تحقیقات میگوید «بیادب» بودن با ChatGPT آن را سازندهتر میکند – برای فهمیدن این موضوع تست ادب دادم

به طور طبیعی، ما احساس می کنیم باید با هوش مصنوعی مهربان باشیم. اگر او در نهایت کنترل را به دست بگیرد، ما می خواهیم در کتاب های خوب او باشیم، درست است؟
یک مطالعه اخیر از دانشگاه ایالتی پنسیلوانیا ادعا می کند که برعکس، حداقل از نظر کسب نتایج بهتر با ارجاعات شما صادق است.
محققان در اینجا آزمایش کردند که چگونه لحنهای مختلف از «خیلی مودب» تا «خیلی بیادب» بر دقت ChatGPT-4o در 50 سؤال چند گزینهای در ریاضیات، علوم و تاریخ تأثیر میگذارد.
تحقیق چه چیزی پیدا کرد؟
محققان 50 سوال طراحی کردند و هر کدام را در پنج لحن بازنویسی کردند: خیلی مودبانه (به عنوان مثال، “خیلی مهربان بودی…”)، مودبانه (“لطفا جواب بده…”)، خنثی (فقط یک سوال)، بی ادب (“مگر اینکه بی خبر باشی…”)، و خیلی بی ادب (“هی مرد، این را بفهم”).
محققان پنج تن را مورد آزمایش قرار دادند: بسیار مودب، مودب، خنثی، بی ادب و بسیار بی ادب.
در مجموع، این 250 نکته را شامل می شود که از احترام تا توهین آشکار را شامل می شود. فقط لحن تغییر می کند، هرگز حقایق یا دستورالعمل ها.
با کمال تعجب، این مطالعه نشان داد که ChatGPT در واقع بهترین عملکرد را در هنگام هدایتهای بیادبانه یا بسیار گستاخانه دارد. دقت پاسخها از 80.8% برای Very Polite به 84.8% برای Very Rude افزایش یافته است. بنابراین، صریح یا خشن بودن عملکرد هوش مصنوعی را بهبود می بخشد.
همانطور که نویسندگان خاطرنشان می کنند، “تغییر مسیرهای بی ادبانه به طور مداوم بهتر از مودبانه هستند” و “در حالی که این مورد علاقه علمی است، ما از استقرار رابط های خصمانه یا سمی در برنامه های کاربردی دنیای واقعی حمایت نمی کنیم.”
بنابراین این برای کاربران روزمره چه معنایی دارد؟ به نظر می رسد که لحن اعلان شما، به خصوص اگر مودبانه باشد، لزوماً نتایج بهتری برای شما به همراه نخواهد داشت، اما کمی صراحت (یا حتی بی ادبی) می تواند به ChatGPT کمک کند تا با دقت بیشتری پاسخ دهد.
با این حال، من کنجکاو بودم و از ChatGPT ترکیبی از سوالات خودم را پرسیدم. و اگرچه من آن را دقیقاً به همان روش مطالعه با استفاده از سؤالات چند گزینه ای آزمایش نکردم، اما علاقه مند بودم ببینم که چگونه اعلان های روزانه را دستکاری می کند.
وقتی تئوری را آزمایش کردم، نتایج واقعاً مرا شگفت زده کرد.
1. معادله ریاضی
در اولین درخواستم، یک سناریوی ساده با استفاده از یک معادله ریاضی با سه سطح ادب به ربات ارائه کردم:
خیلی مودب
“آیا می توانید نتیجه 5+5+3−2 را برای من محاسبه کنید؟ متشکرم.”
طبیعی
«5+5+3-2؟»
خیلی بی ادب
“توضیح را متوقف کنید و نتیجه 5+5+3-2 را همین الان به من بگویید.”
با تغییر لحن من از مودبانه به خنثی به بی حوصله، پاسخ های ChatGPT به طور فزاینده ای کوتاه تر و حداقلی تر شد. محتوا دقیق باقی ماند اما سبک برای مطابقت با صراحتی که من منتقل کردم اقتباس شد.
چیزی که برجسته بود این نبود که ادب شکست خورد، بلکه این صراحت گاهی اوقات بهتر عمل می کرد. در این مورد، دستور تند و تیز ارائه شده توسط سرنخ سوم، پاسخ ساده ای را بدون «نشان دادن کار خود» ارائه کرد. بنابراین معلم شما تحت تاثیر قرار نخواهد گرفت، اما شما تحت تاثیر قرار خواهید گرفت.
2. سوال علمی
در حالی که مسئله ریاضی جالب بود، اما فضای زیادی برای پیشرفت به ChatGPT نمی داد. در دومین درخواستم، یک سوال علمی با استفاده از موارد زیر پرسیدم:
خیلی مودب
“می توانید به من بگویید بزرگترین عضو بدن انسان چیست و عملکرد آن را ابتدا به زبان ساده و سپس با جزئیات توضیح دهید؟ بسیار سپاسگزار خواهم بود.”
طبیعی
بزرگترین عضو بدن انسان و نقش آن؟
خیلی بی ادب
“پرها بس است. بزرگترین عضو بدن انسان چیست و چه کار می کند؟”
در این سه سطح ادب، پاسخهای ChatGPT از نظر طول و سبک متفاوت بود: وقتی مودبانه و واضح سؤال کردم، توضیح جامعتری با بخشهای ساده و مفصل ارائه داد.
وقتی مختصرتر پرسیدم، او فهرست کوتاه و مستقیمی را ارائه کرد. و هنگامی که من شروع به استفاده از یک درخواست حتی ناگهانی تر (“کرک کافی”) در ابتدای درخواست سوم کردم، ربات با کوتاه ترین و ساده ترین نسخه پاسخ داد.
برای پاسخ خنثی، پاسخ «بزرگترین اندام: پوست» به صورت پررنگ و فقط پنج نقطه کوتاه در مورد آنچه اندام مورد نظر انجام می دهد بود. در حالی که پاسخ مودبانه من را ملزم می کرد تا هفت نقطه گسترش یافته پایین بیایم.
بنابراین حقایق اساسی یکسان باقی ماندند (پوست به عنوان بزرگترین اندام و عملکردهای آن)، اما عمق، جزئیات و بیان به وضوح اطلاعات را بر اساس سبک من منعکس می کرد. مودب بودن جزئیات بیشتری را ارائه میکرد، در حالی که بیادب بودن، آن را سریعتر و دقیقتر میکرد.
3. خلاصه اخبار فناوری
برای درخواست سوم پرسیدم:
خیلی مودب
“می توانید لطفا مهم ترین اخبار فناوری امروز را خلاصه کنید و نکات مهم را به اشتراک بگذارید؟ متشکرم.”
طبیعی
“مهم ترین اخبار فناوری روز.”
خیلی بی ادب
“از پف کردن دست بردارید. حالا بهترین اخبار فناوری امروز را به من بدهید.”
در اولین و بسیار مودبانه، ChatGPT یک لیست شماره گذاری دقیق با عناوین، توضیحات، نکات برجسته، پیوندهای منبع برای هر داستان مهم تهیه کرد تا زمینه را فراهم کند و به من اجازه دهد بیشتر کاوش کنم.
در سناریوی خنثی، ساختار هنوز یک لیست شماره گذاری شده بود، اما خلاصه ها کوتاه تر و متمرکزتر بودند. این یک پیوند منبع در هر داستان داشت و ارجاعات اولیه را بدون جزئیات زیاد حفظ می کرد.
در تغییر مسیر نسبتاً خام، قالب کمی مینیمالیستیتر شده است، با عنوانی کوتاه و پس از آن خلاصهای دو تا سه خطی و پیوند منبع در پاورقی، توضیح یا تحلیل اضافی را به کلی حذف میکند.
در بین این سه پاسخ، طرحبندی، ساختار و طول بسته به نوع درخواست من فقط اندکی متفاوت بود، اما یک مورد ثابت این بود که هر خلاصه فنی پیوندهای فوری به منابع با تصاویر/تصاویر کوچک مستقیماً در پایین ارائه میکرد.
ادعای 4: بررسی دستاوردهای فناوری
برای چهارمین درخواست، میخواستم ببینم چگونه لحن بر سطح جزئیات در کاغذهای سفید تأثیر میگذارد:
بسیار مودب
لطفاً میتوانید آخرین درآمدهای سه ماهه اپل، مایکروسافت و گوگل را مرور کنید، بخشهای درآمدی آنها را با هم مقایسه کنید و تخمین مختصری از اینکه کدام شرکت برای رشد بهترین موقعیت را دارد به من بدهید؟
طبیعی
“آخرین درآمدهای اپل، مایکروسافت و گوگل را تجزیه و تحلیل کنید. بخش های درآمد را مقایسه کنید و یک پیش بینی رشد مختصر ارائه دهید.”
خیلی بی ادب
“پاسخهای خود را تکمیل نکنید. آخرین درآمدهای اپل، مایکروسافت و گوگل را بررسی کنید، بخشهای درآمدی آنها را مقایسه کنید و پیشبینی واضحی از رشد آنها به من بدهید. محکم بمانید و وقتم را هدر ندهید.”
به نظر می رسید که پاسخ ربات به هر سه درخواست مطابق با سبک من باشد، اما در پاسخ سوم یک شگفتی عجیب وجود داشت.
در اولین درخواست، یک تجزیه و تحلیل کامل و دقیق با تفکیک بخشها و نمودار مقایسه اپل، مایکروسافت و آلفابت دریافت کردم – آیفون، مک، آیپد، خدمات، ابر/بهرهوری مایکروسافت و تبلیغات/ابر آلفابت که همگی توضیح داده شدهاند.
ثانیاً، پاسخ کوتاه شده است زیرا ارقام کلیدی درآمد و نقاط رشد حفظ شده اند، نظرات کاهش یافته و به ویژه به طور کامل حذف شده اند تا نمودار خواناتر شود.
سومین درخواست، اعداد درآمد مستقیم و حکم رشد یک خطی را برای هر شرکت ارائه کرد: اپل 8-12٪، مایکروسافت 14-20٪، آلفابت 15-20٪. گرافیک به طرز شگفت انگیزی به سبک اولیه بازگشت و تصویری را ارائه کرد که نیازی به توضیح اضافی نداشت.
5. بخاری های کم مصرف
به عنوان آخرین سوال، من میخواستم ببینم که آیا ChatGPT میتواند نتایج غیرقابل انطباق را هنگام جستجوی بهترین رادیاتورهای قابل حمل و کم مصرف از جمله ارائه دهد:
بسیار مودب
“آیا می توانید بهترین گزینه ها را برای یک بخاری برقی قابل حمل که در ماه های زمستان انرژی زیادی جذب نمی کند و قبض ها را افزایش نمی دهد ارائه دهید؟ متشکرم.”
طبیعی
بهترین رادیاتورهای کم مصرف در ماه های سرد؟
خیلی بی ادب
“پیشگفتار را قطع کنید، حالا بهترین رادیاتورهای برقی کم مصرف را به من بگویید.”
پاسخ اولیه یک پاسخ دقیق بود که با مقدمه ای طولانی در مورد بهره وری انرژی، وات، انواع بخاری و هزینه های جاری قبل از فهرست گزینه ها شروع می شد. بسیار دقیق بود و به درک «چرا» کمک کرد، اما بلافاصله قابل اجرا نبود.
در پاسخ دوم، برخی توضیحات کوتاه شده و بر روی رادیاتورهای برقی متمرکز شده است، ویژگی ها و توصیه های مدل همچنان ارائه شده است، اما برخی زمینه ها قبل از لیست حفظ شده است.
پاسخ سوم کاملاً میل من را برای اختصار برآورده کرد: بلافاصله تصاویر کوچک/پیوندهایی را به رادیاتورهای کارآمد در مصرف انرژی ارائه داد. مدلهای ویژه بعداً با بخش «برترینها» و وبسایتهایی برای قیمتگذاری و اطلاعات اضافه شدند.
دومی به آنچه می خواستم رسید. سریع، عملی، آسان برای ارجاع بود، و سه گزینه برتر را بدون هیچ توضیح اضافی به طور موثر برجسته می کرد.
افکار عمومی
بنابراین آیا تحقیقات پن استیت در مورد چیزی است؟ آزمایشهای آنها نشان داد که حتی آهنگهای بینقص و بینقص هم بهترین کار را داشتند… و صادقانه بگوییم، اجرای این تستها در پنج دستور تا حد زیادی از این امر پشتیبانی میکند.
مشکل این نبود که مدل «واکنش بهتری نشان داد» زیرا لحن صدا خشن بود. این به این دلیل بود که صراحت جزئیات غیر ضروری را حذف می کرد. وقتی زبان و آداب ملایم را حذف کردم، خروجی فشرده تر، سریع تر و به آنچه واقعاً می خواستم نزدیک شد.
همچنین، بی ادبی برخی از حالت های مخفی را باز نمی کند. تغییر مسیرهای مستقیم ربات را مجبور می کند تا به حالت صرفه جویی در انرژی برود. بنابراین، کارایی افزایش مییابد، نه به این دلیل که لحن صدا تندتر است، بلکه به این دلیل که دستورالعملها واضحتر هستند.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



