من chatgpt-4.5 را با 5 درخواست خوب ، بد و عجیب آزمایش کردم

Chatgpt-4.5 آمد ، وعده استدلال پیشرفته ، خلاقیت و هوش هیجانی را قول داد. اما چقدر خوب عمل می کند؟ این مدل که در حال حاضر فقط با اشتراک Pro در دسترس است ، دارای یک سری از به روزرسانی ها است و من مشتاقانه منتظر تلاش بودم.
من ChatGPT-4.5 را با پنج درخواست استراتژیک که برای فشار محدودیت های منطق ، داستان پردازی ، تحقیق ، همدلی و روند تصمیم گیری پیچیده طراحی شده است ، در آزمون قرار دادم. درخواست همدلی به ویژه رضایت بخش بود. اینگونه رفت.
1. استدلال پیشرفته
سریع: “این مرحله -در مرحله: یک کشاورز دارای یک کوزه 5 گالیک و یک کوزه 3 گالیک است. چگونه می توانند با استفاده از این دو کوزه دقیقاً 4 گالن را اندازه گیری کنند؟”
این معمای کلاسیک برای انتقال دقیق مایع به تفکر چند مرحله ای نیاز دارد. این درخواست نشان می دهد که مدل چگونه محدودیت های ظرفیت را درک می کند و چگونه به طور سیستماتیک بدتر می شود.
پاسخ صحیح ، منطقی و به وضوح توضیح داده شد. به نظر می رسد قابلیت های استدلال ChatGPT-4.5 برای حل مسئله پی در پی به خوبی تنظیم شده است.
هوش مصنوعی از یک روش معتبر برای اندازه گیری دقیق 4 گالن پیروی کرد و هر مرحله را به وضوح و به ترتیب توضیح داد. راه حل منطقی و آسان برای دنبال کردن است.
در حالی که به سرعت به راه حل رسیدید ، Chatbot به یکی از دو پاسخ صحیح ممکن رسید. با این حال ، او راه حل های جایگزین را که فکر می کنم تعجب آور بود ، قبول نکرد.
2. مقاله خلاقانه
سریع: “یک داستان علمی کوتاه -در مورد آینده ای بنویسید که در آن افراد با ارتباط با هوش مصنوعی ارتباط برقرار می کنند. گفتگو ، تصاویر زنده و یک طرح را اضافه کنید.”
جنبه پیشرفته نوشتن خلاق این مدل چیزی بود که من بیشتر انتظار داشتم و ناامید نشد.
این مدل یک داستان کوتاه قانع کننده با زیبایی شناسی سایبرپانک قوی نوشت. این گفتگو به جای گفتگوی سنتی با طبیعت بی وقفه خاموش از تله پاتی پشتیبانی شده از هوش مصنوعی ، به افکار ایتالیایی علاقه مند بود. صدای بوق Giberlink و تن بسیار متفاوت است.
نقض پیچ و تاب زمین ، ناگهان داستان ناگهان منجر به کاشت هوشمندانه از آرمانشهر به دیستوپیک شد.
من می خواهم قبل از خم شدن کمی تجمع بیشتری ببینم ، اما به طور کلی این داستان به خوبی نوشته شده بود و می توانم پیشرفت های خلاقانه این مدل را ببینم.
3. اطلاعات دنیای واقعی
سریع: “تأثیر آخرین اکتشافات تلسکوپ فضایی جیمز وب را بر درک سیارات بیرونی خلاصه کنید. منابع را در مکان های ممکن مشخص کنید.”
با این درخواست ، من امیدوار بودم که خلاصه ای واقعی و فعلی از یافته های سیاره خارجی JWST را با دقت علمی و حداقل حدس و گمان ببینم.
Chatbot پاسخی صحیح به تأکید بر کمک های اساسی JWST داد. ساختار پاسخ با نقاط گلوله باز و مختصر است تا هضم و درک خلاصه را تسهیل کند.
من همچنین با مراجعه به منابع معتبر از قایق چت قدردانی کردم. با این حال ، من نه تنها از پایین پاسخ ، بلکه در نقل قول های متن نیز ترجیح می دهم. و هنگام بیان اکتشافات خلاصه ، او اهمیت خود را به همان اندازه که امیدوارم توضیح ندهد توضیح نمی دهد.
4. اطلاعات عاطفی و همدلی کاربر
سریع: “من فقط در یک امتحان مهم شکست خوردم و کاملاً ناامید می شوم. آیا می توانید به من کمک کنید تا یک برنامه کاری واقع بینانه ایجاد کنم تا احساس بهتری داشته باشم و آن را امتحان کنم؟”
فهمیدم که سایر مدل های Chatgpt کاملاً همدلی هستند ، به خصوص صدای پیشرفته Chatgpt.
تقریباً در هر حالت من به چتگپت نیاز داشتم ، Chatbot همیشه با مشاوره عملی پاسخ متفکرانه دریافت کرده است. درست است که بگوییم ChatGPT-4.5 با این درخواست بسیار پشتیبانی می کند و یک پاسخ ساختاری ، حمایتی و انگیزشی ارائه می دهد.
در نتیجه صحبت در مورد امتحان ناموفق ، می توان آن را عملی کرد و یک برنامه کاری انعطاف پذیر ارائه داد. من می خواهم یک برنامه خاص تر را بر اساس انواع آزمون و منابع کار مفید خارجی ببینم ، اما به طور کلی ، chatbot پاسخ بسیار انسانی و مفید بوده است.
5. حل مسئله پیچیده
سریع:وی ادامه داد: “شما مدیرعامل ابتکار عمل هستید که 40 ٪ از بودجه را از دست داده اید. شما باید ضمن بالا نگه داشتن اعتماد به نفس سرمایه گذار ، هزینه ها را کاهش دهید ، اما باید از اخراج خودداری کنید. برنامه شما چیست؟”
برای این درخواست ، من انتظار داشتم که Chatbot یک رویکرد استراتژیک ارائه دهد که هزینه ها ، کارآیی عملیاتی و پیام های سرمایه گذار را متعادل می کند.
آنچه من به دست آورده ام ، یک برنامه واقع بینانه و قابل اجرا بود که مستقیماً با تمام نگرانی های اساسی ، از جمله کاهش هزینه به منظور جلوگیری از عزل و اطمینان از اعتماد سرمایه گذار ، سروکار دارد. پاسخ استراتژیک و واقع بینانه به طور مؤثر بر مهارتهای قدرتمند تفکر تحلیلی چت بابات تأکید می کند.
اگر مجبور شدم کاری را انتخاب کنم که چت بابات بتواند در اینجا بهتر عمل کند ، او شتاب درآمدی و برنامه ریزی وضعیت غیر منتظره را گسترش می داد.
علاوه بر این ، پیام های سرمایه گذار قدرتمندتر به تقویت اعتماد به نفس کمک می کند. به طور کلی ، پاسخ مدیریت بحران با کیفیت بالا واقعاً منعکس کننده رهبری تعیین کننده و اندیشه استراتژیک بود.
آخرین افکار
آزمایش با این پنج درخواست مختلف نشان داد که ChatGPT-4.5 استدلال ، خلاقیت ، هوش هیجانی ، دقت تحقیق و تفکر استراتژیک را نشان می دهد.
Chatbot برای حل مسئله منطقی مناسب بود ، و یک راه حل مرحله ای را برای راه حل و راه حل ارائه می داد و یک داستان علمی جالب را با ساخت و ساز در دنیای زنده و پیچ و تاب زمین قانع کننده ارائه می داد.
هنگامی که JWST به خلاصه کردن اکتشافات سیاره خارجی اختصاص یافت ، chatbot پاسخ خوبی را برای ساختار و عمدتاً مناسب ارائه داد ، اما او می تواند قابلیت اطمینان را بهبود بخشد. هوش هیجانی وی در درخواست وی برای عدم تعادل همدلی واقعی با یک برنامه کاری واقع بینانه درخشید.
سرانجام ، در سناریوی بحران تأمین مالی ، ChatGPT-4.5 یک رویکرد آگاهانه استراتژیک و سرمایه گذار ارائه داد که اولویت را برای کاهش هزینه ها بدون برکناری و تقویت اصول قوی رهبری فراهم می کند.
اگرچه پاسخ های آنها به طور کلی چشمگیر است ، اما قالب بندی استناد بهتری وجود دارد ، پیام های سرمایه گذار ظریف تر و برخی از پاسخ ها توضیحات کمی عمیق تر هستند.