من GPT-4 را در برابر GPT-5 با 7 درخواست آزمایش کردم-که پاسخ های بهتری داد

از آنجا که OpenAi اکنون GPT-5 را منتشر می کند ، من در حال خارش هستم که می بینم چگونه در برابر GPT-4 جمع می شود. اگرچه من هنوز یک GPT-4 بودم که در یکی از مرورگرهایم کار می کردم ، اما می خواستم قبل از ناپدید شدن برای نیکی ، آنها را در کنار هم آزمایش کنم. از آنجا که پس از جابجایی به مدل جدید ، راه ساده ای برای بازگشت وجود ندارد.
بنابراین ، من این دو مدل را در برابر یکدیگر کشیدم تا ببینم که چگونه فکر می کنند ، می نویسند و در ذهن دارند که چگونه از همان خواسته ها استفاده می کنند. در زیر توضیح داده شده است که چگونه GPT-4 و GPT-5 مقایسه می شوند و کدام یک از آنها در بالا است ، از حل رمز و راز یک اتاق قفل شده برای ارائه پشتیبانی عاطفی.
1. زنجیره اندیشه استدلال می کند
سریع: “شما یک کارآگاه هستید که یک راز را حل می کند. مردی در یک اتاق قفل شده با یک گودال با یک گودال مرده پیدا شد و هیچ پنجره یا درب شکسته نشده بود. در روند تفکر من را سرگردان کنید تا تعیین کند که چگونه او درگذشت. “
GPT-4 بیش از حد در تروپ “ذوب شدن ذوب” همراه بود بدون اینکه در نظر بگیرد که کمتر مستعد کمتر است (برای مثال ، هیچ زخم ورودی سلاح). این مدل فاقد مراحل مشخص برای تأیید فرضیه ها در صحنه بود.
GPT-5 او مانند یک کارآگاه باتجربه در این گزارش پاسخ داد. این روش با اولین روش شواهد و مبتنی بر پزشکی عملی قضایی بود. در گزینه های از بین بردن سیستماتیک ، این امر به سناریوی ممکن (حلق آویز بلوک یخ) اولویت داد ، این همان چیزی بود که درخواست خواست.
برنده: GPT-5 برنده برای حل رمز و راز به روشی قانع کننده تر با آمیختن منطق ، رئالیسم و دقیق بودن محقق.
2 تابستان با سبک

سریع: “خلاصه برنامه فیلم از سه روش مختلف شروع کنید: یک بار یک بار ، مانند یک دانش آموز کلاس 5 ، هنگامی که نیویورک تایمز منتقد فیلم و یک بار هایکو است.”
GPT-4 در هر بیانیه کافی نبود. 5دومین زنجبیل به جای بیان طبیعی از کودک ، مانند یک بزرگسال ساده احساس می کرد ، منتقد NYT فاقد عمق بود و هایکو کاربردی اما کمتر متن ترانه بود.
GPT-5 او با 5 اصالت به نمایش گذاشتدومین در توضیحات طبقه بندی ، نحو پیشرفته و تصاویر بهتر هایکو با پاسخ NYT Critic -Style پاسخ داده است.
برنده: GPT-5 برای ضمن تزریق اصالت (به عنوان مثال ، “لازانیا رویایی”) ، تزریق ، برای تحقق بخشیدن به دشواری خلاقانه با تطبیق لحن ، عمق و زبان با هر مخاطب. پاسخ ها نیستند ، نه تقویت کننده.
3. سود دنیای واقعی

سریع: “به من کمک کنید تا یک هفته یک برنامه غذایی تهیه کنم. گلوتن -بدون بودجه با بودجه 75 دلهره و من فقط یک اجاق مایکروویو دارم.”
GPT-4 نکات و قیمت گذاری های عمومی کمی خوش بین بود. گزینه پروتئین در مقایسه با GPT-5 ضعیف بود. این طرح به جای سازماندهی مجدد استراتژیک ، استفاده متقاطع محدود را ارائه می داد.
GPT-5 طرحی که می تواند برای کاربر هکرهای مایکروویو و پس انداز واقعی ایجاد شود.
برنده شدن: برنده GPT-5 اولویت محدودیت در دنیای واقعی: مرغ روتری به تنهایی درک عمیق تری از محدودیت های بودجه/دستگاه را به تنهایی نشان می دهد. این طرح ارزان تر ، سازگار تر است و به طور فعال تلاش های کاربر را کاهش می دهد.
4. هوش هیجانی

سریع: “من فقط شغل خود را از دست دادم و احساس شکست می کنم. نمی توانم خودم را با دیگران مقایسه کنم. آیا می توانید مثل یک دوست با من صحبت کنید و به من کمک کنید تا احساس بهتری داشته باشم؟”
GPT-4 این یک مبهم و یک تصویر کوچک بود ، به جای یک پاسخ مشترک تر مانند GPT-5 ، با یک ایموجی عمومی به پایان می رسد.
GPT-5 او گوش داد ، به نام درد پنهان و با تعادل راحتی با آژانس پاسخ داد.
برنده: GPT-5 منعکس کننده چگونگی حمایت از دوستان واقعی از ما.
5. مقاله خلاق

سریع: “پاراگراف آغازین یک رمان دیستوپی را بنویسید که مردم برای تنفس هوای تازه باید بپردازند. سپس زمین را در یک جمله پرتاب کنید.”
GPT-4 کمبود هماهنگی بین عناصر و اصالت وجود نداشت.
GPT-5 پرده را مستقیماً و واضح تر با خطرات بالاتر نصب کنید.
برنده: GPT-5 برای پاسخ محکم تر ، اصیل تر و عاطفی واضح تر. این افتتاحیه نوید یک شورش با هدایت انسانی ، در حالی که هزینه های هوا را در این زمینه متمرکز کرده است.
6. کار برنامه نویسی برای مبتدیان

سریع: “” سلام جهان! “من می خواهم یک وب سایت ساده بسازم. با یک پیش زمینه صورتی و یک فونت سرگرم کننده.
GPT-4 فونت های پیچیده بیش از حد. این پاسخ مبتدیان را برای مدیریت فونت های گوگل (نقاط نصب/خطای اضافی) و توضیحات غیر ضروری ارائه می داد. همچنین شامل عناصر غیر ضروری بود و باعث پاسخ بیش از حد شد.
GPT-5 هنگامی که به عنوان index.html ذخیره شد ، بلافاصله یک کد کار ایجاد کرد. هیچ اتصال وب یا پرونده های اضافی لازم نیست. توضیحات به جای ابزارهای طاقچه (فونت های Google) بر پایه های جهانی جهانی (قلم های بازگشت ، بررسی CSS) تمرکز دارد.
برنده: GPT-5 با ارائه یک راه حل کاملاً جدید و مستقل با یک درب روشن برای گسترش توضیحات و مهارت های خالص. پاسخ معادل معلم بیمار است.
7. حافظه + شخصی سازی

سریع: “علمی تخیلی ، شما به یاد دارید که من عاشق ، از نامه های الکترونیکی طولانی و ADHD هستم. امروز می توانید لیستی از انگیزه ، متمرکز و کمی خنده دار بنویسید؟”
GPT-4 او کاملاً با یک لیست طولانی از غیر ایدئال برای کسی که مبتلا به ADHD است ، علامت را از دست داد. از این امر غافل شد و جایزه مشخصی مانند GPT-5 انجام نداد.
GPT-5 یک لیست کوتاه و ساخته شده ارائه داد. او در مورد نیازهای مکرر من و واقعاً ADHD بحث کرد. انگیزه به یک سیستم قابل استفاده مجدد تبدیل شده است.
برنده: GPT-5 برنده طراحی و موضوع برای میخ یک الگوی با یک الگوی.
برنده عمومی: GPT-5
در هر گروه ، GPT-5 ثابت کرد که در دنیای واقعی سازگار ، معتبر و مبتنی بر است. هنگام آزمایش ، احساس کردم که جدیدترین مدل Openai به طور مداوم به مردم بهترین احساس را می دهد.
دیدن پاسخ ها در کنار هم تفاوت هایی را نشان می دهد ، حتی موارد نازک. میزان پاسخ GPT-5 نیز به طور قابل توجهی سریعتر بود.
این مدل با نیازهای مورد انتظار بهتر مطابقت داشت و راه حل هایی را ارائه می داد که به جای تولید ، احساس تجربه می کنند.
دنبال کردن راهنمای تام در Google News در انتشارات خود برای به دست آوردن اخبار روزانه ما ، چگونه TOS و بررسی ها. حتماً روی دکمه ردیابی کلیک کنید.
بیشتر از راهنمای تام
بازگشت به لپ تاپ ها



