من GPT-4 را در برابر GPT-5 با 7 درخواست آزمایش کردم-که پاسخ های بهتری داد

پروین میرمیرانآگوست 9, 2025آخرین به روز رسانی: آگوست 9, 2025

2,695 خواندن این مطلب 5 دقیقه زمان میبرد

من GPT-4 را در برابر GPT-5 با 7 درخواست آزمایش کردم-که پاسخ های بهتری داد

از آنجا که OpenAi اکنون GPT-5 را منتشر می کند ، من در حال خارش هستم که می بینم چگونه در برابر GPT-4 جمع می شود. اگرچه من هنوز یک GPT-4 بودم که در یکی از مرورگرهایم کار می کردم ، اما می خواستم قبل از ناپدید شدن برای نیکی ، آنها را در کنار هم آزمایش کنم. از آنجا که پس از جابجایی به مدل جدید ، راه ساده ای برای بازگشت وجود ندارد.

بنابراین ، من این دو مدل را در برابر یکدیگر کشیدم تا ببینم که چگونه فکر می کنند ، می نویسند و در ذهن دارند که چگونه از همان خواسته ها استفاده می کنند. در زیر توضیح داده شده است که چگونه GPT-4 و GPT-5 مقایسه می شوند و کدام یک از آنها در بالا است ، از حل رمز و راز یک اتاق قفل شده برای ارائه پشتیبانی عاطفی.

1. زنجیره اندیشه استدلال می کند

(وام تصویر: آینده)

سریع: “شما یک کارآگاه هستید که یک راز را حل می کند. مردی در یک اتاق قفل شده با یک گودال با یک گودال مرده پیدا شد و هیچ پنجره یا درب شکسته نشده بود. در روند تفکر من را سرگردان کنید تا تعیین کند که چگونه او درگذشت. “

GPT-4 بیش از حد در تروپ “ذوب شدن ذوب” همراه بود بدون اینکه در نظر بگیرد که کمتر مستعد کمتر است (برای مثال ، هیچ زخم ورودی سلاح). این مدل فاقد مراحل مشخص برای تأیید فرضیه ها در صحنه بود.

GPT-5 او مانند یک کارآگاه باتجربه در این گزارش پاسخ داد. این روش با اولین روش شواهد و مبتنی بر پزشکی عملی قضایی بود. در گزینه های از بین بردن سیستماتیک ، این امر به سناریوی ممکن (حلق آویز بلوک یخ) اولویت داد ، این همان چیزی بود که درخواست خواست.

برنده: GPT-5 برنده برای حل رمز و راز به روشی قانع کننده تر با آمیختن منطق ، رئالیسم و دقیق بودن محقق.

2 تابستان با سبک

نتایج تصویر GPT4 در مقابل GPT5 — (وام تصویر: آینده)

سریع: “خلاصه برنامه فیلم از سه روش مختلف شروع کنید: یک بار یک بار ، مانند یک دانش آموز کلاس 5 ، هنگامی که نیویورک تایمز منتقد فیلم و یک بار هایکو است.”

GPT-4 در هر بیانیه کافی نبود. 5^دومین زنجبیل به جای بیان طبیعی از کودک ، مانند یک بزرگسال ساده احساس می کرد ، منتقد NYT فاقد عمق بود و هایکو کاربردی اما کمتر متن ترانه بود.

GPT-5 او با 5 اصالت به نمایش گذاشت^دومین در توضیحات طبقه بندی ، نحو پیشرفته و تصاویر بهتر هایکو با پاسخ NYT Critic -Style پاسخ داده است.

برنده: GPT-5 برای ضمن تزریق اصالت (به عنوان مثال ، “لازانیا رویایی”) ، تزریق ، برای تحقق بخشیدن به دشواری خلاقانه با تطبیق لحن ، عمق و زبان با هر مخاطب. پاسخ ها نیستند ، نه تقویت کننده.

3. سود دنیای واقعی

سریع: “به من کمک کنید تا یک هفته یک برنامه غذایی تهیه کنم. گلوتن -بدون بودجه با بودجه 75 دلهره و من فقط یک اجاق مایکروویو دارم.”

GPT-4 نکات و قیمت گذاری های عمومی کمی خوش بین بود. گزینه پروتئین در مقایسه با GPT-5 ضعیف بود. این طرح به جای سازماندهی مجدد استراتژیک ، استفاده متقاطع محدود را ارائه می داد.

GPT-5 طرحی که می تواند برای کاربر هکرهای مایکروویو و پس انداز واقعی ایجاد شود.

برنده شدن: برنده GPT-5 اولویت محدودیت در دنیای واقعی: مرغ روتری به تنهایی درک عمیق تری از محدودیت های بودجه/دستگاه را به تنهایی نشان می دهد. این طرح ارزان تر ، سازگار تر است و به طور فعال تلاش های کاربر را کاهش می دهد.

4. هوش هیجانی

نتایج تصویر GPT4 در مقابل GPT5

(وام تصویر: آینده)

سریع: “من فقط شغل خود را از دست دادم و احساس شکست می کنم. نمی توانم خودم را با دیگران مقایسه کنم. آیا می توانید مثل یک دوست با من صحبت کنید و به من کمک کنید تا احساس بهتری داشته باشم؟”

GPT-4 این یک مبهم و یک تصویر کوچک بود ، به جای یک پاسخ مشترک تر مانند GPT-5 ، با یک ایموجی عمومی به پایان می رسد.

GPT-5 او گوش داد ، به نام درد پنهان و با تعادل راحتی با آژانس پاسخ داد.

برنده: GPT-5 منعکس کننده چگونگی حمایت از دوستان واقعی از ما.

5. مقاله خلاق

نتایج تصویر GPT4 در مقابل GPT5

(وام تصویر: آینده)

سریع: “پاراگراف آغازین یک رمان دیستوپی را بنویسید که مردم برای تنفس هوای تازه باید بپردازند. سپس زمین را در یک جمله پرتاب کنید.”

GPT-4 کمبود هماهنگی بین عناصر و اصالت وجود نداشت.

GPT-5 پرده را مستقیماً و واضح تر با خطرات بالاتر نصب کنید.

برنده: GPT-5 برای پاسخ محکم تر ، اصیل تر و عاطفی واضح تر. این افتتاحیه نوید یک شورش با هدایت انسانی ، در حالی که هزینه های هوا را در این زمینه متمرکز کرده است.

6. کار برنامه نویسی برای مبتدیان

نتایج تصویر GPT4 در مقابل GPT5

(وام تصویر: آینده)

سریع: “” سلام جهان! “من می خواهم یک وب سایت ساده بسازم. با یک پیش زمینه صورتی و یک فونت سرگرم کننده.

GPT-4 فونت های پیچیده بیش از حد. این پاسخ مبتدیان را برای مدیریت فونت های گوگل (نقاط نصب/خطای اضافی) و توضیحات غیر ضروری ارائه می داد. همچنین شامل عناصر غیر ضروری بود و باعث پاسخ بیش از حد شد.

GPT-5 هنگامی که به عنوان index.html ذخیره شد ، بلافاصله یک کد کار ایجاد کرد. هیچ اتصال وب یا پرونده های اضافی لازم نیست. توضیحات به جای ابزارهای طاقچه (فونت های Google) بر پایه های جهانی جهانی (قلم های بازگشت ، بررسی CSS) تمرکز دارد.

برنده: GPT-5 با ارائه یک راه حل کاملاً جدید و مستقل با یک درب روشن برای گسترش توضیحات و مهارت های خالص. پاسخ معادل معلم بیمار است.

7. حافظه + شخصی سازی

نتایج تصویر GPT4 در مقابل GPT5

(وام تصویر: آینده)

سریع: “علمی تخیلی ، شما به یاد دارید که من عاشق ، از نامه های الکترونیکی طولانی و ADHD هستم. امروز می توانید لیستی از انگیزه ، متمرکز و کمی خنده دار بنویسید؟”

GPT-4 او کاملاً با یک لیست طولانی از غیر ایدئال برای کسی که مبتلا به ADHD است ، علامت را از دست داد. از این امر غافل شد و جایزه مشخصی مانند GPT-5 انجام نداد.

GPT-5 یک لیست کوتاه و ساخته شده ارائه داد. او در مورد نیازهای مکرر من و واقعاً ADHD بحث کرد. انگیزه به یک سیستم قابل استفاده مجدد تبدیل شده است.

برنده: GPT-5 برنده طراحی و موضوع برای میخ یک الگوی با یک الگوی.

برنده عمومی: GPT-5

در هر گروه ، GPT-5 ثابت کرد که در دنیای واقعی سازگار ، معتبر و مبتنی بر است. هنگام آزمایش ، احساس کردم که جدیدترین مدل Openai به طور مداوم به مردم بهترین احساس را می دهد.

دیدن پاسخ ها در کنار هم تفاوت هایی را نشان می دهد ، حتی موارد نازک. میزان پاسخ GPT-5 نیز به طور قابل توجهی سریعتر بود.

این مدل با نیازهای مورد انتظار بهتر مطابقت داشت و راه حل هایی را ارائه می داد که به جای تولید ، احساس تجربه می کنند.

دنبال کردن راهنمای تام در Google News در انتشارات خود برای به دست آوردن اخبار روزانه ما ، چگونه TOS و بررسی ها. حتماً روی دکمه ردیابی کلیک کنید.

بیشتر از راهنمای تام

بازگشت به لپ تاپ ها

نشان دادن بیشتر

پروین میرمیرانآگوست 9, 2025آخرین به روز رسانی: آگوست 9, 2025

2,695 خواندن این مطلب 5 دقیقه زمان میبرد

من GPT-4 را در برابر GPT-5 با 7 درخواست آزمایش کردم-که پاسخ های بهتری داد

1. زنجیره اندیشه استدلال می کند

2 تابستان با سبک

3. سود دنیای واقعی

پروین میرمیران

پخش زنده رایگان اسپانیا و کیپ ورد: نحوه تماشای آنلاین جام جهانی 2026 از هر کجا

شیبا اینو (SHIB) نهنگ ها را سرکوب می کند: 4 میلیارد ورودی در 24 ساعت ثبت شد – U.Today

چرا که Aston Martin Vanquish پس از 25 سال همچنان مهم است، همانطور که توسط طراح آن گفته شده است

فروش نهنگ های بیت کوین با بازگشت قیمت از 65000 دلار – U.Today

Samsung Galaxy S27 Ultra ممکن است باتری بزرگتر و شارژ مغناطیسی داشته باشد، اما ممکن است به قیمت دوربین ها تمام شود.

مهندس سابق ریپل می گوید XRP در میان نوآوری های سولانا جلوتر از زمان خود بود – U.Today

“هیچ کس توپ کریستالی ندارد”: مدیران Lexar برنامه ای برای کاهش وابستگی به رم ما دارند اگر رونق داده های هوش مصنوعی “سالها” طول بکشد.

XRP قوی‌ترین حرکت را از زمان سقوط به زیر 50 EMA ارائه می‌کند – U.Today

فیلیپس یک چراغ سقفی جدید با برچسب قیمت گزاف عرضه کرده است – در اینجا گزینه های ارزان تری وجود دارد که باعث خرابی نمی شود.