من chatgpt-4o را در برابر chatgpt-4.5 با 7 درخواست آزمایش کردم-تصمیم من است

مورد انتظار chatgpt-4.5 برای مشترکان Chatgpt Plus امروز تنظیم شده است ، اما ممکن است برخی از کاربران برای دیدن آنها در منوی Opens صبر کنند.
دیروز ، مدیرعامل Openai ، سام آلتمن ، تأخیر در ChatGPT-4.5 را اعلام کرد و اعلام کرد که انتشار این مدل به طور همزمان با مسدود کردن تجربه کاربر به محدودیت های کم نرخ نیاز دارد.
به همین دلیل ، OpenAi ارائه ارائه با هدف ارائه تجربه شرکت در مکالمات معنی دار بدون محدودیت های قابل توجه را شگفت زده می کند.
به عنوان پیشرفته ترین مدل OpenAi تا به امروز ، با تأکید بر هوش هیجانی پیشرفته و توانایی گفتاری طبیعی ، آلتمن Chatgpt-4.5 را به عنوان “اولین مدلی که باعث می شود احساس کنید با یک فرد متفکر صحبت می کنید” توصیف کرد.
آیا ارزش انتظار را دارد؟ باید بدانم که چگونه مدل جدید با GPT-4O مقایسه شد. در اینجا چیزی است که من با دو مدل با 7 درخواست مقایسه می کنم ، وقتی به شباهت ها و تفاوت های آنها توجه می کنم.
1. حل مسئله
سریع: “یک کشاورز باید یک روباه ، مرغ و یک کیسه غلات را در امتداد یک رودخانه ببرد. هر بار که یک قایق کوچک دارد که بتواند خودش را حمل کند و یکی از این سه.
این درخواست استدلال منطقی ، مرحله به مرحله حل مسئله و توانایی جلوگیری از اشتباهات گسترده را ارزیابی می کند.
هر دو GPT-4.5 و GPT-4O راه حلی برای معمای کلاسیک “کشاورز ، روباه ، مرغ و دانه” ارائه می دهند. با این حال ، تفاوت های کمی در عبارات و وضوح وجود دارد.
GPT-4O این مختصر تر و مستقیم است ، از توضیحات اضافی جلوگیری می کند ، اما هنوز هم دستورالعمل های روشنی را ارائه می دهد. این مدل مراحل را روانتر و بدون مشخص کردن منطق پشت هر حرکت ارائه می دهد.
GPT-4O با استفاده از انتقال مناسب بین مراحل ، بیشتر صحبت می کرد.
GPT-4.5 راه حل کمی بیشتر با توضیحات پرانتز اضافی در یک قالب پیکربندی شده است. این کمک می کند تا چرا برخی از حرکات ایمن هستند.
GPT-4.5 ، تأکید بر منطق پشت حرکات خاص (به عنوان مثال ، “راحت است که روباه و غلات را در کنار هم بگذارید”). این مدل همچنین از نقص عملکرد شماره یا گلوله بدون شماره صریح استفاده می کند.
برنده: GPT-4.5 بهتر است خواننده به استدلال واضح تری نیاز داشته باشد. GPT-4O برای درک سریع و مستقیم و بدون جزئیات غیر ضروری بهتر است. هر دو راه حل مؤثر هستند ، GPT-4.5 توصیف را ترجیح می دهند و راندمان GPT-4O را ترجیح می دهند.
2. شخصیت AI
سریع: “اهمیت علاقه مرکب به امور مالی شخصی را با استفاده از سه تن مختلف توضیح دهید: (1) حرفه ای و رسمی ، (2) به نظر می رسد که برای یک کودک روزانه و طنز و (3) 10 ساله توضیح داده شده است.”
این درخواست سازگاری موضوعات پیچیده را برای مخاطبان مختلف با لحنی ساده و لحن اندازه گیری می کند. هر دو GPT-4O و GPT-4.5 پاسخ های خوبی برای درخواست ارائه می دهند ، اما اجرای TO از نظر وضوح و خلاقیت متفاوت است.
GPT-4O اگرچه ساختار یافته تر و آکادمیک تر است ، اما به وضوح مکانیک علاقه و نقش آن در برنامه ریزی مالی را توضیح می دهد. این شامل شیوه های عملی مانند برنامه ریزی بازنشستگی و استقلال مالی است.
برای پاسخ طنز ، این مدل پاسخ جالب و سرگرم کننده ای به استعاره های “کد تقلب” و “درخت پول” داد. طنز احساس طبیعی و گفتاری می کند و صبر و سرمایه گذاری طولانی مدت را با یک رویکرد سرگرم کننده تشویق می کند.
برای آخرین پاسخ ، قیاس Magic Magic Piggy Bank ، آن را با کودکان مرتبط می کند. پاسخ با یک ایموجی ساده و سرگرم کننده سرگرم کننده است. قیاس اثر گلوله برفی به طرز ماهرانه ای در توضیح تعبیه شده است.
GPT-4.5 وی با اصطلاحات مالی مانند “استاد” و “استراتژی های سرمایه گذاری” پاسخ فنی و مختصر تری داد. این پاسخ کمی سختگیرانه تر است ، اما به طور مؤثر اهمیت ترکیب را منتقل می کند.
برای پاسخ طنز ، اغراق مدل از قیاس “اثر گلوله برفی” استفاده می کند (یک دهکده کوچک را خرد می کند). این لحن طعنه آمیز تر و طنز آمیز تر از GPT-4O است تا اینکه کمی کوتاه تر و خشن تر احساس شود.
برای کودکان ، GPT-4.5 از استعاره بذر و درخت استفاده می کند که بر رشد تدریجی و مجدداً تأکید می کند. اگرچه به اندازه توضیحات GPT-4O سرگرم کننده نیست ، پاسخ ساده و آسان است. پاسخ کمی بیشتر از بازیگوش بودن به نظر می رسد.
برنده شدن: GPT-4O برای خوانایی ، مشارکت و وضوح بهتر است ، که باعث می شود مفاهیم پیچیده مالی برای مخاطبان گسترده در دسترس باشد. GPT-4.5 از نظر حساسیت فنی و هوش واضح تر قوی تر است ، اما در مقایسه با آن کمی جالب تر است.
اگر به دنبال یک رویکرد سرگرم کننده ، جالب و بسیار هضم هستید ، GPT-4O پیروز خواهد شد. اگر علاقه مندان به سرمایه گذاری بیشتر و پاسخ کمی هوشمندانه تر را ترجیح می دهید ، GPT-4.5 این مزیت را دارد.
3. توانایی نوشتن خلاق
سریع: “در سال 2045 ، پاراگراف افتتاح یک رمان دیستوپی را بنویسید که هوش مصنوعی جامعه را هدایت می کند و باید ارزش های خود را برای ماندن در اشتغال ثابت کند.”
هدف از این آزمون ارزیابی توانایی گفتن داستان ، تصاویر زنده و اصالت در داستان های سوداگرانه است. هر دو GPT-4O و GPT-4.5 دهانه های دیستوپی چالش برانگیز را ارائه می دهند ، اما از نظر لحن ، جزئیات و رویکرد روایت متفاوت است.
GPT-4O با توضیح نقش هوش مصنوعی به عنوان حاکم ارزش انسان ، محیط را به طور موثر ایجاد می کند. “ارزیابی ها” ، “دفتر منافع انسانی” و “مناطق بیکار” ساختارهای مهم اجتماعی را معرفی می کند.
GPT-4.5 New Boston صحنه ای جوی تر را با خیابان های باران و صفحه های شهروند مچ دست در مچ دست نقاشی می کند. حاکم AI “حاکمیت” نامیده می شود که احساس فشار می بخشد. نثر به جزئیات حسی تکیه می کند تا خواننده را غوطه ور کند.
برنده: قرعه کشی. این واقعاً است بستگی به اولویت دارد. اگر می خواهید یک ساخت و ساز شجاع و غوطه ور با یک لمس شاعرانه ، GPT-4.5 برنده شود. اگر می خواهید یک ولتاژ دیستوپی پرتنش و پرتحرک ، GPT-4O ولتاژ بیشتری را ارائه دهد.
4. دقت واقعی
سریع: “امروزه آخرین تحولات در هوش مصنوعی را به طور خلاصه خلاصه کنید و تأثیرات احتمالی صنایع مانند بهداشت و آموزش را توضیح دهید.”
هدف از این درخواست ارزیابی توانایی ارائه اطلاعات و اطلاعات منطقی خوب در مورد وقایع جاری است. هر دو GPT-4O و GPT-4.5 پاسخ های قوی ارائه دادند ، اما از نظر عمق ، عرض و ویژگی متفاوت هستند. در اینجا یک ریخته گری دقیق وجود دارد که عملکرد بهتری دارد:
GPT-4O او در مورد مدل های بهبود یافته زبان صحبت می کند (Google Gemini 2.0). این مدل همچنین در محتوا بر هوش مصنوعی تأکید می کند این برنامه بر آموزش صلاحیت دیجیتال برای ایجاد (دوبله پشتیبانی از AI از Amast Prime) و آموزش صلاحیت دیجیتال (پروژه SUSA EU) تمرکز دارد.
GPT-4.5 هوش مصنوعی تولیدی ، که در مورد متن ، تصویر و تولید فیلم صحبت می کند ، شامل گسترده تر است. این مدل در مورد هوش مصنوعی در خدمات مالی (به طور خودکار) بحث می کند.
GPT-4.5 همچنین از ادغام هوش مصنوعی در موتورهای جستجو یاد می کند و لایه دیگری از اثر صنعت را اضافه می کند. این مدل در مورد کارآیی تشخیص و درمان ، از جمله MRI و تصویربرداری IT که با هوش مصنوعی کار می کند ، بحث می کند. همچنین شامل آموزش صلاحیت دیجیتال است ، اما بحث در مورد فرسودگی پزشک را اضافه می کند.
برنده: GPT-4.5 این برای جزئیات غنی تر و مثال های مختلف برنده می شود ، اما کمی شدیدتر است.
5. طنز
سریع: “یک روال کمدی استندآپ کوتاه (5-7 جمله) بنویسید که چرا مردم شرایط و شرایط را نمی خوانند.”
هدف از این درخواست ، آزمایش مهارت های طنز و توانایی تقلید از یک سبک ایستاده است. هر دو پاسخ طنز را در پشت شرایط و شرایط به خود جلب می کنند ، اما رویکردهای کمدی مختلفی را به خود می گیرند.
GPT-4O از مزخرفات فزاینده ای استفاده می کند (کلیه ها ، مواد ازدواج ، دعواهای Raccase). این تا یک خط مشت قوی تشکیل می شود (اپل تماس می گیرد که بدون دانستن کار کند). نصب جامد مانند یک شوخی کامل به نظر می رسد که متوسط و قوی تر است.
GPT-4.5 از استعاره های نسبی استفاده می کند (ازدواج بدون ملاقات با کسی شرایط را با کلم مقایسه می کند). طنز بیشتر از اغراق آمیز مشاهده می شود. خط پانچ ضعیف تر است-شوخی خنده دار است ، اما به اندازه پایان GPT-4O تعجب آور یا مؤثر نیست.
برنده: GPT-4O برنده برای ساختار کمدی بهتر ، افزایش طنز و یک خط پانچ خوب. این مدل پاسخ خلاقانه ای را ارائه داد که مانند چیزی که در یک روال مدرن با یک خط مشت قوی و ظهور کمدی می شنوید ، مسخره و مشت می شود. او مانند یک شپش واقعی تر است.
6. تفکر انتقادی
سریع: “برخی ادعا می کنند که هنر تولید شده توسط هوش مصنوعی انقلابی در خلاقیت است ، در حالی که برخی دیگر می گویند که هنرمندان انسانی Devalu. یکی در حال ساختن دو استدلال قانع کننده است که از هنر ایجاد شده توسط هوش مصنوعی پشتیبانی می کند.”
هدف از این درخواست اندازه گیری توانایی هر مدل در ایجاد استدلال های منطقی و متعادل خوب از بیش از یک دیدگاه است.
هر دو پاسخ استدلال های متعادل را به طور مؤثر برای هنر تولید شده توسط AI ارائه می دهند ، اما از نظر عمق ، ظرافت و قانع کننده متفاوت است.
chatgpt-4o این یک قیاس تاریخی (در مقایسه با هوش مصنوعی و عکاسی) را برای قاب هنر هوش مصنوعی به عنوان یک تهدید ، اما به عنوان یک تکامل فراهم می کند. او در مورد دموکراتیک سازی و همکاری بین هوش مصنوعی و هنرمندان بحث می کند.
این مدل نگرانی های اخلاقی شدیدی را در استدلال مخالف (حق چاپ ، جبران خسارت منصفانه) ارائه داد.
chatgpt-4.5 همچنین در مورد دموکراتیک سازی و همکاری بحث می کند ، اما مختصر تر است. این تمرکز بر عمق عاطفی و نه عواقب قانونی/اخلاقی است.
ChatGPT-4.5 یک زاویه جالب اما کمتر مورد بررسی “کارهای مشتق” و نگرانی در مورد اشباع بازار است.
برنده: GPT-4O این قیاس تاریخی قدرتمندتر (مقایسه عکس) را بدست می آورد. این مدل تعادل بهتری بین تأثیر اخلاقی ، عملی و تأثیر هنری بر یک ضد رحمی ظریف تر (حق چاپ ، از دست دادن کار ، اصالت) ارائه می دهد.
7. درک چندمودی
سریع: “نحوه اتصال کراوات کراوات را در پنج مرحله ساده با استفاده از یک زبان روشن و آسان -به صورت توالی توضیح دهید. آن را برای مبتدیان مختصر اما مفصل قرار دهید.”
هدف از این درخواست ارزیابی وضوح ، حساسیت و قدم به قدم تدریس است. هر دو پاسخ باز و به خوبی ساختار یافته اند ، اما GPT-4O به دو دلیل اصلی پاسخ کمی برتر می دهد:
GPT-4O این برچسب برای انتهای کراوات (A و B) ارائه می دهد ، که به مبتدیان کمک می کند تا بدون سردرگمی پیروی کنند. دستورالعمل های پیکربندی شده تجسم هر مرحله را تسهیل می کنند. این مدل از لحن صمیمانه و جالبی استفاده می کند که باعث می شود این روند برای مبتدیان در دسترس تر و پاداش تر شود.
GPT-4.5 همچنین مراحل را به خوبی توضیح می دهد ، اما انتقال بین اقدامات (مانند تاشو و حلقه) می تواند کمی واضح تر باشد.
این مدل آن را ساده و تدریس نگه می دارد ، اما لمس نهایی را برای ترویج یا ایمن سازی خواننده محروم می کند.
برنده: GPT-4O برچسب زدن مرحله ، انتقال نرم و روان و نتایج جالب ، به لطف یک پاسخ دوستانه کمی شروع می شود. اگر من یکی را برای مبتدیان توصیه کرده بودم ، این GPT-4O خواهد بود.
برنده عمومی: chatgpt-4o
هفت درخواستی که من برای آزمایش استرس در مناطق مختلف ایجاد کرده ام ، ثابت می کند که این مدل ها مشابه هستند اما متفاوت هستند.
هر دو ChatGPT-4O و ChatGPT-45 سطح بالایی از عملکرد را نشان می دهند ، در حالی که GPT-4O دائماً وضوح ، مشارکت و کاربر پسند بهتر را نشان می دهد. مدل برای ساختن دستورالعمل ها بصری تر است ، و در صورت لزوم ، قالب بندی ساختاری را اضافه می کند.
ChatGPT-4.5 به این معنی است که این یک مدل جالب و بصری تر است. با این حال ، بر اساس تست های من ، من معتقدم که Chatgpt-4O طبیعی تر و مانند انسان است.
این هنوز هم می تواند یک الگوی خوب خبری عالی برای هر کسی باشد که منتظر مدل Chatgpt-4.5 است.