ChatGPT-4o در مقابل ChatGPT-4: 5 بزرگترین ارتقا که باید در مورد آنها بدانید
این هفته، OpenAI آخرین نسخه چت ربات هوش مصنوعی ChatGPT خود را منتشر کرد.
اگرچه ChatGPT-5 نیست، اما بسیار مهم است که حرف “o” را در انتها اضافه کنید که به معنای “Omni” است. او تاکید می کند که ChatGPT-4o با تعاملات صوتی، متنی و ویدیویی راحت تر از همیشه است.
در اینجا پنج مورد مهم ترین ارتقاء نسبت به مدل قبلی آورده شده است.
ChatGPT-4o برای همه رایگان است
این بدون شک ارتقاء اصلی برای کاربران معمولی است. پیش از این، GPT-4 هوشمند تنها برای کسانی قابل دسترسی بود که می خواستند 20 دلار در ماه برای اشتراک پلاس بپردازند. اکنون، به لطف بهبود در کارایی، OpenAI می گوید GPT-4o برای هر کاربر رایگان است.
اما این بدان معنا نیست که مزایای قابل توجهی برای دریافت اشتراک پولی وجود ندارد. نه تنها کاربران پولی پنج برابر دستورات بیشتری در روز دریافت میکنند (پس از پایان مکالمه به GPT-3.5 محدودتر باز میگردد)، بلکه بهبودهای عمده حالت صوتی در ابتدا به روی حسابهای رایگان بسته میشود (آنها هنوز اینجا نیستند، اما بر اساس نسخه ی نمایشی، ویژگی های صوتی و صفحه نمایش یک تغییر دهنده بازی خواهد بود).
بهبودهای عمده در پرس و جوهای حالت صوتی
GPT-4 حالت صدا دارد اما کاملاً محدود است. در هر زمان فقط می تواند به یک سوال پاسخ دهد، و آن را شبیه یک الکسا، دستیار گوگل یا سیری می کند. همانطور که ویدیوی زیر نشان می دهد، این به طور چشمگیری با GPT-4o تغییر کرده است.
ارزش این را دارد که خودتان تماشا کنید، اما به طور خلاصه، ChatGPT نه تنها قادر به تولید یک “داستان قبل از خواب در مورد ربات ها و عشق” در زمان واقعی است، بلکه می تواند با پاسخ فوری به وقفه ها به درخواست های تغییر پاسخ دهد. برای خوشحالی مخاطبان، GPT-4o می تواند درام صدای خود را افزایش دهد، به آهنگ های رباتیک روی بیاورد، و حتی به تعقیب و گریز ادامه دهد و داستان را با یک آهنگ به پایان برساند.
مهمتر از همه، او بدون فراموش کردن موضوع اصلی گفتگو به همه این تغییرات پاسخ داد. چیزی که بهترین اسپیکرهای هوشمند در حال حاضر از عهده آن بر نمی آیند.
بهبود قابلیت های بینایی
ارائه حالت صوتی چشمگیر منجر به نمایشی حتی چشمگیرتر از قابلیت های بینایی شد. GPT-4o به حل یک معادله خطی نوشته شده با دوربین تلفن در زمان واقعی کمک کرد. مهمتر از آن، او این کار را بدون ارائه پاسخ مطلوب انجام داد.
در پایان نسخه ی نمایشی، هوش مصنوعی وقتی که “I ❤️ ChatGPT” برای “دیدن” تایپ می شود، افتخار به نظر می رسد.
دیدن اینکه چگونه می توان از این در دنیای واقعی برای توضیح برخی کدها یا خلاصه کردن یک متن خارجی به زبان انگلیسی استفاده کرد، دشوار نیست. اما این فقط متن نیست: دمو دوم به دقت شادی و هیجان را در چهره یک سلفی جدید تشخیص داد.
در حال حاضر، به نظر میرسد که تواناییهای بینایی بهبود یافته آنها تصاویر ثابت را هدف قرار میدهد. با این حال، OpenAI در آینده نزدیک معتقد است که GPT-4o میتواند کارهایی را با ویدیو انجام دهد، مانند تماشای یک رویداد ورزشی و توضیح قوانین.
خیلی سریعتر
اگرچه به طرز شگفتآوری سریع است، اما ChatGPT-4 قطعاً به شما امکان میدهد چرخش چرخها را ببینید، به خصوص در جستارهای پیچیدهتر. طبق گفته OpenAI، ChatGPT-4o “بسیار سریعتر” است و قطعا در استفاده قابل توجه است.
اگر میخواهید زمانبندی واقعی در این مورد داشته باشید، XDA Developers چند معیار ارائه کرده است.
یک پاسخ 488 کلمه ای در کمتر از 12 ثانیه تحت GPT-4o ظاهر شد، در حالی که یک پاسخ مشابه “گاهی اوقات به تقریباً یک دقیقه رندر تحت GPT-4 نیاز داشت”. همچنین قادر به ایجاد یک CSV در کمتر از یک دقیقه بود. “GPT-4 تقریباً به همان اندازه زمان برای ایجاد شهرهای مورد استفاده در مثال صرف کرد.”
برنامه های بومی برای مک و (گاهی) ویندوز
ممکن است نسخه وب برای اکثر افراد کافی باشد، اما برای کسانی که خواهان اپلیکیشن دسکتاپ هستند، خبر خوبی وجود دارد.
OpenAI یک برنامه اختصاصی مک را منتشر کرده است که اکنون در دسترسی اولیه به مشترکین Plus در دسترس است. اما از آنجایی که این یک عرضه تدریجی است، باید منتظر بمانید تا ایمیلی از OpenAI با لینک دانلود دریافت کنید. حتی اگر یک فایل dmg. مشروع پیدا کنید، تا زمانی که حساب شما برای استفاده از آن چراغ سبز نشان داده نشود، نمی توانید از آن استفاده کنید.
در مورد ویندوز چطور؟ OpenAI می گوید یک برنامه ویندوز باید تا پایان سال 2024 آماده شود. شاید این تاخیر به این دلیل باشد که مایکروسافت همچنان کاربران ویندوز 11 را برای استفاده از Copilot با پشتیبانی ChatGPT تحت فشار قرار می دهد.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide