لعنتی! نسخه جدید ChatGPT که GPT-4o نام دارد، اولین دموهای زنده خود را در آپدیت OpenAI Spring دریافت کرد و سیری را کاملاً ابتدایی جلوه داد.
ما در مورد یک ربات چت صحبت می کنیم که می تواند احساسات واقعی را بیان کند، ترجمه در زمان واقعی انجام دهد و از ویژگی های بینایی مانند لنز Google استفاده کند تا به شما کمک کند همه چیز را از حل معادلات خطی تا پیش بینی خلق و خوی خود انجام دهید.
بله، دستیار صوتی GPT-4o می تواند مکالمه مکالمه در زمان واقعی را انجام دهد. در اولین دمو، مارک، یکی از محققان OpenAI را میبینیم که از GPT-4o میخواهد تا به او در آرام کردن اعصاب خود در حین ارائه یک نمایش زنده کمک کند. ربات چت می گوید که عالی است و هیجان زده به نظر می رسد و همچنان او را در یک جلسه تنفس راهنمایی می کند.
مارک عمداً سنگین و سریع نفس میکشد و GPT-4o با طنز اظهار میکند که او «جاروبرقی نیست». به دلیل هماهنگ نبودن صدا، دستیار کمی لکنت دارد، اما در کل بسیار چشمگیر است. همچنین می توانید الگو را قطع کنید تا بتوانید هر زمان که خواستید دنده ها را عوض کنید.
توجه به این نکته مهم است که GPT-4o می تواند احساسات را تشخیص دهد. اما می تواند احساس ایجاد کند. برای مثال، مارک از دستیار صوتی خواست تا داستانی را قبل از خواب برای او بخواند و مدام دستورالعملهایی را برای معنادارتر و دراماتیکتر بودن به او میداد. بنابراین ممکن است بگویید: “من می خواهم کمی احساسات بیشتر در صدای شما و کمی درام داشته باشم.”
در نتیجه، GPT-4o با اشتیاق بسیار بیشتری مطالعه میکند و ربات دستیار حتی میتواند به دستورات صوتی سوئیچ کند. حتی می توانید از او بخواهید که آواز بخواند و او رعایت می کند.
بعدی چشم انداز است. OpenAI به GPT-4o یک مسئله ریاضی خطی نشان داد و دستیار با عجله سعی در حل یک مسئله قبل از نمایش آن داشت. اما حتی در اینجا او با گفتن “نه، من خیلی هیجان زده بودم” احساسات خود را نشان داد. این لحظه کوچک نقطه عطفی است، همانطور که می بینید او می تواند اشتباهات خود را بفهمد و حتی به آن بخندد.
سرانجام GPT-4o معادله “3x +1 = 4” را تشخیص داد و سرنخ هایی در مورد چگونگی حل آن بدون دادن پاسخ ارائه کرد. این می تواند GPT-4o را به یک کمک کننده خوب برای انجام تکالیف تبدیل کند.
GPT-4o همچنین به اندازه کافی هوشمند است که کدهای موجود در رایانه شما را شناسایی و تجزیه و تحلیل کند و حتی می تواند به نمودارها نگاه کند و بازخورد و اطلاعات را در زمان واقعی ارائه دهد.
من به ویژه تحت تأثیر ابزار ترجمه بلادرنگ GPT 4o قرار گرفتم. وقتی از او پرسیده شد که آیا می تواند یک مکالمه را از انگلیسی به ایتالیایی ترجمه کند، او پاسخ داد: “عالی!” گفت. و من دست به کار شدم دستیار در طول فرآیند دقیق و دوستانه بود و میتوانستم ببینم که این یک ابزار مسافرتی عالی است.
در نهایت، OpenAI نشان داد که چگونه GPT-4o می تواند احساسات را فقط با نگاه کردن به سلفی شما از طریق دوربین جلوی تلفن شما تشخیص دهد. او می دانست که آن شخص لبخند می زند و حتی از او پرسید: “آیا می خواهید دلیل احساسات خوب خود را در میان بگذارید؟” پرسید.
این اولین نمونه از کاری است که ChatGPT-4o می تواند انجام دهد، و در حال حاضر بسیار هوشمندتر و همه کاره تر از سیری، دستیار گوگل/جمینی و الکسا است. فشار به طور رسمی ادامه دارد، زیرا طبق گزارش ها، اپل در حال کار بر روی Siri 2.0 است و Google I/O برای فردا تنظیم شده است.
ChatGPT-4o در هفته های آینده در دسترس خواهد بود و ما نمی توانیم منتظر باشیم تا آن را امتحان کنیم.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران