ChatGPT با GPT-4o — یادم نیست آخرین باری که با یک فناوری اینقدر شگفت زده شدم
OpenAI در پخش زنده به روز رسانی شب گذشته از اپل پیشی گرفت. این به دلیل هیجان پیش از این رویداد و پاسخ بسیار مثبت به محصولات اعلام شده توسط تیم بود. همانطور که مدیر عامل شرکت سام آلتمن می گوید: “این مانند جادو است.”
بزرگترین اعلامیه مدل GTP-4o بود که ChatGPT را هم برای کاربران پولی و هم برای کاربران رایگان تامین میکند. برخلاف مدلهای زبان بزرگ، این یک مدل همه کاره است که میتواند همه چیز را از متن گرفته تا ویدیو را وارد کند و گفتار، متن و حتی فایلهای سه بعدی را خروجی کند.
ما قبلاً در مورد لحظه آیفون صحبت می کردیم که استیو جابز صنعت تلفن همراه را برای همیشه تغییر داد و سپس در نوامبر 2022 شروع به صحبت در مورد لحظه ChatGPT کردیم. این یکی دیگر از محصولات تعریفکننده صنعت بود و فکر میکنم OpenAI دوباره این کار را انجام داده است.
من در طول بیش از 20 سال کار خود، بسیاری از اعلانهای محصول را پوشش دادهام، و این هیجانانگیزترین تجربهای بود که تا به حال تجربه یک محصول جدید را تجربه کردهام. اگر بخواهیم آلتمن را باور کنیم، این تازه آغاز راه است.
چرا GPT-4o اینقدر مهم است؟
GPT-4o (یا مدل Omni) راه جدیدی برای تعامل با اطلاعات به ارمغان می آورد. به جای تایپ کردن، می توانید فقط چت کنید یا یک ویدیو نشان دهید و بدون هیچ تاخیری پاسخ صوتی دریافت کنید.
این پاسخ یکنواختی جزئی دستیاران دیگر یا صداهای جعلی نسل قبلی ChatGPT Voice را نخواهد داشت. صدایی طبیعی همراه با خنده، احساسات و لحن هایی خواهد داشت که به گفتار شما در زمان واقعی واکنش نشان می دهد.
همه ویژگیهای چند وجهی که امکان مکالمه طبیعی با استفاده از گفتار به گفتار را فراهم میکنند هنوز به آرامی در حال گسترش هستند، اما حتی نسخه چت که با متن و تصاویر چت میکند سریعتر و پاسخگوتر از نسخههای قبلی خود است.
آلتمن در وبلاگ خود نوشت: «حرف زدن با کامپیوتر هرگز برای من طبیعی نبوده است. اکنون است. همانطور که شخصی سازی (اختیاری)، دسترسی به اطلاعات شما، توانایی انجام اقدام از طرف شما و موارد دیگر را اضافه می کنیم، من واقعاً می توانم آینده هیجان انگیزی را ببینم که در آن می توانیم از رایانه ها برای انجام کارهای بسیار بیشتر از قبل استفاده کنیم.
این آینده ممکن است چگونه باشد؟
یک روز، و احتمالاً آنقدرها دور نیست که بسیاری فکر میکنند، این فناوری به رباتهایی که با ما کار میکنند یا در خانههایمان به ما خدمات میدهند، قدرت میدهد.
اینها روباتهایی هستند که میتوانیم مانند یک دوست با آنها صحبت کنیم، از او بخواهیم کارهای پیچیدهای را انجام دهد و از او بخواهیم هم بفهمد و هم پاسخ دهد.
کسی عاشق GPT-4o خواهد شد.
حتی در کوتاهمدت، زمانی که OpenAI برنامههای iPad، iPhone و لپتاپ را با قابلیتهای صوتی و تصویری برای ChatGPT راهاندازی میکند، شاهد خواهیم بود که این برنامه نقش معلم، دستیار برنامهنویسی، مشاور مالی و مربی تناسب اندام را بر عهده میگیرد – و این کار را بدون انجام این کار انجام میدهد. داوری.
آنچه که ما شاهد آن هستیم و سایر شرکتها با آن روبرو خواهند شد، طلوع عصر جدیدی در فناوری رابط انسان و رایانه است.
مدل های Omni نیازی به هوش مصنوعی ندارند که ابتدا آنچه شما می گویید را به متن تبدیل کند، متن را تجزیه و تحلیل کند و سپس آن را به گفتار تبدیل کند. آنها با تجزیه و تحلیل صدا، انعکاس در صدای ما و حتی فیدهای ویدیویی زنده، آنچه را که به صورت محلی می گوییم درک می کنند.
نقطه سیاه کوچکی که حرف میزند و باز میگوید، به اندازه اولین ماشین چاپ، ماشین تحریر، رایانه شخصی، اینترنت و حتی تلفن هوشمند، تغییر پارادایم در دسترسی به اطلاعات است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide