از رویداد OpenAI چه انتظاری می توانیم داشته باشیم؟
OpenAI به شرکتهایی مانند گوگل، اپل و مایکروسافت میپیوندد تا رویدادی را برای رونمایی از یک محصول جدید برگزار کند، با صدایی مشابه هر چیزی که سازنده آیفون میزبانی میکند.
بنابراین چه انتظاری از اولین رویداد اعلام عمومی OpenAI داریم؟ این احتمالاً آن چیزی نیست که انتظار دارید وقتی شرکت شروع به تمرکز روی محصول به جای مدل می کند، ببینید.
شایعات حاکی از آن بود که ما شاهد نوعی موتور جستجوی جدید و احتمالاً GPT-5 خواهیم بود، اما به گفته مدیر عامل سم آلتمن، هیچ کدام از اینها اتفاق نخواهد افتاد.
وی اعلام کرد که در این برای من مانند جادو است.”
شایعات عمدتا بر این واقعیت استوار است که ما یک دستیار صوتی دریافت خواهیم کرد، و این دستیار صوتی مانند سیری یا الکسا نخواهد بود، به سامانتا از فیلم “Her” نزدیک تر خواهد بود – یک پایان واقعی. -پایان هوش مصنوعی محاوره ای
از رویداد OpenAI چه انتظاری می توانیم داشته باشیم؟
من با این شایعه موافقم که محتمل ترین اعلامیه اصلی در رویداد OpenAI نوعی دستیار صوتی خواهد بود.
اما ایجاد یک دستیار صوتی واقعی شامل برخی از مدلهای بهطور قابل توجهی ارتقا یافته، مانند تشخیص پیشرفته گفتار و تجزیه و تحلیل صدا است. این احتمالاً به معنای نسخه جدیدی از مدل رونویسی قدرتمند Whispering OpenAI خواهد بود.
همچنین ممکن است رفتاری شبیه به عامل برای دستیار جدید ببینیم. اینجاست که هوش مصنوعی میتواند از طرف شما اقداماتی را به تنهایی در سراسر شبکه بازتر انجام دهد.
این مدلهای جایگزین و نمایندگان بالقوه میتوانند در ChatGPT Plus، طرح برتر محصول پرچمدار OpenAI، جایی پیدا کنند.
اگر یک ارتقاء اساسی برای ChatGPT Plus دریافت کنیم، احتمالاً به معنای ارتقاء نسخه رایگان نیز خواهد بود و در نهایت GPT-4 و DALL-E را به همراه خواهد داشت.
این دستیار صوتی جادویی چه شکلی خواهد داشت؟
در فیلم “Her” شخصیت هوش مصنوعی سامانتا برای سازگاری و رشد از طریق تعامل خود با انسان طراحی شده است. با گذشت زمان، سامانتا خودآگاهی، عمق عاطفی و توانایی خود را برای ایجاد ارتباطات معنادار توسعه می دهد.
ما نکاتی را دیدهایم که OpenAI به این سمت میرود. ChatGPT اکنون میتواند آنچه را که تایپ میکنید به خاطر بیاورد و در مکالمات بعدی از آن استفاده کند، و اگر تا به حال با عامل صوتی در برنامه ChatGPT تعامل داشتهاید، مکثها و لحنهای انسانمانند را شامل میشود که احساسیتر به نظر میرسد.
فکر نمیکنم هرگز چیزی در مقیاس سامانتا ببینیم. اما اگر OpenAI یک هوش مصنوعی صوتی پیشرفته ایجاد کند که بتواند از طرف شما عمل کند و با دستگاههای دیگر ادغام شود، این یک لحظه “جادویی” خواهد بود.
بزرگترین تغییر تغییر از گفتار به گفتار خواهد بود. در حال حاضر ChatGPT Voice گفتار شما را به متن تبدیل می کند و سپس آن متن را می گیرد و به مدل هوش مصنوعی می فرستد که متن را پس می گیرد و به گفتار تبدیل می کند. این تاخیری ایجاد می کند که برای گفتار خیلی مفید نیست.
برخلاف سیری یا حتی جمینی، که با پرسیدن یک سوال و منتظر ماندن، با امیدواری آموزش یا برنامه ریزی برای دریافت پاسخ تعامل برقرار می کنید، یک مکالمه طبیعی و شبیه انسان با یک دستیار صوتی واقعی جدید خواهید داشت.
در مورد نمایندگان چطور؟
Agent ها روند بزرگ بعدی در هوش مصنوعی هستند. اینها مدل های mini AI هستند که توسط مدل اصلی مانند GPT-4 کنترل می شوند، اما می توانند وظایف خود را انجام دهند.
به عنوان مثال، می توانید به ChatGPT بگویید “تولد همسرم است و من فراموش کردم” و کارت ظاهر می شود، می توانید هدیه ای را از آنچه در گذشته در مورد او گفته اید پیدا کنید، هدیه را سفارش دهید و با ارسال پیام به همسرتان، تحویل را ترتیب دهید. .
نمونه ای از این “ازدحام” عوامل را می توان در پلتفرم توسعه دهنده هوش مصنوعی Devin مشاهده کرد. در اینجا به او می گویید چه کاری انجام دهد و او وارد عمل می شود و تمام اقداماتی را که برای رسیدن به هدف نیاز دارد، از مرور وب گرفته تا دانلود تصاویر، انجام می دهد.
چه چیز دیگری می توانیم ببینیم؟
ممکن است ویدیوهای Sora بیشتری دریافت کنیم و نشانی از زمان عرضه آن برای عموم داشته باشیم. ما همچنین میتوانیم اولین ایدهای از نحوه عملکرد جایگزین Voice Engine ElevenLabs داشته باشیم.
تمرکز بر محصولات به جای مدل های پایه خواهد بود. ما در حال ورود به عصر تجاری هوش مصنوعی هستیم، جایی که این مدلهای چشمگیر باید امرار معاش کنند.
این بدان معنا نیست که شاهد مدل های جدید نخواهیم بود. آلتمن قبلاً گفته است که GPT-5 پیشرفت قابل توجهی نسبت به GPT-4 خواهد بود و بودجه را برای توسعه یک هوش مصنوعی فوقهوشمند افزایش میدهد.
این رویداد بیشتر شبیه آزمایشگاه هوش مصنوعی است که وارد فضای تجاری شده و آن را به جهانیان اعلام می کند. ما بخش محصولات خود را به اندازه تحقیقات خود جدی می گیریم.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide