OpenAI “به طور تصادفی” به برخی از کاربران قابلیت صدای پیشرفته را زودتر داد – این چیزی است که اتفاق افتاد
OpenAI در اوایل این هفته اعلام کرد که اکثر کاربران برای دسترسی به ویژگی صدای پیشرفته GPT-4o باید تا پاییز منتظر بمانند، اما به نظر میرسد برخی از افراد خوششانس نگاهی اجمالی به آنچه که با دستیار صوتی نسل بعدی امکانپذیر است، دریافت کردهاند.
کاربر Reddit RozziTheCreator یکی از معدود افراد خوش شانس بود. آنها صدای ضبط شده جدیدی از GPT-4o را به اشتراک گذاشتند که قبلاً هرگز نشنیده بودیم که داستانی ترسناک را تعریف کند، همراه با جلوه های صوتی مرتبط با داستان مانند رعد و برق و رد پا.
ظاهراً این یک اشتباه بوده است. OpenAI به من گفت که برخی از کاربران به طور تصادفی به این مدل دسترسی پیدا کردند، اما اکنون این مشکل برطرف شده است.
در ویدیوی لو رفته چه چیزی شنیده می شود؟
آنها مرا در r/ChatGPT مسخره کردند 🥲
تاکنون، هر ویدیویی که از صدای پیشرفته GPT-4o داشتهایم، تحت کنترل OpenAI بوده است، و با اینکه عالی به نظر میرسد، محدود به موارد استفاده خاص است.
به نظر میرسد ویدیوی جدید RozziTheCreator این توانایی را به روشی طبیعیتر نشان میدهد، از جمله ویژگی جلوههای صوتی که قبلاً نشنیدهایم.
من به RozziTheCreator در مورد تجربه ام پیام دادم و او گفت: “از هیچ جا بیرون آمد، به نظر یکسان بود، تنها تفاوت صدا بود.” آنها گفتند. این کشف اواخر شب زمانی رخ داد که RozziTheCreator سعی کرد از چت بات سؤالی بپرسد: “پت، من تغییر را کشف کردم.”
تنها چند دقیقه طول کشید و به گفته RozziTheCreator، “خیلی باگ” بود، بنابراین زمان زیادی برای خارج شدن وجود نداشت، اما آنها توانستند بخشی از این داستان شگفت انگیز را ثبت کنند.
به گفته RozziTheCreator، “وقتی او شروع به پاسخ دادن و تکرار چیزهایی کرد که من نگفته بودم، عصبانی شدم” و سپس به لحن اولیه معمولی خود بازگشتم که همه می توانستند از قبل استفاده کنند.
در این ویدیو، میتوانید صدای GPT-4o را بشنوید که با شور و شوق داستان را به شیوهای آرام و با پشتیبانی از جلوههای صوتی بیان میکند. می گفت: “این را تصور کنید، یک شهر کوچک وجود دارد، یک ویدیو که همه همه را می شناسند، و یک خانه کوچک در انتهای خیابان وجود دارد.”
داستان دو نوجوان ادامه دارد که در طول طوفان خانه را چک کردند “با چیزی جز چراغ قوه و تلفن هایشان برای نور.”
پس چه مشکلی در عرضه پیش آمد؟
OpenAI به آرامی تعدادی از ویژگی های جدید را عرضه می کند. کاربران Early Plus قرار بود در این ماه صدای پیشرفته GPT-4o را دریافت کنند، اما به دلیل برخی مسائل امنیتی و نگرانیها در مورد آمادگی زیرساخت سختافزاری، به تعویق افتاد.
من از OpenAI پرسیدم که چه چیزی منجر به دسترسی RozziTheCreator شده است، و یک سخنگوی به من گفت: “در حین آزمایش این ویژگی، ما به طور ناخواسته دعوت نامه هایی را برای تعداد کمی از کاربران ChatGPT ارسال کردیم. این یک خطا بود و ما آن را برطرف کردیم.”
آنها تأیید کردند که چند کاربر اول پلاس ماه آینده دسترسی خواهند داشت، اما برای اکثر آنها کمی بیشتر طول می کشد. آنها توضیح دادند که راه اندازی اولیه “جمع آوری بازخورد و برنامه ریزی توسعه بر اساس آنچه ما یاد می گیریم” خواهد بود.
بنابراین، هنوز صدای GPT-4o وجود ندارد، اما این آخرین مورد از یک سری نمونه از GPT-4o است که میخواهد از محدودیتهای خود رهایی یابد و قابلیتهای کامل خود را ارائه دهد. من خودم آن را دیدم، یک دقیقه به طور مستقیم فایل های صوتی را تجزیه و تحلیل می کنم، و دقیقه بعد آنها را از طریق کد اجرا می کنم.
این باعث شد که من در مورد قابلیتهای کامل دستگاه هیجانزدهتر شوم و در مورد تأخیر بیشتر اذیت شوم. اگرچه این قابل درک است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide