OpenAI “به طور تصادفی” به برخی از کاربران قابلیت صدای پیشرفته را زودتر داد – این چیزی است که اتفاق افتاد

پروین میرمیران28 ژوئن 2024آخرین به روز رسانی: 28 ژوئن 2024

0 2,659 خواندن این مطلب 3 دقیقه زمان میبرد

OpenAI در اوایل این هفته اعلام کرد که اکثر کاربران برای دسترسی به ویژگی صدای پیشرفته GPT-4o باید تا پاییز منتظر بمانند، اما به نظر می‌رسد برخی از افراد خوش‌شانس نگاهی اجمالی به آنچه که با دستیار صوتی نسل بعدی امکان‌پذیر است، دریافت کرده‌اند.

کاربر Reddit RozziTheCreator یکی از معدود افراد خوش شانس بود. آنها صدای ضبط شده جدیدی از GPT-4o را به اشتراک گذاشتند که قبلاً هرگز نشنیده بودیم که داستانی ترسناک را تعریف کند، همراه با جلوه های صوتی مرتبط با داستان مانند رعد و برق و رد پا.

ظاهراً این یک اشتباه بوده است. OpenAI به من گفت که برخی از کاربران به طور تصادفی به این مدل دسترسی پیدا کردند، اما اکنون این مشکل برطرف شده است.

در ویدیوی لو رفته چه چیزی شنیده می شود؟

آنها مرا در r/ChatGPT مسخره کردند 🥲

تاکنون، هر ویدیویی که از صدای پیشرفته GPT-4o داشته‌ایم، تحت کنترل OpenAI بوده است، و با اینکه عالی به نظر می‌رسد، محدود به موارد استفاده خاص است.

به نظر می‌رسد ویدیوی جدید RozziTheCreator این توانایی را به روشی طبیعی‌تر نشان می‌دهد، از جمله ویژگی جلوه‌های صوتی که قبلاً نشنیده‌ایم.

این را تصور کنید، یک شهر کوچک وجود دارد، همه یکدیگر را می شناسند و یک خانه کوچک در انتهای خیابان وجود دارد.
GPT-4o

من به RozziTheCreator در مورد تجربه ام پیام دادم و او گفت: “از هیچ جا بیرون آمد، به نظر یکسان بود، تنها تفاوت صدا بود.” آنها گفتند. این کشف اواخر شب زمانی رخ داد که RozziTheCreator سعی کرد از چت بات سؤالی بپرسد: “پت، من تغییر را کشف کردم.”

تنها چند دقیقه طول کشید و به گفته RozziTheCreator، “خیلی باگ” بود، بنابراین زمان زیادی برای خارج شدن وجود نداشت، اما آنها توانستند بخشی از این داستان شگفت انگیز را ثبت کنند.

به گفته RozziTheCreator، “وقتی او شروع به پاسخ دادن و تکرار چیزهایی کرد که من نگفته بودم، عصبانی شدم” و سپس به لحن اولیه معمولی خود بازگشتم که همه می توانستند از قبل استفاده کنند.

در این ویدیو، می‌توانید صدای GPT-4o را بشنوید که با شور و شوق داستان را به شیوه‌ای آرام و با پشتیبانی از جلوه‌های صوتی بیان می‌کند. می گفت: “این را تصور کنید، یک شهر کوچک وجود دارد، یک ویدیو که همه همه را می شناسند، و یک خانه کوچک در انتهای خیابان وجود دارد.”

داستان دو نوجوان ادامه دارد که در طول طوفان خانه را چک کردند “با چیزی جز چراغ قوه و تلفن هایشان برای نور.”

پس چه مشکلی در عرضه پیش آمد؟

(اعتبار تصویر: OpenAI)

OpenAI به آرامی تعدادی از ویژگی های جدید را عرضه می کند. کاربران Early Plus قرار بود در این ماه صدای پیشرفته GPT-4o را دریافت کنند، اما به دلیل برخی مسائل امنیتی و نگرانی‌ها در مورد آمادگی زیرساخت سخت‌افزاری، به تعویق افتاد.

من از OpenAI پرسیدم که چه چیزی منجر به دسترسی RozziTheCreator شده است، و یک سخنگوی به من گفت: “در حین آزمایش این ویژگی، ما به طور ناخواسته دعوت نامه هایی را برای تعداد کمی از کاربران ChatGPT ارسال کردیم. این یک خطا بود و ما آن را برطرف کردیم.”

آنها تأیید کردند که چند کاربر اول پلاس ماه آینده دسترسی خواهند داشت، اما برای اکثر آنها کمی بیشتر طول می کشد. آنها توضیح دادند که راه اندازی اولیه “جمع آوری بازخورد و برنامه ریزی توسعه بر اساس آنچه ما یاد می گیریم” خواهد بود.

بنابراین، هنوز صدای GPT-4o وجود ندارد، اما این آخرین مورد از یک سری نمونه از GPT-4o است که می‌خواهد از محدودیت‌های خود رهایی یابد و قابلیت‌های کامل خود را ارائه دهد. من خودم آن را دیدم، یک دقیقه به طور مستقیم فایل های صوتی را تجزیه و تحلیل می کنم، و دقیقه بعد آنها را از طریق کد اجرا می کنم.

این باعث شد که من در مورد قابلیت‌های کامل دستگاه هیجان‌زده‌تر شوم و در مورد تأخیر بیشتر اذیت شوم. اگرچه این قابل درک است.