ChatGPT Advanced Voice اکنون در مک و ویندوز – نحوه دسترسی

پروین میرمیران31 اکتبر 2024آخرین به روز رسانی: 31 اکتبر 2024

0 2,666 خواندن این مطلب 3 دقیقه زمان میبرد

ChatGPT Advanced Voice اکنون در مک و ویندوز – نحوه دسترسی

OpenAI بالاخره حالت صوتی پیشرفته را به دسکتاپ می آورد. این برنامه در هر دو نسخه ویندوز و مک برنامه ChatGPT در دسترس خواهد بود و مانند نسخه موبایل کار خواهد کرد.

این بدان معناست که در نهایت می توانید با رایانه خود صحبت کنید. این روشی نیست که بتوانید با سیری یا الکسا صحبت کنید (و بله، هر دو زمانی که من این نسخه را چاپ کردم فعال شدند)، این یک مکالمه کامل است، گویی با یک انسان دیگر صحبت می کنید.

Advanced Voice یک فناوری بومی گفتار به گفتار است. این بدان معناست که ربات صوتی OpenAI می تواند هر چیزی را که می گویید، نحوه بیان آن و حتی مکث بین کلمات شما را درک کند. او به همان اندازه طبیعی پاسخ می دهد، از جمله اضافه کردن تیک های صوتی و صداهای نفس مانند “هوم” بین هر عبارت.

ما هنوز کاملاً از قول کاملی که در طول به‌روزرسانی بهار OpenAI در مورد اشتراک‌گذاری صفحه نمایش و ویدیوی زنده با ChatGPT داده‌ایم، نمی‌دانیم، اما این وعده در نهایت انجام می‌شود، و هنوز یک ارتقای بزرگ نسبت به سایر مدل‌های صوتی است.

Advanced Audio روی دسکتاپ چگونه کار می کند؟

روز بزرگ برای کامپیوترهای رومیزی. صدای پیشرفته اکنون در برنامه‌های دسکتاپ macOS و Windows در دسترس است.https://t.co/mv4ACwIhzA pic.twitter.com/HbwXbN9NkD30 اکتبر 2024

شما به همان روشی که در iOS یا Android انجام می دهید، از برنامه دسکتاپ به Advanced Voice دسترسی دارید. روی نماد در نوار چت کلیک کنید. با کلیک بر روی دکمه، نمای جدیدی با دایره آبی آبشاری معروف در حال حاضر باز می شود.

شما می توانید در حین ادامه سایر وظایف، به صحبت با هوش مصنوعی ادامه دهید. حتی اگر او نمی تواند ببیند شما چه کار می کنید، می تواند به شرح وظایف یا عملکرد شما پاسخ دهد. برای مثال، اگر هنگام بازی Minecraft از آن استفاده می‌کنید، می‌توانید صحنه را توصیف کنید و می‌تواند نوع ساختمان یا بلوک را برای استفاده پیشنهاد دهد.

آوردن Advanced Voice به دسکتاپ گام منطقی بعدی برای OpenAI است که ChatGPT را به عنوان یک پلتفرم بهره وری کامل و نه فقط یک ترفند تقویت می کند. توانایی چت با هوش مصنوعی به شما امکان می دهد ایده هایی را در ذهن خود ایجاد کنید یا کارهایی را انجام دهید که به تنهایی نمی توانید انجام دهید.

در آینده، همچنین می‌توانید صفحه‌نمایش خود را با Enhanced Audio به اشتراک بگذارید تا بتواند بر کارهایی که انجام می‌دهید نظارت کند. و یک روز، هنگامی که عوامل هوش مصنوعی وارد عمل شوند، حتی می توانید کنترل صفحه نمایش شما را به عهده بگیرد و با شما در یک فرآیند صحبت کند.

بعدش چی؟

صدای شخصیت های صوتی GPT-4o – YouTube

تماشا کنید

در حالی که Advanced Audio یک ابزار فوق‌العاده مفید است، چیزی که قدرتمندتر است، API واقعی است. این پشتیبان Advanced Voice است که توسعه دهندگان از آن برای ایجاد نسخه های خود یا اضافه کردن آنها به ابزارهای خود استفاده می کنند.

در طی یک جلسه توجیهی اخیر با تیم OpenAI، Romain Huet، رهبر رابط توسعه دهندگان این شرکت، این نسخه نمایشی چشمگیر از منظومه شمسی را به نمایش گذاشت. می‌توانید به صدا دستور دهید بین سیارات حرکت کند، و می‌تواند بینش‌هایی در مورد ماهیت هر یک از جهان‌هایی که ما از آنها بازدید کرده‌ایم را در زمان واقعی ارائه دهد و به سؤالات به صورت مکالمه پاسخ دهد.

نسخه ی نمایشی دیگری به او نشان داد که از آن به عنوان یک آژانس مسافرتی مجازی استفاده می کند تا به شما کمک کند نه تنها پروازها را رزرو کنید بلکه بهترین معامله را پیدا کنید. می‌توانید نیازهای واضح خود را به آن بگویید و می‌تواند بر اساس آنچه در دسترس است، به جای رویکرد درخت منطقی که در حال حاضر در جستجوهای خودکار می‌بینیم، سؤال بپرسد یا بازخورد را دنبال کند.

همه این ویژگی‌ها نه تنها در برنامه‌های OpenAI، بلکه در برنامه‌های توسعه‌دهندگان دیگر در ماه‌ها و سال‌های آینده در دسترس خواهند بود. من فکر می کنم که صدا روش جدیدی خواهد بود که ما با رایانه هایمان تعامل داریم.

اکنون باید نرم‌افزار دیکته‌ای بهتری پیدا کنم که مجبور نباشد ساعت‌ها روی هر چیزی که با صدایم تایپ می‌کنم صرف کنم تا خطاهای آشکار را برطرف کنم.