OpenAI بالاخره حالت صوتی پیشرفته را به دسکتاپ می آورد. این برنامه در هر دو نسخه ویندوز و مک برنامه ChatGPT در دسترس خواهد بود و مانند نسخه موبایل کار خواهد کرد.
این بدان معناست که در نهایت می توانید با رایانه خود صحبت کنید. این روشی نیست که بتوانید با سیری یا الکسا صحبت کنید (و بله، هر دو زمانی که من این نسخه را چاپ کردم فعال شدند)، این یک مکالمه کامل است، گویی با یک انسان دیگر صحبت می کنید.
Advanced Voice یک فناوری بومی گفتار به گفتار است. این بدان معناست که ربات صوتی OpenAI می تواند هر چیزی را که می گویید، نحوه بیان آن و حتی مکث بین کلمات شما را درک کند. او به همان اندازه طبیعی پاسخ می دهد، از جمله اضافه کردن تیک های صوتی و صداهای نفس مانند “هوم” بین هر عبارت.
ما هنوز کاملاً از قول کاملی که در طول بهروزرسانی بهار OpenAI در مورد اشتراکگذاری صفحه نمایش و ویدیوی زنده با ChatGPT دادهایم، نمیدانیم، اما این وعده در نهایت انجام میشود، و هنوز یک ارتقای بزرگ نسبت به سایر مدلهای صوتی است.
Advanced Audio روی دسکتاپ چگونه کار می کند؟
روز بزرگ برای کامپیوترهای رومیزی. صدای پیشرفته اکنون در برنامههای دسکتاپ macOS و Windows در دسترس است.https://t.co/mv4ACwIhzA pic.twitter.com/HbwXbN9NkD30 اکتبر 2024
شما به همان روشی که در iOS یا Android انجام می دهید، از برنامه دسکتاپ به Advanced Voice دسترسی دارید. روی نماد در نوار چت کلیک کنید. با کلیک بر روی دکمه، نمای جدیدی با دایره آبی آبشاری معروف در حال حاضر باز می شود.
شما می توانید در حین ادامه سایر وظایف، به صحبت با هوش مصنوعی ادامه دهید. حتی اگر او نمی تواند ببیند شما چه کار می کنید، می تواند به شرح وظایف یا عملکرد شما پاسخ دهد. برای مثال، اگر هنگام بازی Minecraft از آن استفاده میکنید، میتوانید صحنه را توصیف کنید و میتواند نوع ساختمان یا بلوک را برای استفاده پیشنهاد دهد.
آوردن Advanced Voice به دسکتاپ گام منطقی بعدی برای OpenAI است که ChatGPT را به عنوان یک پلتفرم بهره وری کامل و نه فقط یک ترفند تقویت می کند. توانایی چت با هوش مصنوعی به شما امکان می دهد ایده هایی را در ذهن خود ایجاد کنید یا کارهایی را انجام دهید که به تنهایی نمی توانید انجام دهید.
در آینده، همچنین میتوانید صفحهنمایش خود را با Enhanced Audio به اشتراک بگذارید تا بتواند بر کارهایی که انجام میدهید نظارت کند. و یک روز، هنگامی که عوامل هوش مصنوعی وارد عمل شوند، حتی می توانید کنترل صفحه نمایش شما را به عهده بگیرد و با شما در یک فرآیند صحبت کند.
بعدش چی؟
تماشا کنید
در حالی که Advanced Audio یک ابزار فوقالعاده مفید است، چیزی که قدرتمندتر است، API واقعی است. این پشتیبان Advanced Voice است که توسعه دهندگان از آن برای ایجاد نسخه های خود یا اضافه کردن آنها به ابزارهای خود استفاده می کنند.
در طی یک جلسه توجیهی اخیر با تیم OpenAI، Romain Huet، رهبر رابط توسعه دهندگان این شرکت، این نسخه نمایشی چشمگیر از منظومه شمسی را به نمایش گذاشت. میتوانید به صدا دستور دهید بین سیارات حرکت کند، و میتواند بینشهایی در مورد ماهیت هر یک از جهانهایی که ما از آنها بازدید کردهایم را در زمان واقعی ارائه دهد و به سؤالات به صورت مکالمه پاسخ دهد.
نسخه ی نمایشی دیگری به او نشان داد که از آن به عنوان یک آژانس مسافرتی مجازی استفاده می کند تا به شما کمک کند نه تنها پروازها را رزرو کنید بلکه بهترین معامله را پیدا کنید. میتوانید نیازهای واضح خود را به آن بگویید و میتواند بر اساس آنچه در دسترس است، به جای رویکرد درخت منطقی که در حال حاضر در جستجوهای خودکار میبینیم، سؤال بپرسد یا بازخورد را دنبال کند.
همه این ویژگیها نه تنها در برنامههای OpenAI، بلکه در برنامههای توسعهدهندگان دیگر در ماهها و سالهای آینده در دسترس خواهند بود. من فکر می کنم که صدا روش جدیدی خواهد بود که ما با رایانه هایمان تعامل داریم.
اکنون باید نرمافزار دیکتهای بهتری پیدا کنم که مجبور نباشد ساعتها روی هر چیزی که با صدایم تایپ میکنم صرف کنم تا خطاهای آشکار را برطرف کنم.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران