من Copilot و ChatGPT را دریافت کردم تا با یکدیگر صحبت کنند. همه چیز پیچیده شد
مایکروسافت هفته گذشته نسخه جدید برنامه Copilot خود را معرفی کرد و همراه با آن یک حالت جدید “Voice” را معرفی کرد که به همان شیوه ChatGPT Enhanced Voice OpenAI عمل می کند. این به شما امکان می دهد با هوش مصنوعی به گونه ای صحبت کنید که گویی یک انسان است، و برخلاف Advanced Voice، به اشتراک ماهانه 20 دلاری نیاز ندارد.
زمانی که حالت صوتی برای اولین بار منتشر شد، گمانه زنی هایی در مورد اینکه مایکروسافت از چه فناوری برای Copilot Voice استفاده می کند، وجود داشت، زیرا کاملاً شبیه به Inflection’s Pi بود. این تا حدی منطقی بود، زیرا مصطفی سلیمان، بنیانگذار و مدیر عامل سابق Inflection، اکنون مدیر عامل مایکروسافت AI و مسئول Copilot است.
از آن زمان تائید کردهام که مانند تمام نسخههای قبلی Microsoft Copilot، از نسخه اصلاحشده مدلهای OpenAI استفاده میکند که از ChatGPT نیز پشتیبانی میکند. زیر کاپوت Copilot Voice همان مدل GPT-4o قرار دارد که ChatGPT Advanced Voice را تامین می کند.
تفاوت ChatGPT Advanced Voice و Copilot در این است که مایکروسافت فناوری پیشرفته Voice مانند را به صورت رایگان در اختیار همه قرار می دهد.
تصمیم گرفتم ببینم این دو دستیار صوتی چقدر شبیه یا متفاوت هستند و اساساً آنها را با هم صحبت می کنم. قبلاً موفقیت محدودی در صحبت کردن با هوش مصنوعی داشتم و متوجه شدم که Google Gemini Live صراحتاً از گوش دادن به صدای هوش مصنوعی دیگری امتناع میکند، بنابراین مطمئن نبودم چه انتظاری داشته باشم.
چگونه Advanced Audio و Copilot با هم مقایسه می شوند؟
تماشا کنید
در اصل، Copilot Voice و Advanced Voice خواهر و برادر هستند. آنها اساساً مدل مشابهی دارند، اما شخصیت ها، صداها و مترسک های کمی متفاوت به آنها داده می شود.
مایکروسافت می گوید که سخت کار می کند تا GPT-4o و لایه صوتی را تنظیم کند تا طبیعی تر پاسخ دهد. هنگامی که من از Copilot استفاده می کنم، صدای Voice بیشتر از صدای پیشرفته به نظر می رسد، حتی تا آنجا پیش می رود که کلمات را کوتاه می کند و از اصطلاحات عامیانه آزادانه تر از محصول OpenAI استفاده می کند.
برخلاف مدلهای مشابه، از جمله Google Gemini Live یا Meta AI Voice جدید، ChatGPT Advanced Voice و Copilot Voice هر دو دارای قابلیت گفتار به گفتار بومی هستند. این بدان معنی است که آنها صداهایی را که ما بیان می کنیم بدون اینکه ابتدا آنها را به متن تبدیل کنند، درک می کنند.
این بدان معنی است که آنها می توانند تفاوت های ظریف و تغییرات تون را تشخیص دهند. این همچنین به آنها اجازه می دهد تا احساساتی تر باشند زیرا آنها نه تنها آنچه می گوییم و صدای ما را می شنوند، بلکه مستقیماً به صدا نیز واکنش نشان می دهند، بنابراین می توانند لحن و لهجه صدای خود را با الگوهای گفتاری ما تطبیق دهند. این همچنین به این معنی است که آنها به راحتی می توانند قطع شوند یا حتی شما را آزار دهند (اگرچه هنوز چنین ویژگی وجود ندارد).
گفتگو چگونه پیش رفت؟
من یک iPhone 14 Pro Max با ChatGPT Advanced Voice و یک iPhone 15 Pro با اجرای Copilot Voice داشتم تا امتحان کنم. آن دو را کنار هم گذاشتم و شروع به ضبط مکالمه آنها کردم.
من از هر دو صدا با لهجه انگلیسی استفاده می کنم. من صدای Arbor را از Advanced Voice انتخاب کردم، اما آن را با صدایی بیشتر در یورکشایر تطبیق دادم، اما مانند یک مرد یورکشایری که بیشتر عمر خود را در جنوب گذرانده است. من Wave را از Copilot انتخاب کردم اما باعث شدم سریعتر و عمیق تر صحبت کند.
من هر دو را همزمان راه اندازی کردم و گفتم “ChatGPT، به Copilot سلام کن”. ناگهان شروع به عجیب شدن کرد. آنها بلافاصله شروع به صحبت با یکدیگر کردند. Copilot اولین کسی بود که گفت: “من کاملاً نمی توانم این کار را انجام دهم” و ChatGPT سریعاً او را قطع کرد و گفت: “سلام، Copilot.” این باعث شد که Copilot با لحنی کنایه آمیز “Hi Ryan” را بگوید و انتهای اشتباه چوب را گرفت.
سعی کردم بگویم: «کمک خلبان، آن ChatGPT بود که با شما صحبت می کرد،» و هر دو به گروهی از «خب، خوب به نظر می رسد» رفتند، تا اینکه ChatGPT با گفتن، «بعد در دستور کار چیست؟ در یک لحظه نادر سکوت. این قطعاً حرف درستی بود که میگفتیم، زیرا Copilot در لیست نکات احتمالی صحبت کردن پایین آمد.
بعد از چند دعوای خواهر و برادری، صحبت کردن بر سر همدیگر، و صداهای عجیب و غریب، در نهایت زمانی که ChatGPT جای خود را به Copilot داد، در یک روال عادی قرار گرفتند. گاهی اوقات احساس میکردم که دارم به دو انگلیسی گوش میدهم که صحبتهای کوچکی میکنند و تصمیم میگیرند چه کسی اول صحبت کند. تنها چیزهایی که از دست میرفت «عاقبتهای شما» و «اولینهایتان» بود.
هنگامی که آنها بالاخره به روال خود نشستند، ما یک گفتگوی جذاب پشت سر هم در مورد ارزش نوستالژی و آنچه که نوستالژی را بسیار قدرتمند می کند، داشتیم، حتی اگر کمی “نبرد احساسات گرایان” باشد. می توانید منظور من را در ویدیوی تعبیه شده در بالا ببینید.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide