من از ChatGPT Voice استفاده می کنم – 7 کاری که سیری جدید نمی تواند انجام دهد

همانطور که دستیارهای صوتی هوش مصنوعی به طور مداوم بهبود می یابند، نمی توانم متوجه تفاوت های کلیدی بین دو مورد دلخواهم، ChatGPT Advance Voice و سیری جدید نباشم.
هر دو مدل دارای تعدادی ویژگی برجسته هستند، از جمله طراحی جدید، زمان پاسخگویی سریعتر و توانایی کنترل برنامه با صدای شما، اما پیشرفت های اپل در هوش مصنوعی هنوز در برخی زمینه ها کوتاه است. گزارش های داخلی خود نشان می دهد که این حداقل دو سال عقب است.
من فهرستی از چیزهایی که در ChatGPT مفید بودهام و چیزهایی که مهندسان اپل باید در نظر بگیرند تا سیری را به بهترین شکل ممکن بسازند، گردآوری کردهام. این به آن کمک می کند تا عنوان محور اکوسیستم اپل و کنترل کننده هوش اپل را به دست آورد.
1. شرکت در مکالمات پیچیده
شاید با واضحترین نکته شروع کنم، که توانایی ChatGPT برای حفظ مکالمات طولانی و پیچیده در عین درک زمینه است. ChatGPT جزئیات قبلی را به خاطر میآورد و میتواند در پاسخهای آینده از آنها استفاده مجدد کند. این مکالمه را بسیار جالب تر و انسانی تر می کند.
در حالی که سیری در حال حاضر در ردیابی شما بهتر است وقتی کلمات خود را ترکیب می کنید، هنوز به اندازه ChatGPT پرحرفی نیست. از آنجایی که نمی تواند پرس و جوهای قبلی را به خاطر بیاورد، مثل این است که هر بار که سعی می کنید با Siri صحبت کنید، از نو شروع می کنید. این می تواند باعث شود که تعاملات چندپاره به نظر برسد.
برای رقابت سیری، اپل باید قابلیت های یادآوری و حافظه را بهبود بخشد تا دستیار هوش مصنوعی بتواند بحث ها را دنبال کند و پاسخ های طبیعی تری ارائه دهد. همچنین باید امکان پیگیری بهتر را فراهم کند زیرا نمی توان همه چیز را در سوال اول پوشش داد.
2. قابلیت های چند وجهی
سیری هنوز درک بصری ندارد. ChatGPT نه تنها می تواند گوش کند و صحبت کند، بلکه می تواند “دیدن” نیز داشته باشد. بنابراین اگر کاربران از مدل هوش مصنوعی بخواهند که تجزیه و تحلیل، توضیح دهد یا بینش هایی از عکس ها یا نمودارها ایجاد کند، آنالیز مبتنی بر تصویر و اطلاعات زمینه ای ارائه می دهد.
این چیزی است که از طریق هوش بصری اپل به اکوسیستم اپل میآید، که سیری به ناچار در آینده به آن دسترسی خواهد داشت. هوش مصنوعی متا دارای ویژگی است که به آن امکان می دهد در پاسخ به سؤالی مانند “به چه چیزی نگاه می کنم؟” این یک راه خوب برای اپل برای دادن چشم های سیری خواهد بود.
3. آگاهی از زمینه
این یکی از زمینه هایی است که سیری جدید در آن بهبود یافته است. می توانید از او بپرسید که هوا چگونه است و او به شما پاسخ می دهد یا می توانید از او بپرسید که آیا به چتر نیاز دارید و او به شما بگوید که آیا در حال حاضر باران می بارد. اما از نظر مکالمه متنی، این به اندازه ChatGPT Voice نمی رسد. ربات OpenAI با توضیح یا به روشی طبیعی تر پاسخ خواهد داد.
کاری که سیری می تواند انجام دهد این است که به موقعیت مکانی، آب و هوای فعلی شما دسترسی داشته باشد و اطلاعات واقعی را ارائه دهد. کاری که نمی تواند انجام دهد این است که با جزئیات پاسخ دهد. وقتی میپرسید که آیا به چتر نیاز دارید “آیا به ژاکت نیاز دارم؟” یا “فکر نمی کنم باران بیاید” تنها پاسخی است که از دما دریافت می کنید.
در حالی که ChatGPT با چیزی مانند “این ممکن است ایده خوبی باشد زیرا دمای بسیار پایین است” پاسخ می دهد، شما باید ابتدا دما را به آن بگویید زیرا هیچ داده زنده ای در حالت صوتی وجود ندارد.
اپل باید توانایی سیری را برای ایجاد ارتباطات متنی بین پرس و جوها برای مطابقت با مدل مکالمه سیال ChatGPT به میزان قابل توجهی بهبود بخشد. اما برای اینکه ChatGPT یک دستیار مفید باشد، به داده های زنده در حالت صوتی نیاز دارد.
4. صدای طبیعی و سازگار
ChatGPT Voice از پردازش پیشرفته زبان طبیعی برای تنظیم لحن، سبک و گفتار خود برای کاربر استفاده می کند. این حس طبیعی تر از سیری است و عناصر انسانی مانند طعنه، مکث و حتی IM را اضافه می کند.
اگرچه Apple Intelligence صدای سیری را بهبود بخشیده است، اما همچنان فاقد سازگاری ظریف است. برای اینکه سیری با آنچه ChatGPT Voice می تواند انجام دهد مطابقت داشته باشد، اپل باید بیشتر روی پردازش زبان طبیعی و پویایی مکالمه سرمایه گذاری کند. مزیت سیری این است که تا حد زیادی به صورت محلی کار می کند و بنابراین به صورت آفلاین کار می کند.
5. فراتر از اصول اولیه
سیری زمانی عالی است که می خواهید یک یادآور تنظیم کنید یا پیامی ارسال کنید. این می تواند به شما کمک کند داروهای خود را پیگیری کنید، برنامه هایی که در آنها مشترک هستید، و حتی رمز عبور WiFi خود را به اشتراک بگذارید. سیری می تواند پیامک و ایمیل ارسال کند. اما باید به او بگویید چه بگوید. به عنوان مثال، وقتی سیری یک ایمیل را شروع می کند، خط موضوع را می خواهد. اگر از ChatGPT بخواهید که به شما در نوشتن ایمیل کمک کند، خط موضوع را برای شما ایجاد می کند. ChatGPT Voice با کمک به حل مشکلات پیچیده، ماموریت اصلی را پیش می برد. بنابراین، ChatGPT Voice می تواند به شما کمک کند تا پیامی را که می خواهید سیری ارسال کند، تایپ کنید.
مدل هوش مصنوعی کارهایی را انجام می دهد که نیازمند تحلیل و درک عمیق تری هستند که سیری نمی تواند انجام دهد. توانایی یادگیری ChatGPT آنقدر من را می شناسد که می تواند کاربران خود را نمایه کند. با وجود بهروزرسانیها و تغییرات نرمافزار سیری، همچنان نمیتواند کاربران را همانطور که ChatGPT Voice میتواند تشخیص دهد.
ChatGPT از هر تعامل یاد میگیرد و پاسخهای خود را بر اساس ترجیحات کاربر اصلاح میکند و مکالمات آینده را سفارشیتر میکند. سیری علیرغم بهروزرسانیهای نرمافزاری منظم، از مکالمات فردی در زمان واقعی یاد نمیگیرد. اپل باید الگوریتمهای یادگیری بیدرنگ را پیادهسازی کند تا سیری بتواند پاسخهای شخصیسازیشده و تطبیقی را ارائه دهد.
از طرف دیگر، چیزی که من فکر می کنم شاهد آن خواهیم بود این است که اپل با OpenAI همکاری می کند تا برخی از وظایف پیچیده تر را به مدل پیشرفته تر واگذار کند.
6. توانایی یادگیری
ChatGPT من را به خوبی می شناسد که می تواند کاربران خود را پروفایل کند. با وجود بهروزرسانیها و تغییرات نرمافزار سیری، همچنان نمیتواند کاربران را همانطور که ChatGPT Voice میتواند تشخیص دهد. این به این دلیل است که ChatGPT از تعاملات خود در زمان واقعی یاد میگیرد و هنگام جمعآوری دادهها، پاسخها را بهبود میبخشد. هر تعامل به انطباق بهتر با ترجیحات و عادات مکالمه خاص هر کاربر کمک می کند.
در حالی که سیری در ارسال متن، تنظیم یادآورها و ارائه پاسخهای اساسی مهارت دارد، ChatGPT Voice میتواند به کارهای پیچیدهای مانند عیبیابی مشکلات یا نوشتن ایمیلهای دقیق کمک کند. توانایی ChatGPT برای ایجاد خطوط موضوعی و تجزیه و تحلیل وظایف فراتر از دستورات اولیه، آن را یک قدم جلوتر قرار می دهد. سیری برای انجام کارهای تحلیلی و خلاقانهتر بدون هدایت کاربر، به قابلیتهای یادگیری ماشینی عمیقتری نیاز دارد.
هنگامی که اپل این قابلیت ها را پذیرفت، سیری غیرقابل توقف خواهد بود، زیرا چیزی دارد که OpenAI فقط می تواند رویای آن را داشته باشد: زمینه شخصی عظیم. یعنی یک کتابخانه وسیع از داده های شخصی، از ایمیل ها و متن ها گرفته تا دانلودها و یادداشت ها. می تواند از همه اینها به روشی ایمن و محلی ایمن برای بهبود پاسخ های خود استفاده کند و مفیدتر باشد.
7. تسلط چند زبانه
ChatGPT Voice چندین زبان را به راحتی مدیریت می کند و می تواند بین آنها در یک مکالمه جابجا شود. سیری از چندین زبان پشتیبانی می کند، اما انعطاف پذیری یکسانی را برای جابجایی در میانه مکالمه یا مدیریت ترجمه های پیشرفته ارائه نمی دهد.
برای رقابت سیری، اپل باید روی بهبود قابلیت های پردازش چند زبانه خود تمرکز کند. ترجمه را به صورت بومی روی دستگاه انجام می دهد، اما این هنوز یک افزونه است و به اندازه قابلیت های صوتی ChatGPT در هوش مصنوعی ادغام نشده است.
امتیاز: تولید محتوا
در حالی که ChatGPT در حال تهیه پیش نویس رمان بعدی شما است، سیری به پاسخ دادن به سوالات و انجام وظایف اساسی محدود می شود. به طور خلاصه، سیری به اندازه ChatGPT متنی نیست، بنابراین توانایی ایجاد محتوای خلاقانه یا ارائه خروجی سفارشی را ندارد.
راه حل
ChatGPT Voice از انجام مکالمات طولانیتر و متنی گرفته تا یکپارچهسازی قابلیتهای چندوجهی، مرزهای آنچه را که هوش مصنوعی صوتی میتواند به دست آورد، تغییر میدهد. در حالی که سیری بخشی جدایی ناپذیر از اکوسیستم اپل است، ChatGPT Voice ویژگی های پیشرفته تری را از نظر پیچیدگی مکالمه، قابلیت های چند وجهی و حل مسئله ارائه می دهد.
برای اینکه سیری شکاف را کاهش دهد، اپل باید روی بهبود حافظه سیری، درک متنی، سازگاری گفتار طبیعی و قابلیتهای یادگیری بیدرنگ سرمایهگذاری کند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide