من آینده سیری را در iOS 27 پیدا کردم و در حال حاضر یک برنامه اندروید AGI است

همانطور که ممکن است خوانده باشید، یک اصلاح اساسی Siri در iOS 27 برای آیفون در راه است، و آنچه Gurman گزارش میکند یک «تجربه شبه رباتهای چت» است که به طور رسمی در رویداد WWDC اپل در ژوئن امسال معرفی خواهد شد.
اگر اپل نیاز دارد از کسی یادداشت برداری کند، این از AGI Inc است – برنامه جدید این شرکت (در حال حاضر در نسخه بتا خصوصی) اولین هوش مصنوعی عامل روی دستگاه در جهان است که می تواند از تلفن شما برای شما استفاده کند، و من باید این کار را انجام دهم و با موسس شرکت، Div Garg صحبت کنم.
به جای دستورات صوتی ساده، میخواهم آینده سیری دقیقاً شبیه این برنامه باشد: هوش مصنوعی که میتواند به صورت فیزیکی دستگاه شما را هدایت کند و از برنامهها از طرف شما استفاده کند، و با مشارکت کوالکام، به دستگاههای مجهز به اسنپدراگون میآید.
ادامه مقاله در زیر
فناوری رانندگی خودمختار واقعی چگونه به نظر می رسد؟
خوب، در اینجا نحوه کار کردن همه چیز در زیر سطح است. پلتفرم زیربنایی AGI-o از یک مدل زبان بینایی (VLM) برای دیدن صفحه نمایش تلفن شما در زمان واقعی استفاده می کند. از درک معنایی برای درک دکمهها، فیلدهای نوشتاری و عناصر رابط کاربری مانند هر انسانی استفاده میکند، و از ویژگیهای دسترسپذیری برای در دست گرفتن کنترل تلفن شما برای تکمیل سریع اقدامات استفاده میکند.
و هنگامی که من به سرعت برنامه را آزمایش کردم، به طرز چشمگیری موثر بود. واضح است که من در بسیاری از رابطهای کاربری آموزش دیدهام تا بتوانم مسیریابی کنم و کارهایی را که از آن میخواهم انجام دهم، مانند رزرو یک Uber یا گرفتن عکس و ارسال مستقیم در استوری اینستاگرامم. به طور خاص برای Uber، حدود 15 ثانیه طول کشید تا از حالت اعلان به رزرو بروید، و من روند را از ابتدا تا انتها دنبال کردم تا زمانی که برای تأیید در پنجره تراکنش نهایی به من فشار داده شد.
می توانید اپل را ببینید نوعی اگر به سخنرانی اصلی WWDC 2024 برگردید، جایی که آنها در مورد اجازه دادن به Siri کنترل برنامه ها را در دست بگیرند، شروع به فکر کردن کنید. بدیهی است که این اتفاق نیفتاد، اما نشان داد که تیم کوپرتینویی بیشتر فکر می کند تا به توسعه دهندگان اجازه دهد تا عملکرد اصلی برنامه های خود را در سیری ادغام کنند. این چیزی است که می تواند کمی سردرد باشد.
اما رویکرد AGI تماماً در مورد یادگیری تقویتی است، با مدلی که بر روی میلیونها رابط UI، از جمله کلونهای داخلی برنامههایی مانند DoorDash و LinkedIn آموزش دیده است، که به هوش مصنوعی اجازه میدهد حتی با بهروزرسانیهای برنامهها سازگار شود.
حریم خصوصی و پردازش روی دستگاه

این بلافاصله مرا به یاد Rabbit R1 انداخت. دستگاهی که با گذشت زمان بهتر می شود اما با مدل اکشن بزرگ خود به پتانسیل کامل این چشم انداز عامل نمی رسد. علاوه بر این، برخی نگرانیهای امنیتی وجود داشت که این شرکت به آن پرداخته است، اما در مورد انجام این نوع کار کارگزاری در فضای ابری نکتهای را بیان میکند.
AGI Inc. در حال حاضر از منظر حفظ حریم خصوصی کمی نگران کننده است، این نماینده از پردازنده های گرافیکی ابری برای انجام کار استفاده می کند. اما مشارکت کوالکام، هوش مصنوعی عامل بومی واقعی را در شش ماه آینده وارد بازی میکند، و NPU مدلهای کوچکتری را اجرا میکند که به طور موثر با دستگاه سازگار میشوند و اطلاعات شخصی شما را ایمن نگه میدارند.
و وقتی صحبت از هوش مصنوعی به میان می آید، این کاملاً با استانداردهای سختگیرانه حریم خصوصی اپل مطابقت دارد. نسل بعدی سیری باید به صورت بومی اجرا شود یا حداقل چند مانع برای رفتن به مسیر محاسبات ابری خصوصی ایجاد کند. اما این درد بسیار بزرگی خواهد بود (تصور کنید سیری هر بار از شما میپرسد «میخواهی این را از ChatGPT بخواهم؟»).
حل مشکل «یخچال کوچک»

هر زمان که در مورد هوش مصنوعی آژانس صحبت می کنم، البته باید در مورد اضافه کردن نرده های محافظ صحبت کنم. بیایید فراموش نکنیم زمانی که من از طریق Rabbit’s LAM Playground شش کوکای رژیمی از آمازون درخواست کردم که تقریباً 2000 دلار یخچال کوچک با مضمون کک رژیمی خریداری کردم.
این بسیار مهم است، و AGI Inc. با وارد کردن یک “کاربر به حلقه” و اطمینان از برگشت پذیر بودن اقدامات، در مورد این موضوع بسیار واضح بوده است. زیرا مطمئناً، “هوش مصنوعی من این را خرید” واقعاً چیزی نیست که وقتی درخواست استرداد وجه بر روی کارت اعتباری خود ارسال می کنید، انجام شود.
اینجاست که مشارکت ما با ویزا مطرح می شود. این عامل قبل از انجام تراکنش های وب از احراز هویت ایمن اطمینان می دهد. اکنون با Apple Pay، این می تواند ریل های امنیتی ضد گلوله باشد که مانع از تایید آیفون شما می شود.
اکوسیستم نهایی

اما یکی از هیجان انگیزترین چیزهایی که گارگ به من گفت این بود که این فناوری جاسوسی فقط به تلفن ها محدود نمی شود. هدف نهایی AGI Inc. استفاده از این فناوری و به کارگیری آن در یک اکوسیستم متقابل دستگاهی است که در آن میتوانید مانند یک انسان با رایانه، تلویزیون هوشمند یا ماشین خود صحبت کنید و هدف خود را در همه پلتفرمها به طور یکپارچه درک کنید.
با توجه به اینکه کوالکام برای چند دستگاه تراشه تولید می کند، مشارکت اسنپدراگون قطعا در این زمینه کمک خواهد کرد. تصور کنید بتوانید به رایانه شخصی خود بگویید در مورد موارد مهمانی تحقیق کند، مکان هایی را برای خرید آنها به تلفن خود فشار دهید، و ماشین خود را در یک روز سرد از قبل گرم کنید. در اینجا وارد قلمرو جارویس می شویم.
با توجه به اینکه دستگاه های اندرویدی به زودی این ویژگی را دریافت خواهند کرد، این قطعه حیاتی از پازلی است که اپل باید در WWDC بسازد تا سیری زنده بماند. برنامه این شرکت به وضوح این بود که شما را با دستگاههایی احاطه کند، از آیفون گرفته تا مک، تلویزیون، واچ و واقعیت مجازی (به زودی عینک اپل خواهد شد). اگر بتوان همه اینها را با این سطح از خودمختاری یکپارچه گرد هم آورد، بسیار بزرگ خواهد بود.

دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.



