من همین الان LAM نسل جدید Rabbit R1 را تست کردم. آیا این شرکت واقعاً این قول را می دهد؟

پروین میرمیران25 سپتامبر 2024آخرین به روز رسانی: 25 سپتامبر 2024

0 2,678 خواندن این مطلب 7 دقیقه زمان میبرد

من همین الان LAM نسل جدید Rabbit R1 را تست کردم. آیا این شرکت واقعاً این قول را می دهد؟

Rabbit R1 در طول سال جاری فراز و نشیب های زیادی داشته است – شروعی قوی با اولین حضور خود در نمایشگاه CES 2024 داشت و در نهایت نقدهای منفی زیادی (از جمله از سوی ما) به دلیل انجام ندادن آن کاری دریافت کرد. قول داده بود علاوه بر این، این مشکل مهم وجود داشت که اکثر ویژگی‌هایی که در آزمایش‌هایمان به ما گفته شده بود آن‌طور که در نظر گرفته شده بود کار نمی‌کردند (باگ‌های فراوان).

برای اینکه در مورد تیم Rabbit منصف باشیم، آنها پشت صحنه به سختی کار کرده اند و 16 به روز رسانی هوایی را برای ارائه ویژگی های جدید، رفع اشکالات و سرعت بخشیدن به ویژگی های از پیش موجود منتشر کرده اند. اما چیز دلخراش واقعی در مورد راه اندازی این بود که وعده این ابزار هوش مصنوعی مدل اقدام بزرگ (LAM) هرگز واقعاً محقق نشد.

همان‌طور که جسی لیو، بنیان‌گذار و مدیر عامل شرکت، در مصاحبه‌ای دو ساعته با من گفت (این آخر هفته چیزهای زیادی برای به اشتراک گذاشتن دارم)، سیستم موجود بر مجموعه کوچک‌تری از «سوابق انسانی» متکی بود. این بدان معناست که کارهایی وجود خواهد داشت که می تواند انجام دهد، اما از قول بزرگی که در ابتدا داده شد، دامنه آن کاملاً محدود بود.

خب، Rabbit با نسل بعدی LAM بازگشته است – که در بتای به عنوان زمین بازی LAM در 1 اکتبر راه اندازی می شود – و من این فرصت را داشتم که آن را امتحان کنم و ببینم چگونه است. من نمی توانم به شما نشان دهم که چگونه به نظر می رسد، اما می توانم در مورد آن صحبت کنم.

زمین بازی جدید Rabbit LAM چگونه کار می کند؟

(اعتبار تصویر: آینده)

این دقیقا همان چیزی است که Rabbit آن را یک کارگزار وب سایت عمومی می نامد. چیزی که می تواند کارهایی را برای شما انجام دهد، یا از طریق یک پیام متنی در Rabbit Hole یا (برای تمام آنچه که منتظرش بوده اید) درخواست زبان طبیعی را برای Rabbit R1 خود ارائه دهید.

بنابراین، در ابتدا، همه چیز از طریق سیستم ماشین مجازی انجام می شود که کاربران Rabbit احتمالاً عادت دارند هنگام ورود به حساب های خود با آن تعامل داشته باشند. از آنجا، اگر درخواستی را به صورت آنلاین ارائه دهید – مثال جسی اضافه کردن یک بسته 12 عددی کوکای رژیمی به سبد خرید آمازون خود بود – LAM شروع به کار می کند.

شما می توانید آن را در زمان واقعی مشاهده کنید زیرا یک مدل بینایی با گرفتن اسکرین شات، تجزیه و تحلیل آن و هدایت یک اسکریپت برای تعامل به روشی خاص با درک آنچه در پنجره مرورگر اتفاق می افتد، مشاهده می کند. این شامل خاموش کردن درخواست‌های کوکی می‌شود و می‌تواند در برابر تغییرات آتی UI مقاوم باشد.

چیزهایی که دوست دارم

خرگوش R1

(اعتبار تصویر: آینده)

در واقع، تنها یک چیز مهم در این مورد وجود دارد که من واقعاً دوست داشتم، و آن این است که خرگوش به قولی که در تمام آن ماه‌ها پیش داده بود عمل کرد. در وظایفی که در فضای بازی LAM دیده‌ام و انجام داده‌ام – از بازدید از یک وب‌سایت دارایی و یافتن همه خانه‌های زیر 500000 پوند در جنوب لندن گرفته تا انجام یک بازی Wordle مانند برای سه دور – می‌بینید که درخواست شما را به صورت واقعی انجام می‌دهد. زمان

هیچ کس در مورد خرید چیزهایی که روی صحنه در CES ادعا شد صحبت نکرد، اما اگر دستورالعمل‌های درست را به Rabbit R1 بدهید و وارد حساب مربوطه خرده‌فروش شوید، ممکن است. یکی از چیزهای کلیدی که ما از آن شنیدیم رویکرد آژانس به سفر بود – ارائه یک برنامه به شما و در واقع اقدام برای رزرو پروازها و تجربیات.

وقتی از او در مورد این ویژگی پرسیدم، جسی به سرعت گفت: “ما نمی دانستیم که برای رزرو در ایالات متحده به مجوز آژانس مسافرتی نیاز داریم، این اشتباه ما بود.” اما اکنون، با ساخت LAM به شکلی که هست – به نحوی که می‌توانید کارکرد آن را ببینید و می‌توانید مستقیماً با آن تعامل داشته باشید و کاری را که انجام می‌دهد قطع کنید – آن‌ها را از نیاز به مجوز نجات می‌دهد.

خرگوش R1

(منبع تصویر: راهنمای تام)

یکی دیگر از ویژگی های عالی این زمین بازی این است که LAM بر روی یک سیستم عامل دسکتاپ – یعنی لینوکس – نیز آموزش داده می شود. این هنوز روزهای خیلی ابتدایی است، اما چیزی که لیو توانست به من نشان دهد، درخواستی برای باز کردن معادل مایکروسافت ورد این سیستم عامل و نوشتن یک شعر بود. این بدان معنی است که با توسعه بیشتر، اساساً می تواند کاری را به عهده بگیرد و کاری را ایجاد کند که برای انجام آن زحمتی ندارید، مانند ایجاد یک عرشه ارائه.

تماشای LAM که یک بار دیگر این کار را در پس‌زمینه انجام می‌دهد، نشانه این است که Rabbit در مسیر درستی قرار دارد. ابزاری که اساساً در اینجا ساخته شده و به من نشان داده شده که کار می کند همان چیزی است که ماه ها پیش در مورد آن صحبت شد. این یک تلاش کاملاً اصلاحی بود، اما اولین نشانه ابزار هوش مصنوعی بود که من به دنبال آن بودم. همانطور که ضرب المثل قدیمی می گوید، دیر یا زود، هرگز زودتر.

زمینه هایی که می توان آنها را بهبود بخشید

خرگوش R1

(اعتبار تصویر: آینده)

اکنون شفافیت واضحی در مورد مشکلات این بتا وجود داشت (تاکید بر بتا) زیرا در حین کار با مشکلات زیادی روبرو شدم. اولین چیزی که متوجه شدم این بود که سرعتش کند بود. به طور متوسط، هر 5-6 ثانیه یک دستورالعمل جدید پس از گرفتن اسکرین شات و تجزیه و تحلیل صادر می شود.

و هنگامی که می‌گویم وظیفه، منظورم حفاری کردن به هر دستورالعمل است – باز کردن یک وب‌سایت، سپس پذیرش درخواست کوکی، کلیک کردن در کادر متن، وارد کردن متن در کادر متن، و فشار دادن enter. همه اینها برای هر کدام این مقدار زمان می برد. Rabbit تشخیص می دهد که در اینجا باید روی سرعت بیشتری کار کرد و تأخیر را کاهش داد.

در مرحله دوم، اشکالاتی وجود دارد که از هر نسخه بتا انتظار می رود. مثلاً در آن شعر لام، وقتی یک سند word را برای نوشتن باز کرد، مدل توهم زد و حدود چهار صفحه حروف و اعداد درهم به هم به ما داد. مجدداً، لیو روشن کرد که این اتفاقات رخ خواهد داد و آزمایش بتا به طور خاص برای یافتن این اشکالات است.

خرگوش R1

(اعتبار تصویر: آینده)

در نهایت، اجازه دهید نگاهی دوباره به آینده در اینجا بیاندازیم. یکی از موانعی که هر شرکت هوش مصنوعی با آن روبرو است این است که آیا شرکت‌هایی که مدل‌هایشان با آن‌ها تعامل دارند، واقعاً موافق بازی هستند یا خیر.

در مورد Rabbit، کاربر پسند بودن یک ابزار هوش مصنوعی عمومی که در کل وب اجرا می شود ممکن است بسیار زیاد باشد، اما به همان اندازه به وب سایت هایی بستگی دارد که به ربات اجازه بازدید و پیمایش وب سایت را می دهند. اگر بازیکنان بزرگ “نه” بگویند چه اتفاقی می افتد؟

و لیو وظیفه پیش روی خود را برای تضمین این مجوزها درک می کند. او در مورد استفاده از لینوکس برای بخش سیستم عامل LAM و نحوه کارکرد آن با ویندوز یا macOS صحبت کرد، اما این نیاز به یک توافق نامه مجوز جامع دارد.

درست مانند OpenAI، من می توانم سناریویی را تصور کنم که در آن پول باید دست به دست شود تا مجوز بازدید از برخی سایت های برندهای بزرگ را دریافت کند. کوهی جالب برای Rabbit برای صعود است که هنوز اینجا نیست، اما قطعاً در افق است.

آیا این را بازگشت نمی نامید؟

خرگوش R1

(اعتبار تصویر: آینده)

مدتی از عرضه در ماه مه گذشته است، اما با توجه به چیزهایی که شنیده‌ام و آزمایش کرده‌ام، مطمئن هستم که Rabbit در مسیر درستی قرار دارد تا به LAM تبدیل شود که همه ما آرزوی آن را داشتیم، از زمانی که Jesse با آن سروصدا کرد. اطلاعیه CES

آیا طعم بد را در دهان کسانی که بین انتظارات و واقعیت خرید R1 بدون این ویژگی های ادعا شده در وهله اول دوخته شده اند پاک می کند؟ باید منتظر بمانیم تا این را ببینیم. اما قطعاً اتخاذ رویکردی عملی بیش از حد برای پاسخ اولیه هوشمندانه‌تر است، و من می‌خواهم ببینم که این رویکرد به چیزی فراپلتفرم و در واقع بسیار هوشمندانه تبدیل شود.

چیزهای دیگری که Rabbit به ارمغان می آورد عبارتند از تعامل زبان طبیعی بیشتر با R1 (این آخرین بار به صورت عمومی اعلام شد) و یک تست آلفا از حالت Teach Mode در حال حاضر در حال اجرا است. از زمانی که من از آن استفاده کردم، تقریباً شبیه یک نسخه ساده‌تر از برنامه Shortcuts اپل به نظر می‌رسد – به جای اینکه به‌جای ورود دستی هر مرحله از فرآیند، به یک درخواست زبان طبیعی تکیه کند.

بزرگترین سوالی که Rabbit به طور رضایت بخشی به آن پاسخ نمی دهد این است که آیا نسخه هوشمندتر دستگاه هوش مصنوعی در عصر تلفن های هوش مصنوعی قدرتمند مانند iPhone 16، Galaxy S24 و Pixel 9 منطقی است یا خیر.

لیو به من گفت که دیدگاه او برای آینده فراتر از این تلفن‌ها است، با قابلیت‌هایی که می‌توانند بین پلتفرم باشند – به جای اینکه مانند این تلفن‌ها به اندروید یا iOS محدود شود، هوش مصنوعی واسطه‌ای را برای انجام هر درخواستی بدون توجه به سیستم عامل مورد نیاز برای انجام آن بیاورد. اما کاربر عادی در واقع مراقبت نظر شما در مورد این چیست؟ مسلماً این مهم‌ترین موضوع است – به خصوص از آنجایی که می‌بینید حتی اگر Rabbit برای اولین بار در نسخه بتا بود، تلفن‌ها ممکن است به زودی ویژگی‌های مشابهی داشته باشند.

به گفته لیو، هنوز کارهای زیادی تا عرضه عمومی این بازی وجود دارد که انتظار می رود حدود شش ماه دیگر عرضه شود، اما اگر هر هفته یک آپدیت OTA منتشر شود، امکان دستیابی به آن وجود دارد. رفع اشکالات و بهبود تجربه.