من همین الان LAM نسل جدید Rabbit R1 را تست کردم. آیا این شرکت واقعاً این قول را می دهد؟
Rabbit R1 در طول سال جاری فراز و نشیب های زیادی داشته است – شروعی قوی با اولین حضور خود در نمایشگاه CES 2024 داشت و در نهایت نقدهای منفی زیادی (از جمله از سوی ما) به دلیل انجام ندادن آن کاری دریافت کرد. قول داده بود علاوه بر این، این مشکل مهم وجود داشت که اکثر ویژگیهایی که در آزمایشهایمان به ما گفته شده بود آنطور که در نظر گرفته شده بود کار نمیکردند (باگهای فراوان).
برای اینکه در مورد تیم Rabbit منصف باشیم، آنها پشت صحنه به سختی کار کرده اند و 16 به روز رسانی هوایی را برای ارائه ویژگی های جدید، رفع اشکالات و سرعت بخشیدن به ویژگی های از پیش موجود منتشر کرده اند. اما چیز دلخراش واقعی در مورد راه اندازی این بود که وعده این ابزار هوش مصنوعی مدل اقدام بزرگ (LAM) هرگز واقعاً محقق نشد.
همانطور که جسی لیو، بنیانگذار و مدیر عامل شرکت، در مصاحبهای دو ساعته با من گفت (این آخر هفته چیزهای زیادی برای به اشتراک گذاشتن دارم)، سیستم موجود بر مجموعه کوچکتری از «سوابق انسانی» متکی بود. این بدان معناست که کارهایی وجود خواهد داشت که می تواند انجام دهد، اما از قول بزرگی که در ابتدا داده شد، دامنه آن کاملاً محدود بود.
خب، Rabbit با نسل بعدی LAM بازگشته است – که در بتای به عنوان زمین بازی LAM در 1 اکتبر راه اندازی می شود – و من این فرصت را داشتم که آن را امتحان کنم و ببینم چگونه است. من نمی توانم به شما نشان دهم که چگونه به نظر می رسد، اما می توانم در مورد آن صحبت کنم.
زمین بازی جدید Rabbit LAM چگونه کار می کند؟
این دقیقا همان چیزی است که Rabbit آن را یک کارگزار وب سایت عمومی می نامد. چیزی که می تواند کارهایی را برای شما انجام دهد، یا از طریق یک پیام متنی در Rabbit Hole یا (برای تمام آنچه که منتظرش بوده اید) درخواست زبان طبیعی را برای Rabbit R1 خود ارائه دهید.
بنابراین، در ابتدا، همه چیز از طریق سیستم ماشین مجازی انجام می شود که کاربران Rabbit احتمالاً عادت دارند هنگام ورود به حساب های خود با آن تعامل داشته باشند. از آنجا، اگر درخواستی را به صورت آنلاین ارائه دهید – مثال جسی اضافه کردن یک بسته 12 عددی کوکای رژیمی به سبد خرید آمازون خود بود – LAM شروع به کار می کند.
شما می توانید آن را در زمان واقعی مشاهده کنید زیرا یک مدل بینایی با گرفتن اسکرین شات، تجزیه و تحلیل آن و هدایت یک اسکریپت برای تعامل به روشی خاص با درک آنچه در پنجره مرورگر اتفاق می افتد، مشاهده می کند. این شامل خاموش کردن درخواستهای کوکی میشود و میتواند در برابر تغییرات آتی UI مقاوم باشد.
چیزهایی که دوست دارم
در واقع، تنها یک چیز مهم در این مورد وجود دارد که من واقعاً دوست داشتم، و آن این است که خرگوش به قولی که در تمام آن ماهها پیش داده بود عمل کرد. در وظایفی که در فضای بازی LAM دیدهام و انجام دادهام – از بازدید از یک وبسایت دارایی و یافتن همه خانههای زیر 500000 پوند در جنوب لندن گرفته تا انجام یک بازی Wordle مانند برای سه دور – میبینید که درخواست شما را به صورت واقعی انجام میدهد. زمان
هیچ کس در مورد خرید چیزهایی که روی صحنه در CES ادعا شد صحبت نکرد، اما اگر دستورالعملهای درست را به Rabbit R1 بدهید و وارد حساب مربوطه خردهفروش شوید، ممکن است. یکی از چیزهای کلیدی که ما از آن شنیدیم رویکرد آژانس به سفر بود – ارائه یک برنامه به شما و در واقع اقدام برای رزرو پروازها و تجربیات.
وقتی از او در مورد این ویژگی پرسیدم، جسی به سرعت گفت: “ما نمی دانستیم که برای رزرو در ایالات متحده به مجوز آژانس مسافرتی نیاز داریم، این اشتباه ما بود.” اما اکنون، با ساخت LAM به شکلی که هست – به نحوی که میتوانید کارکرد آن را ببینید و میتوانید مستقیماً با آن تعامل داشته باشید و کاری را که انجام میدهد قطع کنید – آنها را از نیاز به مجوز نجات میدهد.
یکی دیگر از ویژگی های عالی این زمین بازی این است که LAM بر روی یک سیستم عامل دسکتاپ – یعنی لینوکس – نیز آموزش داده می شود. این هنوز روزهای خیلی ابتدایی است، اما چیزی که لیو توانست به من نشان دهد، درخواستی برای باز کردن معادل مایکروسافت ورد این سیستم عامل و نوشتن یک شعر بود. این بدان معنی است که با توسعه بیشتر، اساساً می تواند کاری را به عهده بگیرد و کاری را ایجاد کند که برای انجام آن زحمتی ندارید، مانند ایجاد یک عرشه ارائه.
تماشای LAM که یک بار دیگر این کار را در پسزمینه انجام میدهد، نشانه این است که Rabbit در مسیر درستی قرار دارد. ابزاری که اساساً در اینجا ساخته شده و به من نشان داده شده که کار می کند همان چیزی است که ماه ها پیش در مورد آن صحبت شد. این یک تلاش کاملاً اصلاحی بود، اما اولین نشانه ابزار هوش مصنوعی بود که من به دنبال آن بودم. همانطور که ضرب المثل قدیمی می گوید، دیر یا زود، هرگز زودتر.
زمینه هایی که می توان آنها را بهبود بخشید
اکنون شفافیت واضحی در مورد مشکلات این بتا وجود داشت (تاکید بر بتا) زیرا در حین کار با مشکلات زیادی روبرو شدم. اولین چیزی که متوجه شدم این بود که سرعتش کند بود. به طور متوسط، هر 5-6 ثانیه یک دستورالعمل جدید پس از گرفتن اسکرین شات و تجزیه و تحلیل صادر می شود.
و هنگامی که میگویم وظیفه، منظورم حفاری کردن به هر دستورالعمل است – باز کردن یک وبسایت، سپس پذیرش درخواست کوکی، کلیک کردن در کادر متن، وارد کردن متن در کادر متن، و فشار دادن enter. همه اینها برای هر کدام این مقدار زمان می برد. Rabbit تشخیص می دهد که در اینجا باید روی سرعت بیشتری کار کرد و تأخیر را کاهش داد.
در مرحله دوم، اشکالاتی وجود دارد که از هر نسخه بتا انتظار می رود. مثلاً در آن شعر لام، وقتی یک سند word را برای نوشتن باز کرد، مدل توهم زد و حدود چهار صفحه حروف و اعداد درهم به هم به ما داد. مجدداً، لیو روشن کرد که این اتفاقات رخ خواهد داد و آزمایش بتا به طور خاص برای یافتن این اشکالات است.
در نهایت، اجازه دهید نگاهی دوباره به آینده در اینجا بیاندازیم. یکی از موانعی که هر شرکت هوش مصنوعی با آن روبرو است این است که آیا شرکتهایی که مدلهایشان با آنها تعامل دارند، واقعاً موافق بازی هستند یا خیر.
در مورد Rabbit، کاربر پسند بودن یک ابزار هوش مصنوعی عمومی که در کل وب اجرا می شود ممکن است بسیار زیاد باشد، اما به همان اندازه به وب سایت هایی بستگی دارد که به ربات اجازه بازدید و پیمایش وب سایت را می دهند. اگر بازیکنان بزرگ “نه” بگویند چه اتفاقی می افتد؟
و لیو وظیفه پیش روی خود را برای تضمین این مجوزها درک می کند. او در مورد استفاده از لینوکس برای بخش سیستم عامل LAM و نحوه کارکرد آن با ویندوز یا macOS صحبت کرد، اما این نیاز به یک توافق نامه مجوز جامع دارد.
درست مانند OpenAI، من می توانم سناریویی را تصور کنم که در آن پول باید دست به دست شود تا مجوز بازدید از برخی سایت های برندهای بزرگ را دریافت کند. کوهی جالب برای Rabbit برای صعود است که هنوز اینجا نیست، اما قطعاً در افق است.
آیا این را بازگشت نمی نامید؟
مدتی از عرضه در ماه مه گذشته است، اما با توجه به چیزهایی که شنیدهام و آزمایش کردهام، مطمئن هستم که Rabbit در مسیر درستی قرار دارد تا به LAM تبدیل شود که همه ما آرزوی آن را داشتیم، از زمانی که Jesse با آن سروصدا کرد. اطلاعیه CES
آیا طعم بد را در دهان کسانی که بین انتظارات و واقعیت خرید R1 بدون این ویژگی های ادعا شده در وهله اول دوخته شده اند پاک می کند؟ باید منتظر بمانیم تا این را ببینیم. اما قطعاً اتخاذ رویکردی عملی بیش از حد برای پاسخ اولیه هوشمندانهتر است، و من میخواهم ببینم که این رویکرد به چیزی فراپلتفرم و در واقع بسیار هوشمندانه تبدیل شود.
چیزهای دیگری که Rabbit به ارمغان می آورد عبارتند از تعامل زبان طبیعی بیشتر با R1 (این آخرین بار به صورت عمومی اعلام شد) و یک تست آلفا از حالت Teach Mode در حال حاضر در حال اجرا است. از زمانی که من از آن استفاده کردم، تقریباً شبیه یک نسخه سادهتر از برنامه Shortcuts اپل به نظر میرسد – به جای اینکه بهجای ورود دستی هر مرحله از فرآیند، به یک درخواست زبان طبیعی تکیه کند.
بزرگترین سوالی که Rabbit به طور رضایت بخشی به آن پاسخ نمی دهد این است که آیا نسخه هوشمندتر دستگاه هوش مصنوعی در عصر تلفن های هوش مصنوعی قدرتمند مانند iPhone 16، Galaxy S24 و Pixel 9 منطقی است یا خیر.
لیو به من گفت که دیدگاه او برای آینده فراتر از این تلفنها است، با قابلیتهایی که میتوانند بین پلتفرم باشند – به جای اینکه مانند این تلفنها به اندروید یا iOS محدود شود، هوش مصنوعی واسطهای را برای انجام هر درخواستی بدون توجه به سیستم عامل مورد نیاز برای انجام آن بیاورد. اما کاربر عادی در واقع مراقبت نظر شما در مورد این چیست؟ مسلماً این مهمترین موضوع است – به خصوص از آنجایی که میبینید حتی اگر Rabbit برای اولین بار در نسخه بتا بود، تلفنها ممکن است به زودی ویژگیهای مشابهی داشته باشند.
به گفته لیو، هنوز کارهای زیادی تا عرضه عمومی این بازی وجود دارد که انتظار می رود حدود شش ماه دیگر عرضه شود، اما اگر هر هفته یک آپدیت OTA منتشر شود، امکان دستیابی به آن وجود دارد. رفع اشکالات و بهبود تجربه.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide