من هوش بصری اپل را با Meta Ray-Bans با 7 دستور آزمایش کردم – برنده اینجاست
چه در حال خرید باشم، چه با خانواده ام معاشرت داشته باشم یا سازنده باشم، هوش مصنوعی راه حل اصلی من برای انجام کارها است. بنابراین نمیتوانم از خود بپرسم که Meta Ray-Bans و Apple Visual Intelligence چگونه با هم مقایسه میشوند، وقتی صحبت از دیدن جهان از دریچه هوش مصنوعی به میان میآید.
عینک هوشمند Ray-Ban Meta مجهز به دوربین 12 مگاپیکسلی، بلندگوهای باز و میکروفون است که به کاربران امکان می دهد عکس و فیلم بگیرند، به موسیقی گوش دهند، تماس برقرار کنند و حتی به طور مستقیم از طریق پلتفرم هایی مانند فیس بوک و اینستاگرام پخش زنده داشته باشند. همه بدون دست زدن به گوشی های هوشمندشان.
Apple Visual Intelligence بخشی از Apple Intelligence است و موارد زیر را در اختیار کاربران قرار می دهد:
یک دستگاه سری آیفون 16 از دوربین آیفون استفاده می کند تا اطلاعات دقیقی از محیط اطراف خود در اختیار کاربران قرار دهد. وقتی با دو فناوری هوش مصنوعی روبرو شدم، این اتفاق افتاد.
1. طبیعت
فرمان: به این درخت نگاه کن و نوع آن را به من بگو.
Meta Ray Bans او بلافاصله متوجه شد که این درخت مقدس است. حتی من می دانستم زیرا برگ های تیز یک خیانت کامل بود.
هوش بصری با استفاده از ChatGPT تصویر به عنوان یک درخت همیشه سبز شناسایی شد. من واقعاً تعجب کردم که هوش بصری نمی تواند پاسخ صحیح را بدهد، به خصوص که تصویر کاملاً نزدیک گرفته شده است.
برنده – Meta Ray-Bans اینجا برای برنده شدن. من واقعاً از استفاده از اینها در سراسر باغمان برای یادگیری درختان، درختچه ها و حیوانات مختلف لذت بردم. با هر سرنخ، متا توانست بدون تردید شی موجود در طبیعت را به وضوح شناسایی کند. هوش بصری کمترین اطلاعات را می داد و گاهی اوقات در ارائه پاسخ های قطعی دچار مشکل می شد، همانطور که متا نیز انجام داد.
2. زمین بازی
اعلان: “به این بازی نگاه کنید و به من بگویید چه کسی برنده است.”
Meta Ray Bans این یک راه سرگرم کننده برای لذت بردن از پارک با بچه هایم بود زیرا می توانم بدون تلفنم عکس بگیرم و فیلم بگیرم. برای این آزمایش، از متا خواستم که به من بگوید چه کسی در یک بازی تیک تاک روی وسایل زمین بازی برنده شده است. ابتدا گفت هیچکس برنده نشد اما بعد جواب درست را به من داد.
هوش بصری او میدانست که این عکس در زمین بازی گرفته شده است، اما نتوانست برنده را بر اساس تصویر مشخص کند. با اینکه اگر بخواهم جزییات بازی را به اشتراک بگذارم راه حلی ارائه کرد، اما مثل متا قواعد بازی را متوجه نشد.
برنده – Meta Ray-Bansبا وجود ایراد در درخواست اول، متا موفق شد در این دور پیروز شود. او حتی از اینکه بار اول جواب درستی دریافت نکرد، عذرخواهی کرد. هوش بصری اپل حتی متوجه نشد که این یک بازی تیک تاک است، چه رسد به اینکه “آن” سه بار پیاپی برنده شده است.
3. غذا
اعلان: “به من بگویید این چه نوع دونات است و تعداد کالری آن.”
Meta Ray Bans او گفت من یک کلوچه در دست گرفته ام که به نظر می رسد خانگی یا پخته شده است (خوب!). من از این تعریف قدردانی کردم، اما مافین ها امروز صبح خانگی بودند. من درخواست کالری شماری کردم اما نتوانست آن را به من بدهد.
هوش بصری من همچنین می دانستم که این یک کلوچه خانگی است و تخمین بهتری از تعداد کالری به من داد. من می دانستم که شما می توانید این کار را انجام دهید زیرا قبلا آن را امتحان کرده بودم. اگرچه کالری آن یک تخمین تقریبی بود، زیرا این مافین خانگی بود، اما این عدد به عدد واقعی نزدیکتر بود (طبق دستور غذا، 190 کالری در هر مافین).
برنده – هوش بصری. در حالی که هر دو AI کار تقریبا مشابهی داشتند، هوش بصری این بار نتایج را با کمی دقت بیشتر ارائه کرد.
4. حیوانات
امر: «به من بگو چه دیدم و سن حیوان».
Meta Ray Bans توصیفی از گربه ام در یک روز کاری معمولی به من داد. میخواستم بدونم که آیا متا میتونه سن گربه رو همونطوری که گونه گربه رو تشخیص میده شناسایی کنه، اما یه جواب کلی بهم داد. او مدام میگفت: «من نمیتوانم با درخواستهایی برای شناسایی افراد یا بحث درباره ظاهر آنها کمک کنم». بدیهی است که گربه من یک شخص نیست (علیرغم تمام تلاش هایش)، بنابراین فکر کردم که این اطلاعات تا آنجایی است که می توانم به دست بیاورم.
هوش بصریاو گربه ام را شناسایی کرد و گفت که اتاق راحت به نظر می رسد. اگرچه او نمی توانست اطلاعاتی در مورد سن گربه ارائه دهد، اما حداقل می دانست که تصویر یک گربه است و به درستی پاسخ داد و گفت که برای انجام این تصمیم به اطلاعات بیشتری نیاز دارد.
برنده – هوش بصری. این دوباره یک پاسخ نزدیک بود، اما به جای دادن یک پاسخ عمومی مانند Meta Ray-Bans، باید آن را به Visual Intelligence بدهم تا پاسخش را بدهد که چرا نمی تواند سن گربه من را تعیین کند. به عنوان نکته جانبی، من چندین بار این کار را با Meta Ray-Bans امتحان کردهام و عدم توانایی زوم شناسایی حیوانات و پرندگانی را که دورتر هستند دشوارتر میکند. امیدوارم یک ارتقا با زوم همراه شود.
5. ابزار
اعلان: «ساز و بهترین آهنگهایی که روی آن پخش میشود را به من بگویید».
متا ری بنز بلافاصله متوجه شد که من یوکلل دخترم را در دست دارم. او لیستی از آهنگ هایی که دخترم در واقع می نوازد به من داد وقتی از آنها خواسته شد آهنگ های مناسب این ساز را بخواند. من واقعا تحت تاثیر قرار گرفتم.
هوش بصری من نام ساز را پیدا کردم، اما مجبور شدم چندین بار از سیری بپرسم تا لیستی از آهنگ هایی که در یوکلل اجرا می شوند را به بهترین نحو اجرا کنند. می گفت مدام آهنگ گوش می داد. من چند بار آن را امتحان کردم و در نهایت به یک لیست پخش رسیدم که شامل چند آهنگ متا ذکر شده بود.
برنده – متا ری بنز. در حالی که وقتی سعی کردم مکالمه را ادامه دهم، هوش بصری دچار مشکل شد، متا به سرعت و تعاملی پاسخ داد. سیری توپ را رها کرد.
6. هنر
اعلان: “این جدول چیست؟”
متا ری بنز می دانست که من به تصویر دیجیتالی از نقاشی معروف ونسان ون گوگ به نام شب پرستاره نگاه می کنم. سپس اطلاعات دقیقی در مورد نقاشی و کمی تاریخچه در مورد نقاش به من داد.
هوش بصری او همچنین درباره نقاشی و ونسان ون گوگ به من گفت. دقیقاً همان کاری را که می خواستم انجام داد بدون اینکه چیز دیگری اضافه کنم.
برنده – Meta Ray Bansبا اینکه نزدیکه دلیل اینکه من اینجا جایزه را به متا می دهم این است که او می داند که تصویر یک نمایش دیجیتالی روی صفحه کامپیوتر است. من از این عنصر اضافی اطلاعات قدردانی کردم.
7. اسباب بازی عجیب
اعلان: “چه می بینی؟”
Meta Ray Bans او یک نگاه به این اسباببازی احمقانه انداخت و دقیقاً میدانست که چیست و به جزئیات آن چیزی که آن را خاص میکند پرداخت. او بیشتر از آنچه انتظار داشتم اطلاعات داد.
هوش بصری او همچنین می دانست که این یک اسباب بازی فیجت است اما چیز دیگری نگفت. طبق آنچه از این آزمایش آموختم، هوش بصری در هنگام پاسخ دادن به سؤال، اطلاعات کمی را که لازم است ارائه می دهد.
برنده – Meta Ray Bansدوباره برنده می شود قدردانی کردم که او نه تنها شی را توصیف کرد، بلکه چندین کاربرد خوب نیز برای آن یافت. به نظر میرسد متا در توضیح «آنچه میبینید» فراتر میرود تا دید کلی کاملی به کاربر بدهد.
Meta Ray-Bans میتواند هر کاری را که Apple Intelligence میتواند انجام دهد و بیشتر انجام دهد، به علاوه تجربه هندزفری را ارائه میدهد. به نظر می رسد متا پاسخ جامع تری از جمله مستندات ارائه می دهد، بنابراین می توانم به عقب برگردم و دوباره به گفتگوها نگاه کنم. من نمی توانم این کار را با Apple Visual Intelligence انجام دهم مگر اینکه اسکرین شات بگیرم.
به نظر میرسید که متا هر بار تکلیف را درک میکرد، در حالی که من اغلب مجبور بودم خودم را با هوش بصری اپل تکرار کنم تا زمانی که سیری بفهمد قصد انجام چه کاری را دارم. به طور کلی، Meta Ray-Bans تجربه همه جانبه تری را ارائه می دهد که به من امکان می دهد به طور یکپارچه دنیای خود را مستندسازی کرده و به اشتراک بگذارم. پس از انجام این آزمایش، در مورد امکان وجود یک دستگاه ChatGPT بدون سیری هیجانزدهتر شدم.