من به تازگی Pictionary را در Google's Project Astra بازی کردم و اکنون هیجان Gemini 1.5 را درک کرده ام.
Project Astra به Google I/O توجه کرد و نگاهی اجمالی به تعاملات ما با جهان به ما داد که توسط Gemini 1.5، مدل هوش مصنوعی نسل بعدی گوگل، طراحی شده است. اگرچه ممکن است کمی طول بکشد تا نسخه عمومی Project Astra به دستگاهها برسد، من این فرصت را داشتم که قابلیتهای مختلف آن را در حین شرکت در کنفرانس سالانه توسعهدهندگان Google به نمایش بگذارم.
به طور خلاصه، Project Astra یک هوش مصنوعی مبتنی بر دوربین در زمان واقعی است که می تواند هر کاری را انجام دهد، از شناسایی یک شی در قاب گرفته تا ایجاد یک داستان تخیلی در مورد شی مذکور و بازنویسی آن داستان با استفاده از مقدار منزجر کننده ای از آلتراسیون. جدی نه، وقتی با یک سیب پلاستیکی از او خواسته شد، اسباب بازی را (احتمالاً از یک مجموعه بازی کودکان گرفته شده است) به عنوان “اقلام زیبای کاملاً قرار داده شده” رمانتیک کرد.
@tomsguide ♬ صدای اصلی – راهنمای تام
برای هدف نمایشی، گوگل یک دوربین ثابت از بالا به پایین را به دستگاهی که Gemini 1.5 را اجرا می کند، متصل کرد. خوراک دوربین به تنهایی برای این بازی آلتراسیون استفاده شد، اما قابلیتهای شناسایی شی مدل را نیز نشان داد. هنگامی که با مجموعه ای از مجسمه های دایناسور ارائه شد، جمینی نه تنها به طبقه بندی هر یک اشاره کرد، بلکه اسامی و داستان های پرماجرا را نیز ارائه کرد که به طرز شگفت آوری مناسب به نظر می رسید.
یکی از خبرنگاران که با چالشی کمتر از پیش طراحی شده ژست گرفته بود، از مامور خواست تا خالکوبی نسبتاً کوچکی که روی ساعدش چاپ شده بود را بخواند و نشان دهد که این تتو برای کدام برنامه تلویزیونی است. اگرچه جمینی در ابتدا «بازی تاج و تخت» را اشتباه حدس زد، اما در تلاش دوم «Battlestar Galactica» را دریافت کرد. (در صورت تعجب، نقل قول این بود که “همه ما چنین می گوییم.”)
مدل Gemini گوگل همچنین دارای یک صفحه نمایش لمسی مجهز به تورهای دوستانه Pictionary بود. من برای به چالش کشیدن پروژه Astra قدم برداشتم و تمام تلاشم را کردم تا یک دروید توپی شکل از دنیای جنگ ستارگان بسازم تا به موضوع علمی تخیلی وفادار بمانم. اگرچه این ابله قطعاً شایسته قرار گرفتن در یخچال نیست، “چه می بینی؟” وقتی پرسیده شد مامور این ترفند را انجام داد – BB-8 از سه گانه دنباله.
در حالی که نسخه آزمایشی ماهیت آزمایشی دارد، هدف جمینی این است که ثابت کند چگونه می تواند به توانایی های بینایی کمک کند. گوگل در ابتدا اعلام کرد که در قالب Gemini Live به گوشیهای اندرویدی میآید، اما این ویدیوی رسمی نمایشی نشان میدهد که آن را با یک «دستگاه نمونه اولیه عینک» کار میکند، که نشان میدهد یک فرم فاکتور جدید در حال کار است.
در سناریوی ایدهآل، Gemini Live میتواند آنچه را که میبینید ببیند تا به سؤالات شما پاسخ دهد، خلاقیت را القا کند یا حتی به شما کمک کند شی گمشدهای را که در دید آشکار پنهان شده است پیدا کنید. انجام این کار از طریق اپلیکیشن Gemini یا اپلیکیشن دوربین روی گوشی هوشمند به اندازه کافی منطقی است، اما من فکر می کنم طراحی عینکی مانند عینک هوشمند Ray-Ban Meta در نهایت اصطکاک کمتری ایجاد می کند.
به نظر میرسد که Project Astra و Gemini بهعنوان یک وسیله نقلیه به سبک «نگاه کن و بگو». در حال حاضر نسخه های رقیب هر دو وجود دارد، اما اگر یک شرکت وجود دارد که می داند چگونه جستجو را درست انجام دهد، آن گوگل است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide