من جمینی لایو را به مدت 24 ساعت آزمایش کردم – خوب، بد و عجیب
توسعه دهندگان هوش مصنوعی مدتی است که سعی کرده اند مشکل دستیار شخصی دیجیتال را حل کنند و سرویسی را ارائه دهند که هوشمند، تعامل آسان و همیشه آماده باشد. Gemini Live که اوایل این هفته در Made by Google اعلام شد، تلاش جدید گوگل برای انجام این کار است، بنابراین من این هوش مصنوعی را یک آزمایش 24 ساعته انجام دادم تا ببینم چقدر نزدیک است.
در حالی که به گپ زدن مستقیم با دستیاران هوش مصنوعی به غیر از درخواست تنظیمات تایمر در حین آشپزی عادت ندارم، میخواستم ببینم که یک مکالمه باز با شخصی مانند جمینی چه فایدهای دارد. و بعد از این روز آزمایش، حداقل به ارزش صحبت کردن با هوش مصنوعی به این طریق مطمئن هستم، حتی اگر کمتر به برخی از پاسخ هایی که اکنون می دهد اعتقاد داشته باشم.
در حالی که آزمایشهای من با Gemini Live به دور از آزمون رسمی تواناییهای آن است، وسعت سؤالاتی که از من میگیرد، تصور خوبی از کارهایی که انجام میدهد و به خوبی انجام نمیدهد به ما میدهد. بنابراین من در ارزیابی خود مطمئن هستم که Gemini Live افزودنی خوبی برای مجموعه Gemini خواهد بود و شاید دلیل کافی برای برخی از کاربران رایگان برای تبدیل شدن به کاربران پولی Gemini Advanced با 20 دلار در ماه باشد. حتی اگر هنوز به تمام اهدافش نرسیده باشد.
بعد از ظهر پنجشنبه – راه اندازی
Gemini Live به عنوان بخشی از اشتراک Gemini Advanced ارائه می شود، اما در حالی که در حین نوشتن در حال انتشار است، هنوز برای همه کاربران در دسترس نیست. خوشبختانه من یک Google Pixel 9 Pro XL برای امتحان داشتم. اگر میخواهید درباره تلفن بیشتر بدانید، میتوانید بررسی عملی Google Pixel 9 Pro و Pro XL ما را بررسی کنید زیرا ما در اینجا فقط بر روی Gemini Live تمرکز میکنیم.
مشکل دیگر این است که در حال حاضر باید زبان Gemini خود را روی انگلیسی ایالات متحده تنظیم کنید تا از آن استفاده کنید. خوشبختانه حتی پس از انجام این کار، باز هم توانستم از بین ده صدای موجود برای جمینی چت، یک صدای انگلیسی به نام «کاپلا» را انتخاب کنم. همه چیز کاملا طبیعی به نظر می رسد، فقط با سطوح مختلف اشتیاق و زیر و بم. حتی زمانی که شروع به سوال پرسیدن می کنید، به ندرت به اشتباه تلفظی بد یا جمله ای عجیب و غریب می رسد.
عصر پنجشنبه – بازگشت به خانه
هنگامی که همه چیز تنظیم شد، اولین تعامل مهم من با جمینی چت درخواست مسیرهای خانه بود. Gemini Live در ابتدا به من نگفت چه چیزی پیدا کرده است، پس از اینکه روش مورد نظر خود را برای حمل و نقل به آن گفتم و ایستگاه هایی را که می خواستم بین آنها بروم تأیید کردم. پس از مدت ها انتظار از او خواستم آنچه را که پیدا کرده به من بگوید و او به من راهنمایی کرد.
احتمالاً مسیر خانه را طی می کردم. با این حال، این یکی از آرام ترین سفرها نخواهد بود. جمینی یکی از خطوط قطار و یکی از ایستگاهها را اشتباه شناسایی کرد، اما از ذکر این نکته غافل شد که یکی از تغییرات من از نظر فنی نیاز به پیادهروی بین دو ایستگاه دارد و سپس به نظر میرسد که یک قطار کاملاً از ابتدا اختراع کرده است. این بسیار عجیب است زیرا Gemini ادعا کرد که وب سایت Transport for London را برای اطلاعات بررسی کرده است.
این یک مشکل در مدل زیربنایی هوش مصنوعی به جای Gemini Live است، اما نشان میدهد که داشتن صدایی معتبر (با لهجه بریتانیایی) در مسیریابی مسیر میتواند منجر به گم شدن فردی کمتر آشنا با حملونقل عمومی لندن شود. به نظر می رسد برای این نوع کارها بهتر است به Google Maps پایبند باشید.
صبح جمعه – نشست خبری
روز بعد، در حالی که برای کار آماده می شدم، از جمینی خواستم که من را در آخرین اخبار روز پر کند. او تنها با یک فرمان توانست در مورد تغییر مجریان برنامه های صبح بخیر بریتانیا و این صبح خیلی چیزها را به ما بگوید و همچنین اشاره ای کوتاه به چاقو زدن اخیر در میدان لستر داشته باشد. اما وقتی من اخبار فناوری را خواستم همه چیز عجیب تر شد.
گوگل جمینی در ابتدا اعلام کرد که مایکروسافت Surface Duo 3 را معرفی کرده است – دستگاهی که هنوز تایید نشده است و حتی چندین ماه شایعه شده است که لغو خواهد شد. PS5 Slim واقعی است، اما پاییز گذشته منتشر شد، و میتوان فرض کرد که او در آخرین نظر خود به قطع شدن Crowdstrike در ماه گذشته اشاره کرده است.
سپس از جمینی لایو خواستم تا بر شایعات آیفون تمرکز کند، اما در ابتدا پاسخهای او درباره سری آیفون 15 موجود در حال حاضر بود. با تشویق بیشتر، او در مورد برخی از شایعات مربوط به دوربین آیفون 16 صحبت کرد، اما جزئیات زیادی نداشت.
صبح جمعه – راهنمای دم کردن آبجو
پس از چند ساعت کار، زمان استراحت قهوه فرا رسید، بنابراین از جمینی لایو خواستم تا در تهیه یک V60 pourover مرا راهنمایی کند.
من امیدوار بودم که دستورالعمل های گام به گام را از هوش مصنوعی دریافت کنم، اما مشکل اینجاست که شما باید دائماً Gemini Live را تحریک یا قطع کنید تا آن را مجبور کنید که پاسخ های گام به گام بدهد. با این حال، علیرغم اینکه متن نشان میداد که او ابتدا به خواستههای من اشتباه نشنیده است، او موفق شد مکالمه را به تأخیر بیندازد و پاسخهای قانعکنندهای ارائه دهد.
جمینی از نظر دانش یک بسته مختلط بود. او نکاتی در سطح حرفه ای مانند فیلتر کردن آب قبل از جوشاندن ارائه کرد. دستور کلی به یک فنجان ساده اما قابل نوشیدن منجر شد. اما Gemini Live همچنین وزن توصیه شده قهوه را در قاشق غذاخوری به جای گرم یا اونس به من داد، که اندازه گیری معمولی هنگام دم کردن نیست. با این حال، من توانستم مقدار گرم را با یک هشدار اضافی دریافت کنم.
ناهار جمعه – بحث مبارزه
در حالی که وقت ناهار آزاد داشتم، با جمینی لایو درباره Street Fighter 6 گپ زدم، بازی که در حال حاضر بیشتر از همه بازی می کنم. به درستی نام قهرمان و رقیب Evo 2024 را برای SF6 امسال انتخاب کرد، اما هنوز جزئیات اولیه زیادی ارائه نکرد.
من مکالمه را به مشاوره تمرینی منتقل کردم (من تمایل دارم بیش از حد به حرکات خاصی تکیه کنم)، جایی که پیشنهادهایی در مورد چگونگی تجدید نظر در رویکرد خود در یک مسابقه دریافت کردم. گفتن آن آسانتر از انجام دادن بود، اما همچنان توصیههای معتبر زمانی که حریف شما گلولههای آتشین را به سمت شما پرتاب میکرد.
من همچنین سعی کردم راهنمایی هایی در مورد اینکه کجا می توانم ملاقات های حضوری را پیدا کنم، دریافت کنم، اما کاملاً جواب نداد. او سعی کرد وب سایت رسمی را برای جزئیات بررسی کند، اما متوجه شد که هیچ چیز دیگری جز مسابقات رسمی کپکام وجود ندارد. سپس یک گروه فیس بوک در نزدیکی من پیدا کرد، اما پس از آن نتوانست به من پیوندی برای دسترسی به آن در متن ارسال کند.
جمعه بعد از ظهر – نوشتن توصیه
من تصمیم گرفتم به عنوان آخرین ماموریت Gemini وارد متا شوم، و نه، ما در مورد Llama 3 صحبت نمی کنیم. از او خواستم به من کمک کند تا مقدمه این مقاله را تهیه کنم.
بعد از اینکه جمینی در پاسخ های قبلی ام جزئیات زیادی به من نداد، از اینکه جمینی چقدر بیشتر مایل به پیشنهاد عبارات خاص بود، متعجب شدم. وقتی از او خواستم اطلاعات بیشتری اضافه کند یا زاویه اش را تغییر دهد، به روشی که منطقی بود پاسخ داد. و همانطور که گوگل با افتخار در نسخه نمایشی Made by Google اشاره کرد، Gemini Live می تواند وقفه ها را مدیریت کند و پاسخ های خود را در لحظه تنظیم کند.
این بهترین چیزی است که Gemini Live تا به حال احساس کرده است، زیرا تکرار یک ایده با صدای بلند کاملا طبیعی است، حتی زمانی که در حال صحبت با شکل موج درخشان در تلفن خود هستید. در نهایت مقدمه این مقاله را از ابتدا نوشتم. اما اگر به عقب برگردید و آن را با آنچه او به من داد مقایسه کنید، احتمالاً می توانید بازتاب آخرین پیشنهاد او را ببینید.
Google Gemini Live: افکار نهایی
ممکن است از این مقاله فکر کنید که من واقعاً جمینی لایو را دوست ندارم، اما این کاملاً درست نیست. بدترین انتقادهای من متوجه مدل Gemini Advanced بود که آن را اجرا می کرد، زیرا به نظر می رسید در بسیاری از سناریوهای آزمایشی به دنبال چه چیزی بود. به اندازه کافی خنده دار، یک رویارویی اخیر بین Gemini و Gemini Advanced نشان می دهد که شاید بهتر باشد از Gemini پایه استفاده کنم.
در همین حال، جمینی لایو به تنهایی موفق شد. به نظر می رسد که بتوانید یک مکالمه مداوم با یک چت بات را حفظ کنید تا تعامل با پیام های متنی یا تصویری، راه بسیار بهتری برای تعامل باشد، به شرطی که بخواهید مشخص باشید و اگر از مسیر خارج شد، مداخله کنید. میتوانید بهطور منظم از دستیاران دیجیتال سؤالات بعدی بپرسید، اما هنوز آنطور که جمینی لایو ثابت میکند، یکپارچه نیست. و این یکپارچگی آن را کاربردی میکند، به شما کمک میکند به سؤالات پاسخ دهید و راهنماییهایی را ارائه دهید، نه فقط بدون دست، بلکه بدون چشم، و به شما امکان میدهد تا زمانی که شما و ربات چت در حال صحبت هستید، روی چیز دیگری تمرکز کنید.
سوال بزرگ این است که چگونه این با ChatGPT Voice آینده مقایسه می شود، به خصوص که Gemini Live قبل از پاسخ دادن به تفسیر گفتار به عنوان متن متکی است، در حالی که ChatGPT Voice می تواند مستقیماً گفتار را پردازش کند. اما علیرغم اخطارهای معمول هوش مصنوعی، به نظر می رسد که گوگل در مسیر درستی برای دنبال کردن رویای دستیار شخصی دیجیتال است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide