گوگل Gemini 2 را منتشر کرد – در اینجا دلیل این موضوع بزرگ است
Gemini 2 آخرین مدل هوش مصنوعی گوگل است و اولین نسخه از این خانواده که منتشر شده است، سریع اما قدرتمند Gemini 2 Flash است. این شرکت میگوید این آغاز «عصر نمایندگی» است، جایی که هوش مصنوعی میتواند وظایف را بدون دخالت انسان انجام دهد.
گوگل تقریبا یک سال پیش هوش مصنوعی Gemini را راه اندازی کرد و با راه اندازی مرورهای هوش مصنوعی، ربات چت جمینی و موارد دیگر، عصر جدیدی را برای غول جستجو آغاز کرد.
Gemini Flash 2 که در اصل به عنوان یک مدل آزمایشی فقط برای توسعه دهندگان یا مشترکین Gemini Advanced در دسترس بود، علی رغم کوچکتر و سریعتر بودن، تقریباً در همه معیارها از نسخه قبلی بهتر عمل می کند.
ساندار پیچای، مدیر عامل شرکت Gemini 2 میگوید Gemini 2 دارای قابلیتهای استدلالی پیشرفتهای است که به مرورهای هوش مصنوعی در جستجوی گوگل نیز میآید تا پاسخهای دقیقتری به سوالات پیچیده و چند مرحلهای ارائه دهد.
Gemini 2 احتمالاً یک نسخه Pro نیز خواهد داشت که این مدل از تمام محصولات Google Gemini از جمله برنامه اندروید، ربات چت و آزمایشها پشتیبانی میکند.
چه چیز جدیدی در Gemini 2 وجود دارد؟
تماشا کنید
Gemini 2 توسط گوگل “عصر آژانس” نامیده می شود. این مدلی است که قادر به استدلال پیشرفته، مشابه مدل o1 OpenAI است، اما همچنین می تواند تصاویر، گفتار، متن و موارد دیگر را به صورت بومی تولید کند.
اولین مدل از خانواده Gemini 2.0 Flash است اما نسخه فعلی دارای برچسب “تجربی” است. گوگل می گوید دو برابر سریعتر از مدل پرچمدار قبلی خود، Gemini Pro 1.5 است و همچنین در معیارهای کلیدی از آن بهتر عمل می کند.
Demis Hassabis، مدیر عامل Google DeepMind، Gemini 2.0 Flash را به عنوان یک “مدل اسب کاری” با تاخیر کم و عملکرد بهبود یافته توصیف می کند. تصاویر، متن و مکالمات را می توان به صورت بومی ایجاد کرد، جایی که قبلا Gemini مجبور بود برای انجام این کارها به مدل های دیگری مانند Imagen متوسل شود.
همچنین در استدلال از تمام مدل های قبلی Gemini بهتر عمل می کند، در درک بصری به طور قابل توجهی بهتر است، می تواند گفتار را سریعتر از صدا ترجمه کند و می تواند ویدیو را بهتر از Pro 1.5 تجزیه و تحلیل کند. تجزیه و تحلیل ویدیو قبلاً یک ویژگی انحصاری Gemini بود.
پس عوامل موجود در Gemini 2.0 چطور؟
تماشا کنید
زمانی که Gemini 1.0 منتشر شد، ما در عصر «چت بات» بودیم، جایی که میتوانستید با مدلهای هوش مصنوعی چت کنید و از آنها برای ایجاد محتوا استفاده کنید. سپس با آمدن OpenAI o1 وارد عصر استدلال و همچنین عصر دلالی شدیم.
از نظر هوش مصنوعی، عامل ها جایی هستند که یک مدل می تواند نسخه هایی از خود را برای انجام عملکردهای مختلف از طرف شما ایجاد کند. گوگل همچنین یک عامل جدید در Gemini معرفی کرده است که می تواند وب را برای شما مرور کند و گزارشی در مورد یک موضوع پیچیده ارسال کند. این به عنوان تحقیقات عمیق شناخته می شود و در Gemini Advanced تعبیه شده است.
Hassabis توضیح داد: “کاربرد عملی عوامل هوش مصنوعی یک حوزه تحقیقاتی پر از امکانات هیجان انگیز است. ما در حال بررسی این مرز جدید با یک سری نمونه های اولیه هستیم که می تواند به انسان در انجام وظایف و انجام کارها کمک کند.”
او افزود که این شامل Project Astra، یک دستیار مجازی جهانی است که در طول Google I/O و پروژه جدید مارینر فاش شد. او گفت: این شامل جولز، یک عامل کد برای کمک به توسعه دهندگان، و همچنین “کاوش در آینده تعامل انسان و عامل، با مرورگر شما” است.
کجا می توانم Gemini 2.0 Flash را امتحان کنم؟
Gemini 2.0 Flash در حال حاضر برای مشترکین Gemini Advanced از منوی مدل کشویی در دسترس است. این برچسب آزمایشی است اما من متوجه شدم که به خوبی کار می کند.
همچنین می توانید از آن به عنوان یک توسعه دهنده در Gemini API یا استودیوی قدرتمند Google Gemini AI استفاده کنید. گوگل می گوید که این ویژگی در سال 2025 به تمام محصولات گوگل خواهد آمد.