من به تازگی آینده وب را دیدم – عامل جدید هوش مصنوعی Gemini Deep Research گوگل باورنکردنی است
Google Gemini یک ویژگی جدید باورنکردنی دریافت میکند که به آن اجازه میدهد تا کلونهای کوچکی از خود ایجاد کند و آنها را در سراسر وب بفرستد تا براساس یک درخواست اطلاعاتی را برای شما پیدا کند. سپس می تواند برگردد و یک گزارش پیچیده و مفصل با پیوندهایی به اطلاعاتی که یافته است ایجاد کند.
این ویژگی جدید برای مشترکین پیشرفته Gemini به عنوان یک منوی کشویی مدل کاملاً تحقیق شده به نام Gemini در دسترس خواهد بود. علاوه بر چندین عامل هوش مصنوعی، یک ویژگی سند جدید نیز معرفی شده است که به شما امکان می دهد گزارش را مشاهده و ویرایش کنید، مشابه ChatGPT Canvas.
این اولین قدم به سوی یک دوره کاملاً جدید از عوامل هوش مصنوعی است، جایی که ما کنترل را به هوش مصنوعی واگذار می کنیم. این به آن اجازه می دهد تا تعدادی از وظایف را به طور موثر از طرف ما انجام دهد. Deep Research مستقل از نماینده Google Jarvis است که گفته می شود سال آینده به کروم می آید.
آروش سلوان، مدیر ارشد محصول تیم جمینی، قبل از راهاندازی با من صحبت کرد و گفت که میتواند از طریق دادههایی که برای ایجاد گزارش پیدا کرده است، استدلال کند. “[It’s] تحلیلگر گرسنه شما، اما این دانشجوی کارشناسی ارشد شما است، نه دستیار دکتری شما.
با Gemini Deep Research چه کاری می توانید انجام دهید؟
موارد استفاده بالقوه برای تحقیقات عمیق Gemini شامل طرح هایی برای پروژه های بازسازی خانه، تهیه گزارش قبل از خرید یک وسیله نقلیه جدید، و حتی موارد پیچیده تر مانند تجزیه و تحلیل پیشنهادات تجاری جایگزین قبل از راه اندازی یک شرکت جدید است.
بنابراین واقعاً، برای موضوعاتی که یک موضوع تحقیقاتی واقعاً پیچیده هستند، جایی که شما باید برگههای زیادی را باز کنید و اطلاعاتی را با هم ترکیب کنید، یا حتی نمیدانید از کجا شروع کنید… یک ویژگی را توسعه دهید که واقعاً میتواند به شما در شروع کار کمک کند، سلوان به تامز گاید گفت.
“مثل [Gemini Deep Research] او اساساً گفت: “هنگامی که او وب را مرور می کند، درباره چیزهایی که پیدا می کند استدلال می کند تا تصمیم بگیرد که در آینده به دنبال چه چیزی باشد.”
وقتی با گزارشی برمیگردد، جمینی دیپ ریسرچ آن را به تفکیک عنوان و بخش، با استنادات و منابع به شما ارائه میکند. میتوانید به هر منبعی که او اطلاعات را از آن جمعآوری کرده است، پیوند دهید و حتی از او بخواهید که با پرسیدن یک سؤال بعدی، گزارش را اصلاح کند.
در طی آزمایشی که Deep Research به من داد، توانستم اطلاعات خاصی در مورد بورسیه های تحصیلات تکمیلی جمع آوری کنم. در ادامه، او میتواند دادههایی را که قبلاً جمعآوری کرده است، بررسی کند و اطلاعات اضافی را اضافه کند، مانند پول موجود از هر کمک مالی و ارائه آن در جدول.
جستجوی عمیق Google Gemini چگونه کار می کند؟
Google Gemini Deep Research به جای یک مدل جدید و مستقل، “سیستمی از مدل های 1.5 Pro” است. هنگامی که هشداری را صادر می کنید، اولین Gemini 1.5 Pro درخواست را منعکس می کند و یک برنامه اقدام ایجاد می کند.
سپس نسخه هایی از خود را برای اجرای و اجرای این طرح ایجاد می کند، از جمله جذب محتوای احتمالی صدها وب سایت و منابع عمومی.
با یک مقاله تحقیقاتی یا وب سایتی که پشت دیوار است یا برای دسترسی به لاگین نیاز دارد کار نمی کند، اما می توانید منابع داده خود را به آن بدهید.
این یک روند سریع نیست. تکمیل جستجو و ارائه گزارش نهایی (که می توانید آن را به Docs وارد کنید) ممکن است چند دقیقه طول بکشد.
در این چند دقیقه، Gemini تجزیه و تحلیل خود را اصلاح می کند، مانند یک انسان در اینترنت جستجو می کند، قطعات جالبی پیدا می کند و بر اساس آموخته های خود جستجوی جدیدی انجام می دهد. ممکن است چندین بار این کار را انجام دهد تا زمانی که مطمئن شود اطلاعات کافی برای یک گزارش جامع بر اساس درخواست شما دارد.
سلوان به من گفت: “من این را به عنوان یک نماینده توصیف می کنم.”
افکار نهایی
Google Gemini Deep Research به خودی خود یک ویژگی جدید و چشمگیر است. حتی با وجود اینکه فقط برای کسانی در دسترس است که برای حساب Google One پول پرداخت می کنند، مفهوم نماینده را به چت بات اصلی معرفی می کند. وقتی ویژگیهای دیگری را که به Gemini 1.5 Pro اضافه میکنید، مانند قابلیتهای استدلال و رابط سند گزارش، اضافه میکنید، نکاتی را در مورد آنچه گوگل انجام میدهد مشاهده میکنیم.
برخلاف OpenAI که از هر ویژگی جدید سود زیادی می برد، گوگل بی سر و صدا در پس زمینه آشپزی می کند و عناصر جدیدی را به محصولات موجود اضافه می کند که استفاده از آنها را آسان تر می کند.
تعجب نخواهم کرد اگر Deep Research به Google Gemini Gemini در حال حاضر چشمگیر اضافه شود و به شما امکان می دهد نسخه ای از Gemini را بر اساس داده های خود شخصی سازی کنید. این امر Gems را به یک ابزار تحقیقاتی قدرتمند تبدیل میکند و با افزودن ویژگیهای پادکست NotebookLM نیز به یک نیروگاه خلاق تبدیل میشود.
آنچه در اینجا مهم است ورود عوامل است. تا سال 2025، شاهد خواهیم بود که نمایندگان هر شرکت هوش مصنوعی تسلط بر چشم انداز هوش مصنوعی و انجام هر کاری که فکرش را می کنید، از جمله کدنویسی، رزرو پرواز و گشت و گذار در وب را انجام می دهند.