به روزرسانی قوی “تحقیقات عمیق” Chatgpt یک نسخه منبع باز دریافت کرد – فقط در 24 ساعت
![به روزرسانی قوی "تحقیقات عمیق" Chatgpt یک نسخه منبع باز دریافت کرد - فقط در 24 ساعت OpenAI جستجوی ChatGPT را برای همه کاربران رایگان کرده است. گوگل باید نگران باشد](https://zoomfars.com/wp-content/uploads/2024/12/oX29deMMhgsTrdb84vDmsY-1200-80.jpg)
در نمایشی قابل توجه از سرعت باورنکردنی بازار هوش مصنوعی ، تیمی در بغل کردن چهره ، نماینده OpenAi را که در اوایل این هفته منتشر شد ، افزایش یافت ، تحقیقات عمیق.
Deepresearch جدید این تیم یک ابتکار عمل باز است که در حال حاضر با عملکرد مقایسه OpenAI مطابقت دارد.
تحقیقات عمیق ، استدلال و LLM اساسی با استفاده از یک تحقیق پیچیده وب چند مرحله ای یک عامل هوش مصنوعی است ، در این حالت مدل O3 منتشر نشده. OpenAI ادعا می کند که اگر داده های جدید به داده های جدید نیاز داشته باشند ، نماینده جدید به اندازه کافی هوشمند است که در تحقیقات خود به یک جهت جدید بازگردد.
این شرکت می گوید: “هنگامی که توسط نسخه ای از OpenAi O3 تقویت می شود ، برای اسکن وب و تجزیه و تحلیل داده ها بهینه می شود ، مقادیر زیادی متن ، تصاویر و PDF را برای جستجو ، تفسیر و تجزیه و تحلیل توجیه می کند. … “
تنها 24 ساعت پس از انتشار جایگزین تجاری ، Deepsearch در فضای باز به منظور ارائه عملکرد مشابهی وارد شد ، اما توسط همه افراد در سراسر جهان به صورت رایگان و باز استفاده می شود.
پشتیبانی مولتیودال عامل باز باید با یک زنجیره کار ترکیب شود تا اطمینان حاصل شود که عامل باز می تواند فوراً پروژه را به طور مؤثر حل کند.
تنها 24 ساعت پس از انتشار جایگزین تجاری ، DeepSearch Open برای ارائه عملکرد مشابهی رایگان به دست آمد.
یک هدف مهم برای تیم نزدیک شدن به برابری با تحقیقات عمیق در جدول رهبر Gaia ، جدول است که قاب های عامل خودمختار را تأیید می کند. Openai در معیار تأیید به 67.36 ٪ رسید و بدون هیچ گونه پشتیبانی وسیله نقلیه ، تنها 9.7 ٪ از LLM Bare GPT-4 Turbo LLM به 9.7 ٪ رسید.
صد مجموعه ای که به روز شده اند به 55.15 ٪ قابل اعتماد رسیده اند. این نمرات نشان دهنده توانایی یک عامل برای مقابله با 450 سؤال ناچیز به صورت خودمختار و حل آنها است.
این تیم گفت: “در حداکثر سرعت 24 ساعته ما ، ما شاهد پیشرفت های پایدار در عملکرد نماینده خود در گایا هستیم! سریع از سودای قبلی … ما در مجموعه تأیید به عملکرد فعلی 55.15 ٪ رفتیم. “
تلاش بغل کردن صورت یک مطالعه مداوم است. توسعه دهندگان مردم را برای کمک به ایجاد محصول نهایی دعوت می کنند. به عنوان مثال ، وب سایت پروژه نیاز به تولید یک مرورگر وب چند حالت ، نمایندگان اضافی و پشتیبانی از مدل محلی را توضیح می دهد.
کسانی که می خواهند ببینند تاکنون کدام پیشرفت انجام شده است ، باید مستقیماً از سایت نسخه ی نمایشی بازدید کنند. این یک قسمت چهره بغل است ، اما اکنون به نظر می رسد که بیش از حد بارگذاری شده است. وقتی سعی کردم یک عامل را اجرا کنم ، یک پیام خطایی دریافت کردم که فرض می کنم که این نشان دهنده مشکلات دندانپزشکی است.
با این وجود ، این قطعاً ارزش تماشای آن را دارد.