من تحقیقات عمیق هوش مصنوعی را در رابطه با حیرت و دوقلوها علیه GOK-3 آزمایش کردم.

آخرین ویژگی Chatbots محبوب مانند Chatgpt ، Twins و Hourtoneshances توانایی جستجوی عمیق تر است. امروز ، XAI GOK-3 را آغاز کرد و بیش از ده برابر قدرت محاسبه سلف خود GOK-2 را به خود اختصاص می دهد. وسیله نقلیه “DeepSearch” به عنوان موتور جستجوی نسل جدید اعلام شد.
این قایق های گپ به این معنی است که آنها می توانند قابلیت های استدلال پیشرفته ، سطح متخصص را اداره کنند و مقادیر زیادی از اطلاعات را در زمینه های مختلف مانند امور مالی ، تحقیقات محصول و موارد دیگر سنتز کنند. این chatbots با وب تماس می گیرند و به محتوای وب سایت های مربوطه نگاهی می اندازند ، بنابراین به آن احتیاج ندارید.
تحقیقات عمیق Chatgpt در حال حاضر فقط 200 دلار در ماه برای کاربران Proser در دسترس است. Grok-3 Beta و Premium+ می توانند با قیمت 30 دلار در هر ماه برای کاربران استفاده شوند. دوقلوهای و حیرت گوگل یک ویژگی تحقیق رایگان را به صورت رایگان برای کاربران ارائه می دهد. برای استفاده از Gemini Pro 1.5 با تحقیقات عمیق ، این مدل را از منوی POP -UP روی سیستم عامل یا برنامه انتخاب کنید. برای استفاده از ویژگی تحقیق عمیق با AI Clostused ، هنگام ورود به پرس و جو خود ، جعبه متن خود را فعال کنید.
مجبور شدم ببینم که چگونه آنها برای خودم با بسیاری از چکمه های چت که می توانند عمیق تر شوند و با استدلال پیشرفته برخورد کنند ، مقایسه شده اند. این سه چکمه چت ، به طور کلی برای تعیین اینکه کدام chatbot در جستجوی عمیق Claude 3.5 غزل که توسط یک سری از 5 درخواست هنگام آزمایش انجام می شود ، بهترین است.
1. تجزیه و تحلیل مقایسه ای
سریع: “تأثیر جهانی سیاست های قیمت گذاری کربن بر اقتصادهای ملی و تلاش های کاهش انتشار را تجزیه و تحلیل کنید.”
جنین وی با لحن دانشگاهی پاسخ رسمی ارائه داد. جزئیات مکرر و عمومی پاسخ را به عنوان ورودی ویکی پدیا می خواند ، اما بدون نمونه های دنیای واقعی یا جزئیات بیش از حد.
تعجب علاوه بر این ، علی رغم جزئیات و نقل قول های فنی قوی ، وی پاسخ علمی را ارائه داد که بسیار متراکم بود. پاسخ بسیار مبتنی بر ژارگون و آمار بود.
Grok-3 این سریعترین پاسخ را با جزئیات و از جمله نمونه ها و تجزیه و تحلیل های مربوطه ارائه داد. او همچنین موفقیت و مشکلات را پذیرفت.
برنده: گوک این برای تجزیه و تحلیل بسیار دقیق و ظریف پیروز می شود و با مثال های خاصی بر اقتصادی و انتشار گازهای گلخانه ای تأثیر می گذارد. هوش مصنوعی به آخرین آماری اشاره دارد که پاسخ به زمان و قابل اعتماد را ایجاد می کند.
2 محاسبه کوانتومی
سریع: “یک مرور کلی از آخرین تحولات در محاسبه کوانتومی در پنج سال گذشته ارائه دهید.”
جنین وی پاسخی را با نمونه های بسیار کلی و محدود و در عین حال با یک زمینه بیش از حد تاریخی ارائه داد. بخش ها بسیار طولانی و مکرر بودند که فاقد عمق فنی بودند.
تعجب تصحیح گسل شامل کلیه تحولات مهم در اطلاعات کوانتومی ، از جمله نوآوری های سخت افزاری ، سیستم های کلاسیک کوانتومی ترکیبی ، پیشرفت های الگوریتمی و تجاری سازی است. او همچنین مسئله پیچیده را شکست و بخش هایی را که آن را خواندنی و جامع می کند ، اما قابل هضم می کند ، طبقه بندی کرد.
Grok-3پاسخ او بسیار روی نقاط عطف تاریخی متمرکز بود. اگرچه جالب و خوب نوشته شده بود ، اما کمتر پیکربندی شده و فاقد عمق بود. این کار همچنین با یک یادداشت سوداگرانه به پایان رسید ، در حالی که تعجب یک خلاصه جامع تر و تحلیلی را انجام داد.
برنده شدن: تعجب بین سالهای 2020-2025 ، آموزنده ترین ، ساختاری و به روزترین تجزیه و تحلیل پیشرفت فرآیند اطلاعات کوانتومی را ارائه داد.
3. تأثیر هوش مصنوعی بر اشتغال
سریع: “اثرات هوش مصنوعی بر تمایلات اشتغال در صنایع مختلف را بررسی کنید. داده های آماری را در محل کار و ایجاد اضافه کنید و نتایج بلند مدت را برای نیروی کار تجزیه و تحلیل کنید.”
جنین از توضیحات صنعتی عمومی بدون ادغام عمیق روندها یا اعداد خاص استفاده می کند. همچنین فاقد عمق آماری خالص است و بسیاری از ادعاها بسیار گسترده و حتی نامشخص هستند.
تعجب وی دیدگاه متعادل در مورد ایجاد و آواره شدن ارائه داد. تأکید بر شکافهای آموزش و راه حل های سیاست. این حیرت همچنین تغییر مهارت ترکیبی را به طور جامع مورد بررسی قرار داد و در مورد مشکلات توزیع مجدد اقتصادی بحث کرد.
Grok-3 او با یک پاسخ جالب و ساختار یافته پاسخ داد ، اما داده ها در عرضه عمق نبودند یا مورد تجزیه و تحلیل قرار گرفتند. وقتی در مورد تعداد جابجایی کار صحبت می کنید ، نقش AI را در صنایع خاص اندازه گیری نمی کند.
برنده: تعجب پاسخ برای غنای داده های آماری با اعداد و منابع عمیق تحلیلی و حساس است.
4. استراتژی های جهانی برای اتخاذ انرژی تجدید پذیر
سریع: “به منظور تشویق انرژی تجدید پذیر برای اتخاذ انرژی تجدید پذیر در دهه گذشته ، تولید ناخالص داخلی توسط تولید ناخالص داخلی بهترین 10 و 10 استراتژی برتر در حال توسعه است که توسط کشور در حال توسعه به کار رفته است.”
جنین به نظر می رسید زمینه ای از پوشش سطحی است ، یعنی محروم از تجزیه و تحلیل عمیق مالی و سیاست. داده ها بسیار عمومی است و تأکید کمتری بر روندهای سرمایه گذاری و دستاوردهای خاص پروژه دارد.
تعجب این اطلاعات کمی در مورد پیشرفت انرژی تجدید پذیر برای هر کشور که توسط ارقام خاص و منابع محترم پشتیبانی می شود ، ارائه می دهد.
Grok-3s این پاسخ بسیار دقیق و ساختار یافته بود ، اما بدون مقایسه یا روند کافی در بسیاری از کشورها متمرکز شده بود. پاسخ گوک همچنین استراتژی های سرمایه گذاری را به اندازه عمیقاً غافلگیرکننده و از دست دادن توافق نامه های چند جانبه و تلاش های یکپارچه سازی انرژی مرزی و مرزی تجزیه و تحلیل نمی کند.
برنده: تعجب پاسخ مبتنی بر داده ها ، مقایسه ای و پاسخ بیشتر ، که به بهترین وجه به آن پاسخ می دهد.
5. کار تطبیقی سیستم های بهداشتی
سریع: “مقایسه و مقایسه چگونه سیستم های بهداشتی مختلف در جهان در دهه گذشته چگونه به پاندما واکنش نشان می دهند. اثربخشی استراتژی های مختلف ، تخصیص منابع و سیاست های بهداشت عمومی را ارزیابی کنید.”
جنین او پاسخ شدیدی داد ، اما او جزئیات GOK-3 را ارائه نداد یا به طور مؤثر طیف گسترده ای از سیستم های بهداشتی را تجزیه و تحلیل نکرد. پاسخ از دیدگاه دانشگاهی و گفتار بسیار دشوار بود.
تعجب وی پاسخ خوبی را ارائه داد ، اما هیچ مقایسه مستقیمی بین کشورها وجود نداشت. برخی از بینش ها احساس عمومی تری می کردند و عمق آماری کمتری را ارائه می دادند.
Grok-3 آمار مفصلی در مورد ظرفیت بیمارستان ، نرخ آزمایش ، دامنه واکسیناسیون و تخصیص تأمین مالی ارائه می دهد.
برنده: GOK-3 این به طور سیستماتیک تجزیه و تحلیل می کند که چگونه انواع مختلف سیستم های بهداشتی (پرداخت مجرد ، پرداخت چندگانه ، سنگین و توسعه ویژه) به همه گیر پاسخ می دهند. با استفاده از اطلاعات دارای اطلاعات ، رویکرد ساختاری AI باعث می شود که چگونه مدل های مختلف بحران ها را کنترل می کنند.
برنده عمومی: حیرت
در این آزمایش ، حیرت به عنوان یک برنده عمومی ظاهر می شود. این رقابت را در زمینه های کلیدی مانند جنبه های قوی ، عمق تحقیق ، وضوح سازمان ، عرض تجزیه و تحلیل و ادغام داده های قدرتمند پشت سر می گذارد. در پنج تقاضا ، حیرت یک رویکرد بسیار ساختار یافته را نشان داد که عمق آماری را با بینش های مقایسه ای روشن متعادل می کند. او از منابع معتبر و داده های کمی به طور مؤثر استفاده کرد ، نه تنها آموزنده ، بلکه به خوبی پشتیبانی می شود.
بر خلاف گوک ، که در سنتز قوی است اما گاهی اوقات به روایات گسترده تر تکیه می کند ، تعجب یک رویکرد خاص و پژوهشی را ایجاد کرد و آن را برای تجزیه و تحلیل واقعی قابل اطمینان تر کرد. گاهی اوقات با دوقلوها که بسیار دانشگاهی بودند و حتی هر از گاهی در خارج از موضوع بودند ، مقایسه می شد ، بر هدف حیرت متمرکز می شد و هر پاسخ را قادر می ساخت تا مستقیماً با مؤلفه های اساسی مسئله مقابله کند. توانایی مقایسه استراتژی های جهانی ، ارزیابی اثربخشی سیاست و ادغام نتایج دنیای واقعی ، آن را به جامع ترین و متعادل ترین قایق مکالمه تبدیل کرده و بهترین عملکرد را به طور کلی انجام می دهد.
از آنجا که Chatbots همچنان به توسعه و توسعه ویژگی های جدید ادامه می دهد ، ما همچنان سعی خواهیم کرد توانایی های آنها را در برابر رقابت با تقاضایی که به طور کامل تست و بررسی توانایی های منحصر به فرد آنها را آزمایش می کنیم.