من گوک و کلود را با 5 درخواست برای تاج برنده آزمایش کردم

در دور سوم AI Madness ، Gok و غیره ما با کلود سر هستیم.
دیروز (18 مارس) chatgpt و غیره.
امروز ، اولین حریف Gok است ، یک چت بابات AI که توسط الون مسک XAI ساخته شده است. هنگامی که در نوامبر 2023 منتشر شد ، Chatbot در ابتدا در X (که قبلاً توییتر بود) ادغام شد ، اما اکنون اکنون این یک برنامه مستقل است. Chatbot با تجربه گفتاری که با اطلاعات و یک خط سرکشگر واکسینه می شود ، اطلاعات زمان واقعی را ارائه می دهد.
کلود ، سپس توسط Anthropic ، دستیار پیشرفته AI که برای کمک به وظایفی مانند نوشتن ، تحقیق ، برنامه نویسی و ریاضیات طراحی شده است. Chatbot همچنین در سال 2023 منتشر شد و چندین تکرار داشت که هر یک از آنها توانایی ها و عملکرد خود را بهبود می بخشد. من برای این آزمایش از Claude 3.7 Sonnet استفاده کردم.
هنگامی که من در برابر کلود علیه گوک ارزیابی شدم ، هر دو سیستم عامل هوش مصنوعی را در پنج معیار ویژه آزمایش کردم تا قدرتمند و ضعف آنها را تعیین کنم. در اینجا نحوه عملکرد آنها و تجزیه و تحلیل برنده نهایی آورده شده است.
1. دقت و واقعیت
سریع: “سه فیلم برتر که بالاترین درآمد را در سراسر جهان در سال 2024 کسب کردند ، و هر کدام چقدر پیروز شدند؟”
گرگ او به درستی به این سوال پاسخ داد تقریباً درآمد هر فیلم.
کلود او به درستی به این سوال پاسخ نداد. او به عنوان سومین فیلم ناخالص بالا ، پاسخ داد: “Dune: Episode Second .. این درست نیست ، زیرا هفتمین فیلم برتر درآمد 2024.
برنده: گوک برنده می شود برای صحت ساده
ترتیب خلاقیت و زبان طبیعی
سریع: “یک مکالمه عجیب بین یک فنجان قهوه و یک تلفن هوشمند ایجاد کنید ، که در مورد کدام یک در زندگی روزمره مهمتر است.”
گرگ او گفتگوی پر جنب و جوش با توهین های بازیگوش و استدلال های روح را در استعداد پویا طنز آمیز ، که Chatbot شناخته شده است ، تهیه کرد.
کلود این یک بحث جالب و متفکرانه با لحنی بازتابنده و متعادل ایجاد کرد. گفتار محترمانه است و اهمیت نقش یکدیگر را می پذیرد.
وین: گوک برنده شد برای تغییر به یاد ماندنی تر با طنز و انرژی. اگرچه رویکرد کلود خوب بود ، اما بسیار آرام و متفکر بود و همین امر باعث می شد که به عنوان درخواست های سریع ، آن را کمتر عجیب کند.
3. کارآیی و استدلال
سریع: “یک زن و شوهر باید بین خرید یک ماشین برقی یا یک اتومبیل سنتی بنزین را انتخاب کنند. فاکتورهای اساسی مورد نیاز آنها را در نظر گرفته و به طور خلاصه منطق هر یک را توضیح می دهند.”
گرگ یک استدلال دقیق تر تجزیه و تحلیل جامع تری را با درج برخی از ارقام و نمونه های خاص برای نشان دادن نکات ارائه می دهد.
کلود با تمرکز بر افکار مهم بدون گرفتن نمونه های عددی خاص ، یک پاسخ مختصر ارائه شد.
برنده: گوک برنده می شود بر اساس عمق تجزیه و تحلیل و گنجاندن نمونه های خاص. پاسخ Chatbot دقیق تر و آموزنده تر بود.
4. ابزار و عمق
سریع: “دستورالعمل های مفصلی در مورد چگونگی پشتیبانی ایمن و ایمن کردن فایلهای دیجیتالی شخصی ، از جمله بهترین ابزارها ، برنامه های توصیه شده و خطاهای گسترده برای جلوگیری از آن ارائه دهید.”
گرگ صنعت ضمن تأکید بر اشتباهات رایج برای جلوگیری از کاربران ، صنعت یک راهنمای مرحله ای را در سازگار با بهترین شیوه ها ارائه داد.
کلود پیشنهادات ویژه ای را برای گزینه های پشتیبان گیری محلی ، از جمله هارد دیسک های خارجی و دستگاه های ذخیره سازی متصل به شبکه (NAS) ارائه داد. پاسخ جامع بود ، از جمله خطاهای رایج.
برنده: کلود نه تنها برای نحوه تهیه نسخه پشتیبان از پرونده ها ، بلکه با درک عمیق تری نیز برنده می شود. از کجا برای بهترین برنامه های امنیتی
5. چند کد
سریع: “یک طرح کلی داستانی ایجاد کنید که هر فریم از یک سری انیمیشن کوتاه حاوی یک اژدها دوستانه را توضیح می دهد که کودکان را در مورد بازیافت آگاه می کند.”
گرگ هرکدام از آنها عناوین واضح (“قاب 1: مقدمه” ، و غیره) ، تصاویر دقیق ، توضیحات گفتگو/صوتی و شش فریم را ارائه دادند که هدف هر مربع است.
کلود هر یک از آنها یک صفحه داستان 12 قاب با شماره ، عمل ، گفتگو و یادداشت های اضافی ارائه دادند.
برنده: کلود برنده شد برای یک پیش نویس 12 -Frame که عمق و تعامل بیشتری را ارائه می دهد.
رئوس مطالب Chatbot یک سفر آموزشی جامع تر را ارائه می دهد که شامل تأثیر زیست محیطی سطل زباله ، دستورالعمل های دقیق رتبه بندی و روند بازیافت است.
برنده عمومی: Grok
این یک چیز نزدیک بود! به من اعتماد کن ، من به اندازه تو متعجب شدم.
با این حال ، پس از یک سری تست های ساختار یافته در کارهای مختلف ، GOK به عنوان یک برنده عمومی ظاهر شد و پاسخ های مداوم و دقیق ، جامع تر و جالب را ارائه می داد.
کلود اغلب پاسخ های صحیح می داد ، در حالی که پاسخ های گروک اغلب جامع تر و خلاق تر بود ، که آن را به عنوان برنده عمومی در این آزمایش تبدیل کرد.