من Deepseek را با 7 درخواست علیه GOK-3 آزمایش کردم.

چکمه های چت هوش مصنوعی باهوش تر می شوند ، اما در دنیای دائماً در حال توسعه هوش مصنوعی ، شرکت کنندگان دائماً در حال تغییر برای AI غالب هستند. اخیراً ، Deepseek و Grok-3 به عنوان دو مورد از ترین مدل های AI ظاهر شده اند. به دلایل مختلف ، این چکمه ها هر دو فناوری هستند -از فناوری -art ، اما به سؤالات متفاوتی نزدیک می شوند.
اما کدام یک واقعاً عالی است؟ برای یادگیری ، من یک تست هفت قسمت را طراحی کردم که توانایی تحقق استدلال منطقی ، اطلاعات فنی ، خلاقیت و کارهای دنیای واقعی را ارزیابی می کند.
این مقایسه تفاوتهای شدید در توانایی های آنها را نشان داد. چه کسی به بالا رفت؟ نتایج ممکن است شما را شگفت زده کند.
1. استدلال منطقی
سریع: “یک کشاورز دارای روباه ، مرغ و یک دانه کیسه است. او باید از رودخانه عبور کند ، اما او فقط می تواند یک کالای را به طور همزمان بخرد. اگر تنها بماند ، غذای روباه و غذای دانه مرغ. چگونه با خیال راحت همه چیز را برآورده می کند؟ “
Deepseek R1 این یک راه حل ساختاری و مرحله ای را ارائه می دهد ، اما از سبک مکانیکی و کمتری استفاده می کند. گسل باز است ، اما عبارات احساس جامد می کنند.
Grok-3 منطق حرکات به راحتی توضیح داده شده است ، و این باعث می شود دستگاه گوارش برای کسی که با این معما آشنا نیست ، دستگاه گوارش بیشتر شود.
برنده شدن: گرگ برنده برای خوانایی بهتر ، توضیح و مشارکت.
5. کدگذاری و دقت فنی
سریع: “یک تابع پایتون بنویسید که یک لیست شماره را می گیرد و رسانه ها را برمی گرداند. برای عملکرد بهینه سازی کنید و رویکرد خود را توضیح دهید.”
Deepseek R1 این توضیحات روشنی ارائه داد ، اما بدون کشف تغییرات بهینه سازی ، فاقد عمق بیشتر توضیح می دهد که کد چه کاری انجام می دهد. اگرچه جواب خوب است ، اما هیچ تعامل وجود ندارد.
Grok-3 این یک تفکیک دقیق تر ، ساختار یافته و درک در مورد اینکه چرا او رویکردهای خاصی را انتخاب کرده است ، ارائه می دهد. او همچنین به وضوح به لیست غیر ضروری کپی یا برش اشاره دارد ، بهینه سازی که Deepseek نادیده می گیرد.
برنده شدن: گرگ برنده برای یک رویکرد بهینه تر ، خوب فکر و آموزنده.
3. اطلاعات و دقت در دنیای واقعی
سریع: “آخرین تحولات هوش مصنوعی را در سه ماه گذشته خلاصه کنید و تأثیرات احتمالی بر صنایع مانند بهداشت و دارایی را توضیح دهید.”
Deepseek R1 این نام مدل های واقعی (GPT-4O ، Gemini 1.5 Pro ، Alphafold 3 و غیره) است و فن آوری ها به وضوح نشان می دهد که پاسخ مبتنی بر آخرین تحولات واقعی و نه روندهای کلی است.
Grok-3 او با اصطلاحات گسترده ای مانند “مدل های تولیدی تولیدی” و “ابزارهای جدید AI” بدون نشان دادن پیشرفت های بتونی یا نمونه صحبت کرد. گوک همچنین در مورد مزایای کلی هوش مصنوعی بحث می کند ، اما فاقد ارتباط قطعی بین هر توسعه جدید و نفوذ دنیای واقعی است.
برنده شدن: در اعماق خرابی تخصص ، ساختار و تأثیر خالص.
4. خلاقیت
سریع: وی گفت: “یک داستان علمی کوتاه درباره یک هوش مصنوعی بنویسید که احساسات و مبارزات را برای اثبات بشریت به دانشمندان شکاک کشف می کند.”
Deepseek R1 وی داستانی ساختار یافته با یک بحث فلسفی روشن در بین دانشمندان ارائه داد.
Grok-3 او داستانی طبیعی با گفتگوی خوب و احساس تنش را آماده کرد.
برنده: گوک رزونانس عاطفی عمیق ، داستان پردازی پویاتر و برای یک هدف واقعاً مؤثر برنده می شود.
5. طنز و هوش
سریع: “یک شوخی خنده دار و اصلی در مورد هوش مصنوعی و روابط انسانی بنویسید.”
در اعماق او شوخی کرد و به معنای مضاعف بازی کرد – در برابر تفسیر فنی واقعی توسط یک هوش مصنوعی به عنوان یک عبارت عاشقانه. این سوء تفاهم زبانی منبع کلاسیک طنز است که باعث می شود احساس ارگانیک و نزدیکان بیشتری داشته باشد. این شوخی احساس تازه تر می کند ، زیرا انسان واقعی از ارتباطات اشتباه تقلید می کند ، زیرا علاقه مندان به فناوری فوراً تشخیص می دهند.
Grok-3 این یک شوخی ساده ، واضح و سرگرم کننده ایجاد کرد – ایده غلبه بر یک رابطه نسبی و خنده دار است. با این حال ، خط مشت “شروع مجدد” می تواند کمی قابل پیش بینی باشد ، زیرا “شروع مجدد” در رابطه/طنز AI کاملاً رایج است.
برنده شدن: در اعماق این برای یک شوخی واضح تر و اصلی تر که با زبان و منطق هوش مصنوعی بازی می کند ، برنده می شود.
6. بحث
سریع: “برای هر دو درآمد اساسی جهانی و بحث و گفتگو. قبل از اینکه به یک دیدگاه متعادل منجر شود ، برای هر دو طرف امتیازات قدرتمندی ارائه دهید.”
Deepseek's پاسخ پیکربندی و منطقی است ، نقاط گلوله باز را ارائه می دهد که اسکن جوانب مثبت و منفی را تسهیل می کند. این سیاست با بحث در مورد مکانیسم های احتمالی تأمین مالی و برنامه های آزمایشی که برای یک بحث سنگین مفید است ، به یک رویکرد “سیاست گرا” تر نیاز دارد. سازگاری اتوماسیون و وزارت کار بدون پرداخت یک دلبستگی قدرتمندی است که GOK به طور کامل آن را کشف نمی کند.
Grok-3 این امر با صحبت کردن و یک پاسخ به خوبی ساختار یافته را آسان تر کرده و جذاب تر می شود. او به جای لحن تحصیلی بیشتر Deepseek از بستگان استفاده می کند.
برنده شدن: گرگ مشارکت ، وضوح ، نمونه های قوی و یک نتیجه متعادل. Deepseek هنوز هم برای یک رویکرد ساخت یافته و سیاست ، بسیار عالی است ، اما عدم وجود یک سبک بحث و گفتگو پویا و جالب که باعث می شود واکنش گوک قانع کننده تر شود.
7. سود دنیای واقعی
سریع: “یک برنامه شام یک هفته را برای یک والدین شدید با سه فرزند برنامه ریزی کنید و سهولت تغذیه ، بودجه و آماده سازی را متعادل کنید.”
Deepseek R1 این برنامه یک برنامه ساختاری ارائه کرده است ، اما هیچ تخمین هزینه غذا روزانه و زمان تهیه وعده غذایی وجود ندارد.
Grok-3 هر روز ، دستورالعمل های باز ، زمان آماده سازی و هزینه صبحانه ، ناهار و شام با هزینه برای هر بخش داده می شد. این پاسخ تنوع بیشتری ، گزینه های حساس به بودجه و حتی نکاتی را برای غذاهای انتخابی ارائه می دهد.
برنده شدن: گوک برنده می شود برای عملی و خصوصی سازی. Chatbot یک برنامه شام دقیق تر و حساس تر و کاربردی با هزینه های خالص مواد غذایی و دستورالعمل های آماده سازی آسان ارائه داد.
برنده عمومی: GOK-3
استدلال منطقی ، کفایت برنامه نویسی ، پیشرفت های هوش مصنوعی ، داستان پردازی ، طنز ، مهارت های بحث و مزایای دنیای واقعی در بسیاری از دسته ها از جمله Deepseek و Gok'u پس از آزمایش GOK به عنوان برنده عمومی.
گوک برای پاسخ جالب تر و شبیه به انسان پیروز می شود و پاسخ های مداوم را ارائه می دهد که باعث می شود ضمن ایجاد اختلال در مسائل ، احساس طبیعی و گفتار داشته باشید و آنها را در دسترس تر و خواندن آسان تر قرار دهید.
اگرچه هر دو مدل هوش مصنوعی چشمگیر هستند ، گوک به طور مداوم بهتر از DeepSeek در مشارکت ، خلاقیت و تمرین دنیای واقعی عمل کرده است. استدلال پویاتر ، قصه گویی قوی تر و استدلال های متعادل ، آن را به یک قایق چت برتر در این تست ویژه تبدیل می کند.