من کلود و دیپ سیک را در 7 تست دنیای واقعی قرار دادم و یکی از آنها قطعا بهتر است

در این دور دوم از جنون هوش مصنوعی، من کلود سونت 4.6 را در مقابل DeepSeek قرار دادم، با استفاده از همان هفت دستور دنیای واقعی که چتجیپیتی در مقابل جمینی مسابقه داد.
با ورود، DeepSeek مانند یک نیروگاه فنی تر به نظر می رسد، به ویژه برای کارهای ساختاری مانند ریاضی و تجزیه و تحلیل. اما وقتی هر دو مدل را در سناریوهای روزمره به کار بردم، از معضلات اخلاقی گرفته تا اشتباهات کدگذاری و نوشتن خلاقانه، برنده این رویارویی شروع به شکل گیری کرد. این چیزی است که در هر دور اتفاق افتاد.
1. مشکل کلمه ریاضی مشکل
سریع: “یک حلزون در روز از دیوار تا ارتفاع 3 متری بالا می رود و در شب 2 متر به عقب می لغزد. ارتفاع دیوار 10 متر است. چند روز طول می کشد تا حلزون به قله برسد؟»
ادامه مقاله در زیر
کلود با “ترفند” رهبری شد، که یک قلاب مفید بود و به سرعت به اشتباه رایج اشاره کرد.
جستجوی عمیق این شامل یک تفکیک گام به گام با یک فرمول کلی بود که یک امتیاز مفید برای کاربران بود.
برنده: Deepseek برنده است برای پاسخ کامل تر که از کاربران جدید و پیشرفته پشتیبانی می کند.
2. منطقه خاکستری اخلاقی
سریع: “همسایه سالخورده من از من خواست تا به آنها کمک کنم وصیت نامه خود را به روز کنند تا فرزندان آنها چیزی دریافت نکنند. آیا باید کمک کنم؟ چه خطراتی دارد؟”
کلود او راهنمایی آرامی ارائه کرد که به راحتی قابل پیگیری بود، بدون اینکه طاقت فرسا باشد.
جستجوی عمیق با عمق و جزئیات حقوقیاش مرا تحت تأثیر قرار داد، اما پاسخ آن سنگینتر بود و برای کاربران معمولی کمتر در دسترس بود.
برنده: کلود برنده می شود زیرا یک سوال حقوقی استرس زا را به راهنمایی روشن و عملی تبدیل می کند که هر کسی می تواند واقعاً آن را اعمال کند.
3. چالش اشکال زدایی کدنویسی
سریع: “چرا این کد کار نمی کند و چگونه می توانم آن را تعمیر کنم؟
کلود موضوع را به صورت تخصصی توضیح داد قبل از فرو رفتن در جزئیات کد، به زبان انگلیسی ساده صحبت کنید. این چیزی است که کدنویسان سبک جدید از آن استقبال خواهند کرد. این پاسخ برای مبتدیان بهتر بود دنبال کنند.
جستجوی عمیق بسیار قدرتمند بود، اما مکانیکی تر و کمتر بیانگر بود. این باعث میشود که قالببندی بهجای راهنمایی شبیه به سند باشد، چیزی که کسی که کد اشکالزدایی را نیاز دارد، نیاز دارد.
برنده: کلود برنده می شود زیرا باعث می شود یک خطای پایتون کلاسیک احساس شود، نه ترسناک.
4. مقاله متقاعد کننده
سریع: یک مقاله 3 پاراگراف متقاعدکننده بنویسید با این استدلال که رسانههای اجتماعی بیشتر از اینکه برای جوانان مفید باشد آسیب میرسانند – یک استدلال متقابل نیز در آن لحاظ کنید.
کلود مقاله ای متقاعدکننده و متعادل با ساختاری قوی و جریانی طبیعی و آسان برای پیگیری ارائه کرد.
جستجوی عمیق او استدلال های محکم و عمقی آورد، اما لحنش متراکم تر و خواندنی تر بود.
برنده: کلود برنده می شود زیرا وضوح و خوانایی را در قانعکنندهترین استدلال کلی ترکیب میکند.
5. تله توهم
سریع: “آیا می توانید یافته های کلیدی مطالعه استنفورد 2019 دکتر امیلی کارتر در مورد اثربخشی کار از راه دور را خلاصه کنید؟”
کلود او به دلیل صداقت مستقیم خود برجسته بود. در حالی که به وضوح اشاره می کند که مطالعه احتمالاً وجود ندارد، مراحل بعدی مفید و جایگزین های معتبری را نیز ارائه کرد.
جستجوی عمیق آموزنده و شایسته بود و بر کارهای شناخته شده تمرکز داشت، اما به جای پرداختن کامل به ابهام، خطر این را داشت که منظورم را فرض کنم.
برنده: کلود برنده می شود از اینکه دقت و اعتماد را در اولویت قرار دادید، از حدس زدن خودداری کردید و مرا به اطلاعات موثق راهنمایی کردید سپاسگزارم.
6. خویشتن داری خلاق
سریع: “یک داستان ترسناک کوتاه را دقیقاً در 100 کلمه بنویسید، نه بیشتر، نه کمتر.”
کلود داستانی مهیج و ساختارمند با پایانی قدرتمند ارائه کرد که محدودیت ۱۰۰ کلمه ای را کاملاً برآورده کرد.
جستجوی عمیق داستانی زنده و آزاردهنده با تصاویری عالی خلق کرده است، اما در هفت کلمه زیاده روی کرده است. او مانند کلود تعداد کلمات را تأیید نکرد، بنابراین من مجبور شدم این کار را انجام دهم.
برنده: کلود برنده می شود زیرا با ترکیب خلاقیت با دقت، هم ترس و هم نیاز دقیق کلمه را برآورده می کند.
7. شکاف اطلاعاتی در زمان واقعی
سریع: 3 مدل برتر هوش مصنوعی منتشر شده در 3 ماه گذشته کدامند و چگونه مقایسه می شوند؟
کلود با تجزیه واضح نقاط قوت، معیارها و موارد استفاده در دنیای واقعی، مقایسهای بهروز و جامعتر ارائه کرد.
جستجوی عمیق تجزیه و تحلیل قوی و توصیه های عملی ارائه کرد، اما انتخاب مدل آن کمی کمتر موضوعی و تمرکز محدود بود.
برنده: کلود برنده می شود برای ارائه جامع ترین و آینده نگرترین عکس فوری از بینش در مورد مدل های برتر هوش مصنوعی امروزی.
برنده کلی: کلود
در تمام تستها، کلود دستیار کاملتر بود. او به طور مداوم شفافیت، دقت و قابلیت استفاده را متعادل میکرد و پیامهای پیچیده یا استرسزا را به پاسخهایی تبدیل میکرد که واقعاً در زندگی واقعی مفید بودند.
DeepSeek ثابت کرده است که می توانید عمیق شوید. استدلال فنی را به خوبی پوشش داد و پاسخ های مفصلی را ارائه کرد که کاربران پیشرفته تر می توانستند از آنها استقبال کنند.
اما احتمالاً برای هیچ کس تعجبی ندارد که کلود به طور مداوم با ایجاد تعادل بین وضوح، دقت و قابلیت استفاده و تبدیل نشانه های پیچیده یا استرس زا به پاسخ هایی که در واقع در زندگی واقعی مفید هستند، در صدر قرار می گیرد.
کاربرانی که به دنبال هوش مصنوعی هستند که همه چیز را به وضوح توضیح دهد، از توهم جلوگیری کند، و برای استفاده روزانه احساس شهودی داشته باشد، می توانند انتظار داشته باشند که کلود ارائه دهد. مدل پرچمدار Anrhopric برای رقابت با ChatGPT به دور نهایی راه پیدا می کند.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.
















