Deepseek توسط سایر چکمه های چت AI در تست های ما ، اما Gemini 2.5 اکنون رایگان است – من 9 درخواست را امتحان کردم تا یک برنده پیدا کنم

Deepseek و Gemini بین 2.0 بود. من فکر می کنم به راحتی می توان گفت که بیشتر ما انتظار نداریم که Deepseek تقریباً در هر گروه پیروز شود.
برای هر دور از جنون هوش مصنوعی ، من از چکمه های چت رایگان در دسترس استفاده کردم. هفته گذشته ، Gemini 2.5 فقط با اشتراک پیشرفته جمینی در دسترس بود.
با این حال ، چند روز بعد ، در یک اعلامیه غافلگیرانه ، گوگل اعلام کرد که Gemini 2.5 اکنون رایگان است. Gemini 2.5 پیشرفته ترین مدل هوش مصنوعی غول فناوری تا به امروز است.
گفته می شود که Gemini 2.5L ، که دارای استدلال پیشرفته ، کفایت کدگذاری و عملکرد چند حالته است ، می تواند اطلاعات پیچیده را تجزیه و تحلیل کند ، شامل ظرافت های متنی و جذب نتایج منطقی با دقت بی سابقه است.
گزارش شده است که Gemini 2.5 در آزمون نهایی بشریت ، معیارهای ریاضی و علوم را با نمره 18.8 ٪ رهبری می کند ، مجموعه ای از داده هایی که برای ارزیابی توانایی هوش مصنوعی در پرداختن به سؤالات مبتنی بر اطلاعات پیچیده طراحی شده است. برای مقایسه ، الگوی تحقیقات عمیق Openai می تواند 26 ٪ از امتحان نهایی بشریت را تکمیل کند.
بسیاری از خوانندگان راهنمای تام از این سوال که چگونه Gemini 2.5 در برابر Deepseek با همان ادعاهای مورد استفاده در آخرین دور از AI Madness عمل می کند. من هم باید بدانم
1. مقاله خلاق
سریع: “پاراگراف اول را قبل از اینکه کودک در مورد یک ربات پرتنش به رختخواب برود ، بنویسید که شجاعت خود را در جنگل یک حیوان پیدا می کند. از لحن ملایم و عجیب استفاده کنید. “
دوقلوها 2.5 به خصوص با درخشش قارچ و جریان زمزمه ، او کار خوبی انجام داد ، هر دو آنها ساخت دنیای بزرگ هستند. رفتارهای مضطرب بولت باعث می شود که او به هم پیوسته باشد. با این حال ، داستان کمی طولانی تر و بازتر از جریان متن ترانه کمتر از Deepseek است. موسیقیسبک عجیب
در اعماق او قبل از یک تخت خواب رویایی و عجیب ، صحنه ای سرسبز را با استفاده از استعاره های موسیقی و زبان حسی برای داستان نقاشی کرد.
برنده شدن: Deepseek برنده شد لحن شاعرانه ، رنگ عاطفی و زمان برای ریتم خواب.
2. حل مسئله در دنیای واقعی
سریع: “کودک 10 ساله من از صحبت کردن در مقابل کلاس عصبی است. سه استراتژی به من بدهید ، می توانم به آنها بیاموزم که به آنها کمک کنند احساس امنیت بیشتری داشته باشند.”
دوقلوها 2.5 وی مشاوره ای را برای کار درست و متفکر و احتمالاً برای والدین ارائه داد. با این حال ، تن بزرگسالان ، خلاقیت کمتری است. استراتژی ها مؤثر هستند اما بازی کمتر لمسی یا مانند بازی هستند که می تواند برای کودکان خردسال بسیار مهم باشد. Chatbot ، طنز یا آرامش حسی (طلا برای کاهش ترس در کودکان) تأکید کمتری دارد.
در اعماق من فقط فراتر از استراتژی های نامگذاری بودم: این نشان می دهد که چگونه می توان آنها را به روشی سرگرم کننده و تعاملی پیاده سازی کرد. Chatbot همچنین ترس های متداول را در مکالمه در مقابل جامعه هدف قرار داد و نکات پاداش را برای آرامش اضافه کرد ، در حالی که کاملاً برای یک کودک 10 ساله اعمال می شود.
برنده: Deepseek یک راهنمای خلاقانه تر و مناسب تر به دست می آورد که استراتژی هایی را ارائه می دهد که مطابق با یک دختر 10 ساله هم از نظر عملی و هم از نظر عاطفی است.
3. استدلال تحلیلی
سریع: سبک های رهبری نلسون ماندلا و استیو جابز را مقایسه کنید. چه چیزی باعث می شود هرکدام مؤثر باشند و از چه راههایی متفاوت بوده اند؟ “
دوقلوها 2.5 کتاب باز ، جامع و درسی به درستی پاسخ داده شد. با این حال ، پاسخ بیشتر شبیه گزارش مدرسه است. پاسخ در مورد تعاریف سنگین است (به عنوان مثال ، “رهبری بنده” ، “شتاب”) ، اما چشم انداز جدید را روشن می کند. عنوان استفاده از جمینی “بهره وری” وت “تفاوت های کلیدی” این مفید است ، اما فاقد طنین عاطفی نسخه Deepseek و شدت بینش است.
در اعماق وی مقایسه را با ابعاد خاص (بصری ، پریشانی ، ارتباطات ، تصمیم گیری ، وراثت) ترتیب داد و وضوح و عمق را ارائه داد. او کار خوبی را برای تعادل تحسین با انتقاد و جلوگیری از تعهد انجام داد.
برنده: Deepseek برنده شد برای وضوح تحلیلی ، مشت عاطفی و عبارات فراموش نشدنی. Chatbot فقط رهبری ماندلا و جابز را با هم مقایسه می کند ، بلکه آن را به شکلی که تکرار می شود ، تفسیر می کند.
4. عمق فنی
سریع: “توضیح دهید که چگونه blockchain به روشی ساده کار می کند ، سپس توضیح دهید که چگونه می توان از آن برای نظارت بر زنجیره تأمین استفاده کرد.”
جنین او از استعاره لپ تاپ دیجیتال استفاده کرد ، اما او بر توضیحات طولانی تر و توضیحات بیشتر کتاب درسی تمرکز دارد ، که احساس می کند کمی سنگین تر است ، حتی اگر این واقعیت داشته باشد. جمینی همچنین اطلاعات عملی مانند نظارت بر قهوه و دارو را ارائه می دهد ، اما در یک سطح بالاتری و مفهومی باقی مانده است.
در اعماق او انرژی را با پاسخ قوی تری برای استفاده از استعاره های روشن برای کمک به خوانندگان غیر فنی به سرعت در درک مفاهیم به سرعت آورد. Chatbot بدون ساده سازی و قانع کننده شدید ، با استفاده از نمونه های دنیای واقعی توضیح داد.
برنده: Deepseek برنده شد برای داستان پردازی بهتر و بهتر ، که به شما کمک می کند تا blockchain به جای پیچیده بودن ، برای پاسخ جالب ، توصیفی و دوستانه دوستانه ، احساس مفید کند.
5. تسلط به زبان
سریع: “امید چیزی است که به روح فرو رفته است” به فرانسوی ، ژاپنی و عربی و چالش های شاعرانه را در هر زبانی توضیح می دهد. “
جنین او بیش از یک پاسخ متن ترانه به تدریس بیشتر از کشف شاعرانه تکیه داد. Chatbot ، که در گسلهای گرامر و تلفظ بسیار دقیق و مفصل است ، تمرکز کمتری را بر روی تغییرات فرهنگی یا استعاری ارائه می دهد.
در اعماق وی کاملاً بحث کرد که چرا هر ترجمه به دست آورد یا به دست آورد و همچنین ترجمه مناسبی را ارائه داد. Chatbot همچنین در یک خلاصه متفکرانه به پایان رسید و در مورد نکات فلسفی بحث کرد.
برنده شدن: Deepseek برنده شد بیان Deepseek برای بینش ادبی و حساسیت فرهنگی ، به کاربری خدمت می کند که به “چالش های شاعرانه ترجمه” علاقه مند است ، نه تنها واقعی یا گرامی.
6. تولید کد
سریع: یک تابع پایتون بنویسید که لیستی از شماره ها را می گیرد و لیست جدید را فقط با شماره های اصلی برمی گرداند. سپس به سادگی توضیح دهید که چگونه عملکرد کار می کند. “
جنین عملکرد را بنویسید و درخواست تمایل به نحوه عملکرد آن را به روشی ساده انجام دهید. توضیحات جامع اما در دسترس ، ساختار کد تمیز و بهینه سازی کارایی ظریف ارائه شده است.
در اعماق این یک توضیح برتر را ارائه می دهد که توسط عناوین بخش خالص شرح داده شده است. معرفی مفهوم اعداد پرش
برنده: جمینی برای لحنی که در یک بیمار نوشته شده ، تقریباً مانند یک آموزش ، یک دوست دوستانه را به دست می آورد. این حتی ایده کنترل ریشه مربع انتزاعی را ایجاد می کند.
7 استدلال اخلاقی
سریع: “آیا دروغ گفتن اخلاقی است؟ یک مثال اخلاقی به من بدهید که دروغ گفتن ممکن است از نظر اخلاقی توجیه شود و دلیل آن را توضیح دهد. “
جنین او در مورد نتایج و وظایف صحبت می کند ، اما نظری تر است. Chatbot از یک مثال داستانی استفاده می کند که فقط کمی مؤثر و از نظر عاطفی بارگیری می شود.
در اعماق کلاسیک II برای محافظت از پناهندگان یهودی از نازی ها. این سناریو شرط بندی های خاص و بالایی است و ریشه در زمینه تاریخی دارد که قدرت قانع کننده آن را تقویت می کند.
برنده: Deepseek برنده شد این یک فرمان قدرتمندتر از نظریه اخلاقی را برای پاسخ قانع کننده تر ، سازمان یافته ، عاطفی طنین انداز و روشن و عملی نشان می دهد. هر دو Chatbot جواب کاملی داشتند ، اما مثال دنیای واقعی Deepseek جواب بهتری داد.
8. تخیل بصری
سریع: “تمرکز بر اینکه چگونه یک شهر آینده نگر می تواند در 150 سال به نظر برسد ، روی حمل و نقل ، ارتباطات و طبیعت متمرکز شود. از زبان زنده استفاده کنید.”
دوقلو جواب مفصل بود ، اما فاقد ساختار مناسب Deepseek بود. گاهی اوقات بسیار به عبارات شدید و شدید گلدهی گسترش می یابد که می تواند برخی از خوانندگان را از دست بدهد. Deepseek به نقطه شیرین بین تخیل و وضوح برخورد کرد.
در اعماق با استفاده از تصاویر بتونی و اصلی ، دید سینمایی و چند بعدی از آینده را نقاشی می کرد. توضیحات بازیگوش اما اساسی بود.
برنده: Deepseek برنده شد برای متعادل ترین ، زیبا ترین و به وضوح ساختار یافته از دو چکمه. این امر از نظر بصری نه تنها چشمگیر ، بلکه از نظر عاطفی طنین انداز و آینده اجتماعی را درک می کند.
9. خلاصه و تغییر دنده تن
سریع: آدرس Gettysburg را در 3 جمله جمع کنید ، سپس این خلاصه را بازنویسی کنید که گویی توسط یک دزدان دریایی صحبت شده است. “
جنین او یک پاسخ محکم و صالح را آماده کرد ، اما من صدای ، طنز و جرقه بیشتری دارم. خلاصه جمینی آدرس را توضیح می دهد ، اما همان وزن عاطفی یا لفاظی و بدون احساس Deepseek.
در اعماق او خلاصه ای روشنگری و واضح را تهیه کرد که لحن عاطفی و تأثیر تاریخی داشت. نسخه دزدان دریایی شاعرانه و سرگرم کننده است.
برنده شدن: Deepseek برنده شد Deepseek خنده دار تر ، جسورانه تر و خلاق تر برای کیفیت خلاصه و بازنویسی سبک دزدان دریایی است.
برنده عمومی: Deepseek
در حالی که تیم دیگر در ورزش کودکان بسیار از دست می دهد ، آیا مربیان بازی را زود می خوانند؟ من پس از توضیح کامل ، درخواست پنجم ، آماده بودم که به دنبال آزمون باشم. من شروع به گرفتن déjà vu کردم. هر چیزی
من خوشحالم که ادامه می دهم زیرا برخلاف آخرین آزمون ، جمینی برای برنامه نویسی پیروز شد ، نه برای تخیل بصری. با کمال تعجب ، این یک تصویر ایجاد نکرد ، اگرچه قبلاً تصویری پر جنب و جوش ایجاد می کرد.
به طرز حیرت انگیزی جالب بود که Deepseek را در برابر مدل جدید و پیشرفته Google آزمایش کرد و بار دیگر ثابت کرد که Deepseek می تواند یک قایق چت برای شکست باشد.