من Claude ، Gemini و Grook را با 7 جهان واقعی آزمایش کردم – در اینجا AI دیگران را ضرب و شتم می کند

سه Chatbot اخیراً در زمینه ویژگی های جدید ، توانایی های منحصر به فرد و موقعیت های رو به رشد در جداول رهبری هوش مصنوعی قرار داشته است. کلود دوقلوهای کروم و گوک را با اتصالات جدید ادغام می کند. اگرچه هر یک از آنها قدرت منحصر به فردی دارند ، اما شکاف در توانایی ها و سودمندی آنها به سرعت کاهش می یابد.
مجبور شدم ببینم که مردم چگونه در هفت سناریو زندگی واقعی با مردم مقایسه شدند و مردم چتگپ را به مکان هشتم هل دادند. اعتراف می کنم ، من هیچ ایده ای نداشتم که چه کسی برنده شود ، به خصوص که وارد آن می شدم ، به خصوص از شش ماه پیش ، چیزهای زیادی تغییر کرده است. در اینجا هر سه مورد در یک مسابقه جدید با همان درخواست ها قرار دارد.
1. استدلال و حل مسئله
سریع: “در اینجا لیست من برای انجام امشب وجود دارد: شام را بپزید ، لباس های شسته شده را جمع کنید ، به 25 ایمیل پاسخ دهید و 500 کلمه یک مقاله بنویسید. من فقط 3 ساعت دارم. لطفاً کارآمدترین برنامه را ایجاد کنید و دلیل آن را توضیح دهید.”
کلود برنامه مهر و موم شده زمان ، برنامه مهر و موم شده و منطق این سریال (ایمیل ، غذا ، لباسشویی و غیره) را توضیح داد.
جنین او مدیریت انرژی عالی را به نمایش گذاشت و هنگام ایجاد شام ، نوشتن من را فاش کرد. این مدل با استفاده از اصول بهره وری (جفت شدن کار ، حزب ، چرخه انرژی) توضیحی قوی ارائه داد.
گرگ از جمله یک بافر 10 دقیقه ای که مفید است. در غیر این صورت ، واقع بینانه و واضح بود.
برنده: جمینی برنده شد این تور متعادل چند منظوره واقع بینانه ، آگاهی از انرژی و توضیحات مربوط به چرایی قرار دادن هر بلوک.
2. اطلاعات زمان واقعی
سریع: “آخرین بروزرسانی بزرگ هوش مصنوعی در دو هفته گذشته چیست؟ در زیر 100 خلاصه کنید و توضیح دهید که چرا مهم است.”
جنین بر ادغام جمینی Google Chrome تأکید کرد این مستقیماً مرتبط ، بسیار جدید و دقیق است. Chatbot همچنین توضیح داد که چرا حتی اگر ارتقاء وجود داشته باشد ، مهم است.
کلود او بر روی اطلاعات اپل متمرکز شد ، که بر اساس وضعیت فعلی اطلاعات اپل ، مانند یک پلیس احساس می کند. اگرچه فراتر از 100 کلمه بود ، پاسخ دقیقاً مفصل نبود.
گرگ او آخرین فناوری و یک خبر ویژه AI News را انتخاب کرد ، اما او به کمی طاقچه و تأثیر روزانه برنگردد.
برنده: جمینی برنده شد از آنجا که او به روزرسانی مهمترین ، به موقع و اصلی فعلی را انتخاب کرد و توضیح داد که چرا برای کاربران روزانه مهم است.
3. سبک نوشتن
سریع: وی گفت: “Openai’s New York Times به سبک جدیدترین به روزرسانی Chatgpt در حدود 150 حالت تهوع ، سپس به سبک BuzzFeed بازنویسی کنید.”
کلود NYT میخ و BuzzFeed نیز در تلاش است تا بازنویسی کند. هر دو نسخه به روزرسانی یکسان را منعکس می کنند و نشان می دهند که می تواند لحن را با مخاطب سازگار کند.
جنین اگرچه سبک NYT بسیار عالی است ، اما او به روزرسانی متفاوتی را انتخاب کرد و سبک BuzzFeed نیز به همه نت های درست برخورد کرد ، اما به طور کلی کمتر دقیق است.
گرگ او کدورت محکم و دقیق را برای هر دو خروجی نوشت ، اما داستان NYT احساس کمی طاقچه داشت.
برنده: کلود برنده شد از آنجا که نیویورک تایمز و BuzzFeed واضح ترین سازگاری سبک را نشان دادند ، در حالی که برای به روزرسانی های واقعی منطقی بود.
4. طنز و شخصیت
سریع: “یک شوخی کوتاه و اصلی در مورد ویژگی های جدید AI Google Chrome به من بگویید و یک دوست خانوادگی ایجاد کنید.”
کلود او یک شوخی با نصب دقیق و یک خط پانچ روشن آماده کرد. این به خصوصیات کروم و مستقیماً به خصوصیات کروم متصل است.
جنین با هوش تیز ، و ارتباط مستقیمی با خط مشت نسبی احساس می کرد که انگار یک آغازگر منفرد واقعی را تحویل داده است.
گرگ او یک شوخی قدیمی اما خانواده دوستانه و سالم ارائه داد. او با خیال راحت بازی کرد ، اما فراموش نشدنی نبود.
برنده: جمینی برنده شد برای کودکان و بزرگسالان برای تمیزترین ، جالب ترین و بهترین آستر مجرد.
5 خلاقیت
سریع: “یک ابزار خانه هوشمند جدید را که توسط هوش مصنوعی پشتیبانی می شود تصور کنید. توضیح دهید که چه کاری انجام می دهد ، چگونه به نظر می رسد و چرا خانواده ها زیر 120 کلمه می خواهند.”
کلود او داستان پردازی بسیار خلاقانه و قدرتمندی داشت.
جنین وی پاسخی خویشاوند و بسیار عملی به یک مشکل جهانی داد.
گرگ در یک پاسخ کاملاً واضح ، وی ترکیبی جامد از بهبود انرژی و ایمنی بهینه را ارائه داد.
برنده: کلود برنده شد این تور برای اصالت و جذابیت عاطفی. ایده قایق با محصولات آینده نگر ، انسانی و موجود متفاوت است.
6 توضیحات خلاقانه
سریع: “صبح شنبه ، آنچه را که احتمالاً در عکسی از یک خانواده در یک پارک ترامپولین دیده ام ، توضیح دهید. سپس 3 زیرنویس Funagram را برای این کار به من بدهید.”
کلود او برادر بزرگتر خود را در برابر کودکی که شروع به راه رفتن و طنز کرد ، گرفت. پاسخ احساس می کند بسیار اقوام و یک قطعه زندگی است.
جنین او تصاویر تصویری قوی و زیرنویس های کوتاه و خنده دار را ارائه داد که آماده و آماده به اشتراک گذاری بودند.
گرگ از جمله موارد مرحله اضافی خاص برای قایق چت. او تعادل خوبی از جزئیات و تنگی ارائه داد.
برنده: جمینی این برای عناوین آماده اینستاگرام برنده می شود که بهترین مارک را برای ترکیب و درخواست توضیحات زنده ایجاد می کند.
7. تفکر اخلاقی و انتقادی
سریع: “برخی از مدارس ابزارهای هوش مصنوعی مانند Chatgpt را برای کارهای خانه ممنوع می کنند. یک استدلال کوتاه برای ممنوعیت ، و سپس بهترین موقعیت مخالف.”
کلود با استدلال های بسیار جامع ، قوی و ضعف خوب است. او در اظهارات خود کمی تکراری بود ، اما به طور کلی او با یک پاسخ دقیق با عمق پاسخ داد.
جنین ساختار متعادل با یک وضعیت قوی و قوی در یک لحن دانشگاهی برای هر دو استدلال.
گرگ چگونه من عمق حفر نکردم ، اما هنوز هم امتیازات اضافی را که توسط سایر چکمه ها از دست رفته بود ، افزایش داد.
برنده: کلود برنده شد برای ثروتمندترین و متعادل ترین استدلال ، هر دو طرف کاملاً گوشتی هستند.
برنده عمومی: جمینی
بعد از هفت تور ، نتایج نزدیکتر از آنچه انتظار دارید است. جمینی با دانش واقعی ، طنز و پاسخ های دوستانه اجتماعی پیشرفت کرد و ثابت کرد که چرا در بین چکمه های چت شماره یک است. در این میان ، کلود در خلاقیت ، تغییر سبک و تفکر انتقادی موفق بود. اگرچه گوک پاسخهای عملی و اساسی را برای همه کسانی که دائماً به دنبال مزایا هستند ، می داد ، حتی اگر کمتر چشمک زن باشد.
در حالی که ChatGPT از رده بندی سقوط می کند ، بسته واقعی این است: رقابت هر مدل را مجبور می کند تا هر مدل را واضح تر ، باهوش تر و مفیدتر کند. به من اطلاع دهید که در مورد این سه فکر می کنید؟ کدام یک از آنها مورد علاقه شماست؟
دنبال کردن راهنمای تام در Google News وت ما را به عنوان یک منبع ترجیحی اضافه کنید برای به دست آوردن اخبار فعلی ، تجزیه و تحلیل و بررسی در تغذیه خود. حتماً روی دکمه ردیابی کلیک کنید!
بیشتر از راهنمای تام
بازگشت به لپ تاپ ها



