من Grok-2 را روی X امتحان کردم و یک رقیب واقعی برای ChatGPT و Gemini است
Grok-2، ربات چت هوش مصنوعی ساخته شده و بر اساس محتوا از
مدت کوتاهی پس از راه اندازی، Grok-2 به پنج رتبه برتر جدول امتیازات عرصه چت بات LMSys راه یافت. اینها ارزیابیهای انسانی از LLMهای پیشرو هستند و عموماً تحت سلطه Google، OpenAI و Anthropic هستند، بنابراین این یک پیروزی بزرگ برای سازنده Grok xAI بود.
با نسخه جدید، Grok-2 نگاهی نزدیکتر به سایر رابطهای چت بات دارد و همچنین توانایی ایجاد تصاویر با استفاده از مدل رندر هوش مصنوعی آزمایشگاههای جنگل سیاه، Flux را به دست آورده است که به کیفیت پیشرو صنعت Midjourney نزدیک است.
من چند روز گذشته با Grok-2 بازی می کردم و متوجه شدم که به همان اندازه ChatGPT پاسخگو است، اما با حس شوخ طبعی بهتر و توانایی پاسخگویی به رویدادهای بلادرنگ به لطف X.
ما Grok-2 را مورد آزمایش قرار دادیم
وای، یک بهروزرسانی هیجانانگیز دیگر از Chatbot Arena❤️🔥نتایج sus-column-r @xAI (نسخه اولیه Grok 2) اکنون برای عموم در دسترس است**! با بیش از 12000 رأی جامعه، sus-column-r در رتبه سوم جدول امتیازات کلی قرار گرفت و حتی با GPT-4o مطابقت داشت! در کدنویسی عالی (#2)،… https://t.co/gqSWSwYN0z pic.twitter.com/j9UYDBYNt414 آگوست 2024
Grok-2-mini برای هر کسی که اشتراک Premium X را دارد در دسترس است. وقتی برای اولین بار Grok را باز می کنید، کادر معمولی “پرسش”، یک ردیف از ایده های پیشنهادی، و سپس موضوعات پرطرفدار از X را می بینید که Grok می تواند توضیح دهد یا حتی به سوالات پاسخ دهد.
1. کنترل نفس
اولین درخواست من این بود که “رایان موریسون کیست” و هیچ چیز تواضعکنندهتر از جستجوی نام خود وقتی وجود دارد که فردی مهم آن نام مستعار را به اشتراک بگذارد (در مورد من، وکیل بازیهای ویدئویی، رایان موریسون). اما با افزودن “ژورنالیست هوش مصنوعی” به نتیجه محکمی رسیدم.
او تکههایی از بیوگرافی من در X، بیوگرافی من در تامز گاید، و سایر اطلاعاتی که من به اشتراک گذاشتهام یا دیگران درباره من در پلتفرم X به اشتراک گذاشتهاند، برداشت. تقریباً همه آنها مربوط به هوش مصنوعی بودند.
گروک هم پست گذاشت
تصمیم گرفتم مسابقه “چه کسی کیست” را با رئیس بسیار شناخته شده خود، مارک اسپوناور، سردبیر جهانی تامز گاید، امتحان کنم. او خلاصهای از حرفهاش، فلسفه سرمقالهاش و پست X را به من ارائه داد. Grok همچنین X پست کاملا تصادفی و نامرتبط را پیشنهاد کرد.
2. آزمون کدنویسی
من از کلود خواستم تا با استفاده از پایتون یک بازی ماجراجویی متنی ساده به نام جنگل طلسم شده بسازد. من برخی جزئیات را در اعلان ارائه کردم، مانند یک پازل برای حل، کلاس بازیکن، و دستورات حرکت و برداشت آیتم.
درخواست: “یک بازی ماجراجویی متنی پایتون به نام “جنگل افسونشده” با حداقل 3 مکان به هم پیوسته، 2 آیتم برای جمعآوری و یک معمای ساده برای حل ایجاد کنید. یک موجودی، یک کلاس اتاق، و دستورات حرکت، گرفتن آیتمها، بررسی موجودی و در حال خروج.» بازی باید یک شرط برد واضح داشته باشد. کد پایتون کامل و قابل اجرا را ارائه دهید.
کد به خوبی کار می کرد و یک بازی ماجراجویی متنی ساده ایجاد کرد که می توانستم در ترمینال در مک بوک خود بازی کنم.
وقتی از Grok-2 خواستم به جای اجرای آن در ترمینال، نسخه ای با رابط کاربری تولید کند، یک سری خطا در کد ثابت برگرداند. او همچنین نتوانست اشتباهات خود را اصلاح کند. رمزگذاری آن تقریباً برابر با GPT-3.5 است.
3. موضوعات پرطرفدار
یکی از قدرتمندترین ویژگی های Grok، از جمله نسخه جدید آن، توانایی آن در تجزیه و تحلیل موضوعات پرطرفدار و کشیدن محتوا از سراسر پلتفرم X است.
این امر آن را به ویژه در مورد داستان های خبری قدرتمند می کند. شما می توانید در مورد هر داستان فعلی بپرسید و می تواند اطلاعاتی را از پست X استخراج کند و با استفاده از داده های آموزشی خودش، از جمله محتوای X را در متن قرار دهد.
من اطلاعاتی در مورد انتشار Luma Labs Dream Machine 1.5 خواستم و او توانست خلاصه پاراگراف و پست X را که چند نمونه را نشان می دهد به من بدهد. من این موضوع را با درخواست نمونه ها و جزئیات بیشتر از مدل جدید پیگیری کردم.
این نه تنها یک تفکیک گلوله ای از ویژگی های جدید، بلکه چندین پست از کاربر X را به من ارائه داد که محتوای ایجاد شده با استفاده از نسخه 1.5 را نشان می دهد.
افکار نهایی
قبلاً گفتهام که Grok یک ابزار جستجوی هوش مصنوعی فوقالعاده قدرتمند به دلیل ادغام آن در X است. این بیشتر در مورد ادغام X بود تا خود مدل، اما با Grok 2 این تغییر می کند. مدل جدید از نظر پاسخگویی با ChatGPT یا Claude برابری می کند و بسیار بازتر است و احتمال رد درخواست کمتر است.
با اضافه شدن Flux، Grok-2 همچنین توانایی تولید تصاویر را برای اولین بار به دست می آورد و حتی می تواند این کار را در ارتباط با یک خبر انجام دهد. این یک بعد جذاب به بررسی آنچه در جهان اتفاق می افتد می افزاید.
با انتشار دوم خود، Grok اکنون نه تنها یک رقیب واقعی برای پلتفرم های بزرگتر چت ربات هوش مصنوعی است، بلکه برای اینکه یک برنامه یک “برنامه همه چیز” واقعی باشد، باید یکپارچه سازی هوش مصنوعی قابل اجرا، از جمله دسترسی به داده های زنده، که همه چیز را با هم جمع می کند، داشته باشد. این استدلال را تقویت می کند که لازم است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide