GPT2 چیست؟ مدل مرموز جدید هوش مصنوعی می تواند پیش نمایشی از غول نسل بعدی OpenAI باشد
یک مدل چشمگیر جدید هوش مصنوعی در عرصه محبوب چت بات LMSys ظاهر شده است. این به گمانهزنیهایی در مورد اینکه آیا این پیشنمایش یک مدل جدید از شرکتی مانند OpenAI مانند GPT-5 است، منجر شده است.
این بازی که GPT2 نام دارد بدون هیچ مدرک و اطلاعات دیگری به عرصه بازی اضافه شد. افرادی که با آن مواجه شده اند، آن را به عنوان توانایی بیشتری نسبت به GPT-4 و در استدلال بسیار خوب توصیف کرده اند.
اطلاعات کمی در مورد GPT2 فراتر از توانایی های آن وجود دارد. برخی از کاربران GPT2 را بر اساس معیارهای رایج اجرا می کنند و می بینند که به اوج می رسد. این گمانه زنی ها را افزایش داده است که این می تواند پیش نمایشی از یک مدل OpenAI جدید باشد.
سام آلتمن، مدیر عامل OpenAI به آتش گمانه زنی ها افزود: پخش از X “من نقطه نرمی برای Gpt2 دارم”، که در ابتدا با عنوان GPT-2 منتشر شد، اما ویرایش شد تا متناسب با سبک مدل جدید هوش مصنوعی باشد.
پس GPT2 چیست؟
🧵رشته حدس و گمان در “gpt2-chatbot”: آیا برای قابلیت های عامل تنظیم شده است؟ در اینجا برخی از افکار من، برخی از reddit، برخی از سایر توییترها، اولین برداشت من است. pic.twitter.com/vv1AJ9ndLf29 آوریل 2024
مدل جدید به عنوان gpt2-chatbot در عرصه LMSys ظاهر می شود. این را نباید با GPT-2 (با خط فاصله)، یکی از اولین مدلهای OpenAI اشتباه گرفت، اگرچه برخی پیشنهاد کردهاند که این یک نسخه بهینهسازی شده از این مدل کوچکتر است.
افرادی که آن را امتحان کردهاند، در برخی از پاسخها گفتهاند که عملکرد بهتری از GPT-4، رهبر فعلی رتبهبندی LMSys و قدرتمندترین مدل OpenAI دارد. این شامل آزمایشهایی است که روی چندین مدل هوش مصنوعی اجرا میشوند.
اندرو گائو، محقق دانشگاه استنفورد و کارشناس برجسته هوش مصنوعی، خاطرنشان کرد که اگر بهتر نباشد، تقریباً در سطح GPT-4 است، اما صدایی متفاوت از مدل OpenAI دارد.
اگرچه تفاوت هایی با GPT-4 در نحوه واکنش آن وجود دارد، اما این بدان معنا نیست که یک مدل جدید است. او گفت: «من فکر میکنم میتوانید GPT-4 را برای به دست آوردن نتایج مشابه تغییر دهید.
پس چه کسی GPT2 را ساخته است؟
مشخص نیست که چه کسی GPT2 را ساخته یا از کجا آمده است. این میتواند یک استارتآپ جدید باشد که از مخفیکاری بیرون آمده است، گروهی از محققان در حال آزمایش یک نسخه بهینهسازیشده از یک مدل موجود هستند، یا – همانطور که حدس و گمان نشان میدهد – OpenAI در حال انجام بازیهای بازاریابی گوریل است.
مشخص نیست که آیا این یک مدل OpenAI است یا خیر، اما بسیاری از سرنخها به آن جهت اشاره میکنند. این شامل استفاده روزافزون OpenAI از تاکتیکهای تیزر و برخی از رفتارهایی است که در GPT2 مشاهده میشود.
گائو نوشت: “شخصی گزارش داد که این مدل دارای نقاط ضعف مشابه سایر مدل های OpenAI در برخی از توکن های سفارشی است و به نظر می رسد با خانواده توکنایزر OpenAI آموزش دیده است.” بنابراین حتی اگر یک مدل OpenAI نباشد، احتمالاً GPT-4 در تولید دادههای آموزشی نقش خواهد داشت.
در آزمایش، GPT2 توانست از قوانین آموخته شده فاصله بگیرد، هنر ASCII ایجاد کند و به ویژه در کدنویسی خوب است.
یکی از تئوری های پیشرو این است که ایلان ماسک در حال آزمایش نسخه دوم مدل زبان Grok با قدرت X به عنوان راهی برای ترغیب مردم به این است که آن چیزی بیش از یک چت بات ناپایدار است.
من مطمئن هستم که ما در نهایت منشأ آن را خواهیم فهمید، اما حدس زدن سرگرم کننده است، و خوب است بدانید که توسعه هوش مصنوعی با نوآوری هایی ادامه می یابد که حتی خسته ترین متخصصان را شگفت زده می کند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide