OpenAI قصد دارد در سال آینده “عامل” را راه اندازی کند. اینها مدلهای هوش مصنوعی مستقلی هستند که میتوانند طیف وسیعی از وظایف را بدون دخالت انسان انجام دهند و ممکن است به زودی در ChatGPT در دسترس باشند.
سام آلتمن، مدیر عامل شرکت در اولین رویداد روز توسعه در سانفرانسیسکو گفت: “2025 زمانی است که نمایندگان کار خواهند کرد.” . .
این شرکت میگوید پنج مرحله هوش عمومی مصنوعی (AGI) وجود دارد و ما در حال حاضر در مرحله دوم هستیم، جایی که هوش مصنوعی میتواند قبل از پاسخگویی از طریق یک ایده استدلال کند. عامل ها مرحله سوم هستند و به این معنی است که هوش مصنوعی به اندازه کافی هوشمند است که بتواند در مورد یک ایده استدلال کند و می تواند به عنوان بخشی از برنامه ریزی پاسخ خود به طور مستقل اقدام کند و اقداماتی را انجام دهد.
آلتمن قبلاً توضیح داده بود که قدرت مدلهای خانواده o1 به این معنی است که آنها میتوانند به ساخت مدلهای سطح عامل کمک کنند، و ما به زودی شاهد ظهور اولین مدلها خواهیم بود. چالش و پتانسیل بزرگتر برای تأخیر این است که اطمینان حاصل شود که آنها با ارزشهای انسانی مطابقت دارند و با انجام اقداماتی که به نفع بشریت نیست «سرکش» نشوند.
هدف عوامل هوش مصنوعی چیست؟
OpenAI Realtime API برای سفارش توت فرنگی در Dev Day تماس می گیرد، که عالی است… اما تأخیر پاسخ ~ 2 ثانیه است (وضعیت هنری <400 میلی ثانیه) و صدا به خوبی صدای "صدای پیشرفته" احساس نمی شود. حالت»، هنوز فاقد احساسات است. (از @swyx) pic.twitter.com/4S3MOMiMZ61 اکتبر 2024
ساخت عوامل مفید و کاربردی چیزی است که هر آزمایشگاه هوش مصنوعی روی آن کار می کند. به عنوان مثال، این به هوش مصنوعی اجازه میدهد نه تنها کتاب بنویسد، بلکه راههایی برای انتشار کتابها از جمله ثبت نام برای یک حساب کاربری در آمازون برای اشتراکگذاری در Kindle Direct پیدا کند.
نمایندگان یک گام ضروری در مسیر AGI هستند زیرا آنها باید بتوانند وظایفی را که AGI برای رسیدن به هدف خود ضروری میداند، انجام دهند. آلتمن در طول روز توسعه گفت: «اگر ما بتوانیم یک سیستم هوش مصنوعی بسازیم که در تحقیقات هوش مصنوعی بهتر از OpenAI باشد، به نظر می رسد یک پیشرفت واقعی است.
رسیدن به این مرحله مستلزم بهبود مستمر نسل های قبلی هوش مصنوعی است. آلتمن گفت که مدلهای o1 همان چیزی است که آژانسها را عملی میکند، و زمانی که مردم شروع به استفاده از آژانسها کنند، «این کار بزرگی خواهد بود» و افزود: «مردم از آژانس میخواهند کاری برایشان انجام دهد که یک ماه طول بکشد. یک ساعت طول می کشد.»
او پیشبینی میکند که افراد ممکن است یک عامل داشته باشند که وظایف خاصی را انجام میدهد و یک عامل دیگر وظایف متفاوتی را انجام میدهد تا زمانی که به ۱۰ یا ۱۰۰ نماینده برسد که بتواند جنبههای مختلف وظایف روزانه را انجام دهد. ما قبلاً برخی از عناصر را دیدهایم که نشان میدهد چگونه میتوان این کار را در پیروی از منطق o1 از طریق ایدهها و پیشنهادات انجام داد.
انطباق بزرگترین مانع برای تکرار است
امروز در DevDay SF تعدادی ویژگی جدید را برای پلتفرم OpenAI راه اندازی می کنیم: pic.twitter.com/y4cqDGugju1 اکتبر 2024
هر مدل جدیدی که توسط OpenAI منتشر میشود، آن را در یک فرآیند تست امنیتی دقیق قرار میدهد و بر اساس مجموعهای از معیارها رتبهبندی میشود که تعیین میکنند آیا انتشار آن ایمن است یا خیر. این امر در گذشته باعث تاخیرهایی شده و نیاز به نصب نرده های محافظ بر روی مدل ها برای جلوگیری از اعمال خاصی داشته است.
نمونه بارز آن مدل GPT-4o است که به صورت بومی قادر به رندر کردن تصاویر، تولید موسیقی و حتی شبیه سازی صداها است، اما تمامی این ویژگی ها توسط نرده های محافظ مسدود شده است. می دانید که می توانید این کار را انجام دهید زیرا گاهی اوقات نرده های محافظ می شکند.
شکستن نردهها مشکل بزرگتری در مورد آژانسها خواهد بود، زیرا ممکن است نمایندگان به حساب بانکی شما دسترسی داشته باشند، توانایی آنلاین شدن و انجام وظایف، یا حتی استخدام شخصی در Fiver برای انجام آن کار برای آنها، با استفاده از حالت صوتی دستورالعمل بدهد .
در مثال روز توسعه، دیدیم که یک ربات صوتی با یک فروشنده تماس می گیرد (با بازی محقق)، 400 توت فرنگی با روکش شکلاتی سفارش می دهد، آدرس خاصی را می دهد و می گوید که به صورت نقدی پرداخت خواهد کرد. او وضعیت خود را به عنوان دستیار هوش مصنوعی توضیح داد، اما گاهی اوقات برای گفتن اینکه او یک هوش مصنوعی است مشکل داشتید.
کوین ویل، مدیر ارشد تولید OpenAI در صحبت با FT گفت: “ما می خواهیم تعامل با هوش مصنوعی را به هر طریقی که شما با انسان دیگری در ارتباط هستید، ممکن کنیم” و سیستم های آژانس در سال آینده به جریان اصلی تبدیل می شوند و این هدف را ممکن می سازند. .
ویل میگوید که یک نرده محافظ در سیستمهای عامل میتواند این باشد که باید همیشه خود را به عنوان هوش مصنوعی اعلام کند. اما اگر تا به حال نام Advanced Audio beatboxing را شنیده اید یا شاهد ارائه گرافیک برداری عالی GPT-4o بوده اید، می دانید که این محدودیت ها همیشه وجود ندارند. عالی
من شخصا نمی توانم منتظر باشم تا آژانس ها بیایند. من عاشق کدنویسی هستم و تکرارها به من اجازه می دهند با انجام برخی از مراحل تست خسته کننده، آن را سریعتر پیاده سازی کنم. این همچنین به من اجازه می دهد تا از طریق برخی از یک چهارم میلیون ایمیل خوانده نشده کار کنم. اگر Skynet بهایی است که برای رسیدن به صندوق ورودی صفر باید بپردازم، ترمیناتورها را بیاورید.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران