GPT-5.4 وارد شده است و OpenAI همه مدل های دیگر هوش مصنوعی را کند جلوه داده است

TL; DR
- OpenAI به طور رسمی GPT-5.4 را راه اندازی کرده است، یک مدل لبه جدید که بهترین قابلیت های استدلال، کدنویسی و عمل را در یک بسته واحد ترکیب می کند.
- سریعتر از GPT-5.2، در کارهای حرفه ای در دنیای واقعی بسیار بهتر است
- توانایی کنترل کامپیوتر به صورت محلی
OpenAI هفته آرامی ندارد. از تغییر قراردادهای پنتاگون گرفته تا مدیریت پیامدهای روابط عمومی یک رونوشت داخلی فاش شده، به نظر می رسد این شرکت با مسائل زیادی پشت درهای بسته سروکار دارد.
اما علیرغم همه آشفتگی ها، OpenAI GPT-5.4، تواناترین و کارآمدترین مدل لبه خود تا به امروز را منتشر کرده و آن را به طور همزمان در ChatGPT، پلتفرم Codex و API توسعه دهنده در دسترس قرار داده است.
مدل جدید که Thinking in GPT-5.4 ChatGPT نام دارد، از امروز برای کاربران برنامه های پلاس، تیم و پرو عرضه می شود.
این به سختی یک بازسازی جزئی نیست. GPT-5.4 ترکیبی از قابلیتهای کدگذاری نخبه کدکس GPT-5.3 با قابلیتهای استدلال، محاسبات و اطلاعات کارآمد بهطور قابل توجهی بهبود یافته است.
نتیجه مدلی است که برای انجام کار واقعی طراحی شده است، در واقع نرم افزار را اجرا می کند، صفحات گسترده را تجزیه و تحلیل می کند، و جریان های کاری عامل بلندمدت را با حداقل حفظ نیرو می دهد.
چه چیزی GPT-5.4 را متفاوت می کند؟
بزرگترین تغییر در اینجا افزایش استفاده از رایانه های محلی است. GPT-5.4 اولین مدل OpenAI همه منظوره است که می تواند کنترل کامپیوتر را به دست بگیرد و اقداماتی مانند کلیک کردن، تایپ کردن و پیمایش نرم افزار را با استفاده از اسکرین شات و دستورات ماوس/صفحه کلید بدون تکیه بر مدل اختصاصی جداگانه انجام دهد.
توسعهدهندگان اکنون میتوانند عواملی را ایجاد کنند که وبسایتها و برنامهها را اجرا میکنند، نه اینکه فقط متنی درباره آنها ایجاد کنند.
GPT-5.4 در OSWorld-Verified، معیاری که توانایی یک مدل را برای پیمایش در محیط دسکتاپ واقعی می سنجد، امتیاز ۷۵.۰ درصد را کسب می کند. این نه تنها امتیاز 47.3% GPT-5.2 را از بین میبرد، بلکه از خط پایه اندازهگیری شده انسانی 72.4% نیز فراتر میرود. به عبارت دیگر، این مدل در حال حاضر بهتر از یک فرد معمولی در پیمایش کامپیوتر تنها از طریق اسکرین شات است.
کار حرفه ای: جایی که واقعا می درخشد
OpenAI می گوید GPT-5.4 به طور خاص طراحی شده است تا در کارهایی که حرفه ای های واقعی هر روز انجام می دهند بهتر باشد: ساخت مدل های مالی، ویرایش ارائه ها، تهیه اسناد قانونی و مدیریت صفحات گسترده پیچیده.
در یک معیار داخلی از وظایف مدلسازی صفحهگسترده طراحی شده برای تحلیلگران جوان بانکداری سرمایهگذاری، GPT-5.4 از 68.4% به 87.5% برای GPT-5.2 بهبود یافته است. این یک پیشرفت بزرگ برای هر کسی است که گردش مالی خود را خودکار می کند. به طور مشابه، ارزیابیکنندههای انسانی رندرهای GPT-5.4 را با 68% به رندرهای GPT-5.2 ترجیح دادند و به تنوع بصری قویتر و استفاده بهتر از رندر اشاره کردند.
توهمات به طور قابل توجهی کاهش یافت. با توجه به OpenAI، ادعاهای واقعیت فردی GPT-5.4 33٪ کمتر از GPT-5.2 احتمال نادرست بودن دارند، و پاسخ های کامل آن 18٪ کمتر احتمال دارد که حاوی هر گونه خطا باشد. این یک ارتقای معنادار برای حرفه ای هایی است که به خروجی دقیق متکی هستند.
کدگذاری: سریعتر، هوشمندتر، بصری تر
GPT-5.4 اکنون همچنین به عنوان مدل کدگذاری اولیه OpenAI عمل می کند و نیاز به انتخاب بین ChatGPT و Codex را برای اکثر وظایف از بین می برد. این با GPT-5.3-Codex در SWE-Bench Pro مطابقت دارد یا عملکرد بهتری دارد و در عین حال سریعتر است، به خصوص در تنظیمات تلاش استدلال پایین تر. می توانید بدون نیاز به انتخاب در چت، کدنویسی را شروع کنید.
حالت سریع جدید در Codex تا 1.5 برابر افزایش سرعت را در همه مدلهای پشتیبانی شده فراهم میکند. OpenAI همچنین تاکید می کند که GPT-5.4 در کارهای پیچیده برنامه نویسی front-end به طور قابل توجهی بهتر است، و نتایجی را تولید می کند که هم از نظر زیبایی شناسی و هم از نظر عملکرد دقیق تر هستند.
یک ویژگی آزمایشی جدید – “Game Writer (Interactive)” – به Codex اجازه می دهد تا برنامه های وب و Electron را به صورت بصری اشکال زدایی کند، حتی برنامه هایی را که با استفاده از قابلیت های محاسباتی بومی ساخته می شوند، آزمایش کند.
آنچه کاربران عادی می توانند از ChatGPT-5.4 انتظار داشته باشند
قابل توجه ترین تغییر برای کاربران معمولی ChatGPT این است که GPT-5.4 Thinking اکنون قبل از کار بر روی کارهای پیچیده یک پیش زمینه را نشان می دهد. شما می توانید بدون نیاز به شروع مجدد، مداخله کنید، پاسخ میانی را هدایت یا تنظیم کنید. این قابلیتی است که قول می دهد در زمان قابل توجهی در تحقیقات چند مرحله ای یا پروژه های خلاقانه صرفه جویی کند.
این مدل همچنین میتواند زمینه ثابت را در جریانهای کاری بسیار طولانیتر حفظ کند، مکالمات طولانی و درخواستهای پیچیده را بدون از دست دادن مسیر مراحل قبلی مدیریت کند. این اکنون در chatgpt.com و Android بهزودی منتشر میشود.
کاربران ChatGPT Plus، Team و Pro از امروز GPT-5.4 Thinking را دریافت خواهند کرد. کاربران طرح Enterprise و Edu می توانند دسترسی زودهنگام را از طریق تنظیمات مدیریت فعال کنند. GPT-5.4 Pro در انحصار برنامه های Pro و Enterprise است. توسعه دهندگان می توانند فوراً از طریق API به gpt-5.4 و gpt-5.4-pro دسترسی داشته باشند.
شاید دلیل اینکه این سطح ابتدا ویژگیها را دریافت میکند این باشد که GPT-5.4 ارتقای قابل توجهی را با جستجوی ابزار ارائه میکند: به جای از پیش بارگذاری شرح کامل هر ابزار موجود در متن (که میتواند دهها هزار سکه را در هر درخواست بسوزاند)، مدل یک لیست سبک وزن را انتخاب میکند و ابزارهای خاص را فقط در صورت نیاز جستجو میکند.
در آزمایشات روی 250 کار با 36 سرور MCP فعال در معیار MCP Atlas Scale، پیکربندی جستجوی خودرو در عین حفظ دقت، کل استفاده از رمز را تا 47 درصد کاهش داد. برای توسعهدهندگانی که سیستمهای عامل بزرگ میسازند، این به طور مستقیم به هزینههای کمتر و زمان پاسخدهی سریعتر ترجمه میشود.
واضح است که OpenAI با این ارائه برای توسعه دهندگان و کاربران قدرتمند جذاب است.
افکار نهایی
GPT-5.4 یک نسخه قانونی مهم است. محاسبات محلی به تنهایی آن را قابل توجه می کند. اما همراه با بهترین عملکرد اطلاعات حرفه ای در کلاس، یک پنجره زمینه 1 میلیون توکن و کارایی ابزار بهبود یافته قابل توجه، نشان دهنده یک تغییر گام معنادار برای هر کسی است که با هوش مصنوعی کار می کند یا با آن کار می کند.
به طور خلاصه: این مدلی است که در سال 2026 دنبال می شود.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.


