GPT-5.4 وارد شده است و OpenAI همه مدل های دیگر هوش مصنوعی را کند جلوه داده است

پروین میرمیرانمارس 5, 2026آخرین به روز رسانی: مارس 5, 2026

2,669 خواندن این مطلب 5 دقیقه زمان میبرد

GPT-5.4 وارد شده است و OpenAI همه مدل های دیگر هوش مصنوعی را کند جلوه داده است

TL; DR

OpenAI به طور رسمی GPT-5.4 را راه اندازی کرده است، یک مدل لبه جدید که بهترین قابلیت های استدلال، کدنویسی و عمل را در یک بسته واحد ترکیب می کند.
سریعتر از GPT-5.2، در کارهای حرفه ای در دنیای واقعی بسیار بهتر است
توانایی کنترل کامپیوتر به صورت محلی

OpenAI هفته آرامی ندارد. از تغییر قراردادهای پنتاگون گرفته تا مدیریت پیامدهای روابط عمومی یک رونوشت داخلی فاش شده، به نظر می رسد این شرکت با مسائل زیادی پشت درهای بسته سروکار دارد.

اما علیرغم همه آشفتگی ها، OpenAI GPT-5.4، تواناترین و کارآمدترین مدل لبه خود تا به امروز را منتشر کرده و آن را به طور همزمان در ChatGPT، پلتفرم Codex و API توسعه دهنده در دسترس قرار داده است.

مدل جدید که Thinking in GPT-5.4 ChatGPT نام دارد، از امروز برای کاربران برنامه های پلاس، تیم و پرو عرضه می شود.

این به سختی یک بازسازی جزئی نیست. GPT-5.4 ترکیبی از قابلیت‌های کدگذاری نخبه کدکس GPT-5.3 با قابلیت‌های استدلال، محاسبات و اطلاعات کارآمد به‌طور قابل توجهی بهبود یافته است.

نتیجه مدلی است که برای انجام کار واقعی طراحی شده است، در واقع نرم افزار را اجرا می کند، صفحات گسترده را تجزیه و تحلیل می کند، و جریان های کاری عامل بلندمدت را با حداقل حفظ نیرو می دهد.

چه چیزی GPT-5.4 را متفاوت می کند؟

(اعتبار تصویر: OpenAI)

بزرگترین تغییر در اینجا افزایش استفاده از رایانه های محلی است. GPT-5.4 اولین مدل OpenAI همه منظوره است که می تواند کنترل کامپیوتر را به دست بگیرد و اقداماتی مانند کلیک کردن، تایپ کردن و پیمایش نرم افزار را با استفاده از اسکرین شات و دستورات ماوس/صفحه کلید بدون تکیه بر مدل اختصاصی جداگانه انجام دهد.

توسعه‌دهندگان اکنون می‌توانند عواملی را ایجاد کنند که وب‌سایت‌ها و برنامه‌ها را اجرا می‌کنند، نه اینکه فقط متنی درباره آنها ایجاد کنند.

GPT-5.4 در OSWorld-Verified، معیاری که توانایی یک مدل را برای پیمایش در محیط دسکتاپ واقعی می سنجد، امتیاز ۷۵.۰ درصد را کسب می کند. این نه تنها امتیاز 47.3% GPT-5.2 را از بین می‌برد، بلکه از خط پایه اندازه‌گیری شده انسانی 72.4% نیز فراتر می‌رود. به عبارت دیگر، این مدل در حال حاضر بهتر از یک فرد معمولی در پیمایش کامپیوتر تنها از طریق اسکرین شات است.

کار حرفه ای: جایی که واقعا می درخشد

نویسنده در حال تایپ روی صفحه کلید

(اعتبار تصویر: Shutterstock)

OpenAI می گوید GPT-5.4 به طور خاص طراحی شده است تا در کارهایی که حرفه ای های واقعی هر روز انجام می دهند بهتر باشد: ساخت مدل های مالی، ویرایش ارائه ها، تهیه اسناد قانونی و مدیریت صفحات گسترده پیچیده.

در یک معیار داخلی از وظایف مدل‌سازی صفحه‌گسترده طراحی شده برای تحلیلگران جوان بانکداری سرمایه‌گذاری، GPT-5.4 از 68.4% به 87.5% برای GPT-5.2 بهبود یافته است. این یک پیشرفت بزرگ برای هر کسی است که گردش مالی خود را خودکار می کند. به طور مشابه، ارزیابی‌کننده‌های انسانی رندرهای GPT-5.4 را با 68% به رندرهای GPT-5.2 ترجیح دادند و به تنوع بصری قوی‌تر و استفاده بهتر از رندر اشاره کردند.

توهمات به طور قابل توجهی کاهش یافت. با توجه به OpenAI، ادعاهای واقعیت فردی GPT-5.4 33٪ کمتر از GPT-5.2 احتمال نادرست بودن دارند، و پاسخ های کامل آن 18٪ کمتر احتمال دارد که حاوی هر گونه خطا باشد. این یک ارتقای معنادار برای حرفه ای هایی است که به خروجی دقیق متکی هستند.

کدگذاری: سریعتر، هوشمندتر، بصری تر

اسکرین شات کد نویسی در ChatGPT

(اعتبار تصویر: OpenAI)

GPT-5.4 اکنون همچنین به عنوان مدل کدگذاری اولیه OpenAI عمل می کند و نیاز به انتخاب بین ChatGPT و Codex را برای اکثر وظایف از بین می برد. این با GPT-5.3-Codex در SWE-Bench Pro مطابقت دارد یا عملکرد بهتری دارد و در عین حال سریعتر است، به خصوص در تنظیمات تلاش استدلال پایین تر. می توانید بدون نیاز به انتخاب در چت، کدنویسی را شروع کنید.

حالت سریع جدید در Codex تا 1.5 برابر افزایش سرعت را در همه مدل‌های پشتیبانی شده فراهم می‌کند. OpenAI همچنین تاکید می کند که GPT-5.4 در کارهای پیچیده برنامه نویسی front-end به طور قابل توجهی بهتر است، و نتایجی را تولید می کند که هم از نظر زیبایی شناسی و هم از نظر عملکرد دقیق تر هستند.

یک ویژگی آزمایشی جدید – “Game Writer (Interactive)” – به Codex اجازه می دهد تا برنامه های وب و Electron را به صورت بصری اشکال زدایی کند، حتی برنامه هایی را که با استفاده از قابلیت های محاسباتی بومی ساخته می شوند، آزمایش کند.

آنچه کاربران عادی می توانند از ChatGPT-5.4 انتظار داشته باشند

شخصی که روی صفحه کلید لپ تاپ تایپ می کند

(اعتبار تصویر: Unsplash)

قابل توجه ترین تغییر برای کاربران معمولی ChatGPT این است که GPT-5.4 Thinking اکنون قبل از کار بر روی کارهای پیچیده یک پیش زمینه را نشان می دهد. شما می توانید بدون نیاز به شروع مجدد، مداخله کنید، پاسخ میانی را هدایت یا تنظیم کنید. این قابلیتی است که قول می دهد در زمان قابل توجهی در تحقیقات چند مرحله ای یا پروژه های خلاقانه صرفه جویی کند.

این مدل همچنین می‌تواند زمینه ثابت را در جریان‌های کاری بسیار طولانی‌تر حفظ کند، مکالمات طولانی و درخواست‌های پیچیده را بدون از دست دادن مسیر مراحل قبلی مدیریت کند. این اکنون در chatgpt.com و Android به‌زودی منتشر می‌شود.

آرم ChatGPT در دست شخص در آیفون

(اعتبار تصویر: گتی ایماژ)

کاربران ChatGPT Plus، Team و Pro از امروز GPT-5.4 Thinking را دریافت خواهند کرد. کاربران طرح Enterprise و Edu می توانند دسترسی زودهنگام را از طریق تنظیمات مدیریت فعال کنند. GPT-5.4 Pro در انحصار برنامه های Pro و Enterprise است. توسعه دهندگان می توانند فوراً از طریق API به gpt-5.4 و gpt-5.4-pro دسترسی داشته باشند.

شاید دلیل اینکه این سطح ابتدا ویژگی‌ها را دریافت می‌کند این باشد که GPT-5.4 ارتقای قابل توجهی را با جستجوی ابزار ارائه می‌کند: به جای از پیش بارگذاری شرح کامل هر ابزار موجود در متن (که می‌تواند ده‌ها هزار سکه را در هر درخواست بسوزاند)، مدل یک لیست سبک وزن را انتخاب می‌کند و ابزارهای خاص را فقط در صورت نیاز جستجو می‌کند.

در آزمایشات روی 250 کار با 36 سرور MCP فعال در معیار MCP Atlas Scale، پیکربندی جستجوی خودرو در عین حفظ دقت، کل استفاده از رمز را تا 47 درصد کاهش داد. برای توسعه‌دهندگانی که سیستم‌های عامل بزرگ می‌سازند، این به طور مستقیم به هزینه‌های کمتر و زمان پاسخ‌دهی سریع‌تر ترجمه می‌شود.

واضح است که OpenAI با این ارائه برای توسعه دهندگان و کاربران قدرتمند جذاب است.

افکار نهایی

GPT-5.4 یک نسخه قانونی مهم است. محاسبات محلی به تنهایی آن را قابل توجه می کند. اما همراه با بهترین عملکرد اطلاعات حرفه ای در کلاس، یک پنجره زمینه 1 میلیون توکن و کارایی ابزار بهبود یافته قابل توجه، نشان دهنده یک تغییر گام معنادار برای هر کسی است که با هوش مصنوعی کار می کند یا با آن کار می کند.

به طور خلاصه: این مدلی است که در سال 2026 دنبال می شود.

اخبار گوگل

دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.

اطلاعات بیشتر از راهنمای تام

پروین میرمیرانمارس 5, 2026آخرین به روز رسانی: مارس 5, 2026

2,669 خواندن این مطلب 5 دقیقه زمان میبرد

GPT-5.4 وارد شده است و OpenAI همه مدل های دیگر هوش مصنوعی را کند جلوه داده است

پروین میرمیران

کد لو رفته iOS 27 به احتمال زیاد اپل ممکن است آیفون‌های اجاره‌شده را به دلیل پرداخت‌های از دست رفته کاملا قفل کند

23 جولای Hyperliquid (HYPE)، Near Protocol (NEAR)، Shiba Inu (SHIB) و Dogecoin (DOGE) تجزیه و تحلیل قیمت: Bulls Take Back the Helm – U.Today

صندوق بازنشستگی 16.3 میلیارد دلاری موقعیت بیت کوین را افزایش می دهد – U.Today

SEC هشدار می دهد که خزانه های کریپتو ممکن است با قوانین اوراق بهادار مواجه شوند – U.Today

ایکس باکس با چهار بازی کلاسیک سازگاری به عقب را برای بازی های قدیمی روی رایانه شخصی آزمایش می کند

گوچا: خودروی اسپرت موتور میانی جدید تویوتا احتمالاً در حال آزمایش در ویدیو ضبط شد

گزارش جدید جزئیات تعمیرات اساسی Mac در MacBooks، iMacs و Mac Studio را نشان می دهد

در اینجا تمام معاملات پیش‌سفارش Galaxy Z Flip 8 وجود دارد که می‌توانید همین الان دریافت کنید: تا 1200 دلار صرفه‌جویی کنید.

یک مرسدس V8 جدید C63 در راه است. در نهایت

چرا تغییر یک کلید ماشین مدرن هزینه زیادی دارد؟