chatgpt-5 اکنون می تواند بهتر از گذشته را ببیند و بشنود.

پروین میرمیرانآگوست 8, 2025آخرین به روز رسانی: آگوست 8, 2025

2,692 خواندن این مطلب 3 دقیقه زمان میبرد

chatgpt-5 اکنون می تواند بهتر از گذشته را ببیند و بشنود.

“چند مدلی” چیست؟

(وام تصویر: Shutterstock)

در مورد هوش مصنوعی ، چند حالته فقط توانایی درک و تعامل با ورودی فراتر از متن است. این به معنای ورودی صدا ، فیلم یا فیلم است. یک Chatbot چند حالته می تواند با چندین ورودی و انواع خروجی کار کند.

به روزرسانی این هفته به ChatGPT سرعت و عملکرد چت بابات را در هنگام برنامه نویسی ، ریاضیات و دقت پاسخ افزایش می دهد. با این حال ، مفیدترین پیشرفت در طرح اصلی توسعه هوش مصنوعی ، مهارت های چند مدل خواهد بود.

ChatGPT-5 یک حالت صوتی پیشرفته و توانایی بهتری در پردازش اطلاعات بصری به ارمغان می آورد. سام آلتمن ، به ویژه در پخش زنده پخش زنده این هفته از چند مدلی ، اگرچه او به جزئیات نپرداخت ، بیل گیتس ، دومی در بخشی از پادکست پادکست پادکست “گفتار ، گفتار. تصاویر.

با اجازه پیشرفته حالت صدا GPT-5 ، اکنون با GPT های ویژه کار خواهد کرد و مطابق با دستورالعمل کاربر ، لحن و سبک گفتار را تطبیق می دهد. به عنوان مثال ، اگر فکر می کنید لحن خیلی سخت است ، ممکن است بپرسید که آیا سریع خواهد بود یا اینکه سبک صدا را کمی داغ تر کند. OpenAi همچنین تأیید کرد که حالت قدیمی استاندارد قدیمی در 30 روز آینده به تدریج در همه مدل ها حذف شده است.

البته اکثریت یا بهترین گزینه های تعامل با ChatGPT از طریق متن خواهد بود. با این حال ، از آنجا که هوش مصنوعی به بخش فزاینده ای از زندگی دیجیتالی هر شخص تبدیل می شود ، باید به طور کامل به یک ورودی چند مدل منتقل شود.

ما قبلاً این را دیده ایم. رسانه های اجتماعی وقتی از لپ تاپ ها و دسک تاپ ها و تلفن های هوشمند منتقل می شدند ، واقعاً ادامه یافت.

ناگهان کاربران می توانند عکس بگیرند و آنها را با همان دستگاه نصب کنند. چه تلفن داشته باشید یا نه – یا همانطور که به زاکربرگ اعتقاد دارید – با مجموعه ای از بهترین عینک های هوشمند. موفق ترین هوش مصنوعی کسی خواهد بود که می تواند دنیای اطراف خود را حس کند.

چرا این مهم است؟

نسخه نمایشی مدل صدا

نسخه ی نمایشی از حالت صوتی پیشرفته Openai در طول جریان زنده GPT-5 (وام تصویر: OpenAi)

GPT – 5 ، در یک مدل واحد ، بیش از یک نوع متفاوت از فرآیند داده (و تولید می شود). تکرارهای قبلی از یک رویکرد Add -on -style استفاده کرده بود ، بنابراین دور شدن از آن باید منجر به تعامل بدون مشکل بیشتر شود ، مهم نیست که چه نوع ورودی را انتخاب می کنید.

یک هوش مصنوعی چند حالته قوی تر ، از جمله کاربران دارای اختلال در شنوایی یا بینایی ، سود زیادی برای هوش مصنوعی است. توانایی حساس کردن پاسخ های chatbot به موانع باعث ایجاد شگفتی برای دسترسی به فناوری می شود.

یک هوش مصنوعی چند حالته قوی تر ، از جمله کاربران دارای اختلال در شنوایی یا بینایی ، سود زیادی برای هوش مصنوعی است.

افزایش استفاده از حالت صدا ممکن است چیزی باشد که Chatgpt Plus به تصویب رسیده است ، زیرا لایه حق بیمه دارای پاسخ های نامحدود است ، در حالی که کاربران رایگان هنوز به تعداد مشخصی از ساعتها محدود می شوند.

در این میان ، درک پیشرفته از تصویر به این معنی است که هنگام تجزیه و تحلیل گرافیکی یا تصویری که می دهید ، هوش مصنوعی کمتر در معرض توهم قرار خواهد گرفت. این با ویژگی “منطقه کار بصری” کار می کند ، به این معنی که وسیله نقلیه می تواند با گرافیک و نمودارها در تعامل باشد. در مقابل ، این امر به ChatGPT آموزش می دهد تا در صورت درخواست تصاویر بهتر و دقیق تر تولید شود.

اگر در مورد این موضوع در زمینه یک آموزش فکر کنید ، کمک بزرگی خواهد بود. به طور خاص ، GPT-5 اکنون می تواند اطلاعات را در مناطق بسیار طولانی تر صحبت کند.

اگرچه همه می دانند که تولید تصویر هوش مصنوعی یک طرف تاریک است ، اما شکی نیست که چند مدلی مؤثر آینده مدل های هوش مصنوعی است و جالب خواهد بود که ببینیم پاسخ گوگل جمینی به این به روزرسانی های GPT-5 چیست.

دنبال کردن راهنمای تام در Google News در انتشارات خود برای به دست آوردن اخبار روزانه ما ، چگونه TOS و بررسی ها. حتماً روی دکمه ردیابی کلیک کنید.

بیشتر از راهنمای تام

پروین میرمیرانآگوست 8, 2025آخرین به روز رسانی: آگوست 8, 2025

2,692 خواندن این مطلب 3 دقیقه زمان میبرد

chatgpt-5 اکنون می تواند بهتر از گذشته را ببیند و بشنود.

پروین میرمیران

پخش زنده رایگان اسپانیا و کیپ ورد: نحوه تماشای آنلاین جام جهانی 2026 از هر کجا

شیبا اینو (SHIB) نهنگ ها را سرکوب می کند: 4 میلیارد ورودی در 24 ساعت ثبت شد – U.Today

چرا که Aston Martin Vanquish پس از 25 سال همچنان مهم است، همانطور که توسط طراح آن گفته شده است

فروش نهنگ های بیت کوین با بازگشت قیمت از 65000 دلار – U.Today

Samsung Galaxy S27 Ultra ممکن است باتری بزرگتر و شارژ مغناطیسی داشته باشد، اما ممکن است به قیمت دوربین ها تمام شود.

مهندس سابق ریپل می گوید XRP در میان نوآوری های سولانا جلوتر از زمان خود بود – U.Today

“هیچ کس توپ کریستالی ندارد”: مدیران Lexar برنامه ای برای کاهش وابستگی به رم ما دارند اگر رونق داده های هوش مصنوعی “سالها” طول بکشد.

XRP قوی‌ترین حرکت را از زمان سقوط به زیر 50 EMA ارائه می‌کند – U.Today

فیلیپس یک چراغ سقفی جدید با برچسب قیمت گزاف عرضه کرده است – در اینجا گزینه های ارزان تری وجود دارد که باعث خرابی نمی شود.