Nano Banana Pro اینجاست – همه ویژگیهای جدید در تولیدکننده تصویر هوش مصنوعی جدید Google

همین چند ماه پیش، گوگل Nano Banana را منتشر کرد، یک تولید کننده تصویر هوش مصنوعی که به دلیل واقع گرایی باورنکردنی اش در فضای مجازی منتشر شد. اکنون گوگل قدم بعدی را برداشته و از راه اندازی Nano Banana Pro خبر داده است.
به عنوان بخشی از راهاندازی Gemini 3، این نسخه جدید از Nano Banana دارای قابلیتهای استدلالی پیشرفته همراه با دانش دنیای واقعی است که آن را قادر میسازد اطلاعات را بهتر تجسم کند.
ارتقاء Nano Banana Pro در یک نگاه
Nano Banana Pro به اپلیکیشن Gemini، جستجوی هوش مصنوعی، NotebookLM و موارد دیگر می آید. در سطح جهانی برای همه کاربران در دسترس خواهد بود (به جز جستجوی هوش مصنوعی در Google، جایی که باید با یک طرح پولی در ایالات متحده باشید). محدودیت ها برای کاربران رایگان اعمال می شود.
Nano Banana Pro شامل:
- توانایی بهتر در کپی کردن متن از تصاویر و بهبود ترجمه زبان
- دقت و درک متنی بهبود یافته با الهام از جستجوی Google
- به Nano Banana تا 14 منبع تصویر بدهید تا الهام بخش ایجاد تصویر شما باشد و توانایی بازآفرینی مطمئن تا پنج نفر در آن تصاویر
- اکنون می توانید هر تصویری را در Gemini آپلود کنید و بپرسید که آیا توسط ابزار هوش مصنوعی گوگل ایجاد شده است یا خیر.
چگونه از Nano Banana Pro استفاده کنیم؟
برای سرویسهای Google که از این فناوری استفاده میکنند، میتوانید از Nano Banana اصلی (که سریعتر است) یا نسخه Pro جدیدتر که آماده انجام کارهای پیچیدهتر است استفاده کنید.
واضح ترین مکان برای استفاده از نسخه جدید Pro، داخل برنامه Gemini است. این در سطح جهانی در دسترس خواهد بود. برای استفاده از این، مدل تفکر را هنگام انتخاب «ایجاد تصویر» انتخاب کنید.
کاربران رایگان تعداد محدودی استفاده خواهند داشت و سپس به نسخه اصلی باز می گردند. کسانی که از هر یک از نسخه های پولی استفاده می کنند سهمیه بالاتری دریافت خواهند کرد.
شما همچنین می توانید از Nano Banana Pro از طریق ارتقاء حالت هوش مصنوعی جدید گوگل استفاده کنید، اما فقط برای کاربران پولی در ایالات متحده.
Nano Banana Pro همچنین تا زمانی که مشترک یکی از برنامههای هوش مصنوعی گوگل باشید، در NotebookLM در سطح جهانی در دسترس خواهد بود.
با Nano Banana Pro چه کاری می توانید انجام دهید؟
شما می توانید از نانو موز مانند هر تصویرساز قبلی استفاده کنید. با این حال، گوگل برخی از پیشرفتهای مهم را که بخشی از این بهروزرسانی هستند، برجسته کرده است.
دقت و زمینه
به عنوان بخشی از پیشرفتها در استدلال، Nano Banana Pro میتواند تصاویر غنی از زمینه مانند نمودارها و اینفوگرافیکها را با متن زیاد ارائه دهد. اینها می توانند بر اساس زمینه ای باشد که ارائه می کنید یا جستجو در اینترنت و حقایق دنیای واقعی.
نانو موز به جستجوی Google متصل می شود و به شما امکان می دهد دستور غذا، گزارش آب و هوای زنده یا امتیاز ورزشی را ضبط کنید و از آنها برای ایجاد تصویر استفاده کنید.
تکثیر متن بهبود یافته است
تولیدکنندگان تصویر هوش مصنوعی برای کپی کردن متن در تصاویر بسیار مشکل داشتند. چه در یک اینفوگرافیک باشد و چه در پسزمینه یک پوستر فیلم تولید شده توسط هوش مصنوعی، اغلب به صورت دستهای از متن پر زرق و برق ظاهر میشود.
اما از آن زمان تغییر کرده است و نانو موز یک قدم فراتر می رود. گوگل ادعا می کند که Gemini 3 در درک عمق و تفاوت های ظریف برتری دارد، که راه های جدیدی را برای متن در تصاویر باز می کند.
این میتواند شامل متن دقیق روی مدلهای سند یا پوستر با فونتها و اندازههای متن مختلف یا حتی بازتولید خطاطی باشد.
به لطف این هوش برتر، Gemini همچنین می تواند متنی را به چندین زبان تولید کند یا متن موجود را در تصاویر ترجمه کند.
کیفیت تصویر بهتر
یکی از بزرگترین وعده های نانو موز، توانایی پردازش چندین تصویر برای نمایش است. به طور دقیق، گوگل ادعا می کند که می توانید از 14 تصویر استفاده کنید و یکپارچگی و شباهت را برای حداکثر 5 نفر حفظ کنید.
این امکان را برای تبدیل طرح ها به محصولات یا تصاویر به ساختارهای سه بعدی فوتورئالیستی با استفاده از انبوهی از زوایا و الگوها باز می کند.
در گذشته، این میتوانست یک مدل هوش مصنوعی را گیج کند و روایتهای رقیب زیادی برای آن ایجاد کند. اگر این امر با موفقیت اجرا شود، می تواند جهشی بزرگ در توانایی نانو موز باشد.
گوگل همچنین اجازه می دهد تا کنترل بیشتری بر روی تنظیمات، از جمله توانایی تغییر هر قسمت از تصویر، تنظیم زاویه دوربین، تغییر فوکوس، و حتی اعمال درجه بندی رنگ، انجام شود.
چگونه تصاویر هوش مصنوعی ایجاد شده توسط Nano Banana Pro را شناسایی کنیم؟
در حال حاضر، گوگل از تکنیکی به نام SynthID برای قرار دادن واترمارک دیجیتال روی هر محتوایی که توسط ابزار گوگل ایجاد می شود، استفاده می کند. SynthID ها توسط سیستم های گوگل قابل شناسایی هستند.
به عنوان بخشی از این به روز رسانی جدید، گوگل این فرآیند را ساده کرده است و به کاربران اجازه می دهد تصویری را در برنامه Gemini آپلود کنند و بپرسند که آیا این تصویر توسط هوش مصنوعی گوگل ایجاد شده است یا خیر. این همچنین می تواند در آینده برای ویدئو و صدا استفاده شود.
با این حال، یک واترمارک قابل مشاهده نیز بر روی تصاویر ایجاد شده توسط گوگل وجود خواهد داشت. این به عنوان یک درخشش کوچک ظاهر می شود (لوگوی Gemini).
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



