Google Gemini در حال به دست آوردن تعدادی ویژگی جدید است، از جمله دسترسی به تولید کننده تصویر چشمگیر Imagen 3 AI و یک ویژگی جدید چت بات سفارشی به نام Gems.
Imagen 3 اولین بار در اوایل سال جاری در Google I/O معرفی شد و قبلاً فقط از طریق آزمایش ImageFX در دسترس بود. این شامل واقع گرایی بهبود یافته در تصاویر و ارائه بهتر متن است.
این جواهرات برای اولین بار در ماه مه معرفی شدند. آنها مشابه GPT ها در ChatGPT کار می کنند، به این معنی که می توانید هوش مصنوعی را به روش خاصی انجام دهید یا شخصیت خاصی را بازی کنید. آنها را می توان در یک نمونه چت در وب جمینی برچسب گذاری کرد.
هر دو ویژگی جدید فقط برای افرادی در دسترس خواهند بود که 19 دلار در ماه برای اشتراک Gemini Advanced از طریق Google One یا Gemini for Workspace پرداخت کنند، اما دسترسی به مرور زمان افزایش خواهد یافت.
شخصی سازی با Gemini Gems
Google Gems یک ایده هوشمندانه است. این به شما امکان می دهد تا به سرعت یک نسخه سفارشی از Gemini را متناسب با یک هدف خاص ایجاد کنید. برای مثال، میتوانید هدفی خاص مانند آموزش برای ماراتن ایجاد کنید. در اینجا او بر تناسب اندام، سلامت و تغذیه تمرکز می کند.
این شرکت در بیانیهای توضیح داد: «با Gems، میتوانید تیمی از متخصصان ایجاد کنید تا به شما کمک کنند تا از طریق یک پروژه چالشبرانگیز فکر کنید، ایدههایی را برای یک رویداد آینده بنویسید، یا عنوان عالی برای یک پست رسانههای اجتماعی بنویسید». او افزود: “Gem شما همچنین می تواند مجموعه ای دقیق از دستورالعمل ها را به خاطر بسپارد تا به شما در صرفه جویی در وقت در کارهای خسته کننده، تکراری یا دشوار کمک کند.”
این شامل ارائه جزئیات دوره ای است که گذرانده اید، موضوعاتی که می خواهید مطالعه کنید یا حتی سبک نوشتن خودتان. بنابراین او می تواند بدون از دست دادن جریان منحصر به فرد شما، کار شما را به گونه ای ویرایش کند که از نظر گرامری صحیح باشد.
Gems در اکثر زبانها و 150 کشور کار میکند، اما در ابتدا فقط برای مشترکین Gemini Advanced یا کسانی که حساب تجاری یا سازمانی دارند در دسترس خواهد بود.
تصاویر بهتر با Imagen 3
من اکنون یک ماه است که در حال آزمایش مدل رندر چشمگیر Google DeepMind Imagen 3 هستم زیرا سرویس Google Labs در ImageFX در دسترس است. بالاخره به چت ربات جمینی آمد.
مدل جدید به زبان انگلیسی برای مشترکین Gemini Advanced در دسترس خواهد بود، اما در نهایت به چندین زبان در سراسر جهان برای همه کاربران در دسترس خواهد بود. در برابر مواردی مانند محتوای نامناسب و حق چاپ با تدابیر امنیتی همراه است. مشخص نیست که چقدر بهتر از Imagen 2 در Gemini خواهد بود که گوگل را به دلیل حساسیت بیش از حد در مورد برخی مسائل به دردسر انداخت.
تمام تصاویر ایجاد شده با استفاده از Imagen 3 در Gemini نیز با SynthID واترمارک خواهند شد تا در صورت استفاده در هر جایی بتوان آنها را به عنوان ایجاد شده توسط هوش مصنوعی علامت گذاری کرد. آنها همچنین فقط به شکل مربع ساخته می شوند.
گوگل میگوید جمینی اکنون میتواند دوباره تصاویری از افراد تولید کند، اما تصاویر واقعی از افراد قابل شناسایی، خردسالان یا هر چیز دیگری که ماهیت جنسی دارد را نمیسازد.
به گفته گوگل: “اصول طراحی ما واضح است: از ابتدا تا انتها، شما کنترل فرآیند خلاقیت را در دست دارید. اگر اولین تصویری که دریافت می کنید انتظارات شما را برآورده نمی کند، فقط به Gemini بگویید که چه چیزی را می خواهید تغییر دهید و این کار به شما کمک خواهد کرد. شما یک تصویر جدید.
این یکی از قوی ترین دلایل برای جاسازی یک رندر هوش مصنوعی در یک ربات چت است. مدل چت هوش مصنوعی بهعنوان واسطه عمل میکند، درخواستها را اصلاح میکند و دستورالعملهای بهتری را نسبت به ارائهکنندهها برای رندر ارسال میکند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران