5 درخواست برای ایجاد بهترین تصاویر AI در Google Gemini

اگرچه دوقلوها برای تبدیل شیرجه های عمیق به مسائل تصادفی و کمک به آنها برای ایجاد حس کادر پراکنده Gmail شما مناسب هستند ، اگر می خواهید از آن به عنوان ژنراتور پیشرو در تصویر AI استفاده کنید ، لازم نیست بیشتر نگاه کنید.
Google’s Imagen 3 Model – یکی از بهترین ژنراتورهای تصویر AI – Gemini تقویت شده نوید جزئیات غنی و تصاویر برجسته را بر اساس درخواست متن شما می دهد. از ایجاد تصاویر فوتوگالیستی گرفته تا طرح های پیچیده ، درخواست های زیادی وجود ندارد که جمینی نتواند از عهده آن برآید.
دانستن اینکه جمینی به خوبی کار می کند می تواند به شما در ایجاد تصاویر بهتر برای ارائه ها ، وب سایت یا استفاده شخصی خود کمک کند. تمایل دارد بهترین عملکرد را با تصاویر و خواسته های فوتوگرالیستی طولانی تر و دقیق تر انجام دهد.
برای دستیابی به بهترین نتیجه ، پنج نمونه سریع می توانید شروع کنید.
1. مربی یوگا
(تصویر: © راهنمای تام)
اگرچه بیشتر تصاویری که در جمینی ایجاد می کنید به احتمال زیاد یک موضوع اصلی هستند ، مهم است که جزئیات کافی را به درخواست های خود اضافه کنید تا به وضوح تعریف کنید که مسئله چه کاری انجام می دهد و در کجا هستند.
من درخواست خود را با توضیح کلی در مورد مرحله شروع کردم و سپس جزئیاتی از قبیل توضیحات کلی لباس مربی یوگا و یک محیط در فضای باز اضافه کردم.
این درخواستی است که من استفاده می کنم: “تصویری از یک مربی یوگا در خارج از منزل ایجاد کنید. مربی یوگا دارای قسمتهای بالای سفید و سبز است و در لبه یک صخره صخره ای قرار دارد.
نتیجه به همه یادداشت های مناسب رسیده است – بزرگنمایی برخی از مشکلات را در چشم و پای مربی نشان می دهد.
2. ربات دیوراما
(تصویر: © راهنمای تام)
سپس ، من می خواستم محدودیت های طول و پیچیدگی سریع را آزمایش کنم. من تصمیم گرفتم که یک صحنه diorama عروسکی نمدی از یک دفتر ، از جمله چند عنصر مهم ایجاد کنم.
من از درخواست زیر استفاده کردم: “تصویری از یک صحنه عروسک عروسکی ساخته شده از یک ساختمان اداری پراکنده ایجاد کنید.
این روبات به طرف دیگر اتاق حرکت می کند که میزبان یک میز چوبی بلند در یک طرف اتاق پوشیده از مانیتورهای رایانه است. جعبه های پیتزا سبک روی این میز چوبی وجود دارد. دارای طراحی زیگزاگ در کف پوشیده از فرش است. تصاویر مختلف حیوانات مختلف دیوارها را تزئین می کند. “
شخصیت اصلی یک روبات بود که یک فنجان قهوه را در یک تکه کاغذ متعادل می کند. در یک طرف دفتر رایانه ای وجود داشت ، در حالی که طرف دیگر دارای یک میز با پیتزا بود. علاوه بر این ، من می خواستم کف پوشیده از فرش یک الگوی زیگزاگ داشته باشد.
دوقلوها دقیقاً همان چیزی را که در چند ثانیه توضیح دادم تولید کردند. در این آزمایش ، محدودیت اصلی تخیل من بود – من کاملاً مطمئن نبودم که چه چیزی می خواستم صحنه به نظر برسد. اما دوقلوها شکاف ها را برای من تحویل دادند و آن را پر کردند.
برای تکمیل نمای دفتر ، چندین صندلی اداری ، برخی از گیاهان و حتی یک جعبه زباله اضافه شده است. این چقدر جالب است؟
3. روشنایی خلق و خوی
(تصویر: © راهنمای تام)
یکی از ویژگی های Gemini که تصویری را که گوگل بر آن تأکید می کند ، توانایی توصیف روشنایی غنی تر است. البته ، من مجبور شدم این ادعا را با درخواست زیر آزمایش کنم:
“تصویری را ایجاد کنید که یک دانش آموز در آپارتمان توکیو می خواند. یک دانش آموز جوان در یک میز قرار دارد و از یک کتاب درسی باز می خواند. این کتاب توسط یک چراغ جدول سبک صنعتی روشن شده است.
این میز به سمت یک پنجره بزرگ با مشرف به خیابان متراکم توکیو که توسط چراغ های نئونی رنگارنگ روشن شده است ، هل داده شده است. قطرات باران به پنجره پخش می شود و در چراغ های نئون می درخشد. از یک عکس از یک سبک واقع بینانه استفاده کنید. “
برای این تصویر تولید شده ، من می خواستم صحنه دانشجویی را که در آپارتمان توکیو نشسته است ، ایجاد کنم. من روی سه عنصر اصلی روشنایی تمرکز کردم: روشنایی داخلی و در فضای باز و تعامل نور با قطره باران.
چراغ جدول به وضوح کتاب و چهره دانش آموز را روشن می کند در حالی که بقیه اتاق تاریک است. در باران بیرون ، چراغ های نئون هنگام تنظیم صحنه شهر ، درخشش کمی می بخشد.
قطرات باران در پنجره در حالی که نور را از بیرون بازتاب می دهد ، رنگ های بنفش و آبی مختلفی می گیرد.
دوقلوها همچنین لمس اضافی اضافه کردند و مستقیماً به پنجره دو پرتو از چراغهای جلو ماشین اشاره کردند.
4. ایجاد متن
(تصویر: © راهنمای تام)
Imagen 3 ، که مدل AI را در Gemini تقویت می کند ، متن بهبود یافته را در تصاویر ارائه می دهد – یک ویژگی مفید که می تواند مرحله اضافی ترتیب را در برنامه دیگر ذخیره کند تا متن اصلی را اضافه کند.
برای این درخواست ، من قصد داشتم یک پوستر فیلم ایجاد کنم که از نظر زیبایی شناسی جذاب باشد و هم عنوان فیلم را درگیر کند:
“یک پوستر فیلم سبک هالیوود ایجاد کنید. پوستر دارای جذابیت فوتوگرال از یک کارآگاه مرد و زن است که پشت یک ماشین اسپرت لوکس غرق می شود. سبک تصویر نوآر فیلم است.
اطمینان حاصل کنید که تنها متن در پوستر باید عنوان و نام بازیگر فیلم باشد. عنوان این فیلم “AI Legends” است. بازیگران فیلم “جین اسمیت” و “جان دوی .. عنوان فیلم زیر پوستر است. نام بازیکنان در صدر قرار دارند.”
کارآگاهان قابل توجه؟ کنترل. ماشین فانتزی؟ کنترل. املای صحیح؟ ارم دقیقاً من کم و بیش در آنجا بودم ، بنابراین می توانید با چند تلاش اضافی نتیجه بهتری نسبت به جمینی کسب کنید.
به نظر می رسد به شما کمک می کند تا حد ممکن واضح باشد که با کدام متن متمایز هستید و متنی که باید روی پوستر قرار گیرد. با این حال ، همانطور که از آزمون ما می بینید ، نتیجه همیشه کامل نیست.
چشم انداز 5
(تصویر: © راهنمای تام)
سرانجام ، من می خواستم صحنه ای جالب ایجاد کنم که بتوانم از آن به عنوان تصویر زمینه دسک تاپ استفاده کنم. چه چیزی می تواند ایجاد یک تصویر بهتر از آسمان شب ستاره خودمان باشد؟
من از جمینی خواستم تا در معرض طولانی سامانولو قرار بگیرند و قایق چت ناامید نشود. تمایل به عکس قرار گرفتن در معرض طولانی به این معنی بود که ستاره ها زنده و واضح به نظر می رسید که درخشش کهکشان را نشان می داد.
این درخواستی بود که من استفاده کردم: تصویری از نمای HD ایجاد کنید. یک آسمان شب ستاره یک عکس در معرض طولانی از راه شیری است. این عکس از وسط دره بزرگ گرفته شده است. یک دوربین حرفه ای با کنتراست بالا و ترکیب سینمایی.
راه شیری حاوی حدود 100 میلیارد ستاره ، هم دوقلوها و من نمی توانم درک کنم. اما جمینی موفق به ایجاد منظره ای جالب و آرام شد.
با بازی با درخواست زیر می توانید صحنه را بیشتر سفارشی کنید. به عنوان مثال ، می توانید مکان دیگری را برای عکس گرفتن از AI انتخاب کنید یا با لنزهای مختلف و تنظیمات دوربین بازی کنید.
حالا که این خواسته ها را برای جمینی آموخته اید ، چرا به سایر مقالات هوش مصنوعی ما نگاه نمی کنید؟
حتماً بررسی کنید که تحقیقات عمیق جمینی Google اکنون رایگان است – اکنون 7 نکته سریع برای شروع استفاده از آن. و اگر شما یک کاربر ChatGPT هستید ، این سرنخ 11 -request را برای کسب نتایج بهتر از دست ندهید ، و من این 5 درخواست را در Chatgpt فروختم.