من تصویر خالق تصویر هوش مصنوعی Imagen 3 جدید گوگل را با 7 دستور آزمایش کردم و شگفت زده شدم.
گوگل نسخه جدیدی از مدل رندر هوش مصنوعی Imagen 3 خود را معرفی کرده است که نوید واقع گرایی بهتر، انسجام بهتر و طیف وسیع تری از سبک های سفارشی، از فوتورئالیسم و امپرسیونیسم گرفته تا انتزاعی و انیمیشن را می دهد.
حتی اگر با خود Imagen 3 آشنایی ندارید، اگر تا به حال از Gemini برای ایجاد یک تصویر یا حتی تصاویر تطبیق داده شده با یک تلفن اندرویدی استفاده کرده اید، احتمالاً از مدل آزمایشگاه هوش مصنوعی Google DeepMind استفاده کرده اید. بهترین مکان برای استفاده از آن در آزمایش آزمایشگاه ImageFX است.
با به روز رسانی جدید، Imagen 3 نه تنها در نحوه پردازش تصاویر، بلکه در نحوه درک اعلان ها نیز بهبود یافته است. به عنوان مثال، اکنون زبان عکاسی را بهتر از مدل های قبلی از جمله انواع لنز و نور می فهمد. بنابراین Imagen 3 این پتانسیل را دارد که یکی از بهترین تولیدکنندگان تصویر هوش مصنوعی باشد.
بهترین راه برای آزمایش این، استفاده از ابزار کاملا رایگان ImageFX است که بخشی از آزمایشگاه های گوگل است. این ویژگی منحصربهفردی دارد که به شما امکان میدهد پس از ایجاد نسخه اولیه، بهعنوان مثال با تغییر نوع لنز، سریعاً درخواست را تطبیق دهید.
قرار دادن Imagen 3 برای آزمایش
برای اینکه بفهمم Imagen 3 چقدر خوب کار می کند، یک سری دستورات سبک عکاسی ایجاد کردم. هر یک از این ادعاها شامل یک لنز یا نوع دوربین متفاوت است. برخی نیز تکنیک های مختلفی دارند، مانند عکاسی ورزشی یا عکاسی خبری.
ایده این است که ببینیم مدل چقدر تصویر را بازتولید می کند و مهمتر از آن، چقدر خوب احساسات و احساس لحظه ای را که در اعلان مشخص شده به تصویر می کشد.
1. یک روز بارانی در لندن
یکی از مواردی که اکثر مدل ها هنگام ایجاد یک صحنه خیابانی با آن مشکل دارند، قرار دادن افراد است. آنها نمی توانند جاده را از پیاده رو تشخیص دهند، اما Imagen 3 به نظر می رسد که آن را درست می کند. در حالی که یکی در حال عبور از خیابان است، بقیه کنار می ایستند.
اعلان: “عکس سطح خیابان از یک خیابان شلوغ لندن در یک روز بارانی، افرادی که چترها را در دست دارند و انعکاس هایی روی سنگفرش خیس می درخشد، با لنز 35 میلی متری گرفته شده است، عمق میدان کم، تمرکز روی یک اتوبوس دو طبقه قرمز رنگ در پس زمینه، نور طبیعی، لحظه ای صادقانه.”
2. یک لحظه تأمل
این اعلان می توانست به راحتی شکست بخورد. بیشتر به خاطر انگشتان دست. بله، مشکل انگشت تقریبا در همه مدل ها حل شده است، اما گاهی اوقات هنگام در دست گرفتن لیوان یا دقت نگاه کردن، مشکل ایجاد می شود. به پیچیدگی به تصویر کشیدن سن اضافه کنید و به راحتی یک دره عجیب و غریب به دست می آورید – نه چندان در اینجا.
اعلان: «ساعت طلایی یک زن مسن با دستهای هوازده که فنجانی چای بخار را در دست گرفته، نور ملایم خورشید که چین و چروکها و لبخندش را برجسته میکند، با لنز 85 میلیمتری f/1.4 برای پسزمینهای کرمی بوکه، حالتی گرم و دوستانه، محیط پرتره منظره در فضای باز گرفته شده است. “
3. اطعام ملت
در اینجا مطمئن شدیم که مدل نوع خاصی از نور، پیچیدگی مشها و سایههای صحیح را بر اساس زمان روز به تصویر میکشد. همچنین باید ضرورت یک تصویر سبک دموکراتیک را در نظر می گرفت.
اعلان: «تصویر عکاس خبری از یک ماهیگیر که در هنگام طلوع خورشید توری را از اقیانوس میکشد، قطرات آب در نور میدرخشند، با دوربین Canon EOS R5 با لنز 24-70 میلیمتری f/2.8، کنتراست بالا با جزئیات واضح در دستهای مرد گرفته شده است. و امواج استقامت انسان را تسخیر می کنند.»
4. هنر باریستا
به اندازه کافی عجیب، latte art چیزی است که مدل های نمایشگر هوش مصنوعی با آن دست و پنجه نرم می کنند. Imagen 3 نه تنها کار درست را انجام داد، بلکه انگشتان را نیز به درستی قرار داد.
اعلان: «عکسی که در نور طبیعی از یک باریستا گرفته شده است که در یک کافه روستایی اروپایی، شیر بخار پز را در کاپوچینویی میریزد، با فوکوس ملایم روی فنجان قهوه در حالی که پسزمینه تار باقی میماند، با لنز 50 میلیمتری f/1.8 گرفته شده است و بخار در حال افزایش را به تصویر میکشد. و بافت از فوم.”
5. گرفتن لحظه
من مجبور شدم چند تغییر در این تصویر ایجاد کنم. من در ابتدا می خواستم قطرات عرق را به تصویر بکشم، اما شبیه باران بود، بنابراین موتیف باران را انتخاب کردم. خوب به نظر می رسد.
اعلان: «عکس نوردهی طولانی پویا از یک دونده سرعت در طول مسابقه دو و میدانی، عضلات منقبض شده و قطرات باران در هوا قابل مشاهده است، با لنز تله فوتو 70-200 میلیمتری f/2.8، سرعت شاتر بسیار واضح فوکوس بالا، تاری حرکت عقب در پس زمینه
6. پر از پتانسیل
در اینجا می خواستم ببینم آیا Imagen 3 می تواند احساسات را در یک تصویر ثبت کند یا خیر. یا حداقل یک عکس هنری و به سبک مدل را به تصویر بکشید و به هدف خود رسید. گرفتن دقیق سایه های مناسب و نور شدید برای یک تصویر سیاه و سفید.
اعلان: «پرتره سیاه و سفید با کنتراست بالا از مرد جوانی که زیر یک پل ایستاده است، با سایههای تند و برجستهای که خط فک زاویهای و نگاه شدید او را برجسته میکند، با لنز M10 لایکا و لنز 50 میلیمتری، جلوه دانههای فیلم کلاسیک برای جلوهای جاودانه گرفته شده است. ”
7. یک لحظه صمیمی
این تصویر دیگری بود که برای درست شدن نیاز به اصلاح داشت. من یک عکس معمولی اما تاثیرگذار (گرفته شده با دوربین خوب) از یک کشاورز می خواستم. باید موقعیت دهقان را به گونه ای قرار دهیم که از عکس گرفتن احساس ناراحتی کند اما در عین حال به مزرعه خود افتخار کند.
اعلان: «پرتره محیطی از یک کشاورز مسن که با غروب در وسط مزرعه ذرت ایستاده است، جایی که نور مهتاب آبی سایههای بلندی میاندازد و جلوهای بوکه روی صورت کشاورز ایجاد میکند، که با دوربین نیکون Z9 و لنز 35 میلیمتری f/1.4 گرفته شده است. پسزمینه ردیفهایی از گندم را نشان میدهد که به آرامی محو شدهاند.”، شن و ماسه و بینظیری زندگی روستایی را به تصویر میکشد.
یک چیز دیگر: عکاسی وحشتناک
می خواستم ببینم Imagen 3 چقدر می تواند با عکاسی بد مقابله کند. خیلی خوب است که مدلها میتوانند آثار هنری خیرهکننده، عکسهای واقعگرایانه زیبا و قطعات انتزاعی خلق کنند که باعث میشود از انسان بودن آنها سوال کنید. عکس های بد چطور؟
من به Imagen 3 این دستور را دادم تا ببینم چگونه با نوع عکاسی نامفهوم رایج در دوربین های دهه 80 و 90 برخورد می کند. ناامید نشدم.
اعلان: «عکسی از فضای داخلی با نور ضعیف که از فاصله نزدیک با استفاده از فلاش سخت با دوربین فیلم گرفته شده است، چهره دو نفر را که پشت میز شام نشستهاند اشباع میکند، چشمهای قرمز میاندازد و سایههای عمیق و ناخوشایند روی دیوار پشت آنها با کمی خاموش شدن. -قاب بندی در مرکز.”