من از کلود خواستم دستورات تصویر را بنویسد و سپس Nano Banana را با ChatGPT آزمایش کردم تا برنده را مشخص کنم.

تولیدکنندگان تصویر هوش مصنوعی به طرز شگفت انگیزی خوب می شوند. اما نتایجی که به دست می آورید معمولاً به یک چیز ختم می شود: سریع.
این بار، به جای نوشتن درخواست ها، تصمیم گرفتم چیزی غیر متعارف را امتحان کنم. من از کلود چت بات آنتروپیک خواستم مجموعه ای از دستورات بسیار دقیق را ایجاد کند که همه چیز را از صحنه های علمی تخیلی سینمایی گرفته تا هنر انتزاعی سورئال را پوشش دهد.
ادامه مقاله در زیر
وقتی کلود مهندس مسیریابی مخفی شد چه اتفاقی افتاد:
1. فوتورئالیستی
درخواست کلود: “یک ماهیگیر هوازده در اواخر دهه 60 خود که تنها در ساعت 5:47 صبح روی اسکله ای پوشیده از مه نشسته است، دستانش پینه بسته و زخمی شده اند و یک فنجان سرامیکی خرد شده قهوه سیاه را در چنگ گرفته است. او یک ژاکت پوست روغنی رنگ و رو رفته با یک جیب سینه پاره پوشیده است. تخته های اسکله از رطوبت تیره هستند و رنگ کهربایی کم رنگ چراغ های داک را منعکس می کند. یک قایق ماهیگیری چوبی کوچک که بدنه آن آبی کبالت پوست کنده شده بود، به آرامی پشت سرش تاب می خورد. با دوربین Canon EOS R5، لنز 85 میلیمتری f/1.4، ساعت طلایی پراکنده در مه دریا. فراواقعی، 8K، فتوژورنالیسم.»
ChatGPT یک پرتره تنگ و صمیمی ایجاد کرد. تمرکز عمدتاً روی چهره و وضعیت عاطفی مرد است (غمگین/متفکر). تصویر تاکید بیشتری بر کثیفی و پوشیدن لباس و پوست دارد. کمی احساس “نقاشی” بیشتری دارد.
نانو موز یک شات محیطی گسترده ایجاد کرد. مقیاس اسکله، کل طول قایق و چشم انداز اسکله را با وضوح عکاسی بیشتری ثبت کرد.
برنده: نانو موز برنده می شود این برای عکاسی خبری مناسب تر است زیرا با زاویه دید باز و نحوه بازتاب نور حوض مرطوب کمی واقعی تر به نظر می رسد.
2. فانتزی
درخواست کلود: “کتابخانه ای باستانی عظیم که در داخل یک درخت زنده توخالی ساخته شده است که فضای داخلی آن صدها متر به سمت بالا کشیده شده است. هزاران فانوس کهربایی درخشان از پلکان های مارپیچی که در پوست درخت حک شده آویزان شده اند. کتاب ها به طور مستقل در هوا شناور هستند و توسط جریان های نامرئی جادوی طلایی هدایت می شوند. دانشمندان ریز با جواهرات ضخیم بر روی جواهر راه می روند. ستونها کف و سقف را سوراخ میکنند که به سبک یک نقاشی رنگ روغن استادانه به تصویر کشیده شده است – کیاروسکورو. نورپردازی، قلم موی جسورانه، پالتی از کهرباهای گرم و سبزهای عمیق جنگلی با الهام از رامبراند و آلن لی.
ChatGPT سبک رامبراند به سمت کیاروسکورو متمایل شد. بسیار تیرهتر، بد خلقتر است و از کنتراست شدید بین نور و سایه استفاده میکند.
نانو موز تصویری به سبک پانوراما وحشی ارائه میکرد که بسیار روشنتر و جزئیات بسیار بیشتر بود.
برنده: نانو موز برنده می شود برای چیزی که واقعاً شبیه یک شاهکار توضیحی است.
3. فضانورد
درخواست کلود: “یک فضانورد تنها، با پوشیدن یک لباس سفید مات نسل بعدی EVA، روی سطح یخی ترک خورده قمر مشتری اروپا می ایستد. مشتری بر 40 درصد آسمان پشت سر او تسلط دارد، با نوارهایی از قهوه ای سوخته، کرم و خاکستری طوفانی پوشیده شده است، و لکه قرمز بزرگ او به سختی در صفحه ی پا دیده می شود. و به دلیل نور بیولومینسانس زیر سطحی، به رنگ آبی کم رنگ می درخشد. لنز آنامورفیک سینمایی، نسبت تصویر 2.39:1، نورپردازی ریدلی اسکات، فضای حجمی، تصویر با کیفیت IMAX.
ChatGPT تمرکز بر “شکوه” و سفر. ما آنچه را که فضانورد می بیند می بینیم که باعث می شود مقیاس مشتری حتی بزرگتر به نظر برسد.
نانو موز متمرکز بر موضوع فضانورد رو به دوربین است و چرخ دنده و انعکاس آن را در منظره یاب برجسته می کند.
برنده: نانو موز برنده می شود ما اینجا هستیم تا به مشخصات دوربین (لنز آنامورفیک و نسبت 2.39:1) پایبند باشیم که آن را شبیه یک عکس اصلی از یک فیلم علمی تخیلی مدرن میکند.
4. خلاصه
درخواست کلود: قلب انسان، که تماماً از گل صد تومانی های قرمز شکوفه و تاک های خاردار تیره تشکیل شده است، در فضای خالی سیاه و گسترده ای در هوا آویزان است. مکانیسم ساعت طلایی از اتاق های آن به بیرون تابش می کند. چرخ دندههای کوچک، فنرها و راههای فرار که در گرانش صفر حرکت میکنند. قطرات طلای قرمز تیره و مایع یخ زده در هوای اطراف او آویزان است. ترکیب متقارن اما ناقص است. هرج و مرج ارگانیک با دقت مکانیکی روبرو می شود. سبک: نقاشی رنگ روغن سوررئالیستی تاریک، یادآور الکس گری و ارنست هکل، با تصویر گیاه شناسی روبرو می شود. ترکیب بندی فوق العاده دقیق و باروک.
ChatGPT ایجاد شده است گلها و درختان انگور که با هم رشد میکنند، عمیقاً یکپارچه شدهاند، تقریباً انگار ساختار خود قلب هستند.
نانو موز او یک شکل قلب ایجاد کرد که بیشتر شبیه یک داربست است و گل صد تومانی به همراه یا خارج از آن شکوفا می شود..
برنده: ChatGPT برنده می شود برای فیلیگران طلایی براق، دقیق و شیک که به خوبی با زیبایی “باروک” ترکیب می شود.
5. طبیعت
درخواست کلود: یک سلول طوفانی عظیم بر فراز دشتهای بزرگ آمریکا در ساعت طلایی. ابر دیواره چرخان ابرسلول به سمت مزارع گندم طلایی مسطح پایین میآید. آسمان شکافته است؛ بنفش تیره و زغالی در سمت چپ، کهربایی و صورتی در سمت راست میسوزد، جایی که نور خورشید هنوز در آن نفوذ میکند. رعد و برق به سه نقطه پرشاخهای برخورد میکند. انبار کوچک قرمز رنگ در پیش زمینه قرار دارد که با لنز 16 میلی متری با زاویه دید عریض، HDR، جزئیات فوق العاده بالا در ساختارهای ابری، شکل گیری کومولونیمبوس درست از چشم انداز هواشناسی گرفته شده است.
ChatGPT تصویری به شدت دراماتیزه شده با آسمانی شدید و آتشین ارائه کرد که حسی تقریبا آخرالزمانی یا سورئال را القا می کرد.
نانو موز تصویری ایجاد کرد که بیشتر شبیه یک عکس واقعی بود
انتقال های ظریف و بافت ابری واقعی.
برنده: نانو موز برنده می شود برای رئالیسم فنی بیشتر شبیه یک چاپ عکاسی با کیفیت بالا است.
6. سامورایی
درخواست کلود: “یک سامورایی ژاپنی دوره فئودالی که نیمه شب در وسط روستایی در حال سوختن بی حرکت ایستاده است. زره لاکی مشکی او ترک خورده است، یک صفحه روی شانه آویزان است. گلبرگ های شکوفه های گیلاس با خاکستر در حال سقوط در هوای روشن مخلوط می شوند. کاتانای او کشیده شده است و می درخشد. او، شبح یک در چوبی در شعله های آتش فرو می ریزد، نورپردازی دراماتیک با زاویه کم، زبان بصری الهام بخش آکیرا کوروساوا، اما رندر مدرن با فوتورئالیسم، سایه های عمیق، کنتراست شدید، دانه بندی فیلم 4K.
ChatGPT تصویری محکم و با قاب عمودی ارائه کرد که شامل یک سامورایی عظیم است که بر کل قاب تسلط دارد.
نانو موز به نظر می رسد او نماهای عریض و سینمایی را ترجیح می دهد. این زمینه محیطی بیشتری را فراهم کرد که منعکس کننده وسعت روستا و دروازه سوزان توری است.
برنده: ChatGPT برنده می شود برای یک شخصیت دراماتیک که تقریباً از صفحه پریده تا داستانی را تعریف کند.
7. غریب
درخواست کلود: “یک کتابفروشی کوچک و مستقل، از آن سوی جاده سنگفرش شده در خیابان فرعی لندن در هنگام غروب دیده می شود. نور طلایی گرم از پنجره های مه آلود می گذرد. تابلوی تخته گچی دست نویس به در تکیه داده است. نمای مغازه به جنگلی عمیق با حروف طلایی رنگ آمیزی شده است. اسطوخودوس گلدانی در کنار ورودی، برگ های آن در میان گربه ها تزئین شده است. انعکاس نور لامپ روی سنگفرش های خیس. می درخشد. سبک: رئالیسم نقاشی – قلم موی سبک امپرسیونیستی با جزئیات فوکوس واضح با الهام از ادوارد هاپر و چایلد حسام. آرام، مالیخولیایی، صمیمی.»
ChatGPT این تصویر رهگذری را ایجاد کرد که به پنجره نگاه میکرد و «کتابفروشی» عمومی بالای در، مانند یک فکر بعدی بود.
نانو موز جزئیات ویژه ای مانند نام منحصر به فرد کتابفروشی، نورپردازی ضعیف و کتاب هایی که در واقع ستون فقرات آنها دیده می شود، اضافه شد.
برنده: نانو موز «خارجآلود ستون فقرات» برنده خلاقیت بیشتر با سطح شخصیتی است که با نام و خواستهاش خیلی بهتر است.
افکار نهایی
پس از هفت آزمایش نقطهای مختلف، واضح است که نانو موز به طور مداوم از نظر مقیاس محیطی و رئالیسم عکاسی برتر است و اغلب ترکیببندیهای گستردهتری تولید میکند که شبیه عکسهای دوربین واقعی است. این مزیت به آن کمک کرده است تا بر مقولاتی مانند فوتورئالیسم، طبیعت و مناظر سینمایی تسلط یابد.
از سوی دیگر، ChatGPT تمایل دارد که داستان سرایی را در اولویت قرار دهد و روی موضوع تمرکز کند. جلوههای بصری او بیشتر بر روی شخصیتها و جزئیات احساسی تمرکز میکند که بهویژه در صحنههای انتزاعی و سامورایی به خوبی کار میکرد.
چیزی که این آزمایش را جالب کرد این بود که هیچ یک از مدل ها مزیت فوری نداشتند. کلود هر اعلان را نوشت. این بدان معنی است که هر دو مولد دقیقاً با دستورالعمل های خلاقانه یکسانی شروع می کنند. نتایج یک چیز مهم را در مورد ابزارهای بینایی هوش مصنوعی در حال حاضر نشان می دهد: تفاوت فقط در درخواست نیست، بلکه نحوه تفسیر هر مدل آن است.
همانطور که مدلهای هوش مصنوعی به تکامل خود ادامه میدهند، ممکن است قدرت واقعی از ترکیب آنها حاصل شود و به یک مدل اجازه میدهد دستور را طراحی کند در حالی که مدل دیگر تصویر را ایجاد میکند. به عبارت دیگر، آینده خلاقیت هوش مصنوعی ممکن است کمتر به انتخاب یک ابزار واحد و بیشتر در مورد مدیریت چندین مورد از آنها با هم باشد.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.



