7 درخواست برای ایجاد تصاویر خیره کننده هوش مصنوعی با Flux
Flux یکی از قدرتمندترین مدلهای تصویر هوش مصنوعی است. این منبع باز است و به طور گسترده در پلتفرم های مختلف در دسترس است، اما مهم نیست در کجا از آن استفاده می کنید، مسیریابی تا حد زیادی یکسان است و به ارزش آن می افزاید.
Flux که توسط Black Forest Labs، یک استارتآپ هوش مصنوعی ایجاد شده توسط برخی از تیمی که مدل اصلی نمایشگر Stable Diffusion را توسعه داده است، در نسخههای زیادی عرضه میشود، که از Flux Schnell کوچک شروع میشود و تا Flux 1.1 Pro Ultra جدید ادامه مییابد.
ایجاد تصاویر هوش مصنوعی ساده تر از همیشه است، اما گاهی اوقات می تواند به داشتن سرنخی برای الهام کمک کند. این هفت فرمان برای Flux طراحی شدهاند، اما با هر مدلی، از جمله مدلهایی که در بهترین راهنمای تولیدکننده تصویر هوش مصنوعی ما آمده، کار میکنند.
دستورات برای Flux ایجاد کنید
برای استفاده حداکثری از Flux یا هر رندر هوش مصنوعی، باید عناصر خاصی را تعریف کنید. به عنوان مثال، اگر می خواهید یک افکت کارتونی داشته باشید، انیمیشن یا سبک طراحی را مشخص کنید. اگر نور رئالیسم می خواهید دوربین را مشخص کنید.
من به هفت دستور مختلف رسیدم که همگی برای تولید یک تصویر واقعی نیاز داشتند. من یک صحنه یا موقعیت را در هر یک و همچنین دستورالعمل های دوربین قرار دادم.
تمام تصاویری که من ایجاد کردم با استفاده از Flux 1.1 Pro Ultra، آخرین مدل از آزمایشگاههای جنگل سیاه، ساخته شدهاند. من اینها را با استفاده از برنامهای که برای خودم ساختهام اجرا میکنم که به من امکان میدهد چندین درخواست را به یک مدل خاص ارسال کنم. در این مورد من از FAL API استفاده می کنم.
درخواست تصویر اصلی به این شرح است: “یک عکس معمولی از تلفن هوشمند از زنی با موهای قرمز موج دار که بیرون در نور طبیعی روز ایستاده است. پوست او دارای بافت طبیعی است، از هرگونه ظاهری بیش از حد صاف یا “پلاستیک” با عیوب ظریف مانند لکه های کوچک قابل مشاهده اجتناب می کند. یا کک و مک است.”
1. بازار ساعت طلایی
این اعلان باید تصویری از بازار شلوغ کشاورزان ایجاد کند. در نور گرم غروب خورشید غرق خواهد شد و به نظر می رسد که با استفاده از دوربین سونی با لنز 35 میلی متری عکس گرفته شده است. میتوانید با تغییر دوربین و حتی زمان روز، آن را تطبیق دهید.
اعلان: «تصویری واقعی از بازار شلوغ کشاورزان در طول ساعت طلایی، که در Sony a7R IV با لنز 35 میلیمتری f/2.8، ISO 100 ثبت شده است. صحنه مملو از فروشندگانی است که محصولات رنگارنگ را مرتب میکنند، مشتریان در حال تعامل هستند، و نور گرم خورشید که از طریق یک دستگاه پخش میشود. سایبان بوم که سایه های بلندی روی زمین می اندازد.
2. تقاطع های شهری (پوستر ایمنی راه)
من در ابتدا برنامه ریزی کرده بودم که فقط تصویری از یک تقاطع شلوغ ایجاد کنم، اما نتیجه به من ایده یک تصویر “امنیت عمومی” را داد، بنابراین از Flux خواستم کلمات “جستجو، ایمن بمان” را اضافه کند. به راحتی می توانید متن و حتی پس زمینه را تنظیم کنید، شاید در تقاطعی که خطوط راه آهن از جاده عبور می کند.
اعلان: این تصویر که با آیفون 15 پرو مکس گرفته شده است، یک تقاطع شلوغ را در ساعات شلوغی شهری مدرن به تصویر میکشد. اتومبیلها، اتوبوسها و دوچرخهسواران از گذرگاههای پیاده عبور میکنند، عابران پیاده از کنار آن عبور میکنند، و بازتابهای آسمانخراشهای اطراف در پنجرههای خیابانی در حال عبور میدرخشند. ” تاکسی زرد یک عنصر متنی چشم نواز با خواندن «تماس بگیرید، ایمن بمانید» در صحنه گنجانده شد، شاید در یک بیلبورد یا اتوبوس، تا به عنوان یادآور ایمنی جاده باشد.
3. صنایع دستی قهوه
من برای انجام این سریع تلاش کردم. سعی کردم نمای وسیع تری از یک باریستایی که روی یک پروژه لاته آرت کار می کند با یک مشتری در پس زمینه عکاسی کنم. این مورد ناموفق بود، بنابراین من دستور را تنظیم کردم که فقط روی latte تمرکز کند.
اعلان: “عکس نمای نزدیک با Canon EOS 5D Mark IV و لنز ماکرو 100mm f/2.8L IS USM، تنظیمات f/4، 1/200 ثانیه، ISO 400. این قاب از دستان هوازده یک باریستا را از نزدیک می گیرد. به طرز ماهرانه ای یک کاپوچینو آماده کنید. در فوکوس، این لحظه ای است که شیر در اسپرسوی غنی در نزدیکی ریخته می شود که اولین چرخش های الگوی روزتا را ایجاد می کند که از دستگاه صیقلی La Marzocco به سمت بالا می رقصد در برابر پس زمینه نرم بوکه. “ترکیب از قانون یک سوم پیروی می کند و نقطه ریزش بر رنگ ماهاگونی عمیق اسپرسو غالب است، در حالی که قطعات فولادی ضد زنگ دستگاه لهجه های فوق العاده ای را ارائه می دهند.”
4. داستان های مترو
من عاشق ماهیت صمیمی این تصویر هستم و اولین تصویر را از اعلان به اشتراک می گذارم. ایده این است که یک ماشین مترو به ظاهر بی پایان بخریم.
اعلان: این تصویر واقعی که در Google Pixel 8 با حالت دید در شب گرفته شده است، یک واگن مترو شلوغ را به تصویر میکشد. مسافران غرق در تلفنها، کتابها و مکالمات خود هستند؛ چهرههای متنوع آنها نشاندهنده چندفرهنگی شهر است. فیلمهای آینده و تبلیغات محلی دیوارهای محل کار را میپوشانند. “
5. یوگا پارک
این احتمالا ساده ترین تصویری است که با پهپاد گرفته شده است تا گوشی هوشمند یا DSLR. ایده جمع آوری فیلم های هوایی از کلاس یوگا است. می توانید این صحنه را به صحنه دیگری مانند دریاچه قایق سواری یا پیست مسابقه تغییر دهید.
اعلان: “این تصویر که با پهپاد DJI Mavic 3 گرفته شده است، نمایی هوایی از کلاس یوگا در پارک ارائه می دهد. شرکت کنندگان در ژست های مختلف روی تشک های خود ژست می گیرند، نور خورشید از میان برگ های درختان عبور می کند و منظره شهری مدرن را می توان در فاصله.”
6. شام خانوادگی (جلد کتاب دستور غذا)
تصوری که در ذهن من برای این موضوع وجود داشت، طرحی دو صفحهای با عنوان در سمت چپ بود، اما کار نکرد، بنابراین طرحی را انتخاب کردم که متن را در بالا نشان دهد. تا حدی کار کرد، اما مورد علاقه من نبود. به راحتی قابل تطبیق است.
اعلان: «عکس با فوجیفیلم: دستور العملهایی برای گردهماییهای گاه به گاه» به طرز ماهرانهای در صحنه گنجانده شده است، شاید به صورت کتابی روی میز یا یادداشتی دستنویس روی تخته سیاه در پسزمینه.
7. عجله اتاق اورژانس
من دوست دارم که این در واقع به نظر می رسد که توسط یک GoPro روی سر گرفته شده است، در موقعیتی که معمولاً با GoPro مرتبط نیست عکسبرداری شده است.
اعلان: “تصویر واقعی گرفته شده با GoPro HERO11 Black که صحنه پر جنب و جوش یک اورژانس بیمارستان را نشان می دهد. پزشکان و پرستاران با احساس فوریت به بیماران مراجعه می کنند، تجهیزات پزشکی و مانیتورها اطراف تخت ها را احاطه کرده اند و اعضای مضطرب خانواده با نگرانی در پس زمینه منتظر می مانند.”
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide