من 5 از بهترین ژنراتورهای تصویر هوش مصنوعی را با استفاده از Nightcafe آزمایش کردم – این بالاترین مکان را گرفت

تصویر هوش مصنوعی رقابت شدید در ژنراتور است و بیش از یک شرکت مانند Ideogram ، Midjourney و Openai امیدوار است که شما را متقاعد کند که از پیشنهادات آنها استفاده کند. به همین دلیل من طرفدار Nightcafe هستم و چند سال است که از آن استفاده می کنم. Dall-E 3 دارای تمام مدل های مهم از جمله Flux ، Google Imagen و Ideogram است.
با گذشت سالها ، من بسیاری از تصاویر هوش مصنوعی ایجاد کرده ام و هر مدل چیز دیگری را به ارمغان می آورد. به عنوان مثال ، Flux یک مدل هدف کلی بزرگ در نسخه های مختلف است. Imagen 4 آن را برای رئالیسم باورنکردنی می کند و به جز IDEOGRAM GPT-4O ، متن بهتری را از هر چیزی ایجاد می کند.
شما می توانید همان درخواست را با Nightcafe در مدل های مختلف امتحان کنید ، حتی با استفاده از Google Image ، می توانید یک تصویر واقع بینانه از یک ایستگاه قطار ایجاد کنید ، سپس از آن به عنوان یک تصویر شروع برای یک پروژه ایده ای استفاده کنید تا یک زیرنویس یا آرم سبک شده را بپوشانید. همچنین می توانید از طریق چندین مدل از همان درخواست استفاده کنید تا ببینید کدام یک را ترجیح می دهید.
Nightcafe همچنین بیشتر مدل های اصلی ویدیویی مانند Kling ، Bunway Gen-4 ، Luma Dream Machine و WAN 2.1 را ارائه می دهد. ما برای این آزمون روی مدل های تصویر تمرکز می کنیم.
انتخاب یک مدل مورد علاقه
داشتن همه این مدل ها یک روش عالی برای آزمایش هر یک است تا آنچه را که مناسب ترین زیبایی شناسی شخصی شماست پیدا کنید – و هرکدام متفاوت از آنچه فکر می کنید متفاوت است.
علاوه بر مدلهای “عنوان” مانند Flux و Imagen ، مدل های جامعه ای نیز با نسخه های ریز از شار و انتشار پایدار وجود دارد. برای این منظور ، من روی مدل های اصلی Openai GPT1 ، Remraft V3 ، Google Imagen 4 ، Ideogram 3 و Flux Kontext تمرکز کردم.
من یک درخواست برای امتحان کردن هر مدل پیدا کردم. به تا حدودی به فوتوگرایی نیاز دارد ، صحنه پیچیده ای را ارائه می دهد و شامل یک متن نازک است.
The prompt: “A small independent coffee van parked on a quiet cobblestone street in Paris during early autumn, captured in candid 35mm street photography style with natural light and shallow depth of field. Golden morning sunlight reflects off the damp stones after a light rain. The van is a matte forest green Citroën Type H, with a hand-painted chalkboard sign leaning against it that reads “Café du Matin” in elegant cursive. A barista in a denim apron hands a coffee to a smiling elderly woman in a beige trench coat holding a small umbrella. Fallen leaves gather near the tyres, and gentle steam rises from takeaway cups on the wooden counter.”
1. Google Imagen 4
Google’s Imagen 4 مدلی است که اگر می خواهید برنامه Gemini برای ایجاد تصویر چیزی برای شما استفاده کنید. همچنین این مدل است که هنگام ایجاد یک تصویر در Google Slides استفاده می شود.
این اولین تصویر از این آزمایش بود و کمی در هنگام گرفتن دود تأکید می کرد. او صحنه ای بصری قانع کننده ایجاد کرد و نیازهای دو نفر را روی صحنه دنبال کرد. او ابزار مناسب را گرفت ، اما متن هیچ نشانه ای ندارد.
2

مدل های Flux Labs Black Forest بسیار متنوع ترین و منبع باز هستند. با ورود به نوع Kondext ، مدل های تصویری وجود دارند که زبان طبیعی را بهتر درک می کنند. این نتایج بسیار دقیق تری به ویژه هنگام ایجاد متن یا صحنه های پیچیده ، مانند تولید تصویر محلی OpenAi در GPT-4O می دهد.
Flux Kontext ‘Cafe Matin را کاملاً گرفتار کرد ، زن را به درستی گرفت و به نوعی احساس فرانسوی تر از Imagen کرد ، اما فکر نمی کنم عکاسی صحیح باشد.
3. Openai GPT Image-1

GPT Image-1 نباید با مدل اصلی GPT-1 2018 اشتباه گرفته شود ، این یک مدل چند حالته است که برای ارائه دقت از OpenAi ، که توسط Adobe ، Figma ، Canva و Nightcafe استفاده می شود ، طراحی شده است. مانند Kondext ، بهتر از درخواست های زبان طبیعی می فهمد.
نقطه ضعف این مدل این است که نمی تواند تصاویر 9:16 یا 16: 9 را بسازد. فقط انواع مربع. او کامیون و نام را گرفت ، اما فکر نمی کنم صحنه خوب باشد. او همچنین یک چتر دوم را برای تصادفی تولید کرد و قرار دادن دست ها غیر واقعی است.
4. ایدوگرافی V4

Ideogram از زمان انتشار یکی از مدل های مورد علاقه AI AI بوده است. این همیشه می تواند متن خوانا ایجاد کند ، از نظر سبک انعطاف پذیرتر از سایر مدل ها است. وب سایت Ideogram شامل یک بوم طراحی شده به چاه و مجلل ساخته شده است.
نتیجه کامل نیست ، Barista خنده دار است ، اما نورپردازی واقع بینانه تر است ، مرحله با کامیون در پیاده رو به جای جاده واقع بینانه تر است. همچنین احساس مدرن تر می کند و متن هم خوانا و هم به خوبی طراحی شده است.
5. V3 را دوباره تقویت کنید

Remraft بیشتر یک مدل طراحی است ، مناسب برای متن و تصویر پردازش شده ، اما این بدان معنی نیست که نمی تواند تصویری جالب ایجاد کند. هنگامی که او به بازار برخورد کرد ، او با شکست دادن مدل های دیگر در صدر نقاشی های رهبری ، چیزی را تکان داد.
من بیش از حد تحت تأثیر خروجی قرار نگرفتم. بله ، به لطف منطقه ای که به صحنه داده شده است ، تا حدودی از نظر بصری برجسته ترین است. اما دود کجا بیش از حد است و Barista کجاست؟ همچنین برای یک مدل پیرامون متن – بدون نوشتن علامت.
مورد علاقه من: Flux Kontext Max

اگرچه Flux از نظر بصری تعدادی از مشکلات را داشت ، اما سازگار ترین و شامل نوشتن علائم خوانا بود. اگر من از آن به عنوان تصویر سهام استفاده می کردم ، با Google Imagen 4 Picture می رفتم ، اما این شار را از یک دیدگاه کاملاً بصری به دست می آورد.
آنچه با Flux Kondext می گیرید سازگاری آسان است. شما می توانید یک درخواست ثانویه برای تغییر رنگ کامیون یا تغییر پیرزن با یک تاجر ایجاد کنید. شما می توانید این کار را در جمینی انجام دهید ، اما نمی توانید این کار را با Imagen انجام دهید. شما باید از تولید تصویر محلی از Gemini 2+ استفاده کنید.
اگر می خواهید با استفاده از Kondext در هر تصویر تغییراتی ایجاد کنید ، روی تصویر در Nightcafe کلیک کنید ، حتی اگر واقعاً تصویر زمینه ای ندارد و “درخواست ویرایش” را انتخاب کنید. هزینه آن حدود 2.5 اعتبار است و فقط یک درخواست توصیفی ساده است.
آخرین افکار در مورد Nightcafe
من از گرانترین نسخه هر مدل برای این تست استفاده کردم. بیشترین زمان پردازش برای کار بر روی هر تصویر. این امکان مقایسه عادلانه ترین را فراهم کرد. آنچه من را شگفت زده می کند این است که چگونه هر مدل متفاوت درخواست توصیفی را تفسیر می کند. اما او تعجب نمی کند که چقدر بهتر هستند که از این جمله پیروی کنند.
با این وجود ، آنچه من در مورد Nightcafe دوست دارم ، تنها فروشگاه توقف برای محتوای هوش مصنوعی است. نه تنها مکانی برای استفاده از تمام مدل های تصویر و تصویری پیشرو ، بلکه شامل یک جامعه بزرگ با یک سری بازی ها ، رویدادها و گروه های متمرکز بر محتوا نیز هست. همچنین می توانید تصویری را که در برنامه ایجاد کرده اید ، ویرایش ، بهبود ، اصلاح ، افزایش و گسترش کنید.
بیشتر از راهنمای تام
بازگشت به لپ تاپ ها



