من Midjourney را با Flux آزمایش کردم تا ببینم کدام رندر هوش مصنوعی بهترین است – این برنده است
Flux که در هفتههای اخیر توسط استارتآپ Black Forest Labs منتشر شد، به یکی از قدرتمندترین و محبوبترین ابزار در نوع خود، حتی رقیب بازار Midjourney تبدیل شده است.
برخلاف Midjourney که یک سرویس بسته و پولی است که فقط از Midjourney قابل دسترسی است، Flux یک مدل منبع باز است که میتواند به صورت محلی یا بر روی پلتفرمهای مختلف مانند Freepik، NightCafe و Hugging Face دانلود و اجرا شود.
برای تعیین اینکه آیا Flux به سطوح فوتورئالیسم Midjourney و تصویرسازی دقیق انسانی رسیده است یا خیر، من 5 درخواست توضیحی ایجاد کردم و آنها را از طریق هر دو اجرا کردم. من تصاویر Flux را با استفاده از ComfyUI نصب شده از طریق نصب کننده Pinokio AI ایجاد می کنم.
درخواست ایجاد کنید
هم Midjourney و هم Flux از یک اعلان توصیفی استفاده می کنند. برای به دست آوردن دقیقا همان چیزی که از مدل می خواهید، خوب است نه تنها شخص، بلکه سبک، نور و ساختار را نیز توصیف کنید.
من هر دستور را در زیر قرار دادهام تا بتوانید آنها را خودتان امتحان کنید، و اگر Midjourney یا Flux ندارید، Ideogram باید با DALL-E 3 روی ChatGPT یا سایر پلتفرمهای نمایش هوش مصنوعی نیز کار کند، اما به غیر از Ideogram، هیچ کدام از آنها به رئالیسم Midjourney یا Flux می رسند.
1. آشپز در آشپزخانه
اولین آزمایش نیاز به ایجاد بافت پیچیده پوست را با محیطی پویا ترکیب می کند: یک آشپزخانه حرفه ای. درخواست از یک زن در اواسط 50 سالگی می خواهد که یک وعده غذایی آماده کند.
همچنین درخواست می شود که آشپزهای سوسی در پس زمینه به تصویر کشیده شوند و نام سرآشپز بر روی یک “کت سرآشپز دو لنگه سفید بدون لک” نمایش داده شود.
A seasoned chef in her mid-50s is captured in action in a bustling professional kitchen. Her salt-and-pepper hair is neatly tucked under a crisp white chef's hat, with a few strands escaping around her temples. Her face, marked with laugh lines, shows intense concentration as she tastes a sauce from a wooden spoon. Her eyes, a warm brown, narrow slightly as she considers the flavor. The chef is wearing a spotless white double-breasted chef's jacket with her name embroidered in blue on the breast pocket. Black and white checkered pants and slip-resistant clogs complete her professional attire. A colorful array of sauce stains on her apron tells the story of a busy service. Behind her, the kitchen is a hive of activity. Stainless steel surfaces gleam under bright overhead lights, reflecting the controlled chaos of dinner service. Sous chefs in white jackets move purposefully between stations, and steam rises from pots on industrial stoves. Plates of artfully arranged dishes wait on the pass, ready for service. In the foreground, a marble countertop is visible, strewn with fresh herbs and exotic spices. A stack of well-worn cookbooks sits nearby, hinting at the chef's dedication to her craft and continuous learning. The overall scene captures the intensity, precision, and passion of high-end culinary artistry.
برنده شدن: در میانه راه
Midjourney برای رئالیسم شخصیت اصلی برنده می شود. این کامل نیست و من پویایی تصویر Flux را ترجیح میدهم، اما چالش ایجاد افراد مناسب است و Midjourney با بافت پوست بهتر نزدیکتر است.
2. نوازنده خیابانی
دستور بعدی از هر دو رندر کننده هوش مصنوعی میخواهد که یک نوازنده خیابانی را در اواخر دهه 30 زندگیاش نشان دهند که در گوشه شلوغ شهر اجرا میکند و در ریتم موسیقی گم شده است.
بخشی از این درخواست شامل یک رهگذر قدردان، سکه در جعبه گیتار و زندگی شهری است که در حرکت پشت شخصیت اصلی تار می شود.
A street musician in his late 30s is frozen in a moment of passionate performance on a busy city corner. His long, dark dreadlocks are caught mid-sway, some falling over his face while others dance in the air around him. His eyes are closed in deep concentration, brows slightly furrowed, as his weathered hands move deftly over the strings of an old, well-loved acoustic guitar. The musician is wearing a vibrant, hand-knitted sweater that's a patchwork of blues, greens, and purples. It hangs loosely over distressed jeans with artistic patches on the knees. On his feet are scuffed brown leather boots, tapping in rhythm with his music. Multiple colorful braided bracelets adorn his wrists, adding to his bohemian appearance. He stands on a gritty sidewalk, with a battered guitar case open at his feet. It's scattered with coins and bills from appreciative passersby, along with a few fallen autumn leaves. Behind him, city life unfolds in a blur of motion: pedestrians hurry past, yellow taxis honk in the congested street, and neon signs begin to flicker to life as dusk settles over the urban landscape. In the foreground, slightly out of focus, a child tugs on her mother's hand, trying to stop and listen to the music. The scene captures the raw energy and emotion of street performance against the backdrop of a bustling, indifferent city.
برنده شدن: در میانه راه
Midjourney دوباره از نظر رئالیسم شخصیت برنده می شود. کیفیت بافت نسخه 6.1 آن را بار دیگر متمایز می کند. همچنین به طور کلی از نظر ساختار، طرح و پسزمینه تصویر بهتری است.
3. باغبان
به دلیل بافت پوست پیچیده تر، ایجاد تصاویر افراد مسن همیشه می تواند برای سازندگان تصویر هوش مصنوعی چالش برانگیز باشد. در اینجا ما می خواهیم یک زن 80 ساله از گیاهان در روف گاردن مراقبت کند.
نقاشی عناصری از صحنه را به تصویر می کشد. نور عصر طلایی با انگورهای کوهنوردی و خط افق شهر که از پشت باغبان ما بالا می رود.
An elderly woman in her early 80s is tenderly caring for plants in her rooftop garden, set against a backdrop of a crowded city. Her silver hair is tied back in a loose bun, with wispy strands escaping to frame her kind, deeply wrinkled face. Her blue eyes twinkle with contentment as she smiles at a ripe tomato cradled gently in her soil-stained gardening gloves. She's wearing a floral print dress in soft pastels, protected by a well-worn, earth-toned apron. Comfortable slip-on shoes and a wide-brimmed straw hat complete her gardening outfit. A pair of reading glasses hangs from a beaded chain around her neck, ready for when she needs to consult her gardening journal. The rooftop around her is transformed into a green oasis. Raised beds burst with a variety of vegetables and flowers, creating a colorful patchwork. Trellises covered in climbing vines stand tall, and terracotta pots filled with herbs line the edges. A small greenhouse is visible in one corner, its glass panels reflecting the golden evening light. In the background, the city skyline looms large - a forest of concrete and glass that stands in stark contrast to this vibrant garden. The setting sun casts a warm glow over the scene, highlighting the lush plants and the serenity on the woman's face as she finds peace in her urban Eden.
برنده شدن: در میانه راه
Midjourney بار دیگر به دلیل کیفیت بافت برنده می شود. با انگشتان دستکش کمی سخت بود اما بهتر از فلاکس بود. این بدان معنا نیست که Flux ظاهر خوبی ندارد، اما به خوبی Midjourney نیست.
4. امدادگر در مواقع اضطراری
برای این اعلان، چیز سنگینتری را انتخاب کردم، تمرکز بر یک امدادگر که تلاش میکند در یک روز بارانی آمبولانس بگیرد. این شامل شرحی از قطرات آب و نوارهای بازتابنده چسبیده به مژه ها بود.
این یک کار چالش برانگیز برای رندرهای هوش مصنوعی بود زیرا باید محیط تاریک تر را به تصویر می کشید. نور ساعت طلایی برای هوش مصنوعی آسان تر از شب و گرگ و میش است.
A young paramedic in her mid-20s is captured in a moment of urgent action as she rushes out of an ambulance on a rainy night. Her short blonde hair is plastered to her forehead by the rain, and droplets cling to her eyelashes. Her blue eyes are sharp and focused, reflecting the flashing lights of the emergency vehicles. Her expression is one of determination and controlled urgency. She's wearing a dark blue uniform with reflective strips that catch the light, the jacket partially unzipped to reveal a light blue shirt underneath. A stethoscope hangs around her neck, bouncing slightly as she moves. Heavy-duty black boots splash through puddles, and a waterproof watch is visible on her wrist, its face illuminated for easy reading in the darkness. In her arms, she carries a large red medical bag, gripping it tightly as she navigates the wet pavement. Behind her, the ambulance looms large, its red and blue lights casting an eerie glow over the rain-slicked street. Her partner can be seen in the background, wheeling out a gurney from the back of the vehicle. In the foreground, blurred by the rain and motion, concerned onlookers gather under umbrellas near what appears to be a car accident scene just out of frame. The wet street reflects the emergency lights, creating a dramatic kaleidoscope of color against the dark night. The entire scene pulses with tension and the critical nature of the unfolding emergency.
برنده شدن: برای کشیدن
من فکر نمی کنم هیچ یک از رندرهای هوش مصنوعی در این دور پیروز شوند. هر دو دارای بافتهای رنگ پریده و «پلاستیکی» هستند که احتمالاً ناشی از مشکلات نور است. Midjourney در تطبیق توضیحات صحنه کمی بهتر کار می کند.
5. فضانورد بازنشسته
بالاخره یک صحنه در یک مدرسه داریم. در اینجا از مدلهای هوش مصنوعی خواستم که فضانوردی بازنشسته را در اواخر دهه 60 زندگیاش ارائه کنند و در مورد فضا ارائه کنند.
این لوگوی ناسا در سلامت کامل به خوبی ارائه شده است. پس زمینه به خوبی با پوسترها، نقل قول ها و افرادی که در حال صحبت کردن او هستند، مشخص شده است.
A retired astronaut in his late 60s is giving an animated presentation at a science museum. His silver hair is neatly trimmed, and despite his age, he stands tall and straight, a testament to years of rigorous physical training. His blue eyes sparkle with enthusiasm as he gestures towards a large scale model of the solar system suspended from the ceiling. He's dressed in a navy blue blazer with a small, subtle NASA pin on the lapel. Underneath, he wears a light blue button-up shirt and khaki slacks. On his left wrist is a watch that looks suspiciously like the ones worn on space missions. His hands, though showing signs of age, move with the precision and control of someone used to operating in zero gravity. Around him, a diverse group of students listen with rapt attention. Some furiously scribble notes, while others have their hands half-raised, eager to ask questions. The audience is a mix of ages and backgrounds, all united by their fascination with space exploration. The walls of the presentation space are adorned with large, high-resolution photographs of galaxies, nebulae, and planets. Inspirational quotes about exploration and discovery are interspersed between the images. In one corner, a genuine space suit stands in a glass case, adding authenticity to the presenter's words. Sunlight streams through large windows, illuminating particles of dust floating in the air, reminiscent of stars in the night sky. The entire scene is bathed in a sense of wonder and possibility, as the retired astronaut bridges the gap between Earth and the cosmos for his eager audience.
برنده: شار
من این را به Flux می دهم. این برنده شد زیرا بافت پوست و واقع گرایی انسانی داشت که همتراز با Midjourney یا کمی بهتر بود، اما ساختار کلی تصویر بسیار بهتری داشت، از جمله افراد پس زمینه واقعی تر.
Flux vs Midjourney: کدام مدل برنده است؟
سلول سرصفحه – ستون 0 | در میانه راه | جریان |
---|---|---|
یک آشپز در آشپزخانه | 🌅 | ردیف 0 – سلول 2 |
یک نوازنده خیابانی | 🌅 | ردیف 1 – سلول 2 |
باغبان | 🌅 | ردیف 2 – سلول 2 |
امدادگر در مواقع اضطراری | 🌅 | 🌅 |
فضانورد بازنشسته | ردیف 4 – سلول 1 | 🌅 |
این تقریباً یک پیروزی کامل برای Midjourney بود و عمدتاً به دلیل بهبودهایی بود که Midjourney در بافت پوست با نسخه 6.1 ایجاد کرده بود.
من فکر نمیکنم آنقدر که روی کاغذ به نظر میرسید واضح بود، زیرا در بسیاری از تصاویر Flux ساختار کلی تصویر بهتری داشت و در پسزمینه بهتر بود. همچنین متوجه شدم که Flux نسبت به Midjourney در ارائه متن سازگارتر است – اما این آزمایش در مورد افراد و ایجاد انسان های دیجیتال واقع گرایانه بود.
چیزی که نشان می دهد این است که حتی در لبه برش تولید تصویر هوش مصنوعی، سرنخ هایی در هر تصویر وجود دارد که آن را به عنوان تولید شده توسط هوش مصنوعی به بازار عرضه می کند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide