من Chatgpt vs Midjourney V7 را برای 7 درخواست تصویر AI آزمایش کردم – نزدیک نبود

هر دو Midjourney و Chatgpt اخیراً نسخه های جدیدی از ژنراتورهای تصویر هوش مصنوعی را منتشر کردند. از نظر تاریخی ، اینها دو بهترین گزینه بودند که منطقه را هدایت می کنند.
با این حال ، وقتی مخالف یکدیگر است ، بهترین ها کدام است؟ Midjourney V7 یا Chatgpt 4O تولید تصویر؟
برای دیدن اینکه این بهترین تولید کننده تصویر هوش مصنوعی است ، من با استفاده از هفت درخواست مختلف ، Chatgpt vs Midjourney را در آزمون قرار دادم. آنها همه چیز را از توانایی مدل برای درک زمینه ، بازآفرینی اشکال پیچیده و ساختن تصاویر آزمایش می کنند.
chatgpt vs midjourney v7: قوانین
اگرچه هر دو مدل تصاویر را ایجاد می کنند ، به دلیل میزان تنظیماتی که مکان میانی به شما امکان تغییر می دهد ، می توان یک مسابقه عادلانه را دشوار کرد. با توجه به این موضوع ، این مراحلی بود که من ابتدا برداشتم.
من از نسخه هفتم برای Midjourney استفاده کردم. این آخرین نسخه است اما هنوز در یک مرحله آزمایشی است. من همچنین درخواست شما را هم به عنوان شخصی سازی و هم به صورت بسته امتحان کردم (تنظیماتی که سبک های هنری مورد نظر شما را به تصاویر اضافه می کند).
Midjourney چهار نسخه از هر تصویر را در مقایسه با تلاش تک Chatgpt تولید می کند. در هر صورت ، من بهترین تصویر را از Midjourney انتخاب کردم و آن را بلند کردم (از نسخه با کیفیت بهتر خواسته شد).
1.
سریع: تصویر یک پف را که روی صورت صخره ای با آب زیر پرواز می کند ، ایجاد کنید. در پس زمینه یک دامنه کوه وجود دارد. دو نفری که زیر یک روز آفتابی و زیر پف به دوربین شکاری نگاه می کنند
گودال
این تقریباً توسط تمام علائم مورد اصابت قرار گرفته است. اگرچه این تصویر به طور بالقوه بیش از اشباع شده است ، اما یک نوری است. یک پف در حال پرواز روی صورت یک صخره وجود دارد ، آب زیر آن وجود دارد و در پس زمینه یک دامنه کوه وجود دارد.
علاوه بر این نکات ، شامل دو نفر نیز مشرف به دوربین شکاری بود. البته ، آنها به پف ها نگاه نمی کنند ، اما در غیر این صورت ، این بسیار خوب است.
میانگین
در اینجا اتفاقات زیادی رخ می دهد. من با همه چیزهایی که گنجانده شده موافقم. کوههای موجود در پس زمینه ، دو نفر با پف ، دوربین شکاری و حتی آب و کوه در پس زمینه.
با این حال ، بیایید به فیل موجود در اتاق (یا در این حالت پف) بپردازیم. پفین غول پیکر است و در صورت لزوم می تواند گودزیلا را بگیرد. تصویر واقعاً یک نورپردازی نیست ، اما به نظر می رسد کمی بیشتر از رنگ روغن است.
حتی گذشته از مشکلات اندازه گیری پفین ، فکر می کنم چتپت نکات را با دقت بیشتری درک می کند. هر دو مدل آب را زیر چهره صخره ای ایجاد کردند ، اما چتپپ میل را با دقت بیشتری درک کرد.
برنده: chatgpt آن را از هر نظر کسب می کند. اگرچه من دوست دارم موجودات افسانه ای غول پیکر Puffins باشم ، اما Midjourney در اینجا متن زیادی را اشتباه فهمیده است. chatgpt خلاصه را میخکوب کرد.
2
سریع: یک بازار بزرگ با توقف که میوه ، لباس فروش و سرامیک فروش را به فروش می رساند. یک رودخانه در پس زمینه و یک جنگل طولانی وجود دارد. یک مرد در مقابل یکی از غرفه ها پول می دهد و دو کودک ناپدید می شوند. در آسمان بالون هوای گرم وجود دارد
گودال
در این درخواست اتفاقات زیادی رخ می داد و می توان برخی از مدل های هوش مصنوعی را نادیده گرفت. با این حال ، تمام جزئیات مهم در اینجا وجود دارد. بادکنک هوای گرم ، دو کودک که در وسط مردی که پول می دهد عبور می کنند. همچنین یک روز گرم است و می توانید بازار فروش میوه ، سرامیک و لباس را ببینید.
با وجود تمام جزئیات لازم ، ChatGPT تصویری با کیفیت و بسیار دقیق تولید کرده است.
میانگین
Midjourney ضمن انجام همان تصویر ، جزئیات کوچکتر بود. هنگام بزرگنمایی ، چهره ها تکمیل نمی شوند ، دست دو نفر به هم تبدیل می شوند و بیشتر زمینه ها کدورت است.
برنده: chatgpt او این را می گیرد. هر دو در یک نگاه به درستی ظاهر می شوند و اغلب تمام ویژگی های مورد نظر را به دست می آورند ، در حالی که Midjourney فقط بیشتر جزئیات نازک تر را از دست نمی دهد.
3. تصاویر واقعی را تطبیق دهید
سریع: این تصویر را به یک پرتره رنسانس تبدیل کنید
گودال
با این درخواست ، Chatgpt عکس من را به سبک های مونا لیزا تبدیل کرد. باز هم ، من واقعاً نمی توانم کار مدل را در اینجا سرزنش کنم. او عکس کاملی را که من در سبک های دوره رنسانس تهیه کردم قرار داد.
همچنین برای حفظ تمام ویژگی هایی مانند هدفون ، پیش زمینه و لباس هایی که می پوشم ، کار خوبی انجام می دهد.
میانگین
بله ، این بهترین چهار تلاش Midjourney بود. من می بینم که مدل در تلاش است به اینجا برود. او فقط نمی توانست.
من حتی سعی کردم کمی درخواست را تغییر دهم تا روشن شود که من به سبک نقاشی می خواهم و این چیزها را بدتر کردم. من فرض می کنم که مرز قهوه ای نیز باید موضوع را دنبال کند؟ توضیح آن دشوار است.
برنده: chatgpt وقتی صحبت از پیچیدگی خلاق در تصاویر خود می شود ، ثابت کرده است که مدل جدید توسعه یافته است ، که شواهد بیشتری است. او دقیقاً همان کاری را که من می خواستم انجام داد. Midjourney در نیمه راه رفت و تسلیم شد.
4. پوسترهای فیلم
سریع: یک پوستر هیجان انگیز برای این فیلم ایجاد کنید: یک فیلم Siberpunk در مجموعه در سال 2250. در یک شهر بزرگ واقع شده است. این فیلم در مورد یک کارآگاه به موقع برای جلوگیری از تحقق یک جنگ آینده است
گودال
این هیجان انگیز ترین پوستر تاکنون نیست ، اما چتپپ به شدت خلاصه را در اینجا میخکوب کرد. کارآگاه ما مرکز را با حرکت (و یک شهر بسیار آینده نگر) در پس زمینه می گیرد. با افزودن داده های درخواست شده با یک شعار ، به معنای واقعی کلمه به درخواست متن نیاز داشت.
به طور کلی ، چشمگیر. کارآگاه با سایه نور نئون در پشت خود به تفصیل است ، یک ماشین در حال پرواز در آسمان است و کمی تقریباً کشیده شده ، تعداد زیادی از آسمان خراش های آینده نگر است.
میانگین
Midjourney با سبکی که در اینجا با جزئیات از دست رفته است جبران می شود. احتمالاً آسمان خراش ها در اینجا بهتر به نظر می رسند ، و در این تصویر چیزهای بیشتری برای دیدن وجود دارد.
متأسفانه ، Midjourney با جزئیات مبهم پشت سر گذاشته است. تصاویر روی کف تبدیل شده ، اتومبیل و موتور سیکلت آشفتگی بودند و جزئیات بسیار عجیبی در پس زمینه وجود دارد.
اگرچه جالب تر است ، در اینجا خیلی اشتباه است.
برنده: chatgpt من هر کاری را که می خواستم انجام دادم و پوستری درست کردم که بتوانم در جهان قرار دهم و هیچ کس به پلک نمی خورد (به جز یک عنوان فیلم فوق العاده کسل کننده).
از طرف دیگر ، در اینجا خیلی اشتباه است. با این حال ، من این کار را مانند مسیری که وارد می شود انجام می دهم.
5. تولید متن
سریع: یک نمای پوستر ایجاد کنید ، پوستر می گوید: “گروه ژنراتور تصویر AI – بازی امشب ساعت 20 در اینجا!
گودال
Chatgpt با تولید تصویر موضوعاتی دارد. جزئیات معمولاً سبک ها را در سایه می گذارد. این پوستر هر کاری را که می خواستم انجام داد و از همه مهمتر ، کل متن را به درستی ساخت.
Chatgpt فقط چند ماه پیش با آن می جنگد ، بنابراین دیدن این که چقدر پیشرفت کرده است هیجان انگیز است.
اگرچه پوستر کسل کننده بود ، اما او خلاصه را شلیک کرد و برای مدل های هوش مصنوعی به یک چالش دشوار رسید.
میانگین
من قدردانی می کنم که Midjourney آن را به یک پوستر بیشتر در یک مکان تبدیل کرده و آن را روی دیوار بیرون قرار داده است. من همچنین عاشق انرژی در گروه میانه با تصویر هستم.
با این حال ، یک قسمت از متن به جز کلمات “باند” قابل خواندن نیست. در مقایسه با توانایی ChatGPT برای خرید کامل کل متن ، به نظر می رسد کمی ناامید کننده است.
برنده: chatgpt او ممکن است در اینجا فوق العاده جالب نباشد ، اما او این کار را کاملاً انجام داد. همانطور که Midjourney نشان می دهد ، مقابله با مدل های AI همیشه آسان نیست که با متن در تصاویر کنار بیایند.
6
سریع: تصویر دست یک شخص را بسازید ، شخص چپ یک نارنجی نگه داشته و دیگری یک لیوان آب دارد
گودال
اوه ، چقدر AI آمد. هنگامی که تولید تصویر AI برای اولین بار ظاهر شد ، یکی از ساده ترین راه های تعریف آن دست بود. انگشتان یا انگشتان فوق العاده طولانی از مکانهای اشتباه چسبیده است.
اکنون ، اگرچه دست های اینجا کاملاً انسانی نیستند ، اما دقت بسیار چشمگیر است. هر دو دست دارای تعداد انگشتان مناسب هستند (شروع خوب) ، آب موجود در شیشه به درستی تصویر دست عقب را جایگزین می کند و می توانید کشتی ها و ناخن ها را مشاهده کنید.
میانگین
Midjourney در اینجا کار بزرگی انجام داد. جزئیاتی که فکر می کنم در مورد این تصویر بسیار چشمگیر است. بازوها ، کشتی ها ، کبودی در مفاصل و ترک در دست آنها.
اگرچه تصویر chatgpt را می توان فوراً به عنوان هوش مصنوعی تشخیص داد ، اما می تواند برای دست کسی عبور کند. تنها مشکلی که برجسته است این است که انگشت پشت شیشه کاملاً درست به نظر نمی رسد. همچنین یک روش بسیار عجیب برای نگه داشتن یک نارنجی است ، اما هر یک به تنهایی.
برنده: Midjourney یکی از بهترین نقص های شناخته شده هوش مصنوعی ، پیروزی را به سرقت برد. این نشان می دهد که چه مدت است. این بدان معنا نیست که چتپپ بد بود ، دقیقاً مطابقت نداشت.
7 غذا
سریع: تصویری از یک کاسه ماکارونی غذاهای دریایی برای استفاده در اینستاگرام درست کنید.
گودال
این یک تصویر غذایی است که من در یک کتاب آشپزی خواهم دید و برای یک ثانیه سوال نمی کنم. حتی اگر این نباشد ، من می خواهم آن را بخورم. در اینجا من واقعاً نمی توانم یک مدل هوش مصنوعی بسازم. حتی اگر شپش های گیاهی تصادفی در زیر بسیار خوب بود ، او همه چیز مورد نظر را انجام داد.
میانگین
مانند Chatgpt ، Midjourney در اینجا کار کاملی انجام داد. به نظر می رسد این یک کاسه واقعی ماکارونی در یک رستوران زیبا است. برخی از گوجه فرنگی های تصادفی و حتی سیر پراکنده در اطراف آن وجود دارد ، من برای دکوراسیون فرض می کنم.
برنده: chatgpt به لطف کیفیت بهتر تصویر ، در اینجا پیروز می شود ، اما مانند دست ها نزدیک بود.
تصمیم: chatgpt برنده می شود
متأسفانه ، برای Midjourney ، این حتی نزدیک نبود. البته این مهم است که بیان کنیم که Midjourney به تازگی این نسخه را منتشر کرده است و هنوز در مرحله آزمایشی است. با این حال ، این آخرین نسخه از تولید تصویر GPT فقط یک یا دو هفته بزرگتر است.
در حالی که این مدل هر از گاهی است ، چتپ اغلب در جایی که Midjourney نبود ، کامل می شد.
امیدوارم Midjourney در مراحل آزمایش نسخه 7 پیشرفت هایی را مشاهده کند ، زیرا می تواند چنین تولید کننده تصویر بزرگ هوش مصنوعی باشد.