آیا Google Gemini می تواند عکس های من را بهتر از من ویرایش کند؟ تستش کردم تا بفهمم

اخیراً، من مهارتهای ویرایش عکس خود را با تغییر دادن تمام عکسهای فوری که هنگام تست رانندگی با بهترین خودروهای الکتریکی در اطراف گرفتهام، تکمیل کردهام. معمولاً 8 تا 15 دقیقه طول می کشد تا یک ویرایش را کامل کنم. برای یک عکس این مقدار زمان قابل قبولی است، اما زمانی که یک گروه 40 عکسی باشد، چندان پایدار نیست.
بنابراین میخواهم ببینم هوش مصنوعی چگونه عمل میکند و آیا میتواند روند را تسریع بخشد و به من اجازه دهد روی کارهای دیگر از روز کاری خود تمرکز کنم. من قبلاً برای حذف اشیاء ناخواسته به هوش مصنوعی متکی بودم، اما این بار میخواهم ببینم چگونه میتواند ظاهر کلی عکسهایی را که میگیرم بهبود بخشد.
ادامه مقاله در زیر
هوش مصنوعی و انسان: آنچه باید بدانید
در حین انجام این تست متوجه شدم که ویرایش عکس با هوش مصنوعی می تواند به خودی خود تبدیل به یک هنر شود. این مستلزم ارسال چند هشدار قبل از اینکه ظاهر دقیق مورد نظرم را بدست بیاورم. بنابراین من تصویر اصلی و بدون تغییر هر وسیله نقلیه ای را که گرفته ام و سپس نسخه های ویرایش شده توسط Google Gemini را به شما نشان می دهم.
اگر به برخی از عکس هایی که من در اینستاگرام ویرایش کرده ام نگاهی بیندازید، دقیقاً همان ظاهری را خواهید دید که من دنبال آن بودم. برای این تست، از Google Gemini میخواهم که عکس من را با دستور زیر ویرایش کند تا بتوانید محدوده عملکرد را ببینید. من به ویژه نسبت به کارهایی که Gemini میتواند برای تطبیق با فرآیند دستی من انجام دهد، انتقاد میکنم.
- ادعای 1: این عکس را طوری ویرایش کنید که ماشین به درستی در معرض دید قرار گیرد، اما بقیه چیزها تاریک و کمی تار شوند.
البته، ویرایشهای عکس اضافی را نیز به شما نشان خواهم داد که با گرفتن تصویر اصلی با Google Gemini و ویرایش آن با دو فرمان زیر انجام شده است. من می خواهم نشان دهم که هوش مصنوعی چقدر می تواند در انجام سریع این اقدامات موثر باشد.
- ادعای 2: این عکس را طوری ویرایش کنید که ماشین در پس زمینه قابل مشاهده باشد.
- ادعای 3: آن را مانند یک صحنه روشن در روز با رنگ طبیعی غنی و نوردهی متعادل جلوه دهید.
شورولت کوروت
جالب اینجاست که گوگل جمینی برای برجسته کردن خودرو، یک وینیت در اطراف کوروت اعمال کرد، اما کاملاً درخواست من را برآورده نکرد. همچنین کامیون پارک شده در سمت راست را قرمز کرد. اما در بیشتر موارد، فکر میکنم Gemini کار ویرایش را به خوبی انجام داده است، حتی اگر هوش مصنوعی تصمیم بگیرد تغییرات ناخواستهای در صحنه ایجاد کند.
در درخواست دوم، Google Gemini درخواست من را متوجه نشد. با کنجکاوی شورولت کوروت را به پورشه 911 تارگا تبدیل کرد. Prompt 3 بسیار بهتر عمل کرد و کل عکس را تنظیم کرد تا با وجود تغییر ظاهری چهره راننده، بسیار دلپذیرتر و متعادلتر به نظر برسد.
هیوندای سانتا کروز
گوگل جمینی نه تنها از یک افکت وینیت استفاده کرد که گوشه های هیوندای سانتا کروز را تیره کرد، بلکه زاویه را نیز تغییر داد تا فردی روی صندلی راننده قرار گیرد. در حالی که هنوز جالب به نظر می رسد، کاش اشباع بیشتری به رنگ خودرو اضافه می کرد، زیرا رنگ در حال حاضر کمی بیش از حد با آسمان آبی رقابت می کند.
عکس اصلی سانتا کروز آنقدر کنتراست پایینی داشت که کاملا کسل کننده و بی رنگ به نظر می رسید، اما Google Gemini آن را با Prompt 2 با افزودن کنتراست به صحنه بسیار زیباتر کرد تا جزئیات پیکاپ بهتر برجسته شوند.
با این حال، با ادعای 3، او همان تصویر تولید شده با ادعای 1 را دریافت کرد. مانند تغییر زاویه شلیک و راننده در داخل وسیله نقلیه. هنوز هم باورنکردنی به نظر می رسد، اما اینها درخواست های خاصی نبودند که من می خواستم.
ولوو EX30
برخلاف دو نمونه قبلی، گوگل جمینی با ولوو EX30 به این مهم دست یافت. جلوه وینیت حذف شده است، در عوض نوردهی را در همه جا به جز SUV در مرکز کاهش می دهد. این در واقع به خوبی در برابر ویرایش دستی خودم مقاومت می کند، و این نتیجه ای است که من واقعاً از آن استفاده خواهم کرد.
بسیار شبیه سانتا کروز، عکس ویرایش نشده ای که من از EX30 گرفتم کمی کسل کننده به نظر می رسد، در درجه اول به دلیل کنتراست کم و رنگ های شسته شده. به طور چشمگیری، Google Gemini با صیقل دادن و اشباع کردن خودرو با Prompt 2 واقعاً خیره می شود.
من همچنین دوست داشتم که Prompt 3 روز بارانی عکسبرداری واقعی را به یک روز کاملا آفتابی تبدیل کند. با این حال، اشباع زیاد اعمال شده در کل صحنه باعث می شود عکس برای سلیقه من کمی بیش از حد کامپیوتری به نظر برسد.
Lexus RX 450h+
عجیب است که جمینی در این عکس ویرایش شده از Lexus RX 450h+ به وینیتینگ بازگشته است. دیدن این که جمینی با کنتراست تهاجمی تر است و در عین حال شیشه جلو را در مقایسه با ویرایش دستی من شفاف تر می کند، جالب است. مانند EX30، چیدمان Gemini با زیبایی شناسی من مطابقت دارد و نتیجه ای است که در استفاده از آن تردیدی ندارم.
صادقانه می گویم: ویرایش عکس Lexus RX 450h+ برای من سخت ترین عکس بود، زیرا کاپوت و سقف مشکی بیش از حد نوردهی شده بودند و روز ابری تنها تصویر اصلی را صاف نشان می داد. اگرچه Google Gemini در پاکسازی این موضوع با Prompt 2 کار بسیار خوبی انجام داده است. من واقعاً از رنگ و کنتراست اضافه شده و همچنین وضوحی که روی ماشین ایجاد می کند دوست دارم.
ادعای 3 با تبدیل آن به یک محیط آفتابی و در روز به همان اندازه چشمگیر بود. خطوط در سرتاسر عنوان متمایزتر شده اند زیرا هوش مصنوعی به طور موثر سایه های آن ناحیه را عمیق تر می کند.
مرسدس بنز CLA 250+
من آخرین تنظیم را در Prompt 1 انجام دادم و از Gemini خواستم که یک آفتاب سوختگی به جلوپنجره اضافه کند تا حس دراماتیک تری به مرسدس بنز CLA 250+ بدهد. خیلی خوب کار کرد – به طور موثری پسزمینه را همانطور که در نظر داشتیم تیره میکرد – و در مقایسه با ویرایش دستی من، جای خودش را دارد.
در حالی که نسخه اصلی به خودی خود خوب به نظر می رسید، Google Gemini آن را به خوبی با Prompt 2 تمیز کرد و به کاپوت خودرو اجازه داد بیشترین توجه را به خود جلب کند.
Prompt 3 با افزودن ابرها به صحنه روز، با انعکاسهایی در اطراف جلوپنجره و چراغهای جلو که این تحول را به طرز شگفتآوری باورپذیر نشان میدهد، تصویر را حتی بیشتر ارتقا داد.
در نتیجه

من قبلاً برای ویرایش عکسهایم به هوش مصنوعی اعتماد نکرده بودم زیرا کاملاً محدود بود. من بیشتر از آن برای حذف موضوعات ناخواسته استفاده می کردم. اما زمان تغییر کرده است و Google Gemini ثابت کرده است که یک ویرایشگر عکس قابل اعتماد است که می تواند وظایف پیچیده نورپردازی و نوردهی را در کوتاه ترین زمان انجام دهد.
در حالی که Gemini میتواند گهگاه با تغییر مدل خودرو یا فاش کردن رانندگان مرموز، علامت خود را از دست بدهد، توانایی آن برای تبدیل یک تصویر صاف و کم کنتراست به تصویری که بهصورت حرفهای ویرایش شده به نظر میرسد، غیرقابل انکار است. این یک صرفه جویی در زمان بسیار زیادی است، اما جریان کار همچنان از من می خواهد که به جای پردازش دسته ای، هر عکس را به صورت دستی آپلود کنم.
آیا ویرایش عکس های خودم را متوقف خواهم کرد؟ نه به طور کامل. هنوز سطحی از دقت و کنترل وجود دارد که ترجیح می دهم آن را حفظ کنم. اما برای یک چرخش سریع، جمینی مطمئناً ثابت کرده است که می تواند ادامه دهد.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود. مشترک شدن در راهنمای تام یوتیوب و ما را دنبال کنید tiktok.




























