قبلا می گفتیم که یک عکس ارزش هزار کلمه را دارد، اما با تورم و افزایش هوش مصنوعی، این نرخ ارز احتمالا تغییر می کند.
GPT-4o ChatGPT یکی از بهترین مدل های بینایی هوش مصنوعی در بازار را ارائه می دهد. عکسی را که گرفته اید به او بدهید و سوالات خود را بپرسید. من با 5 چالش مختلف از شناسایی شی و خلاقیت گرفته تا یک بازی حدس بصری کوچک روبرو شدم.
آیا ChatGPT از این فرصت استفاده می کند یا تحت فشار کوتاه می آید؟ در آزمایشهای قبلی، ما شاهد بودیم که مدلهای مختلف هوش مصنوعی از تصاویر غذا دستور تهیه میکنند یا عکسهای خبرنگاران Tom’s Guide را شناسایی میکنند.
1. چگونه می توانم این را بپزم؟
آیا تا به حال خود را در حال خوردن یک وعده غذایی در رستورانی پیدا کرده اید که می خواستید آن را در خانه بازسازی کنید؟ از ChatGPT پرسیدم که آیا می تواند به این عکس غذای سریعی که در یک رستوران درست کردم نگاهی بیندازد.
من گیاهخوار نیستم، اما این استیک بادمجان، خمیر سویای تخمیر شده با طعم میسو، برایم جذابیت داشت. روی آن سس مایونز لیمویی ریخته شد و من کنار آن سیب زمینی سرخ کرده سفارش دادم. من به چت بات نگفتم مواد تشکیل دهنده چیست تا ببینم تا کجا پیش خواهد رفت.
وقتی ChatGPT شروع به کار کرد، احساس میکردم اطلاعات کافی برای کار به آن نمیدهم، اما اجازه نداشتم تمام مراحل احساس گناه را طی کنم.
ChatGPT وارد شد و به من گفت که دارم به بادمجانی با سس مایونز خامه ای و سس میسو روی آن مقداری دانه کنجد نگاه می کنم. او همچنین به من گفت که چگونه آن را در پنج مرحله بازسازی کنم. امتیاز کامل
2. قطار من را تزئین کنید
شاید ChatGPT خوش شانس بود و مخفیانه از علاقه مندان به آشپزی بود. او چگونه با چیز پیش پا افتاده تری مانند حمل و نقل عمومی کنار می آید؟
من به سرعت از یک صندلی در قطار عکس گرفتم و از ChatGPT خواستم تا با طراحی مجدد فضا برای مناسبتر شدن سفرهای کاری لوکس، کارایی را به حداکثر برساند.
ChatGPT پیشنهاد می کند صندلی تاشو را با چیزی ارگونومیک تر با پورت های شارژ در دسته ها جایگزین کنید. تقسیمکنندههای حریم خصوصی میتوانند محفظههای کاری جداگانه ایجاد کنند که هر کدام دارای نور قابل تنظیم هستند.
ChatGPT بلندپروازانه بود و یک کنترل پنل پیشنهاد کرد که امکان کنترل نور، دما و رسانه را برای دامنه فوری فراهم می کند.
در نهایت، او مقداری انبار برای یک کیسه کوچک و یک سینی جمع شونده برای نوشیدنی و تنقلات پیشنهاد کرد. از آنچه خواندم خوشم آمد و ماکتی از این طرح جدید با استفاده از رندر یکپارچه DALL-E ایجاد کردم.
3. لیست خواندن
من دائماً در زمان کوتاهی می بینم که با یک کتاب خوب سر و کله بزنم. آیا ChatGPT می تواند نگاهی گذرا به کتابخانه کتابخانه من بیندازد و لیست 5 کتاب برتر را که باید بخوانم به من بدهد؟ یک بخش تصادفی پیدا کردم و یک عکس سریع گرفتم که به ChatGPT نشان دادم.
اینجاست که همه چیز به درستی پیش رفت زیرا ChatGPT نتوانست عناوین کتاب را به درستی رمزگشایی کند. علاوه بر این، او به هیچ یک از کتابهایی که بهترین حدسهای خود را درباره آنها میداد زنگ نزد و در مورد اینکه فکر میکرد کتاب ممکن است در مورد چه چیزی باشد، پیشنهاداتی ارائه کرد.
ChatGPT کتاب ها را از روی جلد آنها قضاوت می کرد. این آزمایش تقریباً قبل از شروع به پایان رسیده بود.
4. آیا این یک پرنده است؟ این هواپیماست؟
آیا یک گام اشتباه ChatGPT را از مسیر خارج می کند یا ادامه خواهد داد؟
موزه ها به ویژه در برچسب گذاری اشیاء و ارائه برخی حقایق در مورد آنها خوب هستند. آیا ChatGPT می تواند یک شی دلخواه را شناسایی کند و همین کار را انجام دهد؟
آرشیوهایم را مرور کردم و II. من ویدیویی از موتور هواپیمای مورد استفاده در جنگ جهانی دوم پیدا کردم. من هر تگ آشکار را برش دادم و تصویر را با زمینه صفر به ChatGPT صادر کردم.
ChatGPT گفت: “به نظر می رسد تصویری که ارائه کردید شامل یک موتور شعاعی است، احتمالاً از یک هواپیما. موتورهای شعاعی نوعی موتور احتراق داخلی هستند که معمولا در هواپیماهای قدیمی، به ویژه در طول جنگ جهانی دوم و برخی از طراحی های پس از جنگ استفاده می شود.” تاثیرگذار!
اما ChatGPT با اطمینان خاطر به من گفت که اگر اطلاعات خاصی در مورد سازنده میخواهم باید به آنها اطلاع دهم، کمی از خود پیشی گرفت. از آنجایی که شما ارائه می دهید!
متأسفانه، حدس های ChatGPT این بود که این موتور متعلق به رایت هوانوردی یا پرت اند ویتنی است. پاسخ صحیح BMW بود که هزاران موتور از این BMW 801 تولید کرد.
5. اندازه مهم است
آیا ChatGPT می تواند بر آخرین چالش من غلبه کند؟ من یک بازی کوچک طراحی کردم که در آن از کسی خواستم اندازه یک کفش تصادفی را حدس بزند.
من یک کنترل از راه دور Google Chromecast و کفش را در دو طرف برد قرار دادم تا به ChatGPT اجازه دهد محاسبه کند که برای ایجاد طول نوار لغزنده به چه تعداد ریموت نیاز است. من می خواستم یک شاه ماهی قرمز اضافه کنم تا یک چالش اضافی اضافه کنم. از آنجایی که در یخچالم نداشتم، به جای آن از گوجه قرمز استفاده کردم.
ChatGPT بلافاصله گوجه فرنگی را پرتاب کرد و کنترل از راه دور و طول آن را شناسایی کرد. او سعی کرد اندازه کفش را با مقایسه طول پیکسل کفش و کنترل از راه دور تخمین بزند و تشخیص داد که کفش سایز 4-5 (EU 33-35) است. در واقع شماره 5-6 بود اما فکر می کنم به اندازه کافی نزدیک است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران