Midjourney Holodeck را می سازد – مدل جدید هوش مصنوعی به شما امکان می دهد تصاویر سه بعدی را وارد کنید

پروین میرمیران13 سپتامبر 2024آخرین به روز رسانی: 13 سپتامبر 2024

0 2,658 خواندن این مطلب 2 دقیقه زمان میبرد

Midjourney، خالق برجسته تصویر هوش مصنوعی در حال کار بر روی ویژگی جدیدی است که نحوه تعامل ما با تصاویر ایجاد شده را کاملاً تغییر می دهد. با استفاده از اشکال جدید فناوری سه بعدی، قادر خواهید بود به طور موثری در داخل تصویر قدم بگذارید.

این ویژگی که در ساعات اداری اخیر Midjourney در Discord اعلام شد، تنها یکی از ویژگی‌های جدید در دست ساخت است که می‌تواند تا پایان سال جاری منتشر شود. دیوید هولز، مدیرعامل Midjourney نیز گفت که ما نسخه 7 را تا پایان سال، یک مدل ویدیویی و یک ویرایشگر تصویر ارتقا یافته خواهیم دید که به شما امکان می دهد برای اولین بار تصاویر خارجی را ویرایش کنید.

این استارت آپ مدتی است که روی فناوری سه بعدی کار می کند تا بخشی از چشم انداز خود برای ایجاد دنیایی شبیه به Star Trek Holodeck و استفاده از آن جهان برای ساخت فیلم، بازی یا صرفا برای گذران زمان باشد.

مدل سه بعدی Midjourney چگونه کار خواهد کرد؟

(منبع تصویر: Midjourney/تصویر هوش مصنوعی آینده)

به گفته مارتین نبلونگ، کارشناس هوش مصنوعی، مدل سه بعدی Midjourney یک رویکرد کاملاً جدید خواهد بود که بر اساس فناوری NeRF به طور گسترده در توسعه بازی استفاده می شود. NeRF یک شبکه عصبی است که می تواند صحنه های سه بعدی را از یک تصویر دو بعدی بازسازی کند.

جزئیات کمی منتشر شده است، اما هولز چندین بار در گذشته اشاره کرده است که می‌خواهد دنیای مجازی بسازد که هر کسی بتواند با آن تعامل داشته باشد و آن را بسازد. در آخرین ساعات اداری، او اشاره کرد که می‌خواهد مردم به راحتی تصویر Midjourney را به یک محیط سه بعدی تبدیل کنند.

این “اجازه حرکت دوربین را در محدوده های مشخصی می دهد” و ممکن است یک سیستم مسیر دوربین داشته باشد که امکان پردازش 60 فریم در ثانیه و خروجی ویدئو را فراهم می کند. این بدون توجه به مدل ویدیویی برنامه ریزی شده آینده است که احتمالاً به Runway یا Sora نزدیک تر خواهد بود.

شرکت‌های دیگری مانند Luma Labs، Adobe و Meta مدل‌های تبدیل متن به سه بعدی دارند، اما این مدل‌ها به جای محیط، مبتنی بر شی هستند. Roblox در حال کار بر روی محیط‌های تولید شده توسط هوش مصنوعی است و استارت‌آپ Cybever فهرست انتظاری را برای مدل جهانی متن به سه بعدی راه‌اندازی کرده است.

Midjourney چه چیز دیگری را اعلام کرد؟

ویرایشگر Midjourney نسبت تصویر را تغییر می دهد

(اعتبار تصویر: آینده)

با توجه به پستی در X توسط آلفونسو روزنبرگ، تمرکز اصلی ساعات اداری اخیر Midjourney بر روی به روز رسانی های فوری تر، از جمله شخصی سازی بود. به عنوان مثال، برای برخی از حالت‌ها به‌طور پیش‌فرض روشن خواهد بود و کاربران می‌توانند با انتخاب ساده‌تر از بین چهار تصویر تولید شده، نتایج را به راحتی اصلاح کنند.

همچنین یک ویرایشگر تصویر به‌روزرسانی شده وجود خواهد داشت که امکان ویرایش تصاویر خارجی را در Midjourney فراهم می‌کند، اما این امر با اعتدال و حفاظت از حریم خصوصی محدودتر همراه خواهد بود.

مدل ویدیویی Midjourney ممکن است قبل از پایان سال برسد، اما در سبک‌های مصور بهتر از سبک‌های عکاسی خواهد بود. بالاخره نسخه 7 مدل Midjourney در حال آموزش است و بیش از یک ماه اما کمتر از سه ماه دیگر منتشر خواهد شد.

روزنبرگ به نقل از موضوع Discord جیمز گریفینگ اضافه کرد که دو پروژه سخت افزاری در دست کار است، یک صفحه کاوش جدید در راه است و آنها در حال آزمایش یک ابزار داستان گویی با هدف “ساختن جهان به جای رندر” هستند که قرار است امسال منتشر شود.