Midjourney Holodeck را می سازد – مدل جدید هوش مصنوعی به شما امکان می دهد تصاویر سه بعدی را وارد کنید
Midjourney، خالق برجسته تصویر هوش مصنوعی در حال کار بر روی ویژگی جدیدی است که نحوه تعامل ما با تصاویر ایجاد شده را کاملاً تغییر می دهد. با استفاده از اشکال جدید فناوری سه بعدی، قادر خواهید بود به طور موثری در داخل تصویر قدم بگذارید.
این ویژگی که در ساعات اداری اخیر Midjourney در Discord اعلام شد، تنها یکی از ویژگیهای جدید در دست ساخت است که میتواند تا پایان سال جاری منتشر شود. دیوید هولز، مدیرعامل Midjourney نیز گفت که ما نسخه 7 را تا پایان سال، یک مدل ویدیویی و یک ویرایشگر تصویر ارتقا یافته خواهیم دید که به شما امکان می دهد برای اولین بار تصاویر خارجی را ویرایش کنید.
این استارت آپ مدتی است که روی فناوری سه بعدی کار می کند تا بخشی از چشم انداز خود برای ایجاد دنیایی شبیه به Star Trek Holodeck و استفاده از آن جهان برای ساخت فیلم، بازی یا صرفا برای گذران زمان باشد.
مدل سه بعدی Midjourney چگونه کار خواهد کرد؟
به گفته مارتین نبلونگ، کارشناس هوش مصنوعی، مدل سه بعدی Midjourney یک رویکرد کاملاً جدید خواهد بود که بر اساس فناوری NeRF به طور گسترده در توسعه بازی استفاده می شود. NeRF یک شبکه عصبی است که می تواند صحنه های سه بعدی را از یک تصویر دو بعدی بازسازی کند.
جزئیات کمی منتشر شده است، اما هولز چندین بار در گذشته اشاره کرده است که میخواهد دنیای مجازی بسازد که هر کسی بتواند با آن تعامل داشته باشد و آن را بسازد. در آخرین ساعات اداری، او اشاره کرد که میخواهد مردم به راحتی تصویر Midjourney را به یک محیط سه بعدی تبدیل کنند.
این “اجازه حرکت دوربین را در محدوده های مشخصی می دهد” و ممکن است یک سیستم مسیر دوربین داشته باشد که امکان پردازش 60 فریم در ثانیه و خروجی ویدئو را فراهم می کند. این بدون توجه به مدل ویدیویی برنامه ریزی شده آینده است که احتمالاً به Runway یا Sora نزدیک تر خواهد بود.
شرکتهای دیگری مانند Luma Labs، Adobe و Meta مدلهای تبدیل متن به سه بعدی دارند، اما این مدلها به جای محیط، مبتنی بر شی هستند. Roblox در حال کار بر روی محیطهای تولید شده توسط هوش مصنوعی است و استارتآپ Cybever فهرست انتظاری را برای مدل جهانی متن به سه بعدی راهاندازی کرده است.
Midjourney چه چیز دیگری را اعلام کرد؟
با توجه به پستی در X توسط آلفونسو روزنبرگ، تمرکز اصلی ساعات اداری اخیر Midjourney بر روی به روز رسانی های فوری تر، از جمله شخصی سازی بود. به عنوان مثال، برای برخی از حالتها بهطور پیشفرض روشن خواهد بود و کاربران میتوانند با انتخاب سادهتر از بین چهار تصویر تولید شده، نتایج را به راحتی اصلاح کنند.
همچنین یک ویرایشگر تصویر بهروزرسانی شده وجود خواهد داشت که امکان ویرایش تصاویر خارجی را در Midjourney فراهم میکند، اما این امر با اعتدال و حفاظت از حریم خصوصی محدودتر همراه خواهد بود.
مدل ویدیویی Midjourney ممکن است قبل از پایان سال برسد، اما در سبکهای مصور بهتر از سبکهای عکاسی خواهد بود. بالاخره نسخه 7 مدل Midjourney در حال آموزش است و بیش از یک ماه اما کمتر از سه ماه دیگر منتشر خواهد شد.
روزنبرگ به نقل از موضوع Discord جیمز گریفینگ اضافه کرد که دو پروژه سخت افزاری در دست کار است، یک صفحه کاوش جدید در راه است و آنها در حال آزمایش یک ابزار داستان گویی با هدف “ساختن جهان به جای رندر” هستند که قرار است امسال منتشر شود.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide