من آماده هستم که آخر هفته را در هولدک خودم بگذرانم – و نزدیکتر از چیزی است که فکر می کنید
استارت آپ World Labs مستقر در سانفرانسیسکو پلتفرم جدیدی را با تمرکز بر آنچه مدل های جهان بزرگ (LWM) می نامد معرفی کرده است. این شرکت این LWM ها را برای ایجاد جهان های سه بعدی ایجاد می کند که بتوانیم وارد آنها شویم و با آنها تعامل داشته باشیم، اما با تفاوت. این دنیاها کاملاً از یک تصویر واحد تشکیل شده اند.
آنها در حال حاضر برای بازی در وب سایت World Labs در دسترس هستند، و در آینده موارد بیشتری ارائه می شود. شرکت هایی مانند نتفلیکس در حال بررسی نحوه توزیع چنین بازی های هوش مصنوعی هستند و Midjourney فعالانه به دنبال راه هایی برای ایجاد یک سیستم Holodeck است.
World Labs توسط فارغ التحصیلان متا و گوگل، از جمله Fei Fei Li، یکی از پیشگامان تحقیقات توسعه هوش مصنوعی در دانشگاه استنفورد، رهبری می شود. این تیم امیدوار است با مدلسازی جهانهای سهبعدی با استفاده از هوش فضایی، به یک بازیگر اصلی در آینده رباتیک، ویدیوی هوش مصنوعی و متاورس تبدیل شود.
ایجاد جهان های سه بعدی با هوش مصنوعی مفهوم جدیدی نیست. ما در گذشته در مورد تلاش های مختلفی برای دور شدن از جهان های مسطح دو بعدی صحبت کرده ایم. اما این اولین باری است که هوش مصنوعی را با تعامل ژست محور می بینیم که برای برنامه های هوش مصنوعی آینده حیاتی خواهد بود.
دموهای راه اندازی این شرکت نگاهی تحریک آمیز به انواع محیط های غنی و رنگارنگ ارائه می دهد که LWM می تواند در صورت تقاضا ایجاد کند. ناگهان دیدن آینده بالقوه هولودک برای همه ما بسیار آسان تر شد.
راه اندازی World Labs در همان هفته ای انجام می شود که Google DeepMind Genie 2 را راه اندازی کرد. Genie 2 که به عنوان یک مدل «جهان پایه در مقیاس بزرگ» معرفی شده است، برای کاربردهای هوش مصنوعی بازی و آژانس معرفی شده است.
فناوری جدید گوگل که از یک تصویر نیز کار می کند، می تواند محیط هایی با وضوح 720p کاملا تعاملی ایجاد کند. کاربر با استفاده از ماوس و صفحه کلید در این محیط حرکت می کند و می تواند به آواتار دستور دهد تا اقدامات را بر اساس محتوای محیط انجام دهد.
این ممکن است اولین نشانه واقعی باشد که ما در حال حرکت به سمت جهان های واقعاً غوطه ور هستیم. همانطور که بسیاری از مردم میدانند، مشکلات کنونی در Metaverse منعکسکننده ماهیت پراکنده و نسبتا خستهکننده جهانهای آنلاینی است که در آنجا ایجاد شدهاند.
علیرغم تلاشهای متا و بازاریابی مداوم هدستهای واقعیت مجازی، این دنیای آنلاین به اندازهای فریبنده نیست که افراد را به طور منظم وارد سیستم کند.
اگر سیلیکون ولی قرار است همه ما را برای مدت طولانی زندگی و خرید آنلاین داشته باشد، باید فضای بهتری را پیدا کند که این اتفاق بیفتد.
در اینجا، مطالعات آزمایشگاههای جهانی و گوگل نشان میدهد که این ممکن است چگونه باشد. در واقع، تعداد فزاینده ای از شرکت های فناوری روی این مشکل کار می کنند، از جمله Midjourney، Luma Labs، Adobe و البته Meta.
حل این مشکل آسان نیست
متأسفانه، حرکت از متن به تصویر به تعامل کامل سه بعدی یک چالش پیش پا افتاده نیست. این ممکن است دلیل افزایش انتظار جامعه سازنده بازی باشد که می تواند نوع مناسبی از فناوری را پیدا کند.
آنچه صنعت بازی در پیچیدگی هوش مصنوعی فاقد آن است، با تخصص گرافیکی و سابقه طولانی خود در ایجاد محیط های تعاملی جذاب و سرگرم کننده جبران می کند. حتی پروژههای کوچک خانگی مانند Halo VR نشان میدهد که در آینده این سبک چه چیزی ممکن است.
چیزی که دنیا واقعاً میخواهد گرافیک خیرهکننده Unreal Engine 5.5 همراه با تعامل روان و حداقل تأخیر یک مدل هوش مصنوعی مانند حالت صوتی پیشرفته ChatGPT است.
این شرکت موفق می شود این عناصر را در یک بسته بندی سریع، زیبا و جالب ترکیب کند و به احتمال زیاد به اولین تک شاخ متاورس جهان تبدیل شود. در حال حاضر میدان باز است و همه حدس میزنند چه کسی در صدر قرار میگیرد.