من آماده هستم که آخر هفته را در هولدک خودم بگذرانم – و نزدیکتر از چیزی است که فکر می کنید

پروین میرمیران3 هفته پیشآخرین به روز رسانی: 7 دسامبر 2024

0 0 خواندن این مطلب 3 دقیقه زمان میبرد

من آماده هستم که آخر هفته را در هولدک خودم بگذرانم - و نزدیکتر از چیزی است که فکر می کنید

استارت آپ World Labs مستقر در سانفرانسیسکو پلتفرم جدیدی را با تمرکز بر آنچه مدل های جهان بزرگ (LWM) می نامد معرفی کرده است. این شرکت این LWM ها را برای ایجاد جهان های سه بعدی ایجاد می کند که بتوانیم وارد آنها شویم و با آنها تعامل داشته باشیم، اما با تفاوت. این دنیاها کاملاً از یک تصویر واحد تشکیل شده اند.

آنها در حال حاضر برای بازی در وب سایت World Labs در دسترس هستند، و در آینده موارد بیشتری ارائه می شود. شرکت هایی مانند نتفلیکس در حال بررسی نحوه توزیع چنین بازی های هوش مصنوعی هستند و Midjourney فعالانه به دنبال راه هایی برای ایجاد یک سیستم Holodeck است.

World Labs توسط فارغ التحصیلان متا و گوگل، از جمله Fei Fei Li، یکی از پیشگامان تحقیقات توسعه هوش مصنوعی در دانشگاه استنفورد، رهبری می شود. این تیم امیدوار است با مدل‌سازی جهان‌های سه‌بعدی با استفاده از هوش فضایی، به یک بازیگر اصلی در آینده رباتیک، ویدیوی هوش مصنوعی و متاورس تبدیل شود.

ایجاد جهان های سه بعدی با هوش مصنوعی مفهوم جدیدی نیست. ما در گذشته در مورد تلاش های مختلفی برای دور شدن از جهان های مسطح دو بعدی صحبت کرده ایم. اما این اولین باری است که هوش مصنوعی را با تعامل ژست محور می بینیم که برای برنامه های هوش مصنوعی آینده حیاتی خواهد بود.

دموهای راه اندازی این شرکت نگاهی تحریک آمیز به انواع محیط های غنی و رنگارنگ ارائه می دهد که LWM می تواند در صورت تقاضا ایجاد کند. ناگهان دیدن آینده بالقوه هولودک برای همه ما بسیار آسان تر شد.

(اعتبار تصویر: گوگل AI ایجاد شده)

راه اندازی World Labs در همان هفته ای انجام می شود که Google DeepMind Genie 2 را راه اندازی کرد. Genie 2 که به عنوان یک مدل «جهان پایه در مقیاس بزرگ» معرفی شده است، برای کاربردهای هوش مصنوعی بازی و آژانس معرفی شده است.

فناوری جدید گوگل که از یک تصویر نیز کار می کند، می تواند محیط هایی با وضوح 720p کاملا تعاملی ایجاد کند. کاربر با استفاده از ماوس و صفحه کلید در این محیط حرکت می کند و می تواند به آواتار دستور دهد تا اقدامات را بر اساس محتوای محیط انجام دهد.

این ممکن است اولین نشانه واقعی باشد که ما در حال حرکت به سمت جهان های واقعاً غوطه ور هستیم. همانطور که بسیاری از مردم می‌دانند، مشکلات کنونی در Metaverse منعکس‌کننده ماهیت پراکنده و نسبتا خسته‌کننده جهان‌های آنلاینی است که در آنجا ایجاد شده‌اند.

علی‌رغم تلاش‌های متا و بازاریابی مداوم هدست‌های واقعیت مجازی، این دنیای آنلاین به اندازه‌ای فریبنده نیست که افراد را به طور منظم وارد سیستم کند.

اگر سیلیکون ولی قرار است همه ما را برای مدت طولانی زندگی و خرید آنلاین داشته باشد، باید فضای بهتری را پیدا کند که این اتفاق بیفتد.

در اینجا، مطالعات آزمایشگاه‌های جهانی و گوگل نشان می‌دهد که این ممکن است چگونه باشد. در واقع، تعداد فزاینده ای از شرکت های فناوری روی این مشکل کار می کنند، از جمله Midjourney، Luma Labs، Adobe و البته Meta.

حل این مشکل آسان نیست

متأسفانه، حرکت از متن به تصویر به تعامل کامل سه بعدی یک چالش پیش پا افتاده نیست. این ممکن است دلیل افزایش انتظار جامعه سازنده بازی باشد که می تواند نوع مناسبی از فناوری را پیدا کند.

آنچه صنعت بازی در پیچیدگی هوش مصنوعی فاقد آن است، با تخصص گرافیکی و سابقه طولانی خود در ایجاد محیط های تعاملی جذاب و سرگرم کننده جبران می کند. حتی پروژه‌های کوچک خانگی مانند Halo VR نشان می‌دهد که در آینده این سبک چه چیزی ممکن است.

چیزی که دنیا واقعاً می‌خواهد گرافیک خیره‌کننده Unreal Engine 5.5 همراه با تعامل روان و حداقل تأخیر یک مدل هوش مصنوعی مانند حالت صوتی پیشرفته ChatGPT است.

این شرکت موفق می شود این عناصر را در یک بسته بندی سریع، زیبا و جالب ترکیب کند و به احتمال زیاد به اولین تک شاخ متاورس جهان تبدیل شود. در حال حاضر میدان باز است و همه حدس می‌زنند چه کسی در صدر قرار می‌گیرد.