من Hedra را امتحان کردم، یک ابزار ویدیویی جدید هوش مصنوعی که به شما امکان می دهد شخصیت های متحرک متحرک بسازید، و بسیار تحت تاثیر قرار گرفتم.

پروین میرمیران20 ژوئن 2024آخرین به روز رسانی: 20 ژوئن 2024

0 2,658 خواندن این مطلب 3 دقیقه زمان میبرد

به نظر می‌رسد هر روز یک اعلامیه ویدیویی جدید هوش مصنوعی ظاهر می‌شود و جدیدترین آن از هدرا می‌آید، استارت‌آپی که رویکرد اول شخصیت‌ها را برای ایجاد ایده‌ها اتخاذ می‌کند.

تنها در این هفته شاهد ویژگی‌های جدید Luma Labs Dream Machine و معرفی نسل جدید Sora-like Gen-3 Runway بودیم.

Character-1 یک پیش نمایش تحقیقاتی از مدل ویدیوی اصلی آینده است که به کاربران کنترل دقیقی بر نحوه متحرک سازی شخصیت های مجازی با استفاده از هوش مصنوعی می دهد.

در پیش‌نمایش، می‌توانید به آن صدا و تصویر بدهید و تماشا کنید که یک ویدیوی همگام‌سازی شده از شخصیت در تصویر شما ایجاد می‌کند. برخلاف سایر ابزارهای همگام سازی لب، این ابزار سطح بیان و حرکت بالاتری را نسبت به آنچه که قبلا دیده بودم اضافه می کند.

هدرا در زمان پیش‌نمایش این تحقیق رایگان است و می‌توانید ویدیوهایی با هر طولی که می‌خواهید ایجاد کنید. این شرکت از این برای آزمایش مشکلات مدل و ابزارهای بازرسی آن قبل از ارائه ویژگی‌های پیشرفته‌تر استفاده می‌کند.

شخصیت Hedra-1 چگونه کار می کند؟

Character-1 یک مدل پایه جدید هوش مصنوعی است که برای ایجاد شخصیت های کاملاً قابل کنترل و واقعی با استفاده از هوش مصنوعی طراحی شده است. این شرکت می‌گوید که آن‌ها می‌توانند برای مدت‌های بی‌نهایتی به صورت واضح صحبت کنند، آواز بخوانند و حتی رپ کنند.

در حال حاضر استفاده از آن بسیار ساده است. پس از ثبت نام، می توانید صدایی از متن ایجاد کنید یا صدای خود را به آن بدهید و یک شخصیت بسازید. این می تواند از یک عکس، یک تصویر هوش مصنوعی یا متنی باشد که تصویر را در Hedra می سازد. سپس روی ایجاد ویدیو کلیک کنید و منتظر بمانید.

شباهت هایی در عملکرد به برخی از پروژه های منبع باز، پیش نمایش های تحقیقاتی، و حتی ابزارهای همگام سازی لب در پلتفرم هایی مانند Runway و Synclabs وجود دارد. اما چیزی که هدرا را برای من متمایز می کند قول و بیان آینده در ویدیوها است.

این شرکت در مورد برنامه‌های آتی خود گفت: «این اولین گام در مأموریت هدرا برای ایجاد یک استودیوی خلاقیت چند وجهی است که برای همه قابل دسترسی است و به سازندگان کنترل کامل بر گفتگوی احساسی، حرکت و (بله) کل جهان‌ها می‌دهد.

شخصیت Hedra-1 چقدر خوب کار می کند؟

با پیش‌نمایش تحقیقاتی Character-1 مدل پایه ما آشنا شوید. امروز در https://t.co/G45zFlUfcN (روی دسکتاپ و موبایل) موجود است.* مدت زمان بی نهایت (30 ثانیه برای پیش نمایش باز)* 90 ثانیه در 60 ثانیه رندر می شود (اگر منبع H100 داشته باشیم)* صحبت رسا، آواز خواندن، رپ … عکس twitter.com/cYuHpSnqMu18 ژوئن 2024

از آنجایی که این اولین مرحله از یک مدل جدید است، مشکلاتی به وجود آمد، به خصوص به دلیل نظارت بیش از حد هوش مصنوعی، اما من با ویدیوهایی که ایجاد کردم مشکلی نداشتم.

در حال حاضر به 30 ثانیه محدود شده است، بنابراین اگر شما یک کلیپ صوتی طولانی تر مانند من دارید، باید این کار را در دو قسمت انجام دهید. به نظر می‌رسد که با تصاویر تولید شده توسط Hedra بهترین کار را دارد، اما می‌توانید عکس خود را آپلود کنید، فقط مطمئن شوید که شبیه انسان و رو به جلو باشد.

در حال حاضر فقط ویدیوهای با فرمت مربع را به جای عریض یا پرتره ارائه می دهد و وضوح نسبتاً پایین است. اما این یک پیش نمایش تحقیقاتی برای به نمایش گذاشتن قابلیت ها به جای تولید محتوای آماده برای تولید است و واقعاً نشان می دهد که چه چیزی در راه است.

برای آزمایش این موضوع، داستان کوتاهی درباره تهاجم بیگانگان ایجاد کردم. این به من امکان ساخت چهار شخصیت را داد. سه بیگانه و یک ژنرال انسانی از نیروی دریایی کهکشانی. در مقایسه با بازیگری انسانی، این تقریباً همان چوبی است که در یک سریال دانشجویی پیدا می کنید. برای همگام سازی لب مبتنی بر هوش مصنوعی، این یک گام بزرگ رو به جلو نسبت به آنچه قبلا دیده ام است.