من Hedra را امتحان کردم، یک ابزار ویدیویی جدید هوش مصنوعی که به شما امکان می دهد شخصیت های متحرک متحرک بسازید، و بسیار تحت تاثیر قرار گرفتم.
به نظر میرسد هر روز یک اعلامیه ویدیویی جدید هوش مصنوعی ظاهر میشود و جدیدترین آن از هدرا میآید، استارتآپی که رویکرد اول شخصیتها را برای ایجاد ایدهها اتخاذ میکند.
تنها در این هفته شاهد ویژگیهای جدید Luma Labs Dream Machine و معرفی نسل جدید Sora-like Gen-3 Runway بودیم.
Character-1 یک پیش نمایش تحقیقاتی از مدل ویدیوی اصلی آینده است که به کاربران کنترل دقیقی بر نحوه متحرک سازی شخصیت های مجازی با استفاده از هوش مصنوعی می دهد.
در پیشنمایش، میتوانید به آن صدا و تصویر بدهید و تماشا کنید که یک ویدیوی همگامسازی شده از شخصیت در تصویر شما ایجاد میکند. برخلاف سایر ابزارهای همگام سازی لب، این ابزار سطح بیان و حرکت بالاتری را نسبت به آنچه که قبلا دیده بودم اضافه می کند.
هدرا در زمان پیشنمایش این تحقیق رایگان است و میتوانید ویدیوهایی با هر طولی که میخواهید ایجاد کنید. این شرکت از این برای آزمایش مشکلات مدل و ابزارهای بازرسی آن قبل از ارائه ویژگیهای پیشرفتهتر استفاده میکند.
شخصیت Hedra-1 چگونه کار می کند؟
Character-1 یک مدل پایه جدید هوش مصنوعی است که برای ایجاد شخصیت های کاملاً قابل کنترل و واقعی با استفاده از هوش مصنوعی طراحی شده است. این شرکت میگوید که آنها میتوانند برای مدتهای بینهایتی به صورت واضح صحبت کنند، آواز بخوانند و حتی رپ کنند.
در حال حاضر استفاده از آن بسیار ساده است. پس از ثبت نام، می توانید صدایی از متن ایجاد کنید یا صدای خود را به آن بدهید و یک شخصیت بسازید. این می تواند از یک عکس، یک تصویر هوش مصنوعی یا متنی باشد که تصویر را در Hedra می سازد. سپس روی ایجاد ویدیو کلیک کنید و منتظر بمانید.
شباهت هایی در عملکرد به برخی از پروژه های منبع باز، پیش نمایش های تحقیقاتی، و حتی ابزارهای همگام سازی لب در پلتفرم هایی مانند Runway و Synclabs وجود دارد. اما چیزی که هدرا را برای من متمایز می کند قول و بیان آینده در ویدیوها است.
این شرکت در مورد برنامههای آتی خود گفت: «این اولین گام در مأموریت هدرا برای ایجاد یک استودیوی خلاقیت چند وجهی است که برای همه قابل دسترسی است و به سازندگان کنترل کامل بر گفتگوی احساسی، حرکت و (بله) کل جهانها میدهد.
شخصیت Hedra-1 چقدر خوب کار می کند؟
با پیشنمایش تحقیقاتی Character-1 مدل پایه ما آشنا شوید. امروز در https://t.co/G45zFlUfcN (روی دسکتاپ و موبایل) موجود است.* مدت زمان بی نهایت (30 ثانیه برای پیش نمایش باز)* 90 ثانیه در 60 ثانیه رندر می شود (اگر منبع H100 داشته باشیم)* صحبت رسا، آواز خواندن، رپ … عکس twitter.com/cYuHpSnqMu18 ژوئن 2024
از آنجایی که این اولین مرحله از یک مدل جدید است، مشکلاتی به وجود آمد، به خصوص به دلیل نظارت بیش از حد هوش مصنوعی، اما من با ویدیوهایی که ایجاد کردم مشکلی نداشتم.
در حال حاضر به 30 ثانیه محدود شده است، بنابراین اگر شما یک کلیپ صوتی طولانی تر مانند من دارید، باید این کار را در دو قسمت انجام دهید. به نظر میرسد که با تصاویر تولید شده توسط Hedra بهترین کار را دارد، اما میتوانید عکس خود را آپلود کنید، فقط مطمئن شوید که شبیه انسان و رو به جلو باشد.
در حال حاضر فقط ویدیوهای با فرمت مربع را به جای عریض یا پرتره ارائه می دهد و وضوح نسبتاً پایین است. اما این یک پیش نمایش تحقیقاتی برای به نمایش گذاشتن قابلیت ها به جای تولید محتوای آماده برای تولید است و واقعاً نشان می دهد که چه چیزی در راه است.
برای آزمایش این موضوع، داستان کوتاهی درباره تهاجم بیگانگان ایجاد کردم. این به من امکان ساخت چهار شخصیت را داد. سه بیگانه و یک ژنرال انسانی از نیروی دریایی کهکشانی. در مقایسه با بازیگری انسانی، این تقریباً همان چوبی است که در یک سریال دانشجویی پیدا می کنید. برای همگام سازی لب مبتنی بر هوش مصنوعی، این یک گام بزرگ رو به جلو نسبت به آنچه قبلا دیده ام است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide