پلتفرم تولید کاراکتر هوش مصنوعی Hedra نسخه جدید مدل خود را معرفی کرد و این نسخه شامل حرکات سر و حالات چهره واقعی تر است.
همچنین یک ویژگی جدید ‘stilize’ وجود دارد که به شما امکان می دهد شخصیت خود را در لباس های مختلف بپوشانید، پس زمینه اضافه کنید و حتی چهره آنها را به یک شخصیت لگو یا انیمه تبدیل کنید.
Character خانواده جدیدی از مدلهای پایه است که برای خلق انسانهای سازگارتر و واقعیتر از طریق ویدیوی هوش مصنوعی Hedra طراحی شده است و به سازندگان کنترل بیشتری بر خروجی نهایی میدهد. در ابتدا تمرکز بر روی همگام سازی لب و انیمیشن سر است. نسخه 1.5 این قابلیت را اضافه می کند.
هدرا یک طرح رایگان سخاوتمندانه را برای افراد ارائه می دهد تا آن ها را امتحان کنند، و من متوجه شده ام که با هر تصویر انسانی، از جمله عکس ها، نقاشی ها و حتی فیگورهای اکشن کار می کند. بر اساس کلمات استفاده شده در آهنگ صوتی، سر و صورت را کاملاً متحرک می کند.
ما شخصیت Hedra 1.5 را مورد آزمایش قرار دادیم
من پنج کاراکتر ایجاد کردم، ابتدا از طریق یک پیام تصویری با اجرای Flux.1 به صورت محلی بر روی لپ تاپم، سپس با استفاده از ElevenLabs برای ایجاد صدایی برای هر کاراکتر. در نهایت با استفاده از صدا و تصویر با هدرا یک ویدیو ساختم.
هر تصویر فردی را نشان میدهد که مستقیماً به دوربین نگاه میکند، که هر کدام به اندازه کافی متفاوت هستند تا آزمایش مفیدی باشند. سپس سبکسازی را روی این دو اجرا کردم و برای دیدن ظاهری کاملاً متفاوت و تغییر ظریف در لباس و پسزمینه تلاش کردم. در زیر هر توضیحات، فرمان دقیقی را خواهید دید که من به Flux.1 برای ایجاد هر کاراکتر دادم.
1. دکتر
اول، ما یک دکتر میانسال داریم که روپوش آزمایشگاهی دارد. سپس او را در یک لباس روشن و فوق العاده پر از پاشش رنگ با پس زمینه رنگارنگ استایل کردم.
او کار بدی انجام نداد. برخی از مصنوعات در اطراف دهان وجود دارد و حرکت سر کمی اغراق آمیز است، اما لحن صدا را به خوبی منتقل می کند. تطبیق صدا هوش مصنوعی نیست، من صدای مناسبی را در ElevenLabs پیدا کردم.
A head-and-shoulders shot of Dr. Amelia Chen, a 45-year-old Asian-American female doctor, speaking directly to the camera. She's wearing a white lab coat over light blue scrubs, with a stethoscope draped around her neck. Her long black hair is neatly tied back, revealing a few strands of grey at her temples. Dr. Chen's expression is warm and reassuring, with subtle laugh lines around her eyes as she speaks. The background is slightly out of focus, showing a clean, well-lit hospital corridor. The lighting is soft and professional, emphasizing her facial features and the sincerity in her brown eyes as she addresses the viewer, likely explaining a medical concept or providing patient advice.
2. سازنده
بعد ما یک شخصیت سازنده داریم. این آزمایشی برای رندر هوش مصنوعی نیست، بلکه آزمایشی از قابلیتهای همگامسازی لب و انیمیشن حرکت سر Hedra است.
در اینجا، حرکت سر طبیعی تر با حداقل مصنوعات است، اما پلک زدن چشم غیر طبیعی است. با این حال، این یک پیشرفت قابل توجه نسبت به Hedra Character-1 و برخی دیگر از ابزارهای همگام سازی لب با هوش مصنوعی است.
A head-and-shoulders shot of Marcus Johnson, a 38-year-old African-American male construction worker, speaking directly to the camera. He's wearing a yellow hard hat and an orange high-visibility vest over a grey t-shirt. Marcus has a strong jawline with a 5 o'clock shadow, and a small scar above his right eyebrow. His expression is confident and friendly as he talks, likely explaining a aspect of his work. Sweat beads on his forehead, and there's a smudge of dirt on his cheek, suggesting he's been actively working. The background is blurred but shows the vibrant blues and oranges of a construction site. Natural sunlight illuminates his face, casting small shadows that accentuate his features.
3. باریستا
شخصیت باریستا طبیعی ترین پلک زدن را در بین هر آزمونی که من انجام دادم داشت. حرکات لب دوباره کمی اغراق آمیز بود، اما در کل رندر خوبی بود. این می تواند نگرش دوستانه تصویر و صدای اولیه را حفظ کند.
A head-and-shoulders shot of Sofia Rodriguez, a 25-year-old Hispanic female barista, speaking directly to the camera. She's wearing a dark green apron over a white button-up shirt, with the top button undone. Her curly brown hair is tied back in a messy bun, with a few stray curls framing her face. Sofia's warm brown eyes are engaged and friendly as she talks, likely describing a coffee blend or brewing technique. She has small, simple silver stud earrings, and a glimpse of a delicate tattoo is visible on her right wrist. The background is a softly blurred coffee shop interior, with warm, amber lighting that highlights the left side of her face, creating a cozy atmosphere.
4. معلم
من از نحوه ظاهر شدن این تصویر خیلی راضی نبودم، بیشتر شبیه یک عکس کارت شناسایی بد کارکنان به نظر می رسد تا ویدیویی از صحبت کردن شخصی با دوربین، اما به نظر می رسد واقع گرایی در تصویر به هدرا کمک کرده است.
A head-and-shoulders shot of Mr. David Okafor, a 52-year-old Black British male high school teacher, speaking directly to the camera. He's wearing a navy blue blazer over a light blue shirt with a striped tie. His salt-and-pepper hair is cut short, and he wears rectangular glasses that reflect a bit of light. Mr. Okafor's expression is patient and engaging as he speaks, likely explaining a historical concept. Laugh lines and a few age spots are visible on his face, giving him a distinguished appearance. The background is a blurred classroom, with the edge of a whiteboard visible. The lighting is a mix of soft overhead lights and natural light from a nearby window, creating a warm, educational atmosphere.
5. کشاورز
بالاخره یک چهره پیرتر. از آن خواستم در وسط صدا مکثی ایجاد کند و به درستی انیمیشن تنفس/جمع آوری افکار هدرا را منعکس کند.
مانند همه آزمایشها، حرکات دهان و سر در مقایسه با واقعیت اغراقآمیز است، اما هنوز یک پیشرفت بزرگ است.
A head-and-shoulders shot of Emma Larsson, a 60-year-old Scandinavian female farmer, speaking directly to the camera. She's wearing a plaid flannel shirt and a wide-brimmed sun hat that casts a slight shadow over her eyes. Emma's face is weathered from years of outdoor work, with deep laugh lines and sun spots. Her grey hair peeks out from under her hat in a practical braid. Her blue eyes are bright and passionate as she talks, likely discussing crop conditions or sustainable farming practices. The background is a blurred wheat field bathed in golden early morning light. A bead of sweat is visible on her temple, and her skin has a healthy, sun-kissed glow.
افکار نهایی
من قبلاً از طرفداران روش های متحرک سازی حرکات لب در نسخه 1 بودم، اما با 1.5 Hedra، همه چیز یک قدم جلوتر رفته و حرکات طبیعی سر و حالات صورت را اضافه می کند.
Stylise همچنین یک افزونه قدرتمند است و به ما ایده ای از آنچه می توانیم در جدیدترین مدل ویدیویی هوش مصنوعی کاملاً قابل کنترل توسعه یافته توسط Hedra ببینیم، می دهد.
این به شما اجازه می دهد تا به راحتی هر عنصری را در عکس شخصیت خود تطبیق دهید، ظاهر او یا حتی لباس هایی را که در تصویر می پوشد تغییر دهید.
تنها چیزی که در حال حاضر به آن نیاز دارد صفحه عریض و یک گزینه پرتره است تا بتوان آن را با استفاده از تعداد فزاینده محصولات ویدیویی هوش مصنوعی مانند Runway و Kling در پروژهها ادغام کرد.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران