من از Google’s Veo 3 برای ایجاد فیلم های غذایی AI ASMR استفاده کردم

Google’s Veo 3 Video Video ، یک لیگ در رقبای خود به یک دلیل مهم – Sound. شما ممکن است نه تنها آنچه را که روی صفحه می بینید ، بلکه آنچه را می شنوید بخواهید.
اولین مدل VEO ، ساخته شده توسط آزمایشگاه DeepMind ، در ماه مه 2024 منتشر شد و هر نسل جدید عملکرد بیشتری را به آن اضافه کرد. همیشه در دقت و درک فیزیک حرکت در مقایسه با رقبا کامل شده است ، اما افزودن صدا مبدل بازی بود.
با یک تبلیغ کوتاه ، می توانید از آن استفاده کنید تا از فیلمی که نوشتید ، و حتی یک موزیک ویدیو از صحنه بخواهید. اما استفاده ای وجود دارد که من بیش از دیگران می بینم – ASMR (پاسخ نصف النهاری حسی): برای برخی افراد ، لمس ملایم که باعث ایجاد احساس سوزن شدن ، زمزمه و صدا می شود.
برای دیدن این که چقدر می تواند پیش برود ، من تعدادی از خواسته های غذایی ASMR ایجاد کردم – هر یک از آنها برای ایجاد یک فیلم تطبیق یافته و ایجاد صدایی در اطراف آشپزخانه طراحی شده است.
کار VEO 3 در برنامه Gemini
VEO 3 اکنون در برنامه Gemini موجود است. هنگام شروع یک درخواست جدید ، گزینه ویدیویی را انتخاب کنید ، آنچه را که می خواهید تایپ کنید و یک کلیپ 8 ثانیه ای ایجاد می شود.
جمینی بهترین راه برای دستیابی به VEO 3 نیست – من توصیه می کنم Freepic ، Fal ، Higgsfield یا Google Flow – استفاده آسان و مراقبت از کار.
یک مزیت مهم استفاده مستقیم از دوقلوها این است که به طور خودکار درخواست های خود را تفسیر و توسعه دهید. اگر می خواهید یک فیلم ASMR فوق العاده با Lasagna داشته باشید ، این همان چیزی است که شما می گیرید.
همچنین ممکن است با استفاده از چیزی به نام درخواست ساختاری خاص تر باشید – آن را با تمبر و توضیحات مرحله از هر لحظه برچسب بزنید. با این حال ، مگر اینکه به یک کنترل دقیق نیاز داشته باشید ، یک پاراگراف ساده (که به عنوان راهنمایی روایی نیز شناخته می شود) معمولاً مؤثرتر است.
ایجاد درخواست
اولین کار در هر پروژه هوش مصنوعی فکر کردن در مورد درخواست شما است. مدل ها در تفسیر قصد بهتر می شوند ، اما اگر می دانید چه می خواهید ، بهتر است خاص باشید.
من می دانستم که فیلم های غذایی ASMR را می خواهم ، بنابراین با یک تست شروع کردم: “ASMR Voice Asmr Video Food.”
نتیجه گیری؟ صاف در حقیقت ، او لازانیا را در ذهن من به من داد. سپس من تصفیه کردم – برای امتحان کردن ساختاری که برای یک نوشیدنی گازی یخ زده با خلاصه کردن انواع خاص مواد غذایی ، اضافه کردن توضیحات صدا و حتی ICED پیکربندی شده است.
بیشتر اوقات ، درخواست های روایت به بهترین وجه کار می کنند. فقط توضیح دهید که چه چیزی می خواهید ببینید ، جریان ویدیو و نحوه صدا باید باشد.
1. لازانیا
تماشای
اولین درخواست ، “فیلم غذایی ASMR با فیلم” کلیپ قابل توجهی از کسی را تولید کرد که چنگال را به یک تکه لازانیا منتقل کرد. هنگام ورود به چنگال ، خرد کردن را می شنوید ، سپس وقتی به صفحه ضربه می زنید ، دست و پنجه نرم کنید. این وضعیتی است که آرزو می کنم VEO 3 یک دکمه “گسترش کلیپ” داشته باشد.
هیچ درخواست دیگری وجود ندارد ، بنابراین هیچ راهی وجود ندارد که غذا چه خواهد بود ، چگونه صدا بیرون می آید ، یا حتی اگر صدا کار کند. بنابراین ، خاص بودن ، حتی در چکمه های چت مانند جمینی ، حتی در مدل های هوش مصنوعی ، حتی حتی در چکمه های گپ ، مهم است.
2. آشپزی و غذا غذا
تماشای
سپس ، من در یک آشپزخانه خوب و روایت شده ، یک درخواست طولانی تر و روایتگر که یک غذای رضایت بخش را تهیه می کند و می خواهد یک سرآشپز برای ایجاد یک نزدیک باشد ، در یک آشپزخانه خوب و روایت شده تر رفتم.
من می خواستم صدای خاردار کره را در یک تابه که خرد شده و در یک تابه خرد شده و ذوب شده است ، چروک کنم.
من این خط را اضافه کردم: “بر کیفیت صدا تأکید کنید: نمای صدای تمیز ، لایه ASMR بدون موسیقی ، اما همچنین آنچه نمی خواهم بشنوم.
3. مصر توضیح داد
تماشای
من برای آخرین درخواست با یک تصویر شروع کردم. من از Midjourney V7 برای ایجاد تصویری از زنی که به پاپ کورن رنگین کمان نگاه می کند ، استفاده کردم ، سپس دستور “Asmr Food” را به جمینی اضافه کردم.
از نظر بصری ، نتیجه جالب توجه بود – اما به دلایلی ، زن با آواز می گوید: “این خوشمزه ، این رنگین کمان ذرت را منفجر کرد.” این روی من است – من مشخص نکردم که آیا او مجبور است صحبت کند یا چه چیزی بگوید.
یک اصلاح ساده: مکالمات مورد نظر خود را در نقل قول ها قرار دهید. به عنوان مثال ، من می توانم از او بخواهم که بگوید “من عاشق تماشای پاپ پاپ کورن هستم” ، و بر کلمه پاپ تأکید کردم. من همچنین اظهار داشتم که او روی دوربین صحبت می کند – و Veo 3 با حرکت لب همگام می شود تا مطابقت داشته باشد.
راه حل
به طور کلی ، VEO 3 هنگام تولید صدای با کیفیت بالا ، نتایج چشمگیری را ارائه می دهد ، به خصوص وقتی صحبت از صداهای با کیفیت بالا است. اگرچه چند عجیب و غریب برای سرگردان مانند صدای ناخواسته یا لازانیا کمی شسته شده وجود دارد – این موارد را می توان به راحتی با یک درخواست خاص تر انجام داد.
بیشتر از راهنمای تام
بازگشت به لپ تاپ ها


