Pika Labs ارتقای بزرگی را در مدل هوش مصنوعی تصویر به ویدیو انجام داده است – این 5 نمونه را بررسی کنید
آزمایشگاه Pika روش کار مدل تصویر به ویدئو را بهبود بخشیده است. پلتفرم ویدیویی هوش مصنوعی یک سال پیش راه اندازی شد و با رقابت فزاینده ای از سوی سرویس های جدیدی مانند Sora OpenAI، مدل چینی Kling AI و ماشین رویای Luma Labs که به تازگی راه اندازی شده است، مواجه است.
تاکنون، Pika Labs بر روی ایجاد یک پلتفرم گسترده تمرکز کرده است، از جمله توانایی افزودن جلوه های صوتی و حتی صداهای همگام سازی لب به کار شما.
در حالی که قابلیتهای ایجاد ویدیو در اولین انتشار آن بسیار پیشرفته بود، مدلهای دیگر تأثیر زیادی بر درک آن گذاشتهاند. آزمایشگاه Pika درک تصویر خود را برای مبارزه با این موارد قبل از عرضه یک مدل نسل بعدی توسعه داده است.
این شرکت میگوید میتوانید با شروع با یک تصویر و دادن دستورالعملهای حرکت دوربین از نوع فیلمسازی به نتایج چشمگیری دست پیدا کنید. او این را با مثالهای خودش نشان داد که برای میکس کردن یا تغییر مسیر در اپلیکیشن وب Pika Labs نیز موجود است.
آزمایشگاه پیکا، تصویر به ویدیو را آزمایش می کند
این به روز رسانی مدل تصویر به ویدیو دیوانه کننده است. pic.twitter.com/L7117cMnNO11 ژوئن 2024
اولین تجربه من در تلاش برای تبدیل تصویر بهروزرسانی شده به ویدیو از چند عکس از نوع منظره/پهپاد ایجاد شد. آنها مرا وادار کردند که بنشینم و توجه کنم زیرا عمل به طور قابل توجهی بهتر از ویدیوهای قبلی بود. بنابراین تصمیم گرفتم کارها را جلوتر ببرم.
با استفاده از مدل جدید فونیکس لئوناردو، پنج تصویر ایجاد کردم و با شرح حرکت مورد نیاز به آزمایشگاه پیکا فرستادم. همه تنظیمات، از جمله میزان حرکت، در حالت پیش فرض باقی می مانند.
1. کارناوال سایبرپانک
اول از همه با کارناوالی که در شب برگزار می شود وارد دنیای سایبرپانک می شویم. بسیاری از نورهای خیره کننده و میل به عبور از این دنیای روشن.
دستور لئوناردو فینیکس: “یک کارناوال سایبرپانک پر جنب و جوش در شب، با سواری های نورپردازی نئون، غرفه های غذای آینده نگرانه، بازی های واقعیت افزوده، و جمعیت متنوعی از مردم که لباس های رنگارنگ و عجیب و غریب به تن دارند. اجراکنندگان هولوگرافیک جمعیت را در میان نورهای خیره کننده سرگرم می کنند.”
پیام جنبش Pika Labs: “از یک حرکت انتقالی پویا در میان جمعیت استفاده کنید. از ورودی کارناوال شروع کنید، از غرفههای غذا و بازیها بگذرید و صحنه مرکزی را با اجراکنندگان هولوگرافی پایان دهید.”
سه ثانیه برای ثبت صحیح مراحل کافی نبود، اما باعث شروع فرآیند شد، و بله، حرکت بهتر است زمانی که شما توصیفی هستید و از یک تصویر به عنوان اعلان استفاده می کنید.
2. جنگل قارچ بیولومینسانس
سپس با یک قارچ ملاقات خواهیم کرد. نام او دیو است و او ستاره مهمانی است. خوب، پس او خیلی آدم سرگرم کننده ای نیست، بیشتر شبیه جنگل قارچ است. ما اینجا یک حرکت آهسته و سریع می خواهیم.
پیشنهاد لئوناردو فینیکس: “جنگل انبوه پر از قارچ های بیولومنسسنت سر به فلک کشیده که درخششی سورئال می بخشد. گیاهان عجیب و غریب با الگوهای درخشان و موجودات ریز و درخشان که در میان برگ ها در حال پرواز هستند، فضایی ماورایی ایجاد می کنند.”
اعلان جنبش Pika Labs: “یک حرکت گاری آهسته را تمرین کنید که بر انتقال از لبه جنگل به قلب درخشان آن تاکید می کند، از لبه جنگل شروع می شود و به عمق جنگل می رود، قارچ های بزرگتر و موجودات درخشان را نشان می دهد.”
حرکت محدود بود اما آنچه را که می خواستم انجام داد. مشکل این است که سه ثانیه زمان کافی برای آزمایش مجدد آن نیست، بنابراین تصمیم گرفتم چهار ثانیه دیگر به آن فرصت بدهم، فقط این بار با استفاده از ویژگی گسترش. او بیشتر از همین به من داد.
3. باغ های آسمانی یک تمدن باستانی
در آزمایش سوم، فرض میکنیم که یک تمدن باستانی وجود داشته است و آنها شبکهای از جزایر شناور را ایجاد کردهاند که هر کدام با پلهای معلق به هم متصل شدهاند. حرکت انتقالی است که از پایین جزایر شروع شده و به سمت بالا حرکت می کند.
پیشنهاد لئوناردو فینیکس: “جزایر شناور که با پل های معلق به هم متصل می شوند، هر جزیره پر از گیاهان پر جنب و جوش، عجیب و غریب و سازه های سنگی باستانی است که با کنده کاری های پیچیده تزئین شده اند. آبشارها از لبه ها آبشار می شوند و در ابرهای زیر ناپدید می شوند.”
اعلان جنبش Pika Labs: “از یک حرکت انتقالی نرم استفاده کنید که از پایین جزایر شناور شروع می شود، به سمت آنها بالا می رود، از پل های معلق و آبشارها عبور می کند و به مرکزی و پیچیده ترین ساختار ختم می شود.”
دوباره مشکل این بود که حرکت خیلی آهسته بود، به اندازه کافی طولانی نبود که بتوانم یک تجربه واقعی داشته باشم، بنابراین من تغییراتی ایجاد کردم و از صاف به سریع تغییر دادم و قانون “فقط تنظیمات پیش فرض” خود را شکستم تا قدرت حرکت را به 3 افزایش دهم.
این نسخه ای است که در اینجا می بینید. افزایش قدرت حرکت تفاوت زیادی ایجاد کرد و تغییر از نرم به سریع نیز کمک کرد.
4. شهر متروک کپسول زمان
بازگشت به طبیعت نام دیگر این آرزو بود. اساساً این دنیایی است که طبیعت پس از رها شدن آن را پس گرفت. حرکت یک حرکت سریع بود. از راهنمایی های قبلی درس ام گرفته بودم که از کلمه کند دوری کنم.
پیشنهاد لئوناردو فینیکس: “شهری آیندهنگر که در زمان یخ زده، متروکه و بیش از حد رشد کرده است، زیرا طبیعت سازهها را بازیابی میکند. انگورها و گلها آسمانخراشهای متظاهر را میپوشانند، و حیات وحش در خیابانهای خالی پرسه میزند، با بقایای فناوری پیشرفته پراکنده شده است.”
اخطار اقدام Pika Labs: «ماشین در حال حرکت سریع. از حومه شهر شروع کنید، به تدریج وارد قلب شهر شوید، ترکیبی از طبیعت و فناوری رها شده را به نمایش بگذارید و به میدان مرکزی پوشیده شده توسط یک درخت بزرگ ختم شوید.
چون نمی خواستم خیلی نازک باشد، قدرت حرکت را روی سه نگه داشتم. چون حرکت صفر داشتم کار نکرد. بنابراین پس از حرکت سریع همه چیز را از اعلان حرکت حذف کردم. من هنوز هیچ حرکتی جز یک سگ کوچولو ندارم، بنابراین تصمیم گرفتم که زمان آن رسیده است که تنظیمات را بررسی کنم.
این بار اتکا به دستورات را افزایش دادم و دکمه حرکت زوم را در تنظیمات بررسی کردم. این مشکل را حل کرد و حرکت چشمگیری را ارائه داد.
5. غارهای یخی عرفانی
در نهایت وارد غارهای یخی میشویم که دیوارههای آنها با کریستال میدرخشند و اطراف آن را آبشارهای یخ زده احاطه کردهاند. منظره من را غافلگیر نکرد اما این مسیر را شروع کردیم و تا انتها ادامه خواهیم داد. جنبش یک دوره انتقالی بود.
پیشنهاد لئوناردو فینیکس: “دخمه پرپیچ و خم غارهای یخی با دیوارهایی که با کریستال های تعبیه شده می درخشند و انعکاس های رنگارنگ ایجاد می کنند. آبشارهای یخ زده، استالاکتیت های درخشان و درخشش اثیری از منابع نوری پنهان، فضایی جادویی ایجاد می کنند.”
من با دستور حرکت Pika Labs بسیار ساده رفتم: “حرکت انتقالی صاف”. دکمه های زوم و شیب را هم علامت زدم و حرکت را روی 3 نگه داشتم.
این کارها. بنابراین نکات اصلی من عبارتند از: بله، افزودن یک تصویر به بهبود خروجی ویدیو کمک می کند و از تنظیماتی که با Pika Labs ارائه می شود استفاده رایگان می کند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide