من به تازگی آینده میم ها را دیدم – Pika نسخه 1.5 را منتشر کرده است و می تواند هر چیزی را به کیک تبدیل کند
Pika Labs، یکی از اولین پلتفرمهای ویدیویی هوش مصنوعی تجاری، سرانجام با نسخه 1.5 عرضه شد، یک پیچ جالب در مقایسه با تمرکز بر سرگرمیها و میمهایی مانند Runway Gen-3 و Luma Labs. توجه به توانایی های آنها جلب شود.
علاوه بر بهروزرسانیهای مدل پایه که شامل تصویر به ویدیو، متن به ویدیو، و درجات رو به بهبود واقعگرایی حرکتی میشود، افکتهای ویژهای به نام PikaEffects نیز وجود دارد که به شما امکان میدهد یک تصویر بگیرید و بخشهایی از آن را دستکاری کنید. آن را برای تبدیل آن به کیک، آن را به اسلایم تبدیل کنید یا آن را خرد کنید.
مدت کوتاهی پس از راهاندازی، بار زیادی روی سرورهای Pika Labs وجود داشت، به این معنی که برخی از افراد تا 12 ساعت برای ایجاد یک ویدیو زمان میبردند، اما اکنون به نظر میرسد که این امر خود به خود اصلاح میشود، به خصوص اگر یکی از میمها را ایجاد کنید. فیلم های سبک افکت ها مورد علاقه شخصی من انفجار است.
من تصمیم گرفتم این را آزمایش کنم، یک سری عکس ایجاد کنم و سپس Pikaffect های پیش فرض مختلف را امتحان کنم، از جمله انفجار یک باجه تلفن در لندن، شکستن صفحه شطرنج، و منفجر کردن جمجمه.
Pika Labs 1.5 چگونه کار می کند؟
با عرض پوزش، رمز عبور خود را فراموش کرده ایم. PIKA 1.5 منتشر شد. با حرکات واقعی تر، رندرهای صفحه بزرگ، و جلوه های شگفت انگیز Pik که قوانین فیزیک را زیر پا می گذارد، Pika را بیشتر از همیشه دوست خواهید داشت. آن را امتحان کنید. pic.twitter.com/lOEVZIRygx1 اکتبر 2024
به نظر می رسد معادله هوش مصنوعی این است که داده ها به علاوه قدرت محاسباتی به اضافه زمان با مدل بهتری برابری می کند، و این دقیقاً همان چیزی است که آزمایشگاه Pika به آن دست یافته است. این شرکت در چند ماه گذشته وقت خود را صرف کرده است تا چیزی خاص را با ویژگی هایی که در هیچ پلتفرم دیگری موجود نیست آماده کند.
اگرچه تعدادی افکت میم پیش فرض وجود دارد، اما به نظر می رسد افکت های مخفی نیز وجود دارد که می توانید اضافه کنید. من گمان می کنم که در مقطعی در آینده افراد بتوانند جلوه های خود را ایجاد کنند و آنها را با دیگران به اشتراک بگذارند. من دوست دارم جلوه های متنی را ببینم که در آن یک شی به متن سه بعدی روی صفحه تبدیل می شود.
در برخی مواقع، زمانی که بار سرور کمی آرام شد، قصد دارم بیشتر در قابلیتهای دیگر مدل تحقیق کنم. در حال حاضر، برای آزمایش این، پنج تصویر با یک شی یا موجودیت در جلو و مرکز در Ideogram ایجاد کردم و سپس همه آنها را در آزمایشگاه Pika اجرا کردم.
باد کردن: یک ماشین تحریر قدیمی
اعلان تصویر: «یک ماشین تایپ قدیمی با جزئیات زیبا روی میز چوبی در اتاقی دنج با فضایی گرم و نوستالژیک، احاطه شده با کتاب و کاغذ، با نور طبیعی ملایمی که از پنجره به داخل میچرخد، نشسته است.»
آن را ذوب کن: یک کلاه ایمنی فضایی
اعلان تصویر: “کلاه فضایی فضانوردی که روی میزی در یک ایستگاه فضایی آینده نگر نشسته است، با انعکاس ستارگان و سیارات دور در منظره یاب، نور آبی ملایم محیط، و بافت های شیک و بسیار دقیق.”
منفجرش کن: باجه تلفن
اعلان تصویر: “یک جعبه تلفن کلاسیک قرمز انگلیسی که در یک خیابان ساکت لندن ایستاده است، سنگفرش های خیس که چراغ های خیابان را منعکس می کنند، معماری نمادین در پس زمینه، گرگ و میش عصر، دقیق و واقعی.”
Crush it: یک پیانوی بزرگ
اعلان تصویر: “پیانوی بزرگ در یک سالن کنسرت بزرگ، روکش مشکی صیقلی که منعکس کننده نورهای ملایم صحنه است، فضای داخلی زیبای سالن با پرده های مخملی قرمز و ردیف صندلی ها، فضای دراماتیک و آرام.”
کیک بپز: یک اتوبوس دو طبقه
اعلان تصویر: “اتوبوس دوطبقه قرمز روشن پارک شده در خیابان شلوغ لندن، مردم در حال عبور و ساختمان های نمادین در پس زمینه، نور خورشید بعد از ظهر، منظره شهری بسیار دقیق و واقعی.”
افکار نهایی
اگرچه همه اینها بی نقص نیستند، اما اولین نشانه ای از روش جدیدی هستند که می توان از ویدیوهای هوش مصنوعی برای ایجاد گیف و میم در آینده استفاده کرد. من توانستم از هر یک از ویدیوها گیف های 5 ثانیه ای ایجاد کنم و در هر مورد آنها زیر 10 مگابایت بودند. برای به اشتراک گذاری در رسانه های اجتماعی یا متن عالی بود.
اپل در حال حاضر با ایجاد ایموجی و سفارشیسازی تصویر بر اساس عکس افراد، برخی از هوش مصنوعی مولد خود را در جهت میم قرار داده است، بنابراین شاید این تحول آشکار بعدی باشد.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide