Sora را فراموش کنید – Kling یک مدل ویدیویی جدید هوش مصنوعی عالی است و من تحت تأثیر قرار گرفتم
به نظر میرسد یک مدل ویدیویی جدید هوش مصنوعی به نام Kling بسیاری از ویژگیهایی را ارائه میدهد که در ابتدای سال جاری، OpenAI's Sora را متمایز کرد.
که توسط شرکت چینی پلتفرم ویدئویی Kuaishou توسعه یافته است، ویژگیهای آن شامل نسلهای طولانیتر ویدیو، حرکت بهبودیافته، ردیابی سریعتر و سکانسهای چند شات است. برخلاف Sora، به نظر می رسد Kling در حال حاضر از طریق لیست انتظار در دسترس کاربران است.
OpenAI سورا را در ماه فوریه معرفی کرد و ما شاهد تعداد فزایندهای از سازندگان هستیم که از آن استفاده میکنند. اینها شامل پنج فیلمساز برنده جایزه است که هفته آینده فیلم های کوتاه تولید سورا را در جشنواره فیلم ترایبکا به نمایش خواهند گذاشت. با این حال، هنوز به طور گسترده در دسترس عموم نیست.
در میان کلیپ هایی که کلینگ به اشتراک گذاشت، پسری سوار بر دوچرخه، اسبی در صحرا، کلیپی طولانی از فردی در حال خوردن رشته فرنگی و ویدیویی واقعی از پسر جوانی که در حال خوردن همبرگر بود، دیدیم.
از کلینگ چه می دانیم؟
مدل جدید تولید هوش مصنوعی ویدئویی DiT چین 【KLING】دسترسی باز!ایجاد ویدئو 120s با FPS30 1080P، درک بهتر فیزیک، مدل سازی دقیق حرکت پیچیده سریع: سفر با قطار، مشاهده انواع مناظر از پنجره.https://t. co /hTwiEHRza2 pic.twitter.com/nBvnAsqd1O6 ژوئن 2024
به گفته Kuaishou، Kling می تواند تا دو دقیقه ویدیو با کیفیت 1080p با سرعت 30 فریم در ثانیه با یک فرمان تولید کند. همچنین فیزیک دنیای واقعی را به دقت شبیه سازی می کند، چیزی که اکثر مدل های هوش مصنوعی با آن دست و پنجه نرم می کنند.
این یک مدل ترانسفورماتور دیفیوژن است که مشابه Sora است و از مدل خاصی استفاده می کند که می تواند نسبت های مختلف و انواع شات را پشتیبانی کند.
وب سایت این شرکت گفته است، علاوه بر قابلیت های تولیدی، Kling قابلیت بازسازی سه بعدی صورت و بدن را برای بهبود بیان کامل و حرکت اندام ها در ویدئو دارد.
چیزی که ما هنوز نمی دانیم این است که آیا Kling یا حتی دیگر مدل ویدیویی اصلی چینی هوش مصنوعی، Vidu، در خارج از چین عرضه می شود یا خیر. این می تواند فضل نجات OpenAI در غرب باشد.
ویدیوهای کلینگ چه شکلی هستند؟
چشمگیرترین بخش ویدیوها، فوتورئالیسم است. برخی از کلیپ ها از تاری مشابه آنچه در سایر ویدیوهای هوش مصنوعی دیده ایم رنج می برند، اما نه در مقیاس مشابه.
یک کلیپ طوطی وجود دارد که به سختی می توانید بگویید واقعی نیست، و من هنوز مطمئن نیستم که ویدیوی همبرگر تقلبی نباشد.
یکی از ویدیوهایی که بارها پخش کردم ریختن مایع بود. ما با مشکلات زیادی مواجه شدیم، اما به نظر میرسید که کلینگ آن را درست انجام داده است، حداقل در مورد ریختن شیر در یک فنجان قهوه.
در مجموع، به نظر میرسد که Kling توانایی ایجاد حرکت دقیق، مدلسازی بهتر حرکت و فیزیک دنیای واقعی و ایجاد تصویری واقعی از جهان را دارد.
این برای سورا چه معنایی دارد؟
امیدوارم این شرکت نسخه گستردهتری را در نظر بگیرد که آن را در خارج از چین در دسترس قرار دهد، زیرا رقابت برای خلاقیت و نوآوری خوب است. ما امیدواریم که انتشار این باعث شود OpenAI سریعتر از آنچه در حال حاضر برنامه ریزی شده است، Sora را وارد بازار کند.
OpenAI همچنین با بازیکنان موجود مانند Runway و Pika Labs رقابت می کند و هر دو در حال ارتقای بازی های خود هستند. تازه واردانی مانند Haiper، LTX Studio و Higgsfield نیز وجود دارند که هر کدام رویکردهای متفاوتی را برای ویدیوهای هوش مصنوعی اتخاذ می کنند و مدل جدید Veo گوگل نیز وجود دارد.
حقیقت این است که تاخیر OpenAI به دلیل امنیت است، نه در دسترس بودن فنی. این شرکت میگوید که میخواهد اطمینان حاصل کند که این مدل قبل از انتشار عمومی نمیتواند برای اطلاعات نادرست یا اهداف مخرب استفاده شود. آنها همچنین باید آن را سریعتر و ارزان تر کنند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide