TikTok ممکن است پس از انتشار مدل جدید هوش مصنوعی توسط ByteDance، یک سازنده ویدیو با هوش مصنوعی داشته باشد – این چیزی است که ما می دانیم
ByteDance، شرکت چینی پشت TikTok و ویرایشگر ویدیوی ویروسی CapCut، اولین مدل تبدیل متن به ویدئوی هوش مصنوعی خود را منتشر کرده است که برای رقابت با OpenAI Sora که هنوز منتشر نشده است طراحی شده است – اما در حال حاضر فقط در چین در دسترس است.
Jimeng AI توسط Faceu Technology، یک شرکت متعلق به ByteDance که برنامه ویرایش ویدیوی CaptCut را تولید می کند، توسعه یافته است و برای آیفون، اندروید و آنلاین در دسترس است.
برای دسترسی به آن، باید با یک حساب کاربری Douyin، نسخه چینی TikTok وارد شوید. این نشان می دهد که اگر به مناطق دیگر بیاید به TikTok یا CapCut متصل می شود. این امکان وجود دارد که نسخه ای از Jimeng در آینده در CapCut ادغام شود، اما کاملاً فرضی است.
ByteDance تنها شرکت چینی نیست که مدلهای ویدیویی هوش مصنوعی را توسعه میدهد. Kuaishou یکی از بزرگترین برنامه های ویدیویی چین است و ماه گذشته ویدیوی Kling AI را برای اولین بار در خارج از چین در دسترس قرار داد. یکی از ابزارهای هوش مصنوعی مورد علاقه من با کیفیت حرکت چشمگیر و رئالیسم ویدیویی.
هوش مصنوعی جیمنگ چیست؟
Jimeng AI یک مدل تبدیل متن به ویدیو است که توسط Faceu Technology، شرکت چینی پشتیبان ویرایشگر ویدیوی CapCut آموزش دیده و اداره می شود. Kling، Sora، مانند Runway و Luma Labs Dream Machine، یک ورودی متنی می گیرد و چند ثانیه محتوای ویدیویی واقعی تولید می کند.
خود را به عنوان یک پلتفرم ایجاد هوش مصنوعی یک مرحله ای معرفی می کند، می تواند ویدیو را از متن یا تصاویر تولید کند و به شما امکان کنترل حرکت دوربین و ورودی اول و آخر فریم را بدهد. این چیزی است که اکثر سازندگان ویدیوی هوش مصنوعی مدرن ارائه می دهند. شما به آن دو تصویر می دهید و لحظات بین آنها را پر می کند.
تمرکز Faceu روی اطمینان از این بود که مدلش می تواند اعلان های متن چینی را درک کند و به دقت دنبال کند و ایده های انتزاعی را به آثار بصری تبدیل کند.
هوش مصنوعی جیمنگ چگونه مقایسه می شود؟
از کلیپهای ویدیویی که در رسانههای اجتماعی و وبسایت جیمنگ دیدهام، به نظر میرسد که سورا به Runway Gen-2 یا Pika Labs نزدیکتر از Gen-3 یا حتی Kling است. حرکت ویدیویی کمی تار یا لرزان به نظر می رسد و خروجی آن بیشتر خنده دار است تا واقعی.
چیزی که من نمی توانم تأیید کنم، زیرا در خارج از چین در دسترس نیست، این است که طول هر کلیپ ویدیویی در نسل اول چقدر است یا اینکه آیا می توانید یک کلیپ را گسترش دهید.
اکثر وسایل نقلیه، از جمله Kling، 5 ثانیه شروع می شوند، در حالی که طبق گزارش ها، Runway 10 ثانیه و Sora 15 ثانیه است. بسیاری نیز اجازه چندین افزونه را در این کلیپ اول می دهند.
ماهیت تلفن همراه جیمنگ و اتکا به برنامه هایی مانند Douyin و CapCut آن را در دسته بندی متفاوتی از برنامه هایی مانند Kling و Dream Machine قرار می دهد. از آنجایی که محتوای آن عمدتاً بهجای تولید به سمت ویدیوهای اجتماعی میرود، با برنامههایی مانند Captions App یا Diffuse قابل مقایسه است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide