Runway و Kling دو تا از بهترین مدل های هوش مصنوعی امروزی هستند. این امکان وجود دارد که سورای OpenAI آنها را شکست دهد، اما به طور گسترده در دسترس نیست، بنابراین من راهی برای مقایسه ندارم.
برای اینکه بفهمم کدام یک از این دو بهترین است، Runway و Kling را در یک سری چالشها که شامل حرکات پیچیده دوربین، حرکات ماکرو انسان و صحنههای دشوار رندر میشود، آزمایش کردم.
Runway ایجاد ویدیوی نامحدود در حالت کاوش را با 95 دلار در ماه ارائه می دهد. طرح برتر Kling 92 دلار در ماه برای 8000 اعتبار است. یک تولید 10 ثانیه ای 70 اعتبار هزینه دارد. از نظر عملکرد، Runway بسیار سریعتر از Kling است، به خصوص اگر به حالت Turbo بروید. با این حال، هنگام استفاده از طرح نامحدود، شما به دو نسل به طور همزمان محدود می شوید.
به طور کلی، Runway و Kling از نظر ویژگی ها و عملکرد در دسترس تا حد زیادی قابل مقایسه هستند. ویژگیهایی مانند براش حرکتی وجود دارد که فقط در Kling موجود است و ویدیو به ویدیو که مختص Runway است، اما از نظر ویژگیها تقریباً برابر هستند. بنابراین کار به ایجاد ویدیو می رسد. هر دو در لیست من از بهترین سازندگان ویدیوی هوش مصنوعی هستند.
در اینجا نحوه مقایسه Runway و Kling ما نشان داده شده است.
نمره دادن به آزمون
آزمایش چیزی بصری یا خلاقانه ذهنی خواهد بود، اما این بدان معنا نیست که ما نمی توانیم در مورد این فرآیند علمی باشیم. من یک روبریک تهیه کردم که شایستگی های لازم برای یک ویدیوی هوش مصنوعی خوب و واقعی را بررسی می کند. هر دسته حداکثر 10 امتیاز دارد.
برخی از اینها حوزه هایی هستند که هوش مصنوعی به طور سنتی با آنها دست و پنجه نرم می کرد، مانند حرکت دقیق انسان یا ثبات بصری. برخی دیگر، مانند تطبیق سریع، از یک مدل به مدل دیگر متفاوت هستند، اما به همین دلیل است که من فقط با متن به ویدیو کار میکنم، زیرا به کنترل بیشتری از هوش مصنوعی نیاز دارد.
- کیفیت بصری: وضوح تصویر کلی، جزئیات و واقع گرایی را ارزیابی کنید.
- یکنواختی حرکت: ارزیابی کنید که حرکات چقدر طبیعی و روان هستند.
- Quick Fit: تعیین کنید ویدیوی ایجاد شده چقدر با درخواست داده شده مطابقت دارد.
- خلاقیت/تفسیر: به تفسیر خلاقانه AI از اعلان امتیاز دهید، به خصوص برای مفاهیم انتزاعی تر.
- کاربرد فنی: جنبه های فنی خاص مانند نورپردازی، حرکات دوربین و انتقال را در نظر بگیرید.
درخواست ایجاد کنید
آزمایش دو مدل ویدیویی بسیار متفاوت با هوش مصنوعی به سادگی ارسال یک پیام به هر دو و مقایسه خروجی نیست. این یکی از راههای انجام آزمایش است، اما به هر مدلی این فرصت را نمیدهد که بهترین عملکرد خود را داشته باشد.
من از دستورات Kling و Runway برای اصلاح دستورات خاص در هر یک از پنج تست استفاده کردم تا تصویر بهتری از نحوه مقایسه آنها در کارهای مشابه بدست آوریم. اینها ایده یکسانی دارند و منصفانه هستند اما متناسب با هر مدلی هستند.
من تمام تست ها را روی Kling به مدت 10 ثانیه در حالت حرفه ای و روی Runway در Gen-3 Alpha معمولی (و نه حالت توربو) انجام دادم اما در غیر این صورت تمام تنظیمات را در حالت پیش فرض قرار دادم.
1. تست خودرو
ابتدا، خواهیم دید که هر مدل چقدر حرکت واقعی وسیله نقلیه را ثبت می کند و آن را در یک محیط پویا ادغام می کند. من به دنبال خودروی اسپرتی میگردم که رو به جلو باشد، جایی که دوربین ثابت بماند و با نیازهای روشنایی مطابقت داشته باشد.
باند
هشدار مسیر: «شات استاتیک با زاویه پایین: یک ماشین اسپرت شیک در یک جاده ساحلی پر پیچ و خم شتاب میگیرد. خودرو به صورت پویا حرکت می کند و پیچ های جاده را در بر می گیرد. نورپردازی سینمایی، ساعت طلایی بعد از ظهر. با نزدیک شدن و عبور ماشین، دوربین ثابت می ماند.»
کلینگ
Kling Prompt: «یک ماشین اسپورت شیک با سرعت در یک جاده ساحلی پر پیچ و خم حرکت می کند. وسیله نقلیه به صورت پویا حرکت می کند و پیچ ها را در آغوش می گیرد. روشنایی ساعت طلایی در بعد از ظهر. دوربین: عکس ایستا با زاویه پایین، موقعیت ثابت در حین نزدیک شدن و پاس کردن ماشین.
سلول سرصفحه – ستون 0 | باند | کلینگ |
---|---|---|
کیفیت بصری | 5 | 7 |
یکنواختی حرکت | 7 | 6 |
Quick Fit | 5 | 7 |
خلاقیت/تفسیر | 5 | 6 |
کاربرد فنی | 6 | 7 |
مجموع | 28 | 33 |
آزمون نفر دوم
برای آزمون دوم، هر مدلی را خواهیم داشت که فردی را در یک محیط اجتماعی به تصویر بکشد. تمرکز روی حالات و حرکات صورت است، اما من همچنین خواهم دید که چگونه اینها با محیط تعامل دارند و آیا تعداد انگشتان فرد مناسب است یا خیر.
جنسیت را هم مشخص نکردم که ببینم مدل به کدام سمت می رود. من گمان میکنم که کلمه “متحرک” نیز آنها را تحریک میکند و این عنصر فیلمبرداری شده با گوشیهای هوشمند را نادیده میگیرد، بنابراین ما ظاهری واقعبینانه نخواهیم داشت.
باند
هشدار آهنگ: «شات ردیابی از نمای نزدیک متوسط: شخصی در یک کافه پرجنبوجوش نشسته و درگیر یک مکالمه متحرک میشود. دوربین به آرامی از چپ به راست حرکت میکند و محیط پر جنب و جوش کافه را بیشتر نمایان میکند. نور ملایم و گرم. اکشن طبیعی و به سبک مستند.»
کلینگ
Kling Prompt: «عکس گوشی هوشمند شخصی که در یک کافه شلوغ نشسته و در یک مکالمه متحرک شرکت می کند. نور ملایم و گرم فضای پر جنب و جوش کافه را برجسته می کند. حرکت دوربین: حرکت آهسته از چپ به راست، عکس ردیابی از نمای نزدیک متوسط. سبک طبیعی و مستند.»
سلول سرصفحه – ستون 0 | باند | کلینگ |
---|---|---|
کیفیت بصری | 4 | 6 |
یکنواختی حرکت | 2 | 6 |
Quick Fit | 8 | 8 |
خلاقیت/تفسیر | 7 | 6 |
کاربرد فنی | 3 | 5 |
مجموع | 24 | 31 |
3. تست پرتاب موشک
یکی از آزمایشهایی که از زمان اولین نسخه از باند روی هر مدلی امتحان کردهام، این بود که ببینم چگونه پرتاب موشک را انجام میدهد. این یک تست سرگرم کننده است زیرا به مدل نیاز دارد تا دود در حال افزایش، حرکت شناور و زمان لازم برای قرار گرفتن در کلیپ 10 ثانیه ای را ثبت کند.
باند
اخطار باند: «شات عریض در حال انتقال به اقدام پویا: یک موشک بزرگ روی سکوی پرتاب، موتورهایی که با شعله و دود شدید مشتعل میشوند. دوربین ثابت شروع می شود، سپس با بلند شدن موشک به طور قابل توجهی به عقب و بالا می رود و مقیاس محل پرتاب را آشکار می کند. کنتراست نور شدید بین شعله موشک و محیط اطراف آن.
کلینگ
فرماندهی کلینگ: «یک موشک بزرگ روی سکوی پرتاب، موتورهایی که با شعله و دود شدید مشتعل میشوند. موشک بلند می شود و مقیاس محل پرتاب آشکار می شود. کنتراست نور شدید بین شعله موشک و محیط اطراف. حرکت دوربین: با یک عکس زاویه باز ثابت شروع کنید، سپس با بالا رفتن موشک به طور چشمگیری به عقب و بالا بروید.
سلول سرصفحه – ستون 0 | باند | کلینگ |
---|---|---|
کیفیت بصری | 7 | 7 |
یکنواختی حرکت | 7 | 6 |
Quick Fit | 8 | 6 |
خلاقیت/تفسیر | 5 | 7 |
کاربرد فنی | 6 | 7 |
مجموع | 32 | 34 |
4. تست منظره طبیعت
در این آزمایش ماقبل آخر، می خواهم ببینم که چگونه مدل ها هم حرکت سریع و هم پیچیدگی محیط طبیعی را مدیریت می کنند. باید از سایه بان یک جنگل بارانی پرواز کند و به یک صحنه بوته ای تبدیل شود. نفسم حبس نمیشه
باند
اخطار آهنگ: «تصویربرداری مداوم FPV با سرعت فوقالعاده: دوربین بهطور مداوم از میان جنگلهای بارانی سرسبز پرواز میکند و از میان درختان بلند عبور میکند. نور خورشید از طریق سایبان عبور می کند و نوری را در کف جنگل ایجاد می کند. صحنه از بوته انبوه به یک آبشار مخفی تبدیل میشود، قطرات آب در حرکت آهسته میدرخشند.»
کلینگ
Kling Prompt: «یک جنگل بارانی سرسبز پر از درختان سر به فلک کشیده. نور خورشید از طریق سایبان عبور می کند و نوری را در کف جنگل ایجاد می کند. صحنه از بوته انبوه به یک آبشار مخفی تبدیل می شود، قطرات آب درخشان. حرکت دوربین: FPV مداوم با سرعت بالا، سرگردانی در میان درختان، پایان دادن به آبشار با افکت اسلوموشن.”
دسته بندی | باند | کلینگ |
---|---|---|
کیفیت بصری | 7 | 5 |
یکنواختی حرکت | 7 | 7 |
Quick Fit | 8 | 6 |
خلاقیت/تفسیر | 8 | 5 |
کاربرد فنی | 7 | 7 |
مجموع | 37 | 30 |
5. تست مفهومی چکیده
در نهایت، میخواهم ببینم مدلها چگونه میتوانند یک مفهوم انتزاعی را مدیریت کنند. در اینجا، آنها باید در یک شات نشان دهند که چگونه یک دانه به درخت تبدیل می شود، اما به دیدگاه های متفاوتی نیز نیاز دارد.
باند
اعلان مسیر: «سینماتوگرافی ماکرو در حال گذار به زاویه عریض: نمایی با گذشت زمان از جوانه زدن دانه در درختی عظیم. دوربین بسیار نزدیک به دانه شروع می شود، سپس به تدریج عقب می کشد تا کل چرخه زندگی را نشان دهد. صحنه از خاک به یک جنگل وسیع تغییر می کند. با بلوغ درخت، نور پراکنده از رنگ های سرد به رنگ های گرم تبدیل می شود.
کلینگ
Kling Prompt: «تجسم رشد با گذشت زمان: یک دانه جوانه می زند و به درختی بزرگ تبدیل می شود. این صحنه مفهوم رشد از خاک به یک جنگل وسیع را نشان می دهد. همانطور که درخت بالغ می شود، نور از رنگ های سرد به گرم تبدیل می شود. حرکت دوربین: با یک عکس ماکرو شدید از دانه شروع کنید، به تدریج به عقب بکشید تا کل چرخه زندگی و جنگل اطراف را نشان دهید.
دسته بندی | باند | کلینگ |
---|---|---|
کیفیت بصری | 5 | 5 |
یکنواختی حرکت | 6 | 6 |
Quick Fit | 7 | 5 |
خلاقیت/تفسیر | 7 | 4 |
کاربرد فنی | 6 | 4 |
مجموع | 31 | 24 |
برنده: کلینگ
نمره در هر آزمون تا حد زیادی ذهنی بود و بر اساس یک واکنش اولیه و یک فکر دوم زمانی که یک روز بعد مشاهده شد. به عنوان مثال، در تست ماشین من به طور غریزی به Kling یک برد آسان دادم، اما در تماشای دوم آن را بسیار نزدیکتر کردم.
من نمرات هر Kling و Runway را بر اساس هر عنصر روبریک جمع کردم و سپس نمره هر آزمون را اضافه کردم تا به مجموع دست یابیم.
سلول سرصفحه – ستون 0 | باند | کلینگ |
---|---|---|
تست خودرو | 26 | 33 |
تست شخص | 24 | 31 |
تست موشک | 32 | 34 |
صحنه طبیعت | 37 | 30 |
مفهوم انتزاعی | 31 | 24 |
مجموع | 150 | 152 |
این یک مسابقه بسیار نزدیک بین این دو مدل بود و آنها در هیچ یک از تستها به خوبی درخشیدند یا بهترین عملکرد خود را نداشتند. لحظات درخشانی وجود داشت، مانند پرتاب موشک از کلینگ یا درخت از باند، اما این یک ویدیوی کلی برنده نبود که به خط پایان رسید.
چیزی که این نشان می دهد این است که اگر آن را به درستی هدایت کنید و از راهنماهای ارائه شده برای هر سازنده ویدیوی هوش مصنوعی استفاده کنید، می توانید از هر یک و حتی احتمالات پاسخ بهتری دریافت کنید. همچنین ارزش این را دارد که روز بعد برگردیم و دوباره نگاهی بیندازیم.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران