Runway یکی از محبوب ترین و بهترین تولید کننده های ویدئویی هوش مصنوعی است و با آخرین به روز رسانی آن، اکنون می توانید تا 1000 کاراکتر به آن فرمان بدهید.
هر مدل هوش مصنوعی در نحوه هدایت آن کمی متفاوت است، برخی مسیر طولانی و پیچیده را ترجیح می دهند در حالی که برخی دیگر چیز خاص و متمرکزتری می خواهند. به نظر می رسد که باند در وسط قرار دارد، با راهنمای مسیریابی که خواستار مشخص بودن و کمی اختصار است.
برای اینکه بفهمم آیا 1000 کاراکتر برای دستیابی به سطح قابل توجهی از واقع گرایی و حرکت از یک پیام متنی ضروری است یا خیر، یک سری مفاهیم را توسعه دادم و سپس برای هر مفهوم با پیروی از راهنمای سریع Podium، اعلان های کوتاه و بلند ایجاد کردم.
درخواست ایجاد کنید
تماشا کنید
برای هر کدام، لازم بود که با یک مفهوم کلی شروع کنم و مفهومی را شناسایی کنم که بتوان از آن یک دستور توصیفی تری ساخت. بنابراین باید ویژگی ها یا الزامات حرکتی خاصی داشته باشد.
من ترجیح میدهم از تصویر به ویدیو استفاده کنم زیرا کنترل بیشتری بر خروجی میدهد، اما Runway هنگام استفاده از متن به ویدیو کیفیت تصویر چشمگیری دارد. بنابراین تصمیم گرفتم برای این تست فقط از متن استفاده کنم. همچنین می توانید از حداکثر 1000 کاراکتر در تصویر به ویدیو استفاده کنید.
1. تکامل حمل و نقل
یک دستور یک جمله ای: “فیلم FPV با سرعت بالا: دوربین به طور یکپارچه بین دوره های مختلف جابجا می شود و تکامل حمل و نقل از دوران باستان به دوران آینده را نشان می دهد.”
پیام طولانی: «فیلم FPV با سرعت فوق العاده مداوم: دوربین به طور یکپارچه در دوره های مختلف پرواز می کند و تکامل حمل و نقل را به نمایش می گذارد. از مصر باستان با سورتمه ها و ارابه های چوبی شروع کنید و از کنار اهرام بزرگ عبور کنید. وارد اروپای قرون وسطایی شوید، جایی که کالسکههای اسبکشی در خیابانهای سنگفرششده قرار دارند. روی انقلاب صنعتی بزرگنمایی کنید، لوکوموتیوهای بخار و اولین خودروها را برجسته کنید. در قرن بیستم شیرجه بزنید، اولین پرواز برادران رایت، انتقال به هواپیماهای تجاری را که بر فراز مناظر شهر به پرواز در میآیند، به نمایش بگذارید. با ماشین های برقی شیک و قطارهای مگلو در عصر مدرن غرق شوید. حرکت دوربین شتاب میگیرد، صحنهها را محو میکند، که نشاندهنده سرعت سریع نوآوری است. با ماشینهای پرنده، سیستمهای هایپرلوپ و غلافهای تلهپورت به منظره شهری آیندهنگر بروید.»
2. پرش زمان گلدهی
طرح یک جمله ای: “زمان گذشت ثابت: یک شکوفه پر جنب و جوش از جوانه تا شکوفه کامل در یک باغ آفتابی شکوفا می شود.”
اعلان طولانی: «تصویر تایم لپس ثابت: یک جوانه گل منفرد در یک باغ آفتابی، کادر مرکزی را اشغال می کند و یک سوم پایین عکس را می گیرد. پس زمینه کمی خارج از فوکوس است و نشانه هایی از گیاهان و گل های دیگر را در رنگ های ملایم و کم رنگ نشان می دهد. با پیشرفت ویدئو، جوانه به آرامی باز می شود و لایه هایی از برگ های پر جنب و جوش ظاهر می شود. نورپردازی به تدریج از رنگ های آبی سرد صبح زود به رنگ های طلایی گرم نور خورشید در ظهر تغییر می کند. قطرات شبنم روی برگ ها نور را جذب می کنند و در حین تبخیر برق ایجاد می کنند. حشرات کوچک گهگاه روی قاب پرواز می کنند و به صحنه زندگی می بخشند. رنگ گل با باز شدن کامل تشدید می شود و به نقطه کانونی ترکیب تبدیل می شود. سایههای عناصر خارج از صفحه ممکن است برای مدت کوتاهی از صحنه عبور کنند که به معنای گذر زمان است.
3. بازتاب منظره شهری
دستور یک جمله ای: “شات ایستا: یک گودال یک منظره شهری شلوغ را با مردم و وسایل نقلیه در حال عبور منعکس می کند و یک جلوه جهان آینه ای ایجاد می کند.”
درخواست طولانی: «شات ایستا: کادر به صورت افقی تقسیم شده است، نیمه پایین گودالی را در پیادهروی شهر نشان میدهد. گودال به عنوان یک آینه عمل می کند و منعکس کننده منظره شهری شلوغ بالا است. منظره واقعی شهر نیمه بالایی قاب را می گیرد و ساختمان های مدرن، چراغ های راهنمایی و خیابان شلوغ را نشان می دهد. با پیشرفت ویدیو، پاهای افراد و قسمت های زیرین وسایل نقلیه از قاب عبور می کنند و انعکاس آنها موج هایی را در گودال ایجاد می کند. نورپردازی اواخر بعد از ظهر را تداعی می کند، با سایه های طولانی و نور گرم و طلایی خورشید که از پنجره ها و سطح آب منعکس می شود. دنیای منعکس شده در گودال تقریباً پر جنب و جوش تر از دنیای واقعی به نظر می رسد، با رنگ هایی که در اثر برخورد آب کمی تشدید می شوند. گاهی اوقات ممکن است برگ ها یا زباله ها در بالای گودال شناور شوند و انعکاس را برای مدت کوتاهی مختل کنند. کنار هم قرار گرفتن دوربین ایستا با حرکت مداوم زندگی شهری یک اثر هیپنوتیزمی ایجاد می کند.
4. قلعه شنی و جزر و مد
طرح تک جمله ای: “شات ایستا با زاویه کم: یک قلعه شنی استادانه به آرامی تسلیم جزر و مد می شود.”
اعلان طولانی: «عکس ایستا با زاویه پایین: یک قلعه شنی با رندر زیبا مرکز کادر را اشغال می کند، جزئیات پیچیده آن با نور گرم و بعد از ظهر خورشید برجسته شده است. قلعه حدود یک سوم صفحه را اشغال می کند و اقیانوس در پس زمینه قابل مشاهده است. وقتی ویدیو شروع می شود، شن های اطراف قلعه خشک شده و جزر و مد از بین رفته است. به آرامی، امواج کوچک شروع به نزدیک شدن می کنند، کف سفید آنها با ماسه طلایی متضاد است. آب ورودی بازتابی از قلعه ایجاد می کند و به صحنه عمق می بخشد. با پیشروی جزر و مد، شروع به فرسایش پایه قلعه می کند. برجها و پلهای کوچک شروع به فرو ریختن میکنند و ماسههای آنها با آب نزدیکتر مخلوط میشوند. “نور نور کمی تغییر می کند و به غروب نزدیک با رنگ های گرم تر و شدیدتر اشاره می کند.”
5. دگردیسی ابر
موضوع تک جمله ای: “عکس ایستا با زاویه باز از آسمان: یک ابر واحد به اشکال مختلف، از حیوانات گرفته تا اشیا، در آسمان غروب آفتاب پر جنب و جوش تبدیل می شود.”
اعلان طولانی: “عکس ایستا با زاویه باز از آسمان: قاب با آسمان غروب دراماتیک پر شده است که در سایه های پر جنب و جوش نارنجی، صورتی و بنفش نقاشی شده است. در مقابل این پس زمینه رنگارنگ، یک ابر مجزا و متمایز مرکز کادر را اشغال می کند. ویدئو پیشرفت می کند، ابر به آرامی به اشکال مختلف قابل تشخیص تبدیل می شود. ممکن است به صورت یک ابر کومولوس ساده شروع شود، سپس به تدریج شکل یک خرگوش با گوش های واضح و دم خزدار را به خود بگیرد و یک بادبان در حال حرکت یا شامل یک قلعه در سراسر این دگردیسی ها، رنگ آسمان اطراف به طور نامحسوس تغییر می کند و نور در حال تغییر است. خارج از صفحه) باعث می شود لبه های ابر بدرخشند و سایه های جالبی را در فرم آن ایجاد کنند.”
افکار نهایی
یک فرمان طولانی تر تفاوت بسیار بیشتری از آنچه انتظار داشتم ایجاد کرد، به خصوص با این دستورات عمدتاً مبتنی بر صحنه. اگر یک فرمان طول مشابه را که شامل انسان یا حیوانات می شود امتحان کنید، منجر به اعوجاج و خطاهای بیشتری می شود زیرا مدل سازی فیزیک حرکت دشوارتر است.
من متقاعد نیستم که شما به 1000 کاراکتر کامل نیاز دارید تا به یک نتیجه خوب برسید. در بیشتر موارد، ویدیوی یک جمله ای بد نبود، فقط جزئیات خاصی را که می خواستم از دست داده بود. اما ارزش این را دارد که از فضای موجود کمی بیشتر استفاده کنید تا در مناطق خاصی خاص تر باشید.
همچنین می توانید با شروع با یک تصویر به جای ویدیو از استفاده از اعلان های طولانی اجتناب کنید. در این صورت ویدئو مطابق این طرح رندر می شود و اعلان متن فقط برای حرکات موجود در ویدئو باقی می ماند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران