من فقط با سورا کار کردم – خوب، بد، و وای.
پس از اعلام امروز سورا، من نمیتوانستم صبر کنم تا ابزار را در دست بگیرم و خودم آن را امتحان کنم. مانند بسیاری از مردم، من صبورانه منتظر OpenAI بودم تا سرانجام رندر تصویر و ویدیوی پیشرفته خود را منتشر کند. نیازی به گفتن نیست که دمو امروز در سومین ویرایش رویداد OpenAI ’12 Days of OpenAI’ بسیار هیجان انگیز بود.
اگر مشترک ChatGPT Plus هستید، 50 نسل ویدیو در ماه با Sora دریافت می کنید، در حالی که کاربران ChatGPT Pro ماهانه نسل های ویدیویی نامحدود دریافت می کنند. کسانی که دارای حساب رایگان در ChatGPT هستند هنوز نمیتوانند ویدیو بسازند، اما همچنان میتوانید از Sora.com لذت ببرید و ویدیوهای ایجاد شده توسط کاربران دیگر را کاوش کنید.
بر اساس این وب سایت، کاربران می توانند در هر کجا که ChatGPT در دسترس باشد، به جز بریتانیا، سوئیس و منطقه اقتصادی اروپا، به Sora دسترسی خواهند داشت. در حالی که ممکن است در منطقه شما در دسترس باشد، توجه داشته باشید که ممکن است به دلیل تعداد زیادی از کاربرانی که می خواهند آن را امتحان کنند، سایت کندتر از حد انتظار باشد. این چیزی است که چند ساعت پس از انتشار آن را امتحان کردم:
درخواست 1: ویدیویی که برای Tom’s Guide نوشتم.
حتی با وجود اینکه این درخواست به همان اندازه کسل کننده است، من عمدا آن را انتخاب کردم. میخواستم ببینم سورا چه نوع آزادی خلاقانهای را برای تشخیص اشتباهاتش به خرج میدهد. نقشه ام جواب داد در این ویدیو می توانید فردی را ببینید که در حال “تایپ کردن” است اما به طور کامل صفحه کلید را از دست داده است، گویی که برای الهام گرفتن روی لپ تاپ خود با عصبانیت ضبط می کند (من آنجا بودم!).
این پیشنهاد موفقیت بزرگی بود و آنچه را که قبلاً در مورد اینکه سورا به طور کلی فیزیک نمیداند نوشتم را نشان میدهد. این منطقی است زیرا فیزیک نیاز به درک چگونگی واکنش اجسام به یکدیگر دارد. شبیه به توهمات استاد، مدلهای ویدئویی سورا در ترکیب فیلمها با حرکات اجسام مشکل دارند. ویدیوهایی با ویژگی های واقعی نوری نشانه مطمئنی از این است که ویدیو با هوش مصنوعی ساخته شده است.
ادعای 2: ساحلی آرام در غروب خورشید با امواج ملایم و مرغان دریایی که بالای سرشان پرواز می کنند.
این سریع توانایی سورا در ارائه مناظر طبیعی و گرفتن تفاوت های ظریف از نور و حرکت در محیط ساحلی را آزمایش کرد. اگرچه محیط زیبا است، اما واقع بینانه نیست.
مرغ های دریایی طوری به نظر می رسند که گویی توسط یک نیروی مغناطیسی جذب می شوند و مانند بومرنگ به سرعت آزاد می شوند. نحوه پرواز آنها واقعی به نظر نمی رسد. هدف من در اینجا این است که آنقدر شگفت زده شوم که خودم را گول بزنم که از هوش مصنوعی استفاده می کنم. تا اینجای کار آنطور که فکر می کردم تحت تاثیر قرار نگرفته ام.
ادعای 3: یک خیابان شهری شلوغ در یک شب بارانی، با انعکاس تابلوهای نئونی روی سنگفرش خیس.
این سناریو مهارت سورا در به تصویر کشیدن محیط های شهری، اثرات آب و هوا و تعاملات پیچیده نور را بررسی می کند. فکر میکردم این ویدیو خیلی خوب جواب داده است، به جز یک مشکل واضح، پاهای افرادی که راه میروند.
اگر به دقت نگاه کنید، خواهید دید که گاهی اوقات پای جلویی کار را دوبرابر انجام می دهد در حالی که پای عقبی تلاش می کند به عقب بیفتد. برخی از پاها سفت به نظر می رسند در حالی که برخی دیگر تقریباً جهنده هستند. باید اعتراف کنم که نور و انعکاس آن به خصوص در گودال ها عالی بود.
ادعای 4: یک ربات آینده نگر که در جنگل قدم می زند و با حیات وحش تعامل دارد.
برای این درخواست، میخواستم عناصر علمی تخیلی را با محیطهای طبیعی ترکیب کنم تا ببینم سورا چقدر میتواند مضامین مختلف را با هم ترکیب کند. فکر میکردم هوش مصنوعی کار خوبی برای انطباق انجام داده است. سنجاب کوچولو و ربات غول پیکر انگار برای یک فیلم خانوادگی سرگرم کننده با هم آماده شده بودند.
درختان و محیط طبیعی بسیار واقعی بودند. ربات دقیقاً همان چیزی بود که انتظار داشتم یک ربات آینده شبیه آن باشد. تاکنون این نسل ویدیویی مورد علاقه من بوده است. از آنجایی که من آن را بسیار دوست داشتم، تصمیم گرفتم ابزار ترکیب را امتحان کنم تا ببینم وقتی آن را با ویدیوی قبلی ترکیب کردم چه اتفاقی می افتد.
ادعای 5: ادعای 3 را با ادعای 4 مخلوط کنید
در طول جلسه توجیهی امروز، نسخه ی نمایشی ادغام دو ویدیو بسیار هیجان انگیز به نظر می رسید. وقتی آن را امتحان کردم، از سورا خواستم منظره شهری بارانی را با ربات موجود در جنگل ترکیب کند. نتیجه چیزی بود که شبیه تایم لپس یا دوربری در داستان های علمی تخیلی بود.
منصفانه بگویم، این دو صحنه بسیار متفاوت بودند، بنابراین من انتظاری بیش از آنچه داشتم نداشتم. وقتی دوباره این کار را امتحان کنم، دو ویدیوی بسیار مشابه دیگر را با هم ترکیب میکنم و امیدوارم که ویدیوی یکپارچهتر و جامعتر داشته باشم.
درخواست 6: یک سرآشپز در یک آشپزخانه مدرن یک سبزی سرخ کردنی رنگارنگ آماده می کند.
این اعلان توانایی سورا در به تصویر کشیدن فعالیت های انسانی، جزئیات آشپزخانه و محیط های داخلی را ارزیابی می کند. این یک ویدیو بسیار واقع گرایانه بود، اما هنوز هم ایراداتی داشت.
به عنوان مثال، سرآشپز در حال مخلوط کردن سبزیجات در کاسه با فلفل های کامل و خرد نشده بود. بخار از کاسه بیرون می آمد، اما روی پیشخوان بود، نه روی اجاق گاز. شاید سبزیجات آنقدر داغ باشند؟ جدا از سبزیجات، حرکات سرآشپز، حالات چهره و جزئیات بسیار واضح بود و مرا شگفت زده کرد.
درخواست 7: ریمیکس ویدیو
من ویدیویی از پرندگان در ایوان پیدا کردم و تصمیم گرفتم با درخواست از سورا برای اضافه کردن یک گربه به ویدیو، ویدیو را دوباره ویرایش کنم. من می خواستم ویژگی های ریمیکس سورا را با دیدن نقاط قوت و محدودیت های آن ارزیابی کنم. متوجه شدم که سورا جلوتر رفت و نام آن را “برخورد اسرارآمیز کابین” گذاشت.
من قطعا توانایی سورا در خلق مناظر و موجودات را تحسین میکنم، اما تعجب میکنم که سورا واقعاً گربهای را در ویدیو نشان نداده است. در عوض، همانطور که از عنوان پیداست، آزادی خلاقانه برای مرموز ساختن بازدیدکننده کابین مورد نیاز بود.
افکار نهایی
در کل من تحت تاثیر قرار گرفتم. من از سازندگان ویدیوی دیگری استفاده کردهام که با نتایج مشابه من را شگفتزده کردهاند، اما تولیدکنندگان دیگر زمان بیشتری برای ارائه دارند. سورا به سرعت ویدیوها را ایجاد کرد. در کمتر از 5 دقیقه، دستور من به یک ویدیوی بسیار واقعی 3 تا 5 ثانیه تبدیل شد.
استفاده از سایت آسان بود و تمام ویژگی ها و کارهایی که انجام دادند مشخص بود، به خصوص پس از تماشای نسخه ی نمایشی امروز. پس از ایجاد یک ویدیو، بازگشت به خانه کمی دشوار بود. من فقط از فلش های عقب برای بازگشت به خانه و ایجاد یک درخواست جدید استفاده کردم.
همانطور که در نسخه ی نمایشی امروز ذکر شد، کاربران نباید به فکر ایجاد یک فیلم کامل به Sora وارد شوند. حتی زمانی که از ویژگی استوری بورد استفاده می کنید، ویدیوها چند ثانیه طول می کشند.
توانایی ویرایش سریع و ریمیکس ویدیوهای ایجاد شده توسط کاربران دیگر بسیار عالی است. پیامهای متفاوتی که سایر کاربران استفاده میکردند، بهویژه سادگی پیامهایی که ویدیوهای جذاب ایجاد میکردند، برایم جالب بود.
من هیجان زده هستم که بیشتر با سورا بازی کنم، اما می دانم که این 50 نکته خیلی سریع از بین خواهند رفت. من باید ارجاعاتم را عاقلانه انتخاب کنم.