Recraft، آزمایشگاه هوش مصنوعی پشت مدل ویروسی Red Panda، ممکن است یکی از قویترین پلتفرمها برای رندر تولیدی باشد که من تا به حال استفاده کردهام. علاوه بر ایجاد رندر فوتورئالیستی و حتی گرافیک برداری، یک ویرایشگر چشمگیر دارد که بر روی مدل های اولیه ساخته شده است.
مدت کوتاهی قبل از اینکه مشخص شود Red Panda در واقع Recraft نسخه 3 است، من این فرصت را داشتم که با بنیانگذار و مدیر عامل Recraft، Anna Veronika Dorogush صحبت کنم تا بینشی در مورد آنچه که این پلتفرم را از سایرین متمایز می کند، از جمله Midjourney، Ideogram و حتی Canva را بدست بیاورم.
Recraft از ابتدا به عنوان یک ابزار طراحی هوش مصنوعی طراحی شد تا یک تولید کننده تصویر. این شامل ایجاد سبکهای ثابت، ویرایش و رنگ آمیزی تصاویر میشود تا اطمینان حاصل شود که دقیقاً همان چیزی را که در خروجی دنبال میکنید به دست میآورید. متن آن نیز آن را خارق العاده می کند. این لیست ما از بهترین مدل های نمایشگر هوش مصنوعی را تشکیل می دهد.
دوروگوش به من گفت: «تو باید چیزی منحصر به فرد بسازی. تولید تصاویر با کیفیت کافی نیست، بلکه باید چیزی خلق کنید که توجه مردم را به خود جلب کند.»
با Recraft چه کاری می توانید انجام دهید؟
Recraft; می توان از آن برای ایجاد تصاویر، متن رندر شده، گرافیک های برداری و انواع هنرهای مولد هوش مصنوعی استفاده کرد. قدرت واقعی آن در ویرایشگر مستقل از مدل نهفته است. من توانستم خیلی سریع یک پوستر ایجاد کنم و عناصر خاصی را برای مطابقت بهتر با نیازهایم ویرایش کنم.
ویرایشگر، که به عنوان بوم بینهایت نیز شناخته میشود، مدتی است که وجود داشته است، اما این نسخه جدید و چشمگیر Recraft v3 (معروف به Red Panda) بود که توجه بیشتری را به این ابتکار جلب کرد.
توانایی ارائه دقیق متن، پیروی از دستورات و ایجاد تصاویر واقعی به Recraft کمک می کند تا در بازار بسیار شلوغ برجسته شود. Recraft به لطف ویژگی های بوم و قابلیت ویرایش، خود را به عنوان یک پلت فرم طراحی قدرتمند تثبیت کرده است.
با این حال، سایر پلتفرمهای اصلی هوش مصنوعی اکنون در حال توسعه ویرایشگرهایی مانند Ideogram و Midjourney هستند و ویرایشگرانی مانند Canva و Illustrator نیز در حال اضافه کردن هوش مصنوعی هستند. بنابراین مدل جدید به حفظ آن کمک می کند.
متن کلیدی برای بهبود طراحی هوش مصنوعی است
دورگوش به من گفت که ماه ها کار روی مدل جدید انجام شد، از جمله ایجاد تکنیک متفاوتی برای آموزش داده ها به طور خاص برای ارائه خروجی دقیق تر از متن.
او به تامز گاید گفت: «دو پیشرفت بزرگ داریم. “یکی توانایی تولید متون طولانی” و دیگری زیبایی شناسی است. خروجی بهتر به نظر می رسد، سبک ها سازگارتر هستند و واقع گرایی نسبت به نسل های قبلی پیشرفت قابل توجهی دارد.
همه اینها منجر به صعود “Red Panda” به صدر جدول امتیازات رندرهای هوش مصنوعی شده است. این شامل افراد می شود که خروجی دو مدل ناشناس را در یک اعلان رتبه بندی می کنند. Recraft v3 به Midjourney، Ideogram و Flux در بالای لیست می پیوندد.
همه مدلها از نظر زیباییشناسی و واقعگرایی به طور کلی در حال بهبود هستند، اما تعداد کمی از آنها موفق میشوند بلوکهای طولانی یا چند متنی را با دقت ارائه کنند. اگر خود را به عنوان یک پلتفرم طراحی و نه فقط یک خالق تصویر تبلیغ می کنید، این یک مهارت ضروری است.
Recraft این را با نسخه 3 شکست. دوروگوش توضیح داد: ما از تکنیک متفاوتی استفاده می کنیم و تا آنجا که من می دانم تنها ما در حال حاضر از این تکنیک استفاده می کنیم. “به جای آموزش مدل فقط با تصویر و فونت، موقعیت متن را نیز وارد می کنیم.”
ابتدا موقعیت های متن را پیش بینی می کنیم، سپس آنها را به عنوان ورودی مدل قرار می دهیم. بنابراین مدل اطلاعات بیشتری در مورد نحوه ترسیم متن دارد و انجام این کار برای مدل آسانتر است.
آینده Recraft چیست؟
سوررئالیست درونی خود را آزاد کنید! به لطف ویژگی نقاشی Recraft، تغییرات کوچک بیانیه های هنری بزرگی را ایجاد می کند. فقط کمند را انتخاب کنید، منطقه را مشخص کنید، دستور را تایپ کنید و روی “Recreate” کلیک کنید. ماگریت افتخار می کند. شروع به ایجاد کنید: https://t.co/t6beRXHrlG#RecraftAI #red_panda pic.twitter.com/XZvuOUgGGy7 نوامبر 2024
Recraft نیاز به بهبود سازگاری شخصیت دارد. همه مدلهای تصویر هوش مصنوعی باید روی سازگاری کاراکترها کار کنند، و برخی باید این مشکل را از طریق بهینهسازی یا ارجاع تصویر برطرف کنند. اما اگر شرکتی هستید که محصول خود را به سمت طراحان هدایت میکنید، این مهمتر است.
تصور کنید می خواهید یک تصویر برای یک کمپین با یک مدل ایجاد کنید. شما تصویر مدل (شخصیت خود) را ایجاد می کنید و عالی به نظر می رسد، اما هر تصویر بعدی از همان مدل شبیه یک فرد کمی متفاوت به نظر می رسد. بدون کار بر روی سازگاری شخصیت، این وضعیت فعلی است و در محیط های طراحی حرفه ای کار نخواهد کرد.
دوروگوش توضیح داد: «کار در حال انجام است» در مورد سازگاری شخصیت، و افزود که او «بسیار آگاه است که این موضوع مهمی است». اما این فراتر از حل مدل است، زیرا همه چیز را در تصویر شامل می شود، از جمله محصولی که می تواند تمرکز کمپین باشد.
به عنوان یک راه حل کوتاه مدت می توان رنگ آمیزی داخلی و بیرونی را انجام داد. این راهی برای ویرایش یک تصویر هوش مصنوعی موجود (یا هر تصویر) با استفاده از هوش مصنوعی است. برای مثال، میتوانید یک پوستر با فضا برای تلفن ایجاد کنید و پس از ایجاد صفحه نمایش، از نقاشی داخلی برای تطبیق آن استفاده کنید. این همچنین برای ویرایش متن پس از ایجاد آن مفید است. زیرا حتی بهترین مدل ها هم اشتباه می کنند یا فونت دقیق را بار اول درست نمی کنند.
دورگوش گفت: «در چند ماه آینده بهبودهایی حاصل خواهد شد. اینها شامل عملکرد ویرایش است. برای مثال، در حال حاضر میتوانید یک تصویر با متن ایجاد کنید یا آن را از طریق متن قرار دهید، اما با inpainting میتوانید یک جعبه متن را قرار دهید و متن دقیقی را که میخواهید در آن قسمت ایجاد کنید.
بهروزرسانیهای دیگر، از جمله بهبود نقاشی بیرونی، به زودی ارائه میشود. او گفت: «این برای سناریوهای تولید بسیار مهم است. بدون تغییر نقطه کانونی اصلی، “می توانید تصویر را به صورت افقی یا عمودی گسترش دهید تا تصویر را در قالب های مختلف برای الگوهای مختلف داشته باشید.”
افکار نهایی
Recraft جدیدترین محصول در خط رو به رشد “محصولات” هوش مصنوعی است. اول از همه، ما از مدل و آنچه که به طور بالقوه می تواند به آن دست یابد، به سمت ایجاد یک محصول در دنیای واقعی با موارد و ابزار واقعی حرکت می کنیم.
Midjourney و Ideogram با Editor و Canvas در این مسیر حرکت می کنند. حتی ChatGPT اکنون یک بوم برای ویرایش متن و کد دارد و کلود نیز پروژه ها و مصنوعات دارد. این مسیری است که ابزارهای هوش مصنوعی در آن حرکت خواهند کرد، و همانطور که در Red Panda دیدیم، هرچه مدل پایه بهتر باشد، محصولات بالای آنها می توانند عملکرد بهتری داشته باشند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران