استارتاپ Runway از جدیدترین مدل ویدئوسازی هوش مصنوعی خود رونمایی کرده که توانایی تولید صحنههای پایدار و یکدست را دارد. یکی از چالشهای همیشگی ویدئوهای تولیدشده با هوش مصنوعی، عدم حفظ انسجام در شخصیتها و صحنهها است. اما مدل جدید Runway با نام Gen-4 به کاربران این امکان را میدهد که داستانهایشان را با کنترل بیشتر و پیوستگی بهتر روایت کنند.
حفظ انسجام در چندین نما با استفاده از یک تصویر مرجع
یکی از ویژگیهای مهم Gen-4 این است که به کاربران اجازه میدهد شخصیتها و اشیا را در چندین نما و زاویه مختلف، بدون تغییر ظاهری و با حفظ هماهنگی ایجاد کنند. کاربران فقط کافی است یک تصویر مرجع از شخصیت یا شیء موردنظر خود ارائه دهند و سپس با توصیف ترکیببندی دلخواه، ویدئویی یکپارچه و طبیعی دریافت کنند.
پیشرفت نسبت به نسخههای قبلی
مدل Gen-4 در حالی معرفی شده که کمتر از یک سال از انتشار نسخه Gen-3 Alpha میگذرد. نسخه قبلی توانایی تولید ویدئوهای طولانیتر را داشت، اما انتقادات زیادی را به همراه آورد، زیرا گفته میشد که روی هزاران ویدئوی اسکراپشده از یوتیوب و فیلمهای دزدی آموزش دیده است. با این حال، Gen-4 وعده داده که تجربهای بهتر و حرفهایتر را برای کاربران فراهم کند.
مثالی از عملکرد Gen-4
برای نمایش قابلیتهای این مدل جدید، Runway یک ویدئو منتشر کرده که در آن چهره یک زن در صحنههای مختلف و شرایط نوری گوناگون ثابت میماند. این نشان میدهد که مدل جدید توانایی حفظ ویژگیهای بصری شخصیتها و صحنهها را در تمام نماهای ویدئو دارد، چیزی که در نسلهای قبلی فناوری ویدئوسازی هوش مصنوعی چالشبرانگیز بود.
دسترسی کاربران به Gen-4
در حال حاضر، مدل Gen-4 برای کاربران پرداختکننده و سازمانی عرضه شده و این امکان را به سازندگان محتوا میدهد که ویدئوهایی با داستانسرایی پیوسته و حرفهایتر ایجاد کنند. این پیشرفت میتواند تأثیر بزرگی در حوزههای فیلمسازی، تبلیغات و تولید محتوا داشته باشد و مسیر جدیدی را برای ویدئوسازی هوش مصنوعی هموار کند.
آیندهای روشن برای تولید ویدئوی هوش مصنوعی
با معرفی Gen-4، به نظر میرسد که Runway توانسته یکی از بزرگترین مشکلات ویدئوهای هوش مصنوعی را برطرف کند. حفظ انسجام بصری در نماهای مختلف و کنترل بیشتر بر روی داستانسرایی، از جمله ویژگیهایی هستند که این مدل را به یک گزینه جذاب برای تولیدکنندگان محتوا تبدیل میکند. در آینده، انتظار میرود که تکنولوژیهای پیشرفتهتری در این حوزه معرفی شوند و امکانات بیشتری برای خلق ویدئوهای حرفهای در اختیار کاربران قرار گیرد.
برای مطالعه بیشتر به TheVerge مراجعه بفرمایید