Vidu، یک مدل بزرگ AI برای تولید ویدئو، به تازگی در نشست Zhongguancun Forum 2024 در پکن معرفی شده است. این مدل، حاصل همکاری دانشگاه تسینگهوا و شرکت فناوری AI چینی ShengShu است و اولین مدل هوش مصنوعی ویدیویی در چین محسوب میشود که قابلیتهای بینظیری از جمله مدت زمان طولانیتر، یکپارچگی و پویایی بالا در تولید ویدئو دارد.
این مدل بومی چین، در پردازش و ایجاد محتوای مرتبط با عناصر فرهنگی همچون پاندا و اژدهای چینی، از عملکرد ویژهای برخوردار است. بنا بر ادعای شرکت سازنده، معماری اولیه Vidu در سال 2022 ارائه شده و مشابه معماری Diffusion Transformer در مدل Sora (OpenAI) است.

قابلیتها و کیفیت ویدئویی Vidu
Vidu، این رقیب جدید Sora، میتواند ویدئوهایی با کیفیت 1080p و مدت 16 ثانیه تولید کند. این مدل پیشرفته، برای تبدیل توضیحات متنی به ویدئوهای پویا و با کیفیت بالا طراحی شده است. Vidu نه تنها محتوا را در سطح پایه تفسیر میکند، بلکه از متن ورودی، ویدئوهایی واقعگرایانه با طیف گستردهای از صحنهها، شخصیتها و حرکات ایجاد مینماید.
این مدل، سیر ویدئویی مرتبط با داستان یا دستورالعملهای توضیح داده شده در متن را با تنظیمات، تعاملات و حرکات متناسب با خط داستانی تولید میکند.
در یک نمایش زنده، Vidu توانست دنیای فیزیکی واقعی را شبیهسازی کند و صحنههایی را براساس قوانین فیزیکی واقعی از جمله روشنایی و سایههای واقعگرایانه و حالات چهره جزئی ایجاد نماید، علاوه بر آن، این مدل قادر به تولید دنبالههای پویای پیچیده به جای تصاویر ساکن است.
دسترسی به Vidu
با وجود عملکرد بسیار امیدوارکننده این مدل، اما سوال اصلی این است که آیا کاربران میتوانند به Vidu دسترسی داشته و قابلیتهای آن را آزمایش کنند؟ در کل، میتوان گفت این امکان با محدودیتهایی وجود دارد. Vidu به صورت آزاد از طریق لینک در دسترس عموم نیست، اما هرکس میتواند برای دریافت دسترسی به این مدل AI ویدئویی جدید چینی درخواست بدهد. برای ارسال درخواست دسترسی به Vidu، مراحل زیر را باید انجام داد:
- به لینک https://www.shengshu-ai.com/home بروید.
- دکمه آبی رنگ را در گوشه بالا سمت راست کلیک کنید.
- یک فرم با چند فیلد مشاهده خواهید کرد. آن را تکمیل کنید.