Итак, у китайцев новая видеомодель - Vchitect Китайцы не простые. Авторы того самого VEnhancer . Что есть: Text-to-video Image-to-video Длительность до 20 секунд. Но больше всего интригует вот это: High-definition quality, integrated super-resolution, и внимание, вставка кадров с возможностью пользовательской коррекции контента. Ну и судя по разрешениям видосов у них на сайте(4K), VEnhancer там явно порылся. И все это вроде как Open Source Чего нет: Кода, хотя вот тут есть все ссылки на репу, но они битые. Демо, хотя вот тут есть все ссылки на демо, но они битые. Бумаги, есть только ссылка Coming Soon Если заопенсорсят, то это конечно, очень здорово. Судя по аккаунту на гитхабе, у них там ресерч отличный:
Hide player controls
Hide resume playing