Шок: чувак говорит с нейронкой голосом, а она отвечает ему в видеоформате в реальном времени! На видео — полноценный «созвон» с виртуальными Эммой Уотсон и Куртом Кобейном. Без всяких затупов, с идеальным липсинком и с рекордно низкой задержкой в 1,5 секунды. Работает это всё на нейронке Mistral и куче других технологий — они обрабатывают вашу речь, формируют ответ и тут же выдают ответное видео со звуком и липсинком. И всё это отлично тянет даже RTX 3060 на 12 GB! Код в открытом доступе лежит тут. ()
Hide player controls
Hide resume playing