Myvideo

Guest

Login

OCTAVE (Omni-Capable Text and Voice Engine) На полянке генерации голосов и вообще голосовых вводоввыводов становится довольно ж

Uploaded By: Myvideo
1 view
0
0 votes
0

OCTAVE (Omni-Capable Text and Voice Engine) На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно жарко и интересно. Тут вот Hume AI разродился Октавой. Это “speech-language model“ с интересными фишками типа создания голоса и личности “на лету“, генерацию голосов промптами и всяко-разно другое. Мне понравился сербский акцент и бруклинский таксист. Можно сказать, что это ChatGPT Advanced Voice Mode, Elevenlabs Voice Design и Google NotebookLM в одном флаконе - просматривается некий будущий вижен, а не только голос в чатике. Поглядите тут, сравнение с LLM тоже интересно: На основе очень короткого аудиофрагмента (~5 с) OCTAVE не только имитирует голос говорящего, но и в значительной степени перенимает его эмоционально. Аудиофейки на марше..

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later