Myvideo

Guest

Login

Так, давайте разберемся с Kyutai и Мойшей. Тут вот телеграм надрывается

Uploaded By: Myvideo
1 view
0
0 votes
0

Так, давайте разберемся с Kyutai и Мойшей. Тут вот телеграм надрывается, что французы уделали OpenAI и выпустили голосового помощника Moshi , которого можно перебивать и который может вас перебивать - все как на майском демо GPT-4o. Цитирую: “OpenAI только что урыли — французский стартап Kyutai презентовал голосового ассистента“ или “Французский стартап Kyutai опередил OpenAI — появился полный конкурент голосового режима GPT-4o. Новая модель Moshi в реальном времени слушает и говорит не хуже GPT-4o“. И ну постить видосик от французов. Блин, зачем писать такую хрень не посмотрев хотя бы в спеки модели: это 7B модель, да она MLM - Multimodal LM, но явно должна быть туповата. Базовая модель - Helium 7B, а отвечалка училась на синтетических данных - The model is fine-tuned on 100K transcripts generated by Helium itself. Только английский. Анонсирована 160ms latency (with a Real-Time Factor of 2) - в реальности все гораздо хуже. Короче, вот есть демо: Можете сами попробовать и увидеть: модель явно тупит с ответами и несет порой хтонь модель НЕ может определить эмоции по голосу вопрошающего Модель ОЧЕНЬ часто входит в цикл “я не могу, я не могу, я не могу“, что бы вы ее не спрашивали. Задержка порой огого, какой реалтайм. В общем, французы как можно раньше выкатили какбы-голосового-помощника-которого-можно перебивать, сделав акцент “а вот OpenAI только в сентябре, бе-бе-бе“. Ну да, все так, только как в анекдоте про набор текстов, “я печатаю со скоростью 20000 знаков в минуту, только получается какая-то хрень“. Крутизна в том, что они обещают исходный код, чтобы народ мог это допилить до годного не в одно лицо, а в коллективный разум. Вы можете поиграться с демо, но я бы советовал подождать, когда появится код, и что-то на его основе. А пока расходимся. Мойша пока лыка не вяжет.

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later