0:00 Интро 0:49 Знакомство с гостями 2:46 В чем философия подхода создания моделей T-Lite и T-Pro 5:23 Какие смыслы заложены в continual pre-training 7:22 Рецепт улучшения больших языковых моделей continual pre-training 12:24 Зачем делать continual pre-training, а не pre-training с нуля 18:07 Какие есть проблемы у continual pre-training подхода 21:38 Что используется внутри Т-Банка и что получили от open source релиза 26:26 Про бенчмарки 35:28 Что по безопасности использования LLM 38:26 Эпоха inference time scaling — на сколько это нужно продуктам 42:24 Зачем нужна библиотека для alignment — Turbo Alignment 47:34 Когда ждать следующих релизов
Hide player controls
Hide resume playing