RLHF Intro: from Zero to Aligned Intelligent Systems

About Share Download Add to

Ссылка на презентацию: !AlnN0aqNwShslWtiuDJOR_qt3Urn Мой телеграм канал: Список всех моих образовательных материалов, статей, лекций итд: Перед вами - обзорная-лекция блока Instruct Models Датафеста 2023го года. В ней рассказано о проблемах в мире машинного обучения, о несоответствии функций для оптимизации и реальных задач, для которых модели предназначаются. В лекции будут рассказаны основы RL, языковых моделей, а затем показано, как эти два направления можно объединить, чтобы тренировать модель напрямую оптимизировать воспринимаемое человеком качество генерации. В заключении будет дан обзор текущих тенденций в мире RLHF (Reinforcement Learning from Human Feedback) и рассказано про то, что же такое AI Alignment и почему им нужно заниматься уже сейчас. Подпишитесь на наш канал, чтобы не пропустить новые видео о машинном обучении и искусственном интеллекте. Не забудьте поставить лайк и поделиться эти

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/ektld3dZRjRJc1V2M2Y5bTVLTmREVTNtSnNpN09JNzNzSmpDUmEzY1pibz0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>