Завершаем этот год приятными новостями. Запускаем новый формат — «Желтый Club Talks», в котором будем делиться разными впечатлениями, новостями, мыслями. Ведущий этого выпуска — Даня Гаврилов, лид направления NLP в Tinkoff Research. В гостях — Влад Куренков, лид направления Reinforcement Learning в Tinkoff Research. Влад вернулся с NeurIPS 2023, куда ездил с нашими статьями. Три из них были представлены в основной части конференции, одна — на воркшопе. Делимся полезными ссылками и поясняем термины, которые ребята упоминают во время разговора. Наши статьи на NeurIPS 2023: ▪️ CORL: Research-oriented Deep Offline Reinforcement Learning Library ▪️ Revisiting the Minimalist Approach to Offline Reinforcement Learning ▪️ Katakomba: Tools and Benchmarks for Data-Driven NetHack ▪️ XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX Про конференции: NeurIPS (Conference on Neural Information Processing Systems) — одна из главных мировых научных конференций по искусственному интеллекту и машинному обучению, ежегодно собирающая ведущих специалистов в области на одной площадке. ICML (International Conference on Machine Learning) — крупная ежегодная конференция по машинному обучению. ICLR (International Conference on Learning Representations) — международная конференция по машинному обучению. Полезное: Oral — секция устных докладов на NeurIPS. Статьи с таким статусом презентуются на широкую публику и получают больше цитирований и более широкий охват. Запись воркшопа Бори Шапошникова, исследователя-разработчика направления NLP в Tinkoff Research: «Новые методы алаймента языковых моделей»: * Парочка комментариев от Влада: ▪️ У DeepMind 180 статей на конференции (включая воркшопы и соавторство с университетами). ▪️ RSO не был опубликован на NeurIPS, но было много других статей про LLM/Alignment от них в рамках конференции. Таймкоды: 0:00 Что такое NeurIPS: база 2:19 NIPS или NeurIPS? 2:37 Что такое NeurIPS: нетворкинг 5:12 Ходит ли Лекун на постерные сессии 6:07 Что такое NeurIPS: постерные сессии 7:23 Про Reinforcement Learning: популярно или не очень? 8:37 Как устроены постерные сессии и что было популярным 10:16 Normalizing Flows делают камбэк 12:52 NeurIPS по дням: Expo Day 14:33 Доклады, Test of Time Award — Word2Vec, Шмидхубер и другие 22:14 Что такое NeurIPS: воркшопы 26:04 Лейтмотив конференции: Foundational Models для всего 26:48 Что делают большие компании на NeurIPS 32:04 NeurIPS — это про науку? 33:43 Как связаны фонды, GateLoop и вариационный дропаут 38:32 The Next Big Thing (Gemini?) 41:38 В чем изюминка Reinforcement Learning 42:23 Статьи Big Tech на NeurIPS 46:16 Когда выйдет GPT-5? 48:27 Для чего делался и Grok и про Generalist AI Researchers 53:28 LLM для доказательства теорем 57:02 LLM для генерации кода и редактирования научных статей 59:39 Про безопасность в Новом Орлеане и дорогу до дома 1:08:14 Где будут конференции в следующем году 1:10:11 Чем стоит заниматься на конференциях
Hide player controls
Hide resume playing