Роман Соколков делится опытом имплементации reinforcement learning алгоритма от компании “Learning to drive in a day“, а также применения алгоритма к RC-модели масштаба 1/10. Алгоритм базируется на 2-х нейронных сетях: VAE - variational autoencoder и DDPG - deep deterministic policy gradient. Для интеграции алгоритма с симулятором используется OpenAI gym интерфейс, который является де-факто стандартом для reinforcement learning алгоритмов. В качестве робота, используется шасси от радиоуправляемой машинки масштаба 1/10 с камерой Logitech c920 и компьютером NVIDIA Jetson TX1. Робот использует Robot Operating System версии Kinetic. Весь код используемый в презентации выложен в открытый доступ, что даёт возможность запустить алгоритм с симулятором за 20-30 минут.
Hide player controls
Hide resume playing