Myvideo

Guest

Login

Reinforcement Learning 6. Часть 2

Uploaded By: Myvideo
16 views
0
0 votes
0

Прочитаем и обсудим вместе статью от deepmind. Гипотеза «награды достаточно» предполагает, что агенты с мощными алгоритмами обучения с подкреплением, помещенные в богатую среду с простыми наградами, могут развить широкий, многоатрибутный интеллект, который составляет искусственный общий интеллект. Ссылка на статью в описании. Let's read and discuss together the article from deepmind. The reward-is-enough hypothesis suggests that agents with powerful reinforcement learning algorithms when placed in rich environments with simple rewards could develop the kind of broad, multi-attribute intelligence that constitutes an artificial general intelligence.

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later