PATRONI ROBOTYKI:
 

WIADOMOŚCI EDUKACYJNE

2017-07-11 15:37

Marchewka na roboty

Reinforcement learning, czyli uczenie wspomagane, to technika nauki i ukierunkowywania zachowania poprzez zastosowanie systemu nagród - tzw. "marchewki". Oczekiwane zachowania są nagradzane, podczas gdy niechciane pozostają bez nagrody. To dość powszechne narzędzie stosowane w uczeniu maszynowym, które wykorzystał zespół z Alphabet celem nauczenia algorytmu DeepMind AI do pokonania toru przeszkód.

Zespół naukowców chciał sprawdzić, czy proste nagrody przyniosą efekt w skomplikowanym otoczeniu. Stworzyli oni wirtualny tor przeszkód z uskokami, płotkami oraz krawędziami, ustanawiając przy tym nagrodę za pokonanie każdego z nich. Mówiąc najprościej - im szybciej SI porusza się poprzez teren, tym większa zostanie przyznana jej nagroda. Dodatkowe utrudnienia zostały dodane dla bardziej zaawansowanych symulacji.

Wszystkie z ruchów poszczególnych postaci zostały nauczone przy pomocy reinforcement learning. SI drogą prób i błędów musiało opracować w jaki sposób najszybciej można poruszać się po torze, nie zaliczając przy tym "skuć".

Obejrzenie poniższego filmu daje nam świadomość, iż DeepMind skłania się ku kreatywnym rozwiązaniom celem pokonania przeszkód - w praktyce oznacza to, że zazwyczaj najskuteczniejsze ruchy nie wyglądają do końca naturalnie. Niemniej, otwiera to interesujące możliwości dla SI w przyszłości, ponieważ roboty nie będą musiały ograniczać się do ludzkich ruchów aby wykonać swoje zadania.




Źródło: engadget.com