AI-ML·중요도 7·2017. 03. 24.·OpenAI Blog

Evolution strategies as a scalable alternative to reinforcement learning

── KO ──────────────────

진화 전략이 강화 학습에 대한 스케일 가능 대안이 됨을 발견했다.

진화 전략(ES)은 수십 년 된 최적화 기법으로, 최신 강화 학습 벤치마크(예: Atari/MuJoCo)에서 표준 강화 학습 기술의 성능에 맞먹는다. ES는 강화 학습의 많은 불편함을 극복하면서도 그 성능을 유지할 수 있다. 이 연구는 진화 전략이 강화 학습의 대안으로 인식될 수 있는 가능성을 제시한다.


── EN ──────────────────

Evolution strategies proved to be a scalable alternative to reinforcement learning.

Evolution strategies (ES), a decades-old optimization technique, rival the performance of standard reinforcement learning (RL) on modern RL benchmarks such as Atari and MuJoCo. ES overcomes many of the inconveniences associated with traditional RL methods. This discovery suggests that evolution strategies could be recognized as a viable alternative to reinforcement learning.

원문 보기 →목록으로