CoinRun은 강화 학습에서 일반화 능력을 측정하는 훈련 환경을 제공합니다.
CoinRun이라는 새로운 훈련 환경이 발표되었습니다. 이 환경은 에이전트가 새로운 상황에 경험을 전이할 수 있는 능력을 측정하는 지표를 제공합니다. CoinRun은 전통적인 플랫폼 게임보다 복잡성이 낮지만, 최신 알고리즘에게는 여전히 충분한 일반화 과제를 제공합니다. 이 프레임워크는 강화 학습의 오랜 퍼즐을 명확히 하는 데 기여하고 있습니다.
CoinRun provides a training environment to measure generalization ability in reinforcement learning.
A new training environment called CoinRun has been released. It offers a metric for an agent's ability to transfer its experience to novel situations. CoinRun balances complexity, being simpler than traditional games, yet still presents a significant generalization challenge for state-of-the-art algorithms. This framework helps clarify longstanding puzzles in reinforcement learning.