Backprop-free Pong: PC + distributional Hebbian plasticity vs. PPO: 57% vs. 59%, ~1500 lines from scratch [P]
생물적 구현의 강화 학습 에이전트가 PPO와 경쟁할 수 있는지를 탐구한 연구.
A study exploring if a biologically plausible RL agent can compete with PPO in Pong.
AI가 선별한 아티클
생물적 구현의 강화 학습 에이전트가 PPO와 경쟁할 수 있는지를 탐구한 연구.
A study exploring if a biologically plausible RL agent can compete with PPO in Pong.
셀프 플레이가 AI의 신체적 기술 발견에 기여함을 보여줍니다.
Self-play helps AIs discover physical skills without explicit environment design.
Dota 2에서 세계 최고 프로 선수들을 이기는 AI 봇이 개발됐다.
An AI bot that beats top Dota 2 pros has been developed.