ALL AI-ML BACKEND FRONTEND DEVOPS SECURITY MOBILE DATABASE CLOUD OTHER

© 2026 PLINKFEED — AI가 선별한 IT 기술 뉴스

구독 소개 개인정보처리방침 이용약관

#rnd

AI가 선별한 아티클

8·ai-ml·기타·OpenAI Blog·2018. 10. 31.

Reinforcement learning with prediction-based rewards

예측 기반 보상으로 강화 학습 에이전트를 탐색하도록 유도하는 방법인 RND가 인간 성적을 초월했습니다.

RND, a prediction-based reward method, enables RL agents to surpass average human performance in Montezuma's Revenge.

#reinforcement learning #rnd #montezumas revenge #machine learning #curiosity

요약 보기 원문 →

모든 아티클을 불러왔습니다.