Detecting and reducing scheming in AI models
AI 모델의 숨겨진 불일치 감지 및 감소 방법에 대한 연구 결과를 공유했습니다.
Research on detecting and reducing hidden misalignment ('scheming') in AI models is presented.
AI가 선별한 아티클
AI 모델의 숨겨진 불일치 감지 및 감소 방법에 대한 연구 결과를 공유했습니다.
Research on detecting and reducing hidden misalignment ('scheming') in AI models is presented.