NeurIPS used uncalibrated AI detector for desk rejections [D]
NeurIPS가 비공식 AI 탐지기로 제출물에서 데스크 반려 문제를 다룬다.
NeurIPS 2026의 Position Paper Track에서는 Pangram이라는 AI 텍스트 탐지기를 사용하여 일부 제출물을 데스크 반려했습니다. 이 과정에서 AI 탐지기의 신뢰성 및 검증 문제가 제기되었고, 높은 탐지기 점수가 저자 진술의 일관성 판단에 결정적인 역할을 할 수 있다는 비판이 나왔습니다. 특히, 네이처 논문의 실제 제출물에서의 허위 긍정률에 대한 의문이 제기되었습니다.
NeurIPS used uncalibrated AI detector for desk rejection issues.
The NeurIPS 2026 Position Paper Track employed a proprietary AI text detector called Pangram for desk rejection of submissions. This raised significant concerns regarding the reliability and validation of the detector, as a high score could improperly influence the authors' attestations. Furthermore, questions arose about the false-positive rates concerning the actual submission pool, indicating possible distribution shifts.