SECURITY·중요도 7·2026. 06. 29.·GeekNews

GLM 5.2, Semgrep IDOR 벤치마크에서 Claude 앞서

── KO ──────────────────

GLM 5.2가 Semgrep IDOR 벤치마크에서 Claude보다 우수함.

Semgrep의 IDOR 취약점 탐지 벤치마크에서 Zhipu AI의 모델 GLM 5.2가 Claude Code보다 높은 F1 점수를 기록했습니다. 실험은 고정된 데이터셋과 평가 방식을 사용하여 모델과 하네스를 변경하며 수행되었습니다. 이는 GLM 5.2의 성능이 모델 자체에 기인함을 보여줍니다.


── EN ──────────────────

GLM 5.2 outperforms Claude in Semgrep IDOR benchmark.

In the Semgrep IDOR vulnerability detection benchmark, Zhipu AI's model GLM 5.2 achieved a higher F1 score than Claude Code. The experiment was conducted by fixing the dataset and evaluation method while changing the model and harness. This demonstrates that GLM 5.2's performance is attributed to the model itself.

원문 보기 →목록으로