HealthBench는 의료 AI 평가를 위한 새로운 벤치마크입니다.
HealthBench는 현실적인 시나리오에서 AI 모델을 평가하는 새로운 벤치마크입니다. 250명 이상의 의사들의 의견을 반영하여 개발되었으며, 의료 분야에서 모델 성능과 안전성을 기준으로 공유할 수 있는 표준을 제공합니다. 이 벤치마크는 의료 AI의 발전에 큰 기여를 할 것으로 기대됩니다.
HealthBench is a new benchmark for evaluating AI in healthcare.
HealthBench is a new evaluation benchmark designed to assess AI models in realistic healthcare scenarios. Developed with input from over 250 physicians, it aims to provide a shared standard for performance and safety in health. This benchmark is expected to significantly contribute to advancements in healthcare AI.