언어 모델의 허위 정보 악용 가능성과 위험 저감 방안에 대한 보고서.
OpenAI 연구원들이 조지타운 대학교와 스탠포드 인터넷 관측소와 협력하여 언어 모델의 허위 정보 사용 가능성을 조사했습니다. 2021년 10월에 열린 워크숍을 통해 30명의 연구자와 전문가가 모여 1년 이상의 연구를 바탕으로 공동 보고서를 작성했습니다. 이 보고서는 언어 모델이 허위 정보 캠페인에 사용될 경우 정보 환경에 미치는 위협을 설명하고, 이에 대한 완화 방안을 분석하는 프레임워크를 제시합니다.
Report on the misuse of language models for disinformation and risk reduction strategies.
OpenAI researchers collaborated with Georgetown University and the Stanford Internet Observatory to explore the potential misuse of language models for disinformation. A workshop in October 2021 brought together 30 experts, resulting in a comprehensive report developed over more than a year. This report highlights the threats posed by language models when used to support disinformation campaigns and introduces a framework for analyzing potential mitigations.