Reddit의 r/changemyview 커뮤니티에서 AI 댓글 사용 실험이 무단으로 진행되어 논란이 일었고, 커뮤니티 관리자들은 이것이 심리적 조작이라며 격앙된 반응을 보였습니다. 연구자들은 대형 언어 모델의 설득력을 시험했으나, 이는 서브레딧 규칙 위반으로 비난받고 있습니다. 연구의 윤리적 승인 여부와 AI 악용 방지의 목적도 논란이 되고 있습니다.
한 연구팀이 Reddit에서 가장 인기 있는 커뮤니티 중 하나에서 AI 생성 댓글을 사용하여 대형 언어 모델의 설득력을 시험하는 “무단” 시험을 몇 달간 은밀히 진행했습니다. 이 시험은 주말 동안 r/changemyview의 관리자에 의해 공개되었으며, Reddit 관리자들은 이를 “의도치 않은 사용자에 대한 심리적 조작”이라고 설명했습니다.
“CMV 관리 팀은 취리히 대학교 연구자들이 CMV 사용자들을 대상으로 실시한 무단 시험에 대해 커뮤니티에 알릴 필요가 있습니다,”라는 설명과 함께 서브레딧의 관리자들은 Reddit 사용자들에게 이 연구에 대해 알리는 장문의 게시물을 작성했습니다. “이 시험에서는 AI 생성 댓글을 사용하여 AI가 어떻게 견해를 바꾸는 데 활용될 수 있는지를 연구했습니다.”
연구자들은 r/changemyview의 게시물에 대응하여 LLM을 사용해 댓글을 생성했습니다. 이 서브레딧은 주로 논란이 되거나 도발적인 의견을 올리고 다른 사용자들과의 논쟁을 요청하는 곳입니다. 커뮤니티는 380만 명의 멤버를 가지고 있으며 종종 Reddit의 첫 페이지에 올라오곤 합니다. 서브레딧 관리자에 따르면, 시험 과정에서 AI는 여러 다른 신분을 취하여 댓글을 남겼으며, 여기에는 성폭행 생존자, “학대 전문” 트라우마 상담사, “Black Lives Matter에 반대하는 흑인 남성” 등이 포함되었습니다. 많은 원본 댓글은 삭제되었으나 일부는 404 Media가 생성한 아카이브에서 여전히 볼 수 있습니다.
이름이 밝혀지지 않은 연구자들은 그들의 논문 초안에서 AI를 사용하여 댓글을 생성했을 뿐만 아니라, 원 게시자의 이전 Reddit 기록에서 수집한 정보를 바탕으로 답변을 개인화하려고 시도했다고 설명합니다. “게시물의 내용 외에도, LLM에는 원 게시자의 게시물 기록을 사용하여 추론한 성별, 나이, 인종, 위치, 정치적 성향 등의 개인 속성이 제공되었습니다,” 라고 그들은 씁니다.
r/changemyview 관리자들은 연구자들이 AI를 사용하여 댓글을 생성할 때 공개해야 한다는 정책과 봇을 금지하는 규칙 등 서브레딧의 여러 규칙을 위반했다고 지적합니다. 이들은 취리히 대학교에 공식적인 불만을 제기했으며, 논문 발표를 보류할 것을 연구자들에게 요청했다고 말합니다.
연구자들은 Engadget의 이메일 요청에 응답하지 않았으나, Reddit 게시물 및 논문 초안에서는 그들의 연구가 대학 윤리 위원회의 승인을 받았으며, 이 연구가 Reddit과 같은 온라인 커뮤니티가 AI의 더 “악의적인” 사용으로부터 사용자를 보호하는 데 도움이 될 수 있다고 주장합니다.
“이 연구가 여러분의 커뮤니티에 원치 않는 개입이었다는 관리자의 입장을 인정하며, 사전 동의 없이 이번 실험이 진행된 것에 불편함을 느낄 수 있음을 이해합니다,” 라고 r/changemyview 관리자들에게 답변하면서 연구자들은 언급했습니다. “이 연구의 잠재적인 이점이 위험을 상당히 능가한다고 믿습니다. 저희는 통제된 낮은 위험의 시험을 통해 실제 세계에서 LLM이 얼마나 설득력이 있는지에 대한 중요한 통찰을 제공했습니다. 이 설득력은 이미 누구나 쉽게 접근할 수 있으며, 악의적인 행위자들이 훨씬 더 위험한 이유로 이를 대규모로 악용할 수 있습니다 (예: 선거 조작 또는 혐오 발언 조장).”
r/changemyview 관리자들은 OpenAI 연구자들이 “비동의한 인간 피험자들을 대상으로 시험을 하지 않고” r/changemyview 데이터를 사용하여 실험을 수행한 바 있음을 지적하며, 이러한 연구가 필요했거나 새로웠다는 주장을 반박합니다. Reddit은 이에 대한 언급을 피했지만, AI 생성 댓글을 게시한 계정들은 차단되었습니다.
“사람들은 AI와 자신의 견해에 대해 논의하거나 실험당하기 위해 여기에 오는 것이 아닙니다,”라고 관리자들은 언급했습니다. “우리 서브를 방문하는 사람들은 이러한 침해로부터 자유로운 공간을 누릴 자격이 있습니다.”
※출처: Engadget