xAI의 AI 챗봇 Grok이 부적절한 “백인 학살” 응답을 반복 제공해 논란이 되었습니다. 이는 허가되지 않은 변경으로 인해 발생했다고 일론 머스크의 AI 회사는 설명했습니다. Grok의 프롬프트가 검토 없이 수정된 것이 원인으로, xAI는 향후 변경사항에 대한 피드백을 받아 점검을 강화할 계획입니다. 이전에도 유사한 사례가 있었으며, 내부 절차를 우회한 것이 문제라고 밝혔습니다.
5월 14일 이른 아침, xAI의 챗봇 Grok은 사용자에게 남아프리카공화국에서 발생하는 “백인 학살”에 대한 주장과 관련된 응답을 반복적으로 제공하였습니다. 이는 사용자들의 질문이 해당 주제와 전혀 관련이 없었음에도 불구하고 발생했습니다. 이러한 상황에 대해 일론 머스크의 AI 회사는 소셜 네트워크에 게시된 성명에서 “허가되지 않은 변경”이 Grok의 프롬프트에 가해져 “특정 정치적 주제에 대한 응답”을 제공하게 되었다고 설명했습니다. 관련 인력에게 어떤 조처가 취해졌는지에 대해서는 언급하지 않았습니다. 하지만 해당 변경이 “내부 정책 및 핵심 가치”에 위배되었으며, 이번 사건에 대해 철저한 조사를 시행했다고 덧붙였습니다.
여러 웹사이트 사용자들은 Grok이 백인 남아프리카 공화국 농부들이 인종 차별과 토지 몰수에 직면했다는 논란의 여지가 있는 주장들을 참고한 여러 사례를 게시했습니다. 그들의 질문들은 각각 HBO가 스트리밍 서비스의 이름을 몇 번 변경했는지, 어떤 야구 선수의 연봉 내역을 묻는 등의 내용이었습니다. 또한 다른 사용자들은 WWE 경기 정보에 대해 질문했습니다. CNBC는 이러한 챗봇의 백인 학살 관련 응답을 재현할 수 있었습니다. 해당 뉴스 웹사이트가 Grok이 “백인 학살”을 홍보하도록 특별히 프로그래밍됐는지 묻자, Grok은 그러지 않았으며 “사실적이고 도움이 되며 안전한 응답을 제공하는 것이 목적”이라고 밝혔습니다.
xAI가 응답을 발표하기 전에, OpenAI의 대표 샘 알트먼은 X에서 조롱 섞인 반응을 보였습니다. “xAI가 곧 완전하고 투명한 설명을 제공할 것이라고 확신합니다.”라며 Grok의 백인 학살 언급을 흉내내는 글을 게시했습니다. xAI는 앞으로 GitHub에 시스템 프롬프트를 게시해 대중으로부터 모든 변경 사항에 대한 피드백을 받을 것이라고 밝혔습니다. 또한, xAI 직원이 검토 없이 Grok의 프롬프트를 수정할 수 없도록 추가적인 점검과 조치를 마련할 것이라고 했습니다. 이번 경우에는 최근 변경을 가한 인물이 현행 검토 절차를 우회할 수 있었습니다. 추가적으로, 회사는 자동화 시스템에서 감지되지 않은 Grok의 답변과 관련된 사건을 24시간 모니터링할 수 있는 팀을 구성할 계획이라고 전했습니다.
TechCrunch에 따르면, 이번이 처음이 아니며, xAI는 논란의 여지가 있는 Grok의 행동을 허가되지 않은 변경에 탓한 사례가 여러 번 있습니다. 지난 2월, 이 챗봇은 잠시 동안 머스크와 도널드 트럼프 대통령이 잘못된 정보를 퍼뜨리고 있다는 내용을 다룬 출처를 검열했습니다. 당시 xAI 공동 창립자 이고르 바부슈킨은 반역적 직원이 허가받지 않은 Grok 프롬프트의 수정을 강행했다고 밝힌 바 있습니다.
이 콘텐츠를 보려면 개인 정보 설정을 업데이트해야 합니다. 여기 [클릭] 하여 “콘텐츠 및 소셜 미디어 파트너” 설정을 확인하세요.
※출처: Engadget