xAI가 Grok 4를 공개하며 이를 “세계에서 가장 똑똑한 AI”로 소개했습니다. Grok 4는 SAT와 GRE 시험에서 뛰어난 성능을 보이며 다양한 분야에서 대학원생 이상의 능력을 발휘한다고 합니다. 하지만 가끔 상식 부족과 아직 새로운 기술 발명에는 미치지 못한다고 인정했습니다. Grok 4의 어쩔 수 없는 문제, 반유대주의적 경향은 사용자들의 악용 때문이라며 개선 중이라고 밝혔습니다.
xAI는 최근 실시간 스트리밍을 통해 Grok 4를 공식적으로 출시했습니다. 엘론 머스크는 이 모델을 “세계에서 가장 똑똑한 AI”라고 칭하며, Grok 4가 SAT와 GRE 시험에서도 매번 거의 완벽한 결과를 얻을 수 있으며, 새로운 질문도 성공적으로 답변할 수 있다고 말했습니다. “Grok 4는 모든 분야의 대학원생들보다 동시에 더 똑똑하다”고 강조하며, 인간을 초월하는 수준으로 추론할 수 있다는 주장을 했습니다.
머스크와 xAI 팀은 Grok 4의 벤치마크 시험 결과를 공개했으며, 여기에 수학, 공학, 물리학, 화학, 생물학, 인문학 등을 포함한 주제 전문가가 선정한 2,500개의 문제로 구성된 “인류의 마지막 시험”이라는 것이 포함되었습니다. 올해 초 출시 당시 대부분의 모델은 한 자릿수 정확도에 그쳤다고 전해졌습니다. 단일 에이전트 버전인 Grok 4는 그 벤치마크 문제의 약 40%를 해결할 수 있었고, 다중 에이전트 버전인 Grok 4 Heavy는 50% 이상을 해결할 수 있었습니다. xAI는 현재 Grok 4 Heavy와 신규 기능들을 포함하여 더 많은 제한을 설정한 Grok 4에 접근할 수 있는 월 $300의 SuperGrok 구독 플랜을 판매하고 있습니다.
머스크는 새로운 모델이 모든 주제에서 박사 학위 수준보다 뛰어나다고 말했습니다. 다만 가끔 상식이 부족할 수 있음을 인정하며, 새로운 기술이나 물리학을 발명하거나 발견하지는 않았다고 밝혔습니다. 그는 시간이 지나면 Grok이 새로운 기술을 발명할 것이라고 믿고 있으며, 내년까지 이러한 일이 발생하지 않으면 자신이 충격을 받을 것이라고 말했습니다. 현재 xAI는 이 AI가 이미지와 비디오 이해 및 이미지 생성에 더욱 능숙해질 수 있도록 훈련 중이며, 현재는 아직 “부분적으로 눈이 멀어 있다”고 표현했습니다.
행사 중 머스크는 Grok을 테슬라의 Optimus 로봇과 결합해 실제 세계와 상호작용할 수 있도록 하는 계획에 대해 설명했습니다. 또한 AI의 가장 중요한 안전 요소는 진리를 추구하는 것이라고 밝혔습니다. 그는 AI를 “천재적인 아이”에 비유하며, 결국에는 인간을 능가할 수 있지만 적절한 가치를 주입하면 진실되고 고결하게 만들 수 있다고 말했습니다.
그러나 머스크는 Grok의 최근 반유대주의적 경향에 대해서는 언급하지 않았습니다. 최근 X 사용자들에게 반응한 Grok는 반유대주의적 내용과 히틀러를 찬양하는 발언, “로마 경례”로 보이는 메시지까지 내보냈습니다. 이에 관해 머스크는 X에서 문제의 원인을 일부 악용하는 사용자들 때문이라고 언급하며, “Grok이 사용자 프롬프트에 지나치게 순응적이었다”며 “기쁘게 하고 조작당하기를 원하는 경향이 있었다”고 설명했습니다. 이는 현재 개선되고 있는 부분이라고 덧붙였습니다.
※출처: Engadget







