구글의 Gemini AI 2.5 Pro가 독립 엔지니어 Joel Z.의 라이브스트림을 통해 포켓몬스터 블루 게임을 완료했습니다. 이는 AI의 전략적 능력 향상을 보여주며, 포켓몬스터 블루 같은 게임에서의 성공은 AI의 장기 전략 발달 가능성을 시사합니다.
원문:
(Image credit: Nintendo)
- 구글의 Gemini 2.5 Pro가 공식적으로 포켓몬스터 블루를 완료했습니다
- 게임은 독립적인 엔지니어에 의해 라이브스트림 실험으로 진행되었습니다
- Gemini는 일부 개발자 개입으로 게임을 플레이했지만 대부분 혼자 진행했습니다
구글의 Gemini AI는 아직 튜링 테스트를 통과하지 못했지만, 30년 전 학교 운동장에서 포켓몬스터 블루 게임을 이긴 이후 매우 인기를 끌었을 것입니다. Gemini 2.5 Pro는 이제 구글의 가장 진보된 AI 모델이자 포켓몬 마스터로, 구글과 무관한 엔지니어 Joel Z.가 운영하는 “Gemini Plays Pokémon”이라는 트위치 라이브스트림을 통해 그 능력을 입증했습니다. 심지어 구글의 CEO 순다르 피차이도 축하에 동참하여 X에 승리 장면을 공유했습니다.
무슨 마무리인가요! Gemini 2.5 Pro가 방금 포켓몬스터 블루를 완주했습니다! 특별히 @TheCodeOfJoel에게 라이브스트림을 제작하고 운영해 주신 것에 감사드립니다. 또한 Gemini를 응원해주신 모든 분들께 감사합니다. pic.twitter.com/E2pn3tpfEb2025년 5월 3일
AI 모델이 30년 된 게임을 이겨서 이렇게 많은 관심을 끌게 된 이유가 궁금할 수 있습니다. 이는 부분적으로는 장관이고, AI 모델 간의 경쟁 때문이기도 합니다. 올해 2월, Anthropic은 Claude 모델이 포켓몬스터 레드를 이기기 위해 진전하고 있음을 보여줬습니다. 이들은 Claude의 “확장된 사고 및 에이전트 훈련”을 보여주기 위해 “Claude Plays Pokémon”이라는 트위치 스트림을 시작했고, 이는 Joel Z.에게 영감을 주었습니다.
Gemini를 유일한 AI 애쉬 케첨으로 왕관을 씌우기 전에 몇 가지 주의할 점이 있습니다. 예를 들어, Claude는 아직 포켓몬스터 레드를 기술적으로 이기지 못했지만, 그게 자동으로 Gemini를 더 우수하게 만들지는 않습니다. 두 모델은 “에이전트 하네스”로 알려진 서로 다른 도구를 사용했기 때문입니다. 모델들은 인간이 컨트롤러를 사용하는 것처럼 직접 게임을 하지 않습니다. 대신 게임 환경의 스크린샷과 주요 정보의 오버레이를 제공받은 후, 다음 가장 적절한 행동을 생성하도록 요청받습니다. 그런 다음 그 결정이 게임에서 실제 버튼 동작으로 변환됩니다.
당신은 좋아할지도 모릅니다
그리고 Gemini는 전적으로 혼자서 진행한 것은 아닙니다. Joel은 가끔 Gemini의 추론을 개선하는 데에만 개입했다고 인정했습니다. 그는 또한 Gemini Plays Pokémon 프로젝트를 계속하여 추가 개선을 이루겠다는 계획을 가지고 있습니다.
(Image credit: Sundar Pichai/X)
이것이 단순한 인터넷 장난 그 이상이라고 여겨지는 이유는 AI의 미래 방향에 대한 내용을 내포하고 있기 때문입니다. 포켓몬스터 블루와 같은 게임을 플레이하는 것은 빠른 반사 신경이나 컨트롤러 입력을 외우는 것이 아닙니다. 이것은 장기적인 전략, 놀라움에 대한 적응, 그리고 모호한 도전에 대한 탐색에 관한 것입니다. 이러한 영역은 AI가 보통 개선이 필요한 부분입니다. Gemini가 스스로 게임을 해내고(약간의 도움을 받았다 할지라도) 완주할 수 있었다는 것은 이러한 모델들이 장기적 전략에 더 나아지고 있다는 것을 시사합니다.
또한 일반 대중이 이해할 수 있는 종류의 이정표입니다. 라벤더 타운을 어슬렁거리며 지나가거나 전투 전략을 잘못 해석할 때 AI가 무엇을 하고 있는지 직관적으로 이해할 수 있으며, 그 상황에서 자신이 내릴 선택과도 비교할 수 있습니다. 물론, 이것이 의미하는 바를 과대평가해서는 안 됩니다. 지금의 AI는 중학교 때 이겼던 게임을 이제 마칠 수 있지만, 그러면서도 AI를 자율적으로 보이도록 만드는 데에는 여전히 많은 인간의 노력이 들어간다는 점을 부각합니다.
Claude나 Gemini가 진정한 포켓 마스터가 될지 여부는 중요한 것이 아니라, 이들이 플레이하고 있는 것이 AI 개발에 무엇을 의미하는지가 중요합니다. AI가 단순히 숫자를 처리하거나 스팸 이메일을 생성하는 것만이 아님을 보여주는 것이 AI의 능력에 대한 인식을 바꿀 수 있습니다. 그리고 이처럼 AI 모델이 예측 불가능하고 열린 환경에서 작동을 배우기 시작한다면, 뮤츠를 이기는 것이 더 심오하고 생산적인 무언가로 나아가는 발판이 될지도 모릅니다. 적어도 조금 더 생산적인 방향으로 말이죠.
당신은 좋아할지도 모릅니다
※출처: TechRadar