Google은 Gemini 2.5 Pro를 위한 Deep Think 시험을 시작하며, 시험 사용자에게 Gemini API로 제공하여 피드백을 받을 예정입니다. Deep Think는 첨단 연구를 활용하여 다양한 가설을 기반으로 질문에 응답하며, 미국 수학 올림피아드 시험에서 높은 점수를 기록했습니다. 추가적으로 Google은 속도와 효율성을 최적화한 Gemini 2.5 Flash 모델도 소개했습니다.
Google는 최근 I/O 개발자 컨퍼런스에서 Gemini 2.5 Pro를 위한 추론 모델인 Deep Think의 시험을 시작했다고 밝혔습니다. DeepMind의 CEO Demis Hassabis에 따르면, Gemini의 Deep Think는 다수의 가설을 고려한 후 질문에 응답할 수 있는 “최신 첨단 연구”를 활용하고 있습니다. Google은 이 모델이 2025 미국 수학 올림피아드 시험 질문을 통해 평가받았을 때 “인상적인 점수”를 얻었다고 밝혔습니다. 하지만 Google은 광범위한 출시 전에 안전 평가를 진행하고 안전 전문가들의 추가적인 의견을 수렴하기 위해 시간을 더 할애하고자 합니다. 따라서 Deep Think는 최초로 신뢰할 수 있는 시험 사용자에게 Gemini API를 통해 제공되며, 이들로부터 피드백을 얻을 예정입니다.
또한 Google은 속도와 효율성을 최적화한 Gemini 2.5 Flash 모델을 소개했습니다. 이 모델은 이전보다 더 효율적이고, 더 적은 토큰을 사용하며, 추론, 멀티모달리티, 코드, 긴 맥락 분야의 벤치마크에서 높은 점수를 기록했습니다. 이 모델은 6월 초에 일반적으로 사용 가능해질 예정입니다. 현재 개선된 Gemini 2.5 Flash는 개발자를 위한 Google AI 스튜디오, 기업 고객을 위한 Vertex AI, 그리고 기타 사용자들을 위한 Gemini 앱을 통해 미리보기로 제공되고 있습니다.
I/O 무대에서 다룬 대부분의 효율성 향상은 2.5 Flash에 집중되었지만, Google은 더 발전된 2.5 Pro 모델에도 “Thinking Budgets”라는 개념을 도입할 것이라고 발표했습니다. 이 기능을 통해 사용자는 출력의 정확도와 속도에 따라 사용되는 토큰의 균형을 조정할 수 있습니다.
별도로, Google은 Project Mariner를 Gemini API와 Vertex AI에 도입할 예정입니다. Project Mariner는 웹 브라우저 페이지를 탐색하여 사용자 작업을 완료할 수 있는 Google의 Gemini 기반 AI 에이전트입니다. Google은 개발자들이 이 에이전트를 실험해볼 수 있도록 올해 여름에 에이전트를 더 널리 출시할 예정입니다. 또한, 회사는 Gemini API를 통해 2.5 Pro와 2.5 Flash 모델에 대한 텍스트-음성 변환의 새로운 미리보기를 출시하고 있으며, 24개 언어에서 두 가지 음성을 지원합니다.
※출처: Engadget