구글은 제미니 2.5로 혁신적 음성합성을 선보였습니다. 제미니의 TTS는 자연스럽고 표현력이 뛰어난 음성을 생성하며, 24개 이상의 언어 전환이 매끄럽게 가능합니다.
구글은 제미니의 음성합성(TTS)를 강화하고 있습니다. 화요일에 열린 구글 I/O 2025에서 회사는 더 표현력 있는 대화가 가능한 새로운 TTS 기능을 소개했습니다. 이 기능은 네이티브 오디오 출력에 기반하여 구축되었습니다.
구글의 툴시 도시(Tulsee Doshi)는 마운틴뷰에서 진행된 무대에서 제미니 2.5 TTS 모델의 시연을 짧게 보여주었습니다. 이 모델은 AI 기반의 음성으로, 보다 자연스럽고 덜 기계적인 소리와 더 섬세한 뉘앙스를 자랑합니다.
이 TTS는 24개 이상의 언어로 대화할 수 있으며, 이들 간의 전환이 매끄럽습니다. 시연은 영어로 시작해 힌디어로 전환한 뒤 다시 영어로 돌아오는 모습을 보여주었습니다. 모든 전환에 동일한 목소리를 사용하여 동일한 “사람”이 말하는 듯한 환상을 만들어냅니다. 이 TTS는 또한 즉석에서 속삭임으로 전환할 수 있는데, 이는 약간 소름돋는 소리로 들렸습니다.
이 새로운 음성합성 기능은 오늘부터 제미니 API에서 사용할 수 있습니다. 또한 화요일에는 제미니 라이브 API에 네이티브 오디오 대화의 2.5 플래시 미리보기가 제공됩니다.
2025년 5월 20일, 화요일에 시작된 구글의 연례 I/O 개발자 회의에서 구글은 실시간 번역을 포함한 제미니 AI 서비스의 새로운 주요 개선 사항들을 강조했습니다. AI는 프로젝트 아스트라 컴퓨터 비전에 대한 개선도 이루어졌습니다. 구글 I/O 행사에 대한 실시간 보도는 Engadget의 라이브블로그를 통해 확인할 수 있습니다. 지난 주 구글은 안드로이드 쇼 비디오 스트림 중에 몇 가지 주요 I/O 사전 발표 안드로이드 16 소식을 미리 공개했습니다.
※출처: Engadget