구글 제미니 2.5, 혁신적 음성합성으로 경계 허문다

관리자

구글 제미니 2.5, 혁신적 음성합성으로 경계 허문다

구글은 제미니 2.5로 혁신적 음성합성을 선보였습니다. 제미니의 TTS는 자연스럽고 표현력이 뛰어난 음성을 생성하며, 24개 이상의 언어 전환이 매끄럽게 가능합니다.

구글은 제미니의 음성합성(TTS)를 강화하고 있습니다. 화요일에 열린 구글 I/O 2025에서 회사는 더 표현력 있는 대화가 가능한 새로운 TTS 기능을 소개했습니다. 이 기능은 네이티브 오디오 출력에 기반하여 구축되었습니다.

구글의 툴시 도시(Tulsee Doshi)는 마운틴뷰에서 진행된 무대에서 제미니 2.5 TTS 모델의 시연을 짧게 보여주었습니다. 이 모델은 AI 기반의 음성으로, 보다 자연스럽고 덜 기계적인 소리와 더 섬세한 뉘앙스를 자랑합니다.

이 TTS는 24개 이상의 언어로 대화할 수 있으며, 이들 간의 전환이 매끄럽습니다. 시연은 영어로 시작해 힌디어로 전환한 뒤 다시 영어로 돌아오는 모습을 보여주었습니다. 모든 전환에 동일한 목소리를 사용하여 동일한 “사람”이 말하는 듯한 환상을 만들어냅니다. 이 TTS는 또한 즉석에서 속삭임으로 전환할 수 있는데, 이는 약간 소름돋는 소리로 들렸습니다.

이 새로운 음성합성 기능은 오늘부터 제미니 API에서 사용할 수 있습니다. 또한 화요일에는 제미니 라이브 API에 네이티브 오디오 대화의 2.5 플래시 미리보기가 제공됩니다.

2025년 5월 20일, 화요일에 시작된 구글의 연례 I/O 개발자 회의에서 구글은 실시간 번역을 포함한 제미니 AI 서비스의 새로운 주요 개선 사항들을 강조했습니다. AI는 프로젝트 아스트라 컴퓨터 비전에 대한 개선도 이루어졌습니다. 구글 I/O 행사에 대한 실시간 보도는 Engadget의 라이브블로그를 통해 확인할 수 있습니다. 지난 주 구글은 안드로이드 쇼 비디오 스트림 중에 몇 가지 주요 I/O 사전 발표 안드로이드 16 소식을 미리 공개했습니다.

※출처: Engadget

이 글에는 제휴 링크가 포함되어 있을 수 있으며 파트너스 활동을 통해 일정액의 수수료를 업체로 부터 받을 수 있습니다. 구매자분에게는 추가 비용이 발생하지 않습니다. 이 사이트의 정보는 정보 전달 목적으로만 제공되며 어떠한 보장도 제공하지 않습니다.
※ 파트너스 제휴는 블로그 운영에 있어 더 나은 컨텐츠 제작에 큰 도움이 됩니다.

댓글 남기기