AI 기술 혁신의 일환으로 등장한 Dia는 감정을 표현하는 AI 음성 모델로, 현실적인 감정 연출을 지원합니다. Dia는 웃음, 기침, 비명 등 감정적 스펙트럼을 구현하며, AI 음성의 감정 지능 향상에 기여합니다. 이는 AI가 단순히 말을 전달하는 것을 넘어, 적절한 감정을 표현하는 기능을 갖추도록 발전하고 있음을 보여줍니다. Dia는 감정을 담은 표현을 통해 사용자 경험을 더욱 인간적으로 만듭니다.

(이미지 출처: Getty Images)
AI 목소리는 일반적으로 친근하면서도 현실적인 모습을 목표로 하여 편안하고 행복하며 도움이 되는 사람들을 모방합니다. 그러나 새로운 오픈소스 모델인 Dia는 보다 감정적인 음성 스펙트럼에 집중하고 있으며, 매우 강렬한 비명 소리까지 포함하고 있습니다.
Nari Labs의 창립자들이 개발한 Dia는 AI 목소리에 다소 감성적인 퍼포머의 느낌을 줄 수 있는 옵션을 제공합니다. 이는 현실적인 웃음, 기침, 헛기침, 코를 훌쩍이는 소리, 그리고 예, 고함까지 가능합니다.
현재 AI에게 고함을 지르는 기능이 대단한 것처럼 보이지 않을 수도 있지만, 비명은 모방하기 어려운 부분입니다. 단순히 크게 말하는 것이 아니라 완전히 다른 말하기 방식입니다.
관심 있을 수도 있습니다
감정적으로 표현할 수 있는 연설은 대부분의 AI 목소리에 부족한 부분입니다. 음성 모델이 잠자리 동화를 읽는 것은 쉽지만 친구를 진정시키려 하거나 충격적인 것을 본 것처럼 들리게 하는 것은 훨씬 더 어렵습니다. 대부분의 상업용 모델은 음성을 부드럽게 톤으로 조절함으로써 로봇 같은 소리를 피합니다. 이는 감정을 표현하는 비대칭적인 음성을 내는 공간을 남기지 않습니다.
Dia는 비언어적 의사소통을 공연의 일부분으로 다룹니다. “(기침)”이 무시되거나 문자 그대로 읽히는 것이 아님을 알고 있으며, 비명은 단지 더 큰 소리가 아니라고 이해합니다. 그리고 이러한 것들을 타이밍, 피치 조절, 호흡 조절을 통해 더 실제적으로 느끼도록 수행합니다.
한 창의적인 사용자는 심지어 월드 오브 워크래프트에서의 유명한 리로이 젠킨스 장면의 일부를 재창조하는 데 사용했습니다.
이는 OpenAI, ElevenLabs, Google, Sesame 등의 놀라운 AI 음성 모델들이 없었다는 것을 의미하는 것은 아닙니다. OpenAI의 고급 음성 모드는 다양한 감정을 표현하도록 맞춤화할 수 있으며, ElevenLabs는 대문자와 구두점을 해석해 음성을 조절하는 데 능숙합니다. 그러나 이는 놀라서 외치는 것이나 웃음으로 숨이 찬 것을 표현하는 것과는 다릅니다.
Sesame은 특히 실제 사람처럼 소리 내고 반응하는 데 능숙하지만, 그 모델조차도 일반적으로 쾌활하고 긍정적인 태도에 치우칩니다.
물론 현실감은 주관적인 것이며, Dia가 AI 목소리임을 꽤 빠르게 알아차릴 수 있습니다. 그렇지만, 가짜 비명과 웃음도 적절한 문맥에서는 꽤 인간적인 소리입니다.
두 명의 학부생. 한 명은 여전히 군대에 있음. 제로 자금. 하나의 황당한 목표: NotebookLM 팟캐스트, ElevenLabs 스튜디오, Sesame CSM과 경쟁할 수 있는 TTS 모델 개발. 어떻게든… 해냈습니다. 방법은 👇 pic.twitter.com/8cfJSegciX 2025년 4월 21일
AI를 위한 비명 소리
이것이 단순히 “AI 목소리가 파티 트릭을 배운다”는 이야기 이상의 의미를 가지는 것은 AI의 감정 지능 경쟁에서 무엇을 신호하는가 하는 것입니다.
우리는 점점 점점 보조자가 적절한 말을 하는 것뿐만 아니라 적절한 방식으로 말해야 하는 시대에 접어들고 있습니다. 예를 들어 고객 서비스 봇이 진정으로 미안하게 들리고, 교사가 설명적이기보다는 격려하게 들리며, 게임 내 캐릭터가 진정성을 전달하는 것을 생각해보세요.
물론, AI가 설득력 있게 감정을 전달할 수 있는 능력을 가지는 것은 그것을 더 설득력 있게 만들고 잠재적으로 더 조작 가능하게 만듭니다. 만약 감정적인 연설이 또 다른 AI 도구가 될 수 있다면, 꽤 많은 사람들이 스스로 비명을 지르고 싶은 기분을 느낄 것입니다.
그럼에도 불구하고 Dia에게 유령 이야기를 단순히 읽는 것이 아니라 비명까지 포함하여 공연하는 재미를 느낄 수 있을 것 같습니다.
또한 좋아할 수도 있습니다
※출처: TechRadar







