한국 청년들이 만든 음성 AI 모델 ‘Dia’, 글로벌 빅테크를 뛰어넘다
최근 인공지능(AI) 업계에서 한국 청년들이 만든 음성합성(TTS) 모델 ‘Dia’가 세계적인 주목을 받고 있다. 두 명의 대학생이 개발한 이 모델은 마이크로소프트, 구글, 바이트댄스 등 글로벌 빅테크 기업의 기술력을 뛰어넘었다는 평가를 받으며, 음성 AI 시장에 새로운 패러다임을 제시하고 있다. 특히, 감정 표현과 비언어적 음성 구현까지 가능하다는 점에서 기술적 완성도와 창의성 모두를 인정받고 있다.

ai 이미지 생성
서울대·KAIST 학생이 만든 ‘Dia’, 실리콘밸리를 놀라게 하다
음성합성 기술은 단순히 텍스트를 음성으로 전환하는 기능에서 출발했지만, 최근에는 감정 인식과 비언어 표현까지 구현하는 방향으로 진화하고 있다. 나리랩스(Nari Labs)는 서울대학교 김도엽, KAIST 성재용 두 학생이 공동 창업한 스타트업으로, 단 세 달 만에 자체 음성 AI 모델 ‘Dia’를 개발해 공개했다. 이들은 투자금 없이, 오직 구글이 제공한 인프라를 활용해 모델을 개발했으며, 공개 2주 만에 오픈소스 플랫폼 ‘허깅페이스(Hugging Face)’에서 다운로드 10만 건을 돌파하는 성과를 거두었다.
Dia는 단순한 음성 변환을 넘어, 인간처럼 자연스러운 억양과 감정을 담아내는 데 성공했다. 웃음, 기침, 탄식과 같은 비언어적 표현은 물론, 분노·슬픔·긴장감이 담긴 시나리오에서도 탁월한 감정 전달력을 보여주었다. 경쟁 모델인 일레븐랩스(ElevenLabs)나 구글 노트북LM 대비 감정선 구현과 리듬 유지 면에서 높은 평가를 받았으며, 미국 와튼스쿨 이선 몰릭 교수는 이를 두고 “가장 표현력이 풍부한 AI 음성을 구현한 충격적인 모멘트”라고 극찬했다. 실리콘밸리의 벤처캐피털리스트 디디 다스 역시 “완벽한 감정을 표현해낼 수 있는 모델”이라며 놀라움을 드러냈다.
오픈소스로 공개된 Dia, 누구나 사용할 수 있는 고성능 AI
나리랩스는 Dia를 누구나 활용할 수 있도록 오픈소스로 공개했다. 기업은 이를 상업적 목적으로도 자유롭게 사용할 수 있으며, 이는 기술 민주화를 실현하는 한 가지 방식으로도 평가된다. 지금까지 대부분의 TTS 모델은 고비용 인프라와 대규모 팀이 필요했지만, 단 두 명의 개발자가 비용과 인력의 한계를 넘어 압도적인 성능을 구현한 사례는 드물다. 김도엽 대표는 “시중의 거의 모든 TTS API를 테스트해봤지만, 실제 사람처럼 들리는 모델은 없었다”며, “Dia는 텍스트 프롬프트만으로도 실제 대화처럼 자연스럽고 감정이 살아 있는 음성을 생성할 수 있다”고 밝혔다.
음성 AI 시장은 빠르게 성장하고 있다. 마켓리서치비즈에 따르면, 글로벌 음성합성 시장은 2032년까지 약 111억 달러, 한화 약 15조 원 규모로 성장할 것으로 전망된다. 생성형 AI가 지금까지는 텍스트 기반 중심으로 발전해왔다면, 앞으로는 음성과 멀티모달 출력 기능이 핵심이 될 것으로 예상된다. 최근에는 카카오가 개발한 ‘카나나-o’ 모델이 오픈AI의 GPT-4o, 구글 제미나이-1.5 프로와 유사하거나 뛰어난 성능을 보이며 주목받기도 했다. 특히 카나나-o는 감정 인식 분야에서 큰 격차로 경쟁 모델을 앞질렀으며, 한국 음성 AI 기술의 가능성을 다시 한번 증명했다.

기술 발전과 함께 따라야 할 윤리적 기준도 중요
음성 AI 기술의 발전은 분명 긍정적인 면이 많지만, 악용 우려도 함께 커지고 있다. 예를 들어 보이스피싱, 음성 사기 등 범죄에 악용될 가능성이 지적되며, 이에 따라 법적·윤리적 가이드라인 마련이 시급하다는 목소리도 커지고 있다. 기술의 무분별한 사용을 막고, 사회적으로 안전한 활용을 위해 정책과 제도의 뒷받침이 요구된다.
결론: 기술과 열정이 만든 또 하나의 'AI 모멘트'
Dia의 등장은 단지 하나의 기술 성과에 그치지 않는다. 두 청년의 도전 정신과 창의력, 그리고 한국의 AI 기술이 세계적인 기술 장벽을 넘어설 수 있다는 가능성을 증명한 순간이다. 앞으로 음성 AI가 더 인간에 가까운 방식으로 소통하고, 다양한 분야에서 실질적인 도움을 줄 수 있는 기술로 성장하기 위해선, 이러한 창의적 시도들이 계속 이어져야 할 것이다. K-딥보이스의 시대가 도래하고 있으며, 세계는 지금 한국 기술의 힘을 주목하고 있다.
'AI 활용' 카테고리의 다른 글
AI가 대체할 수 없는 3가지, 이것만 알면 살아남는다 (0) | 2025.05.06 |
---|---|
구글, ‘AI 모드’ 전면 개방…검색 패러다임이 바뀐다 (6) | 2025.05.06 |
알리바바, 초거대 AI 모델 ‘큐원3’ 공개… 구글·오픈AI에 도전장 (0) | 2025.05.05 |
나만의 AI 연구비서 ‘노트북LM’, 구글의 최신 업그레이드로 진화하다 (0) | 2025.05.05 |
'AI가 블로그 운영해 월 100만원'…가짜정보는 나 몰라라 (4) | 2025.01.23 |