가상인간 '로지' AI기술로 목소리로 생겨... '두시탈출 컬투쇼' 출연

클로바의 자체 개발 'NES' 기술로 자연스럽고 완성도 높은 AI 보이스 제작. 가상 인간의 라디오 방송 출연은 최초.

가상인간 ‘로지’가 네이버의 AI 기술로 만든 목소리를 갖게 됐다.
 

▲ 가상인간 로지 (이미지 출처=네이버)

네이버(주)는 싸이더스 스튜디오 엑스와 손잡고, 로지의 AI 보이스를 클로바 AI 음성합성 기술로 만들었다고 6일 밝혔다. 

로지의 AI 보이스는 오는 8일 방송되는 SBS 파워FM ‘두시탈출 컬투쇼’에서 공개될 예정이다. 로지는 이날 방송에 스페셜 게스트로 출연해, DJ 김태균과 버추얼 인플루언서로서의 활동에 대한 이야기를 나누고, 청취자 사연도 직접 읽을 계획이다. 가상 인간이 라디오 방송에 출연하는 것은 이번이 처음이다. 

로지의 AI 보이스는 네이버 클로바에서 자체 개발한 NES(Natural End–to-end Speech Synthesis) 기술을 통해 제작됐다. 약 40분 수준의 짧은 녹음만으로도, 분야에 대한 제약 없이 사용할 수 있으면서, 사람에 가까운 자연스러운 목소리를 구현할 수 있는 것이 NES의 차별점이다. 로지의 MZ세대 감성과 페르소나에 가장 적합한 목소리를 싸이더스 스튜디오 엑스 측이 선택하고, 네이버가 이를 NES 기술을 활용해 AI 보이스로 제작했다.  

로지가 별도의 녹음 없이도 AI 보이스를 통해 음성으로 자유롭게 소통할 수 있게 되면서, 그 동안 SNS, 광고 등에 주력했던 로지의 활동 영역도 한층 넓어질 것으로 기대된다. 라디오 DJ 뿐만 아니라, 도슨트, 사회자, 라이브 커머스 진행자 등 목소리를 필요로 하는 다양한 영역에서의 활동이 가능해질 전망이다.  

한편, 네이버는 AI 보이스로 동영상을 더빙할 수 있는 ‘클로바더빙’을 통해 음성합성 기술을 서비스하고 있다. ’클로바더빙’에서는 다양한 성별, 연령대, 스타일의 105개 보이스를 자유롭게 사용할 수 있으며, 영어, 일본어, 중국어, 스페인어 등 외국어 보이스도 제공된다. 클로바더빙의 AI 보이스는 채널A의 '오은영의 금쪽 상담소', '요즘 육아 금쪽같은 내 새끼' 등 실제 방송에서도 활용되고 있다. 

네이버는 누구나 자신의 목소리로 손쉽게 개성 있는 AI 보이스를 제작할 수 있는 ‘보이스메이커’ 서비스도 작년 11월 베타 오픈했다. ‘보이스메이커’로 제작된 AI 보이스는 ‘클로바더빙’을 통해 공개되며, 이미 20여개의 사용자 보이스가 업로드된 상태다. 

김재민 네이버 클로바 보이스 책임리더는 “국내 최초의 버추얼 인플루언서인 로지의 목소리를 클로바의 AI 기술로 제작하게 돼 의미가 깊다”면서, “네이버는 로지와의 협업을 활발히 이어가는 한편, 클로바 AI 보이스의 활용 범위를 계속해서 넓혀나갈 것”이라고 말했다.  

글. 이지은 기자 smile20222@gmail.com | 사진 및 자료출처=네이버 

ⓒ 브레인미디어 무단전재 및 재배포 금지