책은 원래 혼자 읽는 거라지만, 가끔은 직접 읽어주는 누군가의 목소리가 그립기도 하다. 음성합성기술의 발달은 '혼책러'들에게 반가울 법하다.

 

 

16일 서울 강남구 코엑스 그랜드볼룸에서 열린 'DEVIEW 2017'에서 데브시스터즈의 김태훈 엔지니어가 '책 읽어주는 딥러닝'에 대해 발표했다. 이는 컴퓨터에 목소리를 학습시켜, 직접 녹음하지 않고도 특정인의 목소리를 자유자재로 낼 수 있는 기술이다. 

이 발표에서는 음성 합성 엔진을 구현하는데 사용한 세 가지 연구를 소개하고, 각각의 기술이 얼마나 자연스러운 목소리를 만들 수 있는지를 설명했다. 음성을 추출해 문장별로 자르고, 텍스트와 음성을 맞추는 작업을 거치는 식이다. 

현재 샘플 홈페이지(http://carpedm20.github.io/tacotron/)에는 성우 서혜정, 손석희 앵커, 박근혜 전 대통령, 문재인 대통령의 목소리가 업로드돼 있다. 재미난 예문을 네 사람의 목소리로 들어볼 수 있는데, 일부 잡음이 섞여 있지만 실제 인물들이 직접 녹음한 듯 놀라운 정확도를 자랑한다. 

텍스트를 음성으로 읽어주는 음성 합성 기술은 시각 장애인을 위한 오디오북, 음성 안내 시스템, 대화 인공지능 등 많은 분야에 활용할 수 있다. 지금까지는 개인이 원하는 목소리로 만들기엔 어려움이 많았고, 어도비 등 소수의 기업만이 기술을 보유하고 있었다. 이번 프로젝트로 인해서는 보다 친숙한 목소리들을 다양한 기술에 접목할 수 있을 것으로 보인다.

사진=픽사베이 

저작권자 © 싱글리스트 무단전재 및 재배포 금지

관련기사