이럴 때, 단 한 번 300개 문장을 녹음하면 추가로 녹음하지 않아도 다양한 동화책을 아이에게 읽어줄 수 있으면 얼마나 좋을까.
KT(대표 황창규)가 5월 2일부터 판매하는 화면(스크린) 달린 ‘기가지니 테이블TV’에선 가능하다. 아빠나 엄마의 녹음된 목소리를 딥러닝으로 분석해 음성합성(P-TTS, Personalized-Text To Speech)으로 들려주는 ‘내 목소리 동화’를 서비스하기 때문이다.
국내 최초로 이런 서비스가 가능해진 것은 KT 융합기술원이 개발한 ‘딥러닝 음성합성 엔진’ 덕분이다. KT는 기술의 상당수를 특허 출원했다.
|
|
|
|
-엄마, 아빠 목소리로 어떻게 새로운 동화를 읽어주게 되나.
▲엄마나 아빠가 300개 문장을 스마트폰 별도 앱을 켜고 녹음하면 그 목소리를 딥러닝으로 분석해 음성합성하게 된다. 이후부터는 새로운 동화책을 엄마, 아빠 목소리로 읽어줄 수 있다. 녹음하는데 보통 1시간 반 정도(정확한 녹음을 위해) 걸린다.화자 인식과 개인화 음성합성 기술이 적용됐다.(최준기 상무보)
-다른 회사에는 없는 서비스인데 화자인식의 응용 범위가 넓을 것 같다. 앞으로의 계획은.
▲목표는 그 사람에 부를 때만 반응하는 것이다. 다른 사람이 아니라. 화자 인식에서 중요한 것은 사람의 목소리를 어떻게 확보하느냐가 중요한데 그래서 내 스마트폰으로 녹음할 수 있게 했다. 평소에 문장을 많이 녹음해주시면 본인 목소리로 아이에게 동화를 들려줄 수 있다.
KBS의 3.1절 특집 다큐멘터리에 독립운동가 고 정재용, 이갑성 선생의 목소리를 재현하는 걸 KT가 돕기도 했다. (임미숙 상무)
▲그렇다. 녹음된 음성이 있으면 가능하다.(임미숙 상무)
-내목소리 동화는 무료인가.
▲5월 한달 동안 신청을 받아 300명의 고객에게 우선 서비스를 제공할 예정이다. 다만, 뒷 단에 기술이 많이 들어가 유료화(2~3000원 정도로 알려짐)도 모색중이다.(최준기 상무보)
|
-경쟁사(SK텔레콤 누구 네모)에 비해 화면(스크린) 달린 AI가 화면 크기가 크고 IPTV도 이용할 수 있는데.
▲KT ‘기가지니 테이블TV’는 11.6인치로 SK텔레콤의 ‘누구 네모(7인치)’에 비해 화면이 크다. IPTV까지 불편없이 볼 수 있으려면 이정도 크기는 필요하다고 봤다. 스크린 크기는 막판까지 고민이었다.(김채희 단장)
-가격은 SK텔레콤 누구 네모(19만9000원)에 비해 비싼데
▲기가지니 테이블TV는 기가지니 호텔에 제공했던 단말기를 일반 판매하는 컨셉이다. 호텔 모델을 보고 집에도 두고 싶다는 고객 반응이 많았다.(김채희 단장)
-TV를 보지 않거나 서비스를 이용하지 않을때 어떤 기능이 있나. 보이는 AI스피커를 만든 이유는.
▲IPTV와 동화책 서비스, 요리 메뉴 검색 등을 이용하지 않을 때는 디지털시계로 쓸 수 있다. 디지털 액자로도 사용가능하게 할 생각이다. 또, 커머스 등도 가능하리라 본다. (최준기 상무보)
-IPTV를 ‘기가지니 테이블TV’로 보려면 별도 IPTV요금을 내야 하나. 기가지니 북클럽은 유료인가.
▲IPTV는 별도의 이용료를 내야 한다. 하지만 기가지니 북클럽은 무료다. 기가지니 북클럽은 대교 상상키즈 북클럽에 AI서비스를 결합한 것이다. 소리동화, 세이펜 등이 가능하다. (최준기 상무보)
|
-냉장고 제조사 등이 기가지니를 이용하고 싶을 때 제공한다는 소프트웨어개발툴킷이나 모듈(기가지니 인사이드)은 현재 논의 중인 제조사가 있는가.
▲3,4곳과 협이 중이다. 주로 대형 가전회사가 대상이다. 차량도 나중에는 협력 대상이 되지 않을까 한다. 이전까지 중소 개발사(3rd Party)에서 기가지니 서비스를 이용하기 위해서는 기가지니 단말이 있어야 했고, 개발자 포털 KT API 링크를 통해 웹앱 서비스를 개발해야만 했다
하지만 기가지니 인사이드 모듈은 냉장고, 안마의자, 에어컨과 같은 가전제품은 물론 차량, 스마트홈 단말에 삽입해 기가지니 호출어와 서비스 이용이 가능하다. 다양한 단말 플랫폼을 지원한 소프트웨어 개발 키트를 개발한 덕분이다. 상반기 중 출시 예정이다. B2B 상품이다.(최준기 상무보)
|
|