날이 갈수록 진화하는 국내외 음성인식 기술 기반 서비스는 단순 인식 및 대화 수준을 넘어 일상 속 없어서는 안 될 어시스턴트로 거듭나고 있다. 생활 속 곳곳에 녹아 있는 AI 기술들을 소개한다.
AI 스타트업 리턴제로는 회의 내용을 자동으로 기록하고 분석해주는 ‘콜라보(CALLABO)’를 운영하고 있다.
현재 클로즈 베타 테스트로 20여개 기업에서 도입하여 사용되고 있는 ‘콜라보’는 온라인 원격 회의 플랫폼에서 이용할 수 있는 서비스다. 구글 캘린더에 연동된 원격 회의가 시작되면 ‘콜라보 레코더(CALLABO Recorder)’가 자동으로 참여해 회의 내용을 영상으로 기록해주며, 영상 하단에 변환된 텍스트를 한눈에 보여준다.
텍스트를 클릭하면 발언 시점의 영상이 재생돼 회의 중 중요한 내용을 놓쳤거나, 길어지는 회의 시간에 전체적인 내용을 기억하기 힘들 때 녹화된 영상 및 텍스트 변환 내용을 확인하면 보다 손쉽게 내용을 복기할 수 있다.
회의 분석 기능 ‘토픽트래커’도 선보였다. 회의 중에 언급 가능성이 높은 주요 키워드나 꼭 기록해야 하는 단어들을 회의 전 미리 설정해두면, 토픽트래커가 이를 분류 및 추출하여 회의 직후 데이터로 한눈에 확인할 수 있다. 이 외에도 수월한 업무처리를 위해 워크 툴과의 손쉬운 연동, 공유, 북마크 등 다양한 부가 기능들이 제공돼 담당자들의 업무 효율성과 능률을 한층 높여주고 있다.
LG전자는 최근 도서관 맞춤형 솔루션을 적용한 음성인식 가이드봇을 선보였다.지난달 경남교육청 창원도서관에 공급된 LG전자의 AI 기반 안내로봇 클로이 가이드봇은 더 편리한 도서 검색 서비스를 제공한다. 국내 안내로봇 가운데 최초로 음성인식 기능을 활용한 도서 검색 서비스로 시각장애인이나 글 입력이 어려운 어린이들의 접근성을 더욱 높였다.
이용자는 클로이봇에게 원하는 도서명이나 저자명을 말하면 전면에 설치된 디스플레이에 관련 도서를 보여주고 책이 비치된 곳까지 직접 안내한다. 도서관 내 도서관리시스템이 연동돼 신간 목록, 도서 위치 등은 자동으로 업데이트되어 이용객뿐만 아니라 관리자들에게도 편의성을 제공한다.
음성 기반 버추얼 휴먼 생성과 감정 반영 인공지능 솔루션을 개발한 플루언트는 텍스트, 음성 정보 등 AI 분석을 통해 3D 아바타를 생성해주는 솔루션을 제공한다. 음성 싱크로율이 맞는 자연스러운 아바타 생성이 가능하며 CPU와 웹캠 환경에서 실시간 모션 캡처 기능도 제공한다. 키오스크, 온라인 미팅, 컨택센터, 메타버스 등 다양한 공간에서 활용 가능하다는 점이 특징이다.
또한 카메라나 VR(가상현실) 기기 없이 목소리만으로 아바타를 만들어 주기 때문에 더욱 편리하다. 플루언트는 사람의 목소리와 얼굴 데이터를 학습한 인공지능이 실제 음성과 말할 때 하관의 모양 등을 추정해서 나와 닮은 아바타를 만들어낸다. 특히, 행복, 슬픔, 놀람 등 말의 감정을 분석해서 그에 맞는 표정을 지을 수도 있다.
미국의 손드 헬스(Sonde Health)는 음성 바이오마커를 활용해 질병을 예측할 수 있는 AI 프로그램을 개발했다. 음성 바이오마커란, 음성의 강약, 고저, 성대 움직임 등의 변화를 모니터링해 지표화하는 기술을 말한다.
해당 프로그램 개발을 위해 유럽과 미주 등 4개 대륙에 사는 8만5000여 명으로부터 120만개 음성 샘플을 확보하여 건강 상태 데이터를 구축했다. 현재는 우울증, 호흡기 분야 병 진단에 활용되고 있다. 6초가량의 목소리를 입력하면 천식 여부를 판단할 수 있다. 30초짜리 음성을 입력하면 우울증 여부까지도 진단할 수 있다.