날이 갈수록 진화하는 국내외 음성인식 기술 기반 서비스는 단순 인식 및 대화 수준을 넘어 일상 속 없어서는 안 될 어시스턴트로 거듭나고 있다. 생활 속 곳곳에 녹아 있는 AI 기술들을 소개한다.

사진=리턴제로
사진=리턴제로

AI 스타트업 리턴제로는 회의 내용을 자동으로 기록하고 분석해주는 ‘콜라보(CALLABO)’를 운영하고 있다.

현재 클로즈 베타 테스트로 20여개 기업에서 도입하여 사용되고 있는 ‘콜라보’는 온라인 원격 회의 플랫폼에서 이용할 수 있는 서비스다. 구글 캘린더에 연동된 원격 회의가 시작되면 ‘콜라보 레코더(CALLABO Recorder)’가 자동으로 참여해 회의 내용을 영상으로 기록해주며, 영상 하단에 변환된 텍스트를 한눈에 보여준다. 

텍스트를 클릭하면 발언 시점의 영상이 재생돼 회의 중 중요한 내용을 놓쳤거나, 길어지는 회의 시간에 전체적인 내용을 기억하기 힘들 때 녹화된 영상 및 텍스트 변환 내용을 확인하면 보다 손쉽게 내용을 복기할 수 있다.

회의 분석 기능 ‘토픽트래커’도 선보였다. 회의 중에 언급 가능성이 높은 주요 키워드나 꼭 기록해야 하는 단어들을 회의 전 미리 설정해두면, 토픽트래커가 이를 분류 및 추출하여 회의 직후 데이터로 한눈에 확인할 수 있다. 이 외에도 수월한 업무처리를 위해 워크 툴과의 손쉬운 연동, 공유, 북마크 등 다양한 부가 기능들이 제공돼 담당자들의 업무 효율성과 능률을 한층 높여주고 있다.

사진=LG전자
사진=LG전자

LG전자는 최근 도서관 맞춤형 솔루션을 적용한 음성인식 가이드봇을 선보였다.지난달 경남교육청 창원도서관에 공급된 LG전자의 AI 기반 안내로봇 클로이 가이드봇은 더 편리한 도서 검색 서비스를 제공한다. 국내 안내로봇 가운데 최초로 음성인식 기능을 활용한 도서 검색 서비스로 시각장애인이나 글 입력이 어려운 어린이들의 접근성을 더욱 높였다. 

이용자는 클로이봇에게 원하는 도서명이나 저자명을 말하면 전면에 설치된 디스플레이에 관련 도서를 보여주고 책이 비치된 곳까지 직접 안내한다. 도서관 내 도서관리시스템이 연동돼 신간 목록, 도서 위치 등은 자동으로 업데이트되어 이용객뿐만 아니라 관리자들에게도 편의성을 제공한다.

음성 기반 버추얼 휴먼 생성과 감정 반영 인공지능 솔루션을 개발한 플루언트는 텍스트, 음성 정보 등 AI 분석을 통해 3D 아바타를 생성해주는 솔루션을 제공한다. 음성 싱크로율이 맞는 자연스러운 아바타 생성이 가능하며 CPU와 웹캠 환경에서 실시간 모션 캡처 기능도 제공한다. 키오스크, 온라인 미팅, 컨택센터, 메타버스 등 다양한 공간에서 활용 가능하다는 점이 특징이다.

또한 카메라나 VR(가상현실) 기기 없이 목소리만으로 아바타를 만들어 주기 때문에 더욱 편리하다. 플루언트는 사람의 목소리와 얼굴 데이터를 학습한 인공지능이 실제 음성과 말할 때 하관의 모양 등을 추정해서 나와 닮은 아바타를 만들어낸다. 특히, 행복, 슬픔, 놀람 등 말의 감정을 분석해서 그에 맞는 표정을 지을 수도 있다.

사진=손드 헬스
사진=손드 헬스

미국의 손드 헬스(Sonde Health)는 음성 바이오마커를 활용해 질병을 예측할 수 있는 AI 프로그램을 개발했다. 음성 바이오마커란, 음성의 강약, 고저, 성대 움직임 등의 변화를 모니터링해 지표화하는 기술을 말한다.

해당 프로그램 개발을 위해 유럽과 미주 등 4개 대륙에 사는 8만5000여 명으로부터 120만개 음성 샘플을 확보하여 건강 상태 데이터를 구축했다. 현재는 우울증, 호흡기 분야 병 진단에 활용되고 있다. 6초가량의 목소리를 입력하면 천식 여부를 판단할 수 있다. 30초짜리 음성을 입력하면 우울증 여부까지도 진단할 수 있다.

저작권자 © 싱글리스트 무단전재 및 재배포 금지