음성인식 기술
음성은 사람이 공간, 시간, 문제 해결 등에 집중한 상태로 사용할 수 있는 인터페이스로, 지능형 영역에 적용되는 인터페이스 중 한 분야로 손꼽히고 있다. Amazon Echo, Google Home, SKT NUGU와 같은 스마트 스피커가 앞다퉈 출시하면서 가정 내 사물 인터넷 디바이스를 제어하거나 인공지능 비서로도 음성 인식이 활용되고 있다. 그림5는 음성 인식을 위한 프로세스를 나타내고 있다.
<그림5> 음성 인식 기술
출처: LG CNS
구글의 ‘Cloud Speech API’
구글은 클라우드 플랫폼 서비스 중 하나로 음성 인식을 위한 Cloud Speech API를 제공한다. Google Now와 Google 검색에도 적용되어 있고, 한국어를 포함한 80개 이상의 언어를 지원한다. Google Cloud로 파일을 업로드하여 REST 또는 gRPC 요청이 가능한 여러 디바이스에서 Google Cloud Speech API를 사용하여 개발이 가능하다(그림6). 이러한 API 제공은 음성 인식을 이용한 다양한 소프트웨어를 만들어 낼 수 있으며, 구글의 방대한 자료로 인해 음성 인식의 정확도는 지속적으로 높아질 것이다.
<그림6> 구글의 ‘Cloud Speech API’
출처: 구글
Naver ‘음성 인식’, ‘음성 합성'
Naver 음성 인식은 소켓 통신을 통한 스트리밍 형태로 서버에 전달하여 텍스트로 변환해주는 API이다. REST API는 제공하지 않고, 자체 프로토콜을 구현한 SDK를 제공하고 있고, 현재는 Android 버전만 제공되고 있으며, 추후 iOS용 SDK도 제공될 예정이다. 음성 합성은 4개 언어(한국어, 영어, 일본어, 중국어)에 대한 성우 목소리로 음성을 합성해주는 REST API를 제공한다.
<참고사이트>
Naver 음성인식과 음성 합성 개발자 사이트
https://developers.naver.com/docs/labs/vrecog
https://developers.naver.com/docs/labs/tts
https://developers.naver.com/docs/labs/vrecog
https://developers.naver.com/docs/labs/tts
반응형 기술
지금까지도 사람이 직접 사물을 모니터링 하면서 나타나는 현상에 대해 직접 대응하고 있다. 이렇게 사람이 직접 대응하는 방식은 수집되는 정보의 양에 따라 중요한 정보를 놓지는 경우도 있고 대응에 늦거나 오류가 발생할 수도 있다. 반응형 인공지능은 이러한 부분을 보완할 수 있다.
LG CNS의 ‘산업 안전 서비스 모델’
2016 Innovation Summit에서 공개한 전 세계 12개국 2,500명의 비즈니스 리더 대상으로 진행한 IoT 2020 비즈니스 리포트에 따르면, 응답자의 81%가 “사물 인터넷이 조직에서 효과적으로 활용되어 비즈니스에 도움이 된다”라고 응답했다. Factory, 물류 분야는 생산성 향상, 안전성 증대, 에너지 절감 등과 연관된다.
LG CNS에서 구축한 '산업 안전 서비스 모델'은 안전 장비에 사물 인터넷 센서를 부착한 후 미착용 작업자의 접근을 통제하고, 위험지역의 상태를 실시간으로 모니터링 하여 사고를 미연에 방지하고 사고 발생 시 신속히 대응할 수 있도록 한다. 스마트 팩토리(Smart factory)를 통해 공정의 모터 컨트롤러 등에서 문제 발생 시, 오류 상황을 스스로 판단하여 자동으로 생산 공정을 재구성 할 수도 있다.
<그림7> 산업 안전 서비스 모델의 예
출처: LG CNS
무인 자동차 분야(구글, 현대)
센서, 네트워크, GPS 등을 이용하여 자동차 스스로 실시간 교통상황과 지리 정보 서비스를 제공하는 텔레메틱스(Telematics)라 하는데, 텔레메틱스와 함께 커넥티드 카(Connected Car) 기반의 무인 자동차 기술이 발전되고 있다. 자동차의 인포테인먼트(Infotainment)부터 자율 주행까지 포함하는 의미인데 현재는 스마트폰에 연계되어 정보를 주고받지만 다른 차량과의 정보교환이나 센서 등을 통해 교통 상태를 인식하고 주행하는 자율 주행이 최종 모습이다. 이러한 정보 수집을 통해, 자동차는 교통정보를 인식하고, 사용자는 자율 주행의 효율성 및 안정성을 확보할 수 있게 된다.
자율주행자동차는 머신 러닝의 좀 더 가까운 예시로, 데이터를 수집해 진화하기보다는 실시간으로 처리하는 것에 더 특화돼 있다. 항상 GPS와 위성통신으로 현재 위치를 파악하고, 목적지까지 가는 경로와 교통상황 및 주행상황을 실시간으로 빠르게 분석해야 한다. 교통법규를 준수하며 안전하게 목적지까지 탑승자를 도착시키는 것이 이 자동차의 목적이다. 여기서 한 걸음 더 나아가면, 탑승자가 집과 직장을 왕복하는 경우 해당 목적지까지 더 빠르게 도착할 수 있는 경로를 찾거나, 앞선 차량의 속도가 느릴 때 차선을 바꿔 주행속도를 높이는 등의 선택적 연산까지 가능해진다.
<참고사이트>
시사점
지능형 기기는 인공지능을 반영한 것이기 때문에, 반드시 대용량의 수집 데이터가 필요하다. 구글이나 애플 등과 같은 글로벌 기업들뿐만 아니라 SK나 삼성 등의 국내 기업들도 음성 인식을 통한 정보 수집을 시작하였다. 음성 인식은 짧게는 사람의 말을 기계가 알아들을 수 있는 기술이지만, 길게 보면 사람에게 직접 정보를 수집할 수 있는 창구이기도 하다. 이러한 음성 데이터 수집은 사람에 의해 발생되는 다양한 데이터가 분석되는 시발점이 될 것이고, 분석된 데이터는 인공지능을 한층 더 발전시키는 계기가 될 것이다.