KR102417524B1

KR102417524B1 - 음성 인식 기반의 자동차 제어 방법

Info

Publication number: KR102417524B1
Application number: KR1020170133259A
Authority: KR
Inventors: 심현철
Original assignee: 현대자동차주식회사; 기아 주식회사
Priority date: 2017-10-13
Filing date: 2017-10-13
Publication date: 2022-07-07
Also published as: US20190115017A1; CN109664847A; US10446152B2; CN109664847B; KR20190041710A

Abstract

본 발명은 음성 인식 기반의 자동차 제어 방법에 관한 것으로, 인증을 위한 정보(예를 들면 패스워드 또는 핀 코드)를 직접 음성 형태로 발화하지 않고 사용자의 휴대용 기기(예를 들면 웨어러블 기기)를 통해 비공개적으로 사용자 인증이 이루어지도록 함으로써 사용자 인증 시 충분한 보안이 이루어지도록 하는데 그 목적이 있다. 이를 위해 본 발명에 따른 음성 인식 기반의 자동차 제어 방법은, 음성 명령의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 상기 음성 명령을 제 1 서버로 전송하는 단계와; 상기 음성 명령의 발생에 응답하여 휴대용 디바이스를 경유하는 제 2 경로를 통해 상기 휴대용 디바이스의 인증 데이터 및 상기 음성 명령을 상기 제 1 서버로 전송하는 단계와; 상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 디바이스의 인증을 수행하고, 상기 휴대용 디바이스의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함한다.

Description

음성 인식 기반의 자동차 제어 방법{SPEECH RECOGNITION BASED VEHICLE CONTROL METHOD}

본 발명은 자동차에 관한 것으로, 음성 인식 기반의 자동차 제어에 관한 것이다.

음성 인식 기술이 발달함에 따라 사용자가 발화에 의해 발생하는 음성 명령을 인식하여 해당 명령을 수행하는 음성 인식 비서 서비스의 활용이 크게 증가하고 있다. 음성 인식 비서 서비스는 적용 범위가 가정에서 자동차 등의 다양한 분야로 확대되고 있다. 즉, 음성 인식 비서 서비스와 텔레매틱스 서비스가 연계되어 사용자의 발화에 의해 생성되는 음성 명령이 자동차에 전달되어 자동차의 제어가 이루어진다. 이를 통해 사용자는 자동차의 도어를 잠금/해제하거나, 공조기를 미리 턴 온 시켜서 자동차 내부의 온도를 조절할 수 있다.

이와 같이 음성 인식 비서 서비스를 사용하기 위해서는 사용자 인증이 필요하다. 사용자 인증을 거치지 않으면 허용되지 않은 사람이 자동차를 무단으로 사용할 가능성이 있기 때문이다. 기존의 사용자 인증 방법은 패스워드(예를 들면 PIN Code)를 발화하여 홈 스피커(120)가 인식하도록 하는 것을 예로 들 수 있다. 그러나 이와 같은 패스워드의 직접 발화를 통한 사용자 인증은 패스워드가 노출될 우려가 있어서 꺼려지게 마련이다.

본 발명의 일 측면에 따르면, 인증을 위한 정보(예를 들면 패스워드 또는 핀 코드)를 직접 음성 형태로 발화하지 않고 사용자의 휴대용 기기(예를 들면 웨어러블 기기)를 통해 비공개적으로 사용자 인증이 이루어지도록 함으로써 사용자 인증 시 충분한 보안이 이루어지도록 하는데 그 목적이 있다.

상술한 목적의 본 발명에 따른 음성 인식 기반의 자동차 제어 방법은, 음성 명령의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 상기 음성 명령을 제 1 서버로 전송하는 단계와; 상기 음성 명령의 발생에 응답하여 휴대용 디바이스를 경유하는 제 2 경로를 통해 상기 휴대용 디바이스의 인증 데이터 및 상기 음성 명령을 상기 제 1 서버로 전송하는 단계와; 상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 디바이스의 인증을 수행하고, 상기 휴대용 디바이스의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함한다.

상술한 음성 인식 기반의 자동차 제어 방법은, 상기 음성 명령의 유효성 판단을 위해, 상기 제 1 경로를 통해 전송되는 음성 명령과 상기 제 2 경로를 통해 전송되는 음성 명령을 비교하여 일치 여부를 판단하는 것을 더 포함한다.

상술한 음성 인식 기반의 자동차 제어 방법은, 상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함한다.

상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 제 2 서버는 텔레매틱스 서버이고; 상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것이다.

상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기이다.

상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기이다.

상술한 목적의 본 발명에 따른 또 다른 음성 인식 기반의 자동차 제어 방법은, 휴대용 디바이스에서 제스처 이벤트가 발생하는 단계와; 상기 제스처 이벤트의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 음성 명령을 제 1 서버로 전송하는 단계와; 상기 제스처 이벤트의 발생에 응답하여 상기 휴대용 디바이스를 경유하는 제 2 경로를 통해 상기 휴대용 디바이스의 인증 데이터 및 제스처 이벤트 데이터를 상기 제 1 서버로 전송하는 단계와; 상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 디바이스의 인증을 수행하고, 상기 휴대용 디바이스의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함한다.

상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 제스처 이벤트의 발생 후 미리 설정된 시간 내에 입력되는 음성 신호만을 음성 명령으로 인식한다.

상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 휴대용 디바이스의 사용자가 신체의 일부를 움직이는 것을 움직임 센서를 통해 감지함으로써 상기 제스처 이벤트가 생성된다.

상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 움직임 센서는, 상기 사용자의 신체의 일부가 움직이는 것을 감지하도록 마련되는 자이로 센서와 비전 센서, 광 센서 가운데 적어도 하나이다.

상술한 목적의 본 발명에 따른 음성 인식 제어 방법은, 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 음성 명령을 제 1 서버로 전송하는 단계와; 휴대용 디바이스를 경유하는 제 2 경로를 통해 상기 휴대용 디바이스의 인증 데이터를 상기 제 1 서버로 전송하는 단계와; 상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 디바이스의 인증을 수행하고, 상기 휴대용 디바이스의 인증 결과에 따라 상기 음성 명령의 유효성을 판단하는 단계를 포함한다.

상술한 음성 인식 제어 방법은, 상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함한다.

상술한 음성 인식 제어 방법에서, 상기 제 2 서버는 텔레매틱스 서버이고; 상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것이다.

상술한 음성 인식 제어 방법에서, 상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기이다.

상술한 음성 인식 제어 방법에서, 상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기이다.

본 발명의 일 측면에 따르면, 인증을 위한 정보(예를 들면 패스워드 또는 핀 코드)를 직접 음성 형태로 발화하지 않고 사용자의 휴대용 기기(예를 들면 웨어러블 기기)를 통해 비공개적으로 사용자 인증이 이루어지도록 함으로써 사용자 인증 시 충분한 보안이 이루어지도록 한다.

도 1은 본 발명의 일 실시 예에 따른 음성 인식 기반의 자동차 제어 시스템을 나타낸 도면이다.
도 2는 도 1에 나타낸 자동차 제어 시스템의 구체적인 구성을 나타낸 도면이다.
도 3은 본 발명의 일 실시 예에 따른 음성 인식 기반의 자동차 제어 방법을 나타낸 도면이다.
도 4는 도 3에 나타낸 자동차 제어 방법의 제 1 실시 예를 나타낸 도면이다.
도 5는 도 3에 나타낸 자동차 제어 방법의 제 2 실시 예를 나타낸 도면이다.

도 1은 본 발명의 일 실시 예에 따른 음성 인식 기반의 자동차 제어 시스템을 나타낸 도면이다.

주거 공간(140)에는 홈 스피커(130)를 기반으로 하는 음성 인식 비서 서비스가 마련된다. 음성 인식 비서 서비스는 사용자(110)가 발화를 통해 음성 명령을 발생시키면 홈 스피커(130)에 마련되어 있는 음성 인식 기능 및 인공 지능이 사용자(110)의 음성 명령을 인식하여 해당 명령을 수행하는 서비스이다.

예를 들면 주거 공간(140) 내에 설치되어 있는 에어컨을 켜고 목표 온도를 설정하고자 할 때, 사용자(110)는 “에어컨 켜고, 설정 온도는 25℃로 맞춰 줘.”라고 발화하면 홈 스피커(120)가 사용자(110)의 음성 명령을 인식하고 해당 명령대로 에어컨을 켜고 온도를 25℃로 설정한다. 이와 같은 음성 인식 비서 서비스는 주거 공간(140) 내의 가전 기기들과 홈 스피커(130)가 통신 가능하도록 홈 네트워크를 통해 연결되는 것을 전제로 한다.

음성 인식 비서 서비스는 적용 범위가 가정에서 자동차(100)로 확대되고 있다. 즉, 음성 인식 비서 서비스와 텔레매틱스 서비스가 연계되어 사용자(110)의 발화에 의해 생성되는 음성 명령이 자동차(100)에 전달되어 자동차(100)의 제어가 이루어진다.

예를 들면, 자동차(100)의 시트의 온도를 미리 높이고자 할 때, 사용자(110)는 “자동차의 열선 시트를 켜 줘.”라고 발화하면 홈 스피커(120)가 사용자(110)의 음성 명령을 IoT 서버(150)를 통해 텔레매틱스 서버(160)에 전달하여 자동차(100)의 제어가 이루어지도록 한다.

이와 같이 사용자(110)가 음성 인식 명령을 발생시키기 위해서는 사용자 인증이 필요하다. 사용자 인증을 거치지 않으면 허용되지 않은 사람이 자동차(100)를 무단으로 사용할 가능성이 있기 때문이다. 기존의 사용자 인증 방법은 패스워드(예를 들면 PIN Code)를 발화하여 홈 스피커(120)가 인식하도록 하는 것을 예로 들 수 있다. 그러나 이와 같은 패스워드의 직접 발화를 통한 사용자 인증은 패스워드가 노출될 우려가 있어서 꺼려지게 마련이다.

본 발명의 실시 예에 따른 음성 인식 비서 서비스를 이용한 자동차의 제어에서는 패스워드를 직접 발화하지 않고 사용자(110)가 착용(휴대)한 기기(예를 들면 웨어러블 기기(120))를 통해 비공개적으로 사용자 인증이 이루어진다. 이를 위해 사용자(110)는 웨어러블 기기(120)를 IoT 서버(150)에 미리 등록해 두고, 실 사용 시 웨어러블 기기(120)의 인증으로 사용자 인증을 대신할 수 있도록 한다.

도 2는 도 1에 나타낸 자동차 제어 시스템의 구체적인 구성을 나타낸 도면이다.

웨어러블 기기(120)는 음성 신호 처리부(122)와 움직임 센서(124)를 포함한다. 웨어러블 기기(120)의 음성 신호 처리부(122)는 마이크로폰(미도시)을 통해 입력되는 음성 신호를 전기 신호로 변환하고 다시 디지털 데이터 형태로 변환한다. 움직임 센서(124)는 사용자(110)의 제스처를 감지하도록 마련된다. 움직임 센서(124)는 자이로 센서나 비전 센서, 광 센서처럼 사용자(110)의 신체의 일부가 움직이는 것(제스처)을 감지하기 위한 것이다. 웨어러블 기기(120)를 이용한 미리 약속된 형태의 제스처 이벤트는 사용자(110)가 발화를 통한 음성 명령을 발생시킴을 예고하는 사전 준비 동작일 수 있다.

홈 스피커(130)는 음성 인식 비서 서비스의 기반이 되는 장치이다. 사용자(110)가 음성 인식 비서 서비스를 이용하기 위해 발화를 통해 음성 명령을 발생시키면 홈 스피커(130)에 마련되어 있는 음성 인식 기능 및 인공 지능이 사용자(110)의 음성 명령을 인식하여 해당 명령을 수행한다. 이를 위해 홈 스피커(130)는 음성 신호 처리부(132)와 TTS 처리부(134)를 포함한다. 홈 스피커(130)의 음성 신호 처리부(132)는 마이크로폰(미도시)을 통해 입력되는 음성 신호를 전기 신호로 변환하고 다시 디지털 데이터 형태로 변환한다. TTS 처리부(134)는 텍스트 데이터를 음성 신호로 변환하여(Text-to-Speech) 출력하도록 마련된다. 예를 들면 사용자(110)에게 음성 형태의 메시지를 출력하고자 할 때 해당 내용의 텍스트를 인간의 언어로 변환하여 출력한다.

IoT 서버(150)는 웨어러블 기기(122)와 홈 스피커(130), 텔레매틱스 서버(160)와 통신 가능하도록 연결된다. IoT 서버(150)는 음성 명령의 변환과 사용자의 인증 등을 수행한다. 웨어러블 기기 인증 데이터베이스(152)와 음성 저장부(154), 웨어러블 기기 인증 처리부(156), 명령어 처리부(158)를 포함한다. 웨어러블 기기 인증 데이터베이스(152)는 웨어러블 기기(120)의 인증을 위해 필요한 정보가 저장된다. 예를 들면 사용자(110)가 웨어러블 기기(120)를 사전이 미리 등록하기 위해 입력하는 웨어러블 기기(120)의 고유 정보가 웨어러블 기기 인증 데이터베이스(152)에 저장된다. 웨어러블 기기 인증 데이터베이스(152)에 저장되어 있는 정보는 향후 웨어러블 기기(120)의 인증을 위해 사용된다. 음성 저장부(154)는 웨어러블 기기(120) 또는 홈 스피커(130)를 통해 전달되는 음성 명령이 저장된다. 웨어러블 기기 인증 처리부(156)는 웨어러블 기기 인증 데이터베이스(152)에 저장되어 있는 정보에 기초하여 웨어러블 기기(120)가 사전에 미리 등록된 것임을 확인하는 인증을 수행한다. 명령어 처리부(158)는 사용자(110)가 발화를 통해 생성한 음성 명령을 스피치-텍스트 변환을 통해 텍스트 형태로 변환한다.

도 3은 본 발명의 일 실시 예에 따른 음성 인식 기반의 자동차 제어 방법을 나타낸 도면이다.

도 3에 나타낸 바와 같이, 사용자(110)로부터 음성 명령이 발생하면(312), 음성 인식 서비스 장치인 홈 스피커(130)를 통해 제 1 서버인 IoT 서버(150)로 전송되고(332), 또 휴대용 기기인 웨어러블 기기(120)를 통해 제 1 서버인 IoT 서버(150)로 전송된다(322). 이와 같은 두 개의 경로를 통해 전송되는 음성 명령은 IoT 서버(150)에 수신된다(352). IoT 서버(150)에서는 음성 명령의 유효성 판단을 위해 웨어러블 기기(120)의 인증이 이루어진다(354). 웨어러블 기기(120)의 인증이 정상적으로 이루어져서 음성 명령의 유효성이 확보되면, 음성 명령이 IoT 서버(150)에서 제 2 서버인 텔레매틱스 서버(160)로 전송되어 자동차(362)의 제어가 이루어진다(356)(362).

도 4는 도 3에 나타낸 자동차 제어 방법의 제 1 실시 예를 나타낸 도면이다. 도 4에 나타낸 제 1 실시 예는, 마이크로폰이 탑재되어 있는 웨어러블 기기(120)를 통해 음성 명령을 전달하여 보안 인증이 이루어지도록 하는 경우이다.

사용자(110)는 원격지에 위치한 자동차(100)를 음성 인식 비서 서비스를 통해 제어하기 위해 목적하는 제어 명령에 해당하는 음성 명령을 발화한다(404). 사용자(110)가 발화한 음성 명령은 웨어러블 기기(120) 및 홈 스피커(130)로 전달된다.

웨어러블 기기(120)는, 사용자(110)의 발화에 의해 생성된 음성 명령을 전달받아 녹음한 후 저장한다(426). 본 발명의 실시 예에서는, 웨어러블 기기(130)에 입력되는 음성 신호의 크기(진폭)로부터 음성 명령의 시작과 종료를 판단한다. 예를 들면, 사람이 일상적으로 하나의 문장을 발화할 때 발화의 시작 시점 및 종료 시점 각각의 음성 신호의 크기(진폭)를 실험을 통해 구하여 일반화하고, 실험 결과에 기초하여 음성 명령의 실제 발화 시의 음성 신호의 크기(진폭)로부터 음성 명령의 시작 시점과 종료 시점을 구분한다.

웨어러블 기기(120)는 웨어러블 기기(120) 자신의 인증 데이터 및 녹음된 음성 명령을 IoT 서버(150)로 전송한다(428). 웨어러블 기기(120)의 인증 데이터는 웨어러블 기기(120)가 사전에 IoT 서버(150)에 등록된 신뢰할 수 있는 기기임을 나타내는 근거가 된다. IoT 서버(150)는 웨어러블 기기(120)의 인증 데이터를 확인함으로써 해당 웨어러블 기기(120)가 사전에 등록된 신뢰할 수 있는 기기인 것으로 판단한다.

홈 스피커(130)는, 사용자(110)의 발화에 의해 생성된 음성 명령을 전달받아 스피치-텍스트 변환을 수행한다(442). 스피치-텍스트 변환은 사용자(110)가 발화한 음성 신호 형태의 명령을 텍스트 데이터 형태로 변환하는 것이다. 즉, 사용자(110)의 발화에 의해 생성되는 음성 명령은 홈 스피커(130)를 통해 제 1 텍스트 데이터(제 1 STT)로 변환된다. 홈 스피커(130)에서의 변환을 통해 생성되는 제 1 텍스트 데이터(제 1 STT)는 IoT 서버(150)로 전송된다(444).

IoT 서버(150)는, 홈 스피커(130)로부터 전송되는 제 1 텍스트 데이터(제 1 STT)를 수신하여 저장한다(468). 또한 IoT 서버(150)는, 앞서 웨어러블 기기(120)로부터 전송되는 인증 데이터 및 녹음된 음성 명령을 수신하여 저장한다(470). IoT 서버(150)는 웨어러블 기기(120)로부터 수신한 인증 데이터의 분석을 통해 웨어러블 기기(120)가 사전에 등록된 신뢰할 수 있는 기기임을 확인함으로써 웨어러블 기기(120)의 인증을 수행한다(472). 또한 IoT 서버(150)는 웨어러블 기기(120)로부터 수신한 녹음된 음성 명령을 대상으로 스피치-텍스트 변환을 수행한다(474). 스피치-텍스트 변환은 사용자(110)가 발화한 음성 신호 형태의 명령을 텍스트 데이터 형태로 변환하는 것이다. 즉, 사용자(110)의 발화에 의해 생성되는 음성 명령은 IoT 서버(150)에서 제 2 텍스트 데이터(제 2 STT)로 변환된다.

즉, 사용자(110)의 발화에 의해 생성되는 단일의 음성 명령이 홈 스피커(130)와 IoT 서버(150)에서 서로 별개인 두 개의 텍스트 데이터(제 1 STT & 제 2 STT)로 변환된다. 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT)는 서로 별개의 텍스트 데이터이지만 단일의 음성 명령으로부터 생성된 것이므로, 정상적이라면 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT) 각각의 내용(의미)은 서로 동일해야 한다.

IoT 서버(150)는, 홈 스피커(130)를 경유하는 경로를 통해 생성되는 제 1 텍스트 데이터(제 1 STT)와 웨어러블 기기(120)를 경유하는 경로를 통해 생성되는 제 2 텍스트 데이터(제 2 STT)가 서로 일치하는지를 비교한다(476).

앞서 언급한 것처럼, 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT)는 단일의 음성 명령으로부터 생성된 것이어서 내용(의미)이 서로 동일해야 한다. 따라서, 만약 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT)가 서로 동일하면(476의 '예'), IoT 서버(150)는 제 1 텍스트 데이터(제 1 STT)를 텔레매틱스 서버(160)로 전송함으로써 음성 명령이 텔레매틱스 서버(160)를 통해 자동차(100)로 전달될 수 있도록 한다(478). 이 때 제 1 텍스트 데이터(제 1 STT) 대신 제 2 텍스트 데이터(제 2 STT)를 텔레매틱스 서버(478)로 전송해도 좋다. 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT)가 서로 동일한 것으로 판명된 경우이므로, 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT) 가운데 어느 것으로 텔레매틱스 서버(160)로 전송하더라도 정상적인 제어가 이루어질 수 있다.

텔레매틱스 서버(160)는, IoT 서버(150)로부터 전송되는 제 1 텍스트 데이터(제 1 STT)(또는 제 2 텍스트 데이터(제 2 STT))를 수신하여 해당 제어 명령을 자동차(100)로 전송함으로써, 사용자(110)의 발화에 의해 생성되는 음성 명령에 해당하는 자동차(100)의 제어가 이루어질 수 있도록 한다.

이처럼, 사용자(110)는 홈 스피커(130)를 통해 음성 명령을 발생시키는데 있어서 별도의 패스워드(예를 들면 핀 코드)를 직접 발화하지 않고 웨어러블 기기(120)를 통해 외부로 표출되지 않는 사용자 인증을 수행함으로써 음성 명령 시스템의 보안성을 높게 유지할 수 있다.

도 5는 도 3에 나타낸 자동차 제어 방법의 제 2 실시 예를 나타낸 도면이다. 도 5에 나타낸 제 2 실시 예는, 웨어러블 기기(120)가 마이크로폰을 구비하고 있지 않은 경우에 웨어러블 기기(120)를 통해 제스처 이벤트를 생성하여 보안 인증을 수행하는 경우이다.

사용자(110)는 웨어러블 기기(120)를 착용(휴대)한 채 움직임을 발생시켜서 미리 약속된 제스처 이벤트를 생성한다(502). 예를 들면, 웨어러블 기기(120)를 3회에 걸쳐 짧게 흔들면 음성 명령을 발생시키기 위한 제스처인 것으로 미리 약속되어 있을 때, 사용자(110)는 웨어러블 기기(120)를 3회에 걸쳐 짧게 흔들어서 음성 명령의 발생을 예고할 수 있다. 이와 같은 제스처 이벤트의 생성은 웨어러블 기기(120)가 자이로 센서와 같은 움직임 센서를 구비하는 것을 전제로 한다. 자이로 센서 대신 비전 센서 또는 광 센서 등을 통해 사용자(110)의 신체의 일부가 움직이는 것을 감지함으로써 제스처 이벤트가 생성될 수도 있다.

웨어러블 기기(120)를 이용한 제스처 이벤트 생성 후, 사용자(110)는 원격지에 위치한 자동차(100)를 음성 인식 비서 서비스를 통해 제어하기 위해 목적하는 제어 명령에 해당하는 음성 명령을 발화한다(504). 사용자(110)가 발화한 음성 명령은 홈 스피커(130)로 전달된다.

웨어러블 기기(130)는, 제스처 이벤트의 발생에 응답하여 웨어러블 기기(120) 자신의 인증 데이터 및 제스처 이벤트 데이터를 IoT 서버(150)로 전송한다(528). 웨어러블 기기(120)의 인증 데이터는 웨어러블 기기(120)가 사전에 IoT 서버(150)에 등록된 신뢰할 수 있는 기기임을 나타내는 근거가 된다. IoT 서버(150)는 웨어러블 기기(120)의 인증 데이터를 확인함으로써 해당 웨어러블 기기(120)가 사전에 등록된 신뢰할 수 있는 기기인 것으로 판단한다.

홈 스피커(130)는, 사용자(110)의 발화에 의해 생성된 음성 명령을 전달받아 스피치-텍스트 변환을 수행한다(542). 스피치-텍스트 변환은 사용자(110)가 발화한 음성 신호 형태의 명령을 텍스트 데이터 형태로 변환하는 것이다. 즉, 사용자(110)의 발화에 의해 생성되는 음성 명령은 홈 스피커(130)를 통해 텍스트 데이터(STT)로 변환된다. 홈 스피커(130)에서의 변환을 통해 생성되는 텍스트 데이터(STT)는 IoT 서버(150)로 전송된다(544).

IoT 서버(150)는, 앞서 웨어러블 기기(120)로부터 전송되는 인증 데이터 및 제스처 이벤트 데이터 수신하여 저장한다(560). IoT 서버(150)는 웨어러블 기기(120)로부터 수신한 인증 데이터의 분석을 통해 웨어러블 기기(120)가 사전에 등록된 신뢰할 수 있는 기기임을 확인함으로써 웨어러블 기기(120)의 인증을 수행한다(562). 또한 IoT 서버(150)는, 웨어러블 기기(120)로부터 전송되는 제스처 이벤트 데이터를 수신하고 분석하여 해당 제스처 이벤트가 음성 명령의 발생을 예고하는 것임을 확인한다.

앞에서, 웨어러블 기기(120)를 통해 제스처 이벤트를 생성함으로써 음성 명령의 발생을 예고함을 이미 설명한 바 있다. 본 발명의 실시 예에서는, 음성 명령의 발생을 예고하는 제스처 이벤트를 웨어러블 기기(120)를 통해 발생시킨 후 미리 설정된 일정 시간 내에 입력되는 음성 신호만을 유효한 음성 명령으로 인식한다. 예를 들면 웨어러블 기기(120)를 통한 제스처 이벤트 발생 이후 10초 이내에 입력되는 음성 신호만을 유효한 음성 명령으로 인식한다. 이와 같은 시간 제한은 음성 명령 입력을 위해 무한정 대기하는 상황이 발생하지 않도록 하기 위함이다.

웨어러블 기기(120)를 통한 제스처 이벤트 발생 이후 미리 설정된 시간 내에 음성 명령이 수신되면(564의 '예'), IoT 서버(150)는 홈 스피커(130)로부터 전송되는 텍스트 데이터(STT)를 수신하여 저장한 후 텍스트 데이터(STT)를 텔레매틱스 서버(160)로 전송함으로써 음성 명령이 텔레매틱스 서버(160)를 통해 자동차(100)로 전달될 수 있도록 한다(568).

텔레매틱스 서버(160)는, IoT 서버(150)로부터 전송되는 텍스트 데이터(STT)를 수신하여 해당 제어 명령을 자동차(100)로 전송함으로써, 사용자(110)의 발화에 의해 생성되는 음성 명령에 해당하는 자동차(100)의 제어가 이루어질 수 있도록 한다.

이처럼, 사용자(110)는 홈 스피커(130)를 통해 음성 명령을 발생시키는데 있어서 별도의 패스워드(예를 들면 핀 코드)를 직접 발화하지 않고 타인이 쉽게 인지하지 못하도록 웨어러블 기기(120)를 통해 사용자 인증을 수행함으로써 음성 명령 시스템의 보안성을 높게 유지할 수 있다.

위의 설명은 기술적 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명의 기술 분야에서 통상의 지식을 가진 자라면 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서 위에 개시된 실시 예 및 첨부된 도면들은 기술적 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예 및 첨부된 도면에 의하여 기술적 사상의 범위가 한정되는 것은 아니다. 그 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술적 사상은 권리 범위에 포함되는 것으로 해석되어야 할 것이다.

100 : 자동차
110 : 사용자
120 : 웨어러블 기기
122 : 음성 신호 처리부(웨어러블 기기)
124 : 움직임 센서
130 : 홈 스피커
132 : 음성 신호 처리부(홈 스피커)
134 : TTS 처리부
140 : 주거 공간
150 : IoT 서버
152 : 웨어러블 기기 인증 데이터베이스
154 : 음성 저장부
156 : 웨어러블 기기 인증 처리부
158 : 명령어 처리부
160 : 텔레매틱스 서버

Claims

음성 명령의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 상기 음성 명령을 제 1 서버로 전송하는 단계와;
상기 음성 명령의 발생에 응답하여 휴대용 기기를 경유하는 제 2 경로를 통해 상기 휴대용 기기의 인증 데이터 및 상기 음성 명령을 상기 제 1 서버로 전송하는 단계와;
상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 기기의 인증을 수행하고, 상기 휴대용 기기의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함하는 음성 인식 기반의 자동차 제어 방법.
제 1 항에 있어서,
상기 음성 명령의 유효성 판단을 위해, 상기 제 1 경로를 통해 전송되는 음성 명령과 상기 제 2 경로를 통해 전송되는 음성 명령을 비교하여 일치 여부를 판단하는 것을 더 포함하는 음성 인식 기반의 자동차 제어 방법.
제 1 항에 있어서,
상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함하는 음성 인식 기반의 자동차 제어 방법.
제 3 항에 있어서,
상기 제 2 서버는 텔레매틱스 서버이고;
상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것인 음성 인식 기반의 자동차 제어 방법.
제 1 항에 있어서,
상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기인 음성 인식 기반의 자동차 제어 방법.
제 1 항에 있어서,
상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기인 음성 인식 기반의 자동차 제어 방법.
휴대용 기기에서 제스처 이벤트가 발생하는 단계와;
상기 제스처 이벤트의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 음성 명령을 제 1 서버로 전송하는 단계와;
상기 제스처 이벤트의 발생에 응답하여 상기 휴대용 기기를 경유하는 제 2 경로를 통해 상기 휴대용 기기의 인증 데이터 및 제스처 이벤트 데이터를 상기 제 1 서버로 전송하는 단계와;
상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 기기의 인증을 수행하고, 상기 휴대용 기기의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함하는 음성 인식 기반의 자동차 제어 방법.
제 7 항에 있어서,
상기 제스처 이벤트의 발생 후 미리 설정된 시간 내에 입력되는 음성 신호만을 음성 명령으로 인식하는 음성 인식 기반의 자동차 제어 방법.
제 7 항에 있어서,
상기 휴대용 기기의 사용자가 신체의 일부를 움직이는 것을 움직임 센서를 통해 감지함으로써 상기 제스처 이벤트가 생성되는 음성 인식 기반의 자동차 제어 방법.
제 9 항에 있어서, 상기 움직임 센서는,
상기 사용자의 신체의 일부가 움직이는 것을 감지하도록 마련되는 자이로 센서와 비전 센서, 광 센서 가운데 적어도 하나인 음성 인식 기반의 자동차 제어 방법.
제 7 항에 있어서,
상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함하는 음성 인식 기반의 자동차 제어 방법.
제 11 항에 있어서,
상기 제 2 서버는 텔레매틱스 서버이고;
상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것인 음성 인식 기반의 자동차 제어 방법.
제 7 항에 있어서,
상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기인 음성 인식 기반의 자동차 제어 방법.
제 7 항에 있어서,
상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기인 음성 인식 기반의 자동차 제어 방법.
음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 음성 명령을 제 1 서버로 전송하는 단계와;
휴대용 기기를 경유하는 제 2 경로를 통해 상기 휴대용 기기의 인증 데이터를 상기 제 1 서버로 전송하는 단계와;
상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 기기의 인증을 수행하고, 상기 휴대용 기기의 인증 결과에 따라 상기 음성 명령의 유효성을 판단하는 단계를 포함하는 음성 인식 제어 방법.
제 15 항에 있어서,
상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함하는 음성 인식 제어 방법.
제 16 항에 있어서,
상기 제 2 서버는 텔레매틱스 서버이고;
상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것인 음성 인식 제어 방법.
제 15 항에 있어서,
상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기인 음성 인식 제어 방법.
제 15 항에 있어서,
상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기인 음성 인식 제어 방법.