KR20210072471A

KR20210072471A - 음성 명령 인식 장치 및 그 방법

Info

Publication number: KR20210072471A
Application number: KR1020190162818A
Authority: KR
Inventors: 최서환; 조재민
Original assignee: 현대자동차주식회사; 기아 주식회사
Priority date: 2019-12-09
Filing date: 2019-12-09
Publication date: 2021-06-17
Also published as: CN113035185A; US20210174797A1; US11514908B2

Abstract

본 발명은 음성 명령 인식 장치 및 그 방법에 관한 것으로, 본 발명의 일 실시 예에 따른 음성 명령 인식 장치는, 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 프로세서; 및 상기 프로세서에 의한 음성 인식을 위한 데이터 또는 알고리즘이 저장되는 저장부;를 포함할 수 있다.

Description

음성 명령 인식 장치 및 그 방법{Apparatus for recognizing voice command, system having the same and method thereof}

본 발명은 음성 명령 인식 장치 및 그 방법에 관한 것으로, 보다 상세하게는 복수개의 음성 명령을 패키지로 등록하여 실행하는 기술에 관한 것이다.

최근 음성 인식을 통해 전자 기기를 실행 시키는 기술이 발전되어 다양한 분야에 적용되고 있다. 차량 내에서도 안전을 위해 운전자의 음성을 인식하여 차량 내 장치를 실행시키는 기술들이 개발되어 왔다.

종래의 음성 인식 기술은 사용자가 음성 명령어를 출력하면, 출력된 음성 명령어에 대한 도메인을 분석하고 도메인별 데이터베이스를 기반으로 분석 후 음성 인식을 수행하고 음성 인식 결과를 출력한다.

이에 매일 동일한 장치를 실행하는 경우 매일 동일한 사용자가 음성 명령어를 발화해야 하고 동일한 명령어에 대한 발화 시 마다 다른 인식률로 인해 반복적인 명령어 사용이 필요하다.

본 발명의 실시예는 사용자가 반복적으로 사용하는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴을 분석하여 하나 이상의 음성 명령어를 하나의 패키지 명령어로 생성할 수 있는 음성 명령 인식 장치 및 그 방법을 제공하고자 한다.

본 발명의 실시예는 하나의 패키지 명령어가 발화되면 패키지 명령어 내부의 개별 명령들을 순차적으로 수행할 지 동시 수행할지 여부를 결정하는 음성 명령 인식 장치 및 그 방법을 제공하고자 한다.

본 발명의 실시예는 기 생성된 하나의 패키지 명령어의 발화 시 추가 발화되는 음성 명령어를 분석하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있는 음성 명령 인식 장치 및 그 방법을 제공하고자 한다.

본 발명의 실시예는 기 생성된 하나의 패키지 명령어 발화 시, 현재의 주변 상황을 판단하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있는 있는 음성 명령 인식 장치 및 그 방법을 제공하고자 한다.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재들로부터 당업자에게 명확하게 이해될 수 있을 것이다.

본 발명의 일 실시 예에 따른 음성 명령 인식 장치는, 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 프로세서; 및 상기 프로세서에 의한 음성 인식을 위한 데이터 또는 알고리즘이 저장되는 저장부;를 포함할 수 있다.

일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우에는 동시 수행을 결정하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행하는 경우 그 이후 수행될 음성 명령어에 대한 정보를 사전 수집하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 프로세서는, 하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 상기 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 상기 하나의 패키지 명령어로 생성하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 상기 추가로 발화되는 음성 명령어를 상기 하나의 패키지 명령어에 추가 등록하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 프로세서는, 상기 추가로 발화되는 음성 명령어가 추가 등록된 하나의 패키지 명령어가 발화되면, 상기 하나의 패키지 명령어에 기 등록된 하나 이상의 음성 명령어 및 상기 추가로 발화된 음성 명령어를 함께 수행하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어 발화 시 상기 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우, 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 프로세서는, 상기 취소 요청된 음성 명령어가 삭제된 패키지 명령어가 발화되면, 상기 하나의 패키지 명령어에 기등록된 하나 이상의 음성 명령어중 삭제된 명령어를 제외한 나머지 음성 명령어를 수행하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 주변 상황은, 온도, 습도, 날씨, 조도, 계절, 날짜, 요일, 시간, 위치, 교통 상황, 및 차속 중 적어도 하나 이상을 포함할 수 있다.

일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 상기 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행하는 것을 포함할 수 있다.

본 발명의 일 실시 예에 따른 음성 명령 인식 방법은 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴을 분석하는 단계; 및 상기 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 단계;를 포함할 수 있다.

일 실시 예에 있어서, 상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정하는 단계를 더 포함할 수 있다.

일 실시 예에 있어서, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우, 동시 수행을 결정하는 단계를 더 포함할 수 있다.

일 실시 예에 있어서, 상기 하나의 패키지 명령어로 생성하는 단계는, 하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 상기 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 상기 하나의 패키지 명령어로 생성하는 단계; 및 상기 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시키는 단계; 를 포함하는 것을 포함할 수 있다.

일 실시 예에 있어서, 상기 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 상기 추가로 발화되는 음성 명령어를 상기 하나의 패키지 명령어에 추가 등록하는 단계를 더 포함할 수 있다.

일 실시 예에 있어서, 상기 하나의 패키지 명령어 발화 시 상기 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우, 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제하는 단계;를 더 포함할 수 있다.

일 실시 예에 있어서, 상기 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행하는 단계; 및 상기 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 상기 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행하는 단계;를 더 포함할 수 있다.

본 기술은 사용자가 반복적으로 사용하는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴을 분석하여 하나 이상의 음성 명령어를 하나의 패키지 명령어로 등록하고 하나의 패키지 명령어가 발화되면 패키지 명령어 내부의 개별 명령들을 순차적으로 수행할 지 동시 수행할지 여부를 결정하여 등록된 하나 이상의 음성 명령어를 순차적 또는 동시에 수행할 수 있어 사용자의 편의성을 증대시킬 수 있다.

본 기술은 기 생성된 하나의 패키지 명령어의 발화 시 추가 발화되는 음성 명령어를 분석하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있어 사용자의 편의성을 증대시킬 수 있다.

본 기술은 기 생성된 하나의 패키지 명령어 발화 시, 현재의 주변 상황을 판단하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있어 사용자의 편의성을 증대시킬 수 있다.

이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.

도 1은 본 발명의 일 실시 예에 따른 음성 명령 인식 장치의 구성을 나타내는 블록도이다.
도 2는 본 발명의 일 실시 예에 따른 도메인별 음성 인식 분석 과정을 설명하기 위한 예시 화면을 나타내는 도면이다.
도 3은 본 발명의 일 실시 예에 따른 반복 사용되는 하나 이상의 음성 명령어를 이용하여 패키지 명령을 등록 및 처리하는 프로세스의 예시 화면을 나타내는 도면이다.
도 4는 본 발명의 일 실시 예에 따른 사용자의 음성 명령어 발화 패턴을 이용하여 패키지 명령을 등록 및 처리하는 프로세스의 예시 화면을 나타내는 도면이다.
도 5는 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 다른 음성 명령어를 발화하는 경우 기 생성된 패키지 명령에 추가 발화된 음성 명령어를 수정 등록하는 프로세스의 예시 화면을 나타내는 도면이다.
도 6은 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 주변 상황에 따라 기 생성된 패키지 명령어를 수정하는 프로세스의 예시 화면을 나타내는 도면이다.
도 7은 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 기 생성된 패키지에 등록된 하나 이상의 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화되는 경우의 예시 화면을 나타내는 도면이다.
도 8은 도 3 내지 도 7의 상황이 복합적으로 구현된 프로세스의 예시 화면을 나타내는 도면이다.
도 9는 본 발명의 일 실시 예에 따른 컴퓨팅 시스템을 도시한다.

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 실시예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한다.

본 발명의 실시예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 또한, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

본 발명은 특징은 하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재를 파악하여 하나의 패키지 명령어로 생성하는 구성과 패키지 명령어 내부의 개별 명령들을 순차적으로 또는 동시 실행할지 여부를 결정하여 명령을 수행하는 구성을 개시한다.

이하, 도 1 내지 도 9를 참조하여, 본 발명의 실시예들을 구체적으로 설명하기로 한다.

도 1은 본 발명의 일 실시 예에 따른 음성 명령 인식 장치의 구성을 나타내는 블록도이다.

본 발명의 일 실시 예에 따른 음성 명령 인식 장치(100)는 차량의 내부에 구현될 수 있다. 이때, 음성 명령 인식 장치(100)는 차량의 내부 제어 유닛들과 일체로 형성될 수 있으며, 별도의 장치로 구현되어 별도의 연결 수단에 의해 차량의 제어 유닛들과 연결될 수도 있다.

음성 명령 인식 장치(100)는 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성할 수 있다.

또한, 음성 명령 인식 장치(100)는 기 생성된 하나의 패키지 명령어의 발화 시 추가 발화되는 음성 명령어를 분석하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있다.

또한, 음성 명령 인식 장치(100)는 기 생성된 하나의 패키지 명령어 발화 시, 현재의 주변 상황을 판단하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있다.

도 1을 참조하면, 음성 명령 인식 장치(100)는 통신부(110), 저장부(120), 표시부(130), 및 프로세서(140)를 포함할 수 있다.

통신부(110)는 무선 또는 유선 연결을 통해 신호를 송신 및 수신하기 위해 다양한 전자 회로로 구현되는 하드웨어 장치로서, 본 발명에서는 차량 내 네트워크 통신 기술, 차량 외부의 서버, 인프라, 타 차량 등과 무선 인터넷 접속 또는 근거리 통신(Short Range Communication) 기술을 이용하여 V2I 통신을 수행할 수 있다. 여기서, 차량 네트워크 통신 기술로는 CAN(Controller Area Network) 통신, LIN(Local Interconnect Network) 통신, 플렉스레이(Flex-Ray) 통신 등을 통해 차량 내 통신을 수행할 수 있다. 또한, 무선 통신 기술로는 무선 인터넷 기술로는 무선랜(Wireless LAN, WLAN), 와이브로(Wireless Broadband, Wibro), 와이파이(Wi-Fi), 와이맥스(World Interoperability for Microwave Access, Wimax) 등이 포함될 수 있다. 또한, 근거리 통신 기술로는 블루투스(Bluetooth), 지그비(ZigBee), UWB(Ultra Wideband), RFID(Radio Frequency Identification), 적외선통신(Infrared Data Association, IrDA) 등이 포함될 수 있다.

일 예로서, 통신부(110)는 외부의 서버로부터 음성 인식을 위한 데이터를 수신할 수 있고, 음성 명령어 수행을 위해 차량 내부의 장치와 통신을 수행할 수 있다.

저장부(120)는 프로세서(140)가 동작하는데 필요한 데이터 및/또는 알고리즘 등 특히 음성 인식 관련 알고리즘 및 데이터가 저장될 수 있다.

일 예로서, 저장부(150)는 음성 인식을 위한 도메인별 데이터베이스가 저장될 수 있다.

저장부(120)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 마이크로 타입(micro type), 및 카드 타입(예컨대, SD 카드(Secure Digital Card) 또는 XD 카드(eXtream Digital Card)) 등의 메모리와, 램(RAM, Random Access Memory), SRAM(Static RAM), 롬(ROM, Read-Only Memory), PROM(Programmable ROM), EEPROM(Electrically Erasable PROM), 자기 메모리(MRAM, Magnetic RAM), 자기 디스크(magnetic disk), 및 광디스크(optical disk) 타입의 메모리 중 적어도 하나의 타입의 기록 매체(storage medium)를 포함할 수 있다.

표시부(130)는 사용자로부터의 제어 명령을 음성으로 입력 받기 위한 입력수단과 장치(100)의 음성 인식 결과 등을 출력하는 출력수단을 포함할 수 있다. 여기서, 입력수단은 마이크 등을 포함할 수도 있다. 이때 마이크 등은 표시부(130)와 별도로 구비될 수 도 있다. 출력수단은 디스플레이를 포함할 수 있으며, 스피커와 같은 음성출력수단을 포함할 수도 있다. 이때, 터치 필름, 터치 시트, 터치 패드 등의 터치 센서가 디스플레이에 구비되는 경우, 디스플레이는 터치 스크린으로 동작하며, 입력수단과 출력수단이 통합된 형태로 구현될 수 있다. 본 발명에서 출력수단은 음성 인식 결과, 패키지 명령어 생성, 추가, 수정, 및 삭제 중 하나 이상의 결과를 출력할 수 있다.

이때, 디스플레이는 액정 디스플레이(Liquid Crystal Display, LCD), 박막 트랜지스터 액정 디스플레이(Thin Film Transistor-Liquid Crystal Display, TFT LCD), 유기 발광 다이오드(Organic Light-Emitting Diode, OLED), 플렉시블 디스플레이(Flexible Display), 전계 방출 디스플레이(Feld Emission Display, FED), 3차원 디스플레이(3D Display) 중에서 적어도 하나를 포함할 수 있다.

프로세서(140)는 통신부(110), 저장부(120), 표시부(130) 등과 전기적으로 연결될 수 있고, 각 구성들을 전기적으로 제어할 수 있으며, 소프트웨어의 명령을 실행하는 전기 회로가 될 수 있으며, 이에 의해 후술하는 다양한 데이터 처리 및 계산을 수행할 수 있다.

프로세서(140)는 음성 명령 인식 장치(100)의 각 구성요소들 간에 전달되는 신호를 처리할 수 있다. 프로세서(140)는 예를 들어, 음성 인식 엔진을 포함할 수 있다.

프로세서(140)는 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어를 분석하거나 사용자의 음성 명령어 발화 패턴을 분석할 수 있다. 이때, 프로세서(140)는 사용자에 의해 사용된 음성 명령어의 사용 횟수가 미리 정한 횟수(N회) 이상이면 반복적으로 사용되는 음성 명령어로 판단할 수 있다. 또한, 프로세서(140)는 하나 이상의 음성 명령어가 순차적으로 발화될 때 발화 순서와 상관없이 발화 횟수를 증가시켜 반복적으로 사용되는 음성 명령어로서 선택할 수 있다. 즉 프로세서(140)는 하나 이상의 음성 명령어가 미리 정한 횟수 이상 발화되거나, 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시킬 수 있다.

프로세서(140)는 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성할 수 있다.

프로세서(140)는 하나의 패키지 명령어 발화 시, 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정할 수 있다.

프로세서(140)는 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 상이할 수 있고, 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우에는 동시 수행을 결정할 수 있다. 프로세서(140)는 하나의 패키지 명령어 발화 시, 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행하는 경우 그 이후 수행될 음성 명령어에 대한 정보를 사전에 수집함으로써 음성 명령어 수행 속도를 향상시킬 수 있다.

프로세서(140)는 하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 하나의 패키지 명령어로 생성할 수 있다.

프로세서(140)는 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시킬 수 있다.

프로세서(140)는 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 추가로 발화되는 음성 명령어를 하나의 패키지 명령어에 추가 등록할 수 있다.

프로세서(140)는 추가로 발화되는 음성 명령어가 추가 등록된 하나의 패키지 명령어가 발화되면, 하나의 패키지 명령어에 기 등록된 하나 이상의 음성 명령어 및 추가로 발화된 음성 명령어를 함께 수행할 수 있다.

프로세서(140)는 하나의 패키지 명령어 발화 시 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우, 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제할 수 있다.

프로세서(140)는 취소 요청된 음성 명령어가 삭제된 패키지 명령어가 발화되면, 하나의 패키지 명령어에 기등록된 하나 이상의 음성 명령어중 삭제된 명령어를 제외한 나머지 음성 명령어를 수행할 수 있다.

프로세서(140)는 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행할 수 있다. 이때, 주변 상황은, 온도, 습도, 날씨, 조도, 계절, 날짜, 요일, 시간, 위치, 교통 상황, 및 차속 중 적어도 하나 이상을 포함할 수 있다.

프로세서(140)는 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행할 수 있다.

이와 같이 본 발명은 반복적으로 사용되는 하나 이상의 음성 명령어를 하나의 패키지 명령어로 통합하여 등록 및 수행함으로써, 여러 개의 음성 명령어를 발화하지 않고 하나의 패키지 명령어를 발화함으로써 음성 인식률을 향상시키고 음성 명령어 처리 속도를 향상시킬 수 있다.

또한, 본 발명은 사용자의 명령어 패턴 분석 또는 주변 상황을 판단하여 기 생성된 패키지 명령어의 수정, 삭제, 및 추가 중 하나를 수행할 수 있다.

도 2는 본 발명의 일 실시 예에 따른 도메인별 음성 인식 분석 과정을 설명하기 위한 예시 화면을 나타내는 도면이다.

도 2를 참조하면, 사용자가 "오늘의 날씨는"을 발화하면 음성 명령 인식 장치(100)는 도메인을 분석하여 "날씨"에 대한 정보를 수집하여 출력할 수 있다. 또한, 사용자가 "오늘의 운세는"을 발화하면 음성 명령 인식 장치(100)는 도메인을 분석하여 "운세"에 대한 정보를 수집하여 출력할 수 있다.

이하, 도 3 내지 도 8을 통해 하나 이상의 음성 명령어를 패키지 명령어로 등록, 취소, 추가 등을 수행하는 과정을 구체적으로 설명하기로 한다.

이하에서는 도 1의 음성 명령 인식 장치(100)가 도 3 내지 도 8의 프로세스를 수행하는 것을 가정한다. 또한, 도 3 내지 도 8의 설명에 기술된 동작은 음성 명령 인식 장치(100)의 프로세서(140)에 의해 제어되는 것으로 이해될 수 있다.

도 3은 본 발명의 일 실시 예에 따른 반복 사용되는 하나 이상의 음성 명령어를 이용하여 패키지 명령을 등록 및 처리하는 프로세스의 예시 화면을 나타내는 도면이다.

도 3을 참조하면, 음성 명령 인식 장치(100)는 차량 시동 후 수행되는 음성 명령어를 수집하여, 사용자가 반복적으로 사용하는 하나 이상의 명령어를 하나의 패키지 명령어로 등록하여 하나의 패키지 명령어를 발화하면 등록된 하나 이상의 음성 명령어를 수행하는 예를 개시한다.

도 3의 301과 같이 "날씨 알려줘, "주식 정보 알려줘, "교통 상황 알려줘" 이 3가지의 음성 명령어를 반복적으로 발화하는 경우, 음성 명령 인식 장치(100)는 302와 같이, 3가지 명령에 대한 패키지 명령어의 등록을 제안한다.

이처럼 패키지 명령어가 등록되면, 303과 같이, 패키지 명령어로서 "패키지 1"이 발화되면 음성 명령 인식 장치(100)는 날씨, 주식, 교통 도메인에 대한 정보를 수집하여 출력한다.

도 4는 본 발명의 일 실시 예에 따른 사용자의 음성 명령어 발화 패턴을 이용하여 패키지 명령을 등록 및 처리하는 프로세스의 예시 화면을 나타내는 도면이다.

도 4를 참조하면, 차량 시동 후 수행되는 음성 명령어를 수집하여, 사용자의 음성 명령어 발화 패턴을 분석한다.

401에서는 "날씨 알려줘, "주식 정보 알려줘", 및 "교통 상황 알려줘"의 음성 명령어가 순서만 변경된 채로 반복적으로 발화된 경우 각 음성 명령어의 발화 빈도 및 시간차를 분석하여, 명령어의 순서가 변경되어 진행되더라도 동일한 명령 수행으로 인식하여, 발화 횟수를 증가시킬 수 있다. 즉 401에서 "날씨 알려줘, "주식 정보 알려줘","교통 상황 알려줘"의 음성 명령어가 순서가 변경되었지만 이 3가지의 명령어가 3회 발화된 것으로 기록된다.

이에 402와 같이 음성 명령 인식 장치(100)는 미리 정한 횟수 이상 3가지 명령어가 세트로 발화되면 최종 명령어 수행 후, 이 3가지 명령어를 하나의 패키지 명령어(패키지 1)로 등록하는 것을 사용자에게 제안할 수 있다.

이에 패키지 명령어 1로 등록되면 403과 같이, 사용자가 "패키지 명령어 1"을 발화하면, "날씨 알려줘", "주식 정보 알려줘","교통 상황 알려줘"의 음성 명령어를 순차적으로 수행할 수 있다. 이때, 실행되는 하나 이상의 명령어의 도메인이 각각 다른 경우, 먼저 수행되는 명령어 수행 중 그 이후 수행될 명령어에 대한 정보를 사전에 수집 하여 빠른 정보 제공이 가능하도록 한다.

도 5는 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 다른 음성 명령어를 발화하는 경우 기 생성된 패키지 명령에 추가 발화된 음성 명령어를 수정 등록하는 프로세스의 예시 화면을 나타내는 도면이다.

도 5의 501을 참조하면, "날씨 알려줘, "주식 정보 알려줘", 및 "교통 상황 알려줘"의 음성 명령어의 세트가 등록된 패키지 명령어 1이 발화되면서 "에어컨 틀어줘"의 음성 명령어가 추가 발화된 경우, 502와 같이 패키지 명령어 1에 "에어컨 틀어줘"의 음성 명령어를 추가 제안하여 패키지 명령어 1을 수정 등록한다.

이후, 503과 같이 패키지 명령어 1이 발화되면, 음성 명령 인식 장치(100)는 "날씨 알려줘, "주식 정보 알려줘", "교통 상황 알려줘", 및"에어컨 틀어줘"의 4가지 명령어를 수행할 수 있다.

도 6은 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 주변 상황에 따라 기 생성된 패키지 명령어를 수정하는 프로세스의 예시 화면을 나타내는 도면이다. 이때, 주변 상황은 외부 온도, 날씨, 계절, 습도, 조도, 차속, 차량 내부 온도 등을 포함할 수 있다.

도 6의 601을 참조하면, 날씨, 주식, 교통상황을 도메인으로 하는 음성 명령어들로 기 생성된 패키지 명령어 1이 발화되면, 음성 명령 인식 장치(100)는 날씨, 주식, 교통상황 중 실시간 정보를 제공할 수 없는 도메인에 대해 안내할 수 있다. 601에서는, 음성 명령 인식 장치(100)는 주식과 관련하여 요일을 판단하여, 금일이 휴일인 경우 실시간 주식 정보 제공이 어려우므로 이전 종가 기준으로 주식 정보를 안내하는 예시 화면을 개시한다.

602에서는 날씨, 주식, 교통상황을 도메인으로 하는 음성 명령어들로 기 생성된 패키지 명령어 1이 발화되면, 음성 명령 인식 장치(100)는 차량 내 온도를 판단하여, 차량 내 온도가 높은 경우 사용자에게 에어컨 온(ON)을 제안하고 사용자가 제안을 받아들인 경우 에어컨을 온한 상태에서 날씨, 주식, 교통상황을 안내하는 예를 개시한다.

603에서는 날씨, 주식, 교통상황을 도메인으로 하는 음성 명령어들로 기 생성된 패키지 명령어 1이 발화되면, 음성 명령 인식 장치(100)는 현재 날씨, 계절, 온도, 습도 등을 판단하여 그에 맞는 차량 공조 제어를 제안할 수 있다. 603에서는 음성 명령 인식 장치(100)는 현재 계절이 겨울이므로 히터와 열선 핸들 동작을 패키지 명령어 1에 추가하는 것을 제안한 예를 개시한다.

도 7은 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 기 생성된 패키지에 등록된 하나 이상의 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화되는 경우의 예시 화면을 나타내는 도면이다.

도 7의 701을 참조하면, 날씨, 주식, 교통상황, 에어컨과 관련한 음성 명령어가 등록되어 있는 패키지 명령어 1이 발화될 때, 에어컨 온 명령을 취소하는 명령이 추가 발화된 경우, 702와 같이, 음성 명령 인식 장치(100)는 에어컨 온 명령어를 패키지 명령어 1에서 삭제할 수 있다.

도 8은 도 3 내지 도 7의 상황이 복합적으로 구현된 프로세스의 예시 화면을 나타내는 도면이다.

도 8의 801을 참조하면, 음성 명령 인식 장치(100)는 사용자에 의해 반복적으로 사용되는 하나 이상의 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해, 자주 사용되는 음성 명령어 "날씨 알려줘, "주식 정보 알려줘","교통 상황 알려줘"를 패키지 명령어 1로 등록하는 것을 제안할 수 있다.

이에 패키지 명령어 1이 생성되어, 802와 같이, 패키지 명령어 1이 발화 시 "에어컨 틀어줘"의 음성 명령어가 추가 발화된 경우, 803과 같이, 음성 명령 인식 장치(100)는 패키지 명령어 1에 "에어컨 틀어줘"의 음성 명령어를 추가할지를 문의하는 화면을 출력할 수 있다.

이어, 패키지 명령어 1에 "에어컨 틀어줘"의 음성 명령어가 추가된 경우 패키지 명령어 1이 발화되면, 804와 같이 음성 명령 인식 장치(100)는 주변 상황을 고려하여, 패키지 명령어 1에 포함된 음성 명령어인 "에어컨 틀어줘"대신에 "히터 틀어줘"의 명령어를 추가할 것을 제안하고 805와 같이, 패키지 명령어 1의 에어컨 관련 명령어를 삭제하고 날씨, 주식, 교통 상황, 히터 관련 명령어가 등록되도록 한다.

이와 같이 본 발명은 반복적으로 사용하는 하나 이상의 명령어를 하나의 패키지 명령어로 등록할 수 있고(도 3), 사용자의 음성 명령어 발화 패턴을 분석하여 하나 이상의 음성 명령어를 하나의 패키지 명령어로 등록할 수 있다(도 4).

또한, 본 발명은 기 생성된 패키지 명령어 발화 시 하나 이상의 음성 명령어를 추가 발화하면, 기 생성된 패키지 명령어에 음성 명령어를 추가하여 패키지 명령어를 수정 등록할 수 있다(도 5).

또한, 본 발명은 현재의 주변 상황을 판단하여 기 생성된 패키지 명령어를 변경 수행할 수 있다(도 6).

또한, 본 발명은 기 생성된 패키지 명령어 발화 시 패키지 명령어로 등록된 하나 이상의 음성 명령어 중 하나를 취소하는 명령어 발화 시, 이를 반영하여 기 생성된 패키지 명령어 중 취소 요청한 음성 명령어를 삭제할 수 있다(도 7).

도 9는 본 발명의 일 실시 예에 따른 컴퓨팅 시스템을 도시한다.

도 9를 참조하면, 컴퓨팅 시스템(1000)은 버스(1200)를 통해 연결되는 적어도 하나의 프로세서(1100), 메모리(1300), 사용자 인터페이스 입력 장치(1400), 사용자 인터페이스 출력 장치(1500), 스토리지(1600), 및 네트워크 인터페이스(1700)를 포함할 수 있다.

프로세서(1100)는 중앙 처리 장치(CPU) 또는 메모리(1300) 및/또는 스토리지(1600)에 저장된 명령어들에 대한 처리를 실행하는 반도체 장치일 수 있다. 메모리(1300) 및 스토리지(1600)는 다양한 종류의 휘발성 또는 불휘발성 저장 매체를 포함할 수 있다. 예를 들어, 메모리(1300)는 ROM(Read Only Memory) 및 RAM(Random Access Memory)을 포함할 수 있다.

따라서, 본 명세서에 개시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계는 프로세서(1100)에 의해 실행되는 하드웨어, 소프트웨어 모듈, 또는 그 2 개의 결합으로 직접 구현될 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM과 같은 저장 매체(즉, 메모리(1300) 및/또는 스토리지(1600))에 상주할 수도 있다.

예시적인 저장 매체는 프로세서(1100)에 커플링되며, 그 프로세서(1100)는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정보를 기입할 수 있다. 다른 방법으로, 저장 매체는 프로세서(1100)와 일체형일 수도 있다. 프로세서 및 저장 매체는 주문형 집적회로(ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법으로, 프로세서 및 저장 매체는 사용자 단말기 내에 개별 컴포넌트로서 상주할 수도 있다.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.

따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims

사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 프로세서; 및
상기 프로세서에 의한 음성 인식을 위한 데이터 또는 알고리즘이 저장되는 저장부;
를 포함하는 음성 명령 인식 장치.
청구항 1에 있어서,
상기 프로세서는,
상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정하는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 2에 있어서,
상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우에는 동시 수행을 결정하는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 2에 있어서,
상기 프로세서는,
상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행하는 경우, 그 이후 수행될 음성 명령어에 대한 정보를 사전 수집하는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 1에 있어서,
상기 프로세서는,
하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 상기 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 상기 하나의 패키지 명령어로 생성하는 것을 특징으로 하는 음성 명령 인식 장치
청구항 5항에 있어서,
상기 프로세서는,
상기 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시키는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 1에 있어서,
상기 프로세서는,
상기 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 상기 추가로 발화되는 음성 명령어를 상기 하나의 패키지 명령어에 추가 등록하는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 7에 있어서,
상기 프로세서는,
상기 추가로 발화되는 음성 명령어가 추가 등록된 하나의 패키지 명령어가 발화되면, 상기 하나의 패키지 명령어에 기 등록된 하나 이상의 음성 명령어 및 상기 추가로 발화된 음성 명령어를 함께 수행하는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 1에 있어서,
상기 프로세서는,
상기 하나의 패키지 명령어 발화 시 상기 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우,
상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제하는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 9에 있어서,
상기 프로세서는,
상기 취소 요청된 음성 명령어가 삭제된 패키지 명령어가 발화되면,
상기 하나의 패키지 명령어에 기등록된 하나 이상의 음성 명령어중 삭제된 명령어를 제외한 나머지 음성 명령어를 수행하는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 1에 있어서,
상기 프로세서는,
상기 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행하는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 11에 있어서,
상기 주변 상황은,
온도, 습도, 날씨, 조도, 계절, 날짜, 요일, 시간, 위치, 교통 상황, 및 차속 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 음성 명령 인식 장치.
청구항 1에 있어서,
상기 프로세서는,
상기 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 상기 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행하는 것을 특징으로 하는 음성 명령 인식 장치.
사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴을 분석하는 단계; 및
상기 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 단계;
를 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
청구항 14에 있어서,
상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정하는 단계
를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
청구항 14에 있어서,
상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우, 동시 수행을 결정하는 단계; 및
상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행하는 경우, 그 이후 수행될 음성 명령어에 대한 정보를 사전 수집하는 단계
를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
청구항 14에 있어서,
상기 하나의 패키지 명령어로 생성하는 단계는,,
하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 상기 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 상기 하나의 패키지 명령어로 생성하는 단계; 및
상기 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시키는 단계;를 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
청구항 14에 있어서,
상기 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 상기 추가로 발화되는 음성 명령어를 상기 하나의 패키지 명령어에 추가 등록하는 단계
를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
청구항 14에 있어서,
상기 하나의 패키지 명령어 발화 시 상기 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우,
상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제하는 단계;
를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
청구항 14에 있어서,
상기 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행하는 단계; 및
상기 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 상기 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행하는 단계;
를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.