KR20210072471A - 음성 명령 인식 장치 및 그 방법 - Google Patents

음성 명령 인식 장치 및 그 방법 Download PDF

Info

Publication number
KR20210072471A
KR20210072471A KR1020190162818A KR20190162818A KR20210072471A KR 20210072471 A KR20210072471 A KR 20210072471A KR 1020190162818 A KR1020190162818 A KR 1020190162818A KR 20190162818 A KR20190162818 A KR 20190162818A KR 20210072471 A KR20210072471 A KR 20210072471A
Authority
KR
South Korea
Prior art keywords
command
voice
package
uttered
voice commands
Prior art date
Application number
KR1020190162818A
Other languages
English (en)
Inventor
최서환
조재민
Original Assignee
현대자동차주식회사
기아 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사, 기아 주식회사 filed Critical 현대자동차주식회사
Priority to KR1020190162818A priority Critical patent/KR20210072471A/ko
Priority to US16/868,028 priority patent/US11514908B2/en
Priority to CN202010439262.3A priority patent/CN113035185A/zh
Publication of KR20210072471A publication Critical patent/KR20210072471A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 발명은 음성 명령 인식 장치 및 그 방법에 관한 것으로, 본 발명의 일 실시 예에 따른 음성 명령 인식 장치는, 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 프로세서; 및 상기 프로세서에 의한 음성 인식을 위한 데이터 또는 알고리즘이 저장되는 저장부;를 포함할 수 있다.

Description

음성 명령 인식 장치 및 그 방법{Apparatus for recognizing voice command, system having the same and method thereof}
본 발명은 음성 명령 인식 장치 및 그 방법에 관한 것으로, 보다 상세하게는 복수개의 음성 명령을 패키지로 등록하여 실행하는 기술에 관한 것이다.
최근 음성 인식을 통해 전자 기기를 실행 시키는 기술이 발전되어 다양한 분야에 적용되고 있다. 차량 내에서도 안전을 위해 운전자의 음성을 인식하여 차량 내 장치를 실행시키는 기술들이 개발되어 왔다.
종래의 음성 인식 기술은 사용자가 음성 명령어를 출력하면, 출력된 음성 명령어에 대한 도메인을 분석하고 도메인별 데이터베이스를 기반으로 분석 후 음성 인식을 수행하고 음성 인식 결과를 출력한다.
이에 매일 동일한 장치를 실행하는 경우 매일 동일한 사용자가 음성 명령어를 발화해야 하고 동일한 명령어에 대한 발화 시 마다 다른 인식률로 인해 반복적인 명령어 사용이 필요하다.
본 발명의 실시예는 사용자가 반복적으로 사용하는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴을 분석하여 하나 이상의 음성 명령어를 하나의 패키지 명령어로 생성할 수 있는 음성 명령 인식 장치 및 그 방법을 제공하고자 한다.
본 발명의 실시예는 하나의 패키지 명령어가 발화되면 패키지 명령어 내부의 개별 명령들을 순차적으로 수행할 지 동시 수행할지 여부를 결정하는 음성 명령 인식 장치 및 그 방법을 제공하고자 한다.
본 발명의 실시예는 기 생성된 하나의 패키지 명령어의 발화 시 추가 발화되는 음성 명령어를 분석하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있는 음성 명령 인식 장치 및 그 방법을 제공하고자 한다.
본 발명의 실시예는 기 생성된 하나의 패키지 명령어 발화 시, 현재의 주변 상황을 판단하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있는 있는 음성 명령 인식 장치 및 그 방법을 제공하고자 한다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재들로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시 예에 따른 음성 명령 인식 장치는, 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 프로세서; 및 상기 프로세서에 의한 음성 인식을 위한 데이터 또는 알고리즘이 저장되는 저장부;를 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우에는 동시 수행을 결정하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행하는 경우 그 이후 수행될 음성 명령어에 대한 정보를 사전 수집하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 상기 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 상기 하나의 패키지 명령어로 생성하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 상기 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 상기 하나의 패키지 명령어로 생성하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 상기 추가로 발화되는 음성 명령어를 상기 하나의 패키지 명령어에 추가 등록하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 상기 추가로 발화되는 음성 명령어가 추가 등록된 하나의 패키지 명령어가 발화되면, 상기 하나의 패키지 명령어에 기 등록된 하나 이상의 음성 명령어 및 상기 추가로 발화된 음성 명령어를 함께 수행하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어 발화 시 상기 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우, 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 상기 취소 요청된 음성 명령어가 삭제된 패키지 명령어가 발화되면, 상기 하나의 패키지 명령어에 기등록된 하나 이상의 음성 명령어중 삭제된 명령어를 제외한 나머지 음성 명령어를 수행하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 주변 상황은, 온도, 습도, 날씨, 조도, 계절, 날짜, 요일, 시간, 위치, 교통 상황, 및 차속 중 적어도 하나 이상을 포함할 수 있다.
일 실시 예에 있어서, 상기 프로세서는, 상기 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 상기 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행하는 것을 포함할 수 있다.
본 발명의 일 실시 예에 따른 음성 명령 인식 방법은 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴을 분석하는 단계; 및 상기 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 단계;를 포함할 수 있다.
일 실시 예에 있어서, 상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정하는 단계를 더 포함할 수 있다.
일 실시 예에 있어서, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우, 동시 수행을 결정하는 단계를 더 포함할 수 있다.
일 실시 예에 있어서, 상기 하나의 패키지 명령어로 생성하는 단계는, 하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 상기 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 상기 하나의 패키지 명령어로 생성하는 단계; 및 상기 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시키는 단계; 를 포함하는 것을 포함할 수 있다.
일 실시 예에 있어서, 상기 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 상기 추가로 발화되는 음성 명령어를 상기 하나의 패키지 명령어에 추가 등록하는 단계를 더 포함할 수 있다.
일 실시 예에 있어서, 상기 하나의 패키지 명령어 발화 시 상기 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우, 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제하는 단계;를 더 포함할 수 있다.
일 실시 예에 있어서, 상기 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행하는 단계; 및 상기 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 상기 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행하는 단계;를 더 포함할 수 있다.
본 기술은 사용자가 반복적으로 사용하는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴을 분석하여 하나 이상의 음성 명령어를 하나의 패키지 명령어로 등록하고 하나의 패키지 명령어가 발화되면 패키지 명령어 내부의 개별 명령들을 순차적으로 수행할 지 동시 수행할지 여부를 결정하여 등록된 하나 이상의 음성 명령어를 순차적 또는 동시에 수행할 수 있어 사용자의 편의성을 증대시킬 수 있다.
본 기술은 기 생성된 하나의 패키지 명령어의 발화 시 추가 발화되는 음성 명령어를 분석하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있어 사용자의 편의성을 증대시킬 수 있다.
본 기술은 기 생성된 하나의 패키지 명령어 발화 시, 현재의 주변 상황을 판단하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있어 사용자의 편의성을 증대시킬 수 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
도 1은 본 발명의 일 실시 예에 따른 음성 명령 인식 장치의 구성을 나타내는 블록도이다.
도 2는 본 발명의 일 실시 예에 따른 도메인별 음성 인식 분석 과정을 설명하기 위한 예시 화면을 나타내는 도면이다.
도 3은 본 발명의 일 실시 예에 따른 반복 사용되는 하나 이상의 음성 명령어를 이용하여 패키지 명령을 등록 및 처리하는 프로세스의 예시 화면을 나타내는 도면이다.
도 4는 본 발명의 일 실시 예에 따른 사용자의 음성 명령어 발화 패턴을 이용하여 패키지 명령을 등록 및 처리하는 프로세스의 예시 화면을 나타내는 도면이다.
도 5는 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 다른 음성 명령어를 발화하는 경우 기 생성된 패키지 명령에 추가 발화된 음성 명령어를 수정 등록하는 프로세스의 예시 화면을 나타내는 도면이다.
도 6은 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 주변 상황에 따라 기 생성된 패키지 명령어를 수정하는 프로세스의 예시 화면을 나타내는 도면이다.
도 7은 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 기 생성된 패키지에 등록된 하나 이상의 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화되는 경우의 예시 화면을 나타내는 도면이다.
도 8은 도 3 내지 도 7의 상황이 복합적으로 구현된 프로세스의 예시 화면을 나타내는 도면이다.
도 9는 본 발명의 일 실시 예에 따른 컴퓨팅 시스템을 도시한다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 실시예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한다.
본 발명의 실시예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 또한, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
본 발명은 특징은 하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재를 파악하여 하나의 패키지 명령어로 생성하는 구성과 패키지 명령어 내부의 개별 명령들을 순차적으로 또는 동시 실행할지 여부를 결정하여 명령을 수행하는 구성을 개시한다.
이하, 도 1 내지 도 9를 참조하여, 본 발명의 실시예들을 구체적으로 설명하기로 한다.
도 1은 본 발명의 일 실시 예에 따른 음성 명령 인식 장치의 구성을 나타내는 블록도이다.
본 발명의 일 실시 예에 따른 음성 명령 인식 장치(100)는 차량의 내부에 구현될 수 있다. 이때, 음성 명령 인식 장치(100)는 차량의 내부 제어 유닛들과 일체로 형성될 수 있으며, 별도의 장치로 구현되어 별도의 연결 수단에 의해 차량의 제어 유닛들과 연결될 수도 있다.
음성 명령 인식 장치(100)는 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성할 수 있다.
또한, 음성 명령 인식 장치(100)는 기 생성된 하나의 패키지 명령어의 발화 시 추가 발화되는 음성 명령어를 분석하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있다.
또한, 음성 명령 인식 장치(100)는 기 생성된 하나의 패키지 명령어 발화 시, 현재의 주변 상황을 판단하여 하나의 패키지 명령어에 추가, 수정, 및 삭제 중 하나를 수행할 수 있다.
도 1을 참조하면, 음성 명령 인식 장치(100)는 통신부(110), 저장부(120), 표시부(130), 및 프로세서(140)를 포함할 수 있다.
통신부(110)는 무선 또는 유선 연결을 통해 신호를 송신 및 수신하기 위해 다양한 전자 회로로 구현되는 하드웨어 장치로서, 본 발명에서는 차량 내 네트워크 통신 기술, 차량 외부의 서버, 인프라, 타 차량 등과 무선 인터넷 접속 또는 근거리 통신(Short Range Communication) 기술을 이용하여 V2I 통신을 수행할 수 있다. 여기서, 차량 네트워크 통신 기술로는 CAN(Controller Area Network) 통신, LIN(Local Interconnect Network) 통신, 플렉스레이(Flex-Ray) 통신 등을 통해 차량 내 통신을 수행할 수 있다. 또한, 무선 통신 기술로는 무선 인터넷 기술로는 무선랜(Wireless LAN, WLAN), 와이브로(Wireless Broadband, Wibro), 와이파이(Wi-Fi), 와이맥스(World Interoperability for Microwave Access, Wimax) 등이 포함될 수 있다. 또한, 근거리 통신 기술로는 블루투스(Bluetooth), 지그비(ZigBee), UWB(Ultra Wideband), RFID(Radio Frequency Identification), 적외선통신(Infrared Data Association, IrDA) 등이 포함될 수 있다.
일 예로서, 통신부(110)는 외부의 서버로부터 음성 인식을 위한 데이터를 수신할 수 있고, 음성 명령어 수행을 위해 차량 내부의 장치와 통신을 수행할 수 있다.
저장부(120)는 프로세서(140)가 동작하는데 필요한 데이터 및/또는 알고리즘 등 특히 음성 인식 관련 알고리즘 및 데이터가 저장될 수 있다.
일 예로서, 저장부(150)는 음성 인식을 위한 도메인별 데이터베이스가 저장될 수 있다.
저장부(120)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 마이크로 타입(micro type), 및 카드 타입(예컨대, SD 카드(Secure Digital Card) 또는 XD 카드(eXtream Digital Card)) 등의 메모리와, 램(RAM, Random Access Memory), SRAM(Static RAM), 롬(ROM, Read-Only Memory), PROM(Programmable ROM), EEPROM(Electrically Erasable PROM), 자기 메모리(MRAM, Magnetic RAM), 자기 디스크(magnetic disk), 및 광디스크(optical disk) 타입의 메모리 중 적어도 하나의 타입의 기록 매체(storage medium)를 포함할 수 있다.
표시부(130)는 사용자로부터의 제어 명령을 음성으로 입력 받기 위한 입력수단과 장치(100)의 음성 인식 결과 등을 출력하는 출력수단을 포함할 수 있다. 여기서, 입력수단은 마이크 등을 포함할 수도 있다. 이때 마이크 등은 표시부(130)와 별도로 구비될 수 도 있다. 출력수단은 디스플레이를 포함할 수 있으며, 스피커와 같은 음성출력수단을 포함할 수도 있다. 이때, 터치 필름, 터치 시트, 터치 패드 등의 터치 센서가 디스플레이에 구비되는 경우, 디스플레이는 터치 스크린으로 동작하며, 입력수단과 출력수단이 통합된 형태로 구현될 수 있다. 본 발명에서 출력수단은 음성 인식 결과, 패키지 명령어 생성, 추가, 수정, 및 삭제 중 하나 이상의 결과를 출력할 수 있다.
이때, 디스플레이는 액정 디스플레이(Liquid Crystal Display, LCD), 박막 트랜지스터 액정 디스플레이(Thin Film Transistor-Liquid Crystal Display, TFT LCD), 유기 발광 다이오드(Organic Light-Emitting Diode, OLED), 플렉시블 디스플레이(Flexible Display), 전계 방출 디스플레이(Feld Emission Display, FED), 3차원 디스플레이(3D Display) 중에서 적어도 하나를 포함할 수 있다.
프로세서(140)는 통신부(110), 저장부(120), 표시부(130) 등과 전기적으로 연결될 수 있고, 각 구성들을 전기적으로 제어할 수 있으며, 소프트웨어의 명령을 실행하는 전기 회로가 될 수 있으며, 이에 의해 후술하는 다양한 데이터 처리 및 계산을 수행할 수 있다.
프로세서(140)는 음성 명령 인식 장치(100)의 각 구성요소들 간에 전달되는 신호를 처리할 수 있다. 프로세서(140)는 예를 들어, 음성 인식 엔진을 포함할 수 있다.
프로세서(140)는 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어를 분석하거나 사용자의 음성 명령어 발화 패턴을 분석할 수 있다. 이때, 프로세서(140)는 사용자에 의해 사용된 음성 명령어의 사용 횟수가 미리 정한 횟수(N회) 이상이면 반복적으로 사용되는 음성 명령어로 판단할 수 있다. 또한, 프로세서(140)는 하나 이상의 음성 명령어가 순차적으로 발화될 때 발화 순서와 상관없이 발화 횟수를 증가시켜 반복적으로 사용되는 음성 명령어로서 선택할 수 있다. 즉 프로세서(140)는 하나 이상의 음성 명령어가 미리 정한 횟수 이상 발화되거나, 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시킬 수 있다.
프로세서(140)는 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성할 수 있다.
프로세서(140)는 하나의 패키지 명령어 발화 시, 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정할 수 있다.
프로세서(140)는 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 상이할 수 있고, 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우에는 동시 수행을 결정할 수 있다. 프로세서(140)는 하나의 패키지 명령어 발화 시, 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행하는 경우 그 이후 수행될 음성 명령어에 대한 정보를 사전에 수집함으로써 음성 명령어 수행 속도를 향상시킬 수 있다.
프로세서(140)는 하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 하나의 패키지 명령어로 생성할 수 있다.
프로세서(140)는 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시킬 수 있다.
프로세서(140)는 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 추가로 발화되는 음성 명령어를 하나의 패키지 명령어에 추가 등록할 수 있다.
프로세서(140)는 추가로 발화되는 음성 명령어가 추가 등록된 하나의 패키지 명령어가 발화되면, 하나의 패키지 명령어에 기 등록된 하나 이상의 음성 명령어 및 추가로 발화된 음성 명령어를 함께 수행할 수 있다.
프로세서(140)는 하나의 패키지 명령어 발화 시 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우, 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제할 수 있다.
프로세서(140)는 취소 요청된 음성 명령어가 삭제된 패키지 명령어가 발화되면, 하나의 패키지 명령어에 기등록된 하나 이상의 음성 명령어중 삭제된 명령어를 제외한 나머지 음성 명령어를 수행할 수 있다.
프로세서(140)는 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행할 수 있다. 이때, 주변 상황은, 온도, 습도, 날씨, 조도, 계절, 날짜, 요일, 시간, 위치, 교통 상황, 및 차속 중 적어도 하나 이상을 포함할 수 있다.
프로세서(140)는 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행할 수 있다.
이와 같이 본 발명은 반복적으로 사용되는 하나 이상의 음성 명령어를 하나의 패키지 명령어로 통합하여 등록 및 수행함으로써, 여러 개의 음성 명령어를 발화하지 않고 하나의 패키지 명령어를 발화함으로써 음성 인식률을 향상시키고 음성 명령어 처리 속도를 향상시킬 수 있다.
또한, 본 발명은 사용자의 명령어 패턴 분석 또는 주변 상황을 판단하여 기 생성된 패키지 명령어의 수정, 삭제, 및 추가 중 하나를 수행할 수 있다.
도 2는 본 발명의 일 실시 예에 따른 도메인별 음성 인식 분석 과정을 설명하기 위한 예시 화면을 나타내는 도면이다.
도 2를 참조하면, 사용자가 "오늘의 날씨는"을 발화하면 음성 명령 인식 장치(100)는 도메인을 분석하여 "날씨"에 대한 정보를 수집하여 출력할 수 있다. 또한, 사용자가 "오늘의 운세는"을 발화하면 음성 명령 인식 장치(100)는 도메인을 분석하여 "운세"에 대한 정보를 수집하여 출력할 수 있다.
이하, 도 3 내지 도 8을 통해 하나 이상의 음성 명령어를 패키지 명령어로 등록, 취소, 추가 등을 수행하는 과정을 구체적으로 설명하기로 한다.
이하에서는 도 1의 음성 명령 인식 장치(100)가 도 3 내지 도 8의 프로세스를 수행하는 것을 가정한다. 또한, 도 3 내지 도 8의 설명에 기술된 동작은 음성 명령 인식 장치(100)의 프로세서(140)에 의해 제어되는 것으로 이해될 수 있다.
도 3은 본 발명의 일 실시 예에 따른 반복 사용되는 하나 이상의 음성 명령어를 이용하여 패키지 명령을 등록 및 처리하는 프로세스의 예시 화면을 나타내는 도면이다.
도 3을 참조하면, 음성 명령 인식 장치(100)는 차량 시동 후 수행되는 음성 명령어를 수집하여, 사용자가 반복적으로 사용하는 하나 이상의 명령어를 하나의 패키지 명령어로 등록하여 하나의 패키지 명령어를 발화하면 등록된 하나 이상의 음성 명령어를 수행하는 예를 개시한다.
도 3의 301과 같이 "날씨 알려줘, "주식 정보 알려줘, "교통 상황 알려줘" 이 3가지의 음성 명령어를 반복적으로 발화하는 경우, 음성 명령 인식 장치(100)는 302와 같이, 3가지 명령에 대한 패키지 명령어의 등록을 제안한다.
이처럼 패키지 명령어가 등록되면, 303과 같이, 패키지 명령어로서 "패키지 1"이 발화되면 음성 명령 인식 장치(100)는 날씨, 주식, 교통 도메인에 대한 정보를 수집하여 출력한다.
도 4는 본 발명의 일 실시 예에 따른 사용자의 음성 명령어 발화 패턴을 이용하여 패키지 명령을 등록 및 처리하는 프로세스의 예시 화면을 나타내는 도면이다.
도 4를 참조하면, 차량 시동 후 수행되는 음성 명령어를 수집하여, 사용자의 음성 명령어 발화 패턴을 분석한다.
401에서는 "날씨 알려줘, "주식 정보 알려줘", 및 "교통 상황 알려줘"의 음성 명령어가 순서만 변경된 채로 반복적으로 발화된 경우 각 음성 명령어의 발화 빈도 및 시간차를 분석하여, 명령어의 순서가 변경되어 진행되더라도 동일한 명령 수행으로 인식하여, 발화 횟수를 증가시킬 수 있다. 즉 401에서 "날씨 알려줘, "주식 정보 알려줘","교통 상황 알려줘"의 음성 명령어가 순서가 변경되었지만 이 3가지의 명령어가 3회 발화된 것으로 기록된다.
이에 402와 같이 음성 명령 인식 장치(100)는 미리 정한 횟수 이상 3가지 명령어가 세트로 발화되면 최종 명령어 수행 후, 이 3가지 명령어를 하나의 패키지 명령어(패키지 1)로 등록하는 것을 사용자에게 제안할 수 있다.
이에 패키지 명령어 1로 등록되면 403과 같이, 사용자가 "패키지 명령어 1"을 발화하면, "날씨 알려줘", "주식 정보 알려줘","교통 상황 알려줘"의 음성 명령어를 순차적으로 수행할 수 있다. 이때, 실행되는 하나 이상의 명령어의 도메인이 각각 다른 경우, 먼저 수행되는 명령어 수행 중 그 이후 수행될 명령어에 대한 정보를 사전에 수집 하여 빠른 정보 제공이 가능하도록 한다.
도 5는 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 다른 음성 명령어를 발화하는 경우 기 생성된 패키지 명령에 추가 발화된 음성 명령어를 수정 등록하는 프로세스의 예시 화면을 나타내는 도면이다.
도 5의 501을 참조하면, "날씨 알려줘, "주식 정보 알려줘", 및 "교통 상황 알려줘"의 음성 명령어의 세트가 등록된 패키지 명령어 1이 발화되면서 "에어컨 틀어줘"의 음성 명령어가 추가 발화된 경우, 502와 같이 패키지 명령어 1에 "에어컨 틀어줘"의 음성 명령어를 추가 제안하여 패키지 명령어 1을 수정 등록한다.
이후, 503과 같이 패키지 명령어 1이 발화되면, 음성 명령 인식 장치(100)는 "날씨 알려줘, "주식 정보 알려줘", "교통 상황 알려줘", 및"에어컨 틀어줘"의 4가지 명령어를 수행할 수 있다.
도 6은 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 주변 상황에 따라 기 생성된 패키지 명령어를 수정하는 프로세스의 예시 화면을 나타내는 도면이다. 이때, 주변 상황은 외부 온도, 날씨, 계절, 습도, 조도, 차속, 차량 내부 온도 등을 포함할 수 있다.
도 6의 601을 참조하면, 날씨, 주식, 교통상황을 도메인으로 하는 음성 명령어들로 기 생성된 패키지 명령어 1이 발화되면, 음성 명령 인식 장치(100)는 날씨, 주식, 교통상황 중 실시간 정보를 제공할 수 없는 도메인에 대해 안내할 수 있다. 601에서는, 음성 명령 인식 장치(100)는 주식과 관련하여 요일을 판단하여, 금일이 휴일인 경우 실시간 주식 정보 제공이 어려우므로 이전 종가 기준으로 주식 정보를 안내하는 예시 화면을 개시한다.
602에서는 날씨, 주식, 교통상황을 도메인으로 하는 음성 명령어들로 기 생성된 패키지 명령어 1이 발화되면, 음성 명령 인식 장치(100)는 차량 내 온도를 판단하여, 차량 내 온도가 높은 경우 사용자에게 에어컨 온(ON)을 제안하고 사용자가 제안을 받아들인 경우 에어컨을 온한 상태에서 날씨, 주식, 교통상황을 안내하는 예를 개시한다.
603에서는 날씨, 주식, 교통상황을 도메인으로 하는 음성 명령어들로 기 생성된 패키지 명령어 1이 발화되면, 음성 명령 인식 장치(100)는 현재 날씨, 계절, 온도, 습도 등을 판단하여 그에 맞는 차량 공조 제어를 제안할 수 있다. 603에서는 음성 명령 인식 장치(100)는 현재 계절이 겨울이므로 히터와 열선 핸들 동작을 패키지 명령어 1에 추가하는 것을 제안한 예를 개시한다.
도 7은 본 발명의 일 실시 예에 따른 기 생성된 패키지 명령어 발화 시 기 생성된 패키지에 등록된 하나 이상의 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화되는 경우의 예시 화면을 나타내는 도면이다.
도 7의 701을 참조하면, 날씨, 주식, 교통상황, 에어컨과 관련한 음성 명령어가 등록되어 있는 패키지 명령어 1이 발화될 때, 에어컨 온 명령을 취소하는 명령이 추가 발화된 경우, 702와 같이, 음성 명령 인식 장치(100)는 에어컨 온 명령어를 패키지 명령어 1에서 삭제할 수 있다.
도 8은 도 3 내지 도 7의 상황이 복합적으로 구현된 프로세스의 예시 화면을 나타내는 도면이다.
도 8의 801을 참조하면, 음성 명령 인식 장치(100)는 사용자에 의해 반복적으로 사용되는 하나 이상의 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해, 자주 사용되는 음성 명령어 "날씨 알려줘, "주식 정보 알려줘","교통 상황 알려줘"를 패키지 명령어 1로 등록하는 것을 제안할 수 있다.
이에 패키지 명령어 1이 생성되어, 802와 같이, 패키지 명령어 1이 발화 시 "에어컨 틀어줘"의 음성 명령어가 추가 발화된 경우, 803과 같이, 음성 명령 인식 장치(100)는 패키지 명령어 1에 "에어컨 틀어줘"의 음성 명령어를 추가할지를 문의하는 화면을 출력할 수 있다.
이어, 패키지 명령어 1에 "에어컨 틀어줘"의 음성 명령어가 추가된 경우 패키지 명령어 1이 발화되면, 804와 같이 음성 명령 인식 장치(100)는 주변 상황을 고려하여, 패키지 명령어 1에 포함된 음성 명령어인 "에어컨 틀어줘"대신에 "히터 틀어줘"의 명령어를 추가할 것을 제안하고 805와 같이, 패키지 명령어 1의 에어컨 관련 명령어를 삭제하고 날씨, 주식, 교통 상황, 히터 관련 명령어가 등록되도록 한다.
이와 같이 본 발명은 반복적으로 사용하는 하나 이상의 명령어를 하나의 패키지 명령어로 등록할 수 있고(도 3), 사용자의 음성 명령어 발화 패턴을 분석하여 하나 이상의 음성 명령어를 하나의 패키지 명령어로 등록할 수 있다(도 4).
또한, 본 발명은 기 생성된 패키지 명령어 발화 시 하나 이상의 음성 명령어를 추가 발화하면, 기 생성된 패키지 명령어에 음성 명령어를 추가하여 패키지 명령어를 수정 등록할 수 있다(도 5).
또한, 본 발명은 현재의 주변 상황을 판단하여 기 생성된 패키지 명령어를 변경 수행할 수 있다(도 6).
또한, 본 발명은 기 생성된 패키지 명령어 발화 시 패키지 명령어로 등록된 하나 이상의 음성 명령어 중 하나를 취소하는 명령어 발화 시, 이를 반영하여 기 생성된 패키지 명령어 중 취소 요청한 음성 명령어를 삭제할 수 있다(도 7).
도 9는 본 발명의 일 실시 예에 따른 컴퓨팅 시스템을 도시한다.
도 9를 참조하면, 컴퓨팅 시스템(1000)은 버스(1200)를 통해 연결되는 적어도 하나의 프로세서(1100), 메모리(1300), 사용자 인터페이스 입력 장치(1400), 사용자 인터페이스 출력 장치(1500), 스토리지(1600), 및 네트워크 인터페이스(1700)를 포함할 수 있다.
프로세서(1100)는 중앙 처리 장치(CPU) 또는 메모리(1300) 및/또는 스토리지(1600)에 저장된 명령어들에 대한 처리를 실행하는 반도체 장치일 수 있다. 메모리(1300) 및 스토리지(1600)는 다양한 종류의 휘발성 또는 불휘발성 저장 매체를 포함할 수 있다. 예를 들어, 메모리(1300)는 ROM(Read Only Memory) 및 RAM(Random Access Memory)을 포함할 수 있다.
따라서, 본 명세서에 개시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계는 프로세서(1100)에 의해 실행되는 하드웨어, 소프트웨어 모듈, 또는 그 2 개의 결합으로 직접 구현될 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM과 같은 저장 매체(즉, 메모리(1300) 및/또는 스토리지(1600))에 상주할 수도 있다.
예시적인 저장 매체는 프로세서(1100)에 커플링되며, 그 프로세서(1100)는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정보를 기입할 수 있다. 다른 방법으로, 저장 매체는 프로세서(1100)와 일체형일 수도 있다. 프로세서 및 저장 매체는 주문형 집적회로(ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법으로, 프로세서 및 저장 매체는 사용자 단말기 내에 개별 컴포넌트로서 상주할 수도 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.
따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (20)

  1. 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 프로세서; 및
    상기 프로세서에 의한 음성 인식을 위한 데이터 또는 알고리즘이 저장되는 저장부;
    를 포함하는 음성 명령 인식 장치.
  2. 청구항 1에 있어서,
    상기 프로세서는,
    상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정하는 것을 특징으로 하는 음성 명령 인식 장치.
  3. 청구항 2에 있어서,
    상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우에는 동시 수행을 결정하는 것을 특징으로 하는 음성 명령 인식 장치.
  4. 청구항 2에 있어서,
    상기 프로세서는,
    상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행하는 경우, 그 이후 수행될 음성 명령어에 대한 정보를 사전 수집하는 것을 특징으로 하는 음성 명령 인식 장치.
  5. 청구항 1에 있어서,
    상기 프로세서는,
    하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 상기 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 상기 하나의 패키지 명령어로 생성하는 것을 특징으로 하는 음성 명령 인식 장치
  6. 청구항 5항에 있어서,
    상기 프로세서는,
    상기 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시키는 것을 특징으로 하는 음성 명령 인식 장치.
  7. 청구항 1에 있어서,
    상기 프로세서는,
    상기 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 상기 추가로 발화되는 음성 명령어를 상기 하나의 패키지 명령어에 추가 등록하는 것을 특징으로 하는 음성 명령 인식 장치.
  8. 청구항 7에 있어서,
    상기 프로세서는,
    상기 추가로 발화되는 음성 명령어가 추가 등록된 하나의 패키지 명령어가 발화되면, 상기 하나의 패키지 명령어에 기 등록된 하나 이상의 음성 명령어 및 상기 추가로 발화된 음성 명령어를 함께 수행하는 것을 특징으로 하는 음성 명령 인식 장치.
  9. 청구항 1에 있어서,
    상기 프로세서는,
    상기 하나의 패키지 명령어 발화 시 상기 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우,
    상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제하는 것을 특징으로 하는 음성 명령 인식 장치.
  10. 청구항 9에 있어서,
    상기 프로세서는,
    상기 취소 요청된 음성 명령어가 삭제된 패키지 명령어가 발화되면,
    상기 하나의 패키지 명령어에 기등록된 하나 이상의 음성 명령어중 삭제된 명령어를 제외한 나머지 음성 명령어를 수행하는 것을 특징으로 하는 음성 명령 인식 장치.
  11. 청구항 1에 있어서,
    상기 프로세서는,
    상기 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행하는 것을 특징으로 하는 음성 명령 인식 장치.
  12. 청구항 11에 있어서,
    상기 주변 상황은,
    온도, 습도, 날씨, 조도, 계절, 날짜, 요일, 시간, 위치, 교통 상황, 및 차속 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 음성 명령 인식 장치.
  13. 청구항 1에 있어서,
    상기 프로세서는,
    상기 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 상기 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행하는 것을 특징으로 하는 음성 명령 인식 장치.
  14. 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴을 분석하는 단계; 및
    상기 사용자에 의해 반복적으로 사용되는 하나 이상의 음성 명령어 또는 사용자의 음성 명령어 발화 패턴 분석에 의해 선택된 하나 이상의 음성 명령어를 등록하여 하나의 패키지 명령어로 생성하는 단계;
    를 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
  15. 청구항 14에 있어서,
    상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행할지 또는 동시에 수행할지 결정하는 단계
    를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
  16. 청구항 14에 있어서,
    상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어 각각의 도메인이 동일한 경우에는 순차적 수행을 결정하고 각각의 도메인이 상이한 경우, 동시 수행을 결정하는 단계; 및
    상기 하나의 패키지 명령어 발화 시, 상기 하나의 패키지 명령어에 등록되어 있는 하나 이상의 음성 명령어를 순차적으로 수행하는 경우, 그 이후 수행될 음성 명령어에 대한 정보를 사전 수집하는 단계
    를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
  17. 청구항 14에 있어서,
    상기 하나의 패키지 명령어로 생성하는 단계는,,
    하나의 명령어를 발화한 이후 임계시간 이내에 순차적으로 이뤄지는 명령어의 존재 여부를 파악함으로써 상기 음성 명령어 발화 패턴 분석을 수행하며, 상기 임계시간 이내에 순차적으로 이뤄지는 명령어가 일정 횟수 이상 발화되는 경우, 상기 하나의 패키지 명령어로 생성하는 단계; 및
    상기 하나 이상의 음성 명령어의 순서가 변경되어 발화되는 경우에도 동일한 명령어 수행으로 인식하여 발화 횟수를 증가시키는 단계;를 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
  18. 청구항 14에 있어서,
    상기 하나의 패키지 명령어 발화 후 추가로 발화된 음성 명령어 존재 시, 상기 추가로 발화되는 음성 명령어를 상기 하나의 패키지 명령어에 추가 등록하는 단계
    를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
  19. 청구항 14에 있어서,
    상기 하나의 패키지 명령어 발화 시 상기 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 하나의 취소를 요청하는 명령어가 추가 발화된 경우,
    상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 취소 요청된 음성 명령어를 삭제하는 단계;
    를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
  20. 청구항 14에 있어서,
    상기 하나의 패키지 명령어의 발화 시, 주변 상황을 기반으로 상기 하나의 패키지 명령어에 등록된 하나 이상의 음성 명령어 중 일부를 수정 또는 음성 명령어의 추가 제안을 수행하는 단계; 및
    상기 하나의 패키지 명령어의 발화 시, 추가 발화되는 음성 명령어를 분석하여 상기 하나의 패키지 명령어의 수정, 삭제, 및 추가 명령어 등록 중 적어도 하나 이상을 수행하는 단계;
    를 더 포함하는 것을 특징으로 하는 음성 명령 인식 방법.
KR1020190162818A 2019-12-09 2019-12-09 음성 명령 인식 장치 및 그 방법 KR20210072471A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020190162818A KR20210072471A (ko) 2019-12-09 2019-12-09 음성 명령 인식 장치 및 그 방법
US16/868,028 US11514908B2 (en) 2019-12-09 2020-05-06 Voice command recognition device and method thereof
CN202010439262.3A CN113035185A (zh) 2019-12-09 2020-05-22 语音命令识别装置及语音命令识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190162818A KR20210072471A (ko) 2019-12-09 2019-12-09 음성 명령 인식 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR20210072471A true KR20210072471A (ko) 2021-06-17

Family

ID=76210135

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190162818A KR20210072471A (ko) 2019-12-09 2019-12-09 음성 명령 인식 장치 및 그 방법

Country Status (3)

Country Link
US (1) US11514908B2 (ko)
KR (1) KR20210072471A (ko)
CN (1) CN113035185A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023090667A1 (ko) * 2021-11-17 2023-05-25 삼성전자 주식회사 발화 기반 퀵 커맨드 재구성 방법 및 이를 위한 전자 장치

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210072471A (ko) * 2019-12-09 2021-06-17 현대자동차주식회사 음성 명령 인식 장치 및 그 방법
US20220093094A1 (en) * 2020-09-21 2022-03-24 Amazon Technologies, Inc. Dialog management for multiple users
CN113421567A (zh) * 2021-08-25 2021-09-21 江西影创信息产业有限公司 基于智能眼镜的终端设备控制方法、系统及智能眼镜
US20230153060A1 (en) * 2021-11-18 2023-05-18 International Business Machines Corporation Dynamic display accommodations for multiple voice commands
CN113990299B (zh) * 2021-12-24 2022-05-13 广州小鹏汽车科技有限公司 语音交互方法及其装置、服务器和可读存储介质
CN117950727A (zh) * 2022-10-31 2024-04-30 华为技术有限公司 一种多指令执行的方法、电子设备、装置和运载工具

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748191A (en) * 1995-07-31 1998-05-05 Microsoft Corporation Method and system for creating voice commands using an automatically maintained log interactions performed by a user
US8890435B2 (en) * 2011-03-11 2014-11-18 Ilumi Solutions, Inc. Wireless lighting control system
US10042603B2 (en) * 2012-09-20 2018-08-07 Samsung Electronics Co., Ltd. Context aware service provision method and apparatus of user device
US9930519B2 (en) * 2013-11-21 2018-03-27 Samsung Electronics Co., Ltd. Method and apparatus for controlling home devices on group basis based upon history of the home devices
WO2015184387A1 (en) * 2014-05-30 2015-12-03 Apple Inc. Accessory management system using environment model
US20170097621A1 (en) * 2014-09-10 2017-04-06 Crestron Electronics, Inc. Configuring a control sysem
KR102327358B1 (ko) * 2014-10-07 2021-11-17 삼성전자 주식회사 사용자의 개입정보를 활용하여 그룹 제어 모드를 동적으로 변경하는 방법 및 장치
US9984686B1 (en) * 2015-03-17 2018-05-29 Amazon Technologies, Inc. Mapping device capabilities to a predefined set
US9934782B2 (en) * 2015-09-22 2018-04-03 Meshrose Ltd. Automatic performance of user interaction operations on a computing device
US10018977B2 (en) * 2015-10-05 2018-07-10 Savant Systems, Llc History-based key phrase suggestions for voice control of a home automation system
US10572530B2 (en) * 2016-07-03 2020-02-25 Apple Inc. Prefetching accessory data
US10764153B2 (en) * 2016-09-24 2020-09-01 Apple Inc. Generating suggestions for scenes and triggers
KR20180058476A (ko) * 2016-11-24 2018-06-01 삼성전자주식회사 다양한 입력 처리를 위한 방법, 이를 위한 전자 장치 및 서버
US20180323996A1 (en) * 2017-05-08 2018-11-08 Essential Products, Inc. Automatic generation of scenes using an assistant device
US11450314B2 (en) * 2017-10-03 2022-09-20 Google Llc Voice user interface shortcuts for an assistant application
EP3583770B1 (en) * 2018-05-07 2020-10-28 Google LLC Providing composite graphical assistant interfaces for controlling various connected devices
US11651196B2 (en) * 2019-02-26 2023-05-16 Google Llc Reinforcement learning techniques for selecting a software policy network and autonomously controlling a corresponding software client based on selected policy network
KR20210072471A (ko) * 2019-12-09 2021-06-17 현대자동차주식회사 음성 명령 인식 장치 및 그 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023090667A1 (ko) * 2021-11-17 2023-05-25 삼성전자 주식회사 발화 기반 퀵 커맨드 재구성 방법 및 이를 위한 전자 장치

Also Published As

Publication number Publication date
CN113035185A (zh) 2021-06-25
US20210174797A1 (en) 2021-06-10
US11514908B2 (en) 2022-11-29

Similar Documents

Publication Publication Date Title
KR20210072471A (ko) 음성 명령 인식 장치 및 그 방법
US11205421B2 (en) Selection system and method
US10170106B2 (en) Parameter collection and automatic dialog generation in dialog systems
KR102348124B1 (ko) 차량의 기능 추천 장치 및 방법
US11295735B1 (en) Customizing voice-control for developer devices
KR102485342B1 (ko) 차량의 환경에 기반한 추천 신뢰도 판단 장치 및 방법
CN103810995A (zh) 用于语音系统的调节方法和系统
KR20190067582A (ko) 사용자의 발화 에러 보정 장치 및 그 방법
US9202459B2 (en) Methods and systems for managing dialog of speech systems
US20200160861A1 (en) Apparatus and method for processing voice commands of multiple talkers
CN105222797B (zh) 利用口授和部分匹配搜索的导航系统的系统和方法
CN103810005A (zh) 用于语音系统的调节方法和系统
CN113421561B (zh) 语音控制方法、语音控制装置、服务器和存储介质
US11514884B2 (en) Driving sound library, apparatus for generating driving sound library and vehicle comprising driving sound library
US11532303B2 (en) Agent apparatus, agent system, and server device
US20070256435A1 (en) Air Conditioner Control Device and Air Conditioner Control Method
CN114327185B (zh) 一种车机屏幕控制方法、装置、介质及电子设备
US20200327888A1 (en) Dialogue system, electronic apparatus and method for controlling the dialogue system
US10522141B2 (en) Vehicle voice recognition including a wearable device
US20210241771A1 (en) Electronic device and method for controlling the electronic device thereof
KR102429501B1 (ko) 음성 안내 제어 장치 및 방법, 그리고 차량 시스템
US20080228492A1 (en) Device Control Device, Speech Recognition Device, Agent Device, Data Structure, and Device Control
US20240127810A1 (en) Dialogue Management Method, Dialogue Management System, And Computer-Readable Recording Medium
US20220139390A1 (en) Vehicle and method of controlling the same
KR20200095636A (ko) 대화 시스템이 구비된 차량 및 그 제어 방법

Legal Events

Date Code Title Description
A201 Request for examination