KR20190050224A - 차량의 음성인식 장치 및 방법 - Google Patents

차량의 음성인식 장치 및 방법 Download PDF

Info

Publication number
KR20190050224A
KR20190050224A KR1020170145545A KR20170145545A KR20190050224A KR 20190050224 A KR20190050224 A KR 20190050224A KR 1020170145545 A KR1020170145545 A KR 1020170145545A KR 20170145545 A KR20170145545 A KR 20170145545A KR 20190050224 A KR20190050224 A KR 20190050224A
Authority
KR
South Korea
Prior art keywords
command
wake
terminal
speech recognition
server
Prior art date
Application number
KR1020170145545A
Other languages
English (en)
Other versions
KR102552486B1 (ko
Inventor
방규섭
Original Assignee
현대자동차주식회사
기아자동차주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사, 기아자동차주식회사 filed Critical 현대자동차주식회사
Priority to KR1020170145545A priority Critical patent/KR102552486B1/ko
Priority to US16/018,934 priority patent/US20190130908A1/en
Publication of KR20190050224A publication Critical patent/KR20190050224A/ko
Application granted granted Critical
Publication of KR102552486B1 publication Critical patent/KR102552486B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mechanical Engineering (AREA)
  • Navigation (AREA)

Abstract

본 발명의 차량의 음성인식 장치는 입력되는 명령어를 수신하는 입력부와, 상기 수신된 명령어가 단말 음성인식을 수행하도록 생성된 제1웨이크업 커맨드(wake-up command) 및 상기 수신된 명령어가 서버 음성인식을 수행하도록 생성된 제2웨이크업 커맨드가 저장된 저장부와, 상기 수신된 명령어로부터 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나를 검출하는지 판단하여, 상기 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하고, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 제어부 및 상기 단말 음성인식 결과값 및 상기 서버 음성인식 결과값 중 적어도 어느 하나를 출력하는 출력부를 포함하여, 수신된 명령어에 따라 활성화되는 서비스 도메인을 한정함으로써 음성인식률을 향상시키고, 수신된 명령어에 대한 결과값을 검색하기 위하여 불필요하게 데이터가 소모되는 것을 방지할 수 있다.

Description

차량의 음성인식 장치 및 방법{APPARATUS AND METHOD FOR RECOGINIZING VOICE IN VEHICLE}
본 발명은 차량의 음성인식 장치 및 방법에 관한 것으로, 보다 자세하게는, 각 모드 별로 웨이크업 명령어를 설정하고, 웨이크업 명령어가 입력되는 경우, 해당모드에서 음성인식을 용이하게 하는 차량의 음성인식 장치 및 방법에 관한 것이다.
일반적으로, 전자 기술의 발전과 소비자의 편의성 요구에 따라 차량에는 각종 첨단 전자 제어장치 및 편의장치들이 장착되고 있으며, 이들 전자 제어장치 및 편의장치들에 대한 동작은 음성인식기술에 의해 수행되도록 하고 있다.
음성인식기술(Speech Recognition)은 마이크로폰을 통해 발화된 사용자의 음성을 컴퓨터가 분석하고 특징을 추출해서 미리 입력된 단어나 문장에 근접한 결과를 명령어로서 인식하고, 인식된 명령어에 해당하는 동작을 수행하도록 하는 기술이다.
기존의 음성인식 장치는 차량, 모바일 등 단말기 내부에 음성인식 엔진이 저장되는 단말 음성인식 방식과, 스마트폰 인터넷 음성 검색 및 각종 정보 처리를 위한 클라우드 기반 서버 음성인식이 각각 서비스 용도에 맞게 변별적으로 사용되어 왔다. 그리고, 인식 문법 기반의 단말 음성인식 장치의 높은 인식률이라는 측면의 장점과, 문장 단위의 인식이라는 서버 음성인식의 장점을 함께 활용 가능한 하이브리드 음성인식(Hybrid Speech Recognition) 기술이 시장에 적용되고 있다.
하이브리드 음성인식은 사용자의 하나의 발화에 대해 단말 음성인식 엔진과 서버 음성인식 엔진을 동시에 구동시켜 2개 이상 복수의 결과값을 수신할 수 있으며, 상기 2개의 값 중에 더 나은 결과값을 명령 구동에 사용할 수 있다. 보다 구체적으로, 종래기술에 따른 음성인식 방법의 흐름을 설명한다.
먼저, 사용자로부터 발화된 명령어를 수신한다. 여기서, 발화된 웨이크업 명령어는 음성인식을 활성화시키기 위한 것으로, 예를들면 '하이, 현대'를 입력할 수 있다. 그 다음, '하이 현대'가 수신되었는지 확인한다. '하이 현대'가 수신된 경우, 음성인식 어플리케이션이 활성화되고, 음성인식 어플리케이션이 활성화된 경우 스피커를 통하여 가이던스 프롬프트 재생한다. 예를들면, '명령어를 말하세요'라는 내용이 출력될 수 있다. 그리고, 사용자가 발화한 명령어에 대한 음성신호를 수신한다. 'FM 91.9'라는 명령어가 수신된 경우, 음성인식 어플리케이션은 명령어에 대한 음성신호를 수신하여 음성인식을 수행하는데 있어서, 단말 음성인식 엔진 및 서버 음성인식 엔진을 동시에 구동시켜 음성인식을 수행할 수 있다. 이후, 음성 어플리케이션은 단말 음성인식 엔진 및 서버 음성인식 엔진으로부터 단말 음성인식 결과값 및 서버 음성인식 결과값을 수신할 수 있다. 음성 어플리케이션은 복수의 결과값 중 더 나은 결과값을 출력한다. 예를들면 '라디오로 전환합니다'라는 내용을 출력할 수 있다.
여기서, 사용자가 입력한 명령어가 단말 음성인식 명령어인지 서버 음성인식 명령어인지 즉시 판단할 수 없기 때문에, 수신된 명령어를 검색하기 위하여 단말 음성인식 엔진 및 서버 음성인식 엔진을 동시에 구동시켜야만 하는 한계가 있다.
따라서, 사용자가 발화한 명령어가 단말 음성인식 명령어인 경우에도, 불필요하게 서버 음성인식 엔진을 구동시키며 검색하게 되므로, 데이터 소모가 낭비되는 문제가 있다. 또한, 사용자가 발화한 명령어가 서버 음성인식 명령어인 경우에도, 불필요하게 단말 음성인식 엔진을 구동시키며 검색하게 되므로, 단말기를 과부하시키는 요인이 될 수 있는 한계가 있다.
본 발명은 상술한 한계점을 극복하기 위한 것으로, 서비스 도메인에 따라 분류되어 등록된 웨이크업 커맨드가 포함되도록 신규 명령어를 생성하고, 이러한 신규 명령어가 입력되는 경우, 신규 명령어 내의 웨이크업 커맨드를 검출하여 신규 명령어가 포함되어 있는 서비스 도메인을 판단하도록 하여, 음성인식률을 향상시키는 차량의 음성인식 장치 및 방법을 제공하는데 목적이 있다.
본 발명의 차량의 음성인식 장치는 입력되는 명령어를 수신하는 입력부와, 상기 수신된 명령어가 단말 음성인식을 수행하도록 생성된 제1웨이크업 커맨드(wake-up command) 및 상기 수신된 명령어가 서버 음성인식을 수행하도록 생성된 제2웨이크업 커맨드가 저장된 저장부와, 상기 수신된 명령어로부터 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나를 검출하는지 판단하여, 상기 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하고, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 제어부 및 상기 단말 음성인식 결과값 및 상기 서버 음성인식 결과값 중 적어도 어느 하나를 출력하는 출력부를 포함하는 것을 특징으로 한다.
그리고, 상기 입력부는 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나를 포함하는 상기 명령어가 입력되는 것을 특징으로 한다.
그리고, 상기 저장부는 차량단말 및 상기 차량단말과 연결된 사용자의 개인 디바이스에 저장된 정보를 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어(word) 및 소정 어구(phrase) 중 적어도 어느 하나를 기반으로 생성되는 상기 제1웨이크업 커맨드를 저장하는 것을 특징으로 한다.
그리고, 상기 저장부는 웹 서버의 정보들을 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어 및 소정 어구 중 적어도 어느 하나를 기반으로 생성되는 상기 제2웨이크업 커맨드를 저장하는 것을 특징으로 한다.
그리고, 상기 제어부는 상기 저장부에 저장된 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드를 기반으로 상기 수신된 명령어로부터 웨이크업 커맨드 및 동작 커맨드를 구분하여 인식하고, 상기 웨이크업 커맨드를 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나로 검출하는 것을 특징으로 한다.
그리고, 상기 제어부는 차량단말 및 상기 차량단말과 연결된 개인 디바이스에 저장된 정보를 기반으로 사용자가 입력한 상기 명령어에 대응하는 결과값이 검색되도록 하는 동작을 통하여 상기 단말 음성인식을 수행하는 것을 특징으로 한다.
그리고, 상기 제어부는 웹 서버의 정보를 기반으로 사용자가 입력한 상기 명령어에 대응하는 결과값이 검색되도록 하는 동작을 통하여 상기 서버 음성인식을 수행하는 것을 특징으로 한다.
그리고, 상기 제어부는 상기 단말 음성인식을 수행하는 경우, 차량단말 및 상기 차량단말과 연결된 개인 디바이스 기반의 서비스 도메인 내에서 상기 수신된 명령어의 음성인식이 수행되도록 하는 것을 특징으로 한다.
그리고, 상기 제어부는 상기 서버 음성인식을 수행하는 경우, 웹 서버 기반의 서비스 도메인 내에서 상기 수신된 명령어의 음성인식이 수행되도록 하는 것을 특징으로 한다.
본 발명의 차량의 음성인식 방법은 사용자로부터 발화된 명령어를 수신하는 단계와, 상기 수신된 명령어로부터 제1웨이크업 커맨드(wake-up command) 및 제2웨이크업 커맨드 중 적어도 어느 하나를 검출하는 단계와, 상기 수신된 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하고, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 단계 및 상기 단말 음성인식 결과값 및 상기 서버 음성인식 결과값 중 적어도 어느 하나를 출력하는 단계를 포함하는 것을 특징으로 한다.
그리고, 상기 발화된 명령어를 수신하는 단계 이전, 차량단말 및 상기 차량단말과 연결된 사용자의 개인 디바이스에 저장된 정보를 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어(word) 및 소정 어구(phrase) 중 적어도 어느 하나를 기반으로 생성된 상기 제1웨이크업 커맨드를 저장하는 단계를 수행하는 것을 특징으로 한다.
그리고, 상기 발화된 명령어를 수신하는 단계 이전, 웹 서버의 정보들을 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어 및 소정 어구 중 적어도 어느 하나를 기반으로 생성되는 상기 제2웨이크업 커맨드를 저장하는 단계를 수행하는 것을 특징으로 한다.
그리고, 상기 발화된 명령어를 수신하는 단계는 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나를 포함하는 상기 명령어를 수신하는 것을 특징으로 한다.
그리고, 상기 수신된 명령어로부터 제1웨이크업 커맨드(wake-up command) 및 제2웨이크업 커맨드 중 적어도 어느 하나를 검출하는 단계는 상기 저장된 제1웨이크업 커맨드 및 상기 저장된 제2웨이크업 커맨드를 기반으로 상기 수신된 명령어로부터 웨이크업 커맨드 및 동작 커맨드를 구분하여 인식하는 단계 및 상기 웨이크업 커맨드를 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나로 검출하는 단계를 포함하는 것을 특징으로 한다.
그리고, 상기 수신된 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하거나, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 단계에서, 상기 단말 음성인식은 차량단말 및 상기 차량단말과 연결된 개인 디바이스에 저장된 정보를 기반으로 사용자가 입력한 상기 명령어에 대응하는 결과값이 검색되도록 하는 동작을 통하여 수행되고, 상기 서버 음성인식은 웹 서버의 정보를 기반으로 사용자가 입력한 상기 명령어에 대응하는 결과값이 검색되도록 하는 동작을 통하여 수행되는 것을 특징으로 한다.
그리고, 상기 수신된 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하거나, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 단계에서, 상기 단말 음성인식을 수행하는 경우, 차량단말 및 상기 차량단말과 연결된 개인 디바이스 기반의 서비스 도메인 내에서 상기 수신된 명령어의 음성인식이 수행되도록 하는 것을 특징으로 한다.
그리고, 상기 수신된 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하거나, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 단계에서, 상기 서버 음성인식을 수행하는 경우, 웹 서버 기반의 서비스 도메인 내에서 상기 수신된 명령어의 음성인식이 수행되도록 하는 것을 특징으로 한다.
본 발명은 하이브리드 음성인식 방식에 있어서, 서비스 도메인에 따라 분류되어 등록된 웨이크업 커맨드를 포함하는 명령어가 입력되는 경우, 발화된 명령어를 수신하고, 웨이크업 커맨드를 검출하여 수신된 명령어에 따라 활성화되는 서비스 도메인을 한정함으로써 음성인식률을 향상시킬 수 있다.
또한, 수신된 명령어가 어느 서비스 도메인에 포함되는지 알 수 있기 때문에, 수신된 명령어에 대한 결과값을 검색하기 위하여 불필요하게 데이터가 소모되는 것을 방지할 수 있다.
또한, 사용자가 음성인식을 활성화시키기 위한 웨이크업 명령어를 입력하지 않고, 본 발명에서 제안되는 웨이크업 커맨드를 포함하는 명령어만 입력되어도 음성인식이 활성화되므로 간편하고 빠르게 음성인식을 활성화시킬 수 있는 효과를 제공할 수 있다.
도 1은 본 발명의 실시예에 따른 차량의 음성인식 장치를 설명하는 도면이다.
도 2는 본 발명의 실시예에 따른 차량의 음성인식 장치를 나타내는 구성도이다.
도 3은 본 발명의 실시예에 따른 차량의 음성인식 방법의 흐름을 나타낸 도면이다.
도 4는 본 발명의 다른 실시예에 따른 차량의 음성인식 방법의 흐름을 나타낸 도면이다.
도 5는 본 발명의 실시예에 따른 차량의 음성인식 방법을 나타낸 순서도이다.
도 6은 본 발명의 일 실시예에 따른 방법을 실행하는 컴퓨팅 시스템의 구성을 도시한 도면이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 실시예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한다.
본 발명의 실시예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 또한, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
본 발명의 차량의 음성인식 장치는 사용자로부터 발화된 명령어를 수신하고, 수신된 명령어로부터 소정의 웨이크업 커맨드(wake-up command)가 검출된 경우, 음성인식 어플리케이션을 활성화시키고, 소정 웨이크업 커맨드가 속해있는 서비스 도메인을 활성화하여, 수신된 명령어가 해당 서비스 도메인에서 검색되도록 하여 결과값을 출력할 수 있다. 이를 위해, 발화된 명령어는 소정의 웨이크업 커맨드가 포함되도록 구성될 수 있으며, 발화된 명령어는 소정의 웨이크업 커맨드 및 동작 커맨드로 구성될 수 있다.
본 발명에 따른 음성인식 장치에 입력되는 명령어는 소정의 웨이크업 커맨드를 포함하고 있기 때문에, 종래와 같이 음성인식 어플리케이션을 활성화시키기 위한 별도의 웨이크업 명령어를 발화하고 수신하는 과정이 생략될 수 있다. 따라서, 수신된 명령어만으로 명령어에 대응하는 결과값을 출력할 수 있다. 즉, 수신된 명령어와 관련있는 서비스 도메인 내에서 검색되므로 발화된 명령어에 대응하는 결과값을 빠르고 정확하게 출력할 수 있다.
본 발명의 실시예에 따른 웨이크업 커맨드는 사용자들이 일반적으로 입력하는 명령어의 일부 소정 단어(word) 또는 소정 어구(phrase)를 기반으로 생성될 수 있다. 이처럼, 웨이크업 커맨드가 포함되도록 명령어를 생성하는 것은, 발화된 명령어에 대응하는 음성신호가 수신되는 경우, 음성신호로부터 웨이크업 커맨드가 검출되도록 하고, 음성인식 어플리케이션을 활성화시키기 위함이다.
또한, 웨이크업 커맨드는 사용자가 입력한 명령어가 단말 음성인식 명령어인지, 서버 음성인식 명령어인지 구분하도록 생성될 수 있다. 이처럼 웨이크업 커맨드가 단말 음성인식 명령어인지, 서버 음성인식 명령어인지 구분하도록 생성하는것은, 웨이크업 커맨드와 관련있는 서비스 도메인 내에서 발화된 명령어의 검색이 이루어지도록 하기 위함이다. 여기서, 단말 음성인식 명령어는 발화된 명령어에 대하여 차량단말의 정보 및 차량단말과 연결된 사용자의 개인 디바이스의 정보를 기반으로 결과값을 도출하도록 하는 명령어를 의미할 수 있고, 서버 음성인식 명령어는 발화된 명령어에 대하여 웹 서버의 정보를 기반으로 결과값을 도출하도록 하는 명령어를 의미할 수 있다. 차량단말은 본 발명의 차량의 음성인식 장치를 포함할 수 있으나, 이에 한정되는 것은 아니다.
이하에서는 편의상 단말 음성인식 명령어 내에 포함된 웨이크업 커맨드는 제1웨이크업 커맨드, 서버 음성인식 명령어 내에 포함된 웨이크업 커맨드는 제2웨이크업 커맨드라 지칭한다.
제1웨이크업 커맨드는 차량단말 및 사용자의 개인 디바이스에 저장된 정보를 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어 또는 소정 어구를 기반으로 생성될 수 있다.
실시예에 따르면 제1웨이크업 커맨드는 'FM', 'RADIO' 및 'AM'를 포함할 수 있으며, 이는 '라디오'의 서비스 도메인 내에서 검색이 이루어져 결과값을 도출하도록 할 수 있다. 또한, 제1웨이크업 커맨드는 'Call' 및 'Make a call'를 포함할 수 있으며, 이는 '전화걸기'의 서비스 도메인 내에서 검색이 이루어져 결과값을 도출하도록 할 수 있다.
또한, 제2웨이크업 커맨드는 차량단말 및 사용자의 개인 디바이스에 저장된 정보를 기반으로 도출할 수 없는 경우, 웹 서버의 정보들을 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어 또는 소정 어구를 기반으로 생성될 수 있다. 즉, 제2웨이크업 커맨드는 대용량 단어(large vocabulary)의 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어 또는 소정 어구일 수 있다.
실시예에 따르면, 제2웨이크업 커맨드는 'Find' 및 'Navigate to'를 포함할 수 있으며, 이는 'POI/주소검색'의 서비스 도메인 내에서 검색이 이루어져 결과값을 도출하도록 할 수 있다. 또한, 제2웨이크업 커맨드는 'Send'를 포함할 수 있으며, 이는 'SMS 작성'의 서비스 도메인 내에서 검색이 이루어져 결과값을 도출하도록 할 수 있다.
그리고, 제1웨이크업 커맨드와 제2웨이크업 커맨드는 미리 등록되어, 사용자로부터 발화된 명령어에 대응되는 음성신호로부터 검출될 수 있다. 보다 자세한 설명은 도 1을 참조한다. 도 1은 본 발명의 실시예에 따른 차량의 음성인식 시스템을 설명하는 도면이다.
도 1을 참조하면, 기 등록된 제1 및 제2웨이크업 커맨드가 포함되도록 구성된 초기 명령어 'FM 91.9', 'Call James', 'Find starbucks' 및 'Send message' 등이 발화되어 초기 명령어에 대한 음성신호를 수신한 경우, 음성신호로부터 제1 및 제2웨이크업 커맨드 중 어느 하나를 검출할 수 있다. 실시예에 따르면, 'FM' 및 'Call'은 제1웨이크업 커맨드에 포함될 수 있고, 'Find' 및 'Send'는 제2웨이크업 커맨드에 포함될 수 있다. 초기 명령어에 대한 음성신호를 수신하는 과정에서 제1 및 제2웨이크업 커맨드 중 어느 하나가 검출되었으므로, 음성인식 어플리케이션이 활성화될 수 있다. 초기 명령어로부터 제1 및 제2웨이크업 커맨드 중 어느 하나가 검출된 경우, 초기 명령어에 대한 결과값을 제1 및 제2웨이크업 커맨드 중 어느 하나와 관련된 서비스 도메인 내에서 검색할 수 있다.
본 발명은 종래 기술에서와 같이, 음성인식 어플리케이션을 활성화시키기 위하여 별도의 웨이크업 명령어를 입력하고, 웨이크업 명령어에 대한 음성신호가 수신되었는지 판단하여, 웨이크업 명령어에 대한 음성신호가 수신된 경우, 추가적으로 사용자에게 명령어의 입력을 요청하는 일련의 과정을 수행할 필요가 없다. 그리고, 명령어에 대한 결과값을 정해진 서비스 도메인 내에서 검색되도록 함으로써 빠르고 정확한 음성인식이 수행되도록 할 수 있다.
그러므로, 도 1에 도시된 바와 같이, 초기 명령어 'FM 91.9' 및 'Call James'가 입력되는 경우, 제1웨이크업 커맨드가 검출됨에 따라, 단말 음성인식이 수행되도록 하여, 각각 '라디오' 및 '전화걸기'의 서비스 도메인 내에서 명령어에 대응하는 결과값이 검색되도록 할 수 있다. 또한, 초기 명령어 'Find starbucks' 및 'Send message' 가 입력되는 경우, 제2웨이크업 커맨드가 검출됨에 따라, 서버 음성인식이 수행되도록 하여, 각각 'POI(point of interest)' 및 'SMS'의 서비스 도메인 내에서 명령어의 결과값이 검색되도록 할 수 있다.
도 2는 본 발명의 실시예에 따른 차량의 음성인식 장치를 나타내는 구성도이다.
도 2에 도시된 바와 같이, 본 발명의 차량의 음성인식 장치는 입력부(10), 저장부(20), 제어부(30), 출력부(40) 및 통신부(50)를 포함할 수 있다.
입력부(10)는 사용자의 음성신호를 수신할 수 있으며, 보다 자세하게는 사용자가 발화한 명령어에 대한 음성신호를 수신할 수 있다. 참고로, 입력부(10)는 사용자로부터 발화된 명령어의 음성신호를 전기적인 오디오 신호로 변환하여 제어부(30)로 전송할 수 있다. 입력부(10)는 외부의 음향신호를 입력 받는 과정에서 발생 되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘에 기초한 동작을 수행하도록 구성될 수 있다. 입력부(10)는 마이크로 폰으로 구성될 수 있다.
저장부(20)는 웨이크업 커맨드를 저장할 수 있다. 보다 자세하게는 제1웨이크업 커맨드 및 제2웨이크업 커맨드를 저장할 수 있다.
제1웨이크업 커맨드는 차량단말 및 사용자의 개인 디바이스에 저장된 정보를 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어 또는 소정 어구를 기반으로 생성될 수 있다. 또한, 제2웨이크업 커맨드는 웹 서버의 정보들을 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어 또는 소정 어구를 기반으로 생성될 수 있다. 제1웨이크업 커맨드 및 제2웨이크업 커맨드는 전문가들에 의해 연구되어 생성될 수 있으며, 차량의 출고시 기 저장되어 있을 수 있다.
또한, 저장부(20)는 제어부(30)의 처리 및 제어를 위한 프로그램을 저장할 수 있다. 저장부(20)에 저장되는 프로그램은 OS(operating system) 프로그램 및 각종 애플리케이션 프로그램을 포함할 수 있다. 각종 애플리케이션 프로그램은 본 발명에 따른 음성인식 어플리케이션을 포함할 수 있다.
참고로, 저장부(20)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류될 수 있다. 복수개의 모듈들은, 예를 들어, 이동 통신 모듈, Wi-Fi 모듈, 블루투스 모듈, DMB 모듈, 카메라 모듈, 센서 모듈, GPS 모듈, 동영상 재생 모듈, 오디오 재생 모듈, 전원 모듈, 터치 스크린 모듈, UI 모듈, 또는/및 어플리케이션 모듈을 포함할 수 있다.
저장부(20)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory), SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory),
EEPROM(Electrically Erasable Programmable Read-Only Memory),PROM(Programmable Read-Only Memory), 자기메모리, 자기 디스크, 또는 광디스크 타입의 저장매체를 포함할 수 있다.
제어부(30)는 음성인식 장치의 동작을 제어할 수 있다. 이를 위하여 입력부(10)를 통해 사용자가 입력한 명령어가 수신되면, 명령어에 포함된 웨이크업 커맨드와 동작 커맨드를 구분하여 인식할 수 있다. 제어부(30)는 저장부(20)에 기 저장된 웨이크업 커맨드를 기반으로, 수신된 명령어로부터 웨이크업 커맨드를 인식할 수 있다. 또한, 수신된 명령어로부터 웨이크업 커맨드가 인식되면, 제1웨이크업 커맨드 및 제2웨이크업 커맨드 중 어느 하나로 판단하여 검출할 수 있다.
수신된 음성신호 중 제1웨이크업 커맨드가 검출된 경우, 단말 음성인식 엔진을 구동하여 단말 음성인식이 수행되도록 하고, 수신된 음성신호 중 제2웨이크업 커맨드가 검출된 경우, 서버 음성인식 엔진을 구동하여 서버 음성인식이 수행되도록 한다.
단말 음성인식은 차량단말 및 차량단말과 연결된 개인 디바이스에 저장된 정보를 기반으로 사용자가 입력한 명령어에 대응하는 결과값이 검색되도록 하는 동작을 의미할 수 있다. 또한, 서버 음성인식은 웹 서버의 정보를 기반으로 사용자가 입력한 명령어에 대응하는 결과값이 검색되도록 하는 동작을 의미할 수 있다.
출력부(40)는 사용자가 입력한 명령어에 대응하는 결과값을 음성 또는 이미지로 출력할 수 있다. 출력부(40)는 스피커 또는 디스플레이를 포함할 수 있다. 디스프레이는 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 또는 전기영동 디스플레이(electrophoretic display, EPD)를 포함할 수 있다. 디스플레이는, 예를 들어, 터치 스크린을 포함할 수 있으나, 상술한 바로 제한하지 않는다.
통신부(50)는 차량단말과 웹 서버 간에 유선 또는 무선으로 연결되도록 한다. 통신부(50)는 차량단말의 적어도 하나의 정보를 적어도 하나의 외부 디바이스로 전송하거나 적어도 하나의 외부 디바이스로부터 전송되는 정보를 수신할 수 있다. 통신부(50)는 차량과 적어도 하나의 외부 디바이스간의 통신을 위한 하나 이상의 구성요소를 포함할 수 있다.
예를 들어, 근거리 통신기, 이동 통신기, 및 방송 수신기 중 적어도 하나를 포함할 수 있다. 근거리 통신기(short-range wireless communicator)는, 블루투스 통신 모듈, BLE(Bluetooth Low Energy)통신 모듈, 근거리 무선 통신(Near Field Communication unit, RFID) 모듈, WLAN(와이파이) 통신 모듈, 지그비(Zigbee) 통신 모듈, Ant+ 통신 모듈, WFD(Wi-Fi Direct) 통신 모듈, 비콘 통신 모듈, 또는 UWB(ultra wideband) 통신 모듈을 포함할 수 있으나 이로 제한되지 않는다. 예를 들어, 근거리 통신기는 적외선(IrDA, infrared Data Association) 통신 모듈을 포함할 수 있다.
이동 통신기는 이동 통신망 상에서 기지국, 외부 디바이스, 서버 중 적어도 하나와 무선 신호를 송수신할 수 있다. 여기에서, 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다. 방송 수신기는, 방송 채널을 통하여 외부로부터 방송 신호 및/또는 방송 관련된 정보를 수신할 수 있다. 방송 채널은 위성 채널, 지상파 채널, 및 라디오 채널 중 적어도 하나를 포함할 수 있으나 이로 제한되지 않는다.
도 3은 본 발명의 실시예에 따른 차량의 음성인식 방법의 흐름을 나타낸 도면이다.
도 3에 도시된 바와 같이, 사용자로부터 발화된 명령어를 수신한다(S100). S100 단계에서 발화된 명령어는 웨이크업 커맨드를 포함할 수 있다. 본 발명의 실시예에 따르면 사용자로부터 발화된 명령어 'FM 91.9'가 수신될 수 있다. 이어서, 수신된 명령어 내에 웨이크업 커맨드가 포함되었는지 판단한다(S110).
본 발명의 실시예에 따르면, 수신된 명령어로부터 'FM'은 웨이크업 커맨드로 검출될 수 있다. S110 단계에서 수신된 명령어로부터 제1웨이크업 커맨드가 검출된 것으로 판단될 수 있다. 따라서, 수신된 명령어에 대응하는 결과값을 도출하기 위하여 단말 음성인식만을 수행한다(S120). S120 단계에서 단말 음성인식 엔진을 구동하여 차량단말 및 사용자의 개인 디바이스에 저장된 정보를 기반으로 검색하는 동작이 수행될 수 있다.
즉, S120 단계에서는 단말 음성인식 및 서버 음성인식을 동시에 수행하는 것이 아니라, 수신된 명령어로부터 제1웨이크업 커맨드 또는 제2웨이크업 커맨드가 검출되었는지 판단하여 검출된 웨이크업 커맨드와 관련된 서비스 도메인 내에서만 음성인식만을 수행하여 음성인식률을 향상시키는 효과를 제공한다.
이후, 음성 어플리케이션은 단말 음성인식 엔진으로부터 도출된 단말 음성인식 결과값을 수신할 수 있다(S130). 그리고, 결과값을 출력한다(S140). S140 단계에서 '라디오로 전환합니다'라는 내용을 출력할 수 있다. S140 단계에서는 출력내용을 음성 또는 이미지로 출력할 수 있다.
도 4는 본 발명의 다른 실시예에 따른 차량의 음성인식 방법의 흐름을 나타낸 도면이다.
도 4에 도시된 바와 같이, 사용자로부터 발화된 명령어를 수신한다(S200). S200 단계에서 발화된 명령어는 웨이크업 커맨드를 포함할 수 있다. 본 발명의 실시예에 따르면 사용자로부터 발화된 명령어 'Find Starbucks'가 수신될 수 있다. 이어서, 사용자가 입력한 명령어 웨이크업 커맨드가 포함되었는지 판단한다(S210).
본 발명의 실시예에 따르면, 사용자가 입력한 명령어로부터 'Find'는 웨이크업 커맨드로 검출될 수 있다. S210 단계에서 발화된 명령어로부터 제2웨이크업 커맨드가 검출된 것으로 판단될 수 있다. 따라서, 발화된 명령어에 대응하는 결과값을 도출하기 위하여 서버 음성인식만을 수행한다(S220). S220 단계에서 서버 음성인식 엔진을 구동하여 웹 서버의 정보를 기반으로 검색하는 동작이 수행될 수 있다.
즉, S220 단계에서는 단말 음성인식 및 서버 음성인식을 동시에 수행하는 것이 아니라, 수신된 명령어로부터 제1웨이크업 커맨드 또는 제2웨이크업 커맨드가 검출되었는지 판단하여 검출된 웨이크업 커맨드와 관련된 서비스 도메인 내에서만 음성인식만을 수행하여 음성인식률을 향상시키는 효과를 제공한다.
이후, 음성 어플리케이션은 서버 음성인식 엔진으로부터 도출된 서버 음성인식 결과값을 수신할 수 있다(S230). 그리고, 결과값을 출력한다(S240). S240 단계에서 '목적지를 스타벅스로 설정합니다'라는 내용을 출력할 수 있다. S240 단계에서는 출력내용을 음성 또는 이미지로 출력할 수 있다.
도 5는 본 발명의 실시예에 따른 차량의 음성인식 방법을 나타낸 순서도이다.
먼저, 발화된 명령어를 수신한다(S300). 그리고, 수신된 명령어로부터 웨이크업 커맨드가 검출되었는지 확인한다(S310). 웨이크업 커맨드가 검출된 경우(Yes), 웨이크업 커맨드가 제1웨이크업 커맨드 또는 제2웨이크업 커맨드 인지 판단한다(S320,S321,S322). 웨이크업 커맨드가 검출되지 않은 경우(No), 재발화된 명령어를 수신할 수 있다.
S320 단계는 실시예에 따르면, 수신된 명령어로부터 'FM'을 웨이크업 커맨드로 검출할 수 있다. 'FM'은 제1웨이크업 커맨드로 판단될 수 있으므로, 수신된 명령어가 단말 음성인식을 수행하도록 한다(S330). 실시예에 따르면 S330 단계는 '라디오'의 서비스 도메인 내에서 수신된 명령어에 대하여 음성인식이 수행되도록 할 수 있다. 음성인식 결과값은 '라디오로 전환합니다'의 내용으로 음성 또는 이미지를 통해 출력될 수 있다(S340).
S321 단계는 실시예에 따르면, 수신된 명령어로부터 'Find'를 웨이크업 커맨드로 검출할 수 있다. 'Find'는 제2웨이크업 커맨드로 판단될 수 있으므로, 수신된 명령어가 서버 음성인식을 수행하도록 한다(S331). 실시예에 따르면 S331 단계는 'POI 검색'의 서비스 도메인 내에서 수신된 명령에 대하여 음성인식이 수행되도록 할 수 있다. 음성인식 결과값은 '목적지를 스타벅스로 설정합니다'의 내용으로 음성 또는 이미지를 통해 출력될 수 있다(S341).
S322 단계는 실시예에 따르면, 수신된 명령어로부터 'Send'를 웨이크업 커맨드로 검출할 수 있다. 'Send'는 제2웨이크업 커맨드로 판단될 수 있으므로, 수신된 명령어가 서버 음성인식을 수행하도록 한다(S332). 실시예에 따르면 S332 단계는 'SMS 작성'의 서비스 도메인 내에서 수신된 명령어에 대하여 음성인식이 수해외도록 할 수 있다. 음성인식 결과값은 'John에게 메세지를 보내겠습니다'의 내용으로 음성 또는 이미지를 통해 출력될 수 있다(S342).
도 6은 본 발명의 일 실시예에 따른 방법을 실행하는 컴퓨팅 시스템의 구성을 도시한 도면이다.
도 6을 참조하면, 컴퓨팅 시스템(1000)은 버스(1200)를 통해 연결되는 적어도 하나의 프로세서(1100), 메모리(1300), 사용자 인터페이스 입력 장치(1400), 사용자 인터페이스 출력 장치(1500), 스토리지(1600), 및 네트워크 인터페이스(1700)를 포함할 수 있다.
프로세서(1100)는 중앙 처리 장치(CPU) 또는 메모리(1300) 및/또는 스토리지(1600)에 저장된 명령어들에 대한 처리를 실행하는 반도체 장치일 수 있다. 메모리(1300) 및 스토리지(1600)는 다양한 종류의 휘발성 또는 불휘발성 저장 매체를 포함할 수 있다. 예를 들어, 메모리(1300)는 ROM(Read Only Memory) 및 RAM(Random Access Memory)을 포함할 수 있다.
따라서, 본 명세서에 개시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계는 프로세서(1100)에 의해 실행되는 하드웨어, 소프트웨어 모듈, 또는 그 2 개의 결합으로 직접 구현될 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM과 같은 저장 매체(즉, 메모리(1300) 및/또는 스토리지(1600))에 상주할 수도 있다. 예시적인 저장 매체는 프로세서(1100)에 커플링되며, 그 프로세서(1100)는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정보를 기입할 수 있다. 다른 방법으로, 저장 매체는 프로세서(1100)와 일체형일 수도 있다. 프로세서 및 저장 매체는 주문형 집적회로(ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법으로, 프로세서 및 저장 매체는 사용자 단말기 내에 개별 컴포넌트로서 상주할 수도 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.
따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
10 입력부
20 저장부
30 제어부
40 출력부
50 통신부

Claims (17)

  1. 발화된 명령어를 수신하는 입력부;
    상기 수신된 명령어가 단말 음성인식을 수행하도록 생성된 제1웨이크업 커맨드(wake-up command) 및 상기 수신된 명령어가 서버 음성인식을 수행하도록 생성된 제2웨이크업 커맨드가 저장된 저장부;
    상기 수신된 명령어로부터 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나를 검출하는지 판단하여, 상기 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하고, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 제어부; 및
    상기 단말 음성인식 결과값 및 상기 서버 음성인식 결과값 중 적어도 어느 하나를 출력하는 출력부를 포함하는 것을 특징으로 하는 차량의 음성인식 장치.
  2. 청구항 1에 있어서,
    상기 입력부는
    상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나를 포함하는 상기 명령어가 입력되는 것을 특징으로 하는 차량의 음성인식 장치.
  3. 청구항 1에 있어서,
    상기 저장부는
    차량단말 및 상기 차량단말과 연결된 사용자의 개인 디바이스에 저장된 정보를 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어(word) 및 소정 어구(phrase) 중 적어도 어느 하나를 기반으로 생성되는 상기 제1웨이크업 커맨드를 저장하는 것을 특징으로 하는 차량의 음성인식 장치.
  4. 청구항 1에 있어서,
    상기 저장부는
    웹 서버의 정보들을 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어 및 소정 어구 중 적어도 어느 하나를 기반으로 생성되는 상기 제2웨이크업 커맨드를 저장하는 것을 특징으로 하는 차량의 음성인식 장치.
  5. 청구항 1에 있어서,
    상기 제어부는
    상기 저장부에 저장된 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드를 기반으로 상기 수신된 명령어로부터 웨이크업 커맨드 및 동작 커맨드를 구분하여 인식하고, 상기 웨이크업 커맨드를 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나로 검출하는 것을 특징으로 하는 차량의 음성인식 장치.
  6. 청구항 1에 있어서,
    상기 제어부는
    차량단말 및 상기 차량단말과 연결된 개인 디바이스에 저장된 정보를 기반으로 사용자가 입력한 상기 명령어에 대응하는 결과값이 검색되도록 하는 동작을 통하여 상기 단말 음성인식을 수행하는 것을 특징으로 하는 차량의 음성인식 장치.
  7. 청구항 1에 있어서,
    상기 제어부는
    웹 서버의 정보를 기반으로 사용자가 입력한 상기 명령어에 대응하는 결과값이 검색되도록 하는 동작을 통하여 상기 서버 음성인식을 수행하는 것을 특징으로 하는 차량의 음성인식 장치.
  8. 청구항 1에 있어서,
    상기 제어부는
    상기 단말 음성인식을 수행하는 경우, 차량단말 및 상기 차량단말과 연결된 개인 디바이스 기반의 서비스 도메인 내에서 상기 수신된 명령어의 음성인식이 수행되도록 하는 것을 특징으로 하는 차량의 음성인식 장치.
  9. 청구항 1에 있어서,
    상기 제어부는
    상기 서버 음성인식을 수행하는 경우, 웹 서버 기반의 서비스 도메인 내에서 상기 수신된 명령어의 음성인식이 수행되도록 하는 것을 특징으로 하는 차량의 음성인식 장치.
  10. 발화된 명령어를 수신하는 단계;
    상기 수신된 명령어로부터 제1웨이크업 커맨드(wake-up command) 및 제2웨이크업 커맨드 중 적어도 어느 하나를 검출하는 단계;
    상기 수신된 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하고, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 단계; 및
    상기 단말 음성인식 결과값 및 상기 서버 음성인식 결과값 중 적어도 어느 하나를 출력하는 단계를 포함하는 것을 특징으로 하는 차량의 음성인식 방법.
  11. 청구항 10에 있어서,
    상기 발화된 명령어를 수신하는 단계 이전,
    차량단말 및 상기 차량단말과 연결된 사용자의 개인 디바이스에 저장된 정보를 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어(word) 및 소정 어구(phrase) 중 적어도 어느 하나를 기반으로 생성된 상기 제1웨이크업 커맨드를 저장하는 단계를 수행하는 것을 특징으로 하는 차량의 음성인식 방법.
  12. 청구항 10에 있어서,
    상기 발화된 명령어를 수신하는 단계 이전,
    웹 서버의 정보들을 기반으로 검색을 통하여 도출가능한 결과값을 획득하기 위한 명령어의 일부 소정 단어 및 소정 어구 중 적어도 어느 하나를 기반으로 생성되는 상기 제2웨이크업 커맨드를 저장하는 단계를 수행하는 것을 특징으로 하는 차량의 음성인식 방법.
  13. 청구항 10에 있어서,
    상기 발화된 명령어를 수신하는 단계는
    상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나를 포함하는 상기 명령어를 수신하는 것을 특징으로 하는 차량의 음성인식 방법.
  14. 청구항 11 또는 청구항 12에 있어서,
    상기 수신된 명령어로부터 제1웨이크업 커맨드(wake-up command) 및 제2웨이크업 커맨드 중 적어도 어느 하나를 검출하는 단계는
    상기 저장된 제1웨이크업 커맨드 및 상기 저장된 제2웨이크업 커맨드를 기반으로 상기 수신된 명령어로부터 웨이크업 커맨드 및 동작 커맨드를 구분하여 인식하는 단계; 및
    상기 웨이크업 커맨드를 상기 제1웨이크업 커맨드 및 상기 제2웨이크업 커맨드 중 적어도 어느 하나로 검출하는 단계를 포함하는 것을 특징으로 하는 차량의 음성인식 방법.
  15. 청구항 10에 있어서,
    상기 수신된 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하거나, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 단계에서,
    상기 단말 음성인식은 차량단말 및 상기 차량단말과 연결된 개인 디바이스에 저장된 정보를 기반으로 사용자가 입력한 상기 명령어에 대응하는 결과값이 검색되도록 하는 동작을 통하여 수행되고, 상기 서버 음성인식은 웹 서버의 정보를 기반으로 사용자가 입력한 상기 명령어에 대응하는 결과값이 검색되도록 하는 동작을 통하여 수행되는 것을 특징으로 하는 차량의 음성인식 방법.
  16. 청구항 10에 있어서,
    상기 수신된 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하거나, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 단계에서,
    상기 단말 음성인식을 수행하는 경우, 차량단말 및 상기 차량단말과 연결된 개인 디바이스 기반의 서비스 도메인 내에서 상기 수신된 명령어의 음성인식이 수행되도록 하는 것을 특징으로 하는 차량의 음성인식 방법.
  17. 청구항 10에 있어서,
    상기 수신된 명령어로부터 상기 제1웨이크업 커맨드가 검출된 경우, 상기 단말 음성인식을 수행하거나, 상기 명령어로부터 상기 제2웨이크업 커맨드가 검출된 경우, 상기 서버 음성인식을 수행하는 단계에서,
    상기 서버 음성인식을 수행하는 경우, 웹 서버 기반의 서비스 도메인 내에서 상기 수신된 명령어의 음성인식이 수행되도록 하는 것을 특징으로 하는 차량의 음성인식 방법.
KR1020170145545A 2017-11-02 2017-11-02 차량의 음성인식 장치 및 방법 KR102552486B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020170145545A KR102552486B1 (ko) 2017-11-02 2017-11-02 차량의 음성인식 장치 및 방법
US16/018,934 US20190130908A1 (en) 2017-11-02 2018-06-26 Speech recognition device and method for vehicle

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170145545A KR102552486B1 (ko) 2017-11-02 2017-11-02 차량의 음성인식 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20190050224A true KR20190050224A (ko) 2019-05-10
KR102552486B1 KR102552486B1 (ko) 2023-07-06

Family

ID=66243197

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170145545A KR102552486B1 (ko) 2017-11-02 2017-11-02 차량의 음성인식 장치 및 방법

Country Status (2)

Country Link
US (1) US20190130908A1 (ko)
KR (1) KR102552486B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021020624A1 (ko) * 2019-07-30 2021-02-04 미디어젠 주식회사 음성인식 서비스 선별 조정장치

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110182155B (zh) * 2019-05-14 2021-04-30 中国第一汽车股份有限公司 车载控制系统的语音控制方法、车载控制系统和车辆
CN112835377A (zh) * 2019-11-22 2021-05-25 北京宝沃汽车股份有限公司 无人机控制方法、装置、存储介质以及车辆
CN111627435A (zh) * 2020-04-30 2020-09-04 长城汽车股份有限公司 语音识别方法与系统及基于语音指令的控制方法与系统
CN113689857B (zh) 2021-08-20 2024-04-26 北京小米移动软件有限公司 语音协同唤醒方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091477A (ja) * 2000-09-14 2002-03-27 Mitsubishi Electric Corp 音声認識システム、音声認識装置、音響モデル管理サーバ、言語モデル管理サーバ、音声認識方法及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002091484A (ja) * 2000-09-14 2002-03-27 Mitsubishi Electric Corp 言語モデル生成装置及びこれを用いた音声認識装置、言語モデル生成方法及びこれを用いた音声認識方法、並びに言語モデル生成プログラムを記録したコンピュータ読み取り可能な記録媒体及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US20030065427A1 (en) * 2001-09-28 2003-04-03 Karsten Funk Method and device for interfacing a driver information system using a voice portal server
WO2007142102A1 (ja) * 2006-05-31 2007-12-13 Nec Corporation 言語モデル学習システム、言語モデル学習方法、および言語モデル学習用プログラム
KR20150004051A (ko) * 2013-07-02 2015-01-12 엘지전자 주식회사 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법
KR20150107520A (ko) * 2014-03-14 2015-09-23 주식회사 디오텍 음성인식 방법 및 장치
KR20160110085A (ko) * 2015-03-13 2016-09-21 삼성전자주식회사 음성 인식 시스템 및 방법
US20170083285A1 (en) * 2015-09-21 2017-03-23 Amazon Technologies, Inc. Device selection for providing a response
KR20170093629A (ko) * 2016-02-05 2017-08-16 삼성전자주식회사 음성인식 장치 및 방법, 음성인식시스템

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005024781A1 (en) * 2003-08-29 2005-03-17 Johnson Controls Technology Company System and method of operating a speech recognition system in a vehicle
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
US8019608B2 (en) * 2008-08-29 2011-09-13 Multimodal Technologies, Inc. Distributed speech recognition using one way communication
US9153229B2 (en) * 2011-11-21 2015-10-06 Robert Bosch Gmbh Methods and systems for adapting grammars in hybrid speech recognition engines for enhancing local SR performance
JP5821639B2 (ja) * 2012-01-05 2015-11-24 株式会社デンソー 音声認識装置
US9583100B2 (en) * 2012-09-05 2017-02-28 GM Global Technology Operations LLC Centralized speech logger analysis
WO2014055076A1 (en) * 2012-10-04 2014-04-10 Nuance Communications, Inc. Improved hybrid controller for asr
DE112013006728B4 (de) * 2013-02-25 2020-10-01 Mitsubishi Electric Corporation Spracherkennungssystem und Spracherkennungsgerät
WO2014188512A1 (ja) * 2013-05-21 2014-11-27 三菱電機株式会社 音声認識装置、認識結果表示装置および表示方法
US10008205B2 (en) * 2013-11-20 2018-06-26 General Motors Llc In-vehicle nametag choice using speech recognition
US10325592B2 (en) * 2017-02-15 2019-06-18 GM Global Technology Operations LLC Enhanced voice recognition task completion
US10902848B2 (en) * 2017-07-20 2021-01-26 Hyundai Autoever America, Llc. Method for providing telematics service using voice recognition and telematics server using the same

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002091477A (ja) * 2000-09-14 2002-03-27 Mitsubishi Electric Corp 音声認識システム、音声認識装置、音響モデル管理サーバ、言語モデル管理サーバ、音声認識方法及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002091484A (ja) * 2000-09-14 2002-03-27 Mitsubishi Electric Corp 言語モデル生成装置及びこれを用いた音声認識装置、言語モデル生成方法及びこれを用いた音声認識方法、並びに言語モデル生成プログラムを記録したコンピュータ読み取り可能な記録媒体及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US20030065427A1 (en) * 2001-09-28 2003-04-03 Karsten Funk Method and device for interfacing a driver information system using a voice portal server
WO2007142102A1 (ja) * 2006-05-31 2007-12-13 Nec Corporation 言語モデル学習システム、言語モデル学習方法、および言語モデル学習用プログラム
KR20150004051A (ko) * 2013-07-02 2015-01-12 엘지전자 주식회사 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법
KR20150107520A (ko) * 2014-03-14 2015-09-23 주식회사 디오텍 음성인식 방법 및 장치
KR20160110085A (ko) * 2015-03-13 2016-09-21 삼성전자주식회사 음성 인식 시스템 및 방법
US20170083285A1 (en) * 2015-09-21 2017-03-23 Amazon Technologies, Inc. Device selection for providing a response
KR20170093629A (ko) * 2016-02-05 2017-08-16 삼성전자주식회사 음성인식 장치 및 방법, 음성인식시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021020624A1 (ko) * 2019-07-30 2021-02-04 미디어젠 주식회사 음성인식 서비스 선별 조정장치

Also Published As

Publication number Publication date
KR102552486B1 (ko) 2023-07-06
US20190130908A1 (en) 2019-05-02

Similar Documents

Publication Publication Date Title
KR102552486B1 (ko) 차량의 음성인식 장치 및 방법
US10522146B1 (en) Systems and methods for recognizing and performing voice commands during advertisement
US20240096345A1 (en) Electronic device providing response to voice input, and method and computer readable medium thereof
US9911416B2 (en) Controlling electronic device based on direction of speech
US9564132B2 (en) Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
US10699718B2 (en) Speech recognition system and speech recognition method thereof
CN106663430B (zh) 使用用户指定关键词的说话者不相依关键词模型的关键词检测
US9105267B2 (en) Speech recognition apparatus
US7822613B2 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
CN103295572B (zh) 一种语音识别方法及具有语音识别的车载多媒体导航仪系统
US9305545B2 (en) Speech recognition vocabulary integration for classifying words to identify vocabulary application group
US20140337031A1 (en) Method and apparatus for detecting a target keyword
US9601107B2 (en) Speech recognition system, recognition dictionary registration system, and acoustic model identifier series generation apparatus
US20160217783A1 (en) Speech recognition processing device, speech recognition processing method and display device
US20140129223A1 (en) Method and apparatus for voice recognition
CN111670471A (zh) 基于对在线语音命令的使用来学习离线语音命令
US10008205B2 (en) In-vehicle nametag choice using speech recognition
US11908467B1 (en) Dynamic voice search transitioning
US12014730B2 (en) Voice processing method, electronic device, and storage medium
KR20190049260A (ko) 차량의 음성인식 장치 및 방법
US20180144740A1 (en) Methods and systems for locating the end of the keyword in voice sensing
US20180052658A1 (en) Information processing device and information processing method
US9191490B2 (en) Electronic system and controlling method thereof
KR20200040562A (ko) 사용자 발화를 처리하기 위한 시스템
KR20110025510A (ko) 전자 기기 및 이를 이용한 음성인식 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant