KR101724748B1 - Speech recognition apparatus for vehicle - Google Patents

Speech recognition apparatus for vehicle Download PDF

Info

Publication number
KR101724748B1
KR101724748B1 KR1020110129412A KR20110129412A KR101724748B1 KR 101724748 B1 KR101724748 B1 KR 101724748B1 KR 1020110129412 A KR1020110129412 A KR 1020110129412A KR 20110129412 A KR20110129412 A KR 20110129412A KR 101724748 B1 KR101724748 B1 KR 101724748B1
Authority
KR
South Korea
Prior art keywords
engine
voice
user
command
capacity
Prior art date
Application number
KR1020110129412A
Other languages
Korean (ko)
Other versions
KR20130063091A (en
Inventor
석동희
임규형
신완재
Original Assignee
현대자동차주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사 filed Critical 현대자동차주식회사
Priority to KR1020110129412A priority Critical patent/KR101724748B1/en
Publication of KR20130063091A publication Critical patent/KR20130063091A/en
Application granted granted Critical
Publication of KR101724748B1 publication Critical patent/KR101724748B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems

Abstract

본 발명은 기존의 단일 음성엔진 대신에 2개의 듀얼 음성엔진을 적용하여 소용량의 음성엔진을 PTT 버튼 대용 및 단순 검색을 위해 사용하고, 대용량으로 이루어진 음성엔진을 대용량의 어휘 검색이 필요한 경우에만 활성화시킴으로써, 효율적인 리소스 관리를 할 수 있고, PTT 버튼을 제거할 수 있고 운전자의 시선 분산을 방지할 수 있는 차량용 음성인식 장치를 제공하는데 그 목적이 있다.
또한, 본 발명은 사용자가 음성을 발화 후 음성이 잘못 발화된 경우 대용량 엔진의 음성인식 도중 음성인식 과정을 정지 및 리셋시킴으로써, 대기시간 없이 사용자의 재발화를 유도할 수 있는 차량용 음성인식 장치를 제공하는데 그 목적이 있다.
상기한 목적을 달성하기 위해 본 발명에 따른 차량용 음성인식 장치는 사용자로부터 발화된 소용량 어휘의 음성을 인식하는 제1엔진; 및 사용자로부터 발화된 소용량 어휘에서 대용량 어휘의 음성을 인식할 수 있는 제2엔진;을 포함하고, 상기 제1엔진과 제2엔진은 선택적으로 사용됨으로써, 효율적인 리소스 관리가 이루어질 수 있도록 된 것을 특징으로 한다.
In the present invention, two dual-voice engines are applied instead of a conventional single voice engine, a small-capacity voice engine is used for substituting PTT buttons and simple searches, and a large-capacity speech engine is activated only when a large- An object of the present invention is to provide a voice recognition apparatus for a vehicle that can efficiently manage resources and can eliminate a PTT button and prevent a driver from diverging attention.
In addition, the present invention provides a vehicle voice recognition device capable of inducing a user's recurrence without waiting time by stopping and resetting the voice recognition process during voice recognition of a large-capacity engine when a voice is erroneously generated after a user uttered voice It has its purpose.
According to an aspect of the present invention, there is provided a voice recognition apparatus for a vehicle, comprising: a first engine that recognizes a voice of a small capacity vocabulary uttered by a user; And a second engine capable of recognizing a voice of a large capacity vocabulary in a small capacity vocabulary uttered by a user, wherein the first engine and the second engine are selectively used, whereby efficient resource management can be performed do.

Description

차량용 음성인식 장치{Speech recognition apparatus for vehicle}[0001] Speech recognition apparatus for vehicle [0002]

본 발명은 차량용 음성인식 장치에 관한 것으로서, 더욱 상세하게는 운전자의 음성명령만으로 차량 내 각종 편의장치를 구동할 수 있는 차량용 음성인식 장치에 관한 것이다.
BACKGROUND OF THE INVENTION 1. Field of the Invention [0002] The present invention relates to a voice recognition apparatus for a vehicle, and more particularly to a voice recognition apparatus for a vehicle capable of driving various convenience devices in a vehicle by voice commands of a driver.

음성인식이란 음성에 포함된 음향학적 정보로부터 음운 즉, 언어적 정보를 추출하여 이를 기계가 인지하고 반응하게 만드는 일련의 과정이다. Speech recognition is a series of processes that extracts phonological or linguistic information from acoustical information included in speech and makes the machine recognize and respond to it.

음성으로 대화하는 것은 수많은 인간과 기계의 정보 교환 매체 중 가장 자연스럽고 간편한 방법으로 인식되어지고 있지만 기계와 음성으로 대화하기 위해서는 인간의 음성을 기계가 처리할 수 있는 코드로 변환을 해줘야 하는 제약이 따르게 된다. 이런 코드로 변환해주는 과정이 바로 음성 인식이다.Speech conversation is recognized as the most natural and easy way to communicate among many human and machine information. However, in order to communicate with machine and voice, there is a restriction to convert the human voice into a code that can process the machine. do. Speech recognition is the process of converting these codes.

최근에는 발전한 음성인식기술을 자동차에 적용하여 간단한 편의 장치, 예를 들면 윈도우의 승강, 와이퍼의 작동 및 정지, 에어컨의 작동, 전조등의 점등 및 소등 등을 운전자의 음성명령만으로 구동할 수 있도록 하고 있다.In recent years, the developed speech recognition technology has been applied to automobiles so that simple convenience devices such as window lift, wiper operation and stop, air conditioner operation, headlight illumination, and the like can be driven only by voice commands of the driver .

종래 차량의 음성인식방법을 설명하면 다음과 같다.A speech recognition method of a conventional vehicle will now be described.

운전자가 음성으로 기구의 작동을 명령하면 마이크로 폰을 통해 운전자의 음성을 입력하는 단계와, 필터링 및 A/D 변환을 통해 아날로그 신호를 디지털 신호로 전처리하는 단계와, 특징벡터 추출 및 음성패턴 분류를 통해 음성명령을 인식하는 단계와, 인식된 음성 명령에 따라 제어대상이 되는 장치를 구동하는 단계로 이루어진다.A step of inputting a voice of a driver through a microphone when the driver commands operation of the device by voice; a step of preprocessing an analog signal into a digital signal through filtering and A / D conversion; Recognizing a voice command through the voice command, and driving the device to be controlled according to the recognized voice command.

현재의 음성인식은 한 개의 음성엔진을 사용하여 소용량 어휘부터 대용량 어휘까지 인식할 수 있도록 되어 있고, PTT(Push-to-Talk) 버튼을 누를 때에만 음성인식을 활성화할 수 있도록 되어 있다.The current speech recognition is capable of recognizing a small capacity vocabulary from a small capacity vocabulary using a single speech engine, and enables voice recognition only when a push-to-talk (PTT) button is pressed.

그러나, 한 개의 음성엔진을 이용하여 음성인식을 하고, PTT 버튼을 이용하여 활성화하는 경우에 다음과 같은 문제점이 있다.However, when voice recognition is performed using one speech engine and activation is performed using the PTT button, the following problem arises.

첫째로, 사용자가 발화 후 잘못 발화됨을 인식하여 이미 발화된 말을 즉시 취소하고 싶을 때, 한 개의 음성엔진만을 사용하면 이미 발화된 말, 예를 들면 어떤 검색어을 검색하라고 지시한 경우 그 검색어에 대한 검색을 취소할 수 없으므로, 이 검색을 마칠 때까지 기다려야 하는 문제점이 있다. First, when a user recognizes that a user has misstated after utterance and desires to immediately cancel uttered utterances immediately, if only one utterance is instructed to instruct a uttered utterance, for example, a certain utterance, It is necessary to wait until the search is completed.

둘째로, 상기 음성엔진은 소용량 어휘에서 대용량 어휘까지 인식하기 위해 프로세스상에서 대용량을 차지하고, PTT 버튼을 제거한 상태에서 음성인식을 할 경우에 상기 대용량으로 이루어진 음성엔진을 항시 활성화된 상태로 사용하여야 하기 때문에, 리소스 관리 측면에서 매우 비효율적인 문제점이 있다.Second, the speech engine occupies a large capacity in the process to recognize small-capacity vocabulary to large-capacity vocabulary. When speech recognition is performed in a state where the PTT button is removed, the speech engine of large capacity must be always used in an activated state , There is a very inefficient problem in terms of resource management.

예를 들어, 음성엔진이 프로세스상에서 차지하는 용량을 100으로 봤을 때, 음성엔진의 활성화 시 항상 100이라는 리소스를 차지하게 되어 매우 비효율적이다.For example, when the speech engine has a capacity of 100 in the process, it is very inefficient because it always occupies 100 resources when activating the speech engine.

세째로, 음성인식을 이용하기 위해 PTT를 버튼을 눌러서 음성엔진을 활성화하여야 하기 때문에, PTT 버튼 누르기 위해 운전자의 시선이 분산되는 문제점이 있다.
Third, since the voice engine must be activated by pressing the PTT button in order to utilize the voice recognition, there is a problem that the driver's line of sight is dispersed for pressing the PTT button.

본 발명은 상기와 같은 문제점을 해결하기 위해 발명한 것으로서, 음성 명령을 수행하기 위한 음성엔진으로 두 개의 엔진(듀얼 엔진)을 적용하여, 사용자가 음성명령을 발화 후 명령어가 잘못 발화됨을 인식한 경우에 명령어를 실행하는 동안에도 새로운 명령어를 인식할 수 있도록 함으로써, 잘못된 음성 명령에 대한 사용자의 명령 대기시간을 단축할 수 있는 차량용 음성인식 장치를 제공하는데 그 목적이 있다.SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems, and it is an object of the present invention to provide a voice engine for performing a voice command by applying two engines (dual engine) The present invention provides a voice recognition apparatus for a vehicle that can recognize a new command even while executing a command on a voice command, thereby shortening a user's command waiting time for an incorrect voice command.

또한, 본 발명은 기존의 단일 음성 엔진에서 엔진 활성화 기능 및 단순 검색 기능을 가진 소용량의 엔진을 추가로 적용함으로써, 대용량으로 이루어진 음성엔진을 필요한 경우에만 선택적으로 활성화하여, 효율적인 리소스 관리를 할 수 있고, PTT 버튼을 제거하여 운전자의 시선 분산을 방지할 수 있는 차량용 음성인식 장치를 제공하는데 그 목적이 있다.
Further, according to the present invention, by applying a small-capacity engine having an engine activation function and a simple search function in an existing single speech engine, a speech engine having a large capacity can be selectively activated only when necessary, And a voice recognition device for a vehicle that can eliminate a PTT button and prevent a driver from diverging his or her gaze.

상기한 목적을 달성하기 위해 본 발명에 따른 차량용 음성인식 장치는 사용자의 음성명령을 인식하기 위해 활성화 상태로 대기하고 있는 제1엔진; 및According to an aspect of the present invention, there is provided a voice recognition apparatus for a vehicle, including: a first engine that is in an activated state to recognize a voice command of a user; And

상기 제1엔진으로부터 제어신호를 받아 제어되며, 필요에 따라 선택적으로 활성화 되어 사용자의 음성명령을 인식하는 제2엔진;A second engine that is controlled by receiving a control signal from the first engine and selectively activated as needed to recognize a voice command of the user;

으로 구성되고, 상기 제2엔진은 제1엔진에 의해 음성 인식 중에도 실행중인 음성인식을 중단하고, 새로운 음성명령을 인식할 수 있도록 된 것을 특징으로 한다.
Wherein the second engine stops the speech recognition being executed even during speech recognition by the first engine and recognizes a new speech command.

본 발명에 따른 차량용 음성인식장치 및 방법의 장점을 설명하면 다음과 같다.Advantages of the vehicle voice recognition apparatus and method according to the present invention will be described as follows.

첫째로, 항상 활성화되어 있는 음성엔진과 필요한 경우에만 활성화되어 있는 음성엔진으로 이루어지는 듀얼 엔진을 통해 명령어 실행 중에도 취소가 가능하고 새로운 명령 또는 수정된 명령을 재인식가능하여 운전자가 실수로 잘못된 명령을 지시한 후 즉시 수정된 명령으로 변경가능하여 잘못된 명령을 수정하는데 대기시간을 최소화할 수 있는 장점이 있다. First, it can be canceled while executing a command through a dual engine composed of a speech engine that is always active and a speech engine that is activated only when necessary, and a new command or a modified command can be recognized again, It is possible to change to a command that is immediately modified, thereby minimizing the waiting time for correcting an erroneous command.

둘째로, 평상시에는 소용량의 메모리를 차지하는 제1엔진을 항상 활성화시키고, 대용량의 메모리를 차지하는 나머지 제2엔진은 필요한 경우에만 활성화시킴으로써, 리소스 관리를 효율적으로 할 수 있다.Second, resource management can be efficiently performed by always activating the first engine occupying a small capacity memory at normal times and activating the remaining second engine occupying a large capacity memory only when necessary.

셋째로, 소용량의 메모리를 차지하는 제1엔진에 제2엔진을 활성화시키는 기능과 단순 검색을 할 수 있는 기능을 추가로 적용함으로써, 별도의 PTT 버튼을 누를 필요가 없기 때문에 운전시 기존에 PTT 버튼을 누르기 위한 운전자의 시선 분산을 방지할 수 있다.Third, it is not necessary to press the PTT button separately by applying the function of activating the second engine to the first engine occupying a small amount of memory and the function of performing the simple search, so that the PTT button It is possible to prevent the sight line dispersion of the driver for pressing.

넷째로, 소용량 음성 엔진을 이용하여 인터럽트(interrupt; 어떤 장치가 다른 장치의 일을 잠시 중단시키고 자신의 상태 변화를 알려 줌)를 발생시키기 때문에 시스템에 무리가 적게 가는 장점이 있다.
Fourth, there is an advantage of using a small capacity speech engine to interrupt the system because it generates an interrupt (a device temporarily stops the operation of another device and informs its state change).

도 1은 본 발명의 일실시예에 따른 음성인식방법의 예를 보여주는 블록도
도 2는 본 발명의 다른 실시예에 따른 음성인식방법의 예를 보여주는 블록도
도 3은 본 발명의 또 다른 실시예에 따른 음성인식방법의 예를 보여주는 블록도
1 is a block diagram showing an example of a speech recognition method according to an embodiment of the present invention;
2 is a block diagram showing an example of a speech recognition method according to another embodiment of the present invention
3 is a block diagram showing an example of a speech recognition method according to another embodiment of the present invention

이하, 첨부도면을 참조하여 본 발명의 바람직한 실시예를 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세하게 설명하면 다음과 같다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention.

첨부한 도 1은 본 발명의 일실시예에 따른 음성인식방법의 예를 보여주는 블록도이고, 도 2는 본 발명의 다른 실시예에 따른 음성인식방법의 예를 보여주는 블록도이고, 도 3은 본 발명의 또 다른 실시예에 따른 음성인식방법의 예를 보여주는 블록도이다.1 is a block diagram illustrating an example of a speech recognition method according to an embodiment of the present invention. FIG. 2 is a block diagram illustrating an example of a speech recognition method according to another embodiment of the present invention. FIG. 8 is a block diagram illustrating an example of a speech recognition method according to another embodiment of the present invention. FIG.

본 발명은 듀얼 엔진을 통해 음성 인식 중에도 또 다른 음성명령을 인식하여 사용자가 잘못된 명령을 한 경우 즉시 수정할 수 있는 차량용 음성인식 장치에 관한 것이다.The present invention relates to a voice recognition apparatus for a vehicle, which recognizes another voice command even during speech recognition through a dual engine and can promptly correct a wrong command.

본 발명에 따른 차량용 음성인식 장치는 듀얼 음성엔진(이하, 엔진으로 약칭함), 즉 항시 활성화되어 있는 제1엔진(10)과 필요시에만 활성화되는 제2엔진(11)으로 구성된다.The speech recognition apparatus for a vehicle according to the present invention comprises a dual speech engine (hereinafter abbreviated as an engine), that is, a first engine 10 always activated and a second engine 11 activated only when necessary.

제1엔진(10)은 항상 활성화되어 음성인식 장치에 전원이 인가되는 한 운전자 또는 승객으로부터 발화되는 음성명령을 항상 인식할 수 있도록 대기 상태에 있다.The first engine 10 is always in a standby state so that it can always recognize a voice command which is activated by the driver or the passenger as long as the power is applied to the voice recognition apparatus.

대신에 제1엔진(10)은 항상 활성화 상태에서도 시스템에 무리를 주지 않을 정도로 매우 작은 메모리 용량을 차지하고, 제1엔진(10)을 구동하기 위한 전력 소비량도 매우 작다.Instead, the first engine 10 always occupies a very small memory capacity so as not to overload the system even in the active state, and the power consumption for driving the first engine 10 is also very small.

따라서 제1엔진(10)은 필요에 따라 제2엔진(11)을 활성화하거나 단순한 단어를 검색 및 제한된 단어만을 인식할 수 있도록 되어 있다.Therefore, the first engine 10 can activate the second engine 11 or search for a simple word and recognize only limited words if necessary.

예를 들면 제2엔진(11)이 단어 검색을 실행하고 있는 중 수정된 단어 검색을 지시해야할 경우에 제1엔진(10)은 사용자로부터 취소명령을 대기하고 있다가 취소명령을 받는 즉시 기존의 단어검색을 하는 제2엔진(11)의 실행을 중지 및 리셋시키고 재활성화시킬 수 있다.For example, when the second engine 11 is instructed to search for a modified word while executing a word search, the first engine 10 waits for a cancel command from the user, The execution of the second engine 11 that performs the search can be stopped, reset, and reactivated.

그리고, 사용자의 음성명령은 먼저 제1엔진(10)에게 항시 내려지며, 제1엔진(10)은 음성명령을 인식하되, 자신이 직접 하기 어려운 음성명령은 제2엔진(11)을 실행시켜 제2엔진(11)으로 하여금 대신 명령을 수행하게 한다.The voice command of the user is always output to the first engine 10. The voice command of the first engine 10 is recognized by the first engine 10, 2 engine 11 to execute the command instead.

상기 제2엔진(11)은 음성명령을 인식하여 수행하던 기존의 한 개의 엔진과 동일한 기능을 하기 때문에 상세한 설명은 생략하기로 한다.Since the second engine 11 has the same function as the existing one engine that recognizes and executes the voice command, a detailed description will be omitted.

여기서, 본 발명은 기존의 음성엔진과 동일하게 기능하는 제2엔진(11)에 제1엔진(10)을 추가로 구성한 것이다.Here, the present invention further comprises a first engine 10 in a second engine 11 functioning in the same manner as a conventional speech engine.

제1엔진(10) 자신은 항시 활성화상태에 있으면서 사용자로부터 발화된 음성명령을 인식함과 동시에 필요에 따라 제2엔진(11)을 자동으로 활성화시킴으로써, PTT 버튼을 수동조작하여 음성엔진을 활성화시키는 종래기술에 비해 업그레이드 된 것이다.The first engine 10 itself recognizes the voice command which is always active while being activated by the user and at the same time automatically activates the second engine 11 as necessary so that the PTT button is manually operated to activate the voice engine And has been upgraded in comparison with the prior art.

또한, 제1엔진(10)은 사용자의 음성명령을 항시 대기함으로써, 제2엔진(11)이 음성명령을 수행하고 있는 중에도 언제든지 제2엔진(11)의 실행을 중단, 리셋 및 제어할 수 있는 기능을 가짐으로써, 운전자 등이 음성명령 발화 후 수정된 명령을 즉시 재발화하여 기존 명령을 번복할 수 있는 기회를 제공할 수 있다.In addition, the first engine 10 is capable of stopping, resetting, and controlling the execution of the second engine 11 at any time even while the second engine 11 is executing a voice command, by always waiting for the voice command of the user The present invention can provide an opportunity for the driver or the like to instantaneously rewrite the corrected command after the speech command is spoken to override the existing command.

다시 말해서, 제2엔진(11)은 제1엔진(10)에 의해 제어됨에 따라, 사용자의 명령어에 대한 중복 인식이 가능하다.In other words, as the second engine 11 is controlled by the first engine 10, it is possible to recognize redundantly the user's command.

본 발명의 일실시예에 따른 제1엔진(10)은 소용량 어휘, 예를 들면 제한된 단어 또는 제2엔진(11)을 활성화시키기 위한 사용자의 음성명령을 인식하고, 작은 프로세스를 필요로 하는 소용량을 차지하는 엔진이다.The first engine 10 according to an embodiment of the present invention recognizes a voice command of a user for activating a small capacity vocabulary such as a limited word or the second engine 11 and outputs a small capacity requiring a small process It is the engine that occupies.

상기 제1엔진(10)이 검색할 수 있는 단어 수는 몇십~몇백 개 정도이기 때문에 제1엔진(10)의 검색가능범위를 벗어나면 제1엔진(10)은 바로 제2엔진(11)에게 활성화 신호를 보내어 제2엔진(11)을 활성화시킬 수 있다.The number of words that can be searched by the first engine 10 is in the range of several tens to several hundreds. Therefore, when the first engine 10 is out of the searchable range of the first engine 10, It is possible to activate the second engine 11 by sending an activation signal.

제2엔진(11)은 수백~수만 개의 대용량 어휘까지 모두 인식가능하고, 필요시 제1엔진(10)으로부터 제1엔진(10)으로부터 활성화신호를 입력받아 대용량의 메모리에 저장된 명령어에 따라 음성명령을 실행할 수 있다.The second engine 11 is capable of recognizing from hundreds to tens of thousands of large capacity vocabularies. If necessary, the second engine 11 receives an activation signal from the first engine 10 from the first engine 10, .

다시 말해서, 제2엔진(11)은 평상시에는 슬립(Sleep) 상태를 유지하다가 제1엔진(10)에서 발생하는 활성화 신호에 의해 활성화 상태가 된다.In other words, the second engine 11 maintains the sleep state at normal times and is activated by the activation signal generated by the first engine 10. [

여기서, 소용량 어휘란 한 단어 등 간단한 단어로 명령을 수행가능한 어휘를 말하고, 대용량 어휘는 한 단어 등 간단한 단어로 명령을 수행하기 어려운 어휘를 말한다.Here, a small-capacity vocabulary refers to a vocabulary capable of executing an instruction with a simple word such as a single word, and a large-capacity vocabulary refers to a vocabulary difficult to execute a command with a simple word such as a single word.

또한, 상기와 같이 제1엔진(10)의 메모리에 저장된 단어 수에 한정됨을 의미한다.Further, it means that the number of words is limited to the number of words stored in the memory of the first engine 10 as described above.

즉, 소용량 어휘는 사용자가 한 단계로 음성 명령을 수행할 수 있는 경우에 해당하고, 대용량 어휘는 사용자가 여러 단계에 걸쳐 음성 명령을 수행하는 경우에 해당한다.That is, a small capacity vocabulary corresponds to a case where a user can perform a voice command in one step, and a large capacity vocabulary corresponds to a case where a user performs a voice command over several stages.

이하, 본 발명에 따른 차량용 음성인식방법을 설명하기로 한다.Hereinafter, a vehicle speech recognition method according to the present invention will be described.

도 1의 일 실시예에 따라 사용자가 차량 오디오시스템의 소리를 줄이기 위해 "소리 줄여"라고 음성 명령(발화)을 하면 소용량으로 이루어진 제1엔진(10)에서 해당 음성명령을 입력받아 오디오 시스템의 소리를 줄이는 액션을 취한다.According to the embodiment of FIG. 1, when the user makes a voice command (utterance) saying "reduce the sound" to reduce the sound of the vehicle audio system, the first engine 10 of small capacity receives the voice command, . ≪ / RTI >

다른 실시예에 따라 운전 중 갑자기 전화가 걸려오는 경우에, 사용자는 "전화받어" 또는 "여보세요"라고 발화하면 제1엔진(10)이 이를 인식하고 사용자의 휴대폰에 신호를 보내어 음성통화가 가능하도록 한다.According to another embodiment, when the user suddenly calls a phone call while driving, the first engine 10 recognizes it as "received" or "Hello" .

여기서, "소리 줄여" 및 "전화받어" 또는 "여보세요"는 한 단어만으로 명령을 수행할 수 있기 때문에, 제1엔진(10)은 제2엔진(11)을 활성화하지 않고 자체적으로 명령을 수행하며, 제2엔진(11)은 슬립상태를 유지할 수 있다.Here, the first engine 10 does not activate the second engine 11 and executes the command itself because it can perform the command with only one word of "reduce sound" and "receive a call" or " And the second engine 11 can maintain the slip state.

또 다른 실시예에 따라, 도 2에 도시한 바와 같이 사용자가 길을 찾기 위해 "네비게이션"이라고 음성 명령(발화)을 하면, 제1엔진(10)은 "네비게이션"이란 단어를 여러 단계에 걸쳐 명령을 수행할 수 있는 단어로 인식하기 때문에, 제2엔진(11)을 활성화시킨다.According to another embodiment, as shown in Fig. 2, when the user makes a voice command (speech) as "navigation" to find a route, the first engine 10 transmits the word "navigation" , The second engine 11 is activated.

그 다음, 운전자가 "우리집" 또는 "서울시 강남구 신사동"을 발화하면, 활성화된 제2엔진(11)이 네비게이션과 관련된 음성인식을 진행하여 네비게이션을 통해 길 안내를 진행한다.Then, when the driver speaks "my house" or "Shinseam-dong, Gangnam-gu, Seoul", the activated second engine 11 carries out voice recognition related to navigation and guides navigation through navigation.

제2엔진(11)의 음성인식이 완료되면 초기상태(슬립상태)로 복귀하여 제1엔진(10)만 활성화 상태로 된다.When the voice recognition of the second engine 11 is completed, the initial state (sleep state) is restored and only the first engine 10 is activated.

여기서, "소리 줄여" 등의 경우에는 사용자가 제어대상 장치에 음성으로 명령하는 것이 일회성으로 끝나지만, "네비게이션"은 음성 명령이 일회성으로 끝나지 않고 사용자가 목적지를 설정하고 경로(최적, 최단)를 선택하거나 경유지 추가 등 길안내를 위해 다양한 단어(음성)들을 사용하게 되기 때문에, 소용량의 제1엔진(10)이 네비게이션을 호출어(특정 ID 값)로 인식하여 대용량의 제2엔진(11)을 활성화시키고, 대용량의 어휘를 인식할 수 있는 제2엔진(11)이 네비게이션과 관련된 음성인식을 진행하게 되는 것이다.Here, in the case of "sound reduction" or the like, the voice command of the user to the control target device ends at one time. However, "navigation " does not end the voice command one time and the user sets the destination and selects the route A small capacity of the first engine 10 recognizes the navigation as a caller ID (specific ID value) and activates the second engine 11 of a large capacity And the second engine 11 capable of recognizing a large-capacity vocabulary will proceed with voice recognition related to navigation.

또 다른 실시예에 따라, 도 3에 도시한 바와 같이 사용자가 "쏘나타"를 찾고 싶은데, 실수로 "쏘타나"라고 발화한 경우에 그 순간 실수함을 느끼고 "취소"라고 말할 수 있다.According to another embodiment, as shown in Fig. 3, when a user wants to find a "sonata ", and mistakenly spoken as " sonata ", he feels a mistake at that moment and can say" cancel ".

제2엔진(11)은 사용자로부터 발화된 명령어를 따라 "쏘타나"를 찾는 중에도 제1엔진(10)이 사용자로부터 "취소"명령을 대기하고 있다가 취소명령을 받는 즉시 제2엔진(11)의 명령어 실행을 중지한 후 리셋시킨다.The second engine 11 can be operated by the second engine 11 immediately after the first engine 10 waits for a cancel command from the user and receives a cancel command even while searching for a " And then resets the command.

이어서, 사용자는 다시 "쏘나타"라고 정확하게 발화하면 제2엔진(11)이 제1엔진(10)으로부터 재활성화 신호를 입력받아 "쏘나타"를 검색하여 사용자가 원하는 "쏘나타"에 대한 검색결과(정보)를 표시하여 제공하게 된다.Then, when the user correctly pronounces "Sonata" again, the second engine 11 receives the reactivation signal from the first engine 10, searches for "Sonata", and obtains a search result (information ) Are displayed and provided.

따라서, 본 발명에 의하면 첫째로, 항상 활성화되어 있는 음성엔진과 필요한 경우에만 활성화되어 있는 음성엔진으로 이루어지는 듀얼 엔진을 통해 명령어 실행 중에도 취소가 가능하고 새로운 명령 또는 수정된 명령을 재인식가능하여 운전자가 실수로 잘못된 명령을 지시한 후 즉시 수정된 명령으로 변경가능하여 잘못된 명령을 수정하는데 대기시간을 최소화할 수 있는 장점이 있다. Therefore, according to the present invention, first, the dual engine including the always-activated speech engine and the speech engine activated only when necessary can cancel the command while the command is being executed and can recognize the new command or the corrected command, It is possible to change the command immediately after the instruction is erroneously changed, thereby minimizing the waiting time for correcting the erroneous command.

둘째로, 평상시에는 소용량의 메모리를 차지하는 제1엔진(10)을 항상 활성화시키고, 대용량의 메모리를 차지하는 나머지 제2엔진(11)은 필요한 경우에만 활성화시킴으로써, 리소스 관리를 효율적으로 할 수 있다.Secondly, the first engine 10 which always occupies a small capacity memory is always activated, and the remaining second engine 11 which occupies a large capacity memory is activated only when necessary, so that resource management can be efficiently performed.

셋째로, 소용량의 메모리를 차지하는 제1엔진(10)에 제2엔진(11)을 활성화시키는 기능과 단순 검색을 할 수 있는 기능을 추가로 적용함으로써, 별도의 PTT 버튼을 누를 필요가 없기 때문에 운전시 기존에 PTT 버튼을 누르기 위한 운전자의 시선 분산을 방지할 수 있다.Third, since the function of activating the second engine 11 and the function of performing simple search can be additionally applied to the first engine 10 occupying a small capacity memory, it is not necessary to press the PTT button separately, It is possible to prevent the divergence of the driver's gaze for pressing the PTT button.

넷째로, 소용량 음성 엔진을 이용하여 인터럽트(interrupt; 어떤 장치가 다른 장치의 일을 잠시 중단시키고 자신의 상태 변화를 알려 줌)를 발생시키기 때문에 시스템에 무리가 적게 가는 장점이 있다.
Fourth, there is an advantage of using a small capacity speech engine to interrupt the system because it generates an interrupt (a device temporarily stops the operation of another device and informs its state change).

10 : 제1엔진 11 : 제2엔진10: first engine 11: second engine

Claims (3)

차량용 음성인식 장치에 있어서,
사용자의 음성명령을 인식하기 위해 활성화 상태로 대기하고 있는 제1엔진(10);
상기 제1엔진(10)으로부터 제어신호를 받아 제어되며, 필요에 따라 선택적으로 활성화되어 사용자의 음성명령을 인식하는 제2엔진(11);
으로 구성되고,
상기 제1엔진(10)이 대기 중 사용자의 취소 명령을 음성인식한 경우 제2엔진(11)에 실행 중인 음성인식을 중단하도록 요청하며,
상기 제2엔진(11)은 음성인식 중에도 상기 제1엔진(10)의 중단 요청에 따라 실행 중인 음성인식을 중단한 후 새로운 음성명령을 인식할 수 있도록 된 것을 특징으로 하는 차량용 음성인식 장치.
In a voice recognition device for a vehicle,
A first engine (10) waiting in an activated state to recognize a voice command of a user;
A second engine (11) controlled by receiving a control signal from the first engine (10) and selectively activated as needed to recognize a voice command of the user;
Lt; / RTI >
When the first engine 10 recognizes the cancel command of the waiting user, it requests the second engine 11 to stop the speech recognition being executed,
Wherein the second engine (11) is able to recognize a new voice command after stopping the speech recognition being executed according to a stop request of the first engine (10) even during voice recognition.
청구항 1에 있어서,
상기 제1엔진(10)은 소용량의 메모리에 제한된 단어수를 저장하고, 사용자의 음성명령에 의해 제2엔진(11)을 자동으로 활성화시키는 것을 특징으로 하는 차량용 음성인식 장치.
The method according to claim 1,
Wherein the first engine (10) stores a limited number of words in a small capacity memory and automatically activates the second engine (11) by a voice command of the user.
청구항 1에 있어서,
상기 제1엔진(10)은 사용자로부터 발화된 소용량 어휘의 음성을 인식하고, 상기 제2엔진(11)은 사용자로부터 발화된 대용량 어휘의 음성을 인식하며, 상기 제1엔진(10)과 제2엔진(11)을 선택적으로 사용하여 음성인식을 할 수 있도록 된 것을 특징으로 하는 차량용 음성인식 장치.
The method according to claim 1,
The first engine 10 recognizes a voice of a small capacity vocabulary uttered by the user, the second engine 11 recognizes a voice of a large capacity vocabulary uttered by the user, and the first engine 10 and the second And the engine (11) is selectively used for voice recognition.
KR1020110129412A 2011-12-06 2011-12-06 Speech recognition apparatus for vehicle KR101724748B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110129412A KR101724748B1 (en) 2011-12-06 2011-12-06 Speech recognition apparatus for vehicle

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110129412A KR101724748B1 (en) 2011-12-06 2011-12-06 Speech recognition apparatus for vehicle

Publications (2)

Publication Number Publication Date
KR20130063091A KR20130063091A (en) 2013-06-14
KR101724748B1 true KR101724748B1 (en) 2017-04-19

Family

ID=48860540

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110129412A KR101724748B1 (en) 2011-12-06 2011-12-06 Speech recognition apparatus for vehicle

Country Status (1)

Country Link
KR (1) KR101724748B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11756575B2 (en) 2021-02-16 2023-09-12 Samsung Electronics Co., Ltd. Electronic device and method for speech recognition processing of electronic device

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101598948B1 (en) * 2014-07-28 2016-03-02 현대자동차주식회사 Speech recognition apparatus, vehicle having the same and speech recongition method
KR101713770B1 (en) * 2015-09-18 2017-03-08 주식회사 베이리스 Voice recognition system and voice recognition method therefor
CN107303909B (en) * 2016-04-20 2020-06-23 斑马网络技术有限公司 Voice call-up method, device and equipment
KR20180012464A (en) * 2016-07-27 2018-02-06 삼성전자주식회사 Electronic device and speech recognition method thereof
KR101910385B1 (en) 2017-06-22 2018-10-22 엘지전자 주식회사 Vehicle control device mounted on vehicle and method for controlling the vehicle
KR102429498B1 (en) * 2017-11-01 2022-08-05 현대자동차주식회사 Device and method for recognizing voice of vehicle

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004053825A (en) * 2002-07-18 2004-02-19 Yamaha Corp Apparatus, method, and program for language identification

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004053825A (en) * 2002-07-18 2004-02-19 Yamaha Corp Apparatus, method, and program for language identification

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11756575B2 (en) 2021-02-16 2023-09-12 Samsung Electronics Co., Ltd. Electronic device and method for speech recognition processing of electronic device

Also Published As

Publication number Publication date
KR20130063091A (en) 2013-06-14

Similar Documents

Publication Publication Date Title
KR101724748B1 (en) Speech recognition apparatus for vehicle
US20200312329A1 (en) Performing speech recognition using a local language context including a set of words with descriptions in terms of components smaller than the words
KR102007478B1 (en) Device and method for controlling application using speech recognition under predetermined condition
WO2017090115A1 (en) Speech dialogue device and speech dialogue method
US20140309996A1 (en) Voice control method and mobile terminal apparatus
US9117449B2 (en) Embedded system for construction of small footprint speech recognition with user-definable constraints
US20140156268A1 (en) Incremental speech recognition for dialog systems
US9812129B2 (en) Motor vehicle device operation with operating correction
US20210134278A1 (en) Information processing device and information processing method
US20020091518A1 (en) Voice control system with multiple voice recognition engines
EP3246915A1 (en) Voice recognition system and method of robot system
WO2008067562A3 (en) Multimodal speech recognition system
CA2814109A1 (en) Multipass asr controlling multiple applications
US8185400B1 (en) System and method for isolating and processing common dialog cues
CN105448293A (en) Voice monitoring and processing method and voice monitoring and processing device
US20150142449A1 (en) Method and Device for Operating a Speech-Controlled Information System for a Vehicle
JP2003114698A (en) Command acceptance device and program
JP2002520681A (en) Automatic speech recognition method
JP2006208486A (en) Voice inputting device
TW200643895A (en) Voice-controlled vehicle control method and system with restricted condition for assisting recognition
CN107230478A (en) A kind of voice information processing method and system
US11646031B2 (en) Method, device and computer-readable storage medium having instructions for processing a speech input, transportation vehicle, and user terminal with speech processing
CN107545895B (en) Information processing method and electronic device
US20210233516A1 (en) Agent system, agent server, and computer readable recording medium
US11587566B2 (en) Agent system, terminal device, and computer readable recording medium using speech interaction for services

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant