KR101661767B1 - Voice Recognition Method and Apparatus for Providing User Interface by Using Voice - Google Patents

Voice Recognition Method and Apparatus for Providing User Interface by Using Voice Download PDF

Info

Publication number
KR101661767B1
KR101661767B1 KR1020100080084A KR20100080084A KR101661767B1 KR 101661767 B1 KR101661767 B1 KR 101661767B1 KR 1020100080084 A KR1020100080084 A KR 1020100080084A KR 20100080084 A KR20100080084 A KR 20100080084A KR 101661767 B1 KR101661767 B1 KR 101661767B1
Authority
KR
South Korea
Prior art keywords
voice
recognition
mode
guidance message
command
Prior art date
Application number
KR1020100080084A
Other languages
Korean (ko)
Other versions
KR20120017492A (en
Inventor
권오일
Original Assignee
현대모비스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대모비스 주식회사 filed Critical 현대모비스 주식회사
Priority to KR1020100080084A priority Critical patent/KR101661767B1/en
Publication of KR20120017492A publication Critical patent/KR20120017492A/en
Application granted granted Critical
Publication of KR101661767B1 publication Critical patent/KR101661767B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

본 발명은 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법 및 장치에 관한 것으로서, 운전자로부터 음성인식 시작신호의 입력시 다수개의 안내모드 선택을 위한 메시지 송출 후 선택되는 안내모드에 따른 음성안내 메시지의 출력을 시작하는 모드선택단계, 음성명령어가 입력되면 해당 주변장치의 구동을 시작하고, 구동중 새로운 음성명령어의 인식이나 인식불량이 발생하면 해당 명령실행 또는 음성안내 메시지를 출력하는 인식구동단계 및 모드선택단계에서 설정시간 내에 음성명령어가 인식되지 않는 경우 또는 인식구동단계에서 구동중지를 알리는 명령어가 입력되면 음성인식 동작을 중지시킴과 동시에 운전자에게 종료메시지를 출력하는 인식종료단계를 포함하고, 모드선택단계에서 선택 가능한 안내모드는 일반 모드, 전문 모드 및 고급 모드 중 어느 하나이고, 선택에 따라 기 설정된 음성인식 시나리오에 따른 음성안내 메시지를 송출하며, 고급모드는 사용자 편집기능을 통해 음성안내 메시지의 편집이 가능하다. 따라서, 운전자는 상시 변화하는 노이즈 상황에서 자신의 목소리가 음성인식 장치가 인지할 수 있는 정도의 신호인지 여부를 항시 알 수 있고, 운전자가 음성안내 메시지를 편집할 수 있도록 하는 등의 부가적인 기능을 제공함으로써 사용자의 편의성을 극대화시키며, 운전자의 목소리 고저의 변화에 따른 인식률 저하시에도 대처가 가능하다는 효과가 얻어진다. The present invention relates to a voice recognition method and apparatus for providing a user interface using voice. More particularly, the present invention relates to a voice recognition method and apparatus for providing a voice guidance message A mode selection step of starting a peripheral device when the voice command is inputted and outputting a corresponding command or a voice guidance message when recognizing or recognizing a new voice command during driving, And a recognition termination step of stopping the speech recognition operation and outputting a termination message to the driver when a command for notifying the termination of the driving is input in the recognition driving step, Selectable guidance modes in normal mode, professional mode And it is one of a fine mode, and transmits a voice guidance message according to the voice recognition scenarios predetermined Optionally, the advanced mode is capable of editing the prompt messages through user editing. Therefore, the driver can always know whether his / her voice is a signal recognizable by the voice recognition device in a constantly varying noise situation, and can perform additional functions such as allowing the driver to edit the voice guidance message Thus, it is possible to maximize the convenience of the user and to cope with a decrease in the recognition rate due to a change in the voice of the driver.

Description

음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법 및 장치{Voice Recognition Method and Apparatus for Providing User Interface by Using Voice}TECHNICAL FIELD [0001] The present invention relates to a voice recognition method and apparatus for providing a user interface using voice,

본 발명은 음성인식 방법 및 장치에 관한 것으로서, 더욱 자세하게는 운전자가 음성인식 모드 구동시 다양한 안내선택 모드를 제공하여 운전자의 선택에 따라 가변적으로 음성안내 메시지를 출력하는 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법 및 장치에 관한 것이다.
The present invention relates to a voice recognition method and apparatus, and more particularly, to a voice recognition system in which a driver provides a variety of guidance selection modes when operating in a voice recognition mode, and provides a user interface using voice to variably output a voice guidance message according to a driver's choice And a speech recognition method and apparatus.

일반적으로 자동차에 사용되는 차량용 음성인식 장치는 자동차에 구비되는 파워 윈도우, 와이퍼, 비상램프, 에어컨, 오디오 등 운행에 안전성 및 편의성을 제공하여 주는 각종 주변 장치를 운전자의 음성을 통해 편리하게 조작하는 것을 의미한다. 2. Description of the Related Art Generally, a voice recognition device for a vehicle used in a car is designed to conveniently operate various peripheral devices that provide safety and convenience in operation such as a power window, a wiper, an emergency lamp, it means.

종래 차량용 음성인식장치는 크게 마이크 입력부와 운전자정보시스템(DIS) 유니트에 포함된 음성인식부(VR;Voice Recognition)로 나눌 수 있으며, 명령어 마이크는 푸쉬 투 토크(Push to talk) 신호를 받은 후 명령어의 입력을 받아 음성인식부(VR)에 입력신호를 전송해 준다. The speech recognizing apparatus of the related art can be broadly divided into a microphone input unit and a voice recognition unit (VR) included in a driver information system (DIS) unit. The command microphone receives a push to talk signal, And transmits the input signal to the voice recognition unit VR.

즉, 운전자가 마이크를 통하여 명령한 음성신호를 아날로그 전기적 신호로 변화시키고, 음성인식에 필요한 소정의 전처리 과정을 실행 한 후, 상기 전처리된 음성신호를 묵음 구간과 음성 구간으로 분리하여 분석하는 것에 의해 이루어진다. 이와 같은 과정을 통해 분리된 음성구간의 신호는 대략 10ms의 프레임으로 구간별 음성의 특징을 표현하는 파라미터를 추출하며, 추출된 파라미터를 통하여 설정된 기준 영역을 초과하는 주파수 대역을 음성신호로 추출하여 사용자의 명령에 대한 음성신호로 인식하도록 하는 방법이 사용되고 있다.
That is, by changing a voice signal, which is commanded by the driver through a microphone, to an analog electrical signal, performing a predetermined preprocessing process necessary for voice recognition, and separating the preprocessed voice signal into a silent section and a voice section, . The signal of the separated speech interval is extracted by extracting the frequency band exceeding the set reference range as the speech signal through the extracted parameters and outputting the extracted speech signal to the user A voice signal for the command of the mobile terminal is recognized.

그러나 상기 종래의 차량용 음성인식장치의 음성인식률에 가장 큰 영향을 미치는 요소는 음성입력신호 대 노이즈(잡음)의 비율인데, 운전자는 상시 변화하는 노이즈 상황에서 자신의 목소리가 음성인식 장치가 인지할 수 있는 정도의 신호인지 여부를 알 수 없었다. However, the most important factor that affects the voice recognition rate of the conventional vehicle voice recognition apparatus is the ratio of voice input signal to noise (noise). The driver can recognize his or her voice in the ever- It is impossible to know whether the signal is as much as possible.

또한, 음성인식 장치를 구동하면 운전자와는 무관하게 정해진 음성인식 시나리오에 따른 음성안내 메시지를 운전자에게 송출함으로써 사용자의 편의성이 현저히 낮고, 운전자의 목소리 고저의 변화에 따른 인식률 저하에 대한 대책이 전혀 없는 문제점이 있었다.
Further, when the voice recognition device is driven, the voice guidance message according to the predetermined voice recognition scenario is transmitted to the driver irrespective of the driver, so that the convenience of the user is remarkably low, and there is no countermeasure against the decrease in the recognition rate due to the change of the voice level of the driver There was a problem.

본 발명의 목적은 상술한 바와 같은 종래의 문제점을 해결하기 위한 것으로서, 운전자가 음성인식 모드 구동시 다양한 안내선택 모드(일반, 전문, 고급)를 제공하여 운전자의 선택에 따라 해당 모드에 따른 음성안내 메시지를 가변적으로 출력하고, 운전자의 음성인식률이 낮아지는 경우 운전자에게 해당 안내 메시지를 출력하여 인식률을 향상시키도록 하는 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법 및 장치를 제공하는데 그 목적이 있다.
The object of the present invention is to solve the conventional problems as described above, and it is an object of the present invention to provide various guidance selection modes (general, specialized, and advanced) when the driver operates the voice recognition mode, The present invention provides a voice recognition method and an apparatus for providing a user interface using voice to output a message in a variable manner and output a corresponding guidance message to a driver when the voice recognition rate of the driver is low, thereby improving the recognition rate.

상기와 같은 목적을 달성하기 위하여, 본 발명에 따른 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 장치는, 마이크를 통해 운전자의 음성명령어를 수신한 후 현재 입력된 음성명령어를 인식하고 그 결과값으로 음성명령어 인식신호를 출력하는 음성인식수단, 다수개의 안내모드에 대응한 음성인식 시나리오에 따른 음성안내 메시지를 저장하는 저장수단, 상기 다수개의 안내모드 중 선택한 안내모드에 따라 입력되는 음성명령어 인식신호를 분석하여 그에 따라 상기 저장수단에 저장한 음성안내 메시지를 출력하거나 주변장치를 구동하는 제어신호를 출력하는 제어수단, 상기 제어신호에 따라 해당 주변장치로 구동신호를 공급하는 기능처리수단을 포함하고, 상기 제어수단은, 음성명령어 인식신호로부터 해당 명령인식이 불가능할 경우 음성인식 불가를 알리는 음성안내 메시지를 송출하여 음성명령어를 재입력하도록 유도하고, 상기 운전자가 선택한 모드가 일반(normal) 모드 또는 전문(expert) 모드 또는 고급(smart) 모드의 선택인 경우에 따라 상기 저장수단에 설정된 음성인식 시나리오에 따른 음성안내 메시지를 송출하도록 제어하며, 상기 고급모드에서 음성안내 메시지의 편집을 통해 수정 또는 추가되는 음성안내 메시지를 저장수단에 저장하도록 제어하고, 상기 고급모드 선택시 차량의 실내 환기 레벨을 최대로 변경하도록 제어한 후 음성명령어에 따라 실내 환기 레벨을 조절한다. In order to achieve the above object, a speech recognition apparatus for providing a user interface using a speech according to the present invention recognizes a currently input voice command after receiving a voice command word of a driver through a microphone, A storage means for storing a voice guidance message according to a voice recognition scenario corresponding to a plurality of guiding modes, a voice recognition means for analyzing a voice command recognition signal inputted according to a selected guiding mode among the plurality of guiding modes, A control means for outputting a voice guidance message stored in the storage means and outputting a control signal for driving a peripheral device, and a function processing means for supplying a driving signal to the peripheral device in accordance with the control signal, If it is impossible to recognize the corresponding command from the voice command recognition signal The method according to claim 1, further comprising: transmitting a voice guidance message informing that the adult ceremony is impossible and re-inputting a voice command; and when the mode selected by the driver is a normal mode or an expert mode or a smart mode, Means for controlling to transmit a voice guidance message according to the voice recognition scenario set in the voice mode, means for storing in the storage means a voice guidance message modified or added by editing the voice guidance message in the advanced mode, And adjusts the indoor ventilation level according to a voice command.

또한, 본 발명에 따른 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법은, 운전자로부터 음성인식 시작신호의 입력시 다수개의 안내모드 선택을 위한 메시지 송출 후 선택되는 안내모드에 따른 음성안내 메시지의 출력을 시작하는 모드선택단계, 상기 음성안내 메시지에 따른 음성명령어가 입력되면 그에 따라 해당 주변장치의 구동을 시작하고, 구동중 새로운 음성명령어의 인식이나 인식불량이 발생하면 그에 따라 해당 명령실행 또는 음성안내 메시지를 출력하는 인식구동단계 및 상기 모드선택단계에서 설정시간 내에 음성명령어가 인식되지 않는 경우 또는 상기 인식구동단계에서 구동중지를 알리는 명령어가 입력되면 음성인식 동작을 중지시킴과 동시에 운전자에게 종료메시지를 출력하는 인식종료단계를 포함하고, 상기 모드선택단계에서 선택 가능한 안내모드는 일반(normal) 모드, 전문(expert) 모드 및 고급(smart) 모드 중 어느 하나이고, 선택에 따라 기 설정된 음성인식 시나리오에 따른 음성안내 메시지를 송출하며, 상기 고급모드는 사용자 편집기능을 통해 음성안내 메시지의 편집이 가능하다.Also, the voice recognition method for providing a user interface using voice according to the present invention is characterized in that when a voice recognition start signal is input from a driver, a voice guidance message according to a guide mode selected after transmitting a message for selecting a plurality of guide modes is output When a voice instruction word corresponding to the voice guidance message is input, the peripheral device starts driving the peripheral device, and if a new voice command is recognized or recognized during driving, a corresponding command execution or voice guidance message When the voice command word is not recognized within the set time in the mode selection step, or when a command for notifying the driving stop in the recognition driving step is inputted, the voice recognition operation is stopped and the end message is outputted to the driver Wherein the mode selection step The guidance mode selectable in the step is any one of a normal mode, an expert mode, and a smart mode, and transmits a voice guidance message according to a predetermined voice recognition scenario according to the selection, Editing voice announcement messages is possible through the user edit function.

상술한 바와 같이, 본 발명에 따른 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법 및 장치에 의하면, 운전자는 상시 변화하는 노이즈 상황에서 자신의 목소리가 음성인식 장치가 인지할 수 있는 정도의 신호인지 여부를 항시 알 수 있고, 운전자가 음성안내 메시지를 편집할 수 있도록 하는 등의 부가적인 기능을 제공함으로써 사용자의 편의성을 극대화시키며, 운전자의 목소리 고저의 변화에 따른 인식률 저하시에도 대처가 가능하다는 효과가 얻어진다.
As described above, according to the speech recognition method and apparatus for providing the user interface using the speech according to the present invention, the driver can recognize whether or not his / her voice is recognizable by the speech recognition apparatus in the ever- It is possible to maximize the convenience of the user by providing additional functions such as allowing the driver to edit the voice guidance message and to cope with the decrease in the recognition rate due to the change of the voice level of the driver .

도 1은 본 발명의 실시예에 따른 사용자 인터페이스를 제공하는 음성인식 장치의 구성을 간략하게 보인 블록도.
도 2는 본 발명의 실시예에 따른 사용자 인터페이스를 통한 음성안내 과정을 보인 흐름도.
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram briefly showing a configuration of a speech recognition apparatus for providing a user interface according to an embodiment of the present invention; FIG.
BACKGROUND OF THE INVENTION 1. Field of the Invention [0001]

이하, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 가장 바람직한 실시예를 첨부한 도면을 참조하여 상세하게 설명한다. 또한, 본 발명을 설명하는데 있어서 동일 부분은 동일 부호를 붙이고, 그 반복 설명은 생략한다.
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings, in order that the present invention may be easily understood by those skilled in the art. In the description of the present invention, the same parts are denoted by the same reference numerals, and repetitive description thereof will be omitted.

도 1는 본 발명의 실시예에 따른 사용자 인터페이스를 제공하는 음성인식 장치의 구성을 간략하게 보인 블록도이다. 1 is a block diagram briefly showing a configuration of a speech recognition apparatus for providing a user interface according to an embodiment of the present invention.

도 1에서 도시한 바와 같이, 본 발명을 적용하기 위한 음성인식 장치는 마이크(100), 입력부(200), 음성인식부(300), 메모리(400), 스피커(500), 제어부(600) 및 기능처리부(700)를 포함하여 구성한다. 1, the speech recognition apparatus for applying the present invention includes a microphone 100, an input unit 200, a voice recognition unit 300, a memory 400, a speaker 500, a control unit 600, And a function processing unit (700).

음성인식부(300)는 마이크(100)를 통해 운전자의 음성명령어를 수신한 후 현재 입력된 음성명령어를 인식하고 그 결과값으로 음성명령어 인식신호를 출력한다. The voice recognition unit 300 recognizes the currently input voice command after receiving the voice command of the driver through the microphone 100 and outputs a voice command recognition signal as a result of the recognition.

메모리(400)는 다수개의 안내모드에 대응한 음성인식 시나리오에 따른 음성안내 메시지를 저장하며, 제어부(600)의 제어에 따라 편집을 통해 수정 또는 추가되는 음성안내 메시지도 저장한다. The memory 400 stores a voice guidance message according to a voice recognition scenario corresponding to a plurality of guidance modes and also stores a voice guidance message modified or added through editing under the control of the controller 600. [

제어부(600)는 입력부(200)를 통해 운전자로부터 음성인식 시작신호의 입력되면 상기 다수개의 안내모드 중 선택한 안내모드에 따라 입력되는 음성명령어 인식신호를 분석하여 그에 따라 상기 메모리(400)에 저장한 음성안내 메시지를 스피커(500)를 통해 출력하거나 주변장치(810~840)를 구동하는 제어신호를 출력한다. When the voice recognition start signal is input from the driver through the input unit 200, the control unit 600 analyzes the voice command recognition signal input according to the guide mode selected from the plurality of guide modes and stores the voice command recognition signal in the memory 400 Outputs a voice guidance message through the speaker 500 or a control signal for driving the peripheral devices 810 to 840.

기능처리부(700)는 상기 제어부(600)의 제어신호에 따라 해당 주변장치(810~840)로 구동신호를 공급한다. The function processor 700 supplies a drive signal to the peripheral devices 810 to 840 according to a control signal of the controller 600. [

또한, 상기 제어부(600)는 음성명령어 인식신호로부터 해당 명령인식이 불가능할 경우 음성인식 불가를 알리는 음성안내 메시지를 송출하여 음성명령어를 재입력하도록 유도한다.
In addition, if the corresponding command can not be recognized from the voice command recognition signal, the controller 600 transmits a voice guidance message indicating that voice recognition is impossible and re-inputs the voice command.

한편, 상기 제어부(600)는 상기 운전자가 선택한 모드가 일반(normal) 모드 또는 전문(expert) 모드 또는 고급(smart) 모드의 선택인 경우에 따라 상기 메모리(400)에 설정된 음성인식 시나리오에 따른 음성안내 메시지를 송출하도록 제어하는데, 상기 고급모드가 선택된 경우에 음성안내 메시지의 편집을 통해 수정 또는 추가되는 음성안내 메시지를 메모리(400)에 저장하도록 제어하며, 차량의 실내 환기 레벨을 최대로 변경하도록 제어한 후 음성명령어에 따라 실내 환기 레벨을 조절한다.
Meanwhile, the controller 600 determines whether the voice selected according to the voice recognition scenario set in the memory 400 according to the mode selected by the driver is a normal mode, an expert mode, or a smart mode, If the advanced mode is selected, the voice guidance message modified or added through editing of the voice guidance message is controlled to be stored in the memory 400, and the indoor ventilation level of the vehicle is changed to the maximum Control the room ventilation level according to voice commands.

이와 같이 구성한 본 발명에 따른 실시예의 동작 과정을 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다. The operation of the embodiment of the present invention will be described in detail with reference to the accompanying drawings.

도 2는 본 발명의 실시예에 따른 사용자 인터페이스를 통한 음성안내 과정을 보인 흐름도이다. 2 is a flowchart illustrating a voice guidance process through a user interface according to an embodiment of the present invention.

상기 도 2를 참조하면, 운전자로부터 음성인식 시작신호의 입력시 다수개의 안내모드 선택을 위한 메시지 출력 후, 선택되는 안내모드에 따른 음성안내 메시지의 출력을 시작한다(S201). Referring to FIG. 2, when a voice recognition start signal is input from a driver, a message for selecting a plurality of guide modes is output, and then a voice announcement message according to the selected guide mode is started (S201).

상기 단계(S201)에서 출력하는 안내모드는 일반(normal) 모드, 전문(expert) 모드 및 고급(smart) 모드이고, 이중 어느 하나를 선택하면 그에 따라 기 설정된 음성인식 시나리오에 따른 음성안내 메시지를 송출하는데(S202~S205), 상기 고급모드에서는 사용자 편집기능을 통해 음성안내 메시지의 편집이 가능하기 때문에 운전자의 사전설정에 따라 음성인식 시나리오에 따른 음성안내 메시지 또는 편집된 음성안내 메시지를 출력하도록 한다(S206). The guidance mode output in the step S201 is a normal mode, an expert mode, and a smart mode. If any one of them is selected, a voice guidance message according to a predetermined speech recognition scenario is transmitted (S202 to S205). In the advanced mode, since the voice guidance message can be edited through the user editing function, the voice guidance message or the edited voice guidance message according to the voice recognition scenario is output according to the presetting of the driver S206).

또한, 상기 고급모드 선택시에는 차량의 실내 환기 레벨을 최대로 자동 변경한 후, 음성안내 메시지(예를 들어 실내 환기 레벨을 낮출까요? 등)를 통해 실내 환기 레벨을 조절하도록 하는 기능을 추가로 수행한다.
In addition, when the advanced mode is selected, a function of automatically adjusting the indoor ventilation level of the vehicle to the maximum, and then adjusting the indoor ventilation level through a voice guidance message (for example, lowering the indoor ventilation level) .

한편, 상기 모드선택에 따른 음성안내 메시지 출력 후, 음성안내 메시지에 따른 운전자의 음성명령어(예를 들어 '블루투스 폰으로 연결' 등)가 입력되면 그에 따라 해당 주변장치(예를 들어 에어컨 등)의 구동을 시작하고, 구동중 새로운 음성명령어의 인식이나 고급모드에서 인식불량이 발생하면 그에 따라 해당 명령실행 또는 음성안내 메시지를 출력한다. When a voice command word (e.g., 'connect to a Bluetooth phone') of the driver according to the voice guidance message is input after outputting the voice guidance message according to the mode selection, the corresponding peripheral device And when a recognition of a new voice command during operation or a recognition failure in the advanced mode occurs, the corresponding command execution or voice guidance message is output accordingly.

즉, 상기 운전자가 선택한 모드가 고급모드인 경우에는 상기 인식불량이 발생하면(S207), 잡음 및 음성 등의 입력신호가 마이크를 통해 입력되면 레벨을 측정한 후 잡음 레벨 대비 음성신호가 해당 장치의 인식가능 최소 잡음률(SNR)보다 작은가(예를 들어 SNR〈 50 )를 판단한다(S208). That is, when the mode selected by the driver is the advanced mode, if the recognition failure occurs (S207), if the input signal such as noise and voice is inputted through the microphone, the level is measured, (For example, SNR < 50) that is smaller than the recognizable minimum noise ratio (SNR) (S208).

상기 단계(S208)의 판단결과 음성신호가 인식가능 최소 잡음률(SNR)보다 작으면 음성인식 불가를 알리는 음성안내 메시지를 송출하여 음성명령어를 재입력하도록 유도하는데(S209), 현재 측정레벨이 인식가능 최소 잡음률(SNR)보다 작다는 것을 인식하게 하여 더 목소리 톤을 높여 명령어를 발성하게 유도한다(예를 들어 '더 큰소리로 말하여주세요'). As a result of the determination in step S208, if the voice signal is smaller than the recognizable minimum noise ratio (SNR), the voice guidance message for not recognizing voice recognition is transmitted and the voice command is re-entered (S209) Recognize that it is smaller than the minimum possible noise ratio (SNR), which induces more voices to raise the voice tone (for example, 'Speak louder').

상기 단계(S208)의 판단결과 음성신호가 인식가능 최소 잡음률(SNR)보다 큰 경우, 사용자 음성 레벨이 설정치(설정된 음성신호의 피크(Peak) 레벨)보다 큰가를 판단한다(S210). If it is determined in step S208 that the voice signal is larger than the recognizable minimum noise ratio (SNR), it is determined whether the user voice level is greater than a set value (peak level of the set voice signal) (S210).

상기 단계(S210)의 판단결과 상기 사용자 음성레벨이 설정치 보다 큰 경우, 음성인식 불가를 알리는 음성안내 메시지를 송출하여 음성명령어를 재입력하도록 유도하는데(S209), 현재 측정레벨이 사용자 음성 레벨이 크다는 것을 인식하게 하여 목소리 톤을 낮추어 명령어를 발성하게 유도한다(예를 들어 '목소리 톤을 낮추어 말하여 주세요'). If it is determined in step S210 that the user's voice level is greater than the set value, the user is prompted to re-input the voice command by informing the user that the voice recognition is impossible (S209) (For example, 'lower your voice tone and speak').

만약, 상기 단계(S210)의 판단결과 설정치보다 작은 경우 비정상적인 상태에 의한 인식불량임을 알리는 음성안내 메시지(예를 들어 '인식이 되지 않습니다. 다시 한번 말씀해주세요' 등)를 출력한다(S211).
If it is smaller than the set value (S210), a voice guidance message (e.g., 'Do not recognize, please tell me again') indicating that the recognition is abnormal due to an abnormal state is output (S211).

한편, 상기 단계(S202~S204)에서 설정시간 내에 운전자로부터 모드 선택 또는 주변장치 구동을 위한 음성명령어가 인식되지 않는 경우나, 상기 단계(S205 또는 S206)에서 구동중지를 알리는 명령어가 입력되면 음성인식 동작을 중지시킴과 동시에 운전자에게 종료메시지(예를 들어 '음성인식 동작을 중지합니다' 등)를 출력한다(S212).
If a voice command for mode selection or peripherals driving is not recognized from the driver within the set time in steps S202 to S204, or if a command to inform the driver of the stop operation is input in the step S205 or S206, And at the same time, outputs a termination message (e.g., 'stop voice recognition operation') to the driver (S212).

이상, 본 발명자에 의해서 이루어진 발명을 상기 실시예에 따라 구체적으로 설명하였지만, 본 발명은 상기 실시예에 한정되는 것은 아니고, 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 물론이다.
Although the present invention has been described in detail with reference to the above embodiments, it is needless to say that the present invention is not limited to the above-described embodiments, and various modifications may be made without departing from the spirit of the present invention.

100 : 마이크 200 : 입력부
300 : 음성인식부 400 : 메모리
500 : 스피커 600 : 제어부
700 : 기능처리부 810~840 : 주변장치
100: microphone 200: input unit
300: Voice recognition unit 400: Memory
500: speaker 600:
700: Function processor 810 to 840: Peripheral device

Claims (10)

운전자로부터 음성인식 시작신호의 입력시 다수개의 안내모드 선택을 위한 메시지 송출 후 선택되는 안내모드에 따른 음성안내 메시지의 출력을 시작하는 모드선택단계,
상기 음성안내 메시지에 따른 음성명령어가 입력되면 그에 따라 해당 주변장치의 구동을 시작하고, 구동중 새로운 음성명령어의 인식이나 인식불량이 발생하면 그에 따라 해당 명령실행 또는 음성안내 메시지를 출력하는 인식구동단계 및
상기 모드선택단계에서 설정시간 내에 음성명령어가 인식되지 않는 경우 또는 상기 인식구동단계에서 구동중지를 알리는 명령어가 입력되면 음성인식 동작을 중지시킴과 동시에 운전자에게 종료메시지를 출력하는 인식종료단계를 포함하고,
상기 모드선택단계에서 선택 가능한 안내모드는 일반(normal) 모드, 전문(expert) 모드 및 고급(smart) 모드 중 어느 하나이고, 선택에 따라 기 설정된 음성인식 시나리오에 따른 음성안내 메시지를 송출하며,
상기 고급모드는 사용자 편집기능을 통해 음성안내 메시지의 편집이 가능한 것인 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법.
A mode selecting step of starting outputting a voice guidance message according to a guidance mode selected after sending a message for selecting a plurality of guidance modes when a voice recognition start signal is input from a driver,
When a voice command word according to the voice guidance message is input, the peripheral device starts driving the peripheral device, and when a new voice command is recognized or recognized in operation, a corresponding command is issued or a voice guidance message is output And
And a recognition termination step of stopping the voice recognition operation and outputting a termination message to the driver when a voice command is not recognized within the set time in the mode selection step or when an instruction to stop the driving is input in the recognition driving step, ,
Wherein the guidance mode selectable in the mode selection step is one of a normal mode, an expert mode, and a smart mode, and transmits a voice guidance message according to a predetermined voice recognition scenario according to the selection,
Wherein the advanced mode provides a user interface using a voice, the voice guidance message being editable through a user editing function.
삭제delete 삭제delete 제1항에 있어서, 상기 모드선택단계는
상기 고급모드 선택시 차량의 실내 환기 레벨을 최대로 자동 변경한 후 음성안내 메시지를 통해 실내 환기 레벨을 조절하도록 하는 것인 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법.
2. The method of claim 1, wherein the mode selection step comprises:
When the advanced mode is selected, the indoor ventilation level of the vehicle is automatically maximized and then the indoor ventilation level is adjusted through the voice guidance message.
제1항에 있어서, 상기 인식구동단계는
상기 운전자가 선택한 모드가 고급 모드인 경우에 인식가능 최소 잡음률(SNR), 사용자 음성 레벨, 비정상적인 상태에 의해 인식불량이 발생하면 음성인식 불가를 알리는 음성안내 메시지를 송출하는 것인 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법.
2. The method according to claim 1,
And a voice guidance message for notifying that voice recognition is impossible if a recognition failure occurs due to a recognizable minimum noise ratio (SNR), a user voice level, or an abnormal state when the mode selected by the driver is the advanced mode A speech recognition method that provides an interface.
제5항에 있어서, 상기 인식구동단계는
상기 인식불량이 발생하는 경우 잡음 및 음성의 입력신호가 마이크를 통해 입력되면 레벨을 측정하는 제1 단계,
상기 레벨을 측정한 후 잡음 레벨 대비 음성신호가 해당 장치의 인식가능 최소 잡음률(SNR)보다 작은가를 판단하는 제2 단계,
상기 음성신호가 인식가능 최소 잡음률(SNR)보다 작으면 음성인식 불가를 알리는 음성안내 메시지를 송출하여 음성명령어를 재입력하도록 유도하는 제3 단계,
상기 음성신호가 인식가능 최소 잡음률(SNR)보다 큰 경우, 사용자 음성 레벨이 설정치(설정된 음성신호의 피크(Peak) 레벨)보다 큰가를 판단하는 제4 단계 및
상기 사용자 음성레벨이 설정치 보다 큰 경우, 음성인식 불가를 알리는 음성안내 메시지를 송출하여 음성명령어를 재입력하도록 유도하는 제5 단계를 포함하는 것인 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법.
6. The method according to claim 5,
A first step of measuring a level when an input signal of a noise and a voice is inputted through a microphone when the recognition failure occurs,
A second step of determining whether the voice signal is less than a recognizable minimum noise ratio (SNR) of the device after measuring the level,
If the voice signal is smaller than the recognizable minimum noise ratio (SNR), transmitting a voice guidance message informing that voice recognition is impossible and re-entering the voice command;
A fourth step of determining whether the user's voice level is greater than a set value (a peak level of a set voice signal) when the voice signal is greater than a recognizable minimum noise ratio (SNR)
And a fifth step of transmitting a voice guidance message informing that voice recognition is impossible and re-inputting voice commands when the user voice level is higher than the set value.
제6항에 있어서,
상기 제3 단계에서 음성안내 메시지로 음성인식 불가를 알리는 경우에, 현재 측정레벨이 인식가능 최소 잡음률(SNR)보다 작다는 것을 인식하게 하여 더 목소리 톤을 높여 명령어를 발성하게 유도하고,
상기 제5 단계에서 음성안내 메시지로 음성인식 불가를 알리는 경우에, 현재 측정레벨이 사용자 음성 레벨이 크다는 것을 인식하게 하여 목소리 톤을 낮추어 명령어를 발성하게 유도하는 것인 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 방법.
The method according to claim 6,
In the third step, when it is notified that speech recognition is disabled in the voice guidance message, it is recognized that the current measurement level is smaller than the recognizable minimum noise ratio (SNR), thereby further increasing the voice tone to induce utterance,
When the voice guidance message is notified in the fifth step, it is recognized that the current measurement level is higher than the user voice level, and the voice tone is lowered to induce the voice to be uttered. Speech recognition method.
마이크를 통해 운전자의 음성명령어를 수신한 후 현재 입력된 음성명령어를 인식하고 그 결과값으로 음성명령어 인식신호를 출력하는 음성인식수단,
다수개의 안내모드에 대응한 음성인식 시나리오에 따른 음성안내 메시지를 저장하는 저장수단,
상기 다수개의 안내모드 중 선택한 안내모드에 따라 입력되는 음성명령어 인식신호를 분석하여 그에 따라 상기 저장수단에 저장한 음성안내 메시지를 출력하거나 주변장치를 구동하는 제어신호를 출력하는 제어수단,
상기 제어신호에 따라 해당 주변장치로 구동신호를 공급하는 기능처리수단을 포함하고,
상기 제어수단은,
음성명령어 인식신호로부터 해당 명령인식이 불가능할 경우 음성인식 불가를 알리는 음성안내 메시지를 송출하여 음성명령어를 재입력하도록 유도하고,
상기 운전자가 선택한 모드가 일반(normal) 모드 또는 전문(expert) 모드 또는 고급(smart) 모드의 선택인 경우에 따라 상기 저장수단에 설정된 음성인식 시나리오에 따른 음성안내 메시지를 송출하도록 제어하며,
상기 고급모드에서 음성안내 메시지의 편집을 통해 수정 또는 추가되는 음성안내 메시지를 저장수단에 저장하도록 제어하고,
상기 고급모드 선택시 차량의 실내 환기 레벨을 최대로 변경하도록 제어한 후 음성명령어에 따라 실내 환기 레벨을 조절하는 것인 음성을 이용한 사용자 인터페이스를 제공하는 음성인식 장치.
Voice recognizing means for recognizing a currently inputted voice command after receiving a voice command of the driver through a microphone and outputting a voice command recognition signal as a result of the voice command,
Storage means for storing a voice guidance message according to a voice recognition scenario corresponding to a plurality of guidance modes,
A control means for analyzing a voice command recognition signal input according to the selected guide mode among the plurality of guidance modes and outputting a voice guidance message stored in the storage means or outputting a control signal for driving a peripheral device,
And a function processing means for supplying a driving signal to the peripheral device in accordance with the control signal,
Wherein,
If the corresponding command can not be recognized from the voice command recognition signal, the voice guidance message for informing that speech recognition is impossible is issued to induce re-input of the voice command,
A voice guidance message according to the speech recognition scenario set in the storage means according to the mode selected by the driver is a normal mode or an expert mode or a smart mode,
Controlling to store in the storage means a voice guidance message modified or added by editing the voice guidance message in the advanced mode,
Wherein the controller controls the indoor ventilation level of the vehicle to be changed to the maximum when the advanced mode is selected, and then adjusts the indoor ventilation level according to voice commands.
삭제delete 삭제delete
KR1020100080084A 2010-08-19 2010-08-19 Voice Recognition Method and Apparatus for Providing User Interface by Using Voice KR101661767B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100080084A KR101661767B1 (en) 2010-08-19 2010-08-19 Voice Recognition Method and Apparatus for Providing User Interface by Using Voice

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100080084A KR101661767B1 (en) 2010-08-19 2010-08-19 Voice Recognition Method and Apparatus for Providing User Interface by Using Voice

Publications (2)

Publication Number Publication Date
KR20120017492A KR20120017492A (en) 2012-02-29
KR101661767B1 true KR101661767B1 (en) 2016-09-30

Family

ID=45839383

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100080084A KR101661767B1 (en) 2010-08-19 2010-08-19 Voice Recognition Method and Apparatus for Providing User Interface by Using Voice

Country Status (1)

Country Link
KR (1) KR101661767B1 (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10088853B2 (en) 2012-05-02 2018-10-02 Honeywell International Inc. Devices and methods for interacting with an HVAC controller
US10145579B2 (en) 2013-05-01 2018-12-04 Honeywell International Inc. Devices and methods for interacting with a control system that is connected to a network
US10047970B2 (en) 2013-08-21 2018-08-14 Honeywell International Inc. Devices and methods for interacting with an HVAC controller
US10030878B2 (en) 2013-08-21 2018-07-24 Honeywell International Inc. User interaction with building controller device using a remote server and a duplex connection
US10514677B2 (en) 2014-04-11 2019-12-24 Honeywell International Inc. Frameworks and methodologies configured to assist configuring devices supported by a building management system
US9870772B2 (en) * 2014-05-02 2018-01-16 Sony Interactive Entertainment Inc. Guiding device, guiding method, program, and information storage medium
KR20170089670A (en) 2016-01-27 2017-08-04 현대자동차주식회사 Vehicle and control method for the same
CN107678465A (en) * 2017-11-07 2018-02-09 厦门盈趣科技股份有限公司 Temperature control system and method
US10524046B2 (en) 2017-12-06 2019-12-31 Ademco Inc. Systems and methods for automatic speech recognition
US20190390866A1 (en) 2018-06-22 2019-12-26 Honeywell International Inc. Building management system with natural language interface
JP7002823B2 (en) * 2018-12-06 2022-01-20 アルパイン株式会社 Guidance voice output control system and guidance voice output control method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050081470A (en) * 2004-02-13 2005-08-19 주식회사 엑스텔테크놀러지 Method for recording and play of voice message by voice recognition
KR20080035754A (en) * 2006-10-20 2008-04-24 현대자동차주식회사 A voice recognition display apparatus and the method thereof

Also Published As

Publication number Publication date
KR20120017492A (en) 2012-02-29

Similar Documents

Publication Publication Date Title
KR101661767B1 (en) Voice Recognition Method and Apparatus for Providing User Interface by Using Voice
US10657945B2 (en) Noise control method and device
JP2007501420A (en) Driving method of dialog system
US10290292B2 (en) Noise control method and device
JP2008256802A (en) Voice recognition device and voice recognition method
CN111798850B (en) Method and system for operating equipment by voice and server
KR101526736B1 (en) Air-conditioning control apparatus for vehicle
JP5431282B2 (en) Spoken dialogue apparatus, method and program
KR102417899B1 (en) Apparatus and method for recognizing voice of vehicle
JP4491438B2 (en) Voice dialogue apparatus, voice dialogue method, and program
JP5863928B1 (en) Audio adjustment device
US20030163309A1 (en) Speech dialogue system
CN113228167A (en) Voice control method and device
JP5365530B2 (en) Communication equipment
CN113658601A (en) Voice interaction method, device, terminal equipment, storage medium and program product
JP2019191490A5 (en)
JPH08263092A (en) Response voice generating method and voice interactive system
KR102495028B1 (en) Sound Device with Function of Whistle Sound Recognition
KR20210125356A (en) An electronic apparatus and a method of operating the electronic apparatus
KR20200034228A (en) Apparatus and method for controlling a device based on speech recognition
KR102594683B1 (en) Electronic device for speech recognition and method thereof
JP2019020475A (en) Voice recognition device and voice recognition method
JPH08263093A (en) Voice recognition controller
JPH02103599A (en) Voice recognizing device
JP2018091911A (en) Voice interactive system and voice interactive method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant