KR101724734B1 - 음성 인식 장치 - Google Patents

음성 인식 장치 Download PDF

Info

Publication number
KR101724734B1
KR101724734B1 KR1020110094842A KR20110094842A KR101724734B1 KR 101724734 B1 KR101724734 B1 KR 101724734B1 KR 1020110094842 A KR1020110094842 A KR 1020110094842A KR 20110094842 A KR20110094842 A KR 20110094842A KR 101724734 B1 KR101724734 B1 KR 101724734B1
Authority
KR
South Korea
Prior art keywords
pitch
voice
unit
meaning
analyzing
Prior art date
Application number
KR1020110094842A
Other languages
English (en)
Other versions
KR20130031109A (ko
Inventor
허동필
서재암
박재우
배현철
윤헌중
Original Assignee
현대자동차주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사 filed Critical 현대자동차주식회사
Priority to KR1020110094842A priority Critical patent/KR101724734B1/ko
Publication of KR20130031109A publication Critical patent/KR20130031109A/ko
Application granted granted Critical
Publication of KR101724734B1 publication Critical patent/KR101724734B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Air-Conditioning For Vehicles (AREA)

Abstract

본 발명은 음성 인식 장치로서, 음성 신호를 입력받는 음성 입력부, 상기 음성 신호에 대한 음높이를 분석하는 음높이 분석부, 상기 음성 신호에 대한 의미를 해석하는 음성 해석부, 및 상기 음높이 분석부 및 상기 음성 해석부에 의해 분석된 음높이 및 의미에 따라, 상기 의미에 대응하는 차량내 유닛을 상기 음높이에 대응하는 정도로 제어하는 제어부를 포함한다.

Description

음성 인식 장치{Voice recognition device}
본 발명은 음성 인식 장치에 관한 것으로, 보다 상세하게는 음성에 포함되는 의미와 음높이를 이용하는 음성 인식 장치에 관한 것이다.
일반적으로 음성 인식 장치는 제어대상을 설정하기 위한 제1음성 및 제어대상을 어느 정도로 제어할지를 설정하기 위한 제2음성을 입력받아, 제1음성에 의해 선택된 제어대상을 제2음성에 의해 선택된 정도로 제어하고 있다.
제2음성의 경우, 한국어상에서는 “일”, “이”, “삼”, “사” 등으로 표현될 수 있는데, 상기한 바와 같이 단음절을 갖는 단어들은 실제 음성 인식 과정에서 비슷한 발성에 의해 인식 오류가 발생할 확률이 높다.
따라서, 종래의 음성 인식 장치는 인식 오류에 의한 오작동이 발생하는 경우가 많고, 음성 인식이 제대로 수행되지 않아 사용자가 반복적으로 동일 음성을 입력해야 하는 불편함을 초래한다.
본 발명은 음성의 의미 및 음높이를 모두 이용하여 음성 인식을 수행함으로써, 음성 인식률이 높고, 사용자가 편리하게 이용할 수 있는 음성 인식 장치를 제공하는데 그 목적이 있다.
본 발명은 음성 신호를 입력받는 음성 입력부, 상기 음성 신호에 대한 음높이를 분석하는 음높이 분석부, 상기 음성 신호에 대한 의미를 해석하는 음성 해석부, 및 상기 음높이 분석부 및 상기 음성 해석부에 의해 분석된 음높이 및 의미에 따라, 상기 의미에 대응하는 차량내 유닛을 상기 음높이에 대응하는 정도로 제어하는 제어부를 포함한다.
본 발명에 따르면, 사용자는 제어의 정도를 설정하기 위한 별도의 음성을 반복적으로 입력할 필요없이, 제어 대상을 뜻하는 단어에 다양한 음높이를 결합하여 입력할 수 있어, 보다 간편하게 음성 인식 장치를 이용할 수 있다.
또한, 제어의 정도를 설정하기 위한 별도의 음성에 의해 발생하는 인식 오류를 줄일 수 있어, 인식률이 높은 음성 인식 장치를 제공할 수 있다.
또한, 음높이에 따른 게이지를 사용자에게 제공함으로써, 사용자는 입력되고 있는 음높이에 대한 피드백을 받아, 적절하게 음성 인식 장치를 이용할 수 있다.
도 1은 본 발명의 일실시예에 따른 음성 인식 장치를 나타내는 구성도이다.
도 2는 본 발명의 일실시예에 따른 음석 인식 방법을 나타내는 흐름도이다.
도 1은 본 발명의 일실시예에 따른 음성 인식 장치를 나타내는 구성도이다.
도 1에 도시된 바와 같이, 음성 인식 장치는 음성 입력부(101), 음높이 분석부(103), 음성 해석부(105), 제어부(107), 표시부(109) 및 차량내 유닛(111)이 포함될 수 있다. 차량내 유닛(111)은 음석 인식 장치로부터 출력되는 신호에 따라 제어되는 대상으로 실질적으로 본 발명의 음성 인식 장치로 볼 수 없으나, 발명의 설명상 함께 표시한다.
음성 입력부(101)는 사용자로부터 음성을 입력받는 장치로서, 마이크로폰이 될 수 있다. 사용자로부터 입력되는 음성 신호는 소정의 의미 및 음높이를 포함하게 된다.
음높이 분석부(103)는 음성 입력부(101)를 통해 입력된 음성에 포함된 음높이를 분석하는 장치로서, 음성의 주파수 정보를 이용하여 음높이를 측정할 수 있다. 음높이 분석부(103)는 음높이에 대해 미리 칼리브레이션(calibration) 과정을 수행하거나, 음높이의 기준을 사용자별로 미리 설정할 수도 있다.
상기 음높이 분석부(103)를 통해 측정된 음높이는 표시부(109)를 통해 출력될 수 있다. 사용자는 표시부(109)를 통해 입력되고 있는 음성의 음높이에 대한 피드백을 받을 수 있으므로, 사용자는 원하는 음높이 정도에 따라 적절하게 음높이를 조절할 수 있다.
음성 해석부(105)는 음성 입력부(101)를 통해 입력된 음성에 포함된 음성의 의미를 해석하는 장치로서, 음성에 포함된 발음을 기초로 의미를 해석할 수 있다.
제어부(107)는 음높이 분석부(103) 및 음성 해석부(105)에 의해 분석된 음높이 및 음성의 의미를 결합하여 차량내 유닛(111)에 대한 제어명령을 출력한다. 즉, 음성의 의미에 대응하는 차량내 유닛(111)이 음높이에 대응하는 정도로 제어될 수 있도록 제어명령을 출력한다.
예를 들어, “에어컨”이라는 단어가 낮은 음높이로 음성 입력부(101)를 통해 입력되는 경우, 제어부(107)는 차량내 유닛(111)인 에어컨이 대해 낮음 음높이에 해당하는 온도로 동작하도록 제어명령을 출력한다.
또 다른 실시예로서, “풍량”이라는 단어가 높은 음높이로 음성 입력부(101)를 통해 입력되는 경우, 제어부(107)는 풍량이 높은 음높이에 해당하는 세기로 동작하도록 제어명령을 출력한다.
한편, 제어부(107)는 음성 해석부(105)에 의해 분석된 음성의 의미에 대응하는 차량내 유닛(111)을 확인할 수 없거나, 분석된 음성의 의미가 불분명한 경우, 음성이 입력되는 시점에 차량내 동작 중인 차량내 유닛(111)이 음높이에 대응하는 정도로 제어되도록 제어명령을 출력한다.
예를 들어, 현재 차량에서 조명장치가 실행되고 있는 경우, “아”라는 단어가 높은 음높이로 음성 입력부(101)를 통해 입력되는 경우, 제어부(107)는 조명장치가 높은 음높이에 대응하는 정도의 밝기로 제어되도록 제어명령을 출력한다.
표시부(109)는 음높이 분석부(103)에 의해 측정된 음높이 또는 음성 해석부(105)에 의해 분석된 의미를 표시함으로써, 사용자가 원하는대로 음성 명령이 입력되고 있는지 피드백을 제공할 수 있다. 또한, 제어부(107)로부터 출력되는 차량내 유닛(111)에 대한 제어명령을 표시하여, 사용자가 실행될 차량내 유닛(111)의 동작에 대해 예측할 수 있도록 한다.
따라서, 사용자는 표시부(109)에 출력되는 음높이의 게이지를 보고, 음높이를 변경함으로써, 사용자가 원하는 음높이를 선택적으로 입력할 수 있다. 사용자가 음높이 조절을 위해 음높이가 변동되는 음성을 계속적으로 입력하는 경우, 제어부(107)는 음높이가 소정 시간이상 변경되지 않는 음성에 대해서만 음높이 분석부(103)의 분석 결과를 이용하여 제어명령을 출력함으로써, 사용자 의도에 부합하는 제어명령을 생성할 수 있다. 여기서 소정 시간이란 3초 내지 10초 사이의 시간으로 설정될 수 있고, 변동되지 않는 음성이란, 정확히 동일 음높이를 갖는 음성인 경우 뿐 아니라, 음높이가 변동하고 있으나 평균 음높이가 동일하게 유지되는 음성까지 포함하는 개념이다.
차량내 유닛(111)은 제어부(107)로부터 출력되는 제어명령에 따라 제어되는 차량내 장치로서, 공조장치, 윈도우, 난방장치, 조명장치, 멀티미디어 볼륨장치 등이 될 수 있다.
도 2는 본 발명의 일실시예에 따른 음석 인식 방법을 나타내는 흐름도이다.
도 2에 도시된 바와 같이, 먼저 음성 입력부(101)를 통해 사용자로부터 음성이 입력된다(S200).
다음, 입력된 음성에 대해 음높이 분석부(103) 및 음성 해석부(105)가 각각 음높이 및 음성의 의미를 분석한다(S210). 다음, 분석된 음높이 및 음성의 의미가 표시부(109)를 통해 표시된다(S220).
S220 단계에서 표시부(109)를 통해 표시되는 음높이 및 음성의 의미가 사용자 의도에 부합되는지 사용자에 의해 판단되어(S230), 부합되는 경우, 표시부(109)에 표시된 음높이 및 음성의 의미에 따라 차량내 유닛(111)이 제어된다(S240).
한편, 사용자 의도에 부합되지 않는 경우, 사용자는 음높이 또는 음성의 의미가 변경된 음성을 다시 입력할 것이므로, 새로운 음성이 입력된다.
본 발명은 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있다. 또한 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
또한, 본 발명은 상기 실시예에 한정되지 않으며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시도 가능하며, 변형실시는 본 발명의 기술적 사상이나 해결 원리로부터 개별적으로 이해되어서는 안될 것이다.

Claims (5)

  1. 음성 신호를 입력받는 음성 입력부;
    상기 음성 신호에 대한 음높이를 분석하는 음높이 분석부;
    상기 음성 신호에 대한 의미를 해석하는 음성 해석부; 및
    상기 음높이 분석부 및 상기 음성 해석부에 의해 분석된 음높이 및 의미에 따라, 상기 의미에 대응하는 차량내 유닛을 상기 음높이에 대응하는 정도로 제어하는 제어부를 포함하되, 상기 제어부는 상기 음성 해석부에 의해 분석된 의미가 불분명한 경우, 상기 음성 신호가 입력되는 시점에 동작 중인 차량 내 유닛을 상기 음높이에 대응하는 정도로 제어하고, 상기 음성 신호의 음높이가 변동되는 경우, 상기 제어부는 음높이가 소정 시간이상 변동되지 않는 음성 신호를 이용하여 차량내 유닛을 제어하는 음성 인식 장치.
  2. 제1항에 있어서,
    상기 음높이 분석부에 의해 분석된 음높이를 표시하는 표시부를 더 포함하는 음성 인식 장치.
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 차량내 유닛은 공조장치, 윈도우, 난방장치, 조명장치, 멀티미디어 볼륨장치 중 어느 하나인 것을 특징으로 하는 음성 인식 장치.
KR1020110094842A 2011-09-20 2011-09-20 음성 인식 장치 KR101724734B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110094842A KR101724734B1 (ko) 2011-09-20 2011-09-20 음성 인식 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110094842A KR101724734B1 (ko) 2011-09-20 2011-09-20 음성 인식 장치

Publications (2)

Publication Number Publication Date
KR20130031109A KR20130031109A (ko) 2013-03-28
KR101724734B1 true KR101724734B1 (ko) 2017-04-10

Family

ID=48180472

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110094842A KR101724734B1 (ko) 2011-09-20 2011-09-20 음성 인식 장치

Country Status (1)

Country Link
KR (1) KR101724734B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000284794A (ja) * 1999-03-31 2000-10-13 Canon Inc 音声認識装置及び方法、及び音声認識システム
JP2001166860A (ja) * 1999-12-07 2001-06-22 Canon Inc 情報処理装置、カーソル表示方法、及び記憶媒体
KR101022159B1 (ko) * 2004-03-04 2011-03-17 엘지전자 주식회사 차량용 네비게이션 장치 및 그 동작 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000284794A (ja) * 1999-03-31 2000-10-13 Canon Inc 音声認識装置及び方法、及び音声認識システム
JP2001166860A (ja) * 1999-12-07 2001-06-22 Canon Inc 情報処理装置、カーソル表示方法、及び記憶媒体
KR101022159B1 (ko) * 2004-03-04 2011-03-17 엘지전자 주식회사 차량용 네비게이션 장치 및 그 동작 방법

Also Published As

Publication number Publication date
KR20130031109A (ko) 2013-03-28

Similar Documents

Publication Publication Date Title
US20210082433A1 (en) Display apparatus and method for registration of user command
US10623811B1 (en) Methods and systems for detecting audio output of associated device
US7548861B2 (en) Speech recognition system
US11790891B2 (en) Wake word selection assistance architectures and methods
KR20150087025A (ko) 전자 장치 및 이의 음성 인식 방법
JP2009192942A (ja) 音声対話装置及び支援方法
US20230054864A1 (en) Methods and Apparatus for Audio Equalization Based on Variant Selection
KR20190083476A (ko) 디스플레이장치 및 그 제어방법
US20240147153A1 (en) Methods and Apparatus for Audio Equalization Based on Variant Selection
US20230419955A1 (en) Machine-trained network detecting context-sensitive wake expressions for a digital assistant
US20170366909A1 (en) Systems and methods for audio calibration using acoustic measurements
US11948567B2 (en) Electronic device and control method therefor
CN111417924A (zh) 电子设备及其控制方法
US20110110534A1 (en) Adjustable voice output based on device status
JP5277704B2 (ja) 音声認識装置及びこれを用いる車両システム
KR101724734B1 (ko) 음성 인식 장치
KR20160098881A (ko) 악기 보조 시스템
US20160299677A1 (en) Equalizer setting device, equalizer setting method, medium storing equalizer setting program
EP2924898B1 (en) Signal processing device and computer program for signal processing
JP7158110B2 (ja) オーディオ認識方法、オーディオ認識装置、電子機器、記憶媒体及びプログラム
JP2021517267A (ja) 音高に依存しない音色属性をメディア信号から抽出する方法及び装置
JP6536018B2 (ja) 音声制御システム、音声制御方法、及び音声制御プログラム
TW201409992A (zh) 電子裝置及其通過發聲裝置分辨應用程式的方法
RU2549298C1 (ru) Музыкально-акустический комплекс контроля высокоавтоматизированного летательного аппарата в испытательном полете
KR20140059662A (ko) 음성인식 데이터 처리 장치 및 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
GRNT Written decision to grant