KR101724734B1

KR101724734B1 - 음성 인식 장치

Info

Publication number: KR101724734B1
Application number: KR1020110094842A
Authority: KR
Inventors: 허동필; 서재암; 박재우; 배현철; 윤헌중
Original assignee: 현대자동차주식회사
Priority date: 2011-09-20
Filing date: 2011-09-20
Publication date: 2017-04-10
Also published as: KR20130031109A

Abstract

본 발명은 음성 인식 장치로서, 음성 신호를 입력받는 음성 입력부, 상기 음성 신호에 대한 음높이를 분석하는 음높이 분석부, 상기 음성 신호에 대한 의미를 해석하는 음성 해석부, 및 상기 음높이 분석부 및 상기 음성 해석부에 의해 분석된 음높이 및 의미에 따라, 상기 의미에 대응하는 차량내 유닛을 상기 음높이에 대응하는 정도로 제어하는 제어부를 포함한다.

Description

음성 인식 장치{Voice recognition device}

본 발명은 음성 인식 장치에 관한 것으로, 보다 상세하게는 음성에 포함되는 의미와 음높이를 이용하는 음성 인식 장치에 관한 것이다.

일반적으로 음성 인식 장치는 제어대상을 설정하기 위한 제1음성 및 제어대상을 어느 정도로 제어할지를 설정하기 위한 제2음성을 입력받아, 제1음성에 의해 선택된 제어대상을 제2음성에 의해 선택된 정도로 제어하고 있다.

제2음성의 경우, 한국어상에서는 “일”, “이”, “삼”, “사” 등으로 표현될 수 있는데, 상기한 바와 같이 단음절을 갖는 단어들은 실제 음성 인식 과정에서 비슷한 발성에 의해 인식 오류가 발생할 확률이 높다.

따라서, 종래의 음성 인식 장치는 인식 오류에 의한 오작동이 발생하는 경우가 많고, 음성 인식이 제대로 수행되지 않아 사용자가 반복적으로 동일 음성을 입력해야 하는 불편함을 초래한다.

본 발명은 음성의 의미 및 음높이를 모두 이용하여 음성 인식을 수행함으로써, 음성 인식률이 높고, 사용자가 편리하게 이용할 수 있는 음성 인식 장치를 제공하는데 그 목적이 있다.

본 발명은 음성 신호를 입력받는 음성 입력부, 상기 음성 신호에 대한 음높이를 분석하는 음높이 분석부, 상기 음성 신호에 대한 의미를 해석하는 음성 해석부, 및 상기 음높이 분석부 및 상기 음성 해석부에 의해 분석된 음높이 및 의미에 따라, 상기 의미에 대응하는 차량내 유닛을 상기 음높이에 대응하는 정도로 제어하는 제어부를 포함한다.

본 발명에 따르면, 사용자는 제어의 정도를 설정하기 위한 별도의 음성을 반복적으로 입력할 필요없이, 제어 대상을 뜻하는 단어에 다양한 음높이를 결합하여 입력할 수 있어, 보다 간편하게 음성 인식 장치를 이용할 수 있다.

또한, 제어의 정도를 설정하기 위한 별도의 음성에 의해 발생하는 인식 오류를 줄일 수 있어, 인식률이 높은 음성 인식 장치를 제공할 수 있다.

또한, 음높이에 따른 게이지를 사용자에게 제공함으로써, 사용자는 입력되고 있는 음높이에 대한 피드백을 받아, 적절하게 음성 인식 장치를 이용할 수 있다.

도 1은 본 발명의 일실시예에 따른 음성 인식 장치를 나타내는 구성도이다.
도 2는 본 발명의 일실시예에 따른 음석 인식 방법을 나타내는 흐름도이다.

도 1은 본 발명의 일실시예에 따른 음성 인식 장치를 나타내는 구성도이다.

도 1에 도시된 바와 같이, 음성 인식 장치는 음성 입력부(101), 음높이 분석부(103), 음성 해석부(105), 제어부(107), 표시부(109) 및 차량내 유닛(111)이 포함될 수 있다. 차량내 유닛(111)은 음석 인식 장치로부터 출력되는 신호에 따라 제어되는 대상으로 실질적으로 본 발명의 음성 인식 장치로 볼 수 없으나, 발명의 설명상 함께 표시한다.

음성 입력부(101)는 사용자로부터 음성을 입력받는 장치로서, 마이크로폰이 될 수 있다. 사용자로부터 입력되는 음성 신호는 소정의 의미 및 음높이를 포함하게 된다.

음높이 분석부(103)는 음성 입력부(101)를 통해 입력된 음성에 포함된 음높이를 분석하는 장치로서, 음성의 주파수 정보를 이용하여 음높이를 측정할 수 있다. 음높이 분석부(103)는 음높이에 대해 미리 칼리브레이션(calibration) 과정을 수행하거나, 음높이의 기준을 사용자별로 미리 설정할 수도 있다.

상기 음높이 분석부(103)를 통해 측정된 음높이는 표시부(109)를 통해 출력될 수 있다. 사용자는 표시부(109)를 통해 입력되고 있는 음성의 음높이에 대한 피드백을 받을 수 있으므로, 사용자는 원하는 음높이 정도에 따라 적절하게 음높이를 조절할 수 있다.

음성 해석부(105)는 음성 입력부(101)를 통해 입력된 음성에 포함된 음성의 의미를 해석하는 장치로서, 음성에 포함된 발음을 기초로 의미를 해석할 수 있다.

제어부(107)는 음높이 분석부(103) 및 음성 해석부(105)에 의해 분석된 음높이 및 음성의 의미를 결합하여 차량내 유닛(111)에 대한 제어명령을 출력한다. 즉, 음성의 의미에 대응하는 차량내 유닛(111)이 음높이에 대응하는 정도로 제어될 수 있도록 제어명령을 출력한다.

예를 들어, “에어컨”이라는 단어가 낮은 음높이로 음성 입력부(101)를 통해 입력되는 경우, 제어부(107)는 차량내 유닛(111)인 에어컨이 대해 낮음 음높이에 해당하는 온도로 동작하도록 제어명령을 출력한다.

또 다른 실시예로서, “풍량”이라는 단어가 높은 음높이로 음성 입력부(101)를 통해 입력되는 경우, 제어부(107)는 풍량이 높은 음높이에 해당하는 세기로 동작하도록 제어명령을 출력한다.

한편, 제어부(107)는 음성 해석부(105)에 의해 분석된 음성의 의미에 대응하는 차량내 유닛(111)을 확인할 수 없거나, 분석된 음성의 의미가 불분명한 경우, 음성이 입력되는 시점에 차량내 동작 중인 차량내 유닛(111)이 음높이에 대응하는 정도로 제어되도록 제어명령을 출력한다.

예를 들어, 현재 차량에서 조명장치가 실행되고 있는 경우, “아”라는 단어가 높은 음높이로 음성 입력부(101)를 통해 입력되는 경우, 제어부(107)는 조명장치가 높은 음높이에 대응하는 정도의 밝기로 제어되도록 제어명령을 출력한다.

표시부(109)는 음높이 분석부(103)에 의해 측정된 음높이 또는 음성 해석부(105)에 의해 분석된 의미를 표시함으로써, 사용자가 원하는대로 음성 명령이 입력되고 있는지 피드백을 제공할 수 있다. 또한, 제어부(107)로부터 출력되는 차량내 유닛(111)에 대한 제어명령을 표시하여, 사용자가 실행될 차량내 유닛(111)의 동작에 대해 예측할 수 있도록 한다.

따라서, 사용자는 표시부(109)에 출력되는 음높이의 게이지를 보고, 음높이를 변경함으로써, 사용자가 원하는 음높이를 선택적으로 입력할 수 있다. 사용자가 음높이 조절을 위해 음높이가 변동되는 음성을 계속적으로 입력하는 경우, 제어부(107)는 음높이가 소정 시간이상 변경되지 않는 음성에 대해서만 음높이 분석부(103)의 분석 결과를 이용하여 제어명령을 출력함으로써, 사용자 의도에 부합하는 제어명령을 생성할 수 있다. 여기서 소정 시간이란 3초 내지 10초 사이의 시간으로 설정될 수 있고, 변동되지 않는 음성이란, 정확히 동일 음높이를 갖는 음성인 경우 뿐 아니라, 음높이가 변동하고 있으나 평균 음높이가 동일하게 유지되는 음성까지 포함하는 개념이다.

차량내 유닛(111)은 제어부(107)로부터 출력되는 제어명령에 따라 제어되는 차량내 장치로서, 공조장치, 윈도우, 난방장치, 조명장치, 멀티미디어 볼륨장치 등이 될 수 있다.

도 2는 본 발명의 일실시예에 따른 음석 인식 방법을 나타내는 흐름도이다.

도 2에 도시된 바와 같이, 먼저 음성 입력부(101)를 통해 사용자로부터 음성이 입력된다(S200).

다음, 입력된 음성에 대해 음높이 분석부(103) 및 음성 해석부(105)가 각각 음높이 및 음성의 의미를 분석한다(S210). 다음, 분석된 음높이 및 음성의 의미가 표시부(109)를 통해 표시된다(S220).

S220 단계에서 표시부(109)를 통해 표시되는 음높이 및 음성의 의미가 사용자 의도에 부합되는지 사용자에 의해 판단되어(S230), 부합되는 경우, 표시부(109)에 표시된 음높이 및 음성의 의미에 따라 차량내 유닛(111)이 제어된다(S240).

한편, 사용자 의도에 부합되지 않는 경우, 사용자는 음높이 또는 음성의 의미가 변경된 음성을 다시 입력할 것이므로, 새로운 음성이 입력된다.

본 발명은 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있다. 또한 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

또한, 본 발명은 상기 실시예에 한정되지 않으며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시도 가능하며, 변형실시는 본 발명의 기술적 사상이나 해결 원리로부터 개별적으로 이해되어서는 안될 것이다.

Claims

음성 신호를 입력받는 음성 입력부;
상기 음성 신호에 대한 음높이를 분석하는 음높이 분석부;
상기 음성 신호에 대한 의미를 해석하는 음성 해석부; 및
상기 음높이 분석부 및 상기 음성 해석부에 의해 분석된 음높이 및 의미에 따라, 상기 의미에 대응하는 차량내 유닛을 상기 음높이에 대응하는 정도로 제어하는 제어부를 포함하되, 상기 제어부는 상기 음성 해석부에 의해 분석된 의미가 불분명한 경우, 상기 음성 신호가 입력되는 시점에 동작 중인 차량 내 유닛을 상기 음높이에 대응하는 정도로 제어하고, 상기 음성 신호의 음높이가 변동되는 경우, 상기 제어부는 음높이가 소정 시간이상 변동되지 않는 음성 신호를 이용하여 차량내 유닛을 제어하는 음성 인식 장치.
제1항에 있어서,
상기 음높이 분석부에 의해 분석된 음높이를 표시하는 표시부를 더 포함하는 음성 인식 장치.
삭제
삭제
제1항에 있어서,
상기 차량내 유닛은 공조장치, 윈도우, 난방장치, 조명장치, 멀티미디어 볼륨장치 중 어느 하나인 것을 특징으로 하는 음성 인식 장치.