KR100397610B1 - 음성 인식 및 처리 장치 및 방법 - Google Patents

음성 인식 및 처리 장치 및 방법 Download PDF

Info

Publication number
KR100397610B1
KR100397610B1 KR10-2001-0009276A KR20010009276A KR100397610B1 KR 100397610 B1 KR100397610 B1 KR 100397610B1 KR 20010009276 A KR20010009276 A KR 20010009276A KR 100397610 B1 KR100397610 B1 KR 100397610B1
Authority
KR
South Korea
Prior art keywords
voice
determined
input
unit
sound
Prior art date
Application number
KR10-2001-0009276A
Other languages
English (en)
Other versions
KR20020068896A (ko
Inventor
김재우
방석원
이미희
이형기
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-2001-0009276A priority Critical patent/KR100397610B1/ko
Publication of KR20020068896A publication Critical patent/KR20020068896A/ko
Application granted granted Critical
Publication of KR100397610B1 publication Critical patent/KR100397610B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics

Abstract

음성 인식 및 처리 장치 및 방법이 개시된다. 이 장치는, 소정 면적 이상에서 열의 분포가 감지되는가를 검사하고, 검사된 결과에 응답하여 감지 펄스를 발생하는 열 감지부와, 열 감지부의 근거리에 마련되어 소리를 외부로부터 입력하여 소리 신호로서 출력하는 소리 입력부와, 열 감지부로부터 발생되는 감지 펄스의 발생된 개수 및 발생 기간을 계산하고, 계산된 개수 및 계산된 발생 기간에 응답하여 음성 명령 입력 가능의 여부를 결정하고, 결정된 결과에 해당하는 메시지 데이타를 출력하는 제어부와, 소리 입력부로부터 입력한 소리 신호를 결정된 결과에 응답하여 음성 신호 처리하는 음성 신호 처리부 및 제어부로부터 출력되는 메시지 데이타에 해당하는 메시지를 사용자에게 표시하는 메시지 표시부를 구비하는 것을 특징으로 한다. 그러므로, 음성을 입력시키기 위해서 음성 제공자가 인위적으로 조작을 할 필요성을 제거시켜 보다 편리하게 유효한 음성을 인식할 수 있으며, 전력 절감을 달성할 수 있으며, 경제적으로 저렴하고 음성 명령 입력 가능 모드로의 빠른 진입이 가능하며, 음성 명령 인식에 대한 실패율이 낮은 효과를 갖는다.

Description

음성 인식 및 처리 장치 및 방법{Apparatus and method for perceiving and processing voice}
본 발명은 음성 인식에 관한 것으로서, 특히 자동으로 음성을 인식하여 처리할 수 있는 음성 인식 및 처리 장치 및 방법에 관한 것이다.
음성 인식 등을 포함하는 음성 관련 기술이 폭 넓게 이용되기 시작하면서 사용자에게 불편을 덜 주면서 음성 신호를 입력하는 여러가지의 다양한 음성 인식 및 처리 방법들이 개발되고 있다. 특히, 원거리에 위치한 기기로 음성 신호를 전달해야 하는 상황에서, 음성 입력에 필요한 마이크는 대부분 그 기기에 가깝게 위치하지 못하고 사용자 근처에 존재해야 한다. 이를 해결하기 위해, 무선 전송을 전제로 하는 해드폰(headphone)이나 핸드 헬드(handheld)등의 디바이스들이 개발되어 오고 있다. 이러한 디바이스들은 입력하기를 원하는 음성 신호와 입력하기를 원하지 않는 음성 신호를 구별하기 위해, 음성 신호의 입력 시작 혹은 음성 신호의 입력 끝을 판별하기 위한 다양한 방법들을 채택한다. 예로서, 핸드폰의 경우, 음성을 입력시키기 위해 음성 제공자는 인위적으로 핸드폰의 뚜껑을 열거나 음성을 입력한다는 것을 알리는 버튼을 눌른다. 그러나, 이러한 방법은 사용자를 번거롭게 하는 문제점을 갖는다.
그 밖에, 입력되는 모든 소리들중에서 인간의 음성만을 구별해내는 종래의 음성 인식 및 처리 방법들이 많이 개시되어 있다.
예를 들면, 국내 특허 공개 번호 P1998-083217인 "자동차용 핸즈프리 시스템의 노이즈 필터링 장치 및 그 방법"이란 제목의 특허, 국내 특허 공개 번호 P2000-056849인 "국내 음향 기기의 음성 인식 방법"이란 제목의 특허, 국내 특허 공개 번호 P2000-019199인 "심한 잡음 환경에서 이동 전화기의 음성 인식을 위한 음성 검출 방법 및 장치"란 제목의 특허에 종래의 다양한 음성 인식 및 처리 방법들이 개시되어 있다. 개시된 종래의 음성 인식 및 처리 방법들은 대상이 되는 타겟(target) 음성 신호는 이미 입력되고 있다고 간주하면서(또는, 마이크가 항상 온되어 있다고 간주하면서) 그 이후에 신호 처리 즉, 주변 잠음으로부터 음성 신호를 분리하는 것에 주된 관심을 갖는다. 그러므로, 이러한 종래의 음성 인식 및 처리 방법은 같은 사용자의 음성 신호들중에서 어떤 신호가 음성 인식되기를 요구하는 음성 신호이고 어떤 신호가 음성 인식되기를 요구하지 않은 음성 신호인가를 구별할 수 없는 문제점을 갖는다.
다른 예를 들면, 미국 특허 출원 번호 US6144938인 "Voice user interfacewith personality"라는 제목의 특허, 미국 특허 출원 번호 US5794187인 "Method and apparatus for improving effective signal to noise ratio in hearing aids and other communication systems used in noisy environments without loss of spectral information"라는 제목의 특허 및 미국 특허 출원 번호 US6070140인 "Speech recognizer"라는 제목의 특허에 종래의 음성 인식 및 처리 방법들이 개시되어 있다. US6144938 또는 US5794187에 개시된 종래의 음성 인식 및 처리 방법은 문장 중에 등장하는 대화의 구문(syntax)를 활용하여 음성 인식 대상에 해당하는 명령인가 아닌가를 구별한다. 그러나, 이 방법은 버튼을 사용하여 음성 인식 대상에 해당하는 명령인지의 여부를 판별시키는 버튼 방식에 대비할 때, 계산 시간을 증가시키고, 정확도를 저하시키는 문제점들을 갖는다. 또한, US6070140에 개시된 종래의 음성 인식 및 처리 방법은 전력 절감 모드로부터 벗어날 때, 마이크로 입력되는 음성 압력을 전기적 신호로 바꾸어 이를 웨이크 업(wake-up)으로 이용한다. 그러나, 이 방법은 매번 음성 명령을 입력시키려고 할 때마다 의미없는 소리로 시작해야 하는 문제점을 갖는다.
본 발명이 이루고자 하는 기술적 과제는, 소정 면적상에서 인간의 체온과 비슷한 열을 감지하여 자동으로 음성 명령 입력 가능 모드로 진입하거나 벗어날 수 있는 음성 인식 및 처리 장치를 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 상기 음성 인식 및 처리 장치에서 수행되는 음성 인식 및 처리 방법을 제공하는 데 있다.
도 1은 본 발명에 의한 음성 인식 및 처리 장치의 블럭도이다.
도 2는 도 1에 도시된 장치에서 수행되는 본 발명에 의한 음성 인식 및 처리 방법을 설명하기 위한 플로우차트이다.
상기 과제를 이루기 위한 본 발명에 의한 음성 인식 및 처리 장치는, 소정 면적 이상에서 열의 분포가 감지되는가를 검사하고, 검사된 결과에 응답하여 감지 펄스를 발생하는 열 감지부와, 상기 열 감지부의 근거리에 마련되어 소리를 외부로부터 입력하여 소리 신호로서 출력하는 소리 입력부와, 상기 열 감지부로부터 발생되는 상기 감지 펄스의 발생된 개수 및 발생 기간을 계산하고, 상기 계산된 개수 및 상기 계산된 발생 기간에 응답하여 음성 명령 입력 가능의 여부를 결정하고, 결정된 결과에 해당하는 메시지 데이타를 출력하는 제어부와, 상기 소리 입력부로부터 입력한 상기 소리 신호를 상기 결정된 결과에 응답하여 음성 신호 처리하는 음성 신호 처리부 및 상기 제어부로부터 출력되는 상기 메시지 데이타에 해당하는 메시지를 상기 사용자에게 표시하는 메시지 표시부로 구성되는 것이 바람직하다.
상기 다른 과제를 이루기 위해, 상기 음성 인식 및 처리 장치에서 수행되는 본 발명에 의한 음성 인식 및 처리 방법은, 상기 감지 펄스가 제1 소정 기간 이상 동안 지속적으로 발생되는가를 계속적으로 판단하는 (a) 단계와, 상기 감지 펄스가 상기 제1 소정 기간 이상 동안 지속적으로 발생되는 것으로 판단되면, 상기 음성 명령 입력이 가능하다는 메시지를 음성 제공자에게 표시하는 (b) 단계와, 상기 소리 신호를 음성 신호 처리하는 (c) 단계와, 상기 감지 펄스가 소정 시간 간격으로 발생되는가를 판단하고, 상기 감지 펄스가 상기 소정 시간 간격으로 발생되는 것으로 판단되면 상기 (b) 단계로 진행하는 (d) 단계와, 상기 감지 펄스가 상기 소정 시간 간격으로 발생되지 않은 것으로 판단되면, 상기 감지 펄스가 지속적으로 발생되지 않은 기간이 제2 소정 기간 보다 적은가를 판단하고, 상기 감지 펄스가 지속적으로 발생되지 않은 기간이 상기 제2 소정 기간 보다 적은 것으로 판단되면 상기 (b) 단계로 진행하는 (e) 단계와, 상기 감지 펄스가 지속적으로 발생되지 않은 기간이 상기 제2 소정 기간 보다 적지 않은 것으로 판단되면, 상기 음성 명령 입력이 가능하지 않다는 메시지를 음성 제공자에게 표시하는 (f) 단계 및 상기 소리 신호를 음성 신호 처리하지 않는 (g) 단계로 이루어지는 것이 바람직하다.
이하, 본 발명에 의한 음성 인식 및 처리 장치의 구성 및 동작을 첨부한 도면을 참조하여 다음과 같이 설명한다.
도 1은 본 발명에 의한 음성 인식 및 처리 장치의 블럭도로서, 열 감지부(10), 소리 입력부(12), 제어부(14), 음성 신호 처리부(16) 및 메시지 표시부(18)로 구성된다.
도 1에 도시된 열 감지부(10)는 소정 면적 이상에서 체온과 비슷한 열의 분포가 감지되는가를 검사하고, 검사된 결과에 응답하여 감지 펄스를 발생하는 역할을 한다. 예컨데, 열 감지부(10)는 소정 면적 이상에서 열의 분포가 감지되는 동안 일정한 시간 간격으로 감지 펄스를 주기적으로 발생하여 준다. 여기서, 도 1에 도시된 장치를 사용하는 사용자(또는, 음성 제공자)가 음성을 입력시키기 위해서 열 감지부(10)와 근거리에 마련되는 소리 입력부(12)를 얼굴에 가깝게 근접시킬 때, 이를 감지할 수 있을 정도로 소정 면적은 결정된다. 이 때, 열 감지부(10)는 열의 분포를 적외선을 이용하여 감지하는 적외선 센서 따위로 구현될 수 있다. 예를 들어, 열 감지부(10)는 'EG G MEIMANN' 회사에서 제작된 'Pyroelectric InfraredSensor'들중에서 'Therpile Sensor 434'라는 제품으로 구현될 수 있다.
소리 입력부(12)는 열 감지부(10)의 근거리에 마련되어 예를 들면, 열 감지부(10)와 일체화되어 소리를 외부로부터 입력하여 소리 신호로서 제어부(14) 및 음성 신호 처리부(16)로 각각 출력한다. 여기서, 소리 입력부(12)는 마이크 따위에 해당한다.
제어부(14)는 열 감지부(10)로부터 발생되는 감지 펄스의 발생 기간을 계산하고, 계산된 결과에 응답하여 음성 명령 입력 가능의 여부를 결정하고, 결정된 결과에 해당하는 메시지 데이타를 메시지 표시부(18)로 출력한다. 예컨데, 제어부(14)는 감지 펄스의 발생 기간을 계산하여, 사용자가 음성을 입력시키고자 하는가를 판단하고, 판단된 결과에 해당하는 메시지 데이타 즉, 음성 명령이 현재 입력될 수 있다는 메시지나 음성 명령이 현재 입력될 수 없는 메시지를 나타내는 메시지 데이타를 메시지 표시부(18)로 출력한다. 이 때, 제어부(14)는 음성 명령 입력 가능의 여부를 결정하기 위해서, 열 감지부(10)에서 감지 펄스가 발생된 개수를 계산한다든지, 소리 입력부(12)로부터 입력한 소리 신호의 전력 스펙트럼이 인간의 음성에 대한 전력 스펙트럼 범위내에 존재하는가를 검사할 수도 있다. 이 경우, 제어부(14)는 계산된 발생 기간, 계산된 개수 및 전력 스펙트럼을 조사한 결과에 응답하여 음성 명령 입력 가능의 여부를 결정한다. 여기서, 인간의 음성에 대한 전력 스펙트럼은 200 ∼ 4000㎐가 될 수 있다.
메시지 표시부(18)는 전술한 바와 같이 제어부(14)로부터 출력되는 메시지 데이타에 해당하는 메시지를 사용자에게 표시하는 역할을 한다. 예컨데,제어부(14)에서 음성 명령 입력 가능으로 결정될 경우, 메시지 표시부(18)는 제어부(14)로부터 입력한 메시지 데이타를 이용하여 음성 명령의 입력이 가능하다는 메시지 즉, 음성 제공자가 음성을 제공해도 좋다는 메시지를 음성 제공자에게 보여준다. 그러므로, 사용자는 메시지 표시부(18)에 표시되는 메시지를 확인한 후 소리 입력부(12)로 음성을 제공할 수 있다. 여기서, 메시지 표시부(18)는 해당하는 메시지를 시각적으로 또는 청각적으로 사용자에게 제공할 수 있다. 즉, 메시지 표시부(18)는 액정 표시부(미도시) 또는 스피커(미도시) 따위로 구현될 수 있다.
한편, 음성 신호 출력부(16)는 소리 입력부(12)로부터 입력한 소리 신호를 제어부(14)에서 결정된 결과에 응답하여 음성 신호 처리하고, 음성 신호 처리된 결과를 출력단자 OUT를 통해 출력한다. 즉, 제어부(14)는 음성 명령의 입력이 가능하다고 결정할 경우 음성 신호 처리부(16)를 음성 명령 입력 가능 모드로 진입시키고, 음성 명령의 입력이 가능하지 않다고 결정할 경우 음성 신호 처리부(16)를 음성 명령 불 가능 모드로 진입시킨다. 예컨데, 음성 신호 처리부(16)는 소리 입력부(12)로부터 입력한 소리 신호를, 음성 명령 입력 가능 모드에서 음성으로서 인식하여 음성 신호 처리하고, 음성 명령 불가능 모드에서 음성이 아닌 유효하지 않은 데이타로서 취급하여 음성 신호 처리하지 않는다.
여기서, 출력단자 OUT를 통해 출력되는 음성 신호 처리된 결과는 기록부(미도시)에 기록될 수도 있고, 음성 신호 처리된 결과가 갖는 정보를 인식하는 음성 인식부(미도시)로 전송될 수도 있고, 음성 신호 처리된 결과를 원격으로 무선 전송하는 음성 전송부(미도시)로 전송될 수도 있다.
이하, 도 1에 도시된 음성 인식 및 처리 장치에서 수행되는 본 발명에 의한 음성 인식 및 처리 방법을 첨부한 도면을 참조하여 다음과 같이 설명한다.
도 2는 도 1에 도시된 장치에서 수행되는 본 발명에 의한 음성 인식 및 처리 방법을 설명하기 위한 플로우차트로서, 감지 펄스 및 실패 가중치를 이용하여 음성 신호 처리를 수행하거나 음성 신호 처리를 수행하지 않는 단계(제40 ∼ 제64 단계들)로 이루어진다.
도 1에 도시된 음성 인식 및 처리 장치는 본 발명에 의한 음성 인식 및 처리 방법을 수행하기 위해, 먼저 실패 가중치를 초기화한다(제40 단계).
제40 단계후에, 제어부(14)는 열 감지부(10)로부터 발생되는 감지 펄스가 제1 소정 기간 이상 동안 지속적으로 발생되는가를 계속적으로 판단한다(제42 단계). 만일, 감지 펄스가 제1 소정 기간 이상 동안 지속적으로 발생되는 것으로 판단되면, 제어부(14)는 음성 명령 입력이 가능하다는 메시지를 갖는 메시지 데이타를 메시지 표시부(18)로 출력하고, 메시지 표시부(18)는 음성 명령 입력이 가능하다는 메시지를 음성 제공자에게 표시한다(제44 단계).
제44 단계후에, 제어부(14)의 제어하에 음성 신호 처리부(16)는 음성 명령 입력 가능 모드로 진입하여 소리 입력부(12)로부터 입력한 소리 신호를 음성 신호 처리하고, 음성 신호 처리된 결과를 출력단자 OUT를 통해 출력한다(제46 단계).
제46 단계후에, 제어부(14)는 열 감지부(10)로부터 감지 펄스가 소정 시간 간격으로 발생되는가를 판단한다(제48 단계). 만일, 감지 펄스가 소정 시간 간격으로 발생되는 것으로 판단되면 제44 단계로 진행하고, 제어부(14)는 메시지표시부(18) 및 음성 신호 처리부(16)를 제어하여 제44 및 제46 단계가 수행되도록 한다.
그러나, 감지 펄스가 소정 시간 간격으로 발생되지 않은 것으로 판단되면, 제어부(14)는 제3 소정 기간 동안 열 감지부(10)로부터 발생된 감지 펄스의 개수가 제1 소정 임계값보다 큰가를 판단한다(제50 단계). 만일, 제3 소정 기간 동안 발생된 감지 펄스의 개수가 제1 소정 임계값 이하인 것으로 판단되면, 제어부(14)는 실패 가중치를 예를 들면 '1'만큼 증가시킨다(제52 단계).
이 때, 제3 소정 기간 동안 발생된 감지 펄스의 개수가 제1 소정 임계값 보다 큰 것으로 판단되거나 제52 단계후에, 제어부(14)는 제4 소정 기간 동안에 소리 입력부(12)로부터 입력한 소리 신호의 전력 스펙트럼이 인간의 음성에 대한 전력 스펙트럼 범위내에 존재하는가를 판단한다(제54 단계). 만일, 제4 소정 기간 동안에 입력된 소리 신호의 전력 스펙트럼이 음성에 대한 전력 스펙트럼의 범위내에 존재하는 것으로 판단되면 제58 단계로 진행한다.
그러나, 제4 소정 기간 동안에 입력된 소리 신호의 전력 스펙트럼이 음성에 대한 전력 스펙트럼의 범위내에 존재하지 않은 것으로 판단되면, 제어부(14)는 실패 가중치를 제52 단계에서 보다 더 증가시키고 예를 들면 실패 가중치를 '3'만큼 증가시키고 제58 단계로 진행한다.
한편, 제4 소정 기간 동안에 입력된 소리 신호의 전력 스펙트럼이 음성에 대한 전력 스펙트럼의 범위내에 존재하는 것으로 판단되거나 제56 단계후에, 제어부(14)는 열 감지부(10)로부터 감지 펄스가 지속적으로 발생되지 않은 기간이제2 소정 기간 보다 적은가를 판단한다(제58 단계).
이 때, 감지 펄스가 지속적으로 발생되지 않은 기간이 제2 소정 기간 보다 적은 것으로 판단되면, 제어부(14)는 실패 가중치가 제2 소정 임계값보다 적은가를 판단한다(제60 단계).
만일, 실패 가중치가 제2 소정 임계값보다 적은 것으로 판단되면, 제44 단계로 진행한다. 그러나, 실패 가중치가 제2 소정 임계값 보다 적지 않은 것으로 판단되거나 감지 펄스가 지속적으로 발생되지 않은 기간이 제2 소정 기간 보다 적지 않은 것으로 판단되면, 제어부(14)는 음성 명령 입력이 가능하지 않다는 메시지에 해당하는 메시지 데이타를 메시지 표시부(18)로 출력하고, 메시지 표시부(18)는 음성 명령 입력이 가능하지 않다는 메시지를 음성 제공자에게 표시한다(제62 단계).
제62 단계후에, 음성 신호 처리부(16)는 음성 명령 입력 불가능 모드로 진입하여 소리 입력부(12)로부터 입력한 소리 신호를 음성 신호 처리하지 않는다. 이와 같이, 음성 신호 처리부(16)는 제어부(14)의 제어하에 음성 명령 입력 가능 모드로 진입할 때만 소리 신호를 음성 신호 처리하고, 음성 명령 입력 불가능 모드로 진입하면 소리 신호를 음성 신호 처리하지 않고 대기 상태가 된다. 그러므로, 음성 신호 처리부(16)에서 음성이 아닌 소리 신호를 음성 신호 처리하기 때문에 불필요하게 소모될 수 있는 전력을 절감시킬 수 있다.
도 2에 도시된 제50, 52, 54, 56 및 제60 단계들은 선택적으로 마련될 수 있다. 예컨데, 제50, 52, 54, 56 및 제60 단계들이 마련되지 않을 때, 본 발명에 의한 음성 인식 및 처리 방법은 다음과 같이 수행된다. 예컨데, 제48 단계에서 감지펄스가 소정 시간 간격으로 발생되지 않으면 제58 단계로 진행하고, 제58 단계에서 감지 펄스가 지속적으로 발생되지 않은 기간이 제2 소정 기간보다 적은 것으로 판단되면 제44 단계로 진행한다.
결국, 도 1 및 도 2에 도시된 본 발명에 의한 음성 인식 및 처리 장치 및 방법은, 소리 입력부(12)와 근거리에 마련되어 있는 열 감지부(10)로 소정 면적 이상에서 열을 감지하여 음성 제공자가 음성을 제공하기 위해서 얼굴 특히, 입 가까이에 소리 입력부(12)를 위치시키는 것을 자동으로 인식하여 음성 명령 입력 가능 모드나 음성 명령 입력 불가능 모드로 진입한다. 따라서, 음성을 받아들일 순간과 음성을 받아들이는 것을 중단할 순간을 자동으로 포착할 수 있다.
이상에서 설명한 바와 같이, 본 발명에 의한 음성 인식 및 처리 장치 및 방법은 말을 하기 위해서 얼굴과 마이크가 근접하게 된다는 점에 착안하여 자동으로 음성 입력 가능 모드로 진입할 수 있기 때문에, 음성을 입력시키기 위해서 음성 제공자가 핸드폰의 뚜껑을 연다든지 음성 인식 시작 버튼 따위를 인위적으로 누를 필요성을 제거시켜 보다 편리하게 유효한 음성을 인식할 수 있으며, 음성 신호 처리가 필요할 때만 음성 신호 처리부(16)를 동작시켜 전력 절감을 달성할 수 있으며, 구문 활용 방법에 대비하여 경제적으로 저렴하고 음성 명령 입력 가능 모드로의 빠른 진입이 가능하며, 음성 명령 인식에 대한 실패율이 낮은 효과를 갖는다.

Claims (6)

  1. 소정 면적 이상에서 열의 분포가 감지되는가를 검사하고, 검사된 결과에 응답하여 감지 펄스를 발생하는 열 감지부;
    상기 열 감지부의 근거리에 마련되어 소리를 외부로부터 입력하여 소리 신호로서 출력하는 소리 입력부;
    상기 열 감지부로부터 발생되는 상기 감지 펄스의 발생된 개수 및 발생 기간을 계산하고, 상기 계산된 개수 및 상기 계산된 발생 기간에 응답하여 음성 명령 입력 가능의 여부를 결정하고, 결정된 결과에 해당하는 메시지 데이타를 출력하는 제어부;
    상기 소리 입력부로부터 입력한 상기 소리 신호를 상기 결정된 결과에 응답하여 음성 신호 처리하는 음성 신호 처리부; 및
    상기 제어부로부터 출력되는 상기 메시지 데이타에 해당하는 메시지를 상기 사용자에게 표시하는 메시지 표시부를 구비하는 것을 특징으로 하는 음성 인식 및 처리 장치.
  2. 삭제
  3. 제1 항에 있어서, 상기 제어부는
    상기 소리 신호의 전력 스펙트럼이 인간의 음성에 대한 전력 스펙트럼 범위내에 존재하는가를 검사한 결과, 상기 계산된 개수 및 상기 계산된 발생 기간에 응답하여 상기 음성 명령 입력 가능의 여부를 결정하는 것을 특징으로 하는 음성 인식 및 처리 장치.
  4. 제1 항에 있어서, 상기 열 감지부는 상기 열의 분포를 적외선을 이용하여 감지하는 것을 특징으로 하는 음성 인식 및 처리 장치.
  5. 제1 항의 상기 음성 인식 및 처리 장치에서 수행되는 음성 인식 및 처리 방법에 있어서,
    (a) 상기 감지 펄스가 제1 소정 기간 이상 동안 지속적으로 발생되는가를 계속적으로 판단하는 단계;
    (b) 상기 감지 펄스가 상기 제1 소정 기간 이상 동안 지속적으로 발생되는 것으로 판단되면, 상기 음성 명령 입력이 가능하다는 메시지를 음성 제공자에게 표시하는 단계;
    (c) 상기 소리 신호를 음성 신호 처리하는 단계;
    (d) 상기 감지 펄스가 소정 시간 간격으로 발생되는가를 판단하고, 상기 감지 펄스가 상기 소정 시간 간격으로 발생되는 것으로 판단되면 상기 (b) 단계로 진행하는 단계;
    (e) 상기 감지 펄스가 상기 소정 시간 간격으로 발생되지 않은 것으로 판단되면, 상기 감지 펄스가 지속적으로 발생되지 않은 기간이 제2 소정 기간 보다 적은가를 판단하고, 상기 감지 펄스가 지속적으로 발생되지 않은 기간이 상기 제2 소정 기간 보다 적은 것으로 판단되면 상기 (b) 단계로 진행하는 단계;
    (f) 상기 감지 펄스가 지속적으로 발생되지 않은 기간이 상기 제2 소정 기간 보다 적지 않은 것으로 판단되면, 상기 음성 명령 입력이 가능하지 않다는 메시지를 음성 제공자에게 표시하는 단계; 및
    (g) 상기 소리 신호를 음성 신호 처리하지 않는 단계를 구비하는 것을 특징으로 하는 음성 인식 및 처리 방법.
  6. 제5 항에 있어서, 상기 음성 인식 및 처리 방법은
    (h) 상기 (d) 단계에서 상기 감지 펄스가 상기 소정 시간 간격으로 발생되지 않은 것으로 판단되면, 제3 소정 기간 동안 발생된 상기 감지 펄스의 개수가 제1 소정 임계값보다 큰가를 판단하는 단계;
    (i) 상기 제3 소정 기간 동안 발생된 상기 감지 펄스의 개수가 상기 제1 소정 임계값 이하인 것으로 판단되면, 실패 가중치를 증가시키는 단계;
    (j) 상기 제3 소정 기간 동안 발생된 상기 감지 펄스의 개수가 상기 제1 소정 임계값 보다 큰 것으로 판단되거나 상기 (i) 단계후에, 제4 소정 기간 동안에 상기 소리 신호의 전력 스펙트럼이 인간의 음성에 대한 전력 스펙트럼 범위내에 존재하는가를 판단하고, 상기 제4 소정 기간 동안에 상기 소리 신호의 전력 스펙트럼이 상기 음성에 대한 전력 스펙트럼의 범위내에 존재하는 것으로 판단되면 상기 (e) 단계로 진행하는 단계;
    (k) 상기 제4 소정 기간 동안에 상기 소리 신호의 전력 스펙트럼이 상기 음성에 대한 전력 스펙트럼의 범위내에 존재하지 않는 것으로 판단되면, 상기 실패 가중치를 상기 (i) 단계에서 보다 더 증가시키고 상기 (e) 단계로 진행하는 단계; 및 (l) 상기 (e) 단계에서 상기 감지 펄스가 지속적으로 발생되지 않은 기간이 상기 제2 소정 기간 보다 적은 것으로 판단되면, 상기 실패 가중치가 제2 소정 임계값보다 적은가를 판단하고, 상기 실패 가중치가 상기 제2 소정 임계값보다 적은 것으로 판단되면 상기 (b) 단계로 진행하고, 상기 실패 가중치가 상기 제2 소정 임계값 보다 적지 않은 것으로 판단되면 상기 (f) 단계로 진행하는 단계를 더 구비하는 것을 특징으로 하는 음성 인식 및 처리 방법.
KR10-2001-0009276A 2001-02-23 2001-02-23 음성 인식 및 처리 장치 및 방법 KR100397610B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0009276A KR100397610B1 (ko) 2001-02-23 2001-02-23 음성 인식 및 처리 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0009276A KR100397610B1 (ko) 2001-02-23 2001-02-23 음성 인식 및 처리 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20020068896A KR20020068896A (ko) 2002-08-28
KR100397610B1 true KR100397610B1 (ko) 2003-09-13

Family

ID=27695348

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0009276A KR100397610B1 (ko) 2001-02-23 2001-02-23 음성 인식 및 처리 장치 및 방법

Country Status (1)

Country Link
KR (1) KR100397610B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0297998A (ja) * 1988-10-05 1990-04-10 Sekisui Chem Co Ltd 音声判定方式
JPH0522381A (ja) * 1991-07-16 1993-01-29 Seikosha Co Ltd 電話機
JPH1011089A (ja) * 1996-06-24 1998-01-16 Nippon Soken Inc 赤外線検出素子を用いた入力装置
JP2000341376A (ja) * 1999-05-28 2000-12-08 Kyocera Corp 携帯電話機

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0297998A (ja) * 1988-10-05 1990-04-10 Sekisui Chem Co Ltd 音声判定方式
JPH0522381A (ja) * 1991-07-16 1993-01-29 Seikosha Co Ltd 電話機
JPH1011089A (ja) * 1996-06-24 1998-01-16 Nippon Soken Inc 赤外線検出素子を用いた入力装置
JP2000341376A (ja) * 1999-05-28 2000-12-08 Kyocera Corp 携帯電話機

Also Published As

Publication number Publication date
KR20020068896A (ko) 2002-08-28

Similar Documents

Publication Publication Date Title
US7356473B2 (en) Management and assistance system for the deaf
US20040155770A1 (en) Audible alarm relay system
US20130202130A1 (en) Motion Based Compensation of Uplinked Audio
CN111432303B (zh) 单耳耳机、智能电子设备、方法和计算机可读介质
CN106797507A (zh) 低功率声学装置和操作方法
TR200000030T2 (tr) Telefon zili sinyalinin kontrol edilmesi için yöntem ve tertibat
CN109065060B (zh) 一种语音唤醒方法及终端
KR20100081587A (ko) 로봇의 소리 인식 장치 및 그 제어 방법
WO2020056329A1 (en) Energy efficient custom deep learning circuits for always-on embedded applications
DE60223945D1 (de) Spracherkennungs- und diskriminationsvorrichtung und verfahren
KR102259428B1 (ko) 로봇
US20050068177A1 (en) Security device for detecting change of air pressure and method thereof
KR100397610B1 (ko) 음성 인식 및 처리 장치 및 방법
US9697700B2 (en) Ambient condition detector with processing of incoming audible commands followed by speech recognition
JP3233390U (ja) 通知装置及びウェアラブル装置
JP3926280B2 (ja) 音声認識システム
WO2010100852A1 (ja) 弁別センサ、電子機器及び監視システム、並びに、被検体の弁別方法
CN111326175A (zh) 一种对话者的提示方法及穿戴设备
JPH02132499A (ja) 音声入力装置
KR20190068182A (ko) 인공지능 디바이스, 서비스 서버 및 그의 사용자 인터페이스 제공 방법
JP2002183859A (ja) 異常判別通報装置
GB2550118A (en) Sensing device for detecting alarm bell of siren
NL2016751B1 (en) Sensing device for detecting alarm bell of siren
GB2298067A (en) Personal attack alarms
KR20200034056A (ko) 복수의 인공지능 음성단말장치를 이용하여 구역별 전자장치를 제어하는 시스템 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120716

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20130724

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20140721

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20150716

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20160718

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20170807

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20180809

Year of fee payment: 16

FPAY Annual fee payment

Payment date: 20190819

Year of fee payment: 17