KR100855592B1 - Apparatus and method for robust speech recognition of speaker distance character - Google Patents
Apparatus and method for robust speech recognition of speaker distance character Download PDFInfo
- Publication number
- KR100855592B1 KR100855592B1 KR1020070003187A KR20070003187A KR100855592B1 KR 100855592 B1 KR100855592 B1 KR 100855592B1 KR 1020070003187 A KR1020070003187 A KR 1020070003187A KR 20070003187 A KR20070003187 A KR 20070003187A KR 100855592 B1 KR100855592 B1 KR 100855592B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- distance
- unit
- output
- input
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000001514 detection method Methods 0.000 claims description 12
- 238000012805 post-processing Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 230000001755 vocal effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
본 발명은 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법을 제공하기 위한 것으로, 근거리 음성녹음부와 원거리 음성녹음부에 의해 입력된 음성을 동시에 받아들여 녹음하는 거리별 음성녹음부와; 상기 거리별 음성녹음부에 출력된 거리별 음성을 입력받아 외부잡음을 추정하여 녹음음성에서 제거하는 외부잡음 제거부와; 상기 외부잡음 제거부에서 외부잡음이 제거된 녹음음성을 입력받아 원거리와 근거리의 거리특성이 반영된 입력 음성 중에서 어느 음성이 음성인식 성능을 높일 수 있는 지 확인하여 선정하는 입력음성 선정부와; 상기 입력음성 선정부에서 선정된 음성을 입력받아 음성인식을 수행하는 음성인식부;를 포함하여 구성함으로서, 원거리 음성인식 성능과 근거리 음성인식 성능이 동시에 높게 나오며 외부 잡음에 강인하도록 할 수 있게 되는 것이다.The present invention is to provide a voice recognition apparatus and method that is robust to the speaker distance characteristics, and a distance-specific voice recording unit for receiving the voice input by the near-field voice recording unit and the remote voice recording unit at the same time; An external noise removing unit for receiving the distance-specific speech output from the distance-based voice recording unit and estimating the external noise to remove from the recording voice; An input voice selecting unit which receives the recorded voice from which the external noise has been removed and receives and selects which voice can increase the voice recognition performance among the input voices reflecting the distance characteristics of the remote and short distances; By including the voice selected by the input voice selector to perform the voice recognition; speech recognition unit comprising a, the long-distance speech recognition performance and the near-field speech recognition performance is high at the same time to be able to be robust to external noise. .
발성자, 거리 특성, 음성인식, 음성녹음, 외부잡음 Speaker, distance characteristic, voice recognition, voice recording, external noise
Description
도 1은 본 발명의 일 실시예에 의한 발성자 거리 특성에 강인한 음성인식 장치의 블록구성도이다.1 is a block diagram of a speech recognition apparatus robust to speaker distance characteristics according to an embodiment of the present invention.
도 2는 도 1에서 거리별 음성녹음부의 상세블록도이다.FIG. 2 is a detailed block diagram of a voice recording unit for each distance in FIG. 1.
도 3은 도 1에서 외부잡음 제거부의 상세블록도이다.3 is a detailed block diagram of the external noise removing unit of FIG. 1.
도 4는 도 1에서 입력음성 선정부의 상세블록도이다.FIG. 4 is a detailed block diagram of the input voice selector of FIG. 1.
도 5는 도 1에서 음성인식부의 상세블록도이다.FIG. 5 is a detailed block diagram of the voice recognition unit of FIG. 1.
도 6은 본 발명의 일 실시예에 의한 발성자 거리 특성에 강인한 음성인식 방법을 보인 흐름도이다.6 is a flowchart illustrating a voice recognition method that is robust to speaker distance characteristics according to an embodiment of the present invention.
도 7은 도 6에서 거리별 음성녹음 동작에 대한 상세흐름도이다.FIG. 7 is a detailed flowchart illustrating a voice recording operation for each distance in FIG. 6.
도 8은 도 6에서 외부잡음 제거 동작에 대한 상세흐름도이다.FIG. 8 is a detailed flowchart illustrating an external noise removing operation of FIG. 6.
도 9는 도 6에서 입력음성 선정 동작에 대한 상세흐름도이다.9 is a detailed flowchart illustrating an operation of selecting an input voice in FIG. 6.
도 10은 도 6에서 음성인식 동작에 대한 상세흐름도이다.FIG. 10 is a detailed flowchart of the voice recognition operation of FIG. 6.
* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings
100 : 거리별 음성녹음부 101 : 녹음음성크기 분류부100: voice recording unit by distance 101: recording voice size classification unit
102 : 샘플화자 입력게인 계산부 103 : 실사용자 입력게인 계산부102: sample speaker input gain calculation unit 103: real user input gain calculation unit
104 : 입력게인 지정부 110 : 근거리 음성녹음부104: input gain designation unit 110: short-range voice recording unit
120 : 원거리 음성녹음부 200 : 외부잡음 제거부120: remote voice recording unit 200: external noise removing unit
201 : 시간축 특성추출부 202 : 시간축 음성검출부201: time base feature extractor 202: time base voice detector
203 : 주파수 변환부 204 : 음성주파수 특성추출부203: frequency converter 204: voice frequency characteristic extraction unit
205 : 잡음주파수 특성추출부 206 : 주파수잡음 제거부205: noise frequency characteristic extraction unit 206: frequency noise removal unit
207 : 주파수축 음성검출부 208 : 음성검출결과 선정부207: frequency axis voice detection unit 208: voice detection result selection unit
210 : 제 1 외부잡음 제거부 220 : 제 2 외부잡음 제거부210: first external noise removing unit 220: second external noise removing unit
300 : 입력음성 선정부 301 : 제 1 음가명확도 신뢰수치 선정부300: input voice selector 301: first sound accuracy accuracy confidence value selector
302 : 제 1 음질왜곡수치 선정부 303 : 제 1 SNR 수치 선정부302: First sound quality distortion value selector 303: First SNR numerical selector
304 : 제 2 음가명확도 신뢰수치 선정부 305 : 제 2 음질왜곡수치 선정부304: second sound quality accuracy confidence value selecting unit 305: second sound quality distortion value selecting unit
306 : 제 2 SNR 수치 선정부 307 : 음성선정부306: second SNR numerical selection unit 307: voice preselection
400 : 음성인식부 401 : 특징추출부400: voice recognition unit 401: feature extraction unit
402 : 디코더 403 : 후처리부402: decoder 403: post-processing unit
본 발명은 음성인식에 관한 것으로, 특히 원거리 음성인식 성능과 근거리 음성인식 성능이 동시에 높게 나오며 외부 잡음에 강인하도록 하기에 적당하도록 한 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법에 관한 것이다.TECHNICAL FIELD The present invention relates to speech recognition, and more particularly, to a speech recognition apparatus and a method which is robust to a speaker distance characteristic such that the distance speech recognition performance and the near speech recognition performance are both high and suitable to be robust to external noise.
일반적으로 음성인식이란 음성을 기계로 식별하는 것으로서, 음성파를 주파수 분석하여 모음을 특징짓는 음역(音域) 또는 그것과 등가(等價)인 특징을 추출해서 분리하는 방법이 가장 보편적으로 시도되고 있다. 주파수 분석 결과를 시간적으로 연속 기록한 것을 소나그램이라 하는데, 잘 훈련하면 거기 기록된 무늬를 보고 시각적으로 음성을 알아볼 수 있다. 그러나 말하는 사람이 많거나 말수가 많으면 오차가 생길 수가 있다.In general, speech recognition refers to speech as a machine, and the most common method is to extract and separate a sound region or an equivalent feature that characterizes a vowel by frequency analysis of the sound wave. . The sonagram is a continuous record of the results of frequency analysis. When trained well, the patterns recorded there can be visually recognized. But if you talk too much or talk too much, you may get errors.
종래의 음식인식 장치는 외부 잡음 때문에 근거리에서 발성하는 음성을 인식하는 것이 일반적이나, 최근에는 마이크어레이 기술을 적용하여 원거리에서도 음성인식을 적용하고 있다. 즉, 종래기술에는 원거리용 마이크를 이용하여 원거리 음성 인식을 가능하게 한 기술과 복수의 마이크를 이용한 마이크어레이 기술이 있다.Conventional food recognition devices generally recognize speech that is spoken at a short distance due to external noise, but recently, microphone recognition technology is applied to speech recognition even at a long distance. That is, in the prior art, there is a technology that enables remote speech recognition using a remote microphone and a microphone array technology using a plurality of microphones.
그러나 원거리 음성 인식 기술은 근거리 음성 인식 성능이 낮다는 취약점과 외부 잡음에 취약하다는 약점이 있다. 또한 마이크어레이 기술은 잡음에 강인하다는 장점이 있으나 역시 근거리 음성 인식에 취약점이 있고 고가의 하드웨어 장치가 필요하며 시스템 구성이 복잡하고 정교해야 하는 설치 상의 문제가 있다.However, far speech recognition technology has weaknesses such as low near speech recognition performance and weakness of external noise. In addition, the microphone array technology has the advantage of being robust against noise, but also has a weakness in short-range speech recognition, an expensive hardware device, and an installation problem that requires complicated and sophisticated system configuration.
이처럼 종래의 음성인식 장치는 음성입력 크기 때문에 인식할 수 있는 거리에 영향을 많이 받는다.As such, the conventional speech recognition apparatus is affected by the distance that can be recognized because of the size of the speech input.
또한 원거리 인식기는 근거리 입력에 대해서 음성입력이 너무 커 음의 왜곡이 생길 수 있어 인식률이 현저히 떨어지게 되며, 근거리 인식기는 원거리 입력에 대해서 음성입력이 너무 작아 음을 구분할 수 없어 인식이 불가능하게 되는 문제점이 있었다.In addition, the far field recognizer has a large speech input that is too large for the near field input, so that the recognition rate decreases significantly. there was.
이에 본 발명은 상기와 같은 종래의 제반 문제점을 해결하기 위해 제안된 것으로, 본 발명의 목적은 원거리 음성인식 성능과 근거리 음성인식 성능이 동시에 높게 나오며 외부 잡음에 강인하도록 할 수 있는 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법을 제공하는데 있다.Therefore, the present invention has been proposed to solve the conventional problems as described above, and an object of the present invention is to provide a speaker distance characteristic capable of achieving both a long distance speech recognition performance and a near speech recognition performance at the same time and being robust to external noise. The present invention provides a robust speech recognition device and a method thereof.
상기와 같은 목적을 달성하기 위하여 본 발명의 일실시예에 의한 발성자 거리 특성에 강인한 음성인식 장치는,In order to achieve the above object, the voice recognition device robust to the speaker distance characteristic according to an embodiment of the present invention,
근거리 음성녹음부와 원거리 음성녹음부에 의해 입력된 음성을 동시에 받아들여 녹음하는 거리별 음성녹음부와; 상기 거리별 음성녹음부에 출력된 거리별 음성을 입력받아 외부잡음을 추정하여 녹음음성에서 제거하는 외부잡음 제거부와; 상기 외부잡음 제거부에서 외부잡음이 제거된 녹음음성을 입력받아 원거리와 근거리의 거리특성이 반영된 입력 음성 중에서 어느 음성이 음성인식 성능을 높일 수 있는 지 확인하여 선정하는 입력음성 선정부와; 상기 입력음성 선정부에서 선정된 음성을 입력받아 음성인식을 수행하는 음성인식부;를 포함하여 이루어짐을 그 기술적 구성상의 특징으로 한다.A distance-specific voice recording unit for simultaneously receiving and recording voice input by the near voice recording unit and the remote voice recording unit; An external noise removing unit for receiving the distance-specific speech output from the distance-based voice recording unit and estimating the external noise to remove from the recording voice; An input voice selecting unit which receives the recorded voice from which the external noise has been removed and receives and selects which voice can increase the voice recognition performance among the input voices reflecting the distance characteristics of the remote and short distances; And a voice recognition unit for receiving a voice selected by the input voice selection unit and performing voice recognition.
상기와 같은 목적을 달성하기 위하여 본 발명의 일실시예에 의한 발성자 거리 특성에 강인한 음성인식 방법은,In order to achieve the above object, the voice recognition method robust to the speaker distance characteristic according to an embodiment of the present invention,
거리별 음성녹음부에서 근거리와 원거리에서 입력된 음성을 동시에 받아들여 녹음하도록 하는 제 1 단계와; 상기 제 1 단계 후 외부잡음 제거부에서 거리별 음성에서 외부잡음을 추정하여 녹음음성에서 제거하는 제 2 단계와; 상기 제 2 단계 후 입력음성 선정부에서 외부잡음이 제거된 녹음음성을 입력받아 원거리와 근거리의 거리특성이 반영된 입력 음성 중에서 어느 음성이 음성인식 성능을 높일 수 있는 지 확인하여 선정하도록 하는 제 3 단계와; 상기 제 3 단계 후 음성인식부에서 선정된 음성을 입력받아 음성인식을 수행하는 제 4 단계;를 포함하여 수행함을 그 기술적 구성상의 특징으로 한다.A first step of allowing voice recording units by distance to simultaneously receive and record voice input from near and far distances; A second step of estimating external noise from distance-specific voices and removing them from the recorded voice after the first step; After the second step, the input voice selecting unit receives the recorded voice from which the external noise has been removed and checks and selects which voice can improve the voice recognition performance among the input voices reflecting the distance characteristics of the remote and short distances. Wow; And a fourth step of performing voice recognition by receiving the voice selected by the voice recognition unit after the third step.
이하, 상기와 같은 본 발명, 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법의 기술적 사상에 따른 일실시예를 도면을 참조하여 설명하면 다음과 같다.Hereinafter, an exemplary embodiment according to the present invention as described above, a voice recognition device robust to speaker distance characteristics, and a technical idea of the method will be described with reference to the accompanying drawings.
도 1은 본 발명의 일 실시예에 의한 발성자 거리 특성에 강인한 음성인식 장치의 블록구성도이다.1 is a block diagram of a speech recognition apparatus robust to speaker distance characteristics according to an embodiment of the present invention.
이에 도시된 바와 같이, 근거리 음성녹음부(110)와 원거리 음성녹음부(120)에 의해 입력된 음성을 동시에 받아들여 녹음하는 거리별 음성녹음부(100)와; 상기 거리별 음성녹음부(100)에 출력된 거리별 음성을 입력받아 외부잡음을 추정하여 녹음음성에서 제거하는 외부잡음 제거부(200)와; 상기 외부잡음 제거부(200)에서 외부잡음이 제거된 녹음음성을 입력받아 원거리와 근거리의 거리특성이 반영된 입력 음성 중에서 어느 음성이 음성인식 성능을 높일 수 있는 지 확인하여 선정하는 입력음성 선정부(300)와; 상기 입력음성 선정부(300)에서 선정된 음성을 입력받아 음성인식을 수행하는 음성인식부(400);를 포함하여 구성된 것을 특징으로 한다.As shown therein, the
도 2는 도 1에서 거리별 음성녹음부의 상세블록도이다.FIG. 2 is a detailed block diagram of a voice recording unit for each distance in FIG. 1.
이에 도시된 바와 같이, 상기 거리별 음성녹음부(100)의 상기 거리별 음성녹 음부(110)와 원거리 음성녹음부(120)는 각각, 샘플화자의 음성을 입력받아 녹음음성의 크기를 분류하는 녹음음성 크기분류부(101)와; 상기 녹음음성 크기분류부(101)의 출력을 입력받아 샘플화자의 입력게인을 계산하여 거리별 모드에 따른 입력게인값을 출력하여 사전 파라미터 세팅을 수행하는 샘플화자 입력게인 계산부(102)와; 실사용자의 음성을 입력받아 실사용자의 입력게인을 계산하여 실사용자의 파라미터를 세팅하는 실사용자 입력게인 계산부(103)와; 상기 샘플화자 입력게인 계산부(102)에서 거리별 모드의 입력게인값을 입력받고, 상기 실사용자 입력게인 계산부(103)에서 출력된 실사용자의 입력게인값을 입력받아 입력게인을 지정하여 거리별 음성을 출력하는 입력게인 지정부(104);를 포함하여 구성된 것을 특징으로 한다.As shown in the drawing, the distance-based
도 3은 도 1에서 외부잡음 제거부의 상세블록도이다.3 is a detailed block diagram of the external noise removing unit of FIG. 1.
이에 도시된 바와 같이, 상기 외부잡음 제거부(200)는, 상기 거리별 음성녹음부(100)에서 출력된 근거리 또는 원거리의 거리별 음성을 입력받아 시간축의 특성을 추출하는 시간축 특성추출부(201)와; 상기 시간축 특성추출부(201)의 출력을 입력받아 시간축에서의 음성을 검출하는 시간축 음성검출부(202)와; 상기 거리별 음성녹음부(100)에서 출력된 근거리 또는 원거리의 거리별 음성을 입력받아 주파수로 변환시키는 주파수 변환부(203)와; 상기 주파수 변환부(202)의 출력을 입력받아 음성주파수의 특성을 추출하는 음성주파수 특성추출부(204)와; 상기 주파수 변환부(202)의 출력을 입력받아 잡음주파수의 특성을 추출하는 잡음주파수 특성추출부(205)와; 상기 음성주파수 특성추출부(204)와 상기 잡음주파수 특성추출부(205) 의 출력을 입력받아 주파수 측에서의 잡음 특성을 제거하는 주파수잡음 제거부(206)와; 상기 주파수잡음 제거부(206)의 출력을 입력받아 주파수축에서의 음성을 검출하는 주파수축 음성검출부(207)와; 상기 시간축 음성검출부(202)와 상기 주파수축 음성검출부(207)의 출력을 입력받아 잡음특성을 반영하여 음성검출결과를 선정하여 음성을 출력하는 음성검출결과 선정부(208);를 포함하여 구성된 것을 특징으로 한다.As shown in the drawing, the external
도 4는 도 1에서 입력음성 선정부의 상세블록도이다.FIG. 4 is a detailed block diagram of the input voice selector of FIG. 1.
이에 도시된 바와 같이, 상기 입력음성 선정부(300)는, 상기 외부잡음 제거부(200)에서 외부잡음이 제거된 녹음음성을 입력받아 근거리 음성출력에 대한 음가명확도 신뢰수치를 선정하여 음가가 명확한 발성은 녹음음량의 크기와 피치 정보의 명료성으로 산출하는 제 1 음가명확도 신뢰수치 선정부(301)와; 상기 제 1 음가명확도 신뢰수치 선정부(301)의 출력을 입력받아 주파수 특성의 분석시 근접한 음성구간 내에서 불연속 주파수 특성을 야기하는 정도에 의해 음질왜곡수치를 선정하는 제 1 음질왜곡수치 선정부(302)와; 상기 제 1 음질왜곡수치 선정부(302)의 출력을 입력받아 잡음의 상대적인 크기 값인 SNR(Signal to Noise Ratio, 신호대 잡음비) 수치를 선정하는 제 1 SNR 수치 선정부(303)와; 상기 외부잡음 제거부(200)에서 외부잡음이 제거된 녹음음성을 입력받아 원거리 음성출력에 대한 음가명확도 신뢰수치를 선정하여 음가가 명확한 발성은 녹음음량의 크기와 피치 정보의 명료성으로 산출하는 제 2 음가명확도 신뢰수치 선정부(304)와; 상기 제 2 음가명확도 신뢰수치 선정부(304)의 출력을 입력받아 주파수 특성의 분석시 근접한 음성구간 내에서 불연속 주파수 특성을 야기하는 정도에 의해 음질왜곡수치를 선정하는 제 2 음질왜곡수치 선정부(305)와; 상기 제 2 음질왜곡수치 선정부(305)의 출력을 입력받아 잡음의 상대적인 크기 값인 SNR 수치를 선정하는 제 2 SNR 수치 선정부(306)와; 상기 제 1 및 제 2 SNR 수치 선정부(303, 306)의 출력을 입력받아 인식률이 높은 음성입력을 선정하여 선정된 음성을 출력하는 음성선정부(307);를 포함하여 구성된 것을 특징으로 한다.As shown in the drawing, the
도 5는 도 1에서 음성인식부의 상세블록도이다.FIG. 5 is a detailed block diagram of the voice recognition unit of FIG. 1.
이에 도시된 바와 같이, 상기 음성인식부(400)는, 상기 입력음성 선정부(300)에서 선정된 음성을 입력받아 음가마다 고유한 특성을 추출하는 특징추출부(401)와; 상기 특징추출부(401)의 출력을 입력받아 발성문법과 음향모델에 의해 디코딩(Decoding)을 수행하는 디코더(402)와; 상기 디코더(402)의 출력을 입력받아 언어적인 특성과 발성 시점의 명확성을 고려하여 후처리를 수행하여 인식결과를 출력하는 후처리부(403);를 포함하여 구성된 것을 특징으로 한다.As shown therein, the
도 6은 본 발명의 일 실시예에 의한 발성자 거리 특성에 강인한 음성인식 방법을 보인 흐름도이다.6 is a flowchart illustrating a voice recognition method that is robust to speaker distance characteristics according to an embodiment of the present invention.
이에 도시된 바와 같이, 거리별 음성녹음부(100)에서 근거리와 원거리에서 입력된 음성을 동시에 받아들여 녹음하도록 하는 제 1 단계(ST1)와; 상기 제 1 단계 후 외부잡음 제거부(200)에서 거리별 음성에서 외부잡음을 추정하여 녹음음성에서 제거하는 제 2 단계(ST2)와; 상기 제 2 단계 후 입력음성 선정부(300)에서 외부잡음이 제거된 녹음음성을 입력받아 원거리와 근거리의 거리특성이 반영된 입력 음 성 중에서 어느 음성이 음성인식 성능을 높일 수 있는 지 확인하여 선정하도록 하는 제 3 단계(ST3)와; 상기 제 3 단계 후 음성인식부(400)에서 선정된 음성을 입력받아 음성인식을 수행하는 제 4 단계(ST4);를 포함하여 수행하는 것을 특징으로 한다.As shown therein, the first step ST1 allows the
도 7은 도 6에서 거리별 음성녹음 동작에 대한 상세흐름도이다.FIG. 7 is a detailed flowchart illustrating a voice recording operation for each distance in FIG. 6.
이에 도시된 바와 같이, 상기 제 1 단계는, 상기 거리별 음성녹음부(100)는 샘플화자의 음성을 입력받아 녹음음성의 크기를 분류하는 제 11 단계(ST11)와; 상기 제 11 단계 후 샘플화자의 입력게인을 계산하여 거리별 모드에 따른 입력게인값을 출력하여 사전 파라미터 세팅을 수행하는 제 12 단계(ST12)와; 실사용자의 음성을 입력받아 실사용자의 입력게인을 계산하여 실사용자의 파라미터를 세팅하는 제 13 단계(ST13)와; 상기 제 12 단계에서의 거리별 모드의 입력게인값을 입력받고, 상기 제 13 단계에서의 실사용자의 입력게인값을 입력받아 입력게인을 지정하여 거리별 음성을 출력하는 제 14 단계(ST14);를 포함하여 수행하는 것을 특징으로 한다.As shown therein, the first step includes: an eleventh step ST11 of classifying the voice quality of the recorded voice by receiving the voice of the
도 8은 도 6에서 외부잡음 제거 동작에 대한 상세흐름도이다.FIG. 8 is a detailed flowchart illustrating an external noise removing operation of FIG. 6.
이에 도시된 바와 같이, 상기 제 2 단계는, 상기 거리별 음성녹음부(100)에서 출력된 근거리 또는 원거리의 거리별 음성을 입력받아 시간축의 특성을 추출하는 제 21 단계(ST21)와; 상기 제 21 단계 후 시간축에서의 음성을 검출하는 제 22 단계(ST22)와; 상기 거리별 음성녹음부(100)에서 출력된 근거리 또는 원거리의 거리별 음성을 입력받아 주파수로 변환시키는 제 23 단계(ST23)와; 상기 제 23 단계 후 음성주파수와 잡음주파수의 특성을 추출하는 제 24 단계(ST24)와; 상기 제 24 단계 후 주파수 측에서의 잡음 특성을 제거하는 제 25 단계(ST25)와; 상기 제 25 단계 후 주파수축에서의 음성을 검출하는 제 26 단계(ST26)와; 상기 제 22 단계와 상기 제 26 단계 수행 후 잡음특성을 반영하여 음성검출결과를 선정하여 음성을 출력하는 제 27 단계(ST27);를 포함하여 수행하는 것을 특징으로 한다.As shown in the drawing, the second step may include a twenty-first step (ST21) of extracting a characteristic of a time axis by receiving a voice of a short distance or a long distance output from the
도 9는 도 6에서 입력음성 선정 동작에 대한 상세흐름도이다.9 is a detailed flowchart illustrating an operation of selecting an input voice in FIG. 6.
이에 도시된 바와 같이, 상기 제 3 단계는, 상기 외부잡음 제거부(200)에서 외부잡음이 제거된 녹음음성을 입력받아 근거리 음성출력에 대한 음가명확도 신뢰수치를 선정하여 음가가 명확한 발성은 녹음음량의 크기와 피치 정보의 명료성으로 산출하는 제 31 단계(ST31)와; 상기 제 31 단계 후 주파수 특성의 분석시 근접한 음성구간 내에서 불연속 주파수 특성을 야기하는 정도에 의해 음질왜곡수치를 선정하는 제 32 단계(ST32)와; 상기 제 32 단계 후 잡음의 상대적인 크기 값인 SNR 수치를 선정하는 제 33 단계(ST33)와; 상기 외부잡음 제거부(200)에서 외부잡음이 제거된 녹음음성을 입력받아 원거리 음성출력에 대한 음가명확도 신뢰수치를 선정하여 음가가 명확한 발성은 녹음음량의 크기와 피치 정보의 명료성으로 산출하는 제 34 단계(ST34)와; 상기 제 34 단계 후 주파수 특성의 분석시 근접한 음성구간 내에서 불연속 주파수 특성을 야기하는 정도에 의해 음질왜곡수치를 선정하는 제 35 단계(ST35)와; 상기 제 35 단계 후 잡음의 상대적인 크기 값인 SNR 수치를 선정하는 제 36 단계(ST36)와; 상기 제 33 단계와 상기 제 36 단계 수행 후 인식률이 높은 음성입력을 선정하여 선정된 음성을 출력하는 제 37 단계(ST37);를 포함하여 수행 하는 것을 특징으로 한다.As shown in the drawing, the third step receives the recorded voice from which the external noise has been removed by the external
도 10은 도 6에서 음성인식 동작에 대한 상세흐름도이다.FIG. 10 is a detailed flowchart of the voice recognition operation of FIG. 6.
이에 도시된 바와 같이, 상기 제 4 단계는, 상기 입력음성 선정부(300)에서 선정된 음성을 입력받아 음가마다 고유한 특성을 추출하는 제 41 단계(ST41)와; 상기 제 41 단계 후 발성문법과 음향모델에 의해 디코딩을 수행하는 제 42 단계(ST42)와; 상기 제 42 단계 후 언어적인 특성과 발성 시점의 명확성을 고려하여 후처리를 수행하여 인식결과를 출력하는 제 43 단계(ST43);를 포함하여 수행하는 것을 특징으로 한다.As shown in the drawing, the fourth step includes: a 41st step (ST41) of receiving a voice selected by the input
이와 같이 구성된 본 발명에 의한 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법의 바람직한 실시예를 첨부한 도면에 의거하여 상세히 설명하면 다음과 같다. 하기에서 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서, 이는 사용자, 운용자의 의도 또는 판례 등에 따라 달라질 수 있으며, 이에 따라 각 용어의 의미는 본 명세서 전반에 걸친 내용을 토대로 해석되어야 할 것이다.Referring to the accompanying drawings, preferred embodiments of the voice recognition device and the method robust to the speaker distance characteristics according to the present invention configured as described above are as follows. In the following description of the present invention, detailed descriptions of well-known functions or configurations will be omitted if it is determined that the detailed description of the present invention may unnecessarily obscure the subject matter of the present invention. In addition, terms to be described below are terms defined in consideration of functions in the present invention, which may vary according to intention or precedent of a user or an operator, and thus, the meaning of each term should be interpreted based on the contents throughout the present specification. will be.
먼저 본 발명은 원거리 음성인식 성능과 근거리 음성인식 성능이 동시에 높게 나오며 외부 잡음에 강인하도록 하고자 한 것이다. 이를 위해 본 발명에서는 사용자가 거리에 관계없이 높은 음성인식 성능을 확보하도록 한다.First of all, the present invention aims to provide high distance speech recognition performance and near speech recognition performance at the same time and to be robust to external noise. To this end, the present invention allows the user to ensure high voice recognition performance regardless of distance.
그래서 본 발명에서는 거리에 따른 인식률 저하를 해결하기 위한 장치로 2개 이상의 마이크를 연결하여 복수의 음성입력 단계를 수행하는 특징이 있으며, 자동으로 복수의 음성입력 중에서 안정된 인식 성능을 확보할 수 있는 음성입력을 선택할 수 있다.Thus, in the present invention, a device for solving a decrease in recognition rate according to distance has a feature of performing a plurality of voice input steps by connecting two or more microphones, and a voice capable of automatically securing stable recognition performance among a plurality of voice inputs. Input can be selected.
예를 들어, 일반 가정환경에서 벽면에 부착된 월패드의 내장형 음성인식기를 이용하여 가전제어를 하고자 할 때, 3미터 정도 떨어진 거실 소파에서 음성명령을 내리는 경우와 LCD(Liquid Crystal Display, 액정 디스플레이)를 볼 수 있을 정도의 가까운 거리(0.5미터)에서 음성명령을 내리는 경우를 동시에 처리하여 인식률 저하가 없도록 한다.For example, if you want to control home appliances using wall pad's built-in voice recognition device in a normal home environment, you can give voice commands from the living room sofa about 3 meters and LCD (Liquid Crystal Display). Simultaneously process voice commands at a close range (0.5m) so that the recognition rate is not reduced.
도 1은 본 발명의 전체적인 구성도를 나타낸 것이고, 도 6은 그 동작흐름을 보인 것이다.Figure 1 shows the overall configuration of the present invention, Figure 6 shows the operation flow.
그래서 본 발명에서는 음성녹음을 2개의 그룹으로 분리하여 수행한다. 즉, 근거리 음성녹음부(110)와 원거리 음성녹음부(120)로 음성 입력을 동시에 받아들인 후, 입력된 음성 부분 중에서 자동으로 잡음 부분을 추정하여 녹음 음성에서 제거해주는 외부잡음 제거부(200)를 거친다.Thus, in the present invention, voice recording is performed by separating into two groups. That is, after receiving a voice input simultaneously to the near
이후 각각의 거리 특성이 반영된 입력 음성 중에서 어느 음성이 음성인식 성능을 높일 수 있는 지 확인하는 입력음성 선정부(300)를 거쳐 음성인식부(400)에서 음성인식을 수행하여 인식 결과를 출력한다.After that, the
거리 특성에 강인한 본 음성인식의 주된 적용은 홈 네트워크용 가전 제어 기기이다. 예를 들어 거실 소파에서 월 패드까지의 거리는 3미터 내외로 원거리 음성 녹음 장치가 이 거리의 음성 입력을 해결하도록 한다. 한편, 일반적인 사용자는 월 패드 근처에서 다양한 정보 서비스를 직접 체험하기를 원하므로 LCD 창을 볼 수 있는 0.5미터 내외의 근접한 거리에서의 음성 입력은 근거리 음성 녹음 장치가 대응하도록 한다. 이렇게 2미터 이상의 거리 차가 있을 때 거리 별로 녹음 음성에 대한 대응을 하지 않으면 소리가 너무 크게 녹음 되어 왜곡 현상이 발생하거나, 소리가 너무 작게 녹음되어 음가가 불명확하게 될 수 있어 음성인식의 효용성을 보장할 수 없게 된다.The main application of this voice recognition, which is robust to the distance characteristic, is home appliance control device for home network. For example, the distance from the living room sofa to the wall pad is about three meters, allowing the remote voice recorder to resolve the voice input at this distance. On the other hand, the general user wants to experience various information services directly near the wall pad, so that the voice input device at a close distance of about 0.5 meters that can see the LCD window allows the near voice recording apparatus to respond. If there is a distance difference of more than 2 meters, if you do not respond to the recorded voice by distance, the sound may be recorded too loud and distortion may occur, or the sound may be recorded too small to make the sound price unclear. It becomes impossible.
도 2는 거리별 음성녹음부(100)의 세부 구성도이고, 도 6은 그의 동작흐름을 보인 것이다.2 is a detailed configuration diagram of the
그래서 지정 거리에서 평상시의 자연스런 목소리를 발성하여 음성을 녹음하였을 시, 디지털화된 녹음 음성의 크기가 16비트 해상도에서 5,000에서 20,000 정도의 수치를 갖는다면 인식률은 최적의 성능을 확보할 수 있다. 따라서 거리별 음성녹음부(100)에 녹음하여 각각 5,000에서 20,000 사이의 입력 크기가 될 수 있도록 입력 게인을 조절하는 작업이 필요하다.Therefore, when the voice is recorded by uttering a natural voice at a specified distance, the recognition rate can be optimized if the size of the digitized recorded voice has a value of 5,000 to 20,000 at 16-bit resolution. Therefore, it is necessary to adjust the input gain so that the distance is recorded in the
먼저 (가) 사전 파라미터 세팅은 최종 음성입력 장치가 완료되기 전에 미리 많은 화자 발성의 통계특성에 따라 입력 게인 파라미터를 세팅하는 작업을 수행한다. 녹음음성크기 분류부(101)는 남, 녀, 노, 소를 감안한 복수의 샘플 화자로부터 지정거리에서 정상발성, 큰 발성, 작은 발성 3가지 녹음을 받아 전체 녹음된 음성을 크기 별로 분류하며, 최소 녹음 크기 수준과 최대 녹음 크기 수준을 알아낸다. 이 값을 이용하여 샘플화자 입력게인 계산부(102)를 통해 모든 녹음 입력이 5,000 에서 20,000 정도의 수치가 되도록 게인 값을 산출한다. 이 수치는 거리 별 3가지 모드(대/중/소)에 해당하는 파라미터 값으로 보관한다.First, (a) prior parameter setting is performed to set input gain parameters according to the statistical characteristics of many speaker utterances before the final voice input device is completed. The recording voice
이러한 샘플화자로부터 미리 구해진 파라미터 값은 (나)에서와 같이 실사용자에게도 적용되어 입력게인 지정부(104)에서 적정의 입력 게인 수치로 지정될 수 있도록 거리 별 3가지 모드의 파라미터 중 하나로 세팅하는 과정을 수행한다.The parameter value obtained in advance from the sampler is applied to the real user as in (b), and is set to one of three mode parameters for each distance so that the input
도 3 및 도 7은 외부잡음 제거부(200)의 세부 구성과 그 동작을 보인 것이다.3 and 7 show the detailed configuration and operation of the external
그래서 근거리, 원거리에 대해 각각 외부잡음 제거 장치가 필요하나 두 개의 장치는 동일한 구조를 갖는다.Therefore, external noise canceling devices are required for short distance and long distance, respectively, but the two devices have the same structure.
한편 거리 별로 음성 입력이 되어 음가가 충실히 입력되었다고 가정하여도 녹음 음성에 잡음 입력이 크게 입력되면 오인식 혹은 인식 거절 확률이 매우 높게 된다. 따라서 외부 잡음 요소를 최대한 제거하고 음성부분을 추출하는 것이 인식 성능을 높이는 중요한 요소가 된다.On the other hand, even if the voice input is faithfully input by distance, even if the noise input is largely input to the recorded voice, the probability of false recognition or recognition is very high. Therefore, it is important to remove the external noise as much as possible and extract the speech part to increase the recognition performance.
외부 잡음 제거는 주파수 측에서의 잡음 특성을 제거하는 부분인 주파수 잡음 제거부(206)와 시간 축과 주파수 축에서 동시에 음성부분을 검출하는 시간축 음성검출부(202)와 주파수축 음성검출부(207)로 부분으로 구성된다. 동시에 검출된 음성구간은 잡음 특성을 반영하여 음성검출결과 선정부(208)에서 최종 음성검출 결과를 선정한다.External noise rejection is divided into a
도 4 및 도 9는 입력 음성을 선정하는 입력음성 선정부(300)의 세부 구성과 그 동작을 보인 것이다.4 and 9 show the detailed configuration and operation of the input
그래서 입력음성 선정부(300)에서는 검출된 2개의 음성 구간 중 음성인식 성능이 높게 나오는 음성을 선정하는 작업을 수행한다.Therefore, the
음가가 명확한 발성은 녹음 음량의 크기와 피치 정보의 명료성으로 산출되므로, 제 1 및 제 2 음가명확도 신뢰수치 선정부(301, 304)에서 근거리 또는 원거리 음성 출력에 대해 각각 음가명확도 신뢰수치를 선정한다.Since the sound with a clear voice value is calculated by the clarity of the volume and pitch information of the recording volume, the first and second loudness confidence
음질 왜곡 수치는 녹음 크기가 16비트 해상도를 넘는 경우처럼, 주파수 특성을 분석하였을 시 근접한 음성 구간 내에서 불연속 주파수 특성을 야기하는 정도에 의해 산출되므로, 제 1 및 제 2 음질왜곡수치 선정부(302, 305)에서 근거리 또는 원거리 음성출력에 대해 각각 음질왜곡수치를 선정한다.Since the sound quality distortion value is calculated by the degree of causing the discontinuous frequency characteristic in the adjacent speech section when the frequency characteristic is analyzed, such as when the recording size exceeds 16 bit resolution, the first and second sound quality distortion
또한 제 1 및 제 2 SNR 수치 선정부(303, 306)에서 선정하는 SNR 수치는 신호 대 잡음 비율에 해당하는 값으로서 잡음의 상대적인 크기 값에 해당한다. 이러한 3개의 수치인 음가명확도 신뢰수치, 음질왜곡수치, SNR 수치를 이용하여 음성선정부(307)에서는 인식률이 높게 되는 음성입력을 선정한다.In addition, the SNR values selected by the first and second
도 5 및 도 10은 음성인식부(400)의 구성과 그 동작을 보인 것이다.5 and 10 show the configuration and operation of the
그래서 특징추출부(401)에서는 음가마다 고유한 특성을 추출한다.Thus, the
또한 디코더(402)에서는 사전에 학습되어진 음향모델과 입력할 어휘의 발성 관련 규칙을 이용하여 인식을 수행한다.In addition, the
또한 후처리부(403)에서는 인식 부분의 결과를 언어적인 특성과 발성 시점의 명확성 등을 고려하여 후처리를 수행한다.In addition, the
이처럼 본 발명은 원거리 음성인식 성능과 근거리 음성인식 성능이 동시에 높게 나오며 외부 잡음에 강인하게 되는 것이다.As described above, the present invention provides both the long distance speech recognition performance and the short range speech recognition performance at the same time, and is robust to external noise.
이상에서 살펴본 바와 같이, 본 발명에 의한 발성자 거리 특성에 강인한 음성인식 장치 및 그 방법은 원거리 음성인식 성능과 근거리 음성인식 성능이 동시에 높게 나오며 외부 잡음에 강인한 효과가 있게 된다.As described above, the speech recognition apparatus robust to the speaker distance characteristic and the method thereof according to the present invention have a long range speech recognition performance and a near speech recognition performance are high at the same time, and has a robust effect on external noise.
또한 본 발명은 거리에 관계없이 음성인식이 가능한 장치를 제작할 수 있다.In addition, the present invention can manufacture a device capable of speech recognition regardless of the distance.
더불어 본 발명은 잡음제거 장치를 이용하여 원거리 시 생기는 잡음을 제거할 수 있어 서비스 성능이 우수한 시나리오가 가능해진다. 이러한 장치는 두 개 이상 마이크를 통해 입력된 신호를 분석하여 내부에서 자동으로 인식 성능이 우수한 음성 입력을 선정하게끔 구성되어 있어 사용자의 설치에 어려움이 없도록 되어 있다. 따라서 일반 홈 네트워크 시스템이나 모발 로봇의 음성 인터페이스에 바로 적용이 가능한 효과가 있다.In addition, the present invention can remove the noise generated at a long distance by using a noise canceling device enables a scenario with excellent service performance. Such a device is configured to analyze a signal input through two or more microphones and to automatically select a voice input having excellent recognition performance internally, so that the installation of the user is not difficult. Therefore, it can be directly applied to the voice interface of a general home network system or a hair robot.
이상에서 본 발명의 바람직한 실시예에 한정하여 설명하였으나, 본 발명은 이에 한정되지 않고 다양한 변화와 변경 및 균등물을 사용할 수 있다. 따라서 본 발명은 상기 실시예를 적절히 변형하여 응용할 수 있고, 이러한 응용도 하기 특허청구범위에 기재된 기술적 사상을 바탕으로 하는 한 본 발명의 권리범위에 속하게 됨은 당연하다 할 것이다.Although the above has been described as being limited to the preferred embodiment of the present invention, the present invention is not limited thereto and various changes, modifications, and equivalents may be used. Therefore, the present invention can be applied by appropriately modifying the above embodiments, it will be obvious that such application also belongs to the scope of the present invention based on the technical idea described in the claims below.
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070003187A KR100855592B1 (en) | 2007-01-11 | 2007-01-11 | Apparatus and method for robust speech recognition of speaker distance character |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070003187A KR100855592B1 (en) | 2007-01-11 | 2007-01-11 | Apparatus and method for robust speech recognition of speaker distance character |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080066129A KR20080066129A (en) | 2008-07-16 |
KR100855592B1 true KR100855592B1 (en) | 2008-09-01 |
Family
ID=39821042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070003187A KR100855592B1 (en) | 2007-01-11 | 2007-01-11 | Apparatus and method for robust speech recognition of speaker distance character |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100855592B1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102365757B1 (en) | 2015-09-09 | 2022-02-18 | 삼성전자주식회사 | Apparatus and method for recognition, collaborative recognition apparatus |
WO2020241923A1 (en) * | 2019-05-29 | 2020-12-03 | 엘지전자 주식회사 | Artificial intelligence device for predicting performance of speech recognition model in user environment, and method therefor |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04273298A (en) * | 1991-02-28 | 1992-09-29 | Fujitsu Ltd | Voice recognition device |
JPH04318900A (en) * | 1991-04-18 | 1992-11-10 | Oki Electric Ind Co Ltd | Multidirectional simultaneous sound collection type voice recognizing method |
JPH09127982A (en) * | 1995-10-27 | 1997-05-16 | Nec Robotics Eng Ltd | Voice recognition device |
JPH10232691A (en) | 1997-02-20 | 1998-09-02 | Nec Robotics Eng Ltd | Voice recognition device with recognition result selective function by using plural microphones |
KR20030010432A (en) * | 2001-07-28 | 2003-02-05 | 주식회사 엑스텔테크놀러지 | Apparatus for speech recognition in noisy environment |
-
2007
- 2007-01-11 KR KR1020070003187A patent/KR100855592B1/en active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04273298A (en) * | 1991-02-28 | 1992-09-29 | Fujitsu Ltd | Voice recognition device |
JPH04318900A (en) * | 1991-04-18 | 1992-11-10 | Oki Electric Ind Co Ltd | Multidirectional simultaneous sound collection type voice recognizing method |
JPH09127982A (en) * | 1995-10-27 | 1997-05-16 | Nec Robotics Eng Ltd | Voice recognition device |
JPH10232691A (en) | 1997-02-20 | 1998-09-02 | Nec Robotics Eng Ltd | Voice recognition device with recognition result selective function by using plural microphones |
KR20030010432A (en) * | 2001-07-28 | 2003-02-05 | 주식회사 엑스텔테크놀러지 | Apparatus for speech recognition in noisy environment |
Also Published As
Publication number | Publication date |
---|---|
KR20080066129A (en) | 2008-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7613611B2 (en) | Method and apparatus for vocal-cord signal recognition | |
CN108010512B (en) | Sound effect acquisition method and recording terminal | |
JP2006079079A (en) | Distributed speech recognition system and its method | |
KR101616112B1 (en) | Speaker separation system and method using voice feature vectors | |
JPS62231997A (en) | Voice recognition system and method | |
JPH0990974A (en) | Signal processor | |
US6032115A (en) | Apparatus and method for correcting the difference in frequency characteristics between microphones for analyzing speech and for creating a recognition dictionary | |
JP2004504641A (en) | Method and apparatus for constructing a speech template for a speaker independent speech recognition system | |
Zhang et al. | Improved modeling for F0 generation and V/U decision in HMM-based TTS | |
US9020818B2 (en) | Format based speech reconstruction from noisy signals | |
CN103050116A (en) | Voice command identification method and system | |
KR101022519B1 (en) | System and method for voice activity detection using vowel characteristic, and method for measuring sound spectral similarity used thereto | |
KR100855592B1 (en) | Apparatus and method for robust speech recognition of speaker distance character | |
Kitaoka et al. | Development of VAD evaluation framework CENSREC-1-C and investigation of relationship between VAD and speech recognition performance | |
JP4696418B2 (en) | Information detection apparatus and method | |
JP2019020678A (en) | Noise reduction device and voice recognition device | |
JP2002366192A (en) | Method and device for recognizing voice | |
US20080228477A1 (en) | Method and Device For Processing a Voice Signal For Robust Speech Recognition | |
KR101610708B1 (en) | Voice recognition apparatus and method | |
CN115440192A (en) | Testing method, device, equipment and storage medium of voice recognition system | |
KR20180087038A (en) | Hearing aid with voice synthesis function considering speaker characteristics and method thereof | |
Heracleous et al. | Fusion of standard and alternative acoustic sensors for robust automatic speech recognition | |
Lipeika | Optimization of formant feature based speech recognition | |
CN107039046B (en) | Voice sound effect mode detection method based on feature fusion | |
JP2007248529A (en) | Voice recognizer, voice recognition program, and voice operable device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120629 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20130821 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20140821 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20150812 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20160802 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20170803 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20180808 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20190812 Year of fee payment: 12 |