KR100198978B1 - Apparatus and mehtod for extracting the speech inputting to speech recognition apparatus - Google Patents
Apparatus and mehtod for extracting the speech inputting to speech recognition apparatus Download PDFInfo
- Publication number
- KR100198978B1 KR100198978B1 KR1019960033638A KR19960033638A KR100198978B1 KR 100198978 B1 KR100198978 B1 KR 100198978B1 KR 1019960033638 A KR1019960033638 A KR 1019960033638A KR 19960033638 A KR19960033638 A KR 19960033638A KR 100198978 B1 KR100198978 B1 KR 100198978B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- value
- signal
- speech
- input
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000000605 extraction Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 5
- 230000007547 defect Effects 0.000 abstract description 2
- 230000007257 malfunction Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
본 발명은 카폰 등에 이용되고 있는 음성 인식장치에 입력되는 음성을 추출하기 위한 음성 추출장치 및 그 방법에 관한 것으로, 입력되는 음성신호에 대해 순시적으로 입력 값을 절대치와 비교하여 음성신호의 유/무를 판단하거나, 임의의 갯수에 대한 입력신호의 평균값을 구하여 음성의 유/무를 판단하므로 인하여 혼입되는 잡음에 의한 오동작 가능성이 높고, 입력되는 음성신호를 정확하게 검출할 수 있는 확률이 낮아지는 종래의 결점을 해소하기 위하여, 디지털 신호로 입력되는 음성신호를 MA필터를 이용하여 필터링하여 잡음에 대한 영향을 최대한 줄이고 설정된 프로그램에 따라 음성신호를 정확하게 추출할 수 있도록 한 것이다The present invention relates to a voice extractor for extracting a voice input to a voice recognition device used in a car and the like, and a method thereof. The present invention relates to a voice signal by instantaneously comparing an input value with an absolute value. Determination of the presence or absence of the voice by determining the average value of the input signal for any number, or by the determination of the presence or absence of the voice, due to the high possibility of malfunction due to the mixed noise, the probability of accurately detecting the input voice signal is a conventional defect In order to solve the problem, the voice signal input as a digital signal is filtered using a MA filter to minimize the effect on noise and to accurately extract the voice signal according to a set program.
Description
본 발명은 카폰 등에 이용되고 있는 음성 인식장치에 입력되는 음성을 추출하기 위한 음성 추출장치 및 그 방법에 관한 것으로, 더욱 상세하게는 음성 인식장치에 입력되는 음성신호를 필터링하여 잡음(Noise)에 대한 영향을 최대한 줄여 음성신호를 설정된 프로그램에 의해 정확하게 추출하기 위한 음성 인식장치에 입력되는 음성 추출장치 및 방법에 관한 것이다.The present invention relates to a voice extractor for extracting a voice input to a voice recognition device used in a car phone and the like, and more particularly, to filtering a voice signal input to the voice recognition device to remove noise. The present invention relates to a voice extraction apparatus and a method for inputting a voice recognition apparatus for accurately extracting a voice signal by a set program with the smallest impact.
주지된 바와 같이, 음성 인식장치는 디지털 신호로 변환되어 입력되는 음성신호를 추출하여 추출된 음성신호의 프로세싱 공정이 구비되어 있는 바, 이는 추출된 음성신호에 의해 음성을 인식하는 상태가 결정된다.As is well known, the speech recognition apparatus includes a processing process of an extracted speech signal by extracting a speech signal that is converted into a digital signal and is input, and the state of speech recognition is determined by the extracted speech signal.
일반적으로 카폰 등에서 음성을 추출하기 위한 장치는 제1도에 도시한 바와 같이, 음성신호를 아날로그 신호로 입력받는 음성 입력부(10)와, 상기 음성 입력부(10)에서 출력되는 아날로그 음성신호를 디지털 신호로 변환하는 A/D 변환부(20)와, 상기 A/D 변환부(20)에서 출력되는 디지털 신호로 변환된 음성신호의 시작점과 끝점을 검출하여 음성신호의 시작점과 끝점을 설정된 절대치와 비교 처리하는 마이크로 프로세서(30)와, 상기 마이크로 프로세서(30)에서 출력되는 현재 수집된 음성에 대한 데이터를 기준치와 비교하여 최소의 차이를 갖는 기준 음성신호를 결정하는 DTW(Dynamic Time Warping : 40)로 구성되어 있다.Generally, a device for extracting a voice from a car or the like includes a voice input unit 10 for receiving a voice signal as an analog signal, and an analog voice signal output from the voice input unit 10 as shown in FIG. 1. A / D converter 20 for converting the signal to the digital signal output from the A / D converter 20 and the A / D converter 20 detects the start point and the end point of the voice signal and compares the start and end points of the voice signal with the set absolute values. And a DTW (Dynamic Time Warping: 40) which determines a reference voice signal having a minimum difference by comparing the microprocessor 30 to process the data of the currently collected voice output from the microprocessor 30 with a reference value. Consists of.
제2도는 종래의 음성 인식장치에 입력되는 음성을 추출하는 방법을 보인 흐름도이다.2 is a flowchart illustrating a method of extracting a voice input to a conventional speech recognition apparatus.
디지털 신호로 변환되어 입력되는 음성 데이터를 판독하는 단계(S201)와, 판독된 입력 값의 절대치를 설정하는 단계(S202)와, 입력된 음성 데이터의 시작점이 설정된 절대치 보다 큰가를 확인하는 단계(S203)와, 확인된 결과 음성 데이터의 시작점이 설정된 절대치 보다 작으면 단계(S201)로 복귀되고, 음성 데이터의 시작점이 설정된 절대치 보다 크면 시작점을 임의의 기준점으로 세트하는 단계(S204)와, 시작점이 임의의 기준점으로 세트되면 입력된 음성 데이터를 저장하는 단계(S205)와, 데이터가 저장되면 시작점이 설정된 절대치 보다 작은가를 확인하는 단계(S206)와, 확인된 결과 시작점이 설정된 절대치 보다 크면 단계(S201)로 복귀되고, 시작점이 설정된 절대치 보다 작으면 음성 인식과정을 수행하는 단계(S207)로 이루어짐을 보이고 있다.Reading the voice data converted into the digital signal (S201), setting the absolute value of the read input value (S202), and checking whether the starting point of the input voice data is larger than the set absolute value (S203). And, if the start point of the voice data is smaller than the set absolute value, the process returns to step S201. If the start point of the voice data is larger than the set absolute value, the start point is set to an arbitrary reference point (S204), and the start point is random. Storing the input voice data when the reference point is set (S205); checking whether the starting point is smaller than the set absolute value when the data is stored (S206); and if the determined starting point is larger than the set absolute value (S201). If the starting point is smaller than the set absolute value, it is shown that the step of performing the speech recognition process (S207).
상기한 방식에 의해 입력되는 음성 추출장치가 음성신호를 추출하는 과정을 살펴보면, 음성 입력부(10)를 통해 아날로그 신호로 입력되는 음성신호가 A/D 변환기(20)에서 디지털 신호로 변환되어 마이크로 프로세서(30)에 입력한다.Looking at the process of extracting the voice signal by the voice extraction apparatus input by the above method, the voice signal input as an analog signal through the voice input unit 10 is converted into a digital signal in the A / D converter 20 is a microprocessor Enter in (30).
따라서 마이크로 프로세서(30)는 디지털 입력된 음성신호를 설정된 프로그램에 의해 처리하여 음성신호의 시작점과 끝점을 검출한다.Therefore, the microprocessor 30 detects the start point and the end point of the voice signal by processing the digital input voice signal by the set program.
상기 마이크로 프로세서(30)가 디지털 신호로 입력된 음성신호의 시작점과 끝점을 검출하는 과정을 설명하면, 전단에서 디지털 신호로 변환되어 입력된 음성 데이터를 판독(S201)하여 판독된 입력값의 절대치(시작점과 끝점)를 구한다(S202).When the microprocessor 30 detects a start point and an end point of a voice signal input as a digital signal, the microprocessor 30 reads the voice data, which is converted into a digital signal at the front end (S201), and then reads the absolute value of the input value ( Start point and end point) are obtained (S202).
입력된 음성 데이터의 절대치가 설정되면 마이크로 프로세서(30)는 입력된 음성 데이터의 시작점이 설정된 절대치 보다 큰가를 확인한다. (S203)상기 단계(S203)에서 확인된 결과 음성 데이터의 시작점이 설정된 절대치 보다 작으면 마이크로 프로세서(30)는 단계(S201)로 복귀시켜 전단에서 디지털 신호로 변환되어 필터링된 음성 데이터를 재차 판독(S201)하여 판독된 입력 값의 절대치(시작점과 끝점)를 다시 설정(S202)한다.When the absolute value of the input voice data is set, the microprocessor 30 checks whether the starting point of the input voice data is larger than the set absolute value. If the starting point of the voice data is smaller than the set absolute value as a result of the check in the step S203, the microprocessor 30 returns to step S201 to convert the filtered voice data into a digital signal at the front end and read the filtered data again ( In step S201, the absolute values (start point and end point) of the read input values are set again (S202).
즉, 입력 값의 다시 절대치가 설정되면 마이크로 프로세서(30)는 입력된 음성 데이터의 시작점이 설정된 절대치 보다 큰가를 재차 확인한다. (S203)That is, when the absolute value of the input value is set again, the microprocessor 30 checks again whether the starting point of the input voice data is larger than the set absolute value. (S203)
상기 확인된 결과 음성 데이터의 시작점이 설정된 절대치 보다 크면 마이크로 프로세서(30)는 시작점에 대한 임의의 기준점(Flag)을 세트(S204)하며 입력된 음성 데이터를 저장(S205)한 후 시작점이 절대치 보다 작은가를 확인(S206)한다. 상기 확인된 결과 시작점이 절대치 보다 크면 마이크로 프로세서(40)는 단계(S201)로 복귀시켜 상기한 과정들을 다시 수행하도록 하고, 확인된 결과 시작점이 절대치 보다 작으면 음성 인식과정을 수행(S207)하도록 하여 후단의 DTW(40)를 경유하여 현재 수집된 음성에 대한 데이터를 기준치와 비교하여 최소의 차이를 갖는 기준 음성신호를 결정하는 것이다.If the start point of the voice data is greater than the set absolute value, the microprocessor 30 sets an arbitrary reference point (Flag) for the start point (S204) and stores the input voice data (S205), and then is the start point smaller than the absolute value? Check (S206). If the confirmed result start point is greater than the absolute value, the microprocessor 40 returns to step S201 to perform the above processes again, and if the confirmed result start point is smaller than the absolute value, the voice recognition process is performed (S207). The reference voice signal having the minimum difference is determined by comparing the data of the voice currently collected via the DTW 40 at the rear stage with the reference value.
그러나 상기한 종래의 음성 인식장치에 입력되는 음성신호를 추출하는 과정은, 입력되는 음성신호에 대해 순시적으로 입력 값을 절대치와 비교하여 음성신호의 유/무를 판단하거나, 임의의 갯수에 대한 입력신호의 평균값을 구하여 음성의 유/무를 판단하므로 인하여 혼입되는 잡음에 대한 오동작 가능성이 높아 입력되는 음성신호를 정확하게 검출할 수 있는 확률이 낮아지는 결점이 발생되었던 것이다.However, the process of extracting the voice signal input to the conventional voice recognition apparatus, by comparing the instantaneous input value with the absolute value for the input voice signal to determine the presence or absence of the voice signal, or input for any number Since the average value of the signal is determined to determine whether or not the voice is present, there is a defect in that the probability of malfunction of the mixed noise is high and the probability of accurately detecting the input voice signal is low.
상기와 같은 종래의 결점을 해결하기 위한 본 발명의 목적은, 디지털 신호로 변환되어 음성 인식장치에 입력되는 음성신호를 필터링하여 잡음에 대한 영향을 최대한 줄여 설정된 프로그램에 따라 음성신호를 정확하게 추출할 수 있는 음성 추출장치 및 방법을 제공함에 있다.An object of the present invention for solving the above-mentioned drawbacks is to filter the voice signal converted into a digital signal and input to the voice recognition device to reduce the effect on noise as much as possible to accurately extract the voice signal according to the set program The present invention provides a voice extraction apparatus and method.
상기 목적을 달성하기 위하여 본 발명에서는, 디지털 신호로 입력되는 음성신호를 필터링하여 설정된 프로그램 처리하여 음성신호를 간편하고 정확하게 추출할 수 있도록 하는 음성 추출장치 및 그에 따른 추출방법을 제공하는 것을 특징으로 한다.In order to achieve the above object, the present invention is characterized in that it provides a voice extraction device and a method for extracting the same so that the voice signal can be extracted simply and accurately by filtering the voice signal input as a digital signal and setting the program. .
제1도는 일반적인 음성 추출장치를 개략적으로 보인 구성 블록도.1 is a block diagram schematically showing a general speech extraction device.
제2도는 종래의 음성 인식장치에 입력되는 음성을 추출하는 방법을 보인 흐름도.2 is a flowchart illustrating a method of extracting a voice input to a conventional speech recognition apparatus.
제3도는 본 발명에 따른 음성 인식장치에 입력되는 음성 추출장치를 개략적으로 보인 구성 블록도.3 is a block diagram schematically showing a speech extraction apparatus input to a speech recognition apparatus according to the present invention.
제4도는 본 발명에 따른 음성 인식장치에 입력되는 음성을 추출하는 방법을 보인 흐름도.4 is a flowchart illustrating a method of extracting a voice input to a voice recognition apparatus according to the present invention.
* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings
10 : 음성 입력부 20 : A/D 변환부10: voice input unit 20: A / D conversion unit
22 : MA 필터(Moving Average Value Filter) 30 : 마이크로 프로세서22: Moving Filter (MA) 30: Microprocessor
40 : DTW(Dynamic Time Warping)40: Dynamic Time Warping (DTW)
제3도는 본 발명에 따른 음성 인식장치에 입력되는 음성 추출장치를 개략적으로 보인 구성 블록도이다.3 is a block diagram schematically showing a speech extraction apparatus input to a speech recognition apparatus according to the present invention.
음성신호를 아날로그 신호로 입력받는 음성 입력부(10)와, 상기 음성 입력부(10)에서 출력되는 아날로그 음성신호를 디지털 신호로 변환하는 A/D 변환부(20)와, 상기 A/D 변환부(20)에서 출력되는 디지털 신호로 변환된 음성신호의 시작점과 끝점을 검출하여 음성신호의 시작점과 끝점을 설정된 기준값와 비교 처리하는 마이크로 프로세서(30)와, 상기 마이크로 프로세서(30)에서 출력되는 현재 수집된 음성에 대한 데이터를 기준치와 비교하여 최소의 차이를 갖는 기준 음성신호를 결정하는 DTW(40)를 구비한 음성 추출장치에 있어서, 상기 A/D 변환부(20)에서 디지털 신호로 변환된 음성신호 중에서 노이즈 성분을 무빙 평균값을 이용하여 필터링한다음 마이크로 프로세서(30)에 출력하는 MA 필터(Moving Average Value Filter : 32)를 더 포함하여 구성되며, 상기 마이크로 프로세서(30)는 MA 필터(22)에서 출력하는 필터링된 음성신호에 대한 절대치 평균을 구하고, 그 값을 이용하여 음성의 시작점과 끝점을 판단한다.A voice input unit 10 for receiving a voice signal as an analog signal, an A / D converter 20 for converting an analog voice signal output from the voice input unit 10 into a digital signal, and the A / D converter ( A microprocessor 30 which detects a start point and an end point of the voice signal converted into a digital signal output from the digital signal 20 and compares the start point and the end point of the voice signal with a set reference value, and currently collected by the microprocessor 30. In the speech extraction device having a DTW 40 for determining a reference speech signal having a minimum difference by comparing the data about the speech with a reference value, the speech signal converted into a digital signal by the A / D converter 20 And a MA filter (32) for filtering the noise component using a moving average value and outputting the noise component to the microprocessor 30. The processor 30 obtains an average of absolute values of the filtered voice signal output from the MA filter 22 and determines start and end points of the voice using the values.
상기 마이크로 프로세서(30)는 내부에 타이머와 메모리를 포함하고 있다.The microprocessor 30 includes a timer and a memory therein.
제4도는 본 발명에 따른 마이크로 프로세서(30)가 음성 인식장치에 입력되는 음성을 추출하는 방법을 보인 흐름도이다.4 is a flowchart illustrating a method of extracting a voice input to a speech recognition apparatus by the microprocessor 30 according to the present invention.
초기(Initialization) 기억 매체상의 끝점(Head Tail)을 순환 대기열(Circular Queue)에 대기시키는 단계(S401)와, 초기 기억 매체상의 끝점이 순환 대기되면 내부 타이머에 인터럽트(INT)가 걸렸는가를 확인하는 단계(S402)와, 확인된 결과 인터럽트가 걸렸으면 디지털 신호로 필터링되어 입력되는 음성 데이터를 판독하는 단계(S403)와, 판독된 음성 데이터를 순환 대기열(Circular Queue)에 저장하는 단계(S404)와, 데이터가 저장되면 기억 매체상의 끝점을 증가시켜 단계(S402)로 복귀시키는 단계(S405)와, 단계(S402)에서 확인된 결과 인터럽트가 걸리지 않았으면 순환대기열(Circular Queue)의 절대치 평균값을 구하는 단계(S406)와, 구해진 절대치 평균값이 기준값보다 큰가를 확인하는 단계(S407)와, 확인된 결과 절대치 평균값이 기준값보다 작으면 단계(S402)로 복귀시키고, 절대치 평균값이 기준값보다 크면 메모리에 음성 데이터를 저장하는 단계(S408)와, 메모리에 음성 데이터가 저장되면 순환 대기열(Circular Queue)의 절대치 평균값을 재차 구하는 단계(S409)와, 구해Waiting for an end of the initial tail on the initial storage medium to the circular queue (S401), and checking whether an internal timer has been interrupted when the end on the initial storage medium is cyclically waited (S402), if the identified result is interrupted, reading the inputted voice data filtered by the digital signal (S403), storing the read voice data in a circular queue (S404), When the data is stored, increasing the end point on the storage medium and returning to step S402 (S405), and if the result of the check in step S402 is not interrupted, obtaining an average value of the absolute value of the circular queue (Circular Queue) ( S406) and checking whether the obtained absolute mean value is greater than the reference value (S407), and if the resultant absolute mean value is smaller than the reference value, returns to step S402, and the absolute mean is If the value is larger than the reference value, storing the voice data in the memory (S408), and if the voice data is stored in the memory (S409) to obtain the absolute value of the absolute value of the circular queue again (S409)
진 절대치 평균값이 기준값보다 작은가를 확인하는 단계(S410)와, 확인된 결과 절대치 평균값이 기준값보다 크면 단계(S408)로 복귀시키고, 절대치 평균값이 기준값 보다 작으면 음성 인식과정을 수행하는 단계(S411)로 이루어짐을 보이고 있다.Checking whether the true absolute value is smaller than the reference value (S410); and if the determined absolute value is greater than the reference value, returns to step S408; and if the absolute value is smaller than the reference value, performing a speech recognition process (S411). It is shown to be made.
본 발명의 일 실시예에 따른 작용상태를 살펴보면, 음성 입력부(10)를 통해 아날로그 신호로 입력되는 음성신호가 A/D 변환기(20)에서 디지털 신호로 변환되어 MA 필터(22)에 입력된다.Looking at the operation state according to an embodiment of the present invention, the voice signal input as an analog signal through the voice input unit 10 is converted into a digital signal in the A / D converter 20 is input to the MA filter 22.
상기 MA 필터(22)는 전단의 A/D 변환부(20)에서 디지털 신호로 변환된 음성신호를 무빙 평균값을 이용하여 필터링하여 노이즈 성분을 제거하여 마이크로 프로세서(30)에 입력한다.The MA filter 22 filters the voice signal converted into a digital signal by the A / D converter 20 of the front end using a moving average value to remove noise components and input the same to the microprocessor 30.
따라서 마이크로 프로세서(30)는 디지털 입력된 음성신호를 제4도에 도시한 바와 같이 설정된 프로그램에 의해 음성신호를 처리한다.Therefore, the microprocessor 30 processes the audio signal by the program set as shown in FIG.
상기 마이크로 프로세서(30)가 음성신호를 설정된 프로그램에 의해 처리하는 과정을 상세하게 살펴보면, 전단에서 필터링되어 입력된 음성신호의 초기(Initialization) 기억 매체상의 끝점(Head Tail)을 순환 대기열(Circular Queue)에 대기 시킨다. (5401) 즉, 초기 기억 매체상의 끝점이 순환 대기열에 대기되면 마이크로 프로세서(30)는 설정된 프로그램에 따라 내부 타이머에 인터럽트(INT)가 걸렸는가를 확인(S402)한다.When the microprocessor 30 processes the voice signal by a set program in detail, a circular queue of an end point on an initialization storage medium filtered through the front end of the input voice signal is circulated. Let's wait. That is, when the endpoint on the initial storage medium is queued in the circular queue, the microprocessor 30 checks whether the internal timer has been interrupted (INT) according to the set program (S402).
상기 확인된 결과 인터럽트가 걸렸으면 전단에서 디지털 신호로 필터링되어 입력되는 음성 데이터를 판독하여(S403) 판독된 음성 데이터를 내부 순환 대기열(Circular Queue)에 저장(S404)한다.If the result of the check is interrupted, the voice data filtered through the digital signal at the front end is read (S403), and the read voice data is stored in an internal circular queue (S404).
상기 순환 대기열(Circular Queue)에 데이터가 저장되면 마이크로 프로세서(30)는 기억 매체상의 끝점을 증가시켜 재차 내부 타이머에 인터럽트가 걸렸는가를 확인(5402)하여 인터럽트가 걸리지 않았으면 순환 대기열(Circular Queue)의 절대치 평균값을 구한다. (S406) 상기 순환 대기열(Circular Queue)에 저장된 음성신호의 절대치 평균값을 구하는 일예는 아래의 식과 같다When data is stored in the circular queue, the microprocessor 30 increases the end point on the storage medium to check whether the internal timer is interrupted again (5402). Find the absolute mean value. (S406) An example of obtaining an average value of absolute values of voice signals stored in the circular queue is as follows.
여기서, S(n)은 순환 대기열의 절대치 평균값이고, i(n)은 MA 필터(22)에서 마이크로 프로세서(30)에 입력되어 순환 대기열에 저장되어 있는 음성신호이고, M은 순환 대기열에 저장된 음성신호의 갯수이며, n은 음성신호가 저장되어 있는 순환 대기열의 끝점이고, m은 0부터 M-1 중의 임의의 값이다.Here, S (n) is the absolute mean value of the circular queue, i (n) is the voice signal input to the microprocessor 30 from the MA filter 22 and stored in the circular queue, and M is the voice stored in the circular queue. The number of signals, n is the end point of the circular queue where voice signals are stored, and m is any value from 0 to M-1.
즉, 순환 대기열의 절대값 평균은 순환 대기열에 저장되어 있는 음성신호 데이터 i(n-M+l)부터 i(n)까지의 절대치의 산술 합을 저장된 음성신호의 갯수 M으로 나누어서 구한다. 이때 n-m0이면 i(n-m)=0으로 하여 무시한다.That is, the absolute value average of the circular queue is obtained by dividing the arithmetic sum of the absolute values from voice signal data i (n-M + l) to i (n) stored in the circular queue by the number M of stored voice signals. If n-m0, i (n-m) = 0 is ignored.
상기 마이크로 프로세서(30)는 구해진 절대치 평균값이 설정된 기준값 보다 큰가를 확인(S407)하여 절대치 평균값이 기준값보다 작으면(음성의 시작점이 발견되지 않으면) 단계(S402)로 복귀시켜 설정된 프로그램에 따라 내부 타이머에 인터럽트(INT)가 걸렸는가를 재차 확인(S402)하여 인터럽트가 걸리지 않았으면 순환 대기열의 절대치 평균값을 구한다.(S406)The microprocessor 30 checks whether the obtained absolute mean value is greater than the set reference value (S407), and if the absolute mean value is smaller than the reference value (when no voice start point is found), the microprocessor 30 returns to step S402 to determine the internal timer according to the set program. Check again whether an interrupt (INT) has occurred (S402), and if no interruption has occurred, obtain an average value of the absolute value of the circular queue (S406).
상기 마이크로 프로세서(30)는 구해진 순환 대기열의 절대치 평균값이 설정된 기준값보다 큰가를 재차 확인(S407)하여 절대치 평균값이 기준값보다 크면 내부 메모리에 음성 데이터를 저장(S408)한다.The microprocessor 30 checks again whether the obtained absolute mean value of the circulating queue is larger than the set reference value (S407), and stores the voice data in the internal memory when the absolute mean value is larger than the reference value (S408).
계속하여 마이크로 프로세서(30)는 내부 메모리에 음성 데이터가 저장되면 순환대기열(Circular Queue)의 절대치 평균값을 재차 구하여(S409) 절대치 평균값이 기준값보다 작은가를 확인(S410)한다.Subsequently, when the voice data is stored in the internal memory, the microprocessor 30 obtains the absolute mean value of the circular queue again (S409) and checks whether the absolute mean value is smaller than the reference value (S410).
상기 확인된 결과 절대치 평균값이 기준값보다 크면 마이크로 프로세서(30)는 단계(S408)로 복귀시켜 내부 메모리에 음성 데이터를 저장(S408)하여 순환 대기열(Circular Queue)의 절대치 평균값을 재차 구하여(S409) 걸대치 평균값이 기준값보다 작은가를 다시 확인(S410)한다.If the resultant absolute value is greater than the reference value, the microprocessor 30 returns to step S408, stores the voice data in the internal memory (S408), and obtains the absolute value of the absolute value of the circular queue again (S409). It is again checked whether the mean value of substitution is smaller than the reference value (S410).
상기 확인된 결과 절대치 평균값이 기준값보다 작으면 마이크로 프로세서(30)는 후단의 DTW(40)로 데이터를 출력하여 음성 인식과정을 안정되게 수행(S411)하도록 하는 것이다.If the resultant absolute value is smaller than the reference value, the microprocessor 30 outputs data to the DTW 40 at the rear end so as to stably perform the speech recognition process (S411).
상술한 바와 같이 본 발명은 입력되는 음성신호를 필터링하여 잡음에 대한 영향을 최대한 줄여 음성신호를 설정된 프로그램에 의해 정확하게 추출하여 음성 인식장치에 입력할 수 있는 효과를 가진다.As described above, the present invention has an effect of filtering the input voice signal to minimize the effect on noise and accurately extracting the voice signal by a set program and inputting the input voice signal into the voice recognition device.
본 발명은 특허 청구의 범위에 기재되어 있는 바와 같이 음성 인식장치에 입력되는 음성 추출장치 및 그 방법의 일 실시예에 관해서만 설명하였으나, 본 발명은 이에 한정하지 아니하며 당업자라면 여러 가지로 그 응용과 변형이 가능할 것이다.The present invention has been described only with respect to an embodiment of a speech extraction apparatus and a method for inputting a speech recognition apparatus as described in the claims, but the present invention is not limited to this and various applications and Modifications may be possible.
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019960033638A KR100198978B1 (en) | 1996-08-13 | 1996-08-13 | Apparatus and mehtod for extracting the speech inputting to speech recognition apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019960033638A KR100198978B1 (en) | 1996-08-13 | 1996-08-13 | Apparatus and mehtod for extracting the speech inputting to speech recognition apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19980014604A KR19980014604A (en) | 1998-05-25 |
KR100198978B1 true KR100198978B1 (en) | 1999-06-15 |
Family
ID=19469540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019960033638A KR100198978B1 (en) | 1996-08-13 | 1996-08-13 | Apparatus and mehtod for extracting the speech inputting to speech recognition apparatus |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100198978B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016208789A1 (en) * | 2015-06-26 | 2016-12-29 | 삼성전자 주식회사 | Method for determining sound and device therefor |
-
1996
- 1996-08-13 KR KR1019960033638A patent/KR100198978B1/en not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016208789A1 (en) * | 2015-06-26 | 2016-12-29 | 삼성전자 주식회사 | Method for determining sound and device therefor |
US10839827B2 (en) | 2015-06-26 | 2020-11-17 | Samsung Electronics Co., Ltd. | Method for determining sound and device therefor |
Also Published As
Publication number | Publication date |
---|---|
KR19980014604A (en) | 1998-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8046215B2 (en) | Method and apparatus to detect voice activity by adding a random signal | |
CN107516534B (en) | Voice information comparison method and device and terminal equipment | |
CN105989836B (en) | Voice acquisition method and device and terminal equipment | |
CN109448746B (en) | Voice noise reduction method and device | |
CN111768760B (en) | Multi-mode voice endpoint detection method and device | |
US5671330A (en) | Speech synthesis using glottal closure instants determined from adaptively-thresholded wavelet transforms | |
JP2010257140A (en) | Apparatus and method for processing information | |
CN110807093A (en) | Voice processing method and device and terminal equipment | |
KR950013553B1 (en) | Voice signal processing device | |
KR100198978B1 (en) | Apparatus and mehtod for extracting the speech inputting to speech recognition apparatus | |
CN106504756A (en) | Built-in speech recognition system and method | |
US20070070428A1 (en) | Device and method for sharpening image signal | |
CN112393799B (en) | Far-field voice equipment detection method and device and television terminal | |
KR20060055776A (en) | Adaptive edge-preserving smoothing filter and filtering method with noise cancelation capability | |
CN112017649A (en) | Audio processing method and device, electronic equipment and readable storage medium | |
CN113590873A (en) | Processing method and device for white list voiceprint feature library and electronic equipment | |
JPS62211699A (en) | Voice section detecting circuit | |
JPH021317B2 (en) | ||
JP2007043285A (en) | Shake vector detecting apparatus, camera system, shake vector detection method, and shake vector detection program | |
JP3484559B2 (en) | Voice recognition device and voice recognition method | |
CN116343812B (en) | Voice processing method | |
KR100194210B1 (en) | Image splitting device and method | |
KR920006870A (en) | Data processing device | |
EP3935632B1 (en) | Method and system for speech separation | |
JP2643435B2 (en) | Input signal recognition method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |