KR930004739B1 - Voice pitch detecting device - Google Patents
Voice pitch detecting device Download PDFInfo
- Publication number
- KR930004739B1 KR930004739B1 KR1019900022900A KR900022900A KR930004739B1 KR 930004739 B1 KR930004739 B1 KR 930004739B1 KR 1019900022900 A KR1019900022900 A KR 1019900022900A KR 900022900 A KR900022900 A KR 900022900A KR 930004739 B1 KR930004739 B1 KR 930004739B1
- Authority
- KR
- South Korea
- Prior art keywords
- pitch
- detecting
- signal
- filter bank
- filter
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Abstract
Description
제1도는 본 발명의 블록도.1 is a block diagram of the present invention.
제2도는 본 발명에 적용된 필터뱅크부의 실시예시도.2 is an exemplary view of a filter bank unit applied to the present invention.
제3도는 본 발명에 적용된 진폭검출장치의 실시예시도.3 is an exemplary view of an amplitude detection device applied to the present invention.
제4도는 본 발명에 적용된 주기검출장치의 블록도.4 is a block diagram of a periodic detection device applied to the present invention.
제5도는 본 발명에 적용된 주기검출장치의 실시예시도.5 is an exemplary view of a periodic detection device applied to the present invention.
제6도는 본 발명의 동작 흐름도.6 is an operational flowchart of the present invention.
제7도는 목소리의 PITCH 범위예시도.7 shows an example of the PITCH range of the voice.
제8도는 종래 AUTO-CORRELATION의 출력파형도.8 is an output waveform diagram of a conventional AUTO-CORRELATION.
제9도는 종래 AUTO-CORRELATION의 동작도.9 is an operation of conventional AUTO-CORRELATION.
* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings
203 : 필터 뱅크부 204 : 진폭 검출 장치부203: filter bank portion 204: amplitude detection device portion
205 : 주기검출장치부205: periodic detection unit
본 발명은 사람의 목소리에서 PITCH성분을 검출하여 NOTE 정보로 변환하는 것으로 특히 연산시간이 과다하여 실시간 검출이 어려운 점을 해결하는 한편 검출된 PITCH정보를 MIDI의 NOTE정보로 변환하여 전송가능케하여 전자악기와 연결하여 사용할 수 있도록 한 VOICE PITCH 검출장치에 관한 것이다.The present invention detects a PITCH component from a human voice and converts it into NOTE information. In particular, it solves a problem in that it is difficult to detect in real time due to excessive computation time, and converts the detected PITCH information into NOTE information of MIDI so that it can be transmitted. It relates to a VOICE PITCH detection device that can be used in conjunction with the.
종래에는 AUTO-CORRELATION을 이용한 PITCH검출 방식으로서 AUTO-CORRELATION은 C(t)=y.(z)y(t+z)dc의 형태로 정의되며, y(t)가 주기함수인 경우 상기 식의 연산에 의해서 제8도에서 보는 바와 같이 그 주마다 최소치를 갖는 정현파로 출력되며, 상기 식을 SHAMPLED데이타의 형태로 표현하면Conventionally, as a PITCH detection method using AUTO-CORRELATION, AUTO-CORRELATION is defined in the form of C (t) = y. (Z) y (t + z) dc, and when y (t) is a periodic function, As shown in FIG. 8, the result is a sine wave having a minimum value for each week. The above expression is expressed in the form of SHAMPLED data.
과 같으며 이 식을 제9도를 참고로 설명하면 다음과 같다.This equation is explained with reference to FIG.
먼저 전체 신호중에서 최소한 2주기 이상의 성분을 포함하는 시간으로 Sample Window를 행한 다음 릴레이를 φ-m까지 행함으로써(Co)-C(m)의 값을 구한다.First, a sample window is performed for a time including at least two cycles of components in the total signal, and then a relay is performed up to φ-m (Co) -C (m).
이때 첫번째 최고값은 C(o)이고, C(o)=C(m)이 되는 m값을 얻으며, m.Δ(t) (Δ(t) : 샘플링 interval)가 신호 X(n)의 PITCH에 해당하는 주기가 되며, 이 방법을 이용하는 경우 덧셈과 곱셈이 각 C(m) 값마다 N번씩 소요되기 때문에 샘플링률을 10KHz로 하고 Window길이를 50msec로 한 경우 각 C(m)을 구하는 데 500번의 덧셈과 곱셈이 행해져야 하고 100개의 C(m)을 계산하는 경우, 1초에 1,000,000번의 덧셈과 곱셈이 필요하므로 전용 DSP CHIP을 사용하지 않고서는 실현하기가 거의 불가능하다는 문제점이 있다.At this time, the first highest value is C (o) and C (o) = C (m) is obtained, and m.Δ (t) (Δ (t): sampling interval) is the PITCH of the signal X (n). In this method, addition and multiplication takes N times for each C (m) value. Therefore, if the sampling rate is 10KHz and the window length is 50msec. In the case where 100 additions and multiplications are to be performed and 100 C (m) are calculated, 1,000,000 additions and multiplications are required in one second, and thus it is almost impossible to realize without using a dedicated DSP chip.
본 발명은 이와 같은 문제점을 시정 보완하기 위해 안출된 것으로 아날로그 필터 뱅크를 사용하여 처리시간을 실시간으로 행할 수 있으며 MPU로 실시간 PITCH검출을 할 수 있도록 한 것으로 첨부한 도면에 의해서 상세히 설명하면 다음과 같다.The present invention has been devised to correct the above problems, and can be performed in real time using an analog filter bank. The present invention will be described in detail with reference to the accompanying drawings. .
본 발명은 제1도에서 보는 바와 같이, 자동레벨 조정장치부(202)를 통과한 음성신호에 대해서 그 음성신호의 PITCH에 해당되는 Fundamental 성분으로 검출되도록 하는 필터 뱅크부(203)와, 상기 필터의 출력을 제로크로스검파기(210)로 검출하여 그 신호를 이용해서주기 만큼의 시간을 카운터를 이용해서 측정하도록 하는 주기 검출 장치부(205)와, 상기 필터 뱅크부(203)에서 출력된 음성신호를 정류화하여 A/D컨버터(209)로 입력되도록 하는 진폭검출 장치부(204)로 구성된다.As shown in FIG. 1, the present invention provides a filter bank unit 203 for detecting a voice signal passing through the automatic level adjusting unit 202 as a Fundamental component corresponding to the PITCH of the voice signal. The output is detected by the zero cross detector 210 and using the signal A period detecting device unit 205 for measuring a period of time using a counter, and an amplitude detection for rectifying the audio signal output from the filter bank unit 203 to be input to the A / D converter 209. It consists of an apparatus part 204.
이와 같이 구성된 본 발명의 작용 효과는 다음과 같다.Effects of the present invention configured as described above are as follows.
제1도에서 보는 바와 같이 마이크로폰을 통해 입력된 음성신호는 fc=830Hz의 로우패스 필터(201)를 통해서 높은 주파수 성분의 노이즈는 제거되고 자동레벨 조정장치부(202)로 입력되므로 자동레벨 조정장치부(202)는 입력신호가 어느 설정된 값보다 작은 때는 출력을 접지 레벨로 함으로써 처리되어야할 음성신호의 크기를 제한할 뿐만 아니라 과다한 입력을 제한하고 전체적으로 Maximum Dynamic Range를 얻을 수 있도록 자동적으로 조정되며, 이 자동 레벨조정 장치부에서 출력된 음성신호 6개로 구성된 로우 패스필터 뱅크부(203)를 통과하게 되는데, 상기 뱅크부의 각 필터의 컷오프 주파수는 가장 낮은 136Hz부터 반 옥타브씩으로 구성되며 각 필터는 2번째 하모닉과 그 이상의 하모닉들을 충분히 감쇄시켜 주어서 필터 출력이 Fundamental 성분과 동일한 제로 크로싱을 얻을 수 있도록 보장되어야 하며 이렇게 되기 위해서는 a12xa2(a1: Fundamental의 Amplitude, a2: Second Harmonic의 Amplitude)의 조건을 만족해야하는데 제2도에서 보는 바와 같이 fourth orde 0.5dB Chebyshev 필터 정도면 상기 조건을 만족한다.As shown in FIG. 1, the voice signal input through the microphone is removed through the low pass filter 201 of fc = 830 Hz, and noise of high frequency component is removed and input to the automatic level adjusting unit 202. When the input signal is smaller than any set value, the output is set to the ground level to not only limit the size of the audio signal to be processed, but also automatically adjust to limit the excessive input and to obtain the maximum dynamic range as a whole. The low pass filter bank section 203, which consists of six audio signals output from the level adjusting device section, passes through the filter, and the cutoff frequency of each filter of the bank section is composed of the second harmonic and the second harmonic. Fully attenuates further harmonics so that the filter output is zero crossing equal to the Fundamental component Be guaranteed to be obtained and in order to do this, a second surface of claim 1 2xa degree fourth orde 0.5dB Chebyshev filter, as shown in Figure 2 have to satisfy the conditions of (a 1:: Fundamental of Amplitude, a 2 Second Harmonic of Amplitude) The above conditions are satisfied.
상기 필터 뱅크부(203)를 통과한 음성 신호는 그 PITCH에 해당되는 Fundamental 성분만이 남아있는 신호로 되고 이 신호는 다시 주기 검출장치부(205) 및 진폭 검출 장치부(204)로 입력되는데, 진폭 검출장치는 제3도에서 보는 바와 같이 정류회로로 구성되어 정류된 신호를 콘덴서(C)에 의해 홀딩하게 되고 이 신호는 A/D컨버터(209)로 입력하여 디지탈 값으로 변환 다음 MPU(207)에 입력하게 되며 즉, MPU(207)는 A/D컨버터(209)에 입력된 6개의 아날로그 신호들을 Multiplexing으로 변환해서 얻어진 디지탈 값을 입력으로 받는다.The voice signal passing through the filter bank unit 203 becomes a signal in which only the Fundamental component corresponding to the PITCH remains, and this signal is input to the period detecting unit 205 and the amplitude detecting unit 204 again. As shown in FIG. 3, the amplitude detection device is composed of a rectifying circuit to hold the rectified signal by the capacitor C. The signal is input to the A / D converter 209 and converted into a digital value. In other words, the MPU 207 receives a digital value obtained by converting six analog signals input to the A / D converter 209 into multiplexing.
이때 Vocal, music에서의 기본이 되는 note duration은 보통 16분음표이고 TEMPO=90일때 16분음표()는 16MSEC이다. 따라서DURATION에서 PITCH를 검출하기 위해서는 83MSEC-55MSEC정도마다 PITCH검출동작을 실시하면 되므로 주기검출장치부 및 진폭 검출장치부는 55MSE-83MSE마다 동작되도록 설계된다.At this time, the basic note duration in vocal and music is usually sixteenth note, and when TEMPO = 90, sixteenth note ( ) Is 16 MSEC. therefore In order to detect the PITCH in the DURATION, the PITCH detection operation should be performed every 83 MSEC-55MSEC. Therefore, the periodic detection unit and the amplitude detection unit are designed to operate every 55MSE-83MSE.
제4도와 제5도는 주기 검출 장치부(205)에 대해 나타낸 것으로서 검출주기마다 MPU(207)는 a신호선을 통하여 카운터(212)를 리세트시키고 주기검출을 시작하는 주기검출장치부(205)는 필터의 출력을 제로크로스검파기(210)로 검출하고 그 신호를 이용해서주기만큼의 시간을 카운터(212)를 이용해서 측정하며 이 카운터의 클럭은 외부의 클럭 발생부(206)로부터 입력되고 카운터를 스타트/스톱시키는 EN신호는 제로 크로스를 거친 필터 출력이므로 제5도에서 보는 바와 같이주기동안 카운터를 동작시키고, 그 출력값을 MPU로 입력되도록 하며 제6도는 MPU에서 검출주기시간 간격으로 실행하는 PITCH를 결정 동작 흐름도로서 MAX-A는 진폭 검출장치부의 A(φ)-A(5)중 가장 큰 값으로 정의되고, 이 MAX-A가 SILENCE-THRESHOLD보다 작은 경우는 입력신호가 없거나 자동레벨 장치부(202)의 THRESHOLD보다 작은 경우 이므로 NOTE OFF정보로써 MIDI전송을 하며, MAX-A를배한것을 THRESHOLD 값으로 정의하고, 각 진폭 검출 장치를 검토하고 그 값보다 큰 경우는 그 진폭 검출장치부와 관련된 주기검출장치부의 출력 T값이 그 블록에서 적절한 값인가를 판단하여 적절한 값이면이 그 필터의 컷오프이하에 위치하는 주파수인 경우이고, PITCH는로 결정되고 이 주파수에 해당되는 건반상의 NOTE NUMBER를 NOTE ON정보로 준비하여 MIDI로 전송하며 이 처리는 검출주기마다 행해진다.4 and 5 show the period detecting device unit 205. In each detection period, the MPU 207 resets the counter 212 through the a signal line and starts the period detecting unit 205. The output of the filter is detected by the zero cross detector 210 and using the signal The time of the period is measured by using the counter 212. The clock of this counter is input from the external clock generator 206, and the EN signal for starting / stopping the counter is a filter output through zero cross. As you see The counter is operated during the period, the output value is inputted to the MPU, and FIG. 6 determines the PITCH executed at the detection cycle time interval in the MPU. As an operation flow chart, MAX-A is A (φ) -A (5) of the amplitude detection unit. If the MAX-A is defined as the largest value among SILENCE-THRESHOLD, and there is no input signal or less than THRESHOLD of the automatic level device section 202, MIDI transmission is performed as NOTE OFF information. Define the value as THRESHOLD value, examine each amplitude detection device, and if it is larger than that value, determine whether the output T value of the period detection device part related to the amplitude detection device part is an appropriate value in the block. Is the frequency located below the cutoff of the filter, PITCH The note number on the keyboard corresponding to this frequency is prepared as NOTE ON information and transmitted to MIDI. This process is performed at each detection cycle.
따라서 거의 모든 처리가 아날로그 처리가 되므로 보통의 MPU를 사용해서도 실시간으로 PITCH를 검출할 수 있도록 하며 필터뱅크부, 진폭검출장치부 및 주기검출장치를 전부 디지탈화하여 사용할 수 있으며 종래의 AUTO-CORRELATION을 이용한 PITCH검출 장치와 대치하여 사용할 수 있으며 특히 아날로그 필터 뱅크부를 이용하여 처리시간을 실시간으로 행할 수 있으며 한편 AUTO-CORRELATION 방식의 단점인 많은 계산을 행해야하므로 실시간 처리를 하기 위해서는 고속의 DSP CHIP이 필요한 점을 해결하여 보통의 MPU로도 실시간 PITCH검출을 할 수 있다.Therefore, almost all processing is analog processing, so it is possible to detect PITCH in real time even using ordinary MPU, and it is possible to digitalize all of the filter bank, amplitude detection device and periodic detection device, and use conventional AUTO-CORRELATION. It can be used to replace the used PITCH detection device. Especially, the processing time can be done in real time by using the analog filter bank part, and high speed DSP CHIP is required for real time processing because many calculations, which are disadvantages of AUTO-CORRELATION method, must be performed. By solving the problem, real-time PITCH detection can be performed even with a normal MPU.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900022900A KR930004739B1 (en) | 1990-12-31 | 1990-12-31 | Voice pitch detecting device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900022900A KR930004739B1 (en) | 1990-12-31 | 1990-12-31 | Voice pitch detecting device |
Publications (2)
Publication Number | Publication Date |
---|---|
KR920013252A KR920013252A (en) | 1992-07-28 |
KR930004739B1 true KR930004739B1 (en) | 1993-06-03 |
Family
ID=19309313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019900022900A KR930004739B1 (en) | 1990-12-31 | 1990-12-31 | Voice pitch detecting device |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR930004739B1 (en) |
-
1990
- 1990-12-31 KR KR1019900022900A patent/KR930004739B1/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR920013252A (en) | 1992-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2948739B2 (en) | Karaoke system user's song scorer | |
USRE33739E (en) | Electronic musical instrument | |
EP0054365B1 (en) | Speech recognition systems | |
US5780759A (en) | Method for pitch recognition, in particular for musical instruments which are excited by plucking or striking | |
Kuhn | A real-time pitch recognition algorithm for music applications | |
JPH05297880A (en) | Method and device for processing source sound | |
KR930004739B1 (en) | Voice pitch detecting device | |
KR100189797B1 (en) | Method for recognition of the start of a note in the case or percussion or plucked musical instrument | |
JPH0462399B2 (en) | ||
US4982433A (en) | Speech analysis method | |
US5208861A (en) | Pitch extraction apparatus for an acoustic signal waveform | |
EP0441642A2 (en) | Methods and apparatus for spectral analysis | |
JP2734526B2 (en) | Pitch extraction device | |
KR0128851B1 (en) | Pitch detecting method by spectrum harmonics matching of variable length dual impulse having different polarity | |
JPS63259596A (en) | Voice section detecting system | |
KR970012536A (en) | Echo / accompaniment correction device and method | |
JPS59218498A (en) | Voice frequency detection circuit | |
JPH01315797A (en) | Pitch extractor | |
JPH03288200A (en) | Pitch detecting device | |
JPS58109821A (en) | Device and method of measuring pitch | |
JPS6126089A (en) | Musical scale detector | |
JPS638698A (en) | Rhythm display unit | |
JPH05241597A (en) | Pitch period extracting method | |
Sakk et al. | A time-frequency model for pitch analysis | |
JPS60194500A (en) | Frictivity detector |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 19981221 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |