KR970060045A - Pitch Detection Device - Google Patents

Pitch Detection Device Download PDF

Info

Publication number
KR970060045A
KR970060045A KR1019970001192A KR19970001192A KR970060045A KR 970060045 A KR970060045 A KR 970060045A KR 1019970001192 A KR1019970001192 A KR 1019970001192A KR 19970001192 A KR19970001192 A KR 19970001192A KR 970060045 A KR970060045 A KR 970060045A
Authority
KR
South Korea
Prior art keywords
pitch
zero crossing
waveform
integer
speech waveform
Prior art date
Application number
KR1019970001192A
Other languages
Korean (ko)
Other versions
KR100406655B1 (en
Inventor
다케시 다이소지
야스오 와카모리
도시히코 스즈키
야스케 야마모토
Original Assignee
우에시마 세이스케
야마하 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP524996A external-priority patent/JP3235445B2/en
Priority claimed from JP00525296A external-priority patent/JP3707121B2/en
Priority claimed from JP00524896A external-priority patent/JP3996221B2/en
Priority claimed from JP00525396A external-priority patent/JP3996222B2/en
Priority claimed from JP525096A external-priority patent/JPH09198094A/en
Priority claimed from JP00525196A external-priority patent/JP3707120B2/en
Application filed by 우에시마 세이스케, 야마하 가부시키가이샤 filed Critical 우에시마 세이스케
Publication of KR970060045A publication Critical patent/KR970060045A/en
Application granted granted Critical
Publication of KR100406655B1 publication Critical patent/KR100406655B1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

본 발명의 피치검출장치는 샘플링주파수를 가지며, 사람의 음성에 대응하는 입력디지탈신호를 수신하며, 상기 입력디지탈신호상에서 오버샘플링 동작이 행해져서 임의의 배수(즉, 4)로 상기 샘플링주파수를 승산한다. 따라서 상기 장치는 체배된 주파수를 가지는 디지탈음성신호를 생성하며, 이에 의해 2진 신호가 생성된다. 여기서 상기 2진 신호는 레벨이 시간의 경과에 따라서 변화하는 음성파형이 약 제로 레벨로 마스킹존을 통해 횡단하는 경우에만 역으로 되며, 상기 2진 신호는 상기 음성파형이 상기 마스킹존내에서 이동하는 지속시간에서 그대로 지진된다. 다음으로 상기 장치는 음성파형이 제로 베벨라인을 교차하는 제로 교차라인을 측정하며, 상기 측정된 제로 교차간격이 시간축 상에 연속으로 배치되며, 피치 주기가 '2n'제로 교차간격(여기서n은 정수)의 합에 대응한다는 가정을 근거로 상기 장치는 파형사이클간의 대응도를 연속으로 생성하도록 상기 제로교차 간격에 대한 연산을 수행한다. 상기 대응도 각각은 상기 음성파형에서 서로 인접위치한 'm'파형사이클(여기서 'm'은 '3'과 '4' 같은 정수)과 관련하여 연산되므로 상기 장치는 상기 계산된 대응도 중에서 가장 높은 대응도를 구하도록 'n'에 대해 임의의 정수를 선택하므로서 피치주기를 구한다.The pitch detection apparatus of the present invention has a sampling frequency, receives an input digital signal corresponding to a human voice, and oversampling operation is performed on the input digital signal to multiply the sampling frequency by an arbitrary multiple (i.e., 4). do. The device thus generates a digital speech signal having a multiplied frequency, whereby a binary signal is produced. Wherein the binary signal is reversed only when the voice waveform whose level changes over time traverses through the masking zone at a level of about zero, and the binary signal is a continuous movement of the voice waveform within the masking zone. Earthquake literally in time. The apparatus then measures the zero crossing lines where the speech waveform intersects the zero bevel line, the measured zero crossings are continuously arranged on the time axis, and the pitch period is '2n' zero crossings where n is an integer. Based on the hypothesis that the sum corresponds to the sum of N i), the apparatus performs an operation on the zero crossing interval to continuously generate correspondence between waveform cycles. Each of the correspondences is calculated in relation to an 'm' waveform cycle (where 'm' is an integer such as '3' and '4') adjacent to each other in the speech waveform, so that the apparatus has the highest correspondence among the calculated correspondences. The pitch period is obtained by selecting a random integer for 'n' to find the degree.

Description

피치검출장치Pitch Detection Device

본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음Since this is an open matter, no full text was included.

제1도는 본 발명의 일 실시예에 따라 설계된 피치검출장치의 기능을 통합한 가라오케시스템의 구성의 일부를 도시하는 블록도.1 is a block diagram showing a part of the configuration of a karaoke system incorporating the functions of a pitch detection device designed according to an embodiment of the present invention.

Claims (15)

음성파형에서 연속으로 나타나는 제로교차간격(t1, t2…)을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하는데, 상기 정수 'n'은 소정의 수 이상이며, 상기 피치연산수단이 피치주기를 구하도록 상기 정수 'm'을 감소시키는 것을 특징으로 하는 피치검출장치.Zero crossing interval measuring means for measuring zero crossing intervals (t 1 , t 2 ...) Appearing continuously in the speech waveform; And pitch calculation means using an assumption that the pitch period corresponds to the sum of the '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), where the number 'n' is less than or equal to '1'. Is selected from a range of integers, wherein the pitch calculation means performs a calculation based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed in a speech waveform to form part of a speech waveform. Arbitrary to integer n such that 'm' waveform cycles are located adjacent to each other, where 'm' is an integer less than or equal to '2' to obtain the highest correspondence among the calculated correspondences. The pitch period is determined by selecting an integer, wherein the constant 'n' is a predetermined number or more, and the pitch detecting device reduces the constant 'm' so that the pitch calculation means obtains the pitch period. 제1항에 있어서, 상기 피치연산수단이 가장 높은 대응도의 정수 'n'을 구하도록 정수 'n'에 대해 임의의 정수를 선택한후, 각각이 '2n'제로교차간격의 합에 대응하며, 'm'파형사이클과 관련하여 연산되는 피치주기를 평균화하는 평균화수단을 추가로 구비하는 것을 특징으로 하는 피치검출장치.The method according to claim 1, wherein the pitch calculating means selects an arbitrary integer for the integer 'n' so as to obtain the highest correspondence integer 'n', and each corresponds to the sum of the '2n' zero crossing intervals, and averaging means for averaging the pitch period calculated in relation to the 'm' waveform cycle. 음성파형에서 연속으로 나타나는 제로교차간격(t1,t2…)을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+ …+2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하는 것을 특징으로 하는 피치검출장치.Zero crossing interval measurement means for measuring zero crossing intervals (t 1 , t 2 ...) Appearing continuously in the speech waveform; And pitch calculation means using an assumption that the pitch period corresponds to the sum of the '2n' zero crossing intervals (where T = t 1 + t 2 +... + 2n ), where the number 'n' is equal to or less than '1'. Selected from a range of integers, the pitch calculating means performs calculations based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed from each other in a speech waveform to form part of a speech waveform; Arbitrary integers for integer n such that the adjacent 'm' waveform cycle (where 'm' is an integer less than or equal to '2') is computed to obtain the highest correspondence among the calculated correspondences. Pitch detection device, characterized in that for determining the pitch period. 제3항에 있어서, 상기 피치연산수단에 있어서, 정수 'n'이 소정수 이상이 아닌 경우 정수 'm'으로 '4'가 설정되며, 정수 'n'이 소정수 이상인 경우 정수 'm'으로 '3'이 설정되는 것을 특징으로 하는 피치검출장치.4. The pitch calculating means according to claim 3, wherein if the integer 'n' is not greater than or equal to a predetermined number, '4' is set to 'm', and if the integer 'n' is greater than or equal to a predetermined number, the integer is 'm'. Pitch detection device, characterized in that '3' is set. 제3항에 있어서, 상기 피치연산수단은 상기 피치주기에 대응하는 각각의 '2n'제로교차간격과 관련하여 임의의 에러 마진내에서 동일한 시간길이가 'm'파형사이클에서 반복적으로 나타나는 회수를 카운트하여 상기피치연산수단이 '2n'제로교차간격 각각과 관련하여 카운트된 회수의 합에 근거하여 파형사이클 사이의 대응도를 연산하는 것을 특징으로 하는 피치검출장치.4. The method of claim 3, wherein the pitch calculating means counts the number of times the same length of time is repeatedly displayed in an 'm' waveform cycle in relation to each '2n' zero crossing interval corresponding to the pitch period. And the pitch calculation means calculates the correspondence between waveform cycles based on the sum of the number of counts associated with each of the '2n' zero crossing intervals. 음성파형에서 연속으로 나타나는 제로교차간격(t1, t2…)을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1'이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 임의의 허용가능 범위에 속하는 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하며, 상기 피치연산수단은 임의의 허용가능 범위로부터 상기 대응도가 편이되는 경우 피치주기를 판단하지 않는 것을 특징으로 하는 피치검출장치.Zero crossing interval measuring means for measuring zero crossing intervals (t 1 , t 2 ...) Appearing continuously in the speech waveform; And pitch calculation means using a hypothesis where the pitch period corresponds to the sum of the '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), where the number 'n' is '1' or less. Is selected from a range of integers, wherein the pitch calculation means performs a calculation based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed in a speech waveform to form part of a speech waveform. Computation is performed on the 'm' waveform cycles (where 'm' is an integer less than or equal to 2) located adjacent to each other to obtain the highest correspondence among the calculated correspondences for which the pitch operation means falls within any acceptable range. A pitch period is determined by selecting a random integer for the constant n so that the pitch calculation means does not determine the pitch period when the correspondence is shifted from any allowable range. . 음성파형에서 연속으로 나타나는 제로교차간격(t1, t2…)을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하며, 상기 제로교차간격측정수단은 하한 값이거나 그 이하인 측정된 제로교차간격을 무시하며, 상기 측정된 제로교차간격이 상한 값을 초과하는 경우 상기 측정된 제로교차간격대신에 상기 상한값을 이용하는 것을 특징으로 하는 피치검출장치.Zero crossing interval measuring means for measuring zero crossing intervals (t 1 , t 2 ...) Appearing continuously in the speech waveform; And pitch calculation means using an assumption that the pitch period corresponds to the sum of the '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), where the number 'n' is less than or equal to '1'. Is selected from a range of integers, wherein the pitch calculation means performs a calculation based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed in a speech waveform to form part of a speech waveform. Arbitrary to integer n such that 'm' waveform cycles are located adjacent to each other, where 'm' is an integer less than or equal to '2' to obtain the highest correspondence among the calculated correspondences. The pitch period is determined by selecting an integer, and the zero crossing interval measuring means ignores the measured zero crossing interval which is equal to or lower than the lower limit value, and the measured zero crossing interval when the measured zero crossing interval exceeds the upper limit value. A pitch detection apparatus characterized by using the upper limit value, the new. 주파수 체배된 디지탈음성신호를 생성하도록 임의의 배수로 입력디지탈음성신호의 샘플링주파수를 승산하는 오버샘플링수단; 상기 오버샘플링수단으로부터 출력된 디지탈음성신호와 임의의 레벨을 비교해서 상기 신호를 2진 신호로 변환하는 2진화수단; 상기 2진신호에 의거 제로교차간격(t1, t2…)을 측정하는 제로교차간격 측정수단을 구비하는데, 상기 제로교차간격은 상기 디지탈음성신호에 의거 형성된 음성파형에서 연속으로 나타나며; 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하는 것을 특징으로 하는 피치검출장치.Oversampling means for multiplying the sampling frequency of the input digital speech signal by an arbitrary multiple to produce a frequency multiplied digital speech signal; Binarization means for comparing the digital audio signal outputted from the oversampling means with an arbitrary level and converting the signal into a binary signal; Zero crossing interval measuring means for measuring a zero crossing interval (t 1 , t 2 ...) Based on the binary signal, wherein the zero crossing interval appears continuously in a speech waveform formed based on the digital audio signal; A pitch calculation means using a hypothesis whose pitch period corresponds to the sum of '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), wherein the number 'n' is equal to or less than '1'. Selected from a range of integers, the pitch calculating means performs calculations based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed from each other in a speech waveform to form part of a speech waveform; Arbitrary integers for integer n such that the adjacent 'm' waveform cycle (where 'm' is an integer less than or equal to '2') is computed to obtain the highest correspondence among the calculated correspondences. Pitch detection device, characterized in that for determining the pitch period. 기준제로레벨에 의거 음성파형의 2진화동작을 실행하여 2진신호를 생성하는 2진화수단; 상기 2진신호에 의거 상기 음성파형에서 연속으로 나타나는 제로교차간격(t1,t2…)을 측정하는 제로교차간격측정수단; 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하며; 상기2진화수단은 기준제로레벨 주위에서 상기 마스킹존을 설정하여 음성파형레벨이 시간경과에 따라 변화하는 음성파형이 상기 마스킹존을 통과 횡단하는 경우에만 상기 2진신호를 역으로 하며, 상기 음성파형이 상기 마스킹존내에서 이동하는 경우 상기 음성파형이 마스킹존으로 들어가기 바로 전에 생성된 2진신호를 유지하는 것을 특징으로 하는 피치검출장치.Binarization means for generating a binary signal by performing a binarization operation of a speech waveform based on a reference zero level; Zero crossing interval measuring means for measuring zero crossing intervals (t 1 , t 2 ...) Continuously appearing in the speech waveform based on the binary signal; A pitch calculation means using a hypothesis whose pitch period corresponds to the sum of '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), wherein the number 'n' is equal to or less than '1'. Selected from a range of integers, the pitch calculating means performs calculations based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed from each other in a speech waveform to form part of a speech waveform; Arbitrary integers for integer n such that the adjacent 'm' waveform cycle (where 'm' is an integer less than or equal to '2') is computed to obtain the highest correspondence among the calculated correspondences. Judging pitch period by selecting; The binarization means sets the masking zone around a reference zero level, and reverses the binary signal only when a voice waveform whose voice waveform level changes with passage of time passes through the masking zone. And a pitch detection device for maintaining the binary signal generated just before the voice waveform enters the masking zone when moving within the masking zone. 제9항에 있어서, 상기 음성파형의 진폭에 응답하여 마스킹존의 폭이 변경되도록 제어되는 것을 특징으로 하는 피치검출장지.10. The pitch detecting device of claim 9, wherein a width of a masking zone is controlled to change in response to an amplitude of the speech waveform. 사람의 음성을 나타내는 입력디지탈신호를 입력받아 오버샘플링동작을 수행하여 임의의 배수를 이용하여 승산을 효과적으로 하도록 샘플링주파수를 증가시켜서 주파수 체배되고 음성파형을 가지는 디지탈음성신호를 생성하는 오버샘플링수단; 상기 디지탈음성신호에 의거 2진신호를 생성하되, 상기 2진신호가 음성파형레벨이 시간의 경과에 따라 변화하는 음성파형이 제로레벨 주위에 설정된 마스킹존을 통과 횡단하는 경우에만 역으로 되며, 상기 마스킹존내에서 음성파형이 이동하는 지속시간에서 그대로 유지되게된 2진화수단; 음성파형이 제로레벨라인과 교차하는 시간축상에 연속으로 배치된 복수의 제로교차간격을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하는 것을 특징으로 하는 피치검출장치.Oversampling means for receiving an input digital signal representing a human voice and performing an oversampling operation to increase a sampling frequency so as to effectively multiply using an arbitrary multiple to generate a digital voice signal having a frequency multiplied and speech waveform; Generates a binary signal based on the digital voice signal, but is reversed only when the binary signal crosses a masking zone set around a zero level where the voice waveform level changes over time. Binarization means which is maintained intact in the duration of movement of the speech waveform within the masking zone; Zero crossing interval measuring means for measuring a plurality of zero crossing intervals disposed successively on a time axis at which a speech waveform intersects a zero level line; And pitch calculation means using an assumption that the pitch period corresponds to the sum of '2n' zero crossing intervals, wherein the number 'n' is selected from a range of integers less than or equal to '1', and the pitch calculation means is a waveform cycle. The operation is performed based on the zero crossing intervals to continuously generate correspondences between the two correspondences, wherein each correspondence is formed by a 'm' waveform cycle located adjacent to each other in the speech waveform to form part of the speech waveform (where 'm' Pitch determination means for determining a pitch period by selecting an arbitrary integer for integer n so as to obtain the highest correspondence among the calculated degrees of correspondence calculated by the . 제11항에 있어서, 상기 디지탈음성신호의 체배된 주파수가 상기 샘플링주파수의 4배 이상이 되도록 임의의 배수로 설정되는 것을 특징으로 하는 피치검출장치.12. The pitch detection apparatus according to claim 11, wherein the multiplied frequency of said digital speech signal is set to an arbitrary multiple so that it is at least four times the sampling frequency. 제11항에 있어서, 상기 정수 'm'은 피치주기에 대응하는 제로교차간격의 수이며, 적어도 '3'인 정수 '2n'에 응답하여 결정되는 것을 특징으로 하는 피치검출장치.12. The apparatus of claim 11, wherein the constant 'm' is a number of zero crossing intervals corresponding to a pitch period, and is determined in response to an integer '2n' that is at least '3'. 제11항에 있어서, 상기 마스킹존의 폭은 상기 음성파형의 진폭에 응답하여 변경되도록 제어되는 것을 특징으로 하는 피치검출장치.12. The pitch detection apparatus according to claim 11, wherein the width of the masking zone is controlled to be changed in response to an amplitude of the speech waveform. 제11항에 있어서, 상기 베로교차간격측정수단으로 측정되며, 소정의 범위에만 속하는 제로교차간격을 저장하는 저장수단을 구비하는데 상기 기억수단에 기억된 제로교차간격이 판독되어 상기 피치연산수단에 공급되는 것을 특징으로 하는 피치검출장치.12. The apparatus according to claim 11, further comprising storage means for storing the zero crossing intervals measured by the Vero cross interval measuring means, wherein the zero crossing intervals stored in the storage means are read and supplied to the pitch calculation means. Pitch detection device, characterized in that. ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.※ Note: The disclosure is based on the initial application.
KR1019970001192A 1996-01-16 1997-01-16 Pitch Detection Device KR100406655B1 (en)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
JP524996A JP3235445B2 (en) 1996-01-16 1996-01-16 Pitch detection device
JP96-005253 1996-01-16
JP00525296A JP3707121B2 (en) 1996-01-16 1996-01-16 Pitch detection device
JP00524896A JP3996221B2 (en) 1996-01-16 1996-01-16 Pitch detection device
JP00525396A JP3996222B2 (en) 1996-01-16 1996-01-16 Pitch detection device
JP96-005251 1996-01-16
JP96-005250 1996-01-16
JP96-005248 1996-01-16
JP525096A JPH09198094A (en) 1996-01-16 1996-01-16 Pitch detecting device
JP96-005252 1996-01-16
JP96-005249 1996-01-16
JP00525196A JP3707120B2 (en) 1996-01-16 1996-01-16 Pitch detection device

Publications (2)

Publication Number Publication Date
KR970060045A true KR970060045A (en) 1997-08-12
KR100406655B1 KR100406655B1 (en) 2004-03-31

Family

ID=30773759

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970001192A KR100406655B1 (en) 1996-01-16 1997-01-16 Pitch Detection Device

Country Status (2)

Country Link
KR (1) KR100406655B1 (en)
CN (1) CN1136536C (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7715447B2 (en) * 2003-12-23 2010-05-11 Intel Corporation Method and system for tone detection
CN107808655B (en) * 2017-10-27 2021-02-12 广州酷狗计算机科技有限公司 Audio signal processing method, audio signal processing device, electronic equipment and storage medium
JP7395901B2 (en) * 2019-09-19 2023-12-12 ヤマハ株式会社 Content control device, content control method and program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5447622A (en) * 1977-09-21 1979-04-14 Sony Corp Electronic musical instrument
JPS5857758B2 (en) * 1979-09-28 1983-12-21 株式会社日立製作所 Audio pitch period extraction device
JPS60198597A (en) * 1984-03-22 1985-10-08 株式会社リコー Binary coder for voice spelling
JPH05315891A (en) * 1992-05-12 1993-11-26 Victor Co Of Japan Ltd Digital signal processing system

Also Published As

Publication number Publication date
KR100406655B1 (en) 2004-03-31
CN1162113A (en) 1997-10-15
CN1136536C (en) 2004-01-28

Similar Documents

Publication Publication Date Title
KR960030072A (en) Pitch Recognition Method for Strings / Percussion Instruments
KR100808729B1 (en) Simultaneous determination of multiphase flowrates and concentrations
KR900004883B1 (en) Method and apparatus for level measurement with micor waves
KR920015765A (en) Signal transmission system
KR900001082A (en) Transient Exponential Noise Reduction Device and Method in Sine Wave Signal
ES2034600T3 (en) GAS FLOWMETER.
KR970060045A (en) Pitch Detection Device
KR910005596A (en) Radio receiver
DE59408650D1 (en) Method and device for measuring the flow rate, in particular the blood
JPH07294628A (en) Signal processor
Grechikhin et al. Digital Hilbert transform for processing of laser Doppler vibrometer signals
SU610026A1 (en) Discrete analyzer of harmonic spectrum quadrature components
JPS56148067A (en) Measuring circuit for coder characteristic
KR920022657A (en) Waveform Shaping Method and Apparatus and Method and Apparatus for Creating Thresholds for Waveform Shaping
SU647871A1 (en) Device for evaluating coaxial cable non-uniformity
Owen Measurement of speed by cross correlation using pulse frequency signals
SU1056277A1 (en) Meter of period of nuclear reactor
SU1308840A1 (en) Method of determining pulse period-to-pulse duration ratio of sequence with given pulse shape
SU1120353A1 (en) Device for determining third central moment
Kinsella et al. Harmonic analysis in the measurement of CO sub 2 corrosion and inhibition of steel
RU2041862C1 (en) Method for measurement of substance concentration
SU854141A1 (en) Radioisotope device
SU1647325A1 (en) Method for determining energy dissipation characteristics under oscillations of a linear mechanical system
SU558420A2 (en) A device for measuring the pulse width of the white level
SU1499249A1 (en) Method of determining amplitude of periodic pulses

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121019

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20131018

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee