Claims (15)
음성파형에서 연속으로 나타나는 제로교차간격(t1, t2…)을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하는데, 상기 정수 'n'은 소정의 수 이상이며, 상기 피치연산수단이 피치주기를 구하도록 상기 정수 'm'을 감소시키는 것을 특징으로 하는 피치검출장치.Zero crossing interval measuring means for measuring zero crossing intervals (t 1 , t 2 ...) Appearing continuously in the speech waveform; And pitch calculation means using an assumption that the pitch period corresponds to the sum of the '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), where the number 'n' is less than or equal to '1'. Is selected from a range of integers, wherein the pitch calculation means performs a calculation based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed in a speech waveform to form part of a speech waveform. Arbitrary to integer n such that 'm' waveform cycles are located adjacent to each other, where 'm' is an integer less than or equal to '2' to obtain the highest correspondence among the calculated correspondences. The pitch period is determined by selecting an integer, wherein the constant 'n' is a predetermined number or more, and the pitch detecting device reduces the constant 'm' so that the pitch calculation means obtains the pitch period.
제1항에 있어서, 상기 피치연산수단이 가장 높은 대응도의 정수 'n'을 구하도록 정수 'n'에 대해 임의의 정수를 선택한후, 각각이 '2n'제로교차간격의 합에 대응하며, 'm'파형사이클과 관련하여 연산되는 피치주기를 평균화하는 평균화수단을 추가로 구비하는 것을 특징으로 하는 피치검출장치.The method according to claim 1, wherein the pitch calculating means selects an arbitrary integer for the integer 'n' so as to obtain the highest correspondence integer 'n', and each corresponds to the sum of the '2n' zero crossing intervals, and averaging means for averaging the pitch period calculated in relation to the 'm' waveform cycle.
음성파형에서 연속으로 나타나는 제로교차간격(t1,t2…)을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+ …+2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하는 것을 특징으로 하는 피치검출장치.Zero crossing interval measurement means for measuring zero crossing intervals (t 1 , t 2 ...) Appearing continuously in the speech waveform; And pitch calculation means using an assumption that the pitch period corresponds to the sum of the '2n' zero crossing intervals (where T = t 1 + t 2 +... + 2n ), where the number 'n' is equal to or less than '1'. Selected from a range of integers, the pitch calculating means performs calculations based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed from each other in a speech waveform to form part of a speech waveform; Arbitrary integers for integer n such that the adjacent 'm' waveform cycle (where 'm' is an integer less than or equal to '2') is computed to obtain the highest correspondence among the calculated correspondences. Pitch detection device, characterized in that for determining the pitch period.
제3항에 있어서, 상기 피치연산수단에 있어서, 정수 'n'이 소정수 이상이 아닌 경우 정수 'm'으로 '4'가 설정되며, 정수 'n'이 소정수 이상인 경우 정수 'm'으로 '3'이 설정되는 것을 특징으로 하는 피치검출장치.4. The pitch calculating means according to claim 3, wherein if the integer 'n' is not greater than or equal to a predetermined number, '4' is set to 'm', and if the integer 'n' is greater than or equal to a predetermined number, the integer is 'm'. Pitch detection device, characterized in that '3' is set.
제3항에 있어서, 상기 피치연산수단은 상기 피치주기에 대응하는 각각의 '2n'제로교차간격과 관련하여 임의의 에러 마진내에서 동일한 시간길이가 'm'파형사이클에서 반복적으로 나타나는 회수를 카운트하여 상기피치연산수단이 '2n'제로교차간격 각각과 관련하여 카운트된 회수의 합에 근거하여 파형사이클 사이의 대응도를 연산하는 것을 특징으로 하는 피치검출장치.4. The method of claim 3, wherein the pitch calculating means counts the number of times the same length of time is repeatedly displayed in an 'm' waveform cycle in relation to each '2n' zero crossing interval corresponding to the pitch period. And the pitch calculation means calculates the correspondence between waveform cycles based on the sum of the number of counts associated with each of the '2n' zero crossing intervals.
음성파형에서 연속으로 나타나는 제로교차간격(t1, t2…)을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1'이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 임의의 허용가능 범위에 속하는 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하며, 상기 피치연산수단은 임의의 허용가능 범위로부터 상기 대응도가 편이되는 경우 피치주기를 판단하지 않는 것을 특징으로 하는 피치검출장치.Zero crossing interval measuring means for measuring zero crossing intervals (t 1 , t 2 ...) Appearing continuously in the speech waveform; And pitch calculation means using a hypothesis where the pitch period corresponds to the sum of the '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), where the number 'n' is '1' or less. Is selected from a range of integers, wherein the pitch calculation means performs a calculation based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed in a speech waveform to form part of a speech waveform. Computation is performed on the 'm' waveform cycles (where 'm' is an integer less than or equal to 2) located adjacent to each other to obtain the highest correspondence among the calculated correspondences for which the pitch operation means falls within any acceptable range. A pitch period is determined by selecting a random integer for the constant n so that the pitch calculation means does not determine the pitch period when the correspondence is shifted from any allowable range. .
음성파형에서 연속으로 나타나는 제로교차간격(t1, t2…)을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하며, 상기 제로교차간격측정수단은 하한 값이거나 그 이하인 측정된 제로교차간격을 무시하며, 상기 측정된 제로교차간격이 상한 값을 초과하는 경우 상기 측정된 제로교차간격대신에 상기 상한값을 이용하는 것을 특징으로 하는 피치검출장치.Zero crossing interval measuring means for measuring zero crossing intervals (t 1 , t 2 ...) Appearing continuously in the speech waveform; And pitch calculation means using an assumption that the pitch period corresponds to the sum of the '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), where the number 'n' is less than or equal to '1'. Is selected from a range of integers, wherein the pitch calculation means performs a calculation based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed in a speech waveform to form part of a speech waveform. Arbitrary to integer n such that 'm' waveform cycles are located adjacent to each other, where 'm' is an integer less than or equal to '2' to obtain the highest correspondence among the calculated correspondences. The pitch period is determined by selecting an integer, and the zero crossing interval measuring means ignores the measured zero crossing interval which is equal to or lower than the lower limit value, and the measured zero crossing interval when the measured zero crossing interval exceeds the upper limit value. A pitch detection apparatus characterized by using the upper limit value, the new.
주파수 체배된 디지탈음성신호를 생성하도록 임의의 배수로 입력디지탈음성신호의 샘플링주파수를 승산하는 오버샘플링수단; 상기 오버샘플링수단으로부터 출력된 디지탈음성신호와 임의의 레벨을 비교해서 상기 신호를 2진 신호로 변환하는 2진화수단; 상기 2진신호에 의거 제로교차간격(t1, t2…)을 측정하는 제로교차간격 측정수단을 구비하는데, 상기 제로교차간격은 상기 디지탈음성신호에 의거 형성된 음성파형에서 연속으로 나타나며; 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하는 것을 특징으로 하는 피치검출장치.Oversampling means for multiplying the sampling frequency of the input digital speech signal by an arbitrary multiple to produce a frequency multiplied digital speech signal; Binarization means for comparing the digital audio signal outputted from the oversampling means with an arbitrary level and converting the signal into a binary signal; Zero crossing interval measuring means for measuring a zero crossing interval (t 1 , t 2 ...) Based on the binary signal, wherein the zero crossing interval appears continuously in a speech waveform formed based on the digital audio signal; A pitch calculation means using a hypothesis whose pitch period corresponds to the sum of '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), wherein the number 'n' is equal to or less than '1'. Selected from a range of integers, the pitch calculating means performs calculations based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed from each other in a speech waveform to form part of a speech waveform; Arbitrary integers for integer n such that the adjacent 'm' waveform cycle (where 'm' is an integer less than or equal to '2') is computed to obtain the highest correspondence among the calculated correspondences. Pitch detection device, characterized in that for determining the pitch period.
기준제로레벨에 의거 음성파형의 2진화동작을 실행하여 2진신호를 생성하는 2진화수단; 상기 2진신호에 의거 상기 음성파형에서 연속으로 나타나는 제로교차간격(t1,t2…)을 측정하는 제로교차간격측정수단; 피치주기가 '2n'제로교차간격(여기서 T=t1+t2+…+t2n)의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서, 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하며; 상기2진화수단은 기준제로레벨 주위에서 상기 마스킹존을 설정하여 음성파형레벨이 시간경과에 따라 변화하는 음성파형이 상기 마스킹존을 통과 횡단하는 경우에만 상기 2진신호를 역으로 하며, 상기 음성파형이 상기 마스킹존내에서 이동하는 경우 상기 음성파형이 마스킹존으로 들어가기 바로 전에 생성된 2진신호를 유지하는 것을 특징으로 하는 피치검출장치.Binarization means for generating a binary signal by performing a binarization operation of a speech waveform based on a reference zero level; Zero crossing interval measuring means for measuring zero crossing intervals (t 1 , t 2 ...) Continuously appearing in the speech waveform based on the binary signal; A pitch calculation means using a hypothesis whose pitch period corresponds to the sum of '2n' zero crossing intervals (where T = t 1 + t 2 +… + t 2n ), wherein the number 'n' is equal to or less than '1'. Selected from a range of integers, the pitch calculating means performs calculations based on zero crossing intervals to continuously generate correspondences between waveform cycles, each correspondence being formed from each other in a speech waveform to form part of a speech waveform; Arbitrary integers for integer n such that the adjacent 'm' waveform cycle (where 'm' is an integer less than or equal to '2') is computed to obtain the highest correspondence among the calculated correspondences. Judging pitch period by selecting; The binarization means sets the masking zone around a reference zero level, and reverses the binary signal only when a voice waveform whose voice waveform level changes with passage of time passes through the masking zone. And a pitch detection device for maintaining the binary signal generated just before the voice waveform enters the masking zone when moving within the masking zone.
제9항에 있어서, 상기 음성파형의 진폭에 응답하여 마스킹존의 폭이 변경되도록 제어되는 것을 특징으로 하는 피치검출장지.10. The pitch detecting device of claim 9, wherein a width of a masking zone is controlled to change in response to an amplitude of the speech waveform.
사람의 음성을 나타내는 입력디지탈신호를 입력받아 오버샘플링동작을 수행하여 임의의 배수를 이용하여 승산을 효과적으로 하도록 샘플링주파수를 증가시켜서 주파수 체배되고 음성파형을 가지는 디지탈음성신호를 생성하는 오버샘플링수단; 상기 디지탈음성신호에 의거 2진신호를 생성하되, 상기 2진신호가 음성파형레벨이 시간의 경과에 따라 변화하는 음성파형이 제로레벨 주위에 설정된 마스킹존을 통과 횡단하는 경우에만 역으로 되며, 상기 마스킹존내에서 음성파형이 이동하는 지속시간에서 그대로 유지되게된 2진화수단; 음성파형이 제로레벨라인과 교차하는 시간축상에 연속으로 배치된 복수의 제로교차간격을 측정하는 제로교차간격측정수단; 및 피치주기가 '2n'제로교차간격의 합에 대응하는 가정을 이용하는 피치연산수단을 구비하는데, 상기 수 'n'은 '1' 이하의 정수의 범위에서 선택되며, 상기 피치연산수단은 파형사이클 사이의 대응도를 연속으로 생성하도록 제로교차간격에 의거 연산을 실행하며, 상기 각각의 대응도는 음성파형의 일부를 형성하도록 음성파형에서 서로 인접하여 위치한 'm'파형사이클(여기서 'm'은 '2' 이하의 정수)에 대해 연산되어 상기 피치연산수단이 연산된 대응도 중에서 가장 높은 대응도를 구하도록 정수 n에 대해 임의의 정수를 선택하므로서 피치주기를 판단하는 것을 특징으로 하는 피치검출장치.Oversampling means for receiving an input digital signal representing a human voice and performing an oversampling operation to increase a sampling frequency so as to effectively multiply using an arbitrary multiple to generate a digital voice signal having a frequency multiplied and speech waveform; Generates a binary signal based on the digital voice signal, but is reversed only when the binary signal crosses a masking zone set around a zero level where the voice waveform level changes over time. Binarization means which is maintained intact in the duration of movement of the speech waveform within the masking zone; Zero crossing interval measuring means for measuring a plurality of zero crossing intervals disposed successively on a time axis at which a speech waveform intersects a zero level line; And pitch calculation means using an assumption that the pitch period corresponds to the sum of '2n' zero crossing intervals, wherein the number 'n' is selected from a range of integers less than or equal to '1', and the pitch calculation means is a waveform cycle. The operation is performed based on the zero crossing intervals to continuously generate correspondences between the two correspondences, wherein each correspondence is formed by a 'm' waveform cycle located adjacent to each other in the speech waveform to form part of the speech waveform (where 'm' Pitch determination means for determining a pitch period by selecting an arbitrary integer for integer n so as to obtain the highest correspondence among the calculated degrees of correspondence calculated by the .
제11항에 있어서, 상기 디지탈음성신호의 체배된 주파수가 상기 샘플링주파수의 4배 이상이 되도록 임의의 배수로 설정되는 것을 특징으로 하는 피치검출장치.12. The pitch detection apparatus according to claim 11, wherein the multiplied frequency of said digital speech signal is set to an arbitrary multiple so that it is at least four times the sampling frequency.
제11항에 있어서, 상기 정수 'm'은 피치주기에 대응하는 제로교차간격의 수이며, 적어도 '3'인 정수 '2n'에 응답하여 결정되는 것을 특징으로 하는 피치검출장치.12. The apparatus of claim 11, wherein the constant 'm' is a number of zero crossing intervals corresponding to a pitch period, and is determined in response to an integer '2n' that is at least '3'.
제11항에 있어서, 상기 마스킹존의 폭은 상기 음성파형의 진폭에 응답하여 변경되도록 제어되는 것을 특징으로 하는 피치검출장치.12. The pitch detection apparatus according to claim 11, wherein the width of the masking zone is controlled to be changed in response to an amplitude of the speech waveform.
제11항에 있어서, 상기 베로교차간격측정수단으로 측정되며, 소정의 범위에만 속하는 제로교차간격을 저장하는 저장수단을 구비하는데 상기 기억수단에 기억된 제로교차간격이 판독되어 상기 피치연산수단에 공급되는 것을 특징으로 하는 피치검출장치.12. The apparatus according to claim 11, further comprising storage means for storing the zero crossing intervals measured by the Vero cross interval measuring means, wherein the zero crossing intervals stored in the storage means are read and supplied to the pitch calculation means. Pitch detection device, characterized in that.
※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.※ Note: The disclosure is based on the initial application.