JPS58220195A - Pitch extraction system - Google Patents

Pitch extraction system

Info

Publication number
JPS58220195A
JPS58220195A JP10336782A JP10336782A JPS58220195A JP S58220195 A JPS58220195 A JP S58220195A JP 10336782 A JP10336782 A JP 10336782A JP 10336782 A JP10336782 A JP 10336782A JP S58220195 A JPS58220195 A JP S58220195A
Authority
JP
Japan
Prior art keywords
pitch
waveform
autocorrelation function
input waveform
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10336782A
Other languages
Japanese (ja)
Inventor
健作 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP10336782A priority Critical patent/JPS58220195A/en
Publication of JPS58220195A publication Critical patent/JPS58220195A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (発明の技術分野) 本発明は、音声波形の自己相関関数を用いて音声の基本
周期であるピッチを抽出する際における演算回数を少な
くすることができる、ピッチ抽出方式に関するものであ
る。
Detailed Description of the Invention (Technical Field of the Invention) The present invention provides a pitch extraction method that can reduce the number of calculations when extracting the pitch, which is the fundamental period of speech, using an autocorrelation function of a speech waveform. It is related to.

(従来技術と問題点) 音声(有声音)のピッチの抽出は、大刀原音声波形また
はその音声波形の分析後の残差波形の自己相関関数を用
いて行うことができる。この場合の自己相関量数位、波
形x (t)と波形x (t)から一定時間τだけずれ
た波形x(t+τ)との積の積分によって求められる。
(Prior Art and Problems) The pitch of speech (voiced sound) can be extracted using the autocorrelation function of the Otohara speech waveform or the residual waveform after analyzing the speech waveform. In this case, the autocorrelation amount is determined by integrating the product of the waveform x (t) and the waveform x (t+τ) that is shifted by a certain time τ from the waveform x (t).

すなわち自己相関関数R(τ)は で表わされる。In other words, the autocorrelation function R(τ) is It is expressed as

またディジタル処理の場合は自己相関関数R(kT)は で表わされる。In addition, in the case of digital processing, the autocorrelation function R (kT) is It is expressed as

ここでTは標本化周期である。Here, T is the sampling period.

従来、(2)式によって音声のピッチを標本化周期の精
度で求めようとする場合には、ピッチの統計的な分布範
囲のすべてに対応する時間のずれkTに対する、相関の
演算回路を用意して計算を行っていた。例えばピッチの
分布範囲を2〜16mBと仮定すると、標本化周期T=
 125μsとおいた場合−自己相関関数を計算すべき
時間のすれ4の範囲は次のようになる。
Conventionally, when trying to find the pitch of a voice with the accuracy of the sampling period using equation (2), a correlation calculation circuit was prepared for the time shift kT that corresponds to the entire statistical distribution range of the pitch. I was doing calculations. For example, assuming that the pitch distribution range is 2 to 16 mB, the sampling period T =
When 125 μs is set, the range of time lag 4 in which the autocorrelation function should be calculated is as follows.

16T≦kT≦128T          (3)従
って演算を実行するためには、乗算器、積分器。
16T≦kT≦128T (3) Therefore, in order to perform the calculation, a multiplier and an integrator are required.

割算器がそれぞれ113個必要となり、信号の時間ずれ
を設定するための遅延メモリにおけるタップ数も同じ数
だけ必要であって、ノ・−ドウエア規模は著しく大きく
なる。
113 dividers are required for each, and the same number of taps in the delay memory for setting the time lag of the signal are also required, resulting in a significantly larger hardware scale.

(発明の目的) 本発明は、このような従来技術の問題点を解決しようと
するものであって、その目的は、入力波形の自己相関関
数から音声のピッチを抽出する場合において、ピッチの
抽出精度を低下させることなく、抽出に必要な自己相関
関数の個数を少なくすることができる、ピッチ抽出方式
を提供することにある。
(Object of the Invention) The present invention aims to solve the problems of the prior art, and its purpose is to An object of the present invention is to provide a pitch extraction method that can reduce the number of autocorrelation functions required for extraction without reducing accuracy.

(発明の構成) 音声のピッチは、声帯から出力されるインパルス列の周
期と考えられるものであシ、このインパルスの印加と、
そのとき発生する音声波形との関係を見ると、音声波形
はインパルスの印加によって急激な立上シを示し、かつ
その立上シ時点で音声波形の極性は負から正へ変化する
ことが認められる。すなわちインパルスが′印加された
と推定される時点は、音声波形の負から正への変化点に
あることがわかる。このように、ピッチをインパルス列
の周期と考えた場合、ピッチ抽出のための自己相関関数
の計算は、音声波形の極性の負から正への変化点につい
てのみ行えばよいことになる。
(Structure of the Invention) The pitch of speech is considered to be the period of an impulse train output from the vocal cords, and the application of this impulse and
Looking at the relationship with the voice waveform generated at that time, it is observed that the voice waveform shows a sudden rise due to the application of the impulse, and that the polarity of the voice waveform changes from negative to positive at the time of the rise. . In other words, it can be seen that the time point at which the impulse is estimated to have been applied is at the point where the voice waveform changes from negative to positive. In this way, when pitch is considered as the period of an impulse train, calculation of the autocorrelation function for pitch extraction only needs to be performed at the point where the polarity of the audio waveform changes from negative to positive.

ただこのようにし友場合でも、極性の変化点はまだかな
シ多い。すなわち極性の変化点は波形の零交差点であっ
て、この部分では音声波形に重畳している高周波成分の
影響が太きいためである。
However, even in this case, there are still many points where the polarity changes. That is, the polarity change point is the zero crossing point of the waveform, and this is because the influence of the high frequency component superimposed on the audio waveform is large at this portion.

第1図は、音声波形における極性の変化点付近   ゛
を例示したものである。同図においては、3個の零交差
点x、y、zが認められるが、そのうち負から正への変
化点は2個(Xと2)である。従って第1図の波形の場
合、自己相関の計算を行うべき変化点の数は高周波成分
の影響によって2倍になっている。そこで本発明におい
ては、零交差点付近における高周波成分の影響を除去す
るため、第1図において破線で示されているように、零
を中心として±aにしきい値を設定し、このしきい値の
範囲を越えるまでは零交差があっても極性の変化があっ
たと判定しないようにすることによって、自己相関の計
算を必要とする極性変化点の数を少なくしている。なお
この場合のしきい値は、必ずしも正負の値が等しくなく
てもよいことは言うまでもない。
FIG. 1 shows an example of the vicinity of a polarity change point in an audio waveform. In the figure, three zero crossing points x, y, and z are recognized, but two of them (X and 2) are the points of change from negative to positive. Therefore, in the case of the waveform shown in FIG. 1, the number of changing points at which autocorrelation should be calculated is doubled due to the influence of high frequency components. Therefore, in the present invention, in order to remove the influence of high frequency components near the zero crossing point, a threshold value is set at ±a with zero as the center, as shown by the broken line in FIG. By not determining that there has been a polarity change even if there is a zero crossing until the range is exceeded, the number of polarity change points that require autocorrelation calculation is reduced. It goes without saying that the threshold values in this case do not necessarily have to have equal positive and negative values.

(発明の実施例) 第2図は、本発明のピッチ抽出方式の一実施例の構成を
示すブロック図である。同図において、10は入力端子
、20は変化点検出回路、□□□はしきい値生成回路、
40は変化点間隔計数用カウンタ、(資)は相関器、(
イ)は相関器刃にiける遅延メモリのタップ位置設定回
路、70はタップ位置設定回路ωによって設定されるタ
ップ位置が所定の範囲内に入るように規正するタップ位
置制御回路、(資)はピッチを判定するピッチ判定回路
、90は出力端子である。
(Embodiment of the Invention) FIG. 2 is a block diagram showing the configuration of an embodiment of the pitch extraction method of the present invention. In the figure, 10 is an input terminal, 20 is a change point detection circuit, □□□ is a threshold generation circuit,
40 is a counter for counting the change point interval, (capital) is a correlator, (
b) is a tap position setting circuit for the delay memory in the correlator blade i; 70 is a tap position control circuit that regulates the tap position set by the tap position setting circuit ω to fall within a predetermined range; A pitch determination circuit for determining pitch, 90 is an output terminal.

第2図において、端子10から入力した波形は変化点検
出回路20に加えられる。変化点検出回路20はしきい
値生成回路(資)から例えば±aのしきい値を与えられ
て、このしきい値の範囲を越える、入力波形における負
から正への変化点を検出する。
In FIG. 2, a waveform input from terminal 10 is applied to a change point detection circuit 20. In FIG. The change point detection circuit 20 is given a threshold value of, for example, ±a from the threshold generation circuit, and detects a change point from negative to positive in the input waveform that exceeds the range of this threshold value.

変化点としては、しきい値±aを最初に横切った点また
は第2回目以降に横切った点、あるいは零交差点におけ
る同様な点のうちのいずれの1点でもよい。またしきい
値生成回路(9)で生成されるしきい値は、入力波形の
平均電力、振幅、付加雑音電力、振幅、その他の要素か
ら適当な値を選定され、これは適応的であってもよく、
また固定的であってもよい。カウンタ40は、変化点検
出回路茄において検出された変化点の間隔を計数する。
The point of change may be any one of the points at which the threshold value ±a is crossed for the first time, the points at which it is crossed for the second and subsequent times, or similar points at zero crossing points. Further, the threshold value generated by the threshold generation circuit (9) is selected from an appropriate value based on the average power, amplitude, added noise power, amplitude, and other factors of the input waveform, and is adaptive. Good too,
Alternatively, it may be fixed. The counter 40 counts the interval between change points detected by the change point detection circuit.

タップ位置設定回路ωはカウンタ40の計数結果に基づ
いて、相関器間における遅延メモリのタップ位置を設定
する。遅延メモリは相関器力における自己相関関数演算
のための時間的ずれを与えるものであり、カウンタ40
の計数結果によp、検出された変化点に応じである基準
点から順次具なる時間差に対応するタップを設定される
。これはlピッチの範囲内に複数の変化点が生じること
があるためである。タップ位置制御回路70は、タッグ
位置設定器(イ)によって設定されるタップ位置が、統
計的に求められている所定の範囲内に入つないものであ
るとき、そのような設定を阻止するように制御する作用
を行う。
The tap position setting circuit ω sets the tap position of the delay memory between the correlators based on the count result of the counter 40. The delay memory provides a time lag for calculating the autocorrelation function in the correlator power, and is used by the counter 40.
Based on the counting result of p, taps corresponding to specific time differences are sequentially set from a certain reference point according to the detected change point. This is because a plurality of change points may occur within the l pitch range. The tap position control circuit 70 is configured to prevent the tap position set by the tag position setting device (a) when the tap position is not within a predetermined range determined statistically. Performs controlling action.

相関器(7)は、遅延メモリに設定されたタップ位置に
対応する時間ずれによって、端子100入力信号の自己
相関関数を演算する。ピッチ判定回路80は、相関器力
において求められた相関関数値のうち例えば最大のもの
を判定し、これに対応する遅延メモリのタップ位置に応
じた時間値を、ピッチとして端子(イ)に出力する。
The correlator (7) calculates an autocorrelation function of the terminal 100 input signal using a time shift corresponding to the tap position set in the delay memory. The pitch determination circuit 80 determines, for example, the maximum correlation function value among the correlation function values determined by the correlator power, and outputs a time value according to the corresponding tap position of the delay memory to a terminal (A) as a pitch. do.

以上の実施例においては、印加インパルスを正として自
己相関関数を計算すべき変化点を波形における負から正
への変化点としたが、印加インパルスを負として取扱っ
ても同様の結果を得ることができ、この場合は、自己相
関関数を計算すべき変化点として波形における正から負
への変化点を選べばよい。
In the above example, the applied impulse was assumed to be positive, and the changing point at which the autocorrelation function should be calculated was the changing point from negative to positive in the waveform. However, similar results can also be obtained by treating the applied impulse as negative. In this case, the point of change from positive to negative in the waveform may be selected as the point of change at which the autocorrelation function should be calculated.

(発明の効果) 以上説明したように、本発明のピッチ抽出方式によれば
、自己相関関数を計算するための時間すれとして、波形
における一定方向の、例えば負から正への変化点間の時
間差に限定し、さらに変化点の決定に当って適当な間隔
の2つのしきい値を設け、これらのしきい値によって定
められる範囲を通過する間における変化点t−1つに限
定するようにすることによって、自己相関関数を計算す
るための時間ずれの数を少くしたので、相関関数演算の
ための乗算器、積分器1割算器が大幅に減少し、経済的
なピッチ抽出装置を実現することができる。実際に設計
製作した一例によれば、僅か数点のタップ位置について
の計算によってピッチを抽出することができ、従来方式
の113点に比べて20分の1になる結果が得られた。
(Effects of the Invention) As explained above, according to the pitch extraction method of the present invention, the time lag for calculating the autocorrelation function is the time difference between points of change in a certain direction in a waveform, for example from negative to positive. Furthermore, when determining the change point, set two threshold values at an appropriate interval, and limit the change point to t-1 while passing through the range defined by these thresholds. As a result, the number of time lags for calculating the autocorrelation function is reduced, and the number of multipliers, integrators, and dividers for calculating the correlation function is greatly reduced, realizing an economical pitch extraction device. be able to. According to an example that was actually designed and manufactured, it was possible to extract the pitch by calculation for only a few tap positions, and the result was 1/20th of the 113 points of the conventional method.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は音声波形における極性変化点付近を示す説明図
、第2図は本発明のピッチ抽出方式の一実施例の構成を
示すブロック図である610・・・入力端子、20・・
・変化点検出回路、園・・・しきい値生成回路、40・
・・変化点間隔計数用カウンタ、男・・・相関器、■・
・・タップ位置設定回路、70・・・タップ位置制御回
路、(資)・・・ピッチ判定回路、90・・・出力端子
。 特許出願人 富士通株式会社 代理人弁理士 玉 蟲 久 五 部(外3名)第 1 
図 第2図
FIG. 1 is an explanatory diagram showing the vicinity of a polarity change point in an audio waveform, and FIG. 2 is a block diagram showing the configuration of an embodiment of the pitch extraction method of the present invention.
・Changing point detection circuit, garden...threshold generation circuit, 40・
・・Counter for counting the change point interval, male ・correlator, ■・
...Tap position setting circuit, 70...Tap position control circuit, (capital)...Pitch determination circuit, 90...Output terminal. Patent Applicant: Fujitsu Limited Representative Patent Attorney: Hisashi Tamamushi Department 5 (3 others) 1st
Figure 2

Claims (1)

【特許請求の範囲】[Claims] 入力波形とこれにある時間ずれを与え九波形との相関か
ら求められた入力波形の自己相関関数値によって音声の
ピッチを抽出するピッチ抽出方式において、零の上下に
任意の幅を有するしきい値の範囲を一方向に横切る変化
点を検出する手段と、該変化点の間隔を計数する手段と
、該変化点の間隔に対応して時間ずれを設定されて入力
波形の自己相関関数値を求める相関器とを具え、該相関
器によって求められた最大の自己相関値に対応する時間
ずれを入力波形のピッチとして抽出することを特徴とす
るピッチ抽出方式。
In the pitch extraction method, which extracts the pitch of the voice based on the autocorrelation function value of the input waveform obtained from the correlation with the nine waveforms given a certain time lag between the input waveform and this, a threshold value having an arbitrary width above and below zero. means for detecting a changing point that crosses the range in one direction; means for counting the interval between the changing points; and determining an autocorrelation function value of the input waveform by setting a time lag corresponding to the interval between the changing points. 1. A pitch extraction method comprising: a correlator, and extracting a time shift corresponding to the maximum autocorrelation value determined by the correlator as a pitch of an input waveform.
JP10336782A 1982-06-16 1982-06-16 Pitch extraction system Pending JPS58220195A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10336782A JPS58220195A (en) 1982-06-16 1982-06-16 Pitch extraction system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10336782A JPS58220195A (en) 1982-06-16 1982-06-16 Pitch extraction system

Publications (1)

Publication Number Publication Date
JPS58220195A true JPS58220195A (en) 1983-12-21

Family

ID=14352140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10336782A Pending JPS58220195A (en) 1982-06-16 1982-06-16 Pitch extraction system

Country Status (1)

Country Link
JP (1) JPS58220195A (en)

Similar Documents

Publication Publication Date Title
US4039754A (en) Speech analyzer
JPS59100643A (en) Method and device for discriminating noise level on telephone channel
US4604717A (en) Method and apparatus for measuring the time delay between signals
US5465405A (en) Apparatus and method for detecting signals
JPS58220195A (en) Pitch extraction system
JPS58115492A (en) Self correlator for pattern recognition
JP2668721B2 (en) Limiter interpolation type DFT operation method
JPS63163495A (en) Voice section detector
JPS60168200A (en) Pitch extractor
JPS622300A (en) Voice pitch extractor
JPS607499A (en) Pitch extraction circuit
JPS61223796A (en) Voice section detection system
JPS62129898A (en) Voice section detection system
JPS60117299A (en) Zero-crossing number counting control system
JPH1198266A (en) Tone signal detector
SU1465804A1 (en) Follow-up frequency meter
JPS61185800A (en) Voice pitch extractor
JPH026080B2 (en)
SU1619297A1 (en) Digital signal analyzer
JPS6041099A (en) System of separating voice section
JPS61151700A (en) Time constant varying type variable threshold voice detector
JPS61273596A (en) Voice section detection system
JPS63155200A (en) Pitch detection
JPS6349418B2 (en)
JPS62141599A (en) Pitch detection system