JPH09258762A - Pitch extracting device - Google Patents

Pitch extracting device

Info

Publication number
JPH09258762A
JPH09258762A JP6877096A JP6877096A JPH09258762A JP H09258762 A JPH09258762 A JP H09258762A JP 6877096 A JP6877096 A JP 6877096A JP 6877096 A JP6877096 A JP 6877096A JP H09258762 A JPH09258762 A JP H09258762A
Authority
JP
Japan
Prior art keywords
value
pitch
data
waveform
section length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6877096A
Other languages
Japanese (ja)
Inventor
Hiroyasu Ide
博康 井手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP6877096A priority Critical patent/JPH09258762A/en
Publication of JPH09258762A publication Critical patent/JPH09258762A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To extract the pitch of voice waveform with a small quantity of operation by restricting an interval to be a prospect in waveform at the time of computing a square error, so as to become an interval starting from the value approximate to the head value of waveform data to be examined. SOLUTION: A prospective value computing part 11 obtains the head value αof waveform data to extract a pitch out of digital voice waveform data stored in a data buffer 2, and computes the prospective value α± for pitch extraction on the basis of the head value α. A pitch prospect extracting part 12 searches out each position of the waveform data with the same value as the prospective value α±5 from the buffer 2. The interval length from the head value α to each position becomes the interval length of each pitch prospect. A square error computing part 13 computes the square error of each pitch prospect and outputs the pitch prospect with the square error having the shortest inverval length, as an extracted pitch.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、音声データの分析
や圧縮のため音声波形のピッチを抽出するピッチ抽出装
置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a pitch extracting device for extracting a pitch of a voice waveform for analyzing and compressing voice data.

【0002】[0002]

【従来の技術】音声波形には基本的な振動周期があり、
これを一般にピッチと呼んでいる。音声データの分析や
圧縮を行なう際に、このピッチの抽出が頻繁に行なわ
れ、抽出方法として様々なものが提案されている。それ
らピッチの抽出方法のうち最も単純なアルゴリズムとし
て、波形における所定の二つの区間の二乗誤差を算出
し、その二重誤差が最も小さい区間長をピッチとする方
法がある。
2. Description of the Related Art A voice waveform has a basic vibration period,
This is generally called pitch. This pitch is frequently extracted when voice data is analyzed or compressed, and various extraction methods have been proposed. As the simplest algorithm among those pitch extraction methods, there is a method of calculating the squared error of two predetermined sections in the waveform and using the section length having the smallest double error as the pitch.

【0003】図6の(a)および(b)は、従来のこの
種のピッチ抽出方法における二乗誤差によるピッチ抽出
法を説明するための図である。図6の(a)は、区間長
mの区間で波形を切り出した場合を示しており、この場
合二つの波形の二重誤差は大きくなる。
FIGS. 6A and 6B are views for explaining a pitch extraction method based on a square error in the conventional pitch extraction method of this type. FIG. 6A shows the case where the waveform is cut out in the section of the section length m, and in this case, the double error between the two waveforms becomes large.

【0004】また、図6の(b)は、区間長nの区間で
波形を切り出した場合を示しており、この場合二つの波
形の二重誤差は小さくなる。このように図6に示した波
形の場合、区間長mの場合と比べて区間長nの場合の方
が二乗誤差が少なく、よりピッチ長に近いといえる。
Further, FIG. 6B shows a case where a waveform is cut out in a section having a section length n, and in this case, the double error between the two waveforms becomes small. As described above, in the case of the waveform shown in FIG. 6, the square error is smaller in the case of the section length n than in the case of the section length m, and it can be said that it is closer to the pitch length.

【0005】[0005]

【発明が解決しようとする課題】上述したような二乗誤
差の算出によるピッチ抽出法の問題点として、調べよう
とするピッチ長(対象となる区間長)が長くなるほど、
その二乗誤差の算出に係る計算量が増えるという欠点が
ある。しかし、対象となる区間長を短く限定してしまう
と、低い周波数を有する波形のピッチを抽出することが
できない。
As a problem of the pitch extraction method by calculating the squared error as described above, the longer the pitch length to be investigated (target section length) is,
There is a drawback that the amount of calculation for calculating the squared error increases. However, if the target section length is limited to be short, the pitch of the waveform having a low frequency cannot be extracted.

【0006】また、どの区間長がピッチになるか分から
ない以上、ピッチとして考え得る範囲内の全ての区間長
について二乗誤差を求める必要がある。このため多大な
計算量が必要とされ、それらの計算を行なうCPUにお
いて少ないパワーしか利用できない環境の場合に問題に
なる。本発明の目的は、音声波形のピッチの抽出を少な
い演算量で行なえるピッチ抽出装置を提供することにあ
る。
Further, since it is not known which section length corresponds to the pitch, it is necessary to obtain the square error for all the section lengths within the range that can be considered as the pitch. For this reason, a large amount of calculation is required, which becomes a problem in an environment where only a small amount of power is available in the CPU that performs those calculations. It is an object of the present invention to provide a pitch extraction device that can extract the pitch of a voice waveform with a small amount of calculation.

【0007】[0007]

【課題を解決するための手段】上記課題を解決し目的を
達成するために、本発明のピッチ抽出装置は以下の如く
構成されている。 (1)本発明のピッチ抽出装置は、波形データを蓄積す
る蓄積手段と、この蓄積手段で蓄積された波形データ中
の先頭のデータの値を取得する取得手段と、この取得手
段で取得された値に近似する値を有する複数のデータを
前記波形データから探索する探索手段と、前記波形デー
タにおいて前記先頭のデータの位置と前記探索手段で探
索された各データの位置との成す区間の長さを各々区間
長とし、前記先頭のデータの位置から所定の区間長を成
す第1の波形と前記所定の区間長に対応する前記探索手
段で探索されたデータの位置から前記所定の区間長を成
す第2の波形との差異を検出する検出手段と、を備え、
前記検出手段で検出された差異が最も小さい区間長をピ
ッチとして抽出するよう構成されている。 (2)本発明のピッチ抽出装置は上記(1)に記載の装
置であって、かつ前記取得手段で取得した値に所定値を
加算または減算する演算手段を備え、前記演算手段で算
出された値に近似する値を有する複数のデータを前記探
索手段で探索するよう構成されている。 (3)本発明のピッチ抽出装置は上記(2)に記載の装
置であって、かつ前記蓄積手段で蓄積された波形データ
のダイナミックレンジを取得する第2の取得手段と、前
記ダイナミックレンジの値を予め設定された値で除算す
る第2の演算手段と、を備え、前記第2の演算手段で算
出された値を前記所定値とするよう構成されている。 (4)本発明のピッチ抽出装置は上記(1)乃至(3)
のいずれかに記載の装置であって、かつ前記検出手段
は、前記第1の波形と前記第2の波形との成す二乗誤差
を検出するよう構成されている。
In order to solve the above problems and achieve the object, the pitch extracting apparatus of the present invention is configured as follows. (1) The pitch extraction device of the present invention is obtained by accumulating means for accumulating the waveform data, obtaining means for obtaining the value of the first data in the waveform data accumulated by the accumulating means, and the obtaining means. Searching means for searching the waveform data for a plurality of data having a value close to the value, and the length of a section formed by the position of the leading data and the position of each data searched by the searching means in the waveform data Is defined as the section length, and the predetermined section length is formed from the first waveform forming a predetermined section length from the position of the leading data and the position of the data searched by the searching means corresponding to the predetermined section length. A detection means for detecting a difference from the second waveform,
The section length with the smallest difference detected by the detection means is extracted as the pitch. (2) The pitch extracting device of the present invention is the device according to (1) above, and further comprises a calculating means for adding or subtracting a predetermined value to or from the value acquired by the acquiring means, and is calculated by the calculating means. The search means is configured to search for a plurality of data having a value close to the value. (3) The pitch extraction device of the present invention is the device according to (2) above, and further comprises a second acquisition means for acquiring a dynamic range of the waveform data accumulated by the accumulation means, and a value of the dynamic range. And a second calculation means for dividing by the preset value, and the value calculated by the second calculation means is set as the predetermined value. (4) The pitch extracting device of the present invention has the above (1) to (3).
The apparatus according to any one of claims 1 to 5, wherein the detection means is configured to detect a squared error between the first waveform and the second waveform.

【0008】上記手段を講じた結果、それぞれ次のよう
な作用が生じる。 (1)本発明のピッチ抽出装置によれば、取得された値
に近似する値を有する複数のデータの位置と先頭のデー
タの位置との成す区間の長さを各々区間長とし、前記先
頭のデータの位置から所定の区間長を成す第1の波形と
前記所定の区間長に対応するデータの位置から前記所定
の区間長を成す第2の波形との差異を検出し、その差異
が最も小さい区間長をピッチとして抽出するので、ピッ
チ候補となる区間長を簡単に絞り込むことができ、その
絞り込まれた区間長の中から平均的に少ない演算量でピ
ッチを抽出することができる。よって、それらの演算を
行なうCPUにおいて少ないパワーしか利用できない環
境においても、例えば低い周波数を有する波形のピッチ
も問題なく抽出することができる。 (2)本発明のピッチ抽出装置によれば、取得した値に
所定値を加算または減算し、算出された値に近似する値
を有する複数のデータを探索するので、ピッチ長の時間
の経過とともに生ずる揺らぎや、波形データの各値のサ
ンプリング等によりデジタル化する際に生ずるずれを考
慮し、より一層適切な区間長の絞り込みが行なえる。 (3)本発明のピッチ抽出装置によれば、蓄積された波
形データのダイナミックレンジの値を予め設定された値
で除算した値を前記所定値とするので、波形に応じて前
記所定値を適切に変更することができ、より一層適切な
区間長の絞り込みが可能になる。 (4)本発明のピッチ抽出装置によれば、前記第1の波
形と前記第2の波形との成す二乗誤差を検出するので、
当該ピッチ抽出装置に一般的なピッチ抽出方法を適用す
ることができる。
As a result of taking the above-mentioned means, the following actions are brought about respectively. (1) According to the pitch extracting apparatus of the present invention, the length of the section formed by the positions of a plurality of data having values close to the acquired value and the position of the head data is set as the section length, and A difference between the first waveform having a predetermined section length from the data position and the second waveform having the predetermined section length from the data position corresponding to the predetermined section length is detected, and the difference is the smallest. Since the section length is extracted as the pitch, it is possible to easily narrow down the section length as a pitch candidate, and it is possible to extract the pitch from the narrowed down section length with an average small calculation amount. Therefore, even in an environment in which a small amount of power is available in the CPU that performs those calculations, for example, the pitch of a waveform having a low frequency can be extracted without any problem. (2) According to the pitch extracting apparatus of the present invention, a predetermined value is added to or subtracted from the acquired value, and a plurality of data having a value close to the calculated value is searched for. Further appropriate narrowing down of the section length can be performed in consideration of the fluctuations that occur and the deviations that occur when digitizing each value of the waveform data. (3) According to the pitch extraction device of the present invention, the value obtained by dividing the value of the dynamic range of the accumulated waveform data by the preset value is set as the predetermined value, and therefore the predetermined value is appropriately set according to the waveform. It is possible to narrow down the section length more appropriately. (4) According to the pitch extracting apparatus of the present invention, since the square error between the first waveform and the second waveform is detected,
A general pitch extraction method can be applied to the pitch extraction device.

【0009】[0009]

【発明の実施の形態】図1は、本発明の実施の形態に係
るピッチ抽出装置の構成を示すブロック図である。図1
において1は制御部であり、この制御部1は候補値算出
部11、ピッチ候補抽出部12および二乗誤差算出部1
3からなる。これら候補値算出部11、ピッチ候補抽出
部12および二乗誤差算出部13は、各々データバッフ
ァ2に接続されている。また、候補値算出部11にはピ
ッチ候補抽出部12が接続されており、ピッチ候補抽出
部12には二乗誤差算出部13が接続されている。さら
に、制御部1にはROM3とRAM4が接続されてい
る。
1 is a block diagram showing the configuration of a pitch extracting device according to an embodiment of the present invention. FIG.
1 is a control unit, and the control unit 1 includes a candidate value calculation unit 11, a pitch candidate extraction unit 12, and a squared error calculation unit 1.
Consists of three. The candidate value calculation unit 11, the pitch candidate extraction unit 12, and the squared error calculation unit 13 are each connected to the data buffer 2. A pitch candidate extraction unit 12 is connected to the candidate value calculation unit 11, and a squared error calculation unit 13 is connected to the pitch candidate extraction unit 12. Further, a ROM 3 and a RAM 4 are connected to the control unit 1.

【0010】データバッファ2には、入力波形(デジタ
ル音声信号)がピッチ抽出演算のための波形データとし
て一旦蓄積される。制御部1は当該ピッチ抽出装置の動
作制御を行なうものである。制御部1における候補値算
出部11では、データバッファ2に記憶された波形デー
タのうち先頭のデータの値(例えば、αとする)を読み
出し、その値を基にピッチ抽出のための候補値(例え
ば、α±5の範囲の値)を算出する。この候補値算出の
必要性については後述する。
An input waveform (digital audio signal) is temporarily stored in the data buffer 2 as waveform data for pitch extraction calculation. The control unit 1 controls the operation of the pitch extracting device. The candidate value calculation unit 11 in the control unit 1 reads the value (for example, α) of the first data of the waveform data stored in the data buffer 2, and based on the value, the candidate value for pitch extraction ( For example, a value in the range of α ± 5) is calculated. The necessity of calculating this candidate value will be described later.

【0011】ピッチ候補抽出部12では、候補値算出部
11で算出した前記候補値と同じ値を有する複数のサン
プルデータをデータバッファ2から探し出す。そして、
データバッファ2の先頭から前記各サンプルデータまで
の区間の長さが各々ピッチ候補になる。二乗誤差算出部
13では、ピッチ候補抽出部12から入力した各ピッチ
候補における波形の二乗誤差を算出し、この二重誤差が
最小となるピッチ候補を抽出し、ピッチとして出力す
る。
The pitch candidate extraction unit 12 searches the data buffer 2 for a plurality of sample data having the same value as the candidate value calculated by the candidate value calculation unit 11. And
The length of the section from the beginning of the data buffer 2 to each of the sample data is a pitch candidate. The square error calculating unit 13 calculates the square error of the waveform in each pitch candidate input from the pitch candidate extracting unit 12, extracts the pitch candidate having the smallest double error, and outputs it as the pitch.

【0012】また、ROM3には当該ピッチ抽出装置の
動作制御プログラムが格納されており、RAM4には、
後述するように二乗誤差算出部13において二乗誤差を
算出する際に必要とされる、各ピッチ候補における波形
データの値が記憶される。
The ROM 3 stores the operation control program of the pitch extracting device, and the RAM 4 stores the operation control program.
As will be described later, the value of the waveform data for each pitch candidate, which is required when the squared error calculator 13 calculates the squared error, is stored.

【0013】図2は、当該ピッチ抽出装置においてピッ
チ抽出を行なう音声波形の例を示す図である。なお、当
該ピッチ抽出装置では前述したようにデータバッファ2
に蓄積されたデジタル音声信号を基にピッチ抽出を行な
うが、便宜上図2および後述する図4にはアナログの音
声波形を示し説明する。
FIG. 2 is a diagram showing an example of a voice waveform for performing pitch extraction in the pitch extraction device. In the pitch extracting device, as described above, the data buffer 2
Pitch extraction is performed based on the digital audio signal stored in FIG. 2, but for convenience sake, an analog audio waveform is shown and described in FIG. 2 and FIG. 4 described later.

【0014】上述したようにピッチは基本振動周期であ
るので、調べる音声波形データの先頭のデータの値
(P)と、次の1ピッチの始まるポイントの音声波形デ
ータの値(Q)とは、通常近似した値になるものと考え
られる。そこで当該ピッチ抽出装置では、二乗誤差を計
算する際波形において候補になる区間が、調べる波形デ
ータの先頭のデータの値と近似する値から始まる区間に
なるよう絞り込む。これにより、ピッチ抽出に要する計
算量の平均を、従来の抽出方法より少なくすることがで
きる。
Since the pitch is the fundamental vibration period as described above, the value (P) of the beginning data of the voice waveform data to be examined and the value (Q) of the voice waveform data at the start point of the next pitch 1 are: It is considered that the value is usually approximate. Therefore, in the pitch extracting apparatus, when calculating the squared error, the section that becomes a candidate in the waveform is narrowed down to a section that starts from a value close to the value of the first data of the waveform data to be examined. This makes it possible to reduce the average amount of calculation required for pitch extraction as compared with the conventional extraction method.

【0015】図3は、当該ピッチ抽出装置における処理
手順を示すフローチャートである。以下、図3を基に上
述した如き当該ピッチ抽出装置の処理手順を説明する。
まず、ステップS1で、候補値算出部11は、データバ
ッファ2に記憶されたデジタル音声波形データのうちピ
ッチを抽出すべき波形データの先頭の値を取得する。
FIG. 3 is a flow chart showing a processing procedure in the pitch extracting apparatus. Hereinafter, the processing procedure of the pitch extracting apparatus as described above will be described with reference to FIG.
First, in step S1, the candidate value calculation unit 11 acquires the leading value of the waveform data from which the pitch is to be extracted, of the digital voice waveform data stored in the data buffer 2.

【0016】次にステップS2で、後述するように前記
先頭の値にある程度の幅を持たせる必要があるので、候
補値算出部11は前記先頭の値を基にピッチ抽出のため
の候補値を算出する。例えば、先頭の値をαとした場合
幅を5とすれば、α±5の範囲の値が候補値になる。
Next, in step S2, the leading value needs to have a certain width as will be described later, so the candidate value calculation unit 11 determines a candidate value for pitch extraction based on the leading value. calculate. For example, when the leading value is α and the width is 5, values in the range of α ± 5 are candidate values.

【0017】続いてステップS3で、ピッチ候補抽出部
12は前記候補値(α±5)と同じ値を有する波形デー
タ中の複数のデータの各位置をデータバッファ2に記憶
されている前記音声波形データから探し出す。これによ
り、前記先頭の値から前記各位置までの区間の長さが、
各々ピッチ候補の区間長になる。そしてステップS4
で、二乗誤差算出部13は、各ピッチ候補の二乗誤差を
算出し、ステップS5で、算出された各二重誤差のうち
その二重誤差が最も小さい区間長を有するピッチ候補
を、抽出されたピッチとして出力する。
Subsequently, in step S3, the pitch candidate extraction unit 12 stores the respective positions of a plurality of data in the waveform data having the same value as the candidate value (α ± 5) in the voice waveform stored in the data buffer 2. Search from data. Thereby, the length of the section from the first value to each position is
Each becomes a pitch candidate section length. And step S4
Then, the square error calculation unit 13 calculates the square error of each pitch candidate, and in step S5, the pitch candidate having the section length with the smallest double error among the calculated double errors is extracted. Output as pitch.

【0018】図4は、上述した候補となる区間長の絞り
込みを説明するための音声波形を示す図である。以下、
図4に示す音声波形データの先頭のデータOの値と近似
する値を有するデータから始まる区間を絞り込むとす
る。図4の例では、波形データの先頭のデータOの値と
近似する値を有するデータは、A〜Eである。
FIG. 4 is a diagram showing a voice waveform for explaining the narrowing down of the above-mentioned candidate section length. Less than,
It is assumed that a section starting from data having a value close to the value of the data O at the head of the voice waveform data shown in FIG. 4 is narrowed down. In the example of FIG. 4, the data having a value approximate to the value of the data O at the beginning of the waveform data is A to E.

【0019】先頭のデータOの位置からデータA〜Eの
いずれかの位置までの区間長の中にピッチがあると考え
られるので、OからAまでの区間長をa、OからBまで
の区間長をb…以下同様とし、それぞれ連続する二つの
区間長分の波形の二乗誤差を算出する。
Since it is considered that there is a pitch in the section length from the position of the head data O to any position of the data A to E, the section length from O to A is a and the section length from O to B is a. The length is set to b ... The same applies hereinafter, and the square error of the waveform for two continuous section lengths is calculated.

【0020】すなわち、図4に示すそれぞれ二つの区間
長aとa′、bとb′、…eとe′の波形の各二乗誤差
を算出する。そして、この例では区間長dとd′の波形
の二乗誤差が最も小さくなるので、dが抽出されるべき
ピッチであるという結果になる。なお、二乗誤差算出部
13において二乗誤差を算出する際に、RAM4に以下
のようなデータが記憶される。
That is, each squared error of the waveforms of the two section lengths a and a ', b and b', ... E and e'shown in FIG. 4 is calculated. Then, in this example, the square error of the waveforms of the section lengths d and d ′ is the smallest, so that the result is that d is the pitch to be extracted. When the square error calculator 13 calculates the square error, the following data is stored in the RAM 4.

【0021】図5は、RAM4における二乗誤差を算出
するためのデータの記憶状態を示すメモリマップであ
る。RAM4には、初めに候補値算出部11にて抽出さ
れた波形の先頭の値(START POINT)が記憶
され、以下各区間長a〜eにおける複数のデータの値が
記憶される。
FIG. 5 is a memory map showing a storage state of data for calculating a squared error in the RAM 4. The RAM 4 stores the first value (START POINT) of the waveform first extracted by the candidate value calculation unit 11, and hereinafter stores a plurality of data values in each section length a to e.

【0022】例えば区間長aにおけるデータの値はA0
〜A10であり、Aとその前後5個づつ計11個のデータ
の値が記憶される。区間長b〜eについても同様にそれ
ぞれ対応する11個のデータの値が記憶される。このよ
うにRAM4に記憶された各データの値を基に、各区間
長a〜eの二重誤差が算出される。
For example, the data value in the section length a is A0
.About.A10, and a total of 11 data values are stored, each including A and five data before and after it. Similarly, for the section lengths b to e, 11 corresponding data values are stored. In this way, the double error of each section length a to e is calculated based on the value of each data stored in the RAM 4.

【0023】なお実際にピッチの抽出を行なう場合、ピ
ッチ長が時間の経過とともに揺らいでいたり、波形デー
タの各値がサンプリング等によりデジタル化する際にず
れたりする。そのため候補となる区間は、調べたい波形
データの先頭のデータと同じ値を基に絞り込むだけでな
く、前記値にある程度幅を持たせる必要がある。どの程
度の幅が必要なのかは、波形のレンジやデジタル化した
場合の量子化bit数等により変化するので、入力され
た音声波形データに基づき適宜決定する必要がある。
When the pitch is actually extracted, the pitch length fluctuates with the passage of time, or each value of the waveform data shifts when digitized by sampling or the like. Therefore, it is necessary not only to narrow down the candidate sections based on the same value as the leading data of the waveform data to be examined, but also to allow the values to have some width. The required width varies depending on the range of the waveform, the number of quantization bits when digitized, and the like, so it is necessary to appropriately determine it based on the input voice waveform data.

【0024】また本実施の形態では、候補値を算出する
ために固有値(α)±5の範囲を利用したが、例えば波
形のダイナミックレンジを取得し、その値を所定値で除
算し得た値(すなわち、ダイナミックレンジの数%)を
先頭のデータの値に加減算することにより、候補値を適
切に変化させることで、絞り込みを行なうこともでき
る。
In the present embodiment, the eigenvalue (α) ± 5 range is used to calculate the candidate value. However, for example, the dynamic range of the waveform is acquired, and the value obtained by dividing the value by a predetermined value is obtained. It is also possible to narrow down by appropriately changing the candidate value by adding / subtracting (that is, several% of the dynamic range) to the value of the leading data.

【0025】なお、本発明は上記実施の形態のみに限定
されず、要旨を変更しない範囲で適時変形して実施でき
る。 (実施の形態のまとめ)実施の形態に示された構成およ
び作用効果をまとめると次の通りである。 [1]実施の形態に示されたピッチ抽出装置は、波形デ
ータを蓄積する蓄積手段と(2)、この蓄積手段(2)
で蓄積された波形データ中の先頭のデータの値を取得す
る取得手段(11)と、この取得手段(11)で取得さ
れた値に近似する値を有する複数のデータを前記波形デ
ータから探索する探索手段(12)と、前記波形データ
において前記先頭のデータの位置と前記探索手段(1
2)で探索された各データの位置との成す区間の長さを
各々区間長とし、前記先頭のデータの位置から所定の区
間長を成す第1の波形と前記所定の区間長に対応する前
記探索手段(12)で探索されたデータの位置から前記
所定の区間長を成す第2の波形との差異を検出する検出
手段(13)と、を備え、前記検出手段(13)で検出
された差異が最も小さい区間長をピッチとして抽出する
よう構成されている。
The present invention is not limited to the above-described embodiments, but can be modified and implemented as appropriate without departing from the scope of the invention. (Summary of Embodiment) The configuration, operation and effect shown in the embodiment are summarized as follows. [1] The pitch extraction device shown in the embodiment has a storage unit (2) for storing waveform data, and a storage unit (2).
Acquisition means (11) for acquiring the value of the first data in the waveform data accumulated in step (1), and searching the waveform data for a plurality of data having values close to the values acquired by the acquisition means (11). Searching means (12), the position of the top data in the waveform data, and the searching means (1
The length of the section formed by the position of each data searched in 2) is set as the section length, and the first waveform forming a predetermined section length from the position of the leading data and the above-mentioned predetermined section length corresponding to the first waveform. A detection unit (13) for detecting a difference from the position of the data searched by the search unit (12) and the second waveform having the predetermined section length, and the detection unit (13) detects the difference. The interval length with the smallest difference is extracted as the pitch.

【0026】このように上記ピッチ抽出装置において
は、取得された値に近似する値を有する複数のデータの
位置と先頭のデータの位置との成す区間の長さを各々区
間長とし、前記先頭のデータの位置から所定の区間長を
成す第1の波形と前記所定の区間長に対応するデータの
位置から前記所定の区間長を成す第2の波形との差異を
検出し、その差異が最も小さい区間長をピッチとして抽
出するので、ピッチ候補となる区間長を簡単に絞り込む
ことができ、その絞り込まれた区間長の中から平均的に
少ない演算量でピッチを抽出することができる。よっ
て、それらの演算を行なうCPUにおいて少ないパワー
しか利用できない環境においても、例えば低い周波数を
有する波形のピッチも問題なく抽出することができる。 [2]実施の形態に示されたピッチ抽出装置は上記
[1]に記載の装置であって、かつ前記取得手段(1
1)で取得した値に所定値を加算または減算する演算手
段(11)を備え、前記演算手段(11)で算出された
値に近似する値を有する複数のデータを前記探索手段
(12)で探索するよう構成されている。
As described above, in the pitch extracting apparatus, the length of the section formed by the position of the plurality of data having a value close to the acquired value and the position of the head data is defined as the section length, and A difference between the first waveform having a predetermined section length from the data position and the second waveform having the predetermined section length from the data position corresponding to the predetermined section length is detected, and the difference is the smallest. Since the section length is extracted as the pitch, it is possible to easily narrow down the section length as a pitch candidate, and it is possible to extract the pitch from the narrowed down section length with an average small calculation amount. Therefore, even in an environment in which a small amount of power is available in the CPU that performs those calculations, for example, the pitch of a waveform having a low frequency can be extracted without any problem. [2] The pitch extraction device shown in the embodiment is the device according to the above [1], and the acquisition means (1
1) is provided with a calculating means (11) for adding or subtracting a predetermined value to the value, and the searching means (12) searches for a plurality of data having a value approximate to the value calculated by the calculating means (11). It is configured to explore.

【0027】このように上記ピッチ抽出装置において
は、取得した値に所定値を加算または減算し、算出され
た値に近似する値を有する複数のデータを探索するの
で、ピッチ長の時間の経過とともに生ずる揺らぎや、波
形データの各値のサンプリング等によりデジタル化する
際に生ずるずれを考慮し、より一層適切な区間長の絞り
込みが行なえる。 [3]実施の形態に示されたピッチ抽出装置は上記
[2]に記載の装置であって、かつ前記蓄積手段(2)
で蓄積された波形データのダイナミックレンジを取得す
る第2の取得手段(11)と、前記ダイナミックレンジ
の値を予め設定された値で除算する第2の演算手段(1
1)と、を備え、前記第2の演算手段(11)で算出さ
れた値を前記所定値とするよう構成されている。
As described above, in the above pitch extracting device, a predetermined value is added to or subtracted from the acquired value to search for a plurality of data having a value close to the calculated value, so that the pitch length time elapses. Further appropriate narrowing down of the section length can be performed in consideration of the fluctuations that occur and the deviations that occur when digitizing each value of the waveform data. [3] The pitch extracting device shown in the embodiment is the device according to [2] above, and the accumulating means (2) is provided.
Second acquisition means (11) for acquiring the dynamic range of the waveform data accumulated in 1. and second calculation means (1) for dividing the value of the dynamic range by a preset value.
1) and is configured to set the value calculated by the second calculating means (11) as the predetermined value.

【0028】このように上記ピッチ抽出装置において
は、蓄積された波形データのダイナミックレンジの値を
予め設定された値で除算した値を前記所定値とするの
で、波形に応じて前記所定値を適切に変更することがで
き、より一層適切な区間長の絞り込みが可能になる。 [4]実施の形態に示されたピッチ抽出装置は上記
[1]乃至[3]のいずれかに記載の装置であって、か
つ前記検出手段(13)は、前記第1の波形と前記第2
の波形との成す二乗誤差を検出するよう構成されてい
る。
As described above, in the pitch extracting apparatus, the value obtained by dividing the value of the dynamic range of the accumulated waveform data by the preset value is used as the predetermined value, and therefore the predetermined value is appropriately set according to the waveform. It is possible to narrow down the section length more appropriately. [4] The pitch extraction device shown in the embodiment is the device according to any one of the above [1] to [3], and the detection means (13) has the first waveform and the first waveform. Two
Is configured to detect the squared error formed by the waveform of

【0029】このように上記ピッチ抽出装置において
は、前記第1の波形と前記第2の波形との成す二乗誤差
を検出するので、当該ピッチ抽出装置に一般的なピッチ
抽出方法を適用することができる。
As described above, since the above-mentioned pitch extracting apparatus detects the square error between the first waveform and the second waveform, a general pitch extracting method can be applied to the pitch extracting apparatus. it can.

【0030】[0030]

【発明の効果】本発明によれば、音声波形のピッチの抽
出を少ない演算量で行なえるピッチ抽出装置を提供でき
る。
As described above, according to the present invention, it is possible to provide a pitch extracting device which can extract the pitch of a voice waveform with a small amount of calculation.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施の形態に係るピッチ抽出装置の構
成を示すブロック図。
FIG. 1 is a block diagram showing a configuration of a pitch extraction device according to an embodiment of the present invention.

【図2】本発明の実施の形態に係るピッチ抽出装置にお
いてピッチ抽出を行なう音声波形の例を示す図。
FIG. 2 is a diagram showing an example of a voice waveform for performing pitch extraction in the pitch extraction device according to the embodiment of the present invention.

【図3】本発明の実施の形態に係るピッチ抽出装置にお
ける処理手順を示すフローチャート。
FIG. 3 is a flowchart showing a processing procedure in the pitch extraction device according to the embodiment of the present invention.

【図4】本発明の実施の形態に係る候補となる区間長の
絞り込みを説明するための音声波形を示す図。
FIG. 4 is a diagram showing a voice waveform for explaining narrowing down of a section length that is a candidate according to the embodiment of the present invention.

【図5】本発明の実施の形態に係るRAM4における二
乗誤差を算出するためのデータの記憶状態を示すメモリ
マップ。
FIG. 5 is a memory map showing a storage state of data for calculating a squared error in RAM 4 according to the embodiment of the present invention.

【図6】従来例に係るピッチ抽出方法における二乗誤差
によるピッチ抽出法を説明するための図。
FIG. 6 is a diagram for explaining a pitch extraction method based on a square error in the pitch extraction method according to the conventional example.

【符号の説明】[Explanation of symbols]

1…制御部 11…候補値算出部 12…ピッチ候補抽出部 13…二重誤差算出部 2…データバッファ 3…ROM 4…RAM DESCRIPTION OF SYMBOLS 1 ... Control part 11 ... Candidate value calculation part 12 ... Pitch candidate extraction part 13 ... Double error calculation part 2 ... Data buffer 3 ... ROM 4 ... RAM

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】波形データを蓄積する蓄積手段と、 この蓄積手段で蓄積された波形データ中の先頭のデータ
の値を取得する取得手段と、 この取得手段で取得された値に近似する値を有する複数
のデータを前記波形データから探索する探索手段と、 前記波形データにおいて前記先頭のデータの位置と前記
探索手段で探索された各データの位置との成す区間の長
さを各々区間長とし、前記先頭のデータの位置から所定
の区間長を成す第1の波形と前記所定の区間長に対応す
る前記探索手段で探索されたデータの位置から前記所定
の区間長を成す第2の波形との差異を検出する検出手段
と、を具備し、 前記検出手段で検出された差異が最も小さい区間長をピ
ッチとして抽出することを特徴とするピッチ抽出装置。
1. A storage means for storing waveform data, an acquisition means for acquiring the value of the first data in the waveform data stored by the storage means, and a value approximating the value acquired by the acquisition means. Searching means for searching a plurality of data from the waveform data, and the length of a section formed by the position of the top data and the position of each data searched by the searching means in the waveform data, respectively, as a section length, A first waveform having a predetermined section length from the position of the leading data and a second waveform having the predetermined section length from the position of the data searched by the searching means corresponding to the predetermined section length. A pitch extracting device, comprising: a detecting unit that detects a difference, wherein a section length having the smallest difference detected by the detecting unit is extracted as a pitch.
【請求項2】前記取得手段で取得した値に所定値を加算
または減算する演算手段を備え、 前記演算手段で算出された値に近似する値を有する複数
のデータを前記探索手段で探索することを特徴とする請
求項1に記載のピッチ抽出装置。
2. A search means for searching for a plurality of data having a value approximate to the value calculated by the calculation means, comprising calculation means for adding or subtracting a predetermined value to the value acquired by the acquisition means. The pitch extracting device according to claim 1, wherein:
【請求項3】前記蓄積手段で蓄積された波形データのダ
イナミックレンジを取得する第2の取得手段と、 前記ダイナミックレンジの値を予め設定された値で除算
する第2の演算手段と、を備え、 前記第2の演算手段で算出された値を前記所定値とする
ことを特徴とする請求項2に記載のピッチ抽出装置。
3. A second acquisition means for acquiring the dynamic range of the waveform data accumulated by the accumulation means, and a second arithmetic means for dividing the value of the dynamic range by a preset value. The pitch extraction device according to claim 2, wherein the value calculated by the second calculation means is the predetermined value.
【請求項4】前記検出手段は、前記第1の波形と前記第
2の波形との成す二乗誤差を検出することを特徴とする
請求項1乃至3のいずれかに記載のピッチ抽出装置。
4. The pitch extracting apparatus according to claim 1, wherein the detecting means detects a squared error formed between the first waveform and the second waveform.
JP6877096A 1996-03-25 1996-03-25 Pitch extracting device Pending JPH09258762A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6877096A JPH09258762A (en) 1996-03-25 1996-03-25 Pitch extracting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6877096A JPH09258762A (en) 1996-03-25 1996-03-25 Pitch extracting device

Publications (1)

Publication Number Publication Date
JPH09258762A true JPH09258762A (en) 1997-10-03

Family

ID=13383310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6877096A Pending JPH09258762A (en) 1996-03-25 1996-03-25 Pitch extracting device

Country Status (1)

Country Link
JP (1) JPH09258762A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080764A1 (en) * 2006-01-12 2007-07-19 Matsushita Electric Industrial Co., Ltd. Object sound analysis device, object sound analysis method, and object sound analysis program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080764A1 (en) * 2006-01-12 2007-07-19 Matsushita Electric Industrial Co., Ltd. Object sound analysis device, object sound analysis method, and object sound analysis program
US8223978B2 (en) 2006-01-12 2012-07-17 Panasonic Corporation Target sound analysis apparatus, target sound analysis method and target sound analysis program

Similar Documents

Publication Publication Date Title
NL192701C (en) Method and device for recognizing a phoneme in a voice signal.
US6393398B1 (en) Continuous speech recognizing apparatus and a recording medium thereof
US10068558B2 (en) Method and installation for processing a sequence of signals for polyphonic note recognition
JPH07319498A (en) Pitch cycle extracting device for voice signal
US20070150277A1 (en) Method and system for segmenting phonemes from voice signals
US7012186B2 (en) 2-phase pitch detection method and apparatus
JPH09258762A (en) Pitch extracting device
JPH09206291A (en) Device for detecting emotion and state of human
JP5092876B2 (en) Sound processing apparatus and program
JP2871120B2 (en) Automatic transcription device
JPH067343B2 (en) Pattern identification device
Du et al. Determination of the instants of glottal closure from speech wave using wavelet transform
JP3423233B2 (en) Audio signal processing method and apparatus
JP6127811B2 (en) Image discrimination device, image discrimination method, and image discrimination program
KR100293465B1 (en) Speech recognition method
JP2766212B2 (en) Harmonic detection device and harmonic detection method
CN113436641A (en) Music transition time point detection method, equipment and medium
JP2643202B2 (en) Detection device for steady, transient and uncertain parts of input speech
JPH01219623A (en) Automatic score taking method and apparatus
JPS622300A (en) Voice pitch extractor
JPH01219888A (en) Method and device for automatic sampling
JPH07234672A (en) Pitch detection device
JPH01219638A (en) Automatic score taking method and apparatus
JPH01219630A (en) Automatic score taking method and apparatus
JPH0119159B2 (en)