JPS58166399A - 音声信号のピツチ周期抽出方法 - Google Patents
音声信号のピツチ周期抽出方法Info
- Publication number
- JPS58166399A JPS58166399A JP57049558A JP4955882A JPS58166399A JP S58166399 A JPS58166399 A JP S58166399A JP 57049558 A JP57049558 A JP 57049558A JP 4955882 A JP4955882 A JP 4955882A JP S58166399 A JPS58166399 A JP S58166399A
- Authority
- JP
- Japan
- Prior art keywords
- pitch period
- audio signal
- equation
- waveform
- extraction method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、自然音声波形からピッチ周期を抽出する音声
波形のピッチ周期抽出方法に関し、ピッチ周期抽出スピ
ードを向上することを目的とする線形予測法から求めた
残差信号の自己相関関数からピッチ周期を求める方法や
、残差信号のパワスペクトルから求める方法が一般的で
あった。しかしながら、これらの方法は、次式に示すよ
うな相関関数(φ7)を求め、こ図φ、のピーク間から
ピッチ周期を求めるものであり、膨大な計算量が必要で
あり、かつ誤抽出も多かった。
波形のピッチ周期抽出方法に関し、ピッチ周期抽出スピ
ードを向上することを目的とする線形予測法から求めた
残差信号の自己相関関数からピッチ周期を求める方法や
、残差信号のパワスペクトルから求める方法が一般的で
あった。しかしながら、これらの方法は、次式に示すよ
うな相関関数(φ7)を求め、こ図φ、のピーク間から
ピッチ周期を求めるものであり、膨大な計算量が必要で
あり、かつ誤抽出も多かった。
4r、 = 写ei m ei + r ・−
・−、−−−−−−−−・(1)ただし、ei は残
差信号でφ7は残差信号の相関関数を示す。
・−、−−−−−−−−・(1)ただし、ei は残
差信号でφ7は残差信号の相関関数を示す。
このような問題点を改善するために、様々な工夫がなさ
れており例えば、あらかじめピッチ周期の存在範囲を決
めておき、この区間内の最大値を求める方法などがある
。しかしながら、これら改善を行なってもピッチ周期の
誤差が大きい欠点かあ−だ。本発明は、上記従来の欠点
を除去するものであり、以下に本発明について述べる。
れており例えば、あらかじめピッチ周期の存在範囲を決
めておき、この区間内の最大値を求める方法などがある
。しかしながら、これら改善を行なってもピッチ周期の
誤差が大きい欠点かあ−だ。本発明は、上記従来の欠点
を除去するものであり、以下に本発明について述べる。
音声信号f(t)が任意の区間(11,,12)におい
て連続であり、かつ周期がTであると仮定する。
て連続であり、かつ周期がTであると仮定する。
周期関数を7 <1>で表わすと、
′f(t)−j(會−T) ・・−・・・・・
・・・・・・(2)(2)式にて表わされる。
・・・・・・(2)(2)式にて表わされる。
今、音声信号f(t)の直流分を無視すると;(t)の
1周期積分の値y(t)は零となる。これを(3)式に
て表わす・ F(t) = fT人りdt=o ・・・・
・・・・・・・・ (3)また、f(t)のフーリエ展
開を次式にて表わす。
1周期積分の値y(t)は零となる。これを(3)式に
て表わす・ F(t) = fT人りdt=o ・・・・
・・・・・・・・ (3)また、f(t)のフーリエ展
開を次式にて表わす。
j(す=、4 (Aksin 、 kt・Bkco・
−〒−kt)・・・・・・(4)ここで、Ak、Bkは
に次高調波の正弦波及び余弦法の振幅値を示す。
−〒−kt)・・・・・・(4)ここで、Ak、Bkは
に次高調波の正弦波及び余弦法の振幅値を示す。
(4)式において、2π/Tは通常ピッチ周期と言われ
、音声の特徴を示す大きな要素の1つである。ピッチ周
期は、声帯波振動によって生じ、そのスタート位置を声
帯が閉じた状態から始まると仮定すると、音声信号の因
果性により音素片波形(1ピッチ周期区間の音声波形)
のでタートは零からとなる。このようにして選択された
音素片波形を周期関数f(t)とすると(4)式におい
てBm#織 m = 1〜3 ・・・・・・・・・
・・・・−(8)れた音素片波形が奇関数的な特徴を持
っていることからも(5)式が予想される。
、音声の特徴を示す大きな要素の1つである。ピッチ周
期は、声帯波振動によって生じ、そのスタート位置を声
帯が閉じた状態から始まると仮定すると、音声信号の因
果性により音素片波形(1ピッチ周期区間の音声波形)
のでタートは零からとなる。このようにして選択された
音素片波形を周期関数f(t)とすると(4)式におい
てBm#織 m = 1〜3 ・・・・・・・・・
・・・・−(8)れた音素片波形が奇関数的な特徴を持
っていることからも(5)式が予想される。
周期関数At>を音素片波形のスタート位置t0から會
まで積分したときの値をF(t)とすると(6)式に(
4)式を代入して整理すると(7)式となる。
まで積分したときの値をF(t)とすると(6)式に(
4)式を代入して整理すると(7)式となる。
・・・・・・・・・・・・・・・・・・・・・・・・(
7)ただし、 t0≧11.1≦t2 ・・・・・・・・・・・
・・・・・・・(8)である。
7)ただし、 t0≧11.1≦t2 ・・・・・・・・・・・
・・・・・・・(8)である。
(7)式より、周波数が大きくなるにつれて(kの値が
大きくなるにつれて)k次高調波の振幅が小さくなりそ
の影響力が小さくなることが分かる。このことを考慮し
、かつ(6)式より(η式は(9)式に簡素化できる・ ただし、 m=2〜3 ・・・・・−・・・・・・・・
・・・(10)である。
大きくなるにつれて)k次高調波の振幅が小さくなりそ
の影響力が小さくなることが分かる。このことを考慮し
、かつ(6)式より(η式は(9)式に簡素化できる・ ただし、 m=2〜3 ・・・・・−・・・・・・・・
・・・(10)である。
(9)式を図示すると第1図となる。(9)式は、音素
片波形!(t)をtoからtまでの周期として、その時
の直流分を求めていることを意味している。
片波形!(t)をtoからtまでの周期として、その時
の直流分を求めていることを意味している。
以上、音声信号の任意の区間(’1+t2)について述
べたが、隣り合う任意の区間間においても連続であるか
ら、F(t)は音声信号全域について成り立つ。すなわ
ち、 ただし、Nは音素片の数、lは1番目の音素片を示し、
fi(t)は1番目の音素片波形を示す。(11)式は
、音声信号f(t)を0から食まで積分すると、tを含
む(N+1 )番目の音素片以外では全て1周期積分を
行なうため零となり、すなわち(N+1)番目の音素片
波形のみをそのスタート位置t0から會まで積分するの
と等価になることを意味している。
べたが、隣り合う任意の区間間においても連続であるか
ら、F(t)は音声信号全域について成り立つ。すなわ
ち、 ただし、Nは音素片の数、lは1番目の音素片を示し、
fi(t)は1番目の音素片波形を示す。(11)式は
、音声信号f(t)を0から食まで積分すると、tを含
む(N+1 )番目の音素片以外では全て1周期積分を
行なうため零となり、すなわち(N+1)番目の音素片
波形のみをそのスタート位置t0から會まで積分するの
と等価になることを意味している。
次に、D F T (Discrete Fourie
r Transformation)について考える。
r Transformation)について考える。
DFTは、一般に(12)式によって表わされる。
ただし、
X(ト))はに次高調波の振幅と位相を示し、f (n
)はf(りをN個のディスクリートデータにサンプリン
グしたデータ列を示し、 いるので(12)式から次のことが導かれる。
)はf(りをN個のディスクリートデータにサンプリン
グしたデータ列を示し、 いるので(12)式から次のことが導かれる。
す々わち、(13)式は(6)式と等価となる。
ゆえに、標本化定理に基づいてサンプリングされた音声
信号から、(13)式を用いF (i)が零になる区間
をピッチ周期とすることができる。
信号から、(13)式を用いF (i)が零になる区間
をピッチ周期とすることができる。
しかしながら、F(i)は必ずしも1周期区間で零にな
らない場合が生じる。これは、自然音声に含まれる直流
分及びサンプリング誤差によるもので、この為、F(i
)の極小値を求めることによりピッチ周期が求められる
。
らない場合が生じる。これは、自然音声に含まれる直流
分及びサンプリング誤差によるもので、この為、F(i
)の極小値を求めることによりピッチ周期が求められる
。
第2図は自然音声波形を示し、第3図は自然音声波形を
(13)式に基づいて計算したF(i)を示している。
(13)式に基づいて計算したF(i)を示している。
第2図、第3図からも明らかなように、F (i)の極
小値Aと次の極小値Bが、自然音声波形のA′とB′点
に対応し、1ピッチ周期区間に対応していることが分か
る。
小値Aと次の極小値Bが、自然音声波形のA′とB′点
に対応し、1ピッチ周期区間に対応していることが分か
る。
次に、本発明方法を利用してピッチ周期のデータを取り
出す回路について第41とともに説明する。
出す回路について第41とともに説明する。
第4図において1は、音声信号6を標本化定理に基づい
てディジタル信号に変換するA/D変換器、2は、A/
D変換器1においてディジタル信号7に変換された信号
をストアするレジスタ、3は、レジスタ2にストアされ
た信号を信号線8を通して受け(13)式の演算を行な
う加算器、4は、加算器3の結果を信号線9を通して受
けその加算結果の極小値を判定する判定器で、判定され
た結果は信号線1oを通しレジスタ2及び、加算器3へ
送られる。この信号に基づいて、レジスタ2は次の音声
処理器5へ1ピッチ周期分のデータを信号線11を通し
て送り、レジスタ2および加算器3を始期値設定する。
てディジタル信号に変換するA/D変換器、2は、A/
D変換器1においてディジタル信号7に変換された信号
をストアするレジスタ、3は、レジスタ2にストアされ
た信号を信号線8を通して受け(13)式の演算を行な
う加算器、4は、加算器3の結果を信号線9を通して受
けその加算結果の極小値を判定する判定器で、判定され
た結果は信号線1oを通しレジスタ2及び、加算器3へ
送られる。この信号に基づいて、レジスタ2は次の音声
処理器5へ1ピッチ周期分のデータを信号線11を通し
て送り、レジスタ2および加算器3を始期値設定する。
以上の繰返しにより、自然音声信号より1ピッチ周期が
求められる。
求められる。
本発明は、上記のような構成であり、本発明によれば、
加算処理でよいため、従来のピッチ抽出方式に比較して
抽出スピードが格段に速くかつ正確に抽出できる利点を
有する。また、本発明によれば従来方式では不可能だっ
た音素片波形のスタート位置も正確に抽出でき、音声分
析に対して非常に有効となるものである。
加算処理でよいため、従来のピッチ抽出方式に比較して
抽出スピードが格段に速くかつ正確に抽出できる利点を
有する。また、本発明によれば従来方式では不可能だっ
た音素片波形のスタート位置も正確に抽出でき、音声分
析に対して非常に有効となるものである。
また、本発明を音声認識に応用することにより、従来の
認識率の向上が図れる利点を有するものである。
認識率の向上が図れる利点を有するものである。
第1図は本発明の基本原理の説明図、第2図は自然音声
波形を示す図、第3図は第2図に示す自然音声波形を(
13)式に基いて計算した結果を示す図、第4図は本発
明方法を実施する回路のブロック図である。 1・・・・・・A/D変換器、2・・・・・・レジスタ
、3・・・・・加算器、4・・・・・・判定器、6・・
・・・・音声処理器。
波形を示す図、第3図は第2図に示す自然音声波形を(
13)式に基いて計算した結果を示す図、第4図は本発
明方法を実施する回路のブロック図である。 1・・・・・・A/D変換器、2・・・・・・レジスタ
、3・・・・・加算器、4・・・・・・判定器、6・・
・・・・音声処理器。
Claims (2)
- (1)音声信号をサンプリングして得られるデータを順
次加算する第1のステップと、上記順次加算されたデー
タ列の極小値群を求める第2のステップとを有し、上記
極小値群の隣り合う極小値区間よりピッチ周期を得るこ
とを特徴とする音声信号のピッチ周期抽出方法。 - (2)音声信号をサンプリングして得られるデータを順
次加算する第1のステップが積分処凧μテップである特
許請求の範囲第1項記載の音声信号のピッチ周期抽出方
法・
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57049558A JPS58166399A (ja) | 1982-03-26 | 1982-03-26 | 音声信号のピツチ周期抽出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57049558A JPS58166399A (ja) | 1982-03-26 | 1982-03-26 | 音声信号のピツチ周期抽出方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS58166399A true JPS58166399A (ja) | 1983-10-01 |
Family
ID=12834529
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57049558A Pending JPS58166399A (ja) | 1982-03-26 | 1982-03-26 | 音声信号のピツチ周期抽出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS58166399A (ja) |
-
1982
- 1982-03-26 JP JP57049558A patent/JPS58166399A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4038503A (en) | Speech recognition apparatus | |
| US8412526B2 (en) | Restoration of high-order Mel frequency cepstral coefficients | |
| US7272551B2 (en) | Computational effectiveness enhancement of frequency domain pitch estimators | |
| JPH04506575A (ja) | 長時間予測子を有する適応変換コード化装置 | |
| US8280724B2 (en) | Speech synthesis using complex spectral modeling | |
| WO1993018505A1 (en) | Voice transformation system | |
| US4937868A (en) | Speech analysis-synthesis system using sinusoidal waves | |
| US7305339B2 (en) | Restoration of high-order Mel Frequency Cepstral Coefficients | |
| CN100555876C (zh) | 声信号处理装置和方法 | |
| JPH05281996A (ja) | ピッチ抽出装置 | |
| JPS58166399A (ja) | 音声信号のピツチ周期抽出方法 | |
| CN111862931B (zh) | 一种语音生成方法及装置 | |
| JP3223564B2 (ja) | ピッチ抽出方法 | |
| CN113450768A (zh) | 语音合成系统评测方法、装置、可读存储介质及终端设备 | |
| KR0128851B1 (ko) | 극성이 다른 가변길이 듀얼 임펄스의 스펙트럼 하모닉스 매칭에 의한 피치 검출 방법 | |
| JP3271193B2 (ja) | 音声符号化方法 | |
| JPH06202695A (ja) | 音声信号処理装置 | |
| JPH0246960B2 (ja) | ||
| JPH05265489A (ja) | ピッチ抽出方法 | |
| JPS6113600B2 (ja) | ||
| JPS58145993A (ja) | 音声のピツチ抽出方法 | |
| JPS60158500A (ja) | ピツチ抽出装置 | |
| JPS6068000A (ja) | ピッチ抽出装置 | |
| JPS60254200A (ja) | 音声基本周波数抽出装置 | |
| JPH07114396A (ja) | ピッチ検出方法 |