JPS6323200A - ピッチ抽出装置 - Google Patents
ピッチ抽出装置Info
- Publication number
- JPS6323200A JPS6323200A JP16377187A JP16377187A JPS6323200A JP S6323200 A JPS6323200 A JP S6323200A JP 16377187 A JP16377187 A JP 16377187A JP 16377187 A JP16377187 A JP 16377187A JP S6323200 A JPS6323200 A JP S6323200A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- waveform
- output
- period
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 15
- 239000011295 pitch Substances 0.000 description 79
- 230000005236 sound signal Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000270666 Testudines Species 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Landscapes
- Working-Up Tar And Pitch (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声のピッチ時刻などを抽出するためのピッチ
抽出装置に関する。
抽出装置に関する。
音声波形における有声音部分は周期的な繰シ返し波形を
持ちその周期(ピッチ周期)の変化特性は音声の分析合
成、認識等における重要なパラメータであることが知ら
れている。例えば、音声の分析合成系においては分析部
で抽出されるピッチ抽出結果が合成部において合成され
る合成音の品質に大きな影響を及ぼす。
持ちその周期(ピッチ周期)の変化特性は音声の分析合
成、認識等における重要なパラメータであることが知ら
れている。例えば、音声の分析合成系においては分析部
で抽出されるピッチ抽出結果が合成部において合成され
る合成音の品質に大きな影響を及ぼす。
音声波形のピッチ周期の抽出方法としては、従来、ピッ
チ周期程度の時間長を持つフレーム毎に自己相関係数を
算出し抽出する方法等、種々の分析パラメータを用いる
方法が知られている。
チ周期程度の時間長を持つフレーム毎に自己相関係数を
算出し抽出する方法等、種々の分析パラメータを用いる
方法が知られている。
自己相関係数に基づくピッチ抽出法は、自己相関係数が
時間領域内の処理で求め得る点と、被分析波形とフレー
ムとの位相の影響が比鮫的に小さい点とから広く用いら
れる。
時間領域内の処理で求め得る点と、被分析波形とフレー
ムとの位相の影響が比鮫的に小さい点とから広く用いら
れる。
しかしながら自己相関係数に基づくピッチ抽出法は、後
述するようにピッチ周期の整数倍の周期をピッチ周期と
して誤って検出することが多(ハという欠点を有してい
る。前記欠点は有声音定常部に多発する。
述するようにピッチ周期の整数倍の周期をピッチ周期と
して誤って検出することが多(ハという欠点を有してい
る。前記欠点は有声音定常部に多発する。
有声音定常部に前記欠点が発生する一つの原因は被分析
波形の定常性が著しく強いことである。
波形の定常性が著しく強いことである。
なぜならば、いわゆる有声音定常部は、例えば数百m
S E C程度の比較的に長時間について観察するなら
ば、そのピッチ周期全一単位とする波形端片は、ピッチ
周期、波形端片共に、除々に変化していることが認めら
れている。しかし、有声音定常部の種々のセグメントに
ついて、フレーム周期毎に切出される波形の時間長(例
えば3QmSEC)程度の比較的に短時間に限定して観
察すると、その波形は、はぼ完全な定常性、すなわち周
期性を示すことがしばしばある。例えば正弦波の自己相
関係数波形が前記世弦波と同一周期を有する余弦波とな
る等、よく知られている様に、定常性、すなわち周期性
を有する波形の自己相関係数波形は周期性を有する。従
ってフレーム周期毎に例えば30m5EC程度の時間長
で切り出される波形がほぼ完全な定常性すなわち周期性
を示す場合には、この自己相関係数波形は、はぼ完全な
周期性を示す。
S E C程度の比較的に長時間について観察するなら
ば、そのピッチ周期全一単位とする波形端片は、ピッチ
周期、波形端片共に、除々に変化していることが認めら
れている。しかし、有声音定常部の種々のセグメントに
ついて、フレーム周期毎に切出される波形の時間長(例
えば3QmSEC)程度の比較的に短時間に限定して観
察すると、その波形は、はぼ完全な定常性、すなわち周
期性を示すことがしばしばある。例えば正弦波の自己相
関係数波形が前記世弦波と同一周期を有する余弦波とな
る等、よく知られている様に、定常性、すなわち周期性
を有する波形の自己相関係数波形は周期性を有する。従
ってフレーム周期毎に例えば30m5EC程度の時間長
で切り出される波形がほぼ完全な定常性すなわち周期性
を示す場合には、この自己相関係数波形は、はぼ完全な
周期性を示す。
故に例えが第5図に示す様にピッチ周期における自己相
関係数の極大値101と倍ピツチ周期はおける極大値1
02とがほとんど等しくなう、演算精度や、わずかな外
乱等の影響でピッチ周期における極大値101よりも倍
ピツチ周期における極大値102が大きくなることが頻
繁に発生するからである。
関係数の極大値101と倍ピツチ周期はおける極大値1
02とがほとんど等しくなう、演算精度や、わずかな外
乱等の影響でピッチ周期における極大値101よりも倍
ピツチ周期における極大値102が大きくなることが頻
繁に発生するからである。
本発明の目的はピッチ予測手段を介してピッチを抽出す
ることによフ上述の欠点を除去したピッチ抽出装置を提
供することにある。
ることによフ上述の欠点を除去したピッチ抽出装置を提
供することにある。
本発明の装置は音声信号のピッチ予測係数を算出するた
めのピッチ予測分析手段と、この手段により算出された
ピッチ予測係数により制御てれるピッチ予測手段とを有
して構成される。
めのピッチ予測分析手段と、この手段により算出された
ピッチ予測係数により制御てれるピッチ予測手段とを有
して構成される。
次に図面を参照して本発明の詳細な説明する。
第1図は本発明の実施例を示すブロック図である。第1
図に示す本発明は標本化手段5.ピッチ予測分析手段6
.ピッチ予測手段7.ピヅチ強調手段8.ピッチパラメ
ータ抽出手段9等を備えて槽底される。更に標本化手段
5はA/Dコンバータ1.自己相関分析器2 、 L
P C(Linear P−rediction Co
ding、線形予測分析)逆フィルタ、LPC分析器4
を含み、ピッチ予測手段7は遅延回路71.単位遅延素
子73−1.73−2、乗算器74−1.74−2.7
4−3.加算器75を含み、ピッチ強調手段8は乗算器
76゜センタクリップ回路77を含んでいる。
図に示す本発明は標本化手段5.ピッチ予測分析手段6
.ピッチ予測手段7.ピヅチ強調手段8.ピッチパラメ
ータ抽出手段9等を備えて槽底される。更に標本化手段
5はA/Dコンバータ1.自己相関分析器2 、 L
P C(Linear P−rediction Co
ding、線形予測分析)逆フィルタ、LPC分析器4
を含み、ピッチ予測手段7は遅延回路71.単位遅延素
子73−1.73−2、乗算器74−1.74−2.7
4−3.加算器75を含み、ピッチ強調手段8は乗算器
76゜センタクリップ回路77を含んでいる。
第1図において、音声入力[A/Dコンバータ1に供給
され、内蔵する低域通過フィルタで3.4KHz以上の
高域全遮断したのち、8KHzのサンプリング周波数で
標本化し友あと12ビツトの量子化ステップでディジタ
ル化きれIPC合成フィルタ3に提供でれるとともに、
このディジタル化音声信号の1プロプクぶん、たとえば
30m5EC。
され、内蔵する低域通過フィルタで3.4KHz以上の
高域全遮断したのち、8KHzのサンプリング周波数で
標本化し友あと12ビツトの量子化ステップでディジタ
ル化きれIPC合成フィルタ3に提供でれるとともに、
このディジタル化音声信号の1プロプクぶん、たとえば
30m5EC。
240サンプルふんずつを一時的に内部メモリに格納し
つつ、これにあらかじめ設定する念関数、たとえばハミ
ング関数を乗算して切出す窓処理を10m5Ec ごと
に行なって自己相関分析器2に供給する。従って基本分
析フレームは10m5ECとなる。
つつ、これにあらかじめ設定する念関数、たとえばハミ
ング関数を乗算して切出す窓処理を10m5Ec ごと
に行なって自己相関分析器2に供給する。従って基本分
析フレームは10m5ECとなる。
自己相関分析器2ば、A/Dコンバータ1から供給され
るフレーム毎のディジタル化音声信号xi(i=Q。
るフレーム毎のディジタル化音声信号xi(i=Q。
1、・・・・・・239)から下記(1)式に示す自己
相関係数φj(j=o、1.・・・・・・10)を算出
する。
相関係数φj(j=o、1.・・・・・・10)を算出
する。
自己相関分析器2は算出したφGを短時間音声電力を表
わす電力データとして波形発生器6へ出力する。自己相
関分析器2は更にφj(j=1.2.・・・・・・10
)を下記(2)式によ)φ0によ勺正規化し、正規化後
の自己相関係数σj(j=1.2.・・・・・・10)
をLPG分析器4へ出力する。
わす電力データとして波形発生器6へ出力する。自己相
関分析器2は更にφj(j=1.2.・・・・・・10
)を下記(2)式によ)φ0によ勺正規化し、正規化後
の自己相関係数σj(j=1.2.・・・・・・10)
をLPG分析器4へ出力する。
、j10.186011.1911.(2)!1=τ
A/Dコンバータ1は前記フレーム毎に切出されるディ
ジタル化音声信号の他に、窓処理されていない、即ちフ
レーム化されていないディジタル化音声信号S i (
i=・・〜・・−2,−1,0,1,2,・・−・・〕
をLPC逆フィルタ3へ出力する。
ジタル化音声信号の他に、窓処理されていない、即ちフ
レーム化されていないディジタル化音声信号S i (
i=・・〜・・−2,−1,0,1,2,・・−・・〕
をLPC逆フィルタ3へ出力する。
LPC逆フィルタ3は供給された音声信号Siから、L
PG逆フィルタ全利用して残差波形ri(・・・−2,
−1,0,1,2’、・・・・・・)を抽出し、これを
ピッチ予測手段7とピッチ予5.11分析手段6とへ出
力する。この場合、LPC逆フィルタ3のフィルタ係数
はLPC分析器4から基本分析フレームごとに提供され
る10次のびパラメータ、α1゜α2・・・・・・α1
(1が利用される。
PG逆フィルタ全利用して残差波形ri(・・・−2,
−1,0,1,2’、・・・・・・)を抽出し、これを
ピッチ予測手段7とピッチ予5.11分析手段6とへ出
力する。この場合、LPC逆フィルタ3のフィルタ係数
はLPC分析器4から基本分析フレームごとに提供され
る10次のびパラメータ、α1゜α2・・・・・・α1
(1が利用される。
LPC分析器4は自己相関分析器2から受ける10次の
自己相関係数5F1.j’z*・・・・・・Fltoを
利用し、公知のLPC分析技術によって10次のLPG
係数としてのαパラメータ、α1.α2・・・・・・α
toTh抽出しLPC逆フィルタ3に基本分析フレーム
ごとに提供する。
自己相関係数5F1.j’z*・・・・・・Fltoを
利用し、公知のLPC分析技術によって10次のLPG
係数としてのαパラメータ、α1.α2・・・・・・α
toTh抽出しLPC逆フィルタ3に基本分析フレーム
ごとに提供する。
尚、本実施例ではLPC分析技術として、板倉文忠「統
計的手法による音声の特徴抽出」、東北犬学電気通信研
究所主催第8回シンポジウムm−5、1971年2月に
於いて図1として示されている分析技術と原理的に同一
のものを利用している。
計的手法による音声の特徴抽出」、東北犬学電気通信研
究所主催第8回シンポジウムm−5、1971年2月に
於いて図1として示されている分析技術と原理的に同一
のものを利用している。
第3図はLPG逆フィルタ3を詳細に示すブロック図で
ある。このLPC逆フィルタは、単位遅延素子31−1
〜31−10.乗算器32−1〜32−10.加算器3
3,34iCよって構成されるディジタルフィルタであ
り、重み係数として基本分析フレームごとのαパラメー
タ、αl、α、。
ある。このLPC逆フィルタは、単位遅延素子31−1
〜31−10.乗算器32−1〜32−10.加算器3
3,34iCよって構成されるディジタルフィルタであ
り、重み係数として基本分析フレームごとのαパラメー
タ、αl、α、。
・・・・・・σ16を第3図に示すように利用すること
によってLPC分析器4によって分析されるLPC係数
の示すスペクトル包絡特性とに時間・レベル特性が逆特
性のフィルタを基本分析フレームごとに形成する。
によってLPC分析器4によって分析されるLPC係数
の示すスペクトル包絡特性とに時間・レベル特性が逆特
性のフィルタを基本分析フレームごとに形成する。
さて、音声波形は発声者の声帯振動波形が声道形状に依
存する周波数特性全付加てれてつくられる事が矧られて
いる。又、LPC係数の示すスペクトル包絡特性は、前
記声道形状に依存する周波数特性を近似している事も知
られている。従ってA/Dフンバータ1より供給される
音声信号Xiは声道形状に依存する周波数特注がLPC
逆フィルタによ)相殺される。即ちLPC逆フィルタ3
は音声信号Xiから声帯振動波形に類似の波形(以後「
残差波形」と云う)eiを求め、これをピッチ励振時刻
分析器7へ出力する。熱論、残差波形eiは声帯振動周
期、即ちピッチ周期と一致した周期性を有する。
存する周波数特性全付加てれてつくられる事が矧られて
いる。又、LPC係数の示すスペクトル包絡特性は、前
記声道形状に依存する周波数特性を近似している事も知
られている。従ってA/Dフンバータ1より供給される
音声信号Xiは声道形状に依存する周波数特注がLPC
逆フィルタによ)相殺される。即ちLPC逆フィルタ3
は音声信号Xiから声帯振動波形に類似の波形(以後「
残差波形」と云う)eiを求め、これをピッチ励振時刻
分析器7へ出力する。熱論、残差波形eiは声帯振動周
期、即ちピッチ周期と一致した周期性を有する。
次に第3図に示すLPC逆フィルタ3の動作を具体的に
説明する。いまA/Dコンバーターより供給される音声
信号X・ が単位遅延素子31−1へ入力されたとす
る。単位遅延素子31−1はX−を記憶し、これを単位
遅延素子31−2へ出力する。次に音声信号X・ が
単位遅延素子31−1へ供給され入力される。同時に単
位遅延素子31−1に記憶でルていたX は単位!
−10 遅延素子31−2に記憶される。以下、次々に音声信号
xi−6,xi−7,0,−Xi−1が単位遅延素子3
L−1に記憶される。単位遅延素子31−1がXl−1
を記憶した時、単位遅延素子31−2〜10は音声信号
x−x・ ・・・・・・+xi−toを記憶しており
、加算器34VcId音声信号X・が供給されている。
説明する。いまA/Dコンバーターより供給される音声
信号X・ が単位遅延素子31−1へ入力されたとす
る。単位遅延素子31−1はX−を記憶し、これを単位
遅延素子31−2へ出力する。次に音声信号X・ が
単位遅延素子31−1へ供給され入力される。同時に単
位遅延素子31−1に記憶でルていたX は単位!
−10 遅延素子31−2に記憶される。以下、次々に音声信号
xi−6,xi−7,0,−Xi−1が単位遅延素子3
L−1に記憶される。単位遅延素子31−1がXl−1
を記憶した時、単位遅延素子31−2〜10は音声信号
x−x・ ・・・・・・+xi−toを記憶しており
、加算器34VcId音声信号X・が供給されている。
単位遅延素子31−1〜10の各出力Xi −rXi
−2”−” Xi −10”各々乗算器32−1〜10
へ供給される。乗算器32−1〜10は供給されたxi
−1・・・・・・”1−10 とびパラメータ、al
。
−2”−” Xi −10”各々乗算器32−1〜10
へ供給される。乗算器32−1〜10は供給されたxi
−1・・・・・・”1−10 とびパラメータ、al
。
α1 、・・・・・・α亀。とを各々乗算し、結果を加
算器33へ出力する。加算器33の出力は下記(3)式
で示さ△ △ れるX・である。尚、x−ij音声信号Xtの予測値墓
!である。
算器33へ出力する。加算器33の出力は下記(3)式
で示さ△ △ れるX・である。尚、x−ij音声信号Xtの予測値墓
!である。
xi= Σ αjxH−j ・・・・・・・
・・・・・・・・ (3)j=i △ このxil’!加算器34へ哄玲でれる。加算器34i
jx とX・との差ei(=xi−xi)f求め前述の
ようにピッチ予測分析手段6とピッチ予測手段7とへ出
力する。
・・・・・・・・ (3)j=i △ このxil’!加算器34へ哄玲でれる。加算器34i
jx とX・との差ei(=xi−xi)f求め前述の
ようにピッチ予測分析手段6とピッチ予測手段7とへ出
力する。
再び第1図を利用して本発明を詳4tE F説明する。
ピッチ予測分析手段6はLPC逆フィルタ3:り供給さ
れる残差波形e−にもとづき、前述の自己相関分析器2
と同様の方法で自己相関係数8j(j=0 、1 、・
・−・・、I)(Iはピッチ周期つ分布範囲の最大値に
対応する整数)求めろ。次に自己相開−ビッチ抽出器7
2?′i求めたRjのピッチ周期の分布範囲(本実施例
では25〜15m5EC)に於けるRjO服犬憧全検紫
する。この最大値に対応する遅れ時間相等のタイムスロ
ット数T。は先験的にピッチ周期に概ね一致する事が知
られている。
れる残差波形e−にもとづき、前述の自己相関分析器2
と同様の方法で自己相関係数8j(j=0 、1 、・
・−・・、I)(Iはピッチ周期つ分布範囲の最大値に
対応する整数)求めろ。次に自己相開−ビッチ抽出器7
2?′i求めたRjのピッチ周期の分布範囲(本実施例
では25〜15m5EC)に於けるRjO服犬憧全検紫
する。この最大値に対応する遅れ時間相等のタイムスロ
ット数T。は先験的にピッチ周期に概ね一致する事が知
られている。
さて、音声信号はピッチ周期性、即ち予測性を有してお
シ、残差波決も同様に予測性を有する。
シ、残差波決も同様に予測性を有する。
今、残差波形ei+Tcが’ツテ周期だけ以前の波形e
ik中心とした前後1タップ合計3タツプの残差波形e
i−1ei ei+1で波形予測可能とする。ei+T
cに下記(4)式を用いて表現される。
ik中心とした前後1タップ合計3タツプの残差波形e
i−1ei ei+1で波形予測可能とする。ei+T
cに下記(4)式を用いて表現される。
ei+Tc−di+Tc”βIei+□+βjei +
β3e!i1・・・・・・・・・ (4) (4)式に訃いて、di+Tcはナンプル時間i+Tの
位置におけるピッチ予測残差波形、β1〜β3はピッチ
予測係数である。(4)式よシ下記(5)〜(7)式が
導出される。
β3e!i1・・・・・・・・・ (4) (4)式に訃いて、di+Tcはナンプル時間i+Tの
位置におけるピッチ予測残差波形、β1〜β3はピッチ
予測係数である。(4)式よシ下記(5)〜(7)式が
導出される。
ei+rc°ei+x ’i+Tc°ei”l=βl
ei+1+ei+1+β2e五〇ei+1”V”3 e
l 1・ei+□ ・・・・・
・・・・ (5)t+rc”1−di+Te l =β1ei+1・ei+β3ei−ei+β3ei−1
・ei・・・・・・・・・ (6) x+Tc°ei−t−di+Tc t−z=βt6
1+□・ei−1+β”i”’i−1+β3ei−□・
ei−s ・・・・・・
・・・ (7)予測残差波形eiが定常性を有するもの
と仮定し、さらにピッチ予測残差波形di+Tcと予測
残差波形とが無相関であると仮定する。この仮定は音声
処理上、実用的には殆んど問題のない仮定である。
ei+1+ei+1+β2e五〇ei+1”V”3 e
l 1・ei+□ ・・・・・
・・・・ (5)t+rc”1−di+Te l =β1ei+1・ei+β3ei−ei+β3ei−1
・ei・・・・・・・・・ (6) x+Tc°ei−t−di+Tc t−z=βt6
1+□・ei−1+β”i”’i−1+β3ei−□・
ei−s ・・・・・・
・・・ (7)予測残差波形eiが定常性を有するもの
と仮定し、さらにピッチ予測残差波形di+Tcと予測
残差波形とが無相関であると仮定する。この仮定は音声
処理上、実用的には殆んど問題のない仮定である。
ところで(51、+61および(7)式に、原音声波形
と、3個のピッチ予測係数β!、β:およびβ3を介し
て再生されるべき波形との間の関係式を示すもので、両
波形間で対応すべき時間における波形乗算値にもとづく
等式で両波形を関係づけている。求むべき未知数β1.
β2.β3は、これら3つの等式で表現される原子側残
差波形と再生予測残差波形間の電力語差が最小となるも
のでiければならない。この解は(51、(61および
(7)式の等式の右辺と左辺との差を零とするようなβ
l−β3の組合せを見出すことで求まり、最小自乗法の
適用によって容易に見出しうる。ただし[5) 、 +
6) 、 (71は波形乗算のベクトル積の形式で表現
しているので一旦これらを音声電力で表現変換し最小自
乗法の適用を可能ならしめる。
と、3個のピッチ予測係数β!、β:およびβ3を介し
て再生されるべき波形との間の関係式を示すもので、両
波形間で対応すべき時間における波形乗算値にもとづく
等式で両波形を関係づけている。求むべき未知数β1.
β2.β3は、これら3つの等式で表現される原子側残
差波形と再生予測残差波形間の電力語差が最小となるも
のでiければならない。この解は(51、(61および
(7)式の等式の右辺と左辺との差を零とするようなβ
l−β3の組合せを見出すことで求まり、最小自乗法の
適用によって容易に見出しうる。ただし[5) 、 +
6) 、 (71は波形乗算のベクトル積の形式で表現
しているので一旦これらを音声電力で表現変換し最小自
乗法の適用を可能ならしめる。
波形乗算は、この場合自己相関をとることと同様であり
従って(51、(61、+71式はiについて積分し次
の(8] 、 (91、(1o)式に変換しうる。
従って(51、(61、+71式はiについて積分し次
の(8] 、 (91、(1o)式に変換しうる。
凡T0−□=β+Ro+β2”l+β3馬 ・・・・
・・・・・ (8)11、To==βtRq+β2曳+
βs Rt −−−(91”TC+i=β11チ+
β2R1+β3R= −−−(10)(8) 、 (
91訃よび(10)式においてR・s RIs R2゜
RTC−1,RT。、およびRT。+1はそれぞれ予測
残差波形eiの遅れ0 、1 、2 、 T、−0,T
o、およびTC+ 1における自己相関係数である。(
8) 、 (91および(10)式よ勺下記(11)式
が導出される。
・・・・・ (8)11、To==βtRq+β2曳+
βs Rt −−−(91”TC+i=β11チ+
β2R1+β3R= −−−(10)(8) 、 (
91訃よび(10)式においてR・s RIs R2゜
RTC−1,RT。、およびRT。+1はそれぞれ予測
残差波形eiの遅れ0 、1 、2 、 T、−0,T
o、およびTC+ 1における自己相関係数である。(
8) 、 (91および(10)式よ勺下記(11)式
が導出される。
ピッチ予測分析手段は(11)式に基づきピッチ予測係
数β1.β3.β3を算出する。ピッチ予測分析手段は
算出した係数β1.β2.β3を各々乗算器74−1
、74−2 、74−3へ出力し、同時にピッチ周期デ
ータT。−1を遅延回路71へ出力する。
数β1.β3.β3を算出する。ピッチ予測分析手段は
算出した係数β1.β2.β3を各々乗算器74−1
、74−2 、74−3へ出力し、同時にピッチ周期デ
ータT。−1を遅延回路71へ出力する。
ピッチ予測分析手段に更にピッチ測係数β!〜β3 、
遅れOに於ける自己相関係数R0金利用して、V(Vo
ice、有%f)/UV(Unvoice。
遅れOに於ける自己相関係数R0金利用して、V(Vo
ice、有%f)/UV(Unvoice。
無声)情報を抽出しセンタクリップ回路77へ出力する
。このピッチ抽出によって得られる周期T。
。このピッチ抽出によって得られる周期T。
のピッチ周期データはサンプリング周波数8KHzによ
る3個のサンプルデータ、すなわちT。およびT。±1
のタイミングにおけるサンプルデータとしてそれぞれ乗
算器74−2 、74−3および74−1にピッチ予1
1J係数として提供される。
る3個のサンプルデータ、すなわちT。およびT。±1
のタイミングにおけるサンプルデータとしてそれぞれ乗
算器74−2 、74−3および74−1にピッチ予1
1J係数として提供される。
単位遅延素子73−1.73−2はそれぞれ1タップ分
の遅延量を付与され、また遅延回路71はピッチ周期デ
ータごとにTc−1の遅延量を入力に付与するように機
能する従ってピッチパルスに対しては単位遅延素子73
−1と73−2の接合点はT 遅延回路71の出力側
はT またC、C−1゜ 単位遅延素子73−2の出力側d’rc−+−xの時間
位置に設定さiする。
の遅延量を付与され、また遅延回路71はピッチ周期デ
ータごとにTc−1の遅延量を入力に付与するように機
能する従ってピッチパルスに対しては単位遅延素子73
−1と73−2の接合点はT 遅延回路71の出力側
はT またC、C−1゜ 単位遅延素子73−2の出力側d’rc−+−xの時間
位置に設定さiする。
第4図(5)、 (BlはLPC逆フィルタ3より入力
される残差波形eiとピッチ予測係数β1〜β3によ)
つくられる理想的なピッチ子側波形、加算器75の出力
とを模式的に示す図である。乗算器76の出力にこれら
囚、 (Blに示す波形の同時刻に於ける瞬時値の積と
なる。第4図(0は乗算器76の出力波形を示す。この
出力波形は残差波形に含まれるピッチ成分が強勢された
状態となシ、且つピッチ成分の極性が必ず正に変換ぢれ
るため、極めてピッチ抽出が容易な形状に々っている。
される残差波形eiとピッチ予測係数β1〜β3によ)
つくられる理想的なピッチ子側波形、加算器75の出力
とを模式的に示す図である。乗算器76の出力にこれら
囚、 (Blに示す波形の同時刻に於ける瞬時値の積と
なる。第4図(0は乗算器76の出力波形を示す。この
出力波形は残差波形に含まれるピッチ成分が強勢された
状態となシ、且つピッチ成分の極性が必ず正に変換ぢれ
るため、極めてピッチ抽出が容易な形状に々っている。
この出力波形はセンタクリップ回路77へ出力される。
第2図はセンタクリップ回路77の構成を詳細に説明す
るためのブロック図である。第2図に示すセンタクリッ
プ回路77はマグニチュードコンパレータ771.スイ
ッチ772.単位遅延素子773、乗算器774.およ
びANDゲート775を有して講和される。
るためのブロック図である。第2図に示すセンタクリッ
プ回路77はマグニチュードコンパレータ771.スイ
ッチ772.単位遅延素子773、乗算器774.およ
びANDゲート775を有して講和される。
まずスイッチ772.単位遅延素子773および乗算器
7゛74で構成されるループを説明する。
7゛74で構成されるループを説明する。
スイッチ772がOFFの場合、乗算器774の出力は
単位遅延素子7730入力に接続される。
単位遅延素子7730入力に接続される。
時刻iに於いて単位遅延素子773がデータViを記憶
しているものとする。乗算器774にはこのViと定数
0.997とが入力されている。乗算器776の出力0
.997vi(=0.997−vi)が単位遅延素子7
73に入力されているため、時刻i十lに於ける単位遅
延素子773の出力V は0.997v、+1 時刻i+2に於ける同出力は0.997 ’vi(=0
.997・0.997vi)となる。同様に時刻inn
の同出力vt 4.rlは次式で与えられる。
しているものとする。乗算器774にはこのViと定数
0.997とが入力されている。乗算器776の出力0
.997vi(=0.997−vi)が単位遅延素子7
73に入力されているため、時刻i十lに於ける単位遅
延素子773の出力V は0.997v、+1 時刻i+2に於ける同出力は0.997 ’vi(=0
.997・0.997vi)となる。同様に時刻inn
の同出力vt 4.rlは次式で与えられる。
v ffi+n=0.997nv H−・−・−(ta
)ざて、単位遅延素子773の出力はマグニチュードコ
ンパレータ771の入力端子771−2に供給されてい
る。第4図中で■で示される点線は単位遅延素子773
の出力である。マグニチュ−ドコンパレータ771の他
の入力端子771−1には乗算器76よシ第4図(qで
示される波形が供給サレる。マグニチュードコンパレー
タ771は2つの入力の大小を比較し、(7711−1
fの人力〕>(771−2側の入力)の条件に於いて1
1”レベルを、この条件が不成立の場合に″′0″レベ
ルヲ出力する。マグニチュードコンパレータ771の出
力を第4図pに示す。この出力が′1”レベルになると
スイッチ772はONになり単位遅延素子773は第4
図(qに示す波形が入力される。
)ざて、単位遅延素子773の出力はマグニチュードコ
ンパレータ771の入力端子771−2に供給されてい
る。第4図中で■で示される点線は単位遅延素子773
の出力である。マグニチュ−ドコンパレータ771の他
の入力端子771−1には乗算器76よシ第4図(qで
示される波形が供給サレる。マグニチュードコンパレー
タ771は2つの入力の大小を比較し、(7711−1
fの人力〕>(771−2側の入力)の条件に於いて1
1”レベルを、この条件が不成立の場合に″′0″レベ
ルヲ出力する。マグニチュードコンパレータ771の出
力を第4図pに示す。この出力が′1”レベルになると
スイッチ772はONになり単位遅延素子773は第4
図(qに示す波形が入力される。
その結果、時刻が1″だけ歩進した後、単位遅延素子7
73は第4図(Qの■で示すピークを記憶する。この記
憶と同時にマグニチュードコンパレータ771の出力!
ri@o”となる。記憶されたビ一りは前記(12)式
に示す減衰を受けるため第4図■ニ示スマグニチュード
コンバレータ771−2の入力がつくられる。第4図(
Qに示す他のピーク■でも同様の動作が行なわれ■がつ
くられふ。−Mマグニチュードコンパレータフフ1の出
力第4図ρはANDゲート775へ供給される。AND
ゲート775flピッチ予測分析手段6より供給される
V/UV情報を利用して、Uv時にセンタクリップ回路
77より不要な出力が発生する事を防ぎ、7時のみ出力
する。
73は第4図(Qの■で示すピークを記憶する。この記
憶と同時にマグニチュードコンパレータ771の出力!
ri@o”となる。記憶されたビ一りは前記(12)式
に示す減衰を受けるため第4図■ニ示スマグニチュード
コンバレータ771−2の入力がつくられる。第4図(
Qに示す他のピーク■でも同様の動作が行なわれ■がつ
くられふ。−Mマグニチュードコンパレータフフ1の出
力第4図ρはANDゲート775へ供給される。AND
ゲート775flピッチ予測分析手段6より供給される
V/UV情報を利用して、Uv時にセンタクリップ回路
77より不要な出力が発生する事を防ぎ、7時のみ出力
する。
さてピッチ予測分析手段6で分析されたビーチ周期が倍
ピツチエラーを起した場合、即ちピッチ周期としてT
の代#)Ic 2T、が分析さ几た場合ピッチ予側手段
7の出力波形は第4図(8)の波形′t−2T。
ピツチエラーを起した場合、即ちピッチ周期としてT
の代#)Ic 2T、が分析さ几た場合ピッチ予側手段
7の出力波形は第4図(8)の波形′t−2T。
だけ遅延させたものになる。こnは鎮4図fB)の波形
をT。だけ遅延させたものに相等する。その結果第4図
■の部分が■の部分と時[♂的に一致する。
をT。だけ遅延させたものに相等する。その結果第4図
■の部分が■の部分と時[♂的に一致する。
その結果、第4図(口の波形が得られる。
再び詔1図を利用して本発明の詳細な説明する。
センタクリップ回路77の出力はピッチ時刻出カライン
81を介してピッチパラメータ抽出手段9へ供給される
。ピッチパラメータ抽出手段9は第4図山に示される波
形、即ち前記出力からパルス間隔を計測する公知の手段
を利用してピッチ周期を算出しピッチパラメータとして
出力する。
81を介してピッチパラメータ抽出手段9へ供給される
。ピッチパラメータ抽出手段9は第4図山に示される波
形、即ち前記出力からパルス間隔を計測する公知の手段
を利用してピッチ周期を算出しピッチパラメータとして
出力する。
以上説明した如く本発明によれば、音声のピッチ周期等
を抽出するピッチ抽出装置に於いて、ピッチ予測分析手
段とピッチ予測手段とを備えることにより、ピッチ周期
の整数倍の周期をピッチ周期と誤検出する問題を根本的
に解決したピッチ抽出装置が実現できる′という効果が
ある。
を抽出するピッチ抽出装置に於いて、ピッチ予測分析手
段とピッチ予測手段とを備えることにより、ピッチ周期
の整数倍の周期をピッチ周期と誤検出する問題を根本的
に解決したピッチ抽出装置が実現できる′という効果が
ある。
第1図は本発明の実施例を示すブロック図、第2図は第
1図に示すゼンタクリップ回路77の構成を示すブロッ
ク図、第3図は第1図に示すLPC逆フィルタ3の構成
を示すブロック図、第4図は本発明の主要な動作を説明
するための波形図、第5図は従来方法の欠点を説明する
ための波形図である0 5・・・・・・標本化手段、6・・・・・・ピッチ予測
分析手段、7・・・・・・ピッチ予測手段、8・・・・
・・ピッチ強調手段、9・・・・・・ピッチパラメータ
抽出手段。 二カ 第1図 第2図 7′ 第3図
1図に示すゼンタクリップ回路77の構成を示すブロッ
ク図、第3図は第1図に示すLPC逆フィルタ3の構成
を示すブロック図、第4図は本発明の主要な動作を説明
するための波形図、第5図は従来方法の欠点を説明する
ための波形図である0 5・・・・・・標本化手段、6・・・・・・ピッチ予測
分析手段、7・・・・・・ピッチ予測手段、8・・・・
・・ピッチ強調手段、9・・・・・・ピッチパラメータ
抽出手段。 二カ 第1図 第2図 7′ 第3図
Claims (1)
- 音声のピッチ周期あるいぱピッチ周波数、もしくはピッ
チ時刻を抽出するためのピッチ抽出装置に於いて、音声
信号のピッチ予測係数を算出するためのピッチ予測分析
手段と、この手段により算出されたピッチ予測係数によ
り制御されるピッチ予測手段とを有して構成される事を
特徴とするピッチ抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16377187A JPS6323200A (ja) | 1987-06-29 | 1987-06-29 | ピッチ抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16377187A JPS6323200A (ja) | 1987-06-29 | 1987-06-29 | ピッチ抽出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6323200A true JPS6323200A (ja) | 1988-01-30 |
Family
ID=15780403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16377187A Pending JPS6323200A (ja) | 1987-06-29 | 1987-06-29 | ピッチ抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6323200A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5314771B2 (ja) * | 2010-01-08 | 2013-10-16 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 |
-
1987
- 1987-06-29 JP JP16377187A patent/JPS6323200A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5314771B2 (ja) * | 2010-01-08 | 2013-10-16 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 |
US9812141B2 (en) | 2010-01-08 | 2017-11-07 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals |
US10049679B2 (en) | 2010-01-08 | 2018-08-14 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals |
US10049680B2 (en) | 2010-01-08 | 2018-08-14 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals |
US10056088B2 (en) | 2010-01-08 | 2018-08-21 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Schafer et al. | System for automatic formant analysis of voiced speech | |
Schafer et al. | Digital representations of speech signals | |
Ananthapadmanabha et al. | Epoch extraction from linear prediction residual for identification of closed glottis interval | |
Yegnanarayana et al. | Extraction of vocal-tract system characteristics from speech signals | |
CA1065490A (en) | Emphasis controlled speech synthesizer | |
JPH02239293A (ja) | 音声処理方法 | |
US20130046540A9 (en) | Restoration of high-order Mel Frequency Cepstral Coefficients | |
Mittal et al. | Study of characteristics of aperiodicity in Noh voices | |
JPS60194499A (ja) | 音声分析方式 | |
JPS5850360B2 (ja) | 音声認識装置における前処理方法 | |
Athineos et al. | LP-TRAP: Linear predictive temporal patterns | |
Průša et al. | Toward high-quality real-time signal reconstruction from STFT magnitude | |
Atal et al. | Linear prediction analysis of speech based on a pole‐zero representation | |
JPS6051720B2 (ja) | 音声の基本周期抽出装置 | |
JPS62289900A (ja) | 音声分析合成装置 | |
US7305339B2 (en) | Restoration of high-order Mel Frequency Cepstral Coefficients | |
Benetos et al. | Auditory spectrum-based pitched instrument onset detection | |
Fulop | Accuracy of formant measurement for synthesized vowels using the reassigned spectrogram and comparison with linear prediction | |
Robinson | Speech analysis | |
Samad et al. | Pitch detection of speech signals using the cross-correlation technique | |
JPS6323200A (ja) | ピッチ抽出装置 | |
JPH07234696A (ja) | 音声の複素ケプストラム分析装置 | |
Srivastava | Fundamentals of linear prediction | |
Andrews et al. | Robust pitch determination via SVD based cepstral methods | |
JPH10190470A (ja) | 周波数荷重評価関数に基づくスペクトル特徴パラメータ抽出装置 |