JP3308847B2 - ピッチ波形切り出し基準位置決定方法とその装置 - Google Patents

ピッチ波形切り出し基準位置決定方法とその装置

Info

Publication number
JP3308847B2
JP3308847B2 JP06335197A JP6335197A JP3308847B2 JP 3308847 B2 JP3308847 B2 JP 3308847B2 JP 06335197 A JP06335197 A JP 06335197A JP 6335197 A JP6335197 A JP 6335197A JP 3308847 B2 JP3308847 B2 JP 3308847B2
Authority
JP
Japan
Prior art keywords
pitch
determined
reference position
residual signal
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP06335197A
Other languages
English (en)
Other versions
JPH10260697A (ja
Inventor
洋文 西村
利光 蓑輪
康彦 新居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP06335197A priority Critical patent/JP3308847B2/ja
Publication of JPH10260697A publication Critical patent/JPH10260697A/ja
Application granted granted Critical
Publication of JP3308847B2 publication Critical patent/JP3308847B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声を合成する音
声合成方法およびその装置において、特に窓関数により
ピッチ波形を切り出し、再び重畳して音声の合成をする
ピッチ波形切り出し基準位置決定方法とその装置に関す
るものである。
【0002】
【従来の技術】従来、音声波形からピッチ波形を切り出
すには、特開平8−234794号公報に記載されているよう
に、有声区間毎に線形予測残差信号の最大値の位置を求
め、これを基準位置(以下、ピッチマークという)を求め
る開始位置とし、隣接するピッチマークを短区間変形自
己相関係数の最大位置により決定し、有声区間の全ての
ピッチ波形のピッチマークを順次求めるというものであ
った。
【0003】
【発明が解決しようとする課題】しかしながら、有声部
分の一部で線形予測残差信号の振幅が極めて小さくなる
場合や線形予測残差信号に顕著なピークがない場合とい
ったようなことがあると、ピッチマークが正しく決定で
きないという問題があった。
【0004】本発明は、前記従来技術の問題を解決する
ことに指向するものであり、線形予測残差信号からピッ
チマークを決定することができない区間においても、正
確なピッチマークを得ることができるピッチ波形切り出
し基準位置決定方法とその装置を提供することを目的と
する。
【0005】
【課題を解決するための手段】この目的を達成するため
に、本発明に係るピッチ波形切り出し基準位置決定方法
とその装置は、音声波形の有声/無声を判定する有声/
無声判定部と、音声波形から線形予測残差信号を求める
線形予測逆フィルタと、音声波形からピッチ基本波を求
めるピッチフィルタと、線形予測残差信号から基準位置
を決定できる区間であるのか、補間処理により基準位置
を決定する区間であるのかを分類する区間分類部と、区
間分類部で線形予測残差信号から基準位置を決定できる
と判断された区間に対して、線形予測残差信号から基準
位置を決定する基準位置決定部と、区間分類部で補間処
理により基準位置を決定すると判断された区間に対して
補間処理を行う補間部を備えたことを特徴とする。
【0006】また、補間部は、ピッチの波数を抽出する
ピッチ波数抽出部と、ピッチ基本波の零クロス位置を抽
出する零クロス位置抽出部と、ピッチの波数と零クロス
位置と線形予測残差信号より決定した基準位置とから、
補間処理により基準位置を決定すると判断された区間に
対して、基準位置を線形補間する基準位置線形補間部と
を備えるように構成したものである。
【0007】前記構成によれば、ピッチマークを決定で
きないと判断された区間では、ピッチ基本波の零クロス
位置と、ピッチの波数と、線形予測残差信号により決定
されたピッチマークとを用いて、区間のピッチマークを
補間処理し有声区間全体でピッチマークを決定し、その
ピッチマークを用いて、ピッチ波形を抽出し、再び重畳
して音声を合成すれば、高品質の合成音声を得ることが
できる。
【0008】また、線形予測残差信号からピッチマーク
を決定できる区間であるのかどうかの判断において、判
断する位置毎にピッチ周期程度の範囲で線形予測残差信
号の局部的な最大値を求め、比較的広い範囲で求めた線
形予測残差信号の広範囲の最大値と局部的な最大値の比
率を求め、この比率により判断することで、線形予測残
差信号の顕著なピークはあるがパワーが小さい場合を適
確に分類することができる。
【0009】また、線形予測残差信号からピッチマーク
を決定できる区間であるのかどうかの判断において、判
断する位置毎にその付近の音声波形の形状を調べ、音声
波形の零クロス位置の間隔がピッチ周期と略同一のと
き、線形予測残差信号からはピッチマークを決定できな
い区間と判断することで、線形予測残差信号では判断が
困難である区間を適切に分類することができる。
【0010】また、線形予測残差信号からピッチマーク
を決定できる区間であるのかどうかの判断において、線
形予測残差信号からピッチマークを決定できないと判断
される区間の長さに対して最短処理の区間長を設けて、
補間処理に必要な区間長に延長してから基準位置の補間
処理を行うことで、補間処理によりピッチマークを決定
区間が非常に短いときに起こるピッチマークの間隔の急
激な変化を抑えることができる。
【0011】また、ピッチマークを決定できないと判断
された区間では、その区間に最も近くにある決定された
ピッチマークと、その直前にあるピッチ基本波の零クロ
ス位置との間隔を求め、その区間内にある全ての零クロ
ス位置に対して、その零クロス位置から求めた間隔の直
後の位置にピッチマークを決定し、区間の一方の端で有
声区間が終了する場合でもピッチマークを決定すること
ができる。
【0012】
【発明の実施の形態】以下、図面を参照して本発明にお
ける実施の形態を詳細に説明する。図1は本発明の実施
の形態1におけるピッチ波形切り出しを行うピッチマー
ク決定方法の概念図を示したものである。図1におい
て、101は音声波形、102は線形予測残差信号、103はピ
ッチ基本波、1051,1053,1054は線形予測残差信号から
正確なピッチマークを決定できると判断された決定可区
間、1052は線形予測残差信号からでは正確なピッチマー
クを決定できないと判断された決定不可区間である。
【0013】まず、音声波形101から線形予測残差信号1
02を求め、これより、正確なピッチマークを決定できる
かどうかの判定を行う。この判定方法は、例えば、判別
する位置付近における線形予測残差信号の短区間平均パ
ワーが、ある閾値以上の場合は線形予測残差信号により
正確なピッチマークを決定できる区間であると判断し、
そうでない部分は線形予測残差信号からは正確なピッチ
マークを決定できない区間と判断する。
【0014】決定可区間1051,1053,1054は従来の方法
により正確なピッチマークを決定することができる。つ
まり、決定可区間1051の中で線形予測残差信号の最大値
の位置を求め、この位置をこの部分のピッチマークとす
ると共に、決定可区間1051のピッチマーク決定開始位置
とする。このピッチマーク決定開始位置を基準としてピ
ッチ周期だけ負の時刻の位置で短区間変形自己相関係数
の最大値の位置を求め、この位置をピッチマーク決定開
始位置より一つ前に隣接するピッチマークにする。そし
て、このピッチマーク決定開始位置より一つ前に隣接す
るピッチマークの位置を新たな基準して、さらに負の時
刻の方向に隣接するピッチマークを同様にして決定す
る。この作業を繰り返し、決定可区間1051内でピッチマ
ーク決定開始位置から負の時刻の方向にあるピッチマー
クを全て決定する。次に、決定可区間1051内でピッチマ
ーク決定開始位置から正の時刻の方向にある全てのピッ
チマークをピッチマーク決定開始位置より負の時刻の方
向のピッチマークを決定したのと同様の手順で決定す
る。決定可区間1053,1054についても決定可区間1051と
同様にしてピッチマークを決定する。
【0015】次に決定不可区間1052のピッチマークを決
定する。決定不可区間1052のように線形予測残差信号の
パワーが小さすぎたり、顕著なピークが現れない場合に
は線形予測残差信号からは正確なピッチマークを決定す
ることができない。このような区間はピッチ基本波を利
用してピッチマークの補間処理を行う。
【0016】図2はピッチ基本波を利用したピッチマー
クの補間方法の概念図を示したものである。図2におい
て、201は音声波形、202は線形予測残差信号、203はピ
ッチ基本波、2041,2042,2048,2049は線形予測残差信
号から決定したピッチマーク、2043〜2047は補間処理に
より決定されたピッチマーク、2051,2053は線形予測残
差信号から正確なピッチマークを決定できると判断した
決定可区間、2052は補間処理によりピッチマークの決定
を行う補間決定区間、2061〜2067はピッチ基本波203の
負から正へ変化する零クロス位置である。
【0017】まず、決定可区間2051の最後のピッチマー
ク2042とその位置の直前にあるピッチ基本波203の零ク
ロス位置2061までの時間間隔αを求める。同様に、決定
可区間2053の最初のピッチマーク2048とその位置の直前
にあるピッチ基本波203の零クロス位置2067までの時間
間隔βを求める。次に、補間決定区間2052のピッチ基本
波の波数を求める。波数を求めるにはピッチ基本波203
の負から正へ変化する零クロスを数えればよく、図2の
例に示す補間決定区間2052には5個の波数がある。そし
て、この補間決定区間2052の全ての負から正へ変化する
零クロス位置2062〜2066の各零クロス位置から(数1)に
示すf(n)だけ直後の位置を補間処理により求めたピッ
チマーク2043〜2047とする。
【0018】
【数1】f(n)=α+(β−α)n/(N+1) N:波数(この例では5個) n:補間によりピッチマークを決定する 区間の中でのピッチマークの順番 このように、本実施の形態1によれば、線形予測残差信
号から正確なピッチマークを決定できない区間でも、補
間処理により正確なピッチマークを決定することができ
る。したがって、このように決定したピッチマークを用
いて、ピッチ波形を抽出し、再び重畳して音声を合成す
れば、極めて高品質の合成音声を得ることができる。
【0019】図3は本発明の実施の形態2における線形
予測残差信号のピッチマークを決定する区間を分類する
方法の概念図を示したものである。図3において、301
は線形予測残差信号、302,303は線形予測残差信号から
正確なピッチマークを決定できるかどうかを判断しよう
としている決定判断位置である。
【0020】まず、単語や音節や有声区間といった比較
的広い範囲で線形予測残差信号の最大値を求め、これを
広い範囲の最大値として、図3に示す広範囲の最大値30
4とする。この広範囲の最大値304に0.3〜0.5程度の係数
γを掛けて、この値を閾値305とする。
【0021】次に、全ての決定判断位置について線形予
測残差信号から正確なピッチマークを決定できるかどう
かの判断を行う。ここでは、図3に示す決定判断位置30
2,303の2箇所の位置について具体的に説明する。ま
ず、決定判断位置302と決定判断位置303のそれぞれの位
置を中心としてピッチ基本波のピッチ周期より少し広い
範囲で線形予測残差信号301の局部的な最大値max1,ma
x2をそれぞれ求める。この局部的な最大値max1,max
2と先に求めた閾値305の大小を比較して、図3に示す
例では、局部的な最大値max1が閾値305より小さい場合
に線形予測残差信号からは正確なピッチマークを決定で
きない決定判断位置302であると判断し、局部的な最大
値max2が閾値305より大きい場合には線形予測残差信号
から正確なピッチマークを決定できる決定判断位置303
であると判断する。
【0022】単純に線形予測残差信号の短区間平均パワ
ーを判断基準にすると、線形予測残差信号に顕著なピー
クが十分に現れているがパワーが小さい場合において、
線形予測残差信号から正確なピッチマークを決定できな
い位置であると判断してしまうが、局部的な最大値を判
断基準にすれば、適切な判断をすることができる。
【0023】このように、局部的な最大値を基準にして
判断を行うことにより、適切に区間を分類することがで
きるので、それぞれのピッチマークを適切な方法でより
正確に決定することができる。
【0024】図4は本発明の実施の形態3における線形
予測残差信号のピッチマークを決定する区間を分類する
方法の概念図を示したものである。図4において、401
は音声波形、402,403,404は線形予測残差信号から正
確なピッチマークを決定できるかどうかを判断しようと
している決定判断位置、411,413,415は位置402,40
3,404の直前の零クロス位置、412,414,416は位置40
2,403,404の直後の零クロス位置である。
【0025】一般的に音声波形が正弦波のような波形の
場合、顕著なピークはあまり現れない。したがって、音
声波形が正弦波のような波形の場合には線形予測残差信
号からは正確なピッチマークを決定することが困難であ
る。またこのような場合には、線形予測残差信号から正
確なピッチマークを決定できるのかどうかを判断をする
のではなく、元の音声波形から判断をした方が容易、か
つ適切な判断をすることができる。そこで、音声波形が
正弦波のような波形である場合については、線形予測残
差信号からは正確なピッチマークを決定できない区間で
あると判断するようにする。
【0026】次に、その判断方法を図4に示す決定判断
位置402,403,404の場合を例にして具体的に説明す
る。まず、それぞれの決定判断位置の直前と直後にある
負から正へ変化する零クロス位置411〜416を求める。そ
れぞれの決定判断位置について、直前と直後にある零ク
ロス位置411〜416の各間隔421,422,423を求める。そ
して、この間隔がピッチ周期とほぼ同じであるものを正
弦波に似た波形であると判断する候補とする。つまり、
間隔422と間隔423がピッチ周期とほぼ同程度であるの
で、正弦波に似た波形であると判断する候補とする。
【0027】正弦波に似た波形であると判断する候補と
したそれぞれの決定判断位置について、直前と直後の零
クロス位置との間にある極大値と極小値の数を求める。
決定判断位置403の場合は極大値と極小値はぞれぞれ2
つずつあり、決定判断位置404の場合は極大値と極小値
がそれぞれ1つずつある。ここで、極大値と極小値が1
つずつあるもののみを、正弦波に似た波形であると判断
し、線形予測残差信号から正確なピッチマークを決定で
きない位置と判断する。つまり、決定判断位置404がそ
の位置になる。
【0028】このように、音声波形の形状から、線形予
測残差信号から正確なピッチマークを決定できるのかど
うかの判断を行えば、線形予測残差信号からでは判断し
にくい場合においても適切に区間を判断,分類すること
ができるので、それぞれ適切な方法でより正確なピッチ
マークを決定することができる。
【0029】図5(a),(b)は本発明の実施の形態4にお
ける線形予測残差信号のピッチマークを決定する区間を
分類する方法の概念を示し、図5(a)は補間処理により
ピッチマークを決定する区間が極端に短い場合のピッチ
マークの決定、図5(b)は補間処理によりピッチマーク
を決定する区間に最小値を設けた場合のピッチマークの
決定の様子を示した図である。図5(a),(b)において、
501,503は線形予測残差信号、502,504はピッチ基本波
である。また、図5(a),(b)の線形予測残差信号501,5
02およびピッチ基本波502,504はそれぞれ全く同じ波形
である。
【0030】図5(a)に示す場合のように、決定可区間5
051の最後のピッチマーク514とその直前の零クロス位置
の時間間隔αと、決定可区間5053の最初のピッチマーク
516とその直前の零クロス位置との時間間隔βとの差
が、ピッチ基本波502のピッチ周期の2割程度よりも大
きくなる場合で、補間処理によりピッチマークを決定す
る補間決定区間5052の間隔がピッチ周期の2〜3倍程度
と言うように極端に短いと、ピッチマークの間隔が急激
に変化してしまう。したがって、このようにして求めた
ピッチマークを基準にしてピッチ波形を切り出すと、ピ
ッチ波形の位相が急激に変化してしまうため、再び重畳
して音声を合成すると異音が混入してしまう。
【0031】そこで、図5(b)に示す場合のように、補
間処理によりピッチマークを決定する補間決定区間5055
の区間長に最小値を設けることにより、時間間隔αと時
間間隔βが大きく異なる場合でもピッチマークの間隔が
緩やかに変化するようにピッチマークを決定することが
できる。したがって、このようにして求めたピッチマー
クを基準にしてピッチ波形を切り出せば、再び重畳して
音声を合成しても、ピッチ波形の位相が緩やかに変化す
るので、異音の混入を抑えることができる。
【0032】図6は本発明の実施の形態5におけるピッ
チ波形切り出しを行うピッチマーク決定方法の概念図を
示したものである。図6において、601は音声波形、602
は線形予測残差信号、603はピッチ基本波である。この
実施の形態5に示す例は、有声区間の終了する部分が線
形予測残差信号からは正確なピッチマークを決定するこ
とができないと判断された場合を示している。
【0033】まず、線形予測残差信号から正確なピッチ
マークを決定できる決定可区間6051のピッチマークを前
記実施の形態1で説明した従来の方法により決定する。
そして、区間6051の最後のピッチマーク6042がその直前
にある零クロス位置6061からどれだけ遅れているかを求
め、この遅れを時間間隔αとする。次に、補間処理によ
りピッチマークを決定する区間6052の全ての零クロス位
置6062〜6067を求め、この零クロス位置より時間間隔α
だけ直後の位置をそれぞれ補間処理により決定したピッ
チマークにする。図6におけるピッチマーク6043〜6048
がこの補間処理により決定したピッチマークである。
【0034】このようにして、ピッチマークを決定すれ
ば、補間処理する区間の両端に線形予測残差信号から決
定したピッチマークがない場合でも補間処理により正確
なピッチマークを決定することができる。
【0035】なお、前記実施の形態5の説明では、有声
区間の最後の部分で補間処理を行う場合を説明したが、
有声区間の先頭で補間処理を行う場合にも同様の方法に
より正確なピッチマークを決定することができる。
【0036】次に、図7は本発明の実施の形態6におけ
るピッチ波形切り出しを行うピッチマーク決定装置の概
略構成を示すブロック図である。図7において、701は
有声/無声判定部(U/V判定部)、702は線形予測逆フ
ィルタ(LPC(linearpredictive coding)逆フィル
タ)、703はピッチフィルタ、704は線形予測残差信号か
らピッチマークを決定するピッチマーク決定部、705は
線予測残差信号からピッチマークを決定する区間である
のか補間処理によりピッチマークを決定する区間である
のか分類する区間分類部、706は補間処理を行う補間
部、707はピッチマークを出力するピッチマークの出力
部である。
【0037】まず、音声波形を有声/無声判定部701に
入力し、有声区間と判断した区間のみをピッチマークと
決定する対象とする。次に、有声区間の音声波形を線形
予測逆フィルタ702に入力し、線形予測残差信号を作成
する。この線形予測残差信号を区間分類部705に入力す
る。区間分類部705では、線形予測残差信号から正確な
ピッチマークを決定できる区間とできない区間の判別を
行う。例えば、区間分類部705は判別する位置付近にお
ける線形予測残差信号の短区間平均パワーが、ある閾値
以上の場合は線形予測残差信号より正確なピッチマーク
を決定できる区間であると判断し、そうでない部分は線
形予測残差信号からは正確なピッチマークを決定できな
い区間と判断する。そして、線形予測残差信号から正確
なピッチマークを決定できると判断した区間が有声区間
の中でどの部分であるかという区間位置情報をピッチマ
ーク決定部704に出力し、できないと判断した区間が有
声区間の中でどの部分であるのかという区間位置情報を
補間部706に出力する。
【0038】ピッチマーク決定部704では、区間分類部7
05から出力された区間位置情報をもとに、その区間のピ
ッチマークを従来の方法により決定する。一方、補間部
706では、区間分類部705から出力された区間位置情報を
もとに、その区間のピッチマークをピッチ基本波とピッ
チマーク決定部704で決定したピッチマークを利用して
線形補間する。ピッチマーク決定部704と補間部706で決
定したピッチマークを出力部707に入力し、それぞれの
ピッチマークを統合して全体のピッチマークを出力す
る。
【0039】このように、区間分類部705と補間部706を
設けることにより、従来では正確なピッチマークを決定
することができなかった部分についても正確なピッチマ
ークを決定することができる。
【0040】また、図8は本発明の実施の形態7におけ
るピッチ波形切り出しを行うピッチマーク決定装置の補
間部の概略構成を示すブロック図である。図8におい
て、801はピッチ波数抽出部、802は零クロス位置抽出
部、803はピッチマーク線形補間部である。
【0041】ピッチ波数抽出部801は、区間位置情報で
与えられる区間内のピッチの波数をピッチ基本波の負か
ら正へ変化する零クロス位置の数を数えることにより抽
出する。零クロス位置抽出部802は区間位置情報で与え
られる区間内のピッチ基本波が負から正へ変化する零ク
ロス位置を抽出する。ピッチマーク線形補間部803は線
形予測残差信号から求めたピッチマークと、ピッチ波数
抽出部801で求めたピッチの波数と、零クロス位置抽出
部802で求めた零クロス位置を用いてピッチマークを線
形補間することにより決定する。
【0042】このようにピッチ波数抽出部801と零クロ
ス位置抽出部802とピッチマーク線形補間部803で補間部
を構成すれば、非常に簡単な構成で正確、かつ安定した
ピッチマークを補間する装置を作ることができる。
【0043】
【発明の効果】以上説明したように、本発明によれば、
音声波形から線形予測残差信号を抽出し、これにより正
確なピッチマークを決定できる区間とできない区間の判
別を行い、正確なピッチマークを決定できると判断され
た区間のみで短区間変形自己相関係数の最大位置により
ピッチマークを決定し、それ以外の区間は音声波形をピ
ッチフィルタにより求めたピッチ基本波を元にその零ク
ロス位置と波数からピッチマークを決定するため、非常
に少ない演算量、かつ装置構成で正確なピッチマークを
決定することができ、決定したピッチマークを用いて、
ピッチ波形を抽出し、再び重畳して音声を合成すれば、
極めて高品質の合成音声を得ることができるという効果
を奏する。
【図面の簡単な説明】
【図1】本発明の実施の形態1におけるピッチ波形切り
出しを行うピッチマーク決定方法の概念図を示したもの
である。
【図2】本実施の形態1におけるピッチ基本波を利用し
たピッチマークの補間方法の概念図を示したものであ
る。
【図3】本発明の実施の形態2における線形予測残差信
号のピッチマークを決定する区間を分類する方法の概念
図を示したものである。
【図4】本発明の実施の形態3における線形予測残差信
号のピッチマークを決定する区間を分類する方法の概念
図を示したものである。
【図5】本発明の実施の形態4における線形予測残差信
号のピッチマークを決定する区間を分類する方法の概念
を示し、(a)は補間処理によりピッチマークを決定する
区間が極端に短い場合のピッチマークの決定、(b)は補
間処理によりピッチマークを決定する区間に最小値を設
けた場合のピッチマークの決定の様子を示した図であ
る。
【図6】本発明の実施の形態5におけるピッチ波形切り
出しを行うピッチマーク決定方法の概念図を示したもの
である。
【図7】本発明の実施の形態6におけるピッチ波形切り
出しを行うピッチマーク決定装置の概略構成を示すブロ
ック図である。
【図8】本発明の実施の形態7におけるピッチ波形切り
出しを行うピッチマーク決定装置の補間部の概略構成を
示すブロック図である。
【符号の説明】
101,201,401,601…音声波形、 102,202,301,50
1,503,602…線形予測残差信号、 103,203,502,50
4,603…ピッチ基本波、 302,303,402,403,404…
決定判断位置、 304…広範囲の最大値、 305…閾値、
411,413,415…直前の零クロス位置、 412,414,4
16…直後の零クロス位置、 421,422,423…間隔、
510〜529,2041〜2049,6041〜6048…ピッチマー
ク、 701…有声/無声判定部(U/V判定部)、 702…
線形予測逆フィルタ、 703…ピッチフィルタ、 704…
ピッチマーク決定部、 705…区間分類部、 706…補間
部、 707…出力部、 801…ピッチ波数抽出部、 802
…零クロス位置抽出部、 803…ピッチマーク線形補間
部、 1051,1053,1054,2051,2053,5051,5053,50
54,5056,6051…決定可区間、 1052,2052,…決定不
可区間、 2061〜2067,6061〜6067…零クロス位置。
フロントページの続き (56)参考文献 特開 平8−234794(JP,A) 特開 平9−179586(JP,A) 特開 平9−81188(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/06 G10L 11/04

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声波形から線形予測残差信号と、ピッ
    チフィルタを通したピッチ基本波を求め、前記線形予測
    残差信号からピッチ波形を切り出す基準位置を決定でき
    る区間であるかどうかを判断する工程により、基準位置
    を決定できないと判断された区間では、前記ピッチ基本
    波の零クロス位置と、前記ピッチ基本波より求めたピッ
    チの波数と、前記線形予測残差信号により基準位置が決
    定できると判断された区間で決定した基準位置とを用い
    て、この区間の基準位置を補間処理し有声区間全体で基
    準位置を決定することを特徴としたピッチ波形切り出し
    基準位置決定方法。
  2. 【請求項2】 線形予測残差信号から基準位置を決定で
    きる区間であるのかどうかを判断する工程において、判
    断する位置毎にピッチ基本波のピッチ周期程度の範囲で
    線形予測残差信号の局部的な最大値を求め、単語や音節
    や有声区間などの比較的広い範囲で求めた線形予測残差
    信号の広範囲の最大値に対して前記局部的な最大値がど
    のくらいの比率であるのかを求め、この比率を判断基準
    にして前記区間を判断することを特徴とする請求項1記
    載のピッチ波形切り出し基準位置決定方法。
  3. 【請求項3】 線形予測残差信号から基準位置を決定で
    きる区間であるのかどうかを判断する工程において、判
    断する位置毎にこの位置の音声波形の形状を調べ、前記
    音声波形の零クロス位置の間隔がピッチ周期と略同一
    場合には、線形予測残差信号からは基準位置を決定でき
    ない区間であると判断することを特徴とする請求項1記
    載のピッチ波形切り出し基準位置決定方法。
  4. 【請求項4】 線形予測残差信号から基準位置を決定で
    きる区間であるのかどうかを判断する工程において、線
    形予測残差信号から基準位置を決定できないと判断され
    る区間の長さに対して最短処理の区間長を設けて、補間
    処理に必要な区間長に延長してから基準位置の補間処理
    を行うことを特徴とする請求項1記載のピッチ波形切り
    出し基準位置決定方法。
  5. 【請求項5】 音声波形から線形予測残差信号と、ピッ
    チフィルタを通したピッチ基本波を求め、前記線形予測
    残差信号からピッチ波形を切り出す基準位置を決定でき
    る区間であるかどうかを判断する工程により、基準位置
    を決定できると判断された区間では、短区間変形自己相
    関係数の最大位置により基準位置を決定し、基準位置を
    決定できないと判断された区間では、この区間に最も近
    くにある前記短区間変形自己相関係数の最大位置により
    決定した基準位置と、この基準位置の直前にあるピッチ
    基本波の零クロス位置との間隔を求め、この区間内にあ
    る全ての零クロス位置に対して、この零クロス位置から
    前記間隔の直後の位置に基準位置を決定するようにした
    ことを特徴とするピッチ波形切り出し基準位置決定方
    法。
  6. 【請求項6】 音声波形の有声/無声を判定する有声/
    無声判定部と、音声波形から線形予測残差信号を求める
    線形予測逆フィルタと、音声波形からピッチ基本波を求
    めるピッチフィルタと、前記線形予測残差信号から基
    位置を決定できる区間であるのか、補間処理により基準
    位置を決定する区間であるのかを分類する区間分類部
    と、この区間分類部で線形予測残差信号から基準位置を
    決定できると判断された区間に対して、前記線形予測残
    差信号から基準位置を決定する基準位置決定部と、前記
    区間分類部で補間処理により基準位置を決定すると判断
    された区間に対して補間処理を行う補間部を備えたこと
    を特徴とするピッチ波形切り出し基準位置決定装置。
  7. 【請求項7】 前記補間部は、ピッチの波数を抽出する
    ピッチ波数抽出部と、ピッチ基本波の零クロス位置を抽
    出する零クロス位置抽出部と、前記ピッチの波数と前記
    零クロス位置と線形予測残差信号より決定した基準位置
    とから、補間処理により基準位置を決定すると判断され
    た区間に対して、基準位置を補間処理する基準位置線形
    補間部を備えたことを特徴とする請求項6記載のピッチ
    波形切り出し基準位置決定装置。
JP06335197A 1997-03-17 1997-03-17 ピッチ波形切り出し基準位置決定方法とその装置 Expired - Lifetime JP3308847B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06335197A JP3308847B2 (ja) 1997-03-17 1997-03-17 ピッチ波形切り出し基準位置決定方法とその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06335197A JP3308847B2 (ja) 1997-03-17 1997-03-17 ピッチ波形切り出し基準位置決定方法とその装置

Publications (2)

Publication Number Publication Date
JPH10260697A JPH10260697A (ja) 1998-09-29
JP3308847B2 true JP3308847B2 (ja) 2002-07-29

Family

ID=13226753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06335197A Expired - Lifetime JP3308847B2 (ja) 1997-03-17 1997-03-17 ピッチ波形切り出し基準位置決定方法とその装置

Country Status (1)

Country Link
JP (1) JP3308847B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3673507B2 (ja) 2002-05-16 2005-07-20 独立行政法人科学技術振興機構 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム

Also Published As

Publication number Publication date
JPH10260697A (ja) 1998-09-29

Similar Documents

Publication Publication Date Title
Yegnanarayana et al. Extraction of vocal-tract system characteristics from speech signals
EP0993674B1 (en) Pitch detection
US8370153B2 (en) Speech analyzer and speech analysis method
JPH06266390A (ja) 波形編集型音声合成装置
US8942977B2 (en) System and method for speech recognition using pitch-synchronous spectral parameters
US20100217584A1 (en) Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program
US8086449B2 (en) Vocal fry detecting apparatus
Rudresh et al. Epoch-synchronous overlap-add (ESOLA) for time-and pitch-scale modification of speech signals
JP3219868B2 (ja) 音声のピッチ周期抽出装置およびピッチ区間自動抽出装置
US6125344A (en) Pitch modification method by glottal closure interval extrapolation
JP3576800B2 (ja) 音声分析方法、及びプログラム記録媒体
JP3308847B2 (ja) ピッチ波形切り出し基準位置決定方法とその装置
JP3159930B2 (ja) 音声処理装置のピッチ抽出方法
Samad et al. Pitch detection of speech signals using the cross-correlation technique
JP3465941B2 (ja) ピッチ抽出装置
JP2001222289A (ja) 音響信号分析方法及び装置並びに音声信号処理方法及び装置
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
Ding et al. Determining polarity of speech signals based on gradient of spurious glottal waveforms
Shah et al. A novel filtering-based F 0 estimation algorithm with an application to voice conversion
JP2585214B2 (ja) ピッチ抽出方法
Ohtsuka et al. Aperiodicity control in ARX-based speech analysis-synthesis method
KR100211965B1 (ko) 유성음 구간에서 피치동기식 포먼트 추정방법
JPS5925237B2 (ja) 音声分析合成方式の音声区間判定方法
JP2654643B2 (ja) 音声分析方法
JPH0377998B2 (ja)

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090517

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100517

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110517

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110517

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120517

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120517

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130517

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130517

Year of fee payment: 11

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term