JPH10260697A - ピッチ波形切り出し基準位置決定方法とその装置 - Google Patents

ピッチ波形切り出し基準位置決定方法とその装置

Info

Publication number
JPH10260697A
JPH10260697A JP9063351A JP6335197A JPH10260697A JP H10260697 A JPH10260697 A JP H10260697A JP 9063351 A JP9063351 A JP 9063351A JP 6335197 A JP6335197 A JP 6335197A JP H10260697 A JPH10260697 A JP H10260697A
Authority
JP
Japan
Prior art keywords
determined
pitch
section
reference position
residual signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9063351A
Other languages
English (en)
Other versions
JP3308847B2 (ja
Inventor
Hirofumi Nishimura
洋文 西村
Toshimitsu Minowa
利光 蓑輪
Yasuhiko Arai
康彦 新居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP06335197A priority Critical patent/JP3308847B2/ja
Publication of JPH10260697A publication Critical patent/JPH10260697A/ja
Application granted granted Critical
Publication of JP3308847B2 publication Critical patent/JP3308847B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】 線形予測残差信号からピッチマークを決定す
ることができない区間においても、正確なピッチマーク
を決定する。 【解決手段】 決定可区間2051の最後のピッチマーク20
42とその位置の直前にあるピッチ基本波203の零クロス
位置2061までの時間間隔αを求める。決定可区間2053の
最初のピッチマーク2048とその位置の直前にあるピッチ
基本波203の零クロス位置2067までの時間間隔βを求め
る。補間決定区間2052のピッチ基本波の波数をピッチ基
本波203の負から正へ変化する零クロスを数えて求め
る。この補間決定区間2052の全ての負から正へ変化する
零クロス位置2062〜2066の各零クロス位置からf(n)だ
け直後の位置を補間処理により求めたピッチマーク2043
〜2047とする。線形予測残差信号からピッチマークを決
定できな区間でも、補間処理により正確なピッチマーク
を決定することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声を合成する音
声合成方法およびその装置において、特に窓関数により
ピッチ波形を切り出し、再び重畳して音声の合成をする
ピッチ波形切り出し基準位置決定方法とその装置に関す
るものである。
【0002】
【従来の技術】従来、音声波形からピッチ波形を切り出
すには、特開平8−234794号公報に記載されているよう
に、有声区間毎に線形予測残差信号の最大値の位置を求
め、これを基準位置(以下、ピッチマークという)を求め
る開始位置とし、隣接するピッチマークを短区間変形自
己相関係数の最大位置により決定し、有声区間の全ての
ピッチ波形のピッチマークを順次求めるというものであ
った。
【0003】
【発明が解決しようとする課題】しかしながら、有声部
分の一部で線形予測残差信号の振幅が極めて小さくなる
場合や線形予測残差信号に顕著なピークがない場合とい
ったようなことがあると、ピッチマークが正しく決定で
きないという問題があった。
【0004】本発明は、前記従来技術の問題を解決する
ことに指向するものであり、線形予測残差信号からピッ
チマークを決定することができない区間においても、正
確なピッチマークを得ることができるピッチ波形切り出
し基準位置決定方法とその装置を提供することを目的と
する。
【0005】
【課題を解決するための手段】この目的を達成するため
に、本発明に係るピッチ波形切り出し基準位置決定方法
とその装置は、音声波形の有声/無声を判定する有声/
無声判定部と、音声波形から線形予測残差信号を求める
線形予測逆フィルタと、音声波形からピッチ基本波を求
めるピッチフィルタと、線形予測残差信号から正確な基
準位置を決定できる区間であるのか、補間処理により基
準位置を決定する区間であるのかを分類する区間分類部
と、区間分類部で線形予測残差信号から正確な基準位置
を決定できると判断された区間に対して、線形予測残差
信号から基準位置を決定する基準位置決定部と、区間分
類部で補間処理により基準位置を決定すると判断された
区間に対して補間処理を行う補間部を備えたことを特徴
とする。
【0006】また、補間部は、ピッチの波数を抽出する
ピッチ波数抽出部と、ピッチ基本波の零クロス位置を抽
出する零クロス位置抽出部と、ピッチの波数と零クロス
位置と線形予測残差信号より決定した正確な基準位置と
から、補間処理により基準位置を決定すると判断された
区間に対して、基準位置を線形補間する基準位置線形補
間部とを備えるように構成したものである。
【0007】前記構成によれば、正確なピッチマークを
決定できないと判断された区間では、ピッチ基本波の零
クロス位置と、ピッチの波数と、線形予測残差信号によ
り決定されたピッチマークとを用いて、区間のピッチマ
ークを補間処理し有声区間全体で正確なピッチマークを
決定し、そのピッチマークを用いて、ピッチ波形を抽出
し、再び重畳して音声を合成すれば、高品質の合成音声
を得ることができる。
【0008】また、線形予測残差信号からピッチマーク
を決定できる区間であるのかどうかの判断において、判
断する位置毎にピッチ周期程度の範囲で線形予測残差信
号の局部的な最大値を求め、比較的広い範囲で求めた線
形予測残差信号の広範囲の最大値と局部的な最大値の比
率を求め、この比率により判断することで、線形予測残
差信号の顕著なピークはあるがパワーが小さい場合を適
確に分類することができる。
【0009】また、線形予測残差信号からピッチマーク
を決定できる区間であるのかどうかの判断において、判
断する位置毎にその付近の音声波形の形状を調べ、音声
波形が線形予測残差信号にピークの現れにくい正弦波の
ような形状のとき、線形予測残差信号からは正確なピッ
チマークを決定できない区間と判断することで、線形予
測残差信号では判断が困難である区間を適切に分類する
ことができる。
【0010】また、線形予測残差信号からピッチマーク
を決定できる区間であるのかどうかの判断において、線
形予測残差信号からピッチマークを決定できないと判断
される区間の長さに対して最短処理の区間長を設けて、
補間処理に必要な区間長に延長してから基準位置の補間
処理を行うことで、補間処理によりピッチマークを決定
区間が非常に短いときに起こるピッチマークの間隔の急
激な変化を抑えることができる。
【0011】また、正確なピッチマークを決定できない
と判断された区間では、その区間に最も近くにある決定
されたピッチマークと、その直前にあるピッチ基本波の
零クロス位置との間隔を求め、その区間内にある全ての
零クロス位置に対して、その零クロス位置から求めた間
隔の直後の位置にピッチマークを決定し、区間の一方の
端で有声区間が終了する場合でも正確なピッチマークを
決定することができる。
【0012】
【発明の実施の形態】以下、図面を参照して本発明にお
ける実施の形態を詳細に説明する。図1は本発明の実施
の形態1におけるピッチ波形切り出しを行うピッチマー
ク決定方法の概念図を示したものである。図1におい
て、101は音声波形、102は線形予測残差信号、103はピ
ッチ基本波、1051,1053,1054は線形予測残差信号から
正確なピッチマークを決定できると判断された決定可区
間、1052は線形予測残差信号からでは正確なピッチマー
クを決定できないと判断された決定不可区間である。
【0013】まず、音声波形101から線形予測残差信号1
02を求め、これより、正確なピッチマークを決定できる
かどうかの判定を行う。この判定方法は、例えば、判別
する位置付近における線形予測残差信号の短区間平均パ
ワーが、ある閾値以上の場合は線形予測残差信号により
正確なピッチマークを決定できる区間であると判断し、
そうでない部分は線形予測残差信号からは正確なピッチ
マークを決定できない区間と判断する。
【0014】決定可区間1051,1053,1054は従来の方法
により正確なピッチマークを決定することができる。つ
まり、決定可区間1051の中で線形予測残差信号の最大値
の位置を求め、この位置をこの部分のピッチマークとす
ると共に、決定可区間1051のピッチマーク決定開始位置
とする。このピッチマーク決定開始位置を基準としてピ
ッチ周期だけ負の時刻の位置で短区間変形自己相関係数
の最大値の位置を求め、この位置をピッチマーク決定開
始位置より一つ前に隣接するピッチマークにする。そし
て、このピッチマーク決定開始位置より一つ前に隣接す
るピッチマークの位置を新たな基準して、さらに負の時
刻の方向に隣接するピッチマークを同様にして決定す
る。この作業を繰り返し、決定可区間1051内でピッチマ
ーク決定開始位置から負の時刻の方向にあるピッチマー
クを全て決定する。次に、決定可区間1051内でピッチマ
ーク決定開始位置から正の時刻の方向にある全てのピッ
チマークをピッチマーク決定開始位置より負の時刻の方
向のピッチマークを決定したのと同様の手順で決定す
る。決定可区間1053,1054についても決定可区間1051と
同様にしてピッチマークを決定する。
【0015】次に決定不可区間1052のピッチマークを決
定する。決定不可区間1052のように線形予測残差信号の
パワーが小さすぎたり、顕著なピークが現れない場合に
は線形予測残差信号からは正確なピッチマークを決定す
ることができない。このような区間はピッチ基本波を利
用してピッチマークの補間処理を行う。
【0016】図2はピッチ基本波を利用したピッチマー
クの補間方法の概念図を示したものである。図2におい
て、201は音声波形、202は線形予測残差信号、203はピ
ッチ基本波、2041,2042,2048,2049は線形予測残差信
号から決定したピッチマーク、2043〜2047は補間処理に
より決定されたピッチマーク、2051,2053は線形予測残
差信号から正確なピッチマークを決定できると判断した
決定可区間、2052は補間処理によりピッチマークの決定
を行う補間決定区間、2061〜2067はピッチ基本波203の
負から正へ変化する零クロス位置である。
【0017】まず、決定可区間2051の最後のピッチマー
ク2042とその位置の直前にあるピッチ基本波203の零ク
ロス位置2061までの時間間隔αを求める。同様に、決定
可区間2053の最初のピッチマーク2048とその位置の直前
にあるピッチ基本波203の零クロス位置2067までの時間
間隔βを求める。次に、補間決定区間2052のピッチ基本
波の波数を求める。波数を求めるにはピッチ基本波203
の負から正へ変化する零クロスを数えればよく、図2の
例に示す補間決定区間2052には5個の波数がある。そし
て、この補間決定区間2052の全ての負から正へ変化する
零クロス位置2062〜2066の各零クロス位置から(数1)に
示すf(n)だけ直後の位置を補間処理により求めたピッ
チマーク2043〜2047とする。
【0018】
【数1】f(n)=α+(β−α)n/(N+1) N:波数(この例では5個) n:補間によりピッチマークを決定する 区間の中でのピッチマークの順番 このように、本実施の形態1によれば、線形予測残差信
号から正確なピッチマークを決定できない区間でも、補
間処理により正確なピッチマークを決定することができ
る。したがって、このように決定したピッチマークを用
いて、ピッチ波形を抽出し、再び重畳して音声を合成す
れば、極めて高品質の合成音声を得ることができる。
【0019】図3は本発明の実施の形態2における線形
予測残差信号のピッチマークを決定する区間を分類する
方法の概念図を示したものである。図3において、301
は線形予測残差信号、302,303は線形予測残差信号から
正確なピッチマークを決定できるかどうかを判断しよう
としている決定判断位置である。
【0020】まず、単語や音節や有声区間といった比較
的広い範囲で線形予測残差信号の最大値を求め、これを
広い範囲の最大値として、図3に示す広範囲の最大値30
4とする。この広範囲の最大値304に0.3〜0.5程度の係数
γを掛けて、この値を閾値305とする。
【0021】次に、全ての決定判断位置について線形予
測残差信号から正確なピッチマークを決定できるかどう
かの判断を行う。ここでは、図3に示す決定判断位置30
2,303の2箇所の位置について具体的に説明する。ま
ず、決定判断位置302と決定判断位置303のそれぞれの位
置を中心としてピッチ基本波のピッチ周期より少し広い
範囲で線形予測残差信号301の局部的な最大値max1,ma
x2をそれぞれ求める。この局部的な最大値max1,max
2と先に求めた閾値305の大小を比較して、図3に示す
例では、局部的な最大値max1が閾値305より小さい場合
に線形予測残差信号からは正確なピッチマークを決定で
きない決定判断位置302であると判断し、局部的な最大
値max2が閾値305より大きい場合には線形予測残差信号
から正確なピッチマークを決定できる決定判断位置303
であると判断する。
【0022】単純に線形予測残差信号の短区間平均パワ
ーを判断基準にすると、線形予測残差信号に顕著なピー
クが十分に現れているがパワーが小さい場合において、
線形予測残差信号から正確なピッチマークを決定できな
い位置であると判断してしまうが、局部的な最大値を判
断基準にすれば、適切な判断をすることができる。
【0023】このように、局部的な最大値を基準にして
判断を行うことにより、適切に区間を分類することがで
きるので、それぞれのピッチマークを適切な方法でより
正確に決定することができる。
【0024】図4は本発明の実施の形態3における線形
予測残差信号のピッチマークを決定する区間を分類する
方法の概念図を示したものである。図4において、401
は音声波形、402,403,404は線形予測残差信号から正
確なピッチマークを決定できるかどうかを判断しようと
している決定判断位置、411,413,415は位置402,40
3,404の直前の零クロス位置、412,414,416は位置40
2,403,404の直後の零クロス位置である。
【0025】一般的に音声波形が正弦波のような波形の
場合、顕著なピークはあまり現れない。したがって、音
声波形が正弦波のような波形の場合には線形予測残差信
号からは正確なピッチマークを決定することが困難であ
る。またこのような場合には、線形予測残差信号から正
確なピッチマークを決定できるのかどうかを判断をする
のではなく、元の音声波形から判断をした方が容易、か
つ適切な判断をすることができる。そこで、音声波形が
正弦波のような波形である場合については、線形予測残
差信号からは正確なピッチマークを決定できない区間で
あると判断するようにする。
【0026】次に、その判断方法を図4に示す決定判断
位置402,403,404の場合を例にして具体的に説明す
る。まず、それぞれの決定判断位置の直前と直後にある
負から正へ変化する零クロス位置411〜416を求める。そ
れぞれの決定判断位置について、直前と直後にある零ク
ロス位置411〜416の各間隔421,422,423を求める。そ
して、この間隔がピッチ周期とほぼ同じであるものを正
弦波に似た波形であると判断する候補とする。つまり、
間隔422と間隔423がピッチ周期とほぼ同程度であるの
で、正弦波に似た波形であると判断する候補とする。
【0027】正弦波に似た波形であると判断する候補と
したそれぞれの決定判断位置について、直前と直後の零
クロス位置との間にある極大値と極小値の数を求める。
決定判断位置403の場合は極大値と極小値はぞれぞれ2
つずつあり、決定判断位置404の場合は極大値と極小値
がそれぞれ1つずつある。ここで、極大値と極小値が1
つずつあるもののみを、正弦波に似た波形であると判断
し、線形予測残差信号から正確なピッチマークを決定で
きない位置と判断する。つまり、決定判断位置404がそ
の位置になる。
【0028】このように、音声波形の形状から、線形予
測残差信号から正確なピッチマークを決定できるのかど
うかの判断を行えば、線形予測残差信号からでは判断し
にくい場合においても適切に区間を判断,分類すること
ができるので、それぞれ適切な方法でより正確なピッチ
マークを決定することができる。
【0029】図5(a),(b)は本発明の実施の形態4にお
ける線形予測残差信号のピッチマークを決定する区間を
分類する方法の概念を示し、図5(a)は補間処理により
ピッチマークを決定する区間が極端に短い場合のピッチ
マークの決定、図5(b)は補間処理によりピッチマーク
を決定する区間に最小値を設けた場合のピッチマークの
決定の様子を示した図である。図5(a),(b)において、
501,503は線形予測残差信号、502,504はピッチ基本波
である。また、図5(a),(b)の線形予測残差信号501,5
02およびピッチ基本波502,504はそれぞれ全く同じ波形
である。
【0030】図5(a)に示す場合のように、決定可区間5
051の最後のピッチマーク514とその直前の零クロス位置
の時間間隔αと、決定可区間5053の最初のピッチマーク
516とその直前の零クロス位置との時間間隔βとの差
が、ピッチ基本波502のピッチ周期の2割程度よりも大
きくなる場合で、補間処理によりピッチマークを決定す
る補間決定区間5052の間隔がピッチ周期の2〜3倍程度
と言うように極端に短いと、ピッチマークの間隔が急激
に変化してしまう。したがって、このようにして求めた
ピッチマークを基準にしてピッチ波形を切り出すと、ピ
ッチ波形の位相が急激に変化してしまうため、再び重畳
して音声を合成すると異音が混入してしまう。
【0031】そこで、図5(b)に示す場合のように、補
間処理によりピッチマークを決定する補間決定区間5055
の区間長に最小値を設けることにより、時間間隔αと時
間間隔βが大きく異なる場合でもピッチマークの間隔が
緩やかに変化するようにピッチマークを決定することが
できる。したがって、このようにして求めたピッチマー
クを基準にしてピッチ波形を切り出せば、再び重畳して
音声を合成しても、ピッチ波形の位相が緩やかに変化す
るので、異音の混入を抑えることができる。
【0032】図6は本発明の実施の形態5におけるピッ
チ波形切り出しを行うピッチマーク決定方法の概念図を
示したものである。図6において、601は音声波形、602
は線形予測残差信号、603はピッチ基本波である。この
実施の形態5に示す例は、有声区間の終了する部分が線
形予測残差信号からは正確なピッチマークを決定するこ
とができないと判断された場合を示している。
【0033】まず、線形予測残差信号から正確なピッチ
マークを決定できる決定可区間6051のピッチマークを前
記実施の形態1で説明した従来の方法により決定する。
そして、区間6051の最後のピッチマーク6042がその直前
にある零クロス位置6061からどれだけ遅れているかを求
め、この遅れを時間間隔αとする。次に、補間処理によ
りピッチマークを決定する区間6052の全ての零クロス位
置6062〜6067を求め、この零クロス位置より時間間隔α
だけ直後の位置をそれぞれ補間処理により決定したピッ
チマークにする。図6におけるピッチマーク6043〜6048
がこの補間処理により決定したピッチマークである。
【0034】このようにして、ピッチマークを決定すれ
ば、補間処理する区間の両端に線形予測残差信号から決
定したピッチマークがない場合でも補間処理により正確
なピッチマークを決定することができる。
【0035】なお、前記実施の形態5の説明では、有声
区間の最後の部分で補間処理を行う場合を説明したが、
有声区間の先頭で補間処理を行う場合にも同様の方法に
より正確なピッチマークを決定することができる。
【0036】次に、図7は本発明の実施の形態6におけ
るピッチ波形切り出しを行うピッチマーク決定装置の概
略構成を示すブロック図である。図7において、701は
有声/無声判定部(U/V判定部)、702は線形予測逆フ
ィルタ(LPC(linearpredictive coding)逆フィル
タ)、703はピッチフィルタ、704は線形予測残差信号か
らピッチマークを決定するピッチマーク決定部、705は
線予測残差信号からピッチマークを決定する区間である
のか補間処理によりピッチマークを決定する区間である
のか分類する区間分類部、706は補間処理を行う補間
部、707はピッチマークを出力するピッチマークの出力
部である。
【0037】まず、音声波形を有声/無声判定部701に
入力し、有声区間と判断した区間のみをピッチマークと
決定する対象とする。次に、有声区間の音声波形を線形
予測逆フィルタ702に入力し、線形予測残差信号を作成
する。この線形予測残差信号を区間分類部705に入力す
る。区間分類部705では、線形予測残差信号から正確な
ピッチマークを決定できる区間とできない区間の判別を
行う。例えば、区間分類部705は判別する位置付近にお
ける線形予測残差信号の短区間平均パワーが、ある閾値
以上の場合は線形予測残差信号より正確なピッチマーク
を決定できる区間であると判断し、そうでない部分は線
形予測残差信号からは正確なピッチマークを決定できな
い区間と判断する。そして、線形予測残差信号から正確
なピッチマークを決定できると判断した区間が有声区間
の中でどの部分であるかという区間位置情報をピッチマ
ーク決定部704に出力し、できないと判断した区間が有
声区間の中でどの部分であるのかという区間位置情報を
補間部706に出力する。
【0038】ピッチマーク決定部704では、区間分類部7
05から出力された区間位置情報をもとに、その区間のピ
ッチマークを従来の方法により決定する。一方、補間部
706では、区間分類部705から出力された区間位置情報を
もとに、その区間のピッチマークをピッチ基本波とピッ
チマーク決定部704で決定したピッチマークを利用して
線形補間する。ピッチマーク決定部704と補間部706で決
定したピッチマークを出力部707に入力し、それぞれの
ピッチマークを統合して全体のピッチマークを出力す
る。
【0039】このように、区間分類部705と補間部706を
設けることにより、従来では正確なピッチマークを決定
することができなかった部分についても正確なピッチマ
ークを決定することができる。
【0040】また、図8は本発明の実施の形態7におけ
るピッチ波形切り出しを行うピッチマーク決定装置の補
間部の概略構成を示すブロック図である。図8におい
て、801はピッチ波数抽出部、802は零クロス位置抽出
部、803はピッチマーク線形補間部である。
【0041】ピッチ波数抽出部801は、区間位置情報で
与えられる区間内のピッチの波数をピッチ基本波の負か
ら正へ変化する零クロス位置の数を数えることにより抽
出する。零クロス位置抽出部802は区間位置情報で与え
られる区間内のピッチ基本波が負から正へ変化する零ク
ロス位置を抽出する。ピッチマーク線形補間部803は線
形予測残差信号から求めたピッチマークと、ピッチ波数
抽出部801で求めたピッチの波数と、零クロス位置抽出
部802で求めた零クロス位置を用いてピッチマークを線
形補間することにより決定する。
【0042】このようにピッチ波数抽出部801と零クロ
ス位置抽出部802とピッチマーク線形補間部803で補間部
を構成すれば、非常に簡単な構成で正確、かつ安定した
ピッチマークを補間する装置を作ることができる。
【0043】
【発明の効果】以上説明したように、本発明によれば、
音声波形から線形予測残差信号を抽出し、これにより正
確なピッチマークを決定できる区間とできない区間の判
別を行い、正確なピッチマークを決定できると判断され
た区間のみで短区間変形自己相関係数の最大位置により
ピッチマークを決定し、それ以外の区間は音声波形をピ
ッチフィルタにより求めたピッチ基本波を元にその零ク
ロス位置と波数からピッチマークを決定するため、非常
に少ない演算量、かつ装置構成で正確なピッチマークを
決定することができ、決定したピッチマークを用いて、
ピッチ波形を抽出し、再び重畳して音声を合成すれば、
極めて高品質の合成音声を得ることができるという効果
を奏する。
【図面の簡単な説明】
【図1】本発明の実施の形態1におけるピッチ波形切り
出しを行うピッチマーク決定方法の概念図を示したもの
である。
【図2】本実施の形態1におけるピッチ基本波を利用し
たピッチマークの補間方法の概念図を示したものであ
る。
【図3】本発明の実施の形態2における線形予測残差信
号のピッチマークを決定する区間を分類する方法の概念
図を示したものである。
【図4】本発明の実施の形態3における線形予測残差信
号のピッチマークを決定する区間を分類する方法の概念
図を示したものである。
【図5】本発明の実施の形態4における線形予測残差信
号のピッチマークを決定する区間を分類する方法の概念
を示し、(a)は補間処理によりピッチマークを決定する
区間が極端に短い場合のピッチマークの決定、(b)は補
間処理によりピッチマークを決定する区間に最小値を設
けた場合のピッチマークの決定の様子を示した図であ
る。
【図6】本発明の実施の形態5におけるピッチ波形切り
出しを行うピッチマーク決定方法の概念図を示したもの
である。
【図7】本発明の実施の形態6におけるピッチ波形切り
出しを行うピッチマーク決定装置の概略構成を示すブロ
ック図である。
【図8】本発明の実施の形態7におけるピッチ波形切り
出しを行うピッチマーク決定装置の補間部の概略構成を
示すブロック図である。
【符号の説明】
101,201,401,601…音声波形、 102,202,301,50
1,503,602…線形予測残差信号、 103,203,502,50
4,603…ピッチ基本波、 302,303,402,403,404…
決定判断位置、 304…広範囲の最大値、 305…閾値、
411,413,415…直前の零クロス位置、 412,414,4
16…直後の零クロス位置、 421,422,423…間隔、
510〜529,2041〜2049,6041〜6048…ピッチマー
ク、 701…有声/無声判定部(U/V判定部)、 702…
線形予測逆フィルタ、 703…ピッチフィルタ、 704…
ピッチマーク決定部、 705…区間分類部、 706…補間
部、 707…出力部、 801…ピッチ波数抽出部、 802
…零クロス位置抽出部、 803…ピッチマーク線形補間
部、 1051,1053,1054,2051,2053,5051,5053,50
54,5056,6051…決定可区間、 1052,2052,…決定不
可区間、 2061〜2067,6061〜6067…零クロス位置。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声波形から線形予測残差信号と、ピッ
    チフィルタを通したピッチ基本波を求め、前記線形予測
    残差信号からピッチ波形を切り出す正確な基準位置を決
    定できる区間であるかどうかを判断する工程により、 正確な基準位置を決定できないと判断された区間では、
    前記ピッチ基本波の零クロス位置と、前記ピッチ基本波
    より求めたピッチの波数と、前記線形予測残差信号によ
    り正確な基準位置が決定できると判断された区間で決定
    した基準位置とを用いて、当該区間の基準位置を補間処
    理し有声区間全体で正確な基準位置を決定することを特
    徴としたピッチ波形切り出し基準位置決定方法。
  2. 【請求項2】 線形予測残差信号から正確な基準位置を
    決定できる区間であるのかどうかを判断する工程におい
    て、判断する位置毎にピッチ基本波のピッチ周期程度の
    範囲で線形予測残差信号の局部的な最大値を求め、単語
    や音節や有声区間などの比較的広い範囲で求めた線形予
    測残差信号の広範囲の最大値に対して前記局部的な最大
    値がどのくらいの比率であるのかを求め、該比率を判断
    基準にして前記区間を判断することを特徴とする請求項
    1記載のピッチ波形切り出し基準位置決定方法。
  3. 【請求項3】 線形予測残差信号から正確な基準位置を
    決定できる区間であるのかどうかを判断する工程におい
    て、判断する位置毎に該位置の音声波形の形状を調べ、
    前記音声波形が線形予測残差信号にピークの現れにくい
    正弦波のような形状の場合には、線形予測残差信号から
    は正確な基準位置を決定できない区間であると判断する
    ことを特徴とする請求項1記載のピッチ波形切り出し基
    準位置決定方法。
  4. 【請求項4】 線形予測残差信号から正確な基準位置を
    決定できる区間であるのかどうかを判断する工程におい
    て、線形予測残差信号から正確な基準位置を決定できな
    いと判断される区間の長さに対して最短処理の区間長を
    設けて、補間処理に必要な区間長に延長してから基準位
    置の補間処理を行うことを特徴とする請求項1記載のピ
    ッチ波形切り出し基準位置決定方法。
  5. 【請求項5】 音声波形から線形予測残差信号と、ピッ
    チフィルタを通したピッチ基本波を求め、前記線形予測
    残差信号からピッチ波形を切り出す正確な基準位置を決
    定できる区間であるかどうかを判断する工程により、 正確な基準位置を決定できると判断された区間では、短
    区間変形自己相関係数の最大位置により基準位置を決定
    し、正確な基準位置を決定できないと判断された区間で
    は、該区間に最も近くにある前記短区間変形自己相関係
    数の最大位置により決定した基準位置と、該基準位置の
    直前にあるピッチ基本波の零クロス位置との間隔を求
    め、当該区間内にある全ての零クロス位置に対して、該
    零クロス位置から前記間隔の直後の位置に基準位置を決
    定するようにしたことを特徴とするピッチ波形切り出し
    基準位置決定方法。
  6. 【請求項6】 音声波形の有声/無声を判定する有声/
    無声判定部と、音声波形から線形予測残差信号を求める
    線形予測逆フィルタと、音声波形からピッチ基本波を求
    めるピッチフィルタと、前記線形予測残差信号から正確
    な基準位置を決定できる区間であるのか、補間処理によ
    り基準位置を決定する区間であるのかを分類する区間分
    類部と、該区間分類部で線形予測残差信号から正確な基
    準位置を決定できると判断された区間に対して、前記線
    形予測残差信号から基準位置を決定する基準位置決定部
    と、前記区間分類部で補間処理により基準位置を決定す
    ると判断された区間に対して補間処理を行う補間部を備
    えたことを特徴とするピッチ波形切り出し基準位置決定
    装置。
  7. 【請求項7】 前記補間部は、ピッチの波数を抽出する
    ピッチ波数抽出部と、ピッチ基本波の零クロス位置を抽
    出する零クロス位置抽出部と、前記ピッチの波数と前記
    零クロス位置と線形予測残差信号より決定した正確な基
    準位置とから、補間処理により基準位置を決定すると判
    断された区間に対して、基準位置を補間処理する基準位
    置線形補間部を備えたことを特徴とする請求項6記載の
    ピッチ波形切り出し基準位置決定装置。
JP06335197A 1997-03-17 1997-03-17 ピッチ波形切り出し基準位置決定方法とその装置 Expired - Lifetime JP3308847B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06335197A JP3308847B2 (ja) 1997-03-17 1997-03-17 ピッチ波形切り出し基準位置決定方法とその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06335197A JP3308847B2 (ja) 1997-03-17 1997-03-17 ピッチ波形切り出し基準位置決定方法とその装置

Publications (2)

Publication Number Publication Date
JPH10260697A true JPH10260697A (ja) 1998-09-29
JP3308847B2 JP3308847B2 (ja) 2002-07-29

Family

ID=13226753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06335197A Expired - Lifetime JP3308847B2 (ja) 1997-03-17 1997-03-17 ピッチ波形切り出し基準位置決定方法とその装置

Country Status (1)

Country Link
JP (1) JP3308847B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003098597A1 (fr) * 2002-05-16 2003-11-27 Japan Science And Technology Agency Dispositif d'extraction de noyau syllabique et progiciel associe

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003098597A1 (fr) * 2002-05-16 2003-11-27 Japan Science And Technology Agency Dispositif d'extraction de noyau syllabique et progiciel associe
US7627468B2 (en) 2002-05-16 2009-12-01 Japan Science And Technology Agency Apparatus and method for extracting syllabic nuclei

Also Published As

Publication number Publication date
JP3308847B2 (ja) 2002-07-29

Similar Documents

Publication Publication Date Title
Yegnanarayana et al. Extraction of vocal-tract system characteristics from speech signals
EP0993674B1 (en) Pitch detection
US6349277B1 (en) Method and system for analyzing voices
US6453283B1 (en) Speech coding based on determining a noise contribution from a phase change
JPH06266390A (ja) 波形編集型音声合成装置
US8942977B2 (en) System and method for speech recognition using pitch-synchronous spectral parameters
Prasanna et al. Fast prosody modification using instants of significant excitation
Rudresh et al. Epoch-synchronous overlap-add (ESOLA) for time-and pitch-scale modification of speech signals
JPS6051720B2 (ja) 音声の基本周期抽出装置
US6125344A (en) Pitch modification method by glottal closure interval extrapolation
JP3576800B2 (ja) 音声分析方法、及びプログラム記録媒体
JPH06161494A (ja) 音声のピッチ区間自動抽出方法
Kadiri et al. Speech polarity detection using strength of impulse-like excitation extracted from speech epochs
KR100217372B1 (ko) 음성처리장치의 피치 추출방법
JP3308847B2 (ja) ピッチ波形切り出し基準位置決定方法とその装置
JP2007249009A (ja) 音響信号分析方法および音響信号合成方法
JP2001222289A (ja) 音響信号分析方法及び装置並びに音声信号処理方法及び装置
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
Park et al. Pitch detection based on signal-to-noise-ratio estimation and compensation for continuous speech signal
Shah et al. A novel filtering-based F 0 estimation algorithm with an application to voice conversion
Ohtsuka et al. Aperiodicity control in ARX-based speech analysis-synthesis method
Sasou et al. Glottal excitation modeling using HMM with application to robust analysis of speech signal.
JP2585214B2 (ja) ピッチ抽出方法
KR100211965B1 (ko) 유성음 구간에서 피치동기식 포먼트 추정방법
JPS5925237B2 (ja) 音声分析合成方式の音声区間判定方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090517

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100517

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110517

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110517

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120517

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120517

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130517

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130517

Year of fee payment: 11

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term