JP5705086B2 - 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム - Google Patents

声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム Download PDF

Info

Publication number
JP5705086B2
JP5705086B2 JP2011227187A JP2011227187A JP5705086B2 JP 5705086 B2 JP5705086 B2 JP 5705086B2 JP 2011227187 A JP2011227187 A JP 2011227187A JP 2011227187 A JP2011227187 A JP 2011227187A JP 5705086 B2 JP5705086 B2 JP 5705086B2
Authority
JP
Japan
Prior art keywords
lpc
glottal
signal
interval
phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011227187A
Other languages
English (en)
Other versions
JP2013088522A (ja
Inventor
定男 廣谷
定男 廣谷
岳美 持田
岳美 持田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011227187A priority Critical patent/JP5705086B2/ja
Publication of JP2013088522A publication Critical patent/JP2013088522A/ja
Application granted granted Critical
Publication of JP5705086B2 publication Critical patent/JP5705086B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Description

この発明は音声信号から声道スペクトルを抽出する声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラムに関する。
人間の音声生成メカニズムに基づき、音声信号を気管や肺などの声門下インピーダンスの特性を含む音源信号と声門から口唇までの声道スペクトルに精度良く分離することは、音声を用いたアプリケーションのための基盤技術となる。図1はこのような人間の音声生成過程を模式的に示したものである。
声門下インピーダンスは気管や気管支の長さに依存しているため、個人によって異なる。そこで、非特許文献1では声門下インピーダンスの情報を用いた音声信号に含まれる個人性の除去法を提案している。音声信号から声門下インピーダンスの影響を取り除いた声道スペクトルの抽出ができれば、音声信号と得られた声道スペクトルから個人の声門下インピーダンスの抽出が可能となり、音声信号に含まれる個人性の分析などの応用に利用することができると期待される。
音源信号と声道スペクトルの分離には、線形予測(LPC)分析が広く用いられているが、有声音においては音源信号の基本周波数や声門下インピーダンスの影響を受け、音声信号からの声道スペクトルの推定精度が不十分であるという問題があった。
そこで、LPC分析における音源信号の影響を回避するために、複数声門閉鎖区間線形予測法が提案されている(例えば、非特許文献2参照)。これは、有声音の音源である声帯振動は声帯の開閉運動であり、声帯が閉じているときの音声信号は声門から口唇のみの特性、つまり声道スペクトルを示す一方で、声帯が開くと肺や気管が接続されるという事実を利用したものである。
この事実を利用して、声帯が閉じているときの音声信号のみを用いて線形予測法を行えば、声門下インピーダンスに影響されない声道スペクトルの推定を行うことができると期待される。
Shizhen Wang, Abeer Alwan, Steven M.Lulich,"SPEAKER NORMALIZATION BASED ON SUBGLOTTAL RESONANCES", Proc.ICASSP, pp.4277-4280, 2008 陸金林、村上秀紀、粕谷英樹,"複数閉鎖区間を用いた声道伝達関数の推定",電子情報通信学会論文誌,Vol.J73-A,No.5,pp.1011-1014,1990
しかしながら、人間が発声した音声信号は、声帯と声道のカップリングにより複雑な位相特性を示すため、声帯が閉じているときの音声信号であっても声門下インピーダンスの影響が含まれてしまっている。そのため、例え正確な声門閉鎖区間を抽出することができ、その声門が閉じているときの音声信号のみを用いた線形予測法であっても正確な声道スペクトルを得ることは難しい。
この発明の目的はこのような状況に鑑み、音声信号から声門下インピーダンスの影響を受けない正確な声道スペクトルを抽出することができるようにした声道スペクトル抽出装置及び声道スペクトル抽出方法を提供することにある。
請求項1の発明によれば、声道スペクトル抽出装置は、入力された音声信号の音声区間を検出する音声区間検出部と、前記音声区間に対して前記音声信号から基本周波数を推定する基本周波数分析部と、前記基本周波数に基づき決定した窓長で前記音声信号を切り出してLPC分析を行い、LPC逆フィルタに前記音声信号を通すことによりLPC残差信号を求める第1LPC分析部と、前記基本周波数から得られる基本周期に応じたピッチ波形を生成し、そのピッチ波形と前記LPC残差信号とを用いてピッチマーク時刻群を抽出するピッチマーク分析部と、前記ピッチマーク時刻群と前記LPC残差信号とを用いて求めた位相等化フィルタを前記音声信号に施すことにより位相等化音声信号を生成する位相等化音声生成部と、前記ピッチマーク時刻群を声門閉鎖区間の始点とし、声門閉鎖区間の長さを前記基本周期に対して所定の比率として声門閉鎖区間を推定する第1声門閉鎖区間推定部と、前記位相等化音声信号の一次差分を求める傾斜特性補正部と、前記位相等化音声信号の一次差分に対して前記声門閉鎖区間におけるLPC分析を行い、LPC残差信号を最小にするようなLPC係数を求める声門閉鎖区間LPC分析部よりなる。
請求項2の発明では請求項1の発明において、前記LPC係数を用いたLPC逆フィルタに前記位相等化音声信号を通すことにより声門下インピーダンスの特性を含む音源信号を求めるLPC逆フィルタ計算部と、前記ピッチマーク時刻群を声門閉鎖区間の始点とし、前記音源信号の絶対値が所定の閾値よりも小さい区間を声門閉鎖区間として抽出する第2声門閉鎖区間推定部とを備え、声門閉鎖区間LPC分析部は前記位相等化音声信号の一次差分に対して第2声門閉鎖区間推定部で抽出された声門閉鎖区間を用いて再帰的にLPC分析を行ってLPC係数を求める。
請求項3の発明によれば、声道スペクトル抽出方法は、入力された音声信号の音声区間を検出する音声区間検出過程と、前記音声区間に対して前記音声信号から基本周波数を推定する基本周波数分析過程と、前記基本周波数に基づき決定した窓長で前記音声信号を切り出してLPC分析を行い、LPC逆フィルタに前記音声信号を通すことによりLPC残差信号を求める第1LPC分析過程と、前記基本周波数から得られる基本周期に応じたピッチ波形を生成し、そのピッチ波形と前記LPC残差信号とを用いてピッチマーク時刻群を抽出するピッチマーク分析過程と、前記ピッチマーク時刻群と前記LPC残差信号とを用いて求めた位相等化フィルタを前記音声信号に施すことにより位相等化音声信号を生成する位相等化音声生成過程と、前記ピッチマーク時刻群を声門閉鎖区間の始点とし、声門閉鎖区間の長さを前記基本周期に対して所定の比率として声門閉鎖区間を推定する第1声門閉鎖区間推定過程と、前記位相等化音声信号の一次差分を求める傾斜特性補正過程と、前記位相等化音声信号の一次差分に対して前記声門閉鎖区間におけるLPC分析を行い、LPC残差信号を最小にするようなLPC係数を求める声門閉鎖区間LPC分析過程よりなる。
請求項4の発明では請求項3の発明において、前記LPC係数を用いたLPC逆フィルタに前記位相等化音声信号を通すことにより声門下インピーダンスの特性を含む音源信号を求めるLPC逆フィルタ計算過程と、前記ピッチマーク時刻群を声門閉鎖区間の始点とし、前記音源信号の絶対値が所定の閾値よりも小さい区間を声門閉鎖区間として抽出する第2声門閉鎖区間推定過程と、前記位相等化音声信号の一次差分に対して前記第2声門閉鎖区間推定過程で抽出された声門閉鎖区間を用いて再帰的にLPC分析を行ってLPC係数を求める声門閉鎖区間LPC分析再帰処理過程とを有する。
この発明によれば、音声信号から声門下インピーダンスの影響を受けない正確な声道スペクトルを抽出することができる。
音声の生成過程を模式的に示した図。 この発明による声道スペクトル抽出装置の第1の実施例の機能構成を示すブロック図。 図2に示した声道スペクトル抽出装置における処理の流れを示すフローチャート(その1)。 図2に示した声道スペクトル抽出装置における処理の流れを示すフローチャート(その2)。 (A)は音声信号(原音声)の一例を示す図、(B)は(A)に対し、位相等化処理を行った後の音声信号(位相等化音声信号)を示す図。 この発明による声道スペクトル抽出装置の第2の実施例の機能構成を示すブロック図。 図6に示した声道スペクトル抽出装置における処理の流れの要部を示すフローチャート。 図6における第2声門閉鎖区間推定部の処理例を示す図。 声門閉鎖区間線形予測法により得られたフォルマント周波数を示すグラフ、(A)は従来法による場合、(B)はこの発明の第2の実施例による場合。
この発明では音声信号の振幅特性を変えず、位相特性のみを変換する前処理を音声信号に施す。音声信号の位相特性を変換する方法として、下記文献Aに記載されている位相等化処理を用いる。これは、音声信号のエネルギを声門閉鎖時点に集中させる方法である。
文献A:特許第2061816号公報
位相等化処理によって得られる位相等化音声信号は最小位相特性を持つフィルタのインパルス応答とみなせるため、声門閉鎖区間では声道スペクトルの情報が声門下インピーダンスの情報よりも相対的に大きくなることが期待され、その結果、位相等化音声信号の声門閉鎖区間では声門下インピーダンスの影響が少ないと考えられる。
以下、この発明の実施形態を図面を参照して実施例により説明する。
図2はこの発明による声道スペクトル抽出装置の実施例1の機能構成を示したものであり、この例では声道スペクトル抽出装置は音声区間検出部11と基本周波数分析部12と第1LPC分析部13とピッチマーク分析部14と位相等化音声生成部15と第1声門閉鎖区間推定部16と傾斜特性補正部17と声門閉鎖区間LPC分析部18とによって構成されている。
図3〜4は図2に示した声道スペクトル抽出装置における処理の流れを示したものであり、以下、図2〜4を参照して各部の機能、処理の流れについて説明する。
<音声区間検出部>
まず、音声区間検出部11にて、音声信号(原音声)のパワーの閾値処理に基づき、音声区間の検出を行う(ステップS1)。
<基本周波数分析部>
次に、基本周波数分析部12にて、得られた音声区間に対して音声信号からピッチ抽出アルゴリズムを用いて基本周波数を推定する。例えば、本実施例では、30msの分析窓長(分析区間)と、4msの分析シフト長により、瞬時周波数振幅スペクトルに基づき、基本周波数を求める(ステップS2)。なお、基本周波数の分析には例えば下記文献Bに記載されている瞬時周波数振幅スペクトルに基づく手法を用いる。
文献B:Arifianto D., Tanaka T., Masuko T., and kobayashi T.,“Robust F0 estimation of speech signal using harmonicity measure based on instantaneous frequency”, IEICE Trans. Information and Systems, Vol.E87-D, No.12, pp.2812-2820, 2004
<第1LPC分析部>
第1LPC分析部13は、位相等化処理に用いるLPC残差信号を得るために、4msの分析シフト長で、音声信号を基本周期(基本周期=1÷基本周波数)の2.5倍を窓長としたブラックマン窓で切り出し、自己相関法によるLPC分析を行う(ステップS3)。そして、音声信号をLPC逆フィルタに通すことによりLPC残差信号を得る(ステップS4)。この際、基本周波数の影響を避けるために、ラグ窓(100Hz)を用いる。
さらに、窓関数を用いたパワースペクトルの分析は分析時刻に依存するという問題があるため、声道スペクトルの時間方向平滑化を目的として、下記文献Cに記載されているようなTANDEM窓を用いる。これは、当該分析フレームと基本周期の半分シフトした分析フレームのパワースペクトルを足して2で割ることで分析時刻に依存しないパワースペクトルを推定する手法である。
文献C:森勢将雅、高橋徹、河原英紀、入野俊夫,“分析時刻に依存しない周期信号のパワースペクトル推定法を用いた音声分析”,電子情報通信学会論文誌,Vol.J92-A,No.3,pp.163-171,2009
LPC残差信号e(t,k)は、以下のようにして求められる。
Figure 0005705086
但し、t:フレーム番号
k:時刻
s:音声信号(原音声)
p:LPC分析次数
a:LPC係数
<ピッチマーク分析部>
ピッチマーク分析部14は、位相等化処理に用いるピッチマーク(ピッチマーク時刻群)を得るために、音声区間内で、基本周波数から得られる基本周期に応じたパルス系列信号(ピッチ波形)を生成する(ステップS5)。フレーム番号t、時刻kにおいて、音声区間内で、ピッチ波形ex(t,k)の絶対値と、LPC残差信号e(t,k)の絶対値の間で、フレームt毎に、相互相関関数
r(t,j)=Σ|e(t,k)|×|ex(t,k+j)|
を計算し、Σr(t,j)が最大となるようなjの系列を、動的計画法を用いて求め、ピッチマーク時刻群の候補を得る。そして、得られたピッチマーク時刻の近傍で、LPC残差信号の絶対値が最大となる時刻を探索し、ピッチマーク時刻群の候補を得る。このピッチマーク時刻群の中で残差信号の絶対値が最大となるピッチマーク時刻をk(0)とし、時刻k(0)と前後のピッチマーク時刻k(−1)またはk(1)の近傍における変形自己相関関数
Σe(t,km)×e(t,k(0)) km=k(−1)−2〜k(−1)+2
Σe(t,km)×e(t,k(0)) km=k(1)−2〜k(1)+2
を最大にする時刻kmを求める。k(0)を得られたkm、kmをkmの前または後のピッチマーク時刻とし、順次変形自己相関関数を最大にする時刻を求め、ピッチマーク時刻群とする(ステップS6)。
<位相等化音声生成部>
位相等化音声生成部15は、位相等化音声信号を得るために、ピッチマーク(ピッチマーク時刻群)とLPC残差信号を用いて、LPC残差信号の値をピッチマーク時刻を中心として反転させ、正規化した値を係数として持つ位相等化フィルタを求め、これを音声信号に施すことにより位相等化音声信号を得る(ステップS7)。位相等化フィルタのタップ数は基本周期の長さと同じとする。
<第1声門閉鎖区間推定部>
第1声門閉鎖区間推定部16は、声門閉鎖区間を推定する(ステップS8)。分析フレーム内におけるj番目の声門閉鎖区間の始点nは、ピッチマーク時刻群とすることができる。しかし、声門閉鎖区間の長さの推定は難しいことが知られているため、ここでは基本周期に対する声門解放時間率(OQ)として一般的な値である35%を考える。つまり、声門閉鎖区間の長さは基本周期の65%とする。
<傾斜特性補正部>
傾斜特性補正部17は、音声信号に含まれる音源スペクトルの傾斜特性を取り除くために、位相等化音声信号の一次差分を求める(ステップS9)。位相等化音声信号をxとするとき、位相等化音声信号の一次差分Δxは、
Δx(t)=x(t)−x(t−1) t=2〜T (2a)
Δx(1)=0 t=1 (2b)
で求められる。
<声門閉鎖区間LPC分析部>
声門閉鎖区間LPC分析部18は、傾斜特性補正部17で求められた位相等化音声信号の一次差分、j番目の声門閉鎖区間の始点nと声門閉鎖区間の長さNに対して、共分散を用いたLPC分析を行う(ステップS10)。つまり、以下のLPC残差信号e(t)を最小にするようなLPC係数aを求める。
Figure 0005705086
ここで、φとΦを以下のように定義すると、
Figure 0005705086
LPC係数aは以下の連立方程式を解くことで得ることができる。Jは分析フレームに含まれる声門閉鎖区間の数を表す。なお、は行列の転置を表す。
[Φ Φ+…+Φ Φ]a^=[Φ φ+…+Φ φ] (6)
以上のようにして、LPC係数aを得ることができ、LPC係数aが得られれば、声道スペクトルを求めることができる。
図5は位相等化音声生成部15での位相等化処理後の音声信号(位相等化音声信号)の一例を原音声信号と共に例示したものであり、この例では日本語母音「い」と「う」の間の遷移部の音声信号波形を示している。図5中、開/閉は声門の開/閉を示す。
図5において声門閉鎖区間の波形を比較すると、(B)の位相等化音声信号の方が、波形の山のピークが各声門閉鎖区間の中央近くに位置し、声門閉鎖区間からはみ出している波形の山の裾野部分が少なくなっていることがわかる。つまり、声門閉鎖区間において、声道スペクトルに係る情報量が声門下インピーダンスに係る情報量に比べて相対的に大きくなっていることがわかる。
このように、この例では位相等化処理により、声門閉鎖区間における音声信号のエネルギが高められ、これにより声道スペクトルを精度良く抽出することができるものとなっている。
図6はこの発明による声道スペクトル抽出装置の実施例2の機能構成を示したものであり、図2に示した実施例1の構成に対し、LPC逆フィルタ計算部19と第2声門閉鎖区間推定部20が付加された構成となっている。
図7は図6に示した声道スペクトル抽出装置における処理の流れの要部を示したものであり、図3〜4に示した実施例1の処理(ステップS1〜S10)に加え、ステップS11〜S13を実行するものとなっている。
以下、LPC逆フィルタ計算部19及び第2声門閉鎖区間推定部20の機能及び処理の流れについて説明する。
<LPC逆フィルタ計算部>
LPC逆フィルタ計算部19は、声門閉鎖区間LPC分析部18により得られるLPC係数を用いたLPC逆フィルタに位相等化音声信号を通すことにより、LPC残差信号、つまり声門下インピーダンスの特性を含む音源信号を求める(ステップS11)。声門下インピーダンスの特性を含む音源信号(LPC残差信号)は以下のようにして求められる。
Figure 0005705086
ここで、声門閉鎖区間LPC分析部18により得られるLPC係数は基本周期毎に求められるため、男声のように基本周期が長い場合は、時間的に滑らかなLPC係数が得られない。その場合、LPC係数をPARCORやLSPなどに変換し、隣り合う声門閉鎖区間でのパラメータ間を線形補間し、再びLPC係数に戻せばよい。
<第2声門閉鎖区間推定部>
LPC逆フィルタ計算部19で得られた音源信号は、人間が発声する声門体積流の波形に近いことが期待される。第2声門閉鎖区間推定部20は、ピッチマーク時刻群を声門閉鎖区間の始点として、音源信号の絶対値が所定の閾値よりも小さい区間を声門閉鎖区間として抽出することで声門閉鎖区間の推定を行う(ステップS12)。
第2声門閉鎖区間推定部20で得られた声門閉鎖区間は、声門閉鎖区間LPC分析部18に入力され、声門閉鎖区間LPC分析部18は入力された声門閉鎖区間を用いて位相等化音声信号の一次差分に対して再帰的にLPC分析を行い、LPC係数を求める(ステップS13)。
以上説明したように、この例では音源信号より推定した声門閉鎖区間を用いて再帰的にLPC係数を求めるものとなっており、これにより声道スペクトルの抽出精度をより向上させることができ、正確な声道スペクトルを抽出することができるものとなっている。
図8は上述した第2声門閉鎖区間推定部20における音源信号からの声門閉鎖区間の抽出処理例を示したものである。
[実験例]
男性日本語母国語話者が発声した母音連鎖「いうえ」より抽出したフォルマント周波数を図9に示す。本実験では、位相等化処理のためのLPC分析次数は50次、LPCスペクトルを得るための分析次数は17次とした。音声信号のサンプリングレートは16kHzである。図9(A)は式(3)のΔxを原音声信号の一次差分とした声門閉鎖区間線形予測法(従来法)により得られた第1,第2フォルマント周波数を示し、図9(B)はこの発明による声門閉鎖区間線形予測法(実施例2)により得られた第1,第2フォルマント周波数を示す。分析のために用いた声門閉鎖区間の数は2である。
声門下インピーダンスの影響の例として、第2フォルマント周波数(F2)が大きく遷移するような発声の場合に、不連続なF2が抽出されることが知られている。図9(A)に示した従来法では声門閉鎖区間線形予測法を用いているにも関わらず、「い」と「う」の間でF2が不連続になっており、声門下インピーダンスの影響が見られる。
一方、図9(B)に示したこの発明の実施例2による方法では「い」と「う」の間でフォルマント周波数が連続的に遷移しており、声門下インピーダンスの影響を受けないことが分かる。
以上説明した声道スペクトル抽出装置及び声道スペクトル抽出方法は、コンピュータと、コンピュータにインストールされたプログラムによって実現することができる。コンピュータにインストールされたプログラムはコンピュータのCPUによって解読されてコンピュータに上述した声道スペクトル抽出方法を実行させる。
11 音声区間検出部 12 基本周波数分析部
13 第1LPC分析部 14 ピッチマーク分析部
15 位相等化音声生成部 16 第1声門閉鎖区間推定部
17 傾斜特性補正部 18 声門閉鎖区間LPC分析部
19 LPC逆フィルタ計算部 20 第2声門閉鎖区間推定部

Claims (5)

  1. 入力された音声信号の音声区間を検出する音声区間検出部と、
    前記音声区間に対して前記音声信号から基本周波数を推定する基本周波数分析部と、
    前記基本周波数に基づき決定した窓長で前記音声信号を切り出してLPC分析を行い、LPC逆フィルタに前記音声信号を通すことによりLPC残差信号を求める第1LPC分析部と、
    前記基本周波数から得られる基本周期に応じたピッチ波形を生成し、そのピッチ波形と前記LPC残差信号とを用いてピッチマーク時刻群を抽出するピッチマーク分析部と、
    前記ピッチマーク時刻群と前記LPC残差信号とを用いて求めた位相等化フィルタを前記音声信号に施すことにより音声信号のエネルギが声門閉鎖区間に集中した位相等化音声信号を生成する位相等化音声生成部と、
    前記ピッチマーク時刻群を声門閉鎖区間の始点とし、声門閉鎖区間の長さを前記基本周期に対して所定の比率として声門閉鎖区間を推定する第1声門閉鎖区間推定部と、
    前記位相等化音声信号の一次差分を求める傾斜特性補正部と、
    前記位相等化音声信号の一次差分に対して前記声門閉鎖区間におけるLPC分析を行い、LPC残差信号を最小にするようなLPC係数を求める声門閉鎖区間LPC分析部と、よりなることを特徴とする声道スペクトル抽出装置。
  2. 請求項1記載の声道スペクトル抽出装置において、
    前記LPC係数を用いたLPC逆フィルタに前記位相等化音声信号を通すことにより声門下インピーダンスの特性を含む音源信号を求めるLPC逆フィルタ計算部と、
    前記ピッチマーク時刻群を声門閉鎖区間の始点とし、前記音源信号の絶対値が所定の閾値よりも小さい区間を声門閉鎖区間として抽出する第2声門閉鎖区間推定部とを備え、
    前記声門閉鎖区間LPC分析部は前記位相等化音声信号の一次差分に対して前記第2声門閉鎖区間推定部で抽出された声門閉鎖区間を用いて再帰的にLPC分析を行ってLPC係数を求めることを特徴とする声道スペクトル抽出装置。
  3. 入力された音声信号の音声区間を検出する音声区間検出過程と、
    前記音声区間に対して前記音声信号から基本周波数を推定する基本周波数分析過程と、
    前記基本周波数に基づき決定した窓長で前記音声信号を切り出してLPC分析を行い、LPC逆フィルタに前記音声信号を通すことによりLPC残差信号を求める第1LPC分析過程と、
    前記基本周波数から得られる基本周期に応じたピッチ波形を生成し、そのピッチ波形と前記LPC残差信号とを用いてピッチマーク時刻群を抽出するピッチマーク分析過程と、
    前記ピッチマーク時刻群と前記LPC残差信号とを用いて求めた位相等化フィルタを前記音声信号に施すことにより音声信号のエネルギが声門閉鎖区間に集中した位相等化音声信号を生成する位相等化音声生成過程と、
    前記ピッチマーク時刻群を声門閉鎖区間の始点とし、声門閉鎖区間の長さを前記基本周期に対して所定の比率として声門閉鎖区間を推定する第1声門閉鎖区間推定過程と、
    前記位相等化音声信号の一次差分を求める傾斜特性補正過程と、
    前記位相等化音声信号の一次差分に対して前記声門閉鎖区間におけるLPC分析を行い、LPC残差信号を最小にするようなLPC係数を求める声門閉鎖区間LPC分析過程と、
    よりなることを特徴とする声道スペクトル抽出方法。
  4. 請求項3記載の声道スペクトル抽出方法において、
    前記LPC係数を用いたLPC逆フィルタに前記位相等化音声信号を通すことにより声門下インピーダンスの特性を含む音源信号を求めるLPC逆フィルタ計算過程と、
    前記ピッチマーク時刻群を声門閉鎖区間の始点とし、前記音源信号の絶対値が所定の閾値よりも小さい区間を声門閉鎖区間として抽出する第2声門閉鎖区間推定過程と、
    前記位相等化音声信号の一次差分に対して前記第2声門閉鎖区間推定過程で抽出された声門閉鎖区間を用いて再帰的にLPC分析を行ってLPC係数を求める声門閉鎖区間LPC分析再帰処理過程と、
    を有することを特徴とする声道スペクトル抽出方法。
  5. 請求項3又は4記載の声道スペクトル抽出方法をコンピュータに実行させるためのプログラム。
JP2011227187A 2011-10-14 2011-10-14 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム Active JP5705086B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011227187A JP5705086B2 (ja) 2011-10-14 2011-10-14 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011227187A JP5705086B2 (ja) 2011-10-14 2011-10-14 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013088522A JP2013088522A (ja) 2013-05-13
JP5705086B2 true JP5705086B2 (ja) 2015-04-22

Family

ID=48532515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011227187A Active JP5705086B2 (ja) 2011-10-14 2011-10-14 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5705086B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109427338B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号的编码方法和编码装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612098A (ja) * 1992-03-16 1994-01-21 Sanyo Electric Co Ltd 音声符号化装置
JP4568826B2 (ja) * 2005-09-08 2010-10-27 株式会社国際電気通信基礎技術研究所 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム
JP5325130B2 (ja) * 2010-01-25 2013-10-23 日本電信電話株式会社 Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム

Also Published As

Publication number Publication date
JP2013088522A (ja) 2013-05-13

Similar Documents

Publication Publication Date Title
Bayya et al. Spectro-temporal analysis of speech signals using zero-time windowing and group delay function
KR101247652B1 (ko) 잡음 제거 장치 및 방법
Rakesh et al. Gender Recognition using speech processing techniques in LABVIEW
Mittal et al. Study of characteristics of aperiodicity in Noh voices
US20080215321A1 (en) Pitch model for noise estimation
CN104021789A (zh) 一种利用短时时频值的自适应端点检测方法
Mayer et al. Impact of phase estimation on single-channel speech separation based on time-frequency masking
Manfredi et al. Perturbation measurements in highly irregular voice signals: Performances/validity of analysis software tools
CN106782508A (zh) 语音音频的切分方法和语音音频的切分装置
US8942977B2 (en) System and method for speech recognition using pitch-synchronous spectral parameters
Hoang et al. Blind phone segmentation based on spectral change detection using Legendre polynomial approximation
Gamit et al. Isolated words recognition using mfcc lpc and neural network
Hanilçi et al. Comparing spectrum estimators in speaker verification under additive noise degradation
Kumar et al. Performance evaluation of a ACF-AMDF based pitch detection scheme in real-time
JP5325130B2 (ja) Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム
Mittal et al. Significance of aperiodicity in the pitch perception of expressive voices
JP5282523B2 (ja) 基本周波数抽出方法、基本周波数抽出装置、およびプログラム
Bouzid et al. Voice source parameter measurement based on multi-scale analysis of electroglottographic signal
JP5705086B2 (ja) 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム
AU2014395554A1 (en) Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system
Vekkot et al. Significance of glottal closure instants detection algorithms in vocal emotion conversion
Sangeetha et al. Robust automatic continuous speech segmentation for indian languages to improve speech to speech translation
Thirumuru et al. Improved vowel region detection from a continuous speech using post processing of vowel onset points and vowel end-points
Guðnason et al. Closed phase estimation for inverse filtering the oral airflow waveform
Natarajan et al. Segmentation of continuous Tamil speech into syllable like units

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140902

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150224

R150 Certificate of patent or registration of utility model

Ref document number: 5705086

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150