JPH064098A - 音声分析装置 - Google Patents
音声分析装置Info
- Publication number
- JPH064098A JPH064098A JP4166394A JP16639492A JPH064098A JP H064098 A JPH064098 A JP H064098A JP 4166394 A JP4166394 A JP 4166394A JP 16639492 A JP16639492 A JP 16639492A JP H064098 A JPH064098 A JP H064098A
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- sound source
- vocal tract
- signal
- pole
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 声道パラメータおよび音源パラメータの分析
精度を向上させる。 【構成】 声道パラメータを分析する手段106で声道
パラメータを分析する前に音源による極を除去をする手
段105において、分析対象の音声信号(一次のスペク
トルの平坦化手段202の出力)から音源パラメータの
成分を除去する。
精度を向上させる。 【構成】 声道パラメータを分析する手段106で声道
パラメータを分析する前に音源による極を除去をする手
段105において、分析対象の音声信号(一次のスペク
トルの平坦化手段202の出力)から音源パラメータの
成分を除去する。
Description
【0001】
【産業上の利用分野】本発明は入力音声信号から声道パ
ラメータと有声音源パラメータの正確な値を推定する音
声分析装置に関するものである。
ラメータと有声音源パラメータの正確な値を推定する音
声分析装置に関するものである。
【0002】
【従来の技術】Adaptive Inverse F
iltering(AIF)方法と呼ばれる音声分析方
法が従来から知られている。この方法はたとえば、“A
Comparison of EGG and a
New AutomaticInverse Filt
ering Method in Phonation
Change from Breathy to N
ormal”ICSLP−90 Proceeding
s,6.9.1 pp197 to 202(199
0)に示されている。AIF方法は下記のような技術で
あり、この方法を用いる音声分析装置の回路構成を図1
2に示している。
iltering(AIF)方法と呼ばれる音声分析方
法が従来から知られている。この方法はたとえば、“A
Comparison of EGG and a
New AutomaticInverse Filt
ering Method in Phonation
Change from Breathy to N
ormal”ICSLP−90 Proceeding
s,6.9.1 pp197 to 202(199
0)に示されている。AIF方法は下記のような技術で
あり、この方法を用いる音声分析装置の回路構成を図1
2に示している。
【0003】分析する信号s(n)をハミング窓かけ
し、高域フィルタ手段(201)でフィルタし、信号s
h(n)を生成する。高域フィルタ手段201は、録音
器の制限より低い周波数の位相誤差があるデータを除去
するために20Hz以下の周波数を除去するフィルタで
ある。この信号sh(n)を入力した一次のLPC分析
手段(202)は予測次数が1のLPC(線形予測分析
手法)で分析を行う。一次のLPC分析手段(202)
の分析結果で信号sh(n)を逆フィルタ(203)で
逆フィルタし、音声の声道の影響のみがある信号sv
(n)を生成する。高次の予測次数のLPCで分析する
高次のLPC分析手段(204)で信号sv(n)を分
析し、その分析結果で信号sh(n)を逆フィルタ(2
05)で逆フィルタし、音源と放射特性の影響のみがあ
るsgr(n)を生成する。必要ならば、信号sgr
(n)を積分器(206)で積分し、音源波形のみを抽
出する。また、信号sgr(n)から音源パラメータを
抽出手段(207)により抽出する。
し、高域フィルタ手段(201)でフィルタし、信号s
h(n)を生成する。高域フィルタ手段201は、録音
器の制限より低い周波数の位相誤差があるデータを除去
するために20Hz以下の周波数を除去するフィルタで
ある。この信号sh(n)を入力した一次のLPC分析
手段(202)は予測次数が1のLPC(線形予測分析
手法)で分析を行う。一次のLPC分析手段(202)
の分析結果で信号sh(n)を逆フィルタ(203)で
逆フィルタし、音声の声道の影響のみがある信号sv
(n)を生成する。高次の予測次数のLPCで分析する
高次のLPC分析手段(204)で信号sv(n)を分
析し、その分析結果で信号sh(n)を逆フィルタ(2
05)で逆フィルタし、音源と放射特性の影響のみがあ
るsgr(n)を生成する。必要ならば、信号sgr
(n)を積分器(206)で積分し、音源波形のみを抽
出する。また、信号sgr(n)から音源パラメータを
抽出手段(207)により抽出する。
【0004】
【発明が解決しようとする課題】従来のこの種の装置は
高次のLPC分析の結果で、そのまま逆フィルタするよ
うに構成されていたので、LPCの予測次数によらず、
音源分析は不正確であった。より詳しく説明する。
高次のLPC分析の結果で、そのまま逆フィルタするよ
うに構成されていたので、LPCの予測次数によらず、
音源分析は不正確であった。より詳しく説明する。
【0005】高次のLPC分析手段(204)の高次の
予測次数を極の予期される数の2倍にすると、逆フィル
タ(205)でもっぱら声道の成分を取り除くが、音源
特性の表現のためのLPC予測次数は一次だけ(一次の
分析手段202の処理)となり、音源波形の抽出は正確
ではなくなる。すなわち、音源特性を一次のLPC予測
で図4のように表現すると、例えば図5のような5次の
LPC予測で表現した場合と比較して判かるように、特
に低い周波数部分の抽出部が正確ではなくなる。一方、
高次の予測次数を極の予期される数の2倍より大きくす
ると、LPCの結果は音源の成分も声道の成分も含むの
で、逆フィルタ(205)は声道の成分だけではなく音
源の成分も除去してしまう。さらに、AIF方法の中で
LPC分析方法を用いると極の周波数とバンド幅の計算
が不正確となるという解決すべき課題があった。
予測次数を極の予期される数の2倍にすると、逆フィル
タ(205)でもっぱら声道の成分を取り除くが、音源
特性の表現のためのLPC予測次数は一次だけ(一次の
分析手段202の処理)となり、音源波形の抽出は正確
ではなくなる。すなわち、音源特性を一次のLPC予測
で図4のように表現すると、例えば図5のような5次の
LPC予測で表現した場合と比較して判かるように、特
に低い周波数部分の抽出部が正確ではなくなる。一方、
高次の予測次数を極の予期される数の2倍より大きくす
ると、LPCの結果は音源の成分も声道の成分も含むの
で、逆フィルタ(205)は声道の成分だけではなく音
源の成分も除去してしまう。さらに、AIF方法の中で
LPC分析方法を用いると極の周波数とバンド幅の計算
が不正確となるという解決すべき課題があった。
【0006】
【課題を解決するための手段】このような目的を達成す
るために、本発明は、音声波形に基づき、声道パラメー
タおよび音源パラメータに関して、それぞれ分析する音
声分析装置において、前記声道パラメータの分析を行う
際に、前記音声波形から前記音源パラメータの成分を除
去する手段と、前記音源パラメータの分析を行う際に前
記音声波形から前記声道パラメータの成分を除去する手
段とを具えことを特徴とする。
るために、本発明は、音声波形に基づき、声道パラメー
タおよび音源パラメータに関して、それぞれ分析する音
声分析装置において、前記声道パラメータの分析を行う
際に、前記音声波形から前記音源パラメータの成分を除
去する手段と、前記音源パラメータの分析を行う際に前
記音声波形から前記声道パラメータの成分を除去する手
段とを具えことを特徴とする。
【0007】
【作用】本願発明者は従来のAIF方法による音声分析
において、音源パラメータおよび声道パラメータに関し
てそれぞれ分析する際に他方のパラメータ成分が分析対
象の音声信号に混在することを発見し、本発明では一方
のパラメータについて分析を行う際に他方のパラメータ
の成分を、分析対象の音声信号から除去することで、分
析精度を従来よりも向上させる。
において、音源パラメータおよび声道パラメータに関し
てそれぞれ分析する際に他方のパラメータ成分が分析対
象の音声信号に混在することを発見し、本発明では一方
のパラメータについて分析を行う際に他方のパラメータ
の成分を、分析対象の音声信号から除去することで、分
析精度を従来よりも向上させる。
【0008】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
に説明する。
【0009】図1に本発明の基本構成を示す。
【0010】AIF方法を用いた図12の従来装置と同
様に、分析窓手段(101)と一次のスペクトルの平坦
化手段(102)で、入力信号を窓かけし、音源のスペ
クトルの傾きを除去する。また、上記AIF方法と同じ
ように、高次LPC分析手段(103)で信号sf
(n)を分析する。しかし、本実施例では高次LPC分
析手段(103)の出力であるLPC係数は、LPC係
数から極の値への変換手段(104)で極のパラメータ
の値に変換する。
様に、分析窓手段(101)と一次のスペクトルの平坦
化手段(102)で、入力信号を窓かけし、音源のスペ
クトルの傾きを除去する。また、上記AIF方法と同じ
ように、高次LPC分析手段(103)で信号sf
(n)を分析する。しかし、本実施例では高次LPC分
析手段(103)の出力であるLPC係数は、LPC係
数から極の値への変換手段(104)で極のパラメータ
の値に変換する。
【0011】音源による極を除去する手段(105)
に、LPC係数から極の値への変換手段(104)の音
源による極のみを入力し、プリエンファシスされた信号
であるsf(n)から音源による極を除去する。音源に
よる極を除去する手段(105)の出力は音声信号の声
道の影響のみがある信号sv(n)である。
に、LPC係数から極の値への変換手段(104)の音
源による極のみを入力し、プリエンファシスされた信号
であるsf(n)から音源による極を除去する。音源に
よる極を除去する手段(105)の出力は音声信号の声
道の影響のみがある信号sv(n)である。
【0012】信号sv(n)は声道パラメータを分析す
る手段(106)で正確に分析し、声道のパラメータの
値を抽出する。声道のパラメータの値は、信号sw
(n)から声道のパラメータの効果を除去する声道パラ
メータの成分を除去する手段(107)に入力し、この
手段により音源と放射特性の貢献のみがある信号sg
(n)が生成される。
る手段(106)で正確に分析し、声道のパラメータの
値を抽出する。声道のパラメータの値は、信号sw
(n)から声道のパラメータの効果を除去する声道パラ
メータの成分を除去する手段(107)に入力し、この
手段により音源と放射特性の貢献のみがある信号sg
(n)が生成される。
【0013】信号sg(n)は音源パラメータを分析す
る手段(108)に入力し、この手段により音源パラメ
ータの値が抽出される。最後に、音源と声道のパラメー
タは、信号sw(n)を用いて全パラメータを調整する
全体パラメータを調整する手段(109)に入力し、こ
の手段により正確な音源パラメータと声道パラメータを
抽出する。
る手段(108)に入力し、この手段により音源パラメ
ータの値が抽出される。最後に、音源と声道のパラメー
タは、信号sw(n)を用いて全パラメータを調整する
全体パラメータを調整する手段(109)に入力し、こ
の手段により正確な音源パラメータと声道パラメータを
抽出する。
【0014】上記のように構成された音声分析装置を起
動すると、下記のように音源パラメータと声道パラメー
タを抽出することができる。
動すると、下記のように音源パラメータと声道パラメー
タを抽出することができる。
【0015】分析窓手段(101)で入力信号s(n)
の時間と周波数の範囲を設定してsw(n)を生成す
る。一次のスペクトルの平坦化手段(102)でsw
(n)をプリエンファシスして、sf(n)を生成す
る。高次LPC分析手段(103)でsf(n)を分析
して声道の効果と音源のスペクトルの傾きの効果を含ん
だLPC係数を抽出する。
の時間と周波数の範囲を設定してsw(n)を生成す
る。一次のスペクトルの平坦化手段(102)でsw
(n)をプリエンファシスして、sf(n)を生成す
る。高次LPC分析手段(103)でsf(n)を分析
して声道の効果と音源のスペクトルの傾きの効果を含ん
だLPC係数を抽出する。
【0016】LPC係数をLPC係数から極の値への変
換手段(104)に入力し、音源による極と声道による
極を抽出し、別々に出力する。音源による極の値を音源
による極を除去する手段(105)に入力し、極の値を
フィルタ係数に変換し、得られた係数でsf(n)を逆
フィルタして、sv(n)を生成する。
換手段(104)に入力し、音源による極と声道による
極を抽出し、別々に出力する。音源による極の値を音源
による極を除去する手段(105)に入力し、極の値を
フィルタ係数に変換し、得られた係数でsf(n)を逆
フィルタして、sv(n)を生成する。
【0017】声道パラメータを分析する手段(106)
でsv(n)を分析して、声道パラメータの値を抽出す
る。この値を声道パラメータの成分を除去する手段(1
07)に入力し、パラメータの値をフィルタ係数に変換
し、得られた係数でsw(n)を逆フィルタして、sg
(n)を生成する。
でsv(n)を分析して、声道パラメータの値を抽出す
る。この値を声道パラメータの成分を除去する手段(1
07)に入力し、パラメータの値をフィルタ係数に変換
し、得られた係数でsw(n)を逆フィルタして、sg
(n)を生成する。
【0018】音源と放射特性の影響のみがあるsg
(n)を音源パラメータを分析する手段(108)に入
力し、音源モデルのパラメータの値を抽出する。声道パ
ラメータを分析する手段(106)から得られた値と音
源パラメータを分析する手段(108)から得られた値
を全体パラメータを調整する手段(109)で調整し
て、正確な声道パラメータと音源パラメータを出力す
る。
(n)を音源パラメータを分析する手段(108)に入
力し、音源モデルのパラメータの値を抽出する。声道パ
ラメータを分析する手段(106)から得られた値と音
源パラメータを分析する手段(108)から得られた値
を全体パラメータを調整する手段(109)で調整し
て、正確な声道パラメータと音源パラメータを出力す
る。
【0019】図1の音声分析装置の具体的な実施例の構
成を図2に示す。図2において、点線ブロックで示す箇
所が図1の回路ブロックに対応し、その符号と同一符号
を点線ブロックにも付している。また、1対1に対応す
るブロックは図2中の( )記号の中に図1の対応ブロ
ックの符号を付している。
成を図2に示す。図2において、点線ブロックで示す箇
所が図1の回路ブロックに対応し、その符号と同一符号
を点線ブロックにも付している。また、1対1に対応す
るブロックは図2中の( )記号の中に図1の対応ブロ
ックの符号を付している。
【0020】図2において、12.8KHzサンプリン
グ周波数・PCM形式で外部から入力された連続的な音
声信号s(n)を矩形窓手段(301)で時間の範囲を
設定し、位相の補正フィルタ(302)で録音器の位相
歪みを補正して、信号sw(n)を生成する。ハミング
窓手段(303)で信号sw(n)を窓かけし、一次の
LPC分析手段(304)でスペクトルの傾きを解く。
グ周波数・PCM形式で外部から入力された連続的な音
声信号s(n)を矩形窓手段(301)で時間の範囲を
設定し、位相の補正フィルタ(302)で録音器の位相
歪みを補正して、信号sw(n)を生成する。ハミング
窓手段(303)で信号sw(n)を窓かけし、一次の
LPC分析手段(304)でスペクトルの傾きを解く。
【0021】一次のLPC分析手段(304)から得ら
れた一つのLPC係数を用いて一次の逆フィルタ(30
5)で信号sw(n)をフィルタし、sf(n)を生成
する。
れた一つのLPC係数を用いて一次の逆フィルタ(30
5)で信号sw(n)をフィルタし、sf(n)を生成
する。
【0022】信号sf(n)をハミング窓手段(30
6)で窓かけし、予測次数は14である(男声の場合)
LPC分析手段(307)で分析し、分析結果をLPC
係数から極の値への変換する手段(308)で複素極
(声道による極)と実数極(音源による極)のパラメー
タの値に変換する。
6)で窓かけし、予測次数は14である(男声の場合)
LPC分析手段(307)で分析し、分析結果をLPC
係数から極の値への変換する手段(308)で複素極
(声道による極)と実数極(音源による極)のパラメー
タの値に変換する。
【0023】実数の極のみをチャネルaで実数極からフ
ィルタ係数への変換する手段(309)に入力し、実数
極からフィルタ係数への変換する手段(309)でフィ
ルタ係数を計算する。一次の逆フィルタ(310)で計
算したフィルタ係数の全係数で信号sf(n)を逆フィ
ルタして、信号sv(n)を生成する。
ィルタ係数への変換する手段(309)に入力し、実数
極からフィルタ係数への変換する手段(309)でフィ
ルタ係数を計算する。一次の逆フィルタ(310)で計
算したフィルタ係数の全係数で信号sf(n)を逆フィ
ルタして、信号sv(n)を生成する。
【0024】信号sv(n)をハミング窓手段(31
1)で窓かけして、スペクトル計算手段(312)に入
力し、スペクトル計算手段(312)で信号sv(n)
のパワースペクトルを計算する。計算により得られたス
ペクトルをAbS声道パラメータ分析手段(313)に
入力し、AbS(Analysis−by−Synth
esis)の最初の極の値を決定するためにLPC係数
から極の値への変換する手段(308)から得られた複
素の極をチャネルbでAbS声道パラメータ分析手段
(313)に入力する。
1)で窓かけして、スペクトル計算手段(312)に入
力し、スペクトル計算手段(312)で信号sv(n)
のパワースペクトルを計算する。計算により得られたス
ペクトルをAbS声道パラメータ分析手段(313)に
入力し、AbS(Analysis−by−Synth
esis)の最初の極の値を決定するためにLPC係数
から極の値への変換する手段(308)から得られた複
素の極をチャネルbでAbS声道パラメータ分析手段
(313)に入力する。
【0025】AbS声道パラメータ分析手段(313)
でスペクトル領域で信号sv(n)の声道パラメータを
抽出し、抽出したパラメータの値を複素な共振成分から
フィルタ係数への変換する手段(314)でフィルタ係
数に変換する。各パラメータの3つのフィルタ係数を3
次の逆フィルタ等(315)に入力し、信号sw(n)
を逆フィルタして、音源と放射特性のみがある信号sg
(n)を生成する。
でスペクトル領域で信号sv(n)の声道パラメータを
抽出し、抽出したパラメータの値を複素な共振成分から
フィルタ係数への変換する手段(314)でフィルタ係
数に変換する。各パラメータの3つのフィルタ係数を3
次の逆フィルタ等(315)に入力し、信号sw(n)
を逆フィルタして、音源と放射特性のみがある信号sg
(n)を生成する。
【0026】信号sg(n)からAbS時間領域の音源
パラメータ分析手段(316)で音源パラメータの値を
抽出する。音源パラメータの値とAbS声道パラメータ
分析手段(313)から得た声道パラメータの値をAb
Sスペクトル領域の全体パラメータを調整する手段(3
17)に入力し、信号sw(n)を用いるAbSスペク
トル領域の全体パラメータを調整する手段(317)で
全パラメータを調整し、調整した声道パラメータの値と
音源パラメータの値を出力する。
パラメータ分析手段(316)で音源パラメータの値を
抽出する。音源パラメータの値とAbS声道パラメータ
分析手段(313)から得た声道パラメータの値をAb
Sスペクトル領域の全体パラメータを調整する手段(3
17)に入力し、信号sw(n)を用いるAbSスペク
トル領域の全体パラメータを調整する手段(317)で
全パラメータを調整し、調整した声道パラメータの値と
音源パラメータの値を出力する。
【0027】図2の装置構成を図3のようにすることも
できる。この例では音源による極を除去する手段105
の構成が図2の例と異なる。
できる。この例では音源による極を除去する手段105
の構成が図2の例と異なる。
【0028】図3に示されるように構成された音声分析
装置を起動すると、下記のように音源パラメータと声道
パラメータを抽出することができる。12.8KHzサ
ンプリング周波数・PCM形式で入力された連続的な音
声信号s(n)を矩形窓手段(401)で時間の範囲を
設定し、位相の補正フィルタ(402)で録音器の位相
歪みを補正して、信号sw(n)を生成する。ハミング
窓手段(403)で信号sw(n)を窓かけし、一次の
LPC分析手段(404)でスペクトルの傾きを解く。
装置を起動すると、下記のように音源パラメータと声道
パラメータを抽出することができる。12.8KHzサ
ンプリング周波数・PCM形式で入力された連続的な音
声信号s(n)を矩形窓手段(401)で時間の範囲を
設定し、位相の補正フィルタ(402)で録音器の位相
歪みを補正して、信号sw(n)を生成する。ハミング
窓手段(403)で信号sw(n)を窓かけし、一次の
LPC分析手段(404)でスペクトルの傾きを解く。
【0029】一次のLPC分析手段(404)から得ら
れた一つのLPC係数で一次の逆フィルタ(405)で
信号sw(n)をフィルタして、信号sf(n)を生成
する。信号sf(n)をハミング窓手段(406)で窓
かけし、予測次数は14以上である(男声の場合)LP
C分析手段(407)で分析し、分析結果をLPC係数
から極の値への変換する手段(408)で複素極と実数
極(音源による極)のパラメータの値に変換する。実数
の極のみをチャネルaで実数極からフィルタ係数への変
換する手段(409)に入力し、実数極からフィルタ係
数への変換する手段(409)でフィルタ係数を計算す
る。この例では、図2の例と異なり、声道による極の選
択手段(410)で複素の極を声道による極と音源によ
る極に分け、音源による極をチャネルcで複素極からフ
ィルタ係数への変換する手段(411)に入力して、極
をフィルタ係数に変換する。
れた一つのLPC係数で一次の逆フィルタ(405)で
信号sw(n)をフィルタして、信号sf(n)を生成
する。信号sf(n)をハミング窓手段(406)で窓
かけし、予測次数は14以上である(男声の場合)LP
C分析手段(407)で分析し、分析結果をLPC係数
から極の値への変換する手段(408)で複素極と実数
極(音源による極)のパラメータの値に変換する。実数
の極のみをチャネルaで実数極からフィルタ係数への変
換する手段(409)に入力し、実数極からフィルタ係
数への変換する手段(409)でフィルタ係数を計算す
る。この例では、図2の例と異なり、声道による極の選
択手段(410)で複素の極を声道による極と音源によ
る極に分け、音源による極をチャネルcで複素極からフ
ィルタ係数への変換する手段(411)に入力して、極
をフィルタ係数に変換する。
【0030】実数極からフィルタ係数への変換する手段
(409)と複素極からフィルタ係数への変換する手段
(411)の結果を逆フィルタ(412)に入力し、逆
フィルタ(412)で計算したフィルタ係数の全係数で
信号sf(n)を逆フィルタして、信号sv(n)を生
成する。
(409)と複素極からフィルタ係数への変換する手段
(411)の結果を逆フィルタ(412)に入力し、逆
フィルタ(412)で計算したフィルタ係数の全係数で
信号sf(n)を逆フィルタして、信号sv(n)を生
成する。
【0031】以下、図2の例と同様、信号sv(n)を
ハミング窓手段(413)で窓かけして、スペクトル計
算手段(414)に入力し、スペクトル計算手段(41
4)で信号sv(n)のパワースペクトルを計算する。
スペクトルをAbS声道パラメータ分析手段(415)
に入力し、AbSの最初の極の値を決定するために声道
による極の選択手段(410)から得られた声道による
極のみをチャネルdでAbS声道パラメータ分析手段
(415)に入力する。
ハミング窓手段(413)で窓かけして、スペクトル計
算手段(414)に入力し、スペクトル計算手段(41
4)で信号sv(n)のパワースペクトルを計算する。
スペクトルをAbS声道パラメータ分析手段(415)
に入力し、AbSの最初の極の値を決定するために声道
による極の選択手段(410)から得られた声道による
極のみをチャネルdでAbS声道パラメータ分析手段
(415)に入力する。
【0032】AbS声道パラメータ分析手段(415)
でスペクトル領域で信号sv(n)の声道パラメータを
抽出し、抽出したパラメータの値を複素な共振成分から
フィルタ係数への変換する手段(416)でフィルタ係
数に変換する。各パラメータの3つのフィルタ係数を3
次の逆フィルタ(417)に入力し、信号sw(n)を
逆フィルタして、音源と放射特性のみがある信号sg
(n)を生成する。
でスペクトル領域で信号sv(n)の声道パラメータを
抽出し、抽出したパラメータの値を複素な共振成分から
フィルタ係数への変換する手段(416)でフィルタ係
数に変換する。各パラメータの3つのフィルタ係数を3
次の逆フィルタ(417)に入力し、信号sw(n)を
逆フィルタして、音源と放射特性のみがある信号sg
(n)を生成する。
【0033】信号sg(n)からAbS時間領域の音源
パラメータ分析手段(418)で音源パラメータの値を
抽出する。音源パラメータの値とAbS声道パラメータ
分析手段(415)から得た声道パラメータの値をAb
Sスペクトル領域の全体パラメータを調整する手段(4
19)に入力し、信号sw(n)を用いるAbSスペク
トル領域の全体パラメータを調整する手段(419)で
全パラメータを調整し、調整した声道パラメータの値と
音源パラメータの値を出力する。
パラメータ分析手段(418)で音源パラメータの値を
抽出する。音源パラメータの値とAbS声道パラメータ
分析手段(415)から得た声道パラメータの値をAb
Sスペクトル領域の全体パラメータを調整する手段(4
19)に入力し、信号sw(n)を用いるAbSスペク
トル領域の全体パラメータを調整する手段(419)で
全パラメータを調整し、調整した声道パラメータの値と
音源パラメータの値を出力する。
【0034】AbS時間領域の音源パラメータの分析手
段(316)の入力の信号の例を図9と図11に示し
た。従来のAIF方法から得られる入力信号例を図8,
図10に示したので、比較すると、本実施例により得ら
れる波形が正確であることが判かる。なお、図9は図6
の合成音声データから得た音源波形(実線−図7参照)
および音源モデルの波形(点線)を示す。図11は図1
0の従来例と同じ自然音声データから得た音源波形(実
線)および音源モデルの波形(点線)を示す。加えて、
本分析装置の各処理過程に必要な計算は、汎用計算機を
ソフトウェアで制御することによっても実施可能であ
る。
段(316)の入力の信号の例を図9と図11に示し
た。従来のAIF方法から得られる入力信号例を図8,
図10に示したので、比較すると、本実施例により得ら
れる波形が正確であることが判かる。なお、図9は図6
の合成音声データから得た音源波形(実線−図7参照)
および音源モデルの波形(点線)を示す。図11は図1
0の従来例と同じ自然音声データから得た音源波形(実
線)および音源モデルの波形(点線)を示す。加えて、
本分析装置の各処理過程に必要な計算は、汎用計算機を
ソフトウェアで制御することによっても実施可能であ
る。
【0035】以上、説明したように、図1のLPC係数
から極の値への変換手段(104)、音源による極を除
去する手段(105)によって音源の影響を取り除い
て、声道パラメータを分析する手段(106)で声道パ
ラメータを分析するので、音声分析は従来よりも正確に
行える。さらに、声道パラメータの成分を除去する手段
(107)では声道パラメータの影響のみを取り除い
て、音源パラメータを分析する手段(108)で音源パ
ラメータを分析するので、従来より正確な分析ができ
る。
から極の値への変換手段(104)、音源による極を除
去する手段(105)によって音源の影響を取り除い
て、声道パラメータを分析する手段(106)で声道パ
ラメータを分析するので、音声分析は従来よりも正確に
行える。さらに、声道パラメータの成分を除去する手段
(107)では声道パラメータの影響のみを取り除い
て、音源パラメータを分析する手段(108)で音源パ
ラメータを分析するので、従来より正確な分析ができ
る。
【0036】
【発明の効果】以上、説明したように、声道パラメータ
および音源パラメータをそれぞれ分析する際に、分析対
象の音声波形から他方のパラメータ成分を除去するので
各個別のパラメータについて分析精度が向上する。
および音源パラメータをそれぞれ分析する際に、分析対
象の音声波形から他方のパラメータ成分を除去するので
各個別のパラメータについて分析精度が向上する。
【図1】本発明実施例の基本構成を示すブロック図であ
る。
る。
【図2】本発明実施例の具体例を示すブロック図であ
る。
る。
【図3】本発明実施例の他の構成を示すブロック図であ
る。
る。
【図4】音源モデルのスペクトルと従来技術で得た予測
次数1のLPC分析によるスペクトル包絡を示す特性図
である。
次数1のLPC分析によるスペクトル包絡を示す特性図
である。
【図5】音源モデルのスペクトルと予測次数5のLPC
分析によるスペクトル包絡を示す特性図である。
分析によるスペクトル包絡を示す特性図である。
【図6】合成音声波形の一例を示す波形図である。
【図7】図6の合成音声の音源波形を示す波形図であ
る。
る。
【図8】従来技術で図6のデータから得た音源波形と音
源モデルの波形を示す波形図である。
源モデルの波形を示す波形図である。
【図9】本発明の履行で図6のデータから得た音源波形
と音源モデルの波形を示す波形図である。
と音源モデルの波形を示す波形図である。
【図10】従来技術で自然音声データから得た音源波形
と音源モデルの波形を示す波形図である。
と音源モデルの波形を示す波形図である。
【図11】図10と同じ自然音声データから得た本発明
の音源波形と音源モデルの波形を示す波形図である。
の音源波形と音源モデルの波形を示す波形図である。
【図12】従来装置の回路構成を示すブロック図であ
る。
る。
101 分析窓手段 102 一次のスペクトルの平坦化手段 103 高次LPC分析手段 104 LPC係数から極の値への変換手段 105 音源による極を除去する手段 106 声道パラメータを分析する手段 107 声道パラメータの成分を除去する手段 108 音源パラメータを分析する手段 109 全体パラメータを調整する手段
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成4年7月28日
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】図2
【補正方法】変更
【補正内容】
【図2】
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】図3
【補正方法】変更
【補正内容】
【図3】
Claims (1)
- 【請求項1】 音声波形に基づき、声道パラメータおよ
び音源パラメータに関して、それぞれ分析する音声分析
装置において、 前記声道パラメータの分析を行う際に、前記音声波形か
ら前記音源パラメータの成分を除去する手段と、前記音
源パラメータの分析を行う際に前記音声波形から前記声
道パラメータの成分を除去する手段とを具えことを特徴
とする音声分析装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4166394A JPH064098A (ja) | 1992-06-24 | 1992-06-24 | 音声分析装置 |
US08/081,674 US5577160A (en) | 1992-06-24 | 1993-06-23 | Speech analysis apparatus for extracting glottal source parameters and formant parameters |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4166394A JPH064098A (ja) | 1992-06-24 | 1992-06-24 | 音声分析装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH064098A true JPH064098A (ja) | 1994-01-14 |
Family
ID=15830608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4166394A Pending JPH064098A (ja) | 1992-06-24 | 1992-06-24 | 音声分析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH064098A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019035864A (ja) * | 2017-08-17 | 2019-03-07 | 国立研究開発法人情報通信研究機構 | 声門流成分推定装置、プログラムおよび方法 |
-
1992
- 1992-06-24 JP JP4166394A patent/JPH064098A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019035864A (ja) * | 2017-08-17 | 2019-03-07 | 国立研究開発法人情報通信研究機構 | 声門流成分推定装置、プログラムおよび方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0673013A1 (en) | Signal encoding and decoding system | |
EP1422693B1 (en) | Pitch waveform signal generation apparatus; pitch waveform signal generation method; and program | |
US4081605A (en) | Speech signal fundamental period extractor | |
US5577160A (en) | Speech analysis apparatus for extracting glottal source parameters and formant parameters | |
JPH064098A (ja) | 音声分析装置 | |
JP3035939B2 (ja) | 音声分析合成装置 | |
JPH04116700A (ja) | 音声分析・合成装置 | |
JP3398968B2 (ja) | 音声分析合成方法 | |
JP3289511B2 (ja) | 音声合成用音源データ作成方法 | |
JPH07261798A (ja) | 音声分析合成装置 | |
JP3166673B2 (ja) | ボコーダ符号化復号装置 | |
JPH06202695A (ja) | 音声信号処理装置 | |
JP3282595B2 (ja) | 音声符号化・復号化装置及び通信装置 | |
Raffaeli et al. | Adaptive Speech Compression and Decompression for Communications | |
JP2621376B2 (ja) | マルチパルス符号化装置 | |
JPH0636157B2 (ja) | 帯域分割型ボコ−ダ | |
JPH06348298A (ja) | 音声分析装置 | |
JPS62102294A (ja) | 音声符号化方式 | |
JP2535809B2 (ja) | 線形予測型音声分析合成装置 | |
JPS599920B2 (ja) | 音声パラメ−タの修正方式 | |
JP2956938B2 (ja) | 音声分析装置 | |
JP2753716B2 (ja) | 音声変換装置 | |
JPS5912198B2 (ja) | 音声パラメ−タ異常検出方式 | |
JPS61124997A (ja) | 信号分析装置 | |
JPH09160595A (ja) | 音声合成方法 |