JPH0318720B2

JPH0318720B2 -

Info

Publication number: JPH0318720B2
Application number: JP58123666A
Authority: JP
Inventors: Satoru Nakamura; Koji Fujimoto; Mitsuhiro Toya
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1983-07-06
Filing date: 1983-07-06
Publication date: 1991-03-13
Also published as: JPS6014300A

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、重み付き自己相関係数を用いて音声
の特徴抽出を行う音声の特徴抽出方法に関するも
のである。

（従来技術及び背景）従来より、自己相関係数が音声の特徴として多
用されているが、これは聴覚がスペクトル情報に
対応していることによつており、自己相関係数は
Wiener−Khintchineの公式により正規化パワー
スペクトルに対応している。今、デイジタル化さ
れた音声信号をＳ（ｎ）、相関関数をＲ（τ）とす
ると、Ｒ（τ）＝１／Ｎ_N 〓^K=1 Ｓ（Ｋ）・Ｓ（Ｋ＋τ） ……(1) で表わされ、さらに、Ｒ（τ）をＲ（φ）で正規化
することにより(2)式のように自己相関係数Ｃ（τ）
を得る。

Ｃ（τ）＝Ｒ（τ）／Ｒ（φ） ……(2) 従来の方式では、上式のＲ（τ）を分析フレー
ム毎に抽出し特徴パラメータとしているが、
Ａ／Ｄ変換の際の高周波成分のダイナミツクレン
ジを大きくとるためと、音声波形が一般に−
6dB／oct程度の周波数特性をもつていることの
二つから、Ａ／Ｄ変換の前に＋6dB／octのプリ
エンフアシスを施している。これにより、周波数
の次元ではスペクトルが平坦化される効果がある
が、自己相関の次元では、スペクトルは自己相関
波形に対し重なり合う形（従属する形）で存在す
るので、ホルマントの弁別、ホルマントの変動に
対して極めて弱いパラメータとなつている。

ところで、音声をその音源が声帯であるか否か
により分けると、母音等に代表される有音声と摩
擦系子音に代表される無声音とがある。継続時間
的にも長い有声音については、声道の伝達特性が
音韻性を決定し、声道伝達特性は声道における共
振、反共振により規定され、周波数領域上でのス
ペクトル包絡となる。また、このスペクトル包絡
上では、音声の音韻情報は包絡の谷より山のピー
クにあつてホルマントと呼ばれており、周波数の
低い方から２つないしは３つ目の第３ホルマント
までによつて音韻性の大部分を表現している。こ
こに第１ホルマントは、同一話者内の発声変動が
比較的小さく弁別精度はよいが、全ての有声音の
弁別はできず、大まかなグループ分けに効果があ
るのみである。他方、第２、第３ホルマントは発
声変動が大きいが有声音の弁別には不可欠なの
で、上記第１ホルマントと併用する必要がある。
日本語５母音については、第１ホルマントと第２
ホルマントの２軸により非常によく分離でき、
BPF群の出力をパラメータとする方法では、こ
れに基いて有声音を弁別している。自己相関係数
を用いる方法でも、２チヤンネルのBPFの出力
より求めた２系列の自己相関係数を用いれば可能
である。しかし、パラメータ数が２倍になること
及びこれに伴つてのメモリー増加、応答時間の増
加など多くの問題がある。

（発明の目的）そこで本発明では、自己相関係数の性質に基づ
き２系列を持つことなく、第１ホルマント、第
２、３ホルマントを効果的に弁別し得るパラメー
タの抽出方法を提供することを目的とする。

この目的を達成するため考究されたことは、入
力信号をｘ（ｎ）、自己相関関数をＲ（τ）、パワー
スペクトルＰ(f)、複素スペクトルＦ(f)の関係が第
１図で示されるが、第１図のように、パワースペ
クトルと自己相関関数はフーリエ変換で結ばれて
いるので、Ｐ(f)が高域で強ければ、自己相関関数
波形は小さな周期の波となり、逆の場合は大きな
周期となり、波形としてはこれらの重なり合つた
形となつている。これは、フーリエ変換が直交変
換であることから自己相関の次元では、周波数は
独立でなく従属関係にあるためである。また、自
己相関波のピークに関しては、単一共振の場合、
Ｔ＝１／ｆより相関遅れτ＝Ｔのときピークを示
す。このことから、Ｐ(f)上で高域に主成分のある
ものは、自己相関関数の低次に既に情報があり、
高次についてはその繰り返しとなる。逆に、低域
に主成分のあるものは、自己相関の高次に情報を
含む。従つて次の知見を得る。

Ａ第１ホルマントの弁別のためには、入力音声
信号を低域強調すればよく、このとき自己相関
上では、高次（遅れ時間τが大）に弁別的特徴
が現れる。

Ｂ第２、第３ホルマントの弁別のためには、原
波形に対して高域強調すればよく、このとき自
己相関上では、低次に弁別的特徴が現れる。

（発明の概要）このため、本発明は、音声入力信号の高域成分
を低域成分よりも強調する処理を行つた信号に対
応した自己相関係数の低次を抽出し、音声入力信
号の低域成分を高域成分よりも強調する処理を行
つた信号に対応した自己相関係数の高次を抽出
し、上記自己相関係数の低次と高次とを組み合わ
せて重み付き自己相関係数を求め、この重み付き
自己相関係数から音声入力信号の特徴を抽出する
ことを特徴としている。

また、本発明は、音声入力信号の高域成分を低
域成分よりも強調する処理を行つた信号に対応し
た自己相関係数の低次を抽出し、音声入力信号の
高域成分を低域成分よりも強調する処理を行つた
信号に対応した自己相関係数を低域重み付け処理
することによつて得られる自己相関係数の高次を
抽出し、上記自己相関係数の低次と高次とを組み
合わせて重み付き自己相関係数を求め、この重み
付き自己相関係数から音声入力信号の特徴と抽出
することをいま一つの特徴としている。

（実施例）以下、本発明を実施例に基づいて説明するが、
実施例を開示するに当り、予め、実施例に係る特
徴抽出方式の物理・数学的な根拠を与えておく。

すなわち、プリエンンフアシスされＡ／Ｄ変換
された入力信号Ｓ（ｎ）に対し、低域強調した出
力信号をＺ（ｎ）とし、(3)式のように１次系によ
るフイルタリングを考える。

Ｚ（ｎ）＝ｙ（ｎ）＋μy（ｎ−１）……(3) ここで、μは重み付け係数である。このとき、
伝達特性Ｈ（ｚ）は、Ｈ（ｚ）＝Ｚ（ｚ）／ｙ（ｚ）＝１＋μ₂ ^-1 …(4) Ｚ＝e^j〓として周波数伝達特性を求めると、｜Ｈ（e^j〓）｜²＝（１＋μe^-j〓）・（１＋μe^j〓）＝（１＋μ²）＋2μcosω …(5) ここで、重み係数をμ＝１とすると、｜Ｈ（e^j〓）｜²は(7)式で与えられる。

｜Ｈ（e^j〓）｜²＝２（１＋cosω） …(7) (7)式より、周波数特性にcosω形の低域強調を行
うことになる。

一方、Ｚ（ｎ）の自己相関関数Rz（τ）は、 Rz（τ）＝１／Ｍ_M 〓ⁱ⁼¹ Ｚ(i)Ｚ（ｉ＋τ）＝１／Ｍ_M 〓ⁱ⁼¹ （ｙ(i)＋μy（ｉ−１）・（ｙ（ｉ＋τ）＋μy（ｉ＋τ−１））＝１／Ｍ_M 〓ⁱ⁼¹ （ｙ(i)ｙ（ｉ＋τ）＋ μ²y（ｉ−１）ｙ（ｉ＋τ−１）＋ μy（ｉ−１）ｙ（ｉ＋τ）＋μy(i)ｙ（ｉ＋τ−１））＝（１＋μ²）Ry（τ）＋μ（Ry（τ＋
１）＋Ry（τ−１）） ……(8) 自己相関係数Cz（τ）は、 Cz（τ）＝Rz（τ）／Rz（φ）＝（１＋μ²）Ry（τ）
＋μ（Ry（τ＋１）＋Ry（τ＋１））／（１＋μ²）Ry
（０）＋2μRy(1) ＝（１＋μ²）Cy（τ）＋μ（Cy
（τ＋１）＋Cy（τ−１））／（１＋μ²）＋2μCy(1)
……(9) さらに、μ＝１として、 Cz（τ）＝2Cy（τ）＋Cy（τ＋１）＋Cy（τ−１）
／２（１＋Cy(1)） ……(10) この(10)式により、プリエンフアシスされた信号
から求められる自己相関係数から低域の重み付け
を行つた自己相関係数が単純な演算で求められ
る。従つて、切り換え自己相関係数の次数をθAL
とすると、相関次数τは、 φ≦τ＜θ_ALのとき、高域強調による Cy（τ）；(2)式に基づくもの。

θ_AL≦τ＜τ_MAXのとき、高域強調に低域重み
付けを行つたCz（τ）；(10)式に基づくもの。

（ただし、τ_MAX（θ_MAX）は、分析する最大次数）を用いることで、第１、第２、第３ホルマントに
対する弁別能力を効果的に増加できる。この概念
を図解した説明図を第２図のａ，ｂ，ｃ，ｄ，ｅ
順次に示す。

第３図は、本案特徴抽出方式の実施例を示す。
第３図において、マイクロホン１より、音声が入
力されアンプ２に入る。アンプ２で増巾された信
号１０２は、プリエンフアシス回路３に入る。プ
リエンフアシス回路３は、約1KHzから6dB／oct
の高域強調特性となつている。プリエンフアシス
回路３の出力１０３は、ローパスフイルタの
LPF４に入力される。LPF４は、Ａ／Ｄ変換の
折り返し雑音を除くためのアンチエイリアスフイ
ルタとなつている。LDF４の出力１０４は、
Ａ／Ｄ変換器５に入力されデイジタル信号１０５
に変換された後、自己相関器６に入力される。自
己相関器６では、5ms〜10ms程度の分析区間内
の自己相関係数１０６が求められ、分析区間終了
毎に重み付き組み合わせ自己相関係数演算回路７
に送られ、前掲の式(10)に基づく変換と組み合わせ
処理後、判別処理回路８に送られ、ここで音声の
識別が行なわれる。

次に、第４図に従つて、第３図の重み付き組み
合わせ自己相関係数演算回路７の詳細を示し、具
体的な動作を説明する。

回路７の各ブロツク要素は制御回路部７０によ
つて統括して制御される。

(イ) 式(10)における分母部分の計算初期状態では、マルチプレクサ７４セレクト信
号２０３により“１”をセレクトしている。次
に、アドレス制御信号２０１によりアドレス１を
出力し、リード制御信号２０２により、第１のバ
ツフア７１からＣ(1)が信号線３０１に出力され
る。加算器７２は信号線３０１上のＣ(1)と信号線
３０４上の値を加算し、第１のレジスタ７３に格
納する。第１のレジスタ７３の出力線３０３は、
さらに、シフト回路あるいは加算器により成る２
倍演算器７５により２倍される。２倍された値は
信号線３０５を経て第２のレジスタ７６に格納さ
れる。これで第２レジスタ７６には、式(10)の分母
の値が格納されたことになる。

(ロ) 自己相関次数φ＜τ＜τ_ALの場合この場合、アドレス制御信号２０１にアドレス
τを出力し、リード制御信号２０２は、第１のバ
ツフア７１から次数順に自己相関係数を信号線３
０１に出力する。このとき、マルチプレクサ８
は、制御信号２０７により信号線３０１をセレク
トしているので、第２のバツフア７９の入力線３
０８は、信号線３０１に接続されており、アドレ
ス制御信号２０９にアドレスτを出力し、ライト
制御信号２０８により第２のバツフア７９に格納
される。以上の演算がφ＜τ＜τ_ALのτについて
くり返される。

(ハ) 自己相関次数τ_AL≦τ≦τ_MAXの場合まず、アドレス制御信号２０１にアドレスτを
出力し、リード制御信号２０２により、信号線３
０１にＣ（τ）が出力され、第１レジスタ７３に
格納される。このとき、マルチプレクサ７４は
“φ”をセレクトして、加算器７２は“φ”を加
算する。次に第１レジスタ７３の値Ｃ（τ）は、
信号線３０３に出力され、２倍演算器７５を通
る。次に、制御回路部７０は、アドレス制御信号
２０１にアドレス（τ−１）を出力し、リード制
御信号２０２により第１バツフア７１からＣ（τ
−１）を信号線３０１に出力する。マルチプレク
サ７４は、このとき、制御信号２０３により、信
号線３０５にセレクトされていて、加算器７２に
より2C（τ）＋Ｃ（τ−１）が演算され第１レジス
タ７３に格納される。さらに、アドレス制御線２
０１に、アドレス（τ＋１）を出力し、リード制
御線２０２により第１バツフア７１からＣ（τ＋
１）が信号線３０１に出力される。このとき、マ
ツチプレクサ７４は、再び信号線３０３をセレク
トしており、レジスタ１の出力３０３と、信号線
３０１上のＣ（τ＋１）が加算され、式(10)の分子
の値が第１レジスタ７３に格納される。

そこで、１／ｘ・ROMあるいは除算ソフトウ
エアにより構成される割り算回路７７は、信号線
３０３と３０６の値を読み込み、割り算を実行し
てC′（τ）を信号線３０７に出力する。このとき、
マルチプレクサ７８は信号線３０７をセレクトし
ていてアドレス制御線２０９にアドレスτを出力
し、ライト制御線２０８により第２のバツフア７
９に格納される。以上の演算がτ_AL≦τ≦τ_MAXの
τについてくり返される。

以上の如くして重み付き組み合わせ自己相関係
数が第２のバツフア７９に格納される。また、第
２のバツフア７９の内容はアドレス制御信号２０
９にアドレスτを出力し、リード制御線２１０に
より遂次、信号線１０７に出力され、判別処理回
路８に送られ音声の識別が行なわれる。

（効果）以上のことから明らかなように、本発明によれ
ば、音声入力信号の高域成分を低域成分よりも強
調する処理を行つた信号に対応した自己相関係数
の低次と、音声入力信号の低域成分を高域成分よ
りも強調する処理を行つた信号に対応した自己相
関係数の高次とを組み合わせて求めた重み付き自
己相関係数から音声入力信号の特徴を抽出する方
法であるので、従来のように２系列の自己相関係
数を持つことなく第１ホルマント及び第２、第３
ホルマントを精度よく弁別し得るパラメータを抽
出できる効果がある。

また、本発明によれば、音声入力信号の高域成
分を低域成分よりも強調する処理を行つた信号に
対応した自己相関係数とその低域重み付け処理を
行つた自己相関係数とから音声入力信号の特徴を
抽出する方法であるので、１系列の自己相関係数
により、パラメータ数を増加させることなく、小
さいメモリ容量で、第１フオルマント及び第２、
第３フオルマントを短い応答時間で精度よく抽出
することができる。

【図面の簡単な説明】

第１図は入力信号ｘ（ｎ）、その自己相関関数Ｒ
（τ）、パワースペクトルＰ(f)及び複素スペクトル
Ｆ(f)の関係を示す説明図、第２図は本発明の基本
概念を示す説明図、第３図は本発明の実施例を示
すブロツク図、第４図は第３図中の重み付き組み
合わせ自己相関演算回路７を詳細に示したブロツ
ク回路図である。３…プリエンフアシス回路、４…ローパスフイ
ルタ（LPF）、５…Ａ／Ｄ変換器、６…自己相関
器、７…重み付き組み合わせ自己相関演算回路。

Claims

【特許請求の範囲】１音声入力信号の高域成分を低域成分よりも強
調する処理を行つた信号に対応した自己相関係数
の低次を抽出し、音声入力信号の低域成分を高域
成分よりも強調する処理を行つた信号に対応した
自己相関係数の高次を抽出し、上記自己相関係数
の低次と高次とを組み合わせて重み付き自己相関
係数を求め、この重み付き自己相関係数から音声
入力信号の特徴と抽出することを特徴とする音声
の特徴抽出方法。２音声入力信号の高域成分を低域成分よりも強
調する処理を行つた信号に対応した自己相関係数
の低次を抽出し、音声入力信号の高域成分を低域
成分よりも強調する処理を行つた信号に対応した
自己相関係数を低域重み付け処理することによつ
て得られる自己相関係数の高次を抽出し、上記自
己相関係数の低次と高次とを組み合わせて重み付
き自己相関係数を求め、この重み付き自己相関係
数から音声入力信号の特徴と抽出することを特徴
とする音声の特徴抽出方法。