JPS6297000A

JPS6297000A - 音分析方法

Info

Publication number: JPS6297000A
Application number: JP61146317A
Authority: JP
Inventors: エルンスト・ブンゲ
Original assignee: Philips Gloeilampenfabrieken NV
Current assignee: Koninklijke Philips NV
Priority date: 1977-05-07
Filing date: 1986-06-24
Publication date: 1987-05-06
Also published as: JPS6356560B2; JPS53139403A; US4490839A; FR2389963B1; FR2389963A1; DE2720666C2; DE2720666A1; GB1586944A; JPS6152479B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は音分析方法に関するもので、更に詳しく云えば
、一定の制限された時間内に口で話されたテキス）　（
ｓｐｏｋｅｎ　ｔｅｘｔ）を電気信号に変換して記憶し
た音を分析して話者を識別するための音分析方法に関す
るものである。前記の信号から、連続した短期間（例え
ば１０ｍ５−２０ｍ５　）の部分信号を有する短期間ス
ペクトルを発生させる。これらの部分信号は、隣接スペ
クトル範囲内のエネルギの内容を示す。すべての短期間
スペクトルは加算されて１つの長期間スペクトルを形成
し、少な（ともこの長期間スペクトルが音分析装置に供
給される。

話者識別の背景となる情報としては、１９７６年４月発
行「プロシーディングズ　オブ　ジ　アイイーイーイー
Ｊ　　（ｒＰｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　Ｉ
ＢＥε」）の６４巻第４号のＡ、Ｅ、Ｒｏｓｅｎｂｅｒ
ｇ　（４７５−４８７頁）およびＢ、Ｓ、Ａｔａｌ　（
４６０−４７５頁）の論文ならびニコれら論文に引用さ
れた参考文献が参考になる。

このような長期間会話スペクトルは、今日まで音分析方
法例えば音声および話者識別にも用いられてきた。特に
話者の識別は、以下のような状況に対して銀行業務に用
いることができる。すなわち、顧客が口頭で指示を与え
、顧客の音声によって顧客のＨＥＲを行なう。すなわち
記録された音声サンプルを分析装置において顧客の以前
の音声サンプルと比較する。

顧客が電話によって口頭指示を与えることにより確認で
きることも望ましい。しかし電話線を通しての音声の伝
送においては、音声信号は伝送路の種々の伝達関数によ
って影響を受ける。音声信号は、自動システムによる連
続識別が著しく妨害されあるいは不可能となる程に変化
することがある。このことはまた、たとえば、監視のた
めにモニタ中央局に伝送されてそこで標準音と比較され
る他の音にも当て嵌る。

本発明の目的は、音源と分析器装置との間の伝送路の伝
達関数の妨害影響が大巾に排除された、音分析方法ある
いは音声および話者の識別方法を提供することにある。

本発明は、制限期間内に発生され、電気音響信号に変換
された音を分析する方法において、この電気信号から、
隣接スペクトル範囲の音のエネルギ内容を示す短期間ス
ペクトルを連続した短かい時間間隔で発生させ、すべて
の短期間スペクトルを加算して１つの長期間スペクトル
を形成し、各短期間スペクトルと前の短期間スペクトル
との差を形成し、全部の差から中間値を取り出し、この
中間値を前記長期間スペクトルにより除算してその商を
形成し、この商を分析装置に供給することによって前記
目的を達成している。除算される２つの入力順の夫々は
電話線伝達関数の周波数重み付は係数（ｗｅｉｇｈｔｉ
ｎｇ　ｆａｃｔｏｓ）を有し、この係数は除算によって
消去され、これにより未知の電話線伝達関数の影響が除
去される。したがって、長期間スペクトルの変化は、長
期間スペクトル自身の代りに、分析のための特性として
用いられる。

これら変化は長期間スペクトルに関係しているので、個
々のスペクトル範囲の係数のベクトルとして表わすこと
のできる直線伝達関数の影響は、数学的に容易に推定で
きるように、理想的な場合に完全に排除される。前の平
均値に対する差が形成されると、これら差は音声信号と
並列して即座に処理することができ、他方、長期間スペ
クトルに対する差は期間の終りに実行することができる
のみであり、したがって長期間スペクトルは中間記憶装
置に記憶されなければならない。

中間値の取り出しは種々の方法で行なうことができる。

取り出された中間値は、差の２乗の和の平方根を差の数
で除算したものとするのが好適である。このようにして
、いわゆる標準偏差が決定される。他の方法は、中間値
を、差の値の和を差の数で除算したものとすることであ
る。この方法は幾分容易であり且つ幾分安価である。

本発明によれば、次の２つの別の商Ｑ＋　、Ｑ２が得ら
れる。

Ｑ、＝Ｆ　（ＳＴＩ　　−３Ｔ２　）／ＬＴＱ２　＝　
Ｆ　（Ｓ　Ｔ＋　　　Ｓ　Ｔ２　　）　／　ＬＴこの場
合Ｆ（・・）は括弧内の数量の関数を示し、この関数は
前述の「中間値」を表わす。またＬＴとＳＴは夫々長期
間および短期間を表わす。前記の関数はＱｌおよびＱ２
に対して次のように表すことができる、即ちＱｌに対し
てはＦ、、（ＳＴ−３Ｔ２　）　＝　（Ｉ／Ｎ）Σ（ＳＴ、
　−３Ｔ２　）またＱ２に対してはＦ２１（ＳＴ−ＬＴ）　＝　（Ｉ／Ｎ）　Ｅ　（ＳＴ、
　−ＬＴ）Ｆ２□（ＳＴ−ＬＴ）　　＝　　（１／Ｎ）
　　ビΣ　（ＳＴ、　　　−ＬＴ　　）２この場合Ｎは
差の数を表わす。

前記差を、所定数の連続短期間スペクトルの平均値を示
す平均期間スペクトルから形成するのが好適である。こ
の場合には少数の信号のみを記憶するのが必要であり、
全体の装置の必要な処理速度は小さくなる。組み合わさ
れる連続短期間スペクトルの数の適切な選択によって、
すなわち各平均値スペクトルに対する期間の適切な選択
によって、識別の可能性はさらに改良される。

以下、本発明の実施例を図面に基づいて説明する。

第１図は、本発明音分析方法を示すブロック線図である
。分析すべき音をフィルタバンク１に供給する。このフ
ィルタバンクは、隣接する通過帯域を有する複数個のフ
ィルタを具えている。これらフィルタの出力端子、例え
ば前述のＲ１ε、　Ｒｏｓｅｎｂｅｒｇの論文に記載さ
れているように各整流器および低域フィルタを経て、直
接に引き出すことができる。しかしながら、フィルタの
出力端子は、これら出力値を循環的に連続して走査して
これら出力値をフィルタバンクの出力端子に通過させる
多重装置に接続されることが屡々ある。この場合一般に
、マルチプレクサの循環時間は、１〜２０ｍ５の範囲に
ある。このことは、連続短期間スペクトルの個々の値が
連続的に供給され、２個の連続した短期間スペクトルの
間隔がマルチプレクサの循環時間に等しいことを意味し
ている。第１図の実施例は、唯１個のマルチプレクサ出
力端子を有するフィルタバンクを示している。

フィルタバンクの出力端子を、累算器８に接続する。こ
の累算器は、多数の連続した短期間スペクトルすなわち
各スペクトル成分を別々に且つ連続的にその部所加算す
る。このためには累算器８は、加算器、およびこの加算
器に接続されスペクトル範囲の数に等しい多数の段を有
するシフトレジスタを具えるのが好適である。このシフ
トレジスタの各段は、平均期間スペクトル中のスペクト
ル成分を示す２進数に生じうる最大数のビットに等しい
複数個の並列記憶位置を具えている。フィルタバンクは
、その都度、スペクトル成分に対して新しい信号を供給
し、加算によってこれまでに得られた関連値はシフトレ
ジスタの出力端子に達しており、２つの値が加算されて
シフトレジスタの第１段に書込まれ、もはや必要とされ
ない最も古いシフトレジスタより取り除かれる。所定数
の短期間スペクトルの後、シフトレジスタの出力端子が
累算器８の出力端子に切換えられ、スペクトル成分の次
の加算が零値で再び開始する。平均値を形成するために
、加算された短期間スペクトルの数による除算は、この
数が２の整数累乗である場合に特に簡単である。他の場
合には、除算器をシフトレジスタの出力端子と累算器８
の出力端子との間に設けなければならない。累算器８の
この基本的な実施形は特に知られており、本発明の目的
ではない。

累算器８の出力端子を、他の累算器２の入力端子に接続
する。この累算器は、個々のスペクトル値に基づいてす
べての平均期間スペクトルを別個に加算するもので、相
応的に多数の位置を有するという意思外は累算器８と同
様に構成することができる。

さらに、累算器８の出力端子を、減算器４の入力端子と
記憶装置５とに接続し、この記憶装置の出力端子を減算
器４の他方の減算入力端子に接続する。記憶装置５がス
ペクトル範囲の数に等しい多数のステップだけ受信信号
を遅延させる場合には、記憶装置５の出力端子に得られ
るスペクトルの値はこの値が前のスペクトルのスペクト
ル値であるということ以外は減算器４の入力端子におけ
ろスペクトル値と同じである。これを達成するためには
、記憶装置５をスペクトル値の数に等しい多数の役を有
するシフトレジスタとして実行することができる。各段
が、１つのスペクトル値に対する最大可能なビット数に
相当する多数の記憶位置を具えている。

減算器４は、２つのマルチビット２進数を処理するよう
に構成され、基本的に知られた構造、たとえば補数値の
加算による減算構造を有している。

減算器４の出力端子を、やはり累算器８と同様に形成す
ることのできる累算器６の入力端子に接続する。しかし
、この累算器６は減算器４により供給された数の絶対数
のみを、すなわち符号を考慮することなく処理し、その
出力端子に所謂中間値を与える。

累算器２および６の出力端子を、除算器７の入力端子に
接続する。この除算器は、累算器６の出力端子の値を累
算器２の出力端子の値によって除算する。これは、たと
えば、連続的減算によって公知のように行なうことがで
き、このためには除算器７は公知のように構成される。

上述した実施例では、累算器２および６は、総和を加算
値の数で除算して供給する必要はなく、総和を除算器７
に直接に供給することができる。

その理由は、２つの和に対してほぼ同一である除数がこ
れら２つの値が除算されるときに消去されるからである
。減算器４における２つの連続値のその都度の差形成の
ために累算器６が累算器２よりも小さい１つの値を加算
するという事実によって生じるわずかな偏差は、たいて
いの場合無視することができる。累算器２および６は、
出力値を除算器７に連続して供給し、スペクトル値に基
づいて分離される。したがって、連続スペクトル範囲に
対する値が、この除算器の出力端子に連続して発生する
。、これらの値を分析器装置３に供給して、同じ方法で
得られた複数個の値とここで比較する。分析器装置３は
、同じようにプログラムされた多目的コンピュータとす
ることができるが、本発明の一部を形成するものではな
い。

第２図は別の実施例を示し、第１図の要素に対応する要
素には同一の番号を付して示す。ここではフィルタバン
ク１の出力端子を、累算器８および２に並列に接続する
。このフィルタバンクは、第１図で説明したと同様に構
成される。累算器８の出力端子を記憶装置９に接続する
。この記憶装置は、録音あるいは音声伝送の制限期間中
に累算器８によって発生されるすべての信号を記憶する
。

これと並列して、長期間スペクトルが累算器２において
やはり形成され、スペクトル範囲に基づいて分離され、
期間の終りに記憶装置５に入力される。

記憶装置５の出力端子をやはり減算器４の減算入力端子
に接続し、減算器４の一方の入力端子を記憶装置９の出
力端子に接続する。音が完全に記憶されると、その結果
記憶装置５は長期間スペクトルを有し、これらのスペク
トル部分は連続的且つ循環的に減算器４に供給される。

同時に、記憶装置９に記憶された平均期間スペクトルの
対応スペクトル成分が減算記憶装置４に供給される。減
算記憶装置４の出力端子は２乗装置１１の入力端子に接
続されている。２乗することによって、２乗装置１１の
出力端子に発生する数は正符号を有し、累算器６におい
て加算される。この実施例では、累算器６および累算器
２も、出力端子の前に設けた除算器を具えなければなら
ない。この除算器はこれらの和を個々の値の数によって
その都度除算する。累算器６の出力信号をさらに開平装
置１２に供給する。この開平装置は、処理動作の終りに
累算器６によって供給される値すなわち前述の中間値の
平方根を形成する。

記憶装置５および開平器１２の出力端子を、除算器７の
入力端子に接続する。この除算器は、標準偏差の個々の
スペクトル値を出力端子に供給し、これらのスペクトル
値を分析器装置３に供給する。

この分析器装置は、正確に言えば、実際には実時間内で
動作しない。その理由は、制限時間の終りに音力ぞ完全
に記憶されるまで差の形成およびそれらの処理を開始す
ることができないからである。

したがって、その瞬時まですべての短期間スペクトルの
すべてのスペクトル値を連続的に処理することは不可能
である。

フィルタバンク１のマルチプレクサの長い循環時間のた
めに、累算器８での平均期間スペクトルの形成は、達成
しうる精度を著しく減少させる。

この場合には、累算器８を省略することができ、フィル
タバンク１の出力端子を累算器２および記憶装置９０入
力端子に、あるいは減算器４および記憶装置５にそれぞ
れ直接に接続することができる。これは、マルチプレク
サの循環時間および処理スペクトルの最大発振周波数に
よってきまる。

他方では、一定数の短期間スペクトルを発生させ、累算
器８によってこれらスペクトルをさらに処理して最適の
識別結果を得ることが、特に音声あるいは話者の識別に
おいて有益である。

高い処理速度が必要とされる場合には、すなわち記憶さ
れた音の期間が終了した後に即座に識別結果が（尋られ
なければならない場合には、フィルタバンク１の出力端
子と分析器装置３の入力端子との間に複数個の要素を設
け、各要素が全てスペクトル値の一部だけを連続的に処
理し、同一スペクトルの数個の値が並行して処理できる
ようにすることが特に第２図に示す装置に必要であろう
。

このことは同一係数で処理速度を上昇させる。制限され
た場合には、各１つのスペクトルのための１つの別個の
装置に対し、実際には実時間状態が再び得られる。

フィルタバンク１の出力端子と分析器装置３の入力端子
との間に設けた要素を、対応的にプログラムした論理演
算ユニットたとえばマイクロプロセッサ内で組み合わせ
ることもできる。

【図面の簡単な説明】

第１図は本発明方法の一実施例を説明するためのブロッ
ク線図、第２図は本発明方法の他の実施例を説明するための同様
ブロック線図である。１・・・フィルタバンク　　２．８．６・・・累算器３
・・・分析器装置　　　　４・・・減算器５．９・・・
記憶装置　　　　７・・・除算器１１・・・２乗装置　
　　　　１２・・・開平装置特許出願人　　ニス・ベー
・フィリップス・フルーイランペンファフリケン

Claims

【特許請求の範囲】１、制限期間内に発生され、電気音響信号に変換された
音を分析する方法において、この電気信号から、隣接ス
ペクトル範囲の音のエネルギ内容を示す短期間スペクト
ルを連続した短かい時間間隔で発生させ、すべての短期
間スペクトルを加算して１つの長期間スペクトルを形成
し、各短期間スペクトルと前の短期間スペクトルとの差
を形成し、全部の差から中間値を取り出し、この中間値
を前記長期間スペクトルにより除算してその商を形成し
、この商を分析装置に供給することを特徴とする音分析
方法。２、特許請求の範囲第１項に記載の方法において、前記
中間値を差の数により除算した差の２乗の和の平方根を
取り出すことにより得ることを特徴とする音分析方法。３、特許請求の範囲第１項に記載の方法において、前記
中間値を、差の数により除算した差の和を取り出すこと
により得ることを特徴とする音分析方法。４、特許請求の範囲第１項に記載の方法において、前記
差を、短期間スペクトルから、所定数の連続短期間スペ
クトルの平均値を示す平均期間スペクトルを取り出すこ
とにより形成し、次いで連続平均期間スペクトル間の差
を形成することを特徴とする音分析方法。