JPS5941600B2

JPS5941600B2 - 話者の身元確認方法および装置

Info

Publication number: JPS5941600B2
Application number: JP51157680A
Authority: JP
Inventors: マ−ヴイン・ロバ−ト・サンバ−
Original assignee: Western Electric Co Inc
Current assignee: AT&T Corp
Priority date: 1975-12-31
Filing date: 1976-12-28
Publication date: 1984-10-08
Also published as: DE2659083C2; DE2659083A1; GB1556218A; US4032711A; JPS5293207A

Description

【発明の詳細な説明】本発明は、話者の認識に関するものである。

個人をその音声に関する物理的な特性から認識あるいは
認証することは、しばしば重要なことである。電話を通
して行なう処理、迅速な信用の認証、あるいは保護され
た領域への入場を制限するというような安全性維持措置
に際して、このような手続きが望まれる。以前は、自動
話者認識システムとは、話者の話したあらかじめ決めら
れた言葉と、前もつて記憶されている同じまたは類似の
言葉の参考例との比較、あるいはその個人の特定の発声
から選んだパラメータと以前に記憶した対応する発声の
パラメータとの比較に基づいていた。このようなパラメ
ータは、ピツチ周期、強度、特定の周波数のフオルマン
トあるいはその帯域幅といつた音声の特性から求められ
るものである。ダブリユーーエフ・フレンチによつて１
９６９年９月９日に出されたアメリカ合衆国特許第３４
６６３９４で発表されているシステムのような場合には
、各ピツチ周期からいくつかのピークと谷を選んで未知
の話者の音声入力の特性係数を求めるために用いており
、これらの係数が１つあるいは複数の以前に記憶された
参照用係数と選択的に比較される。この比較の結果とし
鳳未知の話者の身元について決定が行なわれる。しかし
、この方法では、その個人が参照用係数を求めたときと
は異なる強度を用いた場合に生じる誤りを防止するため
に、特囲係数を強度に関して正規化することが必要とな
る。１９７２年１０月２４日に出されたジ一・アール・
ドツデイントン等の特許３７００８１５で発表され、同
じ譲受人に指定されているもう一つの方法では、個人が
テスト文章を発声する際の特性を、以前に記憶した同じ
文章を発声と比較している。

しかし、この上諏において？瓢テストおよび参照用発声
を一時的に並置する必要がある。従つて比較する前に、
テストの発声のタイムスケールをひずませて、参照用発
声の時間軸とそろえなければならない。これら及び現在
用いられているその他の手法は、発声内容に依存する音
声特性に基づいたものである。

より効果的な方法は、発声の内容ではなく話者の音声器
官の独特な特性を考慮した話者認識という特徴に基づい
たものであるといえる。音声波形の線形予測可能性に基
づく音声分析は、自動話者認識にとつて望ましいいくつ
かの特性を与える。これらの特性はフオルマント周波数
、その帯域幅、および声道波に関する情報のくみあわさ
つたものを表わしており、実質的にピツチや強度につい
ての情報と無関係である。認識されていない話者の線形
予測特囲の、以前に記憶した既知の話者の線形予測特性
との比較に基づく話者認識方式は、フオルマント周波数
や声道波のような選択された音声特徴に限定された方法
ではない。

このように、線形予測特性は話者認識のためのより完壁
た基礎を形成し得るものである。しかし、話者認識への
線形予測特性の使用は、特性が言語的情報および話者に
依存する情報をも含んでいるので、一般にセグメンテー
シヨンあるいは時間正規化が必要となる。本発明の目的
は、実質的に音声信号の言語的な内洋とは独立で且つ信
号の特性の並置を必要としない話者認識の手段を与える
ものである。

発明に従つて、認識されている話者の音声標本の予測分
析からいくつかの参照用予測パラメータ信号を作ること
、および前記参照用予測パラメータ信号に応答して前記
参照用予測パラメータ信号を前記の認識された話者の身
元を表わす一組の信号へ変換するのに適合した一群の参
照用係数信号を発生ずること、および、前記参照用予測
パラメータ信号と前記参照用係数信号とに応答して前記
の認識された話者の身元を表わす一組の一次信号を発生
すること、および、未知の話者の音声標本の予測分析か
らいくつかのテスト用予測パラメータ信号を作ること、
および、前記テスト用予測パラメータ信号と前記の未知
の話者に対して仮定した身元を表わす前記の認識された
話者の参照用係数信号とから一組の二次信号を発生する
こと、および、前記の仮定した身元を認証するため前記
一次信号と前記二次信号を比較することとを含む前記の
未知の話者の身元確認のための方法が与えられる。

本発明を実施する話者認承方式が第１図に示されており
、ここで話者認識コード論理回路１３２が話者の主張す
る身元に対応したコード信号１ＤＣを発生するように動
作する。

認識される話者に対し参照用の情報を記憶するのかある
いは話者の身元の認証をするのかどうかを示すために、
一つの信号がモード選択器１３３に加えられる。第１図
のシステムを参照モードあるいはテストモードにするた
めに、モード選択器１３３は匍脚論理回路１３４に信号
を加える。参照モードにおいては、論理回路１３２から
のＩＤＣコードによつて認識される話者の発声が分析さ
れ、信号線１０１上の音声標本の予測分析に対応して参
照信号、平均信号および分散信号が発生されて記憶され
る。テストモードにおいては、主張されている身元につ
いての記憶内の参照用信号と未知の話者の予測パラメー
タとから、直交パラメータ信号が発生される。被験話者
の主張する身元に対応した参照、平均および分散信号が
発生され、テスト用平均および分散信号が主張されてい
る身元についての記憶内の参照用平均および分散信号と
比較される。説明のために、制御論理回路１３４により
出力信号ＲＥＦ，ＳおよびＧが発生されることによつて
第１図の認証システムは参照モードにおかれていると仮
定する。信号線１０１から参照される話者の音声信号が
フイルタおよび標本化回路１０２に加えられる。一例と
して、信号線１０１とは電話線にあたる。入力音声信号
の帯域は１００〜レツから４キロヘルツに制限されてお
り、帯域制限された信号はクロツク１０３の制御のもと
に１０キロヘルツで標本化される。この他の周波数帯域
およびこの他の標本化周波数を用いてもよいことを理解
されたい。終端検出器１０９は回路１０２の出力を受け
る。標本化出力の絶対値の総和から求められる音声信号
のエネルギー量に基づいて、クロツク１０３がゲート１
４０を通して抑止されるようにするため発声の終了が検
出される。それぞれの新らしい発声が始まるごとに、検
出器１０９からの信号がクロツク１０３を始動する。第
１図での使用に適した終端検出方式は、１９７５年９月
３０日に出されたエル・アール・ラビナ一等の米国特許
３９０９５３２で発表されている。ノ第３図に示される
クロツク１０３には、１０キロヘルツの標本化周波数の
等間隔パルスＳＰを得るための標本化パルス発生器３０
１が含まれている。

パルスＳＰは標本化回路１０２に加えられ、ここで音声
信号の符号化された標本値が得られる。パルス発生器３
０１の出力はまたパルス発生器３０３へも加えられてい
る。パルス発生器３０１からのパルスＳＰは、パルス発
生器３０３の動作の同期をとつて、これは発生器３０１
からの２００個のＳＰ標本化パルスから成る各フレーム
間に、１４４イ固の等間隔のパルスＡＳを発生する。パ
ルスＡＳはカウンタ３０５に加えられ、このカウンタは
１２番目のＡＳノくノレスごとに対応して出力パルスＢ
Ｓを発生する。したがつて、１４４個のＡＳパルスから
成る各フレーム間に１２個の等間隔パルスＢＳが発生す
ることになる。カウン゛夕Ａの状態は信号線３３０にあ
られれる。カウンタ３０７はカウンタ３０５の出力にあ
られれるパルスＢＳに応答しており、カウンタＢの状態
は信号線３３１にあられれる。カウンタＡは１２番目の
ＡＳパルスごとにりセツトされ、カウンタＢは１２番目
のＢＳパノレスごとにりセツトされる。ＡＳとＢＳパル
スおよび他のクロツク信号は使号線Ａを通して第１図の
他の部分に供給され前記の他の部分の動作のタイミング
制御のために用いられる。それぞれ信号線３３０および
３３１上のカウンタ３０５および３０７の出力は、また
カウンタＡおよびＢがともに零の状態にきつたときに対
応してパルスを発生するフレーム開始点険出器３０９に
も加えられる。

このパルスは１４４個のＡＳパルスおよび１２個のＢＳ
パルスの生じる２００個のＳＰ標本化パルスからなる各
フレームの開始点を決める。検出器３０９の出力は７レ
ームカウンタ３１７に加えられ、これはフイルタおよび
標本化回路１０２に加わる音声標本の各発声フレーム数
を計数する。発声終了検出器３１３は、ともに１２番目
の状態にあるカウンタＡおよびＢと終端検出器１０９の
出力信号に応答して発声終了信号ＥＵおよび而を生じる
。信号ＥＵは各発声の終了時にカウンタ３１７をりセツ
トするために遅延回路３３５を通してカウンタ３１７に
加えられ、また音声標本における発声数を計数する働き
をもつ発声カウンタ３１９にそのまま加えられる。標本
化終了検出器３１５は、カウンタ３０５および３０７の
状態、終端検出器１０９、そして無声検出器１０７のす
べてに応答して音声標本の終了時に信号ＥＳおよびＥＳ
（ＥｎｄＳａｍｐｌｅ、標本終了）を発生する。信号Ｅ
Ｓは音声標本の終了時に発声カウンタ３１９をりセツト
するために、遅延回路３３３を通して加えられる。フレ
ームの終りに無声期間と一致する終了点を検出してＥＳ
およびＥＳを発生する。第１図のシステムにおいて、直
交パラメータの平均と分散を計算するためには、各発声
において生じるフレーム数および音声標本内の発声数を
知る必要がある。

フレーム数Ｎは発声によつて異なるが、フレームカウン
タ３１７の出力により知ることができる。この出力は各
発声の終りにＥＵ信号の発生によつてゲート３２３を通
してとり込まれる。ゲート３２３の出力はちようど終了
した発声のフレーム数に相当する符号化信号Ｎを与える
ものである。ゲート３２５は、各音声標本の終了時に音
声標本内の発声数に相当した符号化信号Ｌ力碍られるよ
うに、検出器３１５で検出された音声標本の終了時に発
声カウンタ３１９の状態をとり込むためのものである。
１０キロヘルツの標本化周波数による標本化信号の系列
は、フイルタおよび標本化回路１０２の出力から線形予
測係数計算機１０５に加えられ、ここで標本値Ｓｎｌは
プロツク化されて、すなわちＳ１からＳ２ＯＯまでの２
００個の符号化信号からなるフレームごとに記憶される
。

その他のフレーム構成を用いてもさしつかえないことを
理解されたい。標本化された音声信号の線形予測分析は
にしたがつて行なわれる。ここで、ｍ−１、２、・・・
・・・、２００１＝１、２、・・・・・・、Ｐであり、
Ｐは予測分析モデルの極致である。線形予測分析ぱ当業
者に周知であつて、ビ一・エス・エイタルおよびエス・
エル・ハナーワ一によつてアメリカ音響学会誌の１９５
１年第５０巻６３７ページから６５５ページに掲載され
た「音声波の線形予測による音声の分析と合成」で述べ
られている全極線形予測フイルタモデルに基いている。
話者認識のためには、１２個の極を持つフイルタモデル
が適当であるということがわかつている。しかし、この
他の極配置を用いてもさしつかえないことを理解された
い。線形予測係数Ａｉは第１，，式での表現にしたがう
標本化音声信号Ｓｍの係数である。

第１図で用いられる１２極のフィルタモデルに対するａ
１からＡｌ２までの係数は、第２式および第３式にした
がつて標本化音声信号Ｓｍを２００個の標本値から成る
各フレーム内で相関をとることによつて、係数計算機１
０５内で発生される。ここで、Ｍは各フレ一判内の標本
数（Ｍ＝２００）であり、Ｐ−１２である。

当業者に周知のように、第１式の線形予測係数ａ１は、
第２式および第３式にしたがう自乗平均予測誤差が最小
となるように選ばれる。

第２式で示したように、このことは、ＳｍからＳｎｌ＋
ャまでの標本信号のプロツクの相関分析によつて行なわ
れる。その結果としてＡｌａｌ２までの線形予測係数が
、各フレームのＭ個（Ｍ−２００）の音声標本値に対し
て得られる。線形予測係数計算機１０５は、１９７１年
１２月２８日に出されたビ一・エス・エイタルによる米
国特許滝３６３１５２０で示さ板また述べられている予
測パラメータ計算機で良い。

この計算方式では、当業者に周知の共分散方式にしたが
つて線形予測パラメータを算出している。あるいはまた
、ジヨン・デ一・マーケルによつてスピーチ・コミユニ
ケーシヨンズ・リサーチ・ラボラトリ一・インコーポレ
ーテツドのモノグラフ第７巻、１９７１年１０月に掲載
された「線形最小自乗逆フイルタ構成からのフオルマン
ト軌跡の推定」の付録Ａにあるフオートランプログラム
を実行できるＰＤＰｌｌあるいはＮＯｖａ８ＯＯ等のど
のような計算機を用いても良い。このフオートランプロ
グラムは当業者に周知の相関方式に基いている。各フレ
ームの長さは２０ミリ秒であつて、すでに明らかなよう
にフレームのａ１からＡｌ２までの係数は対応するＳ１
からＳ２ＯＯまでの標本値をもつフレームの終りに出力
信号線１３６上に得られる。共分散方式あるいは相関方
式のいずれかによつて導き出されたａ１からＡｌ２まで
の係数が第１図の構成において使用される。線形予測係
数ＡｉをＶ組の直交パラメータを求めるのに直接用いて
もよいが、その代りにその他のパーコール係数あるいは
対数面積係数のような当業者に周知の予測係数を用いる
のが有利であることがわかつている。

パーコール係数は計算機１０５の線形予測係数から直接
導出することが可能である。パーコール係数とは、Ｐ個
の一様な等長の円筒部分を縦続して構成される一様でな
い音響管によつて全極フイルタの特性を実現することと
関連している。パーコール係数は音響管の各部分の反射
特性に対応しており、第４ａ式にしたがつて線形予測係
数に関係付けられる。ここでＫｉは第１番目のパーコー
ノレ係数（１一１、２、・・・・・・Ｐ）であり、Ａｉ
（ｊ）け第ｊ番目（ｊ＝１、２ｃ・・・・・Ｐ）の極の
線形予測モデルに対する第１番目の線形予測係数である
。

対数面積係数も同様に一様でない音響管モデルに関連し
たもので、第４ｂ式にしたがつて、計算機１０５から得
られる線形予測係数から一意に導出可能である。係数変
換用計憩１１７は、線形予測係数Ａｉからパーコールの
ような１組の予測パラメータを求めるよう動作するもの
で、第４ａ式あるいは第４ｂ式にしたがつて動作する算
術演算回路を含むようなものであるか、あるいはまたシ
ュー・デ一・マーケル、エ一・エイチ・グリーグ、ジユ
ニアおよびエイチ・ワキタによつてスピーチ・コミユニ
ケーシヨン・リサーチ・ラボラトリ一・インコーポレー
テッドのモノグラフ第１０巻、１９７３年９月、に掲載
された「音声理論の線形予測と実践」の１２８ページに
あるフオートランで前述されたプログラムを実行できる
ようなＰＤＰｌｌあるいはＮＯｖａ８ＯＯのような計算
機であつてもよい。

変換用計算機１１７によつて得られる予測係数Ｘｉはゲ
ート１４８に加えられる。ゲート１４８は、参照モード
の各フレームの間、制御発生器４５０からの信号ＢＳ４
に制御されて、そのフレームの予測係数信号Ｘ，，・・
・・・・，Ｘｌ２を、そのフレームの期間中ＢＳのはや
さ（１フレームにつき１２）で共分散発生器１１１に導
くように動作する。無声検出器１０７はゲート３５０を
通して無声フレームおよびフレームの終りの間はクロツ
ク１０３を抑止するように計算機１０５内で作つた音声
標本値Ｓｒｎに応答する。無声検出器１０７は、無声と
判断された期間中に予測パラメータ信号を発生すること
を防ぐための信号をリード線１９８を通してクロツク１
０３のゲート３５０に与えるためのもので、例えばシュ
ー・ジエ・タブノブスキー等による米国特許応用、連続
番号６２７８６５で発表されているような音声信号のエ
ネルギー特性あるいは周波数特性に応答するような周知
のどのような無声検出器でもよい。共分散発生器１１１
は音声標本化の間、そこへ加えられる予測パラメータ信
号から得られる平均共分散行列丸に対応する複数個の信
号を発生するように動作する。

当業者に周知のように、共分散行列は選択されたパラメ
ータの平均値から予測パラメータの偏差を統計的に分析
することによつて導出される。共分散発生器は第５式に
したがつて予測係数Ｘｉの選択された平均値を作り出す
。ここで、Ｎは発声中のフレーム数であり、Ｘｉｎは第
ｎ番目のフレームの第１番目の子測パラメータである。
当業者には周知のように、共分散行列Ｒは第６式で定義
される要素Ｒｉｋから成る。共分散行列ＲはＰ行Ｐ列の
行列でＰ−１２に対〜し１４４個の要素を持つ。

共分散行列Ｒ１は所与〜の話者の第１番目の発声につい
て計算された共分散行列を示す。

認識される話者のすべての発声についての平均共分散行
列Ｒは第７式にしたがつて〜平均をとることによつて得
られる。

ここで、Ｌは所与の話者の音声標本中の発声数である。

第７式は一例として示したものである。Ｒの計算のため
のその他の周知の公式を用いても良いことを理解された
い。このように、平均共分散行列Ｒは、参照モードにお
いてこれによつて参照用直交パラメータが直交パラメー
タ発生器１１２内で発生されるような認識される話者の
音声標本の発声の統計的な分析を表現している。共分散
発生器１１１は、予測パラメータＸｉの特別な平均値に
対応した信号および平均共分散行列Ｒの要素に対応した
符号とを発生するのに適合した複数個の演算ユニツトか
らなる。平均共分散行列Ｒの要素に対応する符号化信号
を発生する方式は第４図に示されている。第４図を参照
すると、シJャg・レジスタ４０１．加算器４１０、およ
びシフト・レジスタ４１２は組み合わさつて、第５式の
平均値マｉに対応する信号を発生するように動作する。
シフト・レジスタ４０１は２００個の音声標本値から成
る各フレームの間に、ゲート１４８を経て変換用計算機
１１７から来る予測係数Ｘｌ，・・・・・・，Ｘｌ２を
受けるのに適した２４段のレジスタである。各フレーム
において信号Ｘｉが第１図のゲート１４８を通つてレジ
スタ４０１に転送されるが、各フレームに対するそのた
めの励起パルスＢＳ４をも含めて、第４図における動作
に必要な一群の制御信号を供給するために、Ｆｂｌ脚発
生器４５０はクロツク１０３からの信号と論理回路１３
４からの信号とに応答して動作する。１２個のＢＳ４パ
ルスはまた、この期間中シフト速度を制御するためにレ
ジスタ４０１に加えられる。

レジスタ４０１におかれた最下位段側の１２個のＸｉ信
号を加算器４１０の一方の入力に加えるように働く。第
５式にしたがつて、シフト・レジスタ４０１の出力Ｘｉ
はゲート４１１を経て順次加算器４１０に加えられる。

加算器４１０では、各予測パラメータＸｉがシフトレジ
スタ４１２から得られる前のフレームの対応する予測パ
ラメータＸｉに加算される。レジスタ４１２は発生器４
５０からのシフト・パルスＢＳ４Ａの制御のもとでシフ
トされる。加算器４１０の出力は、パルスＢＳ４Ａの制
御のもとで順次レジスタ４１２内へシフトされる。各発
声の終了時には、シフト・レジスタ４１２はその発声の
予測パラメータの蓄積された総和、ΣＸｌ，・・・・・
・ΣＸｌ２を含むことになる。各総和は１２個の予測パ
ラメータのうちの一つに対応する平均値に比例したもの
である。各フレームの開始時に、レジスタ４０１に記憶
されている最下位段側の１２個のパラメータがシフト・
レジスタ４０３および４０５へそれぞれゲート４０７お
よび４０９を通つて並列に転送される。これは予測パラ
メータＸｉが得られる各フレームの開始時に生じる発生
器４５０から来る信号ＢＦ４の制御のもとでなされる。
シフトレジスタ４０５はフレームの予測パラメータＸｌ
，・・・・・・Ｘｌ２を、発生器４５０からのパルスＢ
Ｓ４Ａの制御のもとで１フレームにつき１２のシフト速
度でゲート４０４を経て乗算器４２０の一方の入カへ連
続して加える。シフト・レジスタ４０３は巡回形のシフ
ト・レジスタであつて、記憶された予測パラメータを乗
算器４２０の他方の入力）連続して加えるとともに、ま
た出力パラメータをシフト・レジスタの人力に返してい
る。

レ．ジスタ４０３はパルスＡＳ４Ａの制御のもとで１フ
レームにつき１４４シフトの速度でシフトされるが、レ
ジスタ４０５は発生器４５０からのパルスＢＳ４Ａの制
御のもとに１フレームにつき１２シフトの速度でシフト
される。１２個のシフト制御パルスＡＳ４Ａは、連続し
た２つのＢＳ４Ａパルスの間にレジスタ４０５の各シフ
トごとにレジスタ４０３が１２回連続してシフトするよ
うに発生する。

このように、乗算器４２０は１２個の積ＸｉｎＸｋｎを
得るためにシフト・レジスタ４０５の各？出力に対して
１２個Ｑ連続した積を与えるように動作する。すなわち
第６ａ式の要請と一致するようにレジスタ４０５の各シ
フトに対して動作するわけである。乗算器４２０の出力
は加算器４２１に加えられ、そこでは今乗算された積が
以前のフレームの対応する積の総和に加算される。

その結果の加算器４２１の出力はシフト・パルスＡＳ４
Ａの制御のもとにシフト・レジスタ４２３に加えられる
。ＡＳ４Ａパルスに制御されて１フレームあたり１４４
シフトの速度で動作するシフト・レジスタ４２３は、各
フレームの終りには乗算器４２０の１４４個の各積出力
の現在の蓄積されている総和を記憶する。各発声の終了
時に、シフト・レジスタ４１２は第５式の平均値ｉ１
（１＝１、２ｃ・・・・・１２）に対応する１２個の符
号化信号を持ち、シフト・レジスタ４２３は第６ａ式に
対応した１４４個の積Ｎの総和 Σ ＸｉｎＸＩｃｎを
記憶している。

各発声のｎ−１終了時に、ゲート４１３は第３図から信
号線Ａを通つて来る発声終了信号ＥＵに応答して・りレ
ス発生器４５０で発生される信号ＥＵ４の制御のもとで
開かれる。

信号ＥＵ４は１フレームの間持続する。′Ｘｌ，・・・
・・・マ，２に対する符号化信号は発生器４５０によつ
て作られるシフト信号ＡＳ４Ｂ（１フレームあたり１４
４個のパルス）の制御のもとで順次レジスタ４３０内に
シフトされる。シフト・レジスタ４３０が一ぱいになる
と、ゲート４３１が発生器４５０からの信号ＢＦ４Ａに
よつて開かれ、レジスタ４３０内の１２個の信号が並列
にシフト・レジスタ４３２内に転送される。

レジスタ４３０はすぐに信号ＢＳ４Ｂの制御のもとでシ
フトされる。レジスタ４３２は巡回形のシフト・レジス
タで発生器４５０からのシフト信号ＡＳ４Ｂの制御のも
とで動作し、それによつてレジスタ４３２内の１２個の
信号は順次乗算器４３４の一方の入力にあられれ、また
レジスタ４３０からの１つの信号が乗算器４３４の他方
の入力にあられれる。このようにして、１４４個の積が
乗算器４３４の出力から順々に得られる。おのおのの連
続した発声の終了時に、シフト・レジスタ４２３の内容
は、シフト信号ＡＳ４Ａの制御のもとに、信号ＥＵ４に
応答してゲート４２７を１２（１フレームあたり１４４
個の符号の速度で）遅延シフトレジスタ４３５内に直列
にシフトされる。この転送中に、ゲート４２５は信号Ｅ
Ｕ４に関してシフトレジスタ４２３をクリアするように
動作する。シフトレジスタ４３５はシフトレジスタ４３
０および４３２が一ぱいである期間中、ΣＸｉｎＸｋｎ
の符号化信号の出現を遅延させる働きをしている。この
ようにして、ゲート４６０および４６１から減算器４３
７への入力は、減算器４３７の出力が第６ａ式と一致す
るように、第６ａ式に対応して並置される。減算器４３
７の出力は、行列尽の要素Ｒｉｋを作るためにＮによる
除算器４５０で、第３図のゲート３２３から得られる信
号Ｎによつて除算される。各発声の終了時に、パルス発
生器４５０ぱ信号ＥＵ４Ａに応答してシフトレジスタ４
４１がＡＳＱ速度（１フレームあたり１４４シフト）で
右方にシフトするような信号ＥＵ４Ａを供給する。

シフトレジスタ４４１は、記憶されている要素Ｒｉｋの
総和が、加算器４３９で除算器４５０から来る要素Ｒｉ
ｋに加算されるために、音声標本内の発声の連続した要
素Ｒｉｋの総和を記憶する。その結果の蓄積された総和
は、そのときシフトレジスタ４４１内に記憶されている
。全音声標本化が終つたとき、シフトレジスタ４４１の
内容は第６ａ式にしたがう平均共分散行列尽に対する総
和要素Ｒｉｋである。

行列旦の要素け発生器４５０からのシフト信号ＥＳ４の
制御のもとでレジスタ４４１から読み出される。このシ
フト動作は、ゲート４４３は発生器４５０からの信号Ｅ
Ｓ４に応答してレジスタ４４１の出力が加算器４３９に
加わるのを防げ、それによつてレジスタ４４１をクリア
するように働く。レジスタ４４１の出力は、音声標本化
の終りに生じる信号ＥＳ４の制御のもとに除算器４４５
に加えられ、信号ＥＳ４により各ΣＲｉｋ要素が第３図
のゲート３２５を経てカウンタ３１９から得られるＬに
よつて除算される。除算器４４５の出力は、直交パラメ
ータ発生器１１２で用いるために信号ＥＳ４に制御され
て第１図のゲート１６０を通つていく。またあるいは、
平均共分散行列Ｒの要素を求めるようプログラムされた
ＰＤＰｌｌあるいはＮＯｖａ８ＯＯのような汎用計算機
を豆を発生させるために用いてもよい。この目的のため
のフォ一トランプログラムは「システム１３６０科学技
術計算用サブルーチン・パツケージ第３版−プログラマ
用マニユアル」（プログラム番号３６０Ａ−ＣＭ−０３
Ｘ１第５版（１９７０年８月）、版権インターナシヨナ
ル●ビジネス・マシーンズ・コーポレーシヨン１９６６
、１９６７、１９６８）の３２および３３ページに発表
されている。共分散発生器１１１の出力Ｒは、制御パル
ス発生器４５０からの信号ＥＳ４に制御されて参照モー
ドの動作期間中、ゲート１６０を通つて直交パラメータ
計算機１１２に加えられる。計算機１１２は認識される
話者の音声標本の統計に基く規定された直交パラメータ
の組に対応した符号化信号を発生するように動作する。

直交パラメータは統計的に独立であつて、各直交パラメ
ータは変換用計算機１１７から得られる予測パラメータ
の座標軸の回転をあられしている。この手法を通して、
一群の話者には依存するが、言語的には独立な特性が得
られ、この特性は第１図の話者認証システムの基礎をな
すものである。直交パラメータ信号は、計算機１１１で
得られる平均共分散行列怒の信号に応答して予測パラメ
ータＸｉの固有ベクトル分析をすることによつて発生さ
れる。

認識される話者の発声の直交パラメータの分散をあられ
す固有値Ｖｉ（１−１、・・・・・・Ｐ）は第８式によ
つて得られる；ここでは直交パラメータの固有値（分散
）を表わし、Ｉは単位行列である。

第８式にもとづき、それぞれがＰ（１２）個の要素を持
つ１組の参照用ベクトル信号Ｕｉが第９式から得られる
；Ｖｉは第１番目の直交パラメータの固有値である。各
直交パラメータは第１０式のように予測係数Ｘｉと一意
に関係づけられている。ここでＵｋｉは第ｋ番目の参照
用ベクトル信号の第１番目の要素を表わす。

このように直交計算機１１２から１２個の分散（固有値
）および１４４個の参照信号Ｕ１》１７＄゜゜８″。Ｕ
ｌ２》１２が得られるｏ参照用信号｛Ｕｋｉ｝は予測パ
ラメータＸｉを直交パラメータ座標に変換する変換係数
に相当する。それゆえ、Ｕｋｉに対応する参照用信号は
被験話者に対し、その予測パラメータから１組の直交パ
ラメータを求めるのに用いることができる。係数の組｛
町｝は参照モードの動作期間中、話者認識論理回路１３
２からの認識コード信号１ＤＣによつてアドレス付けさ
れて記憶１１５ｂ内に記憶される。このようにして、１
組の参照用信号が記憶１１５ｂ内のあらかじめ決められ
た場所におかれて各認識された話者に対して利用できる
ようにされる第１図のシステムが参照モードで動作して
いるとき分散（固有値）信号Ｖ，，・・・・・・Ｖｌ２
も同様に話者認識コード信号１Ｄによつてアドレス付け
されて記憶１１５ａ内に記憶される。直交パラメータ計
算機１１２としては、いくつかある周知のプログラムの
うちの１つによつて、第８式および第９式の固有値とそ
れに対応する固有ベクトルとを計算するようにしたＰＤ
ＰｌｌあるいはＮＯｖａ８ＯＯのような汎用計算機でも
良い。

この目的に適した固有値Ｖｉおよび変換係数｛Ｕｋｉ｝
を求めるフオートランプログラムとしては、前述のＩＢ
Ｍプログラマ用マニユアルの１６４ページに掲載された
ものがある。計算機１１２で求められた直交パラメータ
に対応する信号Ｗｉ（但しｉ−１、２、・・・・・・１
２）はゲート１５６を通つて参随用平均値発生器１１３
に加えられる。

発生器１１３は第１１式によつて計算機１１２から得ら
れる各直交パラメータ信号Ｗｉに対し平均値を生じるよ
うにされた算術演算回路からなる。ここでＷｉｎはフレ
ーム旦での第１番目の直交パラメータ信号であり、Ｎｌ
は認識される話者の第１番目の発声中のフレーム数であ
る。

そしてＬは認識される話者の音声標本内の総発声数であ
る・第１１式は一例として挙げたものである。ＷＯにつ
いての他の公式を用いても良いことを理解されたい。第
１１式にしたがつて、発生器１１３はカウンタの制御の
もとに符号化信号に対して働く総和形の論理回路からな
る。第５図は第１１式にしたがつて直交パラメータの平
均値Ｗｌ，・・・・・・′Ｗｌ２を求める方法を示して
いる。

計舞機１１２が直交予演ｕパラメータ信号を供給すると
き、信号Ｗｌ，・・・・・・Ｗｌ２が、参照モードの各
フレームにおいて、信号ＥＳ４に制御されてゲート１５
６から第５図の加算器５０２の一方の入力に順次入力さ
れる。発生器１１２の最初のフレーム出力の際には、前
記の最初のフレームの１２個のＷｉ信号は加算器５０２
を通つて、制御発生器５４０からのシフト信号ＢＳ５に
制御されつつシフトレジスタ５０４内に順次記憶される
。第５図の回路の動作に用いられるＢＳ５シフトパルス
およびその他の制御信号の発生は、それぞれクロツク１
０３および制御論理回路１３４から来る信号線Ａおよび
Ｇ上の信号に応答する発生器５４０において制御されて
いる。発声のそれに続く各フレームにおいては、発生器
１１２から来るそのフレームのＷｉ信号出力は、第１１
式の添字で示されるように、レジスタ５０４内の対応す
る以前に記憶された値に加えられ、その結果の総和はレ
ジスタ５０４に記憶されている。ＢＳ５シフト信号は総
和の際にレジスタ５０４の動作を制御する。発声の終り
に、ゲート５０８は発生器５４０から来るＥＵ５信号に
制御されて開かれ、それによつてレジスタ５０４からの
信号は順次Ｎによる除算回路５１０の一方の入力に加え
られる。

発声中のフレーム数に相当する信号が第３図のゲート３
２３からＮによる除算回路５１０の他方の入力に加えら
れる。その結果、回路５１０の出力は、その発声につい
ての直交パラメータＷｉの平均値となつて、である。

シフトレジスタ５１４は、音声標本内の以前の発声につ
いて平均をとつた直交パラメータを保持している。

加算器５１２はＮによる除算回路５１０から来る直父パ
ラメータの平均値をシフトレジスタ５１４内にある対応
する以前に記憶された平均値の総和に次々と加算するよ
うに動作する。音声標本の終了時にゲート５１７は発生
器５４０からのＥＳ５信号に制御されて開かれ、レジス
タ５１４の出力は逐次ＢＳの速さ（フレームあたり１２
回のシフト）でＬによる除算器５１２に加えられる。回
路５２１の他方の入力は、回路５２１の出力が音声標本
についての１２個の直交パラメータに対して平均値を与
えるように、第３図のゲート３２５を通つて発声カウン
タ３１９から得られる。第１１式にしたがつて求められ
たこれらの平均値信号引は順次シフトレジスタ５２３内
に挿入され、レジスタ５２３から並列に読み出され、そ
してゲート１７５を経て記憶１１５ｃ内に挿入される。
ゲート１７５は発生器５４０からの信号ＥＳ５Ａによつ
て制御される。制御論理回路１３４によつて決められた
参照モードの動作の際には、記憶１１５ｃと関連づけら
れているアドレス論哩回路１１５ｄは、話者認識論理回
路１３２から来るアドレス・コードＩＤに制御されて、
音声標本の直交パラメータ信号の平均値を選択した位置
に置く。参照モードｑ終りには、記憶１１５ａ２１１５
ｂおよび１１５ｃ内に、所与の認識される話者に対する
１２個の直交パラメータの分散Ｖｉに対応する１組の信
号、後に得られるテスト用予測パラメータ信号をテスト
用直交パラメータ信号の規定された組に変換するのに適
合した参照係数Ｕｋｉに対応する１組の信号および１２
個の直交パラメータの平均値豆１に対応する１組の信号
が含まれている。

各組は話者認識コード１ＤＣによつてアドレス可能であ
る。第１図の参照モードの動作はこれによつて認識され
る話者に対して完了した。記憶１１５が、参照モード動
作を繰り返すことによつて複数の認識される話者に対応
する参照用信号で満たされた後に、第１図の認識システ
ムが未知の被験話者の主張する身元を認証するために用
いられることになる。説明のために、複数の認識される
話者に対応する参照用信号が記憶された後に、一人０未
知の被験話者の音声信号が信号線１０１からフイルタお
よび標本回路１０２に加えられている場合を仮定する。

話者認識コード発生器１３２は未知の被験話者の主張す
る身元に対応するコードにセツトされる。モード選択器
はテストモードにセツトされ、論理回路１３４から信号
ＴＥＳＴおよびＳが活性化される。信号ＴＥＳＴおよび
Ｓに制御されて、テスト音声信号はフィルタおよび標本
化回路１０２で標本化される、そしてテスト音声信号の
符号化標本値は順々に線形予測係数計算機１０５に加え
られる。

前述の通り、計算機１０５は第３図のカウンタ３０５に
よつて決まるＢＳ信号の速度で、各フレーム期間に１２
個の線形予測係数Ａｌ，・・・・・・Ａｌ２の組を発生
する。各フレームにおいて２００個の音声標本値Ｓｌ，
・・・・・・Ｓ２ＯＯが与えられる。係数Ａｌ，・・・
・・・Ａ゜ｌ２は係数変換用計算機１１７によつて、も
う一つの表現、すなわちパーコール係数に変換され、そ
れによつて被験話者に対応する予測パラメータＸｉの組
が求められて用いられることになる。予測パラメータ信
号Ｘｉはゲート１６３を通しで被験話者用直交パラメー
タ発生器１１９に加えられる。

これと並行して、主張された身元に対応する参照係数信
号Ｕｌ，ｌ，・・・・・・Ｕｌ２，ｌ２がゲート１６５
を経て被験話者直交パラメータ発生器１１９内に読み出
されるように、記憶１１５ｂに対して主張された身元の
アドレスの所へ問合わせが生じる。変換用計算機１１７
からの被験話者の予測パラメータと記憶１１５ｂからの
主張された身元の参照係数信号とに応答して、発生器１
１９は第１２式にしたがつて各フレームごとにテスト用
直交予測パラメータＺｌ，・・・・・・Ｚｌ２を発生す
るように動作する。ここでＸｉは未知の話者のテスト用
予測パラメータである。

発生器１１９は乗算装置および第１２式の添字にしたが
つて積の総和をとる回路から構成される。第６図は、テ
ストモードの際に、主張された身元についての音声標本
から得られる記憶された参照信号と被験話者に対し係数
変換用計算機１１７から得られる予測パラメータとから
各フレームに対しテスト用直交パラメータの組発生する
のに適した方式を示している。

テスト・モードの開始時に、記憶１１５ｂに主張された
身元のＩＤＣコードによつてアドレスされるような問合
せを行なう。主張された身元に関する記憶１１５ｂから
の参照信号はゲート１６５を経てシフトレジスタ６０１
に並列に加えられる。転送が終ると１４４個の係数咽が
レジスタ６０１に置かれることになる。テスト・モード
の各フレーム内において、ゲート１６３から来た１２個
の予測パラメータが順々にシフトレジスタ６０２内に置
かれる。１つのフレームに対応する１２個のパラメータ
Ｘｌ，・・・・・・Ｘｌ２がレジスタ６０２の最下位側
の１２段内にシフトされた後に、これらのパラメータは
レジスタ６０２から並列に読み出され、そこから制御パ
ルス発生器６２０からの信号ＢＦ６によつて制御されて
ゲート６０９を経てシフトレジスタ６０７へ加えられる
。

シフトレジスタ６０１および６０７は巡回形のシフトレ
ジスタである。

シフトレジスタ６０１は発生器６２０からの信号ＡＳ６
に制御されてＡＳのはやい速度（１フレームあたり１４
４回のシフト）で動作する。シフトレジスタ６０７は信
号ＡＳ６に制御されてシフトレジスタ６０１の各巡回ご
とに１２回巡回する。レジスタ６０１および６０７の出
力はゲート６０３および６０５を通つて乗算器６１１に
加えられ、そこでは積ＵｋｉＸｉが作られる。このよう
にして１２個の予測パラメータの各組に対し乗算器６１
１から１４４個の積が得られる。１２個ｐ連続した積の
組ごとの総和が加算器６１０で作られ、その出力は１デ
イジツトの遅延記憶素子６１２およびゲート６１３を経
てそれ自身に返される。

乗賠６１１および加算器６１０はＡＳの速度（１フレー
ムあたり１４４パラメータ）で動作する。１２個のＡＳ
信号が終ると、発生器６２０からの信号ＢＳ６がゲート
１８５を開き、第１２式にしたがう直交パラメータが、
ゲート１８５を通つてテスト用平均値および分散発生器
１２３に転送される。

直交パラメータ信号の転送中は、次の直交パラメータの
算出が始められるように、ゲート６１３は発生器６２０
からの信号ＢＳ６によつて禁止される。１２個の直交パ
ラメータが第６図の回路で算出されているフレームの終
りには、そのあとに続くフレームに対応する予測パラメ
ータの次の組がレジスタ６０２からレジスタ６０７に転
送されて、前記の次に来るフレームに対応する直交パラ
メータを算出する。

テストモードの動作中は、発生器１１９から得られる被
験話者に対するフレームの直交パラメータＺｌ，・・・
・・・Ｚｌ２は発生器６２０からの信号ＢＳ６による制
御のもとで、ゲート１８５を通してテスト用平均値およ
び分散発生器１２３に加えられる。発生器１２３は第１
３式および第１４式にしたがつて、被験話者の各直交パ
ラメータの乎均ｉ１に対応する信号と、各被験話者の直
交パラメータの分散ｉに対応する信号とを発生するよう
に動作する。発生器１２３は要求される総和および平均
操作を行なうのに適した算術演算装置から構成される。

第７図に、第６図から得られる被験話者の音声標本に関
する直交パラメータ信号の平均値司に対応する信号と
、第１４ａ式にしたがつて各直交パラメータに対する分
散信号Ｖｉとを発生するように動作する算術演算装置の
構成を示している。ゲルト１８５からの直交パラメータ
信号Ｚｌ，・・・・・・Ｚｌ２はＢＳの速度（１フレー
ムあたり１２個のパラメータ）で回路１２３内の加算器
７０２に順次加えられていく。シフトレジスタ７０４は
、直交パラメータの総和ΣＺｌ，・・・・・・ΣＺｌ２
を記憶する。制御発生器６２０からの各ＢＳ６パルスご
とに、レジスタＲＯ４の１つの直交パラメータ出力がゲ
ート１８５から来る対応する直交パラメータに加算され
、その結果はレジスタ７０４内に挿入される。発声の終
りには、発生器Ｒ２ＯからＯ信号ＥＵ７（Ｅｎｄｕｔｌ
ｅｒａｎｃｅ・・・・・・発声終了）の制御のもとで、
レジスタ７０４の内容がゲート７０５を経て順次Ｎによ
る除算器７０９に加えられる。これと同時に、レジスタ
７０４の出力は次の発声への準備のための信号ＥＵ７に
応答してゲート７０６によつてクリアされる。Ｎによる
除算回路７０９の他方の入力はゲート３２３を通して第
３図のクロツク１０３のフレームカウンタ３１７から得
られ、それによつて回路７０９の出力は第１３式にした
がう発声のテスト用直交パラメータ信号の平均ｉ１とな
る。直交信号の平均値は自乗回路Ｒｌｌに加えられて、
減算器７１５の一方の入力に加えられる。

符号化信号（１１）２を算出する。このとき、シフトレ
ジスタＲＯ４の逐次的な出力はまた、ゲート７０５を通
つて自乗回路７１２にも加えられる。自乗回路７１２は
信号（Ｉｉ）２を算出するように動作する。これらの信
号は、信号（Ｚｉ）２の平均値が自乗回路７１４から減
算器７１５の他方の入力に加えられるように、Ｎｌによ
る除算回路７１４の一方の入力に加えられる。減算器７
１５の出力は第１４ａ式にしたがつて分散信号Ｖｉを算
出するようにＮによる除算回路７１７に加えられる。こ
のようにして、未知の被験話者に対応するテスト用直交
パラメータの平均値信号ｉ１および分散信号Ｖｉが算出
されて偏差活号発生器１２７で用いられる。信号Ｙｉお
よびＶｉは、被験話者の予測パラメータの独立した固有
値分析から求めるのではなく、主張された身元に関する
記憶内の参照信号｛Ｕｋｉ｝と、被験話者に関する予測
パラメータとから求められている。各テスト用直交パラ
メータに対する発生器１２３の出力、平均値信号司お
よび分散信号Ｖｉぱ、発生器８７０からの信号ＢＳ８Ａ
によつて制御され、それぞれゲート１８７および１８９
を経て偏差信号発生器１２７に加えられる。

同様に、主張している身元の参照用直交パラメータの平
均値Ｗｉおよび各参照用直交パラメータの分散ｉが記憶
１１５ａおよび１１５ｃからそれぞれゲート１７９およ
び１８１を経て偏差信号発生器１２７に加えられる。被
験話者の直交パラメータと、主張している身元について
の記憶内の参照用直交パラメータとの特性の差異に相当
する偏差信号が第１５式にしたがつて作り出される。偏
差信号ぱ、第１５式の第１項にのみしたがつて平均値の
差異だけから求めてもよい。

すでに第１５式で示したように、各直交パラメータに対
する偏差信号の成分は、身元確認の主張が出ている参照
用話者の予測分析から導びかれる参照用直交パラメータ
の平均ＶＶｉと、被験話者の予測パラメータと、主張し
ている身元の参照用係数信号とを組み合わせて求められ
るテスト用直交パラメータの平均７１との差異から得ら
れる。音声標本に関して相対的に一定（分散が小さい）
である直交パラメータには、より大きな重み付けを与え
、また大きな変化のある直交パラメータに対しては意味
のある程度に小さ℃・重み付けを与えるために、平均の
差の自乗（Ｗｉ−η）２は参照用直交パラメータの分散
Ｖｉで除算し、（Ｖｉ−Ｖｉ）２はＶｉ２で除算してい
る。このようにして偏差信号は実際上、音声標本に関し
て相対的に一定であるような直交パラメータの関数とな
つている。この方法によつて、偏差信号は言語的には独
立であつて、話者には強く依存するような直交パラメー
タの間の差異に相当するものとなる。偏差信号発生器１
２７は、必要な商および第１５式の添字に関しての商の
総和とを算出するのに適した算術演算装置から構成され
ている。

第８図は第１５式に従つて偏差信号ｄを作り出すための
構成方法を示している。テストモードの開始時において
、主張している身元についての記憶内の参照用直交パラ
メータの平均値豆，からＷ青は、ゲ一１・１８１を通つ
て記憶１１５ｃからシフトレジスタ８０１へ転送される
。同様に、主張されている身元についての記憶内の参照
用分散信号盾から▼ｉは、ゲート１７９を通つて記憶１
１５ａからシフトレジスタ８０５へ転送される。被験話
者の音声標本化が終ると、テスト用直交パラメータの平
均値石からヨ１に対応する信号が制御発生器８７０から
の信号ＢＳ８Ａによつて制御されてゲート１８７を経て
テスト用発生器１２３からシフトレジスタ８０３へ転送
され、被験話者の分散信号Ｖ１からＶｌ２が信号ＢＳ８
Ａの制御のもとでゲート１８９を通つて発生器１２３か
らシフトレジスタ８０７へ転送される。レジスタ８０５
および８０９への転送が完了すると、レジスタ８０１，
８０３，８０５および８０７に記憶された符号化信号が
、信号ＢＳ８Ｂに制御されてＢＳの速度（１フレームに
付き１２個）で順次読み出されていくようにゲート８１
０，８１２，８１４および８１６が発生器８７０からの
信号ＢＳ８Ｂによつて開かれる。減算器８２０は、順次
あられれてくる石信号を、対応する信号から減算して（
コ一万）信号を算出するように動作する。

減算器８２０の出力は自乗回路８２３で処理されたあと
、除算器８２２の一方の入力に加えられ、また、シフト
レジスタ８０５の出力は除算器８２２の他方の入力に加
えられ、それによつて除算器８２２は、を発生するよう
に動作する。除算器８２２の出力は加算器８２５の一方
の入力に加えられ、その他方の入力は遅延回路８２７お
よびゲート８２９を含む帰還路からもどつてくる。加算
器８２５は自乗回路８２３の１２個の連続した出力の総
和をとるように動作し、その結果として総和の行なわれ
ている期間の終りに得られる信号は、である。

総和が終ると、信号ＥＦ８によつてゲート８２９は閉じ
られ、総和信号は信号ＥＦ８に制御されてゲート８５１
を通つていく。減算器８３１はレジスタ８０５から得ら
れる参照用分散信号Ｖｉをレジスタ８０７内の対応する
被験話者の分散信号Ｖｉから減算するように動作する。

減算器８３１の出力は除算器８３５に加えられ、このも
う一方の入力には２倍乗算器８３３を通つてレジスタ８
０５からきたものが加えられる。このようにして、に相
当する信号が発生される。

自乗回路８３７とは、除算器８３５の出力をそれ自身に
乗算するもので、その結果の信号を加算器８３９に加え
る。加算器８３９は、に相当する信号を生じるように動
作し、そのもう一方の入力は遅延回路８４０およびゲー
ト８４２を含む帰還路から戻つてくるものである。

加算器８３９で１２個の信号の総和が終ると、ゲート８
４２は信号ＥＦ８によつて閉じられ、ゲート８５０は発
生器８７０からの信号ＥＦ８によつて開かれる。それか
ら加算器８２５および８３９の出力が、ゲート８５０お
よび８５１を通つて加算器８４３に加えられ、ここで第
１５式に従う符号化偏差信号が作り出される。偏差信号
発生器１２７の出力は、被験話者の特性と、彼の主張す
る以前に認識されている話者の特性との差異を示すただ
１つの信号１である。

この信号は、発生器８７０からの信号ＥＦ８に制御され
てゲート１９０を経て比較器１２９の一方の人力に加え
られる。比較器１２９の他方の入力は、被験話者の認証
に際して許容し得る最大の偏差に相当するあらかじめ決
められた大きさの符号化閾値信号である。発生器１２７
からの偏差信号の方がこの閾値より大きいとき比較器１
２９の１番目の出力が生じて、被験話者の主張する身元
確認が拒絶されたことを示す。発生器１２７からの偏差
信号ｄ力号黴器１２９に加えられた閾値符号と等しいか
あるいはより小さいときは、被験話者の特性と記憶１１
５に記憶されている参照用の特性との差異は、話者の主
張する身元確認を受理できる程度のものである。都合の
よいことに哄直交パラメータ特性の比較は、非常に話者
への依存度が高くしかも実質的には言語的な独立性のあ
る特性の比較ということになる。

第１図のシステムの構成においては、参照モード動作時
に、参照用係数信号および直交パラメータ信号を発生し
て記憶するということだけが要求される。被験話者の直
交パラメータは独立して作り出されるのではなく、参照
用係数信号および被１験話者の予測パラメータとから発
生されるのであるから、テストモード動作時に得られる
偏差信号は第１図のシステムから得られる参照用特性と
テスト用特性との差異に対し非常に感度の高いものとな
る。さらに、テスト用直交パラメータの発生はオンライ
ンでの認証を可能にするようなより短時間でなされるよ
うなものにもできる。第１図の話者認証方式は、未知の
話者を以前に認識されている複数の話者のうちの一人と
して認識できるように、第２図に示したごとく変更して
もよい。未知の話者の認識には未知の話者から求められ
た直交パラメータ特性を、以前に認識された各話者の対
応する直交パラメータ特性と比較すること、および以前
に認識された話者の直交パラメータと最もうまく合致し
た身元を選ぶことが必要である。このようなわけで、参
照モード、テストモードの動作が共に必要である。話者
認識方式の参照モードにおいて、認識された話者の音声
標本の予測分析から求められる直交パラメータの規定さ
れた組に基づいて、係数信号、平均値信号、および分散
信号が認識された各話者に対して作り出されて記憶され
る。

話者認識での参照モードは第１図で述べた参照モードと
実質的に同じである。話者認識におけるテストモードで
は、予測分析が未知の話者の発声についてなされ、それ
に対応する予測パラメータが求められて記憶される。

第１番目の認識されている話者の係数信号が記憶から検
策され、未知の話者の予測信号と組み合わされて一組の
テスト用直交予測パラメータ信号を作り出す。算出され
たテスト用直交予測パラメータ信号の平均値と分散が求
められ、記憶内の第１番目の認識されている話者の参照
用平均値および分散と比較される。比較の結果得られる
偏差信号はそのあと第１番目の認識されている話者の認
識コードとともに最小偏差信号検出器に加えられる。テ
スト動作は認識されている各話者に対し順々に繰り返え
され、最小偏差信号を検出して、それに対応する身元と
ともに記憶される。すべてのテスト動作をして求まる最
小偏差信号は、未知の話者の身元を決定するために、未
知の話者に対して求められた特性と最もよく一致する認
識されている話者の特性に関係している。本発明を説明
する話者認識システムは第２図に示すとおりである。

第２図の構成は、未知の話者について求められた直交予
測特性を複数の認識された話者の対応する記憶内の特性
と比較するのに必要なテスト動作の系列を制御するため
に、話者認識カウンタ２１０が用いられている点を除い
ては、第１図の認証システムと実質的に類似のものであ
る。予測パラメータ用記憶２１５が、テスト動作の系列
に際し未知の話者の予測パラメータを保持するために付
け加えられ、また最／］・偏差信号検出器２３０が最小
偏差信号を計算し前記の最小偏差信号に対応する身元を
記憶するために付け加えられている。第２図を見ると、
信号ＲＥＦおよびＳが参照モード動作時に制御論理回路
１３４によつて供給されている。

既知の話者の身元に応答して、論理回路１３２は参照用
認証コードＲＩＤを与え、ＲＩＤは認識された話者の参
照用係数および平均値信号と分散信号とが置かれている
記憶場所にアクセスするためアドレス論理回路１１５ｄ
に加えられる。認識される話者の発声は、フイルタおよ
び標本化回路１０２で標本化され、その結果の標本値は
第１図に関して述べたようにフレームごとに線形予測係
数計算機１０５に加えられる。計算機１０５で発生され
た線形予測係数ぱ変換用計算機１１７により選択された
予測パラメータ、すなわちパーコールパラメータに変換
され、求められた予測パラメータは共分散用計算機１１
１に供給される。発生器１１２からの参照用直交パラメ
ータ係数信号および分散信号は論理回路１１５ｄによつ
てアドレス付けされて、それぞれ記憶１１５ａおよび１
１５ｂに置かれ、また発生器１１３によつて求められた
参照用直交パラメータ平均値は同様に記憶１１５ｃに記
憶される。第２図における参照モード動作は実質的に第
１図について述べられたものと同じである。未知の話者
の発声がフイルタおよび標本化回路１０２に加えられる
テストモードの開始時には、話者認識カウンタ２１０は
最初にアドレスコードＩＤＣが第１番目の認識された話
者に対応するようにセツトされる。

未知の話者の発声に対応する変換用計算機１１７から来
る予測パラメータは、ゲート１４８を経て、予測パラメ
ータ記憶２１５内に置かれて、そこからゲート１６３を
通つてテスト用直交パラメータ発生器１１９へ転送され
る。第１番目の認識された話者のＩＤＣによつてアドレ
スされる記憶内の参照用係数信号は記憶１１５ｂから読
み出され、ゲート１６５を経て発生器１１９に加えられ
る。第１図に関して前述したように、発生器１１９は記
憶内の認識された話者の参照用係数信号と未知の話者の
予測パラメータに応答して直交予測パラメータ信号の規
定された組を算出するように動作する。これらの直交予
測パラメータ信号はテスト用平均値および分散発生器１
２３へ転送されて、そこで、第１図に関して述べたよう
にして、直交パラメータ平均および分散信号が算出され
る。第１番目の認識された話者に対する参照用平均値お
よび分散信号は、それぞれ、記憶１１５ａおよび１１５
ｃから得られ、ゲート１７９および１８１を経て偏差信
号発生器１２７に加えられる。

発生器１２３からのテスト用平均値および分散信号と記
憶１１５ａ及び１１５ｃからの参照用平均値および分散
信号とに応答して、参照とテストとの特性の差異を表わ
す符号化偏差信号が発生器１２７で算出される。この符
号化偏差信号は最小偏差信号検出器２３０に転送され、
カウンタ２１０は次の認識された話者にアドレスされる
ように増分される。テスト動作は認識された各話者に対
して繰返えされ、検出器２３０は最小偏差信号の身元を
記録する。最後の認識されている話者のテスト動作が完
了すると、検出器２３０は最小偏差信号に相当する身元
を保持している。この身元は未知の話者の身元を与える
ために読み出される。第９図は最小偏差信号検出器２３
０に適した論理構成を示している。

第９図において、シフトレジスタ９０３は、レジスタ９
０３と発生器１２７からの偏差信号を記憶するレジスタ
９０５との比較から得られる最小偏差信号を記憶してい
る。シフトレジスタ９０１は最小偏差信号の認識コード
ＤＣを記憶している。レジスタ９０５は現在の偏差信号
を記憶し、シフトレジスタ９０７は現在の偏差信号に対
応するＩＤＣコードを記憶している。最初に、最小偏差
信号を記憶するシフトレジスタ９０３は最大値にセツト
されている。

最初のテスト操作の終りに発生器１２７から得られる最
初の偏差信号符号は、レジスタ９０５内に置かれ、対応
するＤＣコードはレジスタ９０７内に置かれる。レジス
タ９０３からの偏差信号符号は、制御発生器９４０から
のシフト信号ＤＳの制御のもとでゲート９３４を経て比
較器９１３の一方の入力に加えられ、また遅延回路９１
１を通つてゲート９２２の一方の入力に加えられる。レ
ジスタ９０５からの偏差信号符号はゲート９３６を経て
比較器９１３の他方の入力に加えられまた、遅延回路９
１５を通つて、ゲート９２４に加えられる。最初のテス
ト操作の間？ζレジスタ９０５内の符号はレジスタ９０
３内の最大の値の符号よりも小さいので、比較器９１３
は２つの偏差信号符号のどちらが小さいかを検出して、
制御発生器９４０から来る信号ＤＳ２が生じるとゲート
９２４が開くようにセツトされる、またレジスタ９０５
からの符号はバツフアゲート９３０を経て、レジスタ９
０３内に挿入される。また同時に、レジスタ９０７内の
認識コードＩＤＣがゲート９２６を通つてレジスタ９０
１に転送される。遅延回路９０９，９１１，９１５およ
び９１７は比較器９１３での比較が完了したあと、ゲー
ト９２０，９２２，９２４および９２６のうちの選択さ
れたゲートに対して動作するように充分の長さをもつも
のとする。次のテスト操作の終りに、発生器１２７から
得られる第２の偏差信号符号がレジスタ９０５内に挿入
され、この偏差符号がレジスタ９０３内の偏差符号と比
較される。

レジスタ９０３内の符号は、以前に得られた最小偏差符
号に相当する。比較器９１３はレジスタ９０３および９
０５内の符号のうちの小さい方がレジスタ９０３内に挿
入されるように動作し、また、より小さい偏差信号に対
応する認識コードをレジスタ９０１内に転送させるよう
に動作する。このようにして各テスト操作が終ると、よ
り小さい偏差信号符号が比較器９１３によつて選択され
て、レジスタ９０３内に記憶される。最終のテスト操作
が終ると、テスト操作の結果として、最小偏差信号がレ
ジスタ９０３内に記憶され、対応する認識コードがレジ
スタ９０１内に記憶される。このときのレジスタ９０１
内の認識コードが直交パラメータ特性が未知の話者の直
交パラメータ特性と最もよく一致する認識されている話
者の認識コードとなつている。未知の話者はこれによつ
て認識される。

【図面の簡単な説明】

一例として挙げた本発明の実施例が以下の図面を参照し
つつ述べられる。

Claims

【特許請求の範囲】１一組の参照用予測パラメータを認識される話者の音
声標本の予測分析から算出し、前記参照用予測パラメー
タから前記の認識される話者の身元を表わす一組の一次
信号を発生し、一組のテスト用予測パラメータを未知の
話者の音声標本の予測分析から算出し、前記テスト用予
測パラメータから一組の二次信号を発生し、前記一次信
号と前記二次信号とを比較して、前記未知の話者の仮定
した身元を認証する未知の話者の身元を確認する方法に
おいて、前記一組の一次信号＠Ｗ＠ｉを発生することは
前記一組の参照用予測パラメータＸｉからとり出された
一組の参照用係数Ｕｋｉと前記一組の参照用予測パラメ
ータＸｉとを掛け算することを含み、前記一組の二次信
号＠Ｚ＠ｉを発生することは前記一組のテスト用予測パ
ラメータと前記参照用係数とを掛け算することを含むこ
とを特徴とする話者の身元確認方法。２特許請求の範囲第１項に記載の方法において、前記
一組の参照用予測パラメータが前記一組の参照用係数に
よつて一組の参照用直交予測パラメータ信号に変換され
ること、前記一組の一次信号が前記認識される話者の音
声標本に関する前記参照用直交予測パラメータ信号の平
均値を表わす一組の信号を含むこと、前記「組のテスト
用予測パラメータが前記一組の参照用係数によつて一組
のテスト用直交予測パラメータ信号に変換されること、
および前記一組の二次信号が前記一組のテスト用直交パ
ラメータ信号の平均値を表わす信号を含むことを特徴と
する話者の身元確認方法。３特許請求の範囲第２項に記載の方法において、前記
一組の一次信号がさらに、前記一組の参照用直交予測パ
ラメータ信号の分散を表わす一組の信号を含むこと、お
よび前記一組の二次信号がさらに前記一組のテスト用直
交パラメータ信号の分散を表わす一組の信号を含むこと
を特徴とする話者の身元確認方法。４特許請求の範囲第１項ないし第３項のいずれかに記
載された方法において、一組の参照用予測パラメータを
複数の認識される話者のそれぞれの音声標本の予測分析
から算出し、前記一組の一次信号および前記一組の参照
用係数信号を前記認識される各話者に対し発生し、未知
の話者のテスト用予測パラメータ信号と前記未知の話者
について仮定した身元を表わす認識されている話者の参
照用係数信号とから認識された各話者に対応して一組の
二次信号を発生し、前記の認識される各話者の一次信号
を対応する二次信号と比較することを特徴とする話者の
身元確認方法。５特許請求の範囲第４項に記載された方法において、
認識された各話者の前記一次信号と対応する二次信号と
の比較によつて認識された各話者の前記の一次信号と前
記の対応する二次信号との間の差異を表わす三次信号を
発生し、最小の三次信号が前記未知の話者の身元を決定
するために検出されることを特徴とする話者の身元確認
方法。６特許請求の範囲第１項から３項いずれかに記載され
た方法において、前記一次信号と前記二次信号との比較
によつて前記一次信号と前記二次信号との間の差異をあ
らわす三次信号を発生し、さらに認証閾値信号を発生し
前記三次信号を前記認証閾値信号と比較することによつ
て、前記未知の話者について仮定した身元が受理される
かあるいはまた拒絶されることを特徴とする話者の身元
確認方法。７認識される話者の発声の予測分析から一組の参照用
予測パラメータを作り出すための手段と、前記参照用予
測パラメータに応答して前記認識される話者の身元を表
わす一組の一次信号を発生する手段と、未知の話者の発
声の予測分析から一組のテスト用予測パラメータを作り
出すための手段と、前記一組のテスト用予測パラメータ
から一組の二次信号を発生する手段と、前記一組の一次
信号と前記一組の二次信号とを比較して前記未知の話者
の仮定した身元を認証する手段とを含む未知の話者の身
元の確認する装置において、前記一組の一次信号＠Ｗ＠
ｉを発生する手段は前記一組の参照用予測パラメータＸ
ｉからとり出された一組の参照用係数Ｕｋｉと前記一組
の参照用予測パラメータＸｉとを掛け算する手段１１２
を含み、前記一組の二次信号＠Ｚ＠ｉを発生する手段は
前記一組のテスト用予測パラメータと前記参照用係数と
を掛け算する手段１１９を含むことを特徴とする話者の
身元確認装置。８特許請求の範囲第７項記載の話者の身元確認装置に
おいて、前記一組の一次信号を発生する前記手段が、前
記認識された話者の発声の言語的な意味内容とは実質的
に独立した一組の直交予測パラメータ信号を発生する手
段と、前記直交予測パラメータ信号に応答して、前記認
識された話者の発声に関する前記直交予測パラメータ信
号の平均値を表わす一組の信号を発生する手段とを含む
ことを特徴とする話者の身元確認装置。９特許請求の範囲第８項記載の話者の身元確認装置に
おいて、前記一組の二次信号を発生する前記手段が、前
言一組の参照用係数信号と前記一組のテスト用予測パラ
メータ信号とに応答して、一組のテスト用直交予測パラ
メータ信号を発生する手段と、テスト用直交予測パラメ
ータ信号に応答して、前記テスト用直交予測パラメータ
信号の平均値を表わす一組の信号を発生する手段とを含
むこと、および前記比較手段が前記参照用直交予測パラ
メータの平均値信号を前記テスト用直交予測パラメータ
の平均値信号と比較するための手段を含むことを特徴と
する話者の身元確認装置。１０特許請求の範囲第９項記載の話者の身元確認装置
において、前記の直交予測パラメータの平均値を比較す
る手段が、前記参照用直交予測パラメータの平均値信号
と前記テスト用直交予測パラメータの平均値信号との間
の差異を表わす三次信号を発生する手段を含むことを特
徴とする話者の身元確認装置。１１特許請求の範囲第１０項記載の話者の身元確認装
置において、さらに、前記参照用直交予測パラメータの
平均値信号間の許容しうる差異を表わす閾値信号を発生
するための手段と、前記三次信号を前記閾値信号と比較
するための手段とを含むことを特徴とする話者の身元確
認装置。１２特許請求の範囲第７から１０項までのいずれかに
記載の話者の身元確認装置において、複数の認識された
話者の各人を表わす一組の一次信号と、認識された各話
者に対応する一組の参照用係数信号とを記憶する手段を
含むこと、未知の話者に対して仮定した身元を表わして
いる認識された各話者に対応する一組の二次信号を発生
するよう構成されていること、また前記比較手段が一次
信号の組と認識された各話者の二次信号の組とを比較す
るように動作することを特徴とする話者の身元確認装置
。１３前記第１２項に記載の話者の身元確認装置におい
て、さらに、認識されている各話者に対する前記の比較
手段によつて作り出される前記三次信号に応答して、前
記三次信号の最小のものを検出する手段を含んでおり、
前記最小の三次信号とは前記認識されている話者の前記
参照用直交予測パラメータの平均値信号と対応するテス
ト用直交予測パラメータの平均値信号との間で最もよく
合致したものを表わすこと、および前記最小の三次信号
を発生した認識されている話者に対応する認識信号を発
生する手段を含むことを特徴とする話者の身元確認装置
。１４前記第７から１３項までのいずれかに記載された
話者の身元確認装置において、前記一組の参照用予測パ
ラメータが、前記発声の線形予測分析による一組の直交
パラメータから成ることを特徴とする話者の身元確認装
置。