JPH01502611A

JPH01502611A - 連続音声認識システム

Info

Publication number: JPH01502611A
Application number: JP61503471A
Authority: JP
Inventors: ジャーソン・アイラ　アラン
Original assignee: モトローラ・インコーポレーテッド
Priority date: 1986-06-02
Filing date: 1986-06-02
Publication date: 1989-09-07
Anticipated expiration: 2013-02-18
Also published as: WO1987007749A1; JP2717652B2; CA1301340C; US5040127A

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】連続音声認識システム発明の背景本発明は音声認識システムに関し、特に、話された単語（ｗｏｒｄ）の終点（ｅｎｄ　ｐａｉｎｔ）があらかじめ決まっていない音声の認識に関する。

既知の話し手（ｓｐｅａｋｅｒ）について所定の語♀（ｖｏｃａｂｕｌａｒｙ）から孤立した単語を認識することは長い間知られている。語當の単語を個別のテンプレート（型板）としてあらかじめ記憶しておき、各テンプレートが語常により単語に対する音のパターンを表わすようにする。孤立した単語が話されると、システムはその単語を語伯を表わす各個別のテンプレートと比較する。この方法は一般に完全単語テンプレート合致法（ｗｈｏｌｅ−ｗｏｒｄ　ｔｅａｐｌａｔｅ　ｍａｔｃｈｉｎｇ）と言われている。好結果を与える認識システムの多くは動的プログラミングを用いた完全単語テンプレート合致法を採用して、話された単語とあらかじめ記憶しであるテンプレートとの間の非線形時間尺度の変化に対処している。

この手法は孤立した単語を認識する用途には有効であるが、多くの実用的用途には連続した単語の認識が必要であてよく、始めの方の単語の本体は語句が終る前に決定することができるが、孤立単語認識では、入カバターンの始まりと終りとを特定するのに区切り記号（ｄｅｌ　ｆａｌｔｅｒ）を用い、認識は一度に１語ずつ行われる。更に、連続音声認識システムは入カバターンを他の認識可能なパターン、背景雑音、呼吸雑音のような話し手から出る雑音から区別しなければならず、一方孤立認識は通常、単語の始まりまたは終りに他の認識可能なパターンを容認できない。

Ｉ　ＥＥＥ　ｌ−ランザクジョン、音響学、音声および信号処理、ｖｏｌ、＾５ＳＰ−２７，Ｎｏ、Ｂ、　ｐｐ、５８８〜５９５　（１９７９年１２月）のＨ，５ａｋｏｅによる「２レベルＤＰ合致法−接続（ｃｏｎｎｅｃｔｅｄ）単語認識のためのパターン合致アルゴリズムに基づく動的プログラミング」では、完全単語テンプレート合致の方法が接続単語認識を取扱うように拡張されている。この論文は入カバターン全体に最もよく合う一連の単語テンプレートを見出す２パス（ｔｗｏ−ｐａｓｓ）動的プログラミング・アルゴリズムを提示している。第１のパスでは、入カバターンの各可能な部分に対して合致（ＩＩａｔｃｈ）　シた各テンプレート間の類似性を示すスコアを発生する。第２のパスでは、このスコアを使用して入カバターン全体に対応する最良のテンプレート列を見出す。

この拡張された方法には明らかな欠点がある。この技法の１つの欠点は必要な計算時間の量である。特定の設計要件によっては、この限度のため高価な高速プロセッサを不当に必要とすることがある。

この方法の他の欠点は入カバターンの終点をあらかじめ定めねばならず、入カバターン全体をテンプレートの合致が正確に生ずるまでシステム内に格納しなければならないということである。入カバターンがかなり長い場合には、認識応答時間が実質上悪くなる。また、終点検出時の誤差が認識器の性能を甚だしく低下させる。更に、この情報を格納するのに必要なメモリが極端に多くなることもある。

ＩＥＥＥ）ランザクシラン、音響学、音声および信号処理、ｖｏｌ、　ＡＳＳＰ −２７，Ｎｏ、　８．　ｐｐ、　５８８〜５９５　（１９７９年１２月）のＰ、　Ｂｒｏｗｎ、　Ｊ、　５ｐｏｈｒｅｒＳＰ、　Ｈｏｃｈｓｃｈｌｌｄ　ＳＪ、　Ｂａｋｅｒによる「部分的トレースバック（ｔｒａｃｅｂａｃｋ）および動的プログラミング」では、終点をあらかじめ定めずに任意の長さの入カバターンの連続音声認識を考慮した技法が述べられている。これは部分的トレースバックと呼ばれる技法を使用して行われる。部分的トレースバックでは、認識器の性能を犠牲にすることなしに完全な人カバターンの完成の前に認識された単語が出力される。しかしながら、記されている部分的トレースバック技法はプロセッサの負担になるとともに実行が厄介なように思われる。

したがって、容易に実行することができ、しかも実時間で効果的かつ安価に動作することができる連続音声認識システムの必要性が存在する。

発明の目的と概要本発明の目的は実時間用途に対して実施し安価なノ１−ドウエアで連続音声を認識することができる音声認識の機構と方法とを提供することである。

本発明の更に他の目的は認識プロセス中音声認識メモリを効果的にメモリ管理できる音声認識の機構と方法とを提供することである。

本発明の更に他の目的は認識プロセスに対して合致する可能性のあるテンプレート（ｔｅｍｐｌａｔｅ）を表わすソフトウェア・リンク・ネットワークを通して効率的なトレースバ・ツク（ｔｒａｃｅｂａｃｋ）ができる音声認識の装置と方法とを提供することである。

本発明の更に他の目的はストリング全体が人力される前に入力音声を認識することができる音声認識の装置と方法とを提供することである。

手短かに言えば、本発明は音声認識システムに関するものであり、入力フレーム（Ｉｎｐｕｔ　ｒｒａｍｅ）が音声を表わすあらかじめ格納されているテンプレートに対して処理され、認識される可能性のあるものとして考慮されているテンプレートはリンク・ネットワーク（ｌｉｎｋｅｄ　ｎｅｔν０「ｋ）に個別に記録されており、各リンク・レコード（ｌｉｎｋ　ｒｅｃｏｒｄ）は一般に先祖および子孫のリンク・レコードを備えている。音声パターンを認識する１つの装置と方法はリンク・レコードに対するテンポラリ・ポインタ（ｔｅｍｐｏｒａｒｙ　ｐｏｌｎｔｅｒｓ）を設けることと、リンク・レコードに対応する認識される可能性のあるテンプレートを接続するリンク・レコードを選択するのにテンポラリ・ポインタを使用してリンク−ネットワークを通して逆追跡（ｔｒａｃｌｎｇ　ｂａｃｋ）することから成立っている。認識される可能性のある２つ以上の子孫を持っている先祖レコードを備えたこれらリンク・レコードはそのテンポラリ・ポインタが除去されている。ネットワーク内の残りのリンク・レコードは、なおテンポラリ・ポインタのラベルが付いているが、認識される単語として出力されるその関連単語を備えている。

本発明の他の特徴は上記と同様の構成の音声認識システムに関するが、音声認識メモリの管理を自損している。本発明のこの特徴はリンク・レコードをインデックス付データ集合体（Ｉｎｄｅｘｅｄ　ｄａｔａ　５ｅｔｓ）として格納する手段を備えている。各データ集合体（ｄａｔａ　５ｅｔ）はテンプレートを表わす記号と、リンク・レコードが格納された相対的時間を表わすシーケンス・インジケータと、ネットワーク内のそこからそれが派生して来たリンク・レコードを示すポインタとを備えている。テーブル（ｔａｂｌｅ）は自由（ｒｒｅｅ）レコード・スペースと設定（ｅｓｔａｂｌ　ｌ５ｈｅｄ）レコード・スペースとから構成され、リンク・レコードは設定レコード・スペースに格納される。更に、明確に認識されたネットワーク・パス（ｎｅＬｖｏｒｋ　ｐａｔｈｓ）の一部であるこれらリンク・レコードを特定する手段が採用されている。明確に認識されたリンク・レコードは認識されたものとして出力（転置）され、設定レコード・スペースから転置されたこれらリンク・レコードはリンク・ネットワークに別のリンク−レコードを引続き格納するための自由レコード・スペースとして利用できるようになる。

図面の簡単な説明本発明の特徴で新規であると信ぜられるものは特許請求の範囲に特異性とともに示しである。本発明は、その他の目的と利点とともに、付図と関連して行う次の説明を参照することにより最も良く理解されるが、付図のいくつかの図面で同じ参照数字は同じ要素を示している。

第１図は本発明にしたがって描いた音声認識システムのハードウェアのブロック図である。

第２図は本発明にしたがって実施した音声認識システムの１つの局面を示す認識文法モデルの図式表現である。

第３図は第１図の音声文法モデルによるすべての可能なバス（径路；　ｐａｔｈｓ）を列挙した音声文法トリー（ｔｒｅｅ）の図式表現である。

第４ａ図、第４ｂ図、および第４Ｃ図は本発明による認識プロセスを実施するのに行われる一連のステップ゛を描く流れ図である。

第５図は第４Ｃ図のブロック７２を一層詳細に示す流れ図である。

第６８図、第６ｂ図、第６ｃ図、および第６ｄ図は第４ａ図のブロック４４を一層詳細に示す流れ図である。

第７図は本発明による「トレースバック」の１例を示す一連の文法トリー図である。

好ましい実施例の詳細な説明第１図を参照すると、本発明を実施するのに使用することができる音声認識システムのブロック図が示されている。

ブロック図はあらかじめ格納した語量が入っているテンプレート・メモリ１０を含んでいる。典型的なあらかじめ格納した語量の形成はアメリカ音響学会誌、６８　（５）、１９８０年１１月のり、　Ｒ，Ｒａｂｉｎｅｒ　、　Ｊ、　Ｇ、　Ｗｉｌｐｏｎによる「訓練された話者に対する簡略化した強力訓練手順、孤立語認識システム」に述べられている。音響学、音声、および信号処理に関するＩＥＥＥ）ランザクジョン、ｖｏｌ、　ＡＳＳＰ−３１゜ＰＰ、　７９３〜８０Ｇ　（１９８３年８月）のＢ、　Ａ、　Ｄａｕｔｒｊｃｈ、　Ｌ、　Ｒ。

Ｒａｂｉｎｅｒ　、およびＴ、　Ｂ、　ＭａｒＮｎによる「孤立語認識のフィルタ・バンク・パラメータに変化をつけることの効果について」に述べられているような音響プロセッサ１２は入力音声を、一般に「フレーム」と言う、一連の音声セグメン）　（ｓｅｇｍｅｎｔｓ）に変換することができる。各フレームは入力音声の時間セグメントを、通常はＬＰＣまたはフィルタ拳バンク・データの形で表わす。音響プロセッサからのフレームは認識器１４に伝えられる。

認識器１４はテンプレートφメモリ１０にあらかじめ格納しである語當から単語テンプレートにアクセスし、音響プロセッサ１２からの各入力フレームを単語テンプレートのセグメントを用いて処理する。このような技法は多くの音声認識システムに固有のものであり、「テンプレート処理」と言うことができる。

認識器１４は第２のメモリ、すなわちリンク・テーブル１６のメモリに両方向からアクセスする。リンク・テーブル１６のメモリは５個の関連アレイを格納するのに使用される。アレイについては更に以下に説明する。

認識器１４は２つのプロセッサ、すなわち認識プロセッサ１８とリンク・トレースバック・プロセッサ２０とを用いて実現することができる。認識プロセッサ１８はテンプレート合致、文法、制御、およびリンク・トレースバック・プロセッサ２０との通信のすべてを処理する。リンク・トレースバック・プロセッサ２０はリンク・テーブル用メモリを維持する（ｍａｌｎｔａｌｎ）のに使用される。

この機能は連続音声を入力しながら可能なテンプレート合致を記録すること、関連情報をリンク・テーブル用メモリ１６に格納すること、リンク・テーブル用メモリ１６のスペースを他の情報のため自由にすること、および入力音声が特定されるにつれて認識結果を出力することを含む。認識プロセッサ１８とリンク・トレースバック・プロセッサ２・０との機能は１つのプロセッサに組合せたり、あるいは、図示のように分離することができ、これにより認識プロセッサ１８を事録ｐｐ、　８９９〜９０２　（１９８２年）のＪ、　Ｂｒ１ｄｌｅ　％　Ｍ、　ＢｒｏｗｎｓおよびＲ，Ｃｈａｍｂｅｒｌａｉｎの「接続単語認識のアルゴリズム」に詳細に説明されているように実現することができる。リンク・トレースバック・ブ♂セッサは、本発明にしたがって使用するときは、モトローラのＭＣ６８０１のような８ビツトのプロセッサを用いて実現することができる。

文法のモデル化今度は第２図を参照すると、システムが認識することができるすべての可能な単語シーケンスを示す簡略化した認識文法モデルが示されている。二のモデルは示されている語量が、例示の目的で、一般的に必要なものから、ひどく限定されているので、「簡略化した」と言う。第２図には、各々が２語から成る６つの可能な単語ストリングが存在する（第３図で更に説明する）。典型的な音声認識システムでは、文法モデルは各々が敷詰を含む一層多くの可能な単語ストリングを備えることができる。文法モデルのトポロジー（ｚｏｐｏｌｏｇｙ）は、ポインタがテンプレート・メモリ内の対応するテンプレートを指している状態で一部メモリに格納される。文法モデル内の各ノードは、それと関連して、−酸メモリに格納されている、テンプレート合致が始まるノードを指すポインタとその関連する累積距離とを備えている。

文法パスのモデル化第３図において、第２図からの６つの可能な単語ストリングの各々がトリー図に列挙されている。３つの可能な第１語、ｒＯＮＥＪ　（ワン）、ｒＴＷＯＪ　（）ウー）、およびｒＴＨＲＥＥＪ　（スリー）が存在する。各可能な第１語には２つの可能な第２語ｒＦＯＵＲＪ　（フォー）およびｒＦＩＶＥＪ　（ファイブ）が続く。テンプレート合致の期間中、すなわち、入力フレームがあらかじめ格納した単語テンプレートと比較されている間、認識プロセッサは可能な「単語終端」を認識する。可能な「単語終端」は一連の入力フレームが単語テンプレートと合致する可能性があれば見つかる。特定された単語テンプレートは、先に述べたリンク・テーブルに格納されているリンク情報と、処理されている一連の入力フレームとノードに導くテンプレートとの間の類似性の尺度を示す累積距離とを通してトリー図に付加される。たとえば、第２図および第３図の誘電ストリングの可能性を与えて、入力フレームのシーケンスが単語ｒＴＷＯＪと合致する可能性があるものとして特定されると、ｒＴＷＯＪが始めのノード、すなわちノード２４からトリー図に付加される。第３図は別のフレームが人力され処理されてから、単語ｒＯＮＥＪが可能性のある合致となったことを示している。したがって、これは次にノード２４でトリー図にも付加される。次に単語ｒＴＨＲＥＥＪがトリー図に付加され、次いでｒＦＯＵＲＪがノード２６に付加され、その後同じノードにｒＦ　ＩＶＥＪが付加され、以下同様となる。これは各可能性ある合致テンプレートが早暁特定されるにつれてこれをトリー図に付加しながら続Ｉｔ　；　ＩＬ　６・　。

「トリー・ノード」と言う言葉、あるいはトリー図中のノードへの参照はリンク・レコード（ｌｉｎｋ（ｅｄ）　ｒｅｃｏｒｄ）という言葉と相互に交換可能に使用することにする。一般に、リンク・レコードはトリー図中の接続を規定するメモリに格納されているデータ集合体（ｄａｔａ　５ｅｔ）であり、特定のトリー・ノードの特定とトリー・トポロジー内の前のノードとの関係とを含む。

単語の終端の可能性があるフレームごとに、新しいエントリー、またはリンク・レコードが代表的トリー図中のりンクに対応するリンク・テーブルに追加される。きわめて頻繁に、典型的には状態図の形で（状態を表わす）一連のフレームとして表わされている単語テンプレートに、入力フレームが処理されるにつれて、単語の終端である可能性が複数現われることになる。単語の終端の可能性が検出されるごとに、対応するテンプレートが新しいリンクとしてトリーに追加される。更に、各テンプレートの各状態は、現在の人力フレームを通して処理された蓄積距離と、そのテンプレートに対するデコーディングが始まるトリーのリンクに対応するリンク・テーブルのリンク・レコードを指すリンク・ポインタとを記録している。テンプレート合致に関するこれ以上の事項については、上述の「接続単語認識のアルゴリズム」を参考にすることができる。

残念ながら、語量が大きいと、トリーに絶えず付加するテンプレートから問題が生ずる。第１に、これによって認識応答時間が遅れる。入力フレームのシーケンスが長くなるほど、オペレータは、システムが認識しその認識した単語に対して処理を行うまで待たなければならない時間が長くなる。

第２に、テンプレートを絶えず追加するにはトリー図の情報をリンクするための多大なメモリが必要である。文法モデルが複雑でかつ各可能性のある単語に対して、いくつかの可能性のある単語終端フレームが、合致する場合、リンク・テーブル（トリー）に必要なメモリは非常に急速な割合で大きくなる。大きくなる割合が大きすぎれば、メモリの所要条件は非実用的となる。

本発明はリンク・テーブルを独特な構成とし、かつこれを非常に効率的に維持することにより、これらの問題を克服している。

リンク・テーブルリンク・テーブルは、第２図と同様のトリー・ネットワークの形に合うように、考察中の可能性のある単語シーケンスのすべてを表わすものである。単語シーケンスは、事実、テンプレート合致期間中に検出された可能な単語終端を有する連結されたテンプレートである。このような方法でネットワークを設定することにより可能性のあるあらゆる単語シーケンスの明瞭な部分であるこれらのリンクを分析することができる。この分析プロセスをトレースバック（ｔｒａｃｅｂａｃｋ）と言う。適格に利用すれば、トレースバックにより、もはや明らかになお考察中のシーケンスの一部ではなくなっているリンク・レコードを解放する効率的な方法が可能となる。

トリー図の各リンク、あるいはノード式トリー接続には数種類の情報を格納しておかなければならない。この情報は第１図のリンク・テーブル１６のメモリのＬ −ＡＣＴ。

Ｌ−ＦＷＲＤＳＬ−ＢＡＣＫ、Ｌ−ＷＯＲＤ、およびＬ−ＰＴＲのアレイに格納される。この実施例では、各アレイは長さが２５５バイトで、２５６バイトのバウンダリから１バイト過ぎた位置に配置されて、効率的アクセスができるようになっている。各アレイからの対応する要素は「すンク・レコード」を構成している。リンク・レコードは２リンク式リストになるようにチェインされている。１つのリストは自由リンク・レコード、すなわち、追加リンクに利用できる空きレコード・スペースを備えている。第２のリストは設定したリストであり、現在使用されているリンクのレコードを備えている。これらのリストはＬ−ＰＴＲアレイによって互いにチェインされている。この場合し−ＰＴＲ内の１つのエントリは、設定リストまたは自由リストからの、テーブル内の次のリンク・レコードを示しており、各レコードは各５つのアレイからの１バイトを含んでいる。たとえば、設定リスト内の所定のリンク・レコードについて、Ｌ−ＰＴＲアレイの対応するバイトが数「２」の２進表現を含んでいれば、設定リスト内の次のレコードは５つのアレイすべての第２バイト目に存在することになる。Ｌ−ＰＴＲアレイの「０」エントリはリンク式リストの終端を画定している。

Ｌ−ＢＡＣＫアレイとＬ−ＷＯＲＤアレイとは実際のリンク情報を備えている。

Ｌ−ＢＡＣＫはデコード・パス内の前のリンク、すなわち、トリー図の前のノードを指すポインタを備えており、一方、Ｌ−ＷＯＲＤは現行リンクの終りにデコードされた単語を表わす記号を備えている。たとえば、第３図において、トリー・ノード２６に単語「ＦＯＵＲＪを付加してから、Ｌ　−ＷＯＲＤは単語ｒＦＯＵＲＪを表わす８ビット記号を備え、Ｌ−ＢＡＣＫはトリー・ノード２６に対応するリンク・レコードを指すポインタを備えることになる。その他の２つのアレイ、Ｌ−ＡＣＴとＬ−ＦＷＲＤとはデコード・パスを通る「トレースバック」（可能性ある単語シーケンス）に使用される。Ｌ−ＡＣＴは合致の可能性あるものとしてなお考察中のデコード・パスを示すのに使用され、Ｌ−ＦＷＲＤはトリー口内の後続ノード、すなわちＬ−ＢＡＣＫの逆、をポイントするのに使用される。今後、認識される可能性あるパス（アクティブ・パス（ａｃｔｉｖｅ　ｐａｔｈ）　）の一部として考察されているとフラグが立てられたリンク・レコードをアクティブ・リンク・レコードと称することにする。

リンク・レコードはトレースバック情報を示すので、その状態に到達するのに使用される単語モデルを通るパスを確認することができる。トレースバックはトリーから役に立たない情報を切払うこともできる。これは情報がメモリ内に余分に蓄積されないようにするのに必要である。トレースバックは明瞭に認識されている単語、すなわちアクティブ・パスすべてに共通な単語を出力するのに使用することもできる。リンク・テーブルのＬ−ＢＡＣＫエントリはテーブル内の前のエントリを指しており、これはトリー口内の前に接続したノードに対応する。したがって、トレースバックはトリー図を通ってすべてのパスが会合する点、すなわちトリー・ノードまで逆に追跡する（ｔｒａｃｉｎｇ　ｂａｃｋ）プロセスであると言われる。すべてのパスが会合する点まで追跡して戻るという概念は当業者にはよく知られている。

というのは「トレースバック」の一般的説明は前掲の「部分的トレースバックおよび動的プログラミング」を参照して行われるからである。

上述のアレイを後続の図の説明中の参考のため以下に掲げる。

Ｌ−ＰＴＲ：　２５５バイト。各バイトはトリー図（テーブル）に設定リストに対する時間の関数として付加された前のリンク・レコードを指すポインタとして利用できる。また自由リストの自由リンク・レコードをチェインするのにも使用される。

Ｌ−ＢＡＣＫ：２５５バイト。各バイトはトリー図の前のリンク・レコードを指すポインタとして利用できる。

Ｌ−ＷＯＲＤ　：　２５５バイト。各バイトは現行リンク・レコードに対応する、可能性のある認識単語を示す記号として利用できる。

Ｌ−ＡＣＴ　：　２５５バイト。各バイトは現行リンク・レコードがアクティブか否かを示すのに利用することができる（トレースバック中に使用される）。

Ｌ−ＦＷＲＤ：　２５５バイト。各バイトはトリー図中の後続有効リンクφレコードを示すポインタとして利用できる（トレースバック中に使用される）。

上述のアレイの他に、別の５つのポインタが使用される。

それらは次の通りである。

ＨＥＡＤ　：　Ｌ−ＰＴＲアレイによってチェインされた、設定リスト内の最初の、すなわち最も最近に追加されたリンク・レコードを示す１バイトのポインタ。

ＦＲＥＥ　：　Ｌ−ＰＴＲアレイによってチェインされた、自由リストの最初のリンク・レコードを示す１バイトのポインタ。

ＰＴＲ：処理中の現行トリー・ノードを参照する１バイトのポインタ。

ＴλＩＰＩとＴＭＰ２二それぞれ認識流れ図に使用される１バイトのテンポラリ（ｔｅｍｐｏｒａｒｙ）　やポインタである。

構造的に、設定リスト内に１０個のエントリだけを備えたテーブルを仮定すると、これらのアレイは次のように配列することができる。

レコード番号　Ｌ−ＰＴＲＬ−ＢＡＣＫ　Ｌ−ＷＯＲＤ　Ｌ−ＡＣＴ　Ｌ−ＦＷＲＤ上記テーブルのエントリを付録Ａにトリー図で示す。ＨＥＡＤはレコード＃（番号）７を指し、レコード＃３のＬ−ＰＴＲエントリの「０」はリストの最後のレコードを示すことに注目すべきである。ＦＲＥＥは図示してない。

Ｌ−ＰＴＨにより、設定リスト内のレコードを、レコードを自由リストから単に取出してそのＬ−ＰＴＲエントリにＨＥＡＤレコードを指示させ、ＨＥＡＤとＦＲＥＥとを更新することにより、入れることができる。トレースバック中にレコードをテーブルの設定リストから削除すると、そのレコードは、レコード・エントリを自由リストにリンクし、Ｌ−ＰＴＲエントリを利用して設定リストの除去レコードにわたってリンクすることにより、テーブルを配列しなおすことなく利用できるようになる。Ｌ−ＡＣＴおよびＬ−ＦＷＲＤのエントリはトレースバック中にのみ使用され、その他の場合は常にＯにリセットされている。

認識流れ図今度は第４ａ図から第４Ｃ図までを参照すると、認識流れ図が本発明にしたがって示されている。第４ａ図の流れ図はリンク・テーブルとその関連ポインタとをリセットすることによりブロック３０から始まる。リセット手順にはＬ−ＦＲＷＤとＬ−ＡＣＴとの各バイトを０に等しくセットすること、ＨＥＡＤポインタを１に等しくセットして設定リストの始まりを示すこと、およびＬ−ＰＴＲ（１）とＬ−ＰＴＲ（２５５）とを等しく０にセットしてそれぞれ設定リストと自由リストとの終りを示すことが含まれる。

また、典型的には一層メモリに格納されているテンプレート状態メモリがインアクティブ（１ｎａｃｔｉｖｅ）にされる。したがって、第１のレコードは設定リストから構成され、レコード２から２５５まではＬ−ＰＴＲエントリを使用して自由リストを形成するようにチェインされる。ここでＨＥＡＤは設定リストの始まりを指し、ＦＲＥＥは自由リストの始まり（リンク・レコード＃２）を指す。

第４ａ図のブロック３２で、認識文法モデルが初期設定される。初期設定はモデルの最初のノードをアクティブにマーキングすることを含む。これはそのノードに低い累積距離尺度を任意に割当て文法内の始発点を示すことにより行われる。

最初のノードに対するリンク・ポインタは１１；セットされるが、これはリンク・テーブル内で初期設定された最初のエントリに対応する。逆に、文法モデル内の他のすべてのノードはインアクティブに初期設定される。ノードに対する累積距離を、処理が始まるとき二〇ノードで起りそうもないことを示す無限大に等しくセットすれば、そのノードをインアクティブにセットすることができる。

ブロック３４で、トレースバック中カウンタが１０に初期設定される。トレースバック・カウンタはトレースバック・プロセスを行うべきことを周期的に示すのに使用される。この実施例では、トレースバックは１０個の入力フレームが処理されるごとに行われる。

ブロック３６で次の入力フレームが先に述べたテンプレート合致のためにシステムに入力される。この流れ図の残りのステップはすべて現在の入力フレームの処理に関係する。

トレースバック・カウンタはブロック３８でデクレメン）　（ｄｅｅｒｅｍｅｎｔ）　してフレームが丁度入力されたことを示す。

ブロック４０で文法モデルのすべてのノードが処理されたか否かを確認する試験が行われる。換言すれば、−人力フレームが文法モデル全体について処理されたか否かについてである。文法モデルのすべてのノードが処理されてしまっていれば、流れはブロック４２に進んでトレースバック中カウンタがトレースバックをこのフレームで行うべきことを示しているか確認する。もしそうなっていれば、第６ａ図から第６ｄ図までの後に説明するトレースバック拳サブルーチン４４を呼んでトレースバックが行われる。トレースバックに続き、ブロック３６で次の入力フレームを処理する前に、ブロック４６でトレースバック・カウンタがリセットされる。

文法モデルのノードがすべては処理されてしまっていなければ、流れは第４ａ図のブロック４０から第４ｂ図のブロック５０に進む。ブロック５０で、認識文法モデルの処理が次のノードまで進む。このフレームについてノードが処理されていなければ、１次のノード」は文法モデルの最初のノードである。今後、ブロック５０で、「次のノード」とは丁度処理されたばかりのノードに続くノードまたはそれと平行なノードを指す。特に、処理のためのノードの順序は、そのノードで終るすべてのテンプレートに対する始発ノードが現行フレームに対して処理されてしまうまで、ノードが処理されないようになっていなければならない。

これはノード累積距離とリンクとがテンプレートの始発ノードについて、これらのテンプレートが処理される前に確実に更新されるようにするためである。

ブロック５２で、新しいノードがインアクティブにセットされる。これはそのノードに関する累積距離を無限大に等しくセットすることにより行われる。

ブロック５４でこのノードで終るすべてのテンプレートが処理されてしまったか否かを確認する試験が行われる。

その後文法モデルの各ノードの直ぐ前の各テンプレートが他のノードに進む前に処理されることが認識される。このノードて終るテンプレートのすべてが処理されてしまうと、流れは後に説明する第４ｃ図のブロック６８に進む。すべてのテンプレートがまだ処理されていなければ、流れはブロック５６に進み、現在の入力フレームに対して、トレースバックが必要であるか確認する。したがってトレースバック・カウンタが０と比較される。

この時点で、これまで認識流れ図で示された認識文法モデルの処理を要約するのが有用であろう。もう−魔笛２図を参照すると、文法モデルの初期ノード２２がアクティブにセットされ、対応するリンク・テーブル・エントリが可能性のあるすべての文法バス（トリーの枝）が発生する基準を示すように初期設定される。

入力フレームが処理されるごとに、文法モデルは一度に１ノードずつ始発ノードから終了ノードまで進む。更に、文法モデルの各ノードに対して、そのノードで終る各テンプレートが、後に説明するように、１度に１つのテンプレートを処理する。したがって、各入力フレームごとに、各ノードが処理され、各ノードごとに、そのノードで終る各テンプレートが処理される。

ブロック５６で示したように、トレースバックが必要であるか否かに無関係に、次のテンプレートがブロック５８かブロック６０かで処理される。いずれかのブロックでテンプレートが合致すると、現行入力フレーム、テンプレート、およびテンプレートのあらゆる状態に対する累積距離およびリンク・ポインタの他に文法モデルの始発ノードに対する累積距離およびリンク・ポインタに基づいて、テンプレートのあらゆる状態に対する累積距離とリンク・ポインタとが更新される。現在のフレームのこのテンプレートに対して単語終端である可能性が存在すれば、可能性ある単語終端に対応する累積距離とリンク・ポインタとが発生する。

前掲の接続単語認識のアルゴリズム。

流れがブロック５６からブロック６０に進み、トレースバックが、上述のテンプレート処理の他に、このフレームを処理していることを示すと、そのテンプレート内の各アクティブ状態に対するリンク・ポインタが指すリンク・レコードに対応するＬ−ＡＣＴエントリのすべてが非ゼロにセットされる。「アクティブ」テンプレート状態は有限累積距離を有するものである。

次に流れはブロック６２に進み、ここでそのテンプレートに関連する累積距離がこのフレームに対するノードで終る先に処理された最良のテンプレート（これはこれがこのノードに対して処理された最初のテンプレートである場合には無限大になる）に対応する現行累積距離より良いか否かを確認する試験が行われる。この試験の結果は現在の入力フレームのテンプレート合致が単語テンプレートの単語終端である可能性があることを示す場合にのみ真である。

先に述べたとおり、単語終端である可能性があれば入力フレームのシーケンスがテンプレート・メモリに格納されている単語テンプレートと対応する、すなわち合致することを示す。

テンプレートに現在の入力フレームに対して単語終端の可能性がなければ、その関連の累積距離は無限になる。

最も最近に処理されたテンプレートにそのノードに関して格納されている前の累積距離より良い累積距離がないことがわかれば流れはブロック５４に戻り、ここでそのノードで終る別のテンプレートが処理される。

最も最近処理されたテンプレートに対する累積距離がそのノードに関して今まで処理されたものの中で最良であることがわかれば、流れはブロック６４に進んでこの情報を記録する。ブロック６４で、上で処理されたテンプレートに対応する累積距離とリンク・ポインタとが文法モデルのノードとして記録される。他に、テンプレートを表わす単語番号、あるいは記号が記録される。単語番号は、後に認識されたと確認されれば単語を引続き出力するために記録される。ブロック６４から、流れは上に説明したようにブロック５４に進む。

ブロック５４て、そのノードで終るすべてのテンプレートが処理されたことが示されれば、流れは第４Ｃ図のブロック６８に進む。第４ｃ図で、ブロック６８から７４まではリンク・レコードをトリーに加えるべかき否かを確認し、もし加えるべきである場合には、リンク・レコードがリンク・アレイを通してトリーに加えられる。

ブロック６８で、文法モデルのノードがアクティブであるか確認する試験が行われる。ノードがアクティブになっていることができる唯一の態様は、そのノードに対して処理された少なくとも１つの単語テンプレートが現在の入力フレームに対して単語終端である可能性がある場合である。

ノードがインアクティブである場合には、流れは第４ａ図のブロック４０に進み、現在フレームに対して処理する他のノードを探す。それ以外の場合は、流れはブロック７０に進む。

ブロック７０で、そのノードで終る最良テンプレートが単語テンプレートであったか否かを確認する試験が行われる。ある例では、無音テンプレートのような別種のテンプレートであってもよく、この場合には流れは第４ａ図のブロック４０に進む。無音テンプレートは、典型的には認識されているような無音を出力する必要がないから、トリーには加えられない。そのノードで終る最良のテンプレートが単語テンプレートであった場合には、ＬＩＮＫサブルーチン（第５図）が呼出されてリンク・レコードをトリー図に加える。そのテンプレートの始発リンク・レコードに対応するリンク・ポインタとテンプレートを表わす単語番号とを示すパラメータはＬＩＮＫサブルーチンに送られる。

以下に説明するように、リンク・レコードが加えられてから、新しいリンク・ポインタがＬＩＮＫから戻される。

ブロック７４で、文法モデルの現行ノードに対するリンクφポインタがＬＩＮＫから送られたリンク・ポインタにセットされる。

ブロック７４に続いて、流れは第４ａ図のブロック４０に進み、文法トリーのすべてのノードが現在の入力フレームに対して処理されてしまったかチェックする。

リンクのトリーへの付加今度は第５図を参照すると、先に説明したようにこのサブルーチンはリンク・レコードをリンク・アレイで規定されたようにトリー図に追加する。サブルーチンに送られるパラメータはそこから加えられるトリーのノードに対応する単語番号とリンク・ポインタとである。

ブロック７８で、自由リンク−レコードが存在するか否かを確認する試験が行われる。これはＦＲＥＥとＯとを比較することにより行われる。ＦＲＥＥが０に等しければ、もはや自由リンク・レコードは存在しない。上に説明したが、リンク・アレイ内のレコードは、Ｌ−ＰＴＲアレイで互いにチェインされており、自由リンク・レコードと設定リンク・レコードとから構成されている。自由リンク・レコードは別のリンク書レコードをトリー図に追加できるようにする。したがって、自由リンク・レコードが存在しなければ、すべてのリンク・レコードは使用されており、流れはブロック８０に進んでエラーが報告され、システムがリセットされる。ブロック８０のこのステップはリンク・テーブルをオーバフローさせるおそれのある異常状態から保護するときにのみ使用することに注意すべきである。正常状態では、本発明は適当な長さのリンク・テーブルを使用して自由リンク・レコードがなくならないようにしている。

１つ以上の自由リンク・レコードがあれば、流れはブロック８２に進み、次の利用可能なリンク・レコードが自由リストから取出され、ＨＥＡＤおよびＦＲＥＥのポインタを更新することにより設定リストの最上部、すなわち始まりに挿入される。ＦＲＥＥは次の自由レコードのインデックス（ｉｎｄｅｘ）を指すようにセットされ、ＨＥＡＤは丁度加えられたばかりのリンク・レコードを指すようにセットされる。新しいＨＥＡＤリンクψレコードのＬ−ＰＴＲは新しいレコードを設定リストにチェインする、前のＨＥＡＤリンク・レコードを指すようにセットされる。

ブロック８６では、ＨＥＡＤは設定リストに丁度加えられたばかりのリンク・レコードを指すので、このサブルーチンに送られた単語番号がＬ−ＷＯＲＤアレイに新しいレコードとして記録される。また、このサブルーチンに送られたり、ンク・ポインタはＬ−ＢＡＣＫアレイにリンク・レコードとして記録される。

ブロック８８で現在の入力フレームにトレースバックが必要であるか否かを確認する試験が行われる。必要であれば、流れはブロック９０に進み、新しく加えられたリンク・レコードにアクティブの印が付く。これはそのレコードのＬ−ＡＣＴアレイを１に等しくセットすることにより行われる。現在の入力フレームに対してトレースバックが必要でなければ、サブルーチンは終り、流れは第４Ｃ図のブロック７４に戻る。

トリーを通るトレーシング・バック今度は第６ａ図から第６ｄ図までを参照すると、トレースバック・サブルーチン、すなわち、第４ａ図のブロック４４が詳細に示されている。トレースバック・サブルーチンはトリー図を通して可能性のある合致として特定されている単語を探し、合致の一義性（ｕｎｌｑｕｅｎｅｓｓ）にあいまいさくａｍｂｌｇｕｉｔｙ）があるか否か確認する。一義的に特定されている単一は認識システムから認識された単語として出力される。更に、トレースバック・サブルーチンは死んだすべてのリンク・レコード、すなわち、もはや可能性ある合致として考察していないレコードを自由リストに取出し、メモリを将来のリンク・レコードに利用できるようにする。

トレースバックに入る前に、Ｌ−ＡＣＴが上述のようにすべてのアクティブ・リンク・レコードに対してセットされる、すなわちフラグが掲げられる。トレースバックのはじめに、アクティブ・リンク・レコードはトリーを通るまだ考察中のすべてのパスの終りを表わす。トレースバックの基本概念はトリーを通してすべてのアクティブ・パスの終り（はじめにＬ−ＡＣＴアレイにより印がつけられている）から「トレースバックしてすべてのアクティブ・パスがどこで会合するかを見つけることである。すべてのアクティブ・パスに共通なトリーの部分は明確な部分パスを表わしており、この明確な部分パスに対応するこれらの単語は認識されているとして出力することができる。トレースバック中、Ｌ−ＦＷＲＤアレイは部分パスを順方向に（トリーの終りの方に向って）チェインするのに使用される。これら部分パスが形成されるにつれて各部分パスの基本ノードがＬ−ＡＣＴアレイを経由してアクティブとされる。部分パスを（Ｌ−ＢＡＣＫ情報を使用して）現行ノードから既にアクティブと記されている前のノードに拡張しようとすると、１つ以上の可能なパスが二の前のノードから発生して両ノードからの部分パスが削除される（順方向ポインターチェイン（Ｌ−ＦＷＲＤ）がＯにリセットする）。アクティブと記されているすべてのノードはこのような仕方で処理される。ノード処理の順序はリンク・レコードがリンる。この順序は設定リストの構造に固有のものである。処理される最後のノードはトリーのルート（ｒｏｏｔ）・ノードである。この点でそのノードから出る順方向チェイン（部分パス）は明確な部分パスを表わしており、対応する認識された単語が出力される。トレースバック手順はまたＬ−ＦＷＲＤおよびＬ−ＡＣＴアレイが０へのリセットを完了したら直ちにそれ自身「掃除する（ｃｌｅａｎｓ　ｕｐ）　Ｊ。更に、アクティブ・パス上にないすべてのリンク・レコードは、既に出力されている明確な部分パス上のリンク・レコードとともに、自由リストに戻される。

トレースバック・サブルーチンを詳細に説明する前に、図示例に入るのが役に立つであろう。第７図を参照すると、このような例が一連のトリー図Ａから１までとして描かれている。

図Ａでは、トリーはトレースバックの前に示されており、アクティブ・リンク・レコード、すなわち、アクティブ単語リンクが出ているリンクはリンクの右側に太い点で記しである。トレースバックの第１のステップは丁度良い時期に加えられた最も最近のアクティブ・リンク・レコード、この場合は２５と記したノード、を確定することである。

トリーのこのノードの直前にアクティブ・ノードが存在するか確認する試験が行われる。存在すれば、この例でノード２５を経由するかまたはノード２１を経由するというように、どのパスがノード２１に戻るかに関してあいまいさが存在する。あいまいさが生ずるとあいまいなノードに対する順方向ポインタがそのチェインされた順方向ポインタを、もし存在すれば、取除く。これは各後続のリンク・レコードに対してＬ−ＦＷＲＤアレイにＯを挿入することによって行われる。

この例では、どのノードにも順方向ポインタがない。すなわちＬ−ＦＷＲＤ−０である。

次の最も最近加えられたアクティブ・リンク・レコードが特定される（ノード２４）。ノード２４の先行リンクもノード２１であり、上述のノード２５の処理と同様に処理される。

次の最も最近加えられたアクティブ・ノードはノード２３である。二〇ノードにはアクティブな先行ノードがないので、トレースバック・プロセスは先行ノードをアクティブとし、現在処理しているノード、ノード２３、に等しい、先行ノード、ノード１９、の順方向ポインタ（Ｌ−ＦＷＲＤ）を記録する。図Ｂはノード２３を処理した後の図Ａを示しており、ノード１９に加えられた順方向ポインタを太線で描いである。各ノードが処理されたら、それがアクティブ・ノードであることを示しているそのＬ−ＡＣＴエントリが取除かれる。したがって、トリー図Ｂはもはやノード２３．２４、および２５をアクティブと描いていない。

ノード２２はアクティブ・ノードを備えている、次に最も最近加えられたエントリである。これにはアクティブな先行ノードがない。したがって、ノード２３に対して行ったように、ノード１８の順方向ポインタがノード２２に等しくセットされ、ノード１８にアクティブの印が付けられる。図Ｃはノード２２を処理した後のトリーを示す。

ノード２１は、図りに示すように、その先行ノードがアクティブでないので、ノード２２と同様に処理される。

ノード２０は次に処理されるべきアクティブ・ノードである。ノード２０に先行するノードはアクティブであり、これはあいまいさを示す。あいまいさが生ずると、あいまいさのノード、この場合ノード１８と２０、に対する順方向ポインタはその順方向ポインタ・チェインが解かれる。

この例ではノード１８にだけ順方向ポインタがある。ノード１８の後に太線で示したように、ノード１８に対する順方向ポインタはノード２２と等しくセットされている。したがって、図Ｅで、ノード１８の順方向ポインタを０に等しくセットすることにより、太線が除去される。

ノード１９は次に最も最近加えられた、アクティブ・ノードを備えているエントリである。その先行ノードはアクティブであるから、図Ｆに示すように、あいまいさによって両ノード１６および１９に対する順方向ポインタ・チェインを外さなければならない。

ノード１８が次に処理される。その先行ノード、１６、はアクティブであるが、ノード１６または１８はいずれも順方向ポインタを備えていないので、ノードのアクティビティを示す太い点を除去すること以外何らの処置も取られない。

次のアクティブ・ノードはノード１６であり、これの先行ノードはアクティブでない。この場合には、トレースバック・プロセスは先行ノードをアクティブとし、現在処理されているノード、ノード１６、に等しい、先行ノード、ノード１３、に対する順方向ポインタを記録する。図Ｇはノード１６を処理した後のトリー図Ａを示す。

ノード１３はノード１６と同様に処理される。したがって、図Ｈではトリーはノード１１だけをアクティブと記して示してあり、ノード１１と１３とに対する順方向ポインタだけが残っている。

一旦トレースバック・プロセスが、先行する他のノードが無いトリーのルート・ノード（ノード１１）に到達すれば、順方向ポインタを通してチェインした単語を認識単語として出力する。これはチェインされた順方向ポインタを備えているリンク・レコードをＬ−ＦＷＲＤ内でルート・ノードから出発して引続き探すことにより行われる。図！で示すように、そのそれぞれのＬ　−Ｗ　ＯＲＤアレイにｒｅｉｇｈｔ　ＪおよびｒｎｖｅＪを記録するリンク・レコードを出力する。

その他、図Ｈで、ノード１１と１６との間のリンクを表わすリンク・レコードが設定リストから除去され、Ｌ−ＰＴＲアレイおよびＦＲＥＥポインタで示したように、自由リストにリンクされる。この時点でのトリーの新しいに示してあり、これは別の入力フレームが処理されるとき、すなわち、流れが認識流れ図の第４ａ図のブロック４６に戻る場合に使用される。

今度は第６ａ〜６ｄ図を参照してトレースバック流れ図を詳細に説明することにする。第６ａ図で、リンク争テーブルから最も最近加えられたアクティブであるリンク・レコードを探す。ブロック９４で、リンク・テーブルの最初のレコードが設定レコード・リスト内の唯一のレコードであるか否かを確認する試験が行われる。これはＨＥＡＤにより指示されているＬ−ＰＴＲアレイのインデックスを探すことによって行われる。前述のとおり、ＨＥＡＤは最も最近加えられたリンク・レコードのインデックスを備えている。ＨＥＡＤに対応するＬ−ＰＴＲエントリがＯに等しければ、チェインは終結し、テーブルの中には他にレコードがない。この場合には、流れはブロック９６に進み、対応するＬ−ＡＣＴエントリがインアクティブに設定される。

ブロック９６から、サブルーチンは認識流れ図の第４ａ図のブロック４６に戻る。

テーブルの中に別のリンク・レコードが存在する場合には、ブロック９８で最初のリンク・レコードがアクティブであるか確認する試験が行われる。その対応するＬ−ＡＣＴエントリが０に等しくなければリンク・レコードはアクティブである。

リンク・レコードがアクティブであれば、流れはブロック１００に進む。ブロック１００で、リンク・レコードが既に考慮に入れられてしまっていることを示すには、リンク・レコードをインアクティブに設定する。次に流れはブロック１１０に進み、ＨＥＡＤで指示されたレコードがテンポラリ−ポインタＰＴＲに格納される。ブロック１１０から、流れは、引続き説明するが、ブロック１２０に進む。

最初のリンク・レコードがインアクティブに戻ってしまえば、流れはブロック９８からブロック１１２に進む。ブロック１１２で、Ｌ−ＰＴＲはアクティブ・リンク争レコードが見つかるまで動き回り、アクティブ・リンク・レコードが見つかると、そのアクティブ・レコードに対するインデックスがＰＴＲに格納される。ブロック１１４で、アクティブのインジケータがクリアされ、ブロック１００で行ったと同様に、そのリンク・レコードに対する処理を示す。

ブロック１１６で、ポインタＨＥＡＤとＰＴＲとの間で示、されたように、インアクティブであるとわかったリンク・レコードが将来の使用のため自由リストに戻される。

ブロック１１８で、リンク・テーブル内に更にリンクがあるか確認する試験が行われる。この試験は上のブロック９４で行われた試験と同じである。

設定リスト内にもはやリンク・レコードが存在しなければ、サブルーチンは認識流れ図に第４ａ図のブロック４６で戻る。

プロ、ツク１２０で現行リンクに先行するリンク（ノード）がインアクティブであるか否かを確認する試験が行われる。

これは現行リンク・レコードのバック・ポインタを探し、その対応するＬ−ＡＣＴエントリを探すことにより行われる。先行ノードがアクティブであれば、流れは第６ｂ図のブロック１２４に進み、先に説明したあいまいさの問題を処理する。先行ノードがインアクティブであれば、流れは第６Ｃ図のブロック１４２に進む。

今度は第６ｂ図を参照すると、ここのステップは、先行ノードがなお合致について考察中のノードから発生する２つ以上のリンク・レコードがある可能性のあることを示しているとき、あいまいさを処理する。この状態はアクティブ・ノードに先行するノードもアクティブであるときに起る。リンク・レコード・データを操作するためｔＪ６ｂ図で３つのテンポラリ・ポインタ（ＴＭＰＩ、ＴＭＰ２およびＰＴＲ）を使用する。ブロック１２１のステップは順方向ポインタ・チェインを前のリンクから取外す。このステップにはブロック１２４．１２６．１２８、および１３０が含まれている。第６ｂ図にはＰＴＲが現在処理されているノード、あるいはリンク・レコードを指示した状態で入る。

リンク・レコードに対応するＬ−ＢＡＣＫエントリは、第７図により上述したように、現在処理されているノードの直前のノードを指している。リンク・レコードに関連するＬ−ＦＷＲＤエントリは可能性のある子孫リンク争レコードだけを指示する。

ブロック１２４で、現行アクティブΦノードの直前のノードを指すポインタがＴＭＰＩに格納される。ブロック１２６で、先行ノードの、Ｌ−ＦＷＲＤにより指示された子孫リンク・レコードがＴＭＰ２に格納される。

ブロック１２８で、ＴＭＰ２で指示されたノードが実際のＬ−ＦＷＲＤエントリを備えているが、あるいはそれが０にセットされているかを確認する試験が行われる。ＴＭＰ２で指示されたノードが順方向ポインタを備えていれば（Ｌ−ＦＷＲＤが０に等しくなければ）、流れはブロック１３０に進み、そのノードに対する順方向ポインタが除去される。ブロック１３０で、ＴＭＰ２の内容もＴＭＰＩに移動し、これにより現行ノードの参照が一時的にＴＭＰ２により指示されているノードに移動し、次いで、ブロック１２６から始まって、上記のステップが後続のノードに対して、順方向チェイン内に、ブロック１２８で示したように、順方向チニイン終りを示す順方向ポインタを持たないノードが見つかるまで、繰返される。

ブロック１２２のステップは、ＰＴＲで示されているように、現行リンクから順方向ポインタ・チェインを除去する。ブロック１３２で、現行リンク・レコード・ポインタＰＴＲがＴＭＰＩに格納される。ブロック１３４で、そのリンク争レコードに対するＬ−ＦＷＲＤエントリがＴＭＰ２に格納される。ブロック１３６で、上のブロック１２８で行われたように、このリンク・レコードに対する順方向ポインタが存在するか確認する試験が行われる。このリンク・レコードに対する順方向ポインタが存在すれば、流れはブロック１３８に進み、ここで順方向ポインタが除去され、子孫ノードが、その順方向ポインタをも同様に除去するため、ＴＭＰＩに格納される。ブロック１３４から始めて、上のステップは、現行ノードからチェインされている順方向ポインタがすべて削除されるまで繰返される。次に、ブロック１３６から、流れは第６Ｃ図のブロック１４４に進み、次のアクティブ・リンク・レコードを処理する。

°第６ａ図のブロック１２０に戻って参照すると、現行ノードに先行するノードがインアクティブである場合には、流れは第６Ｃ図のブロック１４２に進む。これについて説明する。

第６Ｃ図のブロック１４２では、先行ノード（リンク・レコード）がインアクティブであるとわかっているので、このノードがアクティブにセットされ、その順方向ポインタが現行リンク・レコードを指すようにセットされる。ブロック１４４で、現行リンク・レコードから始めて、次のアクティブ・リンク・レコードが見つかり、ＰＴＲがこのレコードを指すようにセットされ、新しい現行リンクレコードを示すようになるまでテーブルが捜索される。ブロック１４６で、ブロック１４４のステップ中に遭遇したすべてのインアクティブ・レコードが、Ｌ−ＰＴＲアレイ中の適切なエントリを修正することにより、自由リストに戻される。

ブロック１４８で、新しいノードがインアクティブにセットされて、第６ａ図のブロック１００および１１４で行われたと同様に、そのノードが既に考慮に入れられていることを示す。

ブロック１５２でこの新しいリンク拳レコードがチェインの最後であるか否かを確認する試験が行われる。最後である場合には、すべてのリンク・レコードが処理されてしまっており、流れは第６ｄ図のブロック１５６に進んでトレースバック・プロセス中に認識された単語を出力する。

この新しいリンク・レコードがチェインの最後でなければ、流れは更に処理するため第６ａ図のブロック１２０に進む。

今度は第６ｄ図を参照すると、ブロック１５６で現行リンク・レコードのインデックスが、これはトリーのルート・ノードであるが、ＴＭＰＩに格納される。ブロック１５８で、現行ノードの順方向ポインタによって表わされているノード（リンク・レコード）がＴＭＰ２に格納される。

たとえば、第７図の図Ｈを参照すると、ＴＭＰＩは１１（ノード１１）を含んでおり、ＴＭＰ２は１３（ノード１３）を含んでいる。

ブロック１６０で、ＴＭＰＩに格納されているノードからの子孫となる順方向ポインタが存在するか確認する試験が行われる。これはＴＭＰ２の内容と０とを比較して行われる。もしＴＭＰＩに格納されているノードからの子孫となるある順方向ポインタが存在すれば、流れはブロック１６２に進み、現行ノードに対する順方向ポインタが除去され、現行ノードが、ＴＭＰ２に格納されている現行ノードの順方向ポインタによって示されているように、順方向チェイン内の次のノードまで持ち上げられる。ブロック１６４で、現行リンク・レコードに関連する単語が認識された単語として出力される。ブロック１５８から始まって、上記のステップは、順方向ポインタ・チェインの各リンク・レコードが、認識された単語としてその関連単語を備えるようになるまで、繰返される。ブロック１６０でのステップ中、順方向ポインタを備えていない子孫リンク・レコードが見つかるが、この場合には、流れはブロック１６８に進み、ＴＭＰｌおよびＰＴＲの間に示されているように、すべての死んだリンク・レコードが自由リストに戻される。

その他に、ブロック１６８でＬ−ＰＴＲアレイがＰＴＲにより現在指示されている新しい基底（ｂａｓｅ）ノードに対するＬ−ＰＴＲエントリを０にセットすることにより更新される。このレコード内の０はトリーのルート（ｒｏｏｔ）とリンク・レコードの設定リストの終りとを示す。ブロック１６８で、トレースバックは完了し、流れは第４ａ図のブロック４６に進む。

本発明はしたがって連続音声認識のための新しいかつ改良されたシステムと方法とを提供する。本発明は効率的に様式化した上述の流れ図により説明したように簡単かつ安任な８ビツトのプロセッサで実時間認識を行うように簡単に実現することができる。本発明は更に入力フレームを処理するとき最小限の数のリンク・レコードだけを格納すればよいようなすぐれたメモリ管理法を提供する。

本発明について特に好ましい実施例を参照して図示し、説明したが、当業者には上述の本発明に対しその精神および範囲を逸脱することなく各種修正および変更を行い得ることが理解されるであろう。

ｔｎ４ｃ図のリンク流れ図７２第４Ｃ図のブロック　−一一一一一一一一一一一一一一一国際調査報告　Ｓ、− 、Ｑｅ　Ｉ）ｃｒＱ’、ニー、□

Claims

【特許請求の範囲】

１．入力フレームが音声を表わすあらかじめ格納されているテンプレートに対して処理され、認識される可能性のあるテンプレートとして考察中のテンプレートがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている音声認識システムにおいて、前記リンク・レコードに対するテンポラリ・ポインタを設ける手段と、前記テンポラリ・ポインタを有する前記リンク・レコードの所定の１つにラベルを付して前記１つのリンク・レコードに対応する認識される可能性あるテンプレートに接続しながら前記ネットワークを通してトレースバックする手段と、２つ以上の認識される可能性ある子孫リンク・レコードを有するリンク・レコードを確認する手段と、前記確認されたリンク・レコードに対応する前記テンポラリ・ポインタを削除する手段と、前記テンポラリ・ポインタでなおラベルが付けられている前記リンク・レコードに対応するデータを出力する手段と、を備えていることを特徴とする音声パターンを認識する装置。
２．所定数の入力フレームが処理された後、システムに定期的に警報を発する手段を備えている請求項１に記載の音声パターンを認識する装置。
３．所定の文法モデル・トポロジーにしたがってネットワークを構成する手段を備えている請求項１に記載の音声パターンを認識する装置。
４．少なくとも１つの前記テンプレートに対して単語終端の可能性あるものが認識された後、リンク・レコードをネットワークに付加する手段を備えている請求項１に記載の音声パターンを認識する装置。
５．ネットワーク内の最も最近に付加されたリンク・レコードを示す手段を備えている請求項１に記載の音声パターンを認識する装置。
６．リンク・レコードに祖先リンク・レコードが存在しないことを示す手段を備えている請求項１に記載の音声パターンを認識する装置。
７．前記リンク・レコードを自由リンク・レコードと設定リンク・レコードとから成るテーブルに格納する手段を備えている請求項１に記載の音声パターンを認識する装置。
８．設定リンク・レコードの始まりと自由リンク・レコードの始まりとを示す手段を備えている請求項７に記載の音声パターンを認識する装置。
９．設定リンク・レコードの終りと自由リンク・レコードの終りとを示す手段を備えている請求項７に記載の音声パターンを認識する装置。
１０．前記確認されたリンク・レコードからの子孫であるリンク・レコードに対するテンポラリ・ポインタを削除する手段を備えている請求項１に記載の音声パターンを認識する装置。
１１．入力フレームが音声を表わすあらかじめ格納されているテンプレートに対して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレートがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている音声認識システムにおいて、前記リンク・レコードを、各々がテンプレートを表わす記号と、リンク・レコードが格納された相対的時間を表わすシーケンス・インジケータと、ネットワーク内のそれぞれがそこから派生して来たリンク・レコードを示す第１のポインタと、第２のテンポラリ・ポインタとを備えているインデックス付きデータ集合体として格納する手段と、前記第２のテンポラリ・ポインタを含め、前記インデックス付きデータ集合体を用いてネットワークを通してトレースバックし、明確に認識されている少なくとも１つのリンク・レコードを特定する手段と、前記明確に認識されたリンク・レコードを出力する手段と、を備えていることを特徴とする音声パターンを認識する装置。
１２．所定数の入力フレームが処理された後、システムに定期的に警告を発する手段を備えている請求項１１に記載の音声パターンを認識する装置。
１３．所定の文法モデル・トポロジーにしたがってネットワークを構築する手段を備えている請求項１１に記載の音声パターンを認識する装置。
１４．少なくとも１つの前記テンプレートに対して単語終端の可能性あるものを認識した後、リンク・レコードをネットワークに付加する手段を備えている請求項１１に記載の音声パターンを認識する装置。
１５．ネットワーク内の最も最近に付加されたリンク・レコードを示す手段を備えている請求項１１に記載の音声パターンを認識する装置。
１６．リンク・レコードに祖先リンク・レコードが存在しないことを示す手段を備えている請求項１１に記載の音声パターンを認識する装置。
１７．前記リンク・レコードを、自由リンク・レコードと設定リンク・レコードとから成るテーブルに格納する手段を備えている請求項１１に記載の音声パターンを認識する装置。
１８．設定リンク・レコードの始まりと自由リンク・レコードの始まりとを示す手段を備えている請求項１７に記載の音声パターンを認識する装置。
１９．設定リンク・レコードの終りと自由リンク・レコードの終りとを示す手段を備えている請求項１７に記載の音声パターンを認識する装置。
２０．前記確認されたリンク・レコードからの子孫であるリンク・レコードに対するテンポラリ・ポインタを削除する手段を備えている請求項１１に記載の音声パターンを認識する装置。
２１．入力フレームが、音声を表わすあらかじめ格納されているテンプレートに対して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレートがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている音声認識システムにおいて、前記リンク・レコードを、各々がテンプレートを表わす記号と、リンク・レコードが格納された相対的時間を表わすシーケンス・インジケータと、ネットワーク内のそれぞれがそこから派生して来たリンク・レコードを示すポインタとを備えているインデックス付きデータ集合体として、テーブルに格納する手段と、前記テーブルは自由レコード・スペースと設定レコード・スペースとから成り、前記リンク・レコードは前記設定レコード・スペースに格納されており、前記インデックス付きデータ集合体を使用してネットワークを通してトレースバックし、その対応するテンプレートが明確に認識されている１つ以上のリンク・レコードを特定する手段と、前記明確に認識されたリンク・レコードを表わすデータを出力し、前記リンク・レコードを前記設定レコード・スペースから取出し、これにより前記取出したリンク・レコードが引続きリンク・レコードを格納する自由レコード・スペースとなるようにする手段と、を備えていることを特徴とする音声パターンを認識する装置。
２２．所定数の入力フレームを処理した後、システムに定期的に警報を発する手段を備えている請求項２１に記載の音声パターンを認識する装置。
２３．所定の文法モデル・トポロジーにしたがってネットワークを構築する手段を備えている請求の範囲第２１に記載の音声パターンを認識する装置。
２４．少なくとも１つの前記テンプレートに対する単語終端の可能性あるものが認識された後、リンク・レコードをネットワークに付加する手段を備えている請求項２１に記載の音声パターンを認識する装置。
２５．ネットワーク内の最も最近に付加されたリンク・レコードを示す手段を備えている請求項２１に記載の音声パターンを認識する装置。
２６．リンク・レコードに祖先リンク・レコードが存在しないことを示す手段を備えている請求項２１に記載の音声パターンを認識する装置。
２７．認識される可能性のある２つ以上の子孫リンク・レコードを備えている可能性のあるリンク・レコードを決定する手段を備えている請求項２１に記載の音声パターンを認識する装置。
２８．前記設定レコード・スペースで、対応するテンプレートが明確に認識されていない特定のリンク・レコードを選定し、該特定のリンク・レコードを前記自由レコード・スペースに戻す手段を備えている請求項２１に記載の音声パターンを認識する装置。
２９．入力フレームが音声を表わすあらかじめ格納されているテンプレートに対して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレートがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている音声認識システムにおいて、前記リンク・レコードに対しテンポラリ・ポインタを設けるステップと、前記リンク・レコードの所定の１つに前記テンポラリ・ポインタのラベルを付けながら前記ネットワークを通してトレースバックし、前記１つのリンク・レコードに対応する、認識される可能性あるテンプレートを接続するステップと、認識される可能性のある２つ以上の子孫リンク・レコードを備えている可能性のあるリンク・レコードを決定するステップと、前記決定されたリンク・レコードに対応する前記テンポラリ・ポインタを削除するステップと、前記テンポラリ・ポインタのラベルがなお付いている前記リンク・レコードに対応するデータを出力するステップと、を具備することを特徴とする音声パターンを認識する方法。
３０．所定数の入力フレームが処理された後、システムに定期的に警報を発するステップを含んでいる請求項２９に記載の音声パターンを認識する方法。
３１．所定の文法モデル・トポロジーにしたがってネットワークを構築するステップを含んでいる請求項２９に記載の音声パターンを認識する方法。
３２．少なくとも１つの前記テンプレートに対する単語終端の可能性あるものが認識された後、リンク・レコードをネットワークに付加するステップを含んでいる請求項２９に記載の音声パターンを認識する方法。
３３．ネットワーク内の最も最近に付加されたリンク・レコードを示すステップを含んでいる請求項２９に記載の音声パターンを認識する方法。
３４．リンク・レコードに子孫リンク・レコードが存在しないことを示すステップを含んでいる請求項２９に記載の音声パターンを認識する方法。
３５．前記リンク・レコードを、自由リンク・レコードと設定リンク・レコードとから成るテーブルに格納するステップを含んでいる請求項２９に記載の音声パターンを認識する方法。
３６．設定リンク・レコードの始まりと自由リンク・レコードの始まりとを示すステップを含んでいる請求項３５に記載の音声パターンを認識する方法。
３７．設定リンク・レコードの終りと自由リンク・レコードの終りとを示すステップを含んでいる請求項３５に記載の音声パターンを認識する方法。
３８．前記決定されたリンク・レコードからの子孫であるリンク・レコードに対するテンポラリ・ポインタを削除するステップを含んでいる請求項２９に記載の音声パターンを認識する方法。
３９．入力フレームが音声を表わすあらかじめ格納されているテンプレートに対して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレートがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている音声認識システムにおいて、前記リンク・レコードを、各々が、テンプレートを表わす記号と、リンク・レコードが格納された相対的時間を表わすシーケンス・インジケータと、ネットワーク内のそれぞれがそこから派生して来たリンク・レコードを示す第１のポインタと、第２のテンポラリ・ポインタとを備えているインデックス付きデータ集合体として格納するステップと、前記第２のテンポラリ・ポインタを含め、前記インデックス付きデータ集合体を用いてネットワークを通してトレースパックし、明確に認識されている少なくとも１つのリンク・レコードを特定するステップと、前記明確に認識されたリンク・レコードを出力するステップと、を具備することを特徴とする音声パターンを認識する方法。
４０．所定数の入力フレームが処理された後、システムに定期的に警報を発するステップを含んでいる請求項３９に記載の音声パターンを認識する方法。
４１．所定の文法モデル・トポロジーにしたがってネットワークを構築するステップを含んでいる請求項３９に記載の音声パターンを認識する方法。
４２．少なくとも１つの前記テンプレートに対する単語終端の可能性のあるものが認識された後、リンク・レコードをネットワークに付加するステップを含んでいる請求項３９に記載の音声パターンを認識する方法。
４３．ネットワーク内の最も最近に付加されたリンク・レコードを示すステップを含んでいる請求項３９に記載の音声パターンを認識する方法。
４４．リンク・レコードに祖先リンク・レコードが存在しないことを示すステップを含んでいる請求項３９に記載の音声パターンを認識する方法。
４５．前記リンク・レコードを自由リンク・レコードと設定リンク・レコードとから成るテーブルに格納するステップを備えている請求項３９に記載の音声パターンを認識する方法。
４６．設定リンク・レコードの始まりと自由リンク・レコードの始まりとを示すステップを含んでいる請求項４５に記載の音声パターンを認識する方法。
４７．設定リンク・レコードの終りと自由リンク・レコードの終りとを示すステップを含んでいる請求項４５に記載の音声パターンを認識する方法。
４８．前記決定されたリンク・レコードの子孫であるリンク・レコードに対するテンポラリ・ポインタを削除するステップを含んでいる請求項３９に記載の音声パターンを認識する方法。
４９．入力フレームが音声を表わすあらかじめ格納されているテンプレートに対して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレートがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている音声認識システムにおいて、前記リンク・レコードを、各々が、テンプレートを表わす記号と、リンク・レコードが格納された相対的時間を表わすシーケンス・インジケータと、ネットワーク内のそれぞれがそこから派生して来たリンク・レコードを示すポインタを備えているインデックス付きデータ集合体として、自由レコード・スペースと設定レコード・スペースとから成るテーブルの、前記設定レコード・スペースに格納するステップと、前記インデックス付きデータ集合体を使用してネットワークを通してトレースバックし、対応するテンプレートが明確に認識されている１つ以上のリンク・レコードを特定するステップと、前記明確に認識されたリンク・レコードを表わすデータを出力し、前記リンク・レコードを前記設定レコード・スペースから取出し、これにより前記取出したリンク・レコードが引続いて格納するリンク・レコードに対する自由レコード・スペースになるようにするステップと、を具備することを特徴とする音声パターンを認識する方法。
５０．所定数の入力フレームが処理された後、システムに定期的に警報を発するステップを含んでいる請求項４９に記載の音声パターンを認識する方法。
５１．所定の文法モデル・トポロジーにしたがってネットワークを構築するステップを含んでいる請求項４９に記載の音声パターンを認識する方法。
５２．少なくとも１つの前記テンプレートに対する単語終端の可能性あるものが認識された後、リンク・レコードをネットワークに付加するステップを含んでいる請求項４９に記載の音声パターンを認識する方法。
５３．ネットワーク内の最も最近に付加されたリンク・レコードを示すステップを含んでいる請求項４９に記載の音声パターンを認識する方法。
５４．リンク・レコードに祖先リンク・レコードが存在しないことを示すステップを含んでいる請求項４９に記載の音声パターンを認識する方法。
５５．認識される可能性のある２つ以上の子孫リンク・レコードを備えている可能性のあるリンク・レコードを決定するステップを含んでいる請求項４９に記載の音声パターンを認識する方法。
５６．前記設定レコード・スペースで、対応するテンプレートが出力されていない特定のリンク・レコードを選定し、該特定のリンク・レコードを前記自由レコード・スペースに戻すステップを含んでいる請求項４９に記載の音声パターンを認識する方法。