JPH01502611A - 連続音声認識システム - Google Patents

連続音声認識システム

Info

Publication number
JPH01502611A
JPH01502611A JP61503471A JP50347186A JPH01502611A JP H01502611 A JPH01502611 A JP H01502611A JP 61503471 A JP61503471 A JP 61503471A JP 50347186 A JP50347186 A JP 50347186A JP H01502611 A JPH01502611 A JP H01502611A
Authority
JP
Japan
Prior art keywords
link
record
link record
network
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61503471A
Other languages
English (en)
Other versions
JP2717652B2 (ja
Inventor
ジャーソン・アイラ アラン
Original Assignee
モトローラ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by モトローラ・インコーポレーテッド filed Critical モトローラ・インコーポレーテッド
Publication of JPH01502611A publication Critical patent/JPH01502611A/ja
Application granted granted Critical
Publication of JP2717652B2 publication Critical patent/JP2717652B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 連続音声認識システム 発明の背景 本発明は音声認識システムに関し、特に、話された単語(word)の終点(e nd paint)があらかじめ決まっていない音声の認識に関する。
既知の話し手(speaker)について所定の語♀(vocabulary) から孤立した単語を認識することは長い間知られている。語當の単語を個別のテ ンプレート(型板)としてあらかじめ記憶しておき、各テンプレートが語常によ り単語に対する音のパターンを表わすようにする。孤立した単語が話されると、 システムはその単語を語伯を表わす各個別のテンプレートと比較する。この方法 は一般に完全単語テンプレート合致法(whole−word teaplat e matching)と言われている。好結果を与える認識システムの多くは 動的プログラミングを用いた完全単語テンプレート合致法を採用して、話された 単語とあらかじめ記憶しであるテンプレートとの間の非線形時間尺度の変化に対 処している。
この手法は孤立した単語を認識する用途には有効であるが、多くの実用的用途に は連続した単語の認識が必要であてよく、始めの方の単語の本体は語句が終る前 に決定することができるが、孤立単語認識では、入カバターンの始まりと終りと を特定するのに区切り記号(del falter)を用い、認識は一度に1語 ずつ行われる。更に、連続音声認識システムは入カバターンを他の認識可能なパ ターン、背景雑音、呼吸雑音のような話し手から出る雑音から区別しなければな らず、一方孤立認識は通常、単語の始まりまたは終りに他の認識可能なパターン を容認できない。
I EEE l−ランザクジョン、音響学、音声および信号処理、vol、^5 SP−27,No、B、 pp、588〜595 (1979年12月)のH, 5akoeによる「2レベルDP合致法−接続(connected)単語認識 のためのパターン合致アルゴリズムに基づく動的プログラミング」では、完全単 語テンプレート合致の方法が接続単語認識を取扱うように拡張されている。この 論文は入カバターン全体に最もよく合う一連の単語テンプレートを見出す2パス (two−pass)動的プログラミング・アルゴリズムを提示している。第1 のパスでは、入カバターンの各可能な部分に対して合致(IIatch) シた 各テンプレート間の類似性を示すスコアを発生する。第2のパスでは、このスコ アを使用して入カバターン全体に対応する最良のテンプレート列を見出す。
この拡張された方法には明らかな欠点がある。この技法の1つの欠点は必要な計 算時間の量である。特定の設計要件によっては、この限度のため高価な高速プロ セッサを不当に必要とすることがある。
この方法の他の欠点は入カバターンの終点をあらかじめ定めねばならず、入カバ ターン全体をテンプレートの合致が正確に生ずるまでシステム内に格納しなけれ ばならないということである。入カバターンがかなり長い場合には、認識応答時 間が実質上悪くなる。また、終点検出時の誤差が認識器の性能を甚だしく低下さ せる。更に、この情報を格納するのに必要なメモリが極端に多くなることもある 。
IEEE)ランザクシラン、音響学、音声および信号処理、vol、 ASSP −27,No、 8. pp、 588〜595 (1979年12月)のP、  Brown、 J、 5pohrerSP、 Hochschlld SJ、  Bakerによる「部分的トレースバック(traceback)および動的 プログラミング」では、終点をあらかじめ定めずに任意の長さの入カバターンの 連続音声認識を考慮した技法が述べられている。これは部分的トレースバックと 呼ばれる技法を使用して行われる。部分的トレースバックでは、認識器の性能を 犠牲にすることなしに完全な人カバターンの完成の前に認識された単語が出力さ れる。しかしながら、記されている部分的トレースバック技法はプロセッサの負 担になるとともに実行が厄介なように思われる。
したがって、容易に実行することができ、しかも実時間で効果的かつ安価に動作 することができる連続音声認識システムの必要性が存在する。
発明の目的と概要 本発明の目的は実時間用途に対して実施し安価なノ1−ドウエアで連続音声を認 識することができる音声認識の機構と方法とを提供することである。
本発明の更に他の目的は認識プロセス中音声認識メモリを効果的にメモリ管理で きる音声認識の機構と方法とを提供することである。
本発明の更に他の目的は認識プロセスに対して合致する可能性のあるテンプレー ト(template)を表わすソフトウェア・リンク・ネットワークを通して 効率的なトレースバ・ツク(traceback)ができる音声認識の装置と方 法とを提供することである。
本発明の更に他の目的はストリング全体が人力される前に入力音声を認識するこ とができる音声認識の装置と方法とを提供することである。
手短かに言えば、本発明は音声認識システムに関するものであり、入力フレーム (Input rrame)が音声を表わすあらかじめ格納されているテンプレ ートに対して処理され、認識される可能性のあるものとして考慮されているテン プレートはリンク・ネットワーク(linked netν0「k)に個別に記 録されており、各リンク・レコード(link record)は一般に先祖お よび子孫のリンク・レコードを備えている。音声パターンを認識する1つの装置 と方法はリンク・レコードに対するテンポラリ・ポインタ(temporary  polnters)を設けることと、リンク・レコードに対応する認識される 可能性のあるテンプレートを接続するリンク・レコードを選択するのにテンポラ リ・ポインタを使用してリンク−ネットワークを通して逆追跡(traclng  back)することから成立っている。認識される可能性のある2つ以上の子 孫を持っている先祖レコードを備えたこれらリンク・レコードはそのテンポラリ ・ポインタが除去されている。ネットワーク内の残りのリンク・レコードは、な おテンポラリ・ポインタのラベルが付いているが、認識される単語として出力さ れるその関連単語を備えている。
本発明の他の特徴は上記と同様の構成の音声認識システムに関するが、音声認識 メモリの管理を自損している。本発明のこの特徴はリンク・レコードをインデッ クス付データ集合体(Indexed data 5ets)として格納する手 段を備えている。各データ集合体(data 5et)はテンプレートを表わす 記号と、リンク・レコードが格納された相対的時間を表わすシーケンス・インジ ケータと、ネットワーク内のそこからそれが派生して来たリンク・レコードを示 すポインタとを備えている。テーブル(table)は自由(rree)レコー ド・スペースと設定(establ l5hed)レコード・スペースとから構 成され、リンク・レコードは設定レコード・スペースに格納される。更に、明確 に認識されたネットワーク・パス(neLvork paths)の一部である これらリンク・レコードを特定する手段が採用されている。明確に認識されたリ ンク・レコードは認識されたものとして出力(転置)され、設定レコード・スペ ースから転置されたこれらリンク・レコードはリンク・ネットワークに別のリン ク−レコードを引続き格納するための自由レコード・スペースとして利用できる ようになる。
図面の簡単な説明 本発明の特徴で新規であると信ぜられるものは特許請求の範囲に特異性とともに 示しである。本発明は、その他の目的と利点とともに、付図と関連して行う次の 説明を参照することにより最も良く理解されるが、付図のいくつかの図面で同じ 参照数字は同じ要素を示している。
第1図は本発明にしたがって描いた音声認識システムのハードウェアのブロック 図である。
第2図は本発明にしたがって実施した音声認識システムの1つの局面を示す認識 文法モデルの図式表現である。
第3図は第1図の音声文法モデルによるすべての可能なバス(径路; path s)を列挙した音声文法トリー(tree)の図式表現である。
第4a図、第4b図、および第4C図は本発明による認識プロセスを実施するの に行われる一連のステップ゛を描く流れ図である。
第5図は第4C図のブロック72を一層詳細に示す流れ図である。
第68図、第6b図、第6c図、および第6d図は第4a図のブロック44を一 層詳細に示す流れ図である。
第7図は本発明による「トレースバック」の1例を示す一連の文法トリー図であ る。
好ましい実施例の詳細な説明 第1図を参照すると、本発明を実施するのに使用することができる音声認識シス テムのブロック図が示されている。
ブロック図はあらかじめ格納した語量が入っているテンプレート・メモリ10を 含んでいる。典型的なあらかじめ格納した語量の形成はアメリカ音響学会誌、6 8 (5)、1980年11月のり、 R,Rabiner 、 J、 G、  Wilponによる「訓練された話者に対する簡略化した強力訓練手順、孤立語 認識システム」に述べられている。音響学、音声、および信号処理に関するIE EE)ランザクジョン、vol、 ASSP−31゜PP、 793〜80G  (1983年8月)のB、 A、 Dautrjch、 L、 R。
Rabiner 、およびT、 B、 MarNnによる「孤立語認識のフィル タ・バンク・パラメータに変化をつけることの効果について」に述べられている ような音響プロセッサ12は入力音声を、一般に「フレーム」と言う、一連の音 声セグメン) (segments)に変換することができる。各フレームは入 力音声の時間セグメントを、通常はLPCまたはフィルタ拳バンク・データの形 で表わす。音響プロセッサからのフレームは認識器14に伝えられる。
認識器14はテンプレートφメモリ10にあらかじめ格納しである語當から単語 テンプレートにアクセスし、音響プロセッサ12からの各入力フレームを単語テ ンプレートのセグメントを用いて処理する。このような技法は多くの音声認識シ ステムに固有のものであり、「テンプレート処理」と言うことができる。
認識器14は第2のメモリ、すなわちリンク・テーブル16のメモリに両方向か らアクセスする。リンク・テーブル16のメモリは5個の関連アレイを格納する のに使用される。アレイについては更に以下に説明する。
認識器14は2つのプロセッサ、すなわち認識プロセッサ18とリンク・トレー スバック・プロセッサ20とを用いて実現することができる。認識プロセッサ1 8はテンプレート合致、文法、制御、およびリンク・トレースバック・プロセッ サ20との通信のすべてを処理する。リンク・トレースバック・プロセッサ20 はリンク・テーブル用メモリを維持する(malntaln)のに使用される。
この機能は連続音声を入力しながら可能なテンプレート合致を記録すること、関 連情報をリンク・テーブル用メモリ16に格納すること、リンク・テーブル用メ モリ16のスペースを他の情報のため自由にすること、および入力音声が特定さ れるにつれて認識結果を出力することを含む。認識プロセッサ18とリンク・ト レースバック・プロセッサ2・0との機能は1つのプロセッサに組合せたり、あ るいは、図示のように分離することができ、これにより認識プロセッサ18を事 録pp、 899〜902 (1982年)のJ、 Br1dle % M、  BrownsおよびR,Chamberlainの「接続単語認識のアルゴリズ ム」に詳細に説明されているように実現することができる。リンク・トレースバ ック・ブ♂セッサは、本発明にしたがって使用するときは、モトローラのMC6 801のような8ビツトのプロセッサを用いて実現することができる。
文法のモデル化 今度は第2図を参照すると、システムが認識することができるすべての可能な単 語シーケンスを示す簡略化した認識文法モデルが示されている。二のモデルは示 されている語量が、例示の目的で、一般的に必要なものから、ひどく限定されて いるので、「簡略化した」と言う。第2図には、各々が2語から成る6つの可能 な単語ストリングが存在する(第3図で更に説明する)。典型的な音声認識シス テムでは、文法モデルは各々が敷詰を含む一層多くの可能な単語ストリングを備 えることができる。文法モデルのトポロジー(zopology)は、ポインタ がテンプレート・メモリ内の対応するテンプレートを指している状態で一部メモ リに格納される。文法モデル内の各ノードは、それと関連して、−酸メモリに格 納されている、テンプレート合致が始まるノードを指すポインタとその関連する 累積距離とを備えている。
文法パスのモデル化 第3図において、第2図からの6つの可能な単語ストリングの各々がトリー図に 列挙されている。3つの可能な第1語、rONEJ (ワン)、rTWOJ ( )ウー)、およびrTHREEJ (スリー)が存在する。各可能な第1語には 2つの可能な第2語rFOURJ (フォー)およびrFIVEJ (ファイブ )が続く。テンプレート合致の期間中、すなわち、入力フレームがあらかじめ格 納した単語テンプレートと比較されている間、認識プロセッサは可能な「単語終 端」を認識する。可能な「単語終端」は一連の入力フレームが単語テンプレート と合致する可能性があれば見つかる。特定された単語テンプレートは、先に述べ たリンク・テーブルに格納されているリンク情報と、処理されている一連の入力 フレームとノードに導くテンプレートとの間の類似性の尺度を示す累積距離とを 通してトリー図に付加される。たとえば、第2図および第3図の誘電ストリング の可能性を与えて、入力フレームのシーケンスが単語rTWOJと合致する可能 性があるものとして特定されると、rTWOJが始めのノード、すなわちノード 24からトリー図に付加される。第3図は別のフレームが人力され処理されてか ら、単語rONEJが可能性のある合致となったことを示している。したがって 、これは次にノード24でトリー図にも付加される。次に単語rTHREEJが トリー図に付加され、次いでrFOURJがノード26に付加され、その後同じ ノードにrF IVEJが付加され、以下同様となる。これは各可能性ある合致 テンプレートが早暁特定されるにつれてこれをトリー図に付加しながら続It  ; IL 6・ 。
「トリー・ノード」と言う言葉、あるいはトリー図中のノードへの参照はリンク ・レコード(link(ed) record)という言葉と相互に交換可能に 使用することにする。一般に、リンク・レコードはトリー図中の接続を規定する メモリに格納されているデータ集合体(data 5et)であり、特定のトリ ー・ノードの特定とトリー・トポロジー内の前のノードとの関係とを含む。
単語の終端の可能性があるフレームごとに、新しいエントリー、またはリンク・ レコードが代表的トリー図中のりンクに対応するリンク・テーブルに追加される 。きわめて頻繁に、典型的には状態図の形で(状態を表わす)一連のフレームと して表わされている単語テンプレートに、入力フレームが処理されるにつれて、 単語の終端である可能性が複数現われることになる。単語の終端の可能性が検出 されるごとに、対応するテンプレートが新しいリンクとしてトリーに追加される 。更に、各テンプレートの各状態は、現在の人力フレームを通して処理された蓄 積距離と、そのテンプレートに対するデコーディングが始まるトリーのリンクに 対応するリンク・テーブルのリンク・レコードを指すリンク・ポインタとを記録 している。テンプレート合致に関するこれ以上の事項については、上述の「接続 単語認識のアルゴリズム」を参考にすることができる。
残念ながら、語量が大きいと、トリーに絶えず付加するテンプレートから問題が 生ずる。第1に、これによって認識応答時間が遅れる。入力フレームのシーケン スが長くなるほど、オペレータは、システムが認識しその認識した単語に対して 処理を行うまで待たなければならない時間が長くなる。
第2に、テンプレートを絶えず追加するにはトリー図の情報をリンクするための 多大なメモリが必要である。文法モデルが複雑でかつ各可能性のある単語に対し て、いくつかの可能性のある単語終端フレームが、合致する場合、リンク・テー ブル(トリー)に必要なメモリは非常に急速な割合で大きくなる。大きくなる割 合が大きすぎれば、メモリの所要条件は非実用的となる。
本発明はリンク・テーブルを独特な構成とし、かつこれを非常に効率的に維持す ることにより、これらの問題を克服している。
リンク・テーブル リンク・テーブルは、第2図と同様のトリー・ネットワークの形に合うように、 考察中の可能性のある単語シーケンスのすべてを表わすものである。単語シーケ ンスは、事実、テンプレート合致期間中に検出された可能な単語終端を有する連 結されたテンプレートである。このような方法でネットワークを設定することに より可能性のあるあらゆる単語シーケンスの明瞭な部分であるこれらのリンクを 分析することができる。この分析プロセスをトレースバック(tracebac k)と言う。適格に利用すれば、トレースバックにより、もはや明らかになお考 察中のシーケンスの一部ではなくなっているリンク・レコードを解放する効率的 な方法が可能となる。
トリー図の各リンク、あるいはノード式トリー接続には数種類の情報を格納して おかなければならない。この情報は第1図のリンク・テーブル16のメモリのL −ACT。
L−FWRDSL−BACK、L−WORD、およびL−PTRのアレイに格納 される。この実施例では、各アレイは長さが255バイトで、256バイトのバ ウンダリから1バイト過ぎた位置に配置されて、効率的アクセスができるように なっている。各アレイからの対応する要素は「すンク・レコード」を構成してい る。リンク・レコードは2リンク式リストになるようにチェインされている。1 つのリストは自由リンク・レコード、すなわち、追加リンクに利用できる空きレ コード・スペースを備えている。第2のリストは設定したリストであり、現在使 用されているリンクのレコードを備えている。これらのリストはL−PTRアレ イによって互いにチェインされている。この場合し−PTR内の1つのエントリ は、設定リストまたは自由リストからの、テーブル内の次のリンク・レコードを 示しており、各レコードは各5つのアレイからの1バイトを含んでいる。たとえ ば、設定リスト内の所定のリンク・レコードについて、L−PTRアレイの対応 するバイトが数「2」の2進表現を含んでいれば、設定リスト内の次のレコード は5つのアレイすべての第2バイト目に存在することになる。L−PTRアレイ の「0」エントリはリンク式リストの終端を画定している。
L−BACKアレイとL−WORDアレイとは実際のリンク情報を備えている。
L−BACKはデコード・パス内の前のリンク、すなわち、トリー図の前のノー ドを指すポインタを備えており、一方、L−WORDは現行リンクの終りにデコ ードされた単語を表わす記号を備えている。たとえば、第3図において、トリー ・ノード26に単語「FOURJを付加してから、L −WORDは単語rFO URJを表わす8ビット記号を備え、L−BACKはトリー・ノード26に対応 するリンク・レコードを指すポインタを備えることになる。その他の2つのアレ イ、L−ACTとL−FWRDとはデコード・パスを通る「トレースバック」( 可能性ある単語シーケンス)に使用される。L−ACTは合致の可能性あるもの としてなお考察中のデコード・パスを示すのに使用され、L−FWRDはトリー 口内の後続ノード、すなわちL−BACKの逆、をポイントするのに使用される 。今後、認識される可能性あるパス(アクティブ・パス(active pat h) )の一部として考察されているとフラグが立てられたリンク・レコードを アクティブ・リンク・レコードと称することにする。
リンク・レコードはトレースバック情報を示すので、その状態に到達するのに使 用される単語モデルを通るパスを確認することができる。トレースバックはトリ ーから役に立たない情報を切払うこともできる。これは情報がメモリ内に余分に 蓄積されないようにするのに必要である。トレースバックは明瞭に認識されてい る単語、すなわちアクティブ・パスすべてに共通な単語を出力するのに使用する こともできる。リンク・テーブルのL−BACKエントリはテーブル内の前のエ ントリを指しており、これはトリー口内の前に接続したノードに対応する。した がって、トレースバックはトリー図を通ってすべてのパスが会合する点、すなわ ちトリー・ノードまで逆に追跡する(tracing back)プロセスであ ると言われる。すべてのパスが会合する点まで追跡して戻るという概念は当業者 にはよく知られている。
というのは「トレースバック」の一般的説明は前掲の「部分的トレースバックお よび動的プログラミング」を参照して行われるからである。
上述のアレイを後続の図の説明中の参考のため以下に掲げる。
L−PTR: 255バイト。各バイトはトリー図(テーブル)に設定リストに 対する時間の関数として付加された前のリンク・レコードを指すポインタとして 利用できる。また自由リストの自由リンク・レコードをチェインするのにも使用 される。
L−BACK:255バイト。各バイトはトリー図の前のリンク・レコードを指 すポインタとして利用できる。
L−WORD : 255バイト。各バイトは現行リンク・レコードに対応する 、可能性のある認識単語を示す記号として利用できる。
L−ACT : 255バイト。各バイトは現行リンク・レコードがアクティブ か否かを示すのに利用することができる(トレースバック中に使用される)。
L−FWRD: 255バイト。各バイトはトリー図中の後続有効リンクφレコ ードを示すポインタとして利用できる(トレースバック中に使用される)。
上述のアレイの他に、別の5つのポインタが使用される。
それらは次の通りである。
HEAD : L−PTRアレイによってチェインされた、設定リスト内の最初 の、すなわち最も最近に追加されたリンク・レコードを示す1バイトのポインタ 。
FREE : L−PTRアレイによってチェインされた、自由リストの最初の リンク・レコードを示す1バイトのポインタ。
PTR:処理中の現行トリー・ノードを参照する1バイトのポインタ。
TλIPIとTMP2二それぞれ認識流れ図に使用される1バイトのテンポラリ (temporary) やポインタである。
構造的に、設定リスト内に10個のエントリだけを備えたテーブルを仮定すると 、これらのアレイは次のように配列することができる。
レコード番号 L−PTRL−BACK L−WORD L−ACT L−FW RD上記テーブルのエントリを付録Aにトリー図で示す。HEADはレコード# (番号)7を指し、レコード#3のL−PTRエントリの「0」はリストの最後 のレコードを示すことに注目すべきである。FREEは図示してない。
L−PTHにより、設定リスト内のレコードを、レコードを自由リストから単に 取出してそのL−PTRエントリにHEADレコードを指示させ、HEADとF REEとを更新することにより、入れることができる。トレースバック中にレコ ードをテーブルの設定リストから削除すると、そのレコードは、レコード・エン トリを自由リストにリンクし、L−PTRエントリを利用して設定リストの除去 レコードにわたってリンクすることにより、テーブルを配列しなおすことなく利 用できるようになる。L−ACTおよびL−FWRDのエントリはトレースバッ ク中にのみ使用され、その他の場合は常にOにリセットされている。
認識流れ図 今度は第4a図から第4C図までを参照すると、認識流れ図が本発明にしたがっ て示されている。第4a図の流れ図はリンク・テーブルとその関連ポインタとを リセットすることによりブロック30から始まる。リセット手順にはL−FRW DとL−ACTとの各バイトを0に等しくセットすること、HEADポインタを 1に等しくセットして設定リストの始まりを示すこと、およびL−PTR(1) とL−PTR(255)とを等しく0にセットしてそれぞれ設定リストと自由リ ストとの終りを示すことが含まれる。
また、典型的には一層メモリに格納されているテンプレート状態メモリがインア クティブ(1nactive)にされる。したがって、第1のレコードは設定リ ストから構成され、レコード2から255まではL−PTRエントリを使用して 自由リストを形成するようにチェインされる。ここでHEADは設定リストの始 まりを指し、FREEは自由リストの始まり(リンク・レコード#2)を指す。
第4a図のブロック32で、認識文法モデルが初期設定される。初期設定はモデ ルの最初のノードをアクティブにマーキングすることを含む。これはそのノード に低い累積距離尺度を任意に割当て文法内の始発点を示すことにより行われる。
最初のノードに対するリンク・ポインタは11;セットされるが、これはリンク ・テーブル内で初期設定された最初のエントリに対応する。逆に、文法モデル内 の他のすべてのノードはインアクティブに初期設定される。ノードに対する累積 距離を、処理が始まるとき二〇ノードで起りそうもないことを示す無限大に等し くセットすれば、そのノードをインアクティブにセットすることができる。
ブロック34で、トレースバック中カウンタが10に初期設定される。トレース バック・カウンタはトレースバック・プロセスを行うべきことを周期的に示すの に使用される。この実施例では、トレースバックは10個の入力フレームが処理 されるごとに行われる。
ブロック36で次の入力フレームが先に述べたテンプレート合致のためにシステ ムに入力される。この流れ図の残りのステップはすべて現在の入力フレームの処 理に関係する。
トレースバック・カウンタはブロック38でデクレメン) (deeremen t) してフレームが丁度入力されたことを示す。
ブロック40で文法モデルのすべてのノードが処理されたか否かを確認する試験 が行われる。換言すれば、−人力フレームが文法モデル全体について処理された か否かについてである。文法モデルのすべてのノードが処理されてしまっていれ ば、流れはブロック42に進んでトレースバック中カウンタがトレースバックを このフレームで行うべきことを示しているか確認する。もしそうなっていれば、 第6a図から第6d図までの後に説明するトレースバック拳サブルーチン44を 呼んでトレースバックが行われる。トレースバックに続き、ブロック36で次の 入力フレームを処理する前に、ブロック46でトレースバック・カウンタがリセ ットされる。
文法モデルのノードがすべては処理されてしまっていなければ、流れは第4a図 のブロック40から第4b図のブロック50に進む。ブロック50で、認識文法 モデルの処理が次のノードまで進む。このフレームについてノードが処理されて いなければ、1次のノード」は文法モデルの最初のノードである。今後、ブロッ ク50で、「次のノード」とは丁度処理されたばかりのノードに続くノードまた はそれと平行なノードを指す。特に、処理のためのノードの順序は、そのノード で終るすべてのテンプレートに対する始発ノードが現行フレームに対して処理さ れてしまうまで、ノードが処理されないようになっていなければならない。
これはノード累積距離とリンクとがテンプレートの始発ノードについて、これら のテンプレートが処理される前に確実に更新されるようにするためである。
ブロック52で、新しいノードがインアクティブにセットされる。これはそのノ ードに関する累積距離を無限大に等しくセットすることにより行われる。
ブロック54でこのノードで終るすべてのテンプレートが処理されてしまったか 否かを確認する試験が行われる。
その後文法モデルの各ノードの直ぐ前の各テンプレートが他のノードに進む前に 処理されることが認識される。このノードて終るテンプレートのすべてが処理さ れてしまうと、流れは後に説明する第4c図のブロック68に進む。すべてのテ ンプレートがまだ処理されていなければ、流れはブロック56に進み、現在の入 力フレームに対して、トレースバックが必要であるか確認する。したがってトレ ースバック・カウンタが0と比較される。
この時点で、これまで認識流れ図で示された認識文法モデルの処理を要約するの が有用であろう。もう−魔笛2図を参照すると、文法モデルの初期ノード22が アクティブにセットされ、対応するリンク・テーブル・エントリが可能性のある すべての文法バス(トリーの枝)が発生する基準を示すように初期設定される。
入力フレームが処理されるごとに、文法モデルは一度に1ノードずつ始発ノード から終了ノードまで進む。更に、文法モデルの各ノードに対して、そのノードで 終る各テンプレートが、後に説明するように、1度に1つのテンプレートを処理 する。したがって、各入力フレームごとに、各ノードが処理され、各ノードごと に、そのノードで終る各テンプレートが処理される。
ブロック56で示したように、トレースバックが必要であるか否かに無関係に、 次のテンプレートがブロック58かブロック60かで処理される。いずれかのブ ロックでテンプレートが合致すると、現行入力フレーム、テンプレート、および テンプレートのあらゆる状態に対する累積距離およびリンク・ポインタの他に文 法モデルの始発ノードに対する累積距離およびリンク・ポインタに基づいて、テ ンプレートのあらゆる状態に対する累積距離とリンク・ポインタとが更新される 。現在のフレームのこのテンプレートに対して単語終端である可能性が存在すれ ば、可能性ある単語終端に対応する累積距離とリンク・ポインタとが発生する。
前掲の接続単語認識のアルゴリズム。
流れがブロック56からブロック60に進み、トレースバックが、上述のテンプ レート処理の他に、このフレームを処理していることを示すと、そのテンプレー ト内の各アクティブ状態に対するリンク・ポインタが指すリンク・レコードに対 応するL−ACTエントリのすべてが非ゼロにセットされる。「アクティブ」テ ンプレート状態は有限累積距離を有するものである。
次に流れはブロック62に進み、ここでそのテンプレートに関連する累積距離が このフレームに対するノードで終る先に処理された最良のテンプレート(これは これがこのノードに対して処理された最初のテンプレートである場合には無限大 になる)に対応する現行累積距離より良いか否かを確認する試験が行われる。こ の試験の結果は現在の入力フレームのテンプレート合致が単語テンプレートの単 語終端である可能性があることを示す場合にのみ真である。
先に述べたとおり、単語終端である可能性があれば入力フレームのシーケンスが テンプレート・メモリに格納されている単語テンプレートと対応する、すなわち 合致することを示す。
テンプレートに現在の入力フレームに対して単語終端の可能性がなければ、その 関連の累積距離は無限になる。
最も最近に処理されたテンプレートにそのノードに関して格納されている前の累 積距離より良い累積距離がないことがわかれば流れはブロック54に戻り、ここ でそのノードで終る別のテンプレートが処理される。
最も最近処理されたテンプレートに対する累積距離がそのノードに関して今まで 処理されたものの中で最良であることがわかれば、流れはブロック64に進んで この情報を記録する。ブロック64で、上で処理されたテンプレートに対応する 累積距離とリンク・ポインタとが文法モデルのノードとして記録される。他に、 テンプレートを表わす単語番号、あるいは記号が記録される。単語番号は、後に 認識されたと確認されれば単語を引続き出力するために記録される。ブロック6 4から、流れは上に説明したようにブロック54に進む。
ブロック54て、そのノードで終るすべてのテンプレートが処理されたことが示 されれば、流れは第4C図のブロック68に進む。第4c図で、ブロック68か ら74まではリンク・レコードをトリーに加えるべかき否かを確認し、もし加え るべきである場合には、リンク・レコードがリンク・アレイを通してトリーに加 えられる。
ブロック68で、文法モデルのノードがアクティブであるか確認する試験が行わ れる。ノードがアクティブになっていることができる唯一の態様は、そのノード に対して処理された少なくとも1つの単語テンプレートが現在の入力フレームに 対して単語終端である可能性がある場合である。
ノードがインアクティブである場合には、流れは第4a図のブロック40に進み 、現在フレームに対して処理する他のノードを探す。それ以外の場合は、流れは ブロック70に進む。
ブロック70で、そのノードで終る最良テンプレートが単語テンプレートであっ たか否かを確認する試験が行われる。ある例では、無音テンプレートのような別 種のテンプレートであってもよく、この場合には流れは第4a図のブロック40 に進む。無音テンプレートは、典型的には認識されているような無音を出力する 必要がないから、トリーには加えられない。そのノードで終る最良のテンプレー トが単語テンプレートであった場合には、LINKサブルーチン(第5図)が呼 出されてリンク・レコードをトリー図に加える。そのテンプレートの始発リンク ・レコードに対応するリンク・ポインタとテンプレートを表わす単語番号とを示 すパラメータはLINKサブルーチンに送られる。
以下に説明するように、リンク・レコードが加えられてから、新しいリンク・ポ インタがLINKから戻される。
ブロック74で、文法モデルの現行ノードに対するリンクφポインタがLINK から送られたリンク・ポインタにセットされる。
ブロック74に続いて、流れは第4a図のブロック40に進み、文法トリーのす べてのノードが現在の入力フレームに対して処理されてしまったかチェックする 。
リンクのトリーへの付加 今度は第5図を参照すると、先に説明したようにこのサブルーチンはリンク・レ コードをリンク・アレイで規定されたようにトリー図に追加する。サブルーチン に送られるパラメータはそこから加えられるトリーのノードに対応する単語番号 とリンク・ポインタとである。
ブロック78で、自由リンク−レコードが存在するか否かを確認する試験が行わ れる。これはFREEとOとを比較することにより行われる。FREEが0に等 しければ、もはや自由リンク・レコードは存在しない。上に説明したが、リンク ・アレイ内のレコードは、L−PTRアレイで互いにチェインされており、自由 リンク・レコードと設定リンク・レコードとから構成されている。自由リンク・ レコードは別のリンク書レコードをトリー図に追加できるようにする。したがっ て、自由リンク・レコードが存在しなければ、すべてのリンク・レコードは使用 されており、流れはブロック80に進んでエラーが報告され、システムがリセッ トされる。ブロック80のこのステップはリンク・テーブルをオーバフローさせ るおそれのある異常状態から保護するときにのみ使用することに注意すべきであ る。正常状態では、本発明は適当な長さのリンク・テーブルを使用して自由リン ク・レコードがなくならないようにしている。
1つ以上の自由リンク・レコードがあれば、流れはブロック82に進み、次の利 用可能なリンク・レコードが自由リストから取出され、HEADおよびFREE のポインタを更新することにより設定リストの最上部、すなわち始まりに挿入さ れる。FREEは次の自由レコードのインデックス(index)を指すように セットされ、HEADは丁度加えられたばかりのリンク・レコードを指すように セットされる。新しいHEADリンクψレコードのL−PTRは新しいレコード を設定リストにチェインする、前のHEADリンク・レコードを指すようにセッ トされる。
ブロック86では、HEADは設定リストに丁度加えられたばかりのリンク・レ コードを指すので、このサブルーチンに送られた単語番号がL−WORDアレイ に新しいレコードとして記録される。また、このサブルーチンに送られたり、ン ク・ポインタはL−BACKアレイにリンク・レコードとして記録される。
ブロック88で現在の入力フレームにトレースバックが必要であるか否かを確認 する試験が行われる。必要であれば、流れはブロック90に進み、新しく加えら れたリンク・レコードにアクティブの印が付く。これはそのレコードのL−AC Tアレイを1に等しくセットすることにより行われる。現在の入力フレームに対 してトレースバックが必要でなければ、サブルーチンは終り、流れは第4C図の ブロック74に戻る。
トリーを通るトレーシング・バック 今度は第6a図から第6d図までを参照すると、トレースバック・サブルーチン 、すなわち、第4a図のブロック44が詳細に示されている。トレースバック・ サブルーチンはトリー図を通して可能性のある合致として特定されている単語を 探し、合致の一義性(unlqueness)にあいまいさくamblguit y)があるか否か確認する。一義的に特定されている単一は認識システムから認 識された単語として出力される。更に、トレースバック・サブルーチンは死んだ すべてのリンク・レコード、すなわち、もはや可能性ある合致として考察してい ないレコードを自由リストに取出し、メモリを将来のリンク・レコードに利用で きるようにする。
トレースバックに入る前に、L−ACTが上述のようにすべてのアクティブ・リ ンク・レコードに対してセットされる、すなわちフラグが掲げられる。トレース バックのはじめに、アクティブ・リンク・レコードはトリーを通るまだ考察中の すべてのパスの終りを表わす。トレースバックの基本概念はトリーを通してすべ てのアクティブ・パスの終り(はじめにL−ACTアレイにより印がつけられて いる)から「トレースバックしてすべてのアクティブ・パスがどこで会合するか を見つけることである。すべてのアクティブ・パスに共通なトリーの部分は明確 な部分パスを表わしており、この明確な部分パスに対応するこれらの単語は認識 されているとして出力することができる。トレースバック中、L−FWRDアレ イは部分パスを順方向に(トリーの終りの方に向って)チェインするのに使用さ れる。これら部分パスが形成されるにつれて各部分パスの基本ノードがL−AC Tアレイを経由してアクティブとされる。部分パスを(L−BACK情報を使用 して)現行ノードから既にアクティブと記されている前のノードに拡張しようと すると、1つ以上の可能なパスが二の前のノードから発生して両ノードからの部 分パスが削除される(順方向ポインターチェイン(L−FWRD)がOにリセッ トする)。アクティブと記されているすべてのノードはこのような仕方で処理さ れる。ノード処理の順序はリンク・レコードがリンる。この順序は設定リストの 構造に固有のものである。処理される最後のノードはトリーのルート(root )・ノードである。この点でそのノードから出る順方向チェイン(部分パス)は 明確な部分パスを表わしており、対応する認識された単語が出力される。トレー スバック手順はまたL−FWRDおよびL−ACTアレイが0へのリセットを完 了したら直ちにそれ自身「掃除する(cleans up) J。更に、アクテ ィブ・パス上にないすべてのリンク・レコードは、既に出力されている明確な部 分パス上のリンク・レコードとともに、自由リストに戻される。
トレースバック・サブルーチンを詳細に説明する前に、図示例に入るのが役に立 つであろう。第7図を参照すると、このような例が一連のトリー図Aから1まで として描かれている。
図Aでは、トリーはトレースバックの前に示されており、アクティブ・リンク・ レコード、すなわち、アクティブ単語リンクが出ているリンクはリンクの右側に 太い点で記しである。トレースバックの第1のステップは丁度良い時期に加えら れた最も最近のアクティブ・リンク・レコード、この場合は25と記したノード 、を確定することである。
トリーのこのノードの直前にアクティブ・ノードが存在するか確認する試験が行 われる。存在すれば、この例でノード25を経由するかまたはノード21を経由 するというように、どのパスがノード21に戻るかに関してあいまいさが存在す る。あいまいさが生ずるとあいまいなノードに対する順方向ポインタがそのチェ インされた順方向ポインタを、もし存在すれば、取除く。これは各後続のリンク ・レコードに対してL−FWRDアレイにOを挿入することによって行われる。
この例では、どのノードにも順方向ポインタがない。すなわちL−FWRD−0 である。
次の最も最近加えられたアクティブ・リンク・レコードが特定される(ノード2 4)。ノード24の先行リンクもノード21であり、上述のノード25の処理と 同様に処理される。
次の最も最近加えられたアクティブ・ノードはノード23である。二〇ノードに はアクティブな先行ノードがないので、トレースバック・プロセスは先行ノード をアクティブとし、現在処理しているノード、ノード23、に等しい、先行ノー ド、ノード19、の順方向ポインタ(L−FWRD)を記録する。図Bはノード 23を処理した後の図Aを示しており、ノード19に加えられた順方向ポインタ を太線で描いである。各ノードが処理されたら、それがアクティブ・ノードであ ることを示しているそのL−ACTエントリが取除かれる。したがって、トリー 図Bはもはやノード23.24、および25をアクティブと描いていない。
ノード22はアクティブ・ノードを備えている、次に最も最近加えられたエント リである。これにはアクティブな先行ノードがない。したがって、ノード23に 対して行ったように、ノード18の順方向ポインタがノード22に等しくセット され、ノード18にアクティブの印が付けられる。図Cはノード22を処理した 後のトリーを示す。
ノード21は、図りに示すように、その先行ノードがアクティブでないので、ノ ード22と同様に処理される。
ノード20は次に処理されるべきアクティブ・ノードである。ノード20に先行 するノードはアクティブであり、これはあいまいさを示す。あいまいさが生ずる と、あいまいさのノード、この場合ノード18と20、に対する順方向ポインタ はその順方向ポインタ・チェインが解かれる。
この例ではノード18にだけ順方向ポインタがある。ノード18の後に太線で示 したように、ノード18に対する順方向ポインタはノード22と等しくセットさ れている。したがって、図Eで、ノード18の順方向ポインタを0に等しくセッ トすることにより、太線が除去される。
ノード19は次に最も最近加えられた、アクティブ・ノードを備えているエント リである。その先行ノードはアクティブであるから、図Fに示すように、あいま いさによって両ノード16および19に対する順方向ポインタ・チェインを外さ なければならない。
ノード18が次に処理される。その先行ノード、16、はアクティブであるが、 ノード16または18はいずれも順方向ポインタを備えていないので、ノードの アクティビティを示す太い点を除去すること以外何らの処置も取られない。
次のアクティブ・ノードはノード16であり、これの先行ノードはアクティブで ない。この場合には、トレースバック・プロセスは先行ノードをアクティブとし 、現在処理されているノード、ノード16、に等しい、先行ノード、ノード13 、に対する順方向ポインタを記録する。図Gはノード16を処理した後のトリー 図Aを示す。
ノード13はノード16と同様に処理される。したがって、図Hではトリーはノ ード11だけをアクティブと記して示してあり、ノード11と13とに対する順 方向ポインタだけが残っている。
一旦トレースバック・プロセスが、先行する他のノードが無いトリーのルート・ ノード(ノード11)に到達すれば、順方向ポインタを通してチェインした単語 を認識単語として出力する。これはチェインされた順方向ポインタを備えている リンク・レコードをL−FWRD内でルート・ノードから出発して引続き探すこ とにより行われる。図!で示すように、そのそれぞれのL −W ORDアレイ にreight JおよびrnveJを記録するリンク・レコードを出力する。
その他、図Hで、ノード11と16との間のリンクを表わすリンク・レコードが 設定リストから除去され、L−PTRアレイおよびFREEポインタで示したよ うに、自由リストにリンクされる。この時点でのトリーの新しいに示してあり、 これは別の入力フレームが処理されるとき、すなわち、流れが認識流れ図の第4 a図のブロック46に戻る場合に使用される。
今度は第6a〜6d図を参照してトレースバック流れ図を詳細に説明することに する。第6a図で、リンク争テーブルから最も最近加えられたアクティブである リンク・レコードを探す。ブロック94で、リンク・テーブルの最初のレコード が設定レコード・リスト内の唯一のレコードであるか否かを確認する試験が行わ れる。これはHEADにより指示されているL−PTRアレイのインデックスを 探すことによって行われる。前述のとおり、HEADは最も最近加えられたリン ク・レコードのインデックスを備えている。HEADに対応するL−PTRエン トリがOに等しければ、チェインは終結し、テーブルの中には他にレコードがな い。この場合には、流れはブロック96に進み、対応するL−ACTエントリが インアクティブに設定される。
ブロック96から、サブルーチンは認識流れ図の第4a図のブロック46に戻る 。
テーブルの中に別のリンク・レコードが存在する場合には、ブロック98で最初 のリンク・レコードがアクティブであるか確認する試験が行われる。その対応す るL−ACTエントリが0に等しくなければリンク・レコードはアクティブであ る。
リンク・レコードがアクティブであれば、流れはブロック100に進む。ブロッ ク100で、リンク・レコードが既に考慮に入れられてしまっていることを示す には、リンク・レコードをインアクティブに設定する。次に流れはブロック11 0に進み、HEADで指示されたレコードがテンポラリ−ポインタPTRに格納 される。ブロック110から、流れは、引続き説明するが、ブロック120に進 む。
最初のリンク・レコードがインアクティブに戻ってしまえば、流れはブロック9 8からブロック112に進む。ブロック112で、L−PTRはアクティブ・リ ンク争レコードが見つかるまで動き回り、アクティブ・リンク・レコードが見つ かると、そのアクティブ・レコードに対するインデックスがPTRに格納される 。ブロック114で、アクティブのインジケータがクリアされ、ブロック100 で行ったと同様に、そのリンク・レコードに対する処理を示す。
ブロック116で、ポインタHEADとPTRとの間で示、されたように、イン アクティブであるとわかったリンク・レコードが将来の使用のため自由リストに 戻される。
ブロック118で、リンク・テーブル内に更にリンクがあるか確認する試験が行 われる。この試験は上のブロック94で行われた試験と同じである。
設定リスト内にもはやリンク・レコードが存在しなければ、サブルーチンは認識 流れ図に第4a図のブロック46で戻る。
プロ、ツク120で現行リンクに先行するリンク(ノード)がインアクティブで あるか否かを確認する試験が行われる。
これは現行リンク・レコードのバック・ポインタを探し、その対応するL−AC Tエントリを探すことにより行われる。先行ノードがアクティブであれば、流れ は第6b図のブロック124に進み、先に説明したあいまいさの問題を処理する 。先行ノードがインアクティブであれば、流れは第6C図のブロック142に進 む。
今度は第6b図を参照すると、ここのステップは、先行ノードがなお合致につい て考察中のノードから発生する2つ以上のリンク・レコードがある可能性のある ことを示しているとき、あいまいさを処理する。この状態はアクティブ・ノード に先行するノードもアクティブであるときに起る。リンク・レコード・データを 操作するためtJ6b図で3つのテンポラリ・ポインタ(TMPI、TMP2お よびPTR)を使用する。ブロック121のステップは順方向ポインタ・チェイ ンを前のリンクから取外す。このステップにはブロック124.126.128 、および130が含まれている。第6b図にはPTRが現在処理されているノー ド、あるいはリンク・レコードを指示した状態で入る。
リンク・レコードに対応するL−BACKエントリは、第7図により上述したよ うに、現在処理されているノードの直前のノードを指している。リンク・レコー ドに関連するL−FWRDエントリは可能性のある子孫リンク争レコードだけを 指示する。
ブロック124で、現行アクティブΦノードの直前のノードを指すポインタがT MPIに格納される。ブロック126で、先行ノードの、L−FWRDにより指 示された子孫リンク・レコードがTMP2に格納される。
ブロック128で、TMP2で指示されたノードが実際のL−FWRDエントリ を備えているが、あるいはそれが0にセットされているかを確認する試験が行わ れる。TMP2で指示されたノードが順方向ポインタを備えていれば(L−FW RDが0に等しくなければ)、流れはブロック130に進み、そのノードに対す る順方向ポインタが除去される。ブロック130で、TMP2の内容もTMPI に移動し、これにより現行ノードの参照が一時的にTMP2により指示されてい るノードに移動し、次いで、ブロック126から始まって、上記のステップが後 続のノードに対して、順方向チェイン内に、ブロック128で示したように、順 方向チニイン終りを示す順方向ポインタを持たないノードが見つかるまで、繰返 される。
ブロック122のステップは、PTRで示されているように、現行リンクから順 方向ポインタ・チェインを除去する。ブロック132で、現行リンク・レコード ・ポインタPTRがTMPIに格納される。ブロック134で、そのリンク争レ コードに対するL−FWRDエントリがTMP2に格納される。ブロック136 で、上のブロック128で行われたように、このリンク・レコードに対する順方 向ポインタが存在するか確認する試験が行われる。このリンク・レコードに対す る順方向ポインタが存在すれば、流れはブロック138に進み、ここで順方向ポ インタが除去され、子孫ノードが、その順方向ポインタをも同様に除去するため 、TMPIに格納される。ブロック134から始めて、上のステップは、現行ノ ードからチェインされている順方向ポインタがすべて削除されるまで繰返される 。次に、ブロック136から、流れは第6C図のブロック144に進み、次のア クティブ・リンク・レコードを処理する。
°第6a図のブロック120に戻って参照すると、現行ノードに先行するノード がインアクティブである場合には、流れは第6C図のブロック142に進む。こ れについて説明する。
第6C図のブロック142では、先行ノード(リンク・レコード)がインアクテ ィブであるとわかっているので、このノードがアクティブにセットされ、その順 方向ポインタが現行リンク・レコードを指すようにセットされる。ブロック14 4で、現行リンク・レコードから始めて、次のアクティブ・リンク・レコードが 見つかり、PTRがこのレコードを指すようにセットされ、新しい現行リンクレ コードを示すようになるまでテーブルが捜索される。ブロック146で、ブロッ ク144のステップ中に遭遇したすべてのインアクティブ・レコードが、L−P TRアレイ中の適切なエントリを修正することにより、自由リストに戻される。
ブロック148で、新しいノードがインアクティブにセットされて、第6a図の ブロック100および114で行われたと同様に、そのノードが既に考慮に入れ られていることを示す。
ブロック152でこの新しいリンク拳レコードがチェインの最後であるか否かを 確認する試験が行われる。最後である場合には、すべてのリンク・レコードが処 理されてしまっており、流れは第6d図のブロック156に進んでトレースバッ ク・プロセス中に認識された単語を出力する。
この新しいリンク・レコードがチェインの最後でなければ、流れは更に処理する ため第6a図のブロック120に進む。
今度は第6d図を参照すると、ブロック156で現行リンク・レコードのインデ ックスが、これはトリーのルート・ノードであるが、TMPIに格納される。ブ ロック158で、現行ノードの順方向ポインタによって表わされているノード( リンク・レコード)がTMP2に格納される。
たとえば、第7図の図Hを参照すると、TMPIは11(ノード11)を含んで おり、TMP2は13(ノード13)を含んでいる。
ブロック160で、TMPIに格納されているノードからの子孫となる順方向ポ インタが存在するか確認する試験が行われる。これはTMP2の内容と0とを比 較して行われる。もしTMPIに格納されているノードからの子孫となるある順 方向ポインタが存在すれば、流れはブロック162に進み、現行ノードに対する 順方向ポインタが除去され、現行ノードが、TMP2に格納されている現行ノー ドの順方向ポインタによって示されているように、順方向チェイン内の次のノー ドまで持ち上げられる。ブロック164で、現行リンク・レコードに関連する単 語が認識された単語として出力される。ブロック158から始まって、上記のス テップは、順方向ポインタ・チェインの各リンク・レコードが、認識された単語 としてその関連単語を備えるようになるまで、繰返される。ブロック160での ステップ中、順方向ポインタを備えていない子孫リンク・レコードが見つかるが 、この場合には、流れはブロック168に進み、TMPlおよびPTRの間に示 されているように、すべての死んだリンク・レコードが自由リストに戻される。
その他に、ブロック168でL−PTRアレイがPTRにより現在指示されてい る新しい基底(base)ノードに対するL−PTRエントリを0にセットする ことにより更新される。このレコード内の0はトリーのルート(root)とリ ンク・レコードの設定リストの終りとを示す。ブロック168で、トレースバッ クは完了し、流れは第4a図のブロック46に進む。
本発明はしたがって連続音声認識のための新しいかつ改良されたシステムと方法 とを提供する。本発明は効率的に様式化した上述の流れ図により説明したように 簡単かつ安任な8ビツトのプロセッサで実時間認識を行うように簡単に実現する ことができる。本発明は更に入力フレームを処理するとき最小限の数のリンク・ レコードだけを格納すればよいようなすぐれたメモリ管理法を提供する。
本発明について特に好ましい実施例を参照して図示し、説明したが、当業者には 上述の本発明に対しその精神および範囲を逸脱することなく各種修正および変更 を行い得ることが理解されるであろう。
tn4c図のリンク流れ図72 第4C図のブロック −一一一一一一一一一一一一一一一国際調査報告 S、− 、Qe I)crQ’、ニー、□

Claims (56)

    【特許請求の範囲】
  1. 1.入力フレームが音声を表わすあらかじめ格納されているテンプレートに対し て処理され、認識される可能性のあるテンプレートとして考察中のテンプレート がリンク・ネットワーク中にリンク・レコードとして個別に記録されており、前 記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている音 声認識システムにおいて、前記リンク・レコードに対するテンポラリ・ポインタ を設ける手段と、 前記テンポラリ・ポインタを有する前記リンク・レコードの所定の1つにラベル を付して前記1つのリンク・レコードに対応する認識される可能性あるテンプレ ートに接続しながら前記ネットワークを通してトレースバックする手段と、 2つ以上の認識される可能性ある子孫リンク・レコードを有するリンク・レコー ドを確認する手段と、前記確認されたリンク・レコードに対応する前記テンポラ リ・ポインタを削除する手段と、 前記テンポラリ・ポインタでなおラベルが付けられている前記リンク・レコード に対応するデータを出力する手段と、 を備えていることを特徴とする音声パターンを認識する装置。
  2. 2.所定数の入力フレームが処理された後、システムに定期的に警報を発する手 段を備えている請求項1に記載の音声パターンを認識する装置。
  3. 3.所定の文法モデル・トポロジーにしたがってネットワークを構成する手段を 備えている請求項1に記載の音声パターンを認識する装置。
  4. 4.少なくとも1つの前記テンプレートに対して単語終端の可能性あるものが認 識された後、リンク・レコードをネットワークに付加する手段を備えている請求 項1に記載の音声パターンを認識する装置。
  5. 5.ネットワーク内の最も最近に付加されたリンク・レコードを示す手段を備え ている請求項1に記載の音声パターンを認識する装置。
  6. 6.リンク・レコードに祖先リンク・レコードが存在しないことを示す手段を備 えている請求項1に記載の音声パターンを認識する装置。
  7. 7.前記リンク・レコードを自由リンク・レコードと設定リンク・レコードとか ら成るテーブルに格納する手段を備えている請求項1に記載の音声パターンを認 識する装置。
  8. 8.設定リンク・レコードの始まりと自由リンク・レコードの始まりとを示す手 段を備えている請求項7に記載の音声パターンを認識する装置。
  9. 9.設定リンク・レコードの終りと自由リンク・レコードの終りとを示す手段を 備えている請求項7に記載の音声パターンを認識する装置。
  10. 10.前記確認されたリンク・レコードからの子孫であるリンク・レコードに対 するテンポラリ・ポインタを削除する手段を備えている請求項1に記載の音声パ ターンを認識する装置。
  11. 11.入力フレームが音声を表わすあらかじめ格納されているテンプレートに対 して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレー トがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、 前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている 音声認識システムにおいて、 前記リンク・レコードを、各々がテンプレートを表わす記号と、リンク・レコー ドが格納された相対的時間を表わすシーケンス・インジケータと、ネットワーク 内のそれぞれがそこから派生して来たリンク・レコードを示す第1のポインタと 、第2のテンポラリ・ポインタとを備えているインデックス付きデータ集合体と して格納する手段と、前記第2のテンポラリ・ポインタを含め、前記インデック ス付きデータ集合体を用いてネットワークを通してトレースバックし、明確に認 識されている少なくとも1つのリンク・レコードを特定する手段と、 前記明確に認識されたリンク・レコードを出力する手段と、 を備えていることを特徴とする音声パターンを認識する装置。
  12. 12.所定数の入力フレームが処理された後、システムに定期的に警告を発する 手段を備えている請求項11に記載の音声パターンを認識する装置。
  13. 13.所定の文法モデル・トポロジーにしたがってネットワークを構築する手段 を備えている請求項11に記載の音声パターンを認識する装置。
  14. 14.少なくとも1つの前記テンプレートに対して単語終端の可能性あるものを 認識した後、リンク・レコードをネットワークに付加する手段を備えている請求 項11に記載の音声パターンを認識する装置。
  15. 15.ネットワーク内の最も最近に付加されたリンク・レコードを示す手段を備 えている請求項11に記載の音声パターンを認識する装置。
  16. 16.リンク・レコードに祖先リンク・レコードが存在しないことを示す手段を 備えている請求項11に記載の音声パターンを認識する装置。
  17. 17.前記リンク・レコードを、自由リンク・レコードと設定リンク・レコード とから成るテーブルに格納する手段を備えている請求項11に記載の音声パター ンを認識する装置。
  18. 18.設定リンク・レコードの始まりと自由リンク・レコードの始まりとを示す 手段を備えている請求項17に記載の音声パターンを認識する装置。
  19. 19.設定リンク・レコードの終りと自由リンク・レコードの終りとを示す手段 を備えている請求項17に記載の音声パターンを認識する装置。
  20. 20.前記確認されたリンク・レコードからの子孫であるリンク・レコードに対 するテンポラリ・ポインタを削除する手段を備えている請求項11に記載の音声 パターンを認識する装置。
  21. 21.入力フレームが、音声を表わすあらかじめ格納されているテンプレートに 対して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレ ートがリンク・ネットワーク中にリンク・レコードとして個別に記録されており 、前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えてい る音声認識システムにおいて、 前記リンク・レコードを、各々がテンプレートを表わす記号と、リンク・レコー ドが格納された相対的時間を表わすシーケンス・インジケータと、ネットワーク 内のそれぞれがそこから派生して来たリンク・レコードを示すポインタとを備え ているインデックス付きデータ集合体として、テーブルに格納する手段と、 前記テーブルは自由レコード・スペースと設定レコード・スペースとから成り、 前記リンク・レコードは前記設定レコード・スペースに格納されており、前記イ ンデックス付きデータ集合体を使用してネットワークを通してトレースバックし 、その対応するテンプレートが明確に認識されている1つ以上のリンク・レコー ドを特定する手段と、 前記明確に認識されたリンク・レコードを表わすデータを出力し、前記リンク・ レコードを前記設定レコード・スペースから取出し、これにより前記取出したリ ンク・レコードが引続きリンク・レコードを格納する自由レコード・スペースと なるようにする手段と、 を備えていることを特徴とする音声パターンを認識する装置。
  22. 22.所定数の入力フレームを処理した後、システムに定期的に警報を発する手 段を備えている請求項21に記載の音声パターンを認識する装置。
  23. 23.所定の文法モデル・トポロジーにしたがってネットワークを構築する手段 を備えている請求の範囲第21に記載の音声パターンを認識する装置。
  24. 24.少なくとも1つの前記テンプレートに対する単語終端の可能性あるものが 認識された後、リンク・レコードをネットワークに付加する手段を備えている請 求項21に記載の音声パターンを認識する装置。
  25. 25.ネットワーク内の最も最近に付加されたリンク・レコードを示す手段を備 えている請求項21に記載の音声パターンを認識する装置。
  26. 26.リンク・レコードに祖先リンク・レコードが存在しないことを示す手段を 備えている請求項21に記載の音声パターンを認識する装置。
  27. 27.認識される可能性のある2つ以上の子孫リンク・レコードを備えている可 能性のあるリンク・レコードを決定する手段を備えている請求項21に記載の音 声パターンを認識する装置。
  28. 28.前記設定レコード・スペースで、対応するテンプレートが明確に認識され ていない特定のリンク・レコードを選定し、該特定のリンク・レコードを前記自 由レコード・スペースに戻す手段を備えている請求項21に記載の音声パターン を認識する装置。
  29. 29.入力フレームが音声を表わすあらかじめ格納されているテンプレートに対 して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレー トがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、 前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている 音声認識システムにおいて、 前記リンク・レコードに対しテンポラリ・ポインタを設けるステップと、 前記リンク・レコードの所定の1つに前記テンポラリ・ポインタのラベルを付け ながら前記ネットワークを通してトレースバックし、前記1つのリンク・レコー ドに対応する、認識される可能性あるテンプレートを接続するステップと、 認識される可能性のある2つ以上の子孫リンク・レコードを備えている可能性の あるリンク・レコードを決定するステップと、 前記決定されたリンク・レコードに対応する前記テンポラリ・ポインタを削除す るステップと、前記テンポラリ・ポインタのラベルがなお付いている前記リンク ・レコードに対応するデータを出力するステップと、 を具備することを特徴とする音声パターンを認識する方法。
  30. 30.所定数の入力フレームが処理された後、システムに定期的に警報を発する ステップを含んでいる請求項29に記載の音声パターンを認識する方法。
  31. 31.所定の文法モデル・トポロジーにしたがってネットワークを構築するステ ップを含んでいる請求項29に記載の音声パターンを認識する方法。
  32. 32.少なくとも1つの前記テンプレートに対する単語終端の可能性あるものが 認識された後、リンク・レコードをネットワークに付加するステップを含んでい る請求項29に記載の音声パターンを認識する方法。
  33. 33.ネットワーク内の最も最近に付加されたリンク・レコードを示すステップ を含んでいる請求項29に記載の音声パターンを認識する方法。
  34. 34.リンク・レコードに子孫リンク・レコードが存在しないことを示すステッ プを含んでいる請求項29に記載の音声パターンを認識する方法。
  35. 35.前記リンク・レコードを、自由リンク・レコードと設定リンク・レコード とから成るテーブルに格納するステップを含んでいる請求項29に記載の音声パ ターンを認識する方法。
  36. 36.設定リンク・レコードの始まりと自由リンク・レコードの始まりとを示す ステップを含んでいる請求項35に記載の音声パターンを認識する方法。
  37. 37.設定リンク・レコードの終りと自由リンク・レコードの終りとを示すステ ップを含んでいる請求項35に記載の音声パターンを認識する方法。
  38. 38.前記決定されたリンク・レコードからの子孫であるリンク・レコードに対 するテンポラリ・ポインタを削除するステップを含んでいる請求項29に記載の 音声パターンを認識する方法。
  39. 39.入力フレームが音声を表わすあらかじめ格納されているテンプレートに対 して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレー トがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、 前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている 音声認識システムにおいて、 前記リンク・レコードを、各々が、テンプレートを表わす記号と、リンク・レコ ードが格納された相対的時間を表わすシーケンス・インジケータと、ネットワー ク内のそれぞれがそこから派生して来たリンク・レコードを示す第1のポインタ と、第2のテンポラリ・ポインタとを備えているインデックス付きデータ集合体 として格納するステップと、 前記第2のテンポラリ・ポインタを含め、前記インデックス付きデータ集合体を 用いてネットワークを通してトレースパックし、明確に認識されている少なくと も1つのリンク・レコードを特定するステップと、前記明確に認識されたリンク ・レコードを出力するステップと、 を具備することを特徴とする音声パターンを認識する方法。
  40. 40.所定数の入力フレームが処理された後、システムに定期的に警報を発する ステップを含んでいる請求項39に記載の音声パターンを認識する方法。
  41. 41.所定の文法モデル・トポロジーにしたがってネットワークを構築するステ ップを含んでいる請求項39に記載の音声パターンを認識する方法。
  42. 42.少なくとも1つの前記テンプレートに対する単語終端の可能性のあるもの が認識された後、リンク・レコードをネットワークに付加するステップを含んで いる請求項39に記載の音声パターンを認識する方法。
  43. 43.ネットワーク内の最も最近に付加されたリンク・レコードを示すステップ を含んでいる請求項39に記載の音声パターンを認識する方法。
  44. 44.リンク・レコードに祖先リンク・レコードが存在しないことを示すステッ プを含んでいる請求項39に記載の音声パターンを認識する方法。
  45. 45.前記リンク・レコードを自由リンク・レコードと設定リンク・レコードと から成るテーブルに格納するステップを備えている請求項39に記載の音声パタ ーンを認識する方法。
  46. 46.設定リンク・レコードの始まりと自由リンク・レコードの始まりとを示す ステップを含んでいる請求項45に記載の音声パターンを認識する方法。
  47. 47.設定リンク・レコードの終りと自由リンク・レコードの終りとを示すステ ップを含んでいる請求項45に記載の音声パターンを認識する方法。
  48. 48.前記決定されたリンク・レコードの子孫であるリンク・レコードに対する テンポラリ・ポインタを削除するステップを含んでいる請求項39に記載の音声 パターンを認識する方法。
  49. 49.入力フレームが音声を表わすあらかじめ格納されているテンプレートに対 して処理され、認識される可能性のあるテンプレートとして考慮中のテンプレー トがリンク・ネットワーク中にリンク・レコードとして個別に記録されており、 前記リンク・レコードは一般に先祖および子孫のリンク・レコードを備えている 音声認識システムにおいて、 前記リンク・レコードを、各々が、テンプレートを表わす記号と、リンク・レコ ードが格納された相対的時間を表わすシーケンス・インジケータと、ネットワー ク内のそれぞれがそこから派生して来たリンク・レコードを示すポインタを備え ているインデックス付きデータ集合体として、自由レコード・スペースと設定レ コード・スペースとから成るテーブルの、前記設定レコード・スペースに格納す るステップと、 前記インデックス付きデータ集合体を使用してネットワークを通してトレースバ ックし、対応するテンプレートが明確に認識されている1つ以上のリンク・レコ ードを特定するステップと、 前記明確に認識されたリンク・レコードを表わすデータを出力し、前記リンク・ レコードを前記設定レコード・スペースから取出し、これにより前記取出したリ ンク・レコードが引続いて格納するリンク・レコードに対する自由レコード・ス ペースになるようにするステップと、を具備することを特徴とする音声パターン を認識する方法。
  50. 50.所定数の入力フレームが処理された後、システムに定期的に警報を発する ステップを含んでいる請求項49に記載の音声パターンを認識する方法。
  51. 51.所定の文法モデル・トポロジーにしたがってネットワークを構築するステ ップを含んでいる請求項49に記載の音声パターンを認識する方法。
  52. 52.少なくとも1つの前記テンプレートに対する単語終端の可能性あるものが 認識された後、リンク・レコードをネットワークに付加するステップを含んでい る請求項49に記載の音声パターンを認識する方法。
  53. 53.ネットワーク内の最も最近に付加されたリンク・レコードを示すステップ を含んでいる請求項49に記載の音声パターンを認識する方法。
  54. 54.リンク・レコードに祖先リンク・レコードが存在しないことを示すステッ プを含んでいる請求項49に記載の音声パターンを認識する方法。
  55. 55.認識される可能性のある2つ以上の子孫リンク・レコードを備えている可 能性のあるリンク・レコードを決定するステップを含んでいる請求項49に記載 の音声パターンを認識する方法。
  56. 56.前記設定レコード・スペースで、対応するテンプレートが出力されていな い特定のリンク・レコードを選定し、該特定のリンク・レコードを前記自由レコ ード・スペースに戻すステップを含んでいる請求項49に記載の音声パターンを 認識する方法。
JP61503471A 1986-06-02 1986-06-02 連続音声認識システム Expired - Lifetime JP2717652B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US1986/001224 WO1987007749A1 (en) 1986-06-02 1986-06-02 Continuous speech recognition system

Publications (2)

Publication Number Publication Date
JPH01502611A true JPH01502611A (ja) 1989-09-07
JP2717652B2 JP2717652B2 (ja) 1998-02-18

Family

ID=22195542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61503471A Expired - Lifetime JP2717652B2 (ja) 1986-06-02 1986-06-02 連続音声認識システム

Country Status (4)

Country Link
US (1) US5040127A (ja)
JP (1) JP2717652B2 (ja)
CA (1) CA1301340C (ja)
WO (1) WO1987007749A1 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3043439B2 (ja) * 1990-12-28 2000-05-22 富士通株式会社 データ処理装置におけるネットワーク記憶方法
DE4130633A1 (de) * 1991-09-14 1993-03-18 Philips Patentverwaltung Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal
DE4130631A1 (de) * 1991-09-14 1993-03-18 Philips Patentverwaltung Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal
US6385312B1 (en) 1993-02-22 2002-05-07 Murex Securities, Ltd. Automatic routing and information system for telephonic services
SG93215A1 (en) * 1993-03-25 2002-12-17 British Telecomm Speech recognition
SG50489A1 (en) * 1993-03-31 1998-07-20 British Telecomm Connected speech recognition
US6230128B1 (en) 1993-03-31 2001-05-08 British Telecommunications Public Limited Company Path link passing speech recognition with vocabulary node being capable of simultaneously processing plural path links
DE69427083T2 (de) * 1993-07-13 2001-12-06 Theodore Austin Bordeaux Spracherkennungssystem für mehrere sprachen
JP3004883B2 (ja) * 1994-10-18 2000-01-31 ケイディディ株式会社 終話検出方法及び装置並びに連続音声認識方法及び装置
US5970457A (en) * 1995-10-25 1999-10-19 Johns Hopkins University Voice command and control medical care system
US5799276A (en) * 1995-11-07 1998-08-25 Accent Incorporated Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals
US5835893A (en) * 1996-02-15 1998-11-10 Atr Interpreting Telecommunications Research Labs Class-based word clustering for speech recognition using a three-level balanced hierarchical similarity
US5872938A (en) * 1996-06-28 1999-02-16 International Business Machines Corp. Service priority queue implemented with ordered sub-queues and sub-queue pointers pointing to last entries in respective sub-queues
US5884258A (en) * 1996-10-31 1999-03-16 Microsoft Corporation Method and system for editing phrases during continuous speech recognition
US5950160A (en) * 1996-10-31 1999-09-07 Microsoft Corporation Method and system for displaying a variable number of alternative words during speech recognition
US5899976A (en) * 1996-10-31 1999-05-04 Microsoft Corporation Method and system for buffering recognized words during speech recognition
US5829000A (en) * 1996-10-31 1998-10-27 Microsoft Corporation Method and system for correcting misrecognized spoken words or phrases
US6006181A (en) * 1997-09-12 1999-12-21 Lucent Technologies Inc. Method and apparatus for continuous speech recognition using a layered, self-adjusting decoder network
US5983180A (en) * 1997-10-23 1999-11-09 Softsound Limited Recognition of sequential data using finite state sequence models organized in a tree structure
GB2333172A (en) * 1998-01-13 1999-07-14 Softsound Limited Recognition
US6442520B1 (en) 1999-11-08 2002-08-27 Agere Systems Guardian Corp. Method and apparatus for continuous speech recognition using a layered, self-adjusting decoded network
US20040205035A1 (en) * 2000-05-01 2004-10-14 Norbert Rimoux Method and system for adaptive learning and pattern recognition
KR100450396B1 (ko) * 2001-10-22 2004-09-30 한국전자통신연구원 트리탐색기반 음성 인식 방법 및 이를 이용한 대용량 연속음성 인식 시스템
US20040064315A1 (en) * 2002-09-30 2004-04-01 Deisher Michael E. Acoustic confidence driven front-end preprocessing for speech recognition in adverse environments
WO2005031590A1 (en) * 2003-09-30 2005-04-07 Intel Corporation Viterbi path generation for a dynamic bayesian network
US7529657B2 (en) * 2004-09-24 2009-05-05 Microsoft Corporation Configurable parameters for grammar authoring for speech recognition and natural language understanding
US20070214153A1 (en) * 2006-03-10 2007-09-13 Mazzagatti Jane C Method for processing an input particle stream for creating upper levels of KStore
US8086463B2 (en) * 2006-09-12 2011-12-27 Nuance Communications, Inc. Dynamically generating a vocal help prompt in a multimodal application
US8060367B2 (en) * 2007-06-26 2011-11-15 Targus Information Corporation Spatially indexed grammar and methods of use
US9390708B1 (en) * 2013-05-28 2016-07-12 Amazon Technologies, Inc. Low latency and memory efficient keywork spotting

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62275300A (ja) * 1986-05-16 1987-11-30 沖電気工業株式会社 連続音声認識方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4277644A (en) * 1979-07-16 1981-07-07 Bell Telephone Laboratories, Incorporated Syntactic continuous speech recognizer
US4783809A (en) * 1984-11-07 1988-11-08 American Telephone And Telegraph Company, At&T Bell Laboratories Automatic speech recognizer for real time operation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62275300A (ja) * 1986-05-16 1987-11-30 沖電気工業株式会社 連続音声認識方法

Also Published As

Publication number Publication date
WO1987007749A1 (en) 1987-12-17
JP2717652B2 (ja) 1998-02-18
CA1301340C (en) 1992-05-19
US5040127A (en) 1991-08-13

Similar Documents

Publication Publication Date Title
JPH01502611A (ja) 連続音声認識システム
JP5409931B2 (ja) 音声認識装置及びナビゲーション装置
EP1575029B1 (en) Generating large units of graphonemes with mutual information criterion for letter to sound conversion
Young et al. The HTK book
EP0573553A1 (en) Method for recognizing speech using linguistically-motivated hidden markov models
EP1738291A1 (en) Tree index based method for accessing automatic directory
US5987409A (en) Method of and apparatus for deriving a plurality of sequences of words from a speech signal
JPH0583918B2 (ja)
JPS63259697A (ja) 音声認識方法
WO2004049240A1 (en) Method and device for determining and outputting the similarity between two data strings
CN112331229B (zh) 语音检测方法、装置、介质和计算设备
EP0248377B1 (en) Continuous speech recognition system
JP2000293191A (ja) 音声認識装置及び音声認識方法並びにその方法に用いられる木構造辞書の作成方法
TWI241555B (en) Device and method for recognizing consecutive speech, and program recording medium
KR20090063546A (ko) 음성인식 장치 및 방법
JP2012063611A (ja) 音声認識結果検索装置、音声認識結果検索方法および音声認識結果検索プログラム
JP2002278579A (ja) 音声データ検索装置
JPH01502610A (ja) 連続音声認識システム
JP2000267693A (ja) 音声処理装置及び索引作成装置
JP3727173B2 (ja) 音声認識方法及び装置
JP2738403B2 (ja) 音声認識装置
Rabiner Speech recognition based on pattern recognition approaches
CN117316145A (zh) 一种维吾尔语语音关键词的检索方法、装置及电子设备
Wang DTW and Search
JPS6346499A (ja) 大語▲い▼単語音声認識方式

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term