JP2000509836A

JP2000509836A - 自動言語認識

Info

Publication number: JP2000509836A
Application number: JP9539620A
Authority: JP
Inventors: ハベル、サイモン・アレクサンダー
Original assignee: British Telecommunications PLC
Current assignee: British Telecommunications PLC
Priority date: 1996-05-03
Filing date: 1997-04-24
Publication date: 2000-08-02
Also published as: CA2247512C; DE69700472T2; AU709376B2; EP0896710A1; EP0896710B1; CN1217808A; CA2247512A1; KR20000005278A; NO985093L; NO985093D0; DE69700472D1; AU2397797A; NZ331430A; WO1997042626A1

Abstract

(57)【要約】パラメータ表示の言語を、モデル言語要素(12b，12c)を含むパスのダイナミックに延在するパスのネットワークと整合させることによって言語認識を行なう。ユニットは前後関係と関係し、例えばトライフォンである。要素をパスに組込むことが必要なとき、前後関係は関連するときに定められないので、いくつかの要素を同時にモデルに変換することはできない。書換え可能にするために、要素は位置マーカ(21，22，23，24)として書き換えられて、それが位置マーカを変換されて、トライフォンの定義により、後の延長が完了する。位置マーカ(12ａ)を使用して、次に延長する場所を識別できる。

Description

【発明の詳細な説明】自動言語認識本発明は自動言語認識、とくに前後関係（コンテキスト）に関係する要素、例えばトライフォンを使用する自動言語認識に関する。自動言語認識は、例えばディクテーション（書取り）システムのような、多くの潜在的な応用をもち、種々の機構、例えばビデオレコーダの言語制御を行なう。自動言語認識は、例えば電話によって、家庭用機器の遠隔制御に使用することもできる。多くの電話サービス、例えば自動インデックスを使用する広範な種々のサービスがあり、自動言語認識を合成言語と組み合わせて実行することができる。多くの応用では、言語を認識し損なっても容認可能な結果としてみなされている。例えば、話者がミスをしてもよく、また仮に故障があると、それは自動システムの故障でないとしてよい。システムはしばしば、不完全なまたは不適切な発話を認識しないように設計され、例えばシステムは繰り返し要求できる。言語認識は通常、言語信号のパラメータ表示の（パラメータ化）サンプルをネットワークと整合することによって行われ、ネットワークはそれぞれが可能な発話を表す複数のパスを定めている。パラメータ表示の言語は言語認識技術で十分に理解でき、当業者はパラメータ表示にするためのいくつかの方法に気付くであろう。パスは一連のモデル言語要素、例えばモデルフォニームから形成されている。“モデル”という用語は、要素がパラメータ表示のサンプルと直接に比較するのに適した形式で表されることを示唆している。各比較によって１または複数の基本測定基準(elementary metric)を生成し、これによりモデル要素とパラメータ表示のサンプルとの類似性を示す。基本測定基準はパスおよび部分的なパスに集積され、こうしていずれのパスまたは部分的なパスが受信した信号に最も似ているかを確立する。最初に、多くの可能性のあるパスがあり、認識は何れのパスが受信した信号に最もよく整合するかを選択することに等しい。自動言語認識の複雑なまたは詳細な実施形態には、整合プロセス用に非常に多くの代替例を準備する必要がある。すなわちそれらは多くのパスを使用しなければならない。パスは一連の部分的なパスと考えられる。多くの発話は同じところから始まり、同じ部分的パスから始まった多くのパスに分岐して、その後何度も分岐し、その結果部分的パスは多くの完全なパスで共通している。したがってパスをネットワークとして記憶し、このネットワークがその中に含まれる全てのパスおよび部分的なパスを定めるのがよい。認識プロセスは、ネットワークを通る最良のパスを見付けることに相当する。本発明はダイナミックネットワークを使用する。言い換えると、認識を始めるときに最初のネットワークのみが定められ、部分的なパスを時に応じてネットワークに、例えば種々の部分的なパスの最後に付加する。各延長部分(extension) は普通完全なユニット、例えば完全な単語またはシラブルの形をとる。これらのユニットは記号要素(symbolic element)（例えば、フォニーム）から形成されており、記号要素はパラメータ表示のサンプルに整合させるには適していない。認識するのに記号要素が使用できる前には、モデル要素、すなわちパラメータ表示のサンプルに整合できる形に変換されなければならない。簡単な自動言語認識では、記号要素とモデル要素との間に１対１の対応がある。これにより変換は比較的に簡単になるが、実際には要素、例えばフォニームの発音はその前後関係に依存するので、整合品質を下げる結果になる。記号フォニームを隣接する記号フォニームの前後関係で表すモデル要素を使用すると、認識精度は明らかに向上する。言い換えると、記号要素（フォニーム）は種々の異なる発音をもち、複数の異なるモデル要素（フォニーム）はこの種々の異なる発音を表すのに必要である。すなわち各発音には１つのモデル要素（フォニーム）が必要である。本発明は、前後関係が依存するモデル要素、とくに後続する記号要素に依存するモデル要素を使用する。好ましい実施形態では、本発明はトライフォン(triphone)を使用する。すなわち各モデルフォニームは１つのみの記号フォニームと関係するが、その前後の記号フォニームも考慮に入れられる。ここで本発明を添付の図面を引用して例示的に記載することにする。図１は、トライフォンを使用して記号フォニームをモデルフォニームに変換するメモリを示す。図２は、部分的なパスの端部を示す。図３は、ネットワークに付加される記号フォニームのツリーを示す。図４ａは、モデルフォニームに変換した図３のツリーを示し、図４ｂは図４ａの変形であり、該ツリーから位置マーカを取り除いたツリーを示す。図５は、この方法を実行する装置を示す。図６は、この方法のフローチャートである。図７は、遠隔通信システムの前後関係として本発明の装置を示す。図１はトライフォンメモリの内容を示す。このトライフォンメモリは図５の部品56としても記載されている。実際には、さらにより多くのエントリが含まれているが、そのいくつかのみを記載した。とくに、普通は無声音以外の特徴を表す項目、例えば“息継ぎ音(breatth sound)”および“チャンネルノイズ”を含む。図１に示した項目は全てトライフォンであり、すなわち各項目はフォニームそれ自身、その左隣り（先行フォニーム）および右隣り（後続フォニーム）を含む。図１は、“中央(ＣＥＮＴＥＲ)”を見出しにもつ列であり、変換される記号フォニームを識別する。“左(ＬＥＦＴ)”および“右(ＲＩＧＨＴ)”を見出しにもつ列は、先行のおよび後続のフォニームを識別する。“モデル”は小文字を括弧でくくって示される。その理由は、モデルを定義するのに必要なたくさんのデータを表示するのは実行不可能だからである(何れの場合でも、モデルは従来のものであり、当業者によく知られている)。モデルには番号が付され、これにより各記号フォニームに対して複数のモデルフォニームがあることが強調される。トライフォンを使用して、“中央”を見出しにもつ列で記号フォニームを識別し、左および右の見出しをもつ列で左および右側の記号フォニームを識別することが要求される。これは適切なトライフォンを識別して、その前後関係における中央の要素を変換する。単語“ＬＥＡＰＴ”および“ＭＥＴ”の変換について検討する。通常のスペリングは別のやり方で示しているが、“ＬＥＡＰＴ”内の“ＥＡ”は単一のフォニームであるだけでなく、“ｍｅｔ”内の“Ｅ”と同じフォニームである。しかしながら前後関係は異なり、図１のアドレス113および114はトライフォンに基づいて必要な変換を行なうことが明らかである。いずれの単語も、適切なトライフォンを定める右側のフォニームがないので、記号フォニーム“Ｔ”は変換できない。本発明はダイナミックネットワークを使用し、ネットワークの各部分的なパスは一度に１ユニット（例えば、単語）ずつ延長される。単語は記号フォニームであり、サンプルと比較する前に、モデルフォニームに変換できることが必要である。変換を行なうとき、各部分的なパスは(たくさんあり)、トライフォンの一部に( まだ)なっていない最後の記号フォニームをもっている。最後のフォニームの前後関係は定められていないので、変換できない。これは、ダイナミックネットワークで前後関係に関係する要素を使用する際の主要な問題である。前後関係がトライフォンであるとき、しばしば“クロスワードトライフォン”という用語がよく使用される。その理由は、トライフォンの左および右側の要素が異なる単語内に置かれているからである。したがって問題は、“クロスワードトライフオンの問題”として知られている。本発明は特許請求の範囲においてより完全に規定されており、これによると“ 位置マーカ(place marker)”を使用してこの問題を克服する。位置マーカはモデルフォニームに類似しており、パス内に配置できるが、比較に必要な情報は何も含まれていない。したがって位置マーカはダミーモデルと考えることができる。もっと重要なことは、位置マーカは記号フォニーム、例えば、ネットワーク内に配置されたときに変換されなかったもの（変換されなかった理由は、挿入時に前後関係が適切に判断されなかったからである）を識別することである。位置マーカは将来パスを延長する位置を識別し、さらに部分的なパスの最後を識別するのにも使用できる。位置マーカによって識別される記号要素は、パラメータで表示したサンプルと比較するのに適していないので、位置マーカがパスに組み込まれた後は更新する必要はなく、この更新は後でパスを１または複数回の延長するときに行われる( したがって、パスはネットワークの一部を構成している)。延長するときはほぼ必ずパスが位置マーカから分岐する。したがって普通位置マーカから分岐する複数の延長部分が存在することになる。複数の延長部分は位置マーカに対して複数の異なる前後関係を構成しており、したがってモデル要素は前後関係に関係しているので、複数の異なるモデル要素が必要になることが予想される。ここで、更新の２つの方法、すなわち置換方法と継続方法を記載する。置換方法置換方法では、パスから位置マーカを取り出して、前後関係が関係するモデル要素に置換して、位置マーカを記号要素として定められる。上述のように、この置換は複数の異なるモデル要素を要求して、複数の異なる前後関係に対処する。位置マーカが取り除かれるとき、その場所は失われ、その場所からさらに延長することはできない。したがって、同時に異なる延長部分の全てを作ることが適切である。継続方法継続方法(continuation method)では、ネットワーク内にパスが残っている限り、位置マーカは残る。位置マーカはパラメータ表示のサンプルと比較するのに必要な情報に関して“ブランク”であり、したがって位置マーカは比較の役に立たず、パスの選択に影響を与えない。更新された延長部分は位置マーカから続き、必要であれば、いくつかの異なる延長部分が同じ位置マーカから続いてもよい。各延長部分は都合よく位置マーカ内で識別された要素で始まり、ここではこの要素の前後関係が完全に特定されているので、適切な前後関係に関係するモデル形式に要素を変換することができる。パスを延長した後では位置マーカはパスの最後に存在しないことは明らかであろう。それにも関わらず位置マーカはパス内に残り、余分の分岐を作る別の延長部分に配置して使用することができる。所望であれば、位置マーカは付加的な情報、例えば、位置マーカで終了する単語またはユニットの識別を含むことができる。（延長方法を使用するとき、位置マーカはパス内に残り、その中に含まれる付加的な情報もパス内に残ることになる。）したがってこの情報は、必要なときにアクセスできる。本発明は次の方法を含む：（ａ）位置マーカを使用してパスおよびネットワークを延長すること、（ｂ）位置マーカを含むダイナミックネットワークを使用して言語を認識すること、（ｃ）（ｂ）で認識した言語によって装置を制御すること、および、（ｄ）方法（ａ）乃至（ｃ）が遠隔通信の使用を含むこと。本発明は、上述に示した方法（ａ）乃至（ｄ）を実行する装置も含む。ここで本発明にしたがって図１乃至５を参照して位置マーカの使用を開示する。図２は、ネットワークの１つの部分的なパスの延長部分に関し、（例示目的で）部分的なパスは“ｃａｔ”という単語で終わっていると仮定する。最終的にパスの全てを延長する。各延長は実質的に同じ方法で行われるので、プロセスは反復性である。全ての反復（繰返し）は実質的に同じであるので、１つのみ、すなわちこの部分的パスに延長するもののみを記載することにする。検討対象の延長は、複数の単語を図２に示した部分的なパスの最後に付加することによって達成される。“Ｃ”(10)はネットワークの残りを示す。“Ｃ”は先の反復の間に変換されたので、この（または他の将来の）反復の役には立たない。“ｃａｔ”の“Ａ”(図２の参照符号11)も変換され、図１のモデルフォニーム (ａ1)、すなわちアドレス111として示される。それにも関わらず、それに続くトライフォンを定めるのを助けることが必要とされる。ｃａｔ（図２の参照符号12）の“Ｔ”には後続するものがないので、トライフォンに基づいてモデルに変換できない。しかしながら、先行の反復では“Ｔ”をネットワーク内に配置する必要はないので、位置マーカが使用された。位置マーカ１２はさらに部分的なパスの最後をはっきりと示し、パラメータ表示のサンプルとは整合できない。装置（図５に示され、下記に一層詳細に記載されている）は延長装置５０を含み、延長装置(extender)50は辞書(lexicon)57およびトライフォンメモリ56を含む。トライフォンメモリ56は図１に一層詳しく記載されている。（辞書57およびトライフォンメモリ56の両方は種々の項目を表す信号のメモリ領域である。これらの信号は自動処理に適した形である。）辞書57は、装置によって承認されている全ての単語を含み；他のユニット、例えばシラブルまたは特定の応用に重要な項目を含むことができる。延長装置50は、延長するためにユニット、例えば単語を出力することによってネットワーク内に含まれる部分的なパスを延長することができる。この反復を説明するために、延長装置は次の４つの単語のリストを出力すると仮定することにする。ＳＡＴＳＬ（ＥＥ）ＰＳＳＬＥＰＴＬ（ＥＡ）ＰＴ説明には４つの単語で十分であるが、“実際の”リストははるかに長くてもよい。単語“ｓｌｅｅｐｓ”および“ｌｅａｐｔ”におぃて、“ｅｅ”および“ｅａ”が２つの文字を含んでいても、単一の記号後フォニームであることを括弧で示す。モデルフォニームに変換し、次にネットワークへ付加する準備をするために、これらの単語はトリーの形にされる。図２の位置マーカ12の場所にツリーを付加すると、位置マーカ12に含まれる記号フォニームをモデルフォニームに変換する準備が完了する。したがって位置マーカ12および先行するフォニーム11をツリーに組み込む。とくに、先行するフォニーム11および位置マーカ12はツリーの始めを構成する。ツリーは４つの単語、位置マーカ12、および先行するフォニーム11から形成されている。ツリーを図３に示した。図３に示した項目の全ては、“最後の文字”21，22，23，および24および最初の文字“Ａ”(11)を除いて、メモリ５６（同じく図１参照）に含まれる規定のトライフォンである。従って変換が定められる。最初の文字“Ａ”は、モデルフォニームに既に変換されているので、変換する必要がない。最初の文字“Ａ”は、図２の位置マーカ12から得て、項目12の変換を定めるのでツリー内に必要である。最後の文字21，22，23，および24は、それに後続する要素がまだ判断されていないので、トライフォンに変換できない。図３のトリーは完全に変換せずにネットワークに結合できないので、変換できないことは主要な障害となる。本発明によると、最後の文字21，22，23，および２４は位置マーカに変換する。ネットワークは位置マーカを収めることができる。図４は、変換の結果および先行するネットワークとの結合を示す。項目11は、先行の“最後に変換された”要素である。項目(12a)は変更されないままの古い( old)位置マーカである。ここでこの例は２つの異なる前後関係を示すので、位置マーカ12ａに含まれる記号フォニームは２つの異なるモデルフォニーム12bに変換される。したがって１つの分岐において、位置マーカ12ａの記号フォニームはフォニームメモリ56のアドレス128からモデルフォニーム12ｂになる。したがってモデルフォニーム（ｔ3）が与えられ、その前にはＡが、その後にはＳが配置されている。ネットワークの異なる分岐において、位置マーカ12ａからの記号フォニームは（ｔ1）になり、（ｔ1）はフオニームメモリ56のアドレス126からの項目12ｃである。ネットワークのこの分岐では、Ｔの前にはＡが、後にはＬが続いているのでこの形式が選択される。ここで古いネットワークを分岐して、４つの新しい位置マーカ21，22，23，および24を生成する。新しい位置マーカの中に含まれる記号フォニームが上述のようにモデルフォニームに置換されるとき、新しい位置マーカは将来の反復における延長部分の開始点として働くことになる。図4ａから分かるように、位置マーカは変換後のネットワークに残る。これらの位置マーカはサンプルとの比較に関する情報を含まないので、パスの選択に影響を与えない。それにも関わらず、位置マーカはネットワークが分岐するところに配置され、ネットワークを定めるのに使用できる。上述のように、位置マーカは変換用に記号フォニームを含み、特別な情報、例えばトライフォンを定める先行のフォニームを含むことができる。位置マーカ21乃至24によって示されているように、位置マーカはネットワークに挿入されるユニットに対応し、所望であれば、位置マーカはそれを導き出したユニットを識別することができる。別の実施形態（図４ｂ参照）では、位置マーカに含まれるフォニームをモデルに変換するとき、位置マーカが取り除かれる。明らかに、位置マーカが取り除かれると、位置マーカに関係する情報はないが、図４ｂから分かるように、ネットワークの構成は依然として定められている。別の変形例では、図示されていないが、ユニットの完全性が保たれている。各ユニットはモデルフォニームおよび位置マーカに別々に変換されるので、図３に示したトリーは生成されない。次に変換されたユニットは、単一のエンティティとして、ネットワークに付加される。ネットワークを延長するのに使用する装置を図５に示した。この装置は、既存のパスを延ばすための延長装置50を含む。延長装置50は辞書57を含み、ここで記号フォニームのユニット、例えば単語およびシラブルを表す信号を記憶する。延長装置50はトライフォンメモリ56も含み、ここで記号フォニームをモデルフォニームに変換するコンバータ55が使用する信号を記憶する。コンバータ55はネットワークメモリ51にも動作的に接続され、延長部分をその中に記憶したネットワークに付加することができる。延長装置はネットワークメモリ51から部分的なパスの端部、例えば位置マーカ内に含まれる記号フォニームを得て、延長部分のための入力を構成することができる。装置はさらに、サンプリンクおよびパラメータ表示のための言語信号を得る受信機54も含む。信号はディジタル波形の形態であることが好ましい；アナログ信号が供給されるときは、アナログ対ディジタルコンバータ（図示されていない）が含まれている。サンプラ53はパラメータ表示にし、普通１秒当り５０乃至１００サンプルを含む。（電話ディジタル言語は通常、１秒当り８０００サンプルを含む。）コンパレータ52は、最適なパスを識別するまで、メモリ51内に保持されているネットワークとサンプルを整合させる。最適なパスはインターフェイスへ出力される。インターフェイス58は、備え付けられた装置（図５に示されていない）を制御するか、または遠隔通信システムによって選択的にオーディオまたはビジュアル信号として識別確認を行なうようにされている。パスを延長するための反復を示す方法をフローチャートで図６に示す。フローチャートには３つの特徴、すなわち受信およびサンプリング、比較、およびネットワークの延長がある。受信はフローチャートのボックス60に、サンプリングはボックス61に示した。ネットワークの延長はボックス62乃至64に示し、これは次の主要な段階を含む。ボックス62 （メモリ51内の）既存のネットワークを走査して、位置マーカの１つを選択する。位置マーカは、次の延長部分を付加することになる点を判断する。通常、位置マーカは部分的なパスの最後も識別する。ボックス63 延長装置50は、記号フォニームを表す信号で、辞書57からユニットを選択する。ボックス64 ボックス63で選択したユニットは、記号フォニームのトリーの形で整理される。ボックス62で選択した位置マーカはトリーの始めとして含まれる。ボックス65 ボックス64で整理されたトリーはモデルフォニームに変換され、最後のフォニームは位置マーカに変換され、この位置マーカはボックス62の将来の延長の際に選択されることになる。ボックス62で選択された位置マーカの記号フォニームは、さらにモデルフォニームに変換される。これらの変換は、フォニームメモリ56 を使用して実行される(その内容は図１に示されている)。変換後に、メモリ51内に含まれるネットワークにトリーを付加する。モデルフォニームへの変換はボックス65で行ない、一方でフォニームおよびその前後関係の識別は先行のボックス63および64で達成されることを認識することが大切である。ボックス63および64を実行するとき、最後のフォニームは前後関係がないので変換できない。位置マーカはモデルフォニームでなくても、ネットワークと両立可能であり、モデル要素による位置マーカは後の反復中にモデル要素に更新されるので、位置マーカを使用してボックス65で特定した段階を行なうことができる。ボックス66 ボックス61で生成されたサンプルは、ネットワークメモリ51に記憶されたネットワークと比較され、最良のパスを選択する。ボックス67 最良のパスはボックス67で出力される。図６に示した反復は、処理を進め続ける信号を受信する限り、繰り返される。最後を検出するのを助けるために、チャンネルノイズおよび息継ぎ音を表すモデルフォニームを含むことが適切である。最初に、例えば言語を受取る前に、標準の、所定の構成を使用してネットワークを初期化する。“黙音(silent)”要素はとくに初期化に適している。図７では、例えばディレクトリ照会または他の類似のサービス、例えば鉄道の時刻表、またはエアラインサービスのために、直接にまたは遠隔通信システムを介して自動音声制御として本発明が使用されている。本発明の言語認識器70はインターフェイス71に接続され、インターフェイス71 は言語として受信され、認識器70によって識別される命令によってインデックス72を制御するようにされている。認識器70およびインターフェイス71は遠隔通信システム73に接続され、遠隔通信システム73は遠隔の電話装置74を含み、ユーザ75はこれを使用できる。インデックス72に質問するために、ユーザ75は（通常の遠隔通信技術によって）認識器70にアクセスする。発話での要求はシステム 73によって認識器へ送られる。次に認識器７０によって識別され、インターフェイス71を介してインデックス72へ送られる。要求の結果はインターフェイス71およびシステム73を介してユーザ７5へ戻される。いくつかの応用では、例えばフィードバックループによって命令が正しく理解されたことを検査できるようにすることが望ましい。都合よく、これは認識器70 に合成言語機能を組込むことによって達成される。これにより、認識器は必要であれば遠隔通信システムを介してユーザへ翻訳を識別することができる。翻訳はスクリーン上に表示することもできる。この検査は、とくに生成されたテキストがスクリーン上に表示されるときに、自動ディクテーションのような応用においては当然に備えられるものである。これらの応用のほとんどにおいて、言語が全く認識されない可能性がある。これは、この環境がユーザに知らされるときは許容可能な結果として認識される。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＺ，ＵＧ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＥ，ＧＨ，ＨＵ，ＩＬ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＵＡ，ＵＧ，ＵＳ，ＵＺ，ＶＮ，ＹＵ

Claims

【特許請求の範囲】１．言語信号を認識する方法であり：（ａ）前記信号を受信し(60)、それを一連のサンプルに分割する（61）ことと；（ｂ）それぞれがサンプルとの比較に適した形態の一連のモデル言語要素を含む複数のパスを準備する(６3）ことと；（ｃ）サンプルをパスと比較して(66)、個々のパスと受信した信号との間の整合の緊密度にアクセスすることと；（ｄ）受信した信号と最良の整合を構成するパスを選択する（67）ことと；モデル要素の少なくともいくつかは、モデルが次の要素を考慮に入れることに関係する前後関係であり；前記比較に適していない形態の言語要素を定める位置マーカ（12）をパスに挿入し、その後前記位置マーカ内に定められた言語要素をモデル要素（12ｂ，12ｃ）に変換することを特徴とする言語信号を認識する方法。２．それぞれ前後関係が関係するモデル要素は、中央の要素、左側の要素、右側の要素から構成されているトライフォンに基づいており；モデルは右側の要素と左側の要素との前後関係で中央の要素に関係している請求項１記載の方法。３．パス内に既に存在している位置マーカ（12）によって識別される場所に延長部分を付加し、延長部分の少なくとも１つが一連の１または複数のモデル要素および新しい位置マーカ（21，22，23，24）を含み、一連の要素（12ｂ，12ｃ）の一方がパス内の位置マーカによって定められるモデル要素（12ａ）の変換であり、新しい位置マーカ（21，22，23，24）が将来の延長部分の場所を識別する請求項１または２記載の方法。４．パスがネットワークの形態に構成されている請求項１乃至３の何れか１項記載の方法。５．各サンプルが、サンプルの言語特徴を表すパラメータの形態である請求項１乃至４の何れか１項記載の方法。６．入力言語が遠隔通信システム（74）から受信される請求項１乃至５の何れか１項記載の方法。７．応答を生成して、認識結果を識別することを含む請求項１乃至６の何れか１項記載の方法。８．前記識別が、入力を識別しなかった指標を含む請求項７記載の方法。９．（ａ）コンピュータに記憶したインデックスの認識結果の送信（72）と；（ｂ）インデックス（72）からの情報の検索と；（ｃ）検索した情報の出力とを含む請求項１乃至７の何れか１項記載の方法。１０．応答または検索した情報、あるいはその両方を遠隔通信システム（74）を介して送ることを含む請求項７乃至９の何れか１項記載の方法。１１．言語信号との比較に適したモデル要素を含むパスを延長する方法であり、任意の延長中にパス内に位置マーカを挿入することと、後の延長中に位置マーカ内に定められた記号要素をモデル要素と置換することとを含む方法。１２．各延長部分が、位置マーカ（12ａ）によって示される場所に付加される請求項11記載の方法。１３．（ａ）変換のために言語信号を得る受信機（54）と；（ｂ）獲得した信号を、サンプルの言語特徴に関係するパラメータの形態で一連のサンプルに変換する受信機（54）に接続されたパラメータライザ（53）と：（ｃ）パラメータ表示のサンプルと比較するのに適した形態のモデル言語要素を含む前記パスを含むパスメモリ（51）と；（ｄ）パスメモリに含まれるパスに延長部分を生成するが、前記延長部分がパラメータで表示されたサンプルと比較するのに適していない記号要素の形態である延長装置（５０）と：（ｅ）前記延長装置（50）によって生成される延長部分を前後関係が関係するモデル要素に変換するコンバータ（55）であり、さらにパスメモリ（51）に動作的にリンクされて、パスメモリ（51）内に含まれるネットワークに前記変換されたものを付加するコンバータ（５５）と；（ｆ）パラメータライザ（53）およびパスメモリ（51）に動作的にリンクされて、サンプルをパスと比較して、最良の整合を選択するコンパレータ（52）とを含み：コンバータ（55）が適切に定められた前後関係をもたない要素を位置マーカに変換し、前記位置マーカをパスメモリ（51）内に含まれるネットワークに付加するようにされていることと、前記コンバータ（55）が前記パスメモリ（51）内の位置マーカ内に含まれる記号要素を配置し、記号要素を前後関係が関係付けられているモデル要素に変換し、位置マーカによって示される場所で前記前後関係が関係付けられるモデル要素をパスメモリ（51）に付加するようにされていることとを特徴とする言語信号を認識するための装置。１４．コンバータが複数の記憶場所をもつ辞書メモリ（57）を含み、各記憶場所が装置によって認識可能な言語ユニットを定める信号を含む請求項１３記載の装置。１５．コンバータがトライフォンメモリ(56)を含み、トライフォンメモリ(56)がトライフォンに基づくアクセス部とトライフォンの中央要素に相当するモデル要素を定める信号を含む出力部とをもつ請求項1３または14記載の装置。１６．遠隔通信システム(73)に接続されている請求項13乃至15の何れか１項記載の装置。