JPH11282487A - マッチング方法及び装置及び記憶媒体 - Google Patents

マッチング方法及び装置及び記憶媒体

Info

Publication number
JPH11282487A
JPH11282487A JP11033279A JP3327999A JPH11282487A JP H11282487 A JPH11282487 A JP H11282487A JP 11033279 A JP11033279 A JP 11033279A JP 3327999 A JP3327999 A JP 3327999A JP H11282487 A JPH11282487 A JP H11282487A
Authority
JP
Japan
Prior art keywords
pattern
signal
current
path
signal pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11033279A
Other languages
English (en)
Inventor
Robert A Keiller
アレキサンダー キーラー ロバート
Eli Tzirkel-Hancock
ツィケル−ハンコック エリ
Julian Richard Seward
リチャード シーワッド ジュリアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH11282487A publication Critical patent/JPH11282487A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/085Methods for reducing search complexity, pruning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 【課題】 パターンシーケンスのマッチングを効率的に
実行する。 【解決手段】 第1信号を表わす第1パターン列と第2
の信号を表わす第2パターン列とを動的計画法によるマ
ッチング技術を用いてマッチングする。現第1信号パタ
ーンに関する動的計画法パスの終端となっている第2信
号パターンがアクティブリスト201に格納される。ア
クティブリスト上の第2信号パターンを処理することに
より動的計画法パスは成長し、後続の入力パターンに関
して新アクティブリスト205が生成される。各パスを
成長させるために、システムは、比較が行われるべきオ
ーバーラップ領域にいくつの第2信号パターンが存在す
るかを判断し、判断されたオーバーラップの量に基づい
て各パスを処理する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、パターンマッチン
グ方法および装置に関する。本発明は特に、これに限ら
れるものではないが、動的計画法によるマッチング技術
を実施するのに適する。典型的な実施形態においては、
動的計画パターンマッチング技術が音声認識システムに
用いられる。
【0002】
【従来の技術】音声認識は、未知の発声を特定する処理
である。現在、いくつかの異なるタイプの有用な音声認
識システムがあり、いくつかの方法でカテゴリに分類さ
れている。たとえば、いくつかのシステムは話者依存型
であり、他は話者非依存である。いくつかのシステム
は、大量の語彙(>10000語)を用いて稼動し、他
のものは限定された語彙量(<1000語)で稼動す
る。いくつかのシステムは独立した語を認識することの
みが可能であり、他のシステムは接続された一連の語を
含むフレーズを認識できる。
【0003】語彙の限定されたシステムでは、音声認識
は未知の発声の特徴と、データベースに格納された既知
の語の特徴を比較することにより実行される。既知の語
の特徴は学習(トレーニング)セッションの間に決定さ
れる。この学習セッションでは、1つあるいは複数の既
知の語が、それらに対する基準パターンを生成するのに
用いられる。基準パターンは、モデル音声の、または隠
れマルコフモデルのような統計的モデルのアコースティ
ック(音響)テンプレートである。
【0004】未知の発声を認識するために、音声認識装
置はその発声からパターン(あるいは特徴)を抽出し、
データベースに格納された各基準パターンと比較する。
各基準パターンあるいは基準パターンの各コンビネーシ
ョンが入力発声から抽出されたパターンといかにマッチ
しているかの測定を提供するのに、スコア技術(scorin
g technique)が用いられる。未知の発声はこうして、
この未知の発声に最も近い基準パターンに関連づけられ
ている語として認識される。
【0005】典型的には、スコアリングは動的計画法を
用いて達成される。動的計画法は、パターンのペア間で
最適なマッチングが得られるまで一方のパターンの時間
軸を局所的に縮めたり伸ばしたりすることにより、各基
準パターンと未知の発声から抽出されたパターンとの間
の最適な時系列を提供する。最良のスコアを有する基準
パターン列は、入力された発声に最もよく対応する1つ
もしくは複数の語を特定する。
【0006】動的計画法によるマッチング技術は、入っ
てくる発声と各基準モデルとの間の多くの可能なマッチ
ングの判断を含むため、比較的計算量が多く、またメモ
リ消費的である。
【0007】US4592086(日本電気(株))
は、動的計画法によるマッチング技術を用いた、接続さ
れた桁の音声認識システムを開示する。US45920
86は、基準モデルの動的計画法パスの到達端であるパ
ターンが逆の列順序で処理された場合、マッチング処理
に必要なメモリ量を減少させ得ることを開示する。
【0008】また、EP−A−0789349は第1の
信号を表す第1のパターンシーケンスと第2の信号を表
す第2のパターンシーケンスとのマッチングを行うシス
テムを開示する。ここで、システムは各第1の信号パタ
ーンを順番に処理する。処理されている現在の第1の信
号パターンのパスの到達端である第2の信号バターンを
アクティブパターンとして決定し、ここで各パスは並べ
られた第2信号パターンシーケンスと現在の第1信号パ
ターンまでの並べられた第1信号パターンシーケンスと
の間の可能なマッチングを表し、各アクティブパターン
について、現在の第1信号パターンに関するアクティブ
パターンを到達端とするパスのマッチングの近さを表す
累積値を格納し、逆のシーケンス順序で各アクティブパ
ターンを処理することにより上記累積値を更新し、パス
の成長に関して設けられた制限(constraints)に基づ
いてパスを成長させ、処理中の現在のアクティブパター
ンを到達端とするパスを成長させる間に前回のアクティ
ブパターンの処理の間に成長させたパスとオーバーラッ
プがあり、そのオーバーラップ領域におけるパスの関連
する累積値の比較がなされ、最良のスコアを有するパス
が成長され、一方、他のパスがターミネイトされる。
【0009】
【発明が解決しようとする課題】しかしながら、EP−
A−0789349に記載されたシステムでは、各第2
信号パターンがオーバーラップ領域内にあるかどうかを
みるために、処理中の現在のアクティブパターンに関連
するパスが成長する先の各第2信号パターンについてチ
ェックを実行する必要があるため、比較的処理が遅くな
る。
【0010】本発明は、これらの問題に鑑みてなされた
ものであり、パターンシーケンスのマッチングをするた
めのより効率的なシステムを提供することを目的とす
る。
【0011】
【課題を解決するための手段】一つの態様によれば本発
明は以下のマッチング方法を提供する。すなわち、第1
信号を表わす第1パターン列と第2の信号を表わす第2
パターン列とを、各第1信号パターンを順次に処理して
マッチングする方法であって、処理中の現第1信号パタ
ーンについて各パスの終端にある第2信号パターンをア
クティブパターンとして決定し、ここで、各パスは第2
信号パターンの列と第1信号パターン列との間の可能な
マッチングを表しており、各アクティブパターンについ
て、前記現第1信号パターンに関する当該アクティブパ
ターンまで成長しているパスについて、マッチングの近
さを表わす累積値を格納し、各アクティブパターンを反
対の順序で、(i)次に処理されるべき第1信号に関し
て、現アクティブパターンで終っているパスが、どの第
2信号パターンへ成長するかを判断し、(ii)前のアク
ティブパターンの処理の間において、ステップ(i)で
いくつの第2信号パターンがそのように判断されたかを
特定し、(iii)前記ステップ(ii)において特定され
た前記第2信号パターンの数に依存して、現アクティブ
パターンに関連するパスを成長させることにより前記累
積値を更新し、パスの成長に関して設けられた制約に基
づいて前記パスを成長させるマッチング方法が提供され
る。
【0012】上記ステップ(ii)を実行するにおいて、
現時点から後続の時点へ成長するパスのオーバーラップ
がどれくらいあるかを判断し、その判断に従って現パス
を処理する。これは、現パスが成長し得る先のあらゆる
第2信号パターンについてチェックを実行することの必
要性を、各第2信号パターンがオーバーラップ領域内に
存在するか否かを判断するという処理に緩和するもので
ある。結果として、マッチングに要求される処理の量が
大きく削減される。
【0013】また、好ましくは、処理中の現第1信号パ
ターンに対するアクティブパターンは、現アクティブリ
ストに登録され、ステップ(i)で特定された第2信号
パターンが、それらがまだ登録されていなければ、新ア
クティブリストへ登録される。この方法において、直前
のアクティブパターンの処理後に新アクティブリストに
登録された第2信号パターンのシーケンスで最初の第2
信号パターンを特定するために識別子が用いられ得る。
それゆえ、ステップ(ii)は、処理中の現アクティブパ
ターンと識別子によって特定される第2信号パターンと
の間の位置関係を判断することにより、新アクティブリ
ストをサーチすることなく、ステップ(i)で決定され
た第2信号パターンのいくつが前もってそのように決定
されたかを特定できる。
【0014】また、第2の態様によれば、本発明は第1
信号を表わすパターンの第1シーケンスと、第2信号を
表わすパターンの第2シーケンスとのマッチングを行う
方法を提供する。ここで、各パターンは、複数のパラメ
ータ値によって表わされ、第2信号パターンのシーケン
スと第1信号パターンのシーケンスとの間の可能なマッ
チングを表すパスに関する累積値が、現第1信号パター
ンと、処理中の現パスの終わりにある第2信号パターン
との間の距離を表す計測距離値を加えることにより更新
され、現第1信号パターンのパラメータ値と現パスの終
りにある第2信号パターンのパラメータ値が夫々ルック
アップテーブルをアドレスし、そのルックアップテーブ
ルのアドレスされた位置に格納された値がその2つのパ
ラメータ値の差に対応する。
【0015】また、好ましくは、現第1信号パターンを
処理する前に、処理中の現第1信号パターンのパラメー
タ値を用いてルックアップ値のサブテーブルを特定し、
パスの累積値に加算されるべき距離計測値がそのパスの
終わりにある第2信号パターンのパラメータ値でルック
アップ値のサブテーブルをアドレスすることにより決定
される。この方法で、ルックアップ値のサブテーブルを
生成することにより、距離計測値を決定するのに必要な
処理時間が減少される。その理由は、ルックアップテー
ブルが処理中の現パスの終わりにある第2信号パターン
のパラメータ値から直接的にアドレスされるからであ
る。
【0016】
【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な実施形態を説明する。
【0017】本発明の実施形態は、コンピュータハード
ウエアにおいて実現され得るが、以下に記載される実施
形態では、パーソナルコンピュータ、ワークステーショ
ン、複写機、ファクシミリ装置等のような処理ハードウ
エアに関連して稼動されるソフトウエアにおいて実現さ
れる場合を説明する。
【0018】図1は、本発明の実施形態を実現させるべ
くプログラムされたパーソナルコンピュータ(PC)1
を示す。キーボード3、ポインティングデバイス5、マ
イク7及び電話回線9がインターフェース11を介して
接続されている。キーボード3とポインティングデバイ
ス5はユーザによるシステムのコントロールを可能とす
るものである。マイク7はユーザの音響的な音声信号を
装置上の電気信号に変換し、これを処理のためにPC1
に提供する。この実施形態において、処理すべき入力音
声の始点と終点は入力発声の間キーボード3のスペース
キーを押下しておくことにより、ユーザによって特定さ
れる。このような方法を用いた場合、システムは処理す
べく特定された入力発声を処理するだけである。なお、
内蔵モデムと音声受信回路(不図示)が、遠隔のコンピ
ュータもしくは遠隔のユーザと通信できるように電話回
線9に接続されてもよい。
【0019】なお、本発明に従ってPC1を稼動させる
ためのプログラムの命令(プログラムコード)は、磁気
ディスク13のような格納デバイスからPC1による実
行のためにPC1に供給されてもよいし、電話回線19
を介して遠隔コンピュータと通信する内部モデムを介し
て供給されてもよい。
【0020】以下、図2を参照して、本実施形態による
限定語彙連続音声認識システムの動作を説明する。例え
ば、マイク7から入力された音声を表す電気信号は、プ
リプロセッサ15に入力される。プリプロセッサ15は
入力音声信号をパラメータフレームのシーケンスに変換
する。ここで、各パラメータフレームは、入力音声信号
に対応する時間フレームを表す。各パラメータフレーム
におけるパラメータは典型的には、ケプストラル(ceps
tral)係数と、パワー/エネルギー係数とを含み、これ
らは入力音声信号の特徴を表す重要な情報を提供する。
パラメータフレームのシーケンスは認識ブロック17に
供給される。認識ブロック17は、パラメータフレーム
の入力シーケンスを基準モデル、すなわち単語モデル1
9と比較することにより音声を認識する。ここで、各モ
デルは、認識されるべき入力音声のパラメータと同じ種
類のパラメータによって表されたパラメータフレームシ
ーケンスを備える。
【0021】また、言語モデル21とノイズモデル23
も、認識処理の補助のために認識ブロック17へ供給さ
れる。ノイズモデル23は無音声ノイズもしくはバック
グランドノイズを表わし、本実施形態においては、それ
らは認識されるべき入力音声信号と同じタイプの単一の
パラメータフレームを備える。また、言語モデル21
は、認識ブロック17から出力された、認識結果として
許可される単語シーケンスを、そのシステムにとって既
知の単語シーケンスに適合するように制限するのに用い
られる。認識ブロック17から出力される単語シーケン
スは、例えば文書処理アプリケーションにおける使用の
ために提供されてもよいし、あるいは、PC1の動作を
開始したり、止めたり変更したりするためのオペレータ
コマンドとしても用いられ得るものである。
【0022】プリプロセッサ15、バッファ16、単語
モデル19や言語モデル21やノイズモデル23を生成
するための当該システムの学習、新しいフレーズが加え
られた際の言語モデルの更新、そして単語モデルの適用
に関するより詳細な説明は、EP−A−0789349
に示されており、その内容は本願の参照として組み込ま
れる。以下、基準モデルと認識ブロック17についてよ
り詳細に説明する。
【0023】[基準モデル]上述したように、プリプロ
セッサ15からの出力信号によって表される単語が何で
あるかを決定するために、これらの出力信号は基準モデ
ルと比較される。この基準モデルは、当該システムにと
って既知の単語及び当該システムをとりまく音響環境を
モデル化して格納したものである。なお、特定の単語に
関連する各モデルは、上述したプリプロセッサ15から
出力されるパラメータフレームと同じタイプのパラメー
タフレームシーケンスを備える。
【0024】本実施形態において、言語モデル21はバ
イグラムモデル(Bigram model)に類似するものであ
り、メッシュ状にノードを相互接続するものである。こ
こで、それら相互接続は、当該システムに既知の単語を
表わす。しかしながら、それら相互接続は、例えば、正
しい英語の使用に関するようないかなる文法規則をも含
むものではなく、そのシステムにとって既知のフレーズ
に基づいてどの単語が他のどの単語に続くことができる
かを規制するのみである。図3は、当該システムによっ
て以下のフレーズが学習されたときに派生する言語モデ
ル21を表わす図である。
【0025】 get an image −フレーズ1 get the erth −フレーズ2 get the fjord −フレーズ3 get the map −フレーズ4 get the coin −フレーズ5 save an image −フレーズ6 load an image −フレーズ7 make it smaller −フレーズ8 make it larger −フレーズ9 make it brighter −フレーズ10 make it more red −フレーズ11 make it more yellow −フレーズ12 make it more green −フレーズ13 make it more cyan −フレーズ14 make it more blue −フレーズ15 make it more magenta −フレーズ16 quit −フレーズ17。
【0026】この場合、図3に示されるように、スター
トノードN0、エンドノードNn、及び8個の中間ノード
1〜N8がある。認識されるべき入力フレーズのため
に、システムはスタートノードN0からエンドノードNn
までのパスを見出さねばならない。しかしながら、シス
テムは学習した中において、合理的な範囲でフレキシブ
ルである。例えば、ユーザが"make it smaller"のかわ
りに"make smaller"というフレーズを入力すると、シス
テムはこの入力フレーズを"make it smaller"と解釈す
る。しかし、システムはたとえフレーズ内の個々の単語
が既知であっても、そのフレーズが当該システムに未知
のフレーズであった場合には、システムはそのフレーズ
を認識しない。例えば、上述の言語モデルにおいて、ユ
ーザが"save the image"と言った場合、システムにとっ
て"save"、"the"、"image"の各々は既知であるが、シス
テムはこのフレーズを認識しない。
【0027】[動的計画法(DP)]効果的な手法で2
つのパラメータフレーム列を整合させるために、この種
の整合処理は、例えば単語が孤立して話された場合と、
連続的に話されたフレーズ内に単語が埋め込まれている
場合とのように、単語が話された際の異なる速さを補間
できなければならない。動的計画法(DP)による整合
処理は、全てのポイントで最良のマッチングを達成する
ために、最適で非線型のタイム−スケール歪を適用し
て、一つの単語を他の単語上にマッチングさせることの
できる方法の一つである。
【0028】DPマッチング処理の概要について、図4
〜図6を参照して以下に説明する。図4は、横座標軸に
入力された単語を表わすパラメータフレーム列を取り、
縦座標軸に単語モデルを表わすパラメータフレーム列を
とった様子を表わす。単語モデルと入力単語との間の差
の合計を見出すために、最小の累積距離を与える、図4
における左下と右上の間のあらゆるパスに沿ったフレー
ムの各ペア間の全距離の合計を計算する必要がある。こ
のような決定方法によれば、確実に、類似する単語の対
応フレームを正しく整合させることができるであろう。
このような全距離計算方法の一つは、全ての可能なパス
を考慮し、各パスに沿った各ポイントに対してd(k,
j)(フレームkとフレームjの間の距離)を加算する
ものである。そして、それら2つの単語の間で測定され
た距離として、獲得された累積距離の中から最小の値が
採用される。この方法は正しい答えを与えるが,有効な
パスの数が非常に多くなり、実用的な音声認識システム
にとっては実現不可能な計算量となってしまう。
【0029】動的計画法は,全ての可能なパスに沿った
累積距離を計算することなく最適なパスに沿った累積距
離を見つけるための数学的なテクニックである。累積距
離が決定されるパスの数は、DP処理にある制約を設け
ることによって著しく減少させることができる。このよ
うな制約の一つとして、最適なパスは常に非負の傾斜を
有して前進するというものが挙げられる。この制約がな
いと、ある単語において、他のものと時間的に逆転した
ものとなってしまうからである。また、DP処理に設け
られ得る他の制約としては,入力された単語の基準単語
に対応する時間的伸縮の最大量を制限することである。
この制約は,マッチング処理においてスキップもしくは
繰り返すことのできるフレームの数を制限することによ
って実現され得る。例えば、図5において、フレームf
kがフレームfj mとマッチングする場合、フレームfk+1
はフレームfj m、fj+1 m、fj+2 mあるいはfj+3 mとマッ
チングし得るようにフレームシーケンスが制約される。
従って,入力単語のパラメータフレームfkと単語モデ
ルのパラメータフレームfj mが最適なパス上にある場
合、上述の制約によれば、この最適なパス上のこのポイ
ント(k,j)に続くポイントは図6に示すように(k-1,
j)、(k-1,j-1)、(k-1,j-2)あるいは(k-1,j-3)の
どれかでなければならない。
【0030】また、図4では、入力された単語と単語モ
デルの間の可能なマッチングが表わされており、フレー
ムfk-1まで成長した“有効パス”が表わされている。
フレームfkが認識ユニット17に供給されたとき、現
フレームfkと各有効パスの終端に位置する単語モデル
のフレームとの間にはローカル距離が存在し、そのロー
カル距離は対応する有効パスの累積距離に加えられる。
複数のパスが同一のポイントで出会った場合は、最小の
累積距離を有する有効パスが継続され、他のものは破棄
される。例えば、図4において、パスA、B、Cがポイ
ント(k,j)で出会った場合、最も小さい累積距離を有
するパス(A、B或いはC)が継続され、他の2つは破
棄されることになる。
【0031】従って、D(k,j)を、その単語の最初か
らポイント(k,j)までの有効パスに沿った累積距離を
表わすとすると、D(k,j)は、
【0032】
【数10】 と表わされる。
【0033】そして、上述の制約を加味することによ
り、D(k,j)は、
【0034】
【数11】 と表わされる。
【0035】上述の制約で、全ての可能なパスはd(0,
0)、d(1,0)、d(2,0)もしくはd(3,0)から始ま
らなければならないので、D(0,0)はこれらのポイン
トのいずれかに等しくなければならない。従って、これ
らの開始点の一つから開始し、D(k,j)の値は再帰的
な処理ルーチンを経て決定され得る。処理がマッチング
されるべき単語の終わりに到達したとき、DP処理によ
って計算された最小の累積距離が当該2つの単語を最良
の形態でマッチングした場合に対応するスコアを表わし
ている。認識されるべき入力発声が単語のシーケンスを
有している場合、採用された方向を表わすのにバックポ
インタが用いられなければならない。DP処理が最適な
パスの終了を特定した後に、そのバックポインタを通し
て逆追跡することにより、入力発声を認識することを可
能とするためである。
【0036】上述したDP処理は、全ての可能なパスを
余すところなくサーチする場合に比べて著しく計算量を
低減するものであるが、依然としてその計算量はかなり
多いものとなり得る。特に、入ってくる単語の各々は、
マッチングのために多くの単語モデルと比較されなけれ
ばならない。それゆえ、認識結果の精度に重要な影響を
及ぼさないような計算についてその計算量を削ることは
望ましいことである。成長するパスは木の枝に似ている
ので、これは、しばしば刈り込み(pruning)と称され
る。この方法でパスを刈り込むことにより、最良なパス
の両側を含む狭いバンド内において、可能なパスが考慮
されることになる。そのような刈り込みが用いられる場
合には、動的計画法の処理が必ず最適なパスを見つける
ということをもはや保証することはできないが、しかし
ながら、例えば、5〜10のファクターによって計算の
平均量を減少させる閾値では、単語が非常によく似てい
る正しいパスはほとんど常に得られることは、当業者に
は十分に理解できることであろう。
【0037】この実施形態においては、認識されるべき
発声に対するパラメータフレーム列を単語モデル19及
びノイズモデル23とマッチングするために、図2に示
される認識ブロック17は上述したものに類似の動的計
画法処理を用いる。
【0038】[認識サーチ]本実施形態による音声認識
システムの特徴の一つは、動的計画法処理が実現される
方法にある。特に、本実施形態は、上述の式(2)にお
いて実行される最小値の計算、すなわち、
【0039】
【数12】 が処理中の現在フレームfkに依存しないということを
利用する。従って、式(2)のこの部分は前フレームf
k-1が処理されているときに計算しておくことができ
る。
【0040】次に、動的計画法処理が利用される方法に
ついて図7〜17を参照して以下に説明する。なお、単
語モデルのフレームと入力された認識すべき発声のフレ
ームとの混同を避けるために、単語モデルのフレームを
以降ではステートと称することにする。
【0041】図7は、入力された発声を認識するときの
認識ブロック17において実行される処理を示すフロー
チャートである。システムは、プリプロセッサ15によ
って生成される順番で入力発声のパラメータフレームを
順次に処理する。この目的のために、フレームカウンタ
変数kが用いられる。変数kは、ステップS41におい
てゼロに初期化され、各フレームが処理された後にステ
ップS61において順次インクリメントされる。処理中
の各フレームは、ステップS47において、各単語モデ
ル内の残存する有効パスの累積距離を更新するために用
いられる。ここで、各単語モデルを処理する目的のため
に、単語カウンタwが用いられる。この単語カウンタw
は、ステップS43においてゼロに初期化され、ステッ
プS47の処理の後にステップS49においてインクリ
メントされる。ステップS45において、システムは、
現フレームに関して全ての単語モデルが処理されたかど
うかをチェック、すなわち、単語カウンタwがシステム
に既知の単語の数nより小さいかどうかをチェックす
る。
【0042】現フレームfkに関して各単語モデルに対
する処理が終わると、処理はステップS51へ進む。ス
テップS51においては、図3に示される言語モデル2
1のノードが現フレームを用いて処理される。ステップ
S51で実行される処理は、現在のパラメータフレーム
が入力音声の開始もしくは終端の無音声部分、もしくは
入力音声における単語の許容されたシーケンス間に存在
する無音声部分に対応する状況を考慮する。この処理に
おいても、有効パスのみが単語の許容されたシーケンス
を通して成長することを確実にする。
【0043】ステップS51においてノードが処理され
た後、各単語モデルの開始、すなわち、“入り口ステー
ト(エントリステート)”の一つで終わる有効パスのた
めの累積距離がステップS57において更新される。こ
の処理は、現在のパラメータfkが別の単語モデルの終
端にマッチする場合に、次のパラメータフレームfk+1
が別の単語モデルの開始とマッチするという状況に対処
するものである。これを達成するために、単語カウンタ
wはステップS53において再度ゼロに初期化され、ス
テップS55においてシステムは全ての単語モデルが処
理されたかどうかをチェックする。そして、システム
は、ステップS57において、現在の単語モデルの入り
口ステートに対する累積距離を更新する。そして、単語
カウンタwがステップS59においてインクリメントさ
れる。その後、処理はステップS55へ戻る。
【0044】現在のパラメータフレームfkに対して全
ての単語モデルがステップS57で処理された後、パラ
メータフレームカウンタ変数kがステップS61にてイ
ンクリメントされる。次に、ステップS63において、
システムは処理されるべき入力発声のパラメータフレー
ムがあるかどうかを判断する。これは、ステップS63
においてkをシステムリミット(LIMIT)及び発声終端
識別子(EOS)と比較することによりなされる。システ
ムリミットは、プリプロセッサ15によって行われる処
理に先立ってスピーチサンプルを格納するのに用いられ
るバッファ(不図示)のサイズによって定義される。
【0045】入力発声の全てのパラメータフレームが処
理された後、DP処理は完了し、バックトラックアルゴ
リズムが最適のパスを決定し、認識結果を決定するため
に用いられる。一方、ステップS63において処理され
るべきパラメータフレームがまだ存在するとシステムが
判断した場合、システムはステップS65において刈り
込みの閾値を調整する。すなわち、次の入力フレームが
処理される間のステップS47、S51及びS57にお
いて処理される有効パスの数を制限するための刈り込み
閾値ThがステップS65で調節される。そして、処理
はステップS43に戻る。
【0046】以下、図7のステップS47において実行
される処理について、単語モデルの特定の例を挙げなが
ら、図8〜図13を参照してより詳細に説明する。図8
は、トレーニング中に派生したステートS0からS8のシ
ーケンス、出口ステートSD、そして単語モデル201
の終端にある番人(sentinel)ステートSSENを備える
単語モデル201の例を示す。なお、出口ステートと番
人ステートの目的は後述する。
【0047】単語モデル201の各ステートSは、その
ステートまで成長した有効パスの累積距離を格納する累
積距離格納部D[S]を有する。この実施形態において、
単語モデル201は、これに関連する、現在フレームf
kのための現アクティブリスト203も有する。このリ
ストには、現フレームfkにおいて有効パスの終端とな
っている単語モデル201内のステートが、降順で登録
されている。従って、現アクティブリスト203に登録
されている各ステートはそのステートまで延びている有
効パスの累積距離を格納することになる。ここで説明す
る特定の例においては、現フレームfkのための現アク
ティブリスト203には、S7、S5、S4、S3、S2
1そしてSSENが登録されている。現アクティブリスト
203に登録されている各ステートはアクティブステー
トと称される。また、本実施形態において、単語モデル
201はこれに関連する新アクティブリスト205を有
する。この新アクティブリストは、ステップS47にお
いて実行される処理の間に完成され、次のフレームf
k+1において有効パスの終端が存在することになるであ
ろう単語モデル201内のステートを登録する。
【0048】次に、上述の現アクティブリスト203と
新アクティブリスト205の意味について、図9を参照
して説明する。ここで、図9は現フレームfkまでの入
力単語と単語モデル201との間の6種類の可能なマッ
チングを表すものであり、特に6つの有効パスP1〜P
6を示している。図示のように6つの有効パスP1〜P
6の各々は単語モデル201のステートS7、S5
4、S3、S2及びS1を終端としており、これら有効パ
スの各終端ステートが現アクティブリスト203におい
て(番人ステートとともに)降順に登録されることにな
る。一方、新アクティブリスト205に入るべきステー
トを決定するために、すなわち次の入力フレームfk+1
のために残されるべきパスを決定するために、一つの入
力パラメータフレームから次の入力パラメータフレーム
への許容されたステートの遷移、すなわち動的計画法に
よるマッチング処理に設けられた制約が考慮される。
【0049】まず、入ってくる発声に対する基準モデル
の時間的圧縮の最大量は、入ってくる発声の隣接するフ
レーム間でスキップし得るステートの最大数によって決
定される。本実施形態においてこの最大数は“2”にセ
ットされる。すなわち、DP処理は図5で示した状態遷
移に従う。また、入ってくる発声に対する基準モデルの
時間的伸長の最大量は、連続して入ってくるフレームを
いくつまで同一ステートにマッチングさせ得るかによっ
て定義される。しかしながら、これは、繰り返しの数を
カウントする手段と繰り返し数が許容された最大数と等
しいかどうかをチェックするための判断を要求する。発
明者らは、各繰り返しのたびに単にペナルティを課する
ことが効果的で、処理時間の短縮化を実現することを見
出した。以上のような制約により、例えば、パスP5は
図9に破線で示されるパス207の1つ或いは全てに沿
って成長し得る。図9に示されている他のパスP1〜P
4及びP6も同様の方法で成長し、パスの成長先となり
得るステートが新しいアクティブリスト205へ降順で
加えられる。同じポイントにて2つ以上のパスが出会っ
た場合は、最小の累積距離を有するパスが維持され他の
ものは破棄される。さらに、パスの累積距離が刈り込み
閾値より大きくなった場合、そのパスも破棄される。こ
のようにして、新しいパスが連続的に生成され、その一
方で他のパスが破棄されていく。なお、刈り込み閾値の
目的は、各入力パラメータフレームに関して処理される
有効パスの数を制限し、これによってアルゴリズムに必
要となる時間及びメモリの量を制限することにある。
【0050】図10は、図7のステップS47において
実行される処理のより詳細を示すフローチャートであ
る。まず、ステップS71において、ポインタNAが初
期化され、単語モデルの出口ステートにおいて格納され
た累積距離、すなわちD[SD]が特大値、HUGEにセッ
トされる。ポインタNAは、新アクティブリスト205
に登録されている最後のアクティブステートに続く次の
ステートを指すのに用いられる。当業者は、それゆえ、
ポインタNAが新アクティブリストに加えられるべき次
のステートとなる可能性があるステートを指すことにな
ることを理解するであろう。処理の最初において、新ア
クティブリスト205にはアクティブステートがなく、
そのためポインタNAは出口ステートSDを指すように
セットされるのである。ステップS73において、シス
テムは、現アクティブリスト203にアクティブステー
トがあるかどうかを見るべくチェックする。換言すれ
ば、現フレームfkに対して、現在の単語内のステート
を終端とする有効パスがあるかどうかを見るためのチェ
ックを行う。本例においては、現アクティブリスト20
3において7つのアクティブステート(番人ステートS
SENを含む)があり、システムはこれらステートの各々
を順次処理する。ここで、カウント変数iが提供され
る。カウント変数iは、現アクティブリスト203上の
アクティブステートを通してカウントするのに用いられ
るもので、ステップS75においてゼロにセットされ、
ステップS77において、現アクティブリスト203内
の全てのアクティブステートが処理されるまでステップ
S79においてインクリメントされる。
【0051】現アクティブリスト203上の全てのアク
ティブステートが処理されると、ステップS83へ進
む。ステップS83では、ステップS77の処理の間に
生成された新アクティブリスト205が処理されるべき
入力発声の次のフレームfk+1のための現アクティブリ
スト203に変更される。この変更は、実際には、2つ
のアクティブリストを指すために用いられる2つのポイ
ンタを入れ替えることによって達成される。従って、古
くなった現アクティブリストは、次の入力フレームf
k+1の処理の間に新アクティブリストとして上書きされ
る。そして、ステップS85において、最後にアクティ
ベートされ、最後に新アクティブリスト205(番人ス
テートSSENを含まない)に登録された、ポインタLA
によって指定される最終ステートが、図7に示されるス
テップS57における使用のために格納される。なお、
ステップS57については、以下に更に詳細に説明す
る。
【0052】ステップS77において実行される処理の
概要を、アクティブステートS7とS5を例として用いて
説明する。これらS7とS5は、図9に示したように、そ
れぞれパスP1とP2の終わりにある。図11は2つの
有効パスP1とP2の一部を示すもので、これらはそれ
ぞれ現フレームfkにて、ステートS7とS5を終端とし
ている。図11に示される破線は、2つのパスP1とP
2の各々が次のフレームfk+1において成長し得る道を
表わしている。破線213と215によって示されるよ
うに、フレームfk+1においてパスP1が別の単語の中
へ伸びていくことも可能である。従って、パスP1の累
積距離(それはアクティブステートS 7に格納される)
は、出口ステートSDの中にコピーされる。また、破線
217と219によって示されるように、パスP1はス
テートS8およびステートS7のそれぞれにも成長でき
る。従って、パスP1の累積距離はこれらのステートに
もコピーされる。こうして、図12aに示されるよう
に、ステートS8とS7が新しいアクティブリスト205
に降順で加えられる(しかしながら、入ってくるフレー
ムと実際に比較されることがなく、その単語を出て行く
全てのパスの累積距離のうちの最小のものを格納するた
めだけに用いられる出口ステートは新アクティブリスト
205には加えられない)。そして、更に、最終アクテ
ィブポインタLAが最後に加えられたステート、すなわ
ちステートS7を指すべくセットされ、次アクティブポ
インタNAがステートS6を指すようにセットされる。
【0053】パスP1が処理されると、次に、システム
はパスP2を処理する。破線221,223,225及
び227によって示されているように、パスP2はステ
ートS8、ステートS7、ステートS6及びステートS5
それぞれに成長し得る。しかしながら、パスP2の累積
距離(それはアクティブステートS5に格納されてい
る)は、これらステートの全てに単純にコピーされるも
のではない。なぜなら、ステートS8とステートS7の2
つのステートは、このときすでに次のフレームf k+1
対する累積距離を有しているからである。従って、これ
ら2つのステートのために、すでにその中に格納されて
いる累積距離とパスP2による累積距離との比較がなさ
れ、最小のものがそれら2つのステートにコピーされ
る。換言すれば、アクティブリストS5の処理後の、図
11に示されるパスに対してS8とS7に格納される累積
距離は、min(D[S7],D[S5])によって与え
られる。一方、次のフレームfk+1のための累積距離は
ステートS6内にはまだ格納されていないので、アクテ
ィブステートS5に格納された累積距離は、ステートS6
に直接的にコピーされ得る。この結果、図12bに示さ
れるように、2つのステートS6とS5が新アクティブリ
スト205に加えられ、最終アクティブポインタLAが
ステートS5を指すようにセットされ、次アクティブポ
インタNAがステートS4を指すようにセットされる。
現アクティブリスト203における、番人ステートS
SENを除く全ての残りのアクティブステートも同じ方法
で処理される。そして、システムが、処理されるべき次
のステートが番人ステートであると判定した場合に、新
アクティブリスト205に番人ステートSSENを加え、
処理は図10に示されるステップS83に進む。このよ
うに、現アクティブリストの終端を特定するために番人
ステートSSENを用いることの利点については後述す
る。以下に述べるステップS77のより詳細な説明から
明らかであるように、最終アクティブポインタLAと次
アクティブポインタNAは、システムが比較を必要とす
るステートとそうでないステートとを特定するために新
アクティブリスト205をチェックする必要をなくすた
めに提供されている。特に、処理対象のステートが次ア
クティブポインタNAによって示されるステートを超え
ている場合は比較が必要であり、そうでなければ累積距
離は単純にそのステートにコピーされ得る。
【0054】ここで、Sを次に処理されるべきアクティ
ブステートであるとすると、本実施形態において適用さ
れた動的計画法の制約によって4つの異なる状況が存在
する。それらの異なる状況とは、次アクティブポインタ
NAに関連づけて考慮されるものである。すなわち、 i)次アクティブポインタNAがステートSを指す状
態、 ii)次アクティブポインタNAがステートS+2を超え
るステートを指す状態 iii)次アクティブポインタNAがステートS+1を指
す状態 iv)次アクティブポインタNAがステートS+2を指す
状態である。
【0055】発明者らは、上記の第1番目の状態が最も
起こりやすいこと、上記の第2番目の状態が2番目に起
こりやすいこと、そして他の2つの状態はめったに起こ
らないことを確認している。探索アルゴリズムは、それ
ゆえ、これらの状況をこの順番で考慮する。このように
して、発生しそうもない状態が、発生しそうな状態が失
敗(false)に終わった場合にのみ考慮されるように
し、探索アルゴリズムの高速化を図る。
【0056】また、発明者らは、本実施形態の動的計画
の制約のために、Sが処理中の現在のアクティブステー
トである場合には、以下のことが保証されることを確認
している。
【0057】
【数13】
【0058】このことから、現アクティブステートに格
納された累積距離、すなわちD[S]がD[S+1]よ
りも大きい場合には、D[S]をD[S+2]及びD
[S+3]と比較する必要はないことがわかる。同様
に、D[S]がD[S+1]よりも小さく、D[S+
2]よりも大きい場合は、D[S]とD[S+3]を比
較する必要がない。しかしながら、現アクティブステー
トSがその単語の終わりから3つのステート以内のもの
である場合には、注意が必要である。このような場合
は、ステートS+3が存在しないからである。この場合
の明確なテストは、単語の終りに番人ステートSSEN
用いることにより回避され得る。より具体的には、番人
ステートSSENに格納される累積距離をゼロにセットす
ることにより、D[S]がD[SSEN]よりも小さくな
り得ないことを保証することができる。
【0059】次に、図10に示されるステップS77に
おいて、各ステートに対して実行される処理について、
図13aから図13eのフローチャートを参照して詳細
に説明する。図13aのステップS91において、シス
テムは、現アクティブステートSを終端としている有効
パスの累積距離と刈り込み閾値Thとを比較する。すな
わち、D[S]とThを比較する。D[S]が刈り込み
閾値Thよりも大きい場合、現アクティブステートで終
わるパスは破棄され、処理は図10のステップS79に
戻る。一方、D[S]が刈り込み閾値Thよりも小さい
場合は、処理はステップS92へ進む。ステップS92
で、システムは、D[S]がゼロであるかどうかをチェ
ックする。すなわち、処理中である現アクティブステー
トSが番人ステートSSENであるか否かをチェックす
る。
【0060】本実施形態においては、上述したように、
処理されるべき現アクティブリスト上に別のアクティブ
ステートが存在しないことをステップS92において特
定できるように、番人ステートがアクティブリストの終
わりに加えられている。なお、そのステートが現アクテ
ィブリスト上の最後であるかどうかを調べるために、あ
る特定のテストが各アクティブステートを処理した後に
実行されてもよい。しかしながら、この方法において番
人ステートを用いることの利点は、ステップS91にお
いて刈り出されたステートに対してテストを実行しない
ことであり、それにより要求される処理量を節約できる
ことである。
【0061】さて、現ステートが番人ステートでない場
合(D[S]≠0の場合)、処理はステップS93へ進
む。ステップS93において、変数ACOUNTがインクリメ
ントされる。このACOUNTは、現フレームfkに対して処
理されるアクティブステートの総数のカウント値を保持
するのに用いられる。次に、システムは、ステップS9
4において、処理中の現アクティブステートSと処理中
の現フレームfkとの間のローカル距離を計算し、それ
を現アクティブステートに格納された累積距離D[S]
に加える。
【0062】本実施形態において、現フレームfkと現
アクティブステートSとの間のローカル距離を算出する
ために、以下のような大きさの総計(マグニチュードの
サム)が用いられる。
【0063】
【数14】
【0064】ここで、mは、プリプロセッサ15によっ
て入力音声から抽出された各フレーム/ステートにおけ
るパラメータの数である。例えば、ユークリッド距離計
測のような、他の距離計測も使用可能である。しかしな
がら、上記のような大きさの総計によれば、積算を必要
とせず、加算と減算のみで距離計算を行い得る。そのた
め、本実施形態ではこの手法を用いている。
【0065】この距離計算がCPUの占有とうい観点か
らみて、認識サーチの主要な構成要素の一つであるとい
う点を当業者は理解するであろう。
【0066】個人用オルガナイザのような、メモリ容量
及び処理能力が制限され、ステート及び入力されるフレ
ームの各パラメータが単一のバイトで格納される低価格
アプリケーションにおいて、上記の距離計算はルックア
ップテーブルを用いて実現することができる。差分Sp
−fk pが511個の異なる値のうちのひとつをとるから
である。この方法でルックアップテーブルを用いること
は、差分Sp−fpk pが正であるか負であるかの判断を
不要とする。それゆえ、距離計算は、
【0067】
【数15】 のようになる。
【0068】テーブルエントリは−255から+255
の間ではなく、1から511の間となるように、256
がルックアップテーブル(LUT)のアドレッシングに
おいて含まれていることを当業者等は理解できるであろ
う。
【0069】距離計算にルックアップテーブルが用いら
れる場合、同じ入力フレームfkが多数の単語ステート
Sに対して比較されるということに着目することによ
り、高速化が達成される。それゆえ、各フレームfk
対して、TPpがテーブルエレメント[256−fk p
をアドレスするようにテーブルポインタTPが計算され
得る。それゆえ、距離計算は以下のようになる。
【0070】
【数16】
【0071】ステップS94において累積距離が更新さ
れた後、システムは、ステップS95からS97におい
て上述した4つの状況についてチェックする。すなわ
ち、まず、ステップS95において、現アクティブステ
ートSにて終わる有効パスが次アクティブポインタNA
によって指定されているステートであるかどうかをチェ
ックする。もしそうならば、処理は、図13bに示され
るステップS98へ進む。また、次のアクティブポイン
タNAが現アクティブステートSを指定していない場
合、処理はステップS96へ進む。ステップS96にお
いて、システムは、次アクティブポインタNAが、処理
中の現アクティブステートを3つ以上超えるステートを
指定しているかどうかチェックする。もしそうであるな
らば、処理は図13cのステップS109に進む。ステ
ップS109以降の処理については、図13cにおいて
より詳細に説明される。一方、ステップS96で否と判
定されたならば、処理はステップS97へ進む。ステッ
プS97では、次アクティブポインタNAが現アクティ
ブステートに続くステートを指定しているかどうかチェ
ックする。もしそうであれば、処理は図13dにおいて
示されるステップS115に進む。一方、ステップS9
7において否と判断された場合は、次のアクティブポイ
ンタNAがステートS+2を指していることを意味して
いるので、処理は図13eに示されるステップS125
へ進む。
【0072】次に図13bから13eにおける各ステッ
プで実行される処理について説明する。図13bは、次
アクティブポインタNAが、処理されている現アクティ
ブステートSを指定する状況において実行される処理ス
テップを示す。上述してきた説明から当業者には明らか
であるように、上述の動的計画の制約で、この状況にお
いては、現アクティブステートSで終わる有効パスの累
積距離は、現アクティブステートSに続く3つのステー
ト、S+1、S+2、S+3に格納された累積距離と比
較されなければならない。これらのステートはすでに新
しいアクティブリストにすでに存在するからである。
【0073】しかしながら、この比較に先立って、シス
テムは、ステップS98において、現在のアクティブス
テートSを新アクティブリスト205の次の位置に加え
る。そして、システムは、ステップS99において、次
アクティブポインタNAがステートS−1を指すように
セットする。
【0074】その後、処理は、ステップS100へ進
む。ステップS100において、システムは、現アクテ
ィブステートSに格納された累積距離がステートS+1
に格納された累積距離よりも小さいかどうかをチェック
する。このチェック結果が否であった場合は、式(4)
により、現アクティブステートSに格納された累積距離
をステートS+2或いはS+3に格納された累積距離と
比較する必要はなく、処理をステップS108へ進める
ことができる。一方、現アクティブステートSに格納さ
れた累積距離がステートS+1に格納された累積距離よ
りも小さい場合は、処理はステップS101へ進む。ス
テップS101においては、ステートS+1に格納され
た累積距離を現アクティブステートSに格納された累積
距離と等しくする。換言すれば、現アクティブステート
を終端としているパスをステートS+1へ成長させる。
システムは、ステップS102において現アクティブス
テートSに格納された累積距離がステートS+2に格納
された累積距離よりも小さいかどうかをチェックする。
このチェックの結果が否であれば、処理はそのままステ
ップS108へ進む。一方、現アクティブステートSに
格納された累積距離がステートS+2に格納された累積
距離よりも小さい場合、処理はステップS103へ進
む。ステップS103では、ステートS+2に格納され
た累積距離を現アクティブステートSに格納された累積
距離と同じにする。そして、処理はステップS104へ
進む。ステップS104では、システムは、現アクティ
ブステートSに格納された累積距離が、ステートS+3
に格納された累積距離よりも小さいかどうかをチェック
する。このチェックの結果が否であれば、処理はステッ
プS108へ進む。一方、現アクティブステートSに格
納された累積距離が、ステートS+3に格納された累積
距離よりも小さい場合は、処理はステップS105へ進
む。ステップS105では、ステートS+3に格納され
た累積距離を現アクティブステートSに格納された累積
距離と同じにする。
【0075】以上のようにして、現アクティブステート
に格納された累積距離がこれに続く3つのすべてのステ
ートにコピーされた場合、システムは、ステップS10
6において、現アクティブステートSに格納された累積
距離が、全単語中の現フレームfkまで成長した全有効
パスに関する最小累積距離(MINSCORE)よりも小さいか
どうかをチェックする。チェックの結果が否であれば、
処理はステップS108へ進む。一方、現アクティブス
テートSに格納された累積距離が、MINSCOREよりも小さ
いのであれば、ステップS107において、MINSCORE
を、現アクティブステートSに格納されている累積距離
でもって置き換える。そして、処理はステップS108
へ進み、ペナルティ(PEN)が現アクティブステートに
格納された累積距離に加えられる。上述のように、ペナ
ルティは、基準モデルの過度の時間的伸張を防止するた
めに加えられる。こうして処理は終了し、図10に示さ
れるステップS79へ戻る。ステップS79では、ステ
ップS77において現アクティブリストの次のステート
が処理されるように、ステートカウンタiがインクリメ
ントされる。
【0076】一方、図13aに示されるステップS96
において、次アクティブポインタNAが現アクティブス
テートSより2ステートを超えたステートを指定する場
合、処理は図13cに示されるステップS109へ進
む。ステップS109においては、ステートS+3、S
+2、S+1、Sが新アクティブリストにその順番で加
えられる。そして、処理はステップS110へ進み、次
のアクティブポインタNAがS−1を指すようにセット
する。次に処理は、ステップS111へ進み、現アクテ
ィブステートSに格納された累積距離が、現フレームf
kまで成長している全単語中の全有効パスに関する最小
累積距離MINSCOREよりも小さいかどうかをチェックす
る。このチェックの結果が否の場合は、処理はステップ
S113へ進む。一方、現アクティブステートSに格納
された累積距離がMINSCOREよりも小さい場合は、ステッ
プS112において、MINSCOREが現アクティブステート
Sに格納された累積距離によって置き換えられる。
【0077】上述のように、図13aに示されるステッ
プS96からステップS109へ進む状況では、次アク
ティブポインタNAは、現アクティブステートを2つよ
り多く超えるステートを指定していたはずである。この
状況において、本実施形態で用いられる動的計画の制約
で、どのような累積距離とも比較する必要がないこと
は、上記の説明から当業者には理解され得ることであろ
う。現アクティブステートが成長する先となるステート
のいずれもが新アクティブリスト上にはまだ存在しない
からである。従って、ステップS113において、シス
テムは、ステートS+1、S+2、S+3に格納された
累積距離を現アクティブステートSに格納されている累
積距離とする。そして、処理は、ステップS114に進
む。ステップS114では、上述したペナルティが現ア
クティブステートSに格納された累積距離に加えられ
る。次に、処理は終了し、図10に示されるステップS
79に戻る。
【0078】次に、図13aに示されるステップS97
において、システムが、次アクティブポインタNAがス
テートS+1を指定していると判断した場合、処理は図
13dに示されるステップS115へ進む。ステップS
115では、ステートS+1とSを、その順番で新アク
ティブリストに追加する。次に、ステップS116にお
いて、次のアクティブポインタNAがステートS−1を
指すようにセットされる。次に、システムは、ステップ
S117において、ステートS+1に格納されている累
積距離を現アクティブステートSに格納されている累積
距離にする。ステートS+1はステップS115よりも
前では新アクティブリスト上に存在していないので、シ
ステムは、ステートS+1に格納された累積距離を現ア
クティブステートSに格納された累積距離と比較する必
要が無い。この点は、上記の説明から当業者には理解さ
れうるであろう。そして処理はステップS118〜ステ
ップS124へ進む。これらのステップは、図13bに
示されるステップS102〜S108と同じであるの
で、ここではその説明を省略する。
【0079】更に、図13aに示される、ステップS9
7において、次アクティブポインタNAがステートS+
1を指定していないと判断された場合、本実施形態にお
いて用いられている動的計画法による処理の制約のた
め、次アクティブポインタはステートS+2を指定して
いなければならない。従って、処理は、図13eに示さ
れるステップS125へ進む。ステップS125におい
て、ステートS+2、S+1及びSは、その順序で新ア
クティブリストに加えられる。次に、処理はステップS
126へ進み、次アクティブポインタNAがステートS
−1を指すようにセットされる。次に、ステップS12
7において、システムは、ステートS+1とS+2に格
納されている累積距離を現アクティブステートSに格納
されている累積距離と同じにする。ここで現アクティブ
ステートSに格納された累積距離とステートS+1及び
S+2に格納された累積距離との比較を行う必要が無い
ことは、当業者には明らかであろう。ステップS125
よりも前の時点で、新アクティブリスト上にこれらのス
テートは存在しないからである。ステップS128にお
いて、システムは現アクティブステートに格納された累
積距離がステートS+3に格納された累積距離よりも小
さいかどうかを判断する。現アクティブステートSに格
納された累積距離がステートS+3に格納されている累
積距離よりも小さくない場合、処理はステップS132
へ進む。一方、現アクティブステートSに格納された累
積距離がステートS+3に格納されている累積距離より
も小さい場合は、処理はステップS129へ進み、ステ
ートS+3に格納されている累積距離を現アクティブス
テートSに格納されている値とする。そして、システム
は、ステップS130にて、現アクティブステートSに
格納されている累積距離がMINSCOREよりも小さいかどう
かを判断する。ステップS130のチェック結果が否の
場合、処理はステップS132へ進む。一方、ステップ
S130のチェック結果が肯定の場合には、ステップS
131において、システムは、MINSCOREを現アクティブ
ステートSに格納されている累積距離とする。そして、
処理はステップS132へ進み、上述のペナルティPE
Nが現アクティブステートSに格納されている累積距離
に加えられる。そして、本処理を終了し、図10に示さ
れるステップS79へ戻る。
【0080】上述した処理はアクティブリスト中の全て
のステートに対して実行される。しかし、現アクティブ
リスト上の最後のアクティブステートが処理される場
合、それは番人ステートSSENであるので、図13aに
示されるステップS92からステップS133へ処理が
進む。ステップS133では、番人ステートSSENが新
アクティブリストに加えられる。ステートS+3、S+
2、S+1に格納されている累積距離を現アクティブス
テートSに格納された累積距離とした場合にのみ、MINS
CORE(処理中の現フレームfkまでに全単語中の全有効
パスにおける最小の累積距離を表わす)が、図13b、
図13c及び図13dに示される処理ステップにおいて
更新されることが、当業者には理解されよう。しかしな
がら、本実施形態において、現アクティブステートSが
その単語の終端から3ステート以内にある場合にはこれ
は起こり得ないので、出口ステートSDに格納された累
積距離がMINSCOREより小さいかどうかを判断するため
に、ステップS134においてエクストラなテストが実
行されるのである。このテストの判断結果が否の場合
は、処理はそのまま図10に示されるステップS83へ
戻る。一方、肯定の場合は、図10に示されるステップ
S83に戻る前に、ステップS135においてMINSCORE
が終端ステートSDに格納された累積距離に設定され
る。
【0081】以上説明した図13の処理について、図8
に示されるアクティブリスト203における最初の2つ
のアクティブステートを処理する場合を例に挙げて更に
説明する。処理されるべき最初のアクティブステートは
ステートS7である。ステップS91において、システ
ムはステートS7に格納されている累積距離が刈り込み
閾値Thよりも小さいかどうかを判断する。否の場合、
このアクティブステートの処理は終了し、次のアクティ
ブステートの処理が開始される。一方、肯定であれば、
処理はステップS92へ進む。ステートS7は番人ステ
ートSSENではないので、このステートに格納される累
積距離はゼロではない(ゼロ値は、番人ステートSSEN
のためにリザーブされるものである)。従って、処理は
ステップS93へ進み、変数ACOUNTがインクリメントさ
れる。ステップS94において、現アクティブステート
7と現フレームfkとのローカル距離が計算され、ステ
ートS7に格納されている累積距離に加算される。
【0082】ステートS7は、処理すべき最初のアクテ
ィブステートであるので、次アクティブポインタNAは
出口ステートSDを指すことになる。この出口ステート
Dは、図8に示される単語モデル201からわかるよ
うに、ステートS7よりも2ステート離れている。従っ
て、処理はステップS95、S96、S97を通って、
図13eに示されるステップS125に進む。ステップ
S125では、ステートS8とS7が、その順序で新アク
ティブリスト205に加えられる。しかしながら、なお
も出口ステートSDはその新アクティブリストに加えら
れない。出口ステートSDは、その単語を出て行く全て
のパスのうちの最小の累積距離を格納するのに使われる
だけだからである。次に、ステップS126において、
ステートS 6を指すように次のアクティブポインタNA
がセットされ、ステップS127においてステートS8
とSDに格納されている累積距離を現アクティブステー
トS7に格納されている累積距離と同じにする。次に、
処理は、ステップS128に進み、システムは、ステー
トS7に格納されている累積距離が番人ステートSSEN
格納されている累積距離より小さいかチェックする。番
人ステートSSENに格納されている累積距離はゼロであ
るので、処理はステップS132に進むことになる。ス
テップS132では、システムは、ステートS7に格納
されている累積距離にペナルティを加える。こうして図
13eに示される処理は終了し、図10に示されるステ
ップS79へ進む。ステップS79において、カウント
変数iが、次のアクティブステートS5が処理されるよ
うに、インクリメントされる。
【0083】ステートS5の処理は、以下を除いて、ス
テートS7に対する処理と同じである。すなわち、ステ
ップS97において、図13eに示されるステップS1
25へ進む代わりに、処理は、図13dに示されるステ
ップS115へ進む。これは、次のアクティブポインタ
NAがアクティブステートS7の処理の間にステップS
126においてステートS6を指すようにセットされる
からである。従って、ステップS115において、シス
テムはステートS6とS5を新アクティブリスト205へ
この順序で追加する。そして、処理は、ステップS11
6へ進み、次のアクティブポインタNAがステートS4
を指すようにセットされる。次に、ステップS117に
おいて、ステートS6に格納された累積距離を現アクテ
ィブステートS5に格納された累積距離と同じにする。
次に、ステップS118において、システムは現アクテ
ィブステートS5に格納されている累積距離を、ステー
トS7に格納されている累積距離と比較する。現アクテ
ィブステートS5に格納されている累積距離がステート
7に格納されている累積距離よりも大きい場合は、処
理はそのままステップS124へ進む。一方、ステート
7に格納されている累積距離よりもステートS5に格納
されている累積距離のほうが小さい場合は、処理はステ
ップS119へ進む。ステップS119において、ステ
ートS7に格納されている累積距離を現アクティブステ
ートS5に格納されている累積距離で更新する。同様の
比較と更新が、ステップS120とステップS121に
おいて、ステートS8に格納されている累積距離につい
て行われる。そして、ステートS8に格納されている累
積距離がステップS121で更新された場合、システム
はステップS122において、現アクティブステートS
5に格納されている累積距離がMINSCOREよりも小さいか
どうかを判断する。否であれば、処理はステップS12
4へ進み、一方、肯定であれば、ステップS124へ進
む前の現アクティブステートS5に格納されている累積
距離でもってMINSCOREに格納されている累積距離を置き
かえる。ステップS124では、現アクティブステート
5に格納されている累積距離にペナルティPENが加えら
れる。そして、処理は、図10のステップS79へ戻
り、次のアクティブステートS4が処理されるように、
カウント変数iをインクリメントする。
【0084】この再帰的な処理ルーチンは、システムに
既知の全基準単語において、全ての現アクティブステー
トに対して実行される。
【0085】現フレームfkについて上記方法で各単語
を処理した後、言語モデル21の各ノードが順次に処理
される。上述のように、言語モデル21は、許容できる
単語のシーケンスを決定する。この情報は、ノードによ
って定義され、詳細には、特にその入力と出力に接続さ
れる単語によって定義される。図7におけるステップS
51でのノードの処理は、許容された単語列の範囲のみ
で有効パスが成長することを確実にするものである。次
に、図14を参照して、ステップS51で実行される処
理についてより詳細に説明する。
【0086】最初に、ノードのどれかを処理するに先立
って、バックグランドノイズを表わすフレームと現フレ
ームfkとのローカル距離(即ち、d(noise,fk))が
ステップS151で計算される。次に、ステップS15
3において、ノードポインタvがスタートノードN0
指すように初期化される。次に、ステップS155にお
いて、ノードポインタvによって指定されるノードに格
納されている累積距離、即ちD[v]を、刈り込み閾値
Thと比較する。D[v]が刈り込み閾値Thよりも小
さい場合、処理はステップS157へ進み、d(noise,
k)が処理中である現ノードvに格納されている累積
距離に加えられる。次に、ステップS159において、
システムは、D[v]を最小値格納部MINSCOREに格納さ
れている値と比較する。そして、D[v]のほうが小さ
ければ、ステップS161においてD[v]の値をMINS
COREにコピーする。そして、ステップS163におい
て、カウンタACOUNT(それは現フレームについて処理さ
れているアクティブステートとノードの数を表わす)が
インクリメントされ、処理は、ステップS165へ進
む。一方、ステップS155において、D[v]が刈り
込み閾値Thよりも大きい場合は、ステップS167に
進み、特大値HUGEがD[v]にセットされ、処理はステ
ップS165へ進む。
【0087】ステップS165とS168において実行
される処理について、図15に例示されるノードNを用
いて説明する。このノードNは、3つの単語、“ge
t“、“save”及び“load”をその入力側に接続し、“a
n”と“the”をその出力側に接続している。図3におい
てそのようなノードは示されていないが、本実施形態の
動的計画法による処理が、より複雑な言語モデルに関し
て稼動することを示すために選択された例である。特
に、ノードが図15に示されるものに似ている、有限の
ステート文法はありふれたものである。
【0088】ステップS165において、システムは、
ノードNの入力に接続されている単語の出口ステート
(SD)、即ち、“get”、“save”、“load”という単
語の出口ステートに格納された全累積距離のうちの最小
のものを判断する。一般にこの計算は以下のように表わ
される。
【0089】
【数17】
【0090】ここで、Iw[v]はノードvの入力に接
続される全ての単語を表わす。システムが、ノードNに
対するこの最小の累積距離を決定した後、その値が既に
そこ(ノードN)に格納されている累積距離(D
[N])よりも小さい場合、その値はノードNに格納さ
れた累積距離D[N]にコピーされる。実際のところ、
これは、そのノードの入力に接続された単語の一つから
来る有効パスにおいて、当該ノードにおいて成長中であ
るパスの累積距離よりも小さい累積距離を有するものが
あるかどうかの判断である。
【0091】フレーズ中の単語の前、中間、終端にバッ
クグランドノイズフレームとマッチするギャップが含ま
れている可能性があるので、有効パスがノード内を成長
することもありうる。この一つの入力フレームから次の
フレームへの有効パスがノード内に残ることの可能性
は、図15においてノードNより出てノードNに戻る矢
印231によって表わされている。パスは連続して入力
されるいかなる数のフレームに対しても、ノード内に残
ってよい。システムがステップS165の処理を実行し
た後、ステップS168において、ノードNに格納され
ている累積距離が、一時的な格納場所INSCOREに既に格
納されている値よりも小さい場合、その累積距離がINSC
OREにコピーされる。単語“an”と“the”のそれぞれに
ついて、INSCOREがボックス233と235によって表
わされる。単語が2つ以上のノードの出力に接続され得
るので、比較は必須である。そして、最少の累積距離を
有するパスのみが接続単語へ成長される。単語の一時的
格納場所INSCOREに格納された累積距離は、図7に示さ
れるステップS57における処理の間に、その単語のエ
ントリステートを更新するのに用いられる。
【0092】次に、システムは、ステップS169にお
いて、D[v]が特大値HUGEに等しいかどうかをチェッ
クする。等しい場合、これは、そこで終了する有効パス
が無く、また、次のフレームfk+1にて現ノードvを通
ってこれに接続される単語へ通じる有効パスも無いこと
を表わしている。一方、D[v]が特大値HUGEよりも小
さい場合、有効パスがそのノードvで終るか、有効パス
がそれを通り抜けてそれに接続されている単語へ通じる
かのいずれかである。従って、次の入力フレームfk+1
にて潜在的なアクティブステート(およびノード)の数
を表わすカウンタPACOUNTが、ステップS171でイン
クリメントされる。ノードに関連する無音ステートが次
の入力フレームfk+1でアクティブとなることがあるか
らである。ノードポインタvは、その後、ステップS1
73でインクリメントされ、ノードポインタvは言語モ
デル21における次のノードを指すこととなる。次にシ
ステムは、ステップS175において、言語モデル21
における全てのノードが処理されたかどうかをチェック
する。これは、ノードポインタvが言語モデル21のノ
ードNnを超えたノードを指しているかどうかをチェッ
クすることでなされる。システムが全てのノードの処理
を終えていない場合、処理はステップS155へ戻る。
一方、全てのノードの処理が終っていれば、処理は図7
に示されるステップS53へ戻る。
【0093】次に、図7に示されるステップS57にお
いて実行される処理について、図16及び図17を参照
しながら、図8に示される単語モデル201と図9に示
される動的計画法によるパスに関して、より詳細に説明
する。図16において、ステップS181で、システム
は、INSCOREに格納されている累積距離が特大値HUGEと
等しいかどうかをチェックする。等しい場合、それは、
次回のポイントにおいてこの単語に入る有効パスが存在
しないことを意味する。従って、この単語は再び処理さ
れる必要は無く、よって、処理はそのままステップS2
07へ進む。ステップS207においては、次に入力さ
れるフレームfk+1に関して処理される単語のためのア
クティブステートの数(それは、図10に示されるステ
ップS83によって現アクティブリスト203となった
りスト中に登録されているステートの数から決定され
る)が、カウンタPACOUNTに加えられる。次に処理は、
図7に示されるステップS59へ戻り、単語カウンタを
インクリメントし、次の単語モデルが処理されるように
する。
【0094】一方、ステップS181にて、INSCOREが
特大値HUGEと等しくない場合、これは、有効パスがすぐ
前の単語を出て、処理中の現単語へ入る可能性があるこ
とを意味する。よって、他の単語モデルから伸びるパス
によって到達され得る現単語モデルのステート(これ
は、以下ではエントリステート称される)が、INSCORE
に格納されている累積距離を用いて更新されなければな
らない。本実施形態に於いては、上述の動的計画法の制
約で、エントリステートはS0、S1およびS2のいずれ
かである。この更新は、図13を参照して説明したのと
類似の処理テクニックを用いても達成され得るが、本実
施形態においては以下の方法が用いられる。
【0095】まず、ステップS183において、システ
ムは、処理中の現単語を表す単語モデルが3つ以上のス
テート(出口ステートSDや番人ステートSSENは含まな
い)を含むかどうかチェックする。3つ以上のステート
があった場合は、ステップS185において、ステート
ポインタjがステートS2を指すようにセットされる。
一方、現単語中に3つ未満のステートしか存在しない場
合は、ステップS187においてステートポインタjが
出口ステートSDを指すようにセットされる。次に処理
は、ステップS189へ進み、ポインタjによって指定
されるステートが最終アクティブポインタLAによって
示されるステートと比較される。ポインタjによって指
定されるステートが最終アクティブポインタLAによっ
て指定されるステートを超えている場合、当該ステート
に既に格納されている累積距離とINSCOREに格納されて
いる累積距離との間で比較がなされなければならない。
図9に示されるパス、例えばパスP6は、次のフレーム
k+1で、ステートS1、S 2、S3及びS4に成長し得
る。従って、この例において、図10に示されるフロー
チャートに従って現アクティブリスト203上の全ての
アクティブステートを処理した後、最終アクティブポイ
ンタLAはステートS1を指すようになる。
【0096】図17は、図8に示されている単語モデル
201のエントリステート(即ち、最初の3つのステー
ト)を示す。図17に示されているように、最終アクテ
ィブポインタLAはステートS1を指す。単語モデル2
01には、3つより多いステートがあるので、ステート
ポインタjはステートS2を指す。従って、システムは
ステップS189において、ポインタjによって指定さ
れているステートが最終アクティブポインタLAによっ
て指定されているステート、即ちステートS1を超えて
いると判断する。それゆえ、処理はステップS191へ
進む。ステップS191において、システムは、ステー
トS2に格納されている累積距離と単語モデル201に
関連する一時的な格納部INSCOREに格納されている累積
距離とを比較する。なお、INSCOREは、図17において
矩形ボックス241によって表されている。INSCOREに
格納されている累積距離がステートS2に格納されてい
る累積距離よりも小さい場合、ステップS193におい
てINSCOREの値がステートS2にコピーされる。そして、
処理は、ステップS193へ進む。INSCOREに格納され
ている累積距離がステートS2に格納されている累積距
離よりも大きい場合は、ステートS2に格納されている
累積距離は変更されず、処理はステップS197へ進
む。ステップS197において、ポインタjは、デクリ
メントされ、ステートS1を指定する。その後、処理は
ステップS189へ戻り、ステートS1に対して同じ処
理が実行される。
【0097】ステートS1を処理した後、ステップS1
97において、ポインタjがステートS0を指定するよ
うに再度決定される。ステップS189の後、処理はス
テップS198に進む。ステップS198において、シ
ステムは処理すべき更なるステートがあるかどうかをチ
ェックする。本例の場合、ステートS0がなお処理され
るべきであるので、システムはステップS199へ進
み、INSCOREに格納された累積距離がステートS0にコピ
ーされる。ここで、ステートS0は最終のアクティブポ
インタによって指定されている最後のアクティブステー
トの前のステートなので、ステートS0に関して累積距
離の比較を実行する必要はない。そして、システムは、
ステップS201において、図13aに示されるステッ
プS133において現アクティブリストへ加えられるべ
き最終ステートであった番人ステートSSENに上書きし
て、ステートS0を、現アクティブリスト(図10のス
テップS83より前では新アクティブリスト205であ
ったもの)に加える。次にシステムは、ステップS20
3において、ポインタjをデクリメントし、ステートS
-1を指定するようにする。処理はステップS198に戻
り、システムは現単語にはこれ以上の処理すべきエント
リステートが存在しないと判断する。そして、処理は、
ステップS204へ進み、番人ステートSSENが現アク
ティブリストの終わりに再び加えられる。これは、番人
ステートSSENがステップS201で上書きされてしま
っているからである。そして、ステップS204の後、
処理はステップS205へ進み、対応する一時的格納場
所INSCOREに格納されている累積距離を特大値HUGEにリ
セットする。現アクティブリスト上のステートの数は、
ステップS207においてカウンタPACOUNTに加えら
れ、処理は図7に示されるステップS59へ戻る。
【0098】[刈り込み]再び図7を参照すると、ステ
ップS63においてシステムがさらに処理すべき入力フ
レームがあると判断した場合、処理はステップS65へ
進み、刈り込み閾値Thが調整される。刈り込みを用い
ることの目的は、同時に一つのポイントから次のポイン
トへ成長する動的計画法のパスの数を制限することであ
る。特に、本実施形態は、実際に処理されるアクティブ
ステートの数が実質的に前もって決められた制限内に収
まるように、刈り込み閾値を調整することを目的とす
る。この制限は、作業メモリ容量と許容される処理時間
とにより定められる。さらに、本実施形態は、高価な計
算的なオーバーヘッド無しにこれを達成することも目的
としている。
【0099】設定された数のアクティブステートだけが
各入力フレームのために処理されることを確実にするた
めの一つの方法は、まさに処理される入力フレームに関
する全てのアクティブリスト上にあるアクティブステー
トを、それらに格納された累積距離の増大する順番にソ
ートし、最小の累積距離を持つものから所望の数のステ
ートを処理することである。しかしながら、このテクニ
ックでは、アクティブステートをソートするのに多大な
計算時間が必要となる。本実施形態において用いられる
テクニックでは、この計算的に高価な並べ替えを実行す
るのではなく、最終の入力フレームを処理した後に有効
な情報を用いる。特に本実施形態において、差分値(PR
UNING)は、次の処理されるべき入力フレームに対して
潜在的にアクティブなステートの数(PACOUNTに格納さ
れる)に依存して、実際に処理されるステートの数を2
つの閾値の間に存在するべく維持するために変化する。
以下、差分値PRUNINGを変化させる方法について図18
を参照して詳細に説明する。
【0100】ステップS211において、システムは処
理されるべき次のフレームに関して潜在的にアクティブ
なステートの数(PACOUNTに格納されている)と、ステ
−ト閾値(STATETH)とを比較する。ここで、ステート
閾値STATETHは、有用なワークメモリの量によって決定
される絶対的に最大のステート閾値よりも小さいがそれ
に近い値にセットされる。PACOUNTに格納される値がSTA
TETHよりも小さい場合は、これは、全ての潜在的にアク
ティブなステートが処理され得ることを意味し、それゆ
え、前回のポイントで使用された差分値PRUNINGを増加
させることができる。従って、ステップS213におい
て、調整定数dp1が現在の差分値PRUNINGに加えられ
る。dp1の値は、あらゆるリーズナブルなローカル距
離よりも大きく設定される。よって、全てではないにし
ろ、潜在的なアクティブステートの大部分が処理され
る。
【0101】次に、PRUNINGに格納されている値は、ス
テップS215において高い刈り込み閾値HIGHPRTHと比
較される。それより上に到達する必要のありえない最大
の差分値が存在すると仮定されるので、その上限が差分
値PRUNINGに設けられる。PRUNINGに格納されている値
が、HIGHPRTHよりも小さい場合は、処理はステップS2
19へ進む。PRUNINGに格納されている値がHIGHPRTHよ
りも大きい場合は、ステップS217においてPRUNING
がHIGHPRTHと同じ値にセットされる。ステップS215
或いはS217の後、システムは刈り込み閾値Thをセ
ットする。そして、処理は図7に示されるステップS4
3へ戻る。
【0102】一方、ステップS211にて、システムが
次のフレームに対する潜在的にアクティブなステートの
数、PACOUNTが、STATETHよりも大きいと判断した場合、
システムはステップS221において、前回の入力フレ
ームの処理の間アクティブで処理されたステートの数
(ACOUNTに格納されている)と、低ステート閾値LOWSTT
Hとを比較する。LOWSTTHの値は、ACOUNTがLOWSTTHより
小さい場合に多くの時間やメモリを使うことなく次の入
力フレームに対する全ての潜在的なアクティブステート
を処理可能であるようにし、それを確実に保証するべく
セットされる。従って、ACOUNTがLOWSTTHより小さい場
合、処理はステップS221からステップS213へ進
む。ステップS213では、差分値PRUNINGが調整さ
れ、処理は上述のように進む。一方、ACOUNTがLOWSTTH
より大きい場合は、全ての潜在的なアクティブステート
が処理される場合に多くの時間やメモリを処理に費やさ
ないという保証がない。したがって、差分値PRUNINGを
減らす必要がある。
【0103】差分値PRUNINGが減少される必要があるか
どうかを判断するために、システムはステップS223
においてACOUNTをSTATETHと比べる。ACOUNTがSTATETHよ
りも小さい場合、システムはステップS224におい
て、差分値PRUNINGがHIGHPRTHと等しいかどうかをチェ
ックする。もしも、HIGHPRTHと等しければ、このことは
システムが全てのアクティブステートを処理しようとし
ていることを表し、従って、次の入力フレームに関して
処理されるであろうアクティブステートの数が処理にお
いて極めて長い時間もしくは極めて大きいメモリ量を要
することになる可能性は低い。従って、差分値PRUNING
は変更せず、処理はステップS219へ進み、刈り込み
閾値がセットされる。一方、差分値PRUNINGがHIGHPRTH
と等しくない場合(その場合、PRUNINGはHIGHPRTHより
小さくなければならない)、次の入力フレームに関して
処理されることになるアクティブステートの数が非常に
長い時間と非常に大量のメモリを費やすであろうことが
予測される。従って、処理されるべきアクティブステー
トの実際の数を計算し、見積もらなければならない。こ
れは、変更されていない差分値PRUNINGを用いてステッ
プS231においてセットされた刈り込み閾値を用い
て、ステップS233にて実行される。
【0104】ステップS223に戻り、ACOUNTがSTATET
Hよりも大きいとシステムが判断した場合、差分値PRUNI
NGがステップS225において調整定数dp1だけ減じ
られる。差分値PRUNINGがステップS225において減
少させられた後、システムは、ステップS227におい
て、その差分値PRUNINGが低刈り込み閾値LOWPRTHより小
さいか否かを判断する。低刈り込み閾値は、次の入力フ
レームに関して処理されるであろうアクティブステート
の数が設定された緊急ステート閾値EMGSTTHより大きく
なることを確実にするために用いられる。この理由は、
刈り込みがきついと動的計画処理が失敗に終わるという
ことが見出されていることによる。差分値PRUNINGが低
刈り込み閾値LOWPRTHよりも小さい場合、ステップS2
29において、差分値PRUNINGはLOWPRTHと同じ値にセッ
トされる。そして、ステップS231において、刈り込
み閾値Thが調整された差分値PRUNINGを用いて設定さ
れる。続いて、ステップS233において、システムは
次の入力フレームに関して処理されるであろうアクティ
ブステート(及びノード)の数をみつもる。この見積も
りは、まず、直前の入力フレームの処理の間に処理され
たアクティブステートの数、即ち、ACOUNTを、直前の入
力フレームの処理の間に用いられたPRUNINGの値で割る
ことによりステート密度を見積もり、次に、見積もられ
たステート密度にPRUNINGの新たな値を乗ずることによ
って、次の入力フレームに関して処理されるであろうア
クティブステートの数を見積もることでなされる。
【0105】見積もられた数Ensaが、緊急ステート閾
値EMGSTTHよりも小さい場合、セットされている刈り込
み閾値は小さすぎであり、処理はステップS213に戻
り、差分値PRUNINGが増加され、刈り込み閾値が再設定
される。EnsaがEMGSTTHよりも小さくない場合、En
saはステップS237においてlowstthと比較される。
EnsaがLOWSTTHよりも大きい場合は、これは、ステッ
プS231でセットされた刈り込み閾値Thが受け入れ
うるものであることを意味する。そして、処理は終了
し、図7に示されるステップS43に戻る。一方、En
saがLOWSTTHよりも小さい場合、刈り込み閾値は増加さ
せ得るものであり、よって、ステップS239において
第2の調整定数dp2が差分値PRUNINGに加えられ、刈
り込み閾値がステップS219にて再度設定される。な
お、本実施形態において、第2の調整定数dp2は、調
整定数dp1の1/2に設定されている。
【0106】図18に示されるステップS219とS2
31において、刈り込み閾値Thが設定される。この設
定は、まさに処理された入力フレームに対して決定され
た最終的な(全体の)最小累積距離MINSCOREに、まさに
計算された変数差分値(PRUNING)を加えることにより
なされ得る。しかしながら、発明者等は、全体として最
適なパスが、正しい単語の最初の少数のステートを横切
る場合、全体として最適なパスと局所的な最小値との間
の差が最大になる傾向があることを見いだした。従っ
て、本実施形態においては、刈り込み閾値は単語の始め
に近い部分でより大きく、その単語の終わりに向かって
より小さくなるように調整される。本実施形態におい
て、これは、図19に示されるように、各単語の最初の
5つのステートに対して第1の刈り込み閾値Th1を用
い、各単語の次の5つのステートに対して第2の刈り込
み閾値Th2を用い、各単語の残りのステートに対して
第3の刈り込み閾値Th3を用いることにより実現され
る。本実施形態において、3つの刈り込み閾値Th1
Th2、Th3は以下のようにして決定される。即ち、 Th1=MINSCORE+PRUNING Th2=MINSCORE+0.75・PRUNING Th1=MINSCORE+0.5・PRUNING。
【0107】当業者は理解するであろうが、実行されて
いる刈り込みは各パスについてさらに成長すべきか否か
に関して厳密な決定を行う。特に、刈り込み閾値よりも
低い全てのものが処理され、高いものは刈り込まれる。
そのような厳密な刈り込みテクニックを実行するに際し
ての問題は、認識結果のエラーにつながる刈り込み誤差
の可能性の増加にある。これは、全体として最適化され
たパスに関する累積距離が刈り込み閾値よりも大きい場
合、全体として最適なパスが刈り込まれてしまったその
時点で、全体として最適なパスの現ステートの近隣にあ
るステートはこれに類似の累積距離を有し、それらもま
たこのハードな刈り込みテクニックによって刈り込まれ
てしまうことになるということによる。従って、より柔
軟な刈り込みテクニックを適用することにより改良され
た刈り込みが達成され得る。この柔軟な刈り込みでは、
閾値を囲む領域を設け、その領域に入る全てではないい
くつかのパスが刈り込まれることになる。従って、たと
え最適なパスが刈り込まれてしまっても、最適パスに十
分に近いパスが残ることになり、刈り込みが認識エラー
に帰結することをなくす。
【0108】そのような柔軟な刈り込みテクニックは、
いくつかの異なる方法で達成され得る。例えば、所定の
範囲内の累積距離を有するパスの中からランダムに刈り
込まれるべきパスを選ぶのに、乱数発生器が用いられ得
る。しかしながら、そのような刈り込みの決定は全ての
アクティブステートに対して毎ステップ行われる必要が
あるので、できる限り単純にすべきである。さもない
と、刈り込みテクニックが過大な処理時間を必要として
しまう。本実施形態では、刈り込み閾値のベクトルT
[s]が各入力フレームfkに関して計算される。ベク
トルにおける刈り込み閾値の値は、まず、上述の3つの
刈り込み閾値Th1、Th2、Th3を計算し、図20に
示されるように、ステート2、5、8等に対する適切な
刈り込み閾値から定数δを減算し、ステート0、3、6
等に対する適切な刈り込み閾値から2δを減算すること
で計算される。発明者等は、この3レベルの柔軟な刈り
込みが、1レベルの厳密な刈り込みテクニックと同じ刈
り込みエラー率で、処理されるべきアクティブステート
の数を30%減少させることを確認している。
【0109】当業者は理解するであろうが、使用される
刈り込みレベルの数と各レベルの変更は、たとえ最適パ
スが刈り込まれても最適パスに十分に近いパスが残るよ
うに、使用されている動的計画法の制約に関連して選択
されるべきものである。
【0110】また、当業者は気づくことであろうが、刈
り込み閾値を変化させる上述の方法は、計算的に高価で
はなく、割り当てられた処理時間とメモリが超過される
ことのないように、各ポイントの時点で処理されるアク
ティブステートの数を限定するというように、刈り込み
閾値を調整可能とするものである。
【0111】図7に示される処理ステップのシーケンス
を用いて入力シーケンスにおける全てのフレームが処理
された後、動的計画処理によって決定された最適化パス
によって取られる正しいパスを決定するために、バック
トラッキングルーチンが要求される。本実施形態におい
て、バックトラッキングルーチンは、各パスがそれを通
って成長する、単語シーケンスを表すバックポインタを
追跡する。バックトラッキングルーチンが実行される方
法の詳細と、ポインタが発生される方法は音声認識の当
業者には周知であり、更なる説明は行わない。
【0112】[初期化]システムが入力発声の認識を試
みる前に、認識処理の間に用いられるシステムの閾値と
変数が初期化されなければならない。これは以下の方法
で達成される。まず、スタートノードN0に格納された
累積距離がnominal値にセットされ、他の全ノードに格
納される累積距離が同一の大きい値HUGEにセットされ
る。次に、各単語モデルに関連して潜在的なアクティブ
ステートの数をカウントするカウンタPACOUNTをゼロに
セットし、各単語モデルに関連する一時的格納INSCORE
を大きな値HUGEにセットする。次に、全てのノードが処
理され、単語の入力に接続されるすべてのノードの累積
距離の最小値が、その単語に関連する一時的格納INSCOR
Eにコピーされる。これは、スタートノードN0に接続さ
れる各単語の一時的格納INSCOREがnominal値にセットさ
れることを確実にする。最後に、各単語のINSCOREに格
納された値は、各単語モデルのエントリステートをアク
ティベートし初期化するために用いられる。処理ステッ
プは、各単語のモデルのエントリステートを初期化する
ために、図16を参照して上述したエントリステートを
更新するために用いられる処理ステップに対して同一で
ある。刈り込み閾値と差分値PRUNINGも、最初の入力フ
レームの処理に先立って初期化される。特に、刈り込み
閾値Th1、Th2、Th3は大きな値HUGEにセットさ
れ、差分値PRUNINGは、高い刈り込み閾値HIGHPRTHにセ
ットされる。
【0113】[他の実施形態]いくつかの変形が、本発
明のコンセプトから外れることなく、上述の音声認識に
対してなし得る。これら変形のいくつかについて、以下
に説明する。
【0114】上述の実施形態においては、全発声が、処
理される前に受信される。しかしながら、システムは、
処理される発声を受信しながら漸進的に稼動するように
してもよい。そのような実施形態においては、入力バッ
ファは必要とされるが、1フレームに対応する入力音声
を格納することができるものであればよい。当業者は気
づくであろうが、このシステムを稼動させるために、入
力スピーチのフレームの全処理(プロセッサと認識ブロ
ックにより)が、入力音声の次のフレームを処理する準
備ができる前に完了しなければならない。
【0115】第1の実施形態においては、動的計画パス
の終わりにあった単語モデルのステートは、その単語モ
デルに関連するアクティブリストにリストされていた。
変形例においては、全単語モデルの全アクティブステー
トがリストされる単一のグローバルなアクティブリスト
が提供されてもよい。そのような変形例においては、ど
の単語モデルがその特定のアクティブステートに属する
かを示すために、グローバルなアクティブリストに関連
して情報が格納されなければならないであろう。
【0116】第1の実施形態においては、次回のステッ
プに対して各単語内で有効な動的計画法によるパスを成
長するのに含まれる処理を高速化するために、式(4)
が利用される。加えて、最も可能性の高いものが低いも
のよりも先にチェックされるようにサーチが組織され
た。1つの単語から次の単語へ有効な動的計画パスを成
長させるのに、類似の処理テクニックが用いられ得る。
【0117】第1の実施形態において、単語モデルのス
テートは、時間的継続において、認識されるべき入力音
声に対応する。変形例においては、単語モデルの各ステ
ートは、継続時間において、例えば、入力音声の3つの
連続するフレームと等価にしてもよい。そのような変形
例においては、入力フレームは3つのグループにおいて
平均化され、単語モデルのステートとともに並べられ得
る。
【0118】第1の実施形態においては、単語モデルを
通る一つの最良の動的計画パスが決定される。当業者に
よって理解されるように、N個の最良のマッチングを決
定するように容易にアルゴリズムを適用できる。よっ
て、認識結果にエラーがある場合、システムは、2回目
の認識のためにフレーズを再入力する必要なしに、代替
を提示することができる。
【0119】更に他の変形例において、単語モデルは統
計的なモデルであってもよい。統計モデルとしては、例
えば、音声認識の当業者にはよく知られた隠れマルコフ
モデルが挙げられる。そのような実施形態においては、
入力発音と単語モデルのシーケンスとの間の最小の累積
距離を決定するのではなく、隠れマルコフモデルの特定
のシーケンスにより入力シーケンスが生成されることの
最大の確率が決定される。
【0120】第1の実施形態において、使用される基準
モデルは全単語に対応する。当業者には明らかであろう
が、このことは本質的なことではない。基準モデルは、
例えば音節(syllable)のような単語の部分に対応して
もよいし、複数の単語に対応してもよいし、個々の音素
(phoneme)に対応してもよい。しかしながら、音素に
対応する基準モデルを使用することの欠点は、システム
が言語依存になることである。更に、全単語に等価な基
準モデルは、全フレーズに等価なものに対して好まし
い。時間に関するポテンシャルと計算量の節約があるた
めである。特に、フレーズ内の単語をモデル化すること
により、そして言語モデルを用いることにより、システ
ムに、適度な量の(handful)単語のみを用いて多くの
異なるフレーズを教えることが可能である。一方、全フ
レーズに対応された基準モデルの場合、基準モデルは、
システムによって学習されるべき種々のフレーズの各々
に要求されるであろう。この利点に加えて、単語に対応
する基準モデルの使用はフレーズ内の単語間のギャップ
によるシステムの柔軟性を増加させる。これは、フレー
ズの開始と終了及びフレーズ内の単語間にも現れ得る環
境モデルのおかげで可能である。
【0121】更にもう一つの変形例において、モデルの
連続するフレームが類似している場合、基準モデルは圧
縮されてもよい。このような状況が発生する場合、連続
する類似フレームは単一のフレームによって置き換えら
れる。
【0122】図17に示される言語モデルにおいて、2
つの異なる単語が続き得る単語の場合、その単語に続く
2つの単語上には優先度(preference)は与えられな
い。しかしながら、他の実施形態において、いくつかの
単語シーケンスに他のものよりも好適に重み付けするこ
とが可能である。例えば、図17aにおいて示されるフ
レーズに関してフレーズ“make it more”(coulourが
後続する)が、フレーズ“make it smaller”、或いは
“make it larger”或いは“make it brighter”よりも
一般的である。従って、ノードN7からノードN8への遷
移は、ノードN7から終端ノードNnへの遷移に比べて強
い。これはノードN7から単語“more”、“smaller”、
“larger”及び“brighter”の入力へ成長する累積距離
に重みをつける重み係数を用いることで達成される。
【0123】また、当業者には明らかであるように、許
容される単語のシーケンスを定義するのに用いられる言
語モデルは、ビグラム(Bigram)モデルである必要はな
く、例えば限定的なステートの文法モデルのような、周
知のいかなるタイプの言語モデルであってもよい。使用
される言語モデルのタイプが変更された場合、上述した
動的計画法マッチング処理にいくらかの変形が必要とな
るであろうが、そのような変形は音声認識の分野におけ
る当業者には明らかであろう。しかしながら、あらゆる
パターンマッチング処理に適するように設計されている
ので、マッチング処理の本質的な特徴は変化しない。
【0124】加えて、動的計画法によるマッチング処理
を実現する方法は、他のタイプのパターンマッチングに
も利用可能である事は、パターンマッチングの分野にお
ける当業者には明らかである。例えば、上述したパター
ンマッチング処理を、手書き文字認識や他のパターンマ
ッチングアプリケーションに利用することが考えられ
る。
【0125】連続的な単語音声認識システムが、上述の
第1の実施形態で説明されているが、上述のシステム型
の種類の音声認識システムに等価的に適用し得ることは
当業者には明らかであろう。
【0126】第1の実施形態において説明された音声認
識システムは、例えば、表計算パッケージ、グラフィッ
クパッケージ、文書処理パッケージ等の、多くの異なる
ソフトウエアアプリケーションに関連して用いることが
できる。音声認識システムがそのような複数のソフトウ
エアアプリケーションと共に用いられる場合、各アプリ
ケーションに関して別々の単語及び言語モデルを有する
ことが望ましい。特に、各アプリケーションで用いられ
るフレーズが異なる場合にはなおさらである。その理由
は、単語モデルの数が増加するにつれて、そして言語モ
デルのサイズが増加するにつれて、システムが入力音声
を認識するのに必要な時間が増えてしまうからである。
従って、各アプリケーションについて、個別の単語及び
言語モデルを持つことにより、音声認識システムの処理
スピードは維持され得る。加えて、いくつかの単語及び
言語モデルは各アプリケーションで共通に用いられる。
【0127】更に当業者にとって好ましいことに、上述
の音声認識システムは多くの異なるタイプのハードウエ
アにも適用可能である。例えば、パーソナルコンピュー
タ等における明白な使用とは別に、音声認識処理は、フ
ァクシミリ装置、電話、プリンタ、複写機、或いはマン
マシンインターフェースを有する他のあらゆる装置のユ
ーザインターフェースとして利用できる。
【0128】本発明は、上述の典型的な実施形態によっ
て限定されるものではなく、当業者には明らかであるよ
うに、他の種々の変形及び実施形態が可能である。
【0129】
【発明の効果】以上説明したように、本発明によれば、
パターンシーケンスのマッチングを効率的に実行するこ
とができる。
【図面の簡単な説明】
【図1】本発明に係る実施形態が動作するためにプログ
ラムされ得るコンピュータの外観を示す図である。
【図2】音声認識システムの概要を示す図である。
【図3】例示的な複数の入力フレーズに関するトレーニ
ングプロセスの間に生成される言語モデルを表わす図で
ある。
【図4】動的計画法を用いて単語モデルに入力単語が連
携された場合において実行される処理を表わす図であ
る。
【図5】一つの入力フレームから次のフレームへの、許
容された状態遷移シーケンスを表わす図である。
【図6】図5に示される許容されたステート遷移シーケ
ンスを表わす図である。
【図7】第1の実施形態において用いられる、動的計画
法による整合技術を実現する処理手順を示すフローチャ
ートである。
【図8】単語モデル及び現アクティブリストと、それに
関連する新アクティブリストを示す図である。
【図9】基準モデル内で成長する動的計画法によるパス
のいくつかの例を示す図である。
【図10】図7に示されるステップS47において実行
される処理を示すフローチャートである。
【図11】図9に示される2つの動的計画法によるパス
が現入力フレームから次の入力フレームへ成長する様子
を示す図である。
【図12a】図8に示される単語モデルに関する現アク
ティブリスト中の最初のステートが処理された後の、図
8に示される新アクティブリストの内容を示す図であ
る。
【図12b】図8に示される単語モデルに関する現アク
ティブリスト中の2番目のステートが処理された後の、
図8に示される新アクティブリストの内容を示す図であ
る。
【図13a】図10に示されるステップS77において
実行される処理を示すフローチャートである。
【図13b】図10に示されるステップS77において
実行される処理を示すフローチャートである。
【図13c】 図10に示されるステップS77におい
て実行される処理を示すフローチャートである。
【図13d】 図10に示されるステップS77におい
て実行される処理を示すフローチャートである。
【図13e】 図10に示されるステップS77におい
て実行される処理を示すフローチャートである。
【図14】図7に示されるステップS51において実行
される処理を示すフローチャートである。
【図15】図14において示される処理の間に、ノード
Nに対して実行される処理を示す図である。
【図16】図7に示されるステップS57において実行
される処理を示すフローチャートである。
【図17】図8において示される単語モデルのエントリ
ステートを説明する図である。
【図18】図7のステップS65において実行される処
理を示すフローチャートである。
【図19】各単語のステートに対して用いられる異なる
刈り込み閾値をプロットした図である。
【図20】各単語のステートに対して用いられる刈り込
み閾値の好ましいバリエーションをプロットした図であ
る。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 エリ ツィケル−ハンコック イギリス国 ジーユー2 5ワイジェイ サリー, ギルドフォード, サリー リ サーチ パーク, オッカム ロード, オッカム コート 1 キヤノン リサー チ センター ヨーロッパ リミテッド内 (72)発明者 ジュリアン リチャード シーワッド イギリス国 ジーユー2 5ワイジェイ サリー, ギルドフォード, サリー リ サーチ パーク, オッカム ロード, オッカム コート 1 キヤノン リサー チ センター ヨーロッパ リミテッド内

Claims (153)

    【特許請求の範囲】
  1. 【請求項1】 第1信号を表わす第1パターン列と第2
    の信号を表わす第2パターン列とを、各第1信号パター
    ンを順次に処理してマッチングする方法であって、 処理中の現第1信号パターンについて各パスの終端にあ
    る第2信号パターンをアクティブパターンとして決定
    し、ここで、各パスは第2信号パターン列と当該現第1
    信号パターンまでの第1信号パターン列との間の可能な
    マッチングを表しており、 各アクティブパターンについて、前記現第1信号パター
    ンに関する当該アクティブパターンまで成長しているパ
    スについて、マッチングの近さを表わす累積値を格納
    し、 各アクティブパターンを逆の順序で処理し、 (i)次に処理されるべき第1信号に関して、現アクテ
    ィブパターンで終っているパスが、どの第2信号パター
    ンへ成長するかをパス成長の制約に基づいて判断し、 (ii)処理中の現第1信号パターンについて、前のアク
    ティブパターンの処理の間のステップ(i)においてい
    くつの第2信号パターンがそのように判断されたかを特
    定し、 (iii)前記ステップ(ii)において特定された前記第
    2信号パターンの数に依存して、現アクティブパターン
    に関連するパスを成長させる、 ことにより前記累積値を更新し、前記パスの成長に関し
    て設けられた制約に基づいて前記パスを成長させること
    を特徴とするマッチング方法。
  2. 【請求項2】 前記ステップ(iii)は、前記ステップ
    (ii)で特定された第2信号パターンに関して、現アク
    ティブパターンに関連するパスをそれら第2信号パター
    ンに成長させる前に比較を行う比較ステップを実行し、
    前記ステップ(ii)で特定されなかった第2信号パター
    ンへは、該比較ステップを実行することなしに現アクテ
    ィブパターンに関連するパスを成長させることを特徴と
    する請求項1に記載のマッチング方法。
  3. 【請求項3】 各第2信号パターンは、処理中の現第1
    信号パターンについてその第2信号パターンに到達する
    パスのうちの最良のパスの累積値を格納するための、当
    該第2信号パターンに関連する格納部D[]を有し、 前記比較ステップは、現アクティブパターンに格納され
    た累積値を前記ステップ(ii)で特定された第2信号パ
    ターンの少なくとも一つに関連した格納部に格納された
    累積値と比較することを特徴とする請求項2に記載のマ
    ッチング方法。
  4. 【請求項4】 前記ステップ(ii)は、 Sを処理中の現アクティブパターンとし、Nを次に処理さ
    れるべき第1信号パターンに関して現アクティブパター
    ンまで伸びているパスが成長し得る先となる現アクティ
    ブパターンを順序的に超える第2信号パターンの数と
    し、mを前記ステップ(ii)で特定された第2信号パタ
    ーンの数が初期値として設定される正の整数型変数とし
    たとき、 (a)D[S]をD[S+N+1-m]と比較し、 (b)D[S]がD[S+N+1-m]よりもよい場合は、現アクテ
    ィブパターンで終るパスをD[S+N+1-m]=D[S]とするこ
    とにより第2信号パターンへ成長させ、mを減少させて
    ステップ(a)へ戻り、 (c)D[S]がD[S+N+1-m]よりも悪い場合は、現アクテ
    ィブパターンで終るパスを第2信号パターンS+N+1-mへ
    は成長させず、また、第2信号パターンS+N+1-mを順序
    的に超えるいかなる第2信号パターンへも成長させない
    ことを特徴とする請求項3に記載のマッチング方法。
  5. 【請求項5】 前記ステップ(a)、(b)、(c)
    は、mがゼロより大である間実行されることを特徴とす
    る請求項4に記載のマッチング方法。
  6. 【請求項6】 mがNよりも小さいことを特徴とする請求
    項4または5に記載のマッチング方法。
  7. 【請求項7】 成長中の全パスの最小累積値を格納する
    ステップと、 現アクティブパターンに関連するパスがD[S+N]=D[S]
    とすることによって第2信号パターンS+Nへ成長される
    場合に、D[S]を前記最小累積値と比較するステップ
    と、 D[S]の方が最小累積値よりよい場合には最小累積値を
    D[S]に一致させるステップとを更に備えることを特徴
    とする請求項4乃至6のいずれかに記載のマッチング方
    法。
  8. 【請求項8】 現第1信号パターンに対する前記アクテ
    ィブパターンが逆順序で現アクティブリストに登録さ
    れ、ステップ(i)で特定された第2信号パターンが、
    それらがまだ登録されていない場合には、逆順序で新ア
    クティブリストに登録されることを特徴とする請求項1
    乃至7のいずれかに記載のマッチング方法。
  9. 【請求項9】 直前のアクティブパターンを処理した
    後、識別子を用いて新アクティブリストに登録された第
    2信号パターンのシーケンスで最も先頭側の第2信号パ
    ターンを特定するステップを更に備え、 前記ステップ(ii)は、処理中の現アクティブパターン
    と前記識別子により特定される第2信号パターンとの間
    の位置関係を決定することにより、ステップ(i)で決
    定された第2信号パターンのいくつが前もってそのよう
    に決定されていたかを特定することを特徴とする請求項
    8に記載のマッチング方法。
  10. 【請求項10】 前記位置関係は、その関係が持つこと
    のできる異なる可能性をテストすることにより決定され
    ることを特徴とする請求項9に記載のマッチング方法。
  11. 【請求項11】 Sを処理中の現アクティブパターン、
    Nを後続の第1信号パターンに関して現アクティブパタ
    ーンで終るパスが成長し得る先の現アクティブパターン
    を超える第2信号パターンの数とした場合に、 (A)前記識別子が、順序的に、処理中の現アクティブ
    パターンの直後にある第2信号パターンを特定する状況
    と、 (B)前記識別子が、順序的に第2信号パターンS+N
    を超える第2信号パターンを特定する状況と、 (C)識別子が、1からN−1の値を取るiについて、
    第2信号パターンS+iを特定する状況とをテストする
    ことにより前記位置関係が決定されることを特徴とする
    請求項10に記載のマッチング方法。
  12. 【請求項12】 最初に前記状況(A)をテストし、
    (A)が失敗に終った場合にのみ前記状況(B)をテス
    トすることを特徴とする請求項11に記載のマッチング
    方法。
  13. 【請求項13】 前記状況(B)が失敗に終った場合に
    のみ前記状況(C)をテストすることを特徴とする請求
    項12に記載のマッチング方法。
  14. 【請求項14】 iの現在値に対して前記状況(C)を
    テストし、iに対する状況(C)が失敗の場合にのみ、
    i+1に対する状況(C)をテストすることを特徴とす
    る請求項13に記載のマッチング方法。
  15. 【請求項15】 現第1信号パターンに関して全てのア
    クティブパターンを処理したことを判断できるように、
    現アクティブリストの終りに番人パターンが加えられる
    ことを特徴とする請求項8乃至14のいずれかに記載の
    マッチング方法。
  16. 【請求項16】 前記番人パターンに関連する累積値は
    所定値に設定され、各アクティブパターンの累積値を前
    記所定値と比較することにより前記番人パターンを判断
    することを特徴とする請求項15に記載のマッチング方
    法。
  17. 【請求項17】 前記所定値がゼロであることを特徴と
    する請求項16に記載のマッチング方法。
  18. 【請求項18】 現アクティブリスト上の全てのアクテ
    ィブパターンを処理した後に、新アクティブリストの終
    りに前記番人パターンを付加するステップを更に備える
    ことを特徴とする請求項15乃至17のいずれかに記載
    のマッチング方法。
  19. 【請求項19】 現アクティブパターンの処理によって
    新アクティブリストが更新された後、前記識別子は、新
    アクティブリスト上の第2信号を表わすパターンのシー
    ケンスにおける最も先頭側の第2信号パターンを特定す
    るべく設定されることを特徴とする請求項9乃至18の
    いずれかに記載のマッチング方法。
  20. 【請求項20】 前記パスの成長に関する制約の一つ
    が、前記第2信号パターンが前記第1信号パターンとマ
    ッチングした場合に、順序的にその第2信号パターンよ
    り前の第2信号パターンは同じパス上の後続の第1信号
    パターンとはマッチングされ得ないことであることを特
    徴とする請求項1乃至19のいずれかに記載のマッチン
    グ方法。
  21. 【請求項21】 前記パスの成長に関する制約の一つ
    が、処理中の連続する第1信号パターンに対して、同じ
    第2信号パターンとマッチングするパスに関連する累積
    値にペナルティを加えることであることを特徴とする請
    求項1乃至20のいずれかに記載のマッチング方法。
  22. 【請求項22】 現アクティブパターンに関連する累積
    値が閾値よりも良い場合にのみ、その現アクティブパタ
    ーンの累積値を更新し、現アクティブパターンに関連す
    るパスを成長させることを特徴とする請求項1乃至21
    のいずれかに記載のマッチング方法。
  23. 【請求項23】 各第1信号パターンに対して処理され
    るアクティブパターンの数を、与えられた最大数より少
    なく維持するために前記閾値を変化させることを特徴と
    する請求項22に記載のマッチング方法。
  24. 【請求項24】 現第1信号パターンに後続する第1信
    号パターンの処理の間に用いられる閾値が該現第1信号
    パターンの処理の間に、処理されるべき後続の第1信号
    パターンに対する新アクティブリストにおける第2信号
    パターンの合計数に依存して、決定されることを特徴と
    する請求項23に記載のマッチング方法。
  25. 【請求項25】 複数の閾値が用いられ、処理中の現第
    1信号パターンに対して得られているパスについて用い
    られる閾値が、当該得られているパスの到達端にある第
    2信号パターンの、前記第2信号を表わす第2信号パタ
    ーン列内における位置に依存することを特徴とする請求
    項22乃至24のいずれかに記載のマッチング方法。
  26. 【請求項26】 シーケンスの始まりにおいて終端を有
    するパスに対して用いられる閾値が、そのシーケンスの
    終わりにおいて終端を有するパスに用いられる閾値より
    も大きいことを特徴とする請求項25に記載のマッチン
    グ方法。
  27. 【請求項27】 柔軟な刈り込み処理が実行され、それ
    によって、閾値よりも悪い累積値を有するいくつかのパ
    スが破棄されずに残ることを特徴とする請求項22乃至
    26のいずれかに記載のマッチング方法。
  28. 【請求項28】 現第1信号パターンの処理は、後続の
    第1信号パターンが受信される前に実行されることを特
    徴とする請求項1乃至27のいずれかに記載のマッチン
    グ方法。
  29. 【請求項29】 第1信号の全体が、第1信号パターン
    が処理される前に受信されることを特徴とする請求項1
    乃至28のいずれかに記載のマッチング方法。
  30. 【請求項30】 前記第2信号パターンはテンプレート
    を表わし、前記累積値は距離的計測値であることを特徴
    とする請求項1乃至29のいずれかに記載のマッチング
    方法。
  31. 【請求項31】 前記第2信号パターンは統計モデルを
    表わし、前記累積値は確率的計測値であることを特徴と
    する請求項1乃至29のいずれかに記載のマッチング方
    法。
  32. 【請求項32】 前記第1信号を複数の第2信号と比較
    するステップを更に備えることを特徴とする請求項1乃
    至31のいずれかに記載のマッチング方法。
  33. 【請求項33】 1つの第2信号において成長するパス
    が引き続き別の第2信号へ成長することを許容すること
    により、前記第1信号は前記複数の第2信号からなるシ
    ーケンスとマッチングし得ることを特徴とする請求項3
    2に記載のマッチング方法。
  34. 【請求項34】 第1信号がマッチングし得る第2信号
    の列は、前もって規定されたルールによって制限される
    ことを特徴とする請求項33に記載のマッチング方法。
  35. 【請求項35】 前記方法が、動的計画法によるマッチ
    ング処理を用いることを特徴とする請求項1乃至34の
    いずれかに記載のマッチング方法。
  36. 【請求項36】 パスの累積値が、現第1信号パターン
    と現アクティブパターンの間の距離を表す距離計測値を
    加えることにより更新されることを特徴とする請求項3
    1乃至35のいずれかに記載のマッチング方法。
  37. 【請求項37】 前記パターンの各々が複数のパラメー
    タ値によて表わされ、前記距離計測値は、現第1信号パ
    ターンと現アクティブパターンとの間の対応するパラメ
    ータ値の差の度合いの合計を表わすことを特徴とする請
    求項33に記載のマッチング方法。
  38. 【請求項38】 前記距離計測は、d( )を距離計測
    値、Spを現アクティブパターンのp番目のパラメータ
    値、fk pを処理中の現第1信号パターンのp番目のパラ
    メータとしたとき、 【数1】 によって表わされることを特徴とする請求項34に記載
    のマッチング方法。
  39. 【請求項39】 パスの累積値に加えられるべき距離計
    測値を決定するのにルックアップテーブルが用いられる
    ことを特徴とする請求項38に記載のマッチング方法。
  40. 【請求項40】 現第1信号パターンと現アクティブパ
    ターンの夫々のパラメータ値は、ルックアップテーブル
    をアドレスし、そのルックアップテーブルのその位置に
    格納されている値が2つのパラメータ値の差に対応する
    ことを特徴とする請求項39に記載のマッチング方法。
  41. 【請求項41】 現第1信号パターンの処理に先立っ
    て、現第1信号パターンのパラメータ値を用いてルック
    アップ値のサブテーブルを特定し、パスに関する累積値
    に加えられるべき距離計測値が現アクティブパターンの
    パラメータ値でルックアップ値のサブテーブルをアドレ
    スすることにより決定されることを特徴とする請求項3
    9に記載のマッチング方法。
  42. 【請求項42】 現第1信号パターンのp番目のパラメ
    ータに依存するルックアップテーブルのアドレスをTP
    pとし、現アクティブパターンのp番目のパラメータ値
    をSpとしたとき、パスの累積値に加えられるべき距離
    計測値が 【数2】 により決定されることを特徴とする請求項39に記載の
    マッチング方法。
  43. 【請求項43】 TPpが処理されるべき第1信号パタ
    ーンにつき1度決定されることを特徴とする請求項42
    に記載のマッチング方法。
  44. 【請求項44】 前記第1及び第2信号は音声を表わ
    し、各パターンは対応する時間フレームの間の音声の音
    響的特徴を表わす複数のパラメータを備えることを特徴
    とする請求項1乃至43のいずれかに記載のマッチング
    方法。
  45. 【請求項45】 入力音声を複数の基準音声信号と比較
    することにより入力音声を認識する音声認識方法であっ
    て、 前記入力音声信号を表わす入力パターンのシーケンスを
    抽出し、 基準パターンのシーケンスを格納し、ここで、各シーケ
    ンスは対応する基準音声信号を表わし入力パターンのシ
    ーケンスを請求項44に記載の方法を用いて基準音声信
    号とマッチングし、 前記マッチングステップによって決定された累積値から
    認識結果を提供することを特徴とする音声認識方法。
  46. 【請求項46】 前記認識結果は、入力パターンのシー
    ケンスにおける最後の入力パターンで終るパスのうち、
    最良の累積値を有するパスを決定することで提供される
    ことを特徴とする請求項45に記載の音声認識方法。
  47. 【請求項47】 第1信号を表わす第1パターン列と第
    2の信号を表わす第2パターン列とを、各第1信号パタ
    ーンを順次に処理してマッチングする方法であって、 処理中の現第1信号パターンについて各パスの終端にあ
    る第2信号パターンをアクティブパターンとして決定
    し、ここで、各パスは第2信号パターン列と当該現第1
    信号パターンまでの第1信号パターン列との間の可能な
    マッチングを表しており、 各アクティブパターンについて、前記現第1信号パター
    ンに関する当該アクティブパターンまで成長しているパ
    スについて、マッチングの近さを表わす累積値を格納
    し、 各アクティブパターンを反対の順序で処理することによ
    り前記累積値を更新し、パスの成長に関して設けられた
    制約に基づいて前記パスを成長させ、 前記パターンの各々は複数のパラメータ値によって表わ
    され、パスの累積値は現第1信号パターンと現アクティ
    ブパターンとの間の距離を表す距離計測値を加えること
    によって更新され、現第1信号パターンと現アクティブ
    パターンの夫々のパラメータ値はルックアップテーブル
    をアドレスし、そのルックアップテーブルのその位置に
    格納されている値が2つのパラメータ値の差に対応する
    ことを特徴とするマッチング方法。
  48. 【請求項48】 現第1信号パターンの処理に先立っ
    て、現第1信号パターンのパラメータ値を用いてルック
    アップ値のサブテーブルを特定し、パスに関する累積値
    に加えられるべき距離計測値が現アクティブパターンの
    パラメータ値でルックアップ値のサブテーブルをアドレ
    スすることにより決定されることを特徴とする請求項4
    7に記載のマッチング方法。
  49. 【請求項49】 現第1信号パターンのp番目のパラメ
    ータに依存するルックアップテーブルのアドレスをTP
    pとし、現アクティブパターンのp番目のパラメータ地
    をSpとしたとき、パスの累積値に加えられるべき距離
    計測値が 【数3】 により決定されることを特徴とする請求項47または4
    8に記載のマッチング方法。
  50. 【請求項50】 TPpが処理されるべき第1信号パタ
    ーンにつき1度決定されることを特徴とする請求項49
    に記載のマッチング方法。
  51. 【請求項51】 第1信号を表わす第1パターン列と第
    2の信号を表わす第2パターン列とを、各第1信号パタ
    ーンを順次に処理してマッチングする装置であって、 処理中の現第1信号パターンについて各パスの終端にあ
    る第2信号パターンをアクティブパターンとして決定す
    る決定手段と、ここで、各パスは第2信号パターン列と
    当該現第1信号パターンまでの第1信号パターン列との
    間の可能なマッチングを表しており、 各アクティブパターンについて、前記現第1信号パター
    ンに関する当該アクティブパターンまで成長しているパ
    スについて、マッチングの近さを表わす累積値を格納す
    る格納手段と、 各アクティブパターンを逆の順序で処理し、 (i)次に処理されるべき第1信号に関して、現アクテ
    ィブパターンで終っているパスが、どの第2信号パター
    ンへ成長するかを前記パス成長の制約に基づいて判断
    し、 (ii)処理中の現第1信号パターンについて、前のアク
    ティブパターンの処理の間のステップ(i)においてい
    くつの第2信号パターンがそのように判断されたかを特
    定し、 (iii)前記ステップ(ii)において特定された前記第
    2信号パターンの数に依存して、現アクティブパターン
    に関連するパスを成長させる、 ことにより前記累積値を更新し、パスの成長に関して設
    けられた制約に基づいて前記パスを成長させるパス成長
    手段とを備えることを特徴とするマッチング装置。
  52. 【請求項52】 前記パス成長手段において、前記ステ
    ップ(iii)は、前記ステップ(ii)で特定された第2
    信号パターンに関して、現アクティブパターンに関連す
    るパスをそれら第2信号パターンに成長させる前に比較
    を行う比較ステップを実行し、前記ステップ(ii)で特
    定されなかった第2信号パターンへは、該比較ステップ
    を実行することなしに現アクティブパターンに関連する
    パスを成長させることを特徴とする請求項51に記載の
    マッチング装置。
  53. 【請求項53】 各第2信号パターンは、処理中の現第
    1信号パターンについてその第2信号パターンに到達す
    るパスのうちの最良のパスの累積値を格納するための、
    当該第2信号パターンに関連する格納部D[]を有し、 前記比較ステップは、現アクティブパターンに格納され
    た累積値を前記ステップ(ii)で特定された第2信号パ
    ターンの少なくとも一つに関連した格納部に格納された
    累積値と比較することを特徴とする請求項52に記載の
    マッチング装置。
  54. 【請求項54】 前記ステップ(ii)は、 Sを処理中の現アクティブパターンとし、Nを次に処理さ
    れるべき第1信号パターンに関して現アクティブパター
    ンまで伸びているパスが成長し得る先となる現アクティ
    ブパターンを順序的に超える第2信号パターンの数と
    し、mを前記ステップ(ii)で特定された第2信号パタ
    ーンの数が初期値として設定される正の整数型変数とし
    たとき、 (a)D[S]をD[S+N+1-m]と比較し、 (b)D[S]がD[S+N+1-m]よりもよい場合は、現アクテ
    ィブパターンで終るパスをD[S+N+1-m]=D[S]とするこ
    とにより第2信号パターンへ成長させ、mを減少させて
    ステップ(a)へ戻り、 (c)D[S]がD[S+N+1-m]よりも悪い場合は、現アクテ
    ィブパターンで終るパスを第2信号パターンS+N+1-mへ
    は成長させず、また、第2信号パターンS+N+1-mを順序
    的に超えるいかなる第2信号パターンへも成長させない
    ことを特徴とする請求項53に記載のマッチング装置。
  55. 【請求項55】 前記ステップ(a)、(b)、(c)
    は、mがゼロより大である間実行されることを特徴とす
    る請求項54に記載のマッチング装置。
  56. 【請求項56】 mがNよりも小さいことを特徴とする請
    求項54または55に記載のマッチング装置。
  57. 【請求項57】 成長中の全パスの最小累積値を格納す
    る手段と、 現アクティブパターンに関連するパスがD[S+N]=D[S]
    とすることによって第2信号パターンS+Nへ成長される
    場合に、D[S]を前記最小累積値と比較する手段と、 D[S]の方が最小累積値よりよい場合には最小累積値を
    D[S]に一致させる手段とを更に備えることを特徴とす
    る請求項54乃至56のいずれかに記載のマッチング装
    置。
  58. 【請求項58】 現第1信号パターンに対する前記アク
    ティブパターンが逆順序で現アクティブリストに登録さ
    れ、ステップ(i)で特定された第2信号パターンが、
    それらがまだ登録されていない場合には、逆順序で新ア
    クティブリストに登録されることを特徴とする請求項5
    1乃至57のいずれかに記載のマッチング装置。
  59. 【請求項59】 直前のアクティブパターンを処理した
    後、識別子を用いて新アクティブリストに登録された第
    2信号パターンのシーケンスで最も先頭側の第2信号パ
    ターンを特定する手段を更に備え、 前記ステップ(ii)は、処理中の現アクティブパターン
    と前記識別子により特定される第2信号パターンとの間
    の位置関係を決定することにより、ステップ(i)で決
    定された第2信号パターンのいくつが前もってそのよう
    に決定されていたかを特定することを特徴とする請求項
    58に記載のマッチング装置。
  60. 【請求項60】 前記位置関係は、その関係が持つこと
    のできる異なる可能性をテストすることにより決定され
    ることを特徴とする請求項59に記載のマッチング装
    置。
  61. 【請求項61】 Sを処理中の現アクティブパターン、
    Nを後続の第1信号パターンに関して現アクティブパタ
    ーンで終るパスが成長し得る先の現アクティブパターン
    を超える第2信号パターンの数とした場合に、 (A)前記識別子が、順序的に、処理中の現アクティブ
    パターンの直後にある第2信号パターンを特定する状況
    と、 (B)前記識別子が、順序的に第2信号パターンS+N
    を超える第2信号パターンを特定する状況と、 (C)識別子が、1からN−1の値を取るiについて、
    第2信号パターンS+iを特定する状況とをテストする
    ことにより前記位置関係が決定されることを特徴とする
    請求項60に記載のマッチング装置。
  62. 【請求項62】 最初に前記状況(A)をテストし、
    (A)が失敗に終った場合にのみ前記状況(B)をテス
    トすることを特徴とする請求項61に記載のマッチング
    装置。
  63. 【請求項63】 前記状況(B)が失敗に終った場合に
    のみ前記状況(C)をテストすることを特徴とする請求
    項62に記載のマッチング装置。
  64. 【請求項64】 iの現在値に対して前記状況(C)を
    テストし、iに対する状況(C)が失敗の場合にのみ、
    i+1に対する状況(C)をテストすることを特徴とす
    る請求項63に記載のマッチング装置。
  65. 【請求項65】 現第1信号パターンに関して全てのア
    クティブパターンを処理したことを判断できるように、
    現アクティブリストの終りに番人パターンが加えられる
    ことを特徴とする請求項58乃至64のいずれかに記載
    のマッチング装置。
  66. 【請求項66】 前記番人パターンに関連する累積値は
    所定値に設定され、各アクティブパターンの累積値を前
    記所定値と比較することにより前記番人パターンを判断
    することを特徴とする請求項65に記載のマッチング装
    置。
  67. 【請求項67】 前記所定値がゼロであることを特徴と
    する請求項66に記載のマッチング装置。
  68. 【請求項68】 現アクティブリスト上の全てのアクテ
    ィブパターンを処理した後に、新アクティブリストの終
    りに前記番人パターンを付加する手段を更に備えること
    を特徴とする請求項65乃至67のいずれかに記載のマ
    ッチング装置。
  69. 【請求項69】 現アクティブパターンの処理によって
    新アクティブリストが更新された後、前記識別子は、新
    アクティブリスト上の第2信号を表わすパターンのシー
    ケンスにおける最も先頭側の第2信号パターンを特定す
    るべく設定されることを特徴とする請求項59乃至68
    のいずれかに記載のマッチング装置。
  70. 【請求項70】 前記パスの成長に関する制約の一つ
    が、前記第2信号パターンが前記第1信号パターンとマ
    ッチングした場合に、順序的にその第2信号パターンよ
    り前の第2信号パターンは同じパス上の後続の第1信号
    パターンとはマッチングされ得ないことであることを特
    徴とする請求項51乃至69のいずれかに記載のマッチ
    ング装置。
  71. 【請求項71】 前記パスの成長に関する制約の一つ
    が、処理中の連続する第1信号パターンに対して、同じ
    第2信号パターンとマッチングするパスに関連する累積
    値にペナルティを加えることであることを特徴とする請
    求項51乃至70のいずれかに記載のマッチング装置。
  72. 【請求項72】 現アクティブパターンに関連する累積
    値が閾値よりも良い場合にのみ、その現アクティブパタ
    ーンの累積値を更新し、現アクティブパターンに関連す
    るパスを成長させることを特徴とする請求項51乃至7
    1のいずれかに記載のマッチング装置。
  73. 【請求項73】 各第1信号パターンに対して処理され
    るアクティブパターンの数を、与えられた最大数より少
    なく維持するために前記閾値を変化させることを特徴と
    する請求項72に記載のマッチング装置。
  74. 【請求項74】 現第1信号パターンに後続する第1信
    号パターンの処理の間に用いられる閾値が該現第1信号
    パターンの処理の間に、処理されるべき後続の第1信号
    パターンに対する新アクティブリストにおける第2信号
    パターンの合計数に依存して、決定されることを特徴と
    する請求項73に記載のマッチング装置。
  75. 【請求項75】 複数の閾値が用いられ、処理中の現第
    1信号パターンに対して得られているパスについて用い
    られる閾値が、当該得られているパスの到達端にある第
    2信号パターンの、前記第2信号を表わす第2信号パタ
    ーン列内における位置に依存することを特徴とする請求
    項72乃至74のいずれかに記載のマッチング装置。
  76. 【請求項76】 シーケンスの始まりにおいて終端を有
    するパスに対して用いられる閾値が、そのシーケンスの
    終わりにおいて終端を有するパスに用いられる閾値より
    も大きいことを特徴とする請求項75に記載のマッチン
    グ装置。
  77. 【請求項77】 柔軟な刈り込み処理が実行され、それ
    によって、閾値よりも悪い累積値を有するいくつかのパ
    スが破棄されずに残ることを特徴とする請求項72乃至
    76のいずれかに記載のマッチング装置。
  78. 【請求項78】 現第1信号パターンの処理は、後続の
    第1信号パターンが受信される前に実行されることを特
    徴とする請求項51乃至77のいずれかに記載のマッチ
    ング装置。
  79. 【請求項79】 第1信号の全体が、第1信号パターン
    が処理される前に受信されることを特徴とする請求項5
    1乃至78のいずれかに記載のマッチング装置。
  80. 【請求項80】 前記第2信号パターンはテンプレート
    を表わし、前記累積値は距離的計測値であることを特徴
    とする請求項51乃至79のいずれかに記載のマッチン
    グ装置。
  81. 【請求項81】 前記第2信号パターンは統計モデルを
    表わし、前記累積値は確率的計測値であることを特徴と
    する請求項51乃至79のいずれかに記載のマッチング
    装置。
  82. 【請求項82】 前記第1信号を複数の第2信号と比較
    する手段を更に備えることを特徴とする請求項51乃至
    81のいずれかに記載のマッチング装置。
  83. 【請求項83】 1つの第2信号において成長するパス
    が引き続き別の第2信号へ成長することを許容すること
    により、前記第1信号は前記複数の第2信号からなるシ
    ーケンスとマッチングし得ることを特徴とする請求項8
    2に記載のマッチング装置。
  84. 【請求項84】 第1信号がマッチングし得る第2信号
    の列は、前もって規定されたルールによって制限される
    ことを特徴とする請求項83に記載のマッチング装置。
  85. 【請求項85】 前記パスを決定するために、動的計画
    法によるマッチング処理を実行することを特徴とする請
    求項51乃至84のいずれかに記載のマッチング装置。
  86. 【請求項86】 パスの累積値が、現第1信号パターン
    と現アクティブパターンの間の距離を表す距離計測値を
    加えることにより更新されることを特徴とする請求項8
    1乃至85のいずれかに記載のマッチング装置。
  87. 【請求項87】 前記パターンの各々が複数のパラメー
    タ値によて表わされ、前記距離計測値は、現第1信号パ
    ターンと現アクティブパターンとの間の対応するパラメ
    ータ値の差の度合いの合計を表わすことを特徴とする請
    求項83に記載のマッチング装置。
  88. 【請求項88】 前記距離計測は、d( )を距離計測
    値、Spを現アクティブパターンのp番目のパラメータ
    値、fk pを処理中の現第1信号パターンのp番目のパラ
    メータとしたとき、 【数4】 によって表わされることを特徴とする請求項84に記載
    のマッチング装置。
  89. 【請求項89】 パスの累積値に加えられるべき距離計
    測値を決定するのにルックアップテーブルが用いられる
    ことを特徴とする請求項88に記載のマッチング装置。
  90. 【請求項90】 現第1信号パターンと現アクティブパ
    ターンの夫々のパラメータ値は、ルックアップテーブル
    をアドレスし、そのルックアップテーブルのその位置に
    格納されている値が2つのパラメータ値の差に対応する
    ことを特徴とする請求項89に記載のマッチング装置。
  91. 【請求項91】 現第1信号パターンの処理に先立っ
    て、現第1信号パターンのパラメータ値を用いてルック
    アップ値のサブテーブルを特定し、パスに関する累積値
    に加えられるべき距離計測値が現アクティブパターンの
    パラメータ値でルックアップ値のサブテーブルをアドレ
    スすることにより決定されることを特徴とする請求項8
    9に記載のマッチング装置。
  92. 【請求項92】 現第1信号パターンのp番目のパラメ
    ータに依存するルックアップテーブルのアドレスをTP
    pとし、現アクティブパターンのp番目のパラメータ値
    をSpとしたとき、パスの累積値に加えられるべき距離
    計測値が 【数5】 により決定されることを特徴とする請求項89に記載の
    マッチング装置。
  93. 【請求項93】 TPpが処理されるべき第1信号パタ
    ーンにつき1度決定されることを特徴とする請求項92
    に記載のマッチング装置。
  94. 【請求項94】 前記第1及び第2信号は音声を表わ
    し、各パターンは対応する時間フレームの間の音声の音
    響的特徴を表わす複数のパラメータを備えることを特徴
    とする請求項51乃至93のいずれかに記載のマッチン
    グ装置。
  95. 【請求項95】 入力音声を複数の基準音声信号と比較
    することにより入力音声を認識する音声認識装置であっ
    て、 前記入力音声信号を表わす入力パターンのシーケンスを
    抽出する抽出手段と、基準パターンのシーケンスを格納
    する格納手段と、ここで、各シーケンスは対応する基準
    音声信号を表わし、 入力パターンのシーケンスを請求項94に記載の方法を
    用いて基準音声信号とマッチングするマッチング手段
    と、 前記マッチング手段によって決定された累積値から認識
    結果を提供する提供手段とを備えることを特徴とする音
    声認識装置。
  96. 【請求項96】 前記認識結果は、入力パターンのシー
    ケンスにおける最後の入力パターンで終るパスのうち、
    最良の累積値を有するパスを決定することで提供される
    ことを特徴とする請求項95に記載の音声認識装置。
  97. 【請求項97】 第1信号を表わす第1パターン列と第
    2の信号を表わす第2パターン列とを、各第1信号パタ
    ーンを順次に処理してマッチングする装置であって、 処理中の現第1信号パターンについて各パスの終端にあ
    る第2信号パターンをアクティブパターンとして決定す
    る決定手段と、ここで、各パスは第2信号パターン列と
    当該現第1信号パターンまでの第1信号パターン列との
    間の可能なマッチングを表しており、 各アクティブパターンについて、前記現第1信号パター
    ンに関する当該アクティブパターンまで成長しているパ
    スについて、マッチングの近さを表わす累積値を格納す
    る格納手段と、 各アクティブパターンを反対の順序で処理することによ
    り前記累積値を更新し、パスの成長に関して設けられた
    制約に基づいて前記パスを成長させるパス成長手段とを
    備え、 前記パターンの各々は複数のパラメータ値によって表わ
    され、パスの累積値は現第1信号パターンと現アクティ
    ブパターンとの間の距離を表す距離計測値を加えること
    によって更新され、現第1信号パターンと現アクティブ
    パターンの夫々のパラメータ値はルックアップテーブル
    をアドレスし、そのルックアップテーブルのその位置に
    格納されている値が2つのパラメータ値の差に対応する
    ことを特徴とするマッチング装置。
  98. 【請求項98】 現第1信号パターンの処理に先立っ
    て、現第1信号パターンのパラメータ値を用いてルック
    アップ値のサブテーブルを特定し、パスに関する累積値
    に加えられるべき距離計測値が現アクティブパターンの
    パラメータ値でルックアップ値のサブテーブルをアドレ
    スすることにより決定されることを特徴とする請求項9
    7に記載のマッチング装置。
  99. 【請求項99】 現第1信号パターンのp番目のパラメ
    ータに依存するルックアップテーブルのアドレスをTP
    pとし、現アクティブパターンのp番目のパラメータ地
    をSpとしたとき、パスの累積値に加えられるべき距離
    計測値が 【数6】 により決定されることを特徴とする請求項97または9
    8に記載のマッチング装置。
  100. 【請求項100】 TPpが処理されるべき第1信号パ
    ターンにつき1度決定されることを特徴とする請求項9
    9に記載のマッチング装置。
  101. 【請求項101】 第1信号を表わす第1パターン列と
    第2の信号を表わす第2パターン列とを、各第1信号パ
    ターンを順次に処理してマッチングするマッチング処理
    をコンピュータに実行させるための処理ステップを格納
    する記憶媒体であって、該処理ステップが、 処理中の現第1信号パターンについて各パスの終端にあ
    る第2信号パターンをアクティブパターンとして決定
    し、ここで、各パスは第2信号パターン列と当該現第1
    信号パターンまでの第1信号パターン列との間の可能な
    マッチングを表しており、 各アクティブパターンについて、前記現第1信号パター
    ンに関する当該アクティブパターンまで成長しているパ
    スについて、マッチングの近さを表わす累積値を格納
    し、 各アクティブパターンを逆の順序で処理し、 (i)次に処理されるべき第1信号に関して、現アクテ
    ィブパターンで終っているパスが、どの第2信号パター
    ンへ成長するかを前記パス成長の制約に基づいて判断
    し、 (ii)処理中の現第1信号パターンについて、前のアク
    ティブパターンの処理の間のステップ(i)においてい
    くつの第2信号パターンがそのように判断されたかを特
    定し、 (iii)前記ステップ(ii)において特定された前記第
    2信号パターンの数に依存して、現アクティブパターン
    に関連するパスを成長させる、 ことにより前記累積値を更新し、パスの成長に関して設
    けられた制約に基づいて前記パスを成長させることを特
    徴とする記憶媒体。
  102. 【請求項102】 前記ステップ(iii)は、前記ステ
    ップ(ii)で特定された第2信号パターンに関して、現
    アクティブパターンに関連するパスをそれら第2信号パ
    ターンに成長させる前に比較を行う比較ステップを実行
    し、前記ステップ(ii)で特定されなかった第2信号パ
    ターンへは、該比較ステップを実行することなしに現ア
    クティブパターンに関連するパスを成長させることを特
    徴とする請求項101に記載の記憶媒体。
  103. 【請求項103】 各第2信号パターンは、処理中の現
    第1信号パターンについてその第2信号パターンに到達
    するパスのうちの最良のパスの累積値を格納するため
    の、当該第2信号パターンに関連する格納部D[]を有
    し、 前記比較ステップは、現アクティブパターンに格納され
    た累積値を前記ステップ(ii)で特定された第2信号パ
    ターンの少なくとも一つに関連した格納部に格納された
    累積値と比較することを特徴とする請求項102に記載
    の記憶媒体。
  104. 【請求項104】 前記ステップ(ii)は、 Sを処理中の現アクティブパターンとし、Nを次に処理さ
    れるべき第1信号パターンに関して現アクティブパター
    ンまで伸びているパスが成長し得る先となる現アクティ
    ブパターンを順序的に超える第2信号パターンの数と
    し、mを前記ステップ(ii)で特定された第2信号パタ
    ーンの数が初期値として設定される正の整数型変数とし
    たとき、 (a)D[S]をD[S+N+1-m]と比較し、 (b)D[S]がD[S+N+1-m]よりもよい場合は、現アクテ
    ィブパターンで終るパスをD[S+N+1-m]=D[S]とするこ
    とにより第2信号パターンへ成長させ、mを減少させて
    ステップ(a)へ戻り、 (c)D[S]がD[S+N+1-m]よりも悪い場合は、現アクテ
    ィブパターンで終るパスを第2信号パターンS+N+1-mへ
    は成長させず、また、第2信号パターンS+N+1-mを順序
    的に超えるいかなる第2信号パターンへも成長させない
    ことを特徴とする請求項103に記載の記憶媒体。
  105. 【請求項105】 前記ステップ(a)、(b)、
    (c)は、mがゼロより大である間実行されることを特
    徴とする請求項104に記載の記憶媒体。
  106. 【請求項106】 mがNよりも小さいことを特徴とする
    請求項104または105に記載の記憶媒体。
  107. 【請求項107】 成長中の全パスの最小累積値を格納
    するステップと、 現アクティブパターンに関連するパスがD[S+N]=D[S]
    とすることによって第2信号パターンS+Nへ成長される
    場合に、D[S]を前記最小累積値と比較するステップ
    と、 D[S]の方が最小累積値よりよい場合には最小累積値を
    D[S]に一致させるステップとを更に備えることを特徴
    とする請求項104乃至106のいずれかに記載の記憶
    媒体。
  108. 【請求項108】 現第1信号パターンに対する前記ア
    クティブパターンが逆順序で現アクティブリストに登録
    され、ステップ(i)で特定された第2信号パターン
    が、それらがまだ登録されていない場合には、逆順序で
    新アクティブリストに登録されることを特徴とする請求
    項101乃至107のいずれかに記載の記憶媒体。
  109. 【請求項109】 直前のアクティブパターンを処理し
    た後、識別子を用いて新アクティブリストに登録された
    第2信号パターンのシーケンスで最も先頭側の第2信号
    パターンを特定するステップを更に備え、 前記ステップ(ii)は、処理中の現アクティブパターン
    と前記識別子により特定される第2信号パターンとの間
    の位置関係を決定することにより、ステップ(i)で決
    定された第2信号パターンのいくつが前もってそのよう
    に決定されていたかを特定することを特徴とする請求項
    108に記載の記憶媒体。
  110. 【請求項110】 前記位置関係は、その関係が持つこ
    とのできる異なる可能性をテストすることにより決定さ
    れることを特徴とする請求項109に記載の記憶媒体。
  111. 【請求項111】 Sを処理中の現アクティブパター
    ン、Nを後続の第1信号パターンに関して現アクティブ
    パターンで終るパスが成長し得る先の現アクティブパタ
    ーンを超える第2信号パターンの数とした場合に、 (A)前記識別子が、順序的に、処理中の現アクティブ
    パターンの直後にある第2信号パターンを特定する状況
    と、 (B)前記識別子が、順序的に第2信号パターンS+N
    を超える第2信号パターンを特定する状況と、 (C)識別子が、1からN−1の値を取るiについて、
    第2信号パターンS+iを特定する状況とをテストする
    ことにより前記位置関係が決定されることを特徴とする
    請求項110に記載の記憶媒体。
  112. 【請求項112】 最初に前記状況(A)をテストし、
    (A)が失敗に終った場合にのみ前記状況(B)をテス
    トすることを特徴とする請求項111に記載の記憶媒
    体。
  113. 【請求項113】 前記状況(B)が失敗に終った場合
    にのみ前記状況(C)をテストすることを特徴とする請
    求項112に記載の記憶媒体。
  114. 【請求項114】 iの現在値に対して前記状況(C)
    をテストし、iに対する状況(C)が失敗の場合にの
    み、i+1に対する状況(C)をテストすることを特徴
    とする請求項113に記載の記憶媒体。
  115. 【請求項115】 現第1信号パターンに関して全ての
    アクティブパターンを処理したことを判断できるよう
    に、現アクティブリストの終りに番人パターンが加えら
    れることを特徴とする請求項108乃至114のいずれ
    かに記載の記憶媒体。
  116. 【請求項116】 前記番人パターンに関連する累積値
    は所定値に設定され、各アクティブパターンの累積値を
    前記所定値と比較することにより前記番人パターンを判
    断することを特徴とする請求項115に記載の記憶媒
    体。
  117. 【請求項117】 前記所定値がゼロであることを特徴
    とする請求項116に記載の記憶媒体。
  118. 【請求項118】 現アクティブリスト上の全てのアク
    ティブパターンを処理した後に、新アクティブリストの
    終りに前記番人パターンを付加するステップを更に備え
    ることを特徴とする請求項115乃至117のいずれか
    に記載の記憶媒体。
  119. 【請求項119】 現アクティブパターンの処理によっ
    て新アクティブリストが更新された後、前記識別子は、
    新アクティブリスト上の第2信号を表わすパターンのシ
    ーケンスにおける最も先頭側の第2信号パターンを特定
    するべく設定されることを特徴とする請求項109乃至
    118のいずれかに記載の記憶媒体。
  120. 【請求項120】 前記パスの成長に関する制約の一つ
    が、前記第2信号パターンが前記第1信号パターンとマ
    ッチングした場合に、順序的にその第2信号パターンよ
    り前の第2信号パターンは同じパス上の後続の第1信号
    パターンとはマッチングされ得ないことであることを特
    徴とする請求項101乃至119のいずれかに記載の記
    憶媒体。
  121. 【請求項121】 前記パスの成長に関する制約の一つ
    が、処理中の連続する第1信号パターンに対して、同じ
    第2信号パターンとマッチングするパスに関連する累積
    値にペナルティを加えることであることを特徴とする請
    求項101乃至120のいずれかに記載の記憶媒体。
  122. 【請求項122】 現アクティブパターンに関連する累
    積値が閾値よりも良い場合にのみ、その現アクティブパ
    ターンの累積値を更新し、現アクティブパターンに関連
    するパスを成長させることを特徴とする請求項101乃
    至121のいずれかに記載の記憶媒体。
  123. 【請求項123】 各第1信号パターンに対して処理さ
    れるアクティブパターンの数を、与えられた最大数より
    少なく維持するために前記閾値を変化させることを特徴
    とする請求項122に記載の記憶媒体。
  124. 【請求項124】 現第1信号パターンに後続する第1
    信号パターンの処理の間に用いられる閾値が該現第1信
    号パターンの処理の間に、処理されるべき後続の第1信
    号パターンに対する新アクティブリストにおける第2信
    号パターンの合計数に依存して、決定されることを特徴
    とする請求項123に記載の記憶媒体。
  125. 【請求項125】 複数の閾値が用いられ、処理中の現
    第1信号パターンに対して得られているパスについて用
    いられる閾値が、当該得られているパスの到達端にある
    第2信号パターンの、前記第2信号を表わす第2信号パ
    ターン列内における位置に依存することを特徴とする請
    求項122乃至124のいずれかに記載の記憶媒体。
  126. 【請求項126】 シーケンスの始まりにおいて終端を
    有するパスに対して用いられる閾値が、そのシーケンス
    の終わりにおいて終端を有するパスに用いられる閾値よ
    りも大きいことを特徴とする請求項125に記載の記憶
    媒体。
  127. 【請求項127】 柔軟な刈り込み処理が実行され、そ
    れによって、閾値よりも悪い累積値を有するいくつかの
    パスが破棄されずに残ることを特徴とする請求項122
    乃至126のいずれかに記載の記憶媒体。
  128. 【請求項128】 現第1信号パターンの処理は、後続
    の第1信号パターンが受信される前に実行されることを
    特徴とする請求項101乃至127のいずれかに記載の
    記憶媒体。
  129. 【請求項129】 第1信号の全体が、第1信号パター
    ンが処理される前に受信されることを特徴とする請求項
    101乃至128のいずれかに記載の記憶媒体。
  130. 【請求項130】 前記第2信号パターンはテンプレー
    トを表わし、前記累積値は距離的計測値であることを特
    徴とする請求項101乃至129のいずれかに記載の記
    憶媒体。
  131. 【請求項131】 前記第2信号パターンは統計モデル
    を表わし、前記累積値は確率的計測値であることを特徴
    とする請求項101乃至129のいずれかに記載の記憶
    媒体。
  132. 【請求項132】 前記第1信号を複数の第2信号と比
    較するステップを更に備えることを特徴とする請求項1
    01乃至131のいずれかに記載の記憶媒体。
  133. 【請求項133】 1つの第2信号において成長するパ
    スが引き続き別の第2信号へ成長することを許容するこ
    とにより、前記第1信号は前記複数の第2信号からなる
    シーケンスとマッチングし得ることを特徴とする請求項
    132に記載の記憶媒体。
  134. 【請求項134】 第1信号がマッチングし得る第2信
    号の列は、前もって規定されたルールによって制限され
    ることを特徴とする請求項133に記載の記憶媒体。
  135. 【請求項135】 前記方法が、動的計画法によるマッ
    チング処理を用いることを特徴とする請求項101乃至
    134のいずれかに記載の記憶媒体。
  136. 【請求項136】 パスの累積値が、現第1信号パター
    ンと現アクティブパターンの間の距離を表す距離計測値
    を加えることにより更新されることを特徴とする請求項
    131乃至135のいずれかに記載の記憶媒体。
  137. 【請求項137】 前記パターンの各々が複数のパラメ
    ータ値によて表わされ、前記距離計測値は、現第1信号
    パターンと現アクティブパターンとの間の対応するパラ
    メータ値の差の度合いの合計を表わすことを特徴とする
    請求項133に記載の記憶媒体。
  138. 【請求項138】 前記距離計測は、d( )を距離計
    測値、Spを現アクティブパターンのp番目のパラメー
    タ値、fk pを処理中の現第1信号パターンのp番目のパ
    ラメータとしたとき、 【数7】 によって表わされることを特徴とする請求項134に記
    載の記憶媒体。
  139. 【請求項139】 パスの累積値に加えられるべき距離
    計測値を決定するのにルックアップテーブルが用いられ
    ることを特徴とする請求項138に記載の記憶媒体。
  140. 【請求項140】 現第1信号パターンと現アクティブ
    パターンの夫々のパラメータ値は、ルックアップテーブ
    ルをアドレスし、そのルックアップテーブルのその位置
    に格納されている値が2つのパラメータ値の差に対応す
    ることを特徴とする請求項139に記載の記憶媒体。
  141. 【請求項141】 現第1信号パターンの処理に先立っ
    て、現第1信号パターンのパラメータ値を用いてルック
    アップ値のサブテーブルを特定し、パスに関する累積値
    に加えられるべき距離計測値が現アクティブパターンの
    パラメータ値でルックアップ値のサブテーブルをアドレ
    スすることにより決定されることを特徴とする請求項1
    39に記載の記憶媒体。
  142. 【請求項142】 現第1信号パターンのp番目のパラ
    メータに依存するルックアップテーブルのアドレスをT
    pとし、現アクティブパターンのp番目のパラメータ
    値をSpとしたとき、パスの累積値に加えられるべき距
    離計測値が 【数8】 により決定されることを特徴とする請求項139に記載
    の記憶媒体。
  143. 【請求項143】 TPpが処理されるべき第1信号パ
    ターンにつき1度決定されることを特徴とする請求項1
    42に記載の記憶媒体。
  144. 【請求項144】 前記第1及び第2信号は音声を表わ
    し、各パターンは対応する時間フレームの間の音声の音
    響的特徴を表わす複数のパラメータを備えることを特徴
    とする請求項101乃至143のいずれかに記載の記憶
    媒体。
  145. 【請求項145】 入力音声を複数の基準音声信号と比
    較することにより入力音声を認識する音声認識処理をコ
    ンピュータに実行させるための処理ステップを記憶する
    記憶媒体であって、該処理ステップが、 前記入力音声信号を表わす入力パターンのシーケンスを
    抽出し、 基準パターンのシーケンスを格納し、ここで、各シーケ
    ンスは対応する基準音声信号を表わし入力パターンのシ
    ーケンスを請求項144に記載の方法を用いて基準音声
    信号とマッチングし、 前記マッチングステップによって決定された累積値から
    認識結果を提供することを特徴とする記憶媒体。
  146. 【請求項146】 前記認識結果は、入力パターンのシ
    ーケンスにおける最後の入力パターンで終るパスのう
    ち、最良の累積値を有するパスを決定することで提供さ
    れることを特徴とする請求項145に記載の記憶媒体。
  147. 【請求項147】 第1信号を表わす第1パターン列と
    第2の信号を表わす第2パターン列とを、各第1信号パ
    ターンを順次に処理してマッチングするマッチング処理
    をコンピュータに実行させるための処理ステップを記憶
    する記憶媒体であって、該処理ステップが、 処理中の現第1信号パターンについて各パスの終端にあ
    る第2信号パターンをアクティブパターンとして決定
    し、ここで、各パスは第2信号パターン列と当該現第1
    信号パターンまでの第1信号パターン列との間の可能な
    マッチングを表しており、 各アクティブパターンについて、前記現第1信号パター
    ンに関する当該アクティブパターンまで成長しているパ
    スについて、マッチングの近さを表わす累積値を格納
    し、 各アクティブパターンを反対の順序で処理することによ
    り前記累積値を更新し、パスの成長に関して設けられた
    制約に基づいて前記パスを成長させ、 前記パターンの各々は複数のパラメータ値によって表わ
    され、パスの累積値は現第1信号パターンと現アクティ
    ブパターンとの間の距離を表す距離計測値を加えること
    によって更新され、現第1信号パターンと現アクティブ
    パターンの夫々のパラメータ値はルックアップテーブル
    をアドレスし、そのルックアップテーブルのその位置に
    格納されている値が2つのパラメータ値の差に対応する
    ことを特徴とする記憶媒体。
  148. 【請求項148】 現第1信号パターンの処理に先立っ
    て、現第1信号パターンのパラメータ値を用いてルック
    アップ値のサブテーブルを特定し、パスに関する累積値
    に加えられるべき距離計測値が現アクティブパターンの
    パラメータ値でルックアップ値のサブテーブルをアドレ
    スすることにより決定されることを特徴とする請求項1
    47に記載の記憶媒体。
  149. 【請求項149】 現第1信号パターンのp番目のパラ
    メータに依存するルックアップテーブルのアドレスをT
    pとし、現アクティブパターンのp番目のパラメータ
    地をSpとしたとき、パスの累積値に加えられるべき距
    離計測値が 【数9】 により決定されることを特徴とする請求項147または
    148に記載の記憶媒体。
  150. 【請求項150】 TPpが処理されるべき第1信号パ
    ターンにつき1度決定されることを特徴とする請求項1
    49に記載の記憶媒体。
  151. 【請求項151】 第1信号を表わす第1パターン列と
    第2の信号を表わす第2パターン列とを、各第1信号パ
    ターンを順次に処理してマッチングするパターンマッチ
    ング処理を実行するためのコンピュータによって実行可
    能な処理ステップを搬送するための信号であって、該処
    理ステップが、 処理中の現第1信号パターンについて各パスの終端にあ
    る第2信号パターンをアクティブパターンとして決定
    し、ここで、各パスは第2信号パターン列と当該現第1
    信号パターンまでの第1信号パターン列との間の可能な
    マッチングを表しており、 各アクティブパターンについて、前記現第1信号パター
    ンに関する当該アクティブパターンまで成長しているパ
    スについて、マッチングの近さを表わす累積値を格納
    し、 各アクティブパターンを逆の順序で処理し、 (i)次に処理されるべき第1信号に関して、現アクテ
    ィブパターンで終っているパスが、どの第2信号パター
    ンへ成長するかを前記パス成長の制約に基づいて判断
    し、 (ii)処理中の現第1信号パターンについて、前のアク
    ティブパターンの処理の間のステップ(i)においてい
    くつの第2信号パターンがそのように判断されたかを特
    定し、 (iii)前記ステップ(ii)において特定された前記第
    2信号パターンの数に依存して、現アクティブパターン
    に関連するパスを成長させる、 ことにより前記累積値を更新し、パスの成長に関して設
    けられた制約に基づいて前記パスを成長させることを特
    徴とするコンピュータのための処理ステップ搬送信号。
  152. 【請求項152】 入力音声を複数の基準音声信号と比
    較することによって認識する音声認識方法を、コンピュ
    ータによって実行可能な処理ステップとして搬送するた
    めの信号であって、該処理ステップが、 前記入力音声信号を表わす入力パターンのシーケンスを
    抽出し、 基準パターンのシーケンスを格納し、ここで、各シーケ
    ンスは対応する基準音声信号を表わし入力パターンのシ
    ーケンスを請求項53に記載の方法を用いて基準音声信
    号とマッチングし、 前記マッチングステップによって決定された累積値から
    認識結果を提供することを特徴とするコンピュータのた
    めの処理ステップ搬送信号。
  153. 【請求項153】 第1信号を表わす第1パターン列と
    第2の信号を表わす第2パターン列とを、各第1信号パ
    ターンを順次に処理してマッチングする方法をコンピュ
    ータによって実行するための処理ステップを搬送する信
    号であって、該処理ステップが、 処理中の現第1信号パターンについて各パスの終端にあ
    る第2信号パターンをアクティブパターンとして決定
    し、ここで、各パスは並べられた第2信号パターン列と
    当該現第1信号パターンまでの並べられた第1信号パタ
    ーン列との間の可能なマッチングを表しており、 各アクティブパターンについて、前記現第1信号パター
    ンに関する当該アクティブパターンまで成長しているパ
    スについて、マッチングの近さを表わす累積値を格納
    し、 各アクティブパターンを反対の順序で処理することによ
    り前記累積値を更新し、パスの成長に関して設けられた
    制約に基づいて前記パスを成長させ、 前記パターンの各々は複数のパラメータ値によって表わ
    され、パスの累積値は現第1信号パターンと現アクティ
    ブパターンとの間の距離を表す距離計測値を加えること
    によって更新され、現第1信号パターンと現アクティブ
    パターンの夫々のパラメータ値はルックアップテーブル
    をアドレスし、そのルックアップテーブルのそのアドレ
    スされた位置に格納されている値が2つのパラメータ値
    の差に対応することを特徴とするコンピュータのための
    処理ステップ搬送信号。
JP11033279A 1998-02-10 1999-02-10 マッチング方法及び装置及び記憶媒体 Withdrawn JPH11282487A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9802838.4 1998-02-10
GBGB9802838.4A GB9802838D0 (en) 1998-02-10 1998-02-10 Pattern matching method and apparatus

Publications (1)

Publication Number Publication Date
JPH11282487A true JPH11282487A (ja) 1999-10-15

Family

ID=10826773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11033279A Withdrawn JPH11282487A (ja) 1998-02-10 1999-02-10 マッチング方法及び装置及び記憶媒体

Country Status (5)

Country Link
US (1) US6226610B1 (ja)
EP (2) EP0935237B1 (ja)
JP (1) JPH11282487A (ja)
DE (2) DE69919420T2 (ja)
GB (1) GB9802838D0 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9822931D0 (en) * 1998-10-20 1998-12-16 Canon Kk Speech processing apparatus and method
US6275802B1 (en) * 1999-01-07 2001-08-14 Lernout & Hauspie Speech Products N.V. Search algorithm for large vocabulary speech recognition
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7050977B1 (en) 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
US7392185B2 (en) * 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
WO2001061683A1 (en) * 2000-02-16 2001-08-23 Pc Multimedia Limited Identification of structure in time series data
JP2002132287A (ja) * 2000-10-20 2002-05-09 Canon Inc 音声収録方法および音声収録装置および記憶媒体
JP2007047575A (ja) * 2005-08-11 2007-02-22 Canon Inc パターンマッチング方法およびその装置、および音声情報検索システム
TWI508033B (zh) * 2013-04-26 2015-11-11 Wistron Corp 語言學習方法與裝置以及電腦可讀記錄媒體
EP3118578B1 (en) 2015-07-14 2018-10-03 The Boeing Company Method and system for autonomous generation of shortest lateral paths for unmanned aerial systems
US10089989B2 (en) * 2015-12-07 2018-10-02 Semiconductor Components Industries, Llc Method and apparatus for a low power voice trigger device

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4592086A (en) 1981-12-09 1986-05-27 Nippon Electric Co., Ltd. Continuous speech recognition system
US4977598A (en) 1989-04-13 1990-12-11 Texas Instruments Incorporated Efficient pruning algorithm for hidden markov model speech recognition
US5241619A (en) * 1991-06-25 1993-08-31 Bolt Beranek And Newman Inc. Word dependent N-best search method
DE4130633A1 (de) * 1991-09-14 1993-03-18 Philips Patentverwaltung Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal
US5349645A (en) * 1991-12-31 1994-09-20 Matsushita Electric Industrial Co., Ltd. Word hypothesizer for continuous speech decoding using stressed-vowel centered bidirectional tree searches
US5621859A (en) * 1994-01-19 1997-04-15 Bbn Corporation Single tree method for grammar directed, very large vocabulary speech recognizer
JP2775140B2 (ja) * 1994-03-18 1998-07-16 株式会社エイ・ティ・アール人間情報通信研究所 パターン認識方法、音声認識方法および音声認識装置
DE4433366A1 (de) * 1994-09-20 1996-03-21 Sel Alcatel Ag Verfahren und Einrichtung zur Bestimmung eines Maßes der Übereinstimmung zwischen zwei Mustern sowie Spracherkennungseinrichtung damit und Programm-Modul dafür
US5805772A (en) * 1994-12-30 1998-09-08 Lucent Technologies Inc. Systems, methods and articles of manufacture for performing high resolution N-best string hypothesization
GB9602700D0 (en) 1996-02-09 1996-04-10 Canon Kk Pattern matching method and apparatus
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming

Also Published As

Publication number Publication date
DE69919420T2 (de) 2005-08-25
EP0935237B1 (en) 2004-08-18
GB9802838D0 (en) 1998-04-08
DE69928456D1 (de) 2005-12-22
EP1411496A2 (en) 2004-04-21
EP0935237A1 (en) 1999-08-11
DE69919420D1 (de) 2004-09-23
EP1411496B1 (en) 2005-11-16
EP1411496A3 (en) 2004-08-04
US6226610B1 (en) 2001-05-01

Similar Documents

Publication Publication Date Title
JPH11282488A (ja) マッチング方法及び装置及び記憶媒体
KR100406604B1 (ko) 음성인식방법및장치
US5895448A (en) Methods and apparatus for generating and using speaker independent garbage models for speaker dependent speech recognition purpose
US7228275B1 (en) Speech recognition system having multiple speech recognizers
US6076054A (en) Methods and apparatus for generating and using out of vocabulary word models for speaker dependent speech recognition
JPH096386A (ja) 状態遷移モデルの設計方法及び該状態遷移モデルを用いた音声認識装置
EP0789348B1 (en) Pattern matching method and apparatus
JP3847879B2 (ja) 標準モデル決定方法
JPH11282487A (ja) マッチング方法及び装置及び記憶媒体
US8234112B2 (en) Apparatus and method for generating noise adaptive acoustic model for environment migration including noise adaptive discriminative adaptation method
WO2010128560A1 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
CN112951211A (zh) 一种语音唤醒方法及装置
JPH08505957A (ja) 音声認識システム
JP2003208195A5 (ja)
JP2003208195A (ja) 連続音声認識装置および連続音声認識方法、連続音声認識プログラム、並びに、プログラム記録媒体
US6411929B1 (en) Speech recognition method and system
JP2570448B2 (ja) 標準パターン学習方法
JP3042455B2 (ja) 連続音声認識方式
JP3873418B2 (ja) 音声スポッティング装置
KR100284405B1 (ko) 은닉 마르코브 모델 핵심어 검출에 적합한 계산량 감축 방법
JPH06259089A (ja) 音声認識方法
JP3818154B2 (ja) 音声認識方法
JPH0962290A (ja) 音声認識装置
JPH09244688A (ja) 音声認識方法
KR19990017119A (ko) 임의의 단어인식을 위한 음성인식 시스템의클러스터링 방법

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060509