WO2010018796A1

WO2010018796A1 - 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法

Info

Publication number: WO2010018796A1
Application number: PCT/JP2009/064045
Authority: WO
Inventors: 聡小柳津; 真士山田
Original assignee: 旭化成株式会社
Priority date: 2008-08-11
Filing date: 2009-08-07
Publication date: 2010-02-18
Also published as: JPWO2010018796A1; CN102119412A; US20110131038A1; CN102119412B

Abstract

　本件発明は、例外語辞書の辞書サイズを削減しつつ、高い音声認識性能が得られる例外語辞書を作成することが可能な例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、当該例外語辞書を用いて音声を高い認識率で認識する音声認識装置及び音声認識方法を提供することを課題とする。上記課題を解決するために、例外語辞書作成装置１０のテキスト発音記号変換部２１は、語彙リストデータ１２のテキスト列を発音記号列に変換することにより、変換発音記号例を生成する。認識劣化寄与度算出部２４は、変換発音記号列と正しい発音記号列とが一致しなかった場合に、認識劣化寄与度を算出する。例外語辞書登録部４１は、認識劣化寄与度の大きい語彙リストデータ１２のテキスト列と発音記号列とを、例外語辞書メモリサイズ条件７１で示されるデータ制限容量を超えないように例外語辞書６０に登録する。

Description

例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法

　本発明は、語彙のテキスト列を発音記号列に変換する変換装置が使用する例外語辞書を作成する例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、当該例外語辞書を用いて音声認識を行う音声認識装置及び音声認識方法に関する。

　テキストで表された任意の語彙や文章を音声に変換して出力する音声合成装置や、テキスト表記に基づいて音声認識辞書に登録された認識対象の語彙や文章の音声認識を行う音声認識装置では、入力テキストを発音記号列に変換するためにテキスト発音記号変換装置が使われる。この装置が行うテキスト表記の語彙を発音記号列に変換する処理は、テキスト音素変換（ｔｅｘｔ－ｔｏ－ｐｈｏｎｅｍｅ）あるいは書記素音素変換（ｇｒａｐｈｅｍｅ－ｔｏ－ｐｈｏｎｅｍｅ）とも呼ばれる。認識対象の語彙のテキスト表記を音声認識辞書に登録して音声認識を行う音声認識装置の例として、携帯電話の電話帳に登録された相手先の登録名称を音声認識し、その登録名称に対応した電話番号に電話をかける携帯電話または、携帯電話と組み合わせて用い、携帯電話の電話帳を読み込んで音声ダイアルを行うハンズフリー通話装置がある。携帯電話の電話帳に登録された相手先の登録名称が、発音記号を伴わずテキスト表記のみで入力されている場合には、この登録名称を音声認識辞書に登録することはできない。なぜならば、登録名称の読みを示す音素表記などの発音記号列が音声認識辞書に登録される情報として必要となるからである。そこで、相手先の登録名称のテキスト表記を発音記号列に変換するために、テキスト発音記号変換装置が用いられる。図２５に示すように、テキスト発音記号変換装置により得られた発音記号列に基づいて登録名称が音声認識辞書に認識対象語彙として登録されるので、携帯電話のユーザーは発話した登録名称を音声認識させることにより、複雑なボタン操作などを行うことなく、その登録名称に対応する電話番号へ電話をかけることができる（図２６参照）。

　認識対象の単語のテキスト表記を音声認識辞書に登録して音声認識を行う音声認識装置の他の例として、内蔵ハードディスクまたは内蔵半導体メモリに保存された楽曲ファイルが再生される携帯型デジタル音楽再生装置を接続して使用することが可能な車載オーディオ装置がある。この車載オーディオ装置は音声認識機能を備え、接続した携帯型デジタル音楽再生装置に保存された楽曲ファイルに関連付けられた曲名やアーティスト名を音声認識の認識対象語彙とする。前述のハンズフリー通話装置の場合と同様に、携帯型デジタル音楽再生装置に保存された楽曲ファイルに関連付けられた曲名やアーティスト名は発音記号を伴わずテキスト表記のみで入力されているので、テキスト発音記号変換装置が必要となる（図２７，２８参照）。

　従来のテキスト発音記号変換装置で用いられる方法として、単語辞書に基づく方法とルールに基づく方法とがある。単語辞書に基づく方法では、単語等のテキスト列の各々が発音記号列に対応付けられた単語辞書が構成される。音声認識装置のテキスト発音記号変換装置処理では、認識対象語彙である単語等の入力テキスト列に対して単語辞書が検索され、その入力テキスト列に対応した発音記号列が出力される。この方法では、入力される可能性のある入力テキスト列に幅広く対応するためには、単語辞書のサイズを大きくする必要があり、単語辞書を展開するためのメモリ要求量が増大するという問題があった。

　上述のメモリ要求量の問題点を解決するためのテキスト発音記号変換装置で用いられる方法として、ルールに基づく方法がある。例えば、テキスト列に関するルールとして“ＩＦ（条件）　ｔｈｅｎ　（発音記号）”を使用すると、テキストの一部が条件に合致した場合にそのルールが適用される。単語辞書を完全にルールで置き換えてルールのみで変換を行う場合と、単語辞書とルールとを組み合わせて変換を行う場合とがある。単語辞書とルールとを組み合わせる場合のテキスト発音記号変換装置を使用した音声合成システム用の単語辞書サイズを削減する装置が、例えば特許文献１に記載されている。

　図２９は、特許文献１に開示された単語辞書サイズ削減装置の処理を示すブロック図である。単語辞書サイズ削減装置は、２つのフェーズから構成された処理を経ることにより単語辞書に登録された単語を削除し、単語辞書サイズを削減する。まずフェーズ１では、元となる単語辞書に登録された単語のうち、ルールを用いて正しい発音記号列が生成される単語については単語辞書から削除する候補とする。ルールとしては、接頭辞用ルールと接中辞用ルールと接尾辞用ルールとから構成されたものが例示されている。

　次にフェーズ２では、単語辞書内の単語が、他の単語の語根（ｒｏｏｔ　ｗｏｒｄ）として使用可能な場合は、その単語を語根として単語辞書に残しておく。こうすると、この語根となる単語がフェーズ１で削除対象の候補となっていても削除対象から除外される。一方、文字数の多い単語の中で、語根として単語辞書に残しておく対象ではなく、１つ以上の語根とルールを用いて正しい発音記号列が生成される単語については、単語辞書から削除する対象とする。
　フェーズ１とフェーズ２の終了後に、最終的に削除対象と判定された単語を単語辞書から削除することによって、サイズが削減された単語辞書が生成される。このようにして生成された単語辞書は、ルールから発音記号列が得られない例外語の辞書であるため「例外語辞書」と呼ばれる場合がある。

米国特許第６，３４７，２９８号

　上記特許文献１が単語辞書サイズの削減対象とするのは、音声合成システム用の単語辞書であるため、当然のごとく音声認識性能を考慮して単語辞書サイズの削減を行うことは開示されていない。また上記特許文献１では、例外語辞書の作成の過程で、その辞書サイズを削減する方法は開示されているが、装置のメモリ容量制限が有った場合、その制限内での音声認識性能を考慮した例外語辞書の作成方法については開示されていない。

　上記特許文献１では、ルールによって生成された発音記号列と単語辞書の発音記号列が一致しているか否かという基準のみで例外語辞書にテキストとその発音記号列が登録される。このようにして作成された例外語辞書とルールがカバーする認識対象語彙は、その発音記号の不一致の内容が音声認識性能に影響を及ぼさない、あるいは図３０（ａ）に示すように影響が小さい不一致であるにも関わらず、単に一箇所でも発音記号列に不一致があるという理由のみで、例外語辞書に登録されてしまい、例外語辞書の辞書サイズが無駄に消費される場合があるという問題があった。また、上記特許文献１の方法に従って作成した例外語辞書の辞書サイズが装置のメモリ容量制限を超えていた場合に、例外語辞書から削除しても音声認識性能に悪影響を及ぼさないテキストとその発音記号列を選択することができないという問題があった。
　本発明は、このような点に鑑みてなされたものであって、例外語辞書の辞書サイズを削減しつつ、高い音声認識性能が得られる例外語辞書を作成することが可能な例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、当該例外語辞書を用いて音声を高い認識率で認識する音声認識装置及び音声認識方法を提供することを目的とする。

　上記課題を解決するために、請求項１に記載の発明は、語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成装置であって、認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換手段と、認識対象語彙のテキスト列の前記テキスト発音記号変換手段による変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列の前記正しい発音記号列との違いが音声認識性能の劣化に影響を与える度合いである認識劣化寄与度を算出する認識劣化寄与度算出手段と、前記認識劣化寄与度算出手段により算出された複数の各認識対象語彙に対する認識劣化寄与度に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録手段とを備えることを特徴とする例外語辞書作成装置を提供する。

　本発明によれば、例外語辞書作成装置は、複数の各認識対象語彙に対する認識劣化寄与度に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを例外語辞書に登録するため、音声認識性能の劣化に影響を与える度合いが大きい認識対象語彙を優先的に選択して例外語辞書に登録することにより、例外語辞書の辞書サイズを削減しつつ、高い音声認識性能が得られる例外語辞書を作成することができる。

　請求項２に記載の発明は、請求項１に記載の例外語辞書作成装置において、前記例外語辞書に記憶可能なデータ制限容量を記憶する例外語辞書メモリサイズ条件記憶手段をさらに備え、前記例外語辞書登録手段は、前記例外語辞書に記憶されるデータ量が、前記データ制限容量を超えないように、前記登録を行うことを特徴とする。
　本発明によれば、前記例外語辞書に記憶されるデータ量が、前記メモリサイズ条件記憶手段に記憶されたデータ制限容量を超えないように登録を行うことができるため、例外語辞書の辞書サイズが所定の制約下にある場合にも、高い音声認識性能が得られる例外語辞書を作成することができる。

　請求項３に記載の発明は、請求項１又は２に記載の例外語辞書作成装置において、前記例外語辞書登録手段は、前記複数の各認識対象語彙の使用頻度に更に基づいて、登録対象の認識対象語彙を選択することを特徴とする。
　本発明によれば、認識劣化寄与度に加えて、更に使用頻度に基づいて登録対象の認識対象語彙を選択することができるため、例えば、認識劣化寄与度が小さくも使用頻度が大きい認識対象語彙を登録対象として選択することが可能となり、例外語辞書の辞書サイズを削減しつつ、高い音声認識性能が得られる例外語辞書を作成することができる。

　請求項４に記載の発明は、請求項３に記載の例外語辞書作成装置において、前記例外語辞書登録手段は、予め定められた閾値よりも大きい前記使用頻度を有する認識対象語彙を、前記認識劣化寄与度に関わらず、優先して登録対象の認識対象語彙として選択することを特徴とする。
　本発明によれば、予め定められた閾値よりも大きい使用頻度を有する認識対象語彙を、認識劣化寄与度に関わらず、優先して登録対象の認識対象語彙として選択することができるため、使用頻度が大きい認識対象語彙を他の語彙に優先して例外語辞書に登録することができ、例外語辞書の辞書サイズを削減しつつ、高い音声認識性能が得られる例外語辞書を作成することができる。

　請求項５に記載の発明は、請求項１から４の何れか１項に記載の例外語辞書作成装置において、前記認識劣化寄与度算出手段は、前記変換発音記号列と前記正しい発音記号列との間のスペクトル距離尺度を、前記認識劣化寄与度として算出することを特徴とする。
　請求項６に記載の発明は、請求項１から４の何れか１項に記載の例外語辞書作成装置において、前記認識劣化寄与度算出手段は、前記変換発音記号列に基づく音声の認識結果である音声認識尤度と、前記正しい発音記号列に基づく前記音声の認識結果である音声認識尤度との差を、前記認識劣化寄与度として算出することを特徴とする。

　請求項７に記載の発明は、請求項１から４の何れか１項に記載の例外語辞書作成装置において、前記認識劣化寄与度算出手段は、前記変換発音記号列と前記正しい発音記号列との間の最適マッチングによる経路距離を算出し、該算出した経路距離を前記正しい発音記号列の長さで正規化した正規化経路距離を、前記認識劣化寄与度として算出することを特徴とする。
　請求項８に記載の発明は、請求項７に記載の例外語辞書作成装置において、前記認識劣化寄与度算出手段は、前記変換発音記号列と前記正しい発音記号列との間の対応する発音記号同士の関係に基づく重み付けを加味した前記経路距離として類似距離を算出し、該算出した類似距離を前記正しい発音記号列の長さで正規化した正規化類似距離を前記認識劣化寄与度として算出することを特徴とする。

　請求項９に記載の発明は、請求項１から８の何れか１項に記載の例外語辞書作成装置により作成された例外語辞書を用いて認識対象語彙のテキスト列を発音記号列に変換し、該変換結果に基づいて音声認識辞書を作成する音声認識辞書作成手段と、前記音声認識辞書作成手段で作成された音声認識辞書を用いて音声認識を行う音声認識手段とを備えたことを特徴とする音声認識装置を提供する。
　本発明によれば、小さいサイズの例外語辞書を用いつつ、高い音声認識性能を得ることができる。

　請求項１０に記載の発明は、語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成装置が行う例外語辞書作成方法であって、認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換ステップと、前記テキスト発音記号変換ステップにおける前記認識対象語彙のテキスト列の変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列の前記正しい発音記号列との違いが音声認識性能の劣化に影響を与える度合いである認識劣化寄与度を算出する認識劣化寄与度算出ステップと、前記認識劣化寄与度算出ステップにおいて複数の認識対象語彙各々に対して算出された認識劣化寄与度に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録ステップとを備えることを特徴とする例外語辞書作成方法を提供する。

　請求項１１に記載の発明は、請求項１０に記載の例外語辞書作成方法により作成された例外語辞書を用いて認識対象語彙のテキスト列を発音記号列に変換し、該変換結果に基づいて音声認識辞書を作成する音声認識辞書作成ステップと、前記音声認識辞書作成ステップで作成された音声認識辞書を用いて音声認識を行う音声認識ステップとを備えたことを特徴とする音声認識装置が行う音声認識方法を提供する。

　請求項１２に記載の発明は、語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成プログラムであって、認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換手段と、前記認識対象語彙のテキスト列の前記テキスト発音記号変換手段による変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列の前記正しい発音記号列との違いが音声認識性能の劣化に影響を与える度合いである認識劣化寄与度を算出する認識劣化寄与度算出手段と、前記認識劣化寄与度算出手段により複数の認識対象語彙各々に対して算出された認識劣化寄与度に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録手段とをコンピュータに機能させることを特徴とする例外語辞書作成プログラムを提供する。

　請求項１３に記載の発明は、語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成装置であって、認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換手段と、認識対象語彙のテキスト列の前記テキスト発音記号変換手段による変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列に基づく音声と前記正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出手段と、前記発音記号列間距離算出手段により算出された複数の各認識対象語彙に対する発音記号列間距離に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録手段とを備えることを特徴とする例外語辞書作成装置を提供する。

　本発明によれば、例外語辞書作成装置は、複数の各認識対象語彙に対する発音記号列間距離に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを例外語辞書に登録するため、音声認識性能の劣化に影響を与える度合いが大きい認識対象語彙を優先的に選択して例外語辞書に登録することにより、例外語辞書の辞書サイズを削減しつつ、高い音声認識性能が得られる例外語辞書を作成することができる。

　請求項１４に記載の発明は、語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成装置が行う例外語辞書作成方法であって、認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換ステップと、前記テキスト発音記号変換ステップにおける前記認識対象語彙のテキスト列の変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列に基づく音声と前記正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出ステップと、前記発音記号列間距離算出ステップにおいて複数の認識対象語彙各々に対して算出された発音記号列間距離に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録ステップとを備えることを特徴とする例外語辞書作成方法を提供する。

　請求項１５に記載の発明は、語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成プログラムであって、認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換手段と、前記認識対象語彙のテキスト列の前記テキスト発音記号変換手段による変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列に基づく音声と前記正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出手段と、前記発音記号列間距離算出手段により複数の認識対象語彙各々に対して算出された発音記号列間距離に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録手段とをコンピュータに機能させることを特徴とする例外語辞書作成プログラムを提供する。

　請求項１６に記載の発明は、語彙のテキスト列とその正しい発音記号列とを有する認識対象語彙と、該認識対象語彙を所定のルールで前記テキスト列を発音記号列に変換するテキスト発音記号列変換手段と、該テキスト発音記号列変換手段で変換された変換発音記号列と、該変換発音記号列に基づく音声と、前記正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出手段と、該発音記号列間距離算出手段で算出された発音記号列間距離に基づいて前記認識対象語彙を登録する認識対象語彙登録手段と、を備えることを特徴とする認識語彙登録装置を提供する。

　請求項１７に記載の発明は、認識対象語彙のテキスト列を所定のルールで発音記号列に変換するテキスト発音記号列変換手段と、該テキスト発音記号列変換手段で変換された変換発音記号列に基づく音声と、前記認識対象語彙の正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出手段と、該発音記号列間距離算出手段で算出された発音記号列間距離に基づいて前記認識対象語彙を登録する認識対象語彙登録手段と、を備えることを特徴とする認識語彙登録装置を提供する。

　請求項１８に記載の発明は、請求項１６又は１７に記載の認識語彙登録装置の前記認識対象語彙登録手段で登録された認識対象語彙を有する例外語辞書と、該例外語辞書を用いて認識対象語彙のテキスト列を発音記号列に変換し、該変換結果に基づいて音声認識辞書を作成する音声認識辞書作成手段と、前記音声認識辞書作成手段で作成された音声認識辞書を用いて音声認識を行う音声認識手段と、を備えたことを特徴とする音声認識装置を提供する。

本発明に係る例外語辞書作成装置の基本構成を示すブロック図である。本発明の第１実施形態に係る例外語辞書作成装置の構成を示すブロック図である。（ａ）は同実施形態に係る語彙データのデータ構成図、（ｂ）は語彙リストデータのデータ構成図である。同実施形態に係る音声認識装置の構成を示すブロック図である。同実施形態に係る例外語辞書作成装置が行う処理手順を示すフローチャートである。同実施形態に係る例外語辞書作成装置が行う処理手順を示すフローチャートである。同実施形態に係る例外語辞書作成装置が行う別の処理手順を示すフローチャートである。同実施形態に係るＬＰＣケプストラム距離の結果を用いた認識劣化寄与度算出方法を説明するための図である。同実施形態に係る音声認識尤度の結果を用いた認識劣化寄与度算出方法を説明するための図である。同実施形態に係るＤＰマッチングの具体例を示す図である。同実施形態に係るＤＰマッチングの結果を用いた認識劣化寄与度算出方法を説明するための図である。同実施形態に係るＤＰマッチングと発音記号に拠る重み付けの結果とを用いた認識劣化寄与度算出方法を説明するための図である。同実施形態に係る置換距離テーブル、挿入距離テーブル、欠落距離テーブルを用いて、類似距離を算出する方法について説明するための図である。同実施形態に係る一致距離テーブルを用いて類似距離を算出する方法について説明するための図である。本発明の第２実施形態に係る例外語辞書作成装置が行う処理手順を示すフローチャートである。同実施形態に係る認識劣化寄与度及び使用頻度を用いて、登録候補語彙データを並べ替える手順を説明するための図である。同実施形態に係る認識劣化寄与度及び使用頻度を用いて、登録候補語彙データを並べ替える手順を説明するための図である。同実施形態に係る認識劣化寄与度及び使用頻度を用いて、登録候補語彙データを並べ替える手順を説明するための図である。同実施形態に係る認識劣化寄与度及び使用頻度を用いて、登録候補語彙データを並べ替える手順を説明するための図である。同実施形態に係る優先使用頻度差条件を用いて、登録候補語彙データを並べ替える手順を説明するための図である。本発明の第３実施形態に係る例外語辞書作成装置の構成を示すブロック図である。（ａ）は同実施形態に係る処理済語彙リストデータのデータ構成図、（ｂ）は拡張語彙リストデータの構成図である。実際の米国の各ラストネームの人口に占める割合を上位から累積したグラフと、各ラストネームの使用頻度を表したグラフである。認識劣化寄与度に従って例外語辞書を作成して音声認識の実験を行った場合の認識率向上結果を示すグラフである。従来のテキスト発音記号変換装置を用いて電話帳音声認識辞書を作成する手順を説明するための図である。従来の電話帳音声認識辞書を用いて音声認識を行う手順を説明するための図である。従来のテキスト発音記号変換装置を用いて音楽再生装置音声認識辞書を作成する手順を説明するための図である。従来の音楽再生装置音声認識辞書を用いて音声認識を行う手順を説明するための図である。従来の単語辞書サイズ削減装置の処理を示すブロック図である。（ａ）は認識率への影響が小さい発音記号列と変換発音記号列との不一致例、（ｂ）は認識率への影響が大きい発音記号列と変換発音記号列との不一致例を示す図である。

　以下、本発明を実施するための最良の形態を図面を参照しながら説明する。なお、以下の説明において参照する各図では、他の図と同等部分は同一符号によって示されている。
　図１は、本発明の例外語辞書作成装置の基本構成を示すブロック図である。同図に示すように、例外語辞書作成装置は、認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換部２１と、認識対象語彙のテキスト列の変換結果である変換発音記号列と当該認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、認識劣化寄与度を算出する認識劣化寄与度算出部（発音記号列間距離算出部）２４と、算出された認識劣化寄与度に基づいて登録対象の認識対象語彙を選択し、当該登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを例外語辞書６０に登録する例外語辞書登録部４１とを備えている。なお、認識劣化寄与度算出部２４は、請求項の記載における「認識劣化寄与度算出手段」又は「発音記号列間距離算出手段」に対応する。

　以下、これらの基本構成を備える本発明の例外語辞書作成装置について、各実施形態に即して詳細に説明する。
（第１実施形態）
　図２は、本発明の第１実施形態に係る例外語辞書作成装置１０の構成を示すブロック図である。例外語辞書作成装置１０は、語彙リストデータ作成部１１、テキスト発音記号変換部２１、認識劣化寄与度算出部２４、登録候補語彙リスト作成部３１、登録候補語彙リストソート部３２及び例外語辞書登録部４１を含んで構成される。これらの機能は、例外語辞書作成装置１０内の図示せぬＣＰＵ（Central Processing Unit）がメモリ等の記録媒体に記憶されているプログラムを読み出して実行することにより実現される機能である。また、語彙リストデータ１２、登録候補語彙リスト１３及び例外語辞書メモリサイズ条件７１は、例外語辞書作成装置１０内の図示せぬメモリ等の記録媒体に記憶されるデータである。また、データベースまたは単語辞書５０及び例外語辞書６０は、例外語辞書作成装置１０外部の記録媒体に設けられたデータベースまたはデータ記憶領域である。

　データベースまたは単語辞書５０には、複数の語彙データが記憶される。図３（ａ）には、語彙データのデータ構成の一例を示す。同図に示すように、語彙データは、語彙のテキスト列と、そのテキスト列の正しい発音記号列とで構成される。ここで、本実施形態に係る語彙は、人名、楽曲の曲名、演奏者や演奏グループの名前、曲の収められているアルバムのタイトル名等である。
　語彙リストデータ作成部１１は、データベースまたは単語辞書５０に記憶されている語彙データに基づいて語彙リストデータ１２を生成し、例外語辞書作成装置１０内のメモリ等の記録媒体に記憶する。

　図３（ｂ）には、語彙リストデータ１２のデータ構成の一例を示す。語彙リストデータ１２は、語彙データが有するテキストデータ列と発音記号列とに加えて、削除候補フラグと認識劣化寄与度とを更に含むデータ構成を有する。この削除候補フラグと認識劣化寄与度とは、語彙リストデータ１２がメモリなどの記録媒体に構築されるときに初期化される。
　テキスト発音記号変換部２１は、テキスト列を発音記号列に変換するルールのみを用いて、または、ルールと既存の例外語辞書とを用いて、認識対象語彙のテキスト列を発音記号列に変換する。以下、テキスト列のテキスト発音記号変換部２１による変換結果を「変換発音記号列」ともいう。
　認識劣化寄与度算出部２４は、語彙リストデータ１２の発音記号列と、当該テキスト列をテキスト発音記号変換部２１で変換した結果である変換発音記号列とが一致しなかった場合に、テキスト認識劣化寄与度の値を算出する。そして、当該算出した値で語彙リストデータ１２の認識劣化寄与度を更新するとともに、語彙リストデータ１２の削除候補フラグを偽に更新する。

　ここで、認識劣化寄与度とは、変換発音記号列の正しい発音記号列との違いが、音声認識性能の劣化に影響を与える度合いを示す。具体的には、認識劣化寄与度とは、語彙リストデータ１２から取得した発音記号列と、当該発音記号列をテキスト発音記号変換部２１により変換した結果である変換発音記号列との不一致の程度から、取得した発音記号列の代わりに音声認識辞書に変換発音記号列を登録した場合に、音声認識の精度が劣化する度合いを数値化したものである。言い換えれば、語彙リストデータ１２から取得した発音記号列に従って発音した音声と、変換発音記号列２２に従って発声した音声とがどの程度隔たっているかの発音記号列間距離である。発音記号列間距離は、発音記号列から音声合成装置などを用いて音声を合成し、その合成した音声間で発音記号列間距離を算出する方法、語彙リストデータ１２から取得した発音記号列と変換発音記号列とを登録した音声認識辞書で音声認識を行い、発音記号間の認識尤度の差を発音記号列間距離として算出する方法、ＤＰ（Dynamic Programming：動的計画法）マッチングなどによって語彙リストデータ１２から取得した発音記号列と変換発音記号列との発音記号の違いを発音記号列間距離として算出する方法などがある。算出方法の詳細は後述する。

　なお、語彙リストデータ１２の発音記号列と、当該テキスト列をテキスト発音記号変換部２１で変換した結果である変換発音記号列とが一致した場合は、例外語辞書６０に登録する必要がないので、認識劣化寄与度算出部２４は認識劣化寄与度の値を算出せず、語彙リストデータ１２の削除候補フラグを真に更新する。
　登録候補語彙リスト作成部３１は、語彙リストデータ１２のうち、削除候補フラグが偽のデータのみを登録候補語彙リストデータとして抽出し、登録候補語彙リストデータの一覧として登録候補語彙リスト１３を作成してメモリに記憶する。
　登録候補語彙リストソート部３２は、登録候補語彙リスト１３内の登録候補語彙リストデータを、認識劣化寄与度の大きいものの順にソートする。

　例外語辞書登録部４１は、登録候補語彙リスト１３内の複数の登録候補語彙リストデータの中から、各登録候補語彙リストデータの認識劣化寄与度に基づいて、登録対象となる登録候補語彙リストデータを選択し、当該選択した登録候補語彙リストデータのテキスト列とその発音記号例とを例外語辞書６０に登録する。
　具体的には、例外語辞書登録部４１は、登録候補語彙リスト１３内の登録候補語彙リストデータのうち、ソート順で上位に存在する登録候補語彙リストデータ、すなわち、比較的大きい認識劣化寄与度を有する登録候補語彙リストデータを選択し、選択した登録候補語彙リストデータのテキスト列とその発音記号例とを例外語辞書６０に登録する。このとき、例外語辞書６０に記憶可能なデータ制限容量に応じて予め設定された例外語辞書メモリサイズ条件７１に基づいて、例外語辞書６０に記憶可能なデータ制限容量を超えない範囲で、最大数の語彙を登録してもよい。これにより、例外語辞書６０に記憶可能なデータ量に制約があっても、最適な音声認識性能が得られる例外語辞書６０を得ることができる。

　例外語辞書６０を作成するために用いたデータベースまたは単語辞書５０に記憶された語彙データが、特定の範疇（例えば人名や地名）の語彙のみからなる場合は、その範疇に特化された専用例外語辞書を実現することができる。また、テキスト発音記号変換部２１が既に例外語辞書を備えている場合に、データベースまたは単語辞書５０の持つ語彙データで新たに作成した例外語辞書６０を追加する形態により拡張例外語辞書を実現することができる。
　例外語辞書作成装置１０により作成された例外語辞書６０は、図４に示すように、音声認識装置８０の音声認識辞書８１を作成する際に用いられる。テキスト発音記号変換部２１は、認識対象語彙テキスト列にルールと例外語辞書６０とを適用して音声認識辞書８１を生成する。音声認識装置８０の音声認識部８２は、当該音声認識辞書８１を用いて音声を認識する。

　例外語辞書６０の辞書サイズは例外語辞書メモリサイズ条件７１に基づいて削減できるため、例えば、音声認識装置８０が記憶容量の小さい携帯電話機であっても、携帯電話機に例外語辞書６０を保存して使用することが可能となる。
　なお、例外語辞書６０は、音声認識装置８０の製造時から音声認識装置８０に記憶されていてもよいし、音声認識装置８０が通信機能を備えている場合には、音声認識装置８０はネットワーク上のサーバから例外語辞書６０をダウンロードして記憶してもよい。
　また、例外語辞書６０を音声認識装置８０に記憶せずに、ネットワーク上のサーバに記憶しておき、音声認識装置８０が当該サーバにアクセスして例外語辞書を利用してもよい。

（処理フロー）
　次に、図５及び図６に示すフローチャートを参照して、例外語辞書作成装置１０が行う処理手順について説明する。
　まず、例外語辞書作成装置１０の語彙リストデータ作成部１１は、データベースまたは単語辞書５０に基づいて、語彙リストデータ１２を作成する（図５のステップＳ１０１）。次に、変数ｉに１を設定し（ステップＳ１０２）、ｉ番目の語彙リストデータ１２を読み込む（ステップＳ１０３）。
　次に、例外語辞書作成装置１０は、ｉ番目の語彙リストデータ１２のテキスト列をテキスト発音記号変換部２１に入力し、テキスト発音記号変換部２１は、入力されたテキスト列を変換して、変換発音記号列を生成する（ステップＳ１０４）。

　次に、例外語辞書作成装置１０は、生成した変換発音記号列がｉ番目の語彙リストデータ１２の発音記号列と一致しているか否かを判定する（ステップＳ１０５）。変換発音記号列がｉ番目の語彙リストデータ１２の発音記号列と一致していると判定した場合は（ステップＳ１０５；Ｙｅｓ）、ｉ番目の語彙リストデータ１２の削除候補フラグを真に設定する（ステップＳ１０６）。
　一方、変換発音記号列がｉ番目の語彙リストデータ１２の発音記号列と一致していないと判定した場合は（ステップＳ１０５；Ｎｏ）、ｉ番目の語彙リストデータ１２の削除候補フラグを偽に設定する。さらに、認識劣化寄与度算出部２４は、変換発音記号列とｉ番目の語彙リストデータ１２の発音記号列とに基づいて認識劣化寄与度を算出し、当該算出した認識劣化寄与度をｉ番目の語彙リストデータ１２に登録する（ステップＳ１０７）。

　このようにして１番目の語彙リストデータ１２への削除候補フラグ及び認識劣化寄与度の登録が終了したならば、ｉをインクリメントし（ステップＳ１０９）、次の語彙リストデータ１２に対して同様の処理を繰り返す（ステップＳ１０３～Ｓ１０７）。ｉが最終番号となり（ステップＳ１０８；Ｙｅｓ）、全ての語彙リストデータ１２に対して登録が終了したならば、図６のステップＳ１１０に進む。
　ステップＳ１１０では、例外語辞書作成装置１０はｉに１を設定し、ｉ番目の語彙リストデータ１２を読み込んで（ステップＳ１１１）、読み込んだ語彙リストデータ１２の削除候補フラグが真か否かを判定する（ステップＳ１１２）。削除候補フラグが真でない場合にのみ（ステップＳ１１２；Ｎｏ）、ｉ番目の語彙リストデータ１２を登録候補語彙リストデータとして登録候補語彙リスト１３に登録する（ステップＳ１１３）。

　次に、ｉが最終番号か否かを判定し（ステップＳ１１４）、ｉが最終番号でない場合には（ステップＳ１１４；Ｎｏ）、ｉをインクリメントし（ステップＳ１１５）、ｉ番目の語彙リストデータ１２についてステップＳ１１１～Ｓ１１３までの処理を繰り返す。
　一方、ｉが最終番号の場合（ステップＳ１１４；Ｙｅｓ）、登録候補語彙リストソート部３２は、登録候補語彙リスト１３に登録された登録候補語彙リストデータを認識劣化寄与度の大きい順（すなわち、例外語辞書６０への登録優先順位の高い順）に並べ替える（ステップＳ１１６）。
　次に、ステップＳ１１７においてｉに１を設定し、例外語辞書登録部４１は、認識劣化寄与度の値がｉ番目に大きな登録候補語彙リストデータを、登録候補語彙リスト１３から読み込む（ステップＳ１１８）。

　例外語辞書登録部４１は、認識劣化寄与度の値がｉ番目に大きな登録候補語彙リストデータを例外語辞書６０に登録した場合に、例外語辞書６０に記憶されるデータ量が、例外語辞書メモリサイズ条件７１で示されるデータ制限容量を超えるかを判断する（ステップＳ１１９）。
　例外語辞書６０に記憶されるデータ量が例外語辞書メモリサイズ条件７１で示されるデータ制限容量を超えない場合には（ステップＳ１１９；Ｙｅｓ）、認識劣化寄与度の値がｉ番目に大きな登録候補語彙リストデータを例外語辞書６０に登録し（ステップＳ１２０）、ｉが最終番号でない場合には（ステップＳ１２１；Ｎｏ）、ｉをインクリメントし（ステップＳ１２２）、ステップＳ１１８～Ｓ１２２の処理を繰り返す。ｉが最終番号の場合には（ステップＳ１２１；Ｙｅｓ）、処理を終了する。

　一方、例外語辞書６０に記憶されるデータ量がデータ制限容量を超える場合には（ステップＳ１１９；Ｎｏ）、登録候補語彙リストデータを例外語辞書６０に登録せずに処理を終了する。
　なお、上述した実施形態では、登録候補語彙リストソート部３２が、登録候補語彙リスト１３中の登録候補語彙リストデータを認識劣化寄与度の大きい順にソートし、例外語辞書登録部４１が、ソート順に登録候補語彙リストデータを選択して例外語辞書６０に登録するようにしたが、登録候補語彙リストソート部３２によるソートを省略することも可能であり、例えば、図７のステップＳ２０１～Ｓ２０２に示すように、例外語辞書登録部４１が登録候補語彙リスト１３を直接参照して、認識劣化寄与度の大きい登録候補語彙データを判別して例外語辞書６０に登録するようにしてもよい。

（認識劣化寄与度）
　次に、認識劣化寄与度の各種算出方法について、詳細に説明する。
（スペクトル距離尺度を用いた認識劣化寄与度）
　まず、スペクトル距離尺度を用いた認識劣化寄与度算出について説明する。スペクトル距離尺度は２つの音声の短時間スペクトルの類似度あるいは距離を表し、ＬＰＣケプストラム距離等の種々の距離尺度が知られている（例えば、古井貞煕：“音響・音声工学”、近代科学社）。図８を用いてＬＰＣケプストラム距離の結果を用いた認識劣化寄与度算出方法について説明する。

　ここでは、認識劣化寄与度算出部２４は、発音記号列を入力することにより、その発音記号列に従った合成音声を合成する音声合成装置２４０１と、入力された２つの合成音のＬＰＣケプストラム距離を算出するＬＰＣケプストラム距離算出部２４０２とを備えている。
　語彙Ａの発音記号列ａと、テキスト発音記号変換部２１により語彙Ａのテキスト列が変換された結果である語彙Ａの変換発音記号列ａ’とが、認識劣化寄与度算出部２４に入力されると、認識劣化寄与度算出部２４は、発音記号列ａと変換発音記号列ａ’とをそれぞれ音声合成装置２４０１に入力し、発音記号列ａの合成音声と変換発音記号列ａ’の合成音声とを得る。次に、認識劣化寄与度算出部２４は、発音記号列ａの合成音声と変換発音記号列ａ’の合成音声とをＬＰＣケプストラム距離算出部２４０２に入力し、発音記号列ａの合成音声と変換発音記号列ａ’の合成音声とのＬＰＣケプストラム距離ＣＬ_Aを得る。

　ＬＰＣケプストラム距離ＣＬ_Aは、発音記号列ａから合成された合成音声と変換発音記号列ａ’から合成された合成音声とがどの程度隔たっているかを判断する距離であり、ＣＬ_Aが大きいほど合成音声の元となった発音記号列ａと変換発音記号列ａ’とが隔たっていることを示す発音記号間距離の一つであるので、認識劣化寄与度算出部２４は、ＣＬ_Aを語彙Ａの認識率劣化寄与度Ｄ_Aとして出力する。
　ＬＰＣケプストラム距離は音声そのものではなくても、その音声のスペクトラム系列であれば算出可能であるので、発音記号列ａと変換発音記号列ａ’とからそれぞれの発音記号列に従った音声のスペクトラム系列を出力する装置を音声合成装置２４０１の代わりに使い、スペクトラム系列からＬＰＣケプストラム距離を算出するＬＰＣケプストラム距離算出部２４０２を用いて認識率劣化寄与度を算出してもよい。また、スペクトル距離尺度として、帯域フィルタ群やＦＦＴで求めたスペクトルに基づく距離等を用いてもよい。

（音声認識尤度を用いた認識劣化寄与度）
　次に、図９を用いて、音声認識尤度の結果を用いた認識劣化寄与度算出方法について説明する。音声認識尤度とは、音声認識装置の音声認識辞書に登録された各語彙について、入力された音声とその語彙との一致の度合いを確率的に表した値で、出現確率または単に尤度とも呼ばれ、古井貞煕：“音響・音声工学”、近代科学社に詳しく記載されている。音声認識装置は、入力された音声と音声認識辞書に登録されている各語彙との尤度を算出し、最も高い尤度を示した語彙、すなわち入力された音声とその語彙との一致の度合いが最も高い語彙を音声認識の結果として得ている。

　ここでは、認識劣化寄与度算出部２４は、発音記号列を入力することにより、その発音記号列に従った合成音声を合成する音声合成装置２４０１と、入力された発音記号列に従って音声認識辞書２４０５に発音記号列を登録する音声認識辞書登録部２４０４と、音声認識辞書２４０５を使って音声認識を行い、音声認識辞書２４０５に登録された各語彙の尤度を算出する音声認識装置４と、音声認識装置４が算出した尤度から認識率劣化寄与度を算出する尤度差算出部２４０７とを備えている。音声認識辞書登録部２４０４が実際に音声認識辞書２４０５に登録するのは、発音記号列中の発音記号そのものではなく、発音記号と対応付けられた音声認識用の音素モデルデータであるが、ここでは、説明を簡潔にするため、当該発音記号と対応付けられた音声認識用の音素モデルデータを、発音記号として説明する。

　語彙Ａの発音記号列ａと、テキスト発音記号変換部２１により語彙Ａのテキスト列が変換された結果である語彙Ａの変換発音記号列ａ’とが認識劣化寄与度算出部２４に入力されると、認識劣化寄与度算出部２４は、発音記号列ａと変換発音記号列ａ’とを音声認識辞書登録部２４０４に渡すと共に、発音記号列ａを音声合成装置２４０１に入力する。音声認識辞書登録部２４０４は、音声認識辞書２４０５に発音記号列ａと変換発音記号列ａ’とを登録する（辞書登録内容２４０６参照）。音声合成装置２４０１は、発音記号列ａでの合成音声である語彙Ａの合成音声を合成し、語彙Ａの合成音声を音声認識装置４に入力する。

　音声認識装置４は、発音記号列ａと変換発音記号列ａ’とが登録されている音声認識辞書２４０５での語彙Ａの合成音声の音声認識を行い、発音記号列ａの尤度Ｌａと変換発音記号列ａ’の尤度Ｌａ’とを出力し、尤度差算出部２４０７に渡す。尤度差算出部２４０７は、尤度Ｌａと尤度Ｌａ’との差を算出する。尤度Ｌａは、発音記号列ａに基づいて合成された合成音声が発音記号列ａに対応する音素モデルデータの系列にどの程度一致しているかを数値化したものであり、尤度Ｌａ’は当該合成音声が変換発音記号列ａ’に対応する音素モデルデータの系列にどの程度一致しているかを数値化したものである。したがって、尤度Ｌａと尤度Ｌａ’との差は変換発音記号列ａ’が発音記号列ａからどの程度隔たっているかを示す発音記号間距離の一つであるので、認識劣化寄与度算出部２４は、尤度Ｌａと尤度Ｌａ’との差を語彙Ａの認識率劣化寄与度Ｄ_Aとして出力する。

　なお、発音記号列ａと変換発音記号列ａ’との尤度差を求めるために、音声認識には発音記号列ａに基づいて合成された合成音声を用いるのが自然であるが、必要なものは尤度差であるので、音声認識装置４に入力する合成音声を変換発音記号列ａ’に基づいて合成された合成音声としてもよい。
　また、発音記号列ａに基づいて合成された合成音声での尤度差と変換発音記号列ａ’に基づいて合成された合成音声での尤度差とは必ずしも一致しないので、この双方を求めて平均したものを認識率劣化寄与度としてもよい。

（ＤＰマッチングを用いた認識劣化寄与度）
　次に、ＤＰマッチングの結果を用いた認識劣化寄与度算出について説明する。この方法は、合成音声を介さず、発音記号列中の発音記号の違いを発音記号列間距離として算出する。
　ＤＰマッチングは、２つの符号列がどの程度似ているかを判断する手法であり、パターン認識や画像処理の基本技術として広く知られている（例えば、内田　誠一、“ＤＰマッチング概説”、信学技法、ＰＲＭＵ2006-166（2006-12）参照）。例えばＡという記号列にＡ’という記号列がどの程度似ているかを測定する場合、Ａの記号列のある記号が他の記号に置き換わる「置換誤り（Ｓ：Ｓｕｂｓｔｉｔｕｔｉｏｎ）」、Ａの記号列に元々無かった記号が付け加わる「挿入誤り（Ｉ：Ｉｎｓｅｒｔｉｏｎ）」、Ａの記号列に元々あった記号が消えてしまう「欠落誤り（Ｄ：Ｄｅｌｅｔｉｏｎ）」の三種類の変換を複数組み合わせることによりＡ’が生じたと考えて、最も少ない変換でＡからＡ’に変換する方法を推定する。推定する上で、変換の組み合わせの候補間でどの候補が一番少ない変換かを評価する必要があり、各変換をＡからＡ’を得る経路に置き換え、各変換をその経路距離として評価し、その経路距離の一番小さいものを、最も少ない変換でＡからＡ’に変換するパターン（「誤りパターン」という）とし、ＡからＡ’が生じた過程とみなす。ここで評価に使った最も短い経路距離をＡとＡ’との記号間距離とみなしてよい。このような経路距離が最も短いＡからのＡ’への変換及び変換パターンを最適マッチングと呼ぶ。

　このＤＰマッチングを、語彙リストデータ１２から取得した発音記号列と変換発音記号列とに適応することができる。図１０には、米国のラストネームの発音記号列と変換発音記号列とに対してＤＰマッチングを行い、出力された誤りパターンの例を示す。変換発音記号列を発音記号列と比較すると、テキスト列Ｍｏｏｒｅでは、発音記号列右から二番目の発音記号が置換され、右から三番目と四番目の発音記号間に挿入が発生している。テキスト列Ｒｏｂｉｎｓｏｎでは、発音記号列右から四番目の発音記号が置換されている。テキスト列Ｍｏｎｔｇｏｍｅｒｙでは、発音記号列右から六番目の発音記号が置換され、右から八番目の発音記号が欠落し、右から十番目の発音記号が置換されている。

　ＤＰマッチングを語彙リストデータ１２から取得した発音記号列と変換発音記号列とに適応して経路距離を算出する場合、経路距離は発音記号列が長いほど値が大きくなる傾向があるため、認識劣化寄与度として使うためには経路距離を発音記号列の長さで正規化する必要がある。
　このＤＰマッチングの結果を用いた認識劣化寄与度算出方法について、図１１を用いて説明する。ここでは、認識劣化寄与度算出部２４は、ＤＰマッチングを行なうＤＰマッチング部２４０８と、ＤＰマッチング部２４０８で算出された経路距離を発音記号列長で正規化する経路距離正規化部２４０９とを備えている。

　語彙Ａの発音記号列ａと、テキスト発音記号変換部２１により語彙Ａのテキスト列が変換された結果である語彙Ａの変換発音記号列ａ’とが、認識劣化寄与度算出部２４に入力されると、認識劣化寄与度算出部２４は、発音記号列ａと変換発音記号列ａ’とをＤＰマッチング部２４０８に渡す。
　ＤＰマッチング部２４０８は、発音記号列ａの記号列長ＰＬａの算出を行い、発音記号列ａと変換発音記号列ａ’との最適マッチングを見出し、最適マッチングの経路距離Ｌ_Aを算出し、経路距離Ｌ_Aと発音記号列ａの記号列長ＰＬａとを経路距離正規化部２４０９へ渡す。
　経路距離正規化部２４０９は、経路距離Ｌ_Aを発音記号列ａの記号列長ＰＬａで正規化した正規化経路距離Ｌ_A’を算出する。認識劣化寄与度算出部２４は、正規化経路距離Ｌ_A’を語彙Ａの認識劣化寄与度として出力する。

（ＤＰマッチングと発音記号に拠る重み付けの結果を用いた認識劣化寄与度算出）
　ＤＰマッチングの結果を用いた認識劣化寄与度算出は、通常のＤＰマッチングのアルゴリズムのみで容易に認識劣化寄与度の算出が可能であるという利便さがあるが、置換された発音記号の内容、挿入された発音記号の内容、欠落した発音記号の内容に関わらず、同じ重みとして扱っている。しかし、例えば、ある母音が、それに近い発音の他の母音に置き換わった場合と、全く異なった発音の子音に置き換わった場合とでは、後者の方が認識率の劣化を強く引き起こすため音声認識の認識率への影響度は両者間で異なる。このことを考慮して、全ての置換誤り、挿入誤り、欠落誤りの内容を同等に扱うことをせず、以下のように重み付けを行う。置換誤りの場合は、発音記号の置換の組み合わせの内容ごとに音声認識の認識率への影響度の大きいものほど認識劣化寄与度が大きくなるようにする。また、挿入誤りと欠落誤りの場合は、挿入された発音記号ごと、欠落した発音記号ごとに音声認識の認識率への影響度の大きいものほど認識劣化寄与度が大きくなるようにする。語彙リストデータ１２から取得した発音記号列と変換発音記号列とのＤＰマッチングによって得られた最適マッチングの置換誤り、挿入誤り、欠落誤りの内容まで吟味し比較する、ＤＰマッチングと発音記号に拠る重み付けの結果とを使った認識劣化寄与度算出により、より精密な認識劣化寄与度を得ることができる。

　ＤＰマッチングと発音記号に拠る重み付けの結果とを用いた認識劣化寄与度算出方法について、図１２を用いて説明する。ここでは、認識劣化寄与度算出部２４は、ＤＰマッチングを行なうＤＰマッチング部２４０８と、ＤＰマッチング部２４０８で決定された最適マッチングから類似距離を算出する類似距離算出部２４１１と、類似距離算出部２４１１で算出された類似距離を発音記号列長で正規化する類似距離正規化部２４１２とを備えている。
　語彙Ａの発音記号列ａと、テキスト発音記号変換部２１により語彙Ａのテキスト列が変換された結果である語彙Ａの変換発音記号列ａ’とが、認識劣化寄与度算出部２４に入力されると、認識劣化寄与度算出部２４は、発音記号列ａと変換発音記号列ａ’とをＤＰマッチング部２４０８に渡す。

　ＤＰマッチング部２４０８は、発音記号列ａの記号列長ＰＬａの算出を行い、発音記号列ａと変換発音記号列ａ’との最適マッチングを見出し、発音記号列ａと、変換発音記号列ａ’と、誤りパターンと、発音記号列ａの記号列長ＰＬａとを、類似距離算出部２４１１に渡す。
　類似距離算出部２４１１は、類似距離ＬＬ_Aを算出して、類似距離ＬＬ_Aと、記号列長ＰＬａとを類似距離正規化部２４１２へ渡す。なお、類似距離ＬＬ_Aの算出方法の詳細は後述する。
　類似距離正規化部２４１２は、類似距離ＬＬ_Aを変換発音記号列ａの記号列長ＰＬａで正規化した正規化類似距離ＬＬ_A’を算出する。
　認識劣化寄与度算出部２４は、正規化類似距離ＬＬ_A’を語彙Ａの認識劣化寄与度として出力する。

（類似距離）
　次に、類似距離算出部２４１１による類似距離ＬＬ_Aの算出方法について、図１３を用いて説明する。図１３は、最適マッチングの例、及び、例外語辞書作成装置１０のメモリに記憶されている置換距離テーブル、挿入距離テーブル、欠落距離テーブルを示す図である。これらの最適マッチング、置換距離テーブル、挿入距離テーブル、欠落距離テーブルに示されているＶａ、Ｖｂ、Ｖｃ、・・・は、母音の発音記号、Ｃａ、Ｃｂ、Ｃｃ、・・・は、子音の発音記号を表している。最適マッチングには、語彙Ａの発音記号列ａと、語彙Ａの変換発音記号列ａ’と、発音記号列ａ－変換発音記号列ａ’間の誤りパターンとが示されている。

　置換距離テーブル、挿入距離テーブル、欠落距離テーブルは、最適マッチングにおいて発音記号が一致した場合の距離を１とした場合の、誤りの種類毎に距離を算出するためのテーブルである。具体的には、置換距離テーブルは、置換誤りに関して、発音記号の組み合わせ毎に、音声認識の認識率への影響度を考慮した１より大きい距離を定義したテーブルである。挿入距離テーブルは、挿入された発音記号毎に音声認識の認識率への影響度を考慮した１より大きい距離を定義したテーブルである。欠落距離テーブルは、欠落した発音記号毎に音声認識の認識率への影響度を考慮した１より大きい距離を定義したテーブルである。ここでは、置換距離テーブルの発音記号の行（横方向）は、元の発音記号を表しており、置換距離テーブルの発音記号の列（縦方向）は、置換発音記号を表しており、元の発音記号の列と置換発音記号の行とが交わった部分に、その置換誤りが生じたときの距離が表されている。例えば、発音記号Ｖａが発音記号Ｖｂに置換された場合は、元の発音記号Ｖａの列と置換発音記号Ｖｂの行とが交わった距離Ｓ_VaVbを得る。なお、発音記号Ｖａが発音記号Ｖｂに置換された場合の距離Ｓ_VaVbと、発音記号Ｖｂが発音記号Ｖａに置換された場合の距離Ｓ_VbVaとは必ずしも同じ値となるとは限らない。挿入距離テーブルは、発音記号毎のその発音記号による挿入が生じた場合の距離を表しており、例えば発音記号Ｖａが挿入された場合は距離Ｉ_Vaを得る。欠落距離テーブルは、発音記号毎のその発音記号が欠落した場合の距離を表しており、例えば発音記号Ｖａが挿入された場合は距離Ｄ_Vaを得る。この語彙Ａの最適マッチングの発音記号列ａと変換発音記号列ａ’とでは、発音記号列ａの一番目の発音記号Ｃａは一致しているので距離１となり、発音記号列ａの二番目の発音記号Ｖａは発音記号Ｖｃに置換されているので距離Ｓ_VaVcとなり、発音記号列ａの三番目の発音記号Ｃｂは一致しているので距離１となり、発音記号列ａの四番目の発音記号Ｖｂは一致しているので距離１となり、発音記号列ａの四番目と五番目の発音記号の間にはＣｃが挿入されているので距離Ｉ_Ccとなり、発音記号列ａの五番目の発音記号Ｖｃは一致しているので距離１となり、発音記号列ａの六番目の発音記号Ｖａは欠落しているのでＤ_Vaとなる。この結果、発音記号列ａ－変換発音記号列ａ’間の発音記号に拠る重み付けの結果を使った類似距離ＬＬ_Aは、これらの発音記号間の距離を全て加算した値（１＋Ｓ_VaVc＋１＋１＋Ｉ_Cc＋１＋Ｄ_Va）となる。

　ここまでは最適マッチングにおいて発音記号が一致した場合の距離を一律に１とした説明を行なったが、一致した場合でも発音記号によって音声認識において認識率により重要な発音と比較的重要度の低い発音とが存在する。この場合、発音記号が一致した場合、より認識率への重要度の高い発音記号の一致ほど、その重要度を考慮して値が小さくなる１より小さい距離を発音記号毎に決定して、図１３に示す置換距離テーブル、挿入距離テーブル、欠落距離テーブルに加えて、図１４に示す一致距離テーブルを持つことにより、精密な認識劣化寄与度を得ることができる。ここで、一致距離テーブルは、例えば一致した発音記号がＶａである場合は距離Ｍ_Vaを得る。一致距離テーブルを加えた場合、語彙Ａの最適マッチングの発音記号列ａと、変換発音記号列ａ’と、発音記号列ａ－変換発音記号列ａ’間の誤りパターンとでは、発音記号列ａの一番目の発音記号Ｃａは一致しているため距離Ｍ_Caとなり、発音記号列ａの二番目の発音記号Ｖａは発音記号Ｖｃに置換されているため距離Ｓ_VaVcとなり、発音記号列ａの三番目の発音記号Ｃｂは一致しているため距離Ｍ_Cbとなり、発音記号列ａの四番目の発音記号Ｖｂは一致しているため距離Ｍ_Vbとなり、発音記号列ａの四番目と五番目の発音記号の間にはＣｃが挿入されているため距離Ｉ_Ccとなり、発音記号列ａの五番目の発音記号Ｖｃは一致しているため距離Ｍ_Vcとなり、発音記号列ａの六番目の発音記号Ｖａは欠落しているためＤ_Vaとなる。この結果、発音記号列ａ－変換発音記号列ａ’間の発音記号に拠る重み付けの結果を使った類似距離ＬＬ_Aは、これらの発音記号間の距離を全て加算した値（Ｍ_Ca＋Ｓ_VaVe＋Ｍ_Cb＋Ｍ_Vb＋Ｉ_Cc＋Ｍ_Vc＋Ｄ_Va）となる。

（第２実施形態）
　次に、本発明の第２実施形態について説明する。第２実施形態では、図２に示すデータベースまたは単語辞書５０に記憶される語彙データ中に「使用頻度」が更に含まれている。また、登録候補語彙リストソート部３２は、第１実施形態では登録候補語彙リスト１３中の登録候補語彙リストデータを認識劣化寄与度の高いものの順にソートしたが（図６のステップＳ１１６参照）、第２実施形態では、使用頻度を更に考慮して、登録候補語彙リストデータをソートする（第２の実施形態に係る処理フローを示す図１５のステップＳ２１６参照）。その他の構成及び処理手順は第１実施形態と同様である。

　ここで、「使用頻度」とは、現実世界で各語彙が使用される頻度を意味する。例えば、ある国におけるラストネーム（Ｌａｓｔ　Ｎａｍｅ；氏・名字）の使用頻度は、その国でそのラストネームを有する人口の、全体に占める割合と同等とみなすことができ、また、その国での国勢調査の集計時におけるラストネームの数の出現頻度とみなすことができる。
　現実世界では各語彙の使用頻度は異なり、使用頻度の高い語彙は音声認識辞書に登録される確率が高いため、現実の音声認識応用例での認識率への影響が大きくなる。従って、データベースまたは単語辞書５０に使用頻度が含まれている場合は、登録候補語彙リストソート部３２は、認識劣化寄与度と使用頻度との両方を勘案して、登録優先順位順に登録候補語彙リストデータをソートする。

　具体的には、登録候補語彙リストソート部３２は、予め定められた登録順決定条件に基づいてソートする。登録順決定条件は、使用頻度差条件と、認識劣化寄与度差条件と、優先使用頻度差条件の三つの数値条件からなる。使用頻度差条件と、認識劣化寄与度差条件と、優先使用頻度差条件はそれぞれ、使用頻度差条件閾値（ＤＦ；ＤＦは０または負の数字で与えられる）と、認識劣化寄与度差条件閾値（ＤＬ；ＤＬは０または正の数字で与えられる）と、優先使用頻度差条件閾値（ＰＦ；ＰＦは０または正の数字で与えられる）に基づいている。

　第１実施形態では、登録候補語彙リスト１３の登録候補語彙リストデータは、登録候補語彙リストソート部３２により認識劣化寄与度の高い順に並べられたが、第２実施形態では、認識劣化寄与度の高い順に並べられたこの各登録候補語彙リストデータを、以下に示す第１ステップから第３ステップまでの３つのステップで、更に並べ替える。
　第１ステップでは、各登録候補語彙リストデータの認識劣化寄与度を調べ、同じ認識劣化寄与度を持つ登録候補語彙リストデータが２つ以上存在した場合は、それらの登録候補語彙リストデータの中で使用頻度が高い順に並べ変える。このことにより、同じ認識劣化寄与度を持った登録候補語彙リストデータの中では、使用頻度の高い語彙がより優先的に例外語辞書６０に登録される順番に並べられる。

　第２ステップでは、ソート順位ｎ番目に登録されている登録候補語彙リストデータの使用頻度（Ｆ_n）とそれより一つ前のｎ－１番目に登録されている登録候補語彙のリストデータ使用頻度（Ｆ_n-1）の差（ｄＦ_n-1、_n＝Ｆ_n-1－Ｆ_n）が使用頻度差条件閾値（ＤＦ）以上（ｄＦ_n-1、_n≧ＤＦ）であるか、またはｄＦ_n-1、_nがＤＦよりも小さい場合（ｄＦ_n-1、_n＜ＤＦ）は、ｎ番目に登録されている登録候補語彙リストデータの認識劣化寄与度（Ｌ_n）とｎ－１番目に登録されている登録候補語彙のリストデータの認識劣化寄与度（Ｌ_n-1）の差（ｄＬ_n-1、_n＝Ｌ_n-1－Ｌ_n）が認識劣化寄与度差条件閾値（ＤＬ）以上（ｄＬ_n-1、_n≧ＤＬ）という条件を満たすように、それぞれの登録候補語彙リストデータを並び替える。このように並び替える方法は複数存在するが、例えば次のような方法がある。第１ステップが終了した状態で、次の操作を２番目に登録されている登録候補語彙リストデータから最後に登録されている登録候補語彙リストデータまで順番に行なう。すなわち、ｎ番目に登録されている登録候補語彙リストデータの使用頻度とｎ－１番目に登録されている登録候補語彙リストデータの使用頻度との差（ｄＦ_n-1、_n）を算出し、ＤＦと比較する。もし、ｄＦ_n-1、_nがＤＦ以上だった場合（ｄＦ_n-1、_n≧ＤＦ）はそれ以上なにも行なわず、ｎ＋１番目に登録されている登録候補語彙リストデータについて調べに行く。もしｄＦ_n-1、_nがＤＦより小さかった場合（ｄＦ_n-1、_n＜ＤＦ）は、ｎ番目に登録されている登録候補語彙リストデータの認識劣化寄与度とｎ－１番目に登録されている登録候補語彙リストデータの認識劣化寄与度との差（ｄＬ_n-1、_n）を算出し、ＤＬと比較する。もしｄＬ_n-1、_nがＤＬ以上だった場合（ｄＬ_n-1、_n≧ＤＬ）はそれ以上なにも行なわず、ｎ＋１番目に登録されている登録候補語彙リストデータについて調べに行く。もし、ｄＬ_n-1、_nがＤＬより小さかった場合（ｄＬ_n-1、_n＜ＤＬ）は、ｎ番目に登録されている登録候補語彙リストデータと、ｎ－１番目に登録されている登録候補語彙リストデータとの順番を入れ替えた後、ｎ＋１番目に登録されている登録候補語彙リストデータについて調べに行く。ｎ＋１番目に登録されている登録候補語彙リストデータでは、ｎ番目に登録されている登録候補語彙リストデータとの間で同様の操作（すなわち、ｄＦ_n、_n+1＝Ｆ_n－Ｆ_n+1とＤＦ、ｄＬ_n、_n+1＝Ｌ_n－Ｌ_n+1とＤＬの比較による操作）を行なう。この操作を最後に登録されている登録候補語彙リストデータまで行なったならば、第２ステップの並び替えの１回目が終了する。第２ステップの並び替えの１回目で、もし１回も登録候補語彙リストデータの順番の入れ替えが発生しなかったならば、第２ステップを終了とする。もし、登録候補語彙リストデータの順番の入れ替えが１回でも発生したならば、第２ステップの並び替えの２回目として、再度２番目に登録されている登録候補語彙リストデータ以下で、同じ操作を繰り返す。第２ステップの並び替えの２回目で、もし１回も登録候補語彙リストデータの順番の入れ替えが発生しなかったならば、第２ステップを終了とする。もし、登録候補語彙リストデータの順番の入れ替えが１回でも発生したならば、第２ステップの並び替えの３回目として、再度２番目に登録されている登録候補語彙リストデータ以下で同じ操作を繰り返す。このように操作を繰り返して、登録候補語彙リストデータの順番の入れ替えが発生しなくなった回で第２ステップは終了する。

　上記の第２ステップの並べ替え方法を、図１６、図１７、図１８、図１９を用いて具体的に説明する。ここでは、ＤＦを－０．２、ＤＬを０．５とする。図１６「第２ステップの並び替え１回目」の（ａ）「１回目の初期状態」の表は第１ステップが終了した状態を示す。（ａ）「１回目の初期状態」の表では、順位２番目の語彙ＢのｄＦ_1,2は－０．２１であるので、ｄＦ_1,2＜－０．２が成立している、そこでｄＬ_1,2を見ると０．２であるのでｄＬ_1,2＜０．５が成立しているで、１番目の語彙Ａと２番目の語彙Ｂとを入れ替える。入れ替えた後の状態が（ｂ）「１回目の３から７番目」の表である。（ｂ）「１回目の３から７番目」の表では３番目の語彙ＣのｄＦ_2,3は０．１４でありｄＦ_2,3≧－０．２となり入れ替えは発生しない。４番目の語彙ＤのｄＦ_3,4は－０．２１であるのでｄＦ_3,4＜－０．２が成立している、そこでｄＬ_3,4を見ると０．９であるのでｄＬ_3,4≧０．５となり入れ替えは発生しない。５番目の語彙ＥのｄＦ_4,5は０．２５でありｄＦ_4,5≧－０．２となり入れ替えは発生しない。６番目の語彙ＦのｄＦ_5,6は０．０２でありｄＦ_5,6≧－０．２となり入れ替えは発生しない。７番目の語彙ＧのｄＦ_6,7は－０．４９であるのでｄＦ_6,7＜－０．２が成立している。そこでｄＬ_6,7を見ると０．２であるのでｄＬ_6,7＜０．５が成立しているで、６番目の語彙Ｆと７番目の語彙Ｇを入れ替える。入れ替えた後の状態が（ｃ）「１回目の最終状態」の表である。最後の７番目の語彙まで操作を行なったので１回目の操作はこれで終了する。

　次に２回目の操作を行う。２回目の操作は図１６「第２ステップの並び替え１回目」の（ｃ）「１回目の最終状態」と同じ状態を示す図１７「第２ステップの並び替え２回目」の（ａ）「２回目の初期状態」から始まる。２番目の語彙Ａ、３番目の語彙ＣではｄＦ_1,2≧－０．２、ｄＦ_2,3≧－０．２となり入れ替えは発生しない。４番目の語彙ＤではｄＦ_3,4＜－０．２が成立しているがｄＬ_3,4≧０．５となり入れ替えは発生しない。５番目の語彙ＥではｄＦ_4,5≧－０．２となり入れ替えは発生しない。６番目の語彙ＧではｄＦ_5,6＜－０．２が成立しておりかつｄＬ_5,6＜０．５が成立しているで、５番目の語彙Ｅと６番目の語彙Ｇを入れ替える。入れ替えた後の状態が「２回目の最終状態」の表である。「２回目の最終状態」の表では７番目の語彙ＦではｄＦ_6,7≧－０．２となり入れ替えは発生しない。最後の７番目の語彙まで操作を行なったので２回目の操作はこれで終了する。

　次に３回目の操作を行う。３回目の操作は図１７「第２ステップの並び替え２回目」の（ｂ）「２回目の最終状態」と同じ状態を示す図１８「第２ステップの並び替え３回目」の（ａ）「３回目の初期状態」から始まる。２番目の語彙Ａ、３番目の語彙ＣではｄＦ_1,2≧－０．２、ｄＦ_2,3≧－０．２となり入れ替えは発生しない。４番目の語彙ＤではｄＦ_3,4＜－０．２が成立しているがｄＬ_3,4≧０．５となり入れ替えは発生しない。５番目の語彙ＧではｄＦ_4,5＜－０．２が成立しておりかつｄＬ_4,5＜０．５が成立しているで、４番目の語彙Ｄと５番目の語彙Ｇとを入れ替える。入れ替えた後の状態が（ｂ）「３回目の最終状態」の表である。（ｂ）「３回目の最終状態」の表では、６番目の語彙Ｅ、７番目の語彙Ｆでは、ｄＦ_5,6≧－０．２、ｄＦ_6,7≧－０．２となり入れ替えは発生しない。最後の７番目の語彙まで操作を行なったので３回目の操作はこれで終了する。

　次に４回目の操作を行う。４回目の操作は図１８「第２ステップの並び替え３回目」の（ｂ）「３回目の最終状態」と同じ状態を示す図１９「第２ステップの並び替え４回目」の「４回目の初期状態」から始まる。２番目の語彙Ａ、３番目の語彙ＣではｄＦ_1,2≧－０．２、ｄＦ_2,3≧－０．２となり入れ替えは発生しない。４番目の語彙ＧではｄＦ_3,4＜－０．２が成立しているがｄＬ_3,4≧０．５となり入れ替えは発生しない。５番目の語彙Ｄ、６番目の語彙Ｅ、７番目の語彙ＦではｄＦ_4,5≧－０．２、ｄＦ_5,6≧－０．２、ｄＦ_6,7≧－０．２となり入れ替えは発生しない。最後の７番目まで操作を行なったので４回目の操作はこれで終了し、この４回目の操作で順番の入れ替えが発生しなかったので第２ステップも終了となる。

　第２ステップの使用頻度差条件閾値（ＤＦ）は、ｎ－１番目の登録候補語彙リストデータに含まれる使用頻度がｎ番目の登録候補語彙リストデータに含まれる使用頻度より小さかった場合に、認識劣化寄与度差条件による入れ替えを行なうか否かを判断する閾値である。ここで、ＤＦとして０を与えた場合は、使用頻度が逆転しているｎ－１番目とｎ番目の登録候補語彙リストデータ全てに対して認識劣化寄与度差条件閾値（ＤＬ）による比較を行い、条件を満たしていれば登録候補語彙リストデータを入れ替えることとする。従ってＤＦとして０を与えると、ｎ－１番目の語彙の使用頻度がｎ番目の語彙の使用頻度より小さかった場合において、ｎ－１番目とｎ番目との入れ替えの実行は、ＤＬだけで決まる。

　第２ステップの認識劣化寄与度差条件閾値（ＤＬ）は、ｎ－１番目の登録候補語彙リストデータの使用頻度がｎ番目の語彙の使用頻度より小さく、かつ使用頻度差条件を満たしていた場合、これを入れ替えるとｎ－１番目の登録候補語彙リストデータとｎ番目の登録候補語彙リストデータとの間で認識劣化寄与度の逆転が生じるが、その認識劣化寄与度の逆転をどの範囲までならば許すかを示した値である。従ってＤＬとして０を与えれば使用頻度による入れ替えは生じず、第２ステップの効果はなくなる。一方、ＤＬの値を大きくすれば、使用頻度が高い語彙がより優先的に例外語辞書６０に登録されるような順番に並べられる。

　第３ステップでは、優先使用頻度差条件閾値（ＰＦ）より大きい使用頻度を持つ登録候補語彙リストデータに関しては、認識劣化寄与度に関わらず、使用頻度の大きい順に登録候補語彙リストデータの順位を並べ替える。すなわち、使用頻度の一番高い登録候補語彙リストデータを登録候補語彙リスト１３の順位１番目に移動し、順位１番目以降、優先使用頻度差条件より大きい使用頻度を持つ登録候補語彙リストデータを、認識劣化寄与度に関わらず、使用頻度の高い順に並べ替える。図２０を用いて具体的に説明する。図２０の（ａ）「第２ステップ終了時の状態」の表は、図１６、図１７、図１８、図１９で説明した第２ステップの操作の終了時、すなわち図１９の「４回目の初期状態」と同じ状態である。ここでＰＦを０．７とする。この条件を満たす登録候補語彙は、使用頻度０．７１の語彙Ｂと使用頻度０．７９の語彙Ｇである。語彙Ｂと語彙Ｇの中では、使用頻度０．７９の語彙Ｇが最も大きい使用頻度を持つので順位１となり、語彙Ｂは語彙Ｇに次ぐ使用頻度を持つので順位２となる。それ以外の語彙はＰＦ以下の使用頻度なので相対的な順位は変化しない。よって、並べ替えた結果、（ｂ）「第３ステップ終了時の状態」の表に示した順位となる。

　第２ステップ及び第３ステップは、語彙の使用頻度分布の形によって省かれる場合もある。例えば、使用頻度がなだらかな分布を示す場合は、第１ステップのみで十分な効果を示す場合がある。また使用頻度上位の限られた数の語彙の使用頻度が大きく、それ以外の語彙の使用頻度がなだらかな使用頻度分布を示す場合は、第１ステップの後、第２ステップを省いて第３ステップを実行することによって十分な効果を示す場合がある。上記２種類の使用頻度分布の中間的な使用頻度分布形状の場合は、第１ステップと第２ステップのみで第３ステップを省いても十分な効果を示す場合がある。
　認識劣化寄与度に限らず、語彙の使用頻度を用いて、例外語辞書６０への登録対象を決定した場合の効果について、具体的に説明する。理解しやすいように、以下の様に、前提条件を単純化する。

（１）テキスト発音記号変換部２１によって正しい発音記号列が得られなかった名前がＡとＢの２つだけだったとする。
（２）名前Ａの使用頻度は１０％（人口１，０００人につき１００人の出現率）、名前Ｂの使用頻度は０．１％（人口１，０００人につき１人の出現率）であるとする。
（３）名前Ａの認識劣化寄与度をａ、名前Ｂの認識劣化寄与度をｂとしたとき、ｂ＞ａであり、図４に示すように、名前Ａ、名前Ｂがテキスト発音記号変換部２１によって変換された変換発音記号列を用いて音声認識辞書８１に登録した場合の、音声認識部８２による平均認識率が名前Ａでは５０％、名前Ｂでは４０％であるとする。
（４）正しい発音記号列が音声認識辞書に登録されている名前の平均認識率は一律９０％（名前Ａ、名前Ｂとも例外語辞書６０に登録され、図４に示すように、正しい発音記号列で音声認識辞書８１に登録された場合の、音声認識部８２による平均認識率も９０％）であるとする。
（５）例外語辞書６０に登録できる名前は１語だけであるとする（名前Ａと名前Ｂのうち一つしか登録できない）。
（６）携帯電話の電話帳に登録されている登録名称が１人当たり１０登録として、電話帳の登録名称を音声認識装置に登録して使用している人が１，０００人いるとする。

　このような単純化された条件で例外語辞書６０に名前Ａまたは名前Ｂを登録した場合、１，０００人の電話帳全体の平均認識率を計算してみる。
　名前Ｂを例外語辞書６０に登録したとすると、名前Ｂの認識率は９０％となり、一方、１人当たり１０名の登録名称が登録されている電話帳１，０００人分で認識率５０％の名前Ａが出現する回数は１００回程度と考えられる。従って電話帳全体の平均認識率は以下の様に計算される。
（（０．９×９０００＋０．５×１０００）／（１０×１０００））×１００＝８６％
　名前Ａを例外語辞書６０に登録したとすると、名前Ａの認識率は９０％となり、一方、１人当たり１０名の登録名称が登録されている電話帳１，０００人分で認識率４０％の名前Ｂが出現する回数は１０回程度と考えられる。従って電話帳全体の平均認識率は以下の様に計算される。
（（０．９×９９９０＋０．４×１０）／（１０×１０００））×１００＝８９．９５％
　認識劣化寄与度のみで例外語辞書６０に登録される名前を決定する場合は、名前Ｂが登録されることになるが、使用頻度がこのように大きく異なる場合は認識劣化寄与度が小さくても使用頻度の高い単語（この場合、名前Ａ）を優先的に例外語辞書に登録した方が、ユーザー全体で見た場合の認識率が高くなる場合がある。

（第３実施形態）
　次に、本発明の第３実施形態について説明する。図２１は、本実施形態に係る例外語辞書作成装置１０の構成を示すブロック図である。第１実施形態では、データベースまたは単語辞書５０に記憶されている人名、曲名等の語彙データを、例外語辞書作成装置１０への入力としたが、本実施形態では、一般の単語が特許文献１に記載のフェーズ１とフェーズ２とを経て削除候補フラグと登録候補フラグとが付加された処理済語彙リストデータ５３（引用文献１に記載の「ＷＯＲＤ　ＬＩＮＫＥＤ　ＬＩＳＴ」に相当）を、例外語辞書作成装置１０への入力として用いる。

　図２２（ａ）には、処理済語彙リストデータ５３のデータ構成を示す。同図に示すように、処理済語彙リストデータ５３には、テキスト列と、発音記号列と、削除候補フラグと、登録候補フラグとが含まれる。なお、更に使用頻度が含まれていてもよい。処理済語彙リストデータ５３が有するフラグは、特許文献１に開示されたフェーズ２の語根となる単語を、登録候補（つまり、登録候補フラグが真）とする一方、この語根とルールとの組み合わせから元となる単語辞書に登録された発音記号列と同一の発音記号列が生成される単語を、削除候補（つまり、削除候補フラグが真）とするように設定されている。
　例外語辞書作成装置１０は、処理済語彙リストデータ５３から拡張語彙リストデータ１７を生成し、装置１０内のメモリなどの記録媒体に記憶する。

　図２２（ｂ）には、拡張語彙リストデータ１７のデータ構成を示している。拡張語彙リストデータ１７は、処理済語彙リストデータ５３の持つテキストデータ列と発音記号列と削除候補フラグと登録候補フラグとを持ち、更に認識劣化寄与度を持つデータ構造を有する。なお、処理済語彙リストデータ５３に使用頻度が存在する場合は、拡張語彙リストデータ１７は使用頻度を更に持つ。また、拡張語彙リストデータ１７のテキスト列、発音記号列、及び、削除候補フラグと登録候補フラグとの真偽の値は、処理済語彙リストデータ５３の値がそのまま転記され、認識劣化寄与度は、拡張語彙リストデータ１７がメモリなどの記録媒体に構築されるときに初期化される。

　テキスト発音記号変換部２１は、ｉ番目（ｉ＝１～最後のデータ数）の拡張語彙リストデータ１７から入力されたテキスト列を変換して変換発音記号列を生成する。
　認識劣化寄与度算出部２４は、テキスト発音記号変換部２１からｉ番目の変換発音記号列を受け取ると、ｉ番目の拡張語彙リストデータ１７の保持する削除候補フラグと、登録候補フラグとを確認する。確認した結果、削除候補フラグが真であった場合、または、削除候補フラグが偽かつ登録候補フラグが真（すなわち、語根として使われる語）であった場合は、処理を行わず、削除候補フラグが偽かつ登録候補フラグが偽であった場合は、変換発音記号列と拡張語彙リストデータ１７から取得した発音記号列とから認識劣化寄与度を算出し、当該算出した認識劣化寄与度を、ｉ番目の拡張語彙リストデータ１７に登録する。

　登録候補・登録語彙リスト作成部３３は、全ての拡張語彙リストデータ１７に対するテキスト発音記号変換部２１及び認識劣化寄与度算出部２４による処理が終了した後に、拡張語彙リストデータ１７のうち、削除候補フラグが真かつ登録候補フラグが偽のものを削除し、残りのうち、登録候補フラグが真の語彙（すなわち、語根として使われる語彙）を登録語彙とし、削除候補フラグが偽かつ登録候補フラグが偽の語彙を登録候補語彙として、２つに分類する。そして、登録候補・登録語彙リスト作成部３３は、各登録語彙のテキスト列とその発音記号列とを登録語彙リスト１６として、メモリなどの記録媒体に記憶する。さらに、登録候補・登録語彙リスト作成部３３は、登録候補語彙に関しては各語彙のテキスト列とその発音記号列と認識劣化寄与度と（使用頻度を持つ場合は使用頻度と）を、登録候補語彙リスト１３としてメモリなどの記録媒体に記憶する。

　登録候補語彙リストソート部３２は、上述した第１実施形態または第２実施形態と同様に、登録候補語彙リスト１３の登録候補語彙を登録優先順位の高い順にソートする。
　拡張例外語辞書登録部４２は、最初に、登録語彙リスト１６の各登録語彙のテキスト列と発音記号列とを例外語辞書６０に登録する。次に、登録候補語彙リスト１３の各語彙のテキスト列と発音記号列とを、登録優先順位の高い順に、例外語辞書メモリサイズ条件７１で示されるデータ制限容量を超えない範囲で最大数の語彙を例外語辞書６０に登録する。これにより、一般の単語についても、辞書サイズが所定の制約下で最適な音声認識性能が得られる例外語辞書６０が得られる。

　図２３は、実際の米国の各ラストネーム（Ｌａｓｔ　Ｎａｍｅ）の人口に占める割合を上位から累積したグラフと、各ラストネームの使用頻度を表したグラフである。全サンプル数は２６９，７６２，０８７であり、全ラストネーム数は６，２４８，４１５である。これらの数字は、米国のＣｅｎｓｕｓ　２０００（西暦２０００年国勢調査）の回答より抽出したものである。

　図２４は、認識劣化寄与度に従って例外語辞書６０を作成して音声認識の実験を行った場合の認識率向上結果を示すグラフである。実験は米国のラストネーム１万語彙データベースに対して行なったものであり、当データベースには各語彙であるラストネームの北米での使用頻度（すなわち全人口に対してそのラストネームを持つ人口の割合）が含まれている。２つのグラフのうち、「当該発明による例外語辞書作成」のグラフは、米国のラストネーム１万語彙データベースに対してＬＰＣケプストラム距離の結果を使った認識劣化寄与度を算出し、この認識劣化寄与度に従って例外語辞書６０を作成した上で音声認識実験を行なった場合の認識率を表し、「使用頻度による例外語辞書作成」のグラフは、使用頻度のみに基づいて例外語辞書６０を作成した場合の認識率を表す。

　さらに詳細には、「当該発明による例外語辞書作成」のグラフは、既存のテキスト発音記号変換装置で変換した発音記号列と米国のラストネーム１万語彙データベースの発音記号列とが異なった語彙全体の１０％を認識劣化寄与度の大きさに従って例外語辞書６０に登録した場合、２０％を例外語辞書６０に登録した場合、３０％を例外語辞書６０に登録した場合、というように１０％ずつ例外語辞書６０のサイズを大きくしていった場合（例外語辞書６０への登録率を変えた場合）の認識率の変化を示している。一方、「使用頻度による例外語辞書作成」のグラフは、既存のテキスト発音記号変換装置が変換した発音記号列と米国のラストネーム１万語彙データベースの発音記号列とが異なった語彙全体の１０％を使用頻度の高い順に例外語辞書に登録した場合、２０％を例外語辞書に登録した場合、３０％を例外語辞書に登録した場合、というように１０％ずつ例外語辞書のサイズを大きくしていった場合の認識率の変化を示している。
　認識率は、米国のラストネーム１万語彙データベースの中から無作為に選んだ１００語彙を音声認識辞書に登録し、この１００語彙全てを対象に認識率を測定した結果である。認識率の測定に用いた１００語彙の音声は合成音声であり、このデータベースに登録されている発音記号列が音声合成装置の入力である。

　グラフから明らかなように、本実験では例外語辞書への登録率が０％である場合（例外語辞書６０を使わずにルールのみで発音記号列への変換を行なう場合）の音声認識辞書を用いると、認識率は６８％であったものが、登録率１００％の例外語辞書を用いて登録された音声認識辞書では、認識率が８０％まで向上しており、例外語辞書を利用した場合の認識率向上への効果が確認できる。ここで、当該発明による例外語辞書６０による認識率は、例外語辞書６０への登録率５０％で８０％に達しており、このことから、認識劣化寄与度に従って例外語辞書６０を作成した場合、例外語辞書６０への登録語彙を半分に減らしても（すなわち、例外語辞書６０のメモリサイズをほぼ半分にしても）認識率が保たれることがわかる。これに対して、使用頻度により例外語辞書を作成した場合、例外語辞書への登録率が１００％になるまで認識率が８０％に達していない。また、例外語辞書への登録率１０％から９０％のどの点においても、当該発明による例外語辞書６０での認識率は、使用頻度情報による例外語辞書での認識率を上回っている。以上の実験結果から当該発明による例外語辞書６０の作成方法の有効性が明確に示されている。
　なお、認識対象語彙は英語に限らず、英語以外の言語であっても本発明を適用可能である。

１０　例外語辞書作成装置
１１　語彙リストデータ作成部
１２　語彙リストデータ
１３　登録候補語彙リスト
１６　登録語彙リスト
１７　拡張語彙リストデータ
２１　テキスト発音記号変換部
２２　変換発音記号列
２４　認識劣化寄与度算出部
３１　登録候補語彙リスト作成部
３２　登録候補語彙リストソート部
３３　登録候補・登録語彙リスト作成部
４１　例外語辞書登録部
４２　拡張例外語辞書登録部
５０　データベースまたは単語辞書
５３　処理済語彙リストデータ
６０　例外語辞書
７１　例外語辞書メモリサイズ条件

Claims

　語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成装置であって、
　認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換手段と、
　認識対象語彙のテキスト列の前記テキスト発音記号変換手段による変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列の前記正しい発音記号列との違いが音声認識性能の劣化に影響を与える度合いである認識劣化寄与度を算出する認識劣化寄与度算出手段と、
　前記認識劣化寄与度算出手段により算出された複数の各認識対象語彙に対する認識劣化寄与度に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録手段と
　を備えることを特徴とする例外語辞書作成装置。
　前記例外語辞書に記憶可能なデータ制限容量を記憶する例外語辞書メモリサイズ条件記憶手段をさらに備え、
　前記例外語辞書登録手段は、前記例外語辞書に記憶されるデータ量が前記データ制限容量を超えないように、前記登録を行うことを特徴とする請求項１に記載の例外語辞書作成装置。
　前記例外語辞書登録手段は、
　前記複数の各認識対象語彙の使用頻度に更に基づいて、登録対象の認識対象語彙を選択することを特徴とする請求項１又は２に記載の例外語辞書作成装置。
　前記例外語辞書登録手段は、
　予め定められた閾値よりも大きい前記使用頻度を有する認識対象語彙を、前記認識劣化寄与度に関わらず、優先して登録対象の認識対象語彙として選択することを特徴とする請求項３に記載の例外語辞書作成装置。
　前記認識劣化寄与度算出手段は、
　前記変換発音記号列と前記正しい発音記号列との間のスペクトル距離尺度を、前記認識劣化寄与度として算出することを特徴とする請求項１から４の何れか１項に記載の例外語辞書作成装置。
　前記認識劣化寄与度算出手段は、
　前記変換発音記号列に基づく音声の認識結果である音声認識尤度と、前記正しい発音記号列に基づく前記音声の認識結果である音声認識尤度との差を、前記認識劣化寄与度として算出することを特徴とする請求項１から４の何れか１項に記載の例外語辞書作成装置。
　前記認識劣化寄与度算出手段は、
　前記変換発音記号列と、前記正しい発音記号列との間の最適マッチングによる経路距離を算出し、該算出した経路距離を前記正しい発音記号列の長さで正規化した正規化経路距離を、前記認識劣化寄与度として算出することを特徴とする請求項１から４の何れか１項に記載の例外語辞書作成装置。
　前記認識劣化寄与度算出手段は、
　前記変換発音記号列と前記正しい発音記号列との間の対応する発音記号同士の関係に基づく重み付けを加味した前記経路距離として類似距離を算出し、該算出した類似距離を前記正しい発音記号列の長さで正規化した正規化類似距離を前記認識劣化寄与度として算出することを特徴とする請求項７に記載の例外語辞書作成装置。
　請求項１から８の何れか１項に記載の例外語辞書作成装置により作成された例外語辞書を用いて認識対象語彙のテキスト列を発音記号列に変換し、該変換結果に基づいて音声認識辞書を作成する音声認識辞書作成手段と、
前記音声認識辞書作成手段で作成された音声認識辞書を用いて音声認識を行う音声認識手段と
を備えたことを特徴とする音声認識装置。
　語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成装置が行う例外語辞書作成方法であって、
　認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換ステップと、
　前記テキスト発音記号変換ステップにおける前記認識対象語彙のテキスト列の変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列の前記正しい発音記号列との違いが音声認識性能の劣化に影響を与える度合いである認識劣化寄与度を算出する認識劣化寄与度算出ステップと、
　前記認識劣化寄与度算出ステップにおいて複数の認識対象語彙各々に対して算出された認識劣化寄与度に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録ステップと
　を備えることを特徴とする例外語辞書作成方法。
　請求項１０に記載の例外語辞書作成方法により作成された例外語辞書を用いて認識対象語彙のテキスト列を発音記号列に変換し、該変換結果に基づいて音声認識辞書を作成する音声認識辞書作成ステップと、
　前記音声認識辞書作成ステップで作成された音声認識辞書を用いて音声認識を行う音声認識ステップと
　を備えたことを特徴とする音声認識方法。
　語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成プログラムであって、
　認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換手段と、
　前記認識対象語彙のテキスト列の前記テキスト発音記号変換手段による変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列の前記正しい発音記号列との違いが音声認識性能の劣化に影響を与える度合いである認識劣化寄与度を算出する認識劣化寄与度算出手段と、
　前記認識劣化寄与度算出手段により複数の認識対象語彙各々に対して算出された認識劣化寄与度に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録手段と
　をコンピュータに機能させることを特徴とする例外語辞書作成プログラム。
　語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成装置であって、
　認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換手段と、
　認識対象語彙のテキスト列の前記テキスト発音記号変換手段による変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列に基づく音声と前記正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出手段と、
　前記発音記号列間距離算出手段により算出された複数の各認識対象語彙に対する発音記号列間距離に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録手段と
　を備えることを特徴とする例外語辞書作成装置。
　語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成装置が行う例外語辞書作成方法であって、
　認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換ステップと、
　前記テキスト発音記号変換ステップにおける前記認識対象語彙のテキスト列の変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列に基づく音声と前記正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出ステップと、
　前記発音記号列間距離算出ステップにおいて複数の認識対象語彙各々に対して算出された発音記号列間距離に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録ステップと
　を備えることを特徴とする例外語辞書作成方法。
　語彙のテキスト列を発音記号列へ変換するルールと、該ルールによる変換対象外とする例外語のテキスト列とその正しい発音記号列とを対応付けて記憶した例外語辞書とに基づいて、認識対象語彙のテキスト列を発音記号列に変換する変換装置が用いる前記例外語辞書を作成するための例外語辞書作成プログラムであって、
　認識対象語彙のテキスト列を発音記号列に変換するテキスト発音記号変換手段と、
　前記認識対象語彙のテキスト列の前記テキスト発音記号変換手段による変換結果である変換発音記号列と、前記認識対象語彙のテキスト列の正しい発音記号列とが一致しなかった場合に、前記変換発音記号列に基づく音声と前記正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出手段と、
　前記発音記号列間距離算出手段により複数の認識対象語彙各々に対して算出された発音記号列間距離に基づいて、前記複数の認識対象語彙から登録対象の認識対象語彙を選択し、該選択された登録対象の認識対象語彙のテキスト列とその正しい発音記号列とを前記例外語辞書に登録する例外語辞書登録手段とをコンピュータに機能させることを特徴とする例外語辞書作成プログラム。
　語彙のテキスト列と、その正しい発音記号列とを有する認識対象語彙と、
　該認識対象語彙を所定のルールで前記テキスト列を発音記号列に変換するテキスト発音記号列変換手段と、
　該テキスト発音記号列変換手段で変換された変換発音記号列と、
　該変換発音記号列に基づく音声と、前記正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出手段と、
　該発音記号列間距離算出手段で算出された発音記号列間距離に基づいて前記認識対象語彙を登録する認識対象語彙登録手段と、
　を備えることを特徴とする認識語彙登録装置。
　認識対象語彙のテキスト列を所定のルールで発音記号列に変換するテキスト発音記号列変換手段と、
　該テキスト発音記号列変換手段で変換された変換発音記号列に基づく音声と、前記認識対象語彙の正しい発音記号列に基づく音声との間の距離である発音記号列間距離を算出する発音記号列間距離算出手段と、
　該発音記号列間距離算出手段で算出された発音記号列間距離に基づいて前記認識対象語彙を登録する認識対象語彙登録手段と、
　を備えることを特徴とする認識語彙登録装置。
　請求項１６又は１７に記載の認識語彙登録装置の前記認識対象語彙登録手段で登録された認識対象語彙を有する例外語辞書と、
　該例外語辞書を用いて認識対象語彙のテキスト列を発音記号列に変換し、該変換結果に基づいて音声認識辞書を作成する音声認識辞書作成手段と、
　前記音声認識辞書作成手段で作成された音声認識辞書を用いて音声認識を行う音声認識手段と、
　を備えたことを特徴とする音声認識装置。