JP2005292346A

JP2005292346A - 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム

Info

Publication number: JP2005292346A
Application number: JP2004105432A
Authority: JP
Inventors: Toru Iwazawa; 透岩沢
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2004-03-31
Filing date: 2004-03-31
Publication date: 2005-10-20

Abstract

【課題】音声認識を利用するシステムにおいて、音声認識語彙発話以外の不要音声を棄却する棄却辞書を低コストで自動生成する。
【解決手段】音声認識語彙格納部１０１より出力された音声認識語彙は音素変換部１０２であらかじめ定められた音素変換手順により音素変換される。変換された変換語彙は、変換元の音声認識語彙と比較され、変換箇所が１箇所以上存在するなどのある一定以上の条件を満たす場合に棄却単語出力部１０３へ出力される。
【選択図】図１

Description

本発明は、音声認識用棄却辞書生成システム、音声認識システム、音声対話ロボット、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラムに関し、特に、不要音声の棄却に用いる音声認識用棄却辞書生成システム、音声認識システム、音声対話ロボット、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラムに関する。

棄却辞書とは、音声認識システムにおいて不必要な音声を音声認識語彙と誤認識することを防止するための音声認識辞書のことを示す。棄却辞書に含まれる単語を棄却単語と呼ぶ。棄却辞書は、音声認識語彙が記述された音声認識辞書とともに音声認識させ、認識結果が棄却単語である場合に棄却すべきものとして扱うことで動作する。

従来の棄却辞書生成システムの一例が、特許文献１及び特許文献２に記載されている。

特許文献１及び２記載の棄却辞書生成システムは、音声認識語彙の発話データを持ち、膨大な棄却単語データベースの中から発話データの音声認識を阻害する棄却単語を除去することで棄却辞書を生成するものであった。

特許文献３記載の棄却辞書生成システムは、音声認識語彙と音節数が同じか近い母音音節列を擬似単語としてランダムに生成する擬似単語生成部と二つの単語間の類似度を算出する類似度計算部を持ち、類似度が認識語彙と比較して一定の範囲内に収まる擬似単語を棄却単語とするものであった。
特開２００２−３７２９８８号公報特開２００３−３３７５９５号公報特開２００１−１４７６９８号公報

第１の問題点は、棄却辞書の生成に音声認識語彙の発話音声を利用するということである。その理由は、音声認識辞書を変更するたびに発話音声を収録しなおさなければならないためである。

第２の問題点は、棄却辞書の生成にかかる時間コストが大きく動的に実運用される音声認識システムにおいて、音声認識辞書が動的に変化する場合に追従するのが難しいことである。

特許文献１に記載の棄却辞書生成システムは、音声認識語彙の収録が必要なため音声認識辞書の変化には追従不能である。また、特許文献２に記載の棄却辞書生成システムは、全音声認識語彙に対し任意の音節列との類似度計算を行うため時間的コストが大きい。

第３の問題点は、音声認識語彙数に比例して棄却辞書が膨大になると音声認識処理にかかる時間的コストが大きくなることである。例えば、音声認識語彙がＢＮＦ記法などを用いた文法記述で記述されている場合、通常、認識可能な音声認識語彙は爆発的に増大する。

その結果、文法記述を展開し得られた音声認識語彙から棄却単語を生成すると棄却単語数も爆発的に増大する。棄却語彙の増加は、音声認識に掛かる時間を増加させ、結果として音声認識の反応が劣化する問題が発生する。

そこで、本発明は、音声認識を行うシステムにおいて、音声認識語彙に適応した棄却辞書を少ない時間的コストで自動生成できるようにすることを課題とする。

上記課題を解決するための手段として、本発明は、音声認識用棄却辞書生成システムにおいて、音声を認識することで得られる音声認識語彙を格納する音声認識語彙格納部と、前記音声認識語彙に対し音素変換を行い変換語彙として出力する音素変換部と、前記変換語彙を棄却単語として出力する棄却単語出力部と、を備えることを特徴とする。

また、本発明は、音声認識用棄却辞書生成システムにおいて、前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似単語検出部をさらに備え、ここで、前記棄却単語出力部が前記類似単語検出部から受け渡された変換語彙を棄却単語として出力することを特徴とする。

さらに、本発明は、音声認識用棄却辞書生成システムにおいて、前記類似単語検出部による判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、前記類似単語検出部によって類似と判定された前記変換語彙に対し音声認識時にペナルティをかける情報を付与し出力するペナルティ付与部をさらに備えることを特徴とする。

また、本発明は、音声認識用棄却辞書生成システムにおいて、前記音声認識語彙が記述された辞書を格納する音声認識辞書格納部と、当該辞書から音声認識語彙を抽出し前記音声認識語彙格納部に受け渡す辞書解析部と、をさらに備えることを特徴とする。

また、本発明は、音声認識用棄却辞書生成システムにおいて、前記辞書解析部が、音声認識語彙抽出時にある意味づけがされたキーワードのみを取得し前記音声認識語彙格納部へ出力することを特徴とする。

また、本発明は、音声認識用棄却辞書生成システムにおいて、前記辞書解析部が、音声認識語彙取得時に音声認識辞書の文法記述構造を解析し、棄却辞書生成箇所を特定した上で該当箇所の音声認識語彙を取得することを特徴とする。

また、本発明は、音声認識用棄却辞書生成システムにおいて、前記棄却単語出力部が、棄却単語を前記棄却辞書生成箇所により特定された箇所に前記棄却語彙を挿入した音声認識辞書を出力することを特徴とする。

また、本発明は、音声認識システムにおいて、上記の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする。

また、本発明は、音声認識システムにおいて、上記の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする。

また、本発明は、音声対話ロボットにおいて、上記の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする。

また、本発明は、音声対話ロボットにおいて、上記の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする。

また、本発明は、音声対話ロボットにおいて、上記の音声認識用棄却辞書生成システムにより生成された棄却単語を適用することを特徴とする。

また、本発明は、音声認識用棄却語彙生成方法において、音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする。

また、本発明は、音声認識用棄却語彙生成方法において、前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする。

また、本発明は、音声認識用棄却語彙生成方法において、前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする。

また、本発明は、音声認識用棄却語彙生成プログラムにおいて、音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする。

また、本発明は、音声認識用棄却語彙生成プログラムにおいて、前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする。

また、本発明は、音声認識用棄却語彙生成プログラムにおいて、前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする。

本発明によれば、音声認識語彙に対し特定の音素変換を行った語彙を棄却語彙とすることで、音声認識語彙に適応した棄却辞書をより少ない時間的コストで自動生成することが可能となる。

また、本発明によれば、音声認識語彙をベースに音素変換を行い棄却単語を生成することにより、膨大な棄却単語候補を一つ一つ探索することなく棄却単語を生成することができるため、音声認識辞書に適応した棄却辞書をより少ない時間的コストで自動生成することが可能となる。

以下、添付図面を参照して本発明を実施するための最良の実施の形態を説明する。

図１は、本発明の第１の実施の形態の構成を示すブロック図である。

図１に示すように、本発明の第１の実施の形態は、音声認識語彙格納部１０１と、音素変換部１０２と、棄却単語出力部１０３とを有している。

音声認識語彙格納部１０１は、音声認識対象となる語彙を格納し、音素変換部１０２へ出力する。

音素変換部１０２は、音素変換の方法を記述した音素変換手順のリストを持ち、受け渡された音声認識語彙を各々の音素変換手順に従い音素変換を行い得られた変換語彙を出力する。

棄却単語出力部１０３は、音素変換部１０２より受け渡された変換語彙を図示しないコンピュータ画面などの出力デバイスへ出力する。

なお、音声認識語彙格納部１０１は、固定の語彙セットを格納するだけではなく、音声認識辞書からの語彙抽出や動作中のアプリケーションからの動的な語彙追加により格納される場合もある。

図２は音声認識辞書の例を示す。また、棄却単語出力部１０３は出力デバイスへの出力だけでなく、音声認識語彙格納部１０１から認識語彙を取得し変換語彙と併せて認識対象とする音声認識辞書を生成し出力する方法もある。

図３は、本実施の形態の音素変換部１０２の動作を示すフローチャートである。

まず、音声認識語彙のリストから音声認識語彙を一つ取得し（ステップＳ１）、音素変換手順を適用し変換語彙を生成する（ステップＳ２）。

次に変換語彙と変換前の音声認識語彙を比較し（ステップＳ３）、変換語彙が一定の条件を満たしている場合のみ（ステップＳ３／Ｎｏ）、変換語彙リストに出力する(ステップＳ４)。

「一定の条件」とは、例えば変換前の音声認識語彙と変換語彙の音節が一つ以上異なるといった、一定以上の変換がなされたという条件を示す。

ステップＳ２からステップＳ４までの処理を全ての音素変換手順に対して行う処理を適用し(ステップＳ５)、全ての音声認識語彙に対し実行し(ステップＳ６)、得られた変換語彙のリストを出力する(ステップＳ７)。

以上説明したように、本実施の形態によれば、音声認識語彙から音素変換手順に基づく音素変換により棄却語彙を生成するように構成されているため、高速に棄却語彙を生成することが可能である。

次に、本発明の第２の実施の形態を図面を参照して説明する。

図４は、本実施の形態の構成を示すブロック図である。

図４に示すように、本実施の形態の構成は、第１の実施の形態の構成に加え、類似単語検出部１０４を有する点で異なる。

類似単語検出部１０４は、音声認識語彙格納部１０１から音声認識語彙を、音素変換部１０２から変換語彙を受け取り、音声認識語彙と変換語彙の類似度を判定し類似と判定されなかった変換語彙を棄却単語出力部１０３へ出力する。

具体的な動作としては、音声認識語彙格納部１０１に含まれる各々の音声認識語彙を音素変換部１０２から受け渡された全ての変換語彙とマッチングし類似検出を行う。

単語間の類似検出アルゴリズムとしては、音声認識語彙と変換語彙が完全に一致するもののみを検出する方法や、子音や母音の類似性に着目し類似度を数値で算出し一定閾値を上回るものを検出する方法などが考えられる。

本実施の形態によれば、ある音声認識語彙から生成された変換語彙が他の認識語彙の妨げになることを回避することが可能となる。

次に、本発明の第３の実施の形態を図面を参照し詳細に説明する。

図５は、本実施の形態の構成を示すブロック図である。

図５に示すように、本実施の形態は、第２の実施の形態の構成に加え、類似語彙判定部１０４において類似と判定された変換語彙と判定されなかった変換語彙に分割し出力される点と、ペナルティ付与部１０５を有する点で異なる。

ペナルティ付与部１０５は、類似語彙判定部１０４から受け渡された変換語彙リストのうち、音声認識語彙と類似と判定された変換語彙にペナルティを付与するマークをつけ棄却単語出力部１０３へ出力する。

音声認識語彙と類似と判定されなかった変換語彙は何も付与されずに棄却単語出力部１０３へ出力される。実質的なペナルティの付与は、音声認識エンジンに該当の変換語彙をロードした後において、音声認識時にスコアを減点されるなどの形式で行われる。

本実施の形態によれば、音声認識語彙と類似で認識に悪影響を及ぼす変換語彙も棄却単語として出力することが可能となり、棄却の精度向上につながる。

次に、本発明の第４の実施の形態を図面を参照し詳細に説明する。

図６は、本実施の形態の構成を示すブロック図である。

図６に示すように、本実施の形態は、第３の実施の形態の構成に加え、音声認識辞書格納部１０６と、辞書解析部１０７とを備える点で異なる。

音声認識辞書格納部１０６は、音声認識語彙を格納した音声認識辞書を保持する。

辞書解析部１０７は、音声認識辞書格納部１０６が保持する音声認識辞書から音声認識語彙を抽出し音声認識語彙格納部１０１へ出力する。

そして、第１から第３の実施の形態のうちのいずれかの方法を用いて棄却辞書の生成が行われ、棄却単語出力部１０３に出力される。

辞書解析部１０７は、音声認識辞書の記述方法に応じ次の二つの方策を用い棄却単語数の増加を抑えた棄却単語生成を行う。

一つ目は不要語とキーワードの選別による棄却単語生成、二つ目は音声認識辞書の文法記述構造解析した結果に基づく棄却単語生成である。

音声認識アプリケーションによっては、不要音声による誤動作が深刻な動作に対応した音声認識語彙と深刻でない音声認識語彙がある場合がある。

このように不要音声による誤動作を防止したい音声認識語彙があらかじめ決められている場合、誤動作を防止したい音声認識語彙にあらかじめ特定の意味づけをしておき辞書解析部１０７で行われる音声認識語彙抽出時に意味づけされた語彙のみを抽出する方法が考えられる。

このようにすることで、生成される棄却単語数を少なく抑え音声認識への負荷を軽減させることが可能となる。

図８は、文法記述を用いて記述された音声認識辞書の例をネットワーク記述で表現したものである。図８のネットワークは下記の音声認識辞書で記述される。この音声認識辞書は、ＰＲＯＰＮＡＭＥとＶＡＬＳＴＲというタグにより意味づけされた語彙がキーワードであり、タグのないものは不要語彙として記述されている。

図９は、音声認識辞書を単純展開し棄却辞書を生成する例である。

この音声認識辞書を図９に示すように単純に展開し棄却単語を生成すると、１８０単語の音声認識語彙に対し棄却単語を生成する必要がある。これに対し本方式では、最初に音声認識語彙を不要語とキーワードに分ける。この音声認識辞書の場合は、接頭語と接尾語が不要語でＯＢＪ、ＦＵＮＣに属する語彙がキーワードである。

図１０は、各々のキーワードリストに棄却単語を追加する音声認識辞書の例をネットワーク記述で表現したものである。

次に音声認識辞書の構造に着目すると、この音声認識辞書はＯＢＪとＦＵＮＣの二つのキーワードリストが直列に置かれていることが分かる。そこで、各々のキーワードリスト(ＯＢＪ３単語、ＦＵＮＣ２単語)を音声認識語彙セットとした棄却単語を生成し、図１０のように各々のキーワードリストに棄却単語を追加することで棄却単語を組み込むことができる。

本実施の形態によれば、音声認識辞書が文法記述を利用し記述されている場合でも、所要時間の大幅な増加を招くことなく棄却単語生成を行うことが可能となる。

［実施例］
図２の音素変換部１０２の動作例について音素変換手順の例を挙げ説明する。ここでは音声認識語彙の子音をｈに変換する音素変換手順を音声認識語彙「こんにちわ」に適用する例に基づいて音素変換部の動作について説明する。

「こんにちわ」を音節ごとにアルファベットの音節で表示すると ``ｋｏ'', ``Ｎ'', ``ｎｉ'', ``ｔｉ'', ``ｗａ''となる。これに対し、上記の音素変換手順を適用する(``Ｎ''は変換不能なため除く)と、``ｈｏ'', `` Ｎ'', ``ｈｉ'', ``ｈｉ'', ``ｈａ''となる。

したがって、「こんにちわ」に対する変換語彙は「ほんひひは」ということになる。上記音素変換手順は、音声認識語彙全体を変換させたものであるが、変換箇所を限定することも可能である。

例えば、先頭音節のみ変換させる音素変換手順を利用した場合は「ほんにちわ」、先頭から３音節目まで変換させる音素変換手順を利用した場合は「ほんひちわ」という変換語彙が生成される。

また、音素変換手順は複数の変換手段を有することができるので、変換する子音をｈに限定せず複数の音素変換した変換語彙を生成し棄却精度を高めることも可能である。他の音素変換の方法としては、
・子音の類似度に応じ、子音音素ごとに変換音素を規定した音素変換手順を作成する方法。例えば、「音声認識語彙中の子音ｓを子音ｔに置き換える」など。
・母音を変換対象とする方法
などさまざまな変換方法が考えられる。

次に、上記の実施の形態をロボットの分野に適用し実施する例について述べる。対象は、人間とのコミュニケーション手段として音声認識を利用するロボットである。特に、人間がロボットに装着されたマイクに向かって発話する音声インタフェースを想定した場合、音声インタフェースには距離や音声入力角（マイクの正面からの角度のずれ）に対する融通性が求められる。

このような音声インタフェースにおいては、マイクの感度、すなわち入力レベルをある程度高く設定する必要があり、その結果として周囲雑音の影響を受けやすくなる。このような音声インタフェースにおいては、上記の実施の形態により生成された棄却辞書を適用した周囲雑音に対する誤動作防止が有効となる。

また、ロボットの応用例としてインターネットにアクセスしコンテンツプロバイダの作成したクイズやツールなどのコンテンツを自動的に取得したり新規の認識語彙を追加したりする場合が考えられる。

このような場合には、上記の実施の形態により新規追加された語彙に対する棄却辞書を動的に生成し音声認識に利用することで新規追加語彙に対する棄却を行うことが可能となる。

上記の実施の形態は、音素変換により高速な棄却辞書生成を行うことが可能であるため、このような動的な棄却語彙生成・追加を行う際にかかる時間的コストが少なくて済む利点がある。

上記の実施の形態では、音声認識を利用した情報検索システムや音声対話システムといった用途にも適用できる。また、人と音声コミュニケーションするロボットといった用途にも適用可能である。

本発明の第１の実施の形態の構成を示すブロック図である。音声認識辞書の一例を示す。第１の実施の形態の音素変換部１０２の動作を示すフローチャートである。本発明の第２の実施の形態の構成を示すブロック図である。本発明の第３の実施の形態の構成を示すブロック図である。文法記述構造を解析し棄却単語を生成する動作を示すフローチャートである。音声認識辞書の一例を示す。文法記述を用いて記述された音声認識辞書の例をネットワーク記述で表現したものである。音声認識辞書を単純展開し棄却辞書を生成する例である。各々のキーワードリストに棄却単語を追加する音声認識辞書の例をネットワーク記述で表現したものである。

符号の説明

１０１音声認識語彙格納部
１０２音素変換部
１０３棄却単語出力部
１０４類似単語出力部
１０５ペナルティ付与部
１０６音声認識辞書格納部
１０７辞書解析部

Claims

音声を認識することで得られる音声認識語彙を格納する音声認識語彙格納部と、
前記音声認識語彙に対し音素変換を行い変換語彙として出力する音素変換部と、
前記変換語彙を棄却単語として出力する棄却単語出力部と、
を備えることを特徴とする音声認識用棄却辞書生成システム。
前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似単語検出部をさらに備え、ここで、
前記棄却単語出力部が前記類似単語検出部から受け渡された変換語彙を棄却単語として出力することを特徴とする請求項１記載の音声認識用棄却辞書生成システム。
前記類似単語検出部による判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、
前記類似単語検出部によって類似と判定された前記変換語彙に対し音声認識時にペナルティをかける情報を付与し出力するペナルティ付与部をさらに備えることを特徴とする請求項２記載の音声認識用棄却辞書生成システム。
前記音声認識語彙が記述された辞書を格納する音声認識辞書格納部と、
当該辞書から音声認識語彙を抽出し前記音声認識語彙格納部に受け渡す辞書解析部と、
をさらに備えることを特徴とする請求項１から３のいずれか１項記載の音声認識用棄却辞書生成システム。
前記辞書解析部が、音声認識語彙抽出時にある意味づけがされたキーワードのみを取得し前記音声認識語彙格納部へ出力することを特徴とする請求項４記載の音声認識用棄却辞書生成システム。
前記辞書解析部が、音声認識語彙取得時に音声認識辞書の文法記述構造を解析し、棄却辞書生成箇所を特定した上で該当箇所の音声認識語彙を取得することを特徴とする請求項４又は５記載の音声認識用棄却辞書生成システム。
前記棄却単語出力部が、棄却単語を前記棄却辞書生成箇所により特定された箇所に前記棄却語彙を挿入した音声認識辞書を出力することを特徴とする請求項６記載の音声認識用棄却辞書生成システム。
請求項１から６のいずれか１項記載の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする音声認識システム。
請求項７記載の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする音声認識システム。
請求項１から６のいずれか１項記載の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする音声対話ロボット。
請求項７記載の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする音声対話ロボット。
請求項１から６のいずれか１項記載の音声認識用棄却辞書生成システムにより生成された棄却単語を適用することを特徴とする音声対話ロボット。
音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする音声認識用棄却語彙生成方法。
前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする請求項１３記載の音声認識用棄却語彙生成方法。
前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする請求項１４記載の音声認識用棄却語彙生成方法。
音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする音声認識用棄却語彙生成プログラム。
前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする請求項１６記載の音声認識用棄却語彙生成プログラム。
前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする請求項１７記載の音声認識用棄却語彙生成プログラム。