JP2005292346A - 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム - Google Patents

音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム Download PDF

Info

Publication number
JP2005292346A
JP2005292346A JP2004105432A JP2004105432A JP2005292346A JP 2005292346 A JP2005292346 A JP 2005292346A JP 2004105432 A JP2004105432 A JP 2004105432A JP 2004105432 A JP2004105432 A JP 2004105432A JP 2005292346 A JP2005292346 A JP 2005292346A
Authority
JP
Japan
Prior art keywords
vocabulary
speech recognition
rejection
dictionary
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004105432A
Other languages
English (en)
Inventor
Toru Iwazawa
透 岩沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004105432A priority Critical patent/JP2005292346A/ja
Publication of JP2005292346A publication Critical patent/JP2005292346A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 音声認識を利用するシステムにおいて、音声認識語彙発話以外の不要音声を棄却する棄却辞書を低コストで自動生成する。
【解決手段】 音声認識語彙格納部101より出力された音声認識語彙は音素変換部102であらかじめ定められた音素変換手順により音素変換される。変換された変換語彙は、変換元の音声認識語彙と比較され、変換箇所が1箇所以上存在するなどのある一定以上の条件を満たす場合に棄却単語出力部103へ出力される。
【選択図】 図1






Description

本発明は、音声認識用棄却辞書生成システム、音声認識システム、音声対話ロボット、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラムに関し、特に、不要音声の棄却に用いる音声認識用棄却辞書生成システム、音声認識システム、音声対話ロボット、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラムに関する。
棄却辞書とは、音声認識システムにおいて不必要な音声を音声認識語彙と誤認識することを防止するための音声認識辞書のことを示す。棄却辞書に含まれる単語を棄却単語と呼ぶ。棄却辞書は、音声認識語彙が記述された音声認識辞書とともに音声認識させ、認識結果が棄却単語である場合に棄却すべきものとして扱うことで動作する。
従来の棄却辞書生成システムの一例が、特許文献1及び特許文献2に記載されている。
特許文献1及び2記載の棄却辞書生成システムは、音声認識語彙の発話データを持ち、膨大な棄却単語データベースの中から発話データの音声認識を阻害する棄却単語を除去することで棄却辞書を生成するものであった。
特許文献3記載の棄却辞書生成システムは、音声認識語彙と音節数が同じか近い母音音節列を擬似単語としてランダムに生成する擬似単語生成部と二つの単語間の類似度を算出する類似度計算部を持ち、類似度が認識語彙と比較して一定の範囲内に収まる擬似単語を棄却単語とするものであった。
特開2002−372988号公報 特開2003−337595号公報 特開2001−147698号公報
第1の問題点は、棄却辞書の生成に音声認識語彙の発話音声を利用するということである。その理由は、音声認識辞書を変更するたびに発話音声を収録しなおさなければならないためである。
第2の問題点は、棄却辞書の生成にかかる時間コストが大きく動的に実運用される音声認識システムにおいて、音声認識辞書が動的に変化する場合に追従するのが難しいことである。
特許文献1に記載の棄却辞書生成システムは、音声認識語彙の収録が必要なため音声認識辞書の変化には追従不能である。また、特許文献2に記載の棄却辞書生成システムは、全音声認識語彙に対し任意の音節列との類似度計算を行うため時間的コストが大きい。
第3の問題点は、音声認識語彙数に比例して棄却辞書が膨大になると音声認識処理にかかる時間的コストが大きくなることである。例えば、音声認識語彙がBNF記法などを用いた文法記述で記述されている場合、通常、認識可能な音声認識語彙は爆発的に増大する。
その結果、文法記述を展開し得られた音声認識語彙から棄却単語を生成すると棄却単語数も爆発的に増大する。棄却語彙の増加は、音声認識に掛かる時間を増加させ、結果として音声認識の反応が劣化する問題が発生する。
そこで、本発明は、音声認識を行うシステムにおいて、音声認識語彙に適応した棄却辞書を少ない時間的コストで自動生成できるようにすることを課題とする。
上記課題を解決するための手段として、本発明は、音声認識用棄却辞書生成システムにおいて、音声を認識することで得られる音声認識語彙を格納する音声認識語彙格納部と、前記音声認識語彙に対し音素変換を行い変換語彙として出力する音素変換部と、前記変換語彙を棄却単語として出力する棄却単語出力部と、を備えることを特徴とする。
また、本発明は、音声認識用棄却辞書生成システムにおいて、前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似単語検出部をさらに備え、ここで、前記棄却単語出力部が前記類似単語検出部から受け渡された変換語彙を棄却単語として出力することを特徴とする。
さらに、本発明は、音声認識用棄却辞書生成システムにおいて、前記類似単語検出部による判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、前記類似単語検出部によって類似と判定された前記変換語彙に対し音声認識時にペナルティをかける情報を付与し出力するペナルティ付与部をさらに備えることを特徴とする。
また、本発明は、音声認識用棄却辞書生成システムにおいて、前記音声認識語彙が記述された辞書を格納する音声認識辞書格納部と、当該辞書から音声認識語彙を抽出し前記音声認識語彙格納部に受け渡す辞書解析部と、をさらに備えることを特徴とする。
また、本発明は、音声認識用棄却辞書生成システムにおいて、前記辞書解析部が、音声認識語彙抽出時にある意味づけがされたキーワードのみを取得し前記音声認識語彙格納部へ出力することを特徴とする。
また、本発明は、音声認識用棄却辞書生成システムにおいて、前記辞書解析部が、音声認識語彙取得時に音声認識辞書の文法記述構造を解析し、棄却辞書生成箇所を特定した上で該当箇所の音声認識語彙を取得することを特徴とする。
また、本発明は、音声認識用棄却辞書生成システムにおいて、前記棄却単語出力部が、棄却単語を前記棄却辞書生成箇所により特定された箇所に前記棄却語彙を挿入した音声認識辞書を出力することを特徴とする。
また、本発明は、音声認識システムにおいて、上記の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする。
また、本発明は、音声認識システムにおいて、上記の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする。
また、本発明は、音声対話ロボットにおいて、上記の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする。
また、本発明は、音声対話ロボットにおいて、上記の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする。
また、本発明は、音声対話ロボットにおいて、上記の音声認識用棄却辞書生成システムにより生成された棄却単語を適用することを特徴とする。
また、本発明は、音声認識用棄却語彙生成方法において、音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする。
また、本発明は、音声認識用棄却語彙生成方法において、前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする。
また、本発明は、音声認識用棄却語彙生成方法において、前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする。
また、本発明は、音声認識用棄却語彙生成プログラムにおいて、音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする。
また、本発明は、音声認識用棄却語彙生成プログラムにおいて、前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする。
また、本発明は、音声認識用棄却語彙生成プログラムにおいて、前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする。
本発明によれば、音声認識語彙に対し特定の音素変換を行った語彙を棄却語彙とすることで、音声認識語彙に適応した棄却辞書をより少ない時間的コストで自動生成することが可能となる。
また、本発明によれば、音声認識語彙をベースに音素変換を行い棄却単語を生成することにより、膨大な棄却単語候補を一つ一つ探索することなく棄却単語を生成することができるため、音声認識辞書に適応した棄却辞書をより少ない時間的コストで自動生成することが可能となる。
以下、添付図面を参照して本発明を実施するための最良の実施の形態を説明する。
図1は、本発明の第1の実施の形態の構成を示すブロック図である。
図1に示すように、本発明の第1の実施の形態は、音声認識語彙格納部101と、音素変換部102と、棄却単語出力部103とを有している。
音声認識語彙格納部101は、音声認識対象となる語彙を格納し、音素変換部102へ出力する。
音素変換部102は、音素変換の方法を記述した音素変換手順のリストを持ち、受け渡された音声認識語彙を各々の音素変換手順に従い音素変換を行い得られた変換語彙を出力する。
棄却単語出力部103は、音素変換部102より受け渡された変換語彙を図示しないコンピュータ画面などの出力デバイスへ出力する。
なお、音声認識語彙格納部101は、固定の語彙セットを格納するだけではなく、音声認識辞書からの語彙抽出や動作中のアプリケーションからの動的な語彙追加により格納される場合もある。
図2は音声認識辞書の例を示す。また、棄却単語出力部103は出力デバイスへの出力だけでなく、音声認識語彙格納部101から認識語彙を取得し変換語彙と併せて認識対象とする音声認識辞書を生成し出力する方法もある。
図3は、本実施の形態の音素変換部102の動作を示すフローチャートである。
まず、音声認識語彙のリストから音声認識語彙を一つ取得し(ステップS1)、音素変換手順を適用し変換語彙を生成する(ステップS2)。
次に変換語彙と変換前の音声認識語彙を比較し(ステップS3)、変換語彙が一定の条件を満たしている場合のみ(ステップS3/No)、変換語彙リストに出力する(ステップS4)。
「一定の条件」とは、例えば変換前の音声認識語彙と変換語彙の音節が一つ以上異なるといった、一定以上の変換がなされたという条件を示す。
ステップS2からステップS4までの処理を全ての音素変換手順に対して行う処理を適用し(ステップS5)、全ての音声認識語彙に対し実行し(ステップS6)、得られた変換語彙のリストを出力する(ステップS7)。
以上説明したように、本実施の形態によれば、音声認識語彙から音素変換手順に基づく音素変換により棄却語彙を生成するように構成されているため、高速に棄却語彙を生成することが可能である。
次に、本発明の第2の実施の形態を図面を参照して説明する。
図4は、本実施の形態の構成を示すブロック図である。
図4に示すように、本実施の形態の構成は、第1の実施の形態の構成に加え、類似単語検出部104を有する点で異なる。
類似単語検出部104は、音声認識語彙格納部101から音声認識語彙を、音素変換部102から変換語彙を受け取り、音声認識語彙と変換語彙の類似度を判定し類似と判定されなかった変換語彙を棄却単語出力部103へ出力する。
具体的な動作としては、音声認識語彙格納部101に含まれる各々の音声認識語彙を音素変換部102から受け渡された全ての変換語彙とマッチングし類似検出を行う。
単語間の類似検出アルゴリズムとしては、音声認識語彙と変換語彙が完全に一致するもののみを検出する方法や、子音や母音の類似性に着目し類似度を数値で算出し一定閾値を上回るものを検出する方法などが考えられる。
本実施の形態によれば、ある音声認識語彙から生成された変換語彙が他の認識語彙の妨げになることを回避することが可能となる。
次に、本発明の第3の実施の形態を図面を参照し詳細に説明する。
図5は、本実施の形態の構成を示すブロック図である。
図5に示すように、本実施の形態は、第2の実施の形態の構成に加え、類似語彙判定部104において類似と判定された変換語彙と判定されなかった変換語彙に分割し出力される点と、ペナルティ付与部105を有する点で異なる。
ペナルティ付与部105は、類似語彙判定部104から受け渡された変換語彙リストのうち、音声認識語彙と類似と判定された変換語彙にペナルティを付与するマークをつけ棄却単語出力部103へ出力する。
音声認識語彙と類似と判定されなかった変換語彙は何も付与されずに棄却単語出力部103へ出力される。実質的なペナルティの付与は、音声認識エンジンに該当の変換語彙をロードした後において、音声認識時にスコアを減点されるなどの形式で行われる。
本実施の形態によれば、音声認識語彙と類似で認識に悪影響を及ぼす変換語彙も棄却単語として出力することが可能となり、棄却の精度向上につながる。
次に、本発明の第4の実施の形態を図面を参照し詳細に説明する。
図6は、本実施の形態の構成を示すブロック図である。
図6に示すように、本実施の形態は、第3の実施の形態の構成に加え、音声認識辞書格納部106と、辞書解析部107とを備える点で異なる。
音声認識辞書格納部106は、音声認識語彙を格納した音声認識辞書を保持する。
辞書解析部107は、音声認識辞書格納部106が保持する音声認識辞書から音声認識語彙を抽出し音声認識語彙格納部101へ出力する。
そして、第1から第3の実施の形態のうちのいずれかの方法を用いて棄却辞書の生成が行われ、棄却単語出力部103に出力される。
辞書解析部107は、音声認識辞書の記述方法に応じ次の二つの方策を用い棄却単語数の増加を抑えた棄却単語生成を行う。
一つ目は不要語とキーワードの選別による棄却単語生成、二つ目は音声認識辞書の文法記述構造解析した結果に基づく棄却単語生成である。
音声認識アプリケーションによっては、不要音声による誤動作が深刻な動作に対応した音声認識語彙と深刻でない音声認識語彙がある場合がある。
このように不要音声による誤動作を防止したい音声認識語彙があらかじめ決められている場合、誤動作を防止したい音声認識語彙にあらかじめ特定の意味づけをしておき辞書解析部107で行われる音声認識語彙抽出時に意味づけされた語彙のみを抽出する方法が考えられる。
このようにすることで、生成される棄却単語数を少なく抑え音声認識への負荷を軽減させることが可能となる。
図8は、文法記述を用いて記述された音声認識辞書の例をネットワーク記述で表現したものである。図8のネットワークは下記の音声認識辞書で記述される。この音声認識辞書は、PROPNAMEとVALSTRというタグにより意味づけされた語彙がキーワードであり、タグのないものは不要語彙として記述されている。
図9は、音声認識辞書を単純展開し棄却辞書を生成する例である。
この音声認識辞書を図9に示すように単純に展開し棄却単語を生成すると、180単語の音声認識語彙に対し棄却単語を生成する必要がある。これに対し本方式では、最初に音声認識語彙を不要語とキーワードに分ける。この音声認識辞書の場合は、接頭語と接尾語が不要語でOBJ、FUNCに属する語彙がキーワードである。
図10は、各々のキーワードリストに棄却単語を追加する音声認識辞書の例をネットワーク記述で表現したものである。
次に音声認識辞書の構造に着目すると、この音声認識辞書はOBJとFUNCの二つのキーワードリストが直列に置かれていることが分かる。そこで、各々のキーワードリスト(OBJ3単語、FUNC2単語)を音声認識語彙セットとした棄却単語を生成し、図10のように各々のキーワードリストに棄却単語を追加することで棄却単語を組み込むことができる。
本実施の形態によれば、音声認識辞書が文法記述を利用し記述されている場合でも、所要時間の大幅な増加を招くことなく棄却単語生成を行うことが可能となる。
[実施例]
図2の音素変換部102の動作例について音素変換手順の例を挙げ説明する。ここでは音声認識語彙の子音をhに変換する音素変換手順を音声認識語彙「こんにちわ」に適用する例に基づいて音素変換部の動作について説明する。
「こんにちわ」を音節ごとにアルファベットの音節で表示すると ``ko'', ``N'', ``ni'', ``ti'', ``wa''となる。これに対し、上記の音素変換手順を適用する(``N''は変換不能なため除く)と、``ho'', `` N'', ``hi'', ``hi'', ``ha''となる。
したがって、「こんにちわ」に対する変換語彙は「ほんひひは」ということになる。上記音素変換手順は、音声認識語彙全体を変換させたものであるが、変換箇所を限定することも可能である。
例えば、先頭音節のみ変換させる音素変換手順を利用した場合は「ほんにちわ」、先頭から3音節目まで変換させる音素変換手順を利用した場合は「ほんひちわ」という変換語彙が生成される。
また、音素変換手順は複数の変換手段を有することができるので、変換する子音をhに限定せず複数の音素変換した変換語彙を生成し棄却精度を高めることも可能である。他の音素変換の方法としては、
・子音の類似度に応じ、子音音素ごとに変換音素を規定した音素変換手順を作成する方法。例えば、「音声認識語彙中の子音sを子音tに置き換える」など。
・母音を変換対象とする方法
などさまざまな変換方法が考えられる。
次に、上記の実施の形態をロボットの分野に適用し実施する例について述べる。対象は、人間とのコミュニケーション手段として音声認識を利用するロボットである。特に、人間がロボットに装着されたマイクに向かって発話する音声インタフェースを想定した場合、音声インタフェースには距離や音声入力角(マイクの正面からの角度のずれ)に対する融通性が求められる。
このような音声インタフェースにおいては、マイクの感度、すなわち入力レベルをある程度高く設定する必要があり、その結果として周囲雑音の影響を受けやすくなる。このような音声インタフェースにおいては、上記の実施の形態により生成された棄却辞書を適用した周囲雑音に対する誤動作防止が有効となる。
また、ロボットの応用例としてインターネットにアクセスしコンテンツプロバイダの作成したクイズやツールなどのコンテンツを自動的に取得したり新規の認識語彙を追加したりする場合が考えられる。
このような場合には、上記の実施の形態により新規追加された語彙に対する棄却辞書を動的に生成し音声認識に利用することで新規追加語彙に対する棄却を行うことが可能となる。
上記の実施の形態は、音素変換により高速な棄却辞書生成を行うことが可能であるため、このような動的な棄却語彙生成・追加を行う際にかかる時間的コストが少なくて済む利点がある。
上記の実施の形態では、音声認識を利用した情報検索システムや音声対話システムといった用途にも適用できる。また、人と音声コミュニケーションするロボットといった用途にも適用可能である。
本発明の第1の実施の形態の構成を示すブロック図である。 音声認識辞書の一例を示す。 第1の実施の形態の音素変換部102の動作を示すフローチャートである。 本発明の第2の実施の形態の構成を示すブロック図である。 本発明の第3の実施の形態の構成を示すブロック図である。 文法記述構造を解析し棄却単語を生成する動作を示すフローチャートである。 音声認識辞書の一例を示す。 文法記述を用いて記述された音声認識辞書の例をネットワーク記述で表現したものである。 音声認識辞書を単純展開し棄却辞書を生成する例である。 各々のキーワードリストに棄却単語を追加する音声認識辞書の例をネットワーク記述で表現したものである。
符号の説明
101 音声認識語彙格納部
102 音素変換部
103 棄却単語出力部
104 類似単語出力部
105 ペナルティ付与部
106 音声認識辞書格納部
107 辞書解析部

Claims (18)

  1. 音声を認識することで得られる音声認識語彙を格納する音声認識語彙格納部と、
    前記音声認識語彙に対し音素変換を行い変換語彙として出力する音素変換部と、
    前記変換語彙を棄却単語として出力する棄却単語出力部と、
    を備えることを特徴とする音声認識用棄却辞書生成システム。
  2. 前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似単語検出部をさらに備え、ここで、
    前記棄却単語出力部が前記類似単語検出部から受け渡された変換語彙を棄却単語として出力することを特徴とする請求項1記載の音声認識用棄却辞書生成システム。
  3. 前記類似単語検出部による判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、
    前記類似単語検出部によって類似と判定された前記変換語彙に対し音声認識時にペナルティをかける情報を付与し出力するペナルティ付与部をさらに備えることを特徴とする請求項2記載の音声認識用棄却辞書生成システム。
  4. 前記音声認識語彙が記述された辞書を格納する音声認識辞書格納部と、
    当該辞書から音声認識語彙を抽出し前記音声認識語彙格納部に受け渡す辞書解析部と、
    をさらに備えることを特徴とする請求項1から3のいずれか1項記載の音声認識用棄却辞書生成システム。
  5. 前記辞書解析部が、音声認識語彙抽出時にある意味づけがされたキーワードのみを取得し前記音声認識語彙格納部へ出力することを特徴とする請求項4記載の音声認識用棄却辞書生成システム。
  6. 前記辞書解析部が、音声認識語彙取得時に音声認識辞書の文法記述構造を解析し、棄却辞書生成箇所を特定した上で該当箇所の音声認識語彙を取得することを特徴とする請求項4又は5記載の音声認識用棄却辞書生成システム。
  7. 前記棄却単語出力部が、棄却単語を前記棄却辞書生成箇所により特定された箇所に前記棄却語彙を挿入した音声認識辞書を出力することを特徴とする請求項6記載の音声認識用棄却辞書生成システム。
  8. 請求項1から6のいずれか1項記載の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする音声認識システム。
  9. 請求項7記載の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする音声認識システム。
  10. 請求項1から6のいずれか1項記載の音声認識用棄却辞書生成システムにより生成された前記棄却単語を組み込んだ音声認識辞書を利用し動作することを特徴とする音声対話ロボット。
  11. 請求項7記載の音声認識用棄却辞書生成システムにより生成された前記音声認識辞書を利用し動作することを特徴とする音声対話ロボット。
  12. 請求項1から6のいずれか1項記載の音声認識用棄却辞書生成システムにより生成された棄却単語を適用することを特徴とする音声対話ロボット。
  13. 音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする音声認識用棄却語彙生成方法。
  14. 前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする請求項13記載の音声認識用棄却語彙生成方法。
  15. 前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする請求項14記載の音声認識用棄却語彙生成方法。
  16. 音声を認識することで得られる音声認識語彙を、当該音声認識語彙を格納するための音声認識語彙格納部に記憶させておき、前記音声認識語彙に対し音素変換を行い、得られた結果を棄却単語として出力することを特徴とする音声認識用棄却語彙生成プログラム。
  17. 前記変換語彙を前記音声認識語彙と類似するか否かを判定し、当該判定の結果類似でないと判定された場合、前記変換語彙を前記棄却単語出力部へ出力する類似語彙判定部で、前記変換語彙と前記音声認識語彙の類似判定し、類似でないと判定された前記変換語彙を棄却単語として出力することを特徴とする請求項16記載の音声認識用棄却語彙生成プログラム。
  18. 前記類似語彙判定部による類似判定の結果、類似と判定された前記変換語彙と、類似でないと判定された前記変換語彙とを分離して出力し、類似と判定された前記変換語彙にはペナルティ付与部において音声認識時にペナルティを付与する情報を付与することを特徴とする請求項17記載の音声認識用棄却語彙生成プログラム。
JP2004105432A 2004-03-31 2004-03-31 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム Pending JP2005292346A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004105432A JP2005292346A (ja) 2004-03-31 2004-03-31 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004105432A JP2005292346A (ja) 2004-03-31 2004-03-31 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム

Publications (1)

Publication Number Publication Date
JP2005292346A true JP2005292346A (ja) 2005-10-20

Family

ID=35325358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004105432A Pending JP2005292346A (ja) 2004-03-31 2004-03-31 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム

Country Status (1)

Country Link
JP (1) JP2005292346A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226091A (ja) * 2006-02-27 2007-09-06 Nippon Hoso Kyokai <Nhk> 音声認識装置及び音声認識プログラム
JP2010230852A (ja) * 2009-03-26 2010-10-14 Yamaha Corp コマンド認識装置
JP2016206580A (ja) * 2015-04-28 2016-12-08 四郎丸 功 音声認識装置及び音声認識システム
CN111583907A (zh) * 2020-04-15 2020-08-25 北京小米松果电子有限公司 信息处理方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62113197A (ja) * 1985-11-13 1987-05-25 ソニー株式会社 音声認識装置
JPH09244691A (ja) * 1996-03-07 1997-09-19 Nippon Telegr & Teleph Corp <Ntt> 入力音声リジェクト方法およびこの方法を実施する装置
JP2002372988A (ja) * 2001-06-14 2002-12-26 Nec Corp 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法
JP2003330491A (ja) * 2002-05-10 2003-11-19 Nec Corp 音声認識装置および音声認識方法ならびにプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62113197A (ja) * 1985-11-13 1987-05-25 ソニー株式会社 音声認識装置
JPH09244691A (ja) * 1996-03-07 1997-09-19 Nippon Telegr & Teleph Corp <Ntt> 入力音声リジェクト方法およびこの方法を実施する装置
JP2002372988A (ja) * 2001-06-14 2002-12-26 Nec Corp 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法
JP2003330491A (ja) * 2002-05-10 2003-11-19 Nec Corp 音声認識装置および音声認識方法ならびにプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226091A (ja) * 2006-02-27 2007-09-06 Nippon Hoso Kyokai <Nhk> 音声認識装置及び音声認識プログラム
JP2010230852A (ja) * 2009-03-26 2010-10-14 Yamaha Corp コマンド認識装置
JP2016206580A (ja) * 2015-04-28 2016-12-08 四郎丸 功 音声認識装置及び音声認識システム
CN111583907A (zh) * 2020-04-15 2020-08-25 北京小米松果电子有限公司 信息处理方法、装置及存储介质
CN111583907B (zh) * 2020-04-15 2023-08-15 北京小米松果电子有限公司 信息处理方法、装置及存储介质

Similar Documents

Publication Publication Date Title
US20180137109A1 (en) Methodology for automatic multilingual speech recognition
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
Ali et al. A complete KALDI recipe for building Arabic speech recognition systems
US11037553B2 (en) Learning-type interactive device
JP6066354B2 (ja) 信頼度計算の方法及び装置
JP6251958B2 (ja) 発話解析装置、音声対話制御装置、方法、及びプログラム
JP5480760B2 (ja) 端末装置、音声認識方法および音声認識プログラム
KR101590724B1 (ko) 음성 인식 오류 수정 방법 및 이를 수행하는 장치
US10319373B2 (en) Information processing device, information processing method, computer program product, and recognition system
US10535339B2 (en) Recognition result output device, recognition result output method, and computer program product
JP5703491B2 (ja) 言語モデル・音声認識辞書作成装置及びそれらにより作成された言語モデル・音声認識辞書を用いた情報処理装置
EP2645364A1 (en) Spoken dialog system using prominence
US20180137863A1 (en) Speech recognition apparatus, speech recognition method, and computer program product
JP2010078877A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
KR100930714B1 (ko) 음성인식 장치 및 방법
JP5611270B2 (ja) 単語分割装置、及び単語分割方法
KR100480790B1 (ko) 양방향 n-그램 언어모델을 이용한 연속 음성인식방법 및장치
US20110224985A1 (en) Model adaptation device, method thereof, and program thereof
JP5243325B2 (ja) 音声認識に仮名漢字変換システムを用いた端末、方法及びプログラム
JP2000172294A (ja) 音声認識方法、その装置及びプログラム記録媒体
US6963832B2 (en) Meaning token dictionary for automatic speech recognition
JP4269625B2 (ja) 音声認識辞書作成方法及びその装置と音声認識装置
JP2005292346A (ja) 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム
JP4987530B2 (ja) 音声認識辞書作成装置および音声認識装置
JP2965529B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070213

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080508

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100208

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100701