JP3621922B2

JP3621922B2 - 文認識装置、文認識方法、プログラム、および媒体

Info

Publication number: JP3621922B2
Application number: JP2002024427A
Authority: JP
Inventors: 由実脇田; 謙二松井
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2001-02-01
Filing date: 2002-01-31
Publication date: 2005-02-23
Anticipated expiration: 2022-01-31
Also published as: JP2002351494A

Description

【０００１】
【発明の属する技術分野】
本発明は、たとえば音声認識やテキスト文認識を利用する文認識装置、文認識方法、プログラム、および媒体に関する。
【０００２】
【従来の技術】
音声認識手段を例にして、従来技術を説明する。
【０００３】
音声認識手段において、認識処理が完全でなく誤りを起こしてしまい、誤ったまま出力されてしまうことは、実用化の際に大きな問題となる。
【０００４】
従来、この問題を解決するために、認識結果の第一候補の認識スコアが第二候補以下の認識スコアに比べて一定値以下の差であった場合に、認識結果の信頼度が低いとみなし認識結果文をリジェクトするまたは、再入力を促す方法が提案されている。
【０００５】
この例を、たとえば連続音声認識手段の典型的な探索手段であるｏｎｅ−ｐａｓｓ，ｎ−ｂｅｓｔ探索を用いた場合の例でより具体的に説明する。
【０００６】
予め各音素の音響的特徴を学習用音声ＤＢを用いて抽出し、さらに、左記音素の列として表される単語間の連結確率をテキストＤＢを用いて算出しておく。認識時には、入力音声の単位時間あたりの音響的特徴を分析し、この特徴量の時系列と予め学習された各音素の音響的特徴量とを比較し、各時点での入力音声が各音素である確率として音響スコアが算出される。
【０００７】
単語辞書に記述されている単語の音素列に従って時系列に沿って音響スコアを加算し、その加算値が各時点での音響スコアになる。全音素列分の探索空間がとれない場合には、スコアの高い上位Ｎ個の結果のみを残しながら処理が進む。
【０００８】
入力音声に複数単語が含まれている場合は、予め学習されている単語間の連結確率を参照しながら単語を連結し、連結時点では、上記音響スコアに加えて単語間の連結確率（言語スコアという）がスコアに加算される。
【０００９】
このようにして算出された上位Ｎ候補の認識スコアにおいて、第一候補と第二候補のスコアの差が一定値以下の場合には、第一候補の結果の信頼性が低いとみなして結果をリジェクトする（たとえば、實廣など：「対立音素間のゆう度差に基づく信頼性尺度によるリジェクション」電子情報通信学会技術報告ＳＰ９７−７６，ｐｐ．１−７（１９９７））。
【００１０】
【発明が解決しようとする課題】
しかしながら、上記の認識スコアは、入力音声と予め学習された音響モデルまたは言語モデルとの類似性を表わしており、入力する話者や発声内容の違いにより、たとえ正しい認識が行われていてもその値は大きく異なるのが現状である。このため、リジェクトのためのスコア比閾値を決めることが非常に困難であり、度々、正しい認識結果をリジェクトしたり、誤った認識結果を正しいと判断して出力することがあった。
【００１１】
このように、音声認識やテキスト文認識を利用して適切な文認識を行うことは、困難であった。
【００１２】
本発明は、上記従来のこのような課題を考慮し、音声認識やテキスト文認識を利用して適切な文認識を行うことができる文認識装置、文認識方法、プログラム、および媒体を提供することを目的とするものである。
【００１３】
【課題を解決するための手段】
第一の本発明（請求項１に対応）は、あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対を格納するデータベースと、
複数の単語から構成される入力された文を認識する文認識手段と、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択手段と、
前記選択された複数の特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定手段と、
前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識手段により誤って認識された誤認識特定単語を決定する誤認識特定単語決定手段とを備えた文認識装置である。
【００１４】
第二の本発明（請求項２に対応）は、前記誤認識特定単語決定手段は、前記データベースに格納されている標準特定単語対ではないと判定された任意特定単語対の内の所定個以上の任意特定単語対に共通する特定単語を前記誤認識特定単語として決定する第一の本発明の文認識装置である。
【００１５】
第三の本発明（請求項３に対応）は、前記誤認識特定単語があった場合には、（１）その誤認識特定単語に対応する特定単語の再入力、または（２）前記入力された文の再入力を要求する再入力要求手段を備えた第一または第二の本発明の文認識装置である。
【００１６】
第四の本発明（請求項４に対応）は、前記誤認識特定単語があった場合には、その旨をユーザに通知する通知手段を備えた第一または第二の本発明の文認識装置である。
【００１７】
第五の本発明（請求項５に対応）は、あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対を格納するデータベースと、
複数の単語から構成される入力された文を認識する文認識手段と、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択手段と、
前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定手段と、
前記判定の結果に基づいて、前記入力された文が前記文認識手段により誤認識されたか否かを決定する文誤認識決定手段とを備えた文認識装置である。
【００１８】
第六の本発明（請求項６に対応）は、前記誤認識があった場合には、前記入力された文の再入力を要求する文再入力要求手段を備えた第五の本発明の文認識装置である。
【００１９】
第七の本発明（請求項７に対応）は、前記誤認識があった場合には、その旨をユーザに通知する通知手段を備えた第五の本発明の文認識装置である。
【００２０】
第八の本発明（請求項８に対応）は、あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を格納する第一のデータベースと、
複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を格納する第二のデータベースと、
複数の単語から構成される入力された文を認識する文認識手段と、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択手段と、
前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定手段と、
前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定手段と、
前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識手段により誤って認識された誤認識特定単語を決定する誤認識特定単語決定手段とを備えた文認識装置である。
【００２１】
第九の本発明（請求項９に対応）は、前記誤認識特定単語決定手段は、前記第二のデータベースに格納されている標準特定単語クラス対ではないと判定された任意特定単語クラス対の内の所定個以上の任意特定単語クラス対に共通する特定単語クラスに属する特定単語を前記誤認識特定単語として決定する第八の本発明の文認識装置である。
【００２２】
第十の本発明（請求項１０に対応）は、前記誤認識特定単語があった場合には、（１）その誤認識特定単語に対応する特定単語の再入力、または（２）前記入力された文の再入力を要求する再入力要求手段を備えた第八または第九の本発明の文認識装置である。
【００２３】
第十一の本発明（請求項１１に対応）は、前記誤認識特定単語があった場合には、その旨をユーザに通知する通知手段を備えた第八または第九の本発明の文認識装置である。
【００２４】
第十二の本発明（請求項１２に対応）は、あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を格納する第一のデータベースと、
複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を格納する第二のデータベースと、
複数の単語から構成される入力された文を認識する文認識手段と、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択手段と、
前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定手段と、
前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定手段と、
前記判定の結果に基づいて、前記入力された文が前記文認識手段により誤認識されたか否かを決定する文誤認識決定手段とを備えた文認識装置である。
【００２５】
第十三の本発明（請求項１３に対応）は、前記誤認識があった場合には、前記入力された文の再入力を要求する文再入力要求手段を備えた第十二の本発明の文認識装置である。
【００２６】
第十四の本発明（請求項１４に対応）は、前記誤認識があった場合には、その旨をユーザに通知する通知手段を備えた第十二の本発明の文認識装置である。
【００２７】
第十五の本発明（請求項１５に対応）は、あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対を格納するデータベースを用いた文認識方法であって、
複数の単語から構成される入力された文を認識する文認識ステップと、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、
前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定ステップと、
前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識ステップにより誤って認識された誤認識特定単語を決定する誤認識特定単語決定ステップとを備えた文認識方法である。
【００２８】
第十六の本発明（請求項１６に対応）は、あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対を格納するデータベースを用いた文認識方法であって、
複数の単語から構成される入力された文を認識する文認識ステップと、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、
前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定ステップと、
前記判定の結果に基づいて、前記入力された文が前記文認識ステップにより誤認識されたか否かを決定する文誤認識決定ステップとを備えた文認識方法である。
【００２９】
第十七の本発明（請求項１７に対応）は、あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を格納する第一のデータベースと、
複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を格納する第二のデータベースとを用いた文認識方法であって、
複数の単語から構成される入力された文を認識する文認識ステップと、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、
前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定ステップと、
前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定ステップと、
前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識ステップにより誤って認識された誤認識特定単語を決定する誤認識特定単語決定ステップとを備えた文認識方法である。
【００３０】
第十八の本発明（請求項１８に対応）は、あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を格納する第一のデータベースと、
複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を格納する第二のデータベースとを用いた文認識方法であって、
複数の単語から構成される入力された文を認識する文認識ステップと、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、
前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定ステップと、
前記決定された特定単語クラス同士から構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定ステップと、
前記判定の結果に基づいて、前記入力された文が前記文認識ステップにより誤認識されたか否かを決定する文誤認識決定ステップとを備えた文認識方法である。
【００３１】
第十九の本発明（請求項１９に対応）は、あらかじめ定められた複数の特定単語同士から構成される、あらかじめ定められた複数の標準特定単語対をデータベースに格納する格納ステップと、複数の単語から構成される入力された文を認識する文認識ステップと、前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定ステップと、前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識ステップにより誤って認識された誤認識特定単語を決定する誤認識特定単語決定ステップとの全部または一部をコンピュータに実行させるためのプログラムである。
【００３２】
第二十の本発明（請求項２０に対応）は、あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対をデータベースに格納する格納ステップと、複数の単語から構成される入力された文を認識する文認識ステップと、前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定ステップと、前記判定の結果に基づいて、前記入力された文が前記文認識ステップにより誤認識されたか否かを決定する文誤認識決定ステップとの全部または一部をコンピュータに実行させるためのプログラムである。
【００３３】
第二十一の本発明（請求項２１に対応）は、あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を第一のデータベースに格納する第一の格納ステップと、複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を第二のデータベースに格納する第二の格納ステップと、複数の単語から構成される入力された文を認識する文認識ステップと、前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定ステップと、前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定ステップと、前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識ステップにより誤って認識された誤認識特定単語を決定する誤認識特定単語決定ステップとの全部または一部をコンピュータに実行させるためのプログラムである。
【００３４】
第二十二の本発明（請求項２２に対応）は、あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を第一のデータベースに格納する第一の格納ステップと、複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を第二のデータベースに格納する第二の格納ステップと、複数の単語から構成される入力された文を認識する文認識ステップと、前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定ステップと、前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定ステップと、前記判定の結果に基づいて、前記入力された文が前記文認識ステップにより誤認識されたか否かを決定する文誤認識決定ステップとの全部または一部をコンピュータに実行させるためのプログラムである。
【００３５】
第二十三の本発明（請求項２３に対応）は、第十九の本発明のプログラムを担持した媒体であって、コンピュータにより処理可能な媒体である。
【００３６】
第二十四の本発明（請求項２４に対応）は、第二十の本発明のプログラムを担持した媒体であって、コンピュータにより処理可能な媒体である。
【００３７】
第二十五の本発明（請求項２５に対応）は、第二十一の本発明のプログラムを担持した媒体であって、コンピュータにより処理可能な媒体である。
【００３８】
第二十六の本発明（請求項２６に対応）は、第二十二の本発明のプログラムを担持した媒体であって、コンピュータにより処理可能な媒体である。
【００３９】
なお、（１）認識結果文に含まれる特定の単語間の関係から誤認識単語を推定し、推定結果を認識結果文に反映させて出力することを特徴とする音声認識手段において、誤認識単語を推定するために用いた単語の全てまたは多くが誤認識単語であると推定された場合ユーザに再入力を要求することを特徴とする結果リジェクト手段または再入力要求手段や、（２）依存関係または共起関係にある特定単語または単語クラス対を予め学習しておき、これらと同じ単語対が全く認識結果文に含まれないまたは少ない場合にユーザに再入力を要求することを特徴とする結果リジェクト手段または再入力要求手段も、発明に含まれる。
【００４０】
このようなリジェクト手段は、たとえば、複数の単語からなる発声を認識するための連続音声認識手段と、認識結果から特定の単語を抽出する重要語抽出手段と、抽出された単語間の依存関係または共起関係を調べ認識結果の信頼性を判断する信頼性算出手段と、結果の信頼性がない場合に結果をリジェクトするリジェクト決定手段と、リジェクトした場合に再入力要求文を生成する出力文生成手段から構成される。
【００４１】
このようなリジェクト手段においては、認識結果文から特定の単語を抽出し、抽出された単語から依存関係または共起関係にある単語対を探し、左記単語対が存在しないまたは少ない場合に、認識結果をリジェクトすることで、話者や発声内容が変わっても安定して誤った結果をリジェクトすることが可能となる。
【００４２】
また、一般的なシソーラス辞書と学習用文セットに含まれる単語間の関係とを用いて決定された単語クラスを用いることを特徴とする上述の結果リジェクト手段または再入力要求手段も、発明に含まれる。
【００４３】
このようなリジェクト手段は、たとえば、重要語をクラス化する単語クラス決定手段と、先単語クラス間の関係を記述しておく単語クラス間の関係表と、複数の単語からなる発声を認識するための連続音声認識手段と、認識結果から特定の単語を抽出する重要語抽出手段と、抽出された単語間の依存関係または共起関係を調べ認識結果の信頼性を判断する信頼性算出手段と、結果の信頼性がない場合に結果をリジェクトするリジェクト決定手段と、リジェクトした場合に再入力要求文を生成する出力文生成手段から構成される。
【００４４】
このようなリジェクト手段においては、予め単語を最適にクラス化しておき、単語クラス間の依存関係または共起関係を調べ表に記述しておく。認識時には、認識結果文から特定の単語を抽出し、先の依存関係または共起関係を記述した関係表を用いて、抽出された単語から依存関係または共起関係にある単語対を探し、左記単語対が存在しないまたは少ない場合に、認識結果をリジェクトすることで、話者や発声内容が変わっても安定して誤った結果をリジェクトすることが可能となる。さらに、単語間の関係を学習する文セットに存在しない単語が認識時に入力されても、リジェクトまたは再入力要求処理が可能となる。
【００４５】
【発明の実施の形態】
以下に、本発明にかかる実施の形態について、図面を参照しつつ説明を行う。
【００４６】
（実施の形態１）
はじめに、本発明の実施の形態１における再入力要求手段の構成を示すブロック図である図１を参照しながら、本実施の形態における再入力要求手段の構成および動作について説明する。
【００４７】
ここでは、音声認識手段において認識結果をリジェクトする場合を例に説明する。
【００４８】
認識する前に、予め依存関係分析手段を用いて、形態素解析済みのコーパス（以降、タグ付きコーパスという）の各フレーズ毎の依存構造解析を行い、この結果を、各々のフレーズに含まれる内容語間の依存関係として、依存関係にある単語対を表に記述しておく。ここでの依存構造解析手段としては、たとえば、格文法規則を用いて文節間の構文解析を行うことで明らかにすることが可能である。
【００４９】
認識時には、まず入力音声を認識し、認識結果単語列を出力する。この際の認識手法は、たとえば、ｏｎｅ−ｐａｓｓのｎ−ｂｅｓｔ探索を用いた連続音声認識手法では、結果として単語列を認識候補として出力することが可能である。次に、出力された認識結果である単語列から特定の単語のみを抽出する。ここでは、文の意図を理解する上で必要な単語（重要語という）を特定単語とし、具体的には内容語を特定単語としてもよい。次に、特定された重要語間の関係を調べることで、誤認識単語を推定する。この手段は、たとえば、認識結果から抽出された重要語の中に、予め解析されている依存関係にある単語対が共に存在するかを調べ、他のどの重要語とも相当する単語対をなさない重要語を誤認識単語とみなす。この手段において、全ての単語が誤認識単語であるとみなされた際に、本認識結果の信頼性は著しく低いとみなして、リジェクトと決定し、発声者に再入力を促すメッセージ文を生成して画面に表示する。この場合に生成される文としては、「聞き取れませんでした。もう一度発声下さい。」などである。いくつかの単語が誤認識と推定されなかった場合には、誤認識ではない重要語を含むフレーズのみから構成される文を生成し画面に出力する。このリジェクト決定手段では、全ての単語が誤認識であった場合にリジェクトと決定したが、たとえば、認識結果から抽出された重要語の中の一定の割合以上の個数の単語が誤認識単語であるとみなされた場合にリジェクトすると決定し、一定割合以下の場合認識結果を出力てもよい。
【００５０】
本実施の形態では、予め単語間の依存関係を抽出しておき、この依存関係と認識結果に含まれる重要語を比較することで、認識結果に含まれる誤認識単語を推定し、認識結果の全てもしくは一定割合以上の重要語が誤認識単語であるとみなされた場合に認識結果をリジェクトし再入力の要求を発声者に促すことにより、話者や発声内容に変化しても、安定して誤った結果をリジェクトし、効果的に再入力を要求することができるものである。
【００５１】
よって、認識結果文に含まれる重要語間の依存関係または共起関係から誤認識単語を推定し、単語の多くが誤認識単語であると推定された場合にユーザに再入力を要求することにより、話者や発声内容に変化しても、安定して誤った結果をリジェクトし、効果的に再入力を要求することができる。
【００５２】
（実施の形態２）
はじめに、本発明の実施の形態２における再入力要求手段の構成を示すブロック図である図２を参照しながら、本実施の形態における再入力要求手段の構成および動作について説明する。
【００５３】
ここでも、音声認識手段において認識結果をリジェクトする場合を例に説明する。
【００５４】
認識する前に、予め依存関係分析手段を用いて、形態素解析済みのコーパス（以降、タグ付きコーパスという）の各フレーズ毎の依存構造解析を行い、この結果を、各々のフレーズに含まれる内容語間の依存関係として、依存関係にある単語対を表に記述しておく。方法は先の実施例と同様である。次にコーパスに存在しない単語が入力された場合に対応するために、重要語をクラス化する。一般に使用されているシソーラス辞書に従い、シソーラスにて同じカテゴリーに属する重要語を同じクラスとするクラス化手段でもよいが、入力されるドメインが限定できる場合には、以下の手段がより最適なクラス化を行うことば可能になると考えられる。まず、あらゆる重要語をシソーラスの意味コードに従ってクラス化し、これを初期クラスとする。先に解析された依存関係にある単語対から、同じクラスに属している全てのどの単語とも同じ単語に依存していない単語を単語クラスから外し、単語単独で１クラスとする。全ての単語対に対して、上記条件でクラスから外す単語を探索した結果を単語クラスと決定する。単語クラスが決定されると、先に抽出した依存関係にある単語対を単語クラス対として表現し、表に記載する。
【００５５】
認識時にも、先の実施例と同様に連続音声認識と重要語抽出を行い、予め解析された依存関係にある単語クラス対と比較することで誤認識単語を推定し、リジェクトと再入力要求の出力を決定する。
【００５６】
本実施の形態では、予め単語間の依存関係を抽出しておき、シソーラス辞書と先の依存関係を用いて単語クラス化を行い、先の依存関係を単語クラス間の依存関係として表に記載しておく。この単語クラス間の依存関係と認識結果に含まれる重要語を比較することで、認識結果に含まれる誤認識単語を推定し、認識結果の全てもしくは一定割合以上の重要語が誤認識単語であるとみなされた場合に認識結果をリジェクトし再入力の要求を発声者に促す。これにより、先の実施例同様の、話者や発声内容に変化しても、安定して誤った結果をリジェクトし、効果的に再入力を要求することができる効果に加えて、コーパスにない重要語が入力されても、誤認識推定やリジェクト決定などの上記処理を行うことが可能である効果がある。
【００５７】
よってシソーラス辞書とコーパスを用いて予め重要語をクラス化しておき、先重要語クラス間の依存関係を用いて、認識結果に含まれる誤認識単語を推定し、単語の多くが誤認識単語であると推定された場合にユーザに再入力を要求することにより、話者や発声内容に変化しても、安定して誤った結果をリジェクトし、効果的に再入力を要求することができ、さらに、コーパスに含まれない重要語や文表現が入力されても、誤認識推定やリジェクト決定などの上記処理を行うことが可能である。
【００５８】
上述した本実施の形態１〜２においては、認識スコアを指標にリジェクト閾値を設定するのではなく、認識結果文の文としての自然性を指標にし、認識結果に含まれる特定の単語間の依存関係または共起関係を調べ、全ての単語がお互いに関係が薄い場合にリジェクトすることにより、話者や発声内容に変化しても、安定して誤った結果をリジェクトし、効果的に再入力を要求することができる。
【００５９】
（実施の形態３）
はじめに、本発明の実施の形態３における音声認識装置の構成を示すブロック図である図３を参照しながら、本実施の形態における音声認識装置の構成について説明する。
【００６０】
本実施の形態における音声認識装置は、データベース１０１と、音声認識手段１０２と、内容語選択手段１０３と、判定手段１０４と、誤認識内容語決定手段１０５と、内容語再入力要求手段１０６とを備えている。
【００６１】
なお、データベース１０１は本発明のデータベースに対応し、音声認識手段１０２は本発明の文認識手段に対応し、内容語選択手段１０３は本発明の特定単語選択手段に対応し、判定手段１０４は本発明の判定手段に対応し、誤認識内容語決定手段１０５は本発明の誤認識特定単語決定手段に対応し、内容語再入力要求手段１０６は本発明の再入力要求手段に対応し、本実施の形態の音声認識装置は本発明の文認識装置に対応する。また、本実施の形態の内容語は、本発明の特定単語に対応する。
【００６２】
つぎに、本発明の実施の形態３におけるデータベース１０１に格納されているデータの説明図である図４を参照しながら、本実施の形態における音声認識装置の構成についてより詳しく説明する。
【００６３】
データベース１０１は、あらかじめ学習された内容語同士から構成される、あらかじめ定められたキーワード依存関係を有する標準内容語対として、「（熱い、コーヒー）」、「（コーヒー、飲む）」などを格納する手段である（図４参照）。
【００６４】
音声認識手段１０２は、単語から構成される音声入力された文を音声認識する手段である。
【００６５】
内容語選択手段１０３は、前述した学習済みの内容語の記載された内容語辞書（図示省略）を見て、音声認識された文を構成する単語の内から内容語辞書に記載されている内容語を選択する手段である。
【００６６】
判定手段１０４は、選択された内容語同士から構成される任意内容語対がデータベース１０１に格納されている標準内容語対であるか否かを判定する手段である。
【００６７】
誤認識内容語決定手段１０５は、データベース１０１に格納されている標準内容語対ではないと判定された任意内容語対の内の２個以上の任意内容語対に共通する内容語を誤認識内容語として決定する手段である。
【００６８】
内容語再入力要求手段１０６は、誤認識内容語があった場合には、その誤認識内容語に対応する内容語の再入力を要求する手段である。
【００６９】
つぎに、本発明の実施の形態３における音声認識装置の動作を説明するための説明図（その１）である図５（ａ）、および本発明の実施の形態３における音声認識装置の動作を説明するための説明図（その２）である図５（ｂ）を参照しながら、本実施の形態における音声認識装置の動作について説明する。なお、本実施の形態における音声認識装置の動作について説明しながら、本発明の文認識方法の一実施の形態についても説明する。
【００７０】
音声認識手段１０２は、音声入力された文「熱いコーヒーを飲みますか。」を認識文「青いコーヒーを飲みますか。」として（誤って）音声認識する。
【００７１】
内容語選択手段１０３は、認識文「青いコーヒーを飲みますか。」を構成する単語「青い」、「コーヒー」、「を」、「飲み」、「ます」、「か」の内から内容語「青い」、「コーヒー」、「飲む」を選択する（図５（ａ）参照）。なお、活用語の内容語は終止形（辞書見出し形）として選択されるため、「飲み（連用形）」は「飲む（終止形）」として選択された。
【００７２】
判定手段１０４は、選択された内容語同士から構成される合計３個の任意内容語対「（青い、コーヒー）」、「（青い、飲む）」、「（コーヒー、飲む）」の内、「（コーヒー、飲む）」はデータベース１０１に格納されている標準内容語対であり、「（青い、コーヒー）」、「（青い、飲む）」はデータベース１０１に格納されている標準内容語対ではないと判定する（図５（ｂ）参照）。
【００７３】
誤認識内容語決定手段１０５は、データベース１０１に格納されている標準内容語対ではないと判定された任意内容語対「（青い、コーヒー）」、「（青い、飲む）」の内の２個以上の任意内容語対に共通する内容語「青い」は誤認識内容語であると決定する。
【００７４】
内容語再入力要求手段１０６は、誤認識内容語「青い」に対応する内容語の再入力を要求する。
【００７５】
（実施の形態４）
はじめに、本発明の実施の形態４における音声認識装置の構成を示すブロック図である図６を参照しながら、本実施の形態における音声認識装置の構成について説明する。
【００７６】
本実施の形態における音声認識装置は、データベース１０１と、音声認識手段１０２と、内容語選択手段１０３と、判定手段１０４と、文誤認識決定手段１０５′と、文再入力要求手段１０６′とを備えている。
【００７７】
なお、データベース１０１は本発明のデータベースに対応し、音声認識手段１０２は本発明の文認識手段に対応し、内容語選択手段１０３は本発明の特定単語選択手段に対応し、判定手段１０４は本発明の判定手段に対応し、文誤認識決定手段１０５′は本発明の文誤認識決定手段に対応し、文再入力要求手段１０６′は本発明の文再入力要求手段に対応し、本実施の形態の音声認識装置は本発明の文認識装置に対応する。また、本実施の形態の内容語は、本発明の特定単語に対応する。
【００７８】
本実施の形態における音声認識装置は、上述した実施の形態３における音声認識装置の構成と類似した構成を有しているが、文誤認識決定手段１０５′と、文再入力要求手段１０６′とを備えている点を特徴としている。
【００７９】
そこで、文誤認識決定手段１０５′と文再入力要求手段１０６′とについてより詳しく説明する。
【００８０】
文誤認識決定手段１０５′は、データベース１０１に格納されている標準内容語対であると判定された任意内容語対に全く含まれない内容語を誤認識内容語として決定し、選択された内容語の個数Ｘと誤認識内容語の個数Ｙとの間に
【００８１】
【数１】
Ｙ＞０．４×Ｘ
なる関係が成立する場合に入力された文は誤認識されたと決定する手段である。
【００８２】
文再入力要求手段１０６′は、誤認識があった場合には、入力された文の再入力を要求する手段である。
【００８３】
つぎに、本実施の形態における音声認識装置の動作について説明する。なお、本実施の形態における音声認識装置の動作について説明しながら、本発明の文認識方法の一実施の形態についても説明する。
【００８４】
音声認識手段１０２は、音声入力された文「地元のビールを飲んではいけませんか。」を認識文「地元のビールを呼んで池千か。」として（誤って）音声認識する。
【００８５】
内容語選択手段１０３は、認識文「地元のビールを呼んで池千か。」を構成する単語「地元」、「の」、「ビール」、「を」、「呼ん」、「で」、「池」、「千」、「か」の内から内容語「地元」、「ビール」、「呼ぶ」、「池」、「千」を選択する。なお、前述した実施の形態３の場合と同様、活用語の内容語は終止形（辞書見出し形）として選択されるため、「呼ん（連用形）」は「呼ぶ（終止形）」として選択された。
【００８６】
判定手段１０４は、選択された内容語同士から構成される合計６０個の任意内容語対「（地元、ビール）」、「（地元、呼ぶ）」、「（地元、池）」、「（地元、千）」、…の内、「（地元、ビール）」はデータベース１０１に格納されている標準内容語対であり、その他の「（地元、呼ぶ）」、「（地元、池）」、「（地元、千）」、…はデータベース１０１に格納されている標準内容語対ではないと判定する。
【００８７】
文誤認識決定手段１０５′は、データベース１０１に格納されている標準内容語対であると判定された任意内容語対「（地元、ビール）」に全く含まれない内容語「呼ぶ」、「池」、「千」は誤認識内容語であると決定する。また、文誤認識決定手段１０５′は、選択された内容語「地元」、「ビール」、「呼ぶ」、「池」、「千」の個数Ｘ＝５と誤認識内容語「呼ぶ」、「池」、「千」の個数Ｙ＝３との間に（数１）の関係が成立するゆえ、入力された文「地元のビールを飲んではいけませんか。」は誤認識されたと決定する。
【００８８】
そして、文再入力要求手段１０６′は、入力された文「地元のビールを飲んではいけませんか。」の再入力を要求する。
【００８９】
（実施の形態５）
はじめに、本発明の実施の形態５における文字認識装置の構成を示すブロック図である図７を参照しながら、本実施の形態における文字認識装置の構成について説明する。
【００９０】
本実施の形態における文字認識装置は、データベース２０１〜２０２と、文字認識手段２０３と、内容語選択手段２０４と、内容語クラス決定手段２０５と、判定手段２０６と、誤認識内容語決定手段２０７と、内容語再入力要求手段２０８とを備えている。
【００９１】
なお、データベース２０１は本発明の第一のデータベースに対応し、データベース２０２は本発明の第二のデータベースに対応し、文字認識手段２０３は本発明の文認識手段に対応し、内容語選択手段２０４は本発明の特定単語選択手段に対応し、内容語クラス決定手段２０５は本発明の特定単語クラス決定手段に対応し、判定手段２０６は本発明の判定手段に対応し、誤認識内容語決定手段２０７は本発明の誤認識特定単語決定手段に対応し、内容語再入力要求手段２０８は本発明の再入力要求手段に対応し、本実施の形態の文字認識装置は本発明の文認識装置に対応する。また、本実施の形態の内容語は本発明の特定単語に対応し、本実施の形態の内容語クラスは本発明の特定単語クラスに対応する。
【００９２】
つぎに、本発明の実施の形態５におけるデータベース２０１に格納されているデータの説明図である図８（ａ）、および本発明の実施の形態５におけるデータベース２０２に格納されているデータの説明図である図８（ｂ）を参照しながら、本実施の形態における文字認識装置の構成についてより詳しく説明する。
【００９３】
データベース２０１は、あらかじめ学習された内容語と内容語の属するあらかじめ定められた内容語クラスとの対応関係として、「ビール−１００」、「コーヒー−１００」、「地元−２００」、「熱い−２００」、「飲む−３００」、「呼ぶ−４００」などを格納する手段である。ここに、「９０」はカテゴリ「建築物」に対する内容語クラスの意味コードであり、「１００」はカテゴリ「飲料」に対する内容語クラスの意味コードであり、「２００」はカテゴリ「飲料の性質」に対する内容語クラスの意味コードであり、「３００」はカテゴリ「飲料に関わる動作」に対する内容語クラスの意味コードであり、「４００」はカテゴリ「音声に関わる動作」に対する内容語クラスの意味コードである。
【００９４】
データベース２０２は、内容語クラス同士から構成されるあらかじめ定められた共起関係を有する標準内容語クラス対として、「（１００、２００）」、「（１００、３００）」などを格納する手段である。
【００９５】
文字認識手段２０３は、単語から構成されるＯＣＲ（ｏｐｔｉｃａｌｃｈａｒａｃｔｅｒｒｅａｄｅｒ）入力された文を文字認識する手段である。
【００９６】
内容語選択手段２０４は、前述した学習済みの内容語の記載された内容語辞書（図示省略）を見て、文字認識された文を構成する単語の内から内容語辞書に記載されている内容語を選択する手段である。
【００９７】
内容語クラス決定手段２０５は、データベース２０１に格納されている内容語と内容語クラスとの対応関係を利用して、選択された内容語の属する内容語クラスを決定する手段である。
【００９８】
判定手段２０６は、決定された内容語クラス同士から構成される任意内容語クラス対がデータベース２０２に格納されている標準内容語クラス対であるか否かを判定する手段である。
【００９９】
誤認識内容語決定手段２０７は、データベース２０２に格納されている標準内容語クラス対ではないと判定された任意内容語クラス対の内の２個以上の任意内容語クラス対に共通する内容語クラスに属する内容語を誤認識内容語として決定する手段である。
【０１００】
内容語再入力要求手段２０８は、誤認識内容語があった場合には、その誤認識内容語に対応する内容語の再入力を要求する手段である。
【０１０１】
つぎに、本発明の実施の形態５における音声認識装置の動作を説明するための説明図（その１）である図９（ａ）、および本発明の実施の形態５における音声認識装置の動作を説明するための説明図（その２）である図９（ｂ）を参照しながら、本実施の形態における文字認識装置の動作について説明する。なお、本実施の形態における文字認識装置の動作について説明しながら、本発明の文認識方法の一実施の形態についても説明する。
【０１０２】
文字認識手段２０３は、ＯＣＲ入力された文「地元のビールを飲みますか。」を認識文「地元のビールを呼びますか。」として（誤って）文字認識する。
【０１０３】
内容語選択手段２０４は、認識文「地元のビールを呼びますか。」を構成する単語「地元」、「の」、「ビール」、「を」、「呼び」、「ます」、「か」の内から内容語「地元」、「ビール」、「呼ぶ」を選択する。なお、前述した実施の形態３の場合と同様、活用語の内容語は終止形（辞書見出し形）として選択されるため、「呼び（連用形）」は「呼ぶ（終止形）」として選択された。
【０１０４】
内容語クラス決定手段２０５は、データベース２０１に格納されている内容語と内容語クラスとの対応関係を利用して、選択された内容語「地元」、「ビール」、「呼ぶ」の属する内容語クラスがそれぞれ「２００」、「１００」、「４００」であると決定する。
【０１０５】
判定手段２０６は、決定された内容語クラス同士から構成される合計３個の任意内容語クラス対「（１００、２００）」、「（１００、４００）」、「（２００、４００）」の内、「（１００、２００）」はデータベース２０２に格納されている標準内容語クラス対であり、「（１００、４００）」、「（２００、４００）」はデータベース２０２に格納されている標準内容語クラス対ではないと判定する。
【０１０６】
誤認識内容語決定手段２０７は、データベース２０２に格納されている標準内容語クラス対ではないと判定された任意内容語クラス対「（１００、４００）」、「（２００、４００）」の内の２個以上の任意内容語クラス対に共通する内容語クラス「４００」に属する内容語「呼ぶ」は誤認識内容語であると決定する。
【０１０７】
内容語再入力要求手段２０８は、誤認識内容語「呼ぶ」に対応する内容語の再入力を要求する。
【０１０８】
（実施の形態６）
はじめに、本発明の実施の形態６における文字認識装置の構成を示すブロック図である図１０を参照しながら、本実施の形態における文字認識装置の構成について説明する。
【０１０９】
本実施の形態における文字認識装置は、データベース２０１〜２０２と、文字認識手段２０３と、内容語選択手段２０４と、内容語クラス決定手段２０５と、判定手段２０６と、文誤認識決定手段２０７′と、文再入力要求手段２０８′とを備えている。
【０１１０】
なお、データベース２０１は本発明の第一のデータベースに対応し、データベース２０２は本発明の第二のデータベースに対応し、文字認識手段２０３は本発明の文認識手段に対応し、内容語選択手段２０４は本発明の特定単語選択手段に対応し、内容語クラス決定手段２０５は本発明の特定単語クラス決定手段に対応し、判定手段２０６は本発明の判定手段に対応し、文誤認識決定手段２０７′は本発明の文誤認識決定手段に対応し、文再入力要求手段２０８′は本発明の文再入力要求手段に対応し、本実施の形態の文字認識装置は本発明の文認識装置に対応する。また、本実施の形態の内容語は本発明の特定単語に対応し、本実施の形態の内容語クラスは本発明の特定単語クラスに対応する。
【０１１１】
本実施の形態における音声認識装置は、上述した実施の形態３における音声認識装置の構成と類似した構成を有しているが、文誤認識決定手段２０７′と文再入力要求手段２０８′とを備えている点を特徴としている。
【０１１２】
そこで、文誤認識決定手段２０７′と文再入力要求手段２０８′とについてより詳しく説明する。
【０１１３】
文誤認識決定手段２０７′は、データベース２０２に格納されている標準内容語クラス対であると判定された任意内容語クラス対に全く含まれない内容語を誤認識内容語として決定し、選択された内容語の個数Ｘと誤認識内容語の個数Ｙとの間に
【０１１４】
【数２】
Ｙ＞０．５×Ｘ
なる関係が成立する場合に入力された文は誤認識されたと決定する手段である。
【０１１５】
文再入力要求手段２０８′は、誤認識があった場合には、入力された文の再入力を要求する手段である。
【０１１６】
つぎに、本発明の実施の形態６における音声認識装置の構成を示すブロック図である図１０を参照しながら、本実施の形態における文字認識装置の動作について説明する。なお、本実施の形態における文字認識装置の動作について説明しながら、本発明の文認識方法の一実施の形態についても説明する。
【０１１７】
文字認識手段２０３は、ＯＣＲ入力された文「地元のビールを飲みませんか。」を認識文「地元のビルを飲みませんか。」として（誤って）文字認識する。
【０１１８】
内容語選択手段２０４は、認識文「地元のビルを呼びませんか。」を構成する単語「地元」、「の」、「ビル」、「を」、「呼び」、「ませ」、「ん」、「か」の内から内容語「地元」、「ビル」、「呼ぶ」を選択する。なお、前述した実施の形態３の場合と同様、活用語の内容語は終止形（辞書見出し形）として選択されるため、「呼び（連用形）」は「呼ぶ（終止形）」として選択された。
【０１１９】
内容語クラス決定手段２０５は、データベース２０１に格納されている内容語と内容語クラスとの対応関係を利用して、選択された内容語「地元」、「ビル」、「呼ぶ」の属する内容語クラスがそれぞれ「２００」、「９０」、「４００」であると決定する。
【０１２０】
判定手段２０６は、決定された内容語クラス同士から構成される合計３個の任意内容語クラス対「（９０、２００）」、「（９０、４００）」、「（２００、４００）」の内、データベース２０２に格納されている標準内容語クラス対は全くないと判定する。
【０１２１】
文誤認識決定手段２０７′は、選択された内容語「地元」、「ビル」、「呼ぶ」は全て誤認識内容語であると決定する。また、文誤認識決定手段２０７′は、選択された内容語「地元」、「ビル」、「呼ぶ」の個数Ｘ＝３と誤認識内容語「地元」、「ビル」、「呼ぶ」の個数Ｙ＝３との間に（数２）の関係が成立するゆえ、入力された文「地元のビールを飲んではいけませんか。」は誤認識されたと決定する。
【０１２２】
そして、文再入力要求手段２０８′は、入力された文「地元のビールを飲みませんか。」の再入力を要求する。
【０１２３】
以上においては、本実施の形態１〜６について詳細に説明した。
【０１２４】
なお、本発明の再入力要求手段は、上述した本実施の形態３、５においては、誤認識特定単語があった場合にはその誤認識特定単語に対応する特定単語の再入力を要求したが、これに限らず、たとえば、誤認識特定単語があった場合には入力された文の再入力を要求してもよい。
【０１２５】
もちろん、誤認識特定単語があった場合（誤認識があった場合）にはその旨をユーザに通知する通知手段が備えられていてもよい。たとえば、音声やテキストを利用して「名前の部分が（一部）聞き取れませんでした」のようなメッセージをユーザに通知することによっても、上述の再入力の要求と類似した効果を奏するものである。
【０１２６】
なお、発明には、上述した本発明の文認識装置の全部または一部の手段（または、装置、素子、回路、部など）の機能をコンピュータにより実行させるためのプログラムであって、コンピュータと協働して動作するプログラムが含まれる。もちろん、コンピュータは、ＣＰＵなどの純然たるハードウェアに限らず、ファームウェアやＯＳ、さらに周辺機器を含むものであっても良い。
【０１２７】
また、本発明には、上述した本発明の文認識方法の全部または一部のステップ（または、工程、動作、作用など）の動作をコンピュータにより実行させるためのプログラムであって、コンピュータと協働して動作するプログラムが含まれる。
【０１２８】
なお、本発明の一部の手段（または、装置、素子、回路、部など）、本発明の一部のステップ（または、工程、動作、作用など）は、それらの複数の手段またはステップの内の幾つかの手段またはステップを意味する、あるいは一つの手段またはステップの内の一部の機能または一部の動作を意味するものである。
【０１２９】
また、本発明の一部の装置（または、素子、回路、部など）は、それら複数の装置の内の幾つかの装置を意味する、あるいは一つの装置の内の一部の手段（または、素子、回路、部など）を意味する、あるいは一つの手段の内の一部の機能を意味するものである。
【０１３０】
また、本発明のプログラムを記録した、コンピュータに読みとり可能な記録媒体も本発明に含まれる。また、本発明のプログラムの一利用形態は、コンピュータにより読み取り可能な記録媒体に記録され、コンピュータと協働して動作する態様であっても良い。また、本発明のプログラムの一利用形態は、伝送媒体中を伝送し、コンピュータにより読みとられ、コンピュータと協働して動作する態様であっても良い。また、記録媒体としては、ＲＯＭ等が含まれ、伝送媒体としては、インターネット等の伝送媒体、光・電波・音波等が含まれる。
【０１３１】
なお、本発明の構成は、ソフトウェア的に実現しても良いし、ハードウェア的に実現しても良い。
【０１３２】
また、発明には、上述した本発明の文認識装置の全部または一部の手段の全部または一部の機能をコンピュータにより実行させるためのプログラムを担持した媒体であり、コンピュータにより読み取り可能かつ読み取られた前記プログラムが前記コンピュータと協動して前記機能を実行する媒体が含まれる。
【０１３３】
また、本発明には、上述した本発明の文認識方法の全部または一部のステップの全部または一部の動作をコンピュータにより実行させるためのプログラムを担持した媒体であり、コンピュータにより読み取り可能かつ読み取られた前記プログラムが前記コンピュータと協動して前記動作を実行する媒体が含まれる。
【０１３４】
なお、上述の文献の全ての開示は、そっくりそのままここに引用（参照）することにより、一体化される。
【０１３５】
【発明の効果】
以上述べたところから明らかなように、本発明は、音声認識やテキスト文認識を利用して適切な文認識を行うことができるという長所を有する。
【図面の簡単な説明】
【図１】本発明の実施の形態１における再入力要求手段の構成を示すブロック図である。
【図２】本発明の実施の形態２における再入力要求手段の構成を示すブロック図である。
【図３】本発明の実施の形態３における音声認識装置の構成を示すブロック図である。
【図４】本発明の実施の形態３におけるデータベース１０１に格納されているデータの説明図である。
【図５】（ａ）本発明の実施の形態３における音声認識装置の動作を説明するための説明図（その１）である。（ｂ）本発明の実施の形態３における音声認識装置の動作を説明するための説明図（その２）である。
【図６】本発明の実施の形態４における音声認識装置の構成を示すブロック図である。
【図７】本発明の実施の形態５における音声認識装置の構成を示すブロック図である。
【図８】（ａ）本発明の実施の形態５におけるデータベース２０１に格納されているデータの説明図である。
（ｂ）本発明の実施の形態５におけるデータベース２０２に格納されているデータの説明図である。
【図９】（ａ）本発明の実施の形態５における音声認識装置の動作を説明するための説明図（その１）である。
（ｂ）本発明の実施の形態５における音声認識装置の動作を説明するための説明図（その２）である。
【図１０】本発明の実施の形態６における音声認識装置の構成を示すブロック図である。
【符号の説明】
１タグ付きコーパス
２依存関係分析
３重要語依存関係表
４重要語辞書
５音声認識
６重要語抽出
７誤認識単語推定
８リジェクト決定
９結果文生成
１０単語クラス決定
１１重要語クラス依存関係表
１２シソーラス辞書

Claims

あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対を格納するデータベースと、
複数の単語から構成される入力された文を認識する文認識手段と、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択手段と、
前記選択された複数の特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定手段と、
前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識手段により誤って認識された誤認識特定単語を決定する誤認識特定単語決定手段とを備えた文認識装置。
前記誤認識特定単語決定手段は、前記データベースに格納されている標準特定単語対ではないと判定された任意特定単語対の内の所定個以上の任意特定単語対に共通する特定単語を前記誤認識特定単語として決定する請求項１記載の文認識装置。
前記誤認識特定単語があった場合には、（１）その誤認識特定単語に対応する特定単語の再入力、または（２）前記入力された文の再入力を要求する再入力要求手段を備えた請求項１または２記載の文認識装置。
前記誤認識特定単語があった場合には、その旨をユーザに通知する通知手段を備えた請求項１または２記載の文認識装置。
あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対を格納するデータベースと、
複数の単語から構成される入力された文を認識する文認識手段と、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択手段と、
前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定手段と、
前記判定の結果に基づいて、前記入力された文が前記文認識手段により誤認識されたか否かを決定する文誤認識決定手段とを備えた文認識装置。
前記誤認識があった場合には、前記入力された文の再入力を要求する文再入力要求手段を備えた請求項５記載の文認識装置。
前記誤認識があった場合には、その旨をユーザに通知する通知手段を備えた請求項５記載の文認識装置。
あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を格納する第一のデータベースと、
複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を格納する第二のデータベースと、
複数の単語から構成される入力された文を認識する文認識手段と、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択手段と、
前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定手段と、
前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定手段と、
前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識手段により誤って認識された誤認識特定単語を決定する誤認識特定単語決定手段とを備えた文認識装置。
前記誤認識特定単語決定手段は、前記第二のデータベースに格納されている標準特定単語クラス対ではないと判定された任意特定単語クラス対の内の所定個以上の任意特定単語クラス対に共通する特定単語クラスに属する特定単語を前記誤認識特定単語として決定する請求項８記載の文認識装置。
前記誤認識特定単語があった場合には、（１）その誤認識特定単語に対応する特定単語の再入力、または（２）前記入力された文の再入力を要求する再入力要求手段を備えた請求項８または９記載の文認識装置。
前記誤認識特定単語があった場合には、その旨をユーザに通知する通知手段を備えた請求項８または９記載の文認識装置。
あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を格納する第一のデータベースと、
複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を格納する第二のデータベースと、
複数の単語から構成される入力された文を認識する文認識手段と、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択手段と、
前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定手段と、
前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定手段と、
前記判定の結果に基づいて、前記入力された文が前記文認識手段により誤認識されたか否かを決定する文誤認識決定手段とを備えた文認識装置。
前記誤認識があった場合には、前記入力された文の再入力を要求する文再入力要求手段を備えた請求項１２記載の文認識装置。
前記誤認識があった場合には、その旨をユーザに通知する通知手段を備えた請求項１２記載の文認識装置。
あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対を格納するデータベースを用いた文認識方法であって、
複数の単語から構成される入力された文を認識する文認識ステップと、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、
前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定ステップと、
前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識ステップにより誤って認識された誤認識特定単語を決定する誤認識特定単語決定ステップとを備えた文認識方法。
あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対を格納するデータベースを用いた文認識方法であって、
複数の単語から構成される入力された文を認識する文認識ステップと、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、
前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定ステップと、
前記判定の結果に基づいて、前記入力された文が前記文認識ステップにより誤認識されたか否かを決定する文誤認識決定ステップとを備えた文認識方法。
あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を格納する第一のデータベースと、
複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を格納する第二のデータベースとを用いた文認識方法であって、
複数の単語から構成される入力された文を認識する文認識ステップと、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、
前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定ステップと、
前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定ステップと、
前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識ステップにより誤って認識された誤認識特定単語を決定する誤認識特定単語決定ステップとを備えた文認識方法。
あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を格納する第一のデータベースと、
複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を格納する第二のデータベースとを用いた文認識方法であって、
複数の単語から構成される入力された文を認識する文認識ステップと、
前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、
前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定ステップと、
前記決定された特定単語クラス同士から構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定ステップと、
前記判定の結果に基づいて、前記入力された文が前記文認識ステップにより誤認識されたか否かを決定する文誤認識決定ステップとを備えた文認識方法。
あらかじめ定められた複数の特定単語同士から構成される、あらかじめ定められた複数の標準特定単語対をデータベースに格納する格納ステップと、複数の単語から構成される入力された文を認識する文認識ステップと、前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定ステップと、前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識ステップにより誤って認識された誤認識特定単語を決定する誤認識特定単語決定ステップとの全部または一部をコンピュータに実行させるためのプログラム。
あらかじめ定められた複数の特定単語から構成される、あらかじめ定められた複数の標準特定単語対をデータベースに格納する格納ステップと、複数の単語から構成される入力された文を認識する文認識ステップと、前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、前記選択された特定単語から構成される任意特定単語対が前記データベースに格納されている標準特定単語対であるか否かを判定する判定ステップと、前記判定の結果に基づいて、前記入力された文が前記文認識ステップにより誤認識されたか否かを決定する文誤認識決定ステップとの全部または一部をコンピュータに実行させるためのプログラム。
あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を第一のデータベースに格納する第一の格納ステップと、複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を第二のデータベースに格納する第二の格納ステップと、複数の単語から構成される入力された文を認識する文認識ステップと、前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定ステップと、前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定ステップと、前記判定の結果に基づいて、前記選択された特定単語の内から前記文認識ステップにより誤って認識された誤認識特定単語を決定する誤認識特定単語決定ステップとの全部または一部をコンピュータに実行させるためのプログラム。
あらかじめ定められた複数の特定単語と、前記特定単語の属する、あらかじめ定められた複数の特定単語クラスとの対応関係を第一のデータベースに格納する第一の格納ステップと、複数の前記特定単語クラスから構成される、あらかじめ定められた複数の標準特定単語クラス対を第二のデータベースに格納する第二の格納ステップと、複数の単語から構成される入力された文を認識する文認識ステップと、前記認識された文を構成する複数の単語の内から前記特定単語を複数選択する特定単語選択ステップと、前記第一のデータベースに格納されている対応関係を利用して、前記選択された特定単語各々の属する前記特定単語クラスを複数決定する特定単語クラス決定ステップと、前記決定された特定単語クラスから構成される任意特定単語クラス対が前記第二のデータベースに格納されている標準特定単語クラス対であるか否かを判定する判定ステップと、前記判定の結果に基づいて、前記入力された文が前記文認識ステップにより誤認識されたか否かを決定する文誤認識決定ステップとの全部または一部をコンピュータに実行させるためのプログラム。
請求項１９記載のプログラムを担持した媒体であって、コンピュータにより処理可能な媒体。
請求項２０記載のプログラムを担持した媒体であって、コンピュータにより処理可能な媒体。
請求項２１記載のプログラムを担持した媒体であって、コンピュータにより処理可能な媒体。
請求項２２記載のプログラムを担持した媒体であって、コンピュータにより処理可能な媒体。