JP2008515078A

JP2008515078A - 自動テキスト訂正

Info

Publication number: JP2008515078A
Application number: JP2007534155A
Authority: JP
Inventors: ペーテルス，ヨハン; マトゥソフ，イフゲニー
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2004-09-30
Filing date: 2005-09-28
Publication date: 2008-05-08
Also published as: CN101031913A; EP1797506A1; WO2006035402A1; US20070299664A1

Abstract

本発明は、音声テキスト変換システムに対するテキスト変換ルールを生成する方法を提供する。テキスト変換ルールは、音声テキスト変換システムにより生成される誤りテキストと正しい参照テキストとを比較することにより生成される。誤りテキストと参照テキストとの比較は、トレーニングテキストへの厳密な適用と参照テキストとのさらなる比較によって評価されるテキスト変換ルールセットを求めることを可能にする。テキスト変換ルールの評価は、自動生成されたテキスト変換ルールの何れが誤りテキストの向上又は劣化を提供するか決定するのに十分なアプローチを提供する。このように、誤りテキストの向上を保証するテキスト変換ルールセットの当該テキスト変換ルールのみが、選択される。このように、自動音声認識又は自然言語処理システムのシステマティックエラーが、効果的に補償可能である。

Description

本発明は、対応する正しい参照テキストとの比較を利用することによって、誤っているテキストの自動訂正の分野に関する。

音声からテキストへの変換処理により生成されるテキスト文書は、典型的には、各種特徴により誤りのないものではない。最新の自動音声認識（ＡＳＲ）及び自然言語処理（ＮＬＰ）システムはすでに、音声テキスト変換、自動非発話句読点挿入、自動テキストセグメント化、見出し挿入、自動日付フォーマットか、ユニット、省略などに関するかなりのパフォーマンスを提供しているが、結果として得られるテキストには依然として、システムティックな誤りが生じている。例えば、自動音声認識システムは、特定のワードを類似した音声ワードとして誤って解釈するかもしれない。また、自動音声認識システムによって使用される用語集又は辞書のエントリは、誤りの影響を受けるかもしれない。このため、自動音声認識又は音声変換システムは、当該特定の辞書エントリが与えられた音声において認識されると、スペルミスしたワードをシステマティックに生成するかもしれない。

一般に、すべてのＡＳＲ及びＮＬＰシステムは誤りの傾向がある。特に、高度な音声テキスト変換装置はしばしば、ＡＳＲシステムの認識エラーのマイナスとなる多数のフォーマット化処理が実行される必要があるときなど、複雑なタスクに対して高いエラーレートを示す。これらの事実は周知であるが、ＡＳＲ及びＮＬＰシステムのシステマティックな誤りを検出及び解消する一般的なアプローチはまだ存在しない。

文献ＵＳ２００２／０１６５７１６は、音声認識中にコンセンサス復号化（ｃｏｎｓｅｎｓｕｓｄｅｃｏｄｉｎｇ）が使用されるとき、誤り数を減少する技術を開示している。一般に、いくつかの訂正ルールが、リアルタイムの音声認識中に抽出されるコンフュージョンセット（ｃｏｎｆｕｓｉｏｎｓｅｔ）に適用される。訂正ルールは、多数のトレーニングコンフュージョンセットの使用を伴う音声認識システムのトレーニング中に決定される。トレーニングコンフュージョンセットに適用可能なテンプレートルールと呼ばれるいくつかの可能なルールを生成する学習プロセスが、利用される。学習プロセスはまた、テンプレートルールから訂正ルールを決定する。訂正ルールは、仮説ワードが必ずしも最も高いスコアを有するワードであるとは限らないコンフュージョンセットから仮説ワードを選択するため、リアルタイムにコンフュージョンセットに対して機能する。

ＵＳ２００２／０１６５７１６の開示では、訂正ルールは、コンセンサス復号化によりワードラティス（ｗｏｒｄｌａｔｔｉｃｅ）から変換される多数のトレーニングコンフュージョンセットを利用することによって決定される。ワードラティスは、認識装置の用語集のエントリをデコーダが利用することによって生成される。このように、訂正ルールの決定及び導出は、音声認識システムの用語集に基づく。このように、認識装置の用語集の外部のワードは実現可能でなく、このため、訂正ルールを決定するプロセス全体は、音声認識システムにすでに知られているワードに基づくものとなる。さらに、各コンフュージョンセットは、認識されたワードと、当該認識されたワードを置換できる代替ワードセットとから構成される。すなわち、当該セットは、削除に対応する「エンプティワード」を潜在的に含む他の単一ワードにより単一ワードを置換する可能性を提供する。

従って、本発明は、ＡＳＲ又はＮＬＰに固有のトレーニングデータ、用語集又は他の所定のテキストデータベースに関係なく、ＡＳＲ又はＮＬＰシステムにより生成される任意のタイプの所与のテキストのシステマティックエラーを検出及び解消する一般的アプローチを提供することを目的とする。

本発明は、少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを利用することによって、自動テキスト訂正のためのテキスト変換ルールを生成する方法を提供する。本発明の方法は、少なくとも１つの誤りトレーニングテキストと正しい参照テキストとを比較し、トレーニングテキストと参照テキストとの間の乖離を利用することによってテキスト変換ルールセットを求めることを利用する。これらの乖離は、誤りトレーニングテキストと正しい参照テキストとの間の比較により検出される。テキスト変換ルールセットを求めた後、テキスト変換ルールセットは、各変換ルールをトレーニングテキストに適用することによって評価される。このテキスト変換ルールの評価に応じて、評価されたテキスト変換ルールセットの少なくとも１つが、自動テキスト訂正のため選択される。

誤りトレーニングテキストは、自動音声認識システム又は他の何れかのタイプの音声テキスト変換システムによって提供されてもよい。参照テキストは、トレーニングテキストに対応し、誤りのないものであるべきである。この正しい参照テキストは、ＡＳＲ及び／又はＮＬＰシステムの認識されたテキストの校正者によって手動により生成されてもよい。あるいは、典型的には電子形式による任意の参照テキストが、本発明のテキスト訂正システム、すなわち、本発明の方法を実行するのに適用可能なシステムに提供され、誤りトレーニングテキストが、参照テキストを音声としてＡＳＲ及び／又はＮＬＰシステムに入力し、変換されたテキストをＡＳＲ及び／又はＮＬＰシステムによって生成される誤りトレーニングテキストとして受け付けることによって生成されるかもしれない。

テキスト変換ルールを生成する方法はさらに、参照テキストと誤りトレーニングテキストとの間の乖離を検出することを利用する。乖離の検出は、ワード単位の比較に限定されず、各フレーズがテキストのワードセットを有するフレーズ単位の比較を含むものであってもよい。さらに、トレーニングテキストと参照テキストとの間の乖離は、音声テキスト変換システムが生成可能な任意のタイプの考えられる誤りを表すかもしれない。このように、誤りトレーニングテキストの任意のタイプの誤りが、検出及び分類される。

検出された誤りの分類は、典型的には、テキストの置換、挿入又は削除を表す。例えば、トレーニングテキストの各ワードが、参照テキストの対応するワードに割り当てられ、これら２つのワードが正確に一致するとき、正しいとマーク付けされるかもしれない。あるワードがＡＳＲやＮＬＰシステムにより解釈ミスされる場合、例えば、システムが“ｈｏｍｅ”の代わりに“ｂｏｎｅ”に変換すると、ワード“ｈｏｍｅ”はワード“ｂｏｎｅ”と置換されるとマーク付けされるかもしれない。多数のワードが１つのワードに、又は端は異に１つのワードが多数のワードに変換される他のシナリオでは、検出された乖離は、典型的には置換と共に削除又は挿入によりマーク付けされるかもしれない。これは、例えば、“ａｓｅｖｅｒｅ”が“ｗｅｉｒｄ”としてミス解釈されたとなどに適用されるかもしれない。

検出された各乖離は、典型的には、正しい参照テキストの対応するワードに割り当てられる。トレーニングテキストのテキスト部分の対応する訂正されたテキスト部分へのアライメント（ａｌｉｇｎｍｅｎｔ）は、最小編集距離又はＬｅｖｅｎｓｈｔｅｉｎアライメントなどのいくつかの標準的な技術を利用することによって実行することが可能である。誤りテキスト部分と対応する正しいテキスト部分との間のアライメントと適切な分類とに基づき、テキスト変換ルールが生成可能である。“ａｓｅｖｅｒｅ”が“ｗｅｉｒｄ”と解釈ミスされた上記与えられた例について、テキスト変換ルールは、一般にワード“ｗｅｉｒｄ”が“ａｓｅｖｅｒｅ”に置換される必要があることを規定するかもしれない。しかしながら、このテキスト変換ルールは、ＡＳＲ又はＮＬＰシステムのシステマティックエラーに対応するものでないかもしれず、テキストに一貫して適用されると、ワード“ｗｅｉｒｄ”の各出現は、他の出現についてワード“ｗｅｉｒｄ”が正しく変換されたか否かに関係なく、“ａｓｅｖｅｒｅ”に置換されるかもしれない。

テキスト変換ルールの生成は、文法又は意味内容の情報をワードストリームに割り当てるタグ付けプロセスを訂正する変換ルールを求めるフレームワークにおいて知られている変換ベース学習（ＴＢＬ）と同様に実行することができる。本発明によって、変換ベース学習は、参照テキストを誤りテキスト部分に割り当てるため、変更及び調整される。

切り替えされるシステマティックエラーと偶発的な再生不可能な誤りを区別するため、自動生成されたテキスト変換ルールが評価される必要がある。このため、生成されたテキスト変換ルールの何れが音声テキスト変換手続のシステマティックエラーに対応するか決定される必要がある。この評価は、典型的には、生成されたテキスト変換ルールのそれぞれをトレーニングテキストに適用し、テキスト変換ルールが誤りの解消を提供するか、又はその結果として適用がトレーニングテキストにより多くの誤りを導入するか決定するため、参照テキストとの以降の比較を実行することによって行われる。生成されたテキスト変換ルールが特定の１つの誤りを解消したとしても、それはまた、トレーニングテキストの正しいテキスト部分にさらなる多数の誤りを導入するかもしれない。

テキスト変換ルールセットの評価は、トレーニングテキストに適用されると、トレーニングテキストの向上をもたらすテキスト変換ルールのみを直感的に選択するため、テキスト変換ルールのランク付けを実行することを可能にする。このため、自動生成されたテキスト変換ルールセットのこれらのテキスト変換ルールのみが選択され、ＡＳＲ及び／又はＮＬＰシステムのシステマティックエラーを検出及び解消するため、自動テキスト訂正に提供される。

本発明の好適な実施例によると、テキスト変換ルールを求めるステップは、トレーニングテキストと参照テキストの各領域の間の割当に関して実行される。これらのテキスト領域は、隣接及び／若しくは非隣接フレーズ並びに／又は単一の若しくは複数のワード、数及び／若しくは句読点を規定する。このように、本発明の方法は、それらがワード、句読点、数又はそれらの組み合わせを表すか否かに関係なく、任意のタイプのテキスト部分又はテキスト領域に一般に適用可能である。トレーニングテキストと参照テキストの各テキスト領域の間の上記割当及びアライメントは、ワード単位のマッピングによって、すなわち、誤りワードをそれの訂正された参照対応ワードと置換することによって実行されるかもしれない。

ワード単位の割当はしばしば曖昧であるため、本方法はワード単位のマッピングに限定されない。さらに、トレーニングテキストと参照テキストの間の割り当ては、より大きな範囲に対して実行されてもよい。このため、多数のワードを有するテキストが、誤りのない領域と誤り領域に分割されてもよい。このタイプの分割に基づき、曖昧さを低減し、より長い範囲のフレーズ単位のマッピングを学習することを可能にする、完全な誤り領域の間のマッピングが実行されてもよい。このようなフレーズ単位のマッピングは、例えば、“ｔｈｅｐａｔｉｅｎｔｈａｓｗｅｉｒｄｐｒｏｂｌｅｍ”という誤りテキスト部分と“ｔｈｅｐａｔｉｅｎｔｈａｓａｓｅｖｅｒｅｐｒｏｂｌｅｍ”という正しい表現との間のマッピングとして表現されてもよい。

さらに、誤り領域のサブ領域を規定する部分誤り領域に基づき、割当が実行されてもよい。これは、好ましくは、短い範囲の誤り領域の誤りが他のコンテクストに再出現する可能性があるときに適用可能である。例えば、部分的な誤り領域は、“ｏｎｅｈｏｕｒｓ”などの文法的に誤った表現を規定するかもしれない。

トレーニングテキストと参照テキストとの間の不一致又は乖離を検出すると、１つのテキスト変換ルールだけでなく、複数の重複するテキスト変換ルールもまた生成されるかもしれない。あるテキスト変換ルールの生成と乖離のローカルな検出により、本方法は、生成されたテキスト変換ルールのグローバルなパフォーマンス又はクオリティを把握していない。従って、検出された誤りに適用可能な複数のルールを生成することが効果的である。例えば、“ｔｈｅｐａｔｉｅｎｔｈａｓａｓｅｖｅｒｅｐｒｏｂｌｅｍ”というセンテンスが“ｔｈｅｐａｔｉｅｎｔｈａｓｗｅｉｒｄｐｒｏｂｌｅｍ”として変換された場合、テキスト変換ルールセット全体が生成されるかもしれない。極めてシンプルなワード単位変換ルールが、“ｗｅｉｒｄ”を“ｓｅｖｅｒｅ”に置換することを規定するかもしれない。他のテキスト変換ルールは、“ｗｅｉｒｄ”をフレーズ“ａｓｅｖｅｒｅ”と置換するよう規定するかもしれない。さらなる他のテキスト変換ルールは、“はｓｗｅｉｒｄ”を“ｈａｓａｓｅｖｅｒｅ”に置換する規定するかもしれず、以下同様である。

明らかに、これら自動的に生成されたテキスト変換ルールのいくつかは、テキストに厳密に適用されると、テキストのクオリティを向上させるだけでなく、劣化するかもしれない。従って、テキスト変換ルールセットの評価は、生成されたテキスト変換ルールセットの妥当なテキスト変換ルールを検出するため、適用される必要がある。

本発明のさらなる好適な実施例によると、テキスト変換ルールは、トレーニングテキストのテキスト領域と参照テキストのテキスト領域との間の少なくとも１つの割当を有し、さらに当該割当が適用可能な状況を規定する適用条件を利用する。このように、テキスト変換ルールは、追加的な条件が充足されるときに限って、異なるテキスト領域を訂正されたテキスト領域と置換するよう規定するかもしれない。これは、正しいテキストが影響を受けない状態にされている間、テキスト変換ルールを誤りを訂正するのに十分固有なものにすることを可能にする。

例えば、何れか２つのワードの間に、又はワード“ａｎｄ”の何れかの出現前にカンマを単に導入することは、正しいカンマを導入することより不適切なカンマをテキストに確実に挿入することとなる。この場合、適用条件は、次のワードが“ａｎｄ”であり、ある欠落したカンマを挿入するため、当該“ａｎｄ”の２つ前のポジションにカンマが存在することを要求するなどの主張の形式により表現されるかもしれない。

さらに、適用条件は、テキスト変換ルールの適用可能性を不可にする排除を規定するかもしれない。例えば、テキスト変換ルールは、“ｃｏｌｏｎ”を“：”に置換するよう規定するかもしれない。ワード“ｃｏｌｏｎ”が冠詞に後続する場合など、当該テキスト変換ルールの適用を禁止することが効果的である。さらに多くの適用条件が考えられ、ワードクラスによって表現されるワードコンテクストを利用しさえするかもしれない。このようなワードクラスは、例えば、メトリックユニットを規定するかもしれず、適用条件は、次のワードがクラスメトリックユニットからのものである場合、ワード“ｏｎｅ”を“１”に変換するよう規定するかもしれない。これは、単なる基本的な具体例であり、適用条件もまた、テキストセグメント化及びトピックラベリングスキームを利用するより長い範囲のコンテクスト条件を利用するかもしれない。

本発明のさらなる好適な実施例によると、テキスト変換ルールセットの評価は、テキスト変換ルールセットの各テキスト変換ルールを個別に評価することを利用する。このテキスト変換ルールの個別評価はさらに、誤り低減指標を利用し、テキスト変換ルールをトレーニングテキストに適用するステップと、正のカウント数を決定するステップと、負のカウント数を決定するステップと、正及び負のカウント数に基づき誤り低減指標を求めるステップとを有する。

テキスト変換ルールをトレーニングテキストに適用することは、テキスト変換ルールの厳密な適用を表し、変換されたトレーニングテキストを提供する。その後、初期的なトレーニングテキストと変換されたトレーニングテキストの両方が、当該テキスト変換ルールのパフォーマンスを決定するため、正しい参照テキストと比較される。このように、テキスト変換ルールの適用が初期的なトレーニングテキストの誤りの解消をどの程度の頻度により提供するか正確に決定することができる。トレーニングテキストの誤りの各解消に対して、テキスト変換ルールの正のカウントがインクリメントされる。同様に、変換されたトレーニングテキストと参照テキストとの間の比較は、テキスト変換ルールの適用が、トレーニングテキストにおけるエラーの生成をどの程度の頻度により提供するか決定することを可能にする。この場合、負のカウント数がインクリメントされる。

これらの正及び負のカウント数に基づき、誤り低減指標を求めることができる。典型的には、誤り低減指標は、正のカウントから負のカウントを減算することによって取得することができる。当該結果が正である場合、当該テキスト変換ルールは一般に、トレーニングテキストに対する向上を提供する。他方のケースでは、当該結果が負であるとき、このテキスト変換ルールの厳密な適用は、自動テキスト訂正システムにより適用されると、テキストに対して負の影響を及ぼすであろう。さらに、誤り低減指標は、当該テキスト変換ルールの１回の適用によって、いくつの誤りが生成又は解消されるか規定するあるタイプの誤り数量によりスケーリングされるかもしれない。これは、各種テキスト変換ルールのパフォーマンスを比較するのに利用可能な一般的な誤り低減指標を取得することを可能にする。

原則的には、各テキスト変換ルールに対して誤り低減指標を利用することによって、トレーニングテキストに対して正の影響を有するテキスト変換ルールの選択が実行可能である。この場合、テキスト訂正ルールセットの各種ルール間の可能性のあるやりとりは、考慮されない。各種テキスト変換ルールが重複する可能性があるため、すなわち、同一又は部分的に重複したテキスト領域を意味するため、各種ルールの同一テキスト領域への以降の適用は、さらにテキストの劣化を招く可能性がある。

本発明のさらなる好適な実施例によると、テキスト変換ルールセットの評価及び導出はさらに、評価手続の繰り返しの実行を有する。ここで、第１ステップでは、テキスト変換ルールセットのランク付けが、ルール低減指標を利用することによって実行される。その後、最も高くランク付けされたテキスト変換ルールが、第１の変換されたトレーニングテキストを生成するため、トレーニングテキストに適用される。最も高くランク付けされたルールは、テキストの最大の向上と最小の劣化を提供するテキスト変換ルールセット全体を表す。この最も高くランク付けされたテキスト変換ルールの適用が初期的なトレーニングテキストに影響を与えるため、残りのすべてのルールが、変更されたトレーニングテキストを処理するため、少なくとも再評価及び／又は再設計される必要がある。

一般に、残りのルールのランク付けは、もはや有効でないかもしれない。従って、第２のテキスト変換ルールセットが、参照テキストと第１の変換されたトレーニングテキストとに基づき求められる。第２のテキスト変換ルールセットの導出は、典型的には、第１のテキスト変換ルールセットの生成と同様に、すなわち、第１の変換されたトレーニングテキストと参照テキストとを比較し、これら２つのテキストの間の乖離を検出し、適当なテキスト変換ルールを生成することによって実行される。

当該第２のテキスト変換ルールセットを求めた後、この第２のテキスト変換ルールセットと第１の変換されたトレーニングテキストとに基づき、第２のランク付けが実行される。このランク付けは、テキスト変換ルールセットの初期的なランク付けと同様に実行され、従って、それは第２のテキスト変換ルールセットの各ルールに対して誤り低減指標を利用する。その後、第２のテキスト変換ルールセットの最も高くランク付けされたルールが、第２の変換されたトレーニングテキストを生成するため、第１の変換されたトレーニングテキストに適用される。その後、当該手続の全体が繰り返し適用され、第３のテキスト変換ルールセットが、第２の変換されたトレーニングテキストともとの参照テキストとの間の比較に基づき生成される。好ましくは、この繰り返しの手続は、ｎ番目の変換されたトレーニングテキストが参照テキストに等しくなるまで、又はｎ番目の変換されたトレーニングテキストが（ｎ−１）番目の変換されたトレーニングテキストに関して何れの向上も示さなくなるまで実行されるかもしれない。典型的には、各繰り返しの中の最も高くランク付けされたルールが、自動テキスト訂正システムのテキスト変換ルールとして選択される。

当該繰り返し手続を利用することによって、各種テキスト変換ルールの間の相互作用が考慮され、評価及びルール生成手続を実行するのに確実なアプローチを提供する。しかしながら、この繰り返しの評価手続は大きな計算量を要求し、このため、不適切な計算時間と計算リソースを必要とするかもしれない。

本発明のさらに好適な実施例によると、テキスト変換ルールセットの評価は、第１及び第２テキスト変換ルールがトレーニングテキストの同一のテキスト領域を実質的に表している場合、テキスト変換ルールセットの第１及び第２テキスト変換ルールの第１テキスト変換ルールを破棄することを有する。第１テキスト変換ルールは、当該第１テキスト変換ルールが第２テキスト変換ルールより低く評価された場合、すなわち、第１ルールの誤り低減指標が第２ルールの誤り低減指標より低い場合、破棄される。破棄は、ルールをペア毎に破棄することに限定されるものではない。さらに、同一のテキスト領域を参照するすべてのルールを構成し、テキスト領域を参照するこれらのルールのランク付けを実行することが効果的である。このとき、各テキスト領域に対して、より大きな誤り低減指標を特徴付けるルールのみが選択され、テキスト訂正システムに提供される。このように、繰り返しの手続は、ルール相互作用に関して良好なルールを検出するため、明示的に適用される必要はない。

本発明のさらに好適な実施例によると、テキスト変換ルールセットの導出はさらに、あるタイプのテキスト誤りに固有の“ｗｏｒｄｓ”又はテキストユニットの少なくとも１つのクラスを利用する。典型的には、ワードクラスとも呼ばれるこのようなテキストユニットのクラスは、文法ルール又はコンテクストに固有のルールを表す。ワードクラスは、例えば、メートル、キロメートル、ミリメートルなどのメトリック単位のクラスを規定するかもしれない。効果的には、変換ルールは、ワードクラスにより規定されるメトリック表現に先行するとき、書かれた数字をそれの数字の部分と置換などするため、このようなワードクラスを利用するかもしれない。他の具体例は、“ｈｏｒｓｅｓ，ｃａｒｓ，ｐｅｎｃｉｌｓ，．．．”などの複数のワードに決して先行しない“ａ，ａｎ，ｏｎｅ”などの不定冠詞のクラスを表すかもしれない。ワードクラスを利用するテキスト変換ルールはまた、テキスト変換ルールに対して上述した適用条件を利用することによって実現されてもよい。

本発明のさらなる好適な実施例によると、テキスト変換ルール自体は、典型的には、正しいテキスト領域の誤りテキスト領域への意図しない変換を示すある条件が充足されない場合には、テキスト領域を他のテキスト領域に変換するよう規定することができる。このように、テキスト変換ルールは、積極的な意味において置換、挿入又は削除を規定するだけでなく、正しい可能性が高いテキスト領域の変換を禁止するかもしれない。

本発明のさらなる好適な実施例によると、テキスト変換ルールの評価及び／又は選択は、テキスト変換ルールセットの少なくとも一部をユーザに提供することを有する。その後、ユーザは、提供されたテキスト変換ルールの何れかを手動により評価及び／又は選択するかもしれない。このように、テキスト変換ルールを実行する評価及び選択の重要なタスクは、ユーザとのやりとりによって実行可能である。典型的には、テキスト変換ルールが、例えば、テキスト変換ルールの具体的な置換を可視化し、テキスト変換ルールに対して適用条件を規定する論理表現を提供することによって、可視化によりユーザに提供されてもよい。ユーザには、同一のテキスト領域などを表す獲得したテキスト変換ルールセットが提供されるかもしれない。その後、ユーザは提供された他のテキスト変換ルールの１つを選択するかもしれない。

本発明のさらなる好適な実施例によると、誤りトレーニングテキストが、自動音声認識システム、自然言語理解システム又は一般に音声テキスト変換システムによって提供される。このため、本発明の方法は、各自のテキスト出力と対応する正しい参照テキストとの比較とに基づき、これらのシステムのシステマティックエラーを検出するためのものである。

本発明の方法はさらに、検出されたシステマティックエラーを補償することを可能にするテキスト変換ルールを自動生成する。さらに、本発明の方法は一般に、誤りテキストと参照テキストとを、そのもとのものに関係なく比較することを可能にする。このように、本発明の方法は、トレーニー又は学生が潜在的な誤りテキストを生成し、本発明の方法がテキストの訂正後に学生にフィードバックを提供し、又はテキストと参照テキストとの比較を変更するのに利用可能な教育プログラムに適用されてもよい。

他の特徴では、本発明は、誤りテキストを訂正するテキスト変換ルールを利用するテキスト訂正システムを提供する。テキスト訂正システムは、少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを利用することによって、テキスト変換ルールを生成するよう構成される。本発明のテキスト訂正システムは、少なくとも１つの誤りトレーニングテキストと正しい参照テキストとを比較する手段と、トレーニングテキストと参照テキストとの間の乖離を利用することによって、テキスト変換ルールセットを求める手段とを有し、これにより、当該乖離が、比較により検出される。テキスト訂正システムはさらに、各変換ルールをトレーニングテキストに適用することによって、テキスト変換ルールセットを評価する手段と、テキスト訂正システムの評価されたテキスト変換ルールセットの少なくとも１つのテキスト変換ルールを選択する手段とを有する。

さらなる他の特徴では、本発明は、自動テキスト訂正のためテキスト変換ルールを生成するコンピュータプログラムを提供する。コンピュータプログラムは、少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを処理するよう構成される。コンピュータプログラムは、少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを比較し、トレーニングテキストと参照テキストとの間の乖離を利用することによって、テキスト変換ルールセットを求めるよう動作可能なプログラム手段を有する。典型的には、これらの乖離は、コンピュータによりサポートされる比較により検出される。コンピュータプログラムのプログラム手段はさらに、各変換ルールをトレーニングテキストに適用し、テキスト訂正システムに対して評価されたテキスト変換ルールセットの少なくとも１つのテキスト変換ルールを最終的に選択するよう動作可能である。

さらなる他の特徴では、本発明は、音声をテキストに変換する音声テキスト変換システムを提供する。音声テキスト変換システムは、テキストの誤りを訂正するテキスト変換ルールを利用するテキスト訂正モジュールと、音声テキスト変換システムにより生成される少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを利用することによって、テキスト変換ルールを生成するルール生成モジュールとを有する。音声テキスト変換システムと、特にそれのルール生成モジュールは、参照及びトレーニングテキストを格納するストレージモジュールと、少なくとも１つの誤りトレーニングテキストと正しい参照テキストとを比較する比較モジュールと、テキスト変換ルールセットを求める変換ルール生成部と、各変換ルールをトレーニングテキストに適用することによって、テキスト変換ルールセットを評価するよう構成される評価部と、最後に、テキスト訂正モジュールに対して評価されたテキスト変換ルールセットの少なくとも１つのテキスト変換ルールを選択する選択モジュールとを有する。

本発明のさらなる好適な実施例によると、音声テキスト変換システム及び／又はテキスト訂正システムは、テキスト変換ルール毎の推定又は計算された誤り変化又は誤り低減指標の情報と共に、生成されたテキスト変換ルールを可視化するユーザインタフェースを有する。ユーザインタフェースは、各ルール又はルールセットをソート、選択及び／又は破棄することを可能にする選択ツールを有する。さらに、ユーザインタフェースはまた、ユーザによる手動の規定及びテキスト変換ルールの生成を提供するかもしれない。従って、ユーザ自身が、任意のルールを定義又は規定するかもしれない。このユーザにより定義されたルールは、その後、評価モジュールに提供され、ユーザには、当該提案されたルールのパフォーマンスに関するフィードバックが提供されるかもしれない。ユーザにより定義されたルールはまた、統計的証拠及び人間の直感が最大の効果のため組み合わされる自動生成されたルールによるランク付けに含まれるかもしれない。

さらに、ユーザインタフェースは、ユーザがワードクラスのマージや分割などのワードクラスの変更を手動により制御及び規定することができるように、ワードクラスを可視化するかもしれない。さらに、ユーザインタフェースは、テキスト変換ルールの適用を受けた変更されたテキストの領域をグラフィカルにハイライトするようにしてもよい。ハイライト処理は、あるルールにより導入された変更の容易な補償を可能にするｕｎｄｏ機能と共に提供されてもよい。

さらなる好適な実施例によると、ルールとそれらの適用に対する条件とのリストが、１以上のトレーニング及び参照テキストの比較から生成される。その後、特定のユーザからトレーニング及び参照テキストを受け付けると、すべてのルールがこれらのテキストに基づき評価される。このアプローチは、異なる誤り特徴を有する複数のユーザから生じるかもしれない以前に生成及び格納されたルールの長いリストからのルールのユーザ固有の選択を可能にする。予めより長いデータセットからルールを生成することは、しばしば制限されたユーザ固有のデータのみから抽出可能なより多くのルール、又はあるルールを利用又は禁止すべき時期に関する向上した条件を提供するかもしれない。さらに、オンラインシステムにおいてルールを生成する時間を短縮することが可能である。

従って、本発明は、そのうちの１つがいくつかの誤りを特徴付ける何れか２つの対応するテキストに一般に適用可能な方法を提供する。本方法及びテキスト訂正システムは、音声テキスト変換システムにより一般に実現可能であり、これらのシステムのシステマティックエラーを補償し、又はＡＳＲ及び／又はＮＬＰなどの音声テキスト変換システムの将来的な適用に対して、テキストにおいて検出された誤りがどのように解消可能であることを示唆をユーザに少なくとも提供することを可能にする。

請求項の参照符号は本発明の範囲を制限するものとして解釈されるべきでないということにさらに留意すべきである。

図１は、少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを利用するテキスト変換ルールを生成する本発明の方法を実行するフローチャートを示す。典型的には、参照テキストはすでに、自動テキスト訂正システムに提供され、適当なメモリに格納されている。その後、第１ステップ１００において、トレーニングテキストとも呼ばれる誤りテキストが受け付けされ、適当なメモリに格納される。このようにして、誤りテキストと参照テキストは、誤りテキストの比較及び変更を可能にするため、別々に格納される。

典型的には、誤りテキストは、自動音声認識システム及び／又は自然言語処理システム又は他の何れかのタイプの音声テキスト変換システムにより提供される。ステップ１００において、誤りテキストが受け付けされた後、次のステップ１０２において、誤りテキストと参照テキストが比較される。この比較は、ワード単位の比較又は複数のワード、数字、句読点及び同様のテキストユニットを含むテキスト領域全体を比較することに基づくものとすることが可能である。効果的には、この比較は、最小編集距離及び／又は誤りテキスト部分と対応する訂正テキスト部分との乖離の指標を提供するＬｅｖｅｎｓｈｔｅｉｎアライメントにより実行することができる。

この比較に基づき、ステップ１０４において、テキストアライメントのセットを求めることが可能となると共に、ステップ１０６において、アライメント条件のセットを求めることが可能である。テキストアライメントは、誤りテキスト領域をそれの対応する訂正対応部分に変換するため、必要な任意のタイプのテキスト変更を表すかもしれない。このように、テキストアライメントは、挿入、削除又は置換を表すかもしれない。例えば、“ｔｈｅｐａｔｉｅｎｔｈａｓｗｅｉｒｄｐｒｏｂｌｅｍ”などの誤った表現は、“ｔｈｅｐａｔｉｅｎｔｈａｓａｓｅｖｅｒｅｐｒｏｂｌｅｍ”という参照テキストの訂正表現に割り当てられるかもしれない。

典型的には、検出された各乖離に対して、誤りテキスト部分と対応する訂正テキスト部分との間のいくつかの可能性のあるテキスト割当が生成されるかもしれない。上述した具体例を参照するに、“ｗｅｉｒｄ”から“ｓｅｖｅｒｅ”の置換と共に、“ｗｅｉｒｄ”から“ａｓｅｖｅｒｅ”の置換などが考えられる。テキスト割当に加えて、ステップ１０６において、各テキスト割当に対する割当条件のセットが求められるかもしれない。割当条件は、あるテキスト割当が特定の割当条件が充足されたときに限って適用される必要があるということを規定するかもしれない。例えば、あるテキスト割当がワード“ａｎｄ”の前にカンマを挿入することを規定するものであるとき、当該割当条件は、テキスト割当により規定される挿入が、“ａｎｄ”の出現前の２つのポジションにカンマが与えられるときに限って適用可能であるということを規定するかもしれない。テキスト割当の他の例は、ワード“ｃｏｌｏｎ”を符号“：”と置換することによって与えられるかもしれない。ここで、割当条件は、先行するワードが冠詞であるか、又は“ａ，ａｎ，ｔｈｅ”などのテキスト要素又はテキスト領域のクラスに属する場合には、テキスト割当を適用しないよう規定するかもしれない。他の禁止条件は、現在のセンテンスがある胃腸診断などに属することを示すより高いレベルのテキストセグメント化であるかもしれない。

テキスト割当又はテキストマッピングに対する割当条件は、関連するテキストマッピングの統計的評価を利用することによって抽出されてもよい。このため、あるテキスト割当を厳密に適用し、当該テキスト割当の厳密な適用が誤りを解消又は導入するか判断することによって、テキスト割当の周囲のテキスト部分を考慮するとき、ある割当条件を求めることができる。“ｔｈｅｐａｔｉｅｎｔｈａｓｗｅｉｒｄｐｒｏｂｌｅｍ”を“ｔｈｅｐａｔｉｅｎｔｈａｓａｓｅｖｅｒｅｐｒｏｂｌｅｍ”にマッピングする上記の例では、“ｗｅｉｒｄ”を“ａｓｅｖｅｒｅ”にする中心的な置換の周囲のワードが、積極的な意味において条件として規定されるかもしれない。ここで、１つの化のｕｓｅのある条件は、“先行するワードが‘ｈａｓ’であるか、又は‘ｈａｓ’を含むあるワードクラスからのものである”として記述することが可能である。

もちろん、“カンマを有しなければならない２ワード前”という条件など、隣接しないテキスト領域を含むより長いレンジの従属性が、比較されたテキストから直接的に抽出可能である。

原則的に、ステップ１０４において求められたテキスト割当と、ステップ１０６において求められた割当条件の対応するセットとは、テキスト変換ルールを規定するのに十分なものである。最も簡単な実施例では、すでにテキスト割当を求めることによって、置換、挿入、削除などは具体的なテキスト変換ルールを規定するのに十分であるかもしれない。

効果的には、各種テキスト変換ルール、すなわち、テキスト変換ルールセットがステップ１０８において、先行するステップ１０４と１０６を利用することにより導出及び生成される。このように、テキスト割当及び割当条件は効果的にマージされる。ステップ１０８において、テキスト変換ルールが生成されると、それらはあるタイプのストレージにより格納される。ステップ１０８におけるテキスト変換ルールセットの導出後、テキスト変換ルール全体が、誤りテキストを生成した音声テキスト変換システムのシステマティックエラーを表す上記テキスト変換ルールを選択する評価される必要がある。

テキスト変換ルールの評価は、複数の方法により実行可能である。基本的アプローチは、各テキスト変換ルールをトレーニングテキストに個別に適用し、当該テキスト変換ルールがトレーニングテキストのエラーレートに対して正又は負の効果を有するか判断するため、変換されたトレーニングテキストと参照テキストとを比較することを利用するものである。例えば、各テキスト変換ルールに対して、正及び負のカウンターが、それぞれルールの適用による誤りの解消又は生成に対してインクリメントされる。これらの正及び負のカウンターに基づき、誤りテキストに関するテキスト変換ルールの全体的なパフォーマンスを示す誤り低減指標を求めることができる。

複数のテキスト変換ルールを評価するより高度なアプローチは、繰り返しの評価処理を実行することに基づく。各種テキスト変換ルールが、それらの誤り低減指標などに関してランク付けされ、最も高くランクされたテキスト変換ルールのみが誤りテキストに適用される。その後、変更された誤りテキストは、第２のテキスト変換ルールセットを生成するため、参照テキストと繰り返し比較される。この第２のテキスト変換ルールセットがまたランク付けされ、再び最も高くランク付けされたルールが、第２の変更されたトレーニングテキストを生成するため、変更されたトレーニングテキストに適用される。この手順が繰り返し実行され、各種ルール間の相互作用に関して各種テキスト変換ルールを評価することを可能にする。

他のアプローチは、各種テキスト変換ルールをそれらの共通のテキスト割当に関して調整することを利用するものである。この調整は、同じタイプの誤りなどに適用する部分的に重複したルールを説明する。このように、各種テキスト変換ルールグループが生成され、各テキスト変換ルールグループに対して、典型的にはベストパフォーマンスのルール、すなわち、最も高くランクされたルールである１つのルールが実際に選択される。このため、ステップ１１０において実行されたテキスト変換ルールの評価は、各種テキスト変換ルールがテキスト訂正システムに対して選択された後続するステップ１１２にリンクされるかもしれない。

これらのルールがステップ１１２において選択されると、それらはステップ１１４において、上記テキスト変換ルールを選択された順序に厳密に適用するよう構成されるテキスト訂正システムに提供される。評価及び選択されたテキスト変換ルールは、誤りテキストを生成した音声テキスト変換システム又はＡＳＲシステムのシステマティックエラー又は誤りテキストのシステマティックエラーに特有なものであるため、生成されたルールは、ＡＳＲシステムのシステマティックエラーを保証するため、又はＡＳＲシステムを再設計するため、一般に的に適用することが可能である。このため、テキスト変換ルールを生成する本発明の方法は、商業的に利用可能な任意の音声テキスト変換システムに一般に適用することが可能である。このとき、生成されたテキスト変換ルールは、音声テキスト変換システムのシステマティックエラーを訂正するよう構成される自動テキスト訂正システムによって利用されてもよいし、又は音声テキスト変換システムを向上させるためのフィードバックとして利用されてもよい。

図２に示されるブロック図は、参照テキスト２００と誤りテキスト部分を有するトレーニングテキスト２０４とを示す。一例として、参照テキストは“ｔｈｅｐａｔｉｅｎｔｈａｓａｓｅｖｅｒｅｐｒｏｂｌｅｍ”などのテキスト部分２０２を有し、トレーニングテキスト２０４は、“ｔｈｅｐａｔｉｅｎｔｈａｓｗｅｉｒｄｐｒｏｂｌｅｍ”の対応する誤りテキスト部分２０６を有する。参照テキスト２００とトレーニングテキスト２０４を比較することによって、これらの２つの表現２０２と２０６との間の乖離が検出される。このトレーニングテキスト２０４の誤り部分の検出は、ワード単位の比較、フレーズ単位の比較、又は誤りテキスト部分２０６の訂正及び誤りテキスト領域への分割を利用することによって実行されるかもしれない。

２つのテキスト要素又はテキスト領域２０２と２０６との間の乖離は、様々な理由によるかもしれない。従って、テーブル２０８に示されるように、検出された乖離に対して、テキスト変換ルールセットの全体が生成される。典型的には、テキスト変換ルールは、カラム２１８に示される訂正テキストと置換される必要があるカラム２１６に格納される誤りテキストを規定する。これら代わりとなる各割当は、各々がカラム２２０により与えられる適用条件を有する相異なるテキスト変換ルール２１０、２１２及び２１４を規定する。上述したように、“ｈａｓｗｅｉｒｄ”を“ｈａｓａｓｅｖｅｒｅ”と置換するルール２１４はまた、先行ワードが“ｈａｓ”となる必要がある追加的条件２２０によって、“ｗｅｉｒｄ”を“ａｓｅｖｅｒｅ”と置換するルール２１２などとして解釈されるかもしれない。このように、周囲のテキスト部分の解析から、条件を自動抽出することが可能である。同様に、より高いレベルのセグメント化又は何れかのタイプのタグ処理が利用可能である場合、当該追加情報が条件２２０として機能するかもしれない。

誤りテキスト要素２０６とそれの対応する訂正要素２０２とに関して、各種置換が考えられる。例えば、ルール２１０は、“ｗｅｉｒｄ”が“ｓｅｖｅｒｅ”と置換される必要があるということを規定するかもしれない。ルール２１２は、“ｗｅｉｒｄ”が２つのワード“ａｓｅｖｅｒｅ”と置換される必要があることを規定し、ルール２１４は、“ｈａｓｗｅｉｒｄ”という表現が“ｈａｓａｓｅｖｅｒｅ”という表現と置換される必要があることを規定するかもしれない。これらのルール２１０、２１２及び２１４の生成は、当該ルールのコンテンツ及び潜在的なパフォーマンスに関係なく実行される。例えば、一般にワード“ｗｅｉｒｄ”を“ｓｅｖｅｒｅ”に置換することは、ワード“ｗｅｉｒｄ”を利用する訂正テキスト部分がワード“ｓｅｖｅｒｅ”と置換されるため、明らかに良好な選択ではない。従って、存在する場合には、各自の関連する条件２２０を含む各種生成されたルール２１０、２１２及び２１４の評価及びランク付けが要求される。

図３は、繰り返しの評価手順を実行するフローチャートを示す。繰り返しの評価手順は、誤りトレーニングテキストと正しい参照テキストの比較により検出及び生成された複数のテキスト変換ルールを利用する。第１ステップ３００において、テキスト変換ルールセットの各テキスト変換ルールに対して、誤り低減指標が決定される。誤り低減指標の決定は、テキスト変換ルールを誤りテキストに厳密に適用し、その後、変換されたテキストをもとの参照テキストと比較することによって効果的に実行することが可能である。このように、テキスト変換ルールの適用が誤りの解消又は生成を導いたか検出することができる。新たに生成された誤りと解消された誤りの出現は、各テキスト変換ルールに対して誤り低減指標を求めることを可能にする正負のカウントを利用することによって決定される。この誤り低減指標は、例えば、正のカウントから負のカウントを減算するなどによって決定可能であり、これにより、特定のテキスト変換ルールが誤りトレーニングテキストに対して良好又は不良な影響を有するか示す。

誤り低減指標に基づき、後続するステップ３０２において、テキスト変換ルールセットがランク付け及び再ソート可能である。従って、各種テキスト変換ルールが、各自の誤り低減指標に関してソートされるかもしれない。典型的には、負の誤り低減指標を特徴付けるテキスト変換ルール、すなわち、それらが解消したものより多くの誤りを導入したルールは破棄されるかもしれない。

ステップ３０２においてテキスト変換ルールのランク付けが実行された後、後続するステップ３０４において、最も高くランク付けされたテキスト変換ルールがトレーニングテキストに適用される。最も高くランク付けされたテキスト変換ルールの適用は、当該変換ルールのみの厳密な適用を意味する。この結果、トレーニングテキストは、適切に変更される。その後、ステップ３０６において、最も高くランク付けされた変換ルールの厳密な適用の結果である変換されたトレーニングテキストが、参照テキストと比較される。ステップ３０６において実行される当該比較は、初期的なテキスト変換ルールセットの生成に適用された同一の技術を利用する。このため、変換されたトレーニングテキストと参照テキストとの間の乖離が検出され、対応するテキスト変換ルールが生成される。

ステップ３０６において実行される当該比較に基づき、後続するステップ３０８において、次のテキスト変換ルールセットが生成される。その後のステップ３１０において、繰り返し評価手続の停止基準がチェックされる。この停止基準は、例えば、１０回目の繰り返しの後に、評価手続がチェックされるということを規定するものであってもよい。あるいは、当該停止基準は、ステップ３０８において、変換されたトレーニングテキストと参照テキストがほとんど正確に一致することを示す限られた個数の変換ルールのみが生成されたときに、当該手続を停止するよう規定してもよい。ステップ３１０における停止基準が充足された場合、当該手続はステップ３１２に続き、テキスト変換ルールセットの評価が停止し、各繰り返しの最も高くランク付けされたルールが、テキスト訂正システムに提供されるテキスト変換ルールとして選択される。

他方のケースでは、ステップ３１０において停止基準が充足されないとき、当該手続はステップ３１４に続き、ステップ３０８により生成された次のテキスト変換ルールセットが個別に評価される。この個別の評価は、初期的なテキスト変換ルールセットに対してステップ３００において実行されたように、次のテキスト変換ルールセットの各テキスト変換ルールに対して誤り低減指標を決定することを意味する。これにより、次のテキスト変換ルールセットのランク付けがまた、別のテキスト変換ルールの誤り低減指標に基づき実行される。その後、当該手続はステップ３０４に戻って、最も高くランク付けされたテキスト変換ルールがトレーニングテキストに適用される。

好ましくは、ステップ３０４の当該繰り返される実行において、最も高くランク付けされたテキスト変換ルールは、初期的なトレーニングテキストでなく、初期的なテキスト変換ルールセットの最も高くランク付けされた変換ルールの最初の適用から生じるトレーニングテキストに適用される。

テキスト変換ルールの当該評価及び選択の繰り返しの手続は、例えば、テキスト変換ルールがある重複を対象とするとき、各種テキスト変換ルールの間の相互作用を説明することを可能にする。このように、最も良く評価されたテキスト変換ルールを適用した後、変更されたテキストとトレーニングテキストを比較し、テキスト変換ルールセットを決定し、テキスト変換ルールの評価とランク付けを実行する手続全体が繰り返し適用される。

図４は、テキスト変換ルールを生成及び評価するよう構成されるルール生成モジュール４００のブロック図を示す。ルール生成モジュール４００は、ルール生成モジュール４００に誤りテキスト入力を提供する自動音声認識システム４０２とやりとりするかもしれない。さらに、ルール生成モジュール４００は、テキスト訂正システム４０４とユーザ４０６とやりとりするよう構成される。あるいは、図示されたルール生成モジュール４００は、テキスト訂正システム４０４及び／又はＡＳＲ４０２などの音声テキスト変換システムに実現されるかもしれない。

ルール生成モジュール４００は、誤りテキストをトレーニングテキストとしてトレーニングテキストストレージブロック４２２に格納し、正しい参照テキストを参照テキストストレージブロック４２４に別々に格納することを可能にするストレージモジュール４０８を有する。典型的には、トレーニングテキストと参照テキストは、１つの再構成可能なストレージモジュール４０８の各ストレージブロックに格納される。トレーニングテキスト共に参照テキストは、典型的には電子形式によりルール生成モジュール４００に提供される。

ルール生成モジュール４００はさらに、比較モジュール４１２、ルール生成部４１４、ルールストレージ４１６、ディスプレイ４１８、ルール選択部４２０、ユーザインタフェース４２８及びルール評価部４１０を有する。典型的には、ルール評価部４１０はさらに、ストレージと、特に一時的ストレージモジュール４２６とを有する。

比較モジュール４１２は、参照テキストとトレーニングテキストとの間の乖離を検出するため、トレーニングテキストと参照テキストとを比較するのに利用される。この比較は、これら２つのテキストの間のワード単位の比較及びワード単位のマッチングを利用するかもしれないが、ワード単位のマッピングに限定されるものでない。さらに、比較モジュール４１２は、トレーニングテキストと参照テキストのテキスト要素又はテキスト領域の乖離を検出及び分類するため、最小編集距離アルゴリズムを利用し、又はＬｅｖｅｎｓｈｔｅｉｎアライメントを実行するよう構成される。比較モジュール４１２は、フレーズ単位のマッチングを利用して、テキストを誤り領域と非誤り領域に分割するようにしてもよい。

比較モジュール４１２の結果に基づき、ルール生成部４１４は、各誤りテキスト領域に対する少なくとも１つのルールを生成するよう構成される。典型的には、ルール生成部は、誤りテキスト領域を対応する訂正テキスト領域に割り当て、さらに当該割当に対する適用条件を規定するようにしてもよい。典型的には、ルール生成部４１４は、検出された各乖離に対して代替ルールセットを生成するよう構成される。これは特に、検出された誤りを解消するのに考えられる適切な訂正ルールをカバーするのに効果的である。

ルールストレージモジュール４１６は、ルール生成部４１４により生成されるルールを格納するよう構成される。ルール評価部４１０は、ルール生成モジュール４００の他のほとんど任意のコンポーネントとやりとりするよう構成される。ルール評価部は、ストレージブロック４２２に格納されるトレーニングテキストにルール生成部４１４により生成されるルールを適用するのに利用される。ルール評価部４１４は、ルールストレージモジュール４１６に格納されたルールの厳密な適用によって変更された変更したトレーニングテキストを格納するためなどの一時的ストレージモジュール４２６を有する。

当該ルールを適用し、その結果を一時的ストレージモジュール４２６に格納するのとは別に、ルール評価部４１０はさらに、変更されたトレーニングテキストと参照テキストとを比較するよう構成される。典型的には、当該比較は、比較モジュール４１２により実行されてもよい。このように、ルール評価部４１０は、変更されたトレーニングテキストと参照テキストとを比較するため、比較モジュール４１２を制御する。この比較の結果は、ルール評価部に提供され、ルール評価部が適用されたルールに対する誤り低減指標を抽出及び導出するようにしてもよい。この誤り低減指標は、その後、対応するルールに割り当てられたルールストレージモジュール４１６に提供されるかもしれない。

ルール評価部４１０はさらに、上述したルール評価手続の何れかを実行するよう構成される。このため、ルール評価部は、ルールストレージモジュール４１６に格納されているルールのランク付けを実行し、最も高くランク付けされたルールをトレーニングテキストに適用するよう構成される。その後、ルール評価部４１０は、変更されたトレーニングテキストと参照テキストとの間の比較に基づき、第２のテキスト変換ルールセットを生成するため、比較モジュール４１２、ルール生成部４１４及びルールストレージ４１６を制御するようにしてもよい。各繰り返しによって、最も高くランク付けされたルールのみがルール選択部４２０に提供されるようにしてもよい。最終的には、ルール評価部４１０とルール選択部４２０によって評価及び選択されたルールが、テキスト訂正システム４０４に提供され、音声テキスト変換のフレームワークにおいて以降の適用に厳密に適用されるようにしてもよい。

さらに、ルール評価部４１０は、ディスプレイ４１８とユーザインタフェース４２８とやりとりするようにしてもよい。あるいは、ユーザインタフェース４２８と共にディスプレイ４１８は、ルール生成モジュール４００の外部コンポーネントとして実現されてもよい。何れの場合も、ユーザ４０６は、ディスプレイ４１８とユーザインタフェース４２８によってルール生成モジュール４００とやりとりするかもしれない。このように、ルール生成部４１４により生成される各種ルールは、生成されたルールの一部を手動により選択、選択解除、ソート又は破棄するユーザに表示可能である。このとき、ユーザ入力は、テキスト訂正システム４０４に対する適切なルールを抽出するため、ルール評価部及び／又はルール選択部４２０に提供される。さらに、ユーザは、生成モジュール４１０及び比較モジュール４１２によって評価され、その結果がユーザにフィードバックされてもよいし、又はルール選択部により利用されてもよい。

図１は、テキスト変換ルールを生成する本発明の方法のフローチャートを示す。図２は、参照テキスト、トレーニングテキスト及びテキスト変換ルールのリストの概略的なブロック図を示す。図３は、テキスト変換ルールを繰り返し評価するフローチャートを示す。図４は、自動テキスト訂正システムのテキスト変換ルールを生成するルール生成モジュールのブロック図を示す。

符号の説明

２００参照テキスト
２０２テキスト要素
２０４トレーニングテキスト
２０６テキスト要素
２０８テキスト変換ルールセット
２１０、２１２、２１４テキスト変換ルール
２１６誤りテキスト要素
２１８訂正テキスト要素
２２０割当適用条件
４００ルール生成モジュール
４０２自動音声認識システム
４０４テキスト訂正システム
４０６ユーザ
４０８ストレージモジュール
４１０ルール評価部
４１２比較モジュール
４１４ルール生成部
４１６ルールストレージ
４１８ディスプレイ
４２０ルール選択部
４２２トレーニングテキストストレージモジュール
４２４参照テキストストレージモジュール
４２６一時的ストレージモジュール
４２８ユーザインタフェース

Claims

少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを利用することによって、自動テキスト訂正に対するテキスト変換ルールを生成する方法であって、
前記少なくとも１つの誤りトレーニングテキストと前記正しい参照テキストとを比較するステップと、
前記比較するステップによって検出される、前記トレーニングテキストと前記参照テキストとの間の乖離を利用することによって、テキスト変換ルールセットを求めるステップと、
各変換ルールを前記トレーニングテキストに適用することによって、前記テキスト変換ルールセットを評価するステップと、
前記自動テキスト訂正に対する前記評価されたテキスト変換ルールセットの少なくとも１つのテキスト変換ルールを選択するステップと、
を有する方法。
前記テキスト変換ルールを求めるステップは、隣接及び／若しくは非隣接フレーズ並びに／又は単一の若しくは複数のワード、数字及び／若しくは句読点を規定する、前記トレーニングテキストと前記参照テキストの各テキスト領域の間の割当に関して実行される、請求項１記載の方法。
テキスト変換ルールは、前記トレーニングテキストのテキスト領域と前記参照テキストのテキスト領域との間の少なくとも１つの割当を有し、さらに該割当が適用可能である状況を規定する適用条件を利用する、請求項１記載の方法。
前記テキスト変換ルールセットを評価するステップは、前記テキスト変換ルールセットの各テキスト変換ルールを個別に評価することを利用し、
該テキスト変換ルールの評価はさらに、誤り低減指標を利用し、
前記テキスト変換ルールセットを評価するステップは、
変換されたトレーニングテキストを生成するため、前記テキスト変換ルールを前記トレーニングテキストに適用するステップと、
前記テキスト変換ルールの適用が前記トレーニングテキストの誤りの解消をどの程度の頻度により提供するか示す正のカウント数を決定するステップと、
前記テキスト変換ルールの適用が前記トレーニングテキストにおける誤りの生成をどの程度の頻度により提供するか示す負のカウント数を決定するステップと、
前記正のカウント数と前記負のカウント数とを利用することによって、前記テキスト変換ルールに対する誤り低減指標を求めるステップと、
有する、請求項１記載の方法。
前記テキスト変換ルールセットを評価するステップは、繰り返しの評価手続を有し、
１回の繰り返しは、
前記誤り低減指標を利用することによって、前記テキスト変換ルールセットのランク付けを実行するステップと、
第１の変換されたトレーニングテキストを生成するため、最も高くランク付けされたテキスト変換ルールを前記トレーニングテキストに適用するステップと、
前記参照テキストと前記第１の変換されたトレーニングテキストとに基づき、第２のテキスト変換ルールセットを求めるステップと、
を有し、
後続する繰り返しは、前記第２のテキスト変換ルールセットの第２の評価と第２のランク付けとを実行するステップを有する、請求項４記載の方法。
前記テキスト変換ルールセットを評価するステップは、前記テキスト変換ルールセットの第１及び第２テキスト変換ルールの第１テキスト変換ルールを、前記第１及び第２テキスト変換ルールが前記トレーニングテキストの同一のテキスト領域に実質的に表している場合に破棄するステップを有し、
前記第１テキスト変換ルールが前記第２テキスト変換ルールより低く評価される場合に、前記第１テキスト変換ルールは破棄される、請求項４記載の方法。
前記テキスト変換ルールセット及び／又は前記適用条件を求めるステップは、少なくとも１つのワードクラスを利用する、請求項１記載の方法。
前記テキスト変換ルールはさらに、訂正テキスト領域の誤りテキスト領域への変換を禁止する条件を規定する、請求項１記載の方法。
前記テキスト変換ルールを評価及び／又は選択するステップは、ユーザが提供されたテキスト変換ルールを手動により評価及び／又は選択することを可能にする、前記テキスト変換ルールセットの少なくとも一部を前記ユーザに提供するステップを有する、請求項１記載の方法。
ユーザにより規定されるルールが評価され、
前記評価されたルールが、前記自動テキスト訂正に対して選択され、及び／又は手動選択のため前記ユーザに提供される、請求項１記載の方法。
前記誤りトレーニングテキストは、自動音声認識システム、自然言語理解システム又は音声テキスト変換システムによって提供される、請求項１記載の方法。
誤りテキストを訂正するためテキスト変換ルールを利用するテキスト訂正システムであって、
当該テキスト訂正システムは、少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを利用することによって、前記テキスト変換ルールを生成するよう構成され、
前記少なくとも１つの誤りトレーニングテキストと前記正しい参照テキストとを比較する手段と、
前記比較する手段によって検出される、前記トレーニングテキストと前記参照テキストとの間の乖離を利用することによって、テキスト変換ルールセットを求める手段と、
各変換ルールを前記トレーニングテキストに適用することによって、前記テキスト変換ルールセットを評価する手段と、
前記テキスト訂正システムに対する前記評価されたテキスト変換ルールセットの少なくとも１つのテキスト変換ルールを選択する手段と、
を有するテキスト訂正システム。
テキスト訂正システムに対するテキスト変換ルールを生成するコンピュータプログラムであって、
当該コンピュータプログラムは、少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを処理するよう構成され、
前記少なくとも１つの誤りトレーニングテキストと前記正しい参照テキストとを比較し、
前記比較によって検出される、前記トレーニングテキストと前記参照テキストとの間の乖離を利用することによって、テキスト変換ルールセットを求め、
各変換ルールを前記トレーニングテキストに適用することによって、前記テキスト変換ルールセットを評価し、
前記テキスト訂正システムに対する前記評価されたテキスト変換ルールセットの少なくとも１つのテキスト変換ルールを選択する、
よう動作可能なプログラム手段を有するコンピュータプログラム。
音声をテキストに変換する音声テキスト変換システムであって、
当該音声テキスト変換システムは、前記テキストの誤りを訂正するテキスト変換ルールを利用するテキスト訂正モジュールと、当該音声テキスト変換システムによって生成される少なくとも１つの誤りトレーニングテキストと対応する正しい参照テキストとを利用することによって、前記テキスト変換ルールを生成するルール生成モジュールとを有し、
当該音声テキスト変換システムは、
前記参照テキストと前記トレーニングテキストとを格納するストレージモジュールと、
前記少なくとも１つの誤りトレーニングテキストと前記正しい参照テキストとを比較する比較モジュールと、
前記処理モジュールにより検出される、前記トレーニングテキストと前記参照テキストとの間の乖離を利用するよう構成され、テキスト変換ルールセットを求める変換ルール生成部と、
各変換ルールを前記トレーニングテキストに適用することによって、前記テキスト変換ルールセットを評価するよう構成される評価部と、
前記テキスト訂正モジュールに対して前記評価されたテキスト変換ルールセットの少なくとも１つのテキスト変換ルールを選択する選択モジュールと、
を有する音声テキスト変換システム。