JP2023002730A

JP2023002730A - テキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体

Info

Publication number: JP2023002730A
Application number: JP2022169806A
Authority: JP
Inventors: ルイキンジャン，; Ruiqing Zhang; フェー，ジョンジュン; Zhongjun He; ファウー，; Hua Wu
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-11-15
Filing date: 2022-10-24
Publication date: 2023-01-10
Also published as: US20230090625A1; CN114239559A; CN114239559B; EP4109443A3; EP4109443A2

Abstract

【課題】検出された誤字のピンイン特徴を誤字の後ろに接続して誤り訂正を行うことにより、可変長誤り訂正の問題を処理することが可能なテキスト誤り訂正方法、装置、電子機器及び記憶媒体を提供する。【解決手段】テキスト誤り訂正方法は、誤り訂正対象のテキストを取得し、誤り訂正対象のテキストのピンインシーケンスを取得し、誤り訂正対象のテキストとピンインシーケンスをテキスト誤り訂正モデルに入力して、誤り訂正後の誤り訂正済みテキストを得て、テキスト誤り訂正モデルは、誤り訂正対象のテキストの誤字を検出し、ピンインシーケンスにおける誤字に対応するピンインを決定し、ピンインに対応するピンイン特徴を誤字の後ろに追加して、ピンインテキストを得て、ピンインテキストの誤字とピンイン特徴を訂正して、誤り訂正済みテキストを得るステップによって、誤り訂正済みテキストを得る。【選択図】図１

Description

本開示は、人工知能技術の分野における自然言語処理と深層学習技術の分野に関し、特に、テキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体に関する。

現在、業界は通常、中国語の音声認識結果の誤り訂正に対して非自己回帰モデルを使用する。

ただし、非自己回帰モデルを使用して誤り訂正を行うことは、可変長誤り訂正の問題を処理できず、誤り訂正結果の精度が低くなる。

本開示は、テキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体を提供する。

第１の態様によれば、誤り訂正対象のテキストを取得するステップと、前記誤り訂正対象のテキストのピンインシーケンスを取得するステップと、前記誤り訂正対象のテキストと前記ピンインシーケンスをテキスト誤り訂正モデルに入力して、誤り訂正後の誤り訂正済みテキストを得るステップであって、前記テキスト誤り訂正モデルが、前記誤り訂正対象のテキストの誤字を検出し、前記ピンインシーケンスにおける前記誤字に対応するピンインを決定し、前記ピンインに対応するピンイン特徴を前記誤字の後ろに追加して、ピンインテキストを得て、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得るステップによって前記誤り訂正済みテキストを得るステップと、を含むテキスト誤り訂正方法を提供する。

第２の態様によれば、サンプルテキスト、サンプルテキストのサンプルピンインシーケンス及びサンプルテキストのターゲットテキストを取得するステップと、サンプルテキストとサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して、サンプル誤り訂正済みテキストを得るステップであって、トレーニング対象のテキスト誤り訂正モデルが、サンプルテキストのサンプル誤字を検出し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加して、サンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴を訂正して、サンプル誤り訂正済みテキストを得るステップによってサンプル誤り訂正済みテキストを得るステップと、サンプルテキスト、サンプル誤り訂正済みテキスト及びターゲットテキストに基づいて第１の損失値を生成するステップと、第１の損失値に基づいてトレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得るステップと、を含むテキスト誤り訂正モデルの生成方法を提供する。

第３の態様によれば、誤り訂正対象のテキストを取得する第１の取得モジュールと、前記誤り訂正対象のテキストのピンインシーケンスを取得する第２の取得モジュールと、前記誤り訂正対象のテキストと前記ピンインシーケンスをテキスト誤り訂正モデルに入力して、誤り訂正後の誤り訂正済みテキストを得る第１の誤り訂正モジュールであって、前記テキスト誤り訂正モデルが前記誤り訂正対象のテキストの誤字を検出し、前記ピンインシーケンスにおける前記誤字に対応するピンインを決定し、前記ピンインに対応するピンイン特徴を前記誤字の後ろに追加して、ピンインテキストを得て、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得るステップによって前記誤り訂正済みテキストを得る第１の誤り訂正モジュールと、を含むテキスト誤り訂正装置を提供する。

第４の態様によれば、サンプルテキスト、サンプルテキストのサンプルピンインシーケンス及びサンプルテキストのターゲットテキストを取得する第３の取得モジュールと、サンプルテキストとサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して、サンプル誤り訂正済みテキストを得る第２の誤り訂正モジュールであって、トレーニング対象のテキスト誤り訂正モデルが、サンプルテキストのサンプル誤字を検出し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加して、サンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴を訂正して、サンプル誤り訂正済みテキストを得る第２の誤り訂正モジュールと、サンプルテキスト、サンプル誤り訂正済みテキスト及びターゲットテキストに基づいて第１の損失値を生成する第１の生成モジュールと、第１の損失値に基づいてトレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得るトレーニングモジュールと、を含むテキスト誤り訂正モデルの生成装置を提供する。

第５の態様によれば、電子機器を提供し、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも１つのプロセッサが本開示の第１の態様に記載のテキスト誤り訂正方法または本開示の第２の態様に記載のテキスト誤り訂正モデルの生成方法を実行できるように、前記少なくとも１つのプロセッサによって実行される。

第６の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに本開示の第１の態様に記載のテキスト誤り訂正方法または本開示の第２の態様に記載のテキスト誤り訂正モデルの生成方法を実行させる。

第７の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムはプロセッサによって実行される場合、本開示の第１の態様に記載のテキスト誤り訂正方法のステップまたは本開示第２の態様に記載のテキスト誤り訂正モデルの生成方法のステップを実現する。

なお、この部分に記載の内容は、本開示の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していないことを理解されたい。本開示の他の特徴は、以下の説明を通して容易に理解される。

図面は、本技術案をよりよく理解するために使用され、本開示を限定するものではない。
本開示の第１の実施例に係るテキスト誤り訂正方法のフローチャートである。ＴａｇｇｉｎｇｗｉｔｈＰｈｏｎｅｔｉｃｓ方法の概略図である。ピンインと組み合わせられた非自己回帰モデルの概略図である。本開示の第２の実施例に係るテキスト誤り訂正方法のフローチャートである。本開示の第１の実施例に係るテキスト誤り訂正モデルの生成方法のフローチャートである。本開示の第２の実施例に係るテキスト誤り訂正モデルの生成方法のフローチャートである。トレーニングデータ（Ｘ，Ｙ）からＸ_ｃｏｒとＹ＾を生成するプロセスの概略図である。本開示の第１の実施例に係るテキスト誤り訂正装置のブロック図である。本開示の第２の実施例に係るテキスト誤り訂正装置のブロック図である。本開示の第１の実施例に係るテキスト誤り訂正モデルの生成装置のブロック図である。本開示の第２の実施例に係るテキスト誤り訂正モデルの生成装置のブロック図である。本開示の実施例のテキスト誤り訂正方法またはテキスト誤り訂正モデルの生成方法を実現するための電子機器のブロック図である。

以下、図面と併せて本開示の例示的な実施例を説明し、理解を容易にするためにその中には本開示の実施例の様々な詳細事項が含まれており、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本開示の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

人工知能（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ、ＡＩと省略する）は、人間の知能をシミュレーション、延長、拡張するための理論、方法、技術及び応用システムを研究、開発する新しい技術科学である。現在、ＡＩ技術は自動化度が高く、精度が高く、コストが低いという利点があり、幅広く応用されている。

自然言語処理（ＮａｔｕｒａｌＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ，ＮＬＰ）は、自然言語通信を効率的に実現できるコンピュータシステム、特にその中のソフトウェアシステムを研究する科学であり、コンピュータ科学の分野と人工知能の分野における重要な方向である。

深層学習（ＤｅｅｐＬｅａｒｎｉｎｇ、ＤＬと省略する）は、機械学習（ＭａｃｈｉｎｅＬｅａｒｎｉｎｇ、ＭＬと省略する）分野における新しい研究方向であり、サンプルデータの内的法則と表現レベルを学習するものであり、これらの学習プロセスで取得された情報は本文、画像、音声などのデータの解釈に大きいに役立つ。その最終的な目標は、機械が人間のように分析学習能力を持ち、本文、画像、及び音声などのデータを認識できるようにすることである。具体的な研究内容にとっては、主に畳み込み演算に基づくニューラルネットワークシステム、すなわち畳み込みニューラルネットワーク、多層ニューロンベースの自己コーディングニューラルネットワーク、及び多層自己コーディングニューラルネットワーク方式で予めトレーニングし、さらに認証情報と組み合わせてニューラルネットワークの重み値をさらに最適化する深層信頼ネットワークを含む。深層学習は検索技術、データマイニング、機械学習、機械翻訳、自然言語処理、マルチメディア学習、音声、推薦と個性化技術、及びその他の関連分野で多くの成果を収めた深層学習は機械に視聴や思考などの人間の活動を模倣させ、多くの複雑なパターン認識の課題を解決し、人工知能の関連技術が大きく進歩した。

以下、図面を参照しながら、本開示の実施例のテキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体を説明する。

図１は、本開示の第１の実施例に係るテキスト誤り訂正方法のフローチャートである。

図１に示すように、本開示の実施例のテキスト誤り訂正方は具体的に以下のステップＳ１０１～Ｓ１０３を含むことができる。

Ｓ１０１、誤り訂正対象のテキストを取得する。

具体的には、本開示の実施例に係るテキスト誤り訂正方法の実行主体は、本開示の実施例によって提供されるテキスト誤り訂正装置であってもよく、当該テキスト誤り訂正装置は、データ情報処理能力を有するハードウェア装置および／または当該ハードウェア装置の動作を駆動するために必要なソフトウェアであってもよい。選択的に、実行主体は、ワークステーション、サーバ、コンピュータ、ユーザ端末、および他のデバイスを含むことができる。ユーザ端末は、携帯電話、パソコン、インテリジェントな音声対話デバイス、スマート家電、車載端末などを含むが、これらに限定されない。

なお、本開示の実施例のテキスト誤り訂正方法は中国語音声認識結果の誤り訂正シーンに適用することができる。中国語音声認識結果の誤り訂正は、形式的に、以下のように表すことができる。いくつかの本文が含まれる文、つまり音声認識の結果を入力し、その後に誤り訂正後の文を出力し、ただし、２つの文に含まれる本文の数、すなわち文の長さは必ずしも同じではなく、例えば、誤り訂正文の長さは原文に対して増加することができ、文にｎ個の文字が含まれていることを例として、入力Ｘ＝（ｘ_１，ｘ_２，…，ｘ_ｎ）を入力した後、Ｙ＝（ｙ_１，ｙ_２，…，ｙ_ｍ）が出力されることができ、ｎが必ずしもｍに等しくない。

上記の問題に対して、「爾不要難過」（悲しまないで）という音声の認識の結果である「爾表難過」に対して誤り訂正を行うことを例とすると、従来の非自己回帰モデルに基づく誤り訂正方法は、図２に示すように、ｙ_ｔ図のＣは修正が必要であることを表し、Ｋは修正が必要ではないことを表し、２ステップのタグ付け方法が用いられており、ステップ１は、「爾表難過」という音声認識結果の誤り位置、すなわち音声認識結果のうちの誤字「表」を検出することであり、ステップ２は、検出された誤字「表」をピンイン「ｂｉａｏ」で代替してから入力し、さらに１ステップのｔａｇｇｉｎｇで誤り訂正を行い、誤り訂正済みテキスト「爾少難過」を得ることであり、しかしながら、この方法は、可変長誤り訂正を処理することができなく、つまり出力された誤り訂正結果が入力された音声認識結果の長さと同じであり、すなわち文字の数が同じでなければならず、入力された音声認識結果と同じ長さで文の流暢な発音に近い訂正を生成することができなかったため、「少」というおかしい誤り訂正が生成され、誤り訂正結果は十分に正確ではない。
なお、本明細書では、便宜上、「爾」、「難」及び「過」を繁体字で標記しているが、図面では簡体字で標記している。

これに基づいて、本開示の実施例は検出された誤字のピンイン特徴を誤字の後ろに接続して誤り訂正を行うことにより、誤り訂正速度が速く、発音情報を考慮したため、誤り訂正結果の精度が高く、可変長誤り訂正を処理することができ、誤り訂正結果の精度をさらに向上させるテキスト誤り訂正方法を提供する。

本開示の実施例では、誤り訂正対象のテキストは、すなわち音声認識された初期テキストであり、複数種類のクライアントを介して取得することができ、携帯電話、コンピュータなどを含むが、これに限定されず、本開示はこれに対してあまり限定しない。誤り訂正対象のテキストには、１つの文、１つの段落、または１つの文章、例えば、ニュース原稿などを含むことができる。図３に示すように、例えば、誤り訂正対象のテキストは「爾表難過」である。

Ｓ１０２、誤り訂正対象のテキストのピンインシーケンスを取得する。

具体的に、ステップＳ１０１で取得された誤り訂正対象のテキストに基づいて、誤り訂正対象のテキストに対応するピンインシーケンスをさらに取得する。

なお、ピンインシーケンスは、誤り訂正対象のテキストの各漢字のピンインの組み合わせシーケンスであり、小文字で表される。例えば、図３では、誤り訂正対象のテキスト「爾表難過」のピンインシーケンスは「ｎｉｂｉａｏｎａｎｇｕｏ」である。

Ｓ１０３、誤り訂正対象のテキストとピンインシーケンスをテキスト誤り訂正モデルに入力して、誤り訂正後の誤り訂正済みテキストを得て、ここで、テキスト誤り訂正モデルは、誤り訂正対象のテキストの誤字を検出し、ピンインシーケンスにおける誤字に対応するピンインを決定し、ピンインに対応するピンイン特徴を誤字の後ろに追加して、ピンインテキストを得て、ピンインテキストの誤字とピンイン特徴を訂正して、誤り訂正済みテキストを得るステップによって、誤り訂正済みテキストを得る。

具体的に、ステップＳ１０１で取得された誤り訂正対象のテキストとステップＳ１０２で取得された誤り訂正対象のテキストに対応するピンインシーケンスをテキスト誤り訂正モデルに入力し、テキスト誤り訂正モデルは、まず誤り訂正対象のテキストの誤字を検出し、ピンインシーケンスの検出された誤字に対応するピンインを決定し、次に当該ピンインに対応するピンイン特徴を誤字の後ろに追加して、ピンインテキストを得て、ピンインテキストの誤字とピンイン特徴を訂正し、これによって誤り訂正後の誤り訂正済みテキストを得る。例えば、図３では、誤り訂正対象のテキスト「爾表難過」に対応するピンインシーケンス「ｎｉｂｉａｏｎａｎｇｕｏ」をテキスト誤り訂正モデルに入力し、テキスト誤り訂正モデルの誤り検出サブモデルによって検出された「爾表難過」の誤字は「表」であり、ピンインシーケンス「ｎｉｂｉａｏｎａｎｇｕｏ」から誤字「表」に対応するピンインが「ｂｉａｏ」であると決定し、ピンイン「ｂｉａｏ」に対応するピンイン特徴「ｂｉａｏ」を誤字「表」の後ろに追加し、ピンインテキスト「爾表ｂｉａｏ難過」を得て、ピンインテキスト「爾表ｂｉａｏ難過」をテキスト誤り訂正モデルに入力し、テキスト誤り訂正モデルの誤り訂正サブモデルはピンインテキスト「爾表ｂｉａｏ難過」の誤字「表」とピンイン特徴「ｂｉａｏ」を訂正し、誤り訂正済みテキスト「爾不要難過」を得る。

以上より、本開示の実施例のテキスト誤り訂正方法は、誤り訂正対象のテキストと対応するピンインシーケンスをテキスト誤り訂正モデルに入力し、テキスト誤り訂正モデルは、誤り訂正対象のテキストの誤字を検出し、ピンインシーケンスにおける誤字に対応するピンインを決定し、ピンインに対応するピンイン特徴を誤字の後ろに追加して、ピンインテキストを得て、ピンインテキストの誤字とピンイン特徴を訂正して、誤り訂正後の誤り訂正済みテキストを得る。本開示のテキスト誤り訂正方法は、検出された誤字のピンイン特徴を誤字の後ろに接続して誤り訂正を行うことにより、誤り訂正速度が速く、発音情報を考慮したため、誤り訂正結果の精度が高く、可変長誤り訂正を処理することができ、誤り訂正結果の精度をさらに向上させる。

図４は、本開示の第２の実施例に係るテキスト誤り訂正方法のフローチャートである。

図４に示すように、図１に示す実施例に加えて、本開示の実施例のテキスト誤り訂正方法のテキスト誤り訂正モデルは、以下のステップで誤り訂正済みテキストを得ることができる。

上記実施例ステップＳ１０３の「前記誤り訂正対象のテキストの誤字を検出する」というステップは、具体的に、以下のステップＳ４０１－Ｓ４０２を含むことができる。

Ｓ４０１、誤り訂正対象のテキストに対して誤字検出を行い、誤り検出タグ付けシーケンスを得る。

具体的に、テキスト誤り訂正モデルはステップＳ１０１で取得された誤字を検出し、これによって誤り訂正対象のテキストに対応する誤り検出タグ付けシーケンスを得て、例えば、図３では、テキスト誤り訂正モデルの誤り検出サブモデルは、誤り訂正対象のテキスト「爾表難過」に対して誤字検出を行って、誤り検出タグ付けシーケンス「ＫＣＫＫ」を得て、Ｃは修正が必要であることを表し、Ｋは修正が必要ではないことを表す。

Ｓ４０２、誤り検出タグ付けシーケンスに基づいて誤り訂正対象のテキストの誤字を決定する。

具体的に、テキスト誤り訂正モデルは、ステップＳ４０１で取得された誤り訂正対象のテキストの誤り検出タグ付けシーケンスに基づいて、誤り訂正対象のテキストの対応する誤字をさらに決定することができ、例えば、図３では、テキスト誤り訂正モデルは、誤り訂正対象のテキスト「爾表難過」の誤り検出タグ付けシーケンス「ＫＣＫＫ」のＣに対応する「表」という文字を誤字として決定する。

Ｓ４０３、ピンインシーケンスにおける誤字に対応するピンインを決定し、ピンインに対応するピンイン特徴を誤字の後ろに追加して、ピンインテキストを得る。

具体的に、テキスト誤り訂正モデルは、ステップＳ１０２で取得された誤り訂正対象のテキストのピンインシーケンスとステップＳ４０２で取得された誤り訂正対象のテキストの誤字に基づいて、ピンインシーケンスにおける誤字に対応するピンインを決定し、ピンインに対応するピンイン特徴を誤字の後ろに追加し、これによって対応するピンインテキストを得る。具体的なプロセスは、上記ステップＳ１０３の関連説明を参照して、ここでは説明を省略する。

上記実施例のステップＳ１０３の「ピンインテキストの誤字とピンイン特徴を訂正して、誤り訂正済みテキストを得る」というステップは、具体的に以下のステップＳ４０４～Ｓ４０５を含むことができる。

Ｓ４０４、ピンインテキストの誤字とピンイン特徴に対して誤り訂正を行って、候補誤り訂正テキストを得る。

具体的に、テキスト誤り訂正モデルはステップＳ６０３で取得されたピンインテキストの誤字とピンイン特徴に対して誤り訂正を行い、候補誤り訂正テキストを得ることができる。例えば、図３では、テキスト誤り訂正モデルの誤り訂正サブモデルは入力されたピンインテキスト「爾表ｂｉａｏ難過」の誤字「表」とピンイン特徴「ｂｉａｏ」に対して誤り訂正を行い、候補誤り訂正テキスト「爾不不ε要要難過」を得る。

Ｓ４０５、候補誤り訂正テキストに対して重複排除処理を行って、誤り訂正済みテキストを得る。

具体的に、テキスト誤り訂正モデルは、ステップＳ４０４で取得された候補誤り訂正テキストに対して重複排除処理を行い、対応する誤り訂正処理後の誤り訂正済みテキストを得ることができる。例えば、図３では、テキスト誤り訂正モデルは、候補誤り訂正テキスト「爾不不ε要要難過」に対して重複排除処理を行い、誤り訂正済みテキスト「爾不要難過」を得る。

以上より、本開示の実施例のテキスト誤り訂正方法は、誤り訂正対象のテキストと対応するピンインシーケンスをテキスト誤り訂正モデルに入力し、テキスト誤り訂正モデルは、誤り訂正対象のテキストに対して誤字検出を行って誤り検出タグ付けシーケンスを得て、誤り検出タグ付けシーケンスに基づいて誤り訂正対象のテキストの誤字を決定し、ピンインシーケンスにおける誤字に対応するピンインを決定し、ピンインに対応するピンイン特徴を誤字の後ろに追加してピンインテキストを得て、ピンインテキストの誤字とピンイン特徴に対して誤り訂正を行って候補誤り訂正テキストを得て、候補誤り訂正テキストに対して重複排除処理を行って誤り訂正後の誤り訂正済みテキストを得る。本開示のテキスト誤り訂正方法は、検出された誤字のピンイン特徴を誤字の後ろに接続して誤り訂正を行うことにより、誤り訂正速度が速く、発音情報を考慮したため、誤り訂正結果の精度が高く、可変長誤り訂正を処理することができ、誤り訂正結果の精度をさらに向上させる。同時に、誤り訂正対象のテキストに対して誤字検出を行ってピンインシーケンスにおける誤字に対応するピンインを決定して誤り訂正及び重複排除処理を行って誤り訂正後の誤り訂正済みテキストを得ることにより、誤り訂正結果の重複を回避し、誤り訂正速度と誤り訂正結果の精度をさらに向上させる。

図５は、本開示の一実施例によって提供されるテキスト誤り訂正モデルの生成方法のフローチャートである。本開示の実施例のテキスト誤り訂正モデルの生成方法は、本開示の実施例によって提供されるテキスト誤り訂正モデルの生成装置によって実行されることができて、上記実施例のテキスト誤り訂正モデルを生成する。

図５に示すように、本開示の実施例のテキスト誤り訂正モデルの生成方法は、具体的に以下のステップＳ５０１～Ｓ５０４を含むことができる。

Ｓ５０１、サンプルテキスト、サンプルテキストのサンプルピンインシーケンス及びサンプルテキストのターゲットテキストを取得する。

具体的に、サンプルテキスト、サンプルテキストのサンプルピンインシーケンス及びサンプルテキストのターゲットテキストを取得する。サンプルテキストは、トレーニング対象のテキスト誤り訂正モデルをトレーニングするために使用される音声認識された初期テキストであり、サンプルピンインシーケンスはサンプルテキストの各漢字のピンインの組み合わせシーケンスであり、サンプルテキストのターゲットテキストは、サンプルテキストに対応する実際の誤り訂正済みテキストである。サンプルテキストとそれに対応するサンプルピンインシーケンス、ターゲットテキストが複数であってもよい。

Ｓ５０２、サンプルテキストとサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して、サンプル誤り訂正済みテキストを得て、トレーニング対象のテキスト誤り訂正モデルは、サンプルテキストのサンプル誤字を検出し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加して、サンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴を訂正して、サンプル誤り訂正済みテキストを得るステップによってサンプル誤り訂正済みテキストを得る。

具体的に、ステップＳ５０１で取得されたサンプルテキストとサンプルテキストのサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力し、トレーニング対象のテキスト誤り訂正モデルは、まずサンプルテキストのサンプル誤字を検出し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、次に当該サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加して、サンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴を訂正し、これによって誤り訂正後のサンプル誤り訂正済みテキストを得る。

Ｓ５０３、サンプルテキスト、サンプル誤り訂正済みテキスト及びターゲットテキストに基づいて第１の損失値を生成する。

具体的に、ステップＳ５０１で取得されたサンプルテキスト、ステップＳ５０２で取得されたサンプル誤り訂正済みテキスト及びステップＳ５０１で取得されたサンプルテキストのターゲットテキストに基づいて第１の損失値ｌｏｓｓ１を生成し、本開示は損失値の具体的な生成方式をあんまり限定しない。

Ｓ５０４、第１の損失値に基づいてトレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得る。

具体的に、ステップＳ５０３で生成された第１の損失値に基づいて、トレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルのモデルパラメータを最適化し、これによって最適化後のテキスト誤り訂正モデルを得る。本開示の実施例のテキスト誤り訂正モデルの生成方法でテキスト誤り訂正モデルを最適化することにより、テキスト誤り訂正の精度を向上させることができる。

以上より、本開示の実施例のテキスト誤り訂正モデルの生成方法は、サンプルテキストと対応するサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力し、トレーニング対象のテキスト誤り訂正モデルサンプルテキストのサンプル誤字を検出し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加して、サンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴を訂正して、誤り訂正後のサンプル誤り訂正済みテキストを得て、サンプルテキスト、サンプル誤り訂正済みテキスト及びターゲットテキストに基づいて第１の損失値を生成し、第１の損失値に基づいてトレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得る。本開示のテキスト誤り訂正モデルの生成方法は、サンプルテキストとサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して誤り訂正後のサンプル誤り訂正済みテキストを得て、ターゲットテキストとの第１の損失値を生成してトレーニング対象のモデルをトレーニングしてテキスト誤り訂正モデルを得ることにより、誤り訂正速度が速く、発音情報を考慮したため、誤り訂正結果の精度が高く、可変長誤り訂正を処理することができ、誤り訂正結果の精度をさらに向上させ、テキスト誤り訂正モデルのトレーニングをより正確かつ効率的にする。

図６は、本開示の第２の実施例に係るテキスト誤り訂正モデルの生成方法のフローチャートである。

図６に示すように、図５に示される実施例に加えて、本開示の実施例のテキスト誤り訂正モデルの生成方法は、具体的に、以下のステップＳ６０１～Ｓ６０７を含むことができる。

Ｓ６０１、サンプルテキスト、サンプルテキストのサンプルピンインシーケンス及びサンプルテキストのターゲットテキストを取得する。

具体的に、本実施例のステップＳ６０１は上記実施例のステップＳ５０１と同じであり、ここでは説明を省略する。

上記実施例のステップＳ５０２は、具体的に以下のステップＳ６０２を含むことができる。

Ｓ６０２、サンプルテキストとサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力し、トレーニング対象のテキスト誤り訂正モデルはサンプルテキストに対して誤字検出を行って、サンプル誤り検出タグ付けシーケンスを得て、サンプル誤り検出タグ付けシーケンスに基づいてサンプルテキストの誤字を決定し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加して、サンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴に対して誤り訂正を行って、サンプル候補誤り訂正テキストを得て、サンプル候補誤り訂正テキストに対して重複排除処理を行って、サンプル誤り訂正済みテキストを得る。

Ｓ６０３、サンプルテキストのターゲットピンインテキストを取得する。

具体的に、サンプルテキストのターゲットピンインテキストを取得し、サンプルテキストのターゲットピンインテキストが、サンプルテキストに対応する実際のピンインテキストである。

上記実施例のステップＳ５０３は、具体的に、以下のステップＳ６０４～Ｓ６０６を含むことができる。

Ｓ６０４、サンプルテキスト、サンプルピンインテキスト及びターゲットピンインテキストに基づいて第２の損失値を生成する。

具体的に、ステップＳ６０１で取得されたサンプルテキスト、ステップＳ６０２で取得されたサンプルピンインテキスト及びステップＳ６０３で取得されたサンプルテキストのターゲットピンインテキストに基づいて、さらに損失値を計算して、第２の損失値を得ることができる。

Ｓ６０５、ターゲットピンインテキスト、サンプル誤り訂正済みテキスト及びターゲットテキストに基づいて第３の損失値を生成する。

具体的に、ステップＳ６０３で取得されたサンプルテキストのターゲットピンインテキスト、ステップＳ６０２で取得されたサンプル誤り訂正済みテキストとステップＳ６０１で取得されたサンプルテキストのターゲットテキストに基づいて、第３の損失値を生成する。

Ｓ６０６、第２の損失値と第３の損失値に基づいて第１の損失値を生成する。

具体的に、ステップＳ６０４で生成された第２の損失値とステップＳ６０５で生成された第３の損失値に基づいて、さらに損失値を計算して、第１の損失値を得ることができる。

Ｓ６０７、第１の損失値に基づいてトレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得る。

具体的に、本実施例のステップＳ６０７は、上記実施例のステップＳ５０４と同じであり、ここでは説明を省略する。

上記損失値の計算プロセスを明確に説明するために、以下、テキスト誤り訂正モデルの構造を説明する。テキスト誤り訂正モデルの誤り検出サブモデルと誤り訂正サブモデルはいずれも１つのエンコーダと１つのデコーダを含み、２つのサブモデルは１つのエンコーダを共有する。

誤り検出サブモデルは、入力されたサンプルテキストＸのベクトル表現（ｅｗ）に対して符号化Ｅ（エンコーダに対応する）と１つの２クラス分類結果マッピングｆｄｅｔ（デコーダに対応する）を行って２クラス分類結果ｃ’、ｃ’∈｛０，１｝を得る。

ＥはＴｒａｎｓｆｏｒｍｅｒ構造を採用し、ｆ_ｄｅｔは完全接続層である。

当該誤り検出サブモデルに対応する損失値は、第２の損失値であり、サンプルテキストＸからｃ’までのクロスエントロピーとして表すことができる。

誤り訂正サブモデルは、入力されたサンプルピンインテキストＸ_ＣＯＲ＝（ｘ_１’ｘ_２’，…，ｘ_ｔ’）のベクトル表現（ｅ_ｃｏｒ）に対して符号化Ｅ（エンコーダに対応する）と１つの｜Ｖ｜クラス分類マッピングｆ_ｃｏｒ（デコーダに対応する）を行って誤り訂正結果ｙ_ｉ’を得て、ｔ＞ｎ（ｎはサンプルテキストＸの長さである）、ｔ－ｎは追加されたピンイン特徴の個数である。

Ｖ_ｊは辞書のｊ番目の語を表す。

誤り訂正タスクの目的は誤り訂正サブモデルＸ_ｃｏｒをターゲットテキストＹに訂正することであるが、Ｘ_ｃｏｒの長さｔとＹの長さｍとが同じではないため、直接ｔａｇｇｉｎｇタスクで一対一に対応することができないため、ＹをＹ＾（Ｙの上部に「＾」を付したものを明細書中では便宜上「Ｙ＾」と表記する。）に書き換え、Ｙ＾とＸ_ｃｏｒとの長さを同じにする必要があり、その後Ｘ_ｃｏｒからＹ＾までのクロスエントロピーを第３の損失値として最適化する。ＹをＹ＾に書き換えるプロセスは図７に示すように、まずサンプルテキストＸの誤字及びＹのそれに対応する正しい字のピンイン（図７垂直破線の左側に示す）をタグ付け、その後、最長共通サブストリングアルゴリズムに従ってこれらのピンイン特徴（図７の垂直破線の左側の破線矢印に示す）を整列する。Ｘ_ｃｏｒは、Ｘの誤字のピンイン特徴を誤字の後ろに接続することによって得られたものである。図７の垂直破線の右側に示すように、Ｙ＾は、図７の垂直破線の左側のピンイン位置合わせ関係に基づいて得られたものである。

当該誤り訂正サブモデルに対応する損失値は第３の損失値であり、Ｘ_ｃｏｒからＹ＾までのクロスエントロピーとして表すことができる。

テキスト誤り訂正モデルの誤り検出サブモデルと誤り訂正サブモデルは、単独でトレーニングされたものではなく、１つの全体として共同トレーニングされたものであり、誤り訂正モデル共同トレーニング時の損失値は、第１の損失値であり、以下の式で計算して得られる。

以上より、本開示の実施例のテキスト誤り訂正モデルの生成方法は、サンプルテキストと対応するサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力し、トレーニング対象のテキスト誤り訂正モデルは、サンプルテキストのサンプル誤字を検出してサンプル誤り検出タグ付けシーケンスを得て、サンプル誤り検出タグ付けシーケンスに基づいてサンプルテキストの誤字を決定し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加してサンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴に対して誤り訂正を行って、サンプル候補誤り訂正テキストを得て、サンプル候補誤り訂正テキストに対して重複排除処理を行って誤り訂正後のサンプル誤り訂正済みテキストを得て、サンプル誤り訂正済みテキストとターゲットテキストに基づいて第１の損失値を生成し、サンプルテキストのターゲットピンインテキストを取得し、サンプルピンインテキストとターゲットピンインテキストに基づいて第２の損失値を生成し、第１の損失値と第２の損失値に基づいて第３の損失値を生成し、第３の損失値に基づいてトレーニング対象のテキスト誤り訂正モデルをトレーニングし、これによってテキスト誤り訂正モデルを得る。本開示のテキスト誤り訂正モデルの生成方法は、サンプルテキストとサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して誤り訂正後のサンプル誤り訂正済みテキストを得て、ターゲットテキストとの第１の損失値を生成してトレーニング対象のモデルをトレーニングしてテキスト誤り訂正モデルを得ることにより、誤り訂正速度が速く、発音情報を考慮したため、誤り訂正結果の精度が高く、可変長誤り訂正を処理することができ、誤り訂正結果の精度をさらに向上させ、テキスト誤り訂正モデルのトレーニングをより正確かつ効率的にすることもできる。同時に、サンプルテキストに対して誤字検出を行うことにより、ピンインシーケンスにおける誤字に対応するピンインを決定し、誤り訂正と重複排除処理を行って誤り訂正後のサンプル誤り訂正済みテキストを得ることにより、誤り訂正結果の重複を回避し、誤り訂正速度と誤り訂正結果の精度をさらに向上させ、テキスト誤り訂正モデルのトレーニングをより正確かつ効率的にする。

図８は、本開示の第１の実施例に係るテキスト誤り訂正装置のブロック図である。

図８に示すように、本開示の実施例のテキスト誤り訂正装置８００は、第１の取得モジュール８０１、第２の取得モジュール８０２及び第１の誤り訂正モジュール８０３を含む。

第１の取得モジュール８０１は、誤り訂正対象のテキストを取得する。

第２の取得モジュール８０２は、誤り訂正対象のテキストのピンインシーケンスを取得する。

第１の誤り訂正モジュール８０３は、誤り訂正対象のテキストとピンインシーケンスをテキスト誤り訂正モデルに入力して、誤り訂正後の誤り訂正済みテキストを得て、テキスト誤り訂正モデルは、誤り訂正対象のテキストの誤字を検出し、ピンインシーケンスにおける誤字に対応するピンインを決定し、ピンインに対応するピンイン特徴を誤字の後ろに追加して、ピンインテキストを得て、ピンインテキストの誤字とピンイン特徴を訂正して、誤り訂正済みテキストを得るステップによって、誤り訂正済みテキストを得る。

なお、上記テキスト誤り訂正方法の実施例に対する説明は、本開示の実施例のテキスト誤り訂正装置に適用することもでき、具体的なプロセスはここでは説明を省略する。

以上より、本開示の実施例のテキスト誤り訂正装置は、誤り訂正対象のテキストと対応するピンインシーケンスをテキスト誤り訂正モデルに入力し、テキスト誤り訂正モデルは、誤り訂正対象のテキストの誤字を検出し、ピンインシーケンスにおける誤字に対応するピンインを決定し、ピンインに対応するピンイン特徴を誤字の後ろに追加して、ピンインテキストを得て、ピンインテキストの誤字とピンイン特徴を訂正して、誤り訂正後の誤り訂正済みテキストを得る。本開示のテキスト誤り訂正装置は、検出された誤字のピンイン特徴を誤字の後ろに接続して誤り訂正を行うことにより、誤り訂正速度が速く、発音情報を考慮したため、誤り訂正結果の精度が高く、可変長誤り訂正を処理することができ、誤り訂正結果の精度をさらに向上させる。

図９は、本開示の第２の実施例に係るテキスト誤り訂正装置のブロック図である。

図９に示すように、本開示の実施例のテキスト誤り訂正装置９００は、第１の取得モジュール９０１、第２の取得モジュール９０２及び第１の誤り訂正モジュール９０３を含む。

第１の取得モジュール９０１は前の実施例の第１の取得モジュール８０１と同じ構造と機能を有し、第２の取得モジュール９０２は前の実施例の第２の取得モジュール８０２と同じ構造と機能を有し、第１の誤り訂正モジュール９０３は前の実施例の第１の誤り訂正モジュール８０３と同じ構造と機能を有する。

テキスト誤り訂正モデルは、誤り訂正対象のテキストに対して誤字検出を行い、誤り検出タグ付けシーケンスを得て、誤り検出タグ付けシーケンスに基づいて誤り訂正対象のテキストの誤字を決定するステップによって、誤り訂正対象のテキストの誤字を検出する。

テキスト誤り訂正モデルは、ピンインテキストの誤字とピンイン特徴に対して誤り訂正を行って、候補誤り訂正テキストを得て、候補誤り訂正テキストに対して重複排除処理を行って、誤り訂正済みテキストを得るステップによって、ピンインテキストの誤字とピンイン特徴を訂正して、誤り訂正済みテキストを得る。

以上より、本開示の実施例のテキスト誤り訂正装置は、誤り訂正対象のテキストと対応するピンインシーケンスをテキスト誤り訂正モデルに入力し、テキスト誤り訂正モデルは、誤り訂正対象のテキストに対して誤字検出を行って誤り検出タグ付けシーケンスを得て、誤り検出タグ付けシーケンスに基づいて誤り訂正対象のテキストの誤字を決定し、ピンインシーケンスにおける誤字に対応するピンインを決定し、ピンインに対応するピンイン特徴を誤字の後ろに追加してピンインテキストを得て、ピンインテキストの誤字とピンイン特徴に対して誤り訂正を行って候補誤り訂正テキストを得て、候補誤り訂正テキストに対して重複排除処理を行って誤り訂正後の誤り訂正済みテキストを得る。本開示のテキスト誤り訂正装置は、検出された誤字のピンイン特徴を誤字の後ろに接続して誤り訂正を行うことにより、誤り訂正速度が速く、発音情報を考慮したため、誤り訂正結果の精度が高く、可変長誤り訂正を処理することができ、誤り訂正結果の精度をさらに向上させる。同時に、誤り訂正対象のテキストに対して誤字検出を行ってピンインシーケンスにおける誤字に対応するピンインを決定して誤り訂正及び重複排除処理を行って誤り訂正後の誤り訂正済みテキストを得ることにより、誤り訂正結果の重複を回避し、誤り訂正速度と誤り訂正結果の精度をさらに向上させる。

図１０は、本開示の第１の実施例のテキスト誤り訂正モデルの生成装置の概略構成図である。図１０に示すように、本開示の実施例のテキスト誤り訂正モデルの生成装置は、具体的に、第３の取得モジュール１００１、第２の誤り訂正モジュール１００２、第１の生成モジュール１００３及びトレーニングモジュール１００４を含むことができる。

第３の取得モジュール１００１は、サンプルテキスト、サンプルテキストのサンプルピンインシーケンス及びサンプルテキストのターゲットテキストを取得する。

第２の誤り訂正モジュール１００２は、サンプルテキストとサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して、サンプル誤り訂正済みテキストを得て、トレーニング対象のテキスト誤り訂正モデルは、サンプルテキストのサンプル誤字を検出し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加して、サンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴を訂正して、サンプル誤り訂正済みテキストを得るステップによってサンプル誤り訂正済みテキストを得る。

第１の生成モジュール１００３は、サンプルテキスト、サンプル誤り訂正済みテキスト及びターゲットテキストに基づいて第１の損失値を生成する。

トレーニングモジュール１００４は、第１の損失値に基づいてトレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得る。

なお、上記テキスト誤り訂正モデルの生成方法の実施例に対する説明は、本開示の実施例のテキスト誤り訂正モデルの生成装置にも適用され、具体的なプロセスについてここでは説明を省略する。

以上より、本開示の実施例のテキスト誤り訂正モデルの生成装置は、サンプルテキストと対応するサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力し、トレーニング対象のテキスト誤り訂正モデルサンプルテキストのサンプル誤字を検出し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加して、サンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴を訂正して、誤り訂正後のサンプル誤り訂正済みテキストを得て、サンプルテキスト、サンプル誤り訂正済みテキスト及びターゲットテキストに基づいて第１の損失値を生成し、第１の損失値に基づいてトレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得る。本開示のテキスト誤り訂正モデルの生成装置は、サンプルテキストとサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して誤り訂正後のサンプル誤り訂正済みテキストを得て、ターゲットテキストとの第１の損失値を生成してトレーニング対象のモデルをトレーニングしてテキスト誤り訂正モデルを得ることにより、誤り訂正速度が速く、発音情報を考慮したため、誤り訂正結果の精度が高く、可変長誤り訂正を処理することができ、誤り訂正結果の精度をさらに向上させ、テキスト誤り訂正モデルのトレーニングをより正確かつ効率的にする。

図１１は、本開示の第２の実施例のテキスト誤り訂正モデルの生成装置の概略構成図である。図１１に示すように、本開示の実施例のテキスト誤り訂正モデルの生成装置は、具体的に、第３の取得モジュール１１０１、第２の誤り訂正モジュール１１０２、第１の生成モジュール１１０３及びトレーニングモジュール１１０４を含むことができる。

第３の取得モジュール１１０１は前の実施例の第３の取得モジュール１００１と同じ構造と機能を有し、第２の誤り訂正モジュール１１０２は前の実施例の第２の誤り訂正モジュール１００２と同じ構造と機能を有し、第１の生成モジュール１１０３は前の実施例の第１の生成モジュール１００３と同じ構造と機能を有し、トレーニングモジュール１１０４は前の実施例のトレーニングモジュール１００４と同じ構造と機能を有する。

トレーニング対象のテキスト誤り訂正モデルは、サンプルテキストに対して誤字検出を行って、サンプル誤り検出タグ付けシーケンスを得て、サンプル誤り検出タグ付けシーケンスに基づいてサンプルテキストの誤字を決定するステップによってサンプルテキストのサンプル誤字を検出する。

トレーニング対象のテキスト誤り訂正モデルは、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴に対して誤り訂正を行って、サンプル候補誤り訂正テキストを得て、サンプル候補誤り訂正テキストに対して重複排除処理を行って、サンプル誤り訂正済みテキストを得るステップによって、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴を訂正して、サンプル誤り訂正済みテキストを得る。

さらに、テキスト誤り訂正モデルの生成装置１１００は、具体的に、サンプルテキストのターゲットピンインテキストを取得する第４の取得モジュール１１０５をさらに含むことができ、第１の生成モジュール１１０３は、具体的に、サンプルピンインテキストとターゲットピンインテキストに基づいて第２の損失値を生成する第１の生成ユニットと、ターゲットピンインテキスト、サンプル誤り訂正済みテキスト及びターゲットテキストに基づいて第３の損失値を生成する第２の生成ユニットと、第２の損失値と第３の損失値に基づいて第１の損失値を生成する第３の生成ユニットと、を含むことができる。

なお、上記テキスト誤り訂正モデルの生成方法の実施例に対する説明は、本開示の実施例のテキスト誤り訂正モデルの生成装置にも適用され、具体的なプロセスはここでは説明を省略する。

以上より、本開示の実施例のテキスト誤り訂正モデルの生成装置は、サンプルテキストと対応するサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力し、トレーニング対象のテキスト誤り訂正モデルは、サンプルテキストのサンプル誤字を検出してサンプル誤り検出タグ付けシーケンスを得て、サンプル誤り検出タグ付けシーケンスに基づいてサンプルテキストの誤字を決定し、サンプルピンインシーケンスにおけるサンプル誤字に対応するサンプルピンインを決定し、サンプルピンインに対応するサンプルピンイン特徴をサンプル誤字の後ろに追加してサンプルピンインテキストを得て、サンプルピンインテキストのサンプル誤字及びサンプルピンイン特徴に対して誤り訂正を行って、サンプル候補誤り訂正テキストを得て、サンプル候補誤り訂正テキストに対して重複排除処理を行って誤り訂正後のサンプル誤り訂正済みテキストを得て、サンプル誤り訂正済みテキストとターゲットテキストに基づいて第１の損失値を生成し、サンプルテキストのターゲットピンインテキストを取得し、サンプルピンインテキストとターゲットピンインテキストに基づいて第２の損失値を生成し、第１の損失値と第２の損失値に基づいて第３の損失値を生成し、第３の損失値に基づいてトレーニング対象のテキスト誤り訂正モデルをトレーニングし、これによってテキスト誤り訂正モデルを得る。本開示のテキスト誤り訂正モデルの生成装置は、サンプルテキストとサンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して誤り訂正後のサンプル誤り訂正済みテキストを得て、ターゲットテキストとの第１の損失値を生成してトレーニング対象のモデルをトレーニングしてテキスト誤り訂正モデルを得ることにより、誤り訂正速度が速く、発音情報を考慮したため、誤り訂正結果の精度が高く、可変長誤り訂正を処理することができ、誤り訂正結果の精度をさらに向上させ、テキスト誤り訂正モデルのトレーニングをより正確かつ効率的にすることもできる。同時に、サンプルテキストに対して誤字検出を行うことにより、ピンインシーケンスにおける誤字に対応するピンインを決定し、誤り訂正と重複排除処理を行って誤り訂正後のサンプル誤り訂正済みテキストを得ることにより、誤り訂正結果の重複を回避し、誤り訂正速度と誤り訂正結果の精度をさらに向上させ、テキスト誤り訂正モデルのトレーニングをより正確かつ効率的にする。

なお、本開示の技術案では、関連するユーザ個人情報の収集、記憶、使用、加工、伝送、提供、公開などの処理は、いずれも関連法律法規の規定に合致し、かつ公序良俗に違反しない。

本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラムをさらに提供する。

図１２は、本開示の実施例を実行するための例示的な電子機器１２００の概略ブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、および他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、および他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示される部品、それらの接続と関係、およびそれらの機能は、単なる例であり、本明細書の説明および／または求められる本開示の実現を制限することを意図したものではない。

図１２に示すように、電子機器１２００は、読み取り専用メモリ（ＲＯＭ）１２０２に記憶されているコンピュータプログラムまたは記憶ユニット１２０８からランダムアクセスメモリ（ＲＡＭ）１２０３にロードされたコンピュータプログラムに従って様々な適切な動作および処理を実行できる計算ユニット１２０１を含む。ＲＡＭ１２０３には、電子機器１２００の動作に必要な各種のプログラムやデータも記憶されてもよい。計算ユニット１２０１、ＲＯＭ１２０２、およびＲＡＭ１２０３は、バス１２０４を介して互いに接続されておる。パス１２０４には、入力／出力（Ｉ／Ｏ）インターフェース１２０５も接続されている。

電子機器１２００の複数のコンポーネントはＩ／Ｏインターフェース１２０５に接続され、キーボード、マウスなどの入力ユニット１２０６、各タイプのディスプレイ、スピーカなどの出力ユニット１２０７、磁気ディスク、光ディスクなどの記憶ユニット１２０８、およびネットワークカード、モデム、無線通信トランシーバなどの通信ユニット１２０９を含む。通信ユニット１２０９は、電子機器１２００が、インターネットなどのコンピュータネットワークおよび／または各種の電信ネットワークを介して他のデバイスと情報／データを交換することを可能にする。

計算ユニット１２０１は、処理および計算能力を有する様々な汎用および／または専用の処理コンポーネントであってもよい。計算ユニット１２０１のいくつかの例は、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、各種の専用の人工知能（ＡＩ）計算チップ、各種のマシン運転学習モデルアルゴリズムの計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、およびいずれかの適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット１２０１は、前文に記載の各方法および処理、例えば、図１～図４に示すテキスト誤り訂正方法または図５～図７に示すテキスト誤り訂正モデルの生成方法を実行する。例えば、いくつかの実施例では、テキスト誤り訂正方法またはテキスト誤り訂正モデルの生成方法を、記憶ユニット１２０８などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。いくつかの実施例では、コンピュータプログラムの一部または全部はＲＯＭ１２０２および／または通信ユニット１２０９を介して電子機器１２００にロードおよび／またはインストールされてもよい。コンピュータプログラムがＲＡＭ１２０３にロードされ、計算ユニット１２０１によって実行される場合、前文に記載のテキスト誤り訂正方法またはテキスト誤り訂正モデルの生成方法の１つまたは複数のステップが実行されてもよい。代替的に、他の実施例では、計算ユニット１２０１はテキスト誤り訂正方法またはテキスト誤り訂正モデルの生成方法を実行するように、他のいずれかの適切な方式（例えば、ファームウェアを介して）によって構成されてもよい。

本明細書で上記記載されたシステムと技術の様々な実施方式は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックス・プログラマブル・ロジック・デバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、および／又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラム可能なシステムで実行および／または解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、および少なくとも１つの出力装置からデータおよび命令を受信し、データおよび命令を当該ストレージシステム、当該少なくとも１つの入力装置、および当該少なくとも１つの出力装置に伝送することができる。

本開示の方法を実行するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせで書くことができる。これらのプログラムコードは、プロセッサ又はコントローラによって実行された際に、フローチャートおよび／またはブロック図に規定された機能／操作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルテキスト誤り訂正装置のプロセッサ又はコントローラに提供されてもよい。プログラムコードは、完全に機械上で実行されるか、部分的に機械上で実行されるか、スタンドアロンソフトウェアパッケージとして、部分的に機械上で実行され、部分的にリモート機械上で実行され又は完全にリモート機械又はサーバ上で実行されてもよい。

本開示のコンテクストでは、機械読み取り可能な媒体は、命令実行システム、装置、またはデバイスによって使用されるために、又は命令実行システム、装置、またはデバイスと組み合わせて使用するためのプログラムを含むか、又は記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体または機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体システム、装置又はデバイス、または上記コンテンツの任意の適切な組み合わせを含むことができるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、１つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリーメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスクリードオンリーメモリ（ＣＤ－ＲＯＭ）、光学記憶装置、磁気記憶装置、または上記コンテンツのいずれかの適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、ここで説明されるシステムおよび技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボードおよびポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボードおよび当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、ビジョンフィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力、または、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステムおよび技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインターフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインターフェース又は当該ウェブブラウザによってここで説明されるシステムおよび技術の実施形態とインタラクションできる）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントのいずれかの組み合わせを含むコンピューティングシステムで実行することができる。任意の形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、ブロックチェーンネットワークを含む。

コンピュータシステムは、クライアントとサーバを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント－サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよく、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムにおける１つのホスト製品であり、従来の物理ホストとＶＰＳサービス（「ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ」，または「ＶＰＳ」と省略する）に存在する管理の難しさ、ビジネス拡張性の弱いという欠陥を解決した。サーバは分散システムのサーバであってもよく、ブロックチェーンを組み込んだサーバであってもよい。

本開示の実施例によれば、本開示はコンピュータプログラムをさらに提供し、コンピュータプログラムはプロセッサによって実行される場合、本開示の上記実施例に示されるテキスト誤り訂正方法のステップまたはテキスト誤り訂正モデルの生成方法のステップを実現する。

なお、上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができると理解されたい。例えば、本開示に記載の各ステップは、並列に実行されてもよいし、順次実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。

上記具体的な実施形態は、本開示の保護範囲を制限するものではない。当業者は、設計要件と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができると理解されたい。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれなければならない。

Claims

誤り訂正対象のテキストを取得するステップと、
前記誤り訂正対象のテキストのピンインシーケンスを取得するステップと、
前記誤り訂正対象のテキストと前記ピンインシーケンスをテキスト誤り訂正モデルに入力して、誤り訂正後の誤り訂正済みテキストを得るステップであって、前記テキスト誤り訂正モデルが、前記誤り訂正対象のテキストの誤字を検出し、前記ピンインシーケンスにおける前記誤字に対応するピンインを決定し、前記ピンインに対応するピンイン特徴を前記誤字の後ろに追加して、ピンインテキストを得て、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得るステップによって前記誤り訂正済みテキストを得るステップと、
を含むテキスト誤り訂正方法。
前記テキスト誤り訂正モデルが、
前記誤り訂正対象のテキストに対して誤字検出を行って、誤り検出タグ付けシーケンスを得て、
前記誤り検出タグ付けシーケンスに基づいて前記誤り訂正対象のテキストにおける前記誤字を決定するステップによって、前記誤り訂正対象のテキストにおける前記誤字を検出する請求項１に記載のテキスト誤り訂正方法。
前記テキスト誤り訂正モデルが、
前記ピンインテキストの前記誤字及び前記ピンイン特徴に対して誤り訂正を行って、候補誤り訂正テキストを得て、
前記候補誤り訂正テキストに対して重複排除処理を行って、前記誤り訂正済みテキストを得るステップによって、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得る請求項１に記載のテキスト誤り訂正方法。
サンプルテキスト、前記サンプルテキストのサンプルピンインシーケンス及び前記サンプルテキストのターゲットテキストを取得するステップと、
前記サンプルテキストと前記サンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して、サンプル誤り訂正済みテキストを得るステップであって、前記トレーニング対象のテキスト誤り訂正モデルは、前記サンプルテキストのサンプル誤字を検出し、前記サンプルピンインシーケンスにおける前記サンプル誤字に対応するサンプルピンインを決定し、前記サンプルピンインに対応するサンプルピンイン特徴を前記サンプル誤字の後ろに追加して、サンプルピンインテキストを得て、前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴を訂正して、前記サンプル誤り訂正済みテキストを得るステップによって前記サンプル誤り訂正済みテキストを得るステップと、
前記サンプルテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第１の損失値を生成するステップと、
前記第１の損失値に基づいて前記トレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得るステップと、
を含む、テキスト誤り訂正モデルの生成方法。
前記トレーニング対象のテキスト誤り訂正モデルが、
前記サンプルテキストに対して誤字検出を行って、サンプル誤り検出タグ付けシーケンスを得て
前記サンプル誤り検出タグ付けシーケンスに基づいて前記サンプルテキストにおける前記誤字を決定するステップによって、前記サンプルテキストの前記サンプル誤字を検出する請求項４に記載の生成方法。
前記トレーニング対象のテキスト誤り訂正モデルが、
前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴に対して誤り訂正を行って、サンプル候補誤り訂正テキストを得て、
前記サンプル候補誤り訂正テキストに対して重複排除処理を行って、前記サンプル誤り訂正済みテキストを得るステップによって、前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴を訂正して、前記サンプル誤り訂正済みテキストを得る請求項４に記載の生成方法。
前記サンプルテキストのターゲットピンインテキストを取得するステップを含み、
前記サンプルテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第１の損失値を生成するステップが、
前記サンプルテキスト、前記サンプルピンインテキスト及び前記ターゲットピンインテキストに基づいて第２の損失値を生成するステップと、
前記ターゲットピンインテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第３の損失値を生成するステップと、
前記第２の損失値と前記第３の損失値に基づいて前記第１の損失値を生成するステップと、
を含む請求項４に記載の生成方法。
誤り訂正対象のテキストを取得する第１の取得モジュールと、
前記誤り訂正対象のテキストのピンインシーケンスを取得する第２の取得モジュールと、
前記誤り訂正対象のテキストと前記ピンインシーケンスをテキスト誤り訂正モデルに入力して、誤り訂正後の誤り訂正済みテキストを得る第１の誤り訂正モジュールであって、前記テキスト誤り訂正モデルは、前記誤り訂正対象のテキストの誤字を検出し、前記ピンインシーケンスにおける前記誤字に対応するピンインを決定し、前記ピンインに対応するピンイン特徴を前記誤字の後ろに追加して、ピンインテキストを得て、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得るステップによって、前記誤り訂正済みテキストを得る第１の誤り訂正モジュールと、
を備えるテキスト誤り訂正装置。
前記テキスト誤り訂正モデルが、
前記誤り訂正対象のテキストに対して誤字検出を行って、誤り検出タグ付けシーケンスを得て、
前記誤り検出タグ付けシーケンスに基づいて前記誤り訂正対象のテキストにおける前記誤字を決定するステップによって、前記誤り訂正対象のテキストにおける前記誤字を検出する請求項８に記載のテキスト誤り訂正装置。
前記テキスト誤り訂正モデルが、
前記ピンインテキストの前記誤字及び前記ピンイン特徴に対して誤り訂正を行って、候補誤り訂正テキストを得て、
前記候補誤り訂正テキストに対して重複排除処理を行って、前記誤り訂正済みテキストを得るステップによって、前記ピンインテキストの前記誤字及び前記ピンイン特徴を訂正して、前記誤り訂正済みテキストを得る請求項８に記載のテキスト誤り訂正装置。
サンプルテキスト、前記サンプルテキストのサンプルピンインシーケンス及び前記サンプルテキストのターゲットテキストを取得する第３の取得モジュールと、
前記サンプルテキストと前記サンプルピンインシーケンスをトレーニング対象のテキスト誤り訂正モデルに入力して、サンプル誤り訂正済みテキストを得る第２の誤り訂正モジュールであって、前記トレーニング対象のテキスト誤り訂正モデルは、前記サンプルテキストのサンプル誤字を検出し、前記サンプルピンインシーケンスにおける前記サンプル誤字に対応するサンプルピンインを決定し、前記サンプルピンインに対応するサンプルピンイン特徴を前記サンプル誤字の後ろに追加して、サンプルピンインテキストを得て、前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴を訂正して、前記サンプル誤り訂正済みテキストをステップによって前記サンプル誤り訂正済みテキストを得る第２の誤り訂正モジュールと、
前記サンプルテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第１の損失値を生成する第１の生成モジュールと、
前記第１の損失値に基づいて前記トレーニング対象のテキスト誤り訂正モデルをトレーニングして、テキスト誤り訂正モデルを得るトレーニングモジュールと、
を備える、テキスト誤り訂正モデルの生成装置。
前記トレーニング対象のテキスト誤り訂正モデルが、
前記サンプルテキストに対して誤字検出を行って、サンプル誤り検出タグ付けシーケンスを得て、
前記サンプル誤り検出タグ付けシーケンスに基づいて前記サンプルテキストにおける前記誤字を決定するステップによって前記サンプルテキストの前記サンプル誤字を検出する請求項１１に記載の生成装置。
前記トレーニング対象のテキスト誤り訂正モデルが、
前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴に対して誤り訂正を行って、サンプル候補誤り訂正テキストを得て、
前記サンプル候補誤り訂正テキストに対して重複排除処理を行って、前記サンプル誤り訂正済みテキストを得るステップによって、前記サンプルピンインテキストの前記サンプル誤字と前記サンプルピンイン特徴を訂正して、前記サンプル誤り訂正済みテキストを得る請求項１１に記載の生成装置。
前記サンプルテキストのターゲットピンインテキストを取得する第４の取得モジュールを備え、
第１の生成モジュールが、
前記サンプルピンインテキストと前記ターゲットピンインテキストに基づいて第２の損失値を生成する第１の生成ユニットと、
前記ターゲットピンインテキスト、前記サンプル誤り訂正済みテキスト及び前記ターゲットテキストに基づいて第３の損失値を生成する第２の生成ユニットと、
前記第２の損失値と第３の損失値に基づいて前記第１の損失値を生成する第３の生成ユニットと、
を備える請求項１１に記載の生成装置。
少なくとも１つのプロセッサと、
該少なくとも１つのプロセッサと通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令が、前記少なくとも１つのプロセッサが請求項１から３のいずれか一項に記載の方法、または、請求項４から７のいずれか一項に記載の方法を実行できるように、前記少なくとも１つのプロセッサによって実行される電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令が、前記コンピュータに請求項１から３のいずれか一項に記載の方法、または請求項４から７のいずれか一項に記載の方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。
プロセッサによって実行される場合、請求項１から３のいずれか一項に記載の方法のステップ、または、請求項４から７のいずれか一項に記載の方法のステップを実現するコンピュータプログラム。