JP2020187726A

JP2020187726A - テキスト処理方法、テキスト処理装置、テキスト処理デバイス及び記憶媒体

Info

Publication number: JP2020187726A
Application number: JP2019236686A
Authority: JP
Inventors: シーホングオ; Xihong Guo; シンユグオ; xin yu Guo; アンシンリー; Anxin Li; ランチン; Lan Chen
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2019-05-09
Filing date: 2019-12-26
Publication date: 2020-11-19
Also published as: CN112000797A

Abstract

【課題】ニューラルネットワークに基づくテキスト処理システムのパフォーマンスを向上するテキスト処理装置及びコンピュータ読取可能な記憶媒体を提供する。【解決手段】方法は、入力テキストを取得することと、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して入力テキストの構成文を処理し、異なる処理方法に対応する複数の前処理結果を取得することと、複数の前処理結果に基づいて、テキスト処理結果を生成することと、複数の前処理結果の複数の信頼度を決定し、複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることと、を含む。【選択図】図１

Description

本出願は、ニューラルネットワークに基づくテキスト処理分野に関し、特に、ニューラルネットワークに基づくテキスト処理方法、ニューラルネットワークに基づくテキスト処理デバイス、ニューラルネットワークに基づくテキスト処理装置、及びコンピュータ読取可能な記憶媒体に関する。

深層ニューラルネットワークは、大規模なマルチパラメーター最適化ツールである。深層ニューラルネットワークは、大量のトレーニングデータによって、まとめ難い隠された特徴をデータから学習できるため、顔検出、画像セマンティックセグメンテーション、テキスト要約抽出、物体検出、モーショントラッキング、自然言語翻訳などの複数の複雑なタスクを完了できる。

テキスト要約抽出とは、明確な意味を持つテキスト内容を高レベルで概括化／抽象化してテキスト要約を生成することを意味する。従来のテキスト要約抽出方法は、テキストの具体的な内容（表現の意味、文の構造、修辞技法、物語スタイルなど）に大きく依存している。したがって、異なるテキスト（異なる長さのテキストなど）に異なるテキスト要約抽出方法が適用されるとき、パフォーマンスが異なる。例えば、一部のテキスト要約抽出方法は、長いテキストに対して理想的な要約抽出結果を取得できるが、比較的短いテキストに対して理想的な抽出を達成することは困難である一方、他のテキスト要約抽出方法によれば、逆の処理パフォーマンスが示される。複数のテキスト要約抽出方法を採用する場合、要約を抽出するときにあるテキスト要約抽出方法の重みが大きすぎ、他のテキスト要約抽出方法の重みが小さすぎるという問題もあり、よって複数のテキスト要約抽出方法を融合した後の重みがテキストの具体的な内容に大きく依存してしまうため、システムの汎用的なパフォーマンスが低下することに繋がる。

上記の問題に鑑みて、本開示は、テキスト処理方法、テキスト処理装置、テキスト処理デバイス、及びコンピュータ読取可能な記憶媒体を提供する。

本開示の一態様によれば、ニューラルネットワークに基づくテキスト処理方法が提供される。前記方法は、入力テキストを取得することと、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得することと、前記複数の前処理結果に基づいてテキスト処理結果を生成することと、前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることと、を含む。

本開示の一態様によれば、情報エントロピーによって、前記複数の前処理結果の複数の信頼度を決定する。

本開示の一態様によれば、前記複数の信頼度を利用してテキスト処理結果を校正し、校正されたテキスト処理結果を得ることは、前記複数の信頼度を利用してテキスト処理結果をそれぞれ処理して複数の中間校正係数を得ることと、前記複数の中間校正係数を前記テキスト処理結果に加算して、校正されたテキスト処理結果を得ることと、を含む。

本開示の一態様によれば、前記複数の信頼度を利用して前記テキスト処理結果をそれぞれ処理して複数の中間校正係数を得ることは、前記複数の信頼度を利用して、前記複数の前処理結果に対応する複数の校正率を取得し、前記対応する複数の校正率をそれぞれ前記テキスト処理結果に乗算して、複数の中間校正係数を取得することを含む。

本開示の一態様によれば、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を得ることは、前記複数の異なる処理方法のそれぞれを利用して前記入力テキストのすべての構成文を処理し、前記複数の異なる処理方法のそれぞれに対応する、すべての構成文のそれぞれの予測文の重みを前記複数の前処理結果として取得することを含む。

本開示の一態様によれば、前記複数の前処理結果に基づいてテキスト処理結果を生成することは、前記複数の異なる処理方法を利用して前記入力テキストのすべての構成文を分析し、すべての構成文のそれぞれの出力文の重みをテキスト処理結果として取得することを含む。

本開示の他の一態様によれば、ニューラルネットワークに基づくテキスト処理装置が提供される。前記装置は、入力テキストを取得する入力テキスト取得ユニットと、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得する前処理結果取得ユニットと、前記複数の前処理結果に基づいてテキスト処理結果を生成する生成ユニットと、前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得る校正ユニットと、を備える。

本開示の一態様によれば、前記校正ユニットは、情報エントロピーによって、前記複数の前処理結果の複数の信頼度を決定する。

本開示の一態様によれば、前記校正ユニットは、前記複数の信頼度を利用して前記テキスト処理結果をそれぞれ処理して複数の中間校正係数を取得し、前記複数の中間校正係数を前記テキスト処理結果に加算して、校正されたテキスト処理結果を得る。

本開示の一態様によれば、前記校正ユニットは、前記複数の信頼度を利用して前記複数の前処理結果に対応する複数の校正率を取得し、前記対応する複数の校正率をそれぞれ前記テキスト処理結果と乗算して、前記複数の中間校正係数を取得する。

本開示の一態様によれば、前記前処理結果取得ユニットは、前記複数の異なる処理方法のそれぞれを利用して前記入力テキストのすべての構成文を処理し、前記複数の異なる処理のそれぞれに対応する、全ての構成文のそれぞれの予測文の重みを前記複数の前処理結果として取得する。

本開示の一態様によれば、前記生成ユニットは、前記複数の異なる処理方法を利用して前記入力テキストの全ての構成文を分析し、全ての構成文のそれぞれの出力文の重みをテキスト処理結果として取得する。

本開示の他の一態様によれば、ニューラルネットワークに基づくテキスト処理デバイスが提供される。前記テキスト処理デバイスは、プロセッサと、コンピュータ読取可能なプログラム命令を格納したメモリとを備える。前記コンピュータ読取可能なプログラム命令が前記プロセッサによって実行されるとき、ニューラルネットワークに基づくテキスト処理方法が実行される。前記方法は、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の処理方法を取得することと、前記複数の前処理結果に基づいて、テキスト処理結果を生成することと、前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることと、を含む。

本開示の他の一態様によれば、コンピュータ読取可能な命令を格納したコンピュータ読取可能な記憶媒体が提供される。前記コンピュータ読取可能な命令がコンピュータによって実行されるとき、前記コンピュータにニューラルネットワークに基づくテキスト処理方法を実行させる。前記方法は、入力テキストを取得することと、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得することと、前記複数の前処理結果に基づいて、テキスト処理結果を生成することと、前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることと、を含む。

本開示の上記の態様では、ニューラルネットワークをテキスト処理に適用し、ニューラルネットワークの前処理結果を利用してニューラルネットワークのテキスト処理結果を校正することにより、ニューラルネットワーク内のあるテキスト抽出方法の重みが過度に支配的になることを避けるように制御できるため、システムの汎用的なパフォーマンスが向上される。

図面を参照しながら本開示の実施例をさらに詳細に説明することにより、本開示の上記及び他の目的、特徴及び利点は、より明らかになるであろう。図面は、本発明の実施例のさらなる理解を提供することを意図し、明細書の一部となり、本開示の実施例とともに本開示に対する解釈に用いられ、本開示に対する制限ではない。図面において、同じ参照番号は常に同じ部品またはステップを指す。

本開示の実施例に係るテキスト処理方法のフローチャートである。本開示の実施例に係る処理結果を校正する方法のフローチャートである。本開示の実施例に係る処理結果を校正する模式図である。本開示の実施例に係る中間校正係数を利用してテキスト処理結果を校正する模式図である。本開示の実施例に係るテキスト処理装置の模式図である。本開示の実施例に係るテキスト処理デバイスの模式図である。本開示の実施例に係るコンピュータ読取可能な記憶媒体の模式図である。

本開示の実施例に係る技術的解決策は、以下、本開示の実施例における図面と併せて明確かつ完全に説明する。説明する実施例は、本開示の実施例の一部に過ぎず、すべてではないことは明らかである。創造的な作業なしに本開示の実施例に基づいて当業者によって得られる他のすべての実施例は、いずれも本開示の範囲内に属す。

本開示は、ニューラルネットワークをテキスト処理に適用する。異なるテキスト処理方法をトレーニングすることにより、異なるテキスト内容に対する異なるテキスト処理方法の依存性を減らし処理の複雑さを軽減しながら、所望のテキストを効率的かつ正確に抽出することが可能になる。ただし、複数のテキスト処理方法を採用する場合、要約を抽出するときにあるテキスト処理方法の重みが大きすぎ、他のテキスト処理方法の重みが小さすぎるという問題が生じる可能性があり、よって複数のテキスト処理方法を融合した後の重みは、テキストの具体的な内容に大きく依存してしまうため、システムの汎用的なパフォーマンスが低下することに繋がる。

したがって、本願は、ニューラルネットワークの前処理結果を利用してニューラルネットワークのテキスト処理結果を正規化（ｒｅｇｕｌａｒｉｚａｔｉｏｎ）校正することにより、ニューラルネットワーク内のあるテキスト処理方法の重みが過度に支配的になることを避けるように制御できるため、システムの汎用的なパフォーマンスが向上される。

まず、図１を参照して、本開示の実施例を実現するためのテキスト処理方法１００について説明する。図１に示すように、ステップＳ１０１では、入力テキストを取得する。

当該入力テキストは、処理すべき元のテキストであり、当該元のテキストから、希望する単語の数または文の数の要約が生成される。

ステップＳ１０２では、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得する。具体的には、前記複数の異なる処理方法のそれぞれを利用して入力テキストのすべての構成文を処理し、複数の異なる処理方法のそれぞれに対応する、全ての構成文のそれぞれの予測文の重みを前記複数の前処理結果として取得する。

現在、複数の異なるテキスト処理方法がある。例えば、テキスト要約の抽出には、位置方法、フレーズ方法、タイトル方法、キーワード方法などの複数の方法がある。このステップＳ１０２では、異なる処理方法を利用して入力テキストを分析し、複数の前処理結果を得る。例えば、各テキスト処理方法に異なる重みを割り当て、各テキスト処理方法によって構成文を分析して、各テキスト処理方法に対応する各文の重みを取得することにより、複数の異なる処理方法に対応する複数の前処理結果を得ることができる。

例えば、Ｍ種類の異なる処理方法（例えば処理方法１、処理方法２、……処理方法Ｍなど）があると仮定すると、異なる処理方法に、ランダムに異なる重みが割り当てられてもよく、所定のルールに従って異なる重みが割り当てられてもよい。例えば、処理方法１に重みＷ１が割り当てられ、処理方法２に重みＷ２が割り当てられ、処理方法Ｍに重みＷＭが割り当てられる。

さらに、異なる処理方法では、各処理方法は各構成文に異なる重みを割り当て、当該割り当ては、異なる文の特性に対する異なる処理方法の依存性を分析することによって得ることができる。例えば、入力テキストにＰ個の構成文が含まれていると仮定すると、処理方法１では、各文に割り当てられる重みが｛Ｗ１１、Ｗ１２、Ｗ１３．．．Ｗ１Ｐ｝であり、処理方法２では、各文に割り当てられる重みが｛Ｗ２１、Ｗ２２、Ｗ２３．．．Ｗ２Ｐ｝であり、処理方法Ｍでは、各文に割り当てられる重みが｛ＷＭ１、ＷＭ２、ＷＭ３．．．ＷＭＰ｝であり、その他も類推する。そして、当該異なる処理方法におけるすべての構成文のそれぞれの構成文の重みを複数の前処理結果とする。

代わりに、各テキスト処理方法に同じ重みを割り当ててもよい。そして、各テキスト処理方法によって構成文を分析して各テキスト処理方法に対応する各文の重みを取得することにより、複数の異なる処理方法に対応する複数の前処理結果が得られる。

異なる処理方法に対応する複数の前処理結果を取得した後、ステップＳ１０３では、前記複数の前処理結果に基づいてテキスト処理結果を生成する。ここで、複数の異なる処理方法を利用して前記入力テキストのすべての構成文を分析し、すべての構成文のそれぞれの出力文の重みをテキスト処理結果として得ることができる。

複数の前処理結果及びテキスト処理結果を取得した後、次にステップＳ１０４では、前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得る。

例えば、情報エントロピーによって、複数の前処理結果の複数の信頼度を決定することができる。

例えば、第Ｕ種類の前処理結果がＵ_１，Ｕ_２，・・・Ｕ_ｉ，・・・Ｕ_ｎ個の取り得る値があり、これらが入力テキストのすべての構成文のそれぞれの予測文の重みに対応し、対応する確率がそれぞれｐ_１，ｐ₂，・・・ｐ_ｉ，・・・ｐ_ｎであると仮定すると、第Ｕ種類の前処理結果の信頼度Ｈ（Ｕ）は、次の式で表すことができる。

但し、Ｅ（）は平均化することを意味する。

したがって、第Ｕ種類の前処理結果の信頼度Ｈ（Ｕ）が得られる。同様に、同じ方法に基づいて、他の複数の前処理結果の信頼度を取得することができる。上記の信頼度を決定する方法はこれに限定されず、他の適切な方法を採用して信頼度を決定することもできることを理解されたい。

前記複数の前処理結果の複数の信頼度を決定した後、次に前記複数の信頼度を利用してテキスト処理結果を校正し、校正されたテキスト処理結果を得る。

図２は、本開示の実施例に係る処理結果を校正する方法のフローチャートである。図２に示すように、ステップＳ２０１では、前記複数の信頼度を利用して前記テキスト処理結果をそれぞれ処理して複数の中間校正係数を得る。ステップＳ２０２では、前記複数の中間校正係数を前記テキスト処理結果に加算して、校正されたテキスト処理結果を得る。

ここで、中間校正係数は、以下のように得られることができる。前記複数の信頼度を利用して前記複数の前処理結果に対応する複数の校正率を取得し、前記対応する複数の校正率をそれぞれ前記テキスト処理結果に乗算することにより、前記複数の中間校正係数を取得する。

以下、図３を参照して本開示の実施例に係る処理結果を校正する方法について説明する。図３に示すように、まず、入力テキスト３１を取得し（入力テキストには５つの構成文を含むと仮定する）、次に、入力テキストをニューラルネットワーク３２に入力し、当該ニューラルネットワークは複数の異なる処理方法（例えば図３に示す処理方法１、処理方法２、処理方法３など）を含むことができる。当該ニューラルネットワーク３２では、複数の異なる処理方法を利用して入力テキスト３１の構成文を処理し、前記異なる処理方法に対応する複数の前処理結果３４を取得することができ、さらに、複数の前処理結果３４に基づいて、テキスト処理結果３５を生成することができる。複数の前処理結果３４のうちの１つは、図３の｛０．１、０．５、０．３、０．１、０．２｝（図では３６で示される）であり、当該前処理結果３６は、入力テキスト３１の５つの構成文のそれぞれの予測文の重みに対応すると仮定し、同時に、テキスト処理結果３５は、図３の｛０．７、０．３、０．１、０．４、０．１｝（図では４０で示される）であると仮定すると、次の方法でテキスト処理結果４０を校正することができる。最初に、前処理結果３６から最大の２つの値を選択し、それらを１として符号化し、他の前処理結果を０として符号化し、対応する符号化値｛０、１、１、０、０｝（図では３８で示される）を得る。その後、例えば情報エントロピー３６によって、前処理結果３６の信頼度３７を決定し、情報エントロピーによって決定された前処理結果３６の信頼度が０．３であると仮定する。次に、信頼度３７にエンコード値３８を乗算して、信頼度の校正された符号化係数｛０、０．３、０．３、０、０｝を校正率として得る（図では３９で示される）。次に、得られた校正率３９にテキスト処理結果４０を乗算して、中間校正係数｛０、０．０９、０．０３、０、０｝（図では４１で示される）が得られ、前処理結果３６をテキスト処理結果４０と同じレベルに引きずるように校正する。中間校正係数４１を得た後、中間校正係数４１をテキスト処理結果４０に加算して、校正されたテキスト処理結果｛０．７、０．３９、０．１３、０．４、０．１｝（図中４３で示される）を得る。

図３は、前処理結果を利用してテキスト処理結果を校正し、校正されたテキスト処理結果を得ることを示す模式図であることを理解されたい。同様に、他の複数の前処理結果について、同じ方法でテキスト処理結果を校正し、校正されたテキスト処理結果を得ることができる。例えば、他の前処理結果に対応する信頼度を利用して他の中間校正係数を得て、その後、すべての前処理結果によって得られた中間校正係数をテキスト処理結果に加算して、最終的に校正されたテキスト処理結果を得ることができる。

中間校正係数を利用してテキスト処理結果を校正する模式図を図４に示す。図４に示すように、図３に示す方法で各前処理結果に対応する各中間校正係数４６を得た後、すべての中間校正係数４６をテキスト処理結果４５に加算して、校正されたテキスト処理結果４７を得る。

ニューラルネットワークによる前処理結果を利用してニューラルネットワークによるテキスト処理結果を校正することにより、ニューラルネットワーク内のあるテキスト抽出方法の重みが過度に支配的になることを避けるように制御できるため、システムの汎用的なパフォーマンスが向上される。

以下、図５を参照し、本開示の実施例に係るテキスト処理装置１０００について説明する。図５は、本開示の実施例に係るテキスト処理装置１０００の模式図である。本実施例に係るテキスト処理装置の機能は、図１を参照して説明した方法の詳細と同じであるため、便宜上、同じ内容についての詳細な説明はここでは省略する。

図５に示すように、本開示の実施例に係るテキスト処理装置１０００は、入力テキスト取得ユニット１００１、前処理結果取得ユニット１００２、生成ユニット１００３、及び校正ユニット１００４を備える。テキスト処理装置１０００は、図５において４つのユニットのみを備えるように示されているが、これは単なる例示であり、テキスト処理装置１０００は、１つ以上の他のユニットを備えることもできることに留意されたい。これらのユニットは本発明の思想と関係がないため、ここでは省略する。

入力テキスト取得ユニット１００１は、入力テキストを取得する。

前処理結果取得ユニット１００２は、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得する。具体的には、前記複数の異なる処理方法のそれぞれを利用して入力テキストのすべての構成文を処理し、複数の異なる処理方法のそれぞれに対応する、全ての構成文のそれぞれの予測文の重みを前記複数の前処理結果として取得する。

現在、複数の異なるテキスト処理方法がある。例えば、テキスト要約の抽出には、位置方法、フレーズ方法、タイトル方法、キーワード方法などの複数の方法がある。前処理結果取得ユニット１００２は、異なる処理方法を利用して入力テキストを分析し、複数の前処理結果を得る。例えば、前処理結果取得ユニット１００２は、各テキスト処理方法に異なる重みを割り当て、各テキスト処理方法によって構成文を分析して各テキスト処理方法に対応する各文の重みを取得し、複数の異なる処理方法に対応する複数の前処理結果を得ることができる。

例えば、Ｍ種類の異なる処理方法（例えば処理方法１、処理方法２、……処理方法Ｍなど）があると仮定すると、前処理結果取得ユニット１００２は、異なる処理方法に、異なる重みをランダムに割り当ててもよいし、所定の規則に従って異なる重みを割り当ててもよい。例えば、処理方法１に重みＷ１が割り当てられ、処理方法２に重みＷ２が割り当てられ、処理方法Ｍに重みＷＭが割り当てられる。

さらに、異なる処理方法では、各処理方法は各構成文に異なる重みを割り当て、当該割り当ては、異なる文の特性に対する異なる処理方法の依存性を分析することによって得られることができる。例えば、入力テキストにＰ個の構成文が含まれていると仮定すると、処理方法１では、各文に割り当てられる重みが｛Ｗ１１、Ｗ１２、Ｗ１３．．．Ｗ１Ｐ｝であり、処理方法２では、各文に割り当てられる重みが｛Ｗ２１、Ｗ２２、Ｗ２３．．．Ｗ２Ｐ｝であり、処理方法Ｍでは、各文に割り当てられる重みが｛ＷＭ１、ＷＭ２、ＷＭ３．．．ＷＭＰ｝であり、その他も類推できる。そして、異なる処理方法におけるすべての構成文の各文の重みを複数の前処理結果とする。

前処理結果取得ユニット１００２が異なる処理方法に対応する複数の前処理結果を取得した後、生成ユニット１００３は、前記複数の前処理結果に基づいて、テキスト処理結果を生成する。ここで、生成ユニット１００３は、前記複数の異なる処理方法を利用して前記入力テキストの全ての構成文を分析し、全ての構成文のそれぞれの出力文の重みをテキスト処理結果として取得することができる。

複数の前処理結果及びテキスト処理結果を取得した後、次に、校正ユニット１００４は、前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を取得する。

例えば、第Ｕ種類の前処理結果がＵ_１，Ｕ_２，・・・Ｕ_ｉ，・・・Ｕ_ｎ個の取り得る値があり、これらが入力テキストのすべての構成文のそれぞれの予測文の重みに対応し、対応する確率がそれぞれｐ_１，ｐ₂，・・・ｐ_ｉ，・・・ｐ_ｎであると仮定すると、第Ｕ種類の前処理結果の信頼度Ｈ（Ｕ）は次の式で表すことができる。

但し、Ｅ（）は平均化することを意味する。

校正ユニット１００４は、前記複数の前処理結果の複数の信頼度を決定した後、前記複数の信頼度を利用してテキスト処理結果を校正し、校正されたテキスト処理結果を得る。

図２は、本開示の実施例に係る処理結果を校正する方法のフローチャートである。図２に示すように、ステップＳ２０１では、前記複数の信頼度を利用して前記テキスト処理結果をそれぞれ処理して複数の中間校正係数を得て、ステップＳ２０２では、前記複数の中間校正係数を前記テキスト処理結果に加算して、校正されたテキスト処理結果を得る。

ここで、中間校正係数は、以下のように得られることができる。校正ユニット１００４が、前記複数の信頼度を利用して前記複数の前処理結果に対応する複数の校正率を取得し、前記対応する複数の校正率をそれぞれ前記テキスト処理結果と乗算することにより、複数の中間校正係数を得る。

以下、図３を参照し、本開示の実施例に係る処理結果を校正する方法について説明する。図３に示すように、入力テキスト取得ユニット１００１は、まず、入力テキスト３１を取得し（入力テキストには５つの構成文を含むと仮定する）、次に、入力テキストをニューラルネットワーク３２に入力し、当該ニューラルネットワークは複数の異なる処理方法（例えば図２に示す処理方法１、処理方法２、処理方法３など）を含むことができる。当該ニューラルネットワーク３２において、前処理結果取得ユニット１００２は、複数の異なる処理方法を利用して入力テキスト３１の構成文を処理し、前記異なる処理方法に対応する複数の前処理結果３４を取得することができる。さらに、生成ユニット１００３は、複数の前処理結果３４に基づいてテキスト処理結果３５を生成することができる。複数の前処理結果３４のうちの１つは、図３の｛０．１、０．５、０．３、０．１、０．２｝（図では３６で示される）であり、当該前処理結果３６は、入力テキスト３１の５つの構成文のそれぞれの予測文の重みに対応すると仮定し、同時に、テキスト処理結果３５は、図３の｛０．７、０．３、０．１、０．４、０．１｝（図では４０で示される）であると仮定すると、校正ユニット１００４は、以下の方法でテキスト処理結果４０を校正することができる。最初に、前処理結果３６から最大の２つの値を選択し、それらを１として符号化し、他の前処理結果を０として符号化し、対応する符号化値｛０、１、１、０、０｝（図では３８で示される）が得られる。その後、例えば情報エントロピーによって前処理結果３６の信頼度３７を決定し、情報エントロピーによって決定される処理結果３６の信頼度が０．３であると仮定する。次に、信頼度３７に符号化値３８を乗算して、信頼度が校正された符号化係数｛０、０．３、０．３、０、０｝を校正率として得る（図では３９で示される）。次に、得られた校正率３９にテキスト処理結果４０を乗算して、中間校正係数｛０、０．０９、０．０３、０、０｝（図では４１で示される）が得られ、前処理結果３６をテキスト処理結果４０と同じレベルに引きずるように校正する。中間校正係数４１が得られた後、中間校正係数４１をテキスト処理結果４０に加算して、校正されたテキスト処理結果｛０．７、０．３９、０．１３、０．４、０．１｝（図では４３で示される）が得られる。

図３は、前処理結果を利用してテキスト処理結果を校正し、校正されたテキスト処理結果を得ることを示す模式図であることを理解されたい。同様に、他の複数の前処理結果については、同じ方法を採用してテキスト処理結果を校正し、校正されたテキスト処理結果を得ることができる。例えば、校正ユニット１００４は、他の前処理結果に対応する信頼度を利用して他の中間校正係数を得て、その後、全ての前処理結果によって得られた中間校正係数をテキスト処理結果に加算して、最終的に校正されたテキスト処理結果を得ることができる。

中間校正係数を利用してテキスト処理結果を校正する模式図を図４に示す。図４に示すように、図３に示す方法で各前処理結果に対応する各中間校正係数４６が得られた後、すべての中間校正係数４６をテキスト処理結果４５に加算して、校正されたテキスト処理結果４７を得る。

以下、図６を参照し、本開示の実施例に係るテキスト処理デバイスについて説明する。図６は、本開示の実施例に係るテキスト処理デバイスの模式図である。本実施例のテキスト処理デバイスの機能は、図１を参照して説明した方法の詳細と同じであるため、便宜上、同じ内容に対する詳細な説明はここでは省略する。

図６に示すように、テキスト処理装置１１００は、メモリ１１０１とプロセッサ１１０２を備える。図６では、テキスト処理デバイス１１００は、２つのデバイスのみを備えるように示されるが、これは単なる例示であり、テキスト処理デバイス１１００は、１つ以上の他のデバイスを備えることもできることに留意されたい。これらのデバイスは、本発明の思想と関係がないため、ここでは省略する。

本開示のテキスト処理デバイス１１００は、プロセッサ１１０２と、コンピュータ読取可能なプログラム命令を格納したメモリ１１０１とを備える。ここで、コンピュータ読取可能なプログラム命令が前記プロセッサによって実行されるとき、ニューラルネットワークに基づくテキスト処理方法が実行される。前記方法は、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得することと、前記前処理結果に基づいて、テキスト処理結果を生成することと、前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることと、を含む。

ここで、複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることは、前記複数の信頼度を利用して前記テキスト処理結果をそれぞれ処理し、複数の中間校正係数を得ることと、前記複数の中間校正係数を前記テキスト処理結果に加算して、校正されたテキスト処理結果を得ることと、を含む。

ここで、前記複数の信頼度を利用してテキスト処理結果をそれぞれ処理し、複数の中間校正係数を得ることは、前記複数の信頼度を利用して前記複数の前処理結果に対応する複数の校正率を取得し、前記対応する複数の校正率をそれぞれ前記テキスト処理結果と乗算して、前記複数の中間校正係数を取得することを含む。

図７は、本開示の実施例に係るコンピュータ読取可能な記憶媒体の模式図である。

図７に示すように、本開示は、コンピュータ読取可能な命令を格納したコンピュータ読取可能な記憶媒体を提供する。前記コンピュータ読取可能な命令がコンピュータによって実行されるとき、前記コンピュータにニューラルネットワークに基づくテキスト処理方法を実行させる。前記方法は、入力テキストを取得することと、ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得することと、前記複数の前処理結果に基づいて、テキスト処理結果を生成することと、前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることと、を含む。

＜ハードウェア構成＞
なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック（構成部）は、ハードウェア及び／又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び／又は論理的に結合した１つの装置により実現されてもよいし、物理的及び／又は論理的に分離した２つ以上の装置を直接的及び／又は間接的に（例えば、有線及び／又は無線で）接続し、これら複数の装置により実現されてもよい。

なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。例えば、プロセッサは１つだけ図示されているが、複数のプロセッサがあってもよい。また、処理は、１のプロセッサで実行されてもよいし、処理が同時に、逐次に、又はその他の手法で、１以上のプロセッサで実行されてもよい。なお、プロセッサは、１以上のチップで実装されてもよい。

プロセッサは、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサは、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置（ＣＰＵ：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）で構成されてもよい。

また、プロセッサは、プログラム（プログラムコード）、ソフトウェアモジュール、データなどを、ストレージ及び／又は通信装置からメモリに読み出し、これらに従って各種の処理を実行する。プログラムとしては、上記の実施形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、制御ユニットは、メモリに格納され、プロセッサで動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。

メモリは、コンピュータ読取可能な記憶媒体であり、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＥＰＲＯＭ（ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲＯＭ）、ＥＥＰＲＯＭ（ＥｌｅｃｔｒｉｃａｌｌｙＥＰＲＯＭ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、その他の適切な記憶媒体の少なくとも１つで構成されてもよい。メモリは、レジスタ、キャッシュ、メインメモリ（主記憶装置）などと呼ばれてもよい。メモリは、本開示の一実施形態に係る方法を実施するために実行可能なプログラム（プログラムコード）、ソフトウェアモジュールなどを保存することができる。

ストレージは、コンピュータ読取可能な記憶媒体であり、例えば、フレキシブルディスク、フロッピー（登録商標）ディスク、光磁気ディスク（例えば、コンパクトディスク（ＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃＲＯＭ）など）、デジタル多用途ディスク、Ｂｌｕ−ｒａｙ（登録商標）ディスク）、リムーバブルディスク、ハードディスクドライブ、スマートカード、フラッシュメモリデバイス（例えば、カード、スティック（ｓｔｉｃｋ）、キードライブ（ｋｅｙｄｒｉｖｅｒ））、磁気ストライプ、データベース、サーバ、その他の適切な記憶媒体の少なくとも１つで構成されてもよい。ストレージは、補助記憶装置と呼ばれてもよい。

入力装置は、外部からの入力を受け付ける入力デバイス（例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど）である。出力装置は、外部への出力を実施する出力デバイス（例えば、ディスプレイ、スピーカー、ＬＥＤ（ＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ）ランプなど）である。なお、入力装置及び出力装置は、一体となった構成（例えば、タッチパネル）であってもよい。

また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。例えば、無線リソースは、所定のインデックスで指示されるものであってもよい。さらに、これらのパラメータを使用する数式などは、本明細書で明示的に開示したものと異なってもよい。

本明細書においてパラメータなどに使用する名称は、いかなる点においても限定的なものではない。

入出力された情報、信号などは、特定の場所（例えば、メモリ）に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報、信号などは、上書き、更新又は追記をされ得る。出力された情報、信号などは、削除されてもよい。入力された情報、信号などは、他の装置へ送信されてもよい。

情報の通知は、本明細書で説明した態様／実施形態に限られず、他の方法で行われてもよい。例えば、情報の通知は、物理レイヤシグナリング（例えば、下り制御情報（ＤＣＩ：ＤｏｗｎｌｉｎｋＣｏｎｔｒｏｌＩｎｆｏｒｍａｔｉｏｎ）、上り制御情報（ＵＣＩ：ＵｐｌｉｎｋＣｏｎｔｒｏｌＩｎｆｏｒｍａｔｉｏｎ））、上位レイヤシグナリング（例えば、ＲＲＣ（ＲａｄｉｏＲｅｓｏｕｒｃｅＣｏｎｔｒｏｌ）シグナリング、ブロードキャスト情報（マスタ情報ブロック（ＭＩＢ：ＭａｓｔｅｒＩｎｆｏｒｍａｔｉｏｎＢｌｏｃｋ）、システム情報ブロック（ＳＩＢ：ＳｙｓｔｅｍＩｎｆｏｒｍａｔｉｏｎＢｌｏｃｋ）など）、媒体アクセス制御（ＭＡＣ：ＭｅｄｉｕｍＡｃｃｅｓｓＣｏｎｔｒｏｌ）シグナリング）、その他の信号又はこれらの組み合わせによって実施されてもよい。

また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗示的に（例えば、当該所定の情報の通知を行わないことによって又は別の情報の通知によって）行われてもよい。

判定は、１ビットで表される値（０か１か）によって行われてもよいし、真（ｔｒｕｅ）又は偽（ｆａｌｓｅ）で表される真偽値（ｂｏｏｌｅａｎ）によって行われてもよいし、数値の比較（例えば、所定の値との比較）によって行われてもよい。

ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。

また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術（同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ：ＤｉｇｉｔａｌＳｕｂｓｃｒｉｂｅｒＬｉｎｅ）など）及び／又は無線技術（赤外線、マイクロ波など）を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び／又は無線技術は、伝送媒体の定義内に含まれる。

本明細書で使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。

本明細書で説明した各態様／実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、本明細書で説明した各態様／実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。

本明細書で説明した各態様／実施形態は、ＬＴＥ（ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）、ＬＴＥ−Ａ（ＬＴＥ−Ａｄｖａｎｃｅｄ）、ＬＴＥ−Ｂ（ＬＴＥ−Ｂｅｙｏｎｄ）、ＳＵＰＥＲ３Ｇ、ＩＭＴ−Ａｄｖａｎｃｅｄ、４Ｇ（４ｔｈｇｅｎｅｒａｔｉｏｎｍｏｂｉｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓｙｓｔｅｍ）、５Ｇ（５ｔｈｇｅｎｅｒａｔｉｏｎｍｏｂｉｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓｙｓｔｅｍ）、ＦＲＡ（ＦｕｔｕｒｅＲａｄｉｏＡｃｃｅｓｓ）、Ｎｅｗ−ＲＡＴ（ＲａｄｉｏＡｃｃｅｓｓＴｅｃｈｎｏｌｏｇｙ）、ＮＲ（ＮｅｗＲａｄｉｏ）、ＮＸ（Ｎｅｗｒａｄｉｏａｃｃｅｓｓ）、ＦＸ（Ｆｕｔｕｒｅｇｅｎｅｒａｔｉｏｎｒａｄｉｏａｃｃｅｓｓ）、ＧＳＭ（登録商標）（ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ）、ＣＤＭＡ２０００、ＵＭＢ（ＵｌｔｒａＭｏｂｉｌｅＢｒｏａｄｂａｎｄ）、ＩＥＥＥ８０２．１１（Ｗｉ−Ｆｉ（登録商標））、ＩＥＥＥ８０２．１６（ＷｉＭＡＸ（登録商標））、ＩＥＥＥ８０２．２０、ＵＷＢ（Ｕｌｔｒａ−ＷｉｄｅＢａｎｄ）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、その他の適切な無線通信方法を利用するシステム及び／又はこれらに基づいて拡張された次世代システムに適用されてもよい。

本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。

本明細書で使用する「第１の」、「第２の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定するものではない。これらの呼称は、２つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第１及び第２の要素の参照は、２つの要素のみが採用され得ること又は何らかの形で第１の要素が第２の要素に先行しなければならないことを意味しない。

本明細書で使用する「判断（決定）（ｄｅｔｅｒｍｉｎｉｎｇ）」という用語は、多種多様な動作を包含する場合がある。例えば、「判断（決定）」は、計算（ｃａｌｃｕｌａｔｉｎｇ）、算出（ｃｏｍｐｕｔｉｎｇ）、処理（ｐｒｏｃｅｓｓｉｎｇ）、導出（ｄｅｒｉｖｉｎｇ）、調査（ｉｎｖｅｓｔｉｇａｔｉｎｇ）、探索（ｌｏｏｋｉｎｇｕｐ）（例えば、テーブル、データベース又は別のデータ構造での探索）、確認（ａｓｃｅｒｔａｉｎｉｎｇ）などを「判断（決定）」することであるとみなされてもよい。また、「判断（決定）」は、受信（ｒｅｃｅｉｖｉｎｇ）（例えば、情報を受信すること）、送信（ｔｒａｎｓｍｉｔｔｉｎｇ）（例えば、情報を送信すること）、入力（ｉｎｐｕｔ）、出力（ｏｕｔｐｕｔ）、アクセス（ａｃｃｅｓｓｉｎｇ）（例えば、メモリ中のデータにアクセスすること）などを「判断（決定）」することであるとみなされてもよい。また、「判断（決定）」は、解決（ｒｅｓｏｌｖｉｎｇ）、選択（ｓｅｌｅｃｔｉｎｇ）、選定（ｃｈｏｏｓｉｎｇ）、建立（ｅｓｔａｂｌｉｓｈｉｎｇ）、比較（Ｃｏｍｐａｒｉｎｇ）などを「判断（決定）」することであるとみなされてもよい。つまり、「判断（決定）」は、何らかの動作を「判断（決定）」することであるとみなされてもよい。

本明細書で使用する「接続された（ｃｏｎｎｅｃｔｅｄ）」、「結合された（ｃｏｕｐｌｅｄ）」という用語、又はこれらのあらゆる変形は、２又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された２つの要素間に１又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」と読み替えられてもよい。本明細書で使用する場合、２つの要素は、１又はそれ以上の電線、ケーブル及び／又はプリント電気接続を使用することにより、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び／又は光（可視及び不可視の両方）領域の波長を有する電磁エネルギーなどを使用することにより、互いに「接続」又は「結合」されると考えることができる。

本明細書又は請求の範囲で「含む（ｉｎｃｌｕｄｉｎｇ）」、「含んでいる（ｃｏｍｐｒｉｓｉｎｇ）」、及びそれらの変形が使用されている場合、これらの用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書あるいは請求の範囲において使用されている用語「又は（ｏｒ）」は、排他的論理和ではないことが意図される。

以上、本開示について詳細に説明したが、当業者にとっては、本開示が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく校正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。

Claims

ニューラルネットワークに基づくテキスト処理方法であって、
入力テキストを取得することと、
ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得することと、
前記複数の前処理結果に基づいてテキスト処理結果を生成することと、
前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることと、
を含む、テキスト処理方法。
情報エントロピーによって、前記複数の前処理結果の複数の信頼度を決定する、
請求項１に記載のテキスト処理方法。
前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることは、
前記複数の信頼度を利用して前記テキスト処理結果をそれぞれ処理し、複数の中間校正係数を得ることと、
前記複数の中間校正係数を前記テキスト処理結果に加算して、校正されたテキスト処理結果を得ることと、
を含む、請求項１に記載のテキスト処理方法。
前記複数の信頼度を利用して前記テキスト処理結果をそれぞれ処理し、複数の中間校正係数を得ることは、
前記複数の信頼度を利用して前記複数の前処理結果に対応する複数の校正率を取得し、前記対応する複数の校正率をそれぞれ前記テキスト処理結果と乗算して、前記複数の中間校正係数を取得することを含む、
請求項３に記載のテキスト処理方法。
前記ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得することは、
前記複数の異なる処理方法のそれぞれを利用して前記入力テキストのすべての構成文を処理し、前記複数の異なる処理方法のそれぞれに対応する、すべての構成文のそれぞれの予測文の重みを前記複数の前処理結果として取得することを含む、
請求項１ないし４のいずれか一項に記載のテキスト処理方法。
前記複数の前処理結果に基づいてテキスト処理結果を生成することは、
前記複数の異なる処理方法を利用して前記入力テキストのすべての構成文を分析し、全ての構成文のそれぞれの出力文の重みをテキスト処理結果として取得することを含む、
請求項１ないし４のいずれか一項に記載のテキスト処理方法。
ニューラルネットワークに基づくテキスト処理装置であって、
入力テキストを取得する入力テキスト取得ユニットと、
ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得する前処理結果取得ユニットと、
前記複数の前処理結果に基づいてテキスト処理結果を生成する生成ユニットと、
前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得る校正ユニットと、
を備える、テキスト処理装置。
前記校正ユニットは、情報エントロピーによって、前記複数の前処理結果の複数の信頼度を決定する、
請求項７に記載のテキスト処理装置。
前記校正ユニットは、前記複数の信頼度を利用して前記テキスト処理結果をそれぞれ処理し、複数の中間校正係数を取得し、
前記複数の中間校正係数を前記テキスト処理結果に加算して、校正されたテキスト処理結果を得る、
請求項７に記載のテキスト処理装置。
前記校正ユニットは、前記複数の信頼度を利用して前記複数の前処理結果に対応する複数の校正率を取得し、前記対応する複数の校正率をそれぞれ前記テキスト処理結果と乗算して、前記複数の中間校正係数を取得する、
請求項９に記載のテキスト処理装置。
前記前処理結果取得ユニットは、前記複数の異なる処理方法のそれぞれを利用して前記入力テキストのすべての構成文を処理し、前記複数の異なる処理方法のそれぞれに対応する、全ての構成文のそれぞれの予測文の重みを前記複数の前処理結果として取得する、
請求項７ないし１０のいずれか一項に記載のテキスト処理装置。
前記生成ユニットは、前記複数の異なる処理方法を利用して前記入力テキストのすべての構成文を分析し、すべての構成文のそれぞれの出力文の重みをテキスト処理結果として取得する、
請求項７ないし１０のいずれか一項に記載のテキスト処理装置。
ニューラルネットワークに基づくテキスト処理デバイスであって、
プロセッサと、
コンピュータ読取可能なプログラム命令を格納したメモリと、
を備え、
ここで、前記コンピュータ読取可能なプログラム命令が前記プロセッサによって実行されるとき、ニューラルネットワークに基づくテキスト処理方法が実行され、前記方法は、
ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得することと、
前記複数の前処理結果に基づいてテキスト処理結果を生成することと、
前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることと、
を含む、テキスト処理デバイス。
コンピュータ読取可能な命令を格納したコンピュータ読取可能な記憶媒体であって、
前記コンピュータ読取可能な命令がコンピュータによって実行されるとき、前記コンピュータに、ニューラルネットワークに基づくテキスト処理方法を実行させ、
前記方法は、
入力テキストを取得することと、
ニューラルネットワークに基づいて、複数の異なる処理方法を利用して前記入力テキストの構成文を処理し、前記異なる処理方法に対応する複数の前処理結果を取得することと、
前記複数の前処理結果に基づいてテキスト処理結果を生成することと、
前記複数の前処理結果の複数の信頼度を決定し、前記複数の信頼度を利用して前記テキスト処理結果を校正し、校正されたテキスト処理結果を得ることと、
を含む、コンピュータ読取可能な記憶媒体。