JP2021114284A

JP2021114284A - 句読点予測方法および装置

Info

Publication number: JP2021114284A
Application number: JP2020215550A
Authority: JP
Inventors: リャン，ミンシン; Mingxin Liang; フ，シャオイン; Xiaoyin Fu
Original assignee: Baidu Online Network Technology Beijing Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd
Priority date: 2020-01-16
Filing date: 2020-12-24
Publication date: 2021-08-05
Anticipated expiration: 2040-12-24
Also published as: CN111241810B; US11216615B2; US20210224480A1; EP3852013A1; JP7133002B2; KR102630243B1; KR20210092692A; CN111241810A

Abstract

【課題】句読点予測の効率を向上させる句読点予測方法および装置を提供する。【解決手段】句読点予測の効率を向上させる句読点予測方法は、予測対象のテキストを取得するステップ１０１と、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第１の得点を含む第１の句読点予測結果を取得するステップ１０２と、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成し、入力対象のテキストを予め設定された言語モデルに入力して、予測結果に対応する第２の得点を得るステップ１０３と、文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、文字の句読点存在状況を決定するステップ１０４と、テキスト内の各文字の句読点存在状況と併せて、テキストに対して句読点処理を行い、テキストに対応する句読点テキストを得るステップ１０５と。を含む。【選択図】図１

Description

本出願はデータ処理技術分野に関し、具体的にテキストラベリング技術分野に関し、特に句読点予測方法および装置に関する。

現在のテキスト句読点予測方法は主に、シーケンスラベリングモデルまたは言語モデルを用いて、テキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定するものである。ここで、シーケンスラベリングモデルは、新語や人気ワードに対する適応性が悪く、言語モデルの一般化能力が悪く、テキストにわずかな相違があっても異なる結果を得ることになる可能性があり、句読点予測の効率が悪い。

本出願は句読点予測方法および装置を提供し、シーケンスラベリングモデルおよび言語モデルを組み合わせることによってテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合して、句読点予測の効率を向上させる。

本出願の一態様の実施例は、予測対象のテキストを取得するステップと、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第１の句読点予測結果を取得するステップであって、前記第１の句読点予測結果が、少なくとも１種の予測結果および各種の予測結果に対応する第１の得点と、前記予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含むステップと、前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記予測結果に対応する第２の得点を得るステップと、前記文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、前記文字の句読点存在状況を決定するステップと、前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得るステップと、を含む句読点予測方法を提供する。

本出願の一実施例では、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第１の句読点予測結果を取得する前記ステップは、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する少なくとも１種の予測結果および予測確率を取得するステップと、各文字の各種の予測結果に対して、前記予測結果に対応する予測確率に対して逆数および対数演算を行って、前記予測結果に対応する第１の得点を得るステップと、を含む。

本出願の一実施例では、前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成する前記ステップは、前記テキスト内の各文字に対して、前記文字が前記テキストの頭文字であるか否かを判断するステップと、前記文字が前記テキストの頭文字である場合、頭文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成するステップと、前記文字が前記テキストの頭文字ではない場合、前記頭文字でない文字の各予測結果に対して、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキスト、および前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成するステップと、を含む。

本出願の一実施例では、前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、および前記予測結果によって表される内容が挿入され、前記予測結果表示文字の後に句読点が存在しない場合、前記内容は空であり、前記予測結果表示文字の後に句読点が存在する場合、前記内容は存在する句読点のタイプである。

本出願の一実施例では、前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、各前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、前記予測結果によって表される内容、および前記テキストないの前記頭文字でない文字の後の予め設定された数の文字が挿入される。

本出願の一実施例では、前記文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、前記文字の句読点存在状況を決定する前記ステップは、前記文字の各種の予測結果に対して、前記予測結果に対応する第１の得点および第２の得点を取得するステップと、前記第１の得点および前記第２の得点に対して重み付き加算を行って、前記予測結果に対応する総得点を得るステップと、対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定するステップと、を含む。

本出願の一実施例では、前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得る前記ステップは、前記テキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定するステップと、前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記テキスト内の前記文字の後に句読点を追加するステップと、前記テキスト内の各文字が処理された後、前記テキストに対応する句読点テキストを得るステップと、を含む。

本出願の実施例の句読点予測方法は、予測対象のテキストを取得し、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第１の句読点予測結果を取得し、第１の句読点予測結果が、少なくとも１種の予測結果および各種の予測結果に対応する第１の得点と、予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含み、テキスト内の各文字に対して、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成し、入力対象のテキストを予め設定された言語モデルに入力して、予測結果に対応する第２の得点を得て、文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、文字の句読点存在状況を決定し、テキスト内の各文字の句読点存在状況と併せて、テキストに対して句読点処理を行い、テキストに対応する句読点テキストを得る。以上により、シーケンスラベリングモデルおよび言語モデルを組み合わせてテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合し、句読点予測の効率を向上させる。

本出願の他の態様の実施例は、予測対象のテキストを取得するための取得モジュールと、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第１の句読点予測結果を取得するための入力モジュールであって、前記第１の句読点予測結果が、少なくとも１種の予測結果および各種の予測結果に対応する第１の得点と、前記予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含む入力モジュールと、前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記予測結果に対応する第２の得点を得るための第１の決定モジュールと、前記文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、前記文字の句読点存在状況を決定するための第２の決定モジュールと、前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得るための句読点処理モジュールと、を含む句読点予測装置を提供する。

本出願の一実施例では、前記入力モジュールは具体的に、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する少なくとも１種の予測結果および予測確率を取得し、各文字の各種の予測結果に対して、前記予測結果に対応する予測確率に対して逆数および対数演算を行って、前記予測結果に対応する第１の得点を得ることに用いられる。

本出願の一実施例では、前記第１の決定モジュールは具体的に、前記テキスト内の各文字に対して、前記文字が前記テキストの頭文字であるか否かを判断し、前記文字が前記テキストの頭文字である場合、頭文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記文字が前記テキストの頭文字ではない場合、前記頭文字でない文字の各予測結果に対して、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキスト、および前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成することに用いられる。

本出願の一実施例では、前記第２の決定モジュールは具体的に、前記文字の各種の予測結果に対して、前記予測結果に対応する第１の得点および第２の得点を取得し、前記第１の得点および前記第２の得点に対して重み付き加算を行って、前記予測結果に対応する総得点を得て、対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定することに用いられる。

本出願の一実施例では、前記句読点処理モジュールは具体的に、前記テキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定し、前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記テキスト内の前記文字の後に句読点を追加し、前記テキスト内の各文字が処理された後、前記テキストに対応する句読点テキストを得ることに用いられる。

本出願の実施例の句読点予測装置は、予測対象のテキストを取得し、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第１の句読点予測結果を取得し、第１の句読点予測結果が、少なくとも１種の予測結果および各種の予測結果に対応する第１の得点と、予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含み、テキスト内の各文字に対して、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成し、入力対象のテキストを予め設定された言語モデルに入力して、予測結果に対応する第２の得点を得て、文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、文字の句読点存在状況を決定し、テキスト内の各文字の句読点存在状況と併せて、テキストに対して句読点処理を行い、テキストに対応する句読点テキストを得る。以上により、シーケンスラベリングモデルおよび言語モデルを組み合わせてテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合し、句読点予測の効率を向上させる。

本出願の他の態様の実施例は電子機器を提供し、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されるメモリとを含み、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも１つのプロセッサが本出願の実施例の句読点予測方法を実行するように、前記少なくとも１つのプロセッサによって実行される。

本出願の他の態様の実施例は、コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに本出願の実施例の句読点予測方法を実行させることに用いられる。
本出願の他の態様では、コンピュータプログラムを提供し、前記コンピュータプログラムにおける命令が実行された場合に、本出願の実施例の句読点予測方法が実行される。

上記選択可能な形態が有する他の効果は具体的な実施例と併せて以下に説明する。

図面は本解決案をよりよく理解するためのものであり、本出願を限定するものではない。
本出願の第１の実施例に係る概略図である。句読点予測方法の概略図である。本出願の第２の実施例に係る概略図である。文字の句読点存在状況を決定する概略図である。本出願の第３の実施例に係る概略図である。本出願の実施例の句読点予測方法を実現するための電子機器のブロックである。

以下、図面と併せて本出願の例示的な実施例を説明する。理解を促すために、その中には本出願の実施の様々な詳細が含まれており、それらを単なる例示的なものと見なすべきである。そのため、当業者であれば、本出願の精神および趣旨から逸脱しない限り、ここで説明された実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確さおよび簡潔さのために、以下の説明では公知の機能および構造に対する説明は省略されている。

以下、図面を参照して本出願の実施例の句読点予測方法および装置を説明する。

図１は、本出願の第１の実施例に係る概略図である。ここで、本実施例が提供する句読点予測方法の実行主体は句読点予測装置であり、当該装置はソフトウェアおよび／またはハードウェアの形態で実現でき、当該装置は端末装置またはサーバに配置することができ、当該実施例はこれについて具体的に限定しない。

図１に示すように、当該句読点予測方法は以下のステップ１０１〜１０５を含んでも良い。

ステップ１０１、予測対象のテキストを取得する。

本出願では、予測対象のテキストは句読点なしのテキストであってもよい。句読点なしのテキストは、例えば、音声認識システムが音声を認識した後に得られたテキスト、または音声ダビングのプロセスにおける句読点なしのテキストである。

ステップ１０２、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第１の句読点予測結果を取得し、第１の句読点予測結果は、少なくとも１種の予測結果および各種の予測結果に対応する第１の得点と、予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含む。

本出願では、句読点予測装置がステップ１０２を実行するプロセスは具体的に、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する少なくとも１種の予測結果および予測確率を取得し、各文字の各種の予測結果に対して、予測結果に対応する予測確率に対して逆数および対数演算を行って、予測結果に対応する第１の得点を得るものであってもよい。

本出願では、シーケンスラベリングモデルは、例えば、回帰型ニューラルネットワーク（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ、ＲＮＮ）、双方向長短期記憶モデル（ｂｉｄｉｒｅｃｔｉｏｎａｌ−ＬｏｎｇＳｈｏｒｔ−ＴｅｒｍＭｅｍｏｒｙ、Ｂｉ−ＬＳＴＭ）などであってもよい。双方向長短期記憶モデルを例とすると、当該モデルは入力ウィンドウ、ワードベクトル、ＢＬＳＴＭ層およびｓｏｆｔｍａｘ推論層という４つの部分で構成される。入力がテキストである場合、ｓｏｆｔｍａｘ推論層の出力はテキスト内の各文字に対応する少なくとも１種の予測結果および予測確率であってもよい。ここで、「今日の私は元気です」というテキスト内の「元気」という文字を例とすると、当該文字に対応する予測結果は３種類があっても良い。１つは「元気」という文字の後に句読点が存在する場合、１つは「元気」という文字の後に読点が存在する場合、もう１つは「元気」という文字の後に句点が存在する場合である。

本出願では、各文字の各種の予測結果に対して、予測結果に対応する予測確率に対して逆数および対数演算を行って、予測結果に対応する第１の得点を得る。ここで、予測結果に対応する予測確率に対して逆数および対数演算を行うことによって、予測確率が高いほど、得点が低く、つまり、得点が低いほど予測確率が高い。

本出願では、予め設定されたシーケンスラベリングモデルは、トレーニングデータを用いて初期のシーケンスラベリングモデルをトレーニングして得られたものである。トレーニングデータは予め設定された数より大きいサンプルを含み、各サンプルは、句読点なしのテキストおよび対応する句読点シーケンスを含む。ここで、予め設定された数は５ＧＢレベルの数であってもよい。

ステップ１０３、テキスト内の各文字に対して、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成し、入力対象のテキストを予め設定された言語モデルに入力して、予測結果に対応する第２の得点を得る。

本出願では、言語モデルの入力は一段落のテキストであり、出力は一段落のテキストの困惑度である。ここで、困惑度が小さいほど、当該段落のテキストが出現する確率が高いことは示される。そのため、困惑度が小さいほどよい。本出願では、困惑度を得点とする。

本出願では、言語モデルの入力が一段落のテキストであるため、文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成する必要がある。例えば、「今日の私は元気です」というテキストの文字の「元気」を例とすると、特定の予測結果は「元気」という文字の後に句読点が存在しないものである場合、入力対象のテキストは「私はとても元気」であってもよい。特定の予測結果は「元気」という文字の後に読点が存在するものである場合、入力対象のテキストは「私はとても元気で、」であってもよい。特定の予測結果は「元気」という文字の後に句点が存在するものである場合、入力対象のテキストは「私はとても元気です。」であってもよい。

本出願では、予め設定された言語モデルは、トレーニングデータを用いて初期の言語モデルをトレーニングして得られたものである。トレーニングデータは、予め設定された数のサンプルを含み、各サンプルは、句読点なしのテキストおよび対応する句読点テキストを含む。ここで、予め設定された数は１ＴＢレベルの数であってもよい。

ステップ１０４、文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、文字の句読点存在状況を決定する。

本出願では、句読点予測装置がステップ１０４を実行するプロセスは具体的に、文字の各種の予測結果に対して、予測結果に対応する第１の得点および第２の得点を取得し、第１の得点および第２の得点に対して重み付き加算を行って、予測結果に対応する総得点を得て、対応する総得点の最小の予測結果に基づいて、文字の句読点存在状況を決定することを含んでも良い。

本出願では、総得点の計算式は、例えば、
ｓｃｏｒｅ＝θ×Ａ＋（１−θ）×Ｂであってもよい。

ｓｃｏｒｅは総得点を表し、θは第２の得点の重みを表し、Ａは第２の得点を表し、Ｂは第１の得点を表す。

本出願では、シーケンスラベリングモデルおよび言語モデルの得点を統合する融合アルゴリズムはｂｅａｍ−ｓｅａｒｃｈ検索アルゴリズムを用いてもよく、当該アルゴリズムはテキスト内の各文字の各種の予測結果に対して、シーケンスラベリングモデルの得点および言語モデルの得点を融合して予測結果を選択することができ、従って後続の計算量を減らす。

ステップ１０５、テキスト内の各文字の句読点存在状況と併せて、テキストに対して句読点処理を行い、テキストに対応する句読点テキストを得る。

本出願では、句読点予測装置がステップ１０５を実行するプロセスは具体的に、テキスト内の各文字に対して、文字の句読点存在状況に基づいて、文字の後に句読点が存在するか否かを決定し、文字の後に句読点が存在する場合、存在する句読点のタイプに基づいてテキスト内の文字の後に句読点を追加し、テキスト内の各文字が処理された後、テキストに対応する句読点テキストを得ることであってもよい。

本出願では、句読点予測方法の概略図は図２に示すとおり、図２では、テキストが「こんにちは私は百度科技園にいる」であり、対応する句読点テキストが「こんにちは、私は百度科技術園にいる。」である。テキストに対して句読点予測を行うプロセスにおいて、シーケンスラベリングモデルおよび言語モデルを組み合わせることによって、シーケンスラベリングモデルおよび言語モデルの利点を統合して、句読点予測の効率を向上させることができる。

図３は本出願の第２の実施例に係る概略図である。図３に示すように、図１に示す実施例をもとに、ステップ１０３は具体的に以下のステップ１０３１〜１０３３を含むことができる。

ステップ１０３１、テキスト内の各文字に対して、文字がテキストの頭文字であるか否かを判断する。

本出願では、頭文字はテキスト内の最初の文字を指す。

ステップ１０３２、文字がテキストの頭文字である場合、頭文字の各種の予測結果に対して、テキストおよび予測結果と併せて、予測結果に対応する入力対象のテキストを生成する。

本出願では、文字がテキストの頭文字である場合、頭文字の各種の予測結果に対応する入力対象のテキストは頭文字、および予測結果によって表される内容を含んでも良い。

さらに、文字の後の文字は文字の予測結果の得点に大きく影響する。そのため、文字の後の文字と併せて文字の各予測結果の得点を決定することができ、さらに、文字の後の文字と併せて予測結果に対応する入力対象のテキストを生成することができる。そのため、本出願では、文字がテキストの頭文字である場合、頭文字の各種の予測結果に対応する入力対象のテキストは、頭文字、予測結果によって表される内容、およびテキスト内の頭文字の後の予め設定された数の文字を含んでも良い。

ステップ１０３３、文字がテキストの頭文字ではない場合、頭文字でない文字の各予測結果に対して、テキスト内の頭文字でない文字の前の各文字の句読点存在状況、テキスト、および予測結果と併せて、予測結果に対応する入力対象のテキストを生成する。

本出願では、文字がテキストの頭文字でない文字である場合、頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、テキスト内の頭文字でない文字の前の文字、頭文字、および予測結果によって表される内容を含んでも良い。

さらに、文字がテキストの頭文字でない文字である場合、頭文字でない文字の前の特定の文字の句読点存在状況が、句読点が存在するということである場合、頭文字でない文字の前の各文字の句読点存在状況と併せて入力対象のテキストを生成する。入力対象のテキストの精度および句読点予測の効率を向上させることができる。そのため、文字がテキストの頭文字でない文字である場合、頭文字でない各種の予測結果に対応する入力対象のテキストは、テキスト内の頭文字でない文字の前の文字を含み、各頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、頭文字でない文字、および予測結果によって表される内容が挿入される。

前記予測結果は、文字の後に句読点が存在しないことを表す場合、前記内容は空であり、前記予測結果表示文字の後に句読点が存在する場合、前記内容は存在する句読点のタイプである。

前の文字の句読点存在状況は、前の文字の後に句読点が存在しないことを表す場合、前の文字の句読点存在状況によって表される内容は空であり、前の文字の後に句読点を挿入しない。前の文字の句読点存在状況は、前の文字の後に句読点が存在することを表す場合、前の文字の句読点存在状況によって表される内容は、存在する句読点のタイプであり、前の文字の後に句読点を挿入する。

さらに、文字の後の文字は文字の予測結果の得点に大きく影響する。そのため、文字の後の文字と併せて文字の各予測結果の得点を決定することができ、従って文字の後の文字と併せて予測結果に対応する入力対象のテキストを生成することができる。そのため、本出願では、文字がテキストの頭文字でない文字である場合、非頭文字の各種の予測結果に対応する入力対象のテキストは、テキスト内の頭文字でない文字の前の文字を含み、各頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、頭文字でない文字、予測結果によって表される内容、およびテキスト内の頭文字でない文字の後の予め設定された数の文字が挿入される。

本出願では、図４は、文字の句読点存在状況を決定する概略図である。図４では、「外」という文字に基づいて、「外」という文字の句読点存在状況が、その後に読点が存在することであると決定すると、後で「私」という文字を処理する際に、「外」という文字および「外」という文字の後の読点と併せて、「私」という文字の各予測結果の得点を決定して選択する。

本出願の実施例の句読点予測方法は、予測対象のテキストを取得し、テキストを予め設定されたシーケンスラベリングモデルに入力して、テキスト内の各文字に対応する第１の句読点予測結果を取得し、テキスト内の各文字に対して、文字が頭文字である場合、文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、文字が頭文字でない文字である場合、前記頭文字でない文字の各予測結果、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成する。以上により、シーケンスラベリングモデルおよび言語モデルを組み合わせてテキスト内の各文字の後に句読点が存在するか否かおよび句読点が存在するタイプであるか否かを決定し、シーケンスラベリングモデルおよび言語モデルの利点を統合して、句読点の予測効率を向上させる。

上記実施例を実現するために、本出願の実施例は句読点予測装置をさらに提供する。

図５は本出願の第３の実施例に係る概略図である。図３に示すように、当該句読点予測装置１００は、予測対象のテキストを取得するための取得モジュール１１０と、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第１の句読点予測結果を取得するための入力モジュール１２０であって、前記第１の句読点予測結果が、少なくとも１種の予測結果および各種の予測結果に対応する第１の得点と、前記予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含む入力モジュール１２０と、前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記予測結果に対応する第２の得点を得るための第１の決定モジュール１３０と、前記文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、前記文字の句読点存在状況を決定するための第２の決定モジュール１４０と、前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得るための句読点処理モジュール１５０と、を含む。

本出願の一実施例では、前記入力モジュール１２０は具体的に、前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する少なくとも１種の予測結果および予測確率を取得し、各文字の各種の予測結果に対して、前記予測結果に対応する予測確率に対して逆数および対数演算を行って、前記予測結果に対応する第１の得点を得ることに用いられる。

本出願の一実施例では、前記第１の決定モジュール１３０は具体的に、前記テキスト内の各文字に対して、前記文字が前記テキストの頭文字であるか否かを判断し、前記文字が前記テキストの頭文字である場合、頭文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記文字が前記テキストの頭文字ではない場合、前記頭文字でない文字の各予測結果に対して、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキスト、および前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成することに用いられる。

本出願の一実施例では、前記第２の決定モジュール１４０は具体的に、前記文字の各種の予測結果に対して、前記予測結果に対応する第１の得点および第２の得点を取得し、前記第１の得点および前記第２の得点に対して重み付き加算を行って、前記予測結果に対応する総得点を得て、対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定することに用いられる。

本出願の一実施例では、前記句読点処理モジュール１５０は具体的に、前記テキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定し、前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記テキスト内の前記文字の後に句読点を追加し、前記テキスト内の各文字が処理された後、前記テキストに対応する句読点テキストを得ることに用いられる。

なお、上記句読点予測方法に対する説明は本実施例の句読点予測装置にも適用するため、ここで説明を省略する。

本出願の実施例をもとに、本出願は電子機器および読み取り可能な記憶媒体を提供する。
本出願の実施例によれば、コンピュータプログラムが提供される。当該コンピュータプログラムにおける命令が実行された場合に、上記句読点予測方法が実行される。

図６に示すように、本出願の実施例に係る句読点予測方法の電子機器のブロックである。電子機械はラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレーム、及び他の適切なコンピュータなど、様々な形式のデジタルコンピュータを表すこと意図している。電子機械はさらに、様々な形態のモバイル装置、例えば、携帯情報端末、セルラー電話、スマートフォン、ウェアラブルデバイス及び他の同様なコンピューティングデバイスを表すことができる。本明細書に示されている部品、それらの接続と関係、及びそれらの機能は例示的なものに過ぎず、本明細書で説明された及び／又は求められた本出願の実現を限定することを意図していない

図６に示すように、該電子機械は、１つ又は複数のプロセッサ３０１、メモリ３０２、及び各部品を接続するためのインターフェースを含み、インターフェースは高速インターフェースと低速インターフェースを含む。各部品は、異なるバスを用いて互いに接続されており、かつ共用のマザーボードに実装されるか、又は必要に基づいて他の方式で実装されても良い。プロセッサは、電子機器内で実行される命令を処理することができ、前記命令は、外部入力／出力装置（例えば、インターフェースに接続される表示装置）にＧＵＩの図形情報を表示するようにメモリ内又はメモリ上に記憶される命令を含む。他の実施形態において、必要があれば、複数のプロセッサ及び／又は複数のバスを複数のメモリと組み合わせて使用してもよい。同様に、複数の電子機器を接続してもよく、各機械は、必要とされる操作の一部（例えば、サーバアレイ、１組のブレードサーバ、又はマルチプロセッサシステムとして）を提供する。図６では、１つのプロセッサ３０１は例として挙げられた。

メモリ３０２は即ち本出願が提供する非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリには、前記少なくとも１つのプロセッサに本出願が提供する句読点予測方法を実行させるように、少なくとも１つのプロセッサによって実行可能な命令が記憶されている。本出願の非一時的なコンピュータ読み取り可能な記憶媒体には、コンピュータに本出願が提供する句読点予測方法を実行させることに用いられるコンピュータ命令が記憶されている。

メモリ３０２は非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例に係る句読点予測方法に対応するプログラム命令／モジュール（例えば、図面５に示す取得モジュール１１０、入力モジュール１２０、第１の決定モジュール１３０、第２の決定モジュール１４０、句読点処理モジュール１５０）のような非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶することに用いることができる。プロセッサ３０１は、メモリ３０２に記憶される非一時的なソフトウェアプログラム、命令およびモジュールを実行することによって、サーバの機能適用およびデータ処理を実行し、即ち上記方法実施例の句読点予測方法を実行する。

メモリ３０２は、プログラムを記憶する領域と、データを記憶する領域とを含んでも良い。プログラムを記憶する領域は、オペレーティングシステムと、少なくとも１つの機能に必要なアプリケーションプログラムを含んでも良い。データを記憶する領域は、句読点予測の電子機器の使用によって生成されたデータなどを記憶することができる。また、メモリ３０２は、高速ランダムアクセスメモリだけではなく、少なくとも１つのディスクストレージデバイス、フラッシュメモリデバイス又は他の非一時的なソリッドステートストレージデバイスのような非一時的なメモリを含んでも良い。一部の実施例では、メモリ３０２は、プロセッサ３０１に対してリモートで設定されるメモリを選択的に含んでもよく、これらのリモートメモリはネットワーク経由で句読点予測の電子機器に接続することができる。上記ネットワークの実例は、インターネット、企業内部のネットワーク、ローカルエリアネットワーク、移動通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。

句読点予測方法の電子機器は、入力装置３０３および出力装置３０４をさらに含んでも良い。プロセッサ３０１、メモリ３０２、入力装置３０３および出力装置３０４はバスまたは他の方式で接続することができ、図６では、バスによる接続が例として挙げられている。

入力装置３０３は、入力されたデジタル又は文字情報を受信する及び句読点予測の電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパネル、ポインティングスティック、１つ又は複数のマウスボタン、トラックボール、ジョイスティック等の入力装置がある。出力装置３０４は、表示装置、補助照明装置（例えば、ＬＥＤ）及び触覚フィードバック装置（例えば、振動モータ）などを含んでも良い。該表示装置は、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ及びプラズマディスプレイを含むが、これらに限定されない。一部の実施形態では、表示装置はタッチスクリーンであってもよい。

本明細書で説明されたシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ＡＳＩＣ（専用集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は以下を含んでもよい。１つ又は複数のコンピュータプログラムにおいて実施され、該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行及び／又は解釈することができ、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであり、ストレージシステム、少なくとも１つの入力装置及び少なくとも１つの出力装置からデータと命令を受信し、データ及び命令を該ストレージシステム、該少なくとも１つの入力装置及び該少なくとも１つの出力装置に転送することができる。

これらの計算プログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも言う）は、プログラマブルプロセッサの機械命令を含み、かつ高度プロセス及び／又はオブジェクト指向プログラミング言語、及び／又はアセンブリ言語／機械語を用いてこれらの計算プログラム実行することができる。本明細書で使用される「機械読み取り可能な媒体」と「コンピュータ読み取り可能な媒体」という用語は、機械命令及び／又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、装置、及び／又はデバイス（例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス（ＰＬＤ））を指し、機械読み取り可能な信号としての機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び／又はデータをプログラマブルプロセッサに提供するためのあらゆる信号を指す。

ユーザとのインタラクションを提供するために、ここで説明されたシステムと技術をコンピュータ上で実施することができる。当該コンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（ブラウン管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボードとポインティングデバイス（例えば、マウス又はトラックボール）とを含み、ユーザは該キーボードと該ポインティングデバイスを介して入力をコンピュータに提供することができる。別の種類のデバイスはさらにユーザとのインタラクションを提供することができ、例えば、ユーザに提供されたフィードバックは、任意の形式のセンサフィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であっても良い以上、ユーザからの入力を任意の形式（音の入力、音声入力又は触覚入力を含む）で受信することもできる。

ここで説明されたシステムと技術を、バックグラウンドパーツを含む計算システム（例えば、データサーバとして）、又はミドルウェアパーツを含む計算システム（例えば、アプリケーションサーバ）、又はフロントエンドパーツを含む計算システム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは該グラフィカルユーザインタフェース又は該ウェブブラウザ介して、ここで説明されたシステムと技術の実施形態と対話することができる）、又はこれらのバックグラウンドパーツ、ミドルウェアパーツ又はフロントエンドパーツの任意の組み合わせを含む計算システムにおいて実行することができる。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）を介して、システムのパーツを互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）及びインターネットが含まれる。

コンピュータシステムは、クライアント側とサーバを含んでも良い。クライアント側とサーバは通常離れており、一般的に通信ネットワークを介してインタラクションを行う。対応するコンピュータにおいて実行されかつ互いにクライアント側−サーバ関係を有するコンピュータプログラムによってクライアント側とサーバとの関係を生成する。

なお、以上に示した様々な形式のプロセスを用いて、ステップを並べ替えたり、追加したり、削除したりすることができることを理解されたい。例えば、本出願書に記載の各ステップは、並列的に実行するか、順次的に実行するか、又は異なる順序で実行してもよい。本出願で開示された技術的解決手段が予期している結果を実現できる限り、本明細書では限定されない。

上記具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者であれば、設計要件とその他の要因に応じて、様々な修正、組み合わせ、一部の組み合わせ及び置き換えを行うことができることを理解されたい。本出願の精神と原則を逸脱しない限り、行われるすべての修正、置き換え及び改善等は、いずれも本出願の保護範囲に含まれるべきである。

Claims

句読点予測方法であって、
予測対象のテキストを取得するステップと、
前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第１の句読点予測結果を取得するステップであって、前記第１の句読点予測結果が、少なくとも１種の予測結果および各種の予測結果に対応する第１の得点と、前記予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含むステップと、
前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記予測結果に対応する第２の得点を得るステップと、
前記文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、前記文字の句読点存在状況を決定するステップと、
前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得るステップと、を含む、
ことを特徴とする句読点予測方法。
前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第１の句読点予測結果を取得する前記ステップは、
前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する少なくとも１種の予測結果および予測確率を取得するステップと、
各文字の各種の予測結果に対して、前記予測結果に対応する予測確率に対して逆数および対数演算を行って、前記予測結果に対応する第１の得点を得るステップと、を含む、
ことを特徴とする請求項１に記載の方法。
前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成する前記ステップは、
前記テキスト内の各文字に対して、前記文字が前記テキストの頭文字であるか否かを判断するステップと、
前記文字が前記テキストの頭文字である場合、頭文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成するステップと、
前記文字が前記テキストの頭文字ではない場合、前記頭文字でない文字の各予測結果に対して、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキスト、および前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成するステップと、を含む、
ことを特徴とする請求項１に記載の方法。
前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、および前記予測結果によって表される内容が挿入され、
前記予測結果表示文字の後に句読点が存在しない場合、前記内容は空であり、前記予測結果表示文字の後に句読点が存在する場合、前記内容は存在する句読点のタイプである、
ことを特徴とする請求項３に記載の方法。
前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、各前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、前記予測結果によって表される内容、および前記テキストないの前記頭文字でない文字の後の予め設定された数の文字が挿入される、
ことを特徴とする請求項３に記載の方法。
前記文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、前記文字の句読点存在状況を決定する前記ステップは、
前記文字の各種の予測結果に対して、前記予測結果に対応する第１の得点および第２の得点を取得するステップと、
前記第１の得点および前記第２の得点に対して重み付き加算を行って、前記予測結果に対応する総得点を得るステップと、
対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定するステップと、を含む、
ことを特徴とする請求項１に記載の方法。
前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得る前記ステップは、
前記テキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定するステップと、
前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記テキスト内の前記文字の後に句読点を追加するステップと、
前記テキスト内の各文字が処理された後、前記テキストに対応する句読点テキストを得るステップと、を含む、
ことを特徴とする請求項１に記載の方法。
句読点予測装置であって、
予測対象のテキストを取得するための取得モジュールと、
前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する第１の句読点予測結果を取得するための入力モジュールであって、前記第１の句読点予測結果が、少なくとも１種の予測結果および各種の予測結果に対応する第１の得点と、前記予測結果表示文字の後に句読点が存在するか否か、および存在する句読点のタイプとを含む入力モジュールと、
前記テキスト内の各文字に対して、前記文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、前記入力対象のテキストを予め設定された言語モデルに入力して、前記予測結果に対応する第２の得点を得るための第１の決定モジュールと、
前記文字の各種の予測結果に対応する第１の得点および第２の得点と併せて、前記文字の句読点存在状況を決定するための第２の決定モジュールと、
前記テキスト内の各文字の句読点存在状況と併せて、前記テキストに対して句読点処理を行い、前記テキストに対応する句読点テキストを得るための句読点処理モジュールと、を含む、
ことを特徴とする句読点予測装置。
前記入力モジュールは具体的に、
前記テキストを予め設定されたシーケンスラベリングモデルに入力して、前記テキスト内の各文字に対応する少なくとも１種の予測結果および予測確率を取得し、
各文字の各種の予測結果に対して、前記予測結果に対応する予測確率に対して逆数および対数演算を行って、前記予測結果に対応する第１の得点を得ることに用いられる、
ことを特徴とする請求項８に記載の装置。
前記第１の決定モジュールは具体的に、
前記テキスト内の各文字に対して、前記文字が前記テキストの頭文字であるか否かを判断し、
前記文字が前記テキストの頭文字である場合、頭文字の各種の予測結果に対して、前記テキストおよび前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成し、
前記文字が前記テキストの頭文字ではない場合、前記頭文字でない文字の各予測結果に対して、前記テキスト内の前記頭文字でない文字の前の各文字の句読点存在状況、前記テキスト、および前記予測結果と併せて、前記予測結果に対応する入力対象のテキストを生成することに用いられる、
ことを特徴とする請求項８に記載の装置。
前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、および前記予測結果によって表される内容が挿入され、
前記予測結果表示文字の後に句読点が存在しない場合、前記内容は空であり、前記予測結果表示文字の後に句読点が存在する場合、前記内容は存在する句読点のタイプである、
ことを特徴とする請求項１０に記載の装置。
前記頭文字でない文字の各種の予測結果に対応する入力対象のテキストは、前記テキスト内の前記頭文字でない文字の前の文字を含み、各前記頭文字でない文字の前の文字の後に、対応する句読点存在状況によって表される内容、前記頭文字でない文字、前記予測結果によって表される内容、および前記テキストないの前記頭文字でない文字の後の予め設定された数の文字が挿入される、
ことを特徴とする請求項１０に記載の装置。
前記第２の決定モジュールは具体的に、
前記文字の各種の予測結果に対して、前記予測結果に対応する第１の得点および第２の得点を取得し、
前記第１の得点および前記第２の得点に対して重み付き加算を行って、前記予測結果に対応する総得点を得て、
対応する総得点の最小の予測結果に基づいて、前記文字の句読点存在状況を決定することに用いられる、
ことを特徴とする請求項８に記載の装置。
前記句読点処理モジュールは具体的に、
前記テキスト内の各文字に対して、前記文字の句読点存在状況に基づいて、前記文字の後に句読点が存在するか否かを決定し、
前記文字の後に句読点が存在する場合、存在する句読点のタイプに基づいて、前記テキスト内の前記文字の後に句読点を追加し、
前記テキスト内の各文字が処理された後、前記テキストに対応する句読点テキストを得ることに用いられる、
ことを特徴とする請求項８に記載の装置。
電子機器であって、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも１つのプロセッサが請求項１〜７のいずれかに記載の方法を実行するように、前記少なくとも１つのプロセッサによって実行される、
ことを特徴とする電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、前記コンピュータに請求項１〜７のいずれかに記載の方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータプログラムであって、
前記コンピュータプログラムにおける命令が実行された場合に、請求項１〜７のいずれかに記載の方法が実行される、
ことを特徴とするコンピュータプログラム。