JP7421604B2

JP7421604B2 - モデル事前訓練方法および装置、テキスト生成方法および装置、電子機器、記憶媒体並びにコンピュータプログラム

Info

Publication number: JP7421604B2
Application number: JP2022111132A
Authority: JP
Inventors: ジュンユアンシャン; ショウフアンワン; シユディン; ヤンビンツァオ; チャオパン; ユスン
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-10-28
Filing date: 2022-07-11
Publication date: 2024-01-24
Anticipated expiration: 2042-07-11
Also published as: JP2022153441A; CN113962315B; CN113962315A; EP4174715A1; US20230040095A1

Description

本出願は人工知能技術分野に関し、特に自然言語処理および深層学習の技術分野に関する。

近年、自然言語処理技術の発展に伴い、言語モデルが人々の視野に入りつつある。言語モデルは自然言語処理において重要な位置を占めており、そのタスクは１文が言語に出現する確率を予測することである。大規模な言語モデルは超強力なテキスト生成能力を示すが、ユーザが言語モデルの生成結果を制御することは困難である。

本出願の実施形態は、モデル事前訓練方法および装置、テキスト生成方法および装置、電子機器、記憶媒体並びにコンピュータプログラムを提案する。

第１の態様では、本出願の実施形態は、サンプル自然言語テキストを取得するステップと、サンプル自然言語テキストに基づいて、Ｎ（ただし、Ｎは正の整数である）タイプのプロンプトを生成するステップと、サンプル自然言語テキストおよびＮタイプのプロンプトに基づいて、サンプル入力データを生成するステップと、サンプル入力データに基づいて、初期言語モデルを訓練して、事前訓練言語モデルを得るステップとを含むモデル事前訓練方法を提案する。

第２の態様では、本出願の実施形態は、プレフィックス・テキスト・フラグメントおよび少なくとも１タイプのプロンプトを取得するステップと、プレフィックス・テキスト・フラグメントと少なくとも１タイプのプロンプトとをスプライシングして入力データを生成するステップと、入力データを、第１の態様に記載の方法によって訓練された事前訓練言語モデルに入力し、擬似自然言語テキストを生成するステップと、を含むテキスト生成方法を提案する。

第３の態様では、本出願の実施形態は、サンプル自然言語テキストを取得するように構成される取得モジュールと、サンプル自然言語テキストに基づいて、Ｎ（ただし、Ｎは正の整数である）タイプのプロンプトを生成するように構成される第１の生成モジュールと、サンプル自然言語テキストおよびＮタイプのプロンプトに基づいて、サンプル入力データを生成するように構成される第２の生成モジュールと、サンプル入力データに基づいて初期言語モデルを訓練して、事前訓練言語モデルを得るように構成される訓練モジュールと、を備えるモデル事前訓練装置を提案する。

第４の態様では、本出願の実施形態は、プレフィックス・テキスト・フラグメントおよび少なくとも１タイプのプロンプトを取得するように構成される取得モジュールと、プレフィックス・テキスト・フラグメントと少なくとも１タイプのプロンプトとをスプライシングして入力データを生成するように構成されるスプライシングモジュールと、入力データを、第３の態様に記載の装置を用いて訓練された事前訓練言語モデルに入力し、擬似自然言語テキストを生成するように構成される生成モジュールと、を備えるテキスト生成装置を提案する。

第５の態様では、本出願の実施形態は、少なくとも１つのプロセッサと、少なくとも１つのプロセッサと通信可能に接続されたメモリとを備える電子機器であって、メモリには、少なくとも１つのプロセッサによって実行可能な指令が格納され、指令が少なくとも１つのプロセッサによって実行されると、少なくとも１つのプロセッサに第１の態様のいずれかの実施形態に記載のモデル事前訓練方法または第２の態様のいずれかの実施形態に記載のテキスト生成方法を実行させる、電子機器を提案する。

第６の態様では、本出願の実施形態は、コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、コンピュータ指令はコンピュータに第１の態様のいずれかの実施形態に記載のモデル事前訓練方法または第２の態様のいずれかの実施形態に記載のテキスト生成方法を実行させるために用いられる非一時的コンピュータ可読記憶媒体を提案する。

第７の態様では、本出願の実施形態は、プロセッサによって実行されると、第１の態様のいずれかの実施形態に記載のモデル事前訓練方法または第２の態様のいずれかの実施形態に記載のテキスト生成方法が実行されるコンピュータプログラムを提案する。

本出願の一実施形態に係るモデル事前訓練方法は、プロンプトに基づいた生成制御可能な事前訓練技術を提供し、事前訓練段階で異なる種類のデータに対してプロンプトテンプレートを設計することにより、言語モデルによるテキストの生成を改善し、モデルの制御性、解釈性、および興味性を高める。さらに、プロンプトに基づいて制御可能な生成データを構築して言語モデルを訓練することにより、下流の生成タスクに対する二次訓練を回避し、訓練コストを削減できる。

なお、発明の概要に記載された内容は、本出願の実施形態のかなめとなる特徴または重要な特徴を限定することを意図するものではなく、本出願の範囲を限定するものでもない。本出願の他の特徴は、以下の説明によって容易に理解される。

本出願の他の特徴、目的および利点は、以下の図面を参照してなされる非限定的な実施形態に係る詳細な説明を読むことにより、より明らかになる。図面は本出願をよりよく理解するために用いられ、本出願に対する限定ではない。
本出願に係るモデル事前訓練方法の一実施形態のフローチャートである。本出願に係るモデル事前訓練方法のもう一つの実施形態のフローチャートである。本出願の実施形態のモデル事前訓練方法を実現可能なシーンを示す図である。本出願に係るテキスト生成方法の一実施形態のフローチャートである。本出願に係るモデル事前訓練装置の一実施形態の構造概略図である。本出願に係るテキスト生成装置の一実施形態の構造概略図である。本出願の実施形態に係るモデル事前訓練方法またはテキスト生成方法が実現されるための電子機器のブロック図である。

以下、図面を参照して本出願の例示的な実施形態を説明し、ここで理解を助けるため、本出願の実施形態の様々な詳細を記載するが、これらは単なる例示的なものに過ぎないことを理解すべきである。従って、本出願の範囲および要旨を逸脱しない限り、当業者が本明細書の実施形態に対して様々な変更および修正を行うことができることを理解すべきである。なお、以下の説明では、明確化および簡略化のため、公知の機能および構成については説明を省略する。

なお、本出願の実施形態および実施形態における特徴は、矛盾を生じない限り、相互に組み合わせることができる。以下、図面および実施形態を参照しながら本出願を詳細に説明する。

図１は、本出願に係るモデル事前訓練方法の一実施形態のフロー１００を示している。当該モデル事前訓練方法は、次のステップを含む。

ステップ１０１では、サンプル自然言語テキストを取得する。

本実施形態では、モデル事前訓練方法の実行主体は、サンプル自然言語テキストを取得することができる。

なお、サンプル自然言語テキストは、事前訓練コーパスに由来するものであってもよい。通常、これらのテキストは品質が高く、用語が適切で、前後が連続し、言語が簡潔である。例えば、知識増強に基づくＥＲＮＩＥ（ＥｎｈａｎｃｅｄＲｅｐｒｅｓｅｎｔａｔｉｏｎｔｈｒｏｕｇｈＫｎｏｗｌｅｄｇｅＩｎｔｅｇｒａｔｉｏｎ，知識増強のセマンティック表現モデル）３．０百億パラメータ大規模モデルは、百科、捜索、小説、ＢＡＩＤＵ知道、対句古詩など、様々なデータからなる４ＴＢまでの事前訓練コーパスを構築している。サンプル自然言語テキストは、この事前訓練コーパスに由来するものであってもよい。

ステップ１０２では、サンプル自然言語テキストに基づいて、Ｎタイプのプロンプトを生成する。

本実施形態では、上記実行主体は、サンプル自然言語テキストに基づいて、Ｎタイプのプロンプトを生成することができる。ここで、Ｎは正の整数である。

通常、サンプル自然言語テキストの内容を解析することにより、Ｎタイプのプロンプトを確定することができる。Ｎタイプとしては、タスクタイプ、トピックタイプ、注目点タイプ、感情タイプおよび生成長さタイプなどが挙げられるが、これらに限定されない。

その中で、タスクタイプはさらに、質問回答、知識、対話、ユニバーサル、金融、医療、法律、対句、詩、歌曲、翻訳、数学、Ｗｅｂページ、Ｔｉｅｂａ（掲示板サービス）など、複数のタイプに細分化できる。１タスクタイプは、１つの連続的なプロンプト語彙リストを関連付けることができる。まず、サンプル自然言語テキストが属する具体的な分類のタスクタイプを確定し、そのタスクタイプに関連付けられた連続的なプロンプト語彙リストから連続的なプロンプトを取得し、サンプル自然言語テキストのタスクタイプのプロンプトとする。連続的なプロンプトは特殊文字であってもよく、それぞれの特殊文字は学習可能なパラメータである。離散プロンプトよりも連続的なプロンプトの方が汎用性が高く、それにより、モデルがより有効な特徴を学習できる。

このうち、トピックタイプは、１つのトピックタイププロンプト語彙リストに対応することができる。トピックタイププロンプト語彙リストには、国際、スポーツ、娯楽、社会、財経、時事、科学技術、科学、データ、感情、自動車、教育、ファッション、ゲーム、軍事、旅行、美食、文化、健康養生、お笑い、生活用品、アニメ、ペット、ベビー・マタニティ用品・子育て、星座運勢、歴史、音楽などのプロンプトが含まれるが、これらに限定されない。トピックタイププロンプト語彙リストから、サンプル自然言語テキストのトピックタイプのプロンプトを選択できる。トピックタイプのプロンプトにより、モデルをトピックに関するテキストを生成するように導くことができる。

このうち、注目点タイプのプロンプトは、自然言語テキスト中の人間が注目する単語（例えば人物、時間、場所、イベントなどのキーワード）が一般的である。サンプル自然言語テキストから人物、時間、場所、イベントなどのタイプのキーワードを抽出し、サンプル自然言語テキストの注目点タイプのプロンプトとする。これらのキーワードのプロンプトに基づいて、モデルはキーワードに関するテキストを生成することができる。

ここで、感情タイプのプロンプトは、ネガティブタイプ、ポジティブタイプ、およびニュートラルタイプを含んでもよい。サンプル自然言語テキストを感情分類することで、サンプル自然言語テキストの感情分類を特定することができ、その感情分類はその感情タイプのプロンプトである。感情タイプのプロンプトに基づいて、モデルを感情に関するテキストを生成するように導くことができる。

ここで、サンプル自然言語テキストの生成長さタイプのプロンプトは、サンプル自然言語テキストの長さであってもよい。生成長さプロンプトを付与することで、テキスト生成の長さを制御することができ、モデルが長すぎる内容を生成することで人為的に切断することによる不完全な意味の生成を回避することができる。

ステップ１０３では、サンプル自然言語テキストとＮタイプのプロンプトとに基づいて、サンプル入力データを生成する。

本実施形態では、上記実行主体は、サンプル自然言語テキストとＮタイプのプロンプトとに基づいて、サンプル入力データを生成することができる。

通常、サンプル自然言語テキストからサンプル・プレフィックス・テキスト・フラグメントを切り出し、Ｎタイプのプロンプトの全部または一部をサンプル・プレフィックス・テキスト・フラグメントの前に挿入することにより、サンプル入力データを生成することができる。例えば、サンプル自然言語テキストから先頭の５文字からなるサンプル・プレフィックス・テキスト・フラグメントを切り出し、サンプル・プレフィックス・テキスト・フラグメントの前にＮタイプのプロンプトを全て挿入し、サンプル入力データを得る。特殊な場合には、プレフィックス・テキスト・フラグメントを空にしてもよい。例えば、Ｎタイプのプロンプトの中から一部のタイプのプロンプトを選択し、そのままスプライシングしてサンプル入力データを得る。

ステップ１０４では、サンプル入力データに基づいて初期言語モデルを訓練して事前訓練言語モデルを得る。

本実施形態では、上記実行主体は、サンプル入力データに基づいて初期言語モデルを訓練して事前訓練言語モデルを得ることができる。

通常、サンプル入力データを初期言語モデルに入力し、サンプル擬似自然言語テキストを得ることができる。サンプル擬似自然言語テキストとサンプル自然言語テキストとの差に基づいて、モデルから出力されるサンプル擬似自然言語テキストの分布が入力されたサンプル自然言語テキストとより近似するように、初期言語モデルのパラメータを調整することができる。サンプル擬似自然言語テキストの分布がサンプル自然言語テキストと近似するほど、サンプル擬似自然言語テキストの品質が高く、事前訓練言語モデルの性能が良いことを示す。

ここで、事前訓練言語モデルは、初期言語モデルを機械学習手法とサンプル入力データを用いて訓練したものであってもよい。通常、初期言語モデルの各パラメータ（例えば、ウェイトパラメータおよびバイアスパラメータ）を、いくつかの異なる小さな乱数で初期化してもよい。「小さな乱数」を使用することにより、モデルが過大なウェイトにより飽和状態になることで訓練が失敗してしまうことを防止でき、「異なる」乱数の使用により、モデルが正常に学習できることが確保される。初期言語モデルのパラメータは、生成された疑似テキストの分布が入力された実テキストの分布により近い事前訓練言語モデルが訓練されるまで、訓練中に常に調整されることができる。例えば、ＢＰ（ＢａｃｋＰｒｏｐａｇａｔｉｏｎ，誤差逆伝播）アルゴリズムまたはＳＧＤ（ＳｔｏｃｈａｓｔｉｃＧｒａｄｉｅｎｔＤｅｓｃｅｎｔ，確率的勾配降下）アルゴリズムを使用して、初期言語モデルのパラメータを調整することができる。

本出願の一実施形態に係るモデル事前訓練方法は、プロンプトに基づいた生成制御可能な事前訓練技術を提供し、事前訓練段階で異なる種類のデータに対してプロンプトテンプレートを設計することにより、言語モデルによるテキストの生成を改善し、モデルの制御性、解釈性、および興味性を高めることができる。さらに、プロンプトに基づいて制御可能な生成データを構築して言語モデルを訓練することにより、下流の生成タスクに対する二次訓練を回避し、訓練コストを削減できる。

次に、本出願に係るモデル事前訓練方法のもう一つの実施形態のフロー２００を示す図２を参照する。当該モデル事前訓練方法は、次のステップを含む。
ステップ２０１では、サンプル自然言語テキストを取得する。

本実施形態では、ステップ２０１の動作は、図１に示す実施形態のステップ１０１に詳しく説明したので、ここではその説明を省略する。

この実施形態では、プロンプトの分類は、タスクタイプ、トピックタイプ、注目点タイプ、感情タイプ、および生成長さタイプを含んでもよい。モデル事前訓練方法の実行主体は、サンプル自然言語テキストの上記５タイプのプロンプトを取得するために、ステップ２０２～２０４、２０５、２０６、２０７、２０８を並行して実行してもよい。

ステップ２０２では、サンプル自然言語テキストの目標タスクタイプを確定する。

本実施形態では、上記実行主体は、サンプル自然言語テキストを解析して、それが属する特定の種類のタスクタイプ、すなわち目標タスクタイプを確定することができる。

その中で、タスクタイプはさらに、質問回答、知識、対話、汎用、金融、医療、法律、対句、詩、歌曲、翻訳、数学、Ｗｅｂページ、Ｔｉｅｂａ（掲示板サービス）など、複数の種類に細分化できる。

ステップ２０３では、目標タスクタイプに関連付けられる連続的なプロンプト語彙リストを取得する。

本実施形態では、上記実行主体は、目標タスクタイプに関連付けられた連続的なプロンプト語彙リストを取得することができる。

通常、１つのタスクタイプに、１つの連続的なプロンプト語彙リストを関連付けることができる。サンプル自然言語テキストの目標タスクタイプを確定すると、目標タスクタイプに関連付けられる連続的なプロンプト語彙リストを取得できる。

ステップ２０４では、目標タスクタイプに関連付けられた連続的なプロンプト語彙リストからランダムな長さの連続的なプロンプトを取得してサンプル自然言語テキストのタスクタイプのプロンプトとする。

本実施形態では、上記実行主体は、目標タスクタイプに関連付けられた連続的なプロンプト語彙リストからランダムな長さの連続的なプロンプトを取得してサンプル自然言語テキストのタスクタイプのプロンプトとすることができる。

通常、サンプル自然言語テキストのタスクタイプのプロンプトとして、目標タスクタイプに関連付けられた連続的なプロンプト語彙リストから連続的なプロンプトを取得することができる。連続的なプロンプトは特殊文字であってもよく、それぞれの特殊文字は学習可能なパラメータである。離散プロンプトよりも連続的なプロンプトの方が汎用性が高く、それにより、モデルがより有効な特徴を学習できる。例えば、ユニバーサルタスクタイプに関連付けられた連続的なプロンプト語彙リストは、＜ユニバーサル０＞から＜ユニバーサル６３＞までの連続的なプロンプトを含んでもよい。サンプル自然言語テキストのタスクタイプのプロンプトとして、ユニバーサルタスクタイプに関連付けられた連続的なプロンプト語彙リストから＜ユニバーサル０＞から＜ユニバーサルＭ＞までの連続的なプロンプトを取得してもよい。ここで、Ｍは０～６３の整数型の数字である。Ｍは、訓練段階でランダムにサンプリングされたものである。また、予測段階では選択されたＭの値が大きいほどそのタスクのパイロット信号が強いことを示す。

ステップ２０５では、サンプル自然言語テキストを事前訓練されたトピック分類モデルに入力し、サンプル自然言語テキストのトピックタイプのプロンプトを得る。

本実施形態では、上記実行主体は、サンプル自然言語テキストを事前訓練されたトピック分類モデルに入力し、サンプル自然言語テキストのトピックタイプのプロンプトを得ることができる。

このうち、トピックタイプは、１つのトピックタイププロンプト語彙リストに対応することができる。トピックタイププロンプト語彙リストには、国際、スポーツ、娯楽、社会、財経、時事、科学技術、科学、データ、感情、自動車、教育、ファッション、ゲーム、軍事、旅行、美食、文化、健康養生、お笑い、生活用品、アニメ、ペット、ベビー・マタニティ用品・子育て、星座運勢、歴史、音楽などのプロンプトが含まれるが、これらに限定されない。トピックタイプのプロンプトにより、モデルをトピックに関するテキストを生成するように導くことができる。

ここで、トピック分類モデルは、機械学習方法に基づいて訓練されたニューラルネットワークであってもよい。通常、トピック分類モデルは、ＡＰＩ（ＡｐｐｌｉｃａｔｉｏｎＰｒｏｇｒａｍｍｉｎｇＩｎｔｅｒｆａｃｅ，アプリケーションプログラミングインターフェイス）を外部に提供する従来のモデルであってもよい。上記実行主体は、ＡＰＩを呼び出すことにより、トピック分類モデルを用いて、サンプル自然言語テキストのトピックタイプのプロンプトを取得することができる。

ステップ２０６では、サンプル自然言語テキストを事前訓練された注目点抽出モデルに入力して、サンプル自然言語テキストの注目点タイプのプロンプトを得る。

本実施形態では、上記実行主体は、サンプル自然言語テキストを事前訓練された注目点抽出モデルに入力して、サンプル自然言語テキストの注目点タイプのプロンプトを得ることができる。

このうち、注目点タイプのプロンプトは、自然言語テキスト中の人々が比較的注目する単語（例えば人物、時間、場所、イベントなどのキーワード）が一般的である。サンプル自然言語テキストから人物、時間、場所、イベントなどのタイプのキーワードを抽出し、サンプル自然言語テキストの注目点タイプのプロンプトとする。これらのキーワードのプロンプトに基づいて、モデルはキーワードに関するテキストを生成することができる。

ここで、注目点抽出モデルは、機械学習方法により訓練されたニューラルネットワークであってもよい。通常、注目点抽出モデルはＡＰＩを外部に提供するための従来のモデルであってもよい。上記実行主体は、ＡＰＩを呼び出すことにより注目点抽出モデルを用いて、サンプル自然言語テキストの注目点タイプのプロンプトを取得することができる。

ステップ２０７では、サンプル自然言語テキストを事前訓練された感情解析モデルに入力して、サンプル自然言語テキストの感情タイプのプロンプトを得る。

本実施形態では、上記実行主体は、サンプル自然言語テキストを事前訓練された感情解析モデルに入力して、サンプル自然言語テキストの感情タイプのプロンプトを得ることができる。

このうち、感情解析モデルは、機械学習方法を用いて訓練されたニューラルネットワークであってもよく、サンプル自然言語テキストをネガティブ、ポジティブ、ニュートラルの３つのタイプに分類することができる。通常、感情解析モデルは、ＡＰＩを外部に提供するための従来のモデルであってもよい。上記実行主体は、ＡＰＩを呼び出すことにより、感情解析モデルを用いて、サンプル自然言語テキストの感情タイプのプロンプトを取得することができる。

ステップ２０８では、サンプル自然言語テキストの長さを、サンプル自然言語テキストの生成長さタイプのプロンプトとする。

本実施形態では、上記実行主体は、サンプル自然言語テキストの長さを、サンプル自然言語テキストの生成長さタイプのプロンプトとすることができる。

ここで、タスクタイプ、トピックタイプ、注目点タイプ、感情タイプおよび生成長さタイプの５タイプのプロンプトを構築することで、モデルが指定されたタスク、トピック、スタイルなどのテキストの生成をより効率的に完成することができ、ユーザによるテキスト生成の制御を大きく充実した。

ステップ２０９では、５タイプのプロンプトのランダムサンプリング確率をそれぞれ生成する。

本実施形態では、上記実行主体は、５タイプのプロンプトのランダムサンプリング確率をそれぞれ生成することができる。訓練段階では、５タイプのプロンプトのランダムサンプリング確率はランダムに生成されてもよい。

ステップ２１０では、５タイプのプロンプトの中からランダムサンプリング確率が予め設定された確率閾値よりも大きいプロンプトを選択する。

本実施形態では、上記実行主体は、５タイプのプロンプトの中からランダムサンプリング確率が予め設定された確率閾値よりも大きいプロンプトを選択することができる。

通常、訓練段階では、ランダムサンプリング確率が予め設定された確率閾値（例えば０．５）よりも大きい場合にのみ、このタイプのプロンプトを使用する。ランダムサンプリングでは、特定のタイプのプロンプトを用いるか否かを判定することで、モデルがテキスト生成時にプロンプトに強く依存することを防止できる。予測段階では、ユーザはあるタイプのプロンプトを使用するか否かをより多様に選択することができる。

通常、訓練段階では、以下のような制御可能な条件を用いて最適化目標を生成することができる。

ここで、
は、指示関数であり、
は、それぞれ、タスクタイプ、トピックタイプ、注目点タイプ、感情タイプ、生成長さタイプの指示関数である。ランダムサンプリング確率が０．５よりも大きい場合にのみ、このタイプのプロンプトを使用する。生成すべきｉ番目の文字は、その条件が本文中の先頭文字ｘ_＜ｉと５タイプのプロンプトに依存する。

ステップ２１１では、サンプル自然言語テキストからサンプル・プレフィックス・テキスト・フラグメントを切り出す。

本実施形態では、上記実行主体は、サンプル自然言語テキストからサンプル・プレフィックス・テキスト・フラグメントを切り出すことができる。例えば、サンプル自然言語テキストから、先頭の５文字からなるサンプル・プレフィックス・テキスト・フラグメントを切り出す。特殊な場合には、プレフィックス・テキスト・フラグメントを空にしてもよい。

ステップ２１２では、選択されたプロンプトとサンプル・プレフィックス・テキスト・フラグメントとをスプライシングして、サンプル入力データを生成する。

本実施形態では、上記実行主体は、選択されたプロンプトとサンプル・プレフィックス・テキスト・フラグメントとをスプライシングして、サンプル入力データを生成することができる。例えば、５タイプのプロンプトを全てサンプル・プレフィックス・テキスト・フラグメントの前に挿入して、サンプル入力データを得る。実際には、モデルが異なるタイプのプロンプトを正確に区別できるようにするために、各タイプのプロンプトを特殊な分割開始文字で始め、それに応じて特殊な分割終了文字で終了するようにしてもよい。例えば、＜ｔ＞、＜ｋ＞、＜ｓ＞、＜ｗ＞は、それぞれ、トピックタイプ、注目点タイプ、感情タイプおよび生成長さタイプのプロンプトの特殊な分割開始文字であり、＜／ｔ＞、＜／ｋ＞、＜／ｓ＞、＜／ｗ＞は、それぞれ、トピックタイプ、注目点タイプ、感情タイプおよび生成長さタイプのプロンプトの特殊な分割終了文字である。

ステップ２１３では、サンプル入力データを初期言語モデルに入力してサンプル擬似自然言語テキストを得る。

本実施形態では、上記実行主体は、サンプル入力データを初期言語モデルに入力してサンプル擬似自然言語テキストを得ることができる。

通常、サンプル入力データ中のプロンプトにより、モデルを関連するテキストの生成を行うように導くことができる。

ステップ２１４では、サンプル擬似自然言語テキストとサンプル自然言語テキストとの差異に基づいて、初期言語モデルのパラメータを調整し、事前訓練言語モデルを得る。

本実施形態では、上記実行主体は、サンプル擬似自然言語テキストとサンプル自然言語テキストとの差異に基づいて、初期言語モデルのパラメータを調整し、事前訓練言語モデルを得ることができる。

通常、事前訓練言語モデルから出力されるサンプル擬似自然言語テキストの分布は、パラメータの調整により、入力されたサンプル自然言語テキストにより近くなるようにされる。サンプル擬似自然言語テキストの分布がサンプル自然言語テキストと近似するほど、サンプル擬似自然言語テキストの品質が高く、事前訓練言語モデルの性能が良いことを示す。

図２から分かるように、図１の対応する実施例と比較して、本実施形態におけるモデル事前訓練方法のフロー２００では、プロンプト生成ステップ、モデル入力データ生成ステップ、およびモデル訓練ステップが強調された。このように、本実施形態に係る方案では、タスクタイプ、トピックタイプ、注目点タイプ、感情タイプおよび生成長さタイプの５タイプのプロンプトを構築することにより、モデルが指定されたタスク、トピック、スタイルなどのテキストの生成をより効率的に完成することができ、ユーザによるテキスト生成の制御を大きく充実した。また、データ増強の手段として、特定領域のデータを生成することができる。また、タスクタイプのプロンプトは連続的なプロンプトの実現方式を採用しており、離散プロンプトよりも連続的なプロンプトの方がより汎用性が高く、モデルがより有効な特徴を学習でき、離散プロンプトを人手で選択することによるテキスト生成への影響およびコストを回避できる。訓練段階では、ランダムサンプリングでは、特定のタイプのプロンプトを用いるか否かを判定することで、モデルがテキスト生成時にプロンプトに強く依存することを防止できる。予測段階では、ユーザはあるタイプのプロンプトを使用するか否かをより多様に選択することができる。サンプル擬似自然言語テキストとサンプル自然言語テキストとの差異に基づいてパラメータを調整することにより、事前訓練言語モデルから出力されるサンプル擬似自然言語テキストの分布が、入力されたサンプル自然言語テキストにより近くなり、事前訓練言語モデルの性能が向上された。

理解を助けるために、図３は本出願の実施形態のモデル事前訓練方法を実現可能なシーンの図を示している。図３に示すように、サンプル自然言語テキストの内容を解析し確定されたタスクタイプのプロンプトは、＜ユニバーサル０＞＜ユニバーサル１＞…＜ユニバーサルＭ＞であり、ここで、Ｍは０～６３の整数型の数字であり、トピックタイプのプロンプトは、スポーツであり、注目点タイプのプロンプトは、ランパード、チェルシー、ＵＥＦＡチャンピオンズリーグ（ＵＥＦＡＣｈａｍｐｉｏｎｓＬｅａｇｕｅ）であり、感情タイプのプロンプトは、ネガティブ；生成長さタイプのプロンプトは、全文約８５文字である。以上の５タイプのプロンプトをサンプル自然言語テキストのオリジナル本文の前に挿入し、「＜ユニバーサル０＞＜ユニバーサル１＞…＜ユニバーサルＭ＞＜ｔ＞スポーツ＜／ｔ＞＜ｋ＞ランパード、チェルシー、ＵＥＦＡチャンピオンズリーグ＜／ｋ＞＜ｓ＞ネガティブ＜／ｓ＞＜ｗ＞全文約８５文字＜／ｗ＞オリジナル本文」というサンプル入力データを得る。サンプル入力データをＥＲＮＩＥ３．０に入力し、「ランパードのエージェントは４日、このイングランドのサッカー選手はシーズンの終わりにチェルシーを離れることは間違いないが、中国での発展をする予定がない。あと数カ月で、３４歳のランパードはＵＥＦＡチャンピオンズリーグの優勝者であるチェルシーとの契約が満期になるが、双方とも現在、再契約にあまり興味がないと述べた」というサンプル擬似自然言語テキストを出力する。サンプル擬似自然言語テキストとサンプル自然言語テキストとの分布の差異に基づいて、ＥＲＮＩＥ３．０のパラメータを調整して、事前訓練言語モデルを得ることができる。

さらに、本出願に係るテキスト生成方法の一実施形態のフロー４００を示す図４を参照する。当該テキスト生成方法は、次のステップを含む。

ステップ４０１では、プレフィックス・テキスト・フラグメントおよび少なくとも１タイプのプロンプトを取得する。

本実施形態では、テキスト生成方法の実行主体は、プレフィックス・テキスト・フラグメントと、少なくとも１タイプのプロンプトとを取得することができる。
ここで、プレフィックス・テキスト・フラグメントは、任意の不完全なテキストフラグメントであってもよい。少なくとも１タイプのプロンプトは、ユーザが生成ニーズに応じて入力したプロンプトであってもよい。ユーザは、１タイプのプロンプトを入力してもよいし、複数タイプのプロンプトを入力してもよい。予測段階では、ユーザはあるタイプのプロンプトを使用するか否かをより多様に選択することができる。ここで、プレフィックス・テキスト・フラグメントと少なくとも１タイプのプロンプトとに基づいて、関連する完全な自然言語テキストを生成する必要がある。

ステップ４０２では、プレフィックス・テキスト・フラグメントと少なくとも１タイプのプロンプトとをスプライシングして入力データを生成する。

本実施形態では、上記実行主体は、プレフィックス・テキスト・フラグメントと少なくとも１タイプのプロンプトとをスプライシングして入力データを生成することができる。例えば、ユーザが入力したプロンプトをすべてプレフィックス・テキスト・フラグメントの前に挿入することで、入力データを得ることができる。実際には、モデルが異なるタイプのプロンプトを正確に区別できるようにするために、各タイプのプロンプトを特殊な分割開始文字で始め、それに応じて特殊な分割終了文字で終了するようにしてもよい。

ステップ４０３では、入力データを事前訓練された事前訓練言語モデルに入力し、擬似自然言語テキストを生成する。

本実施形態では、上記実行主体は、入力データを事前訓練された事前訓練言語モデルに入力し、擬似自然言語テキストを生成することができる。

ここで、事前訓練言語モデルは、図１または図２に示した方法を用いた実施形態で訓練したものであってもよい。事前訓練言語モデルは、プレフィックス・テキスト・フラグメントと少なくとも１タイプのプロンプトとに基づいて、関連する完全な擬似テキストを生成するために用いられてもよい。

本出願の一実施形態に係るテキスト生成方法は、事前訓練段階で、様々なタイプのデータに対してプロンプトテンプレートを設計することにより、言語モデルにより生成されたテキストがより高品質になり、モデルの制御性、解釈性および興味性を向上した。ユーザは、少なくとも１タイプのプロンプトを入力することにより、関連するテキストを生成するようにモデルを導くことができる。

更に図５を参照すると、上記の各図に示された方法の実施態様として、本出願は、モデル事前訓練装置の第１の実施形態を提供し、当該装置の実施形態は、図１に示された方法の実施形態に対応しており、当該装置は、具体的に様々な電子機器に適用することができる。

図５に示すように、本実施形態のモデル事前訓練装置５００は、取得モジュール５０１と、第１の生成モジュール５０２と、第２の生成モジュール５０３と、訓練モジュール５０４とを備えてもよい。このうち、取得モジュール５０１は、サンプル自然言語テキストを取得するように構成される。第１の生成モジュール５０２は、サンプル自然言語テキストに基づいて、Ｎ（ただし、Ｎは正の整数である）タイプのプロンプトを生成するように構成される。第２の生成モジュール５０３は、サンプル自然言語テキストおよびＮタイプのプロンプトに基づいて、サンプル入力データを生成するように構成される。訓練モジュール５０４は、サンプル入力データに基づいて初期言語モデルを訓練して、事前訓練言語モデルを得るように構成される。

本実施形態では、モデル事前訓練装置５００において、取得モジュール５０１と、第１の生成モジュール５０２と、第２の生成モジュール５０３と、訓練モジュール５０４の具体的な処理およびそれらによってもたらされる技術的効果は、それぞれ図１の対応する実施形態におけるステップ１０１～１０４の関連する記述を参照することができ、ここでその説明を省略する。

本実施形態のいくつかのオプション的な実施形態では、プロンプトにはタスクタイプを含み、第１の生成モジュール５０２は、さらに、サンプル自然言語テキストの目標タスクタイプを確定するステップと、目標タスクタイプに関連付けられた連続的なプロンプト語彙リストを取得するステップであって、１タスクタイプに１つの連続的なプロンプト語彙リストが関連付けられる、ステップと、目標タスクタイプに関連付けられた連続的なプロンプト語彙リストからランダムな長さの連続的なプロンプトを取得してサンプル自然言語テキストのタスクタイプのプロンプトとするステップと、を行うように構成される。

本実施形態のいくつかのオプション的な実施形態では、プロンプトはトピックタイプを含み、第１の生成モジュール５０２はさらに、サンプル自然言語テキストを事前訓練されたトピック分類モデルに入力し、サンプル自然言語テキストのトピックタイプのプロンプトを得るように構成される。

本実施形態のいくつかのオプション的な実施形態では、プロンプトは、注目点タイプを含み、第１の生成モジュール５０２は、さらに、サンプル自然言語テキストを事前訓練された注目点抽出モデルに入力して、サンプル自然言語テキストの注目点タイプのプロンプトを得るように構成される。

本実施形態のいくつかのオプション的な実施形態では、プロンプトは、感情タイプを含み、第１の生成モジュール５０２は、サンプル自然言語テキストを事前訓練された感情解析モデルに入力して、サンプル自然言語テキストの感情タイプのプロンプトを得るようにさらに構成される。

本実施形態のいくつかのオプション的な実施形態では、プロンプトは、生成長さタイプを含み、第１の生成モジュール５０２は、サンプル自然言語テキストの長さを、サンプル自然言語テキストの生成長さタイプのプロンプトとするようにさらに構成される。

本実施形態のいくつかのオプション的な実施形態では、第２の生成モジュール５０３は、Ｎタイプのプロンプトのランダムサンプリング確率をそれぞれ生成するステップと、Ｎタイプのプロンプトの中から、ランダムサンプリング確率が予め設定された確率閾値よりも大きいプロンプトを選択するステップと、サンプル自然言語テキストから、サンプル・プレフィックス・テキスト・フラグメントを切り出すステップと、選択されたプロンプトとサンプル・プレフィックス・テキスト・フラグメントとをスプライシングして、サンプル入力データを生成するステップと、を行うようにさらに構成される。

本実施形態のいくつかのオプション的な実施形態では、訓練モジュール５０４は、サンプル入力データを初期言語モデルに入力して、サンプル擬似自然言語テキストを取得し、サンプル擬似自然言語テキストとサンプル自然言語テキストとの差異に基づいて、初期言語モデルのパラメータを調整し、事前訓練言語モデルを得るようにさらに構成される。

更に図６を参照すると、上記の各図に示された方法の実施態様として、本出願は、テキスト生成装置の第１の実施形態を提供し、当該装置の実施形態は、図４に示された方法の実施形態に対応しており、当該装置は、具体的に様々な電子機器に適用することができる。

図６に示すように、本実施形態のテキスト生成装置６００は、取得モジュール６０１、スプライシングモジュール６０２および生成モジュール６０３を備えてもよい。このうち、取得モジュール６０１は、プレフィックス・テキスト・フラグメントおよび少なくとも１タイプのプロンプトを取得するように構成される。スプライシングモジュール６０２は、プレフィックス・テキスト・フラグメントと少なくとも１タイプのプロンプトとをスプライシングして入力データを生成するように構成される。生成モジュール６０３は、入力データを、図５に示す装置の実施形態を用いて訓練された事前訓練言語モデルに入力し、擬似自然言語テキストを生成するように構成される。

本実施形態では、テキスト生成装置６００における取得モジュール６０１と、スプライシングモジュール６０２と、生成モジュール６０３の具体的な処理およびそれらによってもたらされる技術的効果は、それぞれ図４の対応する実施形態におけるステップ４０１～４０３の関連する記述を参照することができ、ここでその説明を省略する。

本出願の技術方案では、関連するユーザ個人情報の収集、記憶、使用、加工、伝送、提供および公開などの処理は、いずれも関連法律法規の規定に準拠し、且つ公序良俗に反しない。

本出願の実施形態によれば、本出願はさらに電子機器、読み取り可能な記憶媒体およびコンピュータプログラム製品を提供する。

図７は、本出願の実施形態を実施するために使用できる例示的な電子機器７００の概略ブロック図を示している。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレード型サーバ、メインフレームコンピュータおよびその他の適切なコンピュータ等の様々な形態のデジタルコンピュータを表す。また、電子機器は、個人デジタル処理、携帯電話、スマートフォン、ウェアラブル機器およびその他の類似するコンピューティングデバイス等の様々な形態のモバイルデバイスを表すことができる。なお、ここで示したコンポーネント、それらの接続関係、およびそれらの機能はあくまでも例示であり、ここで記述および／または要求した本出願の実施形態を限定することを意図するものではない。

図７に示すように、電子機器７００は、読み出し専用メモリ（ＲＯＭ）７０２に記憶されているコンピュータプログラムまたはストレージユニット７０８からランダムアクセスメモリ（ＲＡＭ）７０３にロードされたコンピュータプログラムによって様々な適当な動作および処理を実行することができる計算ユニット７０１を備える。ＲＡＭ７０３には、機器７００の動作に必要な様々なプログラムおよびデータがさらに記憶されることが可能である。コンピューティングユニット７０１、ＲＯＭ７０２およびＲＡＭ７０３は、バス７０４を介して互いに接続されている。入／出力（Ｉ／Ｏ）インターフェース７０５もバス７０４に接続されている。

電子機器７００において、キーボード、マウスなどの入力ユニット７０６と、様々なタイプのディスプレイ、スピーカなどの出力ユニット７０７と、磁気ディスク、光ディスクなどのストレージユニット７０８と、ネットワークプラグイン、モデム、無線通信送受信機などの通信ユニット７０９とを含む複数のコンポーネントは、Ｉ／Ｏインターフェース７０５に接続されている。通信ユニット７０９は、機器７００がインターネットなどのコンピュータネットワークおよび／または様々な電気通信ネットワークを介して他の装置と情報またはデータのやりとりを可能にする。

計算ユニット７０１は、処理および計算機能を有する様々なユニバーサルおよび／または専用処理コンポーネントであってもよい。計算ユニット７０１のいくつかの例示として、中央処理装置（ＣＰＵ）、グラフィックスプロセシングユニット（ＧＰＵ）、様々な専用人工知能（ＡＩ）計算チップ、機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタルシグナルプロセッサ（ＤＳＰ）、および任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット７０１は、上述したモデル事前訓練方法またはテキスト生成方法のような様々な方法および処理を実行する。例えば、いくつかの実施形態では、モデル事前訓練方法またはテキスト生成方法は、記憶ユニット７０８などの機械可読媒体に有形に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施形態では、コンピュータプログラムの一部または全部は、ＲＯＭ７０２および／または通信ユニット７０９を介して機器７００にロードおよび／またはインストールされてもよい。コンピュータプログラムがＲＡＭ７０３にロードされ、計算ユニット７０１によって実行されると、上述したモデル事前訓練方法またはテキスト生成方法の１つまたは複数のステップを実行可能である。あるいは、他の実施形態では、計算ユニット７０１は、他の任意の適切な形態によって（例えば、ファームウェアを介して）モデル事前訓練方法またはテキスト生成方法を実行するように構成されてもよい。

ここで説明するシステムおよび技術の様々な実施形態はデジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックスプログラマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、および／またはそれらの組み合わせにおいて実現することができる。これらの各実施形態は、１つまたは複数のコンピュータプログラムに実装され、当該１つまたは複数のコンピュータプログラムは少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行および／または解釈することができ、当該プログラマブルプロセッサは専用または汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも１つの入力装置および少なくとも１つの出力装置からデータおよび指令を受信することができ、且つデータおよび指令を当該記憶システム、当該少なくとも１つの入力装置および当該少なくとも１つの出力装置に伝送することを含み得る。

本出願の方法を実施するためのプログラムコードは、１つまたは複数のプログラミング言語のあらゆる組み合わせで作成されてもよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、または他のプログラミング可能なデータ処理装置のプロセッサまたはコントローラに提供されることができ、これらのプログラムコードがプロセッサまたはコントローラによって実行されると、フローチャートおよび／またはブロック図に規定された機能または動作が実施される。プログラムコードは、完全にデバイス上で実行されることも、部分的にデバイス上で実行されることも、スタンドアロンソフトウェアパッケージとして部分的にデバイス上で実行されながら部分的にリモートデバイス上で実行されることも、または完全にリモートデバイスもしくはサーバ上で実行されることも可能である。

本出願のコンテキストでは、機械可読媒体は、有形の媒体であってもよく、指令実行システム、装置または機器が使用するため、または指令実行システム、装置または機器と組み合わせて使用するためのプログラムを含むか、または記憶することができる。機械可読媒体は、機械可読信号媒体または機械可読記憶媒体であり得る。機械可読媒体は、電子的、磁気的、光学的、電磁的、赤外線の、または半導体のシステム、装置または機器、またはこれらのあらゆる適切な組み合わせを含むことができるが、これらに限定されない。機械可読記憶媒体のより具体的な例には、１本または複数本のケーブルに基づく電気的接続、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、光ファイバ、コンパクトディスク読み取り専用メモリ（ＣＤ?ＲＯＭ）、光学記憶装置、磁気記憶装置、またはこれらのあらゆる適切な組み合わせが含まれ得る。

ユーザとのインタラクションを提供するために、ここで説明するシステムと技術は、ユーザに情報を表示するための表示装置（例えば、陰極線管（ＣａｔｈｏｄｅＲａｙＴｕｂｅ，ＣＲＴ）またはＬＣＤ（液晶ディスプレイ）モニタ）と、キーボードおよびポインティングデバイス（例えば、マウスまたはトラックボール）とを備えるコンピュータ上で実装することができ、ユーザが該キーボードおよび該ポインティングデバイスを介してコンピュータに入力を提供できる。他の種類の装置もユーザとのやりとりを行うことに用いることができる。例えば、ユーザに提供されるフィードバックは、例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバックであるいかなる形態のセンシングフィードバックであってもよく、且つ音入力、音声入力若しくは触覚入力を含むいかなる形態でユーザからの入力を受信してもよい。

ここで記述したシステムおよび技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバ）に実施されてもよく、またはミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）に実施されてもよく、またはフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインターフェースまたはウェブブラウザを有するユーザコンピュータ）に実施されてもよく、ユーザは該グラフィカルユーザインターフェースまたはウェブブラウザを介してここで説明したシステムおよび技術の実施形態とインタラクションしてもよく、またはこのようなバックエンドコンポーネント、ミドルウェアコンポーネントまたはフロントエンドコンポーネントのいずれかの組み合わせを含むコンピューティングシステムに実施されてもよい。また、システムの各コンポーネントの間は、通信ネットワーク等の任意の形態または媒体を介してデジタルデータ通信により接続されていてもよい。通信ネットワークとしては、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）およびインターネットなどを含む。

コンピュータシステムは、クライアントとサーバとを含んでもよい。クライアントとサーバは、通常、互いに離れており、通信ネットワークを介してやりとりを行う。クライアントとサーバとの関係は、互いにクライアント－サーバの関係を有するコンピュータプログラムをそれぞれのコンピュータ上で動作することによって生成される。サーバはクラウドサーバであってもよく、分散システムのサーバ、あるいはブロックチェーンを結合したサーバであってもよい。

なお、上述した様々な形態のフローを用いて、ステップを並び替え、追加または削除を行うことができることを理解すべきである。例えば、本に記載された各ステップは、提供に開示された技術方案の所望の結果が達成できる限り、並行して実行されてもよく、順番に実行されてもよく、異なる順番で実行されてもよい。本明細書はここで制限しない。

上記具体的な実施形態は、本出願の保護範囲を限定するものではない。当業者であれば、設計要件および他の要因に従って、様々な修正、組み合わせ、副次的な組み合わせ、および置換を行うことができることを理解すべきである。本出願の趣旨および原理を逸脱せずに行われたあらゆる修正、均等な置換および改善などは、いずれも本出願の保護範囲内に含まれるべきである。

Claims

モデル事前訓練装置により実行されるモデル事前訓練方法であって、
サンプル自然言語テキストを取得するステップと、
前記サンプル自然言語テキストに基づいて、Ｎ（ただし、Ｎは正の整数である）タイプのプロンプトを生成するステップと、
前記サンプル自然言語テキストおよび前記Ｎタイプのプロンプトに基づいて、サンプル入力データを生成するステップと、
前記サンプル入力データに基づいて初期言語モデルを訓練して、事前訓練言語モデルを得るステップと、
を含み、
前記サンプル自然言語テキストおよび前記Ｎタイプのプロンプトに基づいて、サンプル入力データを生成するステップは、
前記Ｎタイプのプロンプトのランダムサンプリング確率をそれぞれ生成するステップと、
前記Ｎタイプのプロンプトの中から、ランダムサンプリング確率が予め設定された確率閾値よりも大きいプロンプトを選択するステップと、
前記サンプル自然言語テキストから、サンプル・プレフィックス・テキスト・フラグメントを切り出すステップと、
選択されたプロンプトと前記サンプル・プレフィックス・テキスト・フラグメントとをスプライシングして、前記サンプル入力データを生成するステップと、
を含む、モデル事前訓練方法。
プロンプトにはタスクタイプのプロンプトが含まれ、
前記サンプル自然言語テキストに基づいて、Ｎタイプのプロンプトを生成するステップは、
前記サンプル自然言語テキストの目標タスクタイプを確定するステップと、
前記目標タスクタイプに関連付けられた連続的なプロンプト語彙リストを取得するステップであって、１タスクタイプに１つの連続的なプロンプト語彙リストが関連付けられる、ステップと、
前記目標タスクタイプに関連付けられた連続的なプロンプト語彙リストからランダムな長さの連続的なプロンプトを取得して前記サンプル自然言語テキストのタスクタイプのプロンプトとするステップと、
を含む請求項１に記載のモデル事前訓練方法。
プロンプトにはトピックタイプのプロンプトが含まれ、
前記サンプル自然言語テキストに基づいて、Ｎタイプのプロンプトを生成するステップは、
前記サンプル自然言語テキストを事前訓練されたトピック分類モデルに入力して、前記サンプル自然言語テキストのトピックタイプのプロンプトを取得するステップを含む、請求項１に記載のモデル事前訓練方法。
プロンプトには注目点タイプのプロンプトが含まれ、
前記サンプル自然言語テキストに基づいて、Ｎタイプのプロンプトを生成するステップは、
前記サンプル自然言語テキストを事前訓練された注目点抽出モデルに入力して、前記サンプル自然言語テキストの注目点タイプのプロンプトを取得するステップを含む、請求項１に記載のモデル事前訓練方法。
プロンプトには感情タイプのプロンプトが含まれ、
前記サンプル自然言語テキストに基づいて、Ｎタイプのプロンプトを生成するステップは、
前記サンプル自然言語テキストを事前訓練された感情解析モデルに入力して、前記サンプル自然言語テキストの感情タイプのプロンプトを取得するステップを含む、請求項１に記載のモデル事前訓練方法。
プロンプトには生成長さタイプのプロンプトが含まれ、
前記サンプル自然言語テキストに基づいて、Ｎタイプのプロンプトを生成するステップは、
前記サンプル自然言語テキストの長さを、前記サンプル自然言語テキストの生成長さタイプのプロンプトとするステップを含む、請求項１に記載のモデル事前訓練方法。
前記サンプル入力データに基づいて初期言語モデルを訓練して、事前訓練言語モデルを得るステップは、
前記サンプル入力データを初期言語モデルに入力して、サンプル擬似自然言語テキストを得るステップと、
前記サンプル擬似自然言語テキストと前記サンプル自然言語テキストとの差異に基づいて、前記初期言語モデルのパラメータを調整して、前記事前訓練言語モデルを得るステップと、
を含む、請求項１に記載のモデル事前訓練方法。
テキスト生成装置により実行されるテキスト生成方法であって、
プレフィックス・テキスト・フラグメントおよび少なくとも１タイプのプロンプトを取得するステップと、
前記プレフィックス・テキスト・フラグメントと前記少なくとも１タイプのプロンプトとをスプライシングして入力データを生成するステップと、
請求項１～７のいずれか１項に記載のモデル事前訓練方法により訓練された事前訓練言語モデルに前記入力データを入力し、擬似自然言語テキストを生成するステップと、
を含むテキスト生成方法。
サンプル自然言語テキストを取得するように構成される取得モジュールと、
前記サンプル自然言語テキストに基づいて、Ｎ（ただし、Ｎは正の整数である）タイプのプロンプトを生成するように構成される第１の生成モジュールと、
前記サンプル自然言語テキストおよび前記Ｎタイプのプロンプトに基づいて、サンプル入力データを生成するように構成される第２の生成モジュールと、
前記サンプル入力データに基づいて初期言語モデルを訓練して、事前訓練言語モデルを得るように構成される訓練モジュールと、
を備え、
前記第２の生成モジュールは、
前記Ｎタイプのプロンプトのランダムサンプリング確率をそれぞれ生成するステップと、
前記Ｎタイプのプロンプトの中から、ランダムサンプリング確率が予め設定された確率閾値よりも大きいプロンプトを選択するステップと、
前記サンプル自然言語テキストから、サンプル・プレフィックス・テキスト・フラグメントを切り出すステップと、
選択されたプロンプトと前記サンプル・プレフィックス・テキスト・フラグメントとをスプライシングして、前記サンプル入力データを生成するステップと、
を行うようにさらに構成される、モデル事前訓練装置。
プロンプトにはタスクタイプのプロンプトが含まれ、
前記第１の生成モジュールは、
前記サンプル自然言語テキストの目標タスクタイプを確定するステップと、
前記目標タスクタイプに関連付けられた連続的なプロンプト語彙リストを取得するステップであって、１タスクタイプに１つの連続的なプロンプト語彙リストが関連付けられる、ステップと、
前記目標タスクタイプに関連付けられた連続的なプロンプト語彙リストからランダムな長さの連続的なプロンプトを取得して前記サンプル自然言語テキストのタスクタイプのプロンプトとするステップと、
を行うようにさらに構成される請求項９に記載のモデル事前訓練装置。
プロンプトにはトピックタイプのプロンプトが含まれ、
前記第１の生成モジュールは、
前記サンプル自然言語テキストを事前訓練されたトピック分類モデルに入力して、前記サンプル自然言語テキストのトピックタイプのプロンプトを取得するようにさらに構成される請求項９に記載のモデル事前訓練装置。
プロンプトには注目点タイプのプロンプトが含まれ、
前記第１の生成モジュールは、
前記サンプル自然言語テキストを事前訓練された注目点抽出モデルに入力して、前記サンプル自然言語テキストの注目点タイプのプロンプトを取得するようにさらに構成される請求項９に記載のモデル事前訓練装置。
プロンプトにはトピックタイプのプロンプトが含まれ、
前記第１の生成モジュールは、
前記サンプル自然言語テキストを事前訓練された感情解析モデルに入力して、前記サンプル自然言語テキストの感情タイプのプロンプトを取得するようにさらに構成される請求項９に記載のモデル事前訓練装置。
プロンプトには生成長さタイプのプロンプトが含まれ、
前記第１の生成モジュールは、
前記サンプル自然言語テキストの長さを、前記サンプル自然言語テキストの生成長さタイプのプロンプトとするようにさらに構成される請求項９に記載のモデル事前訓練装置。
前記訓練モジュールは、
前記サンプル入力データを初期言語モデルに入力して、サンプル擬似自然言語テキストを得るステップと、
前記サンプル擬似自然言語テキストと前記サンプル自然言語テキストとの差異に基づいて、前記初期言語モデルのパラメータを調整して、前記事前訓練言語モデルを得るステップと、
を行うようにさらに構成される、請求項９に記載のモデル事前訓練装置。
プレフィックス・テキスト・フラグメントおよび少なくとも１タイプのプロンプトを取得するように構成される取得モジュールと、
前記プレフィックス・テキスト・フラグメントと前記少なくとも１タイプのプロンプトとをスプライシングして入力データを生成するように構成されるスプライシングモジュールと、
請求項９～１５のいずれか１項に記載のモデル事前訓練装置を用いて訓練された事前訓練言語モデルに前記入力データを入力し、擬似自然言語テキストを生成するように構成される生成モジュールと、
を備えるテキスト生成装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信接続されたメモリとを備える電子機器であって、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な指令が格納され、前記指令が前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサに請求項１～７のいずれか１項に記載のモデル事前訓練方法を実行させる、電子機器。
コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、
前記コンピュータ指令はコンピュータに請求項１～７のいずれか１項に記載のモデル事前訓練方法を実行させるために用いられる非一時的コンピュータ可読記憶媒体。
プロセッサによって実行されると、請求項１～７のいずれか１項に記載のモデル事前訓練方法が実現されるコンピュータプログラム。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信接続されたメモリとを備える電子機器であって、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な指令が格納され、前記指令が前記少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサに請求項８に記載のテキスト生成方法を実行させる、電子機器。
コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、
前記コンピュータ指令はコンピュータに請求項８に記載のテキスト生成方法を実行させるために用いられる非一時的コンピュータ可読記憶媒体。
プロセッサによって実行されると、請求項８に記載のテキスト生成方法が実現されるコンピュータプログラム。