JP6979899B2

JP6979899B2 - 生成装置、学習装置、生成方法、学習方法、生成プログラム、及び学習プログラム

Info

Publication number: JP6979899B2
Application number: JP2018023226A
Authority: JP
Inventors: 直也村上; 一真村尾; 毅司増山; 隼人小林; 健小林; 太一谷塚; 立日暮; 学明神; 伸幸清水; ジャンウィラゴタマプトラ
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2017-09-20
Filing date: 2018-02-13
Publication date: 2021-12-15
Anticipated expiration: 2038-02-13
Also published as: JP2019057266A

Description

本発明は、生成装置、学習装置、生成方法、学習方法、生成プログラム、学習プログラム、及びモデルに関する。

テキストを装置に生成させる技術が知られている。例えば、装置に文書の要約文を生成させる技術が知られている。装置にテキストを生成させることで、人がテキストを生成する手間を省くことができる。

特開平１１−１０２３７２号公報

テキストの生成は、すでにあるテキストに所定の処理を加えることにより生成される。しかし、生成元のテキストに曖昧な表現が含まれていたり、生成元のテキストの情報量が少なかったりすると、精度（例えば、正確性）の高いテキストの生成は困難となる。

本願は、上記に鑑みてなされたものであって、精度が高いテキストを生成できるようにすることを目的とする。

本願に係る生成装置は、第１のテキスト及び該第１のテキストの元のテキストである第２のテキストを取得する取得部と、第１のテキストと第２のテキストとに基づいて、第１のテキスト或いは第２のテキストに対応するテキストであって所定の条件を満たす第３のテキストを生成する生成部と、を備える。

実施形態の一態様によれば、精度が高いテキストを生成できるようにすることができる。

図１は、実施形態に係る情報処理装置が実行する処理の一例を示す図である。図２は、コンテンツが表示された端末装置を示す図である。図３は、学習データデータベースに登録される学習データの一例を示す図である。図４は、モデルの一例を示す図である。図５は、モデルの他の例を示す図である。図６は、第２のモデルの構成例を示す図である。図７は、モデルの他の例を示す図である。図８は、関連テキストを説明するための図である。図９は、実施形態に係る情報処理装置が実行する処理の他の例を示す図である。図１０は、抽出テキストを説明するための図である。図１１は、実施形態に係る情報処理装置の構成例を示す図である。図１２は、学習データデータベースに登録される情報の一例を示す図である。図１３は、モデルデータベースに登録される情報の一例を示す図である。図１４は、コンテンツ情報データベースに登録される情報の一例を示す図である。図１５は、学習処理の一例を示すフローチャートである。図１６は、生成処理の一例を示すフローチャートである。図１７は、学習処理の他の例を示すフローチャートである。図１８は、生成処理の他の例を示すフローチャートである。図１９は、複数のエンコーダの出力を合成する様子を示す図である。図２０は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

以下に、本願に係る学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデルを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、以下の実施形態により本願に係る学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデルが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

〔実施形態１〕
〔１−１．情報処理装置の一例〕
最初に、生成装置および学習装置の一例である情報処理装置が実行する学習処理および生成処理の一例について説明する。図１は、実施形態に係る情報処理装置が実行する処理の一例を示す図である。情報処理装置１０は、インターネット等の所定のネットワークを介して、所定のクライアントが使用するデータサーバ２０および端末装置３０と通信可能である。

情報処理装置１０は、後述の学習処理及び生成処理を実行する装置である。情報処理装置１０は、サーバ装置やクラウドシステム等により実現される。

データサーバ２０は、情報処理装置１０が後述する学習処理を実行する際に用いる学習データや、情報処理装置１０が後述する生成処理を実行する際に出力する配信コンテンツを管理する情報処理装置である。データサーバ２０は、サーバ装置やクラウドシステム等により実現される。データサーバ２０は、例えば、端末装置３０に対してニュースや、利用者によって投稿された各種のコンテンツを配信する配信サービスを実行する。このような配信サービスは、例えば、各種ニュースの配信サイトやＳＮＳ（Social Networking Service）等により実現される。

端末装置３０は、スマートフォンやタブレット等のスマートデバイスであり、３Ｇ（3rd Generation）やＬＴＥ（Long Term Evolution）等の無線通信網を介して任意のサーバ装置と通信を行うことができる携帯端末装置である。なお、端末装置３０は、スマートデバイスのみならず、デスクトップＰＣ（Personal Computer）やノートＰＣ等の情報処理装置であってもよい。

〔１−２．要約コンテンツの配信について〕
ここで、データサーバ２０は、配信対象となる配信コンテンツが複数存在する場合には、各コンテンツを全て配信するのではなく、各コンテンツの要約となるテキストが含まれる要約コンテンツを端末装置３０へと配信することがある。配信コンテンツは、例えば、情報媒体或いは情報の配信主体から取得したニュース記事である。一例として、要約コンテンツは、配信コンテンツへのリンクが張られたポータルサイトのトップページである。

なお、情報媒体とは、情報の配信媒体或いは掲載媒体を示す情報であり、例えば、“新聞”、“雑誌”等を示す情報である。また、配信主体とは、ニュース記事等の情報を配信する組織或いは個人である。例えば、配信主体は、新聞社、出版社、放送局（テレビ局、ラジオ局）等のマスメディアである。勿論、配信主体はマスメディアに限定されない。配信主体は、ポータルサイトの運営者であってもよいし、携帯電話会社であってもよい。配信主体は、情報処理装置１０の運営者自身であってもよい。

図２は、コンテンツが表示された端末装置３０を示す図である。図２の状態Ｊ１は、ポータルサイトのトップページが表示された様子を示す図であり、図２の状態Ｊ２は、配信コンテンツＣ１１を含むページが表示された様子を示す図である。配信コンテンツＣ１１は、例えば、所定の配信主体から情報処理装置１０の運営者（例えば、ポータルサイトの運営者）が取得したニュース記事である。状態Ｊ１に示す端末装置３０には、記事へのリンクが張られたタイルが複数配置されたページが表示されている。各タイルには、配信コンテンツの内容を示すテキスト（以下、見出しという。）が表示されている。例えば、縦一列に並ぶ複数のタイルの一番上のタイルには、見出しＵ１１が表示されている。見出しＵ１１は配信コンテンツＣ１１の内容に対応するテキストである。ユーザが見出しＵ１１が表示されたタイルをタップすると、端末装置３０には、配信コンテンツＣ１１を含む画面が表示される。配信コンテンツＣ１１には、記事の本文Ｋ１１と、記事のタイトルＴ１１が含まれている。

配信コンテンツに対応付けられるテキスト（例えば、ポータルサイトのトップページに掲載される見出し）は、配信コンテンツの内容に基づいて人が作成する。例えば、見出しＵ１１は、配信コンテンツＣ１１に含まれるタイトルＴ１１をポータルサイトの運営者の従業員が読んで要約することにより作成される。しかしながら、配信コンテンツごとに、人手で見出しを生成するのは、手間がかかる。

そこで、各種情報が有する特徴を学習した学習モデル（以下、単にモデルという。）を用いて、配信コンテンツから見出しを自動的に生成することが考えらえる。例えば、配信コンテンツに含まれるテキスト（例えば、タイトル）から、見出しとなるタイトルを自動的に生成することが考えられる。

精度が高い見出し（例えば、正確性が高い見出し）を作成するには、精度が高いモデルの生成が必要となる。モデルの学習には、学習データとなるテキストの組（例えば、タイトルと見出しの組）が必要となる。しかし、学習データとなるテキスト（例えば、タイトル）に曖昧な表現が含まれていたり、学習データとなるテキストの情報量が少なかったりすることが多くある。この場合、精度の高いモデルの生成は困難である。例え精度の高いモデルが生成されたとしても、曖昧な表現が含まれるテキストや情報量の少ないテキストからは精度の高い見出しの生成は困難である。

タイトルの元のテキスト（例えば、タイトルが付された記事の本文等、タイトルの作成元となったテキスト。以下、単に本文という。）を入力とすることも考えられる。この場合、タイトルとは異なり、テキストの情報量が多いので、多少曖昧な表現が含まれていたとしても、曖昧部分の補完が期待できる。しかし、本文は長いので要約によって削減すべき文字数が多い。しかも、本文には冗長な部分や重要な情報を含まない文も多く存在する。また、本文には前に言及した単語を代名詞や短縮語で言い換えていたり、主語が省略されていたりすることもある。そのため、単純に本文を入力データとしても、精度の高い見出しの生成は困難である。

〔１−３．学習処理について〕
そこで、情報処理装置１０は、以下の学習処理を実行することで、配信コンテンツに含まれるテキスト（例えば、タイトル）から見出しとなるテキストを生成するためのモデルの学習を行う。以下、図１を参照しながら情報処理装置１０が実行する学習処理の一例について説明する。

まず、情報処理装置１０は、データサーバ２０から学習データとなる情報を取得する（ステップＳ１）。例えば、情報処理装置１０は、データサーバ２０から、過去、ユーザに配信された配信コンテンツを取得する。そして、情報処理装置１０は、データサーバ２０から取得した情報を学習データデータベースに登録する。

図３は、学習データデータベースに登録される学習データの一例を示す図である。学習データデータベースには、学習データとして、本文、タイトル、および見出しを関連付けた情報が登録される。本文、タイトル、および見出しの組には、それぞれ、学習データＩＤ（Identifier）が付されている。「本文」及び「タイトル」は、配信コンテンツに含まれるテキストである。タイトルは本文に付された要約となるテキストであり、本文に基づいて作成される。タイトルにとって、本文は元のテキスト（作成元となるテキスト）である。

「見出し」は、配信コンテンツの内容をユーザが容易に把握するためのテキストである。見出しは、配信コンテンツに含まれるテキスト（例えば、本文或いはタイトル）に対応するテキストである。学習データとなる見出しは、配信コンテンツに含まれるテキストを所定の者（例えば、ポータルサイトの運営者の従業員）が読んで要約することにより作成される。なお、見出しは、所定の条件を満たすよう生成される。例えば、見出しは、所定の文字数以下となるよう生成される。一例として、見出しは、１３.５文字以下となるよう生成される。このとき、１３.５文字は、全角文字１個を１文字とした文字数である。半角文字１文字は０．５文字である。以下の説明では、所定の条件のことを「生成条件」という。生成条件は、１３．５文字以下に限定されない。生成条件となる文字数は、１３．５文字より多くてもよいし少なくてもよい。勿論、生成条件は文字数に限定されない。

なお、「見出し」は、要約、タイトル、短縮タイトル、トピック、トピック見出し等と言い換えることができる。同様に、配信コンテンツに含まれる「タイトル」も、要約等と言い換えることができる。本実施形態では、「見出し」は、配信コンテンツに含まれる「タイトル」に基づき作成される短縮テキストであるものとする。勿論、「見出し」は本文に基づき作成された短縮テキストであってもよい。なお、構文上は文が短縮されていても、「見出し」の文字数が「タイトル」の文字数より多くなることがあり得る。例えば、「タイトル」に含まれる略語を正式名称に置き換えた場合は、構文上は文が短縮されていても、結果として文字数が増えることがある。このような場合も、「見出し」は「タイトル」の短縮テキストである。

情報処理装置１０は、学習データデータベースに登録されたデータの中から、タイトル本文と見出しとの組を複数組取得する。そして、情報処理装置１０は、タイトルと本文と見出しとに基づいて、モデルＭ（第１のモデル）の学習を行う（ステップＳ２）。モデルＭは、モデルに入力されるテキストから生成条件を満たすテキストを生成するモデルである。情報処理装置１０は、タイトルとそのタイトルの本文とを入力データ、見出しを正解データとしてモデルＭの学習（例えば、教師あり学習）を行う。

なお、以下の説明では、学習の際、入力データとなる複数のテキストのうちの１つ（本実施形態の場合、タイトル）のことを「第１の学習用テキスト」、第１の学習用テキストの元のテキスト（本実施形態の場合、本文）のことを「第２の学習用テキスト」、正解データとなるテキスト（本実施形態の場合、見出し）のことを「第３の学習用テキスト」ということがある。また、テキストの生成の際、入力データとなる複数のテキストのうちの１つ（本実施形態の場合、タイトル）のことを「第１のテキスト」、第１のテキストの元のテキスト（本実施形態の場合、本文）のことを「第２のテキスト」、モデルＭから出力されるテキストのことを「第３のテキスト」と呼ぶことがある。また、以下の説明では、正解データのことを教師ラベルということもある。

モデルＭは、入力テキスト（第１のテキスト及び第２のテキスト）から入力テキストが有する特徴を示す特徴情報を生成するエンコーダと、特徴情報から出力テキスト（第３のテキスト）を生成するデコーダと、を含むエンコーダ−デコーダ型のモデルであってもよい。

（モデルＭ１）
図４は、モデルＭの一例を示す図である。具体的には、図４は、モデルＭの一例であるモデルＭ１を示す図である。モデルＭ１は、ＲＮＮ（Recurrent Neural Network）の一例であるＬＳＴＭ（Long Short Term Memory）を用いたSequence to Sequence Model（以下、Ｓｅｑ２Ｓｅｑともいう。)である。より具体的には、アテンションモデル（Attention Model）を追加したＳｅｑ２Ｓｅｑ（Sequence to Sequence with Attention Model）である。Ｓｅｑ２Ｓｅｑは、エンコーダ−デコーダモデルの一種であり、異なる長さのワード列（Sequence）を入力とし、異なる長さのワード列(Sequence)を出力とすることを可能とする。

図４に示すモデルＭ１は、第１のテキスト（タイトル）に基づいて特徴情報（第１の特徴情報）を生成するエンコーダＥ１２（第１のエンコーダ）と、第２のテキスト（本文）に基づいて特徴情報（第２の特徴情報）を生成するエンコーダＥ１１（第２のエンコーダ）と、を備える。また、モデルＭ１は、第１の特徴情報と第２の特徴情報とを合成して合成情報を生成する合成モデルＳＭ１と、合成情報に基づいて第３のテキスト（見出し）を生成するデコーダＤ１と、を備える。

エンコーダＥ１２は、入力テキストが有する特徴を抽出する。エンコーダＥ１２は、入力層と中間層（隠れ層）とを有する。エンコーダＥ１２には、第１の学習用テキスト（本実施形態の場合、タイトル）に含まれるワードが順次入力される。エンコーダＥ１２は、入力されたテキストの特徴を示す多次元量（例えば、ベクトル）である特徴情報を出力する。特徴情報は、モデルＭ１がアテンションモデルの場合、特徴情報はアテンションベクトルと呼ばれることもある。

エンコーダＥ１１は、入力テキストが有する特徴を抽出する。エンコーダＥ１１は、入力層と中間層（隠れ層）とを有する。エンコーダＥ１１には、第２の学習用テキスト（本実施形態の場合、本文）に含まれるワードが順次入力される。エンコーダＥ１１は、入力されたテキストの特徴を示す多次元量（例えば、ベクトル）である特徴情報を出力する。モデルＭ１がアテンションモデルの場合、特徴情報はアテンション情報或いはアテンションベクトルと言い換えることができる。

合成モデルＳＭ１は、エンコーダＥ１２が出力する第１の特徴情報と、エンコーダＥ１１が出力する第２の特徴情報との線形結合を合成情報として出力する。なお、合成モデルＳＭ１は、各特徴情報に対して所定の重みを適用した合成情報を生成してもよい。なお、モデルＭ１は、合成モデルＳＭ１が出力する合成情報をデコーダＤ１の入力層に対応する次元数まで畳み込むよう構成されていてもよい。

デコーダＤ１は、入力テキストが短縮されたテキスト（すなわち、見出し）を出力する。デコーダＤ１は、中間層（隠れ層）Ｈ２と出力層Ｙとを有する。デコーダＤ１には、合成モデルＳＭ１から出力された合成情報（すなわち、第１の特徴情報及び第２の特徴情報）が入力される。合成情報が入力されると、デコーダＤ１は、出力層から短縮テキストとなるワードを順次出力する。

情報処理装置１０は、エンコーダＥ１２に第１の学習用テキスト、エンコーダＥ１１に第２の学習用テキストを入力した際に、デコーダＤ１から第１の学習用テキストに対応する第３の学習用テキストが出力されるよう、モデルＭ１の学習を行う。例えば、情報処理装置１０は、デコーダＤ１が出力した短縮テキストが、第３の学習用テキストに近づくように、バックプロパゲーション等の手法により、各ノード間で値が伝達する際に考慮される重み（すなわち、接続係数）の値を修正する。これにより、情報処理装置１０は、モデルＭ１に第１の学習用テキスト及び第２の学習用テキストが有する特徴を学習させる。なお、情報処理装置１０は、短縮テキストの分散表現となるベクトルと第３の学習用テキストの分散表現となるベクトルとのコサイン類似度に基づいて重みの値を修正してもよい。

（モデルＭ２）
図５は、モデルＭの他の例を示す図である。具体的には、図５は、モデルＭの一例であるモデルＭ２を示す図である。図５に示すモデルＭ２は、第１のテキスト（タイトル）に基づいて特徴情報（第１の特徴情報）を生成するエンコーダＥ２２（第１のエンコーダ）と、第２のテキスト（本文）に基づいて特徴情報（第２の特徴情報）を生成するエンコーダＥ２１（第２のエンコーダ）と、を備える。また、モデルＭ２は、第１の特徴情報と第２の特徴情報とを合成して合成情報を生成する合成モデルＳＭ２と、合成情報に基づいて第３のテキスト（見出し）を生成するデコーダＤ２２と、を備える。エンコーダＥ２２、エンコーダＥ２１、合成モデルＳＭ２、及びデコーダＤ２２の構成はモデルＭ１のエンコーダＥ１２、エンコーダＥ１１、合成モデルＳＭ１、及びデコーダＤ１と同様である。

また、モデルＭ２は、エンコーダＥ２１のプリトレーニングに使用されるデコーダＤ２１を備える。エンコーダＥ２１とデコーダＤ２１は、エンコーダＥ２１のプリトレーニングに使用される第２のモデルを形成している。図６は、第２のモデルの構成例を示す図である。第２のモデルは、Ｓｅｑ２Ｓｅｑにアテンションモデルを追加したSequence to Sequence with Attention Modelである。

エンコーダＥ２１は、入力テキストが有する特徴を抽出する。エンコーダＥ２１は、入力層Ｘと中間層（隠れ層）Ｈ１とを有する。エンコーダＥ２１には、第２の学習用テキスト（本実施形態の場合、本文）に含まれるワード（図６に示すワードＷ１１〜Ｗ１６）が順次入力される。＜ＥＯＳ＞は、End Of Statementの略であり、テキストの終わりであることを示す。図６に示すエンコーダＥ２１は、入力層Ｘと中間層Ｈ１を時間軸方向に展開した図である。なお、図６に示す例では、入力テキストとなる本文に含まれるワードが、ワードＷ１１〜Ｗ１６までの６つとなっているが、本文に含まれるワードは、６つより多くてもよい。中間層Ｈ１は、本文に含まれる各ワードがタイトルとどの程度類似しているかを示す情報（例えば、各ワードの重みの情報）を出力する。図６の斜線が付された棒は、各中間層の出力の値を示している。棒が高いほど、該当のワードがタイトルと近いことを示している。図６の例の場合、ワードＷ１１〜Ｗ１６のうちワードＷ１４が最もタイトルが示す内容に近いワードであることを示している。エンコーダＥ２１は、各中間層の出力に基づいて特徴情報を生成する。特徴情報は、アテンションベクトルであり、例えば、各中間層の出力の重み付き和である。この特徴情報は、本文とタイトルとの関連を示している。すなわち、エンコーダＥ２１から出力される特徴情報は、本文のうちどの部分がタイトルに近いか（関連が高いか）を示している。

デコーダＤ２１は、入力テキストが短縮されたテキスト（すなわち、短縮テキスト）を出力する。デコーダＤ２１は、中間層（隠れ層）Ｈ２と出力層Ｙとを有する。図６に示すデコーダＤ２１は、中間層（隠れ層）Ｈ２と出力層Ｙを時間軸方向に展開した図である。デコーダＤ２１の各中間層Ｈ２には、エンコーダＥ２１が生成した特徴情報が入力され、出力層Ｙからタイトルとなるワード（図６に示すワードＷ２１〜Ｗ２３）が順次出力される。なお、図６に示す例では、短縮テキストに含まれるワードが、ワードＷ２１〜Ｗ２３までの３つとなっているが、短縮テキストに含まれるワードは、３つより多くてもよい。

情報処理装置１０は、エンコーダＥ２１に第２の学習用テキスト（本文）を入力した際に、デコーダＤ２１から第２の学習用テキストに対応する第１の学習用テキスト（タイトル）が出力されるよう、モデルＭ２の学習を行う。例えば、情報処理装置１０は、デコーダＤ２１が出力した短縮テキストが、第１の学習用テキストに近づくように、バックプロパゲーション等の手法により、各ノード間で値が伝達する際に考慮される重み（すなわち、接続係数）の値を修正する。これにより、情報処理装置１０は、エンコーダＥ２１が第２の学習用テキストの第１の学習用テキストに近い部分を抽出するよう学習させる。なお、情報処理装置１０は、短縮テキストの分散表現となるベクトルと第１の学習用テキストの分散表現となるベクトルとのコサイン類似度に基づいて重みの値を修正してもよい。

エンコーダＥ２１のプリトレーニング後、情報処理装置１０は、エンコーダＥ２２に第１の学習用テキスト、エンコーダＥ２１に第２の学習用テキストを入力した際に、デコーダＤ２２から第１の学習用テキストに対応する第３の学習用テキストが出力されるよう、モデルＭ２の学習を行う。例えば、情報処理装置１０は、デコーダＤ２２が出力した短縮テキストが、第３の学習用テキストに近づくように、バックプロパゲーション等の手法により、各ノード間で値が伝達する際に考慮される重み（すなわち、接続係数）の値を修正する。

（モデルＭ３）
図７は、モデルＭの他の例を示す図である。具体的には、図７は、モデルＭの一例であるモデルＭ３を示す図である。図７に示すモデルＭ３は、第４の学習用テキストである関連テキストを入力するためのエンコーダＥ３３（第３のエンコーダ）を有している。関連テキストは、第２の学習用テキストとなる本文と関連するテキストである。

図８は、関連テキストを説明するための図である。図８には、記事の本文Ｋ１１と記事のタイトルＴ１１とが含まれる配信コンテンツＣ１１が示されている。更に、図８には、本文Ｋ１１に関連するテキストである３つの関連テキストＲ１１１、Ｒ１１２、Ｒ１１３が示されている。関連テキストＲ１１１、Ｒ１１２、Ｒ１１３は、例えば、本文Ｋ１１に張られたリンクを辿って得られるテキストであってもよい。例えば、関連テキストＲ１１１、Ｒ１１２、Ｒ１１３は、本文Ｋ１１に張られたリンクのリンク先のページから取得したテキストであってもよい。或いは、関連テキストＲ１１１、Ｒ１１２、Ｒ１１３は、本文Ｋ１１の一部を検索クエリとして検索した結果得られるテキストであってもよい。例えば、関連テキストＲ１１１、Ｒ１１２、Ｒ１１３は、本文Ｋ１１に含まれるワードを検索クエリとして検索して得られたＵＲＬ（Uniform Resource Locator）が示すページに含まれるテキストであってもよい。

モデルＭ３は、第１のテキスト（タイトル）に基づいて特徴情報（第１の特徴情報）を生成するエンコーダＥ３２（第１のエンコーダ）と、第２のテキスト（本文）に基づいて特徴情報（第２の特徴情報）を生成するエンコーダＥ３１（第２のエンコーダ）と、第４のテキスト（関連テキスト）に基づいて特徴情報（第３の特徴情報）を生成するエンコーダＥ３３（第３のエンコーダ）と、を備える。また、モデルＭ３は、第１の特徴情報と第２の特徴情報と第３の特徴情報を合成して合成情報を生成する合成モデルＳＭ３と、合成情報に基づいて第３のテキスト（見出し）を生成するデコーダＤ３と、を備える。

情報処理装置１０は、第２の学習用テキスト（本文）に関連する関連テキストを第４の学習用テキストとして取得する。関連テキストが複数ある場合、情報処理装置１０は、複数ある関連テキストの１つを第４の学習用テキストとして取得してもよい。このとき、情報処理装置１０は、第２の学習用テキストに関連する複数の関連テキストから所定の基準を満たす第４の学習用テキストを取得する。例えば、情報処理装置１０は、複数の関連テキストのうち第２の学習用テキストに最も類似するテキストを第４の学習用テキストとして取得する。このとき、情報処理装置１０は、テキストそれぞれを多次元量（ベクトル）に変換し、ベクトルのコサイン類似度を算出することにより、テキストの類似を判別してもよい。

そして、情報処理装置１０は、エンコーダＥ３２に第１の学習用テキスト（タイトル）、エンコーダＥ３１に第２の学習用テキスト（本文）、エンコーダＥ３３に第４の学習用テキスト（関連テキスト）、を入力した際に、デコーダＤ３から第３の学習用テキスト（見出し）が出力されるよう、モデルＭ３の学習を行う。例えば、情報処理装置１０は、デコーダＤ３が出力したテキストが、第３の学習用テキストに近づくように、バックプロパゲーション等の手法により、各ノード間で値が伝達する際に考慮される重み（すなわち、接続係数）の値を修正する。

〔１−４．生成処理について〕
次に、上述した学習処理によって学習が行われたモデルを用いて、第１のテキスト（例えば、タイトル）に対応するテキストであって生成条件を満たす第３のテキスト（例えば、見出し）を生成する生成処理の一例について説明する。

まず、情報処理装置１０は、データサーバ２０からモデルＭに入力される情報を取得する（ステップＳ３）。例えば、情報処理装置１０は、データサーバ２０から、配信予定の配信コンテンツ（本文及びタイトル）を取得する。

また、情報処理装置１０は、内部の記憶装置からモデルＭを取得する。上述したように、モデルＭは、第１の学習用テキストと第１の学習用テキストの元のテキストである第２の学習用テキストとを入力データ、第１の入力テキスト或いは第２の入力テキストに対応するテキストであって生成条件を満たす第３の学習用テキストを正解データ（教師ラベル）として学習したモデルである。

そして、情報処理装置１０は、モデルＭに第１のテキスト（例えば、タイトル）と当該第１のテキストの元のテキストである第２のテキスト（例えば、本文）とを入力することにより、第１のテキストに対応するテキストであって生成条件を満たす第３のテキスト（例えば、見出し）を生成する（ステップＳ４）。

例えば、モデルＭが図４に示すモデルＭ１であるとする。上述したように、モデルＭ１は、第１のテキストに基づいて特徴情報（第１の特徴情報）を生成するエンコーダＥ１２（第１のエンコーダ）と、第２のテキストに基づいて特徴情報（第２の特徴情報）を生成するエンコーダＥ１１（第２のエンコーダ）と、第１の特徴情報及び第２の特徴情報との合成情報に基づいて第３のテキストを生成するデコーダＤ１と、を含む。情報処理装置１０は、第１のテキスト（タイトル）に含まれるワードを、順次、エンコーダＥ１２に入力するとともに、第２のテキスト（本文）に含まれるワードを、順次、エンコーダＥ１１に入力する。そして、情報処理装置１０は、デコーダＤ１から、順次、第３のテキスト（見出し）となるワードを取得する。

また、モデルＭが図５に示すモデルＭ２であるとする。情報処理装置１０は、第２のテキスト（本文）に含まれるワードを、順次、エンコーダＥ２１に入力する。エンコーダＥ２１から出力される特徴情報（第２の特徴情報）は、第２のテキストと第１のテキストとの関連を示している。すなわち、第２の特徴情報は、第２のテキストのうちどの部分が第１のテキストに近いか（関連が高いか）を示している。情報処理装置１０は、第１のテキストと第２のテキストとの関連に基づいて第２のテキストから生成された第２の特徴情報と、第１のテキストと、に基づいて第３のテキストを生成する。すなわち、情報処理装置１０は、第１のテキスト（タイトル）に含まれるワードを、順次、エンコーダＥ２２に入力して得られる特徴情報（第１の特徴情報）と第２の特徴情報とを合成モデルＳＭ２に入力することにより、デコーダＤ２２から、順次、第３のテキストとなるワードを取得する。

また、モデルＭが図７に示すモデルＭ３であるとする。上述したように、モデルＭ３は、第１のテキストに基づいて特徴情報（第１の特徴情報）を生成するエンコーダＥ３２（第１のエンコーダ）と、第２のテキストに基づいて特徴情報（第２の特徴情報）を生成するエンコーダＥ３１（第２のエンコーダ）と、第４のテキストに基づいて特徴情報（第３の特徴情報）を生成するエンコーダＥ３３（第３のエンコーダ）と、第１の特徴情報、第２の特徴情報、及び第３の特徴情報の合成情報に基づいて第３のテキストを生成するデコーダＤ３と、を含む。

情報処理装置１０は、第２のテキストに関連する関連テキストをエンコーダＥ３３に入力する第４のテキストとして取得する。関連テキストは、第２のテキストとなる本文と関連するテキストである。エンコーダＥ３３に入力する関連テキスト（第４のテキスト）は、第２のテキストに張られたリンクを辿って得られるテキストであってもよいし、第２のテキストの一部を検索クエリとして検索した結果得られるテキストであってもよい。

なお、関連テキストが複数ある場合、情報処理装置１０は、複数の関連テキストから所定の基準を満たすテキストを第４のテキストとして取得してもよい。例えば、情報処理装置１０は、複数の関連テキストのうち第２のテキストに最も類似するテキストを第４の学習用テキストとして取得する。このとき、情報処理装置１０は、テキストそれぞれを多次元量（ベクトル）に変換し、ベクトルのコサイン類似度を算出することにより、テキストの類似を判別してもよい。

そして、情報処理装置１０は、第１のテキスト（タイトル）に含まれるワードを、順次、エンコーダＥ３２に入力するとともに、第２のテキスト（本文）に含まれるワードを、順次、エンコーダＥ３１に入力する。更に、情報処理装置１０は、第４のテキスト（関連テキスト）に含まれるワードを、順次、エンコーダＥ３３に入力する。そして、情報処理装置１０は、デコーダＤ３から、順次、第３のテキスト（見出し）となるワードを取得する。

第３のテキストが生成されたら、情報処理装置１０は、第３のテキストを用いて、要約コンテンツを生成する。そして、情報処理装置１０は、要約コンテンツを端末装置３０に配信する（ステップＳ５）。

本実施形態によれば、情報処理装置１０が有するモデルＭ１は、第１のテキスト（タイトル）のみならず第２のテキスト（本文）も使って第３のテキスト（見出し）を生成するよう構成されている。第１のテキストに曖昧な表現が含まれていたり、第１のテキストの情報量が少なかったりしても、第２のテキストの情報で補完できるので、情報処理装置１０は、精度の高い第３のテキストを生成できる。

また、情報処理装置１０が有するモデルＭ２は、第１のテキストと第２のテキストとの関連に基づいて第２のテキストから生成された特徴情報（例えば、アテンションベクトル）を使って第３のテキスト（見出し）を生成するよう構成されている。これにより、情報処理装置１０は、単純に第２のテキストを使用して第３のテキスト（見出し）を生成するのではなく、第２のテキストのうちの第１のテキストに近い部分（関連する部分）の情報を使って第３のテキストを生成できるようになる。この結果、第２のテキストに含まれる大量の情報が第３のテキストの生成の阻害要因とならないので、情報処理装置１０は、精度の高い第３のテキストを生成できる。

また、情報処理装置１０が有するモデルＭ３は、第１のテキスト（タイトル）及び第２のテキスト（本文）のみならず、第２のテキストに関連する第４のテキスト（関連テキスト）をも使って第３のテキスト（見出し）を生成するよう構成されている。第１のテキストと第２のテキストの不足部分を第４のテキストで補完できるので、情報処理装置１０は、精度の高い第３のテキストを生成できる。

〔実施形態２〕
〔１−５．情報処理装置の他の例〕
実施形態１では、本文、タイトル、及び関連テキストをそのままモデルＭへの入力データとした。しかしながら、モデルへの入力データはこれらテキストの一部であってもよい。実施形態２では、所定のテキスト（例えば、本文）から抽出されたテキスト（以下、抽出テキストという。）から所定のテキストに対応するテキスト（タイトル、見出し）を生成するモデルＭ１０（第３のモデル）の学習、及びモデルＭ１０を使ったテキストの生成について説明する。以下、生成装置および学習装置の一例である情報処理装置が実行する学習処理および生成処理の他の例について説明する。

図９は、実施形態に係る情報処理装置が実行する処理の他の例を示す図である。情報処理装置１０は、実施形態１と同様に、インターネット等の所定のネットワークを介して、所定のクライアントが使用するデータサーバ２０および端末装置３０と通信可能である。情報処理装置１０は、後述の学習処理及び生成処理を実行する装置である。データサーバ２０は、学習データや配信コンテンツを管理する情報処理装置である。端末装置３０は、スマートデバイス等のユーザ端末（情報処理装置）である。

なお、実施形態１では、情報処理装置１０は見出し（第３のテキスト）を生成するものとしたが、実施形態２では、情報処理装置１０はタイトル（第２のテキスト）を生成するものとする。なお、情報処理装置１０は見出しを生成してもよい。この場合、第２のテキストは見出しとみなすことができる。以下の実施形態２の説明において、「タイトル」の記載は「見出し」と言い換えることが可能である。なお、本文、タイトル、見出し、関連テキストの定義については実施形態１と同様である。

〔１−６．学習処理について〕
最初に学習処理について説明する。情報処理装置１０は、以下の学習処理を実行することで、配信コンテンツに含まれるテキスト（例えば、本文）から抽出された抽出テキストからタイトルとなるテキストを生成するためのモデルの学習を行う。「抽出テキスト」の具体例については後述する。以下、図９を参照しながら情報処理装置１０が実行する学習処理の一例について説明する。

まず、情報処理装置１０は、データサーバ２０から学習データとなる情報を取得する（ステップＳ１０１）。例えば、情報処理装置１０は、データサーバ２０から、過去、ユーザに配信された配信コンテンツを取得する。そして、情報処理装置１０は、データサーバ２０から取得した情報を学習データデータベースに登録する。

情報処理装置１０は、学習データデータベースに登録されたデータの中から、本文とタイトルとの組を複数組取得する。そして、情報処理装置１０は、本文からテキストを抽出する（ステップＳ１０２）。この抽出されたテキストが、学習に使用する抽出テキストとなる。ここで抽出テキストとは、所定のテキスト（例えば、本文）から所定の基準に従い抽出されたテキストのことである。例えば、抽出テキストは、複数の文から構成される所定のテキストから所定の基準に従い抽出された文である。ここで、文（Sentence）とは、例えば、文頭から句点或いはピリオドまでのテキストのことである。勿論、文の末尾は、疑問符、感嘆符等、句点やピリオド以外の文末を示す符号であってもよい。また、一文と認識できるのであれば、文末には句点、ピリオド、疑問符、感嘆符等、文末を示す符号が付いていなくてもよい。なお、「テキスト」は、複数の文から構成されるテキストのみならず、一文から構成されるテキストを含む概念である。

本実施形態では、抽出テキストは、所定のテキストのファーストセンテンス、所定のテキストに含まれるトピックセンテンス、或いはこれらの組み合わせのテキスト（以下、「組み合わせテキスト」という。）であるものとする。

ここでファーストセンテンスとは、所定のテキストの最初の文（第一文）のことである。また、トピックセンテンスとは、所定のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文のことである。トピックセンテンスは、時間或いは場所を示す要素を含む文であってもよい。なお、多くのテキストは、書き出し部分であるファーストセンテンスに重要な情報が含まれることが多い。また、時間或いは場所を示す要素を含むトピックセンテンスは、多くのテキストで特徴的部分であることが多い。そのため、ファーストセンテンスやトピックセンテンスを入力として使えば、精度の高いモデルの構築が可能になる。

なお、組み合わせテキストは、ファーストセンテンスとトピックセンテンスを組み合わせたテキストである。或いは、組み合わせテキストは、トピックセンテンスとトピックセンテンスを組み合わせたテキストのことである。なお、学習用テキストが複数あるのであれば、組み合わせテキストは、ファーストセンテンスとファーストセンテンスを組み合わせたテキストであってもよい。例えば、組み合わせテキストは、本文のファーストセンテンスと当該本文の関連テキストのファーストセンテンスであってもよい。以下の説明では、組み合わせテキストは、ファーストセンテンスとトピックセンテンスを組み合わせたテキストであるものとするが、トピックセンテンスとトピックセンテンスを組み合わせたテキストであってもよいし、ファーストセンテンスとファーストセンテンスを組み合わせたテキストであってもよい。

図１０は、抽出テキストを説明するための図である。図１０には、図８と同様に、記事の本文Ｋ１１と記事のタイトルＴ１１とが含まれる配信コンテンツＣ１１が示されている。また、図１０には、本文Ｋ１１に関連するテキストである関連テキストＲ１１２が示されている。なお、図１０の例では、関連テキストが１つしか示されていないが、図８と同様に、関連テキストは複数あってもよい。本文Ｋ１１をモデルの学習のための学習用テキストとするのであれば、情報処理装置１０は、本文Ｋ１１の第一文であるファーストセンテンスＦＳ１１、或いは本文Ｋ１１に含まれるトピックセンテンスＴＳ１１、ＴＳ１２を抽出テキストとして取得する。

なお、所定のテキストの中にトピックセンテンスが複数含まれる場合、情報処理装置１０は、複数のトピックセンテンスの中から所定の基準に従い選択された１つのトピックセンテンスを抽出テキストとしてもよい。例えば、情報処理装置１０は、複数のトピックセンテンスの中の所定のテキストでの初出のトピックセンテンスを抽出テキストとしてもよい。図１０の例で、本文Ｋ１１から２つのトピックセンテンスＴＳ１１、ＴＳ１２が抽出されたのであれば、情報処理装置１０は、本文Ｋ１１で初出のトピックセンテンスＴＳ１１を抽出テキストとして取得してもよい。勿論、情報処理装置１０は、複数のトピックセンテンスの中から選択される複数のトピックセンテンスを抽出テキストとしてもよいし、所定のテキストに含まれる複数のトピックセンテンス全てを抽出テキストとしてもよい。

また、情報処理装置１０は、ファーストセンテンスとトピックセンテンスとを組み合わせた組み合わせテキストを抽出テキストとしてもよい。図１０の例で、本文Ｋ１１を学習用テキストとするのであれば、情報処理装置１０は、ファーストセンテンスＦ１１とトピックセンテンスＴＳ１１、ＴＳ１２との組み合わせテキストを抽出テキストとして取得する。勿論、情報処理装置１０は、ファーストセンテンスＦ１１と初出のトピックセンテンスＴＳ１１との組み合わせテキストを抽出テキストとして取得してもよい。

なお、学習用テキストは、本文に限定されない。例えば、情報処理装置１０は、本文の関連テキストを学習用テキストとしてもよい。そして、情報処理装置１０は、関連テキストから抽出されたテキスト、例えば、ファーストセンテンス、トピックセンテンス、或いはこれらの組み合わせテキストを抽出テキストとしてもよい。図１０の例で、関連テキストＲ１１２を学習用テキストとするのであれば、情報処理装置１０は、関連テキストＲ１１２の第一文であるファーストセンテンスＦＳ２１、或いは関連テキストＲ１１２に含まれるトピックセンテンスＴＳ２１、ＴＳ２２を抽出テキストとして取得する。勿論、情報処理装置１０は、本文Ｋ１１を学習用テキストとした場合と同様に、初出のトピックセンテンスＴＳ２１を抽出テキストとしてもよいし、関連テキストＲ１１２に含まれる全てのトピックセンテンスを抽出テキストとしてもよい。また、情報処理装置１０は、ファーストセンテンスとトピックセンテンスとを組み合わせた組み合わせテキストを抽出テキストとしてもよい。

また、情報処理装置１０は、本文と関連テキストの双方から抽出されたテキストを抽出テキストとしてもよい。例えば、本文と関連テキストの双方のファーストセンテンス、本文と関連テキストの双方に含まれるトピックセンテンス、或いはそれらを組み合わせた組み合わせテキストを抽出テキストとしてもよい。

続いて、情報処理装置１０は、抽出テキストとタイトルとに基づいて、モデルＭ１０（第３のモデル）の学習を行う（ステップＳ１０３）。モデルＭ１０は、モデルに入力されるテキストからタイトル等のテキストを生成するモデルである。情報処理装置１０は、本文及び関連テキストの少なくとも一方から抽出されたテキストを入力データ、本文に対応するタイトルを正解データとしてモデルＭの学習（例えば、教師あり学習）を行う。

なお、以下の説明では、学習の際、要約対象となるテキスト（本実施形態の場合、本文）のことを「第２の学習用テキスト」、第２の学習用テキストの関連テキストのことを「第４の学習用テキスト」、正解データとなるテキスト（本実施形態の場合、タイトル）のことを「第３の学習用テキスト」ということがある。また、テキストの生成の際、抽出テキストの抽出元となるテキスト（本実施形態の場合、本文）のことを「第２のテキスト」、第２の学習用テキストの関連テキストのことを「第４のテキスト」、モデルＭ１０から出力されるテキストのことを「第１のテキスト」と呼ぶことがある。

また、第２の学習用テキスト及び第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出されたテキスト（本実施形態の場合、ファーストセンテンス、トピックセンテンス、或いはそれらの組み合わせ）のことを「学習用抽出テキスト」ということがある。また、第２の学習用テキスト（例えば、本文）から抽出されたトピックセンテンスを第１の学習用抽出テキスト、第４の学習用テキスト（例えば、関連テキスト）から抽出されたトピックセンテンスを第２の学習用抽出テキスト、第２の学習用テキストのファーストセンテンスを第３の学習用抽出テキスト、第４の学習用テキストのファーストセンテンスを第４の学習用抽出テキストとして取得してもよい。また、第２の学習用テキスト及び第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出されたテキスト（本実施形態の場合、ファーストセンテンス、トピックセンテンス、或いはそれらの組み合わせ）のことを単に「抽出テキスト」ということがある。

モデルＭ１０は、実施形態１のモデルＭと同様に、入力テキスト（抽出テキスト）から入力テキストが有する特徴を示す特徴情報を生成するエンコーダと、特徴情報から出力テキスト（第１のテキスト）を生成するデコーダと、を含むエンコーダ−デコーダ型のモデルであってもよい。このとき、エンコーダに入力される抽出テキストは複数あってもよい。そして、情報処理装置１０は、エンコーダに学習用抽出テキストを入力した際に、デコーダから第２の学習用テキストに対応する第１の学習用テキストが出力されるよう、モデルＭ１０の学習を行う。例えば、情報処理装置１０は、デコーダが出力した短縮テキストが、第１の学習用テキスト（例えば、タイトル）に近づくように、バックプロパゲーション等の手法により、各ノード間で値が伝達する際に考慮される重み（すなわち、接続係数）の値を修正する。これにより、情報処理装置１０は、モデルＭ１０に抽出テキストが有する特徴を学習させる。なお、情報処理装置１０は、短縮テキストの分散表現となるベクトルと第１の学習用テキストの分散表現となるベクトルとのコサイン類似度に基づいて重みの値を修正してもよい。なお、エンコーダに入力される学習用抽出テキストは複数であってもよい。例えば、情報処理装置１０は、第１〜第４の学習用抽出テキストから選択される複数の学習用抽出テキストをエンコーダへの入力としてもよい。

〔１−７．生成処理について〕
次に、上述した学習処理によって学習が行われたモデルを用いて、第２のテキスト（例えば、本文）に対応する第１のテキスト（例えば、タイトル或いは見出し）を生成する生成処理の一例について説明する。

まず、情報処理装置１０は、データサーバ２０からモデルＭ１０で第１のテキストの生成対象となるテキストを取得する（ステップＳ１０４）。例えば、情報処理装置１０は、データサーバ２０から、配信予定の配信コンテンツ（本文及びタイトル）を取得する。

また、情報処理装置１０は、内部の記憶装置からモデルＭ１０を取得する。上述したように、モデルＭ１０は、第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストを入力データ、第２の学習用テキストに対応する第１の学習用テキストを正解データとして学習したモデルである。

続いて、情報処理装置１０は、第２のテキスト（例えば、本文）及び該第２のテキストに関連する第４のテキスト（例えば、関連テキスト）の少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する（ステップＳ１０５）。

例えば、情報処理装置１０は、第２のテキスト或いは第４のテキストの少なくとも一方のテキスト（以下、該当のテキストともいう。）に含まれるトピックセンテンスを抽出テキストとして取得する。このとき、該当のテキストに複数のトピックセンテンスが含まれるのであれば、情報処理装置１０は、複数のトピックセンテンスのいずれか１つ（例えば、第２のテキスト或いは第４のテキストで初出のトピックセンテンス）を抽出テキストとして取得してもよい。勿論、情報処理装置１０は、複数のトピックセンテンスの中から複数のトピックセンテンスを選択してもよいし、該当のテキストに含まれる全てのトピックセンテンスを抽出テキストとして選択してもよい。このとき、情報処理装置１０は、複数のトピックセンテンスを繋げて１つの抽出テキストとしてもよいし、複数のトピックセンテンスそれぞれを抽出テキストとしてもよい。

また、生成処理に使用する抽出テキストは組み合わせテキストであってもよい。例えば、情報処理装置１０は、該当のテキストに含まれるトピックセンテンスと、該当のテキストのファーストセンテンスと、の組み合わせテキストを抽出テキストとして取得してもよい。勿論、情報処理装置１０は、トピックセンテンスとトピックセンテンスを組み合わせたテキストであってもよいし、ファーストセンテンスとファーストセンテンスを組み合わせたテキストであってもよい。

また、情報処理装置１０は、第２のテキストに含まれるトピックセンテンスを第１の抽出テキストとして取得するとともに、第４のテキストに含まれるトピックセンテンスを第２の抽出テキストとして取得してもよい。さらに、情報処理装置１０は、第２のテキストの第一文を第３の抽出テキストとして取得するとともに、第４のテキストの第一文である第４の抽出テキストとして取得してもよい。

そして、情報処理装置１０は、モデルＭ１０に抽出テキストを入力することにより、第１のテキスト（タイトル）を生成する（ステップＳ１０６）。このとき、情報処理装置１０は、第１〜第４の抽出テキストから選択される１又は複数の抽出テキストをモデルＭ１０に入力してもよい。モデルＭ１０が例えば図４に示すモデルＭ１のように複数のエンコーダを備え、複数の入力を受け付けるよう構成されているのであれば、情報処理装置１０は、複数の抽出テキストをそれぞれ異なるエンコーダに入力してもよい。勿論、情報処理装置１０は、複数の抽出テキストを１つに繋げてモデルＭ１０に入力してもよい。

第１のテキストが生成されたら、情報処理装置１０は、第１のテキストを用いて、要約コンテンツ（例えば、タイトル、見出し）を生成する。そして、情報処理装置１０は、要約コンテンツを端末装置３０に配信する（ステップＳ１０７）。

本実施形態によれば、情報処理装置１０はモデルＭ１０の学習にファーストセンテンスやトピックセンテンスを使用している。ファーストセンテンスは、重要な情報を含む文であることが多く、また、トピックセンテンスは、多くのテキストで特徴的部分であることが多い。そのため、トピックセンテンスを使用することで、情報処理装置１０は、モデルＭ１０を精度の高いものとすることができる。結果として、情報処理装置１０は、精度の高いテキストを生成できる。

〔２．情報処理装置の構成例〕
以上、実施形態１及び実施形態２の情報処理装置１０の動作を述べたが、以下、情報処理装置１０の構成を説明する。

情報処理装置１０は、端末装置３０等のクライアントコンピュータからの要求を処理するサーバ用ホストコンピュータ（以下、単に「サーバ」という。）である。情報処理装置１０は、ＰＣサーバであってもよいし、ミッドレンジサーバであってもよいし、メインフレームサーバであってもよい。また、情報処理装置１０は、１つのサーバにより構成されていてもよいし、協働して処理を実行する複数のサーバにより構成されていてもよい。情報処理装置１０が複数のサーバで構成される場合、これらサーバの設置場所は離れていてもよい。設置場所が離れていたとしても、協働して処理を実行するのであれば、これらサーバは１つの情報処理装置とみなすことができる。情報処理装置１０は、生成装置および学習装置として機能する。

上述したように、情報処理装置１０は、データサーバ２０及び端末装置３０とネットワークを介して接続されている。ネットワークは、ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）、電話網（携帯電話網、固定電話網等）、地域ＩＰ（Internet Protocol）網、インターネット等の通信ネットワークである。ネットワークには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。

図１１は、実施形態に係る情報処理装置１０の構成例を示す図である。情報処理装置１０は、通信部１１と、記憶部１２と、制御部１３と、を備える。なお、図１１に示した構成は機能的な構成であり、ハードウェア構成はこれとは異なっていてもよい。

通信部１１は、外部の装置と通信する通信インタフェースである。通信部１１は、ネットワークインタフェースであってもよいし、機器接続インタフェースであってもよい。例えば、通信部１１は、ＮＩＣ（Network Interface Card）等のＬＡＮインタフェースであってもよいし、ＵＳＢ（Universal Serial Bus）ホストコントローラ、ＵＳＢポート等により構成されるＵＳＢインタフェースであってもよい。また、通信部１１は、有線インタフェースであってもよいし、無線インタフェースであってもよい。通信部１１は、情報処理装置１０の通信手段として機能する。通信部１１は、制御部１３の制御に従ってデータサーバ２０及び端末装置３０と通信する。

記憶部１２は、ＤＲＡＭ（Dynamic Random Access Memory）、ＳＲＡＭ（Static Random Access Memory）、フラッシュメモリ、ハードディスク等のデータ読み書き可能な記憶装置である。記憶部１２は、情報処理装置１０の記憶手段として機能する。記憶部１２は、学習データデータベース１２１、モデルデータベース１２２、及びコンテンツ情報データベース１２３を記憶する。

学習データデータベース１２１には、学習データが登録される。図１２は、学習データデータベース１２１に登録される情報の一例を示す図である。学習データデータベース１２１には、「学習データＩＤ」、「本文」、「タイトル」、「見出し」、及び「関連テキスト」といった項目を有する情報が登録される。

なお、図１２に示す情報のうち「本文」、「タイトル」、および「見出し」は、図３に示す「本文」、「タイトル」、および「見出し」に対応する。なお、学習データデータベース１２１には、図１２に示す情報以外にも、学習データや要約データを閲覧した利用者に関する各種の情報が登録されていてもよい。なお、図１２に示す例では、学習データデータベース１２１に登録される情報として、「Ｋ１１〜Ｋ１３」、「Ｔ１１〜１３」、「Ｕ１１〜Ｕ１３」、「Ｒ１１１〜Ｒ１３１」といった概念的な情報を示したが、実際には、テキストデータやバイナリデータが登録されることとなる。

ここで、「学習データＩＤ」とは、学習データを識別するための識別子である。また、「本文」とは、ユーザに配信されたコンテンツ（例えば、記事）に含まれる本文となるテキストである。また「タイトル」とは、コンテンツ或いは当該コンテンツに含まれる本文に付されたタイトルである。また、「見出し」とは、コンテンツ（本文或いはタイトル）に付された見出しである。また、「関連テキスト」とは、本文と関連するテキストである。

例えば、図１２に示す例では、学習データＩＤ「１００１」、本文「Ｋ１１」、タイトル「Ｔ１１」、見出し「Ｕ１１」、及び関連テキスト「Ｒ１１１」といった情報が対応付けて登録されている。このような情報は、例えば、学習データＩＤ「１００１」が示す学習データに、「Ｋ１１」が示す本文と、「Ｔ１１」が示すタイトルと、「Ｕ１１」が示す見出しと、「Ｒ１１１」が示す関連テキストと、が含まれる旨を示す。

図１１に戻り、モデルデータベース１２２には、情報処理装置１０が有するモデルのデータが登録される。図１３は、モデルデータベース１２２に登録される情報の一例を示す図である。図１３に示す例では、モデルデータベース１２２には、「モデルＩＤ」、および「モデルデータ」といった情報が登録されている。

ここで、「モデルＩＤ」とは、各モデルを識別するための情報である。また、「モデルデータ」とは、対応付けられた「モデルＩＤ」が示すモデルのデータであり、例えば、各層におけるノードと、各ノードが採用する関数と、ノードの接続関係と、ノード間の接続に対して設定される接続係数とを含む情報である。

例えば、図１３に示す例では、モデルＩＤ「２００１」およびモデルデータ「Ｍ１」といった情報が対応付けて登録されている。このような情報は、例えば、「２００１」が示すモデルのデータが「Ｍ１」である旨を示す。なお、図１３に示す例では、モデルデータベース１２２に登録される情報として、「Ｍ１〜Ｍ３」といった概念的な情報を記載したが、実際には、モデルの構造や接続係数を示す文字列や数値等が登録されることとなる。

モデルＭは、第１の学習用テキストと、第１の学習用テキストの元のテキストである第２の学習用テキストと、を入力データ、第１の学習用テキストに対応するテキストであって生成条件を満たす第３の学習用テキストとを正解データ（教師ラベル）として学習したモデルである。モデルＭは、第１のテキストから生成条件を満たす第３のテキストを生成する。このようなモデルＭは、第１のテキスト及び該第１のテキストの元のテキストである第２のテキストを入力する入力層と、第１のテキストに対応するテキストであって生成条件を満たす第３のテキストを出力する出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第１要素と、第１要素と第１要素の重みとに基づいて値が算出される第２要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第１要素として、第１要素と第１要素の重み（すなわち、接続係数）とに基づく演算を行うことにより、入力層に入力されたテキストに対応するテキストであって生成条件を満たすテキストを出力する出力層から出力するよう、コンピュータを機能させるためのモデルである。

また、モデルＭ１０は、第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストを入力データ、第２の学習用テキストに対応する第１の学習用テキストを正解データ（教師ラベル）として学習したモデルであってもよい。そして、第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストから第２のテキストに対応する第１のテキストを出力してもよい。このようなモデルＭは、第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを入力する入力層と、第２のテキストに対応する第１のテキストを出力する出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第１要素と、第１要素と第１要素の重みとに基づいて値が算出される第２要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第１要素として、第１要素と第１要素の重み（すなわち、接続係数）とに基づく演算を行うことにより、入力層に入力された抽出テキストに応じて、第１のテキストを出力するよう、コンピュータを機能させる。

ここで、モデルＭ、Ｍ１０が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルＭ、Ｍ１０が含む第１要素は、x1やx2等といった入力データ（xi）に対応する。また、第１要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第１要素は、入力層が有するいずれかのノードに対応し、第２要素は、出力層が有するノードと見做すことができる。

また、モデルＭ、Ｍ１０がＤＮＮ（Deep Neural Network）等、１つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルＭ、Ｍ１０が含む第１要素は、入力層または中間層が有するいずれかのノードに対応する。また、第２要素は、第１要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第１要素の重みは、第１要素と対応するノードから第２要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。

情報処理装置１０は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、出力テキストの算出を行う。具体的には、モデルＭは、テキスト（例えば、タイトル）、及び当該テキストの元のテキスト（例えば、当該タイトルの本文）が入力された場合に、入力されたテキストに対応するテキストであって生成条件を満たすテキスト（例えば、見出し）を出力するように係数が設定される。モデルＭは、テキスト及び当該テキストの元のテキストが入力された場合に、入力されたテキストに対応するテキストであって生成条件を満たすテキストを出力するように係数が設定されてもよい。情報処理装置１０は、このようなモデルＭを用いて、生成条件を満たすテキスト（例えば、見出し）を生成する。また、モデルＭ１０は、所定のテキスト（例えば、本文、関連テキスト）から抽出された抽出テキスト（例えば、トピックセンテンス、ファーストセンテンス、或いはそれらの組み合わせ）が入力された場合に、所定のテキストに対応するテキスト（例えば、タイトル、見出し）を出力するように係数が設定される。

なお、上記例では、モデルＭが、テキスト（例えば、タイトル）及び当該テキストの元のテキスト（例えば、当該タイトルの本文）が入力された場合に、入力されたテキストに対応するテキストであって生成条件を満たすテキスト（例えば、見出し）を出力するモデル（以下、モデルＶという。）である例を示した。しかし、実施形態に係るモデルＭは、モデルＶにデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルＶは、「テキスト及び当該テキストの元のテキスト」を入力とし、モデルＶが出力する「入力されたテキストに対応するテキストであって生成条件を満たすテキスト」を出力とするよう学習されたモデルであってもよい。

なお、上記例では、モデルＭ１０が、所定のテキスト（例えば、本文、関連テキスト）から抽出された抽出テキスト（例えば、トピックセンテンス、ファーストセンテンス、或いはそれらの組み合わせ）が入力された場合に、所定のテキストに対応するテキスト（例えば、タイトル、見出し）を出力するモデル（以下、モデルＶ１０という。）である例を示した。しかし、実施形態に係るモデルＭ１０は、モデルＶ１０にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルＶ１０は、「所定のテキスト」を入力とし、モデルＶ１０が出力する「所定のテキストに対応するテキスト」を出力とするよう学習されたモデルであってもよい。

また、情報処理装置１０がＧＡＮ（Generative Adversarial Networks）を用いた学習処理或いは生成処理を行う場合、モデルＭは、ＧＡＮの一部を構成するモデルであってもよい。

図１１に戻り、コンテンツ情報データベース１２３には、ユーザに配信されるコンテンツの情報が登録される。例えば、コンテンツ情報データベース１２３には、コンテンツパートナーから取得した記事等が登録される。図１４は、コンテンツ情報データベース１２３に登録される情報の一例を示す図である。コンテンツ情報データベース１２３には、「コンテンツＩＤ」、「本文」、「タイトル」、及び「関連テキスト」といった項目を有する情報が登録される。なお、「コンテンツＩＤ」とは、コンテンツのデータを識別するための識別子である。「本文」、「タイトル」、及び「関連テキスト」は、図１２に示す「本文」、「タイトル」、及び「関連テキスト」と同様である。

図１１に戻り、制御部１３は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）等のプロセッサによって、情報処理装置１０内部の記憶装置に記憶されている各種プログラムがＲＡＭ等を作業領域として実行されることにより実現される。また、制御部１３は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現されてもよい。

また、制御部１３は、記憶部１２に記憶されるモデルＭ（モデルＭ１〜Ｍ３等）に従った情報処理により、モデルＭの入力層に入力された入力テキスト（例えば、タイトル及び当該タイトルの本文）に対し、モデルＭが有する係数（すなわち、モデルＭが学習した各種の特徴に対応する係数）に基づく演算を行い、モデルＭの出力層から出力テキスト（例えば、見出し）を出力する。

制御部１３は、図１１に示すように、学習データ取得部１３１と、学習部１３２と、出力情報取得部１３３と、生成部１３４と、出力制御部１３５と、を備える。制御部１３を構成するブロック（学習データ取得部１３１〜出力制御部１３５）はそれぞれ制御部１３の機能を示す機能ブロックである。これら機能ブロックはソフトウェアブロックであってもよいし、ハードウェアブロックであってもよい。例えば、上述の機能ブロックが、それぞれ、ソフトウェア（マイクロプログラムを含む。）で実現される１つのソフトウェアモジュールであってもよいし、半導体チップ（ダイ）上の１つの回路ブロックであってもよい。勿論、各機能ブロックがそれぞれ１つのプロセッサ或いは１つの集積回路であってもよい。機能ブロックの構成方法は任意である。なお、制御部１３は上述の機能ブロックとは異なる機能単位で構成されていてもよい。

学習データ取得部１３１は、第１の学習用テキストと、第１の学習用テキストの元のテキストである第２の学習用テキストと、第１の学習用テキストに対応するテキストであって生成条件を満たす第３の学習用テキストと、を取得する。また、学習データ取得部１３１は、第２の学習用テキストに関連する第４の学習用テキストを取得する。例えば、学習データ取得部１３１は、第２の学習用テキストに関連する複数の関連テキストから所定の基準を満たすテキストを第４の学習用テキストとして取得する。

また、学習データ取得部１３１は、第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストと、第２の学習用テキストに対応する第１の学習用テキストと、を取得する。また、学習データ取得部１３１は、第２の学習用テキスト或いは第４の学習用テキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文を学習用抽出テキストとして取得する。また、学習データ取得部１３１は、第２の学習用テキスト或いは第４の学習用テキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文と、第２の学習用テキスト或いは第４の学習用テキストの第一文と、を学習用抽出テキストとして取得する。

学習部１３２は、モデルＭ（第１のモデル）の学習を行い、学習したモデルＭをモデルデータベース１２２に格納する。より具体的には、学習部１３２は、学習データに含まれる第１の学習用テキスト（例えば、タイトル）及び第２の学習用テキスト（例えば、タイトルの本文）をモデルＭに入力した際に、モデルＭが学習データに含まれる第３の学習用テキスト（例えば、入力したタイトルに対応する見出し）を出力するように、モデルＭが有する各モデルの接続係数の設定を行う。すなわち、学習部１３２は、入力テキストと当該入力テキストの元のテキストを入力した際に、モデルＭが、入力テキストに対応するテキストであって生成条件を満たす出力テキストを出力するように、モデルＭの学習を行う。モデルＭには、入力テキストに加えて、当該入力テキストの元のテキスト（本文等の入力テキストの生成元となったテキスト）が入力されてもよい。

例えば、学習部１３２は、モデルＭが有する入力層のノードであって、入力層に入力される情報と対応する特徴を学習したエンコーダの入力層と対応するノードに第１の学習用テキスト（例えば、タイトル）と第２の学習用テキスト（例えば、本文）を入力し、各中間層を辿ってモデルＭの出力層までデータを伝播させることで、第１の学習用テキストに対応するテキストであって生成条件を満たすテキストを出力させる。そして、学習部１３２は、モデルＭが実際に出力したテキストと、学習データに含まれる第３の学習用テキスト（例えば、見出し）との差に基づいて、モデルＭの接続係数を修正する。例えば、学習部１３２は、バックプロパゲーション等の手法を用いて、接続係数の修正を行ってもよい。また、学習部１３２は、第３の学習用テキストの分散表現となるベクトルと、モデルＭが実際に出力したテキストの分散表現となるベクトルとのコサイン類似度に基づいて、接続係数の修正を行ってもよい。

また、学習部１３２は、モデルＭ１０（第３のモデル）の学習を行い、学習したモデルＭ１０をモデルデータベース１２２に格納する。より具体的には、学習部１３２は、第２の学習用テキスト（例えば、本文）及び該第２の学習用テキストに関連する第４の学習用テキスト（例えば、関連テキスト）の少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキスト（例えば、トピックセンテンス、ファーストセンテンス、或いはそれらの組み合わせ）をモデルＭ１０に入力した際に、モデルＭ１０が学習データに含まれる第１の学習用テキスト（例えば、本文に対応するタイトル或いは見出し）を出力するように、モデルＭが有する各モデルの接続係数の設定を行ってもよい。すなわち、学習部１３２は、入力テキスト及び入力テキストに関連する関連テキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを入力した際に、モデルＭが、入力テキストに対応する出力テキストを出力するように、モデルＭの学習を行ってもよい。

例えば、学習部１３２は、モデルＭ１０が有する入力層のノードであって、入力層に入力される情報と対応する特徴を学習したエンコーダの入力層と対応するノードに第２の学習用テキスト（例えば、本文）及び第２の学習用テキストに関連する第４の学習用テキスト（例えば、関連テキスト）の少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキスト（例えば、トピックセンテンス、ファーストセンテンス、或いはそれらの組み合わせ）を入力し、各中間層を辿ってモデルＭ１０の出力層までデータを伝播させることで、第２の学習用テキストに対応するテキスト（例えば、本文に対応するタイトル或いは見出し）を出力させる。そして、学習部１３２は、モデルＭが実際に出力したテキストと、学習データに含まれる第１の学習用テキスト（例えば、タイトル或いは見出し）との差に基づいて、モデルＭ１０の接続係数を修正する。例えば、学習部１３２は、バックプロパゲーション等の手法を用いて、接続係数の修正を行ってもよい。また、学習部１３２は、第１の学習用テキストの分散表現となるベクトルと、モデルＭが実際に出力したテキストの分散表現となるベクトルとのコサイン類似度に基づいて、接続係数の修正を行ってもよい。

なお、学習部１３２は、いかなる学習アルゴリズムを用いてモデルＭ、Ｍ１０を学習してもよい。例えば、学習部１３２は、ニューラルネットワーク、サポートベクターマシン（support vector machine）、クラスタリング、強化学習等の学習アルゴリズムを用いて、モデルＭを学習してよい。

ここで、学習部１３２は、第１の学習用テキストと第２の学習用テキストとを入力データ、第３の学習用テキストを正解データとして、第１のテキスト及び該第１のテキストの元のテキストである第２のテキストから生成条件を満たす第３のテキストを生成する第１のモデル（例えば、モデルＭ）の学習を行う。このとき、第１のモデルは、第３のテキストとして、所定の文字数以下のテキストを生成するモデルであってもよい。学習部１３２は、第３の学習用テキストとして所定の文字数以下のテキストを取得してもよい。

なお、第１のモデル（例えば、モデルＭ）は、第１のテキストに基づいて第１の特徴情報を生成する第１のエンコーダと、第２のテキストに基づいて第２の特徴情報を生成する第２のエンコーダと、第１の特徴情報及び第２の特徴情報に基づいて第３のテキストを生成するデコーダと、を含んでいてもよい。そして、学習部１３２は、第１の学習用テキストを第１のエンコーダに入力される入力データ、第２の学習用テキストを第２のエンコーダに入力される入力データ、第３の学習用テキストを正解データとして、第１のモデルの学習を行ってもよい。

また、学習部１３２は、第２の学習用テキストを入力データ、第１の学習用テキストを正解データとして、第２のエンコーダを含む第２のモデル（例えば、図６に示すエンコーダＥ２１とデコーダＤ２１により構成されるモデル）の学習を行うことにより、第２のエンコーダ（例えば、エンコーダＥ２１）の学習を行う。

また、学習部１３２は、第２の学習用テキストを入力データ、第３の学習用テキストを正解データとして、第２のエンコーダを含む第２のモデルの学習を行うことにより、第２のエンコーダの学習を行う。

また、学習部１３２は、第１の学習用テキストと第２の学習用テキストと第４の学習用テキストとを入力データ、第３の学習用テキストを正解データとして第１のモデルの学習を行う。

また、学習部１３２は、学習用抽出テキストを入力データ、第１の学習用テキストを正解データとして、第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストから第２のテキストに対応する第１のテキストを生成する第３のモデル（例えば、モデルＭ１０）の学習を行う。

また、学習部１３２は、学習用抽出テキストを入力データ、第１の学習用テキストを正解データとして、第２のテキスト及び第４のテキストの少なくとも一方のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である抽出テキストから第２のテキストに対応する第１のテキストを生成する第３のモデルの学習を行う。

また、学習部１３２は、学習用抽出テキストを入力データ、第１の学習用テキストを正解データとして、第２のテキスト及び第４のテキストの少なくとも一方のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文と、から第２のテキストに対応する第１のテキストを生成する第３のモデルの学習を行う。

出力情報取得部１３３は、第１のテキスト及び該第１のテキストの元のテキストである第２のテキストを取得する。

また、出力情報取得部１３３は、第２のテキストに関連する第４のテキストを取得する。このとき、出力情報取得部１３３は、第２のテキストに張られたリンクを辿って得られるテキストを第４のテキストとして取得してもよい。或いは、出力情報取得部１３３は、第２のテキストの一部を検索クエリとして検索した結果得られるテキストを第４のテキストとして取得してもよい。なお、出力情報取得部１３３は、複数の関連テキストの中で第１のテキストと最も類似するテキストを第４のテキストとして取得してもよい。

出力情報取得部１３３は、第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する。また、出力情報取得部１３３は、第２のテキスト或いは第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文を抽出テキストとして取得する。

また、出力情報取得部１３３は、第２のテキスト或いは第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文と、第２のテキスト或いは第４のテキストの第一文と、を抽出テキストとして取得する。

また、出力情報取得部１３３は、第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、を取得する。

また、出力情報取得部１３３は、第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、第２のテキストの第一文である第３の抽出テキストと、第４のテキストの第一文である第４の抽出テキストと、を取得する。

生成部１３４は、第１のテキストと第２のテキストとに基づいて、第１のテキスト或いは第２のテキストに対応するテキストであって生成条件を満たす第３のテキストを生成する。生成部１３４は、第３のテキストとして、所定の文字数以下のテキストを生成してもよい。

また、生成部１３４は、第１のテキストと第２のテキストとの関連に基づいて第２のテキストから生成された特徴情報と、第１のテキストと、に基づいて第３のテキストを生成する。

また、生成部１３４は、第１のテキストと第２のテキストと第４のテキストに基づいて、第３のテキストを生成する。

また、生成部１３４は、第１の学習用テキストと第１の学習用テキストの元のテキストである第２の学習用テキストとを入力データ、第１の入力テキスト或いは第２の入力テキストに対応するテキストであって生成条件を満たす第３の学習用テキストを正解データとして学習したモデル（例えば、モデルＭ）に第１のテキストと第２のテキストとを入力することにより、第３のテキストを生成する。

また、生成部１３４は、抽出テキストに基づいて、第２のテキストに対応する第１のテキストを生成する。また、生成部１３４は、第１の抽出テキストと第２の抽出テキストに基づいて、第２のテキストに対応する第１のテキストを生成する。また、生成部１３４は、第１の抽出テキストと第２の抽出テキストと第３の抽出テキストと第４の抽出テキストとに基づいて、第２のテキストに対応する第１のテキストを生成する。

また、生成部１３４は、第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストを入力データ、第２の学習用テキストに対応する第１の学習用テキストを正解データとして学習したモデル（例えば、モデルＭ１０）に抽出テキストを入力することにより、第１のテキストを生成する。

出力制御部１３５は、生成部１３４が生成したテキストを利用者に対して出力する。例えば、出力制御部１３５は、端末装置３０からの要求に応じて、生成部１３４が生成したテキストが含まれるコンテンツを配信する。なお、出力制御部１３５は、生成部１３４が生成したテキストが含まれるコンテンツをデータサーバ２０に提供し、データサーバ２０から配信させてもよい。

〔３．情報処理装置の処理フロー〕
次に、情報処理装置１０が実行する処理の手順について説明する。情報処理装置１０は学習処理と生成処理とを実行する。情報処理装置１０はマルチタスクＯＳを備え、これらの処理を並行して実行可能である。

〔３−１．学習処理〕
最初に学習処理を説明する。図１５は、学習処理の一例を示すフローチャートである。学習処理は、入力テキスト（例えば、タイトル）と当該入力テキストの元のテキスト（例えば、本文）から出力テキスト（例えば、見出し）を生成するモデルＭを学習する処理である。情報処理装置１０は、ユーザから処理開始命令を受信すると、学習処理を実行する。

まず、情報処理装置１０は、学習データを取得する（ステップＳ１１）。例えば、情報処理装置１０は、データサーバ２０から配信コンテンツ（本文及びタイトル）の情報を取得するとともに、配信コンテンツに対応する見出しを取得する。

続いて、情報処理装置１０は、ステップＳ１１で取得したデータの中から、入力データとなるテキスト（第１の学習用テキスト及び第２の学習用テキスト）と、当該入力データに対応するテキストであって正解データとなるテキスト（第３の学習用テキスト）を選択する（ステップＳ１２）。例えば、情報処理装置１０は、タイトルを第１の学習用テキスト、当該タイトルの本文を第２の学習用テキスト、見出しを第３の学習用テキストとして選択する。

続いて、情報処理装置１０は、第２の学習用テキストの関連テキストを取得する（ステップＳ１３）。

そして、情報処理装置１０は、第１の学習用テキストと第２の学習用テキストを入力データ、第３の学習用テキストを正解データとしてモデルＭの学習を実行する（ステップＳ１４）。なお、モデルＭが第１の学習用テキストと第２の学習用テキストとに加えて関連テキストを入力できるよう構成されているのであれば、情報処理装置１０は、第１の学習用テキストと第２の学習用テキストと関連テキストを入力データ、第３の学習用テキストを正解データとしてモデルＭの学習を実行する。学習の実行が終了したら、情報処理装置１０は、学習処理を終了する。

〔３−２．生成処理〕
次に生成処理を説明する。図１６は、生成処理の一例を示すフローチャートである。生成処理は、入力テキスト（例えば、タイトル）と当該入力テキストの元のテキスト（例えば、本文）から出力テキスト（例えば、見出し）を生成する処理である。情報処理装置１０は、ユーザから処理開始命令を受信すると、生成処理を実行する。

まず、情報処理装置１０は、コンテンツ情報を取得する（ステップＳ２１）。例えば、情報処理装置１０は、データサーバ２０から配信コンテンツ（本文及びタイトル）の情報を取得する。

続いて、情報処理装置１０は、ステップＳ２１で取得したデータの中から、モデルＭに入力する入力テキスト（第１のテキスト及び第２のテキスト）を選択する（ステップＳ２２）。例えば、情報処理装置１０は、タイトルを第１のテキスト、本文を第２のテキストとして選択する。

続いて、情報処理装置１０は、第２のテキストの関連テキストを取得する（ステップＳ２３）。

続いて、情報処理装置１０は、第１のテキスト及び第２のテキストをモデルＭに入力して第３のテキストを生成する（ステップＳ２４）。なお、モデルＭが第１のテキストと第２のテキストとに加えて関連テキストを入力できるよう構成されているのであれば、情報処理装置１０は、第１のテキストと第２のテキストとに加えて関連テキストをモデルＭに入力してもよい。出力テキストの生成が終了したら、情報処理装置１０は、生成処理を終了する。

〔３−３．学習処理〕
次にモデルＭ１０の学習処理を説明する。図１７は、学習処理の他の例を示すフローチャートである。学習処理は、入力テキスト（例えば、抽出テキスト）から出力テキスト（例えば、タイトル）を生成するモデルＭ１０を学習する処理である。情報処理装置１０は、ユーザから処理開始命令を受信すると、学習処理を実行する。

まず、情報処理装置１０は、学習データを取得する（ステップＳ３１）。例えば、情報処理装置１０は、データサーバ２０から配信コンテンツ（本文）の情報を取得するとともに、配信コンテンツに対応するタイトルを取得する。

続いて、情報処理装置１０は、ステップＳ３１で取得したデータの中から、要約元となるテキスト（第２の学習用テキスト）と、正解データとなるテキスト（第１の学習用テキスト）を選択する（ステップＳ３２）。例えば、情報処理装置１０は、本文を第２の学習用テキスト、当該本文のタイトルを第１の学習用テキストとして選択する。

続いて、情報処理装置１０は、第２の学習用テキストの関連テキストを取得する（ステップＳ３３）。そして、情報処理装置１０は、第２の学習用テキスト及び関連テキストの少なくとも一方のテキストから学習用抽出テキストを取得する（ステップＳ３４）。

そして、情報処理装置１０は、学習用抽出テキストを入力データ、第１の学習用テキストを正解データとしてモデルＭ１０の学習を実行する（ステップＳ３５）。学習の実行が終了したら、情報処理装置１０は、モデルＭ１０の学習処理を終了する。

〔３−４．生成処理〕
次にモデルＭ１０を使ったテキストの生成処理を説明する。図１８は、生成処理の他の例を示すフローチャートである。生成処理は、第２のテキスト（例えば、本文）に対応する第１のテキスト（例えば、タイトル）を生成する処理である。情報処理装置１０は、ユーザから処理開始命令を受信すると、生成処理を実行する。

まず、情報処理装置１０は、コンテンツ情報を取得する（ステップＳ４１）。例えば、情報処理装置１０は、データサーバ２０から配信コンテンツ（本文）の情報を取得する。

続いて、情報処理装置１０は、ステップＳ４１で取得したデータの中から、要約元となるテキスト（第２のテキスト）を選択する（ステップＳ４２）。例えば、情報処理装置１０は、本文を第２のテキストとして選択する。

続いて、情報処理装置１０は、第２のテキストの関連テキストを取得する（ステップＳ４３）。そして、情報処理装置１０は、第２のテキスト及び関連テキストの少なくとも一方のテキストから抽出テキストを取得する（ステップＳ４４）。

続いて、情報処理装置１０は、抽出テキストをモデルＭ１０に入力して第１のテキストを生成する（ステップＳ４５）。第１のテキストの生成が終了したら、情報処理装置１０は、生成処理を終了する。

〔４．合成処理の詳細〕
上述の実施形態では、情報処理装置１０は、複数のエンコーダから出力される特徴情報を合成した。以下、この合成処理の詳細について述べる。以下の説明では、第１のテキストをタイトル、第２のテキストを本文、第３のテキストを見出しとした時を例に、合成処理の詳細を述べる。最初に、エンコーダ・デコーダモデルについて述べる。

〔４−１．エンコーダ・デコーダモデル〕
本実施形態では、エンコーダ・デコーダモデルの一例として、例えば図６に示したような、アテンションモデルを使用した。以下、アテンションモデルを例に、エンコーダ・デコーダモデルで実行される処理を説明する。

本実施形態の情報処理装置１０は、長さＳの入力文字列をＸ＝［ｘ_１，ｘ_２，・・・，ｘ_Ｓ]、長さＴの出力文字列をＹ＝［ｙ_１，ｙ_２，・・・，ｙ_Ｔ]として，以下の式（１）で示される確率を最大にするように学習することで、ＸからＹを生成するモデルを作成する。

ここで式（１）に示したｐ（ｙ_ｔ+１｜ｙ_≦ｔ）は、Ｘをベクトル化するエンコーダとＹを出力するデコーダを用いて、以下の式（２）〜式（５）のように表される。

ここで、式（２）はエンコーダによる処理を示しており、式（３）から式（５）はデコーダによる処理を表している。式（２）のｆ_ｅｎｃは入力ｘ_ｓと、ｓ−１番目の状態ベクトルｈ_ｓ-１を用いてｓ番目の状態ベクトルｈ_ｓを計算する状態遷移関数である。式（３）のｆ_ｄｅｃも状態遷移関数である。式（３）では、ｙ_ｔとｔ−１の状態ベクトルｓ_ｔ−１を利用してｓ_ｔを計算している。なお、ｓ_０＝ｈ_Ｓである。式（４）はアテンションと呼ばれる処理である。α_ｔ，ｓはｓ_ｔとｈ_ｓに基づいて計算される重みで、各入力のｈ_ｓの重要度を表す。この重みつき和を計算することにより、ｓ_ｔに関連する入力文字列のベクトルを計算することができる。式（４）で示したｃ_ｔが特徴情報となる。そして、式（５）のｇ_ｄｅｃでｃ_ｔとｓ_ｔを入力として、次の出力の確率を計算する。例えば、入力文字列を本文或いはタイトル、出力文字列を見出しとすることで、本文或いはタイトルから見出しを生成するモデルを作成することができる。

〔４−２．複数エンコーダを利用するモデル〕
上述したように、本実施形態では、情報処理装置１０は、記事のタイトルと記事の本文をそれぞれエンコーダによってベクトル化し、その出力を合成モデルで統合する。なお、上述の実施形態（例えば、図４を使って説明した例）では、複数のエンコーダの出力を合成するのは合成モデルであった。しかし、複数のエンコーダの出力を合成するのは、合成モデルではなく、デコーダであってもよい。

情報処理装置１０は、次のように各エンコーダの出力を合成してもよい。例えば、情報処理装置１０は、エンコーダごとにスカラーの重みを動的に計算し、その重み和ベクトルを、複数のエンコーダから出力される特徴情報を合成した合成情報とする。合成情報は、デコーダで使用される特徴情報であり、上述の例であれば、式（５）で示したｇ_ｄｅｃに入力されるｃ_ｔである。例えば、記事のタイトルのベクトルをｄ_ｔ、記事の本文のベクトルをｄ’_ｔ、βをスカラーの重みとすると、合成情報（統合された特徴情報）は、ｃ_ｔ＝βｄ_ｔ＋（１−β）ｄ’_ｔとなる。

〔４−３．合成情報の生成〕
なお、上述の例（４−２の例）では、重みをスカラー値で計算し、これを掛けることによって重み付き和を計算した。しかし、ｃ_ｔの各要素がそれぞれ特徴を表現する役割を担っていると考えると、要素ごとに重みを計算できれば、より適切な特徴を表現できる。そこで、以下の式（６）〜式（８）ようにｃ_ｔを計算する。

ここで、式（６）、式（７）に示したσはシグモイド関数である。また、ＷとＷ’はそれぞれ重み行列を表している。また、式（８）に示した記号（円の中心に点）は要素ごとの積を示している。図１９は、複数のエンコーダの出力を合成する様子を示す図である。具体的には、図１９は、デコーダ部の処理である式（３）、同じくデコーダ部の処理であり確率を計算する式（５）、重みの計算処理である式（６）及び式（７）を除いた処理を図にしたものであり、計算された重みを用いてベクトルを統合する処理の概略図である。より具体的には、図１９に示すエンコーダが式（２）に相当し、図１９に示すアテンションが式（４）に相当し、エンコーダ及びアテンション以後の処理が式（６）に相当する。なお、上記式（４）では出力がｃ_ｔとなっているが、これが、ｄ_ｔとｄ’_ｔに置き換わる。

このように、要素ごとに重みを計算することで、より詳細な重みつき和（統合された特徴情報）を計算できる。結果として、情報処理装置１０は、精度が高いテキストを生成できる。

〔５．変形例〕
上述の実施形態は一例を示したものであり、種々の変更及び応用が可能である。

例えば、上述の実施形態では、情報処理装置１０は、第１の学習用テキストをタイトル、第２の学習用テキストを本文、第３の学習用テキストを見出しとしてモデルＭの学習を行った。しかし、第１の学習用テキスト、第２の学習用テキスト、及び第３の学習用テキストは上記の例に限定されない。例えば、情報処理装置１０は、第１の学習用テキストを論文の要約、第２の学習用テキストを要約の元となった論文、第３の学習用テキストを論文のタイトルとしてモデルＭの学習を行ってもよい。その他、第１の学習用テキスト、第２の学習用テキスト、及び第３の学習用テキストとするテキストは任意に変更可能である。第４の学習用テキストとするテキストも任意に変更可能である。同様に、モデルＭに入力する第１のテキスト、第２のテキスト、第３のテキスト、及び第４のテキスト（関連テキスト）とするテキストも任意に変更可能である。

また、第１〜第４のテキスト、及び第１〜第３の学習用テキストは適宜言い換えることが可能である。例えば、実施形態２において、第２のテキストを第１のテキスト、第４のテキストを第２のテキスト、第１のテキストを第３のテキストと言い換えること可能である。同様に、実施形態２において、第２の学習用テキストを第１の学習用テキスト、第４の学習用テキストを第２の学習用テキスト、第１の学習用テキストを第３の学習用テキストと言い換えること可能である。

また、上述の実施形態では、情報処理装置１０は、第２の学習用テキスト（本文）を入力データ、第１の学習用テキスト（タイトル）を正解データとして、第２のモデル（例えば、図６に示すモデル）に含まれるエンコーダＥ２１（第２のエンコーダ）の学習を行った。しかし、情報処理装置１０は、第２の学習用テキスト（本文）を入力データ、第３の学習用テキスト（見出し）を正解データとして、第２のモデルに含まれるエンコーダＥ２１（第２のエンコーダ）の学習を行ってもよい。

また、上述の実施形態では、モデルＭは、アテンションモデルを追加したＳｅｑ２Ｓｅｑであるものとしたが、アテンションモデルが追加されていない通常のＳｅｑ２Ｓｅｑであってもよい。

また、上述の実施形態では、モデルＭを構成するエンコーダおよびデコーダは、ＬＳＴＭにより構成されるものとしたが、ＬＳＴＭ以外のＲＮＮにより構成されていてもよい。モデルＭを構成するエンコーダおよびデコーダは、ＣＮＮ（Convolution Neural Network）等、ＲＮＮ以外のニューラルネットワークであってもよい。その他、モデルＭを構成するエンコーダおよびデコーダは、単純に入力された情報量の次元数を変化させるニューラルネットワークであってもよい。このとき、モデルＭを構成するエンコーダは、入力された情報の次元量を圧縮することで入力された情報が有する特徴を抽出するよう構成されていてもよい。また、モデルＭを構成するデコーダは、エンコーダによって抽出された特徴の次元量を増大させ、エンコーダに入力された情報よりも次元数が少ない情報を出力するよう構成されていてもよい。

また、上述の実施形態では、情報処理装置１０は学習モデル（モデルＭ）を使用して第３のテキストを生成したが、情報処理装置１０は学習モデルを使用せずに第３のテキストを生成してもよい。例えば、情報処理装置１０は、第１のテキスト（タイトル）を構文解析し、不要なワードを第１のテキストから削除してもよい。そして、情報処理装置１０は、第１のテキスト（タイトル）に含まれる略語の本来のワードを第２のテキスト（本文）に基づいて特定し、第１のテキストに含まれる略語を本来のワードに置き換えてもよい。そして、情報処理装置１０は、略語を置き換えたテキストを第３のテキストとして取得してもよい。

本実施形態の情報処理装置１０を制御する制御装置は、専用のコンピュータシステムによって実現してもよいし、通常のコンピュータシステムにより実現してもよい。例えば、上述の動作を実行するためのプログラムまたはデータ（例えば、モデルＭ）を、光ディスク、半導体メモリ、磁気テープ、フレキシブルディスク等のコンピュータ読み取り可能な記録媒体に格納して配布し、該プログラムをコンピュータにインストールし、上述の処理を実行することによって制御装置を構成してもよい。制御装置は、情報処理装置１０の外部の装置（例えば、パーソナルコンピュータ）であってもよいし、内部の装置（例えば、制御部１３）であってもよい。また、上記プログラムをインターネット等のネットワーク上のサーバ装置が備えるディスク装置に格納しておき、コンピュータにダウンロード等できるようにしてもよい。また、上述の機能を、ＯＳ（Operating System）とアプリケーションソフトとの協働により実現してもよい。この場合には、ＯＳ以外の部分を媒体に格納して配布してもよいし、ＯＳ以外の部分をサーバ装置に格納しておき、コンピュータにダウンロード等できるようにしてもよい。

また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

〔６．ハードウェア構成〕
実施形態及び変形例に係る情報処理装置１０は、例えば図２０に示すような構成のコンピュータ１０００によっても実現可能である。図２０は、情報処理装置１０の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ（Central Processing Unit）１１００、ＲＡＭ（Random Access Memory）１２００、ＲＯＭ（Read Only Memory）１３００、ＨＤＤ（Hard Disk Drive）１４００、通信インタフェース（Ｉ／Ｆ）１５００、入出力インタフェース（Ｉ／Ｆ）１６００、及びメディアインタフェース（Ｉ／Ｆ）１７００を有する。

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インタフェース１５００は、ネットワークＮを介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータをネットワークＮを介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インタフェース１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インタフェース１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インタフェース１６００を介して出力装置へ出力する。

メディアインタフェース１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインタフェース１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が実施形態に係る情報処理装置１０として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムまたはデータ（例えば、モデルＭ）を実行することにより、制御部１３を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムまたはデータ（例えば、モデルＭ）を記録媒体１８００から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムまたはデータ（例えば、モデルＭ）を取得してもよい。

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

〔７．効果〕
情報処理装置１０は、第１のテキスト及び該第１のテキストの元のテキストである第２のテキストを取得する。そして、情報処理装置１０は、第１のテキストと第２のテキストとに基づいて、第１のテキスト或いは第２のテキストに対応するテキストであって生成条件を満たす第３のテキストを生成する。このとき、情報処理装置１０は、第３のテキストとして、所定の文字数以下のテキストを生成してもよい。これにより、第１のテキストに曖昧な表現が含まれていたり、第１のテキストの情報量が少なかったりしても、第２のテキストの情報で補完できるので、情報処理装置１０は、精度の高い第３のテキストを生成できる。

情報処理装置１０は、第１のテキストと第２のテキストとの関連に基づいて第２のテキストから生成された特徴情報と、第１のテキストと、に基づいて第３のテキストを生成する。これにより、情報処理装置１０は、第２のテキストのうちの第１のテキストに近い部分（関連する部分）の情報を使って第３のテキストを生成できるようになる。この結果、第２のテキストに含まれる大量の情報が第３のテキストの生成の阻害要因とならないので、情報処理装置１０は、精度の高い第３のテキストを生成できる。

情報処理装置１０は、第２のテキストに関連する第４のテキストを取得する。そして、情報処理装置１０は、第１のテキストと第２のテキストと第４のテキストに基づいて、第３のテキストを生成する。これにより、第１のテキストと第２のテキストの不足部分を第４のテキストで補完できるので、情報処理装置１０は、精度の高い第３のテキストを生成できる。

情報処理装置１０は、第２のテキストに張られたリンクを辿って得られるテキストを第４のテキストとして取得する。リンクを辿って得られるテキストは、第２のテキストの内容を補完する内容である可能性が高い。結果として、情報処理装置１０は、精度の高い第３のテキストを生成できる。

情報処理装置１０は、第２のテキストの一部を検索クエリとして検索した結果得られるテキストを第４のテキストとして取得する。第２のテキストの一部を検索クエリとして検索した結果得られるテキストは、第２のテキストの内容を補完する内容である可能性が高い。結果として、情報処理装置１０は、精度の高い第３のテキストを生成できる。

情報処理装置１０は、第２のテキストに関連する複数の関連テキストから所定の基準を満たす第４のテキストを取得する。情報処理装置１０は、第１のテキストと第２のテキストと第４のテキストに基づいて、第３のテキストを生成する。情報処理装置１０は、複数の関連テキストから選択されたテキストを第４のテキストとしている。この結果、大量の情報が第３のテキストの生成の阻害要因とならないので、情報処理装置１０は、精度の高い第３のテキストを生成できる。

情報処理装置１０は、複数の関連テキストの中で第１のテキストと最も類似するテキストを第４のテキストとして取得する。これにより、大量の情報が第３のテキストの生成の阻害要因とならないので、情報処理装置１０は、精度の高い第３のテキストを生成できる。

情報処理装置１０は、第１の学習用テキストと第１の学習用テキストの元のテキストである第２の学習用テキストとを入力データ、第１の学習用テキスト或いは第２の学習用テキストに対応するテキストであって生成条件を満たす第３の学習用テキストを正解データとして学習したモデルＭに第１のテキストと第２のテキストとを入力することにより、第３のテキストを生成する。これにより、情報処理装置１０は、精度の高い第３のテキストを生成できる。

モデルＭは、第１のテキストに基づいて第１の特徴情報を生成する第１のエンコーダと、第２のテキストに基づいて第２の特徴情報を生成する第２のエンコーダと、第１の特徴情報及び第２の特徴情報に基づいて第３のテキストを生成するデコーダと、を含む。これにより、情報処理装置１０は、精度の高い第３のテキストを生成できる。

情報処理装置１０は、第１の学習用テキストと、第１の学習用テキストの元のテキストである第２の学習用テキストと、第１の学習用テキストに対応するテキストであって生成条件を満たす第３の学習用テキストと、を取得する。そして、第１の学習用テキストと第２の学習用テキストとを入力データ、第３の学習用テキストを正解データとして、第１のテキスト及び該第１のテキストの元のテキストである第２のテキストから生成条件を満たす第３のテキストを生成する第１のモデル（例えば、モデルＭ）の学習を行う。これにより、情報処理装置１０は、第３のテキストを生成するための精度の高いモデルを実現できる。

第１のモデル（例えば、モデルＭ）は、第１のテキストに基づいて第１の特徴情報を生成する第１のエンコーダと、第２のテキストに基づいて第２の特徴情報を生成する第２のエンコーダと、第１の特徴情報及び第２の特徴情報に基づいて第３のテキストを生成するデコーダと、を含む。そして、情報処理装置１０は、第１の学習用テキストを第１のエンコーダに入力される入力データ、第２の学習用テキストを第２のエンコーダに入力される入力データ、第３の学習用テキストを正解データとして、モデルＭ（第１のモデル）の学習を行う。これにより、情報処理装置１０は、第３のテキストを生成するための精度の高いモデルを実現できる。

情報処理装置１０は、第２の学習用テキストを入力データ、第１の学習用テキストを正解データとして、第２のエンコーダを含む第２のモデル（例えば、図６に示すモデル）の学習を行うことにより、第２のエンコーダ（例えば、図６に示すエンコーダＥ２１）の学習を行う。これにより、情報処理装置１０は、第２のテキスト（本文）のうちの第１のテキスト（タイトル）に近い部分を判別可能にする特徴情報を精度よく生成する第２のエンコーダを実現できる。この結果、情報処理装置１０は、第３のテキストを生成するための精度の高いモデルを実現できる。

情報処理装置１０は、第２の学習用テキストを入力データ、第３の学習用テキストを正解データとして、第２のエンコーダを含む第２のモデルの学習を行うことにより、第２のエンコーダの学習を行う。これにより、情報処理装置１０は、第２のテキスト（本文）のうちの第３のテキスト（見出し）に近い部分を判別可能にする特徴情報を精度よく生成する第２のエンコーダを実現できる。この結果、情報処理装置１０は、第３のテキストを生成するための精度の高いモデルを実現できる。

情報処理装置１０は、第２の学習用テキストに関連する第４の学習用テキストを取得する。そして、情報処理装置１０は、第１の学習用テキストと第２の学習用テキストと第４の学習用テキストとを入力データ、第３の学習用テキストを正解データとして第１のモデルの学習を行う。これにより、情報処理装置１０は、第３のテキストを生成するための精度の高いモデルを実現できる。

情報処理装置１０は、第２の学習用テキストに関連する複数の関連テキストから所定の基準を満たす第４の学習用テキストを取得する。そして、情報処理装置１０は、第１の学習用テキストと第２の学習用テキストと第４の学習用テキストとを入力データ、第３の学習用テキストを正解データとしてモデルＭ（第１のモデル）の学習を行う。これにより、情報処理装置１０は、第３のテキストを生成するための精度の高いモデルを実現できる。

情報処理装置１０は、第２のテキスト（例えば、本文）及び該第２のテキストに関連する第４のテキスト（例えば、関連テキスト）の少なくとも一方のテキストから所定の基準に従い抽出された抽出テキスト（例えば、トピックセンテンス、ファーストセンテンス、或いはそれらの組み合わせ）を取得する。そして、情報処理装置１０は、抽出テキストに基づいて、第２のテキストに対応する第１のテキスト（例えば、タイトル、見出し）を生成する。これにより、情報処理装置１０は、精度の高い第１のテキストを生成できる。

情報処理装置１０は、第２のテキスト或いは第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文（トピックセンテンス）を抽出テキストとして取得する。上述したように、トピックセンテンスは、多くのテキストで特徴的部分であることが多い。そのため、情報処理装置１０は、精度の高い第１のテキストを生成できる。

情報処理装置１０は、第２のテキスト或いは第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文（トピックセンテンス）と、第２のテキスト或いは第４のテキストの第一文（ファーストセンテンス）と、を抽出テキストとして取得する。上述したように、書き出し部分であるファーストセンテンスには重要な情報が含まれていることが多い。そのため、情報処理装置１０は、トピックセンテンスに加えてファーストセンテンスを抽出テキストとして使用することで、さらに精度の高い第１のテキストを生成できる。

情報処理装置１０は、第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、を取得する。そして、情報処理装置１０は、第１の抽出テキストと第２の抽出テキストに基づいて、第２のテキストに対応する第１のテキストを生成する。これにより、情報処理装置１０は、精度の高い第１のテキストを生成できる。

情報処理装置１０は、第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、第２のテキストの第一文である第３の抽出テキストと、第４のテキストの第一文である第４の抽出テキストと、を取得する。そして、情報処理装置１０は、第１の抽出テキストと第２の抽出テキストと第３の抽出テキストと第４の抽出テキストとに基づいて、第２のテキストに対応する第１のテキストを生成する。これにより、情報処理装置１０は、精度の高い第１のテキストを生成できる。

情報処理装置１０は、第２の学習用テキスト及び該第２の学習用テキスト（例えば、本文）に関連する第４の学習用テキスト（例えば、関連テキスト）の少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキスト（例えば、トピックセンテンス、ファーストセンテンス、或いはそれらの組み合わせ）を入力データ、第２の学習用テキストに対応する第１の学習用テキスト（例えば、タイトル、見出し）を正解データとして学習したモデルＭ１０（第３のモデル）に抽出テキスト（例えば、トピックセンテンス、ファーストセンテンス、或いはそれらの組み合わせ）を入力することにより、第１のテキスト（例えば、タイトル、見出し）を生成する。これにより、情報処理装置１０は、精度の高い第１のテキストを生成できる。

情報処理装置１０は、第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストと、第２の学習用テキストに対応する第１の学習用テキストと、を取得する。そして、情報処理装置１０は、学習用抽出テキストを入力データ、第１の学習用テキストを正解データとして、第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストから第２のテキストに対応する第１のテキストを生成するモデルＭ１０（第３のモデル）の学習を行う。これにより、情報処理装置１０は、第１のテキストを生成するための精度の高いモデルを実現できる。

情報処理装置１０は、第２の学習用テキスト或いは第４の学習用テキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文を学習用抽出テキストとして取得する。そして、情報処理装置１０は、学習用抽出テキストを入力データ、第１の学習用テキストを正解データとして、第２のテキスト及び第４のテキストの少なくとも一方のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である抽出テキストから第２のテキストに対応する第１のテキストを生成するモデルＭ１０（第３のモデル）の学習を行う。上述したように、トピックセンテンスは、多くのテキストで特徴的部分であることが多い。そのため、情報処理装置１０は、第１のテキストを生成するための精度の高いモデルを実現できる。

情報処理装置１０は、第２の学習用テキスト或いは第４の学習用テキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文と、第２の学習用テキスト或いは第４の学習用テキストの第一文と、を学習用抽出テキストとして取得する。情報処理装置１０は、学習用抽出テキストを入力データ、第１の学習用テキストを正解データとして、第２のテキスト及び第４のテキストの少なくとも一方のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文と、から第２のテキストに対応する第１のテキストを生成するモデルＭ１０（第３のモデル）の学習を行う。上述したように、書き出し部分であるファーストセンテンスには重要な情報が含まれていることが多い。そのため、情報処理装置１０は、トピックセンテンスに加えてファーストセンテンスを学習用抽出テキストとして使用することで、第１のテキストを生成するためのさらに精度の高いモデルを実現できる。

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。

１０…情報処理装置
１１…通信部
１２…記憶部
１２１…学習データデータベース
１２２…モデルデータベース
１２３…コンテンツ情報データベース
１３…制御部
１３１…学習データ取得部
１３２…学習部
１３３…出力情報取得部
１３４…生成部
１３５…出力制御部
２０…データサーバ
３０…端末装置
Ｍ、Ｍ１、Ｍ２、Ｍ３、Ｍ１０…モデル
Ｅ１１、Ｅ１２、Ｅ２１、Ｅ２２、Ｅ３１、Ｅ３２、Ｅ３３…エンコーダ
Ｄ１、Ｄ２１、Ｄ２２、Ｄ３…デコーダ
ＦＳ１１、ＦＳ２１…ファーストセンテンス
ＴＳ１１、ＴＳ１２、ＴＳ２１、ＴＳ２２…トピックセンテンス

Claims

第１のテキスト及び該第１のテキストの元のテキストである第２のテキストを取得する取得部と、
前記第１のテキストと前記第２のテキストとに基づいて、前記第１のテキスト或いは前記第２のテキストに対応するテキストであって所定の条件を満たす第３のテキストを生成する生成部と、
を備えることを特徴とする生成装置。
前記生成部は、前記第１のテキストと前記第２のテキストとの関連に基づいて前記第２のテキストから生成された特徴情報と、前記第１のテキストと、に基づいて前記第３のテキストを生成する、
ことを特徴とする請求項１に記載の生成装置。
前記取得部は、前記第２のテキストに関連する第４のテキストを取得し、
前記生成部は、前記第１のテキストと前記第２のテキストと前記第４のテキストに基づいて、前記第３のテキストを生成する、
ことを特徴とする請求項１又は２に記載の生成装置。
前記取得部は、前記第２のテキストに張られたリンクを辿って得られるテキストを前記第４のテキストとして取得する、
ことを特徴とする請求項３に記載の生成装置。
前記取得部は、前記第２のテキストの一部を検索クエリとして検索した結果得られるテキストを前記第４のテキストとして取得する、
ことを特徴とする請求項３に記載の生成装置。
前記取得部は、前記第２のテキストに関連する複数の関連テキストから所定の基準を満たす第４のテキストを取得し、
前記生成部は、前記第１のテキストと前記第２のテキストと前記第４のテキストに基づいて、前記第３のテキストを生成する、
ことを特徴とする請求項１又は２に記載の生成装置。
前記取得部は、前記複数の関連テキストの中で前記第１のテキストと最も類似するテキストを前記第４のテキストとして取得する、
ことを特徴とする請求項６に記載の生成装置。
前記生成部は、第１の学習用テキストと前記第１の学習用テキストの元のテキストである第２の学習用テキストとを入力データ、前記第１の学習用テキスト或いは前記第２の学習用テキストに対応するテキストであって前記所定の条件を満たす第３の学習用テキストを正解データとして学習したモデルに前記第１のテキストと前記第２のテキストとを入力することにより、前記第３のテキストを生成する、
ことを特徴とする請求項１〜７のいずれか１項に記載の生成装置。
前記モデルは、前記第１のテキストに基づいて第１の特徴情報を生成する第１のエンコーダと、前記第２のテキストに基づいて第２の特徴情報を生成する第２のエンコーダと、前記第１の特徴情報及び前記第２の特徴情報に基づいて前記第３のテキストを生成するデコーダと、を含む、
ことを特徴とする請求項８に記載の生成装置。
前記生成部は、前記第３のテキストとして、所定の文字数以下のテキストを生成する、
ことを特徴とする請求項１〜９のいずれか１項に記載の生成装置。
第１の学習用テキストと、前記第１の学習用テキストの元のテキストである第２の学習用テキストと、前記第１の学習用テキストに対応するテキストであって所定の条件を満たす第３の学習用テキストと、を取得する取得部と、
前記第１の学習用テキストと前記第２の学習用テキストとを入力データ、前記第３の学習用テキストを正解データとして、第１のテキスト及び該第１のテキストの元のテキストである第２のテキストから前記所定の条件を満たす第３のテキストを生成する第１のモデルの学習を行う学習部と、
を備えることを特徴とする学習装置。
前記第１のモデルは、前記第１のテキストに基づいて第１の特徴情報を生成する第１のエンコーダと、前記第２のテキストに基づいて第２の特徴情報を生成する第２のエンコーダと、前記第１の特徴情報及び前記第２の特徴情報に基づいて前記第３のテキストを生成するデコーダと、を含み、
前記学習部は、前記第１の学習用テキストを前記第１のエンコーダに入力される入力データ、前記第２の学習用テキストを前記第２のエンコーダに入力される入力データ、前記第３の学習用テキストを正解データとして、前記第１のモデルの学習を行う、
ことを特徴とする請求項１１に記載の学習装置。
前記取得部は、前記第２の学習用テキストに関連する第４の学習用テキストを取得し、
前記学習部は、前記第１の学習用テキストと前記第２の学習用テキストと前記第４の学習用テキストとを入力データ、前記第３の学習用テキストを正解データとして前記第１のモデルの学習を行う、
ことを特徴とする請求項１２に記載の学習装置。
前記取得部は、前記第２の学習用テキストに関連する複数の関連テキストから所定の基準を満たす第４の学習用テキストを取得し、
前記学習部は、前記第１の学習用テキストと前記第２の学習用テキストと前記第４の学習用テキストとを入力データ、前記第３の学習用テキストを正解データとして前記第１のモデルの学習を行う、
ことを特徴とする請求項１２又は１３に記載の学習装置。
生成装置が実行する生成方法であって、
第１のテキスト及び該第１のテキストの元のテキストである第２のテキストを取得する取得工程と、
前記第１のテキストと前記第２のテキストとに基づいて、前記第１のテキストに対応するテキストであって所定の条件を満たす第３のテキストを生成する生成工程と、
を含むことを特徴とする生成方法。
学習装置が実行する学習方法であって、
第１の学習用テキストと、前記第１の学習用テキストの元のテキストである第２の学習用テキストと、前記第１の学習用テキストに対応するテキストであって所定の条件を満たす第３の学習用テキストと、を取得する取得工程と、
前記第１の学習用テキストと前記第２の学習用テキストとを入力データ、前記第３の学習用テキストを正解データとして、第１のテキスト及び該第１のテキストの元のテキストである第２のテキストから前記所定の条件を満たす第３のテキストを生成する第１のモデルの学習を行う学習工程と、
を含むことを特徴とする学習方法。
第１のテキスト及び該第１のテキストの元のテキストである第２のテキストを取得する取得手順と、
前記第１のテキストと前記第２のテキストとに基づいて、前記第１のテキストに対応するテキストであって所定の条件を満たす第３のテキストを生成する生成手順と、
をコンピュータに実行させるための生成プログラム。
第１の学習用テキストと、前記第１の学習用テキストの元のテキストである第２の学習用テキストと、前記第１の学習用テキストに対応するテキストであって所定の条件を満たす第３の学習用テキストと、を取得する取得手順と、
前記第１の学習用テキストと前記第２の学習用テキストとを入力データ、前記第３の学習用テキストを正解データとして、第１のテキスト及び該第１のテキストの元のテキストである第２のテキストから前記所定の条件を満たす第３のテキストを生成する第１のモデルの学習を行う学習手順と、
をコンピュータに実行させるための学習プログラム。
第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する取得部と、
前記抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する生成部と、を備え、
前記取得部は、前記第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、前記第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、を取得し、
前記生成部は、前記第１の抽出テキストと前記第２の抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する、
ことを特徴とする生成装置。
第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する取得部と、
前記抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する生成部と、を備え、
前記取得部は、前記第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、前記第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、前記第２のテキストの第一文である第３の抽出テキストと、前記第４のテキストの第一文である第４の抽出テキストと、を取得し、
前記生成部は、前記第１の抽出テキストと前記第２の抽出テキストと前記第３の抽出テキストと前記第４の抽出テキストとに基づいて、前記第２のテキストに対応する第１のテキストを生成する、
ことを特徴とする生成装置。
前記生成部は、第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストを入力データ、前記第２の学習用テキストに対応する第１の学習用テキストを正解データとして学習したモデルに前記抽出テキストを入力することにより、前記第１のテキストを生成する、
ことを特徴とする請求項１９又は２０に記載の生成装置。
第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する取得部と、
前記抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する生成部と、を備え、
前記生成部は、第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストを入力データ、前記第２の学習用テキストに対応する第１の学習用テキストを正解データとして学習したモデルに前記抽出テキストを入力することにより、前記第１のテキストを生成する、
ことを特徴とする生成装置。
前記取得部は、前記第２のテキスト或いは前記第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文を前記抽出テキストとして取得する、
ことを特徴とする請求項２２に記載の生成装置。
前記取得部は、前記第２のテキスト或いは前記第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文と、前記第２のテキスト或いは前記第４のテキストの第一文と、を前記抽出テキストとして取得する、
ことを特徴とする請求項２２又は２３に記載の生成装置。
第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストと、前記第２の学習用テキストに対応する第１の学習用テキストと、を取得する取得部と、
前記学習用抽出テキストを入力データ、前記第１の学習用テキストを正解データとして、第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストから前記第２のテキストに対応する第１のテキストを生成するモデルの学習を行う学習部と、
を備えることを特徴とする学習装置。
前記取得部は、前記第２の学習用テキスト或いは前記第４の学習用テキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文を前記学習用抽出テキストとして取得し、
前記学習部は、前記学習用抽出テキストを入力データ、前記第１の学習用テキストを正解データとして、前記第２のテキスト及び前記第４のテキストの少なくとも一方のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である前記抽出テキストから前記第２のテキストに対応する第１のテキストを生成するモデルの学習を行う
ことを特徴とする請求項２５に記載の学習装置。
前記取得部は、前記第２の学習用テキスト或いは前記第４の学習用テキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文と、前記第２の学習用テキスト或いは前記第４の学習用テキストの第一文と、を前記学習用抽出テキストとして取得し、
前記学習部は、前記学習用抽出テキストを入力データ、前記第１の学習用テキストを正解データとして、前記第２のテキスト及び前記第４のテキストの少なくとも一方のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文と、前記第２の学習用テキスト或いは前記第４の学習用テキストの第一文から前記第２のテキストに対応する第１のテキストを生成するモデルの学習を行う、
ことを特徴とする請求項２５又は２６に記載の学習装置。
生成装置が実行する生成方法であって、
第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する取得工程と、
前記抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する生成工程と、を含み、
前記取得工程では、前記第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、前記第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、を取得し、
前記生成工程では、前記第１の抽出テキストと前記第２の抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する、
ことを特徴とする生成方法。
生成装置が実行する生成方法であって、
第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する取得工程と、
前記抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する生成工程と、を含み、
前記取得工程では、前記第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、前記第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、前記第２のテキストの第一文である第３の抽出テキストと、前記第４のテキストの第一文である第４の抽出テキストと、を取得し、
前記生成工程では、前記第１の抽出テキストと前記第２の抽出テキストと前記第３の抽出テキストと前記第４の抽出テキストとに基づいて、前記第２のテキストに対応する第１のテキストを生成する、
ことを特徴とする生成方法。
生成装置が実行する生成方法であって、
第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する取得工程と、
前記抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する生成工程と、を含み、
前記生成工程では、第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストを入力データ、前記第２の学習用テキストに対応する第１の学習用テキストを正解データとして学習したモデルに前記抽出テキストを入力することにより、前記第１のテキストを生成する、
ことを特徴とする生成方法。
学習装置が実行する学習方法であって、
第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストと、前記第２の学習用テキストに対応する第１の学習用テキストと、を取得する取得工程と、
前記学習用抽出テキストを入力データ、前記第１の学習用テキストを正解データとして、第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストから前記第２のテキストに対応する第１のテキストを生成するモデルの学習を行う学習工程と、
を含むことを特徴とする学習方法。
第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する取得手順と、
前記抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する生成手順と、をコンピュータに実行させ、
前記取得手順では、前記第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、前記第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、を取得し、
前記生成手順では、前記第１の抽出テキストと前記第２の抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する、
ことを特徴とする生成プログラム。
第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する取得手順と、
前記抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する生成手順と、をコンピュータに実行させ、
前記取得手順では、前記第２のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第１の抽出テキストと、前記第４のテキストに含まれる文であって、主語、述語、目的語を含み、且つ、時間或いは場所を示す要素を含む文である第２の抽出テキストと、前記第２のテキストの第一文である第３の抽出テキストと、前記第４のテキストの第一文である第４の抽出テキストと、を取得し、
前記生成手順では、前記第１の抽出テキストと前記第２の抽出テキストと前記第３の抽出テキストと前記第４の抽出テキストとに基づいて、前記第２のテキストに対応する第１のテキストを生成する、
ことを特徴とする生成プログラム。
第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストを取得する取得手順と、
前記抽出テキストに基づいて、前記第２のテキストに対応する第１のテキストを生成する生成手順と、をコンピュータに実行させ、
前記生成手順では、第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストを入力データ、前記第２の学習用テキストに対応する第１の学習用テキストを正解データとして学習したモデルに前記抽出テキストを入力することにより、前記第１のテキストを生成する、
ことを特徴とする生成プログラム。
第２の学習用テキスト及び該第２の学習用テキストに関連する第４の学習用テキストの少なくとも一方のテキストから所定の基準に従い抽出された学習用抽出テキストと、前記第２の学習用テキストに対応する第１の学習用テキストと、を取得する取得手順と、
前記学習用抽出テキストを入力データ、前記第１の学習用テキストを正解データとして、第２のテキスト及び該第２のテキストに関連する第４のテキストの少なくとも一方のテキストから所定の基準に従い抽出された抽出テキストから前記第２のテキストに対応する第１のテキストを生成するモデルの学習を行う学習手順と、
をコンピュータに実行させるための学習プログラム。