JP7285308B1

JP7285308B1 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: JP7285308B1
Application number: JP2021207423A
Authority: JP
Inventors: 駿長谷川; 達矢東原
Original assignee: Exa Wizards Inc
Current assignee: Exa Wizards Inc
Priority date: 2021-12-21
Filing date: 2021-12-21
Publication date: 2023-06-01
Anticipated expiration: 2041-12-21
Also published as: JP2023092278A

Abstract

【課題】様々なカテゴリの文章に対して高い精度の要約文を作成する情報処理装置を提供する。【解決手段】情報処理装置１００は、原文と、原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得する取得部１１０と、原文から要約文を生成する生成モデルを、第１の訓練データを用いて学習させる学習部１２０と、学習された生成モデルを用いて、１又は複数の対象文の各々から要約文を生成する生成部１３０と、を備えている。【選択図】図１

Description

本発明は、情報処理装置、情報処理方法、及びプログラムに関する。

文章を圧縮して要約文を生成する技術が知られている。例えば、新聞の記事などの原文テキストから、ルールベースにより単語を削除することにより生成した要約文を訓練データとして学習し、当該新聞記事の中の単語の保持・削除を推論する文圧縮モデルが知られている（非特許文献１）。

"Overcoming the Lack of Parallel Data in Sentence Compression", Katja Filippova, Yasemin Altun, Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, October, 2013.

一般に圧縮の対象となり得る文章には、新聞、メール文、ＷＥＢテキスト等様々なカテゴリに関するものがある。しかし、上記文圧縮モデルでは、特定のカテゴリの文章については高い精度の要約文を生成できるものの、他のカテゴリの文章に対しては精度の高い要約文を生成することが難しいという問題が生じていた。

本発明は、上記の課題に鑑みてなされたものであり、様々なカテゴリの文章に対して高い精度の要約文を生成することのできる技術を提供することを目的とする。

上記の課題を解決するために、本発明の一態様に係る情報処理装置は、原文と、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得する取得部と、原文から要約文を生成する生成モデルを、前記第１の訓練データを用いて学習させる学習部とを備えている。

上記の課題を解決するために、本発明の一態様に係る情報処理方法は、原文と、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得する取得ステップと、原文から要約文を生成する生成モデルを、前記第１の訓練データを用いて学習させる学習ステップと、を含む。

本発明の各態様に係る情報処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを前記情報処理装置が備える各部（ソフトウェア要素）として動作させることにより前記情報処理装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

本発明の一態様によれば、様々なカテゴリの文章に対して高い精度の要約文を生成することのできる技術を提供することができる。

本発明の実施形態１に係る情報処理システムの機能的な構成を示すブロック図である。本発明の実施形態１に係る情報処理装置のユースケースを説明する図である。本発明の実施形態１に係る情報処理装置による要約文を生成する処理を示すフローチャートである。本発明の実施形態１に係る情報処理装置による新聞記事とその要約文を取得する処理を説明するための図である。本発明の実施形態１に係る情報処理装置による言語モデルを用いて要約文を選択する処理を説明するための図である。本発明の実施形態２に係る情報処理装置による要約文を用いて検索する動作を示すフローチャートである。本発明の実施形態における情報処理システムのハードウェア構成の一例を示す図である。

〔実施形態１〕
＜情報処理装置１００の概要＞
本実施形態に係る情報処理装置１００の具体的構成について説明する前に、情報処理装置１００の概要について説明する。

本実施形態に係る情報処理装置１００は、原文と、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得し、原文から要約文を生成する生成モデルを、この第１の訓練データを用いて学習させる構成を含む。ここで、本実施形態において、原文とは、要約の対象となる文章一般のことを指しており、当該文言によって文章の内容が限定されることはない。

従来、原文から要約文を生成する場合、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文（「圧縮文」と呼ばれることもある）を生成する削除型のモデル（「０１モデル」と呼ばれることもある）が知られている。しかしながら、このような削除型のモデルに関しては、特定のカテゴリの文章に関する学習を行った削除型のモデルを他のカテゴリの文章に適用した場合、精度の高い要約文を生成することが難しいという問題が生じていた。

本実施形態に係る情報処理装置１００では、原文から要約文を生成するためのモデルとして削除型のモデルではない生成モデルを採用し、更に、当該生成モデルを上述した第１の訓練データを用いて学習させることによって、様々なカテゴリに対して精度の高い要約文を生成することのできる技術を提供することができる。

＜情報処理装置１００の構成＞
以下では、情報処理装置１００の構成について詳細に説明する。図１は、情報処理装置１００を含む情報処理システムの構成を示すブロック図である。図１に示すように、情報処理装置１００は、制御部１０１、通信部１６０、入力部１７０、出力部１８０、及び記憶部１９０を備えている。図１に示すように、情報処理装置１００は、ネットワークＮを介して外部のデータベース３００と通信可能に接続されている。ここでネットワークＮは、有線ＬＡＮ（Local Area Network）、無線ＬＡＮ、インターネット、公衆回線網、モバイルデータ通信網、またはこれらの組み合わせであるがこれらの例は本実施形態を限定するものではない。

通信部１６０は、ネットワークＮを介した通信を行うための通信モジュールである。通信部１６０は、ネットワークＮを介してデータベース３００から取得したデータを、制御部１０１に供給したり、制御部１０１から取得したデータを、ネットワークＮを介してデータベース３００に出力したりする。なお、情報処理装置１００がデータベース３００を備える構成としてもよい。

入力部１７０は、キーボード、タッチパネル、マイクロフォン等のユーザインターフェースを備え、ユーザによる操作を受けつけて、情報処理装置１００への情報の入力を行う。入力された情報は制御部１０１に供給される。

出力部１８０は、表示ディスプレイ、スピーカ等を備え、制御部１０１からの情報の出力をユーザに提示する。

記憶部１９０には、後述する制御部１０１で使用する訓練データ等が格納される。また、記憶部１９０には、制御部１０１での情報処理により得られた各種の結果が格納される。

（制御部１０１の構成）
制御部１０１は情報処理装置１００の各構成要素の動作を制御する。図１に示すように、制御部１０１は、取得部１１０，学習部１２０，生成部１３０，選択部１４０および検索部１５０を備えている。取得部１１０は、原文と、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得する。第１の訓練データとしては、例えば、新聞記事の１行目の文章を原文とし、この原文と、当該新聞記事のタイトルに基づいて原文からいくつかの単語を削除して生成された要約文との組を用いてもよい。第１の訓練データは自動生成してもよいし、人手で生成してもよい。また、第１の訓練データは記憶部１９０から取得してもよいし、外部のデータベース３００から取得してもよい。また、取得部１１０は、要約文を生成する対象である１又は複数の対象文を取得する構成としてもよい。

学習部１２０は、原文から要約文を生成する生成モデルを、上記第１の訓練データを用いて学習させる。ここで、「生成モデル」としては、新たな文章に対してその要約文を生成するモデルであれば任意のモデルを用いることができる。例えば、生成モデル」として、読み込み部（Encoder）と出力部（Decoder）とを有する時系列変換モデルにおける学習済の生成部を用いることができるが、これは本実施形態を限定するものではないこれは本実施形態を限定するものではない。

生成部１３０は、学習部１２０によって学習された上記生成モデルを用いて、上述した１又は複数の対象文の各々から要約文を生成する。ここで、生成部１３０は、生成モデルが生成する要約文が、当該要約文に対応する対象文に含まれる構成要素のみを含むように、要約文を生成してもよい。このように、要約文を生成する際に、対象文に含まれる構成要素のみを含むように限定することで、対象文には存在しない情報を含んだ不適切な要約文を排除することができる。生成部１３０で生成された要約文は選択部１４０に供給される。

選択部１４０は、生成部１３０が生成した複数の要約文から、相対的に不自然さの小さい１又は複数の要約文を選択する。例えば、選択部１４０は、要約文が文法的な間違いを含む確率を、言語モデルを使って算出し、当該確率が所定の条件を満たす要約文を選択する。より具体的には、一例として、選択部１４０が、当該確率と正の相関を有するパープレキシティを算出する構成とし、パープレキシティが一定の閾値以下である要約文のみを選択する構成としてもよい。選択部１４０により選択された要約文は、再び、学習部１２０に供給される。ここで、選択部１４０が用いる言語モデルとしては、既知の任意の言語モデルを用いることができる。そのような言語モデルの一例としてＢＥＲＴ（Bidirectional encoder representations from Transformer）が挙げられる。

また、学習部１２０は、選択部１４０が選択した要約文と、当該要約文に対応する対象文との組を複数含む第２の訓練データを用いて、上記生成モデルを再学習させる構成としてもよい。このような生成モデルとしては、例えば、削除型モデルを含む。削除モデルの再学習によって、更に高速に適切な要約文を生成することのできる生成モデルを得ることができる。

検索部１５０は、上記再学習後の生成モデルが生成した要約文を検索対象とする検索処理を実行する。上記再学習後の生成モデルでは、相対的に不自然さの小さい要約文を生成することができるため、これらの要約文を用いて検索を行えば、比較的短い時間で精度の高い検索を行うことができる。

＜情報処理装置１００のユースケース＞
続いて、図２を参照して、情報処理装置１００のユースケースを説明する。このユースケースでは、「ｘｘｘをｙｙｙでｚｚｚする方法」に関する論文を検索する。

まず、生成部１３０が、検索の対象となる論文等のテキストから、上述した生成モデルを用いて、要約文を生成する。検索部１５０は生成された要約文を用いて「ｘｘｘをｙｙｙでｚｚｚする方法」についての検索処理を行う。生成された要約文では、検索の核心部分ではないノイズ情報を含んだ部分が削除されている。このため、同じ検索アルゴリズムを用いる場合であっても、原文を用いて検索するよりも、上記のように生成された要約文を用いて検索するほうが検索の精度を高めることができる。また、原文を用いて検索するよりも、上記のように生成された要約文を用いて検索する方が、検索の対象となる論文数が相対的に少なくなるため、検索に要する時間を短縮することができるという更なる効果を奏する。

＜情報処理装置１００の動作の流れ＞
続いて、情報処理装置１００における原文テキストから要約文を生成する処理の流れについて、図３を参照して説明する。図３は、情報処理装置１００による要約文生処理の流れを示すフローチャートである。

（ステップＳ１０１）
まず、ステップＳ１０１において、情報処理装置１００の取得部１１０は、原文と、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得する。本実施形態では、要約文は自動で生成してもよいし、人手により生成し、取得部１１０に供給してもよい。一例として、本ステップでは特定のカテゴリに属する原文を用いる構成とすることができる。たとえば、取得部１１０は、原文としての新聞の記事とその要約文との組を複数含むデータを第１の訓練データとして取得する構成とすることができる。

ここで、図４を参照して、ステップＳ１０１で用いられる第１の訓練データの生成処理の一例について説明する。以下では、当該処理を、原文の構成要素を保持するか削除するかを判定し、削除すると判定した構成要素を削除することによって要約文を生成する削除型のモデルによって行う場合を例に挙げ説明する。

また、ここでは、新聞記事のタイトルに基づき、当該新聞記事の１行目の文を原文として用いて要約文を生成する例を説明する。図４に示す例では、新聞記事のタイトルは「桜／が／見頃／／高崎／城址／公園」であり、当該新聞記事の１行目の文（原文）が「群馬／県／に／ある／高崎／城址／公園／では／４／日／、／桜／が／見頃／を／迎えた」である。ここで、「／」は当該文章の構成要素の区切りを示しているが、これは本実施形態を限定するものではない。また、下線は説明の便宜上付しているものであり、これも本実施形態を限定するものではない。

上述した削除型のモデルは、原文における各単語を保持するか、削除するかを推論し、原文に含まれる各単語にラベル付けを行う。ここで、タイトルと原文に共通に含まれる構成要素は要約文に含めるルールとする。そして、当該削除型のモデルは、原文に含まれる単語のうち、要約文中に保持する単語にはラベル［１］を、削除する単語にはラベル［０］を付加する。本例の場合、図４に示すように、当該削除型のモデルは、原文に［０／０／０／０／１／１／１／１／０／０／０／１／１／１／１／１］のラベルを付加する。

結果として、当該削除型のモデルは、原文から「群馬／県／に／ある／」および「／４／日／、」の単語群を削除することにより、「高崎城址公園では桜が見頃を迎えた」という要約文を生成する。こうして得られた要約文と、原文との組を複数含むように第１の訓練データが生成され、取得部１１０によって取得される。取得部１１０が取得した第１の訓練データは学習部１２０に供給される。

なお、本ステップＳ１０１では、生成された要約文を後述する言語モデルを用いて評価し、文法的に正確と判定された要約文と、当該要約文に対応する原文との組のみを含む第１の訓練データを取得する構成としてもよい。

（ステップＳ１０２）
続いて、ステップＳ１０２において、情報処理装置１００の学習部１２０は、原文から要約文を生成する生成モデルを、上記第１の訓練データを用いて学習させる。

（ステップＳ１０３）
ステップＳ１０３では、生成部１３０は、学習部１２０によって学習された上記生成モデルを用いて、１又は複数の対象文の各々から要約文を生成する。ここで、上記対象文は、一例として、ステップＳ１０１における「原文」とは異なるカテゴリの文章が含まれ得る。例えば、ステップＳ１０１において原文として新聞記事を用いた場合、本ステップにおける対象文として、新聞の記事以外のテキスト、例えば、メール文、ＷＥＢテキスト、論文等を用いてもよい。

（ステップＳ１０４）
続いて、ステップＳ１０４において、生成部１３０が生成した複数の要約文から、選択部１４０が相対的に不自然さの小さい１又は複数の要約文を選択する。
ここで、上記「相対的に不自然さの大きい要約文」および「相対的に不自然さの小さい要約文」の例を下記に挙げる。

例えば、「ＲＯＵＧＥによる自動評価の結果、提案手法が既存手法を上回り、提案手法の有効性が示された」という対象文から、「自動評価の結果、提案手法の有効性が示された」という要約文Ａが得られた場合、この要約文Ａは意味が通る文法的に正しい文である。したがって、要約文Ａは成功例となる。また、「そこで我々は、既存手法で用いられている新聞以外でも高精度な文圧縮手法を提案する」という対象文から、「そこで我々は、新聞以外でも高精度な文圧縮手法を提案する」という要約文Ｂが得られた場合、この要約文Ｂも意味が通る文法的に正しい文である。したがって、要約文Ｂも成功例となる。

これに対して、「ＲＯＵＧＥによる自動評価では提案手法が既存手法を上回り、提案手法の有効性が示された」という対象文から、「自動評価では、提案手法の有効性が示された」という要約文Ｃが得られた場合、この要約文Ｃでは接続詞「では」の使い方が不適切であるため、要約文Ｃは失敗例となる。また、「そこで我々は、新聞以外のドメインでも高精度な文圧縮手法を提案する」という対象文から、「ドメインでも高精度な文圧縮手法を提案」という要約文Ｄが得られた場合、この要約文Ｄにおいて、ドメインを特定する情報が不足しているため、要約文Ｄは失敗例となる。

本実施形態では、選択部１４０が、上述した生成された要約文の成功・失敗を、言語モデルを用いて判定する。例えば、選択部１４０は、要約文が文法的な間違いを含む確率（パープレキシティとも呼ぶ）を判定する言語モデルを用いて要約文を選択してもよい。この言語モデルでは、パープレキシティの値が高いほど、要約文が文法的な間違いを含む確率が高いことを示す。なお、言語モデルとしては、上述したＢＥＲＴ等を用いるこことができるがこれは本実施形態を限定するものではない。

図５に、選択部１４０による、要約文の選択処理の具体例を示す。本実施形態では、パープレキシティの閾値を１００とし、パープレキシティの値が１００を下回る場合、選択部１４０はその要約文は文法的に正確であると判定して、その要約文を選択する。また、パープレキシティの値が１００を上回る場合、選択部１４０はその要約文は文法的に正確でないと判定して、その要約文を選択しない。

例えば、上記要約文Ａ～Ｄの例では、言語モデルで判定した要約文ＡおよびＢのパープレキシティはそれぞれ２６および３４であり、閾値の１００を下回る。このため、選択部１４０は、要約文ＡおよびＢを文法的に正確であると判定して選択する。これに対し、要約文ＣおよびＤのパープレキシティはそれぞれ２１５および３１１であり、閾値の１００を上回る。このため、選択部１４０は要約文ＣおよびＤを文法的に正確でないと判定して選択しない。このように、選択部１４０は、言語モデルを用いて、生成される要約文の文法的な正しさを自動的に判定する。

また、選択部１４０は、上述したようにパープレキシティの閾値を設け当該閾値との比較で要約文を選択する代わりに、複数の要約文の候補をパープレキシティの値に基づいて順位付けし、上位の要約文を選択する構成としてもよい。

（ステップＳ１０５）
続いて、ステップＳ１０５において、学習部１２０は、選択部１４０が選択した要約文と、当該要約文に対応する対象文との組を複数含む第２の訓練データを用いて、上記生成モデルを再学習する。例えば、学習部１２０は、ステップＳ１０４で選択部１４０が選択した要約文とその対象文とを用いて上記生成モデルを再学習する。生成部１３０は、このようにして再学習した生成モデルを用いて要約文を生成してもよい。

上記処理によれば、第１の訓練データを用いることによって生成モデルを学習させるので、様々なカテゴリの文章に対して高い精度の要約文を生成することができる。また、ステップＳ１０５において学習部１２０が上記第２の訓練データを用いて上記生成モデル（例えば、削除型モデル）を再学習させることによって、より精度の高い要約文を生成する生成モデルを実現することができる。また、ステップＳ１０５では、ステップＳ１０４において選択された文法的に正しく精度の良い要約文のみを用いて、生成モデルを再学習するため、様々なカテゴリの文章に対して高い精度の要約文を生成する生成モデルを、比較的短い時間で訓練することができる。更に、生成モデルとして、削除型モデルを用いれば、更に高速に高い精度の要約文を生成することができる。

〔実施形態２〕
次に、実施形態２について説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。

実施形態２では、情報処理装置１００は、ユーザからのクエリを取得し、当該クエリと、実施形態１の手法で取得した要約文とを用いて検索処理を行う。本実施形態の情報処理装置１００の構成は、実施形態１に係る情報処理装置１００と同様である。

以下では、本実施形態に係る情報処理装置１００における処理について、図６を参照して説明する。

（ステップＳ２０１）
まず、ステップＳ２０１において、取得部１１０は論文等のテキストを取得する。テキストとなる論文は、記憶部１９０から取得してもよいし、外部のデータベース３００から取得してもよし、入力部１７０から取得してもよい。また、本実施形態では検索対象を論文としたが、他のカテゴリの文書であってもよい。

（ステップＳ２０２）
続いて、ステップＳ２０２において、生成部１３０は、実施形態１で説明した生成モデルを用いて上記論文から要約文を生成する。一例として、実施形態１のステップＳ１０５にて再学習を行った生成モデルを用いて上記論文から要約文を生成する。

（ステップＳ２０２）
続いて、ステップＳ２０３において、記憶部１９０は、生成された要約文および要約文に対応する論文をデータベースに３００登録する。

（ステップＳ２０４）
続いて、ステップＳ２０４において、取得部１１０は、一例として入力部１７０を介してユーザからクエリを取得する。クエリの例としては、例えば、「ｘｘｘをｙｙｙでｚｚｚする方法」に関する論文等が挙げられる。

（ステップＳ２０５）
続いて、ステップＳ２０５において、検索部１５０はユーザから取得したクエリに類似する要約文を記憶部１９０に記憶された要約文の中から検索する。当該検索には、任意のアルゴリズムを用いることができる。

（ステップＳ２０６）
続いて、ステップＳ２０６において、出力部１８０に、検索結果の論文を表示する。
上記のように、本実施形態では、論文を検索する際に、原文を用いて検索する替わりに、生成された要約文を用いて検索するため検索の精度を高めることができる。また、原文を用いて検索するよりも、上記のように生成された要約文を用いて検索する方が、検索の対象となるテキスト量が相対的に少なくなるため、検索に要する時間を短縮することができる。

〔ソフトウェアによる実現例〕
情報処理装置１００の制御ブロック（特に、取得部１１０、学習部１２０、生成部１３０、選択部１４０および検索部１５０）は、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ソフトウェアによって実現してもよい。後者の場合、情報処理装置１００は、例えば、コンピュータ（電子計算機）を用いて構成される。

（情報処理装置１００の物理的構成）
図７は、情報処理装置１００として用いられるコンピュータの物理的構成を例示したブロック図である。情報処理装置１００は、図７に示すように、バス１０１０と、プロセッサ１００１と、主メモリ１００２と、補助メモリ１００３と、通信インタフェース１００４と、入出力インタフェース１００５とを備えたコンピュータによって構成可能である。プロセッサ１００１、主メモリ１００２、補助メモリ１００３、通信インタフェース１００４、および入出力インタフェース１００５は、バス１０１０を介して互いに接続されている。入出力インタフェース１００５には、入力装置１００６および出力装置１００７が接続されている。

プロセッサ１００１としては、例えば、ＣＰＵ（Central Processing Unit）、マイクロプロセッサ、デジタルシグナルプロセッサ、マイクロコントローラ、またはこれらの組み合わせ等が用いられる。

主メモリ１００２としては、例えば、半導体ＲＡＭ（random access memory）等が用いられる。

補助メモリ１００３としては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、またはこれらの組み合わせ等が用いられる。補助メモリ１００３には、上述した情報処理装置１００の動作をプロセッサ１００１に実行させるためのプログラムが格納されている。プロセッサ１００１は、補助メモリ１００３に格納されたプログラムを主メモリ１００２上に展開し、展開したプログラムに含まれる各命令を実行する。

通信インタフェース１００４は、ネットワークＮに接続するインタフェースである。

入出力インタフェース１００５としては、例えば、ＵＳＢインタフェース、赤外線やBluetooth（登録商標）等の近距離通信インタフェース、またはこれらの組み合わせが用いられる。

入力装置１００６としては、例えば、キーボード、マウス、タッチパッド、マイク、又はこれらの組み合わせ等が用いられる。出力装置１００７としては、例えば、ディスプレイ、プリンタ、スピーカ、又はこれらの組み合わせが用いられる。

〔まとめ〕
〔態様１〕
本発明の態様１に係る情報処理装置は、原文と、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得する取得部と、原文から要約文を生成する生成モデルを、前記第１の訓練データを用いて学習させる学習部とを備えている。

上記構成によれば、前記第１の訓練データを用いることによって、前記生成モデルを学習させるので、様々なカテゴリの文章に対して高い精度の要約文を生成することのできる生成モデルを提供することができる。

〔態様２〕
本発明の態様２に係る情報処理装置では、前記取得部は、１又は複数の対象文を取得し、当該情報処理装置は、前記学習部によって学習された前記生成モデルを用いて、前記１又は複数の対象文の各々から要約文を生成する生成部を更に備えていてもよい。

上記構成によれば、前記生成モデルにより、様々なカテゴリの文章に対して高い精度の要約文を生成することができる。

〔態様３〕
本発明の態様３に係る情報処理装置では、態様１または２において、前記生成部は、前記生成モデルが生成する要約文が、当該要約文に対応する対象文に含まれる構成要素のみを含むように、要約文を生成してもよい。

上記構成によれば、生成モデルが生成する要約文が、当該要約文に対応する対象文に含まれる構成要素のみを含むように、要約文を生成するため、より正確な情報を含んだ要約文を生成することができる。

〔態様４〕
本発明の態様４に係る情報処理装置では、前記生成部が生成した複数の要約文から、相対的に不自然さの小さい１又は複数の要約文を選択する選択部を更に備えていてもよい。

上記構成によれば、多数生成された要約文の中から、文法的に正しく可読性のある要約文を選択することができる。

〔態様５〕
本発明の態様５に係る情報処理装置では、前記学習部は、前記選択部が選択した要約文と、当該要約文に対応する対象文との組を複数含む第２の訓練データを用いて、前記生成モデルを再学習させてもよい。

上記構成によれば、文法的に正しく精度の良い要約文のみを用いて、生成モデルを再学習するため、様々なカテゴリの文章に対して高い精度の要約文を生成する生成モデルを、比較的短い時間で訓練することができる。

〔態様６〕
本発明の態様６に係る情報処理装置では、前記再学習後の生成モデルが生成した要約文を検索対象とする検索処理を実行する検索部を更に備えていてもよい。

上記構成によれば、再学習後の生成モデルが生成した要約文は精度が高いため、要約文を用いて検索を行えば、短い時間に精度の高い検索を行うことができる。

〔態様７〕
本発明の態様７に係る情報処理方法は、原文と、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得する取得ステップと、原文から要約文を生成する生成モデルを、前記第１の訓練データを用いて学習させる学習ステップとを含む。

上記構成によれば、態様１と同様の効果を奏することができる。

本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

１００情報処理装置
１０１制御部
１１０取得部
１２０学習部
１３０生成部
１４０選択部
１５０検索部
１６０通信部
１７０入力部
１８０出力部
１９０記憶部
３００データベース

Claims

原文と、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得する取得部と、
原文から要約文を生成する生成モデルを、前記第１の訓練データを用いて学習させる学習部と
前記学習部によって学習された前記生成モデルを用いて、前記取得部が取得する１又は複数の対象文の各々から要約文を生成する生成部と、
前記生成部が生成した複数の要約文から、相対的に不自然さの小さい１又は複数の要約文を選択する選択部と、を備え、
前記学習部は、前記選択部が選択した要約文と、当該要約文に対応する対象文との組を複数含む第２の訓練データを用いて、前記生成モデルを再学習させる
情報処理装置。
前記生成部は、前記生成モデルが生成する要約文が、当該要約文に対応する対象文に含まれる構成要素のみを含むように、要約文を生成する
請求項１に記載の情報処理装置。
前記再学習後の生成モデルが生成した要約文を検索対象とする検索処理を実行する検索部を更に備えている
請求項１又は２に記載の情報処理装置。
取得部、学習部、生成部および選択部を備える情報処理装置によって、情報処理を行う方法であって、
前記取得部が、原文と、当該原文に含まれる複数の構成要素の少なくとも何れかを削除することによって得られる要約文との組を複数含む第１の訓練データを取得する取得ステップと、
前記学習部が、原文から要約文を生成する生成モデルを、前記第１の訓練データを用いて学習させる学習ステップと、
前記生成部が、前記学習部によって学習された前記生成モデルを用いて、前記取得部が取得する１又は複数の対象文の各々から要約文を生成する生成ステップと、
前記選択部が、前記生成部が生成した複数の要約文から、相対的に不自然さの小さい１又は複数の要約文を選択する選択ステップと、を含み、
前記学習ステップにおいて、前記選択部が選択した要約文と、当該要約文に対応する対象文との組を複数含む第２の訓練データを用いて、前記生成モデルを再学習させる
情報処理方法。
請求項１に記載の情報処理装置としてコンピュータを機能させるためのプログラムであって、上記取得部、上記学習部、上記生成部および上記選択部としてコンピュータを機能させるためのプログラム。