JP2019056973A - 学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデル - Google Patents

学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデル Download PDF

Info

Publication number
JP2019056973A
JP2019056973A JP2017179531A JP2017179531A JP2019056973A JP 2019056973 A JP2019056973 A JP 2019056973A JP 2017179531 A JP2017179531 A JP 2017179531A JP 2017179531 A JP2017179531 A JP 2017179531A JP 2019056973 A JP2019056973 A JP 2019056973A
Authority
JP
Japan
Prior art keywords
text
input
information
model
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017179531A
Other languages
English (en)
Other versions
JP6529559B2 (ja
Inventor
一真 村尾
Kazuma Murao
一真 村尾
村上 直也
Naoya Murakami
直也 村上
毅司 増山
Takeshi Masuyama
毅司 増山
隼人 小林
Hayato Kobayashi
隼人 小林
小林 健
Takeshi Kobayashi
健 小林
太一 谷塚
Taichi Tanizuka
太一 谷塚
立 日暮
Ritsu Higure
立 日暮
学 明神
Manabu Myojin
学 明神
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017179531A priority Critical patent/JP6529559B2/ja
Publication of JP2019056973A publication Critical patent/JP2019056973A/ja
Application granted granted Critical
Publication of JP6529559B2 publication Critical patent/JP6529559B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】精度が高いテキストを生成できるようにすること。【解決手段】本願に係る学習装置は、取得部と、学習部と、を備える。取得部は、第1のテキストと、第1のテキストの属性を示す属性情報と、第1のテキストに対応するテキストであって所定の条件を満たす第2のテキストと、を取得する。また、学習部は、第1のテキストと属性情報と第2のテキストとに基づいて、入力テキストから所定の条件を満たす出力テキストを生成するモデルの学習を行う。【選択図】図1

Description

本発明は、学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデルに関する。
テキストを装置に生成させる技術が知られている。例えば、装置に文書の要約文を生成させる技術が知られている。装置にテキストを生成させることで、人がテキストを生成する手間を省くことができる。
特開2005−115628号公報 特開2005−174173号公報
近年、機械学習が注目されている。テキストの生成は、例えば、複数組のテキスト(例えば、文書とその要約文を1組とした複数組のテキスト)を学習データとして学習した学習モデル(以下、単にモデルという。)を使用することで実現可能である。
テキストの組を多く準備することができれば、精度の高いモデルを実現可能である。しかし、テキストは、テキストの属性毎に特徴が異なる。例えば、新聞に掲載されるテキストは固い表現になりがちであり、雑誌に掲載されるテキストは砕けた表現になりがちである。学習データとなる複数組のテキストに特徴の偏りやバラツキがあると、精度の高いモデルの実現は困難となる。モデルの精度が低いと、装置が生成するテキストは精度(例えば、正確性)が低いものとなる。
本願は、上記に鑑みてなされたものであって、精度が高いテキストを生成できるようにすることを目的とする。
本願に係る学習装置は、第1のテキストと、第1のテキストの属性を示す属性情報と、第1のテキストに対応するテキストであって所定の条件を満たす第2のテキストと、を取得する取得部と、第1のテキストと属性情報と第2のテキストとに基づいて、入力テキストから所定の条件を満たす出力テキストを生成するモデルの学習を行う学習部と、を備える。
実施形態の一態様によれば、精度が高いテキストを生成できるようにすることができる。
図1は、実施形態に係る情報処理装置が実行する処理の一例を示す図である。 図2は、コンテンツが表示された端末装置を示す図である。 図3は、学習データデータベースに登録される学習データの一例を示す図である。 図4は、モデルの一例を示す図である。 図5は、モデルの他の例を示す図である。 図6は、実施形態に係る情報処理装置の構成例を示す図である。 図7は、学習データデータベースに登録される情報の一例を示す図である。 図8は、モデルデータベースに登録される情報の一例を示す図である。 図9は、コンテンツ情報データベースに登録される情報の一例を示す図である。 図10は、学習処理の一例を示すフローチャートである。 図11は、生成処理の一例を示すフローチャートである。 図12は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデルを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、以下の実施形態により本願に係る学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデルが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1−1.情報処理装置の一例〕
最初に、生成装置および学習装置の一例である情報処理装置が実行する学習処理および生成処理の一例について説明する。図1は、実施形態に係る情報処理装置が実行する処理の一例を示す図である。情報処理装置10は、インターネット等の所定のネットワークを介して、所定のクライアントが使用するデータサーバ20および端末装置30と通信可能である。
情報処理装置10は、後述の学習処理及び生成処理を実行する装置である。情報処理装置10は、サーバ装置やクラウドシステム等により実現される。
データサーバ20は、情報処理装置10が後述する学習処理を実行する際に用いる学習データや、情報処理装置10が後述する生成処理を実行する際に出力する配信コンテンツを管理する情報処理装置である。データサーバ20は、サーバ装置やクラウドシステム等により実現される。データサーバ20は、例えば、端末装置30に対してニュースや、利用者によって投稿された各種のコンテンツを配信する配信サービスを実行する。このような配信サービスは、例えば、各種ニュースの配信サイトやSNS(Social Networking Service)等により実現される。
端末装置30は、スマートフォンやタブレット等のスマートデバイスであり、3G(3rd Generation)やLTE(Long Term Evolution)等の無線通信網を介して任意のサーバ装置と通信を行うことができる携帯端末装置である。なお、端末装置30は、スマートデバイスのみならず、デスクトップPC(Personal Computer)やノートPC等の情報処理装置であってもよい。
〔1−2.要約コンテンツの配信について〕
ここで、データサーバ20は、配信対象となる配信コンテンツが複数存在する場合には、各コンテンツを全て配信するのではなく、各コンテンツの要約となるテキストが含まれる要約コンテンツを端末装置30へと配信することがある。配信コンテンツは、例えば、情報媒体或いは情報の配信主体から取得したニュース記事である。一例として、要約コンテンツは、配信コンテンツへのリンクが張られたポータルサイトのトップページである。
なお、情報媒体とは、情報の配信媒体或いは掲載媒体を示す情報であり、例えば、“新聞”、“雑誌”等を示す情報である。また、配信主体とは、ニュース記事等の情報を配信する組織或いは個人である。例えば、配信主体は、新聞社、出版社、放送局(テレビ局、ラジオ局)等のマスメディアである。勿論、配信主体はマスメディアに限定されない。配信主体は、ポータルサイトの運営者であってもよいし、携帯電話会社であってもよい。配信主体は、情報処理装置10の運営者自身であってもよい。
図2は、コンテンツが表示された端末装置30を示す図である。図2の状態J1は、ポータルサイトのトップページが表示された様子を示す図であり、図2の状態J2は、配信コンテンツC11を含むページが表示された様子を示す図である。配信コンテンツC11は、例えば、所定の配信主体から情報処理装置10の運営者(例えば、ポータルサイトの運営者)が取得したニュース記事である。状態J1に示す端末装置30には、記事へのリンクが張られたタイルが複数配置されたページが表示されている。各タイルには、配信コンテンツの内容を示すテキスト(以下、見出しという。)が表示されている。例えば、縦一列に並ぶ複数のタイルの一番上のタイルには、見出しU11が表示されている。見出しU11は配信コンテンツC11の内容に対応するテキストである。ユーザが見出しU11が表示されたタイルをタップすると、端末装置30には、配信コンテンツC11を含む画面が表示される。配信コンテンツC11には、記事の本文K11と、記事のタイトルT11が含まれている。
配信コンテンツに対応付けられるテキスト(例えば、ポータルサイトのトップページに掲載される見出し)は、配信コンテンツの内容に基づいて人が作成する。例えば、見出しU11は、配信コンテンツC11に含まれるタイトルT11をポータルサイトの運営者の従業員が読んで要約することにより作成される。しかしながら、配信コンテンツごとに、人手で見出しを生成するのは、手間がかかる。
そこで、各種情報が有する特徴を学習した学習モデル(以下、単にモデルという。)を用いて、配信コンテンツから見出しを自動的に生成することが考えらえる。例えば、配信コンテンツに含まれるテキスト(例えば、タイトル)から、見出しとなるタイトルを自動的に生成することが考えられる。
精度が高い見出し(例えば、正確性が高い見出し)を作成するには、精度が高いモデルの生成が必要となる。精度が高いモデルを生成するには、学習データとなるテキストの組を大量に準備する必要がある。このとき、学習データとなる複数組のテキストは特徴が類似していることが望ましい。しかし、テキストは、テキストの属性(例えば、テキストの作成者や配信元)毎に特徴が異なる。例えば、新聞に掲載されるテキストは固い表現になりがちであり、雑誌に掲載されるテキストは砕けた表現になりがちである。学習データとなる複数組のテキストに特徴の偏りやバラツキがあると、精度の高いモデルの実現は困難となる。
例えば、単純なsequence to sequenceの学習では、モデルは、学習データ中に頻出するスタイル(例えば、新聞記事のタイトルの型)を学習する傾向にある。この場合、頻度が落ちるスタイル(例えば、雑誌やコラム等の自由なタイトルの型)のテキストは、モデルの学習(特徴抽出)の障害になり、結果として、精度の高いモデルは生成されない。このような学習データで学習したモデルに、頻度が落ちるスタイルのテキストを入力したとしても、不自然なテキストを生成するだけである。なお、テキストの属性毎(すなわち、特徴が類似したテキスト毎)に異なるモデルを作成することも考えられる。しかし、この場合、頻度が落ちるスタイルのテキストを大量に準備するのは困難である。結果として、精度の高いモデルを生成することは困難である。
〔1−3.学習処理について〕
そこで、情報処理装置10は、以下の学習処理を実行することで、配信コンテンツに含まれるテキスト(例えば、タイトル)から見出しとなるテキストを生成するためのモデルの学習を行う。以下、図1を参照しながら情報処理装置10が実行する学習処理の一例について説明する。
まず、情報処理装置10は、データサーバ20から学習データとなる情報を取得する(ステップS1)。例えば、情報処理装置10は、データサーバ20から、過去、ユーザに配信された配信コンテンツを取得する。そして、情報処理装置10は、データサーバ20から取得した情報を学習データデータベースに登録する。
図3は、学習データデータベースに登録される学習データの一例を示す図である。学習データデータベースには、学習データとして、属性情報、本文、タイトル、および見出しを関連付けた情報が登録される。属性情報、本文、タイトル、および見出しの組には、それぞれ、学習データID(Identifier)が付されている。「本文」及び「タイトル」は、配信コンテンツに含まれるテキストである。
属性情報は、配信コンテンツに含まれるテキストの属性を示す情報である。例えば、属性情報は、配信コンテンツの配信元を示す情報(例えば、配信コンテンツの配信主体を示す情報)である。一例として、属性情報は、配信コンテンツが新聞社から取得したものか、雑誌の出版社から取得したものか、を示す情報である。属性情報は、ポータルサイトの運営者等がテキストを見て判断したものであってもよい。属性情報は、テキストの文体(スタイル)を示す情報であってもよい。例えば、属性情報は、どの配信主体の文体かを示す情報(文体情報)であってもよい。例えば、属性情報は、新聞社がよく使用する文体か、雑誌の出版社がよく使用する文体かを示す情報であってもよい。この場合、属性情報は、文体情報と言い換えることができる。
「見出し」は、配信コンテンツの内容をユーザが容易に把握するためのテキストである。見出しは、配信コンテンツに含まれるテキスト(例えば、本文或いはタイトル)に対応するテキストである。学習データとなる見出しは、配信コンテンツに含まれるテキストを所定の者(例えば、ポータルサイトの運営者の従業員)が読んで要約することにより作成される。なお、見出しは、所定の条件を満たすよう生成される。例えば、見出しは、所定の文字数以下となるよう生成される。一例として、見出しは、13.5文字以下となるよう生成される。このとき、13.5文字は、全角文字1個を1文字とした文字数である。半角文字1文字は0.5文字である。以下の説明では、所定の条件のことを「生成条件」という。生成条件は、13.5文字以下に限定されない。生成条件となる文字数は、13.5文字より多くてもよいし少なくてもよい。勿論、生成条件は文字数に限定されない。
なお、「見出し」は、要約、タイトル、短縮タイトル、トピック、トピック見出し等と言い換えることができる。同様に、配信コンテンツに含まれる「タイトル」も、要約等と言い換えることができる。本実施形態では、「見出し」は、配信コンテンツに含まれる「タイトル」に基づき作成される短縮テキストであるものとする。勿論、「見出し」は本文に基づき作成された短縮テキストであってもよい。なお、構文上は文が短縮されていても、「見出し」の文字数が「タイトル」の文字数より多くなることがあり得る。例えば、「タイトル」に含まれる略語を正式名称に置き換えた場合は、構文上は文が短縮されていても、結果として文字数が増えることがある。このような場合も、「見出し」は「タイトル」の短縮テキストである。
図1に戻り、情報処理装置10は、学習データデータベースに登録されたデータの中から、タイトルと属性情報と見出しとの組を複数組取得する。そして、情報処理装置10は、タイトルと属性情報と見出しとに基づいて、モデルMの学習を行う(ステップS2)。モデルMは、モデルに入力されるテキスト(以下、入力テキストという。)から生成条件を満たすテキスト(以下、出力テキストという。)を生成するモデルである。情報処理装置10は、タイトルと属性情報とを入力データ、見出しを正解データとしてモデルMの学習(例えば、教師あり学習)を行う。
なお、以下の説明では、学習の際、入力データとなるテキスト(本実施形態の場合、タイトル)のことを第1のテキスト、正解データとなるテキスト(本実施形態の場合、見出し)のことを第2のテキストということがある。また、以下の説明では、正解データのことを教師ラベルということもある。
第1のテキストは、例えば、所定の配信主体からのテキストである。一例として、第1のテキストは、所定の配信主体から取得した記事のタイトルである。また、第2のテキストは、例えば、第1のテキストを、生成条件を満たすように変換した短縮タイトル(すなわち、見出し)である。また、属性情報は、例えば、所定の配信主体を示す情報である。例えば、属性情報は、配信主体が属する分類を示す情報(例えば、“新聞社”、“出版社”)である。
また、第1のテキストは、例えば、所定の情報媒体からのテキストであってもよい。一例として、第1のテキストは、所定の情報媒体から取得した記事のタイトルである。また、第2のテキストは、例えば、第1のテキストを、生成条件を満たすように変換した短縮タイトル(すなわち、見出し)である。また、属性情報は、例えば、所定の情報媒体を示す情報である。例えば、属性情報は、“新聞”、“雑誌”等を示す情報である。
モデルMは、入力テキストから入力テキストが有する特徴を示す特徴情報を生成するエンコーダと、特徴情報から出力テキストを生成するデコーダと、を含むモデルであってもよい。
(モデルM1)
図4は、モデルMの一例を示す図である。具体的には、図4は、モデルMの一例であるモデルM1を示す図である。モデルM1は、RNN(Recurrent Neural Network)の一例であるLSTM(Long Short Term Memory)を用いたSequence to Sequence Model(以下、Seq2Seqともいう。)である。Seq2Seqは、エンコーダ−デコーダモデルの一種であり、異なる長さのワード列 (Sequence)を入力とし、異なる長さのワード列(Sequence)を出力とすることを可能とする。図4に示すモデルM1は、エンコーダE1とデコーダD1とから構成されている。
エンコーダE1は、入力テキストが有する特徴を抽出する。エンコーダE1は、入力層Xと中間層(隠れ層)H1とを有する。エンコーダE1には、第1のテキスト(本実施形態の場合、タイトル)に含まれるワード(図4に示すワードW11〜W13)が順次入力される。<EOS>は、End Of Statementの略であり、テキストの終わりであることを示す。図4に示すエンコーダE1は、入力層Xと中間層H1を時間軸方向に展開した図である。中間層H1には、入力層Xからの出力に加えて前回の中間層H1の出力が入力される。なお、図4に示す例では、第1のテキストに含まれるワードが、ワードW11〜W13までの3つとなっているが、第1のテキストに含まれるワードは、3つより多くてもよい。エンコーダE1は、入力されたテキストの特徴を示す多次元量(例えば、ベクトル)である特徴情報Fを出力する。
なお、エンコーダE1は、属性情報Pを入力するための層(以下、属性入力層N1という。)が用意されている。属性情報Pは、入力層Xに入力される第1のテキスト(タイトル)の属性を示す情報である。属性入力層N1は、属性情報Pを中間層H1の入力に対応する次元数の多次元量(例えば、ベクトル)に変換する。図4の例では、テキストの先頭ワードであるワードW11が入力される前に属性入力層N1の出力が中間層H1に入力されている。エンコーダE1に、第1のテキストの属性情報Pを入力することにより、エンコーダE1は、第1のテキストの属性も加味して、第1のテキストが有する特徴を学習できる。
デコーダD1は、入力テキストが短縮されたテキスト(すなわち、短縮テキスト)を出力する。デコーダD1は、中間層(隠れ層)H2と出力層Yとを有する。図4に示すデコーダD1は、エンコーダE1と同じく、中間層(隠れ層)H2と出力層Yを時間軸方向に展開した図である。デコーダD1には、エンコーダE1から出力された特徴情報Fが入力され、出力層Yから短縮テキストとなるワード(図4に示すワードW21〜W23)が順次出力される。なお、図4に示す例では、短縮テキストに含まれるワードが、ワードW21〜W23までの3つとなっているが、短縮テキストに含まれるワードは、3つより多くてもよい。
情報処理装置10は、エンコーダE1に第1のテキスト及び属性情報Pを入力した際に、デコーダD1から第1のテキストに対応する第2のテキストが出力されるよう、モデルM1の学習を行う。例えば、情報処理装置10は、デコーダD1が出力した短縮テキストが、第2のテキストに近づくように、バックプロパゲーション等の手法により、各ノード間で値が伝達する際に考慮される重み(すなわち、接続係数)の値を修正する。これにより、情報処理装置10は、モデルM1に第1のテキストが有する特徴を学習させる。なお、情報処理装置10は、短縮テキストの分散表現となるベクトルと第2のテキストの分散表現となるベクトルとのコサイン類似度に基づいて重みの値を修正してもよい。
(モデルM2)
図5は、モデルMの他の例を示す図である。具体的には、図5は、モデルMの一例であるモデルM2を示す図である。情報処理装置10は、第1のテキスト(タイトル)と属性情報Pと文体情報Qを入力データ、第2のテキスト(見出し)を正解データ(教師ラベル)としてモデルM2の学習を行う。図5に示すモデルM2は、エンコーダE1とデコーダD2とから構成されている。エンコーダE1は、モデルM1のエンコーダE1と同じである。デコーダD2は、中間層H2と出力層Yとを有する。中間層H2と出力層YはモデルM1のデコーダD1が有する中間層H2と出力層Yと同じである。なお、デコーダD2は、第2のテキスト(本実施形態の場合、見出し)の文体を示す文体情報Qを入力するための層(以下、文体入力層N2という。)が用意されている。
文体情報Qは、第2のテキスト(本実施形態の場合、見出し)の文体を示す情報である。例えば、文体情報Qは、第2のテキストがどの配信主体の文体のテキストかを示す情報である。例えば、文体情報Qは、“新聞社”スタイルのテキストか、“出版社”スタイルのテキストか、を識別する情報であってもよい。また、文体情報Qは、第2のテキストがどの情報媒体の文体かを示す情報であってもよい。例えば、文体情報は“新聞”でよく使用される文体か、“雑誌”でよく使用される文体か、を示す情報であってもよい。
なお、文体情報Qは、第2のテキストがどの利用者属性に向けたテキストかを示す情報であってもよい利用者属性は、デモグラフィック属性やサイコグラフィック属性である。例えば、文体情報Qは、第2のテキストが女性向けのテキストなのか、男性向けのテキストなのかを示す情報であってもよい。また、文体情報Qは、第2のテキストがどの年代の人に向けたテキストなのかを示す情報であってもよい。
情報処理装置10は、文体情報Qをデータサーバ20から取得してもよい。或いは、情報処理装置10は、属性情報Pをそのまま文体情報Qとしてもよい。上述したように、文体情報Qは、第2のテキストの生成者の識別情報であってもよい。
文体入力層N2は、エンコーダE1から出力された特徴情報Fと文体情報Qとを、中間層H2の入力に対応する次元数の多次元量(例えば、ベクトル)に変換する。デコーダD2に、第2のテキストの文体情報Qを入力することにより、デコーダD2は、第2のテキストの文体も加味して、第2のテキストが有する特徴を学習できる。
〔1−4.生成処理について〕
次に、上述した学習処理によって学習が行われたモデルを用いて、入力テキストに対応するテキストであって生成条件を満たす出力テキストを生成する生成処理の一例について説明する。このとき、出力テキストは、例えば、入力テキストの短縮テキストである。
まず、情報処理装置10は、データサーバ20からモデルMに入力される情報を取得する(ステップS3)。例えば、情報処理装置10は、データサーバ20から、配信予定の配信コンテンツ(本文及びタイトル)を取得する。また、情報処理装置10は、取得した配信コンテンツの属性情報を取得する。このとき、情報処理装置10は、配信コンテンツの配信主体を示す情報を属性情報として取得してもよい。
そして、情報処理装置10は、モデルMに入力テキスト(例えば、タイトル)と該入力テキストの属性情報とを入力することにより、入力テキストに対応するテキストであって生成条件を満たす出力テキスト(例えば、見出し)を生成する(ステップS4)。例えば、モデルMが図4に示すモデルM1なのであれば、情報処理装置10は、属性情報を属性入力層N1に入力するとともに、入力テキストに含まれるワードを、順次、エンコーダE1に入力する。そして、情報処理装置10は、デコーダD1から、順次、出力テキストとなるワードを取得する。
なお、モデルMが図5に示すモデルM2なのであれば、情報処理装置10は、生成されるテキストの文体を指定するための文体指定情報を取得してもよい。文体指定情報は、モデルM2に入力される文体情報に対応する情報である。例えば、文体指定情報は、出力テキストがどの配信主体の文体かを示す情報である。或いは、文体指定情報は、出力テキストがどの情報媒体の文体かを示す情報である。文体指定情報は、出力テキストがどの利用者属性に向けたテキストかを示す情報であってもよい。
情報処理装置10は、属性情報を属性入力層N1に入力するとともに、入力テキストに含まれるワードを、順次、エンコーダE1に入力する。さらに、情報処理装置10は、文体指定情報をデコーダD2の文体入力層N2に入力する。そして、情報処理装置10は、デコーダD2から、順次、出力テキストとなるワードを取得する。
出力テキストが生成されたら、情報処理装置10は、出力テキストを用いて、要約コンテンツを生成する。そして、情報処理装置10は、要約コンテンツを端末装置30に配信する(ステップS5)。
本実施形態によれば、情報処理装置10は、第1のテキストのみならず第1のテキストの属性情報を使ってモデルMの学習を行っている。学習データとなる第1のテキストに特徴の偏りやバラツキがあったとしても、情報処理装置10は、それを踏まえてモデルMの学習を実行できる。よって、頻度が低いスタイルのテキストが学習時の阻害要因とならないので、情報処理装置10は、精度が高いモデルMを生成できる。結果として情報処理装置10は、入力テキストから精度が高い出力テキスト(短縮テキスト)を生成できる。
また、属性情報を学習時の入力とすることにより、情報処理装置10は、頻度が高いスタイルのテキストと頻度が低いスタイルのテキストとを同時にモデルMに学習させることができる。よって、情報処理装置10は、頻度が低いスタイルのテキストが入力されたとしても精度が高い出力テキスト(短縮テキスト)を生成できる。
また、情報処理装置10は、正解データ(教師ラベル)となる第2のテキストの文体を示す文体情報を使ってモデルMの学習を行っている。第2のテキストにスタイルの偏りやバラツキがあったとしても、情報処理装置10は、それを踏まえてモデルMの学習を実行できる。これにより、情報処理装置10は、精度が高いモデルMを生成できる。結果として情報処理装置10は、入力テキストから精度が高い出力テキスト(短縮テキスト)を生成できる。
しかも、モデルMは、出力テキストの生成時、出力テキストの文体を指定するための文体指定情報を入力できるよう構成されている。これにより、情報処理装置10は、ユーザの意図する文体のテキスト(例えば、女性向けのスタイルのテキスト、男性向けのスタイルのテキスト)を生成できる。
〔2.情報処理装置の構成例〕
以上、本実施形態の情報処理装置10の動作を述べたが、以下、情報処理装置10の構成を説明する。
情報処理装置10は、端末装置30等のクライアントコンピュータからの要求を処理するサーバ用ホストコンピュータ(以下、単に「サーバ」という。)である。情報処理装置10は、PCサーバであってもよいし、ミッドレンジサーバであってもよいし、メインフレームサーバであってもよい。また、情報処理装置10は、1つのサーバにより構成されていてもよいし、協働して処理を実行する複数のサーバにより構成されていてもよい。情報処理装置10が複数のサーバで構成される場合、これらサーバの設置場所は離れていてもよい。設置場所が離れていたとしても、協働して処理を実行するのであれば、これらサーバは1つの情報処理装置とみなすことができる。情報処理装置10は、生成装置および学習装置として機能する。
上述したように、情報処理装置10は、データサーバ20及び端末装置30とネットワークを介して接続されている。ネットワークは、LAN(Local Area Network)、WAN(Wide Area Network)、電話網(携帯電話網、固定電話網等)、地域IP(Internet Protocol)網、インターネット等の通信ネットワークである。ネットワークには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。
図6は、実施形態に係る情報処理装置10の構成例を示す図である。情報処理装置10は、通信部11と、記憶部12と、制御部13と、を備える。なお、図6に示した構成は機能的な構成であり、ハードウェア構成はこれとは異なっていてもよい。
通信部11は、外部の装置と通信する通信インタフェースである。通信部11は、ネットワークインタフェースであってもよいし、機器接続インタフェースであってもよい。例えば、通信部11は、NIC(Network Interface Card)等のLANインタフェースであってもよいし、USB(Universal Serial Bus)ホストコントローラ、USBポート等により構成されるUSBインタフェースであってもよい。また、通信部11は、有線インタフェースであってもよいし、無線インタフェースであってもよい。通信部11は、情報処理装置10の通信手段として機能する。通信部11は、制御部13の制御に従ってデータサーバ20及び端末装置30と通信する。
記憶部12は、DRAM(Dynamic Random Access Memory)、SRAM(Static Random Access Memory)、フラッシュメモリ、ハードディスク等のデータ読み書き可能な記憶装置である。記憶部12は、情報処理装置10の記憶手段として機能する。記憶部12は、学習データデータベース121、モデルデータベース122、及びコンテンツ情報データベース123を記憶する。
学習データデータベース121には、学習データが登録される。図7は、学習データデータベース121に登録される情報の一例を示す図である。学習データデータベース121には、「学習データID(Identifier)」、「属性情報」、「本文」、「タイトル」、および「見出し」といった項目を有する情報が登録される。
なお、図7に示す情報のうち「属性情報」、「本文」、「タイトル」、および「見出し」は、図3に示す「属性情報」、「本文」、「タイトル」、および「見出し」に対応する。なお、学習データデータベース121には、図7に示す情報以外にも、学習データや要約データを閲覧した利用者に関する各種の情報が登録されていてもよい。なお、図7に示す例では、学習データデータベース121に登録される情報として、「P11〜P13」、「K11〜K13」、「T11〜T13」、「U11〜U13」といった概念的な情報を示したが、実際には、テキストデータやバイナリデータが登録されることとなる。
ここで、「学習データID」とは、学習データを識別するための識別子である。また、「属性情報」とは、テキストの属性を示す情報である。また、「本文」とは、ユーザに配信されたコンテンツ(例えば、記事)に含まれる本文となるテキストである。また「タイトル」とは、コンテンツ或いは当該コンテンツに含まれる本文に付されたタイトルである。また、「見出し」とは、コンテンツ(本文或いはタイトル)に付された見出しである。
例えば、図7に示す例では、学習データID「1001」、属性情報「P11」、本文「K11」、タイトル「T11」、および見出し「U11」といった情報が対応付けて登録されている。このような情報は、例えば、学習データID「1001」が示す学習データに、「P11」が示す属性情報と、「K11」が示す本文と、「T11」が示すタイトルと、「U11」が示す見出しと、が含まれる旨を示す。
図6に戻り、モデルデータベース122には、情報処理装置10が有するモデルのデータが登録される。図8は、モデルデータベース122に登録される情報の一例を示す図である。図8に示す例では、モデルデータベース122には、「モデルID」、および「モデルデータ」といった情報が登録されている。
ここで、「モデルID」とは、各モデルを識別するための情報である。また、「モデルデータ」とは、対応付けられた「モデルID」が示すモデルのデータであり、例えば、各層におけるノードと、各ノードが採用する関数と、ノードの接続関係と、ノード間の接続に対して設定される接続係数とを含む情報である。
例えば、図8に示す例では、モデルID「2001」およびモデルデータ「M1」といった情報が対応付けて登録されている。このような情報は、例えば、「2001」が示すモデルのデータが「M1」である旨を示す。なお、図8に示す例では、モデルデータベース122に登録される情報として、「M1〜M2」といった概念的な情報を記載したが、実際には、モデルの構造や接続係数を示す文字列や数値等が登録されることとなる。
モデルMは、第1のテキストと第1のテキストの属性を示す属性情報と第1のテキストに対応するテキストであって生成条件を満たす第2のテキストとに基づいて学習したモデルである。モデルMは、入力テキストから生成条件を満たす出力テキストを生成する。このようなモデルMは、テキストが入力される入力層と、入力層に入力されたテキストに対応するテキストであって生成条件を満たすテキストを出力する出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重み(すなわち、接続係数)とに基づく演算を行うことにより、入力層に入力されたテキストに対応するテキストであって生成条件を満たすテキストを出力層から出力するよう、コンピュータを機能させるためのモデルである。
ここで、モデルMが「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルMが含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。
また、モデルMがDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルMが含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。
情報処理装置10は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、出力テキストの算出を行う。具体的には、モデルMは、テキスト(例えば、タイトル)が入力された場合に、入力されたテキストに対応するテキストであって生成条件を満たすテキスト(例えば、見出し)を出力するように係数が設定される。モデルMは、テキスト及び当該テキストの属性情報が入力された場合に、入力されたテキストに対応するテキストであって生成条件を満たすテキストを出力するように係数が設定されてもよい。情報処理装置10は、このようなモデルMを用いて、生成条件を満たすテキスト(例えば、見出し)を生成する。
なお、上記例では、モデルMが、テキスト(及び当該テキストの属性情報)が入力された場合に、入力されたテキストに対応するテキストであって生成条件を満たすテキスト(例えば、見出し)を出力するモデル(以下、モデルVという。)である例を示した。しかし、実施形態に係るモデルMは、モデルVにデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルVは、「テキスト(及び当該テキストの属性情報)」を入力とし、モデルVが出力する「入力されたテキストに対応するテキストであって生成条件を満たすテキスト」を出力とするよう学習されたモデルであってもよい。
また、情報処理装置10がGAN(Generative Adversarial Networks)を用いた学習処理或いは生成処理を行う場合、モデルMは、GANの一部を構成するモデルであってもよい。
図6に戻り、コンテンツ情報データベース123には、ユーザに配信されるコンテンツの情報が登録される。例えば、コンテンツ情報データベース123には、コンテンツパートナーから取得した記事等が登録される。図9は、コンテンツ情報データベース123に登録される情報の一例を示す図である。コンテンツ情報データベース123には、「コンテンツID」、「属性情報」、「本文」、及び「タイトル」といった項目を有する情報が登録される。なお、「コンテンツID」とは、コンテンツのデータを識別するための識別子である。「属性情報」、「本文」、及び「タイトル」は、図7に示す「属性情報」、「本文」、及び「タイトル」と同様である。
図6に戻り、制御部13は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報処理装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部13は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
また、制御部13は、記憶部12に記憶されるモデルM(モデルM1、M2等)に従った情報処理により、モデルMの入力層に入力された入力テキスト(例えば、タイトル)に対し、モデルMが有する係数(すなわち、モデルMが学習した各種の特徴に対応する係数)に基づく演算を行い、モデルMの出力層から出力テキスト(例えば、見出し)を出力する。入力層には、入力テキスト以外に、当該入力テキストの属性情報が入力されてもよい。
制御部13は、図6に示すように、学習データ取得部131と、学習部132と、出力情報取得部133と、生成部134と、出力制御部135と、を備える。制御部13を構成するブロック(学習データ取得部131〜出力制御部135)はそれぞれ制御部13の機能を示す機能ブロックである。これら機能ブロックはソフトウェアブロックであってもよいし、ハードウェアブロックであってもよい。例えば、上述の機能ブロックが、それぞれ、ソフトウェア(マイクロプログラムを含む。)で実現される1つのソフトウェアモジュールであってもよいし、半導体チップ(ダイ)上の1つの回路ブロックであってもよい。勿論、各機能ブロックがそれぞれ1つのプロセッサ或いは1つの集積回路であってもよい。機能ブロックの構成方法は任意である。なお、制御部13は上述の機能ブロックとは異なる機能単位で構成されていてもよい。
学習データ取得部131は、学習データとして、第1のテキスト、当該第1のテキストの属性を示す属性情報と、第1のテキストに対応するテキストであって生成条件を満たすテキストと、を取得する。例えば、学習データ取得部131は、学習データとして、所定のコンテンツパートナーが作成した記事(本文及び/又はタイトル)と、当該記事の属性情報と、との組をデータサーバ20から取得する。さらに、学習データ取得部131は、学習データとして、当該記事に付された見出しを取得する。見出しは、当該記事を過去ユーザに配信したポータルサイトの運営者が作成したものであってもよい。学習データ取得部131は、上記データに加えて、第2のテキストの文体を示す文体情報を学習データとして取得してもよい。そして、学習データ取得部131は、取得した各データを対応付けて学習データデータベース121に登録する。
学習部132は、モデルMの学習を行い、学習したモデルMをモデルデータベース122に格納する。より具体的には、学習部132は、学習データに含まれる第1のテキスト(例えば、タイトル)及び当該第1のテキストの属性情報をモデルMに入力した際に、モデルMが学習データに含まれる第2のテキスト(例えば、入力したタイトルに対応する見出し)を出力するように、モデルMの接続係数の設定を行う。すなわち、学習部132は、入力テキストを入力した際に、モデルMが、入力テキストに対応するテキストであって生成条件を満たす出力テキストを出力するように、モデルMの学習を行う。モデルMには、入力テキストに加えて、当該入力テキストの属性情報が入力されてもよい。
例えば、学習部132は、モデルMが有する入力層のノードであって、入力層に入力される情報と対応する特徴を学習したエンコーダE1の入力層と対応するノードに第1のテキスト(例えば、タイトル)及び当該第1のテキストの属性情報を入力し、各中間層を辿ってモデルMの出力層までデータを伝播させることで、第1のテキストに対応するテキストであって生成条件を満たすテキストを出力させる。そして、学習部132は、モデルMが実際に出力したテキストと、学習データに含まれる第2のテキスト(例えば、見出し)との差に基づいて、モデルMの接続係数を修正する。例えば、学習部132は、バックプロパゲーション等の手法を用いて、接続係数の修正を行ってもよい。また、学習部132は、第2のテキストの分散表現となるベクトルと、モデルMが実際に出力したテキストの分散表現となるベクトルとのコサイン類似度に基づいて、接続係数の修正を行ってもよい。
なお、学習部132は、いかなる学習アルゴリズムを用いてモデルMを学習してもよい。例えば、学習部132は、ニューラルネットワーク、サポートベクターマシン(support vector machine)、クラスタリング、強化学習等の学習アルゴリズムを用いて、モデルMを学習してよい。
ここで、学習部132は、第1のテキストと属性情報と第2のテキストとに基づいて、入力テキストから生成条件を満たす出力テキストを生成するモデルMの学習を行う。このとき、モデルMは、出力テキストとして、所定の文字数以下のテキストを生成するモデルであってもよい。
また、学習部132は、第1のテキストと、属性情報と、第2のテキストと、第2のテキストの文体を示す文体情報と、を取得する。また、学習部132は、第1のテキストと属性情報と文体情報を入力データ、第2のテキストを正解データ(教師ラベル)としてモデルMの学習を行う。
このとき、学習部132は、文体情報として、どの配信主体の文体かを示す情報、或いは、どの情報媒体の文体かを示す情報を取得してもよい。また、学習部132は、文体情報として、どの利用者属性に向けたテキストかを示す情報を取得してもよい。
また、学習部132は、第1のテキストとして所定の配信主体からのテキストを取得し、属性情報として所定の配信主体を示す情報を取得する。
また、学習部132は、第1のテキストとして所定の情報媒体からのテキストを取得し、属性情報として所定の情報媒体を示す情報を取得する。
また、学習部132は、入力テキストから入力テキストが有する特徴を示す特徴情報を生成するエンコーダと、特徴情報から出力テキストを生成するデコーダと、を含むモデルMの学習を行う。
出力情報取得部133は、第1のテキストと該第1のテキストの属性を示す属性情報と第1のテキストに対応するテキストであって生成条件を満たす第2のテキストとに基づいて学習したモデルMに入力される入力テキストと、入力テキストの属性を示す属性情報と、を取得する。出力情報取得部133は、上記情報に加え、生成部134で生成されるテキストの文体を指定するための情報であって文体情報に対応する文体指定情報と、を取得してもよい。
生成部134は、モデルMに入力テキストと該入力テキストの属性情報とを入力することにより、入力テキストに対応するテキストであって生成条件を満たす出力テキストを生成する。生成部134は、出力テキストとして、所定の文字数以下のテキストを生成してもよい。
また、生成部134は、モデルMに入力テキストと該入力テキストの属性情報と文体指定情報とを入力することにより、入力テキストに対応する生成条件を満たすテキストであって文体指定情報で指定された文体を有するテキストを生成する。
このとき、生成部134は、文体指定情報として、どの配信主体の文体かを示す情報、或いは、どの情報媒体の文体かを示す情報を取得してもよい。また、生成部134は、文体指定情報として、どの利用者属性に向けたテキストかを示す情報を取得してもよい。
出力制御部135は、生成部134が生成したテキストを利用者に対して出力する。例えば、出力制御部135は、端末装置30からの要求に応じて、生成部134が生成したテキストが含まれるコンテンツを配信する。なお、出力制御部135は、生成部134が生成したテキストが含まれるコンテンツをデータサーバ20に提供し、データサーバ20から配信させてもよい。
〔3.情報処理装置の処理フロー〕
次に、情報処理装置10が実行する処理の手順について説明する。情報処理装置10は学習処理と生成処理とを実行する。情報処理装置10はマルチタスクOSを備え、これらの処理を並行して実行可能である。
〔3−1.学習処理〕
最初に学習処理を説明する。図10は、学習処理の一例を示すフローチャートである。学習処理は、入力テキストから出力テキストを生成するモデルMを学習する処理である。情報処理装置10は、ユーザから処理開始命令を受信すると、学習処理を実行する。
まず、情報処理装置10は、学習データを取得する(ステップS11)。例えば、情報処理装置10は、データサーバ20から配信コンテンツ(本文及びタイトル)の情報を取得するとともに、配信コンテンツに対応する見出しを取得する。
続いて、情報処理装置10は、ステップS11で取得したデータの中から、入力データとなる第1のテキストと、当該入力データに対応する正解データ(教師ラベル)となる第2のテキストを選択する(ステップS12)。例えば、情報処理装置10は、タイトルを第1のテキスト、見出しを第2のテキストとして選択する。
続いて、情報処理装置10は、第1のテキストの属性情報を取得する(ステップS13)。また、情報処理装置10は、第2のテキストの文体情報を取得する(ステップS14)。
続いて、情報処理装置10は、第1のテキストと属性情報を入力データ、第2のテキストを正解データ(教師ラベル)としてモデルMの学習を実行する(ステップS15)。なお、モデルMが文体情報を入力できるよう構成されているのであれば、情報処理装置10は、第1のテキストと属性情報と文体情報を入力データ、第2のテキストを教師データとしてモデルMの学習を実行する。学習の実行が終了したら、情報処理装置10は、学習処理を終了する。
〔3−2.生成処理〕
次に生成処理を説明する。図11は、生成処理の一例を示すフローチャートである。生成処理は、入力テキストから出力テキスト(入力テキストの短縮テキスト)を生成する処理である。情報処理装置10は、ユーザから処理開始命令を受信すると、生成処理を実行する。
まず、情報処理装置10は、コンテンツ情報を取得する(ステップS21)。例えば、情報処理装置10は、データサーバ20から配信コンテンツ(本文及びタイトル)の情報を取得する。
続いて、情報処理装置10は、ステップS21で取得したデータの中から、モデルMに入力する入力テキストを選択する(ステップS22)。例えば、情報処理装置10は、タイトルを入力テキストとして選択する。
続いて、情報処理装置10は、入力テキストの属性情報を取得する(ステップS23)。また、情報処理装置10は、モデルMから出力されるテキスト(出力テキスト)の文体を指定するための文体指定情報を取得する(ステップS24)。
続いて、情報処理装置10は、入力テキストと属性情報をモデルMに入力して出力テキストを生成する(ステップS25)。なお、モデルMが文体指定情報を入力できるよう構成されているのであれば、情報処理装置10は、入力テキストと属性情報と文体指定情報をモデルMに入力してもよい。出力テキストの生成が終了したら、情報処理装置10は、生成処理を終了する。
〔4.変形例〕
上述の実施形態は一例を示したものであり、種々の変更及び応用が可能である。
例えば、上述の実施形態では、情報処理装置10は、第1のテキストをタイトル、第2のテキストを見出し(タイトルの短縮テキスト)としてモデルMの学習を行った。しかし、情報処理装置10は、第1のテキストを本文、第2のテキストを見出し(本文或いはタイトルの短縮テキスト)としてモデルMの学習を行ってもよい。このとき、情報処理装置10は、本文をモデルMに入力する入力テキストとして出力テキストの生成を行ってもよい。その他、第1のテキスト及び第2のテキストとするテキストは任意に変更可能である。
また、上述の実施形態では、モデルM1、M2に属性情報Pを入力するための属性入力層N1を設けた。しかし、モデルM1、M2に属性入力層N1は設けられていなくてもよい。このとき、情報処理装置10は属性情報Pの多次元量をエンコーダE1の中間層H1に直接入力してもよい。
また、上述の実施形態では、モデルM2に文体情報Qを入力するための文体入力層N2を設けた。しかし、モデルM1に属性入力層N1は設けられていなくてもよい。このとき、情報処理装置10は文体情報Qの多次元量をデコーダD2の中間層H2に直接入力してもよい。
また、上述の実施形態では、モデルMを構成するエンコーダおよびデコーダは、LSTMにより構成されるものとしたが、LSTM以外のRNNにより構成されていてもよい。モデルMを構成するエンコーダおよびデコーダは、CNN(Convolution Neural Network)等、RNN以外のニューラルネットワークであってもよい。その他、モデルMを構成するエンコーダおよびデコーダは、単純に入力された情報量の次元数を変化させるニューラルネットワークであってもよい。このとき、モデルMを構成するエンコーダは、入力された情報の次元量を圧縮することで入力された情報が有する特徴を抽出するよう構成されていてもよい。また、モデルMを構成するデコーダは、エンコーダによって抽出された特徴の次元量を増大させ、エンコーダに入力された情報よりも次元数が少ない情報を出力するよう構成されていてもよい。
本実施形態の情報処理装置10を制御する制御装置は、専用のコンピュータシステムによって実現してもよいし、通常のコンピュータシステムにより実現してもよい。例えば、上述の動作を実行するためのプログラムまたはデータ(例えば、モデルM)を、光ディスク、半導体メモリ、磁気テープ、フレキシブルディスク等のコンピュータ読み取り可能な記録媒体に格納して配布し、該プログラムをコンピュータにインストールし、上述の処理を実行することによって制御装置を構成してもよい。制御装置は、情報処理装置10の外部の装置(例えば、パーソナルコンピュータ)であってもよいし、内部の装置(例えば、制御部13)であってもよい。また、上記プログラムをインターネット等のネットワーク上のサーバ装置が備えるディスク装置に格納しておき、コンピュータにダウンロード等できるようにしてもよい。また、上述の機能を、OS(Operating System)とアプリケーションソフトとの協働により実現してもよい。この場合には、OS以外の部分を媒体に格納して配布してもよいし、OS以外の部分をサーバ装置に格納しておき、コンピュータにダウンロード等できるようにしてもよい。
また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
〔5.ハードウェア構成〕
実施形態及び変形例に係る情報処理装置10は、例えば図12に示すような構成のコンピュータ1000によっても実現可能である。図12は、情報処理装置10の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU(Central Processing Unit)1100、RAM1200、ROM1300、HDD(Hard Disk Drive)1400、通信インタフェース(I/F)1500、入出力インタフェース(I/F)1600、及びメディアインタフェース(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インタフェース1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータをネットワークNを介して他の機器へ送信する。
CPU1100は、入出力インタフェース1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インタフェース1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インタフェース1600を介して出力装置へ出力する。
メディアインタフェース1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインタフェース1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る情報処理装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムまたはデータ(例えば、モデルM)を実行することにより、制御部13を実現する。コンピュータ1000のCPU1100は、これらのプログラムまたはデータ(例えば、モデルM)を記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムまたはデータ(例えば、モデルM)を取得してもよい。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔6.効果〕
本実施形態によれば、情報処理装置10は、第1のテキストと、第1のテキストの属性を示す属性情報と、第1のテキストに対応するテキストであって生成条件を満たす第2のテキストと、を取得する。情報処理装置10は、第1のテキストと属性情報と第2のテキストとに基づいて、入力テキストから生成条件を満たす出力テキストを生成するモデルMの学習を行う。このとき、情報処理装置10が学習を実行するモデルMは、出力テキストとして、所定の文字数以下のテキストを生成するモデルであってもよい。これにより、情報処理装置10は、第1のテキストの特徴を踏まえてモデルMの学習を実行できる。頻度が低いスタイルのテキストが学習時の阻害要因とならないので、情報処理装置10は、精度が高いモデルMを生成できる。結果として情報処理装置10は、入力テキストから精度が高い出力テキストを生成できる。
情報処理装置10は、第1のテキストと、属性情報と、第2のテキストと、第2のテキストの文体を示す文体情報と、を取得する。また、情報処理装置10は、第1のテキストと属性情報と文体情報を入力データ、第2のテキストを正解データとしてモデルMの学習を行う。これにより、情報処理装置10は、第2のテキストの特徴を踏まえてモデルMの学習を実行できる。精度が高いモデルMが生成されるので、情報処理装置10は、入力テキストから精度が高い出力テキストを生成できる。
情報処理装置10は、文体情報として、どの配信主体の文体かを示す情報、或いは、どの情報媒体の文体かを示す情報を取得する。これにより、情報処理装置10は、配信主体或いは情報媒体の文のスタイルを踏まえてモデルMの学習を実行できる。
情報処理装置10は、文体情報として、どの利用者属性に向けたテキストかを示す情報を取得する。これにより、情報処理装置10は、利用者属性毎に文のスタイルが異なっていたとしても、それを踏まえてモデルMの学習を実行できる。
情報処理装置10は、第1のテキストとして所定の配信主体からのテキストを取得し、属性情報として所定の配信主体を示す情報を取得する。これにより、情報処理装置10は、配信主体の文のスタイルを踏まえてモデルMの学習を実行できる。
情報処理装置10は、第1のテキストとして所定の情報媒体からのテキストを取得し、属性情報として所定の情報媒体を示す情報を取得する。これにより、情報処理装置10は、情報媒体の文のスタイルを踏まえてモデルMの学習を実行できる。
情報処理装置10は、入力テキストから入力テキストが有する特徴を示す特徴情報を生成するエンコーダE1と、特徴情報から出力テキストを生成するデコーダD1或いはD2と、を含むモデルMの学習を行う。これにより、情報処理装置10は、精度が高いモデルMを生成できる。
情報処理装置10は、第1のテキストと該第1のテキストの属性を示す属性情報と第1のテキストに対応するテキストであって生成条件を満たす第2のテキストとに基づいて学習したモデルMに入力される入力テキストと、入力テキストの属性を示す属性情報と、を取得する。そして、情報処理装置10は、モデルMに入力テキストと該入力テキストの属性情報とを入力することにより、入力テキストに対応するテキストであって生成条件を満たす出力テキストを生成する。このとき、情報処理装置10は、出力テキストとして、所定の文字数以下のテキストを生成してもよい。これにより、情報処理装置10は、入力テキストの属性を踏まえた精度が高い出力テキストを生成できる。
情報処理装置10は、第1のテキストと該第1のテキストの属性を示す属性情報と第2のテキストの文体を示す文体情報とを入力データ、第1のテキストに対応するテキストであって生成条件を満たす第2のテキストを正解データとして学習したモデルMに入力される入力テキストと、入力テキストの属性を示す属性情報と、生成されるテキストの文体を指定するための情報であって文体情報に対応する文体指定情報と、を取得する。情報処理装置10は、モデルMに入力テキストと該入力テキストの属性情報と文体指定情報とを入力することにより、入力テキストに対応する生成条件を満たすテキストであって文体指定情報で指定された文体を有するテキストを生成する。これにより、情報処理装置10は、ユーザ所望の文体の出力テキストを生成できる。
情報処理装置10は、文体指定情報として、どの配信主体の文体かを示す情報、或いは、どの情報媒体の文体かを示す情報を取得する。これにより、情報処理装置10は、ユーザ所望の配信主体の文体に合わせた出力テキストを生成できる。
情報処理装置10は、文体指定情報として、どの利用者属性に向けたテキストかを示す情報を取得する。これにより、情報処理装置10は、利用者に合わせた文体の出力テキストを生成できる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、学習部は、学習手段や学習回路に読み替えることができる。
10…情報処理装置
11…通信部
12…記憶部
121…学習データデータベース
122…モデルデータベース
123…コンテンツ情報データベース
13…制御部
131…学習データ取得部
132…学習部
133…出力情報取得部
134…生成部
135…出力制御部
20…データサーバ
30…端末装置
M1、M2…モデル
E1…エンコーダ
D1、D2…デコーダ
F…特徴情報
P…属性情報
Q…文体情報

Claims (17)

  1. 第1のテキストと、前記第1のテキストの属性を示す属性情報と、前記第1のテキストに対応するテキストであって所定の条件を満たす第2のテキストと、を取得する取得部と、
    前記第1のテキストと前記属性情報と前記第2のテキストとに基づいて、入力テキストから前記所定の条件を満たす出力テキストを生成するモデルの学習を行う学習部と、
    を備えることを特徴とする学習装置。
  2. 前記取得部は、前記第1のテキストと、前記属性情報と、前記第2のテキストと、前記第2のテキストの文体を示す文体情報と、を取得し、
    前記学習部は、前記第1のテキストと前記属性情報と前記文体情報を入力データ、前記第2のテキストを正解データとして前記モデルの学習を行う、
    ことを特徴とする請求項1に記載の学習装置。
  3. 前記取得部は、前記文体情報として、どの配信主体の文体かを示す情報、或いは、どの情報媒体の文体かを示す情報を取得する、
    ことを特徴とする請求項2に記載の学習装置。
  4. 前記取得部は、前記文体情報として、どの利用者属性に向けたテキストかを示す情報を取得する、
    ことを特徴とする請求項2に記載の学習装置。
  5. 前記取得部は、前記第1のテキストとして所定の配信主体からのテキストを取得し、前記属性情報として前記所定の配信主体を示す情報を取得する、
    ことを特徴とする請求項1〜4のいずれか1項に記載の学習装置。
  6. 前記取得部は、前記第1のテキストとして所定の情報媒体からのテキストを取得し、前記属性情報として前記所定の情報媒体を示す情報を取得する、
    ことを特徴とする請求項1〜5のいずれか1項に記載の学習装置。
  7. 前記学習部は、前記入力テキストから前記入力テキストが有する特徴を示す特徴情報を生成するエンコーダと、前記特徴情報から前記出力テキストを生成するデコーダと、を含む前記モデルの学習を行う、
    ことを特徴とする請求項1〜6のいずれか1項に記載の学習装置。
  8. 第1のテキストと該第1のテキストの属性を示す属性情報と前記第1のテキストに対応するテキストであって所定の条件を満たす第2のテキストとに基づいて学習したモデルに入力される入力テキストと、前記入力テキストの属性を示す属性情報と、を取得する取得部と、
    前記モデルに前記入力テキストと該入力テキストの属性情報とを入力することにより、前記入力テキストに対応するテキストであって前記所定の条件を満たす出力テキストを生成する生成部と、
    を備えることを特徴とする生成装置。
  9. 前記取得部は、前記第1のテキストと該第1のテキストの属性を示す属性情報と前記第2のテキストの文体を示す文体情報とを入力データ、前記第1のテキストに対応するテキストであって所定の条件を満たす前記第2のテキストを正解データとして学習したモデルに入力される入力テキストと、前記入力テキストの属性を示す属性情報と、生成されるテキストの文体を指定するための情報であって前記文体情報に対応する文体指定情報と、を取得し、
    前記生成部は、前記モデルに前記入力テキストと該入力テキストの属性情報と前記文体指定情報とを入力することにより、前記入力テキストに対応する前記所定の条件を満たすテキストであって前記文体指定情報で指定された文体を有するテキストを生成する、
    ことを特徴とする請求項8に記載の生成装置。
  10. 前記取得部は、前記文体指定情報として、どの配信主体の文体かを示す情報、或いは、どの情報媒体の文体かを示す情報を取得する、
    ことを特徴とする請求項9に記載の生成装置。
  11. 前記取得部は、前記文体指定情報として、どの利用者属性に向けたテキストかを示す情報を取得する、
    ことを特徴とする請求項9に記載の生成装置。
  12. 前記生成部は、前記出力テキストとして、所定の文字数以下のテキストを生成する、
    ことを特徴とする請求項8〜11のいずれか1項に記載の生成装置。
  13. 学習装置が実行する学習方法であって、
    第1のテキストと、前記第1のテキストの属性を示す属性情報と、前記第1のテキストに対応するテキストであって所定の条件を満たす第2のテキストと、を取得する取得工程と、
    前記第1のテキストと前記第2のテキストとに基づいて、入力テキストから前記所定の条件を満たす出力テキストを生成するモデルの学習を行う学習工程と、
    を含むことを特徴とする学習方法。
  14. 生成装置が実行する生成方法であって、
    第1のテキストと該第1のテキストの属性を示す属性情報と前記第1のテキストに対応するテキストであって所定の条件を満たす第2のテキストとに基づいて学習したモデルに入力される入力テキストと、前記入力テキストの属性を示す属性情報と、を取得する取得工程と、
    前記モデルに前記入力テキストと該入力テキストの属性情報とを入力することにより、前記入力テキストに対応するテキストであって前記所定の条件を満たす出力テキストを生成する生成工程と、
    を含むことを特徴とする生成方法。
  15. 第1のテキストと、前記第1のテキストの属性を示す属性情報と、前記第1のテキストに対応するテキストであって所定の条件を満たす第2のテキストと、を取得する取得手順と、
    前記第1のテキストと前記属性情報と前記第2のテキストとに基づいて、入力テキストから前記所定の条件を満たす出力テキストを生成するモデルの学習を行う学習手順と、
    をコンピュータに実行させるための学習プログラム。
  16. 第1のテキストと該第1のテキストの属性を示す属性情報と前記第1のテキストに対応するテキストであって所定の条件を満たす第2のテキストとに基づいて学習したモデルに入力される入力テキストと、前記入力テキストの属性を示す属性情報と、を取得する取得手順と、
    前記モデルに前記入力テキストと該入力テキストの属性情報とを入力することにより、前記入力テキストに対応するテキストであって前記所定の条件を満たす出力テキストを生成する生成手順と、
    をコンピュータに実行させるための生成プログラム。
  17. 第1のテキストと該第1のテキストの属性を示す属性情報と前記第1のテキストに対応するテキストであって所定の条件を満たす第2のテキストとに基づいて学習したモデルであって、
    テキストが入力される入力層と、
    前記入力層に入力されたテキストに対応するテキストであって前記所定の条件を満たすテキストを出力する出力層と、
    前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、
    前記第1要素と前記第1要素の重みとに基づいて値が算出される第2要素と、を含み、
    前記入力層に入力されたテキストに応じて、前記入力層に入力されたテキストに対応するテキストであって前記所定の条件を満たすテキストを出力層から出力するよう、
    コンピュータを機能させるためのモデル。
JP2017179531A 2017-09-19 2017-09-19 学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデル Active JP6529559B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017179531A JP6529559B2 (ja) 2017-09-19 2017-09-19 学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデル

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017179531A JP6529559B2 (ja) 2017-09-19 2017-09-19 学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデル

Publications (2)

Publication Number Publication Date
JP2019056973A true JP2019056973A (ja) 2019-04-11
JP6529559B2 JP6529559B2 (ja) 2019-06-12

Family

ID=66107430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017179531A Active JP6529559B2 (ja) 2017-09-19 2017-09-19 学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデル

Country Status (1)

Country Link
JP (1) JP6529559B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377887A (zh) * 2019-07-19 2019-10-25 出门问问(苏州)信息科技有限公司 实体简称转化方法、可读存储介质和电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014071769A (ja) * 2012-09-28 2014-04-21 Toshiba Corp 表現変換装置、方法およびプログラム
JP2017111190A (ja) * 2015-12-14 2017-06-22 株式会社日立製作所 対話テキスト要約装置及び方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014071769A (ja) * 2012-09-28 2014-04-21 Toshiba Corp 表現変換装置、方法およびプログラム
JP2017111190A (ja) * 2015-12-14 2017-06-22 株式会社日立製作所 対話テキスト要約装置及び方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
外山翔平 他2名: "話し言葉音声認識における非言語情報を考慮したRNN言語モデル", 研究報告音声言語情報処理(SLP)[ONLINE], vol. 2016−SLP−111, JPN6018046751, 9 May 2016 (2016-05-09), JP, ISSN: 0003927705 *
菊池悠太 他4名: "Encoder−Decoderモデルにおける出力長制御", 研究報告自然言語処理(NL)[ONLINE], vol. 2016−NL−227, JPN6018046753, 22 July 2016 (2016-07-22), JP, ISSN: 0003927706 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377887A (zh) * 2019-07-19 2019-10-25 出门问问(苏州)信息科技有限公司 实体简称转化方法、可读存储介质和电子设备

Also Published As

Publication number Publication date
JP6529559B2 (ja) 2019-06-12

Similar Documents

Publication Publication Date Title
US9990422B2 (en) Contextual analysis engine
US9015657B2 (en) Systems and methods for developing and delivering platform adaptive web and native application content
WO2022142121A1 (zh) 摘要语句提取方法、装置、服务器及计算机可读存储介质
JP6986978B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US10606910B2 (en) Ranking search results using machine learning based models
JP6698040B2 (ja) 生成装置、生成方法及び生成プログラム
JP6884722B2 (ja) 情報処理装置、情報処理方法、およびプログラム
EP3812919A1 (en) Methods, apparatuses, and systems for data mapping
US7979470B2 (en) Data manipulation process method and system
JP7088646B2 (ja) 生成装置、学習装置、生成方法、学習方法、生成プログラム、及び学習プログラム
JP2019053558A (ja) 学習装置、学習方法、学習プログラム、第1のモデルおよび第2のモデル
JP7231322B2 (ja) 学習装置、学習方法、学習プログラム及びプログラム
JP6529559B2 (ja) 学習装置、生成装置、学習方法、生成方法、学習プログラム、生成プログラム、及びモデル
JP6906456B2 (ja) 学習装置、学習方法、及び学習プログラム
JP6979899B2 (ja) 生成装置、学習装置、生成方法、学習方法、生成プログラム、及び学習プログラム
JP6680655B2 (ja) 学習装置および学習方法
JP2019021218A (ja) 学習装置、プログラムパラメータ、学習方法およびモデル
KR101583073B1 (ko) 기사 요약 서비스 서버 및 방법
JP7388678B2 (ja) 生成装置、生成方法及び生成プログラム
JP2019125317A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP6982444B2 (ja) 学習装置、生成装置、学習方法、生成方法、学習プログラム、及び生成プログラム
US7979451B2 (en) Data manipulation command method and system
JP2019053645A (ja) 検索システム、および検索方法
JP7244449B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP7390091B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190514

R150 Certificate of patent or registration of utility model

Ref document number: 6529559

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350