JP6205466B1

JP6205466B1 - 生成装置、生成方法、及び生成プログラム

Info

Publication number: JP6205466B1
Application number: JP2016141752A
Authority: JP
Inventors: 一真村尾; 正樹野口; 隼人小林; 村上　直也; 直也村上; 太一谷塚; 貴大石川
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2016-07-19
Filing date: 2016-07-19
Publication date: 2017-09-27
Anticipated expiration: 2036-07-19
Also published as: JP2018013876A

Abstract

【課題】所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすること。【解決手段】本願に係る生成装置は、取得部と、生成部とを有する。取得部は、文字情報と、文字情報に関連するコンテンツ関連情報とを取得する。生成部は、取得部により取得したコンテンツ関連情報に基づいて、取得部により取得した文字情報の要約の候補として複数の要約候補を生成する。例えば、生成部は、複数の要約候補の多様性に関する情報に基づいて、複数の要約候補を生成する。【選択図】図２

Description

本発明は、生成装置、生成方法、及び生成プログラムに関する。

従来、文章の要約を自動で生成する要約生成に関する技術が提供されている。例えば、記事や見出し等からタイトルを生成する技術が提供されている。

特開２０１４−０５６４９９号公報

しかしながら、上記の従来技術では、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができるとは限らない。例えば、係り受け構造に基づいて文字情報の要約を生成するだけでは、文字情報に含まれる内容等に対応する適切な要約になっているとは限らない。

本願は、上記に鑑みてなされたものであって、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる生成装置、生成方法、及び生成プログラムを提供することを目的とする。

本願に係る生成装置は、文字情報と、前記文字情報に関連するコンテンツ関連情報とを取得する取得部と、前記取得部により取得したコンテンツ関連情報に基づいて、前記取得部により取得した文字情報の要約の候補として複数の要約候補を生成する生成部と、を備えたことを特徴とする。

実施形態の一態様によれば、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができるという効果を奏する。

図１は、実施形態に係る生成処理の一例を示す図である。図２は、実施形態に係る生成装置の構成例を示す図である。図３は、実施形態に係る編集情報記憶部の一例を示す図である。図４は、実施形態に係るモデル情報記憶部の一例を示す図である。図５は、実施形態に係る類似単語情報記憶部の一例を示す図である。図６は、実施形態に係るコンテンツ関連情報記憶部の一例を示す図である。図７は、実施形態に係るモデルの学習の一例を示すフローチャートである。図８は、実施形態に係る短縮タイトルの生成の一例を示すフローチャートである。図９は、実施形態に係る短縮タイトルの生成の一例を示す図である。図１０は、実施形態に係る短縮タイトルの生成の一例を示す図である。図１１は、実施形態に係る短縮タイトルの生成の一例を示す図である。図１２は、実施形態に係る短縮タイトルの生成の一例を示す図である。図１３は、変形例１に係る生成処理の一例を示す図である。図１４は、変形例１に係る生成装置の構成例を示す図である。図１５は、変形例１に係る短縮タイトルの選択の一例を示すフローチャートである。図１６は、変形例２に係る生成処理の一例を示す図である。図１７は、変形例２に係る生成装置の構成例を示す図である。図１８は、変形例２に係る短縮タイトルの生成の一例を示すフローチャートである。図１９は、変形例２に係る短縮タイトルの生成の一例を示す図である。図２０は、変形例２に係る短縮タイトルの生成の一例を示す図である。図２１は、表示位置に基づく短縮タイトルの生成の一例を示す図である。図２２は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

以下に、本願に係る生成装置、生成方法、及び生成プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る生成装置、生成方法、及び生成プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

（実施形態）
〔１．生成処理〕
まず、図１を用いて、実施形態に係る生成処理の一例について説明する。図１は、実施形態に係る生成処理の一例を示す図である。図１の例では、生成装置１００は、１つのタイトルから、そのタイトルに関するコンテンツ関連情報に基づいて複数の短縮タイトルを生成する。図１に示す例は、所定の編集者であるユーザＵ１が短縮タイトルを生成する際の作業負荷を軽減するために生成システム１を用いる場合を示す。具体的には、図１の例では、生成装置１００は、ユーザＵ１が利用する端末装置１０−１に要約候補（短縮タイトル候補）となる複数の短縮タイトルを提供する。なお、以下では、端末装置１０−１や端末装置１０−２（図１３参照）等を区別せずに説明する場合、端末装置１０と記載する。

図１に示すように、生成システム１には、端末装置１０と、生成装置１００とが含まれる。端末装置１０と、生成装置１００とは図示しない所定の通信網を介して、有線または無線により通信可能に接続される。また、図１に示した生成システム１には、複数台の端末装置１０や、複数台の生成装置１００が含まれてもよい。

端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。図１に示す例においては、端末装置１０が所定の編集者が利用するノート型ＰＣである場合を示す。なお、以下では、端末装置１０をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置１０と読み替えることもできる。

生成装置１００は、端末装置１０に複数の短縮タイトルを提供する情報処理装置である。また、生成装置１００は、１つの文字情報（タイトル）に関連するコンテンツ関連情報に基づいて、文字情報の要約の候補として複数の要約候補を生成する。例えば、生成装置１００は、コンテンツ関連情報に基づいて、所定のコンテンツのタイトルをさらに短縮した複数の短縮タイトルを要約候補として生成する。

なお、生成システム１には、提供元装置（図示省略）や編集者端末（図示省略）が含まれてもよい。例えば、提供元装置は、コンテンツの提供元、いわゆるコンテンツプロバイダ等によって利用される情報処理装置である。例えば、提供元装置は、提供元により作成されたコンテンツを生成装置１００に入稿する。また、例えば、編集者端末は、所定の編集者によって利用される情報処理装置である。例えば、編集者端末は、例えば、コンテンツの本文やタイトルから短縮タイトルを作成する編集者が利用する端末装置である。なお、端末装置１０−１が編集者端末であってもよい。

以下、図１を用いて生成装置１００による複数の短縮タイトルの生成について説明する。図１の例では、生成装置１００は、所定の編集者が利用する編集者端末から短縮タイトルと元となるタイトルとが対応付けられた要約一覧ＥＬ１１を取得済みであるものとする。図１に示す要約一覧ＥＬ１１は、図３に示す編集情報記憶部１２１に記憶される編集情報に対応し、各コンテンツについて、所定の編集者が作成した短縮タイトルと、そのコンテンツの元のタイトルとが対応付けられた情報である。具体的には、要約一覧ＥＬ１１は、所定のコンテンツのタイトルＡから短縮タイトルＡが作成され、所定のコンテンツのタイトルＢから短縮タイトルＢが作成され、所定のコンテンツのタイトルＣから短縮タイトルＣが作成されたことを示す。なお、図１の例では、説明を簡単にするために要約一覧ＥＬ１１には、短縮タイトルに対応付けられたコンテンツの記事自体が含まれてもよい。

まず、生成装置１００は、要約一覧ＥＬ１１を用いた学習により、要約一覧ＥＬ１１から要約生成モデルＭ１１（以下、単に「モデルＭ１１」ともいう）を生成する（ステップＳ１１）。例えば、生成装置１００は、要約一覧ＥＬ１１に示す情報を編集情報記憶部１２１（図３参照）から取得し、要約生成モデルＭ１１を学習する。このように、図１の例では、生成装置１００は、要約一覧ＥＬ１１に含まれる所定の編集者が作成した短縮タイトルとその元となるタイトルの組み合わせを用いて、要約生成モデルＭ１１を学習する。例えば、生成装置１００は、要約一覧ＥＬ１１に含まれる所定の編集者が作成した短縮タイトルとその元となるタイトルの組み合わせを正例として、所定のタイトル等の文字情報が入力された場合に短縮タイトルを出力する要約生成モデルＭ１１を学習する。

また、生成装置１００は、学習により生成した要約生成モデルＭ１１をモデル情報記憶部１２２（図４参照）に記憶する。例えば、生成装置１００は、要約一覧ＥＬ１１に含まれる元タイトルや短縮タイトルに基づいて、リカレントニューラルネットワークや係り受け解析等の種々の従来技術を適宜用いて、要約生成モデルＭ１１を学習する。なお、要約生成モデルＭ１１は、例えばコンテンツのタイトルや記事の入力に対して、所定の文字数以内の短縮タイトルを生成するためのモデルであるが、要約生成モデルＭ１１の詳細については後述する。

そして、生成装置１００は、端末装置１０−１からコンテンツＣＴ１１を取得する（ステップＳ１２）。なお、ここでいうコンテンツＣＴ１１とは、コンテンツＩＤ「ＣＴ１１」により識別されるコンテンツに対応する。図１の例では、生成装置１００は、ステップＳ１２において、端末装置１０−１からコンテンツＣＴ１１の記事やタイトルや画像ＩＭ１１（図６参照）等の種々のコンテンツ関連情報を取得する。すなわち、生成装置１００は、複数の要約候補を生成する対象となる文字情報であるタイトルと、そのタイトルに関連するコンテンツ関連情報である記事や画像等を取得する。なお、生成装置１００は、コンテンツ関連情報として、コンテンツに関する情報であればどのような情報を取得してもよく、例えば、コンテンツＣＴ１１のカテゴリやトピック等の情報を取得してもよい。また、例えば、生成装置１００は、端末装置１０−１から要約候補として短縮タイトルを生成する際の文字数の指定を取得してもよい。

図１では、例えば、生成装置１００は、複数の要約候補を生成する文字情報として「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」というタイトルを取得する。また、生成装置１００は、タイトルに関連するコンテンツ関連情報として、「X月Y日、全国ネットの放送局Zは、来月．．．」といった内容の記事を取得する。

例えば、生成装置１００は、コンテンツＣＴ１１に含まれる記事やタイトルや画像ＩＭ１１に基づいてコンテンツＣＴ１１のカテゴリを推定してもよい。また、例えば、生成装置１００は、コンテンツＣＴ１１に含まれる記事やタイトルや画像ＩＭ１１に基づいてトピックを抽出してもよい。なお、生成装置１００は、トピック分析（解析）等の種々の従来手法を適宜用いて、コンテンツＣＴ１１の記事等からトピックを抽出してもよい。例えば、生成装置１００は、コンテンツＣＴ１１の記事を形態素解析等の自然言語処理技術を適宜用いて解析することにより、コンテンツＣＴ１１の記事から重要なキーワードをコンテンツＣＴ１１のトピックとして抽出してもよい。なお、図１の例では、コンテンツ関連情報ＣＩＮＦ１１に示すように、コンテンツＣＴ１１のカテゴリが「芸能」であり、トピックが「ドラマ」や「アイドル」であるものとして、以下説明する。

生成装置１００は、コンテンツＣＴ１１のタイトルの短縮タイトルの候補として複数の要約候補（短縮タイトル）を生成する（ステップＳ１３）。例えば、生成装置１００は、複数の要約候補の多様性に関する情報に基づいて、短縮タイトルリストＬＴ１１に示すような短縮タイトルＡＴ１１−１〜ＡＴ１１−３等を生成する。なお、ここでいう短縮タイトルＡＴ１１−１とは、ＩＤ「ＡＴ１１−１」により識別される短縮タイトルに対応する。

ここで、生成装置１００は、短縮タイトルを生成するために要約生成モデルＭ１１を用いる。例えば、生成装置１００は、要約生成モデルＭ１１を用いて各単語の各位置におけるスコアを算出する。例えば、生成装置１００は、以下の式（１）により各位置における各単語のスコアを算出する。

Ｗ＿ｘのスコア＝Ｐ（Ｗ＿ｘ｜Ｗ＿｛１｝＾｛ｘ−１｝，ＩＮＰＵＴ）・・・（１）

上記式（１）では、「Ｗ＿ｘ」は、任意の単語を示す。また、上記式（１）では、「Ｗ＿｛１｝＾｛ｘ−１｝」は、単語「Ｗ＿ｘ」よりも前の１〜ｘ−１番目までの単語を示す。このように、上記式（１）では、推定しようとする文字（単語「Ｗ＿ｘ」）より前に出力した単語すべてを条件とする。また、「Ｗ＿ｘ」の「ｘ」と、「Ｗ＿｛１｝＾｛ｘ−１｝」の「ｘ−１」とは、対応する単語の位置関係を示し、「Ｗ＿｛ｘ−１｝」は「Ｗ＿ｘ」の直前に位置する単語となる。すなわち、「Ｗ＿ｘ」は「Ｗ＿｛ｘ−１｝」に続く単語を意味する。

上記式（１）の右辺中の「ＩＮＰＵＴ」は、例えばモデルＭ１１の入力となる文字列を示す。例えば、図１の例では、コンテンツＣＴ１１のタイトル等が入力となる。なお、「Ｗ＿ｘ」に対応する単語と、「Ｗ＿｛ｘ−１｝」に対応する単語とは異なる単語であってもよいし、同じ単語であってもよい。また、単語は、入力「ＩＮＰＵＴ」に含まれる単語に限らず、種々の単語であってもよい。例えば、単語「Ｗ」は、入力に含まれる単語の省略形や略語やニックネーム等であってもよい。また、ここでいう単語には、形態素、文字（ひらがな、カタカナ、漢字１文字）等も含まれてもよい。

例えば、Ｗ＿ｘのスコアは、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、任意の単語「Ｗ＿｛ｘ−１｝」の次に「Ｗ＿ｘ」に遷移する確率に対応するスコアとなる。例えば、Ｗ＿ｘのスコアは、事後確率に基づくスコアであってもよい。このように、上記式（１）の右辺中の「Ｐ」は、任意の文字列「ＩＮＰＵＴ」に応じて所定のスコアを返す関数である。

例えば、１つ目に位置する任意の単語「Ｗ１」のスコアは、以下のような式（２）により算出される。

Ｗ１のスコア＝Ｐ（Ｗ１｜＜Ｓ＞，ＩＮＰＵＴ）・・・（２）

上記式（２）において、右辺中の「＜Ｓ＞」は、先頭を示す記号である。すなわち、上記式（２）の右辺中の「Ｐ」は、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、任意の単語「Ｗ１」が先頭に出現する確率に対応するスコアを返す関数である。

例えば、下記の式（３）は、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、単語「A」が先頭に出現する確率に対応するスコアを示す。なお、ここでいう「A」は、アイドルグループ名であるものとする。この場合、任意の文字列「ＩＮＰＵＴ」は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」であるものとする。

Ｗ１（“A”）のスコア＝Ｐ（A｜＜Ｓ＞，ＩＮＰＵＴ）・・・（３）

また、例えば、下記の式（４）は、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、単語「○村○郎」へ単語「A」の次に遷移する確率に対応するスコアを示す。この場合、任意の文字列「ＩＮＰＵＴ」は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」であるものとする。

Ｗ２（“○村○郎”）のスコア＝Ｐ（○村○郎｜A，ＩＮＰＵＴ）・・・（４）

なお、上記式（４）では、説明を簡単にするために、Ｗ２のスコアの算出にＷ１のスコアを用いない場合を示すが、Ｗ１のスコアを加算したり、乗算したりしたＷ２のスコアを算出してもよい。すなわち、Ｗ２のスコアは、Ｗ１のスコアの影響を加味したスコアであってもよい。

上述したような、例えば、任意の文字列「ＩＮＰＵＴ」中のすべての単語で展開した木構造は、各単語をノードとする木構造（図９中の「木構造ＳＴ１１」参照。以下同じ）により示される。このように、生成装置１００は、上記式（３）や（４）等の例に示すように、各単語の条件付き確率に基づくスコアを算出し、そのスコアに基づいて単語をつなげることにより、短縮タイトルを生成する。例えば、図９に示すような木構造ＳＴ１１の所定の系列（経路）に対応するノード（単語）のスコアの合計が最大の経路の単語をつなげて短縮タイトルを生成してもよい。

また、図１の例では、コンテンツＣＴ１１の短縮タイトルの表示先やユーザＵ１による指定等により、短縮タイトルの文字数の上限値が決定されているものとする。例えば、短縮タイトルの文字数の上限値は、「全角１３」文字とする。

例えば、生成装置１００は、文字数の上限値「全角１３」を満たす木構造中の経路のうち、スコアが最大の経路を短縮タイトルとする。例えば、生成装置１００は、木構造の所定の経路に対応する単語をつなげた文字列にあるノードを加えることにより、文字数が上限値を超えた場合、そのノードへの探索を行なわず、そのノードより先の経路の探索を終了してもよい。また、生成装置１００は、ビーム探索等の種々の従来技術を適宜用いて、探索範囲の増大を抑制するが詳細は後述する。

ここで、図１に示す例では、生成装置１００は、コンテンツ関連情報を加味したスコアを算出する。例えば、生成装置１００は、ステップＳ１２において取得したユーザＵ１のユーザ関連情報を加味したスコアを算出する。例えば、生成装置１００は、以下の式（５）を用いてコンテンツ関連情報を加味したスコアを算出する。

Ｗ＿ｘのスコア＝Ｐ（Ｗ＿ｘ｜Ｗ＿｛１｝＾｛ｘ−１｝，ＩＮＰＵＴ）＊Ｃ（Ｗｘ｜Ｗ＿｛１｝＾｛ｘ−１｝，Ｃｏｎｔｅｎｔｓ）・・・（５）

上記式（５）の右辺中の「Ｃ」は、文字情報に関連するコンテンツ関連情報「Ｃｏｎｔｅｎｔｓ」に基づいて短縮タイトルを生成する場合において、任意の単語「Ｗ＿｛ｘ−１｝」の次に「Ｗ＿ｘ」へ遷移する確率に対応するスコアを返す関数となる。例えば、上記式（５）の右辺中の「Ｃ」は、事後確率に基づくスコアを返す関数であってもよい。このように、上記式（５）の右辺中の「Ｃ」は、文字情報に関連するコンテンツ関連情報「Ｃｏｎｔｅｎｔｓ」に応じて所定のスコアを返す関数である。コンテンツ関連情報「Ｃｏｎｔｅｎｔｓ」は、コンテンツのカテゴリやトピック等の種々の情報が含まれてもよい。なお、上記式（５）は、Ｗ＿ｘのスコアを算出する一例であり、生成装置１００は、加算する等、種々の方法によりＷ＿ｘのスコアを算出してもよい。例えば、生成装置１００は、下記の式（６）を用いて、Ｗ＿ｘのスコアを算出してもよい。例えば、下記の式（６）中の関数「ｆ」は、関数「Ｐ」の値や関数「Ｃ」の値を合算したりする等、関数「Ｐ」の値や関数「Ｃ」の値を用いて所定のスコアを算出する関数である。

Ｗ＿ｘのスコア＝ｆ（Ｐ（Ｗ＿ｘ｜Ｗ＿｛１｝＾｛ｘ−１｝Ｗｘ−１，ＩＮＰＵＴ），Ｃ（Ｗｘ｜Ｗ＿｛１｝＾｛ｘ−１｝Ｗｘ−１，Ｃｏｎｔｅｎｔｓ））・・・（６）

例えば、下記の式（７）は、コンテンツがコンテンツＣＴ１１である場合のコンテンツ関連情報「ＣＩＮＦ１１」に基づいて短縮タイトルを生成する場合において、単語「A」が先頭に出現する確率に対応するスコアを示す。この場合、任意の文字列「ＩＮＰＵＴ」は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」であるものとする。

Ｗ１（“A”）のスコア＝Ｐ（A｜＜Ｓ＞，ＩＮＰＵＴ）＊Ｃ（A｜＜Ｓ＞，ＣＩＮＦ１１）・・・（７）

上記式（７）により、コンテンツがコンテンツＣＴ１１であり、任意の文字列「ＩＮＰＵＴ」を入力として要約（短縮タイトル）を生成する場合において、単語「A」が先頭に出現する確率に対応するスコアを示す。例えば、図９中に示す例では、単語「A」が先頭に出現する確率に対応するスコアは「０．６２」となる。また、例えば、図９中に示す例では、単語「○村○郎」が先頭に出現する確率に対応するスコアは「０．６」となる。

ここで、生成装置１００は、コンテンツＣＴ１１のタイトルに含まれる単語の類似単語を木構造のノードとして追加する。図１の例では、生成装置１００は、類似単語情報記憶部１２３に記憶された類似単語に関する情報に基づいて、要約の生成対象となるタイトルに含まれる単語の類似単語を木構造のノードとして追加する。詳細は後述するが、ここでいう類似単語には、単語の品詞や内容等に応じて、同義語や類義語等が含まれるものとする。また、図１の例では、説明を簡単にするために、単語「○村○郎」の類似単語のみが追加される場合を示す。図１中の類似単語情報記憶部１２３に示すように、例えば、単語「○村○郎」の意味は「アイドルグループAのメンバー」であり、その類似単語には、「××」や「○村」等が含まれるものとする。なお、「××」は、愛称（略称）であり、「○村」は、「○村○郎」の苗字「○村」に対応する。このように、単語「○村○郎」の類似単語には、「○村○郎」の同義語が含まれる。

ここで、単語「○村○郎」の類似単語である「××」や「○村」をノードとして追加した木構造は、図１０中の木構造ＳＴ１２により示される。このように、各単語の類似単語を追加した木構造を探索することにより、生成装置１００は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」の短縮タイトルを生成する。

なお、生成装置１００は、単語「○村○郎」の類似単語「××」や「○村」が先頭に出現する確率に対応するスコアを単語「○村○郎」に基づいて決定する。図１０に示す例では、生成装置１００は、単語「○村○郎」の類似単語「××」や「○村」が先頭に出現する確率に対応するスコアを単語「○村○郎」のスコア「０．６」を「０．０１」小さくした「０．５９」に決定する。なお、生成装置１００は、単語のスコアを類似単語のスコアとしてもよいし、種々の条件に基づいて類似単語のスコアを決定してもよい。

上述したように、図１の例では、短縮タイトルの文字数の上限値は「全角１３」文字であり、生成装置１００は、文字数の上限値「全角１３」を満たす木構造ＳＴ１２（図１０参照）中の経路のうち、スコアが最大の経路を短縮タイトルとする。例えば、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する木構造ＳＴ１２を探索することにより、全角１３文字以内で最大のスコアとなる経路に対応する単語をつなげた文字列を短縮タイトルとして生成する。

例えば、図１の短縮タイトルリストＬＴ１１に示すように、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する短縮タイトルＡＴ１１−１を生成する。具体的には、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する「○村○郎 7月期ドラマ主演」とする短縮タイトルＡＴ１１−１を生成する。なお、図１０に示すように、単語「○村○郎」が先頭に出現する確率に対応するスコア「０．６」よりも、単語「A」が先頭に出現する確率に対応するスコア「０．６２」の方が大きいが、「A」が先頭となる短縮タイトルの経路のスコアよりも「○村○郎」が先頭になる短縮タイトルＡＴ１１−１の経路のスコアの方が高いため、生成装置１００は、短縮タイトルＡＴ１１−１を生成する。

このように、生成装置１００は、短縮タイトルＡＴ１１−１として、全角１１文字、半角２文字を含む文字列を生成する。例えば、半角を全角の「０．５」文字分とした場合、短縮タイトルＡＴ１１−１の文字数は、「１２」となる。このように、生成装置１００は、全角１３文字以内を満たす短縮タイトルＡＴ１１−１を生成する。上記例では、半角２文字が全角１文字に対応し各文字の横幅が変動しないフォントである場合を例示したが、生成装置１００は、各文字に応じて横幅が変動するフォントである場合、各文字に応じて数値を変動させてもよい。

短縮タイトルＡＴ１１−１を生成した後、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する２つ目の短縮タイトルＡＴ１１−２を生成する。このとき、生成装置１００は、要約候補（短縮タイトル）間の多様性に関する情報に基づいて、短縮タイトルＡＴ１１−２を生成する。例えば、生成装置１００は、短縮タイトルＡＴ１１−１に含まれる単語のスコアを低下させる。これにより、生成装置１００は、生成した短縮タイトルＡＴ１１−１に含まれる単語が短縮タイトルＡＴ１１−２に含まれる可能性を低下させることにより、短縮タイトルＡＴ１１−１に含まれる単語以外の単語を含む短縮タイトルが生成される可能性を高めることができる。したがって、生成装置１００は、多様な単語（情報）を含む複数の要約候補を生成することができる。図１及び図１１の例では、説明を簡単にするために、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」のスコアと単語「ドラマ」のスコアが「０．２」だけ減少された場合を示す。具体的には、生成装置１００は、単語「○村○郎」が先頭に出現する確率に対応するスコアを「０．４」に低下させ、単語「○村○郎」が２つ目に出現する確率に対応するスコアを「０．２」に低下させ、単語「ドラマ」が先頭に出現する確率に対応するスコアを「０．３８」に低下させる。なお、単語「ドラマ」が２つ目に出現する確率に対応するスコアや単語「○村○郎」や単語「ドラマ」が３つ目以降に出現する確率に対応するスコアは図示を省略する。

また、生成装置１００は、上記のようなスコアの低下に限らず、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」のスコアや単語「ドラマ」のスコアを例えば５０％減少させる等、所定の割合だけ低下させたりしてもよい。また、生成装置１００は、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」や単語「ドラマ」を木構造のノードから除いてもよい。例えば、生成装置１００は、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」を木構造の１つ目に位置する任意の単語「Ｗ１」に対応するノードから除いてもよい。この場合、生成装置１００は、単語「○村○郎」が先頭に位置する複数の要約候補が生成されることを抑制することができる。

ここで、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」が先頭に出現する確率に対応するスコアを「０．４」に低下させ、単語「○村○郎」が２つ目に出現する確率に対応するスコアを「０．２」に低下させ、単語「ドラマ」が先頭に出現する確率に対応するスコアを「０．３８」に低下させた木構造は、図１１中の木構造ＳＴ１３により示される。このように、生成した短縮タイトルＡＴ１１−１に含まれる単語のスコアを低下させたり除外したりした木構造を探索することにより、生成装置１００は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」の２つ目の短縮タイトルＡＴ１１−２を生成する。

上述したように、図１の例では、短縮タイトルの文字数の上限値は「全角１３」文字であり、生成装置１００は、文字数の上限値「全角１３」を満たす木構造ＳＴ１３（図１１参照）中の経路のうち、スコアが最大の経路を短縮タイトルとする。例えば、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する木構造ＳＴ１３を探索することにより、全角１３文字以内で最大のスコアとなる経路に対応する単語をつなげた文字列を短縮タイトルとして生成する。

例えば、図１の短縮タイトルリストＬＴ１１に示すように、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する２つ目の短縮タイトルＡＴ１１−２を生成する。具体的には、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する「×× 土曜△時のドラマ決定」とする短縮タイトルＡＴ１１−２を生成する。このように、生成装置１００は、短縮タイトルＡＴ１１−２として、全角１２文字、半角１文字を含む文字列を生成する。例えば、半角を全角の「０．５」文字分とした場合、短縮タイトルＡＴ１１−２の文字数は、「１２．５」となる。このように、生成装置１００は、全角１３文字以内を満たす短縮タイトルＡＴ１１−２を生成する。

短縮タイトルＡＴ１１−２を生成した後、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する３つ目の短縮タイトルＡＴ１１−３を生成する。このとき、生成装置１００は、要約候補（短縮タイトル）間の多様性に関する情報に基づいて、短縮タイトルＡＴ１１−３を生成する。例えば、生成装置１００は、短縮タイトルＡＴ１１−２に含まれる単語のスコアを低下させる。これにより、生成装置１００は、生成した短縮タイトルＡＴ１１−１、ＡＴ１１−２に含まれる単語が短縮タイトルＡＴ１１−３に含まれる可能性を低下させることにより、短縮タイトルＡＴ１１−１、ＡＴ１１−２に含まれる単語以外の単語を含む短縮タイトルが生成される可能性を高めることができる。

図１及び図１２の例では、説明を簡単にするために、短縮タイトルＡＴ１１−２に含まれる単語「××」や単語「土曜△時」のスコアが「０．２」だけ減少され、短縮タイトルＡＴ１１−１、ＡＴ１１−２の両方に含まれる単語「ドラマ」が「０．１」だけ減少された場合を示す。具体的には、生成装置１００は、単語「××」が先頭に出現する確率に対応するスコアを「０．３９」に低下させ、単語「ドラマ」が先頭に出現する確率に対応するスコアを「０．２８」に低下させ、単語「××」が２つ目に出現する確率に対応するスコアを「０．１９」に低下させる。

なお、単語「××」が３つ目以降に出現する確率に対応するスコアや、単語「ドラマ」が２つ目以降に出現する確率に対応するスコアや、単語「土曜△時」が先頭や２つ目以降に出現する確率に対応するスコアは図示を省略する。上述のように、単語「ドラマ」は、短縮タイトルＡＴ１１−１と合わせて２回目の出現であるため、「０．２」の半分の「０．１」だけスコアを減少させる。このように、生成装置１００は、短縮タイトルにおける単語の出現回数等に応じてスコアを低下させる量を変動させてもよい。

ここで、短縮タイトルＡＴ１１−２に含まれる単語「××」が先頭に出現する確率に対応するスコアを「０．３９」に低下させ、単語「ドラマ」が先頭に出現する確率に対応するスコアを「０．２８」に低下させ、単語「××」が２つ目に出現する確率に対応するスコアを「０．１９」に低下させた木構造は、図１２中の木構造ＳＴ１４により示される。このように、生成した短縮タイトルＡＴ１１−２に含まれる単語のスコアを低下させたり除外したりした木構造を探索することにより、生成装置１００は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」の３つ目の短縮タイトルＡＴ１１−３を生成する。

上述したように、図１の例では、短縮タイトルの文字数の上限値は「全角１３」文字であり、生成装置１００は、文字数の上限値「全角１３」を満たす木構造ＳＴ１４（図１２参照）中の経路のうち、スコアが最大の経路を短縮タイトルとする。例えば、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する木構造ＳＴ１４を探索することにより、全角１３文字以内で最大のスコアとなる経路に対応する単語をつなげた文字列を短縮タイトルとして生成する。

例えば、図１の短縮タイトルリストＬＴ１１に示すように、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する３つ目の短縮タイトルＡＴ１１−３を生成する。具体的には、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する「A○村の土△ 7月スタート」とする短縮タイトルＡＴ１１−３を生成する。なお、単語「土△」は、単語「土曜△時」の類似単語であるものとし、木構造ＳＴ１２〜ＳＴ１４にノードとして追加されているものとする。このように、生成装置１００は、短縮タイトルＡＴ１１−３として、全角１０文字、半角３文字を含む文字列を生成する。例えば、半角を全角の「０．５」文字分とした場合、短縮タイトルＡＴ１１−３の文字数は、「１１．５」となる。このように、生成装置１００は、全角１３文字以内を満たす短縮タイトルＡＴ１１−３を生成する。

その後、生成装置１００は、生成した複数の短縮タイトルの候補を端末装置１０に提供する（ステップＳ１４）。具体的には、生成装置１００は、短縮タイトルリストＬＴ１１に示すような短縮タイトルＡＴ１１−１〜ＡＴ１１−３等を端末装置１０へ提供する。

上述したように、生成装置１００は、要約生成モデルＭ１１や文字情報に対応するコンテンツ関連情報に基づいて文字情報から複数の短縮タイトルを生成する。上記の例では、生成装置１００は、要約生成モデルＭ１１とコンテンツＣＴ１１のコンテンツ関連情報ＣＩＮＦ１１とに基づいて、コンテンツＣＴ１１のタイトルから複数の短縮タイトルを生成する。そして、生成装置１００は、生成した複数の短縮タイトルを短縮タイトルの候補として編集者が利用する端末装置１０へ送信する。複数の短縮タイトルの候補を受信した編集者は、複数の短縮タイトルの候補の中から適切な短縮タイトルを選択したり、選択した短縮タイトルをさらに編集したりすることにより、適切な短縮タイトルを作成することができる。これにより、生成装置１００は、文字情報と、文字情報に関連するコンテンツ関連情報に基づいて、文字情報の要約の候補として複数の要約候補を生成することにより、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

なお、上記例では、生成装置１００が１３文字以内の短縮タイトルを生成する例を示したが、生成装置１００は、目的に応じて種々の要約を生成してもよい。例えば、生成装置１００は、複数行に亘る短縮タイトル（要約）を生成してもよい。また、生成装置１００は、上記に限らず種々の情報を適宜用いて短縮タイトルを生成してもよい。例えば、生成装置１００は、短縮タイトルの提供先となるユーザのユーザ関連情報を用いて短縮タイトルを生成してもよい。また、例えば、生成装置１００は、編集者の年齢性別に基づいて、短縮タイトルの候補を生成してもよい。例えば、生成装置１００は、年齢や性別等の属性情報に関するパラメータを含むモデルに基づいて、短縮タイトルの候補を生成してもよい。

また、例えば、生成装置１００は、提供した短縮タイトルの候補に対する編集者の選択に関する情報に基づいて、短縮タイトルの候補を生成してもよい。また、例えば、生成装置１００は、提供した短縮タイトルの候補に対する編集者の選択に関する情報に基づいて、モデルを学習してもよい。また、例えば、生成装置１００は、女性誌・男性誌等のデータを用いてモデルを学習してもよい。また、例えば、生成装置１００は、属性等ごとに生成したモデルを用いて女性向けサイト、男性向けサイト用の短縮タイトルを生成してもよい。これにより、生成装置１００は、各属性に属するユーザに好まれやすい短縮タイトルを生成することができる。

例えば、生成装置１００は、ユーザ関連情報として、ユーザの年齢や居住地等の属性情報を用いて短縮タイトルを生成してもよい。また、例えば、生成装置１００は、ユーザ関連情報として、ユーザが利用する端末装置１０の型番や、画面サイズや、設定されたフォント等の端末情報を用いて短縮タイトルを生成してもよい。また、例えば、生成装置１００は、ユーザ関連情報として、ユーザの位置情報や、加速度情報や、コンテキスト情報を取得する。なお、ユーザ関連情報は、ユーザに関連する情報であればどのような情報であってもよい。例えば、ユーザ関連情報は、ユーザの脳波や心拍数や、推定された感情の情報などであってもよい。また、コンテキストは、長期休暇中や旅行中や電車内など、粒度によって複数に分けても良い。また、ここでいうユーザ関連情報は、ユーザを取り巻く環境等の種々の情報が含まれてもよく、天気、気温、湿度、イベント、株価、当日のニュースなど、種々の情報が含まれてもよい。

また、ここでいうコンテキストは、ユーザやユーザが利用する端末装置１０の状況やユーザやユーザが利用する端末装置１０の環境（背景）を意味する。例えば、コンテキストは、ユーザによって端末装置１０が使われている状況や、端末装置１０を所持するユーザが置かれている状態に対応する情報である。すなわち、図１におけるコンテキストは、ユーザの状況、例えばユーザがいる場所の環境に対応する。

また、生成装置１００は、１文字の横幅スコアも加味して、短縮タイトルを生成してもよい。例えば、生成装置１００は、半角アルファベットの「m」や「w」は１文字とし、それ以外の半角アルファベットは０．５文字とする横幅スコアも加味して、短縮タイトルを生成してもよい。また、例えば、生成装置１００は、全角アルファベットを含む単語（例えば、アイドルグループ名「Ａ」）と、その単語と同じ意味に対応する半角アルファベットを含む単語（例えば、アイドルグループ名「A」）とがある場合、半角アルファベットを含む単語が全角アルファベットを含む単語のスコアよりも高くなるように、スコアを算出してもよい。

上述したように、類似単語には、単語の品詞や内容等に応じて、同義語や類義語等が含まれてもよい。例えば、生成装置１００は、単語の品詞や内容等に応じて、その同義語や類義語等を類似単語情報記憶部１２３に記憶してもよい。また、例えば、類似単語には、単語の上位概念や下位概念の単語が含まれてもよい。例えば、単語が名詞の場合は、同義語が含まれてもよい。例えば、単語が人の名前の場合は、その人の愛称や略称等が含まれてもよい。また、例えば、単語が人の名前「□山□子」であり、「□山□子」が所定のグループＸに属する人の名前の場合は、単語「□山□子」の類似単語には、「グループＸのメンバー」等が含まれてもよい。このように、単語「□山□子」の類似単語には、単語「□山□子」の上位概念に相当する単語が含まれてもよい。また、例えば、単語が動詞の場合は、類義語が含まれてもよい。図１に示す例において、単語「決定」の類似単語には、「確定」や「決まった」や「大抜擢」等の種々の単語が含まれてもよい。このように、各単語の類似単語には、単語の品詞や内容等に応じて、種々の単語等が含まれてもよい。

また、上述した例では、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」のスコアや単語「ドラマ」のスコアのみを低下させる例を示したが、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」のスコアや単語「ドラマ」と類似する単語のスコアを低下させたり、ノードから除外したりしてもよい。例えば、生成装置１００は、分散表現等の種々の従来技術を適宜用いて、生成した短縮タイトルに含まれる単語に類似する単語のスコアを低下させたり、ノードから除外したりしてもよい。例えば、生成装置１００は、生成した短縮タイトルに含まれる単語との分散表現における類似度が所定の閾値以上の単語のスコアを下げたりノードから除外したりしてもよい。例えば、生成装置１００は、単語「連ドラ」が木構造のノードに含まれ、生成した短縮タイトルＡＴ１１−１に含まれる単語「ドラマ」との分散表現における類似度が所定の閾値以上である場合、単語「連ドラ」のスコアを下げたり、単語「連ドラ」に対応するノードを除外したりしてもよい。なお、上記は一例であり、生成装置１００は、目的に応じて種々の処理を行ってもよい。例えば、生成装置１００は、木構造におけるパス選択時に、分散表現で類似度が高い単語のスコアを下げたり、一度通った探索パスのスコアを下げたりしてもよい。

また、上述した例では、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」のスコアや単語「ドラマ」のスコアのみを低下させる例を示したが、短縮タイトルＡＴ１１−１に含まれる単語の類似単語も同様にスコアを低下させたり、ノードから除外したりしてもよい。例えば、生成装置１００は、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」の類似単語「××」や「○村」のスコアを「０．２」だけ減少させてもよい。具体的には、生成装置１００は、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」の類似単語「××」のスコアを「０．３９」に低下させ、類似単語「○村」のスコアを「０．３９」に低下させてもよい。

また、例えば、生成装置１００は、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」の類似単語「××」や「○村」のスコアを単語「○村○郎」の半分「０．１」だけ減少させてもよい。具体的には、生成装置１００は、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」の類似単語「××」のスコアを「０．４９」に低下させ、類似単語「○村」のスコアを「０．４９」に低下させてもよい。このように、類似単語も含めてスコアを低下させる場合、生成装置１００は、同じ意味に対応する単語が複数の要約候補に多く出現することを抑制することができる。

また、生成装置１００は、上記に限らず、目的に応じて種々のモデルを学習してもよい。例えば、生成装置１００は、文書から文書、文書から最初の段落、文書から最初の文、文書からタイトル、文書から既存の短縮タイトル、最初の段落から最初の段落、最初の段落から最初の文等の対応関係に基づいてモデルを事前学習してもよい。また、生成装置１００は、一般文書を用いて事前学習してもよい。例えば、生成装置１００は、生成システム１における要約生成の対象となるコンテンツに限らず、Ｗｅｂ上の一般文書等の種々のコンテンツ（情報）を用いて学習してもよい。例えば、生成装置１００は、一般文書から一般文書、一般文書からタイトル等の対応関係に基づいて、要約生成モデルを事前学習（プリトレーニング）してもよい。

〔２．生成装置の構成〕
次に、図２を用いて、実施形態に係る生成装置１００の構成について説明する。図２は、実施形態に係る生成装置１００の構成例を示す図である。図２に示すように、生成装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、生成装置１００は、生成装置１００の管理者等から各種操作を取得する入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続され、端末装置１０や提供元装置や編集者端末との間で情報の送受信を行う。

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図２に示すように、編集情報記憶部１２１と、モデル情報記憶部１２２と、類似単語情報記憶部１２３と、コンテンツ関連情報記憶部１２４とを有する。

（編集情報記憶部１２１）
実施形態に係る編集情報記憶部１２１は、編集に関する各種情報（以下、「編集情報」ともいう）を記憶する。例えば、編集情報記憶部１２１は、所定の編集者により作成された短縮タイトルとその元となるタイトルに関する各種情報を記憶する。図３に、実施形態に係る編集情報記憶部１２１の一例を示す。図３に示す編集情報記憶部１２１は、「編集ＩＤ」、「元タイトル」、「短縮タイトル」といった項目を有する。

「編集ＩＤ」は、元タイトルと短縮タイトルとの組み合わせを識別するための識別情報を示す。また、「元タイトル」は、所定の編集者が短縮タイトルを作成する際に元となったコンテンツのタイトルを示す。また、「短縮タイトル」は、対応する元タイトルから作成された短縮タイトルを示す。

例えば、図３に示す例において、編集ＩＤ「ＥＤ１１」により識別される編集情報は、元タイトルが「タイトルＡ」であり、短縮タイトルが「短縮タイトルＡ」であることを示す。また、例えば、図３に示す例において、編集ＩＤ「ＥＤ１２」により識別される編集情報は、元タイトルが「タイトルＢ」であり、短縮タイトルが「短縮タイトルＢ」であることを示す。

なお、編集情報記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、編集情報記憶部１２１は、所定の編集者が短縮タイトルを作成する際に元となったコンテンツの記事に関する情報を記憶してもよい。また、編集情報記憶部１２１は、所定の編集者が作成した短縮タイトルとその元となったコンテンツに関する情報に限らず、生成装置１００が生成した短縮タイトルとその元となったコンテンツに関する情報を記憶してもよい。例えば、編集情報記憶部１２１は、正例とする短縮タイトルと負例とする短縮タイトルとを識別する情報を、各短縮タイトルに関連付けて記憶してもよい。すなわち、編集情報記憶部１２１は、提供先のユーザにより選択された短縮タイトルを正例とし、提供先のユーザにより選択されなかった短縮タイトルを負例として記憶してもよい。生成装置１００は、正例となる短縮タイトル、及び負例となる短縮タイトルを含む編集情報を用いて学習することにより、より精度よく要約（短縮タイトル）を生成するモデルを学習することができる。

（モデル情報記憶部１２２）
実施形態に係るモデル情報記憶部１２２は、学習に関する情報を記憶する。例えば、モデル情報記憶部１２２は、生成処理により生成されたモデル情報を記憶する。図４は、実施形態に係るモデル情報記憶部の一例を示す図である。図４に示すモデル情報記憶部１２２は、モデル情報として、各モデルＭ１１等に対応させて「パラメータ１」〜「パラメータ３」等といった項目を有する。

例えば、図４に示す例において、モデルＭ１１に関するモデル情報は、パラメータ１の重み（係数）が「０．５」、パラメータ２の重みが「−０．４」、パラメータ３の重みが「０．２」等であることを示す。例えば、モデルのパラメータがｍ次元のベクトルで表現される場合、パラメータ数はｍ個になり、パラメータ１〜パラメータｍの重み（係数）が記憶される。なお、パラメータの数は、ｍに限らず、種々の数に変動してもよい。また、上記モデル情報は一例であり、上述した要約の生成処理が実現できれば、モデル情報記憶部１２２には、どのようなモデル情報が記憶されてもよい。

なお、モデル情報記憶部１２２は、上記に限らず、目的に応じて種々のモデル情報を記憶してもよい。例えば、モデル情報記憶部１２２は、所定のユーザ分類ごとに生成されたモデルを記憶してもよい。例えば、モデル情報記憶部１２２は、ユーザの性別や年代等のユーザ分類ごとに生成されたモデルを記憶してもよい。また、例えば、モデル情報記憶部１２２は、ユーザが利用する端末装置に関する分類ごとに生成されたモデルを記憶してもよい。例えば、モデル情報記憶部１２２は、端末装置の型番や画面サイズ等の分類ごとに生成されたモデルを記憶してもよい。

（類似単語情報記憶部１２３）
実施形態に係る類似単語情報記憶部１２３は、類似単語に関する各種情報を記憶する。図５に、実施形態に係る類似単語情報記憶部１２３の一例を示す。図５に示す類似単語情報記憶部１２３は、「単語ＩＤ」、「単語」、「意味」、「類似単語」といった項目が含まれる。

「単語ＩＤ」は、単語を識別するための識別情報を示す。「単語」は、対応する単語ＩＤにより識別される単語を示す。「意味」は、対応する単語ＩＤにより識別される単語が示す内容（意味）を示す。「類似単語」は、対応する単語ＩＤにより識別される単語の類似単語を示す。

例えば、図５に示す例において、単語ＩＤ「ＷＤ１１」により識別される単語は、単語「○村○郎」であり、意味が「アイドルグループAのメンバー」であることを示す。単語ＩＤ「ＷＤ１１」により識別される単語「○村○郎」の類似単語には、「××」や「○村」等が含まれることを示す。

なお、類似単語情報記憶部１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（コンテンツ関連情報記憶部１２４）
実施形態に係るコンテンツ関連情報記憶部１２４は、コンテンツ（記事）に関する各種情報を記憶する。図６に、実施形態に係るコンテンツ関連情報記憶部１２４の一例を示す。図６に示すコンテンツ関連情報記憶部１２４は、「コンテンツＩＤ」、「記事」、「タイトル」、「画像」といった項目を有する。

「コンテンツＩＤ」は、コンテンツを識別するための識別情報を示す。「記事」は、コンテンツの記事を示す。「タイトル」は、コンテンツのタイトルを示す。「画像」は、コンテンツの画像を示す。図６では「画像」に「ＩＭ１１」といった概念的な情報が格納される例を示したが、実際には、画像情報、または、その格納場所を示すファイルパス名などが格納される。

例えば、図６に示す例において、コンテンツＩＤ「ＣＴ１１」により識別されるコンテンツ（図１中のコンテンツＣＴ１１に対応）の記事は、「X月Y日、全国ネットの放送局Zは、来月．．．」といった内容であることを示す。また、コンテンツＩＤ「ＣＴ１１」により識別されるコンテンツのタイトルは、「アイドルグループAの○村○郎、7月期スタートの土曜△時の新ドラマ□□の主演に決定」といった内容であることを示す。また、コンテンツＩＤ「ＣＴ１１」により識別されるコンテンツの画像は、画像ＩＭ１１であることを示す。

なお、コンテンツ関連情報記憶部１２４は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、コンテンツ関連情報記憶部１２４は、コンテンツを取得した日時やコンテンツが作成された日時に関する情報を記憶してもよい。コンテンツ関連情報記憶部１２４は、各提供元に関する情報やコンテンツのカテゴリやトピックに関する情報を記憶してもよい。

（制御部１３０）
図２の説明に戻って、制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵやＭＰＵ（Micro Processing Unit）等によって、生成装置１００内部の記憶装置に記憶されている各種プログラム（生成プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラ（controller）であり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図２に示すように、制御部１３０は、取得部１３１と、学習部１３２と、算出部１３３と、生成部１３４と、提供部１３５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。

（取得部１３１）
取得部１３１は、各種情報を取得する。例えば、取得部１３１は、外部の情報処理装置から情報を取得する。また、例えば、取得部１３１は、記憶部１２０から情報を取得する。また、取得部１３１は、端末装置１０からコンテンツを取得する。例えば、取得部１３１は、端末装置１０から取得したコンテンツをコンテンツ関連情報記憶部１２４に記憶する。

また、取得部１３１は、要約とその元となる情報とを対応付けた情報を取得する。図１では、取得部１３１は、所定の編集者が利用する編集者端末から短縮タイトルと元となるタイトルとが対応付けられた要約一覧ＥＬ１１を取得する。

また、取得部１３１は、文字情報と、文字情報に関連するコンテンツ関連情報とを取得する。例えば、取得部１３１は、所定のコンテンツに含まれるタイトルを文字情報として取得する。例えば、取得部１３１は、所定のコンテンツに含まれる記事を文字情報に関連するコンテンツ関連情報として取得する。

また、取得部１３１は、外部の情報処理装置から各種モデルを取得してもよい。例えば、取得部１３１は、外部の情報処理装置から要約生成モデルＭ１１等の種々のモデルを取得してもよい。なお、外部の情報処理装置から取得部１３１により要約生成に用いるモデルを取得する場合、生成装置１００は、学習部１３２を有しなくてもよい。

（学習部１３２）
学習部１３２は、各パラメータの重み（係数）を学習する。例えば、学習部１３２は、各種情報に基づいて学習によりモデルを生成する。例えば、学習部１３２は、第１文字情報と、第１文字情報の要約情報である第２文字情報とが対応付けられた情報によりモデルを学習する。図１では、学習部１３２は、要約一覧ＥＬ１１を用いた学習により、要約一覧ＥＬ１１から要約生成モデルＭ１１を生成する。

例えば、学習部１３２は、要約一覧ＥＬ１１に示す情報を編集情報記憶部１２１から取得し、要約生成モデルＭ１１を学習する。例えば、学習部１３２は、要約一覧ＥＬ１１に含まれる所定の編集者が作成した短縮タイトルとその元となるタイトルの組み合わせを用いて、要約生成モデルＭ１１を学習する。例えば、学習部１３２は、要約一覧ＥＬ１１に含まれる元タイトルや短縮タイトルに基づいて、リカレントニューラルネットワークや係り受け解析等の種々の従来技術を適宜用いて、要約生成モデルＭ１１を学習する。例えば、学習部１３２は、学習により生成した要約生成モデルＭ１１をモデル情報記憶部１２２に記憶する。例えば、学習部１３２は、以下のような疑似学習データを用いてモデルを学習してもよい。例えば、「Ａ駅の人身事故でＢ線が遅延」を係り受け解析して、他の要素は「Ｂ線が遅延」にかかるので、統計情報などを加味して、係り受け木から必要なさそうな部分木をカットして「人身事故でＢ線が遅延」などに要約した疑似学習データを用いる。例えば、このような疑似学習データは、種々の従来手法により生成することができる。そして、学習部１３２は、疑似学習データを用いて（ニューラルネットワーク）モデルを学習（プリトレーニング）した後、要約一覧ＥＬ１１等を用いて学習することにより、精度の高いモデルを生成することができる。

（算出部１３３）
算出部１３３は、文字情報から要約を生成するために用いるスコアを算出する。例えば、算出部１３３は、要約生成モデルＭ１１を用いて各単語の各位置におけるスコアを算出する。

例えば、算出部１３３は、上記式（５）により各位置における各単語のスコアを算出する。図１に示す例では、算出部１３３は、コンテンツ関連情報ＣＩＮＦ１１を加味したスコアを算出する。例えば、算出部１３３は、取得した文字情報であるコンテンツＣＴ１１のタイトルに関連するコンテンツ関連情報ＣＩＮＦ１１を加味したスコアを算出する。例えば、算出部１３３は、上記式（５）を用いてコンテンツＣＴ１１のタイトルに関連するコンテンツ関連情報ＣＩＮＦ１１を加味したスコアを算出する。

（生成部１３４）
生成部１３４は、文字情報の要約の候補として複数の要約候補を生成する。例えば、生成部１３４は、算出部１３３により算出されるスコアに基づいて、文字情報から複数の要約候補を生成する。例えば、生成部１３４は、取得部１３１により取得したコンテンツ関連情報に基づいて、取得部１３１により取得した文字情報の要約の候補として複数の要約候補を生成する。

例えば、生成部１３４は、複数の要約候補の多様性に関する情報に基づいて、複数の要約候補を生成する。生成部１３４は、複数の要約候補の多様性に関する情報である他の要約候補に含まれるか否かを示す情報により変動する各単語のスコアに基づいて算出される評価値（スコア）に応じて、要約候補を生成する。例えば、生成部１３４は、文字情報に含まれる単語と、その単語に類似する類似単語とを含む各単語のスコアに基づいて算出される評価値に基づいて、要約候補を生成する。生成部１３４は、第１の要約候補に含まれる単語のスコアを低下させた各単語のスコアに基づいて算出される評価値に基づいて、第２の要約候補を生成する。

また、例えば、生成部１３４は、コンテンツ関連情報とモデルとに基づいて算出されるスコアに基づいて、文字情報から要約情報を生成してもよい。例えば、生成部１３４は、コンテンツ関連情報により学習されたモデルに基づいて、文字情報から要約情報を生成する。例えば、生成部１３４は、第１文字情報と、第１文字情報の要約情報である第２文字情報とが対応付けられた情報により学習されたモデルに基づいて、文字情報の要約の候補として複数の要約候補を生成してもよい。

また、例えば、生成部１３４は、要約一覧ＥＬ１１を用いた学習により、要約一覧ＥＬ１１からモデルＭ１１を生成する。図１の例では、生成部１３４は、コンテンツＣＴ１１のタイトルの短縮タイトルの候補として複数の短縮タイトル候補を生成する。例えば、生成部１３４は、複数の要約候補の多様性に関する情報に基づいて、短縮タイトルリストＬＴ１１に示すような短縮タイトルＡＴ１１−１〜ＡＴ１１−３等を生成する。例えば、生成部１３４は、上記式（３）や（４）等の例に示すように、各単語の条件付き確率に基づくスコアを算出し、そのスコアに基づいて単語をつなげることにより、短縮タイトルを生成する。

図１の例では、生成部１３４は、短縮タイトルＡＴ１１−１を生成した後、コンテンツＣＴ１１のタイトルに対応する２つ目の短縮タイトルＡＴ１１−２を生成する。例えば、生成部１３４は、短縮タイトルＡＴ１１−１に含まれる単語のスコアを低下させる。例えば、生成部１３４は、単語「○村○郎」が先頭に出現する確率に対応するスコアを「０．４」に低下させ、単語「○村○郎」が２つ目に出現する確率に対応するスコアを「０．２」に低下させ、単語「ドラマ」が先頭に出現する確率に対応するスコアを「０．３８」に低下させる。図１の例では、生成部１３４は、生成した短縮タイトルＡＴ１１−１に含まれる単語のスコアを低下させたり除外したりした木構造を探索することにより、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」の２つ目の短縮タイトルＡＴ１１−２を生成する。

（提供部１３５）
提供部１３５は、種々の情報を外部装置へ提供する。提供部１３５は、生成部１３４により生成された複数の短縮タイトルの候補を端末装置１０に提供する。図１の例では、提供部１３５は、短縮タイトルリストＬＴ１１に示すような短縮タイトルＡＴ１１−１〜ＡＴ１１−３等を端末装置１０へ提供する。

〔３．モデルの学習〕
次に、図７を用いて、実施形態に係る生成システム１におけるモデルの学習について説明する。図７は、実施形態に係るモデルの学習の一例を示すフローチャートである。なお、図７に示すフローチャートにより学習されるモデルは、どのようなモデルであってもよい。

図７に示すように、生成装置１００の取得部１３１は、学習に用いる情報を取得する（ステップＳ１０１）。例えば、取得部１３１は、所定の編集者が利用する編集者端末から短縮タイトルと元となるタイトルとが対応付けられた要約一覧ＥＬ１１を取得する。その後、生成装置１００の学習部１３２は、取得した情報に基づいて学習を行う（ステップＳ１０２）。例えば、学習部１３２は、要約一覧ＥＬ１１を用いた学習により、要約一覧ＥＬ１１から要約生成モデルＭ１１を生成する。

〔４．短縮タイトルの生成〕
次に、図８を用いて、実施形態に係る生成システム１における要約の生成について説明する。図８は、実施形態に係る短縮タイトルの生成の一例を示すフローチャートである。

図８に示すように、生成装置１００の取得部１３１は、タイトルを取得する（ステップＳ２０１）。例えば、取得部１３１は、端末装置１０からコンテンツＣＴ１１のタイトルを取得する。また、取得部１３１は、コンテンツＣＴ１１のタイトルに関するコンテンツ関連情報を取得する（ステップＳ２０２）。例えば、取得部１３１は、コンテンツＣＴ１１の記事やカテゴリやトピックを取得する。なお、ステップＳ２０１とステップＳ２０２とは、同時に行われてもよいし、ステップＳ２０２のほうがステップＳ２０１よりも先に行われてもよい。

また、取得部１３１は、短縮タイトルの生成に用いるモデルを取得する（ステップＳ２０３）。例えば、取得部１３１は、モデル情報記憶部１２２から要約生成モデルＭ１１を取得する。また、取得部１３１は、タイトルに含まれる単語の類似単語を取得する（ステップＳ２０４）。例えば、取得部１３１は、類似単語情報記憶部１２３からタイトルに含まれる単語の類似単語を取得する。

その後、生成装置１００の生成部１３４は、モデルと文字数の上限値とに基づいて短縮タイトルを生成する（ステップＳ２０５）。例えば、生成部１３４は、コンテンツＣＴ１１の短縮タイトルの表示先やユーザＵ１による指定等により決定される短縮タイトルの文字数の上限値に基づいて短縮タイトルを生成する。生成部１３４は、短縮タイトルの文字数の上限値「全角１３」文字に基づいて短縮タイトルを生成する。その後、生成部１３４は、所定数の短縮タイトルを生成したかを判定する（ステップＳ２０６）。例えば、生成部１３４は、ユーザＵ１等により指定されたり、生成装置１００の管理者等により設定されたりした数の短縮タイトルを生成する。生成部１３４は、所定数が「４」である場合、４つの短縮タイトルを生成する。

所定数の短縮タイトルを生成していない場合（ステップＳ２０６：Ｎｏ）、生成部１３４は、生成した短縮タイトルに含まれる単語のスコアを更新する（ステップＳ２０７）。そして、生成部１３４は、ステップＳ２０５に戻って、更新されたスコアに基づいて短縮タイトルを生成する。例えば、生成部１３４は、ステップＳ２０５〜Ｓ２０７の処理により、コンテンツＣＴ１１のタイトルに対応する複数の短縮タイトルＡＴ１１−１〜ＡＴ１１−３等を生成する。

また、所定数の短縮タイトルを生成した場合（ステップＳ２０６：Ｙｅｓ）、生成部１３４は、処理を終了する。

〔５．短縮タイトルの生成〕
次に、図９〜図１２を用いて、実施形態に係る生成システム１における短縮タイトルの生成について説明する。図９〜図１２は、実施形態に係る短縮タイトルの生成の一例を示す図である。例えば、生成装置１００は、ビーム探索の手法を用いる。なお、生成装置１００は、木構造を用いる種々の手法を用いてもよい。例えば、生成装置１００は、他の近似手法を用いてもよいし、ビタビ、Ａ＊などの厳密探索手法を用いてもよい。

まず、図９を用いて短縮タイトルを生成する処理の概要を説明する。図９は、類似単語の追加やスコアの更新等を行う前の木構造を示す図である。図９に示す例においては、入力情報ＩＰ１１に示すように入力「ＩＮＰＵＴ」は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」である。また、図９に示す例においては、文字数上限ＭＸ１１に示すように上限値「ＭＡＸ」は、「１３」である。例えば、上限値「ＭＡＸ」は、「全角１３」文字とする。図９中の木構造ＳＴ１１は、「Ｗ１」の範囲に位置するノードは、先頭記号Ｓの次に遷移する単語、すなわち最初の単語に対応するノードを示す。また、「Ｗ２」の範囲に位置するノードは、「Ｗ１」の範囲に位置するノードに対応する単語から次に遷移する単語、すなわち２つめの単語に対応するノードを示す。また、「Ｗ３」の範囲に位置するノードは、「Ｗ２」の範囲に位置するノードに対応する単語から次に遷移する単語、すなわち３つめの単語に対応するノードを示す。

図９に示す例では、生成装置１００は、コンテンツ関連情報を加味したスコアを算出する。例えば、生成装置１００は、図９中の算出式ＭＦ１１に示す式により、コンテンツＣＴ１１のタイトルのコンテンツ関連情報を加味したスコアを算出する。なお、図９中の算出式ＭＦ１１に示す式は、上記式（５）に対応する。

例えば、生成装置１００は、図９中の算出式ＳＣ１１に示す式により、コンテンツがＣＴ１１である場合のコンテンツ関連情報「ＣＩＮＦ１１」に対して短縮タイトルを生成する場合において、単語「○村○郎」が先頭に出現する確率に対応するスコアを算出する。なお、図９中の算出式ＳＣ１１は上記式（７）に対応する。図９の例では、生成装置１００は、上記式（７）を用いてアイドルグループ名を示す単語「Ａ」のスコアを最も高い「０．６２」と算出する。また、図９の例では、生成装置１００は、算出式ＳＣ１１を用いて単語「○村○郎」のスコアを単語「Ａ」のスコアの次に高い「０．６」と算出する。また、図９の例では、生成装置１００は、上記式（７）を用いて単語「ドラマ」のスコアを単語「○村○郎」のスコアの次に高い「０．５８」と算出する。また、図９の例では、生成装置１００は、上記式（７）を用いて単語「の」のスコアを「０．０２」と算出する。

また、生成装置１００は、木構造ＳＴ１１と、上記式（５）を用いて各単語の各々に対して算出されたスコア（確率）でソートし、ビーム幅（ｎ＝３）だけ残す（ステップＳ２０５−１）。例えば、生成装置１００は、スコアが上位である「Ａ」、「○村○郎」、及び「ドラマ」の３つの単語に対応するノードのみを残し、その先のノードを探索する。そして、生成装置１００は、合計の文字数がＭＡＸ「１３」を超えるまで探索を繰り返す（ステップＳ２０５−２）。例えば、生成装置１００は、図９中の算出式ＭＦ１２を用いて、親ノードの単語（「Ａ」、「○村○郎」、及び「ドラマ」）の次に各単語に遷移する確率に対応するスコアを算出する。

次、図１０を用いてタイトルに含まれる単語の類似単語の追加について説明する。図１０は、タイトルに含まれる単語の類似単語の追加後の木構造を示す図である。図１０の例では、「Ｗ１」の範囲に位置するノードとして、単語「○村○郎」の類似単語である「××」や「○村」を追加する（ステップＳ２０４−１）。また、図１０の例では、「Ｗ２」の範囲に位置するノードとして、単語「○村○郎」の類似単語である「××」や「○村」を追加する（ステップＳ２０４−２）。このように、図１０の例における木構造ＳＴ１２は、単語「○村○郎」の類似単語である「××」や「○村」をノードとして追加した木構造を示す。

また、生成装置１００は、単語「○村○郎」の類似単語「××」や「○村」が先頭に出現する確率に対応するスコアを単語「○村○郎」に基づいて決定する。図１０に示す例では、生成装置１００は、単語「○村○郎」の類似単語「××」や「○村」が先頭に出現する確率に対応するスコアを単語「○村○郎」のスコア「０．６」を「０．０１」小さくした「０．５９」に決定する。なお、生成装置１００は、単語のスコアを類似単語のスコアとしてもよいし、種々の条件に基づいて類似単語のスコアを決定してもよい。

このように、各単語の類似単語を追加した木構造を探索することにより、生成装置１００は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」の短縮タイトルを生成する。これにより、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する「○村○郎 7月期ドラマ主演」とする１つ目の短縮タイトルＡＴ１１−１を生成する。

次、図１１を用いて１つ目の短縮タイトル生成後におけるスコアの更新について説明する。図１１は、生成された短縮タイトルに含まれる単語のスコアの更新後の木構造を示す図である。具体的には、図１１の例における木構造ＳＴ１３は、生成リストＬＴ１１−１に示す短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」や単語「ドラマ」に対応するノードのスコアを更新した木構造を示す。

例えば、生成装置１００は、木構造ＳＴ１３中の「Ｗ１」の範囲に位置する単語「○村○郎」に対応するノードのスコアを更新する（ステップＳ２０７−１）。例えば、生成装置１００は、木構造ＳＴ１３中の「Ｗ１」の範囲に位置する単語「○村○郎」に対応するノードのスコアを低下させる。また、例えば、生成装置１００は、木構造ＳＴ１３中の「Ｗ１」の範囲に位置する単語「ドラマ」に対応するノードのスコアを更新する（ステップＳ２０７−２）。例えば、生成装置１００は、木構造ＳＴ１３中の「Ｗ１」の範囲に位置する単語「ドラマ」に対応するノードのスコアを低下させる。また、例えば、生成装置１００は、木構造ＳＴ１３中の「Ｗ２」の範囲に位置する単語「○村○郎」に対応するノードのスコアを更新する（ステップＳ２０７−３）。例えば、生成装置１００は、木構造ＳＴ１３中の「Ｗ２」の範囲に位置する単語「○村○郎」に対応するノードのスコアを低下させる。なお、他のノードについてのスコアの更新は図示を省略する。

図１１の例では、生成リストＬＴ１１−１に示す短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」が先頭に出現する確率に対応するスコアを「０．４」に低下させ、単語「○村○郎」が２つ目に出現する確率に対応するスコアを「０．２」に低下させ、単語「ドラマ」が先頭に出現する確率に対応するスコアを「０．３８」に低下させる。

このように、生成した短縮タイトルＡＴ１１−１に含まれる単語のスコアを低下させたり除外したりした木構造を探索することにより、生成装置１００は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」の２つ目の短縮タイトルを生成する。これにより、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する「×× 土曜△時のドラマ決定」とする２つ目の短縮タイトルＡＴ１１−２を生成する。

次、図１２を用いて２つ目のタイトル生成後におけるスコアの更新について説明する。図１２は、生成された短縮タイトルに含まれる単語のスコアの更新後の木構造を示す図である。具体的には、図１２の例における木構造ＳＴ１４は、生成リストＬＴ１１−２に示す短縮タイトルＡＴ１１−２に含まれる単語「××」や単語「ドラマ」や単語「土曜△時」に対応するノードのスコアを更新した木構造を示す。

例えば、生成装置１００は、木構造ＳＴ１４中の「Ｗ１」の範囲に位置する単語「××」に対応するノードのスコアを更新する（ステップＳ２０７−１１）。例えば、生成装置１００は、木構造ＳＴ１４中の「Ｗ１」の範囲に位置する単語「××」に対応するノードのスコアを低下させる。また、例えば、生成装置１００は、木構造ＳＴ１４中の「Ｗ１」の範囲に位置する単語「ドラマ」に対応するノードのスコアを更新する（ステップＳ２０７−１２）。例えば、生成装置１００は、木構造ＳＴ１４中の「Ｗ１」の範囲に位置する単語「ドラマ」に対応するノードのスコアを低下させる。また、例えば、生成装置１００は、木構造ＳＴ１４中の「Ｗ２」の範囲に位置する単語「××」に対応するノードのスコアを更新する（ステップＳ２０７−１３）。例えば、生成装置１００は、木構造ＳＴ１４中の「Ｗ２」の範囲に位置する単語「××」に対応するノードのスコアを低下させる。なお、他のノードについてのスコアの更新は図示を省略する。

図１２の例では、生成リストＬＴ１１−２に示す短縮タイトルＡＴ１１−２に含まれる単語「××」が先頭に出現する確率に対応するスコアを「０．３９」に低下させ、単語「××」が２つ目に出現する確率に対応するスコアを「０．１９」に低下させ、単語「ドラマ」が先頭に出現する確率に対応するスコアを「０．２８」に低下させる。

このように、生成した短縮タイトルＡＴ１１−２に含まれる単語のスコアを低下させたり除外したりした木構造を探索することにより、生成装置１００は、コンテンツＣＴ１１のタイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」の３つ目の短縮タイトルを生成する。これにより、生成装置１００は、コンテンツＣＴ１１のタイトルに対応する「A○村の土△ 7月スタート」とする３つ目の短縮タイトルＡＴ１１−３を生成する。

（６．変形例１）
〔６−１．生成処理〕
上記例においては、編集者であるユーザＵ１に複数の短縮タイトル候補を提供する例を示したが、生成システム１Ａは、生成した短縮タイトルを含む概要コンテンツをユーザに提供してもよい。例えば、変形例１に係る生成装置１００Ａは、生成した複数の短縮タイトル候補から要約を選択し、選択した複数の要約を含む概要コンテンツをユーザへ提供してもよい。この点について、図１３〜図１５を用いて説明する。なお、実施形態と同様の構成については、同一の符号を付して説明を省略する。

まず、図１３を用いて、変形例１に係る生成処理の一例について説明する。図１３は、変形例１に係る生成処理の一例を示す図である。なお、変形例１における生成処理には、選択した複数の短縮タイトルを含む概要コンテンツを提供する処理を含む。図１３に示す生成装置１００Ａは、端末装置１０からの提供要求に基づいて短縮タイトルを含む概要コンテンツを提供する提供サービスを提供する。

図１３に示すように、生成システム１Ａには、端末装置１０と、生成装置１００Ａとが含まれる。端末装置１０と、生成装置１００Ａとは図示しない所定の通信網を介して、有線または無線により通信可能に接続される。また、図１３に示した生成システム１Ａには、複数台の端末装置１０や、複数台の生成装置１００Ａが含まれてもよい。

図１３に示す例においては、ユーザＵ２が利用する端末装置１０−２がタッチパネル機能を有するスマートフォンである場合を示す。また、図１３の例では、端末装置１０−２は、生成装置１００Ａへ概要コンテンツＷ１１の提供を要求する。また、端末装置１０−２は、生成装置１００Ａから提供された概要コンテンツＷ１１を所定のアプリにより表示する。なお、所定のアプリはブラウザであってもよい。概要コンテンツＷ１１におけるコンテンツＣＴ１１〜ＣＴ１４の配置は、コンテンツＣＴ１１が最上位に配置され、コンテンツＣＴ１２〜ＣＴ１４がその下部に配置されるものとする。

生成装置１００Ａは、端末装置１０から概要コンテンツの提供要求を取得する（ステップＳ２１）。以下では、ステップＳ２１における提供要求に対して、生成装置１００ＡがコンテンツＣＴ１１〜ＣＴ１４を含む概要コンテンツＷ１１を提供するものとして説明する。なお、ここでいうコンテンツＣＴ１１とは、コンテンツＩＤ「ＣＴ１１」により識別されるコンテンツを意味する。また、コンテンツＣＴ１２とは、コンテンツＩＤ「ＣＴ１２」により識別されるコンテンツを意味する。図１３に示すコンテンツ一覧ＣＬ１１は、図６に示すコンテンツ関連情報記憶部１２４に記憶されるコンテンツ関連情報に対応する。例えば、コンテンツＣＴ１１は、タイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」や画像ＩＭ１１等を含む。なお、コンテンツＣＴ１１には、記事が含まれるが図１３では図示を省略する。

また、図１３の例では、生成装置１００Ａは、各コンテンツＣＴ１１〜ＣＴ１４に対応する複数の短縮タイトル候補を生成済みであるものとする。例えば、生成装置１００Ａは、図１に示すような処理により、各コンテンツＣＴ１１〜ＣＴ１４に対応する複数の短縮タイトル候補を生成済みであるものとする。例えば、生成装置１００Ａは、コンテンツＣＴ１１について、短縮タイトルリストＬＴ１１に示すような短縮タイトルＡＴ１１−１〜ＡＴ１１−３等を生成しているものとする。また、例えば、生成装置１００Ａは、コンテンツＣＴ１２について、短縮タイトルリストＬＴ１２に示すような短縮タイトルＡＴ１２−１〜ＡＴ１２−３等を生成しているものとする。短縮タイトルリストＬＴ１１や短縮タイトルリストＬＴ１２を区別せず説明する場合、短縮タイトルリストＬＴと記載する。

生成装置１００Ａは、概要コンテンツＷ１１を提供するために、各コンテンツＣＴ１１〜ＣＴ１４の各々に対応する短縮タイトルリストＬＴから要約（短縮タイトル）を選択する。生成装置１００Ａは、各短縮タイトル候補の評価値に基づいて、短縮タイトルリストＬＴの各々から一の短縮タイトルを選択する。なお、ここでいう短縮タイトル候補の評価値は、その短縮タイトル候補の生成において探索した探索木中の経路に対応するスコアであってもよいし、スコアに基づいて算出される所定の評価値であってもよい。

図１３に示す例においては、生成装置１００Ａは、概要コンテンツＷ１１において最上位に配置されるコンテンツＣＴ１１の短縮タイトルを選択する（ステップＳ２２）。例えば、生成装置１００Ａは、短縮タイトルリストＡＬ１１−１に示すように、短縮タイトルリストＬＴ１１に含まれる短縮タイトルＡＴ１１−１〜ＡＴ１１−３等のうち、最も評価値が高い短縮タイトルＡＴ１１−１をコンテンツＣＴ１１の短縮タイトルとして選択する。

生成装置１００Ａは、コンテンツＣＴ１１の短縮タイトルとして短縮タイトルＡＴ１１−１を選択したことに応じて、他のコンテンツＣＴ１２〜ＣＴ１４等に対応する短縮タイトル候補の評価値を更新する（ステップＳ２３）。例えば、生成装置１００Ａは、短縮タイトルＡＴ１１−１に含まれる単語を含む短縮タイトル候補の評価値を低下させることにより、他のコンテンツＣＴ１２〜ＣＴ１４等に対応する短縮タイトル候補の評価値を更新する。例えば、生成装置１００Ａは、短縮タイトルリストＬＴ１２−２に示すように、短縮タイトルリストＬＴ１２に含まれる短縮タイトルＡＴ１２−１〜ＡＴ１２−３等のうち、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」を含む短縮タイトルＡＴ１２−１のスコアを低下させる。図１３の例では、説明を簡単にするために、生成装置１００Ａは、短縮タイトルＡＴ１１−１に含まれる単語「○村○郎」を含む短縮タイトルＡＴ１２−１の評価値を「０．２」だけ減少させる。これにより、生成装置１００Ａは、選択した短縮タイトルに含まれる単語以外の単語を含む短縮タイトルが選択される確率を高めることにより、概要コンテンツの情報量を増加させ、情報の多様性を向上させることができる。

その後、図１３に示す例においては、生成装置１００Ａは、概要コンテンツＷ１１においてコンテンツＣＴ１１の直下に配置されるコンテンツＣＴ１２の短縮タイトルを選択する（ステップＳ２４）。例えば、生成装置１００Ａは、短縮タイトルリストＡＬ１１−２に示すように、評価値が更新された短縮タイトルリストＬＴ１２−２に含まれる短縮タイトルＡＴ１２−１〜ＡＴ１２−３等のうち、最も評価値が高い短縮タイトルＡＴ１２−２をコンテンツＣＴ１２の短縮タイトルとして選択する。具体的には、生成装置１００Ａは、短縮タイトルＡＴ１２−２である「×× 共演女優との熱愛否定」を選択する。

また、生成装置１００Ａは、コンテンツＣＴ１２の短縮タイトルとして短縮タイトルＡＴ１２−２を選択したことに応じて、他のコンテンツＣＴ１３〜ＣＴ１４等に対応する短縮タイトル候補の評価値を更新する。その後、生成装置１００Ａは、短縮タイトルリストＡＬ１１−２に示すように、コンテンツＣＴ１３のタイトルに対応する短縮タイトルリストＬＴから「A社サーチャージ7月も継続」とする短縮タイトルＡＴ１３−４を選択する。

また、生成装置１００Ａは、コンテンツＣＴ１３の短縮タイトルとして短縮タイトルＡＴ１３−４を選択したことに応じて、他のコンテンツＣＴ１４等に対応する短縮タイトル候補の評価値を更新する。その後、生成装置１００Ａは、短縮タイトルリストＡＬ１１−２に示すように、コンテンツＣＴ１４のタイトルに対応する短縮タイトルリストＬＴから「20XX年の五輪開催国決定」とする短縮タイトルＡＴ１４−２を選択する。

その後、生成装置１００Ａは、コンテンツＣＴ１１〜ＣＴ１４に対して選択した短縮タイトルを含む概要コンテンツを端末装置１０に提供する（ステップＳ２５）。具体的には、生成装置１００Ａは、短縮タイトルＡＴ１１−１、ＡＴ１２−２、ＡＴ１３−４、ＡＴ１４−２を含む概要コンテンツＷ１１を端末装置１０へ提供する。

そして、概要コンテンツＷ１１を受信した端末装置１０は、概要コンテンツＷ１１を表示する（ステップＳ２６）。図１３では、端末装置１０は、コンテンツＣＴ１１〜ＣＴ１４の各々に対応する短縮タイトルＡＴ１１−１、ＡＴ１２−２、ＡＴ１３−４、ＡＴ１４−２や画像ＩＭ１１〜ＩＭ１４を含む概要コンテンツＷ１１を表示する。

上述したように、生成装置１００Ａは、要約生成モデルＭ１１や文字情報に対応するコンテンツ関連情報に基づいて文字情報から複数の短縮タイトルを生成する。上記の例では、生成装置１００Ａは、要約生成モデルＭ１１とコンテンツＣＴ１１のコンテンツ関連情報とに基づいて、コンテンツＣＴ１１のタイトルから複数の短縮タイトルを生成する。そして、生成装置１００Ａは、生成した複数の短縮タイトル候補から短縮タイトルを選択する。そして、生成装置１００Ａは、短縮タイトル候補の評価値に基づいて、複数の短縮タイトル候補から短縮タイトルを選択することにより、タイトルを要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、生成装置１００Ａは、端末装置１０を利用するユーザの操作履歴に応じて、生成する短縮タイトルを変動させてもよい。例えば、生成装置１００Ａは、ユーザの操作履歴として提供したコンテンツ等へのユーザの操作に関する情報を用いてもよい。例えば、生成装置１００Ａは、ユーザの操作履歴中にスクロールが早い等の情報が含まれる場合、そのユーザの性格をせっかちと推定し、通常よりも短い要約を生成してもよい。また、例えば、生成装置１００Ａは、ユーザの操作履歴中にスクロールが遅い等の情報が含まれる場合、そのユーザの性格をのんびりと推定し、通常よりも長い要約を生成してもよい。

また、例えば、生成装置１００Ａは、ユーザの操作履歴として音声対話の履歴を用いてもよい。例えば、生成装置１００Ａは、音声対話において最後まで聞くユーザには、情報量が通常よりも多くなるように、要約を生成してもよい。また、生成装置１００Ａは、音声対話において途中で聞くのを止めるユーザには情報量が通常よりも情報量が通常よりも少なくなるように、要約を生成してもよい。また、生成装置１００Ａは、上記の処理を音声対話でユーザによって長さを変動させるために用いてもよい。例えば、生成装置１００Ａは、上記の要約を音声対話の出力情報として用いてもよいし、音声対話用のモデルを用いて、音声対話の出力情報を生成してもよい。

また、生成装置１００Ａは、端末装置１０を利用するユーザの属性に応じて、生成する短縮タイトルを変動させてもよい。例えば、生成装置１００Ａは、端末装置１０を利用するユーザの年代が６０代や７０代である場合、通常よりも短い要約を生成してもよい。また、例えば、生成装置１００Ａは、端末装置１０を利用するユーザが１０代や２０代である場合、通常よりも長い要約を生成してもよい。

また、生成装置１００Ａは、上述のような要約を生成するモデルを用いて、生成処理を行ってもよい。例えば、生成装置１００Ａは、端末装置１０を利用するユーザが専門職である場合、通常よりも専門用語を含む確率が高くなるモデルを用いて要約を生成してもよい。また、例えば、生成装置１００Ａは、端末装置１０を利用するユーザが主婦である場合、通常よりも専門用語を含む確率が低くなるモデルを用いて要約を生成してもよい。また、例えば、生成装置１００Ａは、端末装置１０を利用するユーザの職種が短縮タイトルを生成する対象のコンテンツの内容に関する専門職である場合、通常よりも専門用語のスコアが高くなるようなモデルを用いて、短縮タイトルを生成してもよい。例えば、生成装置１００Ａは、端末装置１０を利用するユーザの職種が主婦である場合、専門用語のスコアが低くなるようなモデルを用いて、短縮タイトルを生成してもよい。

また、生成装置１００Ａは、端末装置１０を利用するユーザのコンテキストに応じて、生成する短縮タイトルを変動させてもよい。例えば、生成装置１００Ａは、端末装置１０を利用するユーザのコンテキストが走っている等の忙しい状態に対応するコンテキストである場合、通常よりも短い要約を生成してもよい。また、例えば、生成装置１００Ａは、端末装置１０を利用するユーザのコンテキストが仕事中に対応するコンテキストである場合、通常よりも短い要約を生成してもよい。また、例えば、生成装置１００Ａは、端末装置１０を利用するユーザのコンテキストが家にいる等の十分に時間がある状態に対応するコンテキストである場合、通常よりも長い要約を生成してもよい。また、生成装置１００Ａは、上述のような要約を生成するモデルを用いて、生成処理を行ってもよい。

また、生成装置１００Ａは、上述した情報に限らず、目的に応じて種々の情報を用いてもよい。例えば、生成装置１００Ａは、生成処理時の時間に関する情報や、気温に関する情報や、天気に関する情報等を用いてもよい。生成装置１００Ａは、ユーザが利用する端末装置１０のＣＰＵ（Central Processing Unit）やメモリ使用率などの情報を用いてもよい。また、例えば、生成装置１００Ａは、各情報をクラスタリングしておき、事前に要約（短縮タイトル）を生成してコンテンツ関連情報記憶部１２４に格納し、提供要求時に要求元のユーザに対応する短縮タイトルを提供してもよい。

また、生成装置１００Ａは、不自然な要約（短縮タイトル）がユーザに提供されることを抑制するために、短縮タイトル候補を言語モデルで再ランキングしてもよい。例えば、生成装置１００Ａは、所定の言語モデルを用いて、各短縮タイトル候補の評価値を更新してもよい。例えば、生成装置１００Ａは、各短縮タイトル候補のうち、そのコンテンツの内容に適した単語が用いられている短縮タイトル候補の評価値を増加してもよい。これにより、生成装置１００Ａは、より適切な短縮タイトルを含む概要コンテンツをユーザに提供することができる。

〔６−２．生成装置の構成〕
次に、図１４を用いて、変形例１に係る生成装置１００Ａの構成について説明する。図１４は、変形例１に係る生成装置１００Ａの構成例を示す図である。図１４に示すように、生成装置１００Ａは、通信部１１０と、記憶部１２０と、制御部１３０Ａとを有する。なお、生成装置１００Ａにおいて、生成装置１００と同様の構成は適宜説明を省略する。

（制御部１３０Ａ）
制御部１３０Ａは、コントローラ（controller）であり、例えば、ＣＰＵやＭＰＵ等によって、生成装置１００Ａ内部の記憶装置に記憶されている各種プログラム（生成プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０Ａは、コントローラ（controller）であり、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現される。

図１４に示すように、制御部１３０Ａは、取得部１３１Ａと、学習部１３２と、算出部１３３Ａと、生成部１３４Ａと、提供部１３５Ａと、選択部１３６とを有し、以下に説明する情報処理の機能や作用を実現または実行する。

（取得部１３１Ａ）
取得部１３１Ａは、取得部１３１と同様に各種情報を取得する。例えば、取得部１３１Ａは、外部の情報処理装置から情報を取得する。また、例えば、取得部１３１Ａは、記憶部１２０から情報を取得する。また、取得部１３１Ａは、端末装置１０からコンテンツの提供要求を取得する。例えば、取得部１３１Ａは、提供元装置からコンテンツの入稿を取得する。例えば、取得部１３１Ａは、記事やタイトルを含むコンテンツの入稿を取得する。例えば、取得部１３１Ａは、多数の提供元装置からコンテンツの入稿を取得してもよい。例えば、取得部１３１Ａは、提供元装置から入稿されたコンテンツをコンテンツ関連情報記憶部１２４に記憶する。取得部１３１Ａは、概要コンテンツに要約が表示される各文字情報の各々に対応する複数の要約候補を取得する。取得部１３１Ａは、概要コンテンツにおける各文字情報に対応する要約の配置に関する情報を取得する。例えば、取得部１３１Ａは、概要コンテンツＷ１１において、コンテンツＣＴ１１が最上位に配置され、コンテンツＣＴ１２〜ＣＴ１４がその下部に配置されることを示す情報を取得する。

また、取得部１３１Ａは、要約とその元となる情報とを対応付けた情報を取得する。図１では、取得部１３１Ａは、所定の編集者が利用する編集者端末から短縮タイトルと元となるタイトルとが対応付けられた要約一覧ＥＬ１１を取得する。

また、取得部１３１Ａは、文字情報と、提供先となるユーザに関する情報であるユーザ関連情報とを取得する。例えば、取得部１３１Ａは、所定のコンテンツに含まれるタイトルを文字情報として取得する。例えば、取得部１３１Ａは、所定のコンテンツに含まれる記事を文字情報として取得する。

例えば、取得部１３１Ａは、ユーザが利用する端末装置１０に関する端末情報をユーザ関連情報として取得する。例えば、取得部１３１Ａは、ユーザの端末装置１０における操作履歴に関する情報をユーザ関連情報として取得する。例えば、取得部１３１Ａは、ユーザの属性情報をユーザ関連情報として取得する。例えば、取得部１３１Ａは、ユーザのコンテキストに関する情報をユーザ関連情報として取得する。

また、取得部１３１Ａは、外部の情報処理装置から各種モデルを取得してもよい。例えば、取得部１３１Ａは、外部の情報処理装置から要約生成モデルＭ１１やユーザモデル等の種々のモデルを取得してもよい。なお、外部の情報処理装置から取得部１３１Ａにより要約生成に用いるモデルを取得する場合、生成装置１００Ａは、学習部１３２を有しなくてもよい。

（算出部１３３Ａ）
算出部１３３Ａは、算出部１３３と同様に各種情報を算出する。例えば、算出部１３３Ａは、各短縮タイトル候補の評価値を算出する。例えば、算出部１３３Ａは、短縮タイトル候補の生成において探索した探索木中の経路に対応するスコアを評価値として算出してもよい。また、例えば、算出部１３３Ａは、短縮タイトル候補の生成において探索した探索木中の経路に対応するスコアと、所定の関数とに基づいて評価値を算出してもよい。

また、算出部１３３Ａは、一のコンテンツの短縮タイトルが選択されたことに応じて、他のコンテンツに対応する短縮タイトル候補の評価値を更新してもよい。図１３の例では、算出部１３３Ａは、コンテンツＣＴ１１の短縮タイトルとして短縮タイトルＡＴ１１−１を選択したことに応じて、他のコンテンツＣＴ１２〜ＣＴ１４等に対応する短縮タイトル候補の評価値を更新する。

（生成部１３４Ａ）
生成部１３４Ａは、生成部１３４と同様に種々の情報を生成する。例えば、生成部１３４Ａは、選択部１３６により選択された短縮タイトル等に基づいて、概要コンテンツを生成してもよい。

（提供部１３５Ａ）
提供部１３５Ａは、生成部１３４Ａにより生成された短縮タイトルを含む概要コンテンツを提供する。例えば、提供部１３５Ａは、選択部１３６により選択された短縮タイトルを含む概要コンテンツを端末装置１０に提供する。図１３の例では、提供部１３５Ａは、短縮タイトルＡＴ１１−１、ＡＴ１２−２、ＡＴ１３−４、ＡＴ１４−２を含む概要コンテンツＷ１１を端末装置１０へ提供する。

（選択部１３６）
選択部１３６は、各要約候補の評価値に基づいて、複数の要約候補から一の要約候補を文字情報の要約として選択する。選択部１３６は、各文字情報に対応する複数の要約候補のうち、一の要約候補を各文字情報の要約として選択した場合における概要コンテンツの情報量と、情報の多様性に関する情報とに基づいて、各文字情報に対応する要約を選択する。選択部１３６は、一の要約候補が他の文字情報に対応する要約に含まれる単語を含む場合、一の要約候補の評価値を低下させることにより変動する各要約候補の評価値に基づいて、各文字情報に対応する要約を選択する。

図１３の例では、選択部１３６は、概要コンテンツＷ１１において最上位に配置されるコンテンツＣＴ１１の短縮タイトルを選択する。例えば、選択部１３６は、短縮タイトルリストＡＬ１１−１に示すように、短縮タイトルリストＬＴ１１に含まれる短縮タイトルＡＴ１１−１〜ＡＴ１１−３等のうち、最も評価値が高い短縮タイトルＡＴ１１−１をコンテンツＣＴ１１の短縮タイトルとして選択する。

また、図１３の例では、選択部１３６は、短縮タイトルリストＡＬ１１−２に示すように、評価値が更新された短縮タイトルリストＬＴ１２−２に含まれる短縮タイトルＡＴ１２−１〜ＡＴ１２−３等のうち、最も評価値が高い短縮タイトルＡＴ１２−２をコンテンツＣＴ１２の短縮タイトルとして選択する。具体的には、選択部１３６は、短縮タイトルＡＴ１２−２である「×× 共演女優との熱愛否定」を選択する。

〔６−３．短縮タイトルの生成〕
次に、図１５を用いて、変形例１に係る生成システム１Ａにおける要約の選択について説明する。図１５は、変形例１に係る短縮タイトルの選択の一例を示すフローチャートである。

図１５に示すように、生成装置１００Ａの取得部１３１Ａは、各コンテンツの短縮タイトルの候補を取得する（ステップＳ３０１）。例えば、取得部１３１Ａは、生成装置１００Ａの生成部１３４Ａにより生成された短縮タイトルの候補を取得する。

また、生成装置１００Ａの選択部１３６は、短縮タイトルを未選択の一のコンテンツを選択する（ステップＳ３０２）。例えば、選択部１３６は、概要コンテンツＷ１１において最上位に配置されるコンテンツＣＴ１１を選択する。

その後、選択部１３６は、一のコンテンツの短縮タイトルの各候補の評価値に基づいて短縮タイトルを選択する（ステップＳ３０３）。例えば、生成装置１００Ａは、一のコンテンツに対応する短縮タイトルリストＬＴに含まれる短縮タイトルのうち、最も評価値が高い短縮タイトルを一のコンテンツの短縮タイトルとして選択する。

その後、選択部１３６は、全コンテンツの短縮タイトルが選択済みかを判定する（ステップＳ３０４）。全コンテンツの短縮タイトルが選択済みでない場合（ステップＳ３０４：Ｎｏ）、生成装置１００Ａの算出部１３３Ａは、未選択のコンテンツの短縮タイトルの候補のうち、選択した短縮タイトルに含まれる単語を含む短縮タイトルの候補の評価値を更新する（ステップＳ３０５）。そして、選択部１３６は、ステップＳ３０２に戻って、更新されたスコアに基づいてコンテンツの短縮タイトルを選択する。例えば、選択部１３６は、ステップＳ３０２〜Ｓ３０５の処理により、コンテンツＣＴ１１〜ＣＴ１４等のタイトルに対応する複数の短縮タイトルＡＴ１１−１、ＡＴ１２−２、ＡＴ１３−４、ＡＴ１４−２等を選択する。

また、全コンテンツの短縮タイトルを選択した場合（ステップＳ３０４：Ｙｅｓ）、選択部１３６は、処理を終了する。

（７．変形例２）
〔７−１．生成処理〕
上記例においては、各コンテンツに対応する複数の短縮タイトル候補から短縮タイトルを選択する例を示したが、変形例２に係る生成システム１Ｂは、先に生成された短縮タイトルに含まれる単語のスコアを更新しながら、各コンテンツに対応する短縮タイトルを生成してもよい。例えば、変形例２に係る生成装置１００Ｂは、概要コンテンツに含まれる要約（短縮タイトル）を他の短縮タイトルに含まれる単語に基づいて生成し、生成した複数の要約を含む概要コンテンツをユーザへ提供してもよい。この点について、図１６〜図２１を用いて説明する。なお、実施形態や変形例１と同様の構成については、同一の符号を付して説明を省略する。

図１６に示すように、生成システム１Ｂには、端末装置１０と、生成装置１００Ｂとが含まれる。端末装置１０と、生成装置１００Ｂとは図示しない所定の通信網を介して、有線または無線により通信可能に接続される。また、図１６に示した生成システム１Ｂには、複数台の端末装置１０や、複数台の生成装置１００Ｂが含まれてもよい。

まず、図１６を用いて、変形例２に係る生成処理の一例について説明する。図１６は、変形例２に係る生成処理の一例を示す図である。なお、変形例２における生成処理には、選択した複数の短縮タイトルを含む概要コンテンツを提供する処理を含む。図１６に示す生成装置１００Ｂは、端末装置１０からの提供要求に基づいて短縮タイトルを含む概要コンテンツを提供する提供サービスを提供する。

図１６に示す例においては、ユーザＵ２が利用する端末装置１０−２がタッチパネル機能を有するスマートフォンである場合を示す。また、図１６の例では、端末装置１０−２は、生成装置１００Ｂへ概要コンテンツＷ２１の提供を要求する。また、端末装置１０−２は、生成装置１００Ｂから提供された概要コンテンツＷ２１を所定のアプリにより表示する。なお、所定のアプリはブラウザであってもよい。概要コンテンツＷ２１におけるコンテンツＣＴ１１〜ＣＴ１４の配置は、コンテンツＣＴ１１が最上位に配置され、コンテンツＣＴ１２〜ＣＴ１４がその下部に配置されるものとする。

生成装置１００Ｂは、端末装置１０から概要コンテンツの提供要求を取得する（ステップＳ３１）。以下では、ステップＳ３１における提供要求に対して、生成装置１００ＢがコンテンツＣＴ１１〜ＣＴ１４を含む概要コンテンツＷ２１を提供するものとして説明する。図１６に示すコンテンツ一覧ＣＬ１１は、図６に示すコンテンツ関連情報記憶部１２４に記憶されるコンテンツ関連情報に対応する。例えば、コンテンツＣＴ１１は、タイトル「アイドルグループAの○村○郎、７月期スタートの土曜△時の新ドラマ□□の主演に決定」や画像ＩＭ１１等を含む。なお、コンテンツＣＴ１１には、記事が含まれるが図１６では図示を省略する。

生成装置１００Ｂは、概要コンテンツＷ２１を提供するために、各コンテンツＣＴ１１〜ＣＴ１４の各々に対応する短縮タイトルを生成する。図１６に示す例においては、生成装置１００Ｂは、概要コンテンツＷ２１において最上位に配置されるコンテンツＣＴ１１の短縮タイトルを生成する（ステップＳ３２）。例えば、生成装置１００Ｂは、短縮タイトルリストＡＬ１１−１１に示すように、コンテンツＣＴ１１の短縮タイトルＡＴ１１を生成する。例えば、生成装置１００Ｂは、図１０に示す木構造ＳＴ１２を用いて、コンテンツＣＴ１１のタイトルに対応する「○村○郎 7月期ドラマ主演」とする短縮タイトルＡＴ１１を生成する。

図１６の例では、短縮タイトルの文字数の上限値は「全角１３」文字に設定されており、生成装置１００Ｂは、文字数の上限値「全角１３」を満たす木構造ＳＴ１２（図１０参照）中の経路のうち、スコアが最大の経路を短縮タイトルとする。例えば、生成装置１００Ｂは、コンテンツＣＴ１１のタイトルに対応する木構造ＳＴ１２を探索することにより、全角１３文字以内で最大のスコアとなる経路に対応する単語をつなげた文字列を短縮タイトルとして生成する。

短縮タイトルＡＴ１１を生成した後、生成装置１００Ｂは、他のコンテンツＣＴ１２〜ＣＴ１４等のタイトルに対応する短縮タイトルを生成するが、このとき、生成装置１００は、短縮タイトル間の多様性に関する情報に基づいて、他のコンテンツＣＴ１２〜ＣＴ１４等の短縮タイトルを生成する。例えば、生成装置１００Ｂは、コンテンツＣＴ１１の短縮タイトルとして短縮タイトルＡＴ１１を生成したことに応じて、他のコンテンツＣＴ１２〜ＣＴ１４等に対応する短縮タイトルを生成する際に用いる木構造におけるノードのスコアを更新する（ステップＳ３３）。その後、図１６に示す例においては、生成装置１００Ｂは、概要コンテンツＷ２１においてコンテンツＣＴ１１の直下に配置されるコンテンツＣＴ１２の短縮タイトルを生成する（ステップＳ３４）。

例えば、生成装置１００Ｂは、他のコンテンツＣＴ１２〜ＣＴ１４等に対応する短縮タイトルを生成する際に用いる木構造について、短縮タイトルＡＴ１１に含まれる単語に対応するノードのスコアを低下させる。

ここで、コンテンツＣＴ１２のタイトル「アイドルグループAの○村○郎、共演女優○山○子との熱愛報道を否定・・・」が文字列「ＩＮＰＵＴ」である場合の木構造は、図１９中の木構造ＳＴ２１により示される。具体的には、図１９中の木構造ＳＴ２１は、単語「○村○郎」の類似単語である「××」や「○村」をノードとして追加した木構造であり、短縮タイトルＡＴ１１が生成されたことによるスコアの更新を行う前の木構造ＳＴ２１を示す。

例えば、生成装置１００Ｂは、木構造ＳＴ２１において、短縮タイトルＡＴ１１に含まれる単語のスコアを低下させる。これにより、生成装置１００Ｂは、生成した短縮タイトルＡＴ１１に含まれる単語が、その後に生成する短縮タイトルに含まれる可能性を低下させることにより、短縮タイトルＡＴ１１に含まれる単語以外の単語を含む短縮タイトルが生成される可能性を高めることができる。したがって、生成装置１００Ｂは、多様な単語（情報）を含む複数の要約候補を生成することができる。図１６及び図２０の例では、説明を簡単にするために、短縮タイトルＡＴ１１に含まれる単語「○村○郎」のスコアが「０．１」だけ減少された場合を示す。具体的には、生成装置１００Ａは、単語「○村○郎」が先頭に出現する確率に対応するスコアを「０．６」に低下させ、単語「○村○郎」が２つ目に出現する確率に対応するスコアを「０．４」に低下させる。これにより、生成装置１００Ｂは、生成した短縮タイトルに含まれる単語以外の単語を含む短縮タイトルが生成される確率を高めることにより、概要コンテンツの情報量を増加させ、情報の多様性を向上させることができる。なお、単語「○村○郎」が３つ目以降に出現する確率に対応するスコアは図示を省略する。

ここで、短縮タイトルＡＴ１１に含まれる単語「○村○郎」が先頭に出現する確率に対応するスコアを「０．６」に低下させ、単語「○村○郎」が２つ目に出現する確率に対応するスコアを「０．４」に低下させた木構造は、図２０中の木構造ＳＴ２２により示される。このように、生成した短縮タイトルＡＴ１１に含まれる単語のスコアを低下させたり除外したりした木構造を探索することにより、生成装置１００Ｂは、コンテンツＣＴ１２のタイトル「アイドルグループAの○村○郎、共演女優○山○子との熱愛報道を否定・・・」の短縮タイトルＡＴ１２を生成する。

上述したように、図１６の例では、短縮タイトルの文字数の上限値は「全角１３」文字であり、生成装置１００Ｂは、文字数の上限値「全角１３」を満たす木構造ＳＴ２２（図２０参照）中の経路のうち、スコアが最大の経路を短縮タイトルとする。例えば、生成装置１００Ｂは、コンテンツＣＴ１２のタイトルに対応する木構造ＳＴ２２を探索することにより、全角１３文字以内で最大のスコアとなる経路に対応する単語をつなげた文字列を短縮タイトルとして生成する。

例えば、図１６の短縮タイトルリストＡＬ１１−１２に示すように、生成装置１００Ｂは、コンテンツＣＴ１２のタイトルに対応する短縮タイトルＡＴ１２を生成する。具体的には、生成装置１００Ｂは、コンテンツＣＴ１２のタイトルに対応する「XX 共演女優との熱愛否定」とする短縮タイトルＡＴ１２を生成する。

また、生成装置１００Ｂは、コンテンツＣＴ１２の短縮タイトルＡＴ１２を生成したことに応じて、他のコンテンツＣＴ１３〜ＣＴ１４等に対応する木構造の単語のスコアを更新する。その後、生成装置１００Ｂは、短縮タイトルリストＡＬ１１−１２に示すように、「A社サーチャージ7月も継続」とする、コンテンツＣＴ１３のタイトルに対応する短縮タイトルＡＴ１３を生成する。

また、生成装置１００Ｂは、コンテンツＣＴ１３の短縮タイトルＡＴ１３を生成したことに応じて、他のコンテンツＣＴ１４等に対応する木構造の単語のスコアを更新する。その後、生成装置１００Ｂは、短縮タイトルリストＡＬ１１−１２に示すように、「20XX年の五輪開催国決定」とする、コンテンツＣＴ１４のタイトルに対応する短縮タイトルＡＴ１４を生成する。

その後、生成装置１００Ｂは、コンテンツＣＴ１１〜ＣＴ１４に対して生成した短縮タイトルを含む概要コンテンツを端末装置１０に提供する（ステップＳ３５）。具体的には、生成装置１００Ｂは、短縮タイトルＡＴ１１〜ＡＴ１４を含む概要コンテンツＷ２１を端末装置１０へ提供する。

そして、概要コンテンツＷ２１を受信した端末装置１０は、概要コンテンツＷ２１を表示する（ステップＳ３６）。図１６では、端末装置１０は、コンテンツＣＴ１１〜ＣＴ１４の各々に対応する短縮タイトルＡＴ１１〜ＡＴ１４や画像ＩＭ１１〜ＩＭ１４を含む概要コンテンツＷ２１を表示する。

上述したように、生成装置１００Ｂは、要約生成モデルＭ１１や文字情報に対応するコンテンツ関連情報に基づいて文字情報から複数の短縮タイトルを生成する。上記の例では、生成装置１００Ｂは、要約生成モデルＭ１１とコンテンツＣＴ１１のコンテンツ関連情報とに基づいて、各コンテンツＣＴ１１のタイトルから短縮タイトルを生成する。そして、生成装置１００Ｂは、他のコンテンツにおける木構造について、生成した短縮タイトルに含まれる単語のスコアを更新し、他のコンテンツの短縮タイトルを生成することにより、タイトルを要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

〔７−２．生成装置の構成〕
次に、図１７を用いて、変形例２に係る生成装置１００Ｂの構成について説明する。図１７は、変形例２に係る生成装置１００Ｂの構成例を示す図である。図１７に示すように、生成装置１００Ｂは、通信部１１０と、記憶部１２０と、制御部１３０Ｂとを有する。なお、生成装置１００Ｂにおいて、生成装置１００や生成装置１００Ａと同様の構成は適宜説明を省略する。

（制御部１３０Ｂ）
制御部１３０Ｂは、コントローラ（controller）であり、例えば、ＣＰＵやＭＰＵ等によって、生成装置１００Ｂ内部の記憶装置に記憶されている各種プログラム（生成プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０Ｂは、コントローラ（controller）であり、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現される。

図２に示すように、制御部１３０Ｂは、取得部１３１Ｂと、学習部１３２と、算出部１３３Ｂと、生成部１３４Ｂと、提供部１３５Ａとを有し、以下に説明する情報処理の機能や作用を実現または実行する。

（取得部１３１Ｂ）
取得部１３１Ｂは、取得部１３１や取得部１３１Ａと同様に各種情報を取得する。例えば、取得部１３１Ｂは、外部の情報処理装置から情報を取得する。また、例えば、取得部１３１Ｂは、記憶部１２０から情報を取得する。また、取得部１３１Ｂは、端末装置１０からコンテンツの提供要求を取得する。例えば、取得部１３１Ｂは、提供元装置からコンテンツの入稿を取得する。例えば、取得部１３１Ｂは、記事やタイトルを含むコンテンツの入稿を取得する。例えば、取得部１３１Ｂは、多数の提供元装置からコンテンツの入稿を取得してもよい。例えば、取得部１３１Ｂは、提供元装置から入稿されたコンテンツをコンテンツ関連情報記憶部１２４に記憶する。取得部１３１Ｂは、概要コンテンツに要約が表示される各文字情報の各々に対応する複数の要約候補を取得する。取得部１３１Ｂは、概要コンテンツにおける各文字情報に対応する要約の配置に関する情報を取得する。例えば、取得部１３１Ｂは、概要コンテンツＷ２１において、コンテンツＣＴ１１が最上位に配置され、コンテンツＣＴ１２〜ＣＴ１４がその下部に配置されることを示す情報を取得する。

また、取得部１３１Ｂは、要約とその元となる情報とを対応付けた情報を取得する。図１６では、取得部１３１Ｂは、所定の編集者が利用する編集者端末から短縮タイトルと元となるタイトルとが対応付けられた要約一覧ＥＬ１１を取得する。

また、取得部１３１Ｂは、文字情報と、提供先となるユーザに関する情報であるユーザ関連情報とを取得する。例えば、取得部１３１Ｂは、所定のコンテンツに含まれるタイトルを文字情報として取得する。例えば、取得部１３１Ｂは、所定のコンテンツに含まれる記事を文字情報として取得する。

例えば、取得部１３１Ｂは、ユーザが利用する端末装置１０に関する端末情報をユーザ関連情報として取得する。例えば、取得部１３１Ｂは、ユーザの端末装置１０における操作履歴に関する情報をユーザ関連情報として取得する。例えば、取得部１３１Ｂは、ユーザの属性情報をユーザ関連情報として取得する。例えば、取得部１３１Ｂは、ユーザのコンテキストに関する情報をユーザ関連情報として取得する。

また、取得部１３１Ｂは、外部の情報処理装置から各種モデルを取得してもよい。例えば、取得部１３１Ｂは、外部の情報処理装置から要約生成モデルＭ１１やユーザモデル等の種々のモデルを取得してもよい。なお、外部の情報処理装置から取得部１３１Ｂにより要約生成に用いるモデルを取得する場合、生成装置１００Ｂは、学習部１３２を有しなくてもよい。

（算出部１３３Ｂ）
算出部１３３Ｂは、算出部１３３や算出部１３３Ａと同様に各種情報を算出する。例えば、算出部１３３Ｂは、一のコンテンツの短縮タイトルが生成選択されたことに応じて、他のコンテンツに対応する単語のスコアを更新してもよい。図１６の例では、算出部１３３Ｂは、コンテンツＣＴ１１の短縮タイトルＡＴ１１を生成したことに応じて、他のコンテンツＣＴ１２〜ＣＴ１４等に対応する木構造の単語のスコアを更新する。例えば、算出部１３３Ｂは、コンテンツＣＴ１１の短縮タイトルとして短縮タイトルＡＴ１１を生成したことに応じて、他のコンテンツＣＴ１２〜ＣＴ１４等に対応する短縮タイトルを生成する際に用いる木構造におけるノードのスコアを更新する。なお、スコアの更新は、生成部１３４Ｂが行ってもよい。

（生成部１３４Ｂ）
生成部１３４Ｂは、生成部１３４や生成部１３４Ａと同様に種々の情報を生成する。例えば、生成部１３４Ｂは、複数の文字情報から生成される複数の要約の多様性に関する情報に基づいて、各文字情報の要約を生成する。

図１６の例では、生成部１３４Ｂは、概要コンテンツＷ２１を提供するために、各コンテンツＣＴ１１〜ＣＴ１４の各々に対応する短縮タイトルを生成する。例えば、生成部１３４Ｂは、概要コンテンツＷ２１において最上位に配置されるコンテンツＣＴ１１の短縮タイトルを生成する。例えば、生成部１３４Ｂは、短縮タイトルリストＡＬ１１−１１に示すように、コンテンツＣＴ１１の短縮タイトルＡＴ１１を生成する。例えば、生成部１３４Ｂは、図１０に示す木構造ＳＴ１２を用いて、コンテンツＣＴ１１のタイトルに対応する「○村○郎 7月期ドラマ主演」とする短縮タイトルＡＴ１１を生成する。

図１６の例では、短縮タイトルの文字数の上限値は「全角１３」文字に設定されており、生成部１３４Ｂは、文字数の上限値「全角１３」を満たす木構造ＳＴ１２（図１０参照）中の経路のうち、スコアが最大の経路を短縮タイトルとする。例えば、生成部１３４Ｂは、コンテンツＣＴ１１のタイトルに対応する木構造ＳＴ１２を探索することにより、全角１３文字以内で最大のスコアとなる経路に対応する単語をつなげた文字列を短縮タイトルとして生成する。

短縮タイトルＡＴ１１を生成した後、生成部１３４Ｂは、他のコンテンツＣＴ１２〜ＣＴ１４等のタイトルに対応する短縮タイトルを生成するが、このとき、生成部１３４Ｂは、短縮タイトル間の多様性に関する情報に基づいて、他のコンテンツＣＴ１２〜ＣＴ１４等の短縮タイトルを生成する。その後、図１６に示す例においては、生成部１３４Ｂは、概要コンテンツＷ２１においてコンテンツＣＴ１１の直下に配置されるコンテンツＣＴ１２の短縮タイトルを生成する。

また、生成した短縮タイトルＡＴ１１に含まれる単語のスコアを低下させたり除外したりした木構造を探索することにより、生成部１３４Ｂは、コンテンツＣＴ１２のタイトル「アイドルグループAの○村○郎、共演女優○山○子との熱愛報道を否定・・・」の短縮タイトルＡＴ１２を生成する。

例えば、図１６の短縮タイトルリストＡＬ１１−１２に示すように、生成部１３４Ｂは、コンテンツＣＴ１２のタイトルに対応する短縮タイトルＡＴ１２を生成する。具体的には、生成部１３４Ｂは、コンテンツＣＴ１２のタイトルに対応する「ＸＸ共演女優との熱愛否定」とする短縮タイトルＡＴ１２を生成する。

（提供部１３５Ａ）
提供部１３５Ａは、生成部１３４Ｂにより生成された短縮タイトルを含む概要コンテンツを提供する。図１６の例では、提供部１３５Ａは、短縮タイトルＡＴ１１〜ＡＴ１４を含む概要コンテンツＷ２１を端末装置１０へ提供する。

〔７−３．短縮タイトルの生成〕
次に、図１８を用いて、変形例２に係る生成システム１Ｂにおける要約の生成について説明する。図１８は、変形例２に係る短縮タイトルの生成の一例を示すフローチャートである。

図１８に示すように、生成装置１００Ｂの取得部１３１Ｂは、複数のタイトルを取得する（ステップＳ４０１）。例えば、取得部１３１Ｂは、端末装置１０からコンテンツＣＴ１１〜ＣＴ１４のタイトルを取得する。また、取得部１３１Ｂは、コンテンツＣＴ１１〜ＣＴ１４のタイトルに関するコンテンツ関連情報を取得する（ステップＳ４０２）。例えば、取得部１３１Ｂは、コンテンツＣＴ１１〜ＣＴ１４の記事やカテゴリやトピックを取得する。なお、ステップＳ４０１とステップＳ４０２とは、同時に行われてもよいし、ステップＳ４０２のほうがステップＳ４０１よりも先に行われてもよい。また、取得部１３１Ｂは、コンテンツごとに取得してもよい。

また、取得部１３１Ｂは、短縮タイトルの生成に用いるモデルを取得する（ステップＳ４０３）。例えば、取得部１３１Ｂは、モデル情報記憶部１２２から要約生成モデルＭ１１を取得する。

また、生成装置１００Ｂの生成部１３４Ｂは、短縮タイトルを未生成の一のコンテンツを選択する（ステップＳ４０４）。例えば、生成部１３４Ｂは、概要コンテンツＷ２１において最上位に配置されるコンテンツＣＴ１１を選択する。

また、取得部１３１Ｂは、タイトルに含まれる単語の類似単語を取得する（ステップＳ４０５）。例えば、取得部１３１Ｂは、類似単語情報記憶部１２３からタイトルに含まれる単語の類似単語を取得する。

その後、生成部１３４Ｂは、モデルと文字数の上限値とに基づいて短縮タイトルを生成する（ステップＳ４０６）。例えば、生成部１３４Ｂは、コンテンツＣＴ１１の短縮タイトルの表示先やユーザＵ２による指定等により決定される短縮タイトルの文字数の上限値に基づいて短縮タイトルを生成する。生成部１３４Ｂは、短縮タイトルの文字数の上限値「全角１３」文字に基づいて短縮タイトルを生成する。その後、生成部１３４Ｂは、全コンテンツの短縮タイトルを生成したかを判定する（ステップＳ４０７）。

全コンテンツの短縮タイトルを生成していない場合（ステップＳ４０７：Ｎｏ）、生成部１３４Ｂは、短縮タイトルを未生成の一のコンテンツを選択する（ステップＳ４０８）。そして、生成装置１００Ｂの算出部１３３Ｂは、生成済みの短縮タイトルに含まれる単語のスコアを更新する（ステップＳ４０９）。その後、ステップＳ４０５に戻って、生成部１３４Ｂは、短縮タイトルの生成を繰り返す。生成装置１００Ｂは、ステップＳ４０５〜Ｓ４０９の処理により、コンテンツＣＴ１１〜ＣＴ１４等のタイトルに対応する短縮タイトルＡＴ１１〜ＡＴ１４等を生成する。

また、全コンテンツの短縮タイトルを生成した場合（ステップＳ４０７：Ｙｅｓ）、生成部１３４Ｂは、処理を終了する。

〔７−４．短縮タイトルの生成〕
次に、図１９及び図２０を用いて、変形例２に係る生成システム１Ｂにおける短縮タイトルの生成について説明する。図１９及び図２０は、変形例２に係る短縮タイトルの生成の一例を示す図である。

まず、図１９を用いて短縮タイトルを生成する処理の概要を説明する。図１９は、類似単語の追加後であり、スコアの更新を行う前の木構造を示す図である。図１９に示す例においては、入力情報ＩＰ２１に示すように入力「ＩＮＰＵＴ」は、コンテンツＣＴ１２のタイトル「アイドルグループAの○村○郎、共演女優○山○子との熱愛報道を否定・・・」である。また、図１９に示す例においては、文字数上限ＭＸ２１に示すように上限値「ＭＡＸ」は、「１３」である。例えば、上限値「ＭＡＸ」は、「全角１３」文字とする。すなわち、図１９中の木構造ＳＴ２１は、入力「ＩＮＰＵＴ」がコンテンツＣＴ１２のタイトル「アイドルグループAの○村○郎、共演女優○山○子との熱愛報道を否定・・・」に変更されたことによりノードが変更される点で、図１０中の木構造ＳＴ１２と相違する。

図１９に示す例では、生成装置１００Ｂは、コンテンツ関連情報を加味したスコアを算出する。例えば、生成装置１００Ｂは、例えば、図９中の算出式ＭＦ１１に示す式等により、コンテンツＣＴ１２のタイトルのコンテンツ関連情報を加味したスコアを算出する。例えば、生成装置１００Ｂは、例えば上記式（７）を用いて、コンテンツがＣＴ１２である場合のコンテンツ関連情報「ＣＩＮＦ１２」に対して短縮タイトルを生成する場合において、単語「○村○郎」が先頭に出現する確率に対応するスコアを算出する。図１９の例では、生成装置１００Ｂは、上記式（７）を用いてアイドルグループ名を示す単語「Ａ」のスコアを最も高い「０．７２」と算出する。また、図１９の例では、生成装置１００Ｂは、上記式（７）を用いて単語「○村○郎」のスコアを単語「Ａ」のスコアの次に高い「０．７」と算出する。

図１９に示す例では、生成装置１００Ｂは、各単語の類似単語を追加した木構造を探索することにより、生成装置１００Ｂは、コンテンツＣＴ１２のタイトル「アイドルグループAの○村○郎、共演女優○山○子との熱愛報道を否定・・・」の短縮タイトルを生成する。これにより、生成装置１００Ｂは、コンテンツＣＴ１２のタイトルに対応する「×× 共演女優との熱愛否定」とする短縮タイトルＡＴ１２を生成する。

次、図２０を用いて短縮タイトルＡＴ１１生成後におけるスコアの更新について説明する。図２０は、生成された短縮タイトルに含まれる単語のスコアの更新後の木構造を示す図である。具体的には、図２０の例における木構造ＳＴ２２は、生成リストＬＴ１１−１１に示す短縮タイトルＡＴ１１に含まれる単語「○村○郎」等に対応するノードのスコアを更新した木構造を示す。

例えば、生成装置１００Ｂは、木構造ＳＴ２２中の「Ｗ１」の範囲に位置する単語「○村○郎」に対応するノードのスコアを更新する（ステップＳ４０９−１）。例えば、生成装置１００Ｂは、木構造ＳＴ２２中の「Ｗ１」の範囲に位置する単語「○村○郎」に対応するノードのスコアを低下させる。また、例えば、生成装置１００Ｂは、木構造ＳＴ２２中の「Ｗ２」の範囲に位置する単語「○村○郎」に対応するノードのスコアを更新する（ステップＳ４０９−２）。例えば、生成装置１００Ｂは、木構造ＳＴ２２中の「Ｗ２」の範囲に位置する単語「○村○郎」に対応するノードのスコアを低下させる。なお、他のノードについてのスコアの更新は図示を省略する。

図２０の例では、生成リストＬＴ１１−１１に示す短縮タイトルＡＴ１１に含まれる単語「○村○郎」が先頭に出現する確率に対応するスコアを「０．６」に低下させ、単語「○村○郎」が２つ目に出現する確率に対応するスコアを「０．４」に低下させる。

このように、コンテンツＣＴ１１の短縮タイトルＡＴ１１に含まれる単語のスコアを低下させたり除外したりした木構造を探索することにより、生成装置１００Ｂは、コンテンツＣＴ１２のタイトル「アイドルグループAの○村○郎、共演女優○山○子との熱愛報道を否定・・・」の短縮タイトルを生成する。これにより、生成装置１００Ｂは、コンテンツＣＴ１２のタイトルに対応する「×× 共演女優との熱愛否定」とする短縮タイトルＡＴ１２を生成する。

〔８．表示位置に基づく短縮タイトルの生成〕
上記例においては、タイトルに含まれる単語やその単語の類似単語等に基づいて短縮タイトルを生成する場合を示したが、生成装置１００、１００Ａ、１００Ｂは、短縮タイトルの表示位置の関係に基づいて、短縮タイトルを生成してもよい。この点について図２１を用いて説明する。なお、以下では、生成装置１００Ｂが行う場合を例に説明する。

図２１中の端末装置１０−３１は、概要コンテンツＷ３１−１を表示している状態を示す。図２１では、端末装置１０−３１は、コンテンツＣＴ３１、ＣＴ３２等の各々に対応する短縮タイトルＡＴ３１、ＡＴ３２−１や画像ＩＭ３１、ＩＭ３２等を含む概要コンテンツＷ３１−１を表示する。また、図２１中の端末装置１０−３２は、概要コンテンツＷ３１−２を表示している状態を示す。図２１では、端末装置１０−３２は、コンテンツＣＴ３１、ＣＴ３２等の各々に対応する短縮タイトルＡＴ３１、ＡＴ３２−２や画像ＩＭ３１、ＩＭ３２等を含む概要コンテンツＷ３１−２を表示する。

ここで、図２１に示す例では、生成装置１００Ｂが概要コンテンツＷ３１−１や概要コンテンツＷ３２−２を提供する時点において所定のイベントが行われている場合を示す。例えば、サッカーの大会の決勝が行われているものとする。また、概要コンテンツＷ３１−１や概要コンテンツＷ３２−２におけるコンテンツＣＴ３１、ＣＴ３２等の配置は、コンテンツＣＴ３１が最上位に配置され、コンテンツＣＴ３２がコンテンツＣＴ３１の直下に配置されるものとする。なお、コンテンツＣＴ３１は、サッカーの大会○○の決勝の試合開始に関するコンテンツであり、コンテンツＣＴ３２は、サッカーの大会○○の決勝で開始後すぐにＡ国の選手が得点したことに関するコンテンツであるものとする。

この場合、生成装置１００Ｂは、コンテンツＣＴ３１について「サッカー○○決勝試合開始」とする短縮タイトルＡＴ３１を生成する。例えば、生成装置１００Ｂは、コンテンツＣＴ３１のタイトルに対応する木構造等を用いて、短縮タイトルＡＴ３１を生成する。

一方、生成装置１００Ｂは、コンテンツＣＴ３２について短縮タイトルを生成する際に、短縮タイトルの先頭にコンテンツＣＴ３２がコンテンツＣＴ３１の続きの情報であることを示す情報を加えてもよい。例えば、生成装置１００Ｂは、コンテンツＣＴ３２について短縮タイトルを生成する際に、先頭に「（続報）」と記載されたマークＭＫ１１を加えてもよい。そして、成装置１００Ｂは、コンテンツＣＴ３１のタイトルに対応する木構造等を用いて、先頭に「（続報）」が加えられた短縮タイトルＡＴ３２−１を生成してもよい。

例えば、生成装置１００Ｂは、コンテンツＣＴ３２について短縮タイトルを生成する際に、木構造のノードからサッカーの大会○○に関するノードを除いて短縮タイトルＡＴ３２−１を生成してもよい。例えば、生成装置１００Ｂは、コンテンツＣＴ３２について短縮タイトルを生成する際に、木構造のノードから「サッカー」や「○○」や「決勝」等のノードを除いて短縮タイトルＡＴ３２−１を生成してもよい。これにより、生成装置１００Ｂは、重複する情報を除いたうえで、短縮タイトルを生成することができる。

また、例えば、生成装置１００Ｂは、コンテンツＣＴ３２について短縮タイトルを生成する際に、先頭に「└」のマークＭＫ１２を加えてもよい。そして、生成装置１００Ｂは、コンテンツＣＴ３１のタイトルに対応する木構造等を用いて、先頭に「└」が加えられた短縮タイトルＡＴ３２−２を生成してもよい。このように、生成装置１００Ｂは、各短縮タイトルの配置に応じて、所定のマーク等を追加したり、木構造からノードを除いたりすることにより、より適切な短縮タイトルを生成することができる。

なお、上述した例では、生成装置１００Ｂが所定の条件を満たす配置の場合に先頭に所定のマークを追加する場合を示したが、生成装置１００Ｂは、所定のマークをノードとして木構造に追加してもよい。例えば、生成装置１００Ｂは、配置位置が上位のコンテンツに関連する短縮タイトルであることを示すマークをノードとして木構造に追加してもよい。例えば、生成装置１００Ｂは、図２０中の木構造ＳＴ２２における「Ｗ１」の範囲に位置するノードとして、所定のマークを追加してもよい。例えば、生成装置１００Ｂは、所定のマークのノードに所定のスコアを付加してもよい。なお、生成装置１００Ｂは、掲載する順序を変更してもよい。例えば、生成装置１００Ｂは、コンテンツＣＴ３１類似するコンテンツであるコンテンツＣＴ３２をコンテンツＣＴ３１の直下に配置するように、概要コンテンツＷ３１−１、Ｗ３１−２における各コンテンツの掲載する順序を変更してもよい。このように、生成装置１００Ｂは、類似する内容のコンテンツを連続して配置する用の表示順を変更する処理を行ってもよい。

〔９．効果〕
上述してきたように、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂは、取得部１３１、１３１Ａ、１３１Ｂと、生成部１３４、１３４Ａ、１３４Ｂと、を有する。取得部１３１、１３１Ａ、１３１Ｂは、文字情報と、文字情報に関連するコンテンツ関連情報とを取得する。生成部１３４、１３４Ａ、１３４Ｂは、取得部１３１、１３１Ａ、１３１Ｂにより取得したコンテンツ関連情報に基づいて、取得部１３１、１３１Ａ、１３１Ｂにより取得した文字情報の要約の候補として複数の要約候補を生成する。

これにより、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂは、文字情報と、文字情報に関連するコンテンツ関連情報に基づいて、文字情報の要約の候補として複数の要約候補を生成することにより、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂにおいて、生成部１３４、１３４Ａ、１３４Ｂは、複数の要約候補の多様性に関する情報に基づいて、複数の要約候補を生成する。

これにより、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂは、多様性に関する情報に基づいて、文字情報の要約の候補として複数の要約候補を生成することにより、多様な要約候補が生成できるため、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂにおいて、生成部１３４、１３４Ａ、１３４Ｂは、複数の要約候補の多様性に関する情報である他の要約候補に含まれるか否かを示す情報により変動する各単語のスコアに基づいて算出される評価値に応じて、要約候補を生成する。

これにより、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂは、複数の要約候補の多様性に関する情報である他の要約候補に含まれるか否かを示す情報により各単語のスコアを変動させ、他の要約候補に含まれる単語以外の単語を含む要約候補が生成される可能性を高めることにより、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂにおいて、生成部１３４、１３４Ａ、１３４Ｂは、文字情報に含まれる単語と、当該単語に類似する類似単語とを含む各単語のスコアに基づいて算出される評価値に基づいて、要約候補を生成する。

これにより、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂは、文字情報に含まれる単語と、その単語に類似する類似単語とを含む各単語のスコアに基づくことにより種々の単語が含まれる要約が生成される可能性が高まり、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂにおいて、生成部１３４、１３４Ａ、１３４Ｂは、第１の要約候補に含まれる単語のスコアを低下させた各単語のスコアに基づいて算出される評価値に基づいて、第２の要約候補を生成する。

これにより、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂは、要約候補に含まれる単語のスコアを低下させ、他の要約候補に含まれる単語以外の単語を含む要約候補が生成される可能性を高めることにより、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、変形例１に係る生成装置１００Ａは、選択部１３６を有する。選択部１３６は、各要約候補の評価値に基づいて、複数の要約候補から一の要約候補を文字情報の要約として選択する。

これにより、変形例１に係る生成装置１００Ａは、各要約候補の評価値に基づいて、複数の要約候補から一の要約候補を文字情報の要約として選択することにより、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、変形例１に係る生成装置１００Ａにおいて、取得部１３１Ａは、概要コンテンツに要約が表示される各文字情報の各々に対応する複数の要約候補を取得する。選択部１３６は、各文字情報に対応する複数の要約候補のうち、一の要約候補を各文字情報の要約として選択した場合における概要コンテンツの情報量と、情報の多様性に関する情報とに基づいて、各文字情報に対応する要約を選択する。

これにより、変形例１に係る生成装置１００Ａは、各文字情報に対応する複数の要約候補のうち、一の要約候補を各文字情報の要約として選択した場合における概要コンテンツの情報量と、情報の多様性に関する情報とに基づいて、各文字情報に対応する要約を選択することにより、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、変形例１に係る生成装置１００Ａにおいて、選択部１３６は、一の要約候補が他の文字情報に対応する要約に含まれる単語を含む場合、一の要約候補の評価値を低下させることにより変動する各要約候補の評価値に基づいて、各文字情報に対応する要約を選択する。

これにより、変形例１に係る生成装置１００Ａは、一の要約候補が他の文字情報に対応する要約に含まれる単語を含む場合、一の要約候補の評価値を低下させることにより変動する各要約候補の評価値に基づいて、各文字情報に対応する要約を選択することにより、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、変形例１に係る生成装置１００Ａにおいて、取得部１３１Ａは、概要コンテンツにおける各文字情報に対応する要約の配置に関する情報を取得する。選択部１３６は、概要コンテンツにおいて先に表示される要約に含まれる単語を含む場合、一の要約候補の評価値を低下させることにより変動する各要約候補の評価値に基づいて、各文字情報に対応する要約を選択する。

これにより、変形例１に係る生成装置１００Ａは、概要コンテンツにおいて先に表示される要約に含まれる単語を含む場合、一の要約候補の評価値を低下させることにより変動する各要約候補の評価値に基づいて、各文字情報に対応する要約を選択することにより、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

また、変形例２に係る生成装置１００Ｂにおいて、取得部１３１Ｂは、複数の文字情報と、複数の文字情報の各々に関連するコンテンツ関連情報とを取得する。生成部１３４Ｂは、取得部１３１Ｂにより取得した各文字情報に対応するコンテンツ関連情報と、複数の文字情報から生成される複数の要約の多様性に関する情報とに基づいて、各文字情報の要約を生成する。

これにより、実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂは、各文字情報に対応するコンテンツ関連情報と、複数の文字情報から生成される複数の要約の多様性に関する情報とに基づくことにより種々の単語が含まれる要約が生成される可能性が高まり、所定の文字情報を要約する作業負荷を軽減しつつ、適切な要約を生成可能にすることができる。

〔１０．ハードウェア構成〕
上述してきた実施形態に係る生成装置１００、変形例１に係る生成装置１００Ａ、及び変形例２に係る生成装置１００Ｂは、例えば図２２に示すような構成のコンピュータ１０００によって実現される。図２２は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、ネットワークＮを介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が決定したデータをネットワークＮを介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、決定したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が実施形態に係る生成装置１００、１００Ａ、１００Ｂとして機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０、１３０Ａ、１３０Ｂの機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムを取得してもよい。

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

〔１１．その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

また、上述してきた実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

１生成システム
１００生成装置
１２１編集情報記憶部
１２２モデル情報記憶部
１２３類似単語情報記憶部
１２４コンテンツ関連情報記憶部
１３０制御部
１３１取得部
１３２学習部
１３３算出部
１３４生成部
１３５提供部

Claims

コンテンツの要約を示す文字情報と、前記文字情報に関連するコンテンツ関連情報とを取得する取得部と、
前記取得部により取得したコンテンツ関連情報に基づいて、前記取得部により取得した一つの前記文字情報をさらに要約する内容の文字情報で、表現の異なる複数の要約候補を生成する生成部と、
を備えることを特徴とする生成装置。
コンテンツの要約を示す文字情報と、前記文字情報に関連するコンテンツ関連情報とを取得する取得部と、
前記取得部により取得したコンテンツ関連情報に基づいて、前記取得部により取得した一つの前記文字情報を要約する内容の文字情報で、候補としていずれか一つが選択される複数の要約候補を生成する生成部と、
を備えることを特徴とする生成装置。
前記生成部は、
前記複数の要約候補の多様性に関する情報に基づいて、前記複数の要約候補を生成する
ことを特徴とする請求項１または請求項２に記載の生成装置。
前記生成部は、
前記複数の要約候補の多様性に関する情報である他の要約候補に含まれるか否かを示す情報により変動する各単語のスコアに基づいて算出される評価値に応じて、要約候補を生成する
ことを特徴とする請求項３に記載の生成装置。
前記生成部は、
前記文字情報に含まれる単語と、当該単語に類似する類似単語とを含む前記各単語のスコアに基づいて算出される評価値に基づいて、要約候補を生成する
ことを特徴とする請求項４に記載の生成装置。
前記生成部は、
第１の要約候補に含まれる単語のスコアを低下させた前記各単語のスコアに基づいて算出される評価値に基づいて、第２の要約候補を生成する
ことを特徴とする請求項４または請求項５に記載の生成装置。
各要約候補の評価値に基づいて、前記複数の要約候補から一の要約候補を前記文字情報の要約として選択する選択部、
をさらに備えることを特徴とする請求項４〜６のいずれか１項に記載の生成装置。
前記取得部は、
概要コンテンツに要約が表示される各文字情報の各々に対応する複数の要約候補を取得し、
前記選択部は、
前記各文字情報に対応する複数の要約候補のうち、一の要約候補を前記各文字情報の要約として選択した場合における前記概要コンテンツの情報量と、情報の多様性に関する情報とに基づいて、前記各文字情報に対応する要約を選択する
ことを特徴とする請求項７に記載の生成装置。
前記選択部は、
前記一の要約候補が他の文字情報に対応する要約に含まれる単語を含む場合、前記一の要約候補の評価値を低下させることにより変動する各要約候補の評価値に基づいて、前記各文字情報に対応する要約を選択する
ことを特徴とする請求項８に記載の生成装置。
前記取得部は、
前記概要コンテンツにおける前記各文字情報に対応する要約の配置に関する情報を取得し、
前記選択部は、
前記概要コンテンツにおいて先に表示される要約に含まれる単語を含む場合、前記一の要約候補の評価値を低下させることにより変動する各要約候補の評価値に基づいて、前記各文字情報に対応する要約を選択する
ことを特徴とする請求項９に記載の生成装置。
複数の文字情報であって、コンテンツの要約を示す文字情報と、前記複数の文字情報の各々に関連するコンテンツ関連情報とを取得する取得部と、
前記取得部により取得した各文字情報に対応するコンテンツ関連情報と、前記複数の文字情報から生成される複数の要約の多様性に関する情報とに基づいて、前記各文字情報をさらに要約する内容の文字情報で、表現の異なる要約を生成する生成部と、
を備えることを特徴とする生成装置。
コンピュータが実行する生成方法であって、
コンテンツの要約を示す文字情報と、前記文字情報に関連するコンテンツ関連情報とを取得する取得工程と、
前記取得工程により取得したコンテンツ関連情報に基づいて、前記取得工程により取得した一つの前記文字情報をさらに要約する内容の文字情報で、表現の異なる複数の要約候補を生成する生成工程と、
を含むことを特徴とする生成方法。
コンテンツの要約を示す文字情報と、前記文字情報に関連するコンテンツ関連情報とを取得する取得手順と、
前記取得手順により取得したコンテンツ関連情報に基づいて、前記取得手順により取得した一つの前記文字情報をさらに要約する内容の文字情報で、表現の異なる複数の要約候補を生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。
コンピュータが実行する生成方法であって、
コンテンツの要約を示す文字情報と、前記文字情報に関連するコンテンツ関連情報とを取得する取得工程と、
前記取得工程により取得したコンテンツ関連情報に基づいて、前記取得工程により取得した一つの前記文字情報を要約する内容の文字情報で、候補としていずれか一つが選択される複数の要約候補を生成する生成工程と、
を含むことを特徴とする生成方法。
コンテンツの要約を示す文字情報と、前記文字情報に関連するコンテンツ関連情報とを取得する取得手順と、
前記取得手順により取得したコンテンツ関連情報に基づいて、前記取得手順により取得した一つの前記文字情報を要約する内容の文字情報で、候補としていずれか一つが選択される複数の要約候補を生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。