JP2015064650A

JP2015064650A - 情報処理装置、記事情報生成方法およびプログラム

Info

Publication number: JP2015064650A
Application number: JP2013196843A
Authority: JP
Inventors: 憲和松村; Norikazu Matsumura
Original assignee: Biglobe Inc
Current assignee: Biglobe Inc
Priority date: 2013-09-24
Filing date: 2013-09-24
Publication date: 2015-04-09
Anticipated expiration: 2033-09-24
Also published as: JP5841108B2

Abstract

【課題】多くの人にとって関心の高い情報を高い確率で生成可能な情報処理装置、記事情報生成方法およびプログラムを提供する。
【解決手段】情報処理装置は、ネットワーク上の電子情報の中から特定情報を有する該当電子情報を特定する特定処理を繰り返し実行する特定手段と、該当電子情報の数の推移に基づいて特定情報を記事対象情報と判定するかを決定する決定手段と、記事対象情報と判定された特定情報を用いて記事情報を生成する生成手段と、を含む。
【選択図】図１

Description

本発明は、情報処理装置、記事情報生成方法およびプログラムに関し、特には、記事情報を生成する情報処理装置、記事情報生成方法およびプログラムに関する。

特許文献１には、インターネット上の電子情報を利用するニュース配信システムが記載されている。

特許文献１に記載のニュース配信システムは、インターネット上の電子情報の中から、予め設定されたキーワードを含む情報を抽出し、その抽出結果から配信用の情報を生成する。特許文献１に記載のニュース配信システムは、配信用の情報を電子メールで配信する。

特開２００６−１３９５９９号公報

特許文献１に記載のニュース配信システムは、キーワードを含む情報を単に抽出し、その抽出結果から配信用の情報を生成する。このため、その配信用の情報が、多くの人にとって関心の高い情報（以下「高関心情報」と称する）であるか否かは不明である。

高関心情報は、多くの人にとって有益な情報となる可能性が高い。このため、高関心情報に対する需要は大きいと予想される。

このため、特許文献１に記載のニュース配信システムは、需要が大きいと予想される高関心情報を高い確率で生成できないという課題を有していた。

本発明の目的は、上記課題を解決可能な情報処理装置、記事情報生成方法およびプログラムを提供することである。

本発明の情報処理装置は、
ネットワーク上の電子情報の中から特定情報を有する該当電子情報を特定する特定処理を繰り返し実行する特定手段と、
前記該当電子情報の数の推移に基づいて、前記特定情報を記事対象情報と判定するかを決定する決定手段と、
前記記事対象情報と判定された特定情報を用いて、記事情報を生成する生成手段と、を含む。

本発明の記事情報生成方法は、
ネットワーク上の電子情報の中から特定情報を有する該当電子情報を特定する特定処理を繰り返し実行する特定ステップと、
前記該当電子情報の数の推移に基づいて、前記特定情報を記事対象情報と判定するかを決定する決定ステップと、
前記記事対象情報と判定された特定情報を用いて、記事情報を生成する生成ステップと、を含む。

本発明のプログラムは、
コンピュータに、
ネットワーク上の電子情報の中から特定情報を有する該当電子情報を特定する特定処理を繰り返し実行する特定手順と、
前記該当電子情報の数の推移に基づいて、前記特定情報を記事対象情報と判定するかを決定する決定手順と、
前記記事対象情報と判定された特定情報を用いて、記事情報を生成する生成手順と、を実行させる。

本発明によれば、多くの人にとって関心の高い情報を高い確率で生成することが可能になる。

本発明の第１実施形態の情報処理装置１００を示したブロック図である。情報処理装置１００の動作全体を説明するための図である。記事対象情報を特定する動作を説明するためのフローチャートである。集計テーブル３ａの一例を示した図である。該当推移モデルの例を示した図である。記事情報のフォーマット決定動作を説明するためのフローチャートである。第１記事情報フォーマットの一例を示した図である。第２記事情報フォーマットの一例を示した図である。第３記事情報フォーマットの一例を示した図である。第１記事情報フォーマットの記事情報を生成する動作を説明するためのフローチャートである。第２記事情報フォーマットの記事情報を生成する動作を説明するためのフローチャートである。第３記事情報フォーマットの記事情報を生成する動作を説明するためのフローチャートである。特定部２と決定部３と生成部４とからなる情報処理装置を示した図である。本発明の第２実施形態の情報処理装置１００Ａを示したブロック図である。生成部４Ａが行うフォーマット決定動作を説明するためのフローチャートである。

以下、本発明の実施形態について図面を参照して説明する。

（第１実施形態）
図１は、本発明の第１実施形態の情報処理装置１００を示したブロック図である。

図１において、情報処理装置１００は、収集部１と、特定部２と、決定部３と、生成部４と、送信部５と、を含む。

収集部１は、インターネット等のネットワーク２００を介して、取得対象ウェブサイトサーバ３００と通信する。

取得対象ウェブサイトサーバ３００は、各端末（不図示）からコメントが投稿される投稿サイトを、ネットワーク２００上に公開する。

本実施形態では、投稿サイトとして、「Ｔｗｉｔｔｅｒ」（登録商標）が用いられる。以下では、投稿されたコメントを「ツイート」とも称する。ツイートは、ネットワーク２００上の電子情報の一例である。

ツイートに示される情報は、多種多様である。例えば、ある有名人に関する情報、ある出来事に関する情報、または、あるウェブサイトで公開された電子情報（例えば、特定のツイート、ニュースまたは画像）に関する情報が、ツイートに示される可能性がある。

なお、あるウェブサイトで公開された電子情報（以下「特定電子情報」と称する）に関する情報がツイートに示される場合、そのツイートに、特定電子情報を識別するための情報として、特定電子情報のＵＲＬ（Uniform Resource Locator）が示されることが多い。

投稿サイトは、「Ｔｗｉｔｔｅｒ」に限らず適宜変更可能である。

収集部１は、所定時間（例えば５分）ごとに、その所定時間内に投稿された全ツイートの一部（例えば、全ツイートの１０％）またはすべてのツイートを、取得対象ウェブサイトサーバ３００から収集する。以下、収集部１が収集したツイートを「収集ツイート」と称する。

なお、所定時間は５分に限らない。所定時間は、５分よりも長くてもよいし５分よりも短くてよい。また、全ツイートの一部は、全ツイートの１０％に限らない。全ツイートの一部は、全ツイートの１０％よりも多く１００％未満であってもよいし、全ツイートの０％よりも多く１０％未満でもよい。また、全ツイートの一部または全てに含まれるツイートの数に上限値が設けられてもよい。

収集部１は、所定時間ごとに、その所定時間に収集された収集ツイートを特定部２に出力する。

特定部２は、特定手段の一例である。

特定部２は、所定時間間隔で収集ツイートを受け付けるごとに、収集ツイートの中から、特定情報を有する収集ツイート（以下「該当ツイート」と称する）を特定する。なお、該当ツイートは、該当電子情報の一例である。

本実施形態では、特定部２は、予め定められた分類ごとに、その分類に属する特定情報を有する該当ツイートを、収集ツイートの中から特定する。

分類としては、「画像／動画」と「ワード」と「ツイート」と「まとめ」と「ニュース」と「有名人」が、予め設定されている。なお、分類は、「画像／動画」、「ワード」、「ツイート」、「まとめ」、「ニュース」および「有名人」に限らず適宜変更可能である。

特定部２は、分類ごとに分類用情報を有する。また、特定部２は、分類用の辞書を有する。各辞書には、分類用情報が示されている。

「画像／動画」用の辞書には、分類用情報として、各ユーザの端末に対して、画像データを共有するウェブサイトである画像サイトを特定するためのＵＲＬ情報（以下「画像用ＵＲＬ情報」と称する）が示されている。画像用ＵＲＬ情報としては、画像サイトが有する各画像に付与されたＵＲＬのうち、各ＵＲＬに共通する部分が用いられる。画像用ＵＲＬ情報の数は１以上である。

「ワード」についての分類用情報は、言語解析エンジンを用いてワードを抽出したり、「#」が先頭に付与されているハッシュタグ（例えば#○○○、#□□□□）を抽出したりして作成される。以下、「ワード」についての分類用情報を、特定ワードと称する。特定ワードの数は１以上である。

「ツイート」用の辞書には、分類用情報として、リツイートされたツイートそのものを指定するためのツイート指定情報（例えば、「RT」という文字、リツイートアイコンなど）が示されている。

「まとめ」用の辞書には、分類用情報として、複数のウェブサイト上の情報などをまとめて記載しているまとめページを有するウェブサイトであるまとめサイトを特定するためのＵＲＬ情報（以下「まとめ用ＵＲＬ情報」と称する）が示されている。まとめページは、自動ではなく手動で作成される。まとめ用ＵＲＬ情報としては、まとめサイトが有する各まとめページに付与されたＵＲＬのうち、各ＵＲＬに共通する部分が用いられる。まとめ用ＵＲＬ情報の数は１以上である。

「ニュース」用の辞書には、分類用情報として、ニュースサイトを特定するためのＵＲＬ情報（以下「ニュース用ＵＲＬ情報」と称する）が示されている。ニュース用ＵＲＬ情報としては、ニュースサイトが有する各ニュースに付与されたＵＲＬのうち、各ＵＲＬに共通する部分が用いられる。ニュース用ＵＲＬ情報の数は１以上である。

「有名人」用の辞書には、分類用情報として、有名人の氏名（以下「特定人名」と称する）が示されている。特定人名の数は１以上である。

特定部２は、収集ツイートに、分類用情報、または、分類用情報にて指定される情報（リツイートされたツイート）が含まれる場合、その収集ツイートを、その分類用情報の分類に属する該当ツイートとして特定する。

このため、「画像／動画」の分類に属する該当ツイートには、「画像を特定するＵＲＬ」（以下「画像ＵＲＬ」と称する）が含まれる。「ワード」の分類に属する該当ツイートには、「特定ワード」が含まれる。「ツイート」の分類に属する該当ツイートには、「リツイートされたツイート」が含まれる。「まとめ」の分類に属する該当ツイートには、「まとめページを特定するＵＲＬ」（以下「まとめＵＲＬ」と称する）が含まれる。「ニュース」の分類に属する該当ツイートには、「ニュースを特定するＵＲＬ」（以下「ニュースＵＲＬ」と称する）が含まれる。「有名人」の分類に属する該当ツイートには、「特定人名」が含まれる。

なお、該当ツイートに含まれる、「画像ＵＲＬ」「特定ワード」「リツイートされたツイート」「まとめＵＲＬ」「ニュースＵＲＬ」および「特定人名」は、それぞれ、特定情報の一例である。

また、「画像ＵＲＬ」「まとめＵＲＬ」および「ニュースＵＲＬ」は、所定ＵＲＬの一例である。「特定ワード」および「特定人名」は、所定語句の一例である。「リツイートされたツイート」は所定文書の一例である。

本実施形態では、１つの収集ツイートに、異なる分類に属する特定情報が含まれる場合、その１つの収集ツイートは、異なる分類の各々に属することになる。

決定部３は、決定手段の一例である。

決定部３は、各々の分類単位で、その分類に属する特定情報ごとに、その特定情報を有する該当ツイートの数の推移に基づいて、その特定情報を記事対象情報と判定するかを決定する。

決定部３は、該当ツイートの数の推移を表すための複数種類の推移モデルを記憶している。本実施形態では、決定部３は、複数種類の推移モデルとして、線形近似モデルと、指数近似モデルと、対数近似モデルと、累乗近似モデルと、を記憶している。

線形近似モデルは、該当ツイートの数が時間の経過に応じて直線的に増加するモデルである。指数近似モデルは、該当ツイートの数が時間の経過に応じて指数関数的に増加するモデルである。対数近似モデルは、該当ツイートの数が時間の経過に応じて対数関数的に増加するモデルである。累乗近似モデルは、該当ツイートの数が時間の経過に応じて累乗関数的に増加するモデルである。

なお、複数種類の推移モデルは、線形近似モデルと指数近似モデルと対数近似モデルと累乗近似モデルに限らず適宜変更可能である。例えば、複数種類の推移モデルとして、線形近似モデルと指数近似モデルと対数近似モデルと累乗近似モデルのうちの少なくとも２つが用いられてもよい。

決定部３は、複数種類の推移モデルの中から、特定情報ごとに、特定情報を有する該当ツイートの数の推移に最も近い該当推移モデルを特定する。決定部３は、特定情報ごとに、該当推移モデルを用いて、今後の所定タイミング（例えば１５分後）における該当ツイートの数の予測値を求める。決定部３は、特定情報の予測値に基づいて、その特定情報を記事対象情報と判定するかを決定する。なお、今後の所定タイミングは、１５分後に限らず適宜変更可能である。

本実施形態では、決定部３は、予測値が所定閾値を超える特定情報を、記事対象情報と判定する。

生成部４は、生成手段の一例である。

生成部４は、決定部３が判定した記事対象情報を用いて、記事情報を生成する。

例えば、生成部４は、記事対象情報に関する関連情報を収集し、その関連情報を用いて、記事情報を生成する。

記事対象情報が特定ワードまたは特定人名である場合、生成部４は、投稿サイトやソーシャルネットワークサービス提供サイトやブログを検索対象として、特定ワードまたは特定人名を用いて検索を行う。生成部４は、その検索結果を関連情報として用いる。なお、その検索結果に画像／動画サイトのＵＲＬが含まれていれば、生成部４は、そのＵＲＬにて特定される画像や動画も関連情報として収集する。また、その検索結果にニュースサイトのＵＲＬが含まれていれば、生成部４は、そのＵＲＬにて特定されるニュース記事内の見出しや写真も関連情報として収集する。

記事対象情報がツイートである場合、生成部４は、そのツイートを管理する投稿サイトを検索対象として、そのツイートやそのツイートに返信している返信ツイートを関連情報として収集する。なお、記事対象情報であるツイートや返信ツイートに画像／動画サイトのＵＲＬが含まれていれば、生成部４は、そのＵＲＬにて特定される画像や動画も関連情報として収集する。また、記事対象情報であるツイートや返信ツイートにニュースサイトのＵＲＬが含まれていれば、生成部４は、そのＵＲＬにて特定されるニュース記事内の見出しや写真も関連情報として収集する。

記事対象情報がまとめＵＲＬやニュースＵＲＬである場合、生成部４は、投稿サイトやソーシャルネットワークサービス提供サイトやブログを検索対象として、そのＵＲＬを用いて検索を行う。生成部４は、その検索結果を関連情報として用いる。なお、その検索結果に画像／動画サイトのＵＲＬが含まれていれば、生成部４は、そのＵＲＬにて特定される画像や動画も関連情報として収集する。また、その検索結果にニュースサイトのＵＲＬが含まれていれば、生成部４は、そのＵＲＬにて特定されるニュース記事内の見出しや写真も関連情報として収集する。また、記事対象情報がまとめＵＲＬやニュースＵＲＬである場合、生成部４は、そのＵＲＬにて特定されるまとめページやニュースも関連情報として収集する。

なお、記事対象情報がＵＲＬまたはリツイートされたツイートである場合、関連情報には、第１電子情報（記事対象情報であるＵＲＬにて特定される電子情報や、記事対象情報であるリツイートされたツイート）と、第２電子情報（記事対象情報を含むと共に第１電子情報とは異なるツイート）とが含まれる。

第１電子情報は、例えば、ニュースＵＲＬにて特定されるニュースや、まとめＵＲＬにて特定されるまとめページや、画像ＵＲＬにて特定される画像／動画や、記事対象情報であるリツイートされたツイートである。

第２電子情報は、例えば、投稿サイトを検索対象として特定ワードまたは特定人名を用いて検索された検索結果である。

一方、記事対象情報が特定ワードまたは特定人名である場合、関連情報には、第２電子情報が含まれる。

なお、第２電子情報のうちリツイートされたツイートは、引用関連情報の一例である。

生成部４は、関連情報のうち、第１電子情報、または、引用関連情報を、優先的に用いて記事情報を生成する。

本実施形態では、生成部４は、引用関連情報のうち、リツイート回数が相対的に多い引用関連情報を優先的に用いて、記事情報を生成する。

また、生成部４は、関連情報に含まれる文言に対して、リツイート回数が多いツイートに記載されている文言ほど高くなる優先度を付与する。生成部４は、優先度が高い文言を優先的に用いて記事の要約を生成する。生成部４は、記事の要約を含む記事情報を生成する。

本実施形態では、生成部４は、文言に付与する優先度を、その文言が関連情報に出現する回数が多いほど高く、その文言が記事対象情報を含むほど高く、その文言を構成する文字の数が多いほど高くする。

送信部５は、送信手段の一例である。

送信部５は、生成部４が生成した記事情報を、送信先（例えば、端末、記事情報を表示するウェブサイトである所定のサイトなど）に送信する。

次に、動作を説明する。

図２は、情報処理装置１００の動作を説明するための図である。

以下、図２を参照して、情報処理装置１００の動作を説明する。

収集部１は、取得対象ウェブサイトサーバ３００から、５分間隔で収集ツイートを収集する（ステップＳ２０１）。

続いて、収集部１は、収集ツイートを特定部２に出力する。

特定部２は、収集ツイートを受け付けると、収集ツイートについて言語解析を行う。続いて、特定部２は、言語解析結果に基づいて、各分類に属する該当ツイートを特定する（ステップＳ２０２）。

続いて、特定部２は、分類ごとに該当ツイートを決定部３に出力する。

決定部３は、該当ツイートを受け付けると、分類ごとに、各該当ツイートから特定情報を抽出する。続いて、決定部３は、特定情報ごとに、特定情報を有する該当ツイートの数の推移に基づいて、その特定情報を記事対象情報と判定するかを決定する（ステップＳ２０３）。なお、図２では、記事対象情報と判定された特定情報が、イベントと称されている。

続いて、決定部３は、記事対象情報を生成部４に出力する。

生成部４は、記事対象情報を受け付けると、記事対象情報に関する関連情報を収集する（ステップＳ２０４）。

続いて、生成部４は、関連情報を用いて記事情報を生成する（ステップＳ２０５）。

次に、情報処理装置１００の動作を詳細に説明する。

まず、記事対象情報を特定する動作について説明する。図３は、情報処理装置１００が記事対象情報を特定する動作を説明するためのフローチャートである。なお、本実施形態では、情報処理装置１００は、図３に示した動作を５分ごとに実行する。

収集部１は、取得対象ウェブサイトサーバ３００から、５分間に投稿された全ツイートの１０％のツイートを、収集ツイートとして収集する（ステップＳ３０１）。

ステップＳ３０１では、収集部１は、例えば以下のように実行する。

収集部１は、５分間に投稿された全ツイートを投稿時刻順にソートする。続いて、収集部１は、ソート結果を１０件ごとに分けながら、その１０件のツイート中から１件のツイートを収集ツイートとしてランダムに取得する。なお、収集部１は、時間帯ごとの収集ツイートの数と時間帯ごとの投稿ツイートの数との比率が所定範囲内に収まるように、収集ツイートを収集することが望ましい。

特定部２は、収集ツイートを受け付けると、「画像／動画」と「ワード」と「ツイート」と「まとめ」と「ニュース」と「有名人」の分類ごとに、各分類に属する該当ツイートを特定する（ステップＳ３０２）。

決定部３は、分類ごとに該当ツイートを受け付けると、特定部２内の分類用情報を用いて、分類ごとに各該当ツイートから特定情報を抽出する（ステップＳ３０３）。

ステップＳ３０３では、決定部３は以下のように動作する。

決定部３は、「画像／動画」の分類の該当ツイートに、画像用ＵＲＬ情報を含むＵＲＬ（画像ＵＲＬ）が含まれていれば、その該当ツイートから、その画像ＵＲＬを特定情報として抽出する。

また、決定部３は、「ワード」の分類の該当ツイートに、特定ワードが含まれていれば、その該当ツイートから、その特定ワードを特定情報として抽出する。

また、決定部３は、「ツイート」の分類の該当ツイートに、リツイートされたツイートそのものが含まれていれば、その該当ツイートから、そのリツイートされたツイートを特定情報として抽出する。

また、決定部３は、「まとめ」の分類の該当ツイートに、まとめ用ＵＲＬ情報を含むＵＲＬ（まとめＵＲＬ）が含まれていれば、その該当ツイートから、そのまとめＵＲＬを特定情報として抽出する。

また、決定部３は、「ニュース」の分類の該当ツイートに、ニュース用ＵＲＬ情報を含むＵＲＬ（ニュースＵＲＬ）が含まれていれば、その該当ツイートから、そのニュースＵＲＬを特定情報として抽出する。

また、決定部３は、「有名人」の分類の該当ツイートに、特定人名が含まれていれば、その該当ツイートから、その特定人名を特定情報として抽出する。

続いて、決定部３は、該当ツイートの各々に、抽出タイミングを表すタイミング情報を付与する（ステップＳ３０４）。決定部３は、図３に示した動作を実行するごとに、タイミング情報を更新する。本実施形態では、タイミング情報として、通し番号が用いられる。本実施形態では、図３に示した動作が５分ごとに実行されるので、決定部３は、通し番号は５分ごとに「１」増やす。

続いて、決定部３は、ステップＳ３０４で通し番号が付与された該当ツイートを対象にして、分類単位で、特定情報ごとに、特定情報を含む該当ツイートの数を算出する（ステップＳ３０５）。

続いて、決定部３は、特定情報ごとに、特定情報を含む該当ツイートの数を、通し番号と関連づけて、決定部３内の集計テーブル３ａに格納する（ステップＳ３０６）。

図４は、集計テーブル３ａの一例を示した図である。

続いて、決定部３は、各推移モデルを特定する。

ここで、各推移モデルについて説明する。以下では、Xを時刻とする。Yを、特定情報を有する該当ツイートの数とする。

決定部３は、線形近似モデルとしてY＝a₁X+b₁を用いる。

ただし、線形近似モデルでのa₁は、

SHAPE \* MERGEFORMAT
である。

なお、AVEは平均を表す。iは通し番号を表す変数である。Xiは、通し番号iに対応する時刻である。なお、本実施形態では、Xiとして通し番号iが用いられる。Yiは、通し番号iに対応する、特定情報を有する該当ツイートの数である。Σの計算を行う際に用いられるiとしては、i〜i+2という３つの連続するiが用いられる。

線形近似モデルでのb₁は、

SHAPE \* MERGEFORMAT
である。

線形近似モデルでの寄与度R₁ ²は、

SHAPE \* MERGEFORMAT
である。なお、SQRTはルート（√）を意味する。

決定部生３は、指数近似モデルとしてY=b₂e^(a2X)を用いる。

ただし、指数近似モデルでのa₂は、

SHAPE \* MERGEFORMAT
である。

指数近似モデルでのb₂は、

SHAPE \* MERGEFORMAT
である。

指数近似モデルでの寄与度R₂ ²は、

SHAPE \* MERGEFORMAT
である。

決定部３は、対数近似モデルとしてY=a₃loge^X+b₃を用いる。

ただし、対数近似モデルでのa₃は、

SHAPE \* MERGEFORMAT
である。

対数近似モデルでのb₃は、

SHAPE \* MERGEFORMAT
である。

対数近似モデルでの寄与度R₃ ²は、

SHAPE \* MERGEFORMAT
である。

決定部３は、累乗近似モデルとしてY＝Xb₄X^a4を用いる。

ただし、累乗近似モデルでのa₄は、

SHAPE \* MERGEFORMAT
である。

累乗近似モデルでのb₄は、

SHAPE \* MERGEFORMAT
である。

累乗近似モデルでの寄与度R₄ ²は、

SHAPE \* MERGEFORMAT
である。

なお、線形近似モデル、指数近似モデル、対数近似モデルおよび累乗近似モデルと、数１〜数１２に示した式は、例えば、集計テーブル３ａに記憶されている。

まず、決定部３は、集計テーブル３ａに格納された情報と、数１、数２、数４、数５、数７、数８、数１０、数１１に示した式と、を用いて、各推移モデルの係数aおよびbを算出して、各推移モデルの係数aおよびbを確定する（ステップＳ３０７）。

続いて、決定部３は、集計テーブル３ａの格納された情報と、数３、数６、数９、数１２に示した式と、を用いて、特定情報ごとに、係数aおよびbが確定した線形近似モデル、指数近似モデル、対数近似モデルおよび累乗近似モデルの各々と、特定情報を有する該当ツイートの数の推移と、について、寄与度R²を算出する（ステップＳ３０８）。

ステップＳ３０８では、決定部３は、数３、数６、数９、数１２に示した式を用いて、特定情報ごとに、寄与度R₁ ²、R₂ ²、R₃ ²、R₄ ²を算出する。

続いて、決定部３は、特定情報ごとに、線形近似モデル、指数近似モデル、対数近似モデルおよび累乗近似モデルの中から、寄与度が特定閾値（例えば０．７）以上であるモデルを、候補モデルとして選択する。続いて、決定部３は、特定情報ごとに、候補モデルの中で寄与度が最大の候補モデルを、該当推移モデルとして特定する（ステップＳ３０９）。

なお、ステップＳ３０９は以下のように変形してもよい。

決定部３は、特定情報ごとに、線形近似モデル、指数近似モデル、対数近似モデルおよび累乗近似モデルの中から、寄与度が最大のモデルを、候補モデルとして選択する。続いて、決定部３は、特定情報ごとに、候補モデルの寄与度が特定閾値以上であるかを判定する。決定部３は、候補モデルの寄与度が特定閾値以上であった特定情報について、その候補モデルを、該当推移モデルとして特定する。

また、決定部３は、線形近似モデル、指数近似モデル、対数近似モデルおよび累乗近似モデルの中から、寄与度が最大のモデルを、該当推移モデルとして特定してもよい。

図５は、該当推移モデルの例を示した図である。なお、図５では、説明の簡略化を図るため、複数の推移モデルとして、線形近似モデル、指数近似モデル、対数近似モデルが用いられている。

図５（ａ）に示した例では、決定部３は、該当数位モデルとして、線形近似モデルを特定する。図５（ｂ）に示した例では、決定部３は、該当数位モデルとして、指数近似モデルを特定する。図５（ｃ）に示した例では、決定部３は、該当数位モデルとして、対数近似モデルを特定する。

なお、変形例として、決定部３は、候補モデルの寄与度の大きさに関わらず、候補モデルを該当推移モデルとして特定してもよい。

続いて、決定部３は、該当推移モデルごとに、該当推移モデルが有する変数Xに、現在の通し番号に規定値（例えば３）を加算した加算結果を代入して、該当推移モデルが有する変数Yを算出する（ステップＳ３１０）。

なお、変数Yは、該当推移モデルに対応する特定情報を有する該当ツイートの数の予測値を表す。また、規定値は、今後の所定タイミングを規定する値である。本実施形態では５分ごとに通し暗号が「１」増える。このため、規定値が「３」である場合には、１５分後の変数Yが算出されることになる。

続いて、決定部３は、予測値ごとに、予測値が所定閾値を超えているかを判定する。

続いて、決定部３は、所定閾値を超えている予測値に対応する特定情報を、記事対象情報として特定する（ステップＳ３１１）。続いて、決定部３は、記事対象情報を、生成部４に出力する。

次に、記事情報のフォーマットを決定する動作について説明する。

図６は、記事情報のフォーマットを決定する動作を説明するためのフローチャートである。なお、情報処理装置１００は、図６に示した動作を、図３に示したステップ３１１の終了後に実行する。また、情報処理装置１００は、図６に示した動作を、記事対象情報ごとに実行する。

生成部４は、今回対象になっている記事対象情報が、ＵＲＬまたはツイートそのものであるかを判定する（ステップＳ６０１）。

ステップＳ６０１で記事対象情報がＵＲＬである場合、生成部４は、そのＵＲＬにて特定される電子情報（例えばニュース情報）を取得する。続いて、生成部４は、その電子情報に含まれる文書から代表語を抽出する（ステップＳ６０２）。

例えば、記事対象情報であるＵＲＬにて特定される電子情報が「Ａ社、Ｂ事業を○月△日で終了」という文書を含む場合、生成部４は、「Ａ」と「Ｂ」と「終了」という各代表語を抽出する。なお、文書から代表語を抽出する技術は公知であるので、その詳細な説明は割愛する。

一方、ステップＳ６０１で記事対象情報がツイートそのものである場合、生成部４は、そのツイートに含まれる文書から代表語を抽出する（ステップＳ６０２）。

なお、ステップＳ６０１で記事対象情報がＵＲＬまたはツイートそのものでもない場合、記事対象情報は、特定ワードまたは特定人名となる。この場合、生成部４は、記事対象情報である特定ワードおよび特定人名を、代表語として扱う。

ステップＳ６０２終了後、または、記事対象情報がＵＲＬまたはツイートそのものでもない場合、生成部４は、代表語を用いたツイートを投稿サイトから検索し、直近の既定数（例：100件）の代表語を用いたツイートを抽出する（ステップＳ６０３）。なお、ステップＳ６０３において、生成部４は、該当推移モデルを特定するために使用したツイートを検索対象として、代表語を用いたツイートを検索してもよい。

続いて、生成部４は、ステップＳ６０３での検索結果を生成部４内に記憶する（ステップＳ６０４）。

続いて、生成部４は、ステップＳ６０３での検索結果と、過去に他の代表語を用いて実行された検索結果（以下「過去検索結果」と称する）と、の間で重複しているツイートが、第１判定値（例えば２０％）以上であるかを判断する（ステップＳ６０５）。なお、過去検索結果は、生成部４内に記憶されている。また、第１判定値は２０％に限らず適宜変更可能である。

ステップＳ６０５で重複割合が第１判定値以上である場合、生成部４は、今回対象になっている記事対象情報に関する記事が既に存在すると判断し、記事情報の生成動作を終了する（ステップＳ６０６）。

一方、ステップＳ６０５で重複割合が第１判定値未満である場合、生成部４は、代表語を用いたツイートの検索結果のうち、同じＵＲＬ、または同じリツイートを含むツイートの割合が第２判定値（例えば７０％）以上であるかを判断する（ステップＳ６０７）。ここで、検索結果のうち、第２判定値（例えば７０％）以上のツイートに記載された同じＵＲＬを「特定のＵＲＬ」、また、同じリツイートを「特定のリツイート」と呼ぶ。なお、第２判定値は７０％に限らず適宜変更可能である。

ステップＳ６０７で特定のＵＲＬ、または特定のリツイートを含むツイートの割合が第２判定値以上である場合、生成部４は、その特定のＵＲＬ、または特定のリツイートを新たな記事対象情報（以下「新記事対象情報」と称する）として判定する。続いて、生成部４は、新記事対象情報にて特定される１つの電子情報（例えばニュースまたはツイート）に関連した内容を有するツイートが多いと判断する。そして、生成部４は、その新記事対象情報にて特定される１つの電子情報と、新記事対象情報を示しているツイートと、を含む第１記事情報フォーマットを選択する（ステップＳ６０８）。

図７は、第１記事情報フォーマットの一例を示した図である。

図７に示したように、第１記事情報フォーマットは、第１欄７１と、第２欄７２と、第３欄７３を含む。第１欄７１には、新記事対象情報にて特定される１つの電子情報が載せられる。第２欄７２には、新記事対象情報を示しているツイートが載せられる。第３欄７３には、新記事対象情報にて特定される記事に含まれる画像（例えば、写真）や紹介文が載せられる。

ステップＳ６０７で特定のＵＲＬ、または特定のリツイートを含むツイートの割合が第２判定値未満である場合、生成部４は、処理をステップＳ６０９に進める。

ステップＳ６０９では、生成部４は、代表語を用いたツイートの検索結果のうち、画像または動画を示すＵＲＬを含むツイートの割合が第３判定値（例えば２０％）以上であるかを判断する。以下、検索結果のいずれかに含まれる画像または動画を示すＵＲＬを「記事対象画像ＵＲＬ」と称する。なお、第３判定値は２０％に限らず適宜変更可能である。

ステップＳ６０９で記事対象画像ＵＲＬを含むツイートの割合が第３判定値以上である場合、生成部４は、記事対象画像ＵＲＬを有する電子情報に関連した内容を有するツイートが多いと判断する。そして、生成部４は、記事対象画像ＵＲＬにて特定される画像と、記事対象画像ＵＲＬを含むツイートと、記事対象画像ＵＲＬを含むツイートの要約と、を含む第２記事情報フォーマットを選択する（ステップＳ６１０）。

図８は、第２記事情報フォーマットの一例を示した図である。

図８に示したように、第２記事情報フォーマットは、第１欄８１と、第２欄８２と、第３欄８３を含む。第１欄８１には、記事対象画像ＵＲＬを含むツイートの要約が載せられる。第２欄８２には、記事対象画像ＵＲＬにて特定される画像が載せられる。第３欄８３には、記事対象画像ＵＲＬを含むツイートが載せられる。

一方、ステップＳ６０９で画像または動画を示すＵＲＬを含むツイートの割合が第３判定値未満である場合、生成部４は、話題の中心になっている電子情報を特定するための内容を示していないが記事対象情報を含むツイートが多いと判断する。そして、生成部４は、検索結果に含まれるツイートと、検索結果に含まれるツイートの要約と、を含む第３記事情報フォーマットを選択する（ステップＳ６１１）。

図９は、第３記事情報フォーマットの一例を示した図である。

図９に示したように、第３記事情報フォーマットは、第１欄９１と第２欄９２を含む。第１欄９１には、検索結果に含まれるツイートの要約が載せられる。第２欄９２には、検索結果に含まれるツイートが載せられる。

次に、要約を生成する動作について説明する。

なお、情報処理装置１００は、記事情報のフォーマットとして、第２記事情報フォーマットまたは第３記事情報フォーマットを選択した場合、要約を生成する動作を実行する。

まず、生成部４は、検索結果に含まれるツイート（以下「対象ツイート」と称する）について言語解析を行う。

続いて、生成部４は、言語解析結果を参照して、各対象ツイートを体言ごとに区分して要約構成部を生成する。なお、要約構成部は、文言の一例である。

続いて、生成部４は、各要約構成部に優先度を付与する。

生成部４は、要約構成部の優先度を、その要約構成部の元になった対象ツイートのリツイート回数が多いほど高くする。また、生成部４は、要約構成部の優先度を、その要約構成部が対象ツイートに出現する回数が多いほど高くする。また、生成部４は、要約構成部の優先度を、その要約構成部が記事対象情報を含むほど高くする。また、生成部４は、要約構成部の優先度を、その要約構成部を構成する文字の数が多いほど高くする。

続いて、生成部４は、要約構成部を優先度が高い順に並べて記事の要約を生成する。

本実施形態では、要約構成部の優先度を、以下のように決定する。

要約構成部の優先度＝Σリツイート数×（位置ポイント−α×（1/文字の数））
位置ポイントは、要約構成部が記事対象情報を含む場合「2」とし、要約構成部が記事対象情報を含まない場合「0.5」とする。なお、位置ポイントは、「2」または「0.5」に限らず適宜変更可能である。

Σは、要約構成部が出現している収集ツイートの数、優先度を加算することを意味する。

αは、重みを表す。本実施形態では、αとして「6」が用いられる。なお、αは「6」に限らず適宜変更可能である。

ここで、要約構成部の優先度の一例を説明する。

例えば、記事対象情報が「○○○」であり、収集ツイートとして、
「新発売の○○○の□□□□を買った。」（リツイート数：30）、
「秋葉原の北口周辺にて、○○○のキャンペーン実施中。」（リツイート数：8）、および
「秋葉原の駅構内に、○○○の広告が。」（リツイート数：9）が、それぞれ存在するとする。

そして、要約構成部として、例えば「新発売の○○○の□□□□」、「秋葉原」、「○○○のキャンペーン実施中」および「○○○の広告」が生成されたとする。

この場合、各要約構成部の優先度は以下のようになる。

「新発売の○○○の□□□□」の優先度：30×(2−6×(1/12))＝45
「○○○の広告」の優先度：9×(0.5−6×(1/3))＋8×(0.5−6×(1/3))＝−25.5
「○○○のキャンペーン実施中」の優先度：8×(2−6×(1/13))＝12.3
「○○○の広告」の優先度：9×(2−6×(1/6))＝9
この場合、生成部４は、「新発売の○○○の□□□□」「○○○のキャンペーン実施中」「○○○の広告」「○○○の広告」という順で要約構成部が並ぶ要約を生成する。

次に、第１記事情報フォーマットの記事情報を生成する動作を説明する。

図１０は、第１記事情報フォーマットの記事情報を生成する動作を説明するためのフローチャートである。

生成部４は、新記事対象情報にて特定される記事を、第１記事情報フォーマットの第１欄７１に載せる（ステップＳ１００１）。

なお、新記事対象情報がＵＲＬである場合、生成部４は、そのＵＲＬにて特定される電子情報を、新記事対象情報にて特定される記事として用いる。また、新記事対象情報がツイートそのものである場合、生成部４は、そのツイートを、新記事対象情報にて特定される記事として用いる。

続いて、生成部４は、図６に示したステップＳ６０３での代表語での検索結果を、第１記事情報フォーマットの第２欄７２に載せる（ステップＳ１００２）。

なお、ステップＳ１００２において、生成部４は、代表語での検索結果に含まれる各ツイートについて、単位時間当たりの平均リツイート数を算出し、その算出値が大きいツイートを優先的に第２欄７２に載せる。

また、ステップＳ１００２において、生成部４は、代表語での検索結果に含まれるツイートのうち重複しているツイートについては、１つのツイート（例えば、最も古いツイート）を残し、他のツイートを削除する。

なお、ステップＳ１００２において、第２欄７２に載せることになった情報が、第１欄７１に載せることになっている情報と同一である場合、生成部４は、その情報を第２欄７２に載せないようにしてもよい。

また、新記事対象情報にて特定される記事に画像（例えば、写真）や紹介文が含まれている場合、生成部４は、その画像や紹介文を、第１記事情報フォーマットの第３欄７３に載せる。

生成部４は、図１０に示した動作を実行することで、第１記事情報フォーマットの記事情報を生成する。

次に、第２記事情報フォーマットの記事情報を生成する動作を説明する。

図１１は、第２記事情報フォーマットの記事情報を生成する動作を説明するためのフローチャートである。

生成部４は、図６に示したステップＳ６１０が終了し、その後、要約の作成を終了すると、図１１に示した動作を実行する。

生成部４は、作成された要約を、第２記事情報フォーマットの第１欄８１に載せる（ステップＳ１１０１）。

続いて、生成部４は、代表語を用いたツイートの検索結果に含まれる画像または動画を示すＵＲＬを検出する（ステップＳ１１０２）。

続いて、生成部４は、ステップＳ１１０２で検出されたＵＲＬにて特定される画像または動画を取得する（ステップＳ１１０３）。

続いて、生成部４は、ステップＳ１１０３で取得された画像または動画を、第２記事情報フォーマットの第２欄８２に載せる（ステップＳ１１０４）。

続いて、生成部４は、図６に示したステップＳ６０３での代表語での検索結果を、第２記事情報フォーマットの第３欄８３に載せる（ステップＳ１１０５）。

なお、ステップＳ１１０５では、上述したステップＳ１００２と同様に、生成部４は、代表語での検索結果に含まれる各ツイートについて、単位時間当たりの平均リツイート数を算出し、その算出値が大きいツイートを優先的に第３欄８３に載せる。

また、ステップＳ１１０５では、上述したステップＳ１００２と同様に、生成部４は、代表語での検索結果に含まれるツイートのうち重複しているツイートについては、１つのツイート（例えば、最も古いツイート）を残し、他のツイートを削除する。

生成部４は、図１１に示した動作を実行することで、第２記事情報フォーマットの記事情報を生成する。

次に、第３記事情報フォーマットの記事情報を生成する動作を説明する。

図１２は、第３記事情報フォーマットの記事情報を生成する動作を説明するためのフローチャートである。

生成部４は、図６に示したステップＳ６１１が終了し、その後、要約の作成を終了すると、図１２に示した動作を実行する。

生成部４は、作成された要約を、第３記事情報フォーマットの第１欄９１に載せる（ステップＳ１２０１）。

続いて、生成部４は、図６に示したステップＳ６０３での代表語での検索結果を、第３記事情報フォーマットの第２欄９２に載せる（ステップＳ１２０２）。

なお、ステップＳ１２０２では、上述したステップＳ１００２と同様に、生成部４は、代表語での検索結果に含まれる各ツイートについて、単位時間当たりの平均リツイート数を算出し、その算出値が大きいツイートを優先的に第２欄９２に載せる。

また、ステップＳ１２０２では、上述したステップＳ１００２と同様に、生成部４は、代表語での検索結果に含まれるツイートのうち重複しているツイートについては、１つのツイート（例えば、最も古いツイート）を残し、他のツイートを削除する。

生成部４は、図１２に示した動作を実行することで、第３記事情報フォーマットの記事情報を生成する。

生成部４は、第１、第２または第３記事情報フォーマットの記事情報を生成すると、その記事情報を、送信部５に出力する。

送信部５は、記事情報を受け付けると、その記事情報を送信先に送信する。

例えば、送信部５は、記事情報を、Ｔｗｉｔｔｅｒアカウントで取得対象ウェブサイトサーバ（Ｔｗｉｔｔｅｒウェブサイト）３００に発信する。なお、送信部５は、記事情報を、ＲＳＳ（RDF Site Summary）情報として発信してもよい。また、送信部５は、記事情報を所定のサイトに速報記事として掲載してもよい。また、送信部５は、例えば記事情報を受信するためのアプリケーションがインストールされたスマートフォンに、記事情報を送信してもよい。

次に、本実施形態の効果について説明する。

本実施形態では、特定部２は、ネットワーク２００上の電子情報の中から特定情報を有する該当電子情報を特定する特定処理を、繰り返し実行する。決定部３は、該当電子情報の数の推移に基づいて、特定情報を記事対象情報と判定するかを決定する。生成部４は、記事対象情報と判定された特定情報を用いて、記事情報を生成する。

該当電子情報の数の推移は、今後の該当電子情報の数の増減に関連する可能性が高い。今後、数が増える可能性が高い該当電子情報に含まれる特定情報は、多くの人にとって関心の高い情報である可能性が高い。このため、該当電子情報の数の推移を用いることで、該当電子情報に含まれる特定情報が、多くの人にとって関心の高い情報となるか否かを推定可能となる。したがって、記事対象情報と判定された特定情報を用いて記事情報を生成することで、多くの人にとって関心の高い情報を高い確率で生成することが可能になる。

また、ネットワーク２００上の電子情報の中から特定された該当電子情報を用いて記事対象情報を判定するので、該当電子情報と異なる電子情報（例えば、スパムや挨拶やアフェリエイトの電子情報）を用いることなく、記事対象情報を判定することが可能にある。

上記効果は、特定部２と決定部３と生成部４とからなる情報処理装置でも奏する。

図１３は、特定部２と決定部３と生成部４とからなる情報処理装置を示した図である。

本実施形態では、特定情報は、所定ＵＲＬ、所定語句または所定文書が用いられる。

このため、所定ＵＲＬ、所定語句または所定文書を用いて、多くの人にとって関心の高い情報を生成することが可能になる。

本実施形態では、決定部３は、複数種類の推移モデルの中から、該当電子情報の数の推移に最も近い該当推移モデルを特定する。決定部３は、特定該当推移モデルを用いて、今後の所定タイミングにおける該当電子情報の数の予測値を求める。決定部３は、予測値に基づいて、特定情報を記事対象情報と判定するかを決定する。

このため、推移モデルを用いて、今後の所定タイミングにおける該当電子情報の数の予測値を求めることが可能になる。よって、例えば、１つの推移モデルを用いて予測値を求める場合に比べて、予測値を高い精度で求めることが可能になる。

本実施形態では、決定部３は、予測値が所定閾値を超える場合、特定情報を記事対象情報と判定する。

このため、予測値と所定閾値とを比較することで、特定情報を記事対象情報と判定することが可能になる。

なお、決定部３は、分類ごとに所定閾値を記憶してもよい。分類ごとに所定閾値が設定されている場合、決定部３は、予測値が、特定情報が属する分類に対して設定された所定閾値を超える場合、特定情報を記事対象情報と判定する。

この場合、例えば、多くの人にとって関心の高い情報になる確率が高い分類（例えば、有名人の分類）の所定閾値を、他の分類の所定閾値よりも低い値に設定することができ、多くの人にとって関心の高い情報を精度よく検出することが可能になる。

また、決定部３は、時刻ごとに所定閾値を記憶してもよい。時刻ごとに所定閾値が設定されている場合、決定部３は、予測値が所定タイミングの時刻に対して設定された所定閾値を超える場合、特定情報を記事対象情報と判定する。

一般に、ツイート等の投稿情報では、時間帯に応じて総投稿数が異なる。このため、投稿数が相対的に少ない時刻の所定閾値を、投稿数が相対的に多い時刻の所定閾値よりも少ない値に設定すれば、総投稿数に対する予測値の割合が所定の範囲内にある場合に、特定情報を記事対象情報と判定することが可能になる。よって、特定情報を記事対象情報と判定する精度を高くすることが可能になる。

本実施形態では、決定部３は、複数種類の推移モデルのうちの該当電子情報の数の推移との一致度合いが特定閾値以上である推移モデルの中から、該当電子情報の数の推移に最も近い推移モデルを、該当推移モデルとして特定する。このため、該当電子情報の数の推移との相関関係が高い該当推移モデルを特定でき、よって、予測値を高い精度で求めることが可能になる。

なお、本実施形態では、複数種類の推移モデルとして、線形近似モデルと指数近似モデルと対数近似モデルと累乗関数近似モデルの４つが用いられている。

しかしながら、変形例としては、複数種類の推移モデルとして、線形近似モデルと指数近似モデルと対数近似モデルと累乗関数近似モデルのうちの少なくとも２つが用いられてもよい。

本実施形態では、生成部４は、記事対象情報に関する関連情報を収集し、関連情報を用いて記事情報を生成する。このため、記事情報を充実したものにすることが可能になる。

また、生成部４は、関連情報のうち、記事対象情報にて特定される電子情報、または、リツイートされている引用関連情報を、優先的に用いて記事情報を生成する。リツイートされる情報は、一般的に、他の人に知ってもらいたい関心の高い情報（例えば、重要な情報やコメント付きツイート）である。このため、多くの人にとってより関心の高い情報を用いて記事情報を生成することが可能になる。

また、生成部４は、引用関連情報の中で、リツイート回数が相対的に多い引用関連情報を優先的に用いて、記事情報を生成する。このため、多くの人にとってとても関心の高い情報を用いて記事情報を生成することが可能になる。

また、生成部４は、関連情報に含まれる文言に、文言を含む関連情報のリツイート回数が多いほど高くなる優先度を付与する。生成部４は、優先度が高い文言を優先的に用いて記事の要約を生成する。生成部４は、記事の要約を含む記事情報を生成する。

このため、多くの人にとって関心の高い文言を用いて、記事の要約をすることが可能になる。また、記事情報は記事の要約を含むので、例えば、ワード（例えば、特定情報）のみを示した記事に比べて、記事の可読性が高くなる。よって、利用者が記事の内容を容易に理解することを可能にする。

また、生成部４は、文言に付与する優先度を、文言が関連情報に出現する回数が多いほど高く、文言が記事対象情報を含むほど高く、文言を構成する文字の数が多いほど高くする。

このため、多くの人にとってより関心の高い文言を用いて、記事の要約をすることが可能になる。

また、生成部４は、関連情報に記載されたコメントの内容に応じて、記事情報のフォーマットを決定する。生成部４は、そのフォーマットの記事情報を生成する。

このため、記事情報のフォーマットを、関連情報に記載されたコメントの内容に応じたフォーマットにすることが可能になる。

また、送信部５は、記事情報を送信先に送信する。このため、多くの人にとって関心の高い記事情報を送信先に提供することが可能になる。

（第２実施形態）
次に、本発明の第２実施形態について説明する。

図１４は、第２実施形態の情報処理装置１００Ａを示したブロック図である。なお、図１４において、図１に示したものと同一構成のものには同一符号を付してある。

第２実施形態の情報処理装置１００Ａと第１実施形態の情報処理装置１００との主な相違点は、情報処理装置１００Ａが、生成部４の代わりに生成部４Ａを含む点である。以下、情報処理装置１００Ａについて、情報処理装置１００と異なる点を中心に説明する。

生成部４Ａは、生成手段の一例である。

生成部４Ａは、図６に示した動作を実行する代わりに図１５に示した動作を実行する。

図１５は、生成部４Ａが行うフォーマット決定動作を説明するためのフローチャートである。図１５において、図６に示した処理と同様の処理には同一符号を付してある。

以下、図１５に示したフォーマット決定動作について、図６に示した処理と異なる点について説明する。

生成部４Ａは、ステップＳ６０１で記事対象情報がＵＲＬまたはツイートそのものであった場合、処理をステップＳ６０８に進める。

生成部４Ａは、処理をステップＳ６０１からステップＳ６０８に直接進めた場合、ステップＳ６０８では新記事対象情報の代わりに、今回対象となっている記事対象情報を用いる。

また、生成部４Ａは、ステップＳ６０８で新記事対象情報の代わりに今回対象となっている記事対象情報を用いた場合、図１０に示したステップＳ１００１でも、新記事対象情報の代わりに今回対象となっている記事対象情報を用いる。

また、生成部４Ａは、図１０に示したステップＳ１００２では、今回対象となっている記事対象情報を用いたツイートを検索し、その検索結果を、図６に示したステップＳ６０３での代表語での検索結果の代わりに用いる。

本実施形態では、図６に示したステップＳ６０２が省略されるので、第１実施形態と比べて処理の簡素化を図ることが可能になる。

なお、上記各実施形態において、生成部４または４Ａは、生成された記事情報を、時系列で保存したり、日単位で保存したりしてもよい。この場合、保存された記事情報を参照可能にすれば、記事情報を、過去に起こった出来事を確認するために用いることも可能になる。

また、情報処理装置１００または１００Ａは、パーソナルコンピュータやサーバコンピュータなどのコンピュータにて実現されてもよい。この場合、コンピュータは、コンピュータにて読み取り可能なＣＤ−ＲＯＭ（Compact Disk Read Only Memory）のような記録媒体に記録されたプログラムを読込み実行して、情報処理装置１００または１００Ａが有する各機能を実行する。記録媒体は、ＣＤ−ＲＯＭに限らず適宜変更可能である。

また、情報処理装置１００または１００Ａは、１台の情報処理装置にて構成されてもよいし、複数台の処理装置にて構成されてもよい。

以上説明した各実施形態において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。

１００、１００Ａ情報処理装置
１収集部
２特定部
３決定部
３ａ集計テーブル
４、４Ａ生成部
５送信部

Claims

ネットワーク上の電子情報の中から特定情報を有する該当電子情報を特定する特定処理を繰り返し実行する特定手段と、
前記該当電子情報の数の推移に基づいて、前記特定情報を記事対象情報と判定するかを決定する決定手段と、
前記記事対象情報と判定された特定情報を用いて、記事情報を生成する生成手段と、を含む情報処理装置。
請求項１に記載の情報処理装置において、
前記特定情報は、所定ＵＲＬ、所定語句または所定文書である、情報処理装置。
請求項１または２に記載の情報処理装置において、
前記決定手段は、前記該当電子情報の数の推移を表すための複数種類の推移モデルの中から、前記該当電子情報の数の推移に最も近い該当推移モデルを特定し、前記該当推移モデルを用いて、今後の所定タイミングにおける前記該当電子情報の数の予測値を求め、前記予測値に基づいて、前記特定情報を前記記事対象情報と判定するかを決定する、情報処理装置。
請求項３に記載の情報処理装置において、
前記決定手段は、前記予測値が所定閾値を超える場合、前記特定情報を前記記事対象情報と判定する、情報処理装置。
請求項４に記載の情報処置装置において、
前記特定情報は、複数の分類のいずれかに属すものであり、
前記所定閾値は、前記分類ごとに設定されており、
前記決定手段は、前記予測値が、前記特定情報が属する分類に対して設定された所定閾値を超える場合、前記特定情報を前記記事対象情報と判定する、情報処理装置。
請求項４または５に記載の情報処理装置において、
前記所定閾値は、時刻ごとに設定されており、
前記決定手段は、前記予測値が、前記所定タイミングの時刻に対して設定された所定閾値を超える場合、前記特定情報を前記記事対象情報と判定する、情報処理装置。
請求項３から６のいずれか１項に記載の情報処理装置において、
前記決定手段は、前記複数種類の推移モデルのうちの前記該当電子情報の数の推移との一致度合いが特定閾値以上である推移モデルの中から、前記該当電子情報の数の推移に最も近い推移モデルを、前記該当推移モデルとして特定する、情報処理装置。
請求項３から７のいずれか１項に記載の情報処理装置において、
前記複数種類の推移モデルは、前記数が時間の経過に応じて直線的に増加する線形近似モデルと、前記数が時間の経過に応じて指数関数的に増加する指数近似モデルと、前記数が時間の経過に応じて対数関数的に増加する対数近似モデルと、前記数が時間の経過に応じて累乗関数的に増加する累乗関数近似モデルと、のうちの少なくとも２つを含む、情報処理装置。
請求項１から８のいずれか１項に記載の情報処理装置において、
前記生成手段は、前記記事対象情報に関する関連情報を収集し、前記関連情報を用いて前記記事情報を生成する、情報処理装置。
請求項９に記載の情報処理装置において、
前記生成手段は、前記関連情報のうち、前記記事対象情報にて特定される電子情報、または、他の電子情報に引用されている引用関連情報を、優先的に用いて前記記事情報を生成する、情報処理装置。
請求項１０に記載の情報処理装置において、
前記生成手段は、前記引用関連情報の中で、他の電子情報に引用されている回数が相対的に多い引用関連情報を優先的に用いて、前記記事情報を生成する、情報処理装置。
請求項９から１１のいずれか１項に記載の情報処理装置において、
前記生成手段は、前記関連情報に含まれる文言に、該文言を含む関連情報が他の電子情報に引用されている回数が多いほど高くなる優先度を付与し、前記優先度が高い文言を優先的に用いて記事の要約を生成し、前記記事の要約を含む記事情報を生成する、情報処理装置。
請求項１２に記載の情報処理装置において、
前記生成手段は、前記文言に付与する優先度を、当該文言が前記関連情報に出現する回数が多いほど高く、当該文言が前記記事対象情報を含むほど高く、当該文言を構成する文字の数が多いほど高くする、情報処理装置。
請求項９から１３のいずれか１項に記載の情報処理装置において、
前記生成手段は、前記関連情報に記載されたコメントの内容に応じて、前記記事情報のフォーマットを決定し、当該フォーマットの記事情報を生成する、情報処理装置。
請求項１から１４のいずれか１項に記載の情報処理装置において、
前記記事情報を送信先に送信する送信手段を、さらに含む情報処理装置。
ネットワーク上の電子情報の中から特定情報を有する該当電子情報を特定する特定処理を、繰り返し実行する特定ステップと、
前記該当電子情報の数の推移に基づいて、前記特定情報を記事対象情報と判定するかを決定する決定ステップと、
前記記事対象情報と判定された特定情報を用いて、記事情報を生成する生成ステップと、を含む記事情報生成方法。
コンピュータに、
ネットワーク上の電子情報の中から特定情報を有する該当電子情報を特定する特定処理を、繰り返し実行する特定手順と、
前記該当電子情報の数の推移に基づいて、前記特定情報を記事対象情報と判定するかを決定する決定手順と、
前記記事対象情報と判定された特定情報を用いて、記事情報を生成する生成手順と、を実行させるためのプログラム。