JP2010079826A - 情報処理装置、対比情報出力方法およびプログラム - Google Patents

情報処理装置、対比情報出力方法およびプログラム Download PDF

Info

Publication number
JP2010079826A
JP2010079826A JP2008250336A JP2008250336A JP2010079826A JP 2010079826 A JP2010079826 A JP 2010079826A JP 2008250336 A JP2008250336 A JP 2008250336A JP 2008250336 A JP2008250336 A JP 2008250336A JP 2010079826 A JP2010079826 A JP 2010079826A
Authority
JP
Japan
Prior art keywords
date
information
electronic information
keyword
blog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008250336A
Other languages
English (en)
Inventor
Yuji Ikui
佑治 生井
Junko Watanabe
純子 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biglobe Inc
Original Assignee
NEC Biglobe Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Biglobe Ltd filed Critical NEC Biglobe Ltd
Priority to JP2008250336A priority Critical patent/JP2010079826A/ja
Publication of JP2010079826A publication Critical patent/JP2010079826A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】キーワードを含む電子情報の基準期間の前後での変化内容を知りたいという要望に応えられる情報処理装置、対比情報出力方法およびプログラムを提供する。
【解決手段】テキストとテキストの作成日または更新日を表す日付情報とを含む複数の電子情報を記憶する記憶装置と通信可能な情報処理装置は、開始日と終了日とを表す期間情報とキーワードとを含む検索要求が入力されると、記憶装置内の複数の電子情報の中から、テキスト内に該キーワードが含まれかつ日付情報が開始日より前の日付を示す第1電子情報と、テキスト内に該キーワードが含まれかつ日付情報が開始日と終了日のいずれかである特定日以降の日付を示す第2電子情報と、を抽出する抽出手段と、第1電子情報の抽出結果と第2電子情報の抽出結果との違いを表す対比情報を生成する生成手段と、を含む。
【選択図】図1

Description

本発明は、情報処理装置、対比情報出力方法およびプログラムに関する。
ブログ等の電子情報には、特定の対象(例えば、商品またはサービス)についてのコメントが記載されている場合がある。このため、例えば、マーケティングリサーチにおいて、特定の対象の名称が記載されたブログ等の電子情報を分析することが重要になってきている。
特許文献1には、ブログ等の電子情報から、特定の対象(例えば、商品)の評価を示す意見を抽出する意見抽出装置が記載されている。
特開2007−172179号公報
商品またはサービス等の特定対象についてのキャンペーンが、特定の期間、実施される場合がある。この際、キャンペーンの効果を分析したいという要望、例えば、特定対象を表すキーワードが記載された電子情報が、キャンペーン前とキャンペーン後とで、どのように変化したかを知りたいという要望がある。
特許文献1に記載の意見抽出装置は、期間情報を用いた検索・抽出を行わない。このため、この意見抽出装置は、特定対象を表すキーワードが記載された電子情報を、キャンペーン前とキャンペーン後に分けて、分析することはできない。よって、この意見抽出装置は、特定対象を表すキーワードが記載された電子情報が、所定期間の前後で、どのように変化したかを知りたいという要望に応えることができない。
本発明の目的は、上述した課題を解決することが可能な情報処理装置、対比情報出力方法およびプログラムを提供することにある。
本発明の情報処理装置は、テキストと、当該テキストの作成日または更新日を表す日付情報と、を含む複数の電子情報を記憶する記憶装置と、通信可能な情報処理装置であって、開始日と終了日とを表す期間情報と、キーワードと、を含む検索要求が入力されると、前記記憶装置内の複数の電子情報の中から、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日より前の日付を示す第1電子情報と、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日と前記終了日のいずれかである特定日以降の日付を示す第2電子情報と、のそれぞれを抽出する抽出手段と、前記第1電子情報の抽出結果と、前記第2電子情報の抽出結果と、の違いを表す対比情報を生成する生成手段と、を含む。
本発明の対比情報出力方法は、テキストと、当該テキストの作成日または更新日を表す日付情報と、を含む複数の電子情報を記憶する記憶装置と、通信可能な情報処理装置が行う対比情報出力方法であって、開始日と終了日とを表す期間情報と、キーワードと、を含む検索要求が入力されると、前記記憶装置内の複数の電子情報の中から、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日より前の日付を示す第1電子情報と、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日と前記終了日のいずれかである特定日以降の日付を示す第2電子情報と、のそれぞれを抽出する抽出ステップと、前記第1電子情報の抽出結果と、前記第2電子情報の抽出結果と、の違いを表す対比情報を生成する生成ステップと、を含む。
本発明のプログラムは、テキストと、当該テキストの作成日または更新日を表す日付情報と、を含む複数の電子情報を記憶する記憶装置と、通信可能なコンピュータに、開始日と終了日とを表す期間情報と、キーワードと、を含む検索要求が入力されると、前記記憶装置内の複数の電子情報の中から、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日より前の日付を示す第1電子情報と、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日と前記終了日のいずれかである特定日以降の日付を示す第2電子情報と、のそれぞれを抽出する抽出手順と、前記第1電子情報の抽出結果と、前記第2電子情報の抽出結果と、の違いを表す対比情報を生成する生成手順と、を実行させる。
本発明によれば、キーワードが記載された電子情報が、基準期間(所定期間)の前後で、どのように変化したかを知りたいという要望に応えることが可能になる。
以下、本発明の実施形態を図面を参照して説明する。
(第1実施形態)
図1は、本発明の第1実施形態の情報処理装置1を示したブロック図である。
図1において、情報処理装置1は、利用者PC(Personal Computer)2とブログサーバ3とネットワーク4のそれぞれと接続される。
利用者PC2は、情報処理装置1の利用者によって使用される。
利用者PC2は、例えば、利用者の操作に応じて、情報処理装置1に、検索要求を送信する。検索要求は、開始日と終了日とで表されるイベント期間(例えば、2008年12月14日〜2008年12月16日)を示すイベント期間情報と、キーワードと、を含む。なお、複数のイベント期間情報が、検索要求に含まれてもよい。イベント期間情報は、一般的に期間情報と呼ぶことができる。イベント期間情報は、時刻情報を有してもよい。
本実施形態では、検索要求は、評価期間を示す評価期間情報をさらに含む。
評価期間情報は、イベント期間の開始日より前の評価開始日と、イベント期間の終了日より後の評価終了日と、によって特定される評価期間を表す。評価期間情報は、時刻情報を有してもよい。
なお、評価期間が、イベント期間の前後に既定期間を加えた期間として、予め設定されている場合、検索要求内の評価期間情報は省略される。この場合、評価開始日は、開始日より予め定められた期間だけ前の日となり、評価終了日は、終了日より予め定められた期間だけ後の日となる。
利用者PC2は、情報処理装置1に検索要求を送信した後、情報処理装置1から、検索要求に応じた検索結果を受信し、その検索結果を表示する。
ブログサーバ3は、一般的に記憶装置と呼ぶことができる。ブログサーバ3は、複数のブログを記憶するブログ記憶部31を含む。ブログは、一般的に、テキストと、そのテキストの作成日または更新日を表す日付情報と、を含む電子情報と呼ぶことができる。なお、テキストは、タイトルおよびブログ内容を含む。日時情報は、時刻情報を含んでもよい。
情報処理装置1は、抽出部11と、生成部12と、を含む。抽出部11は、ブログ抽出部11aと、抽出結果記憶部11bと、を含む。生成部12は、カウント部12aと、算出部12bと、出力部12cと、を含む。
抽出部11は、一般的に抽出手段と呼ぶことができる。
抽出部11(具体的には、ブログ抽出部11a)は、利用者PC2から検索要求を受信する(検索要求が入力される)と、検索要求内のイベント期間情報ごとに、ブログ記憶部31内の複数のブログの中から、テキスト内に検索要求内のキーワードが含まれ、かつ、日付情報が、イベント期間情報にて表される開始日より前の日付を示すイベント期間前ブログと、テキスト内にそのキーワードが含まれ、かつ、日付情報がイベント期間情報にて表される開始日と終了日のいずれかである特定日以降の日付を示すイベント期間後ブログと、のそれぞれを、少なくとも抽出する。
なお、抽出部11は、入力部(不図示)から検索要求が入力されてもよい。
イベント期間前ブログは、一般的に第1電子情報と呼ぶことができる。イベント期間後ブログは、一般的に第2電子情報と呼ぶことができる。
本実施形態では、ブログ抽出部11aは、ブログ記憶部31内の複数のブログの中から、イベント期間前ブログとして、テキスト内に検索要求内のキーワードが含まれ、かつ、日付情報が、評価開始日以降で開始日より前の日付を示す期間前ブログを抽出する。
また、ブログ抽出部11aは、ブログ記憶部31内の複数のブログの中から、イベント期間後ブログとして、テキスト内に検索要求内のキーワードが含まれ、かつ、日付情報が、特定日以降で評価終了日以前の日付を示す期間後ブログを抽出する。
期間前ブログは、一般的に第3電子情報と呼ぶことができる。期間後ブログは、一般的に第4電子情報と呼ぶことができる。
なお、評価期間が、イベント期間の前後に既定期間(例えば、1週間)を加えた期間として、予め設定されている場合、ブログ抽出部11aは、以下のように動作する。
ブログ抽出部11aは、検索要求を受け付けると、開始日より予め定められた期間(第1既定期間;例えば、1週間)だけ前の評価開始日と、終了日より予め定められた期間(第2既定期間;例えば、1週間)だけ後の評価終了日と、を特定する。ブログ抽出部11aは、評価開始日から評価終了日までの期間を、評価期間として扱う。
ブログ抽出部11aは、評価期間を特定すると、ブログ記憶部31内の複数のブログの中から、イベント期間前ブログとして、テキスト内に検索要求内のキーワードが含まれ、かつ、日付情報が、評価開始日以降で開始日より前の日付を示す基準期間前ブログを抽出する。
また、ブログ抽出部11aは、ブログ記憶部31内の複数のブログの中から、イベント期間後ブログとして、テキスト内に検索要求内のキーワードが含まれ、かつ、日付情報が、特定日以降で評価終了日以前の日付を示す基準期間後ブログを抽出する。
基準期間前ブログは、一般的に第5電子情報と呼ぶことができる。基準期間後ブログは、一般的に第6電子情報と呼ぶことができる。
本実施形態では、ブログ抽出部11aは、イベント期間情報ごとに、イベント期間前ブログと、イベント期間後ブログと、を抽出する。
ブログ抽出部11aは、イベント期間情報ごとに、抽出結果(抽出されたブログ(URL、タイトル、作成(更新)日、内容等))を、評価期間を表す評価期間情報と検索要求と共に、抽出結果記憶部11bに記憶する。
なお、ブログ抽出部11aは、イベント期間前ブログ、または、イベント期間後ブログとして、検索要求に該当するブログのURLと作成(更新)日のみを抽出し、その抽出結果を、抽出結果記憶部11bに記憶してもよい。
評価期間情報が、検索要求に含まれている場合、ブログ抽出部11aは、抽出結果を、検索要求と共に、抽出結果記憶部11bに記憶する。また、検索要求には、検索要求の送信元を特定するためのアクセス情報が付与されているものとする。
ブログ抽出部11aは、抽出結果等を抽出結果記憶部11bに記憶すると、抽出終了通知を、生成部12(具体的には、カウント部12a)に提供する。
生成部12は、一般的に生成手段と呼ぶことができる。
生成部12は、イベント期間情報ごとに、イベント期間前ブログの抽出結果と、イベント期間後ブログの抽出結果と、の違いを表す対比情報を生成し、その対比情報を、検索結果として、利用者PC2に出力する。
本実施形態では、生成部12は、対比情報と共に、少なくとも、検索要求内のキーワードを、検索結果として、利用者PC2に出力する。
カウント部12aは、一般的にカウント手段と呼ぶことができる。
カウント部12aは、抽出終了通知を受け付けた場合、抽出結果記憶部11bから、イベント期間情報ごとに、抽出結果と、評価期間情報と、イベント期間情報と、を読み出す。
カウント部12aは、続いて、開始日より前の日付ごとに、その日付を表す日付情報を含むイベント期間前ブログの数を計数し、かつ、特定日以降の日付ごとに、その日付を表す日付情報を含むイベント期間後ブログの数を計数する。
本実施形態では、カウント部12aは、イベント期間情報ごとに、抽出結果である各ブログをカウント対象として、評価期間内の日付ごとに、その日付を表す日付情報を含むブログの数をカウントする。カウント部12aは、イベント期間情報ごとに、日ごとのカウント結果を、評価期間情報と検索要求と共に、算出部12bに、提供する。
算出部12bは、一般的に算出手段と呼ぶことができる。
算出部12bは、イベント期間情報ごとに、イベント期間前ブログについての日付ごとの計数の結果の平均を表すブログ前件数を算出し、かつ、イベント期間後ブログについての日付ごとの計数の結果の平均を表すブログ後件数を算出する。
ブログ前件数は、一般的に第1平均値と呼ぶことができる。ブログ後件数は、一般的に第2平均値と呼ぶことができる。
算出部12bは、イベント期間情報ごとに、ブログ前件数およびブログ後件数を表す平均件数情報を、対比情報として生成する。
また、算出部12bは、イベント期間情報ごとに、ブログ後件数のブログ前件数に対する比(ブログ後件数をブログ前件数で除算した値)を算出する。算出部12bは、その比(以下「ブログ増加割合」と称する)に応じた増加度情報を、対比情報として、さらに生成する。
算出部12bは、イベント期間情報ごとに、対比情報を、検索要求と共に、出力部12cに提供する。
出力部12cは、一般的に出力手段と呼ぶことができる。
出力部12cは、算出部12bから、イベント期間情報ごとに、対比情報を受け付けた場合、その対比情報を、検索結果として、検索要求の送信元に送信する。なお、出力部12cは、対比情報を、検索結果として、表示部(不図示)に表示してもよい。
本実施形態では、出力部12cは、対比情報を、検索要求と共に、検索要求の送信元に送信する。
なお、図1に示した情報処理装置1は、CD−ROM、ハードディスクまたはメモリに記録されたプログラムに従って動作するコンピュータによって実現されてもよい。CD−ROM、ハードディスクまたはメモリは、一般的に、コンピュータにて読み取り可能な記録媒体と呼ぶことができる。
この場合、コンピュータは、そのプログラムを記録媒体から読み取り実行することによって、抽出部11および生成部12として機能し、情報処理装置1を実現する。
次に、動作を説明する。
図2は、情報処理装置1の動作を説明するためのフローチャートである。以下、図2を参照して情報処理装置1の動作を説明する。以下では、検索要求内に、1つのイベント情報が含まれるとする。
ステップ201で、抽出部11は、利用者PC2から検索要求を受け付けると、ステップ202を実行する。
ステップ202では、抽出部11は、検索要求に基づいて、ブログ記憶部31から、イベント期間前ブログと、イベント期間後ブログと、のそれぞれを抽出する。各ブログの抽出が終了すると、抽出部11は、抽出終了通知を、カウント部12aに提供する。
続いて、ステップ203では、カウント部12aは、抽出終了通知を受け付けると、抽出部11が抽出した各ブログをカウント対象として、評価期間内の日付ごとに、その日付を表す日付情報を含むブログの数をカウントする。カウント部12aは、日付ごとにカウント結果を、評価期間情報と検索要求と共に、算出部12bに提供する。
続いて、ステップ204では、算出部12bは、評価期間情報と、検索要求内のイベント期間情報と、カウント部12aによる日付ごとのカウント結果と、に基づいて、ブログ前件数を算出する。
続いて、ステップ205では、算出部12bは、評価期間情報と、検索要求内のイベント期間情報と、カウント部12aによる日付ごとのカウント結果と、に基づいて、ブログ後件数を算出する。
続いて、ステップ206では、算出部12bは、ブログ後件数をブログ前件数で除算して、ブログ増加割合を算出する。続いて、算出部12bは、ブログ増加割合に応じた増加度情報を生成する。
例えば、算出部12bは、ブログ増加割合が1未満の値を示す場合、「△」を表す画像情報を、増加度情報として生成する。また、算出部12bは、ブログ増加割合が1以上1.5未満の場合、「○」を表す画像情報を、増加度情報として生成する。また、算出部12bは、ブログ増加割合が1.5以上の場合、「◎」を表す画像情報を、増加度情報として生成する。
算出部12bは、増加度情報を生成すると、ブログ前件数と、ブログ後件数と、増加度情報と、検索要求と、評価期間情報とを、出力部12cに提供する。
続いて、ステップ207では、出力部12cは、ブログ前件数と、ブログ後件数と、増加度情報と、検索要求と、評価期間情報とを、検索要求の送信元である利用者PC2に送信する。
利用者PC2は、情報処理装置1から、ブログ前件数と、ブログ後件数と、増加度情報と、検索要求と、評価期間情報と、を受信すると、ブログ前件数と、ブログ後件数と、増加度情報と、検索要求と、評価期間情報と、を表示する。
図3および図4は、利用者PC2での表示例を示した説明図である。
次に、本実施形態の効果を説明する。
本実施形態では、抽出部11は、利用者PC2から検索要求を受け付けると、ブログ記憶部31内の複数のブログの中から、イベント期間前ブログと、イベント期間後ブログと、のそれぞれを抽出する。
生成部12は、イベント期間前ブログの抽出結果と、イベント期間後ブログの抽出結果と、の違いを表す対比情報を生成し、その対比情報を、検索結果として、利用者PC2に出力する。
このため、イベント期間前後で、検索要求に含まれるキーワードが記載されたブログが、どのように変化したかを表す情報を提供することが可能になる。
よって、キーワードが記載されたブログ(電子情報)が、イベント期間(基準期間)の前後で、どのように変化したかを知りたいという要望に応えることが可能になる。
本実施形態では、生成部12は、対比情報と共にキーワードを、検索要求の送信元に送信する。
この場合、対比情報を検証する観点としてキーワードを提供することが可能になる。よって、対比情報の検証を支援することが可能になる。
本実施形態では、カウント部12aが、開始日より前の日付ごとに、その日付を表す日付情報を含むイベント期間前ブログの数を計数し、かつ、特定日以降の日付ごとに、その日付を表す日付情報を含むイベント期間後ブログの数を計数する。
算出部12bは、カウント部12aによる日毎のカウント結果に基づいて、ブログ前件数と、ブログ後件数と、を算出し、ブログ前件数とブログ後件数とを表す平均件数情報を、対比情報として生成する。
出力部12cは、対比情報を、検索要求の送信元(利用者PC2)に送信する。
この場合、イベント期間前後での、キーワードを含むブログの1日あたりの件数の変化を提示することが可能になる。
本実施形態では、算出部12bは、ブログ後件数のブログ前件数に対する比に応じた増加度情報を、対比情報として、さらに生成する。
この場合、イベント期間前後での、キーワードを含むブログの増加度を提示することが可能になる。
本実施形態では、抽出部11は、キーワードとイベント期間情報と評価期間情報とを含む検索要求を受信すると、ブログ記憶部31内の複数のブログの中から、イベント期間前ブログとして、テキスト内にキーワードが含まれ、かつ、日付情報が評価期間のうちでイベント期間より前の日付を示すブログを、イベント期間後ブログとして、テキスト内にキーワードが含まれ、かつ、日付情報が評価期間のうちで特定日以降の日付を示すブログを、それぞれ抽出する。
この場合、ユーザは、自らが望む評価期間を設定することが可能になる。
なお、抽出部11は、キーワードとイベント期間情報とを含むと共に評価期間情報を含まない検索要求を受信すると、イベント期間の前後に予め定められた期間を加えた評価期間を特定し、ブログ記憶部31内の複数のブログの中から、イベント期間前ブログとして、テキスト内にキーワードが含まれ、かつ、日付情報が評価期間のうちでイベント期間より前の日付を示すブログを、イベント期間後ブログとして、テキスト内にキーワードが含まれ、かつ、日付情報が評価期間のうちで特定日より後の日付を示すブログを、それぞれ抽出する。
この場合、ユーザは、評価期間情報を入力する作業を行う必要がなくなる。よって、ユーザの作業負担を軽減することが可能になる。
(第2実施形態)
図5は、本発明の第2実施形態の情報処理装置1Aを示したブロック図である。図5において、図1に示したものと同一構成のものには同一符号を付してある。
図5に示した情報処理装置1Aは、抽出部11の代わりに抽出部11Aを含み、生成部12の代わりに生成部12Aを含む点が、図1に示した情報処理装置1と異なる。以下、情報処理装置1Aについて、情報処理装置1と異なる点を中心に説明する。
生成部12Aは、一般的に生成手段と呼ぶことができ、カウント部12aと、分析部12dAと、算出部12bAと、出力部12cAと、を含む。分析部12dAは、格納部12dA1と、語句分析部12dA2と、記憶部12dA3と、を含む。語句分析部12dA2と、算出部12bAと、出力部12cAとは、語句数情報生成部12eAに含まれる。
抽出部11Aは、一般的に抽出手段と呼ぶことができ、ブログ抽出部11aAと、抽出結果記憶部11bと、を含む。
ブログ抽出部11aAは、ブログ抽出部11と同一の機能を有し、さらに、抽出終了通知を、分析部12dA(具体的には、語句分析部12dA2)に提供する。
分析部12dAは、抽出終了通知を受け付けると、抽出結果記憶部11b内の抽出結果を分析する。
格納部12dA1は、一般的に格納手段と呼ぶことができる。
格納部12dA1は、ポジティブなイメージという種類に予め分類されている語句(以下「ポジティブ語句」と称する)と、ネガティブなイメージという種類に予め分類されている語句(以下「ネガティブ語句」と称する)と、を格納する。
なお、ポジティブ語句とネガティブ語句との関係は、例えば、意味の上で互いに反対の関係になる語の関係、つまり、対義語の関係(例えば、「良い」と「悪い」、「安い」と「高い」)になることが望ましい。
ポジティブなイメージという種類は、一般的に第1種類と呼ぶことができる。ポジティブ語句は、一般的に第1語句と呼ぶことができる。また、ネガティブなイメージという種類は、一般的に第2種類と呼ぶことができる。ネガティブ語句は、一般的に第2語句と呼ぶことができる。
語句数情報生成部12eAは、一般的に語句数情報生成手段と呼ぶことができる。
語句数情報生成部12eAは、抽出終了通知を受け付けると、抽出結果記憶部11bと格納部12dA1とを参照して、イベント期間前ブログ内のポジティブ語句の数およびネガティブ語句の数と、イベント期間後ブログ内のポジティブ語句の数およびネガティブ語句の数と、を計数する。
語句数情報生成部12eAは、計数結果、つまり、イベント期間前ブログ内のポジティブ語句の数およびネガティブ語句の数と、イベント期間後ブログ内のポジティブ語句の数およびネガティブ語句の数と、を表す語句数情報を、対比情報として生成する。
語句数情報生成部12eAは、対比情報を、検索要求の送信元(利用者PC2)に送信する。
語句分析部12dA2は、抽出終了通知を受け付けると、抽出結果記憶部11b内のブログのテキストを、ブログごとに、品詞単位で分解して複数の語句を生成する。
語句分析部12dA2は、ブログごとに複数の語句を生成すると、格納部12dA1を参照して、ブログごとに、複数の語句のそれぞれを、ポジティブ語句、ネガティブ語句、その他の語句に分類する。
語句分析部12dA2は、ブログごとに複数の語句を分類すると、ブログごとに、ポジティブ語句の数(以下「ポジ数」と称する)と、ネガティブ語句の数(以下「ネガ数」と称する)と、をカウントする。
語句分析部12dA2は、ブログごとに、ポジ数とネガ数とをカウントすると、ブログごとにポジ数とネガ数を記憶部12dA3に記憶する。
算出部12bAは、一般的に算出手段と呼ぶことができる。算出部12bAは、算出部12bと同一の機能を有し、さらに、以下の機能を有する。
算出部12bAは、記憶部12dA3を参照して、イベント期間前ブログが有するポジ数の平均値(以下「前ポジ数」と称する)と、イベント期間前ブログが有するネガ数の平均値(以下「前ネガ数」と称する)と、を算出する。
続いて、算出部12bAは、記憶部12dA3を参照して、イベント期間後ブログが有するポジ数の平均値(以下「後ポジ数」と称する)と、イベント期間後ブログが有するネガ数の平均値(以下「後ネガ数」と称する)と、を算出する。
算出部12bAは、前ポジ数と、前ネガ数と、後ポジ数と、後ネガ数と、を表す語句数情報を、対比情報として、出力部12cAに提供する。
出力部12cAは、一般的に出力手段と呼ぶことができる。出力部12cAは、出力部12cと同一の機能を有し、さらに、以下の機能を有する。
出力部12cAは、さらに、語句数情報を、対比情報として、検索要求と共に、検索要求の送信元(利用者PC2)に送信する。
利用者PC2は、情報処理装置1Aから、対比情報と検索要求とを受信すると、さらに、前ポジ数と、前ネガ数と、後ポジ数と、後ネガ数と、を表示する。
本実施形態によれば、語句数情報生成部12eAは、前ポジ数と、前ネガ数と、後ポジ数と、後ネガ数とを計数し、前ポジ数と、前ネガ数と、後ポジ数と、後ネガ数と、を表す語句数情報を、対比情報として生成する。
この場合、イベント期間の前後で、予め定められた語句の数が、どのように変化したかを表すことが可能になる。
なお、図5に示した情報処理装置1Aは、CD−ROM、ハードディスクまたはメモリ等の記録媒体に記録されたプログラムに従って動作するコンピュータによって実現されてもよい。
この場合、コンピュータは、そのプログラムを記録媒体から読み取り実行することによって、抽出部11Aおよび生成部12Aとして機能し、情報処理装置1Aを実現する。
(第3実施形態)
図6は、本発明の第3実施形態の情報処理装置1Bを示したブロック図である。図6において、図5に示したものと同一構成のものには同一符号を付してある。
図6に示した情報処理装置1Bは、抽出部11Aの代わりに抽出部11Bを含み、生成部12Aの代わりに生成部12Bを含む点が、図5に示した情報処理装置1Aと異なる。以下、情報処理装置1Bについて、情報処理装置1Aと異なる点を中心に説明する。
生成部12Bは、一般的に生成手段と呼ぶことができ、カウント部12aと、分析部12dAと、算出部12bAと、出力部12cBと、を含む。
生成部12Bは、対比情報に、イベント期間前ブログの抽出結果と、イベント期間後ブログの抽出結果と、の各々を表示するためのリンク情報を付加し、そのリンク情報が付加された対比情報を、検索要求の送信元である利用者PC2に送信する。
抽出部11Bは、一般的に抽出手段と呼ぶことができ、ブログ抽出部11aBと、抽出結果記憶部11bと、を含む。
ブログ抽出部11aBは、ブログ抽出部11Aと同一の機能を有し、さらに、以下の機能を有する。
ブログ抽出部11aBは、イベント期間前ブログのタイトルもしくはテキストの少なくともいずれかを含む画面データ(以下「前ブログ画面データ」と称する)を作成し、前ブログ画面データを、抽出結果記憶部11bに記憶する。
また、ブログ抽出部11aBは、イベント期間後ブログのタイトルもしくはテキストの少なくともいずれかを含む画面データ(以下「後ブログ画面データ」と称する)を作成し、後ブログ画面データを、抽出結果記憶部11bに記憶する。
ブログ抽出部11aBは、前ブログ画面データおよび後ブログ画面データとして、例えば、HTML(HyperText Markup Language)ファイルの前ブログ画面データおよび後ブログ画面データを作成する。
出力部12cBは、一般的に出力手段と呼ぶことができる。出力部12cBは、出力部12cAと同一の機能を有し、さらに、以下の機能を有する。
出力部12cBは、対比情報である平均件数情報に、前件数がクリックされた際に抽出結果記憶部11b内の前ブログ画面データに応じた画面を表示するためのリンク情報(前ブログ画面データのURLなど)を付加し、さらに、後件数がクリックされた際に抽出結果記憶部11b内の後ブログ画面データに応じた画面を表示するためのリンク情報(後ブログ画面データのURLなど)を付加する。
出力部12cBは、リンク情報が付加された平均件数情報を、他の対比情報および検索要求と共に、検索要求の送信元(利用者PC2)に送信する。
本実施形態によれば、生成部12Bは、対比情報に、イベント期間前ブログの抽出結果と、イベント期間後ブログの抽出結果と、の各々を表示するためのリンク情報を付加し、そのリンク情報が付加された対比情報を、検索要求の送信元である利用者PC2に送信する。
この場合、ユーザは、例えば、対比情報をクリックすることによって、イベント期間前ブログ、または、イベント期間後ブログを確認することが可能になる。
なお、図6に示した情報処理装置1Bは、CD−ROM、ハードディスクまたはメモリ等の記録媒体に記録されたプログラムに従って動作するコンピュータによって実現されてもよい。
この場合、コンピュータは、そのプログラムを記録媒体から読み取り実行することによって、抽出部11Bおよび生成部12Bとして機能し、情報処理装置1Bを実現する。
上記各実施形態では、電子情報としてブログを用いたが、電子情報は、ブログに限らず、HP、電子メールでもよい。
以上説明した各実施形態において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。
本発明の第1実施形態の情報処理装置1を示したブロック図である。 情報処理装置1の動作を説明するためのフローチャートである。 利用者PC2での検索結果の表示例を示した説明図である。 利用者PC2での検索結果の他の表示例を示した説明図である。 本発明の第2実施形態の情報処理装置1Aを示したブロック図である。 本発明の第3実施形態の情報処理装置1Bを示したブロック図である。
符号の説明
1、1A、1B 情報処理装置
11、11A、11B 抽出部
11a、11aA、11aB ブログ抽出部
11b 抽出結果記憶部
12、12A、12B 生成部
12a カウント部
12b、12bA 算出部
12c、12cA、12cB 出力部
12dA 分析部
12dA1 格納部
12dA2 語句分析部
12dA3 記憶部
12eA 語句数情報生成部
2 利用者PC
3 ブログサーバ
31 ブログ記憶部
4 ネットワーク

Claims (12)

  1. テキストと、当該テキストの作成日または更新日を表す日付情報と、を含む複数の電子情報を記憶する記憶装置と、通信可能な情報処理装置であって、
    開始日と終了日とを表す期間情報と、キーワードと、を含む検索要求が入力されると、前記記憶装置内の複数の電子情報の中から、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日より前の日付を示す第1電子情報と、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日と前記終了日のいずれかである特定日以降の日付を示す第2電子情報と、のそれぞれを抽出する抽出手段と、
    前記第1電子情報の抽出結果と、前記第2電子情報の抽出結果と、の違いを表す対比情報を生成する生成手段と、を含む情報処理装置。
  2. 請求項1に記載の情報処理装置において、
    前記抽出手段は、送信されてきた前記検索要求を受信し、
    前記生成手段は、前記対比情報と共に前記キーワードを、前記検索要求の送信元に送信する出力手段を含む、情報処理装置。
  3. 請求項1または2に記載の情報処理装置において、
    前記生成手段は、
    前記開始日より前の日付ごとに、当該日付を表す日付情報を含む前記第1電子情報の数を計数し、かつ、前記特定日以降の日付ごとに、当該日付を表す日付情報を含む前記第2電子情報の数を計数するカウント手段と、
    前記第1電子情報についての日付ごとの計数の結果の平均を表す第1平均値を算出し、かつ、前記第2電子情報についての日付ごとの計数の結果の平均を表す第2平均値を算出し、前記第1平均値および前記第2平均値を表す平均件数情報を、前記対比情報として生成する算出手段と、を含む、情報処理装置。
  4. 請求項3に記載の情報処理装置において、
    前記算出手段は、前記第2平均値の前記第1平均値に対する比に応じた増加度情報を、前記対比情報として、さらに生成する、情報処理装置。
  5. 請求項1から4のいずれか1項に記載の情報処理装置において、
    前記生成手段は、
    第1種類に予め分類されている第1語句と、前記第1分類と異なる第2種類に予め分類されている第2語句と、を格納する格納手段と、
    前記第1電子情報内の前記第1語句の数および前記第2語句の数と、前記第2電子情報内の前記第1語句の数および前記第2語句の数と、を計数し、前記第1電子情報内の前記第1語句の数および前記第2語句の数と、前記第2電子情報内の前記第1語句の数および前記第2語句の数と、を表す語句数情報を、前記対比情報として生成する語句数情報生成手段と、を含む、情報処理装置。
  6. 請求項1から5のいずれか1項に記載の情報処理装置において、
    前記生成手段は、前記対比情報に、前記第1電子情報の抽出結果と、前記第2電子情報の抽出結果と、の各々を表示するためのリンク情報を付加する、情報処理装置。
  7. 請求項1から6のいずれか1項に記載の情報処理装置において、
    前記検索要求は、前記開始日より前の評価開始日と、前記終了日より後の評価終了日と、を表す評価期間情報をさらに含むものであり、
    前記抽出手段は、前記検索要求を受け付けると、前記記憶装置内の複数の電子情報の中から、前記第1電子情報として、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記評価開始日以降で前記開始日より前の日付を示す第3電子情報を抽出し、前記第2電子情報として、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記特定日以降で前記評価終了日以前の日付を示す第4電子情報を抽出する、情報処理装置。
  8. 請求項1から6のいずれか1項に記載の情報処理装置において、
    前記抽出手段は、前記検索要求を受け付けると、前記開始日より予め定められた期間だけ前の評価開始日と、前記終了日より予め定められた期間だけ後の評価終了日と、を特定し、前記記憶装置内の複数の電子情報の中から、前記第1電子情報として、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記評価開始日以降で前記開始日より前の日付を示す第5電子情報を抽出し、前記第2電子情報として、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記特定日以降で前記評価終了日以前の日付を示す第6電子情報を抽出する、情報処理装置。
  9. テキストと、当該テキストの作成日または更新日を表す日付情報と、を含む複数の電子情報を記憶する記憶装置と、通信可能な情報処理装置が行う対比情報出力方法であって、
    開始日と終了日とを表す期間情報と、キーワードと、を含む検索要求が入力されると、前記記憶装置内の複数の電子情報の中から、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日より前の日付を示す第1電子情報と、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日と前記終了日のいずれかである特定日以降の日付を示す第2電子情報と、のそれぞれを抽出する抽出ステップと、
    前記第1電子情報の抽出結果と、前記第2電子情報の抽出結果と、の違いを表す対比情報を生成する生成ステップと、を含む対比情報出力方法。
  10. 請求項9に記載の対比情報出力方法において、
    前記抽出ステップでは、送信されてきた前記検索要求を受信し、
    前記生成ステップでは、前記対比情報と共に前記キーワードを、前記検索要求の送信元に送信する出力ステップを含む、対比情報出力方法。
  11. テキストと、当該テキストの作成日または更新日を表す日付情報と、を含む複数の電子情報を記憶する記憶装置と、通信可能なコンピュータに、
    開始日と終了日とを表す期間情報と、キーワードと、を含む検索要求が入力されると、前記記憶装置内の複数の電子情報の中から、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日より前の日付を示す第1電子情報と、前記テキスト内に当該キーワードが含まれ、かつ、前記日付情報が、前記開始日と前記終了日のいずれかである特定日以降の日付を示す第2電子情報と、のそれぞれを抽出する抽出手順と、
    前記第1電子情報の抽出結果と、前記第2電子情報の抽出結果と、の違いを表す対比情報を生成する生成手順と、を実行させるためのプログラム。
  12. 請求項11に記載のプログラムにおいて、
    前記抽出手順では、送信されてきた前記検索要求を受信し、
    前記生成手順では、前記対比情報と共に前記キーワードを、前記検索要求の送信元に送信する出力手順を含む、プログラム。
JP2008250336A 2008-09-29 2008-09-29 情報処理装置、対比情報出力方法およびプログラム Pending JP2010079826A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008250336A JP2010079826A (ja) 2008-09-29 2008-09-29 情報処理装置、対比情報出力方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008250336A JP2010079826A (ja) 2008-09-29 2008-09-29 情報処理装置、対比情報出力方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2010079826A true JP2010079826A (ja) 2010-04-08

Family

ID=42210156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008250336A Pending JP2010079826A (ja) 2008-09-29 2008-09-29 情報処理装置、対比情報出力方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2010079826A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215647A (ja) * 2001-01-24 2002-08-02 Nec Corp テキストマイニング装置及びそれに用いるテキストマイニング方法並びにそれらに用いるプログラム
JP2003085347A (ja) * 2001-09-11 2003-03-20 Fuji Xerox Co Ltd 組織コミュニケーション分析支援装置及び方法
JP2003157255A (ja) * 2001-11-20 2003-05-30 Just Syst Corp 情報処理装置、情報処理方法、及び情報処理プログラム
JP2005322239A (ja) * 2000-08-21 2005-11-17 Fujitsu Ltd 自然文処理装置、自然言語処理方法及び自然文処理用プログラム
JP2008084151A (ja) * 2006-09-28 2008-04-10 Just Syst Corp 情報表示装置および情報表示方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005322239A (ja) * 2000-08-21 2005-11-17 Fujitsu Ltd 自然文処理装置、自然言語処理方法及び自然文処理用プログラム
JP2002215647A (ja) * 2001-01-24 2002-08-02 Nec Corp テキストマイニング装置及びそれに用いるテキストマイニング方法並びにそれらに用いるプログラム
JP2003085347A (ja) * 2001-09-11 2003-03-20 Fuji Xerox Co Ltd 組織コミュニケーション分析支援装置及び方法
JP2003157255A (ja) * 2001-11-20 2003-05-30 Just Syst Corp 情報処理装置、情報処理方法、及び情報処理プログラム
JP2008084151A (ja) * 2006-09-28 2008-04-10 Just Syst Corp 情報表示装置および情報表示方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
村田真樹, 事例で学ぶ テキストマイニング, vol. 初版, JPN6012041874, 15 January 2008 (2008-01-15), JP, pages 22 - 23, ISSN: 0002301342 *

Similar Documents

Publication Publication Date Title
US20180157636A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
CN107729475B (zh) 网页元素采集方法、装置、终端与计算机可读存储介质
US8972498B2 (en) Mobile-based realtime location-sensitive social event engine
JP5454357B2 (ja) 情報処理装置および方法、並びに、プログラム
JP6206840B2 (ja) テキストマッチング装置、テキスト分類装置及びそれらのためのコンピュータプログラム
US10949753B2 (en) Causal modeling and attribution
US20150081611A1 (en) Method and system for presenting personalized content
US20170103329A1 (en) Knowledge driven solution inference
WO2018080781A1 (en) Systems and methods for monitoring and analyzing computer and network activity
US10733247B2 (en) Methods and systems for tag expansion by handling website object variations and automatic tag suggestions in dynamic tag management
JP2019519019A (ja) テキストタイプを識別する方法、装置及びデバイス
CN107526718B (zh) 用于生成文本的方法和装置
US11651015B2 (en) Method and apparatus for presenting information
CN113688310B (zh) 一种内容推荐方法、装置、设备及存储介质
JP5848199B2 (ja) 影響力予測装置、影響力予測方法、及びプログラム
CN110807311A (zh) 用于生成信息的方法和装置
JP2014534542A (ja) ユーザ作成コンテンツの処理方法及び装置
CN110738056B (zh) 用于生成信息的方法和装置
KR102422844B1 (ko) 인공지능에 기반하여 영상 컨텐츠의 언어 위기를 관리하는 방법
KR101105798B1 (ko) 키워드 정련 장치 및 방법과 그를 위한 컨텐츠 검색 시스템 및 그 방법
JP4774087B2 (ja) 動画評価方法、装置及びプログラム
US20220084312A1 (en) Processing apparatus, processing method, and non-transitory storage medium
JP2006331348A (ja) トラックバック元のコメント・トラックバックの集約方法及び装置及びプログラム及びプログラムを格納した記憶媒体
WO2021117483A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2010079826A (ja) 情報処理装置、対比情報出力方法およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120814