JP2006227925A - 情報提供方法および情報提供装置 - Google Patents

情報提供方法および情報提供装置 Download PDF

Info

Publication number
JP2006227925A
JP2006227925A JP2005041038A JP2005041038A JP2006227925A JP 2006227925 A JP2006227925 A JP 2006227925A JP 2005041038 A JP2005041038 A JP 2005041038A JP 2005041038 A JP2005041038 A JP 2005041038A JP 2006227925 A JP2006227925 A JP 2006227925A
Authority
JP
Japan
Prior art keywords
information
topic
comment
providing
collecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005041038A
Other languages
English (en)
Inventor
Ikumi Fukuda
郁美 福田
Osamu Nakagawa
修 中川
Mitsuaki Morimoto
光昭 森本
Tomohiro Nihongi
智洋 二本木
Eisuke Ishikawa
英介 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2005041038A priority Critical patent/JP2006227925A/ja
Publication of JP2006227925A publication Critical patent/JP2006227925A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 インターネット上に存在するWebサイトから、話題となるトピックス情報と論評情報とを収集し、収集した情報を集約した情報を提供できる情報提供サーバを提供する。
【解決手段】 情報提供サーバ10のトピックス情報収集手段110は、ニュースサイト20からトピックス情報としてニュース記事210を収集し、論評情報収集手段120は、論評情報として、pingサーバ40を利用して、ブログ運営サーバ30からブログコンテンツ310を収集する。コンテンツ生成手段130は、ニュース記事210に関連するブログコンテンツ310を抽出し、ニュース記事210と抽出したブログコンテンツ310とを集約したコンテンツ131を生成し、インターネット60を介して、生成したコンテンツ131を配信する。
【選択図】 図2

Description

本発明は、インターネット上に存在するWebサイトから情報を収集し、収集した情報を集約して提供する情報提供方法および装置であって、更に詳しくは、新しい出来事などの話題となるトピックス情報と、このトピックス情報に関する論評を掲載している論評情報とを集約して提供する情報提供方法および装置に関する。
インターネット上では、ホームページ(Home Page)やブログ(blog:Web Logの略)などで様々な情報が公開され、現在、インターネットはリアルタイムで必要な情報を入手できる有用な情報源になっている。また、ブログが有するトラックバック機能を用いることで、見知らぬ者同士が容易に意見交換を行う場としても、インターネットは活用されている。
一般的にインターネットから必要な情報を入手する際は、ホームページを探索するサーチエンジンとも呼ばれるWebサイトにキーワードを入力し、キーワードに合致したWebページの一覧表を辿ることで、入手したい情報を探索する手法が用いられている。
しかしながら、年月が経つに連れて、インターネット上に公開される情報量は膨大な量に膨れ上がり、サーチエンジンで抽出されるWebページの数も莫大になってしまうため、ユーザの要求にあったWebページのみを自動的に抽出してユーザに提供する情報フィルタリングシステムも開発されている(例えば、特許文献1,2および3)。
特許文献1で開示されているシステムは、インターネット上で配信される複数のニュース記事から、ユーザが指定した探索条件(キーワード)に合致したニュース記事を、予め設定されたURL(Universal Resource Location)で特定されるWebサイトから抽出し、この探索条件と類似度の高いニュース記事のみをユーザに提供するシステムである。また、特許文献2で開示されている装置は、予め設定されたURLで特定されるWebサイトから、ユーザが指定したテーマに対する批評情報が記載された情報のみを抽出し、ユーザに提供する装置である。
加えて、特許文献3で開示されている装置は、特許文献2で開示されている技術に加え、HTMLのタグ情報に基づいてWebページをブロック化して解析することで、批評情報(風評情報)の抽出性能を高めると共に、批評情報(風評情報)が記載されたWebページに張られたリンク情報を辿ることで、予め設定されたURL以外のWebサイトからも批評情報(風評情報)を取得できる装置である。
実際に企業のマーケティング活動の情報収集においてインターネットを活用する場合、上述した従来技術を用いて、自社製品の批評情報を収集したり、他社製品の開発動向および他社製品の批評情報を収集したりして、入手した批評情報を次の製品にフィードバックさせることは重要なことである。しかしながら、上述した技術でインターネットから得られる情報(ニュース記事や批評記事)は、ユーザによって指定されたテーマ(すなわち、探索条件)に関する情報のみであって、このテーマに関連する以外の情報を入手できない問題があった。
例えば、企業戦略を立案するときや、一つの企業が自社(他社)の強みや弱みの分析をするときは、この企業の事業分野(関連する分野)のみならず、様々な分野の情報を入手することが必要になる。例えば、インターネットで配信されるニュース記事全般に目を通すことで、自社に関連する分野の出来事・傾向に関する情報が収集できるばかりか、新たな事業となり得る出来事も発見することができる。
また、インターネットから入手した情報を分析する際は、世の中で起こったトピックス(例えば、ニュース記事)と批評情報を時系列で解析(表示)することも必要になるが、前述した従来技術は、複数のトピックスに関連付けて批評情報を解析(表示)する機能は備えていない。
加えて、インターネットから批評情報を収集する際は、事前に設定されたURLで特定されるWebサイトの情報、もしくはこのURLに張られたリンク情報を辿ることで得られるWebサイトの情報のみならず、より多くのWebサイトから情報を収集することが必要である。何故なら、あるURLで特定されるWebサイトに記事を書き込む者は決まっている場合が多く、このWebに記載された批評記事は偏った内容になってしまっている傾向がしばしば見受けられるからである。
特開平11―53392号公報 特開2001−155021号公報 特開2004−70405号公報
そこで、上述した問題を鑑みて、本発明は、新しい出来事などの話題となるトピックス情報は固定ではなく、世の中で発生した様々なトピックス情報に対して、このトピック情報とトピックス情報に対する感想・コメントなどを記述した論評情報とを集約して配信する情報提供方法および装置を提供することを目的とする。更には、事前に設定されたURLで特定されるWebサイトの論評情報、もしくはこのURLに張られたリンク情報を辿ることで得られるWebサイトの論評情報のみならず、より多くのWebサイトから論評情報を収集することができる情報提供サーバおよび情報提供方法を提供することも目的とする。
上述した課題を解決する第1の発明の第1の態様は、ネットワーク上に存在するWebサイトから情報を収集し、収集した情報を集約して提供する情報提供方法であって、前記情報提供方法は、前記ネットワークを介してWebサイトで公開されている情報を収集する情報収集工程と、収集した情報を集約した提供情報を、前記ネットワークを介して提供する情報提供工程とを、任意の順で実行する情報提供方法である。
前記情報収集工程で前記Webサイトから収集される情報は、定められた第1のトリガが発生するごとに、予め設定された前記Webサイトにアクセスすることで収集される新しい出来事などの話題となるトピックス情報と、定められた第2のトリガが発生するごとに、前記ネットワーク上に存在し、多くの人が意見を発信している情報源から、個人または団体の論評を掲載している論評情報とであって、前記情報提供工程においては、前記情報収集工程で収集した前記トピックス情報の中から前記提供情報に含ませる前記トピックス情報を、所定の基準に基づいて選択し、前記提供情報に含ませる前記トピックス情報のリストを生成した後、前記リストに含まれる各々の前記トピックス情報ごとに、前記情報収集工程で収集した前記論評情報の中から関連度の高い前記論評情報を抽出する。そして、前記リストに含まれる各々の前記トピックス情報ごとに、この前記トピックス情報と関連度の高い前記論評情報とを関連付けて表示する提供情報を生成し、生成した前記提供情報を、前記ネットワークを介して配信する。
第1の発明の第1の態様においては、話題となるトピックス情報さえも、ネットワーク(好ましくはインターネット)上のWebサイトから収集されるため、トピック情報は固定されず、ユーザによって指定されたテーマ以外のトピック情報も取得できる。また、提供するトピックス情報に関連する論評情報を抽出し、このトピックス情報と抽出した論評情報を集約した情報を提供情報とすることで、ユーザはトピックス情報に対する第3者の意見を取得できる。
ここで、多くの人が意見を発信している情報源とは、、電子掲示板(BBS、Bulletin Board System)やウェブログ(Web Log)などのインターネット上の情報源を意味する。また、ここで、トリガとは、1日ごとや1週間ごとといった時間的な事象(内部トリガ)や、あるWebサイトから更新通知情報を受信したときなどといった電気信号的な事象(外部トリガ)を意味する。
更に、第1の発明の第2の態様は、第1の態様の情報提供方法において、前記情報提供ステップで生成される前記提供情報を、前記トピックス情報が記載された前記リストと、前記リストに含まれる一つの前記トピックス情報が選択されると、選択された前記トピックス情報とこの前記トピックス情報と関連度の高い前記論評情報とが階層表示される情報とした方法である。前記トピックス情報と関連度の高い前記論評情報とが階層表示されることで、前記提供情報を閲覧するユーザは、ユーザ自身が興味のある前記トピックス情報に関する前記論評情報を容易に閲覧することができる。
更に、第1の発明の第3の態様は、第1、2の態様の情報提供方法において、前記情報収集工程に含まれる前記トピックス情報収集ステップで収集されるトピックス情報は、ニュースサイトで公開されているニュース記事としたものである。トピックス情報をニュース記事とすることで、最新のトピックス情報を一括してニュースサイトから収集することができる。
更に、第1の発明の第4の態様は、本発明の第1から第3の態様いずれかに記載の情報提供方法において、前記情報収集工程に含まれる前記論評情報収集ステップで収集される前記論評情報は、ウェブログで公開されているウェブログコンテンツ、もしくは、前記ウェブログコンテンツの更新日時、タイトルおよび要約などが記述された更新情報としたものである。前記論評情報を前記ウェブログコンテンツもしくは前記更新情報とすることで、前記更新情報が前記ウェブログから送信される更新情報通知サーバにアクセスすることで、様々な前記論評情報を一括して収集することができる。
更に、第1の発明の第5の態様は、第1の態様から第4の態様のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記論評情報抽出ステップは、少なくとも、前記トピックス情報が掲載されているURLにリンクがはられている前記論評情報を抽出する手順を実行するステップであることを特徴とする。前記トピックス情報が掲載されているURLにリンクがはられている前記論評情報を抽出することで、前記トピックス情報にコメントしている前記論評情報を抽出できる。
更に、第1の発明の第6の態様は、第1の態様から第5の態様のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記論評情報抽出ステップは、少なくとも、前記トピックス情報と前記論評情報との類似度を演算し、演算した前記類似度に基づいて前記論評情報を抽出する手順を実行するステップであることを特徴とする。前記類似度に基づいて前記論評情報を抽出することで、前記トピックス情報と関連性の高い前記論評情報を抽出することができる。
更に、第1の発明の第7の態様は、第1の態様から第6の態様のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記提供情報生成ステップで生成される前記提供情報には、前記トピックス情報で記述されたテキスト情報が含まれ、前記テキスト情報は、他のWebページの位置を示すリンクが埋め込まれている情報(例えば、ハイパーテキスト)であって、前記提供情報生成ステップは、前記テキスト情報を取得する手順を実行することを特徴とする。前記提供情報に前記テキスト情報を含ませることで、前記トピックス情報に関連する他の前記トピックス情報(例えば、プレスリリースなどの企業情報)をも提供できる。
更に、第1の発明の第8の態様は、第1の態様から第7の態様のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記提供情報生成ステップで生成される前記提供情報には、前記トピックス情報に関連するキーワードが含まれ、前記論評情報抽出ステップもしくは前記提供情報生成ステップは、提供する前記トピックス情報からキーワードを抽出する手順を実行することを特徴とする。前記提供情報に前記トピックス情報から抽出したキーワードを含ませることで、前記トピックス情報に関連する他の情報を探索するときに役立てることができる。
更に、第1の発明の第9の態様は、第1の態様から第8の態様のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記提供情報生成ステップは、前記提供情報に含まれるそれぞれの情報を区別して表示する情報を生成するステップであることを特徴とする。前記提供情報に含まれる情報をカテゴリーごとに区別して表示することで、ユーザは容易にそれぞれの情報を把握できる。
上述した課題を解決する第2の発明の第1の態様は、ネットワーク上に存在するWebサイトから情報を収集し、収集した情報を集約して提供する情報提供装置であって、前記情報提供装置は、前記ネットワークを介して、定められた第1のトリガが発生するごとに、予め設定されたWebサイトから、新しい出来事などの話題となるトピックス情報を収集するトピックス情報手段と、定められた第2のトリガが発生するごとに、多くの人が意見を発信している情報源から、個人または団体の論評を掲載している論評情報とを収集する論評情報収集手段と、前記トピックス情報収集手段が収集した前記トピックス情報および前記論評情報収集手段が収集した前記論評情報とを集約した提供情報を生成し、前記ネットワークを介して生成した前記提供情報を提供する情報提供手段とを備え、前記情報提供手段は、前記トピックス情報収集手段が収集した前記トピックス情報の中から前記提供情報に含ませる前記トピックス情報を、所定の基準に基づいて選択し、前記提供情報に含ませる前記トピックス情報のリストを生成し、前記リストに含まれる各々の前記トピックス情報ごとに、この前記トピックス情報と関連度の高い前記論評情報を収集した前記論評情報の中からを抽出し、前記リストに含まれる各々の前記トピックス情報ごとに、この前記トピックス情報と抽出した前記論評情報とを関連付けて表示する前記提供情報を生成することを特徴とする。
更に、第2の発明のの第2の態様は、第1の態様の情報提供装置において、生成される前記提供情報は、前記トピックス情報が記載された前記リストと、前記リストに含まれる一つの前記トピックス情報が選択されると、選択された前記トピックス情報とこの前記トピックス情報と関連度の高い前記論評情報とが階層表示される情報とした装置である。
更に、第2の発明の第3の態様は、第1、2の態様に記載の情報提供装置において、前記情報提供装置に備えられた前記情報収集手段は、一つ以上のニュースサイトにアクセスし、前記ニュースサイトが配信しているニュース記事、および/または、構造化文書で記述された前記ニュース記事の見出し情報を、前記トピックス情報として収集する手段であることを特徴とする。ここで、構造化文書とは、XMLフォーマット、RDFフォーマット(Resource Description Framework)またはRSSフォーマット(Rich Site Summary, RDF Site Summary)で記述された文書を意味する。
更に、第2の発明の第4の態様は、第1の態様から第3の態様のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記論評情報収集手段が収集する前記論評情報は、ウェブログで公開されているウェブログコンテンツ、もしくは、前記ウェブログコンテンツの更新日時、タイトルおよび要約などを記述した更新情報であって、前記論評情報収集手段は、複数の前記ウェブログから前記更新情報が送信される複数の更新情報通知サーバにアクセスし、それぞれの前記更新情報通知サーバから前記更新情報を取得することで、前記ウェブログコンテンツもしくは前記更新情報を前記論評情報として収集することを特徴する。
更に、第2の発明の第5の態様は、第1の態様から第4の態様のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段は、前記提供情報を生成する際、少なくとも、前記一覧表に含まれる前記トピックス情報が掲載されているURLにリンクがはられている前記論評情報を抽出することを特徴とする。
更に、第2の発明の第6の態様は、第1の態様から第5の態様のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段は、前記提供情報を生成する際、前記トピックス情報と前記論評情報との類似度を演算する機能を有し、少なくとも、演算した前記類似度に基づいて前記論評情報を抽出することを特徴とする。
更に、第2の発明の第7の態様は、第1の態様から第6の態様のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段で生成される前記提供情報は、前記トピックス情報で記述されているテキスト情報が含まれ、前記テキスト情報は、他のWebページの位置を示すリンクが埋め込まれている情報であって、前記提供情報手段は、前記提供情報を生成するために前記テキスト情報を取得することを特徴とする。
更に、第2の発明の第8の態様は、第1の態様から請求7態様のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段で生成される前記提供情報には、前記トピックス情報に関連するキーワード情報が含まれ、前記情報提供手段は、提供する前記トピックス情報から前記キーワード情報を抽出することを特徴とする。
更に、第2の発明の第9の態様は、第1の態様から請求8態様のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段は、前記提供情報に含まれる情報をカテゴリーごとに区別して表示する情報を生成することを特徴とする。
上述した本発明によれば、主題となるトピックス情報は固定ではなく、様々なトピックス情報に対して、トピックス情報に対する感想・コメントなどを記述した論評情報を集約して配信する情報提供方法および装置を提供できる。更には、事前に設定されたURLで特定されるWebサイトの論評情報、もしくはこのURLに張られたリンク情報を辿ることで得られるWebサイトの論評情報のみならず、より多くのWebサイトから論評情報を収集することができる情報提供サーバおよび情報収集方法を提供できる。
<情報提供サーバの説明>
図1は、本発明に係る情報提供サーバを配置したネットワークシステムの一例を示した図である。図1に示したように、このシステムは、ニュース記事を配信するニュースサーバ20と、ブログサービスが運営されている複数のWebサーバ30(以下、ブログ運営サーバ30)と、それぞれのブログ運営サーバ30で公開される情報の更新情報が記憶されている更新通知pingサーバ40と、本発明に係り、ニュースサーバ20およびブログ運営サーバ30から情報を収集し、収集した情報が集約された提供情報(以下、コンテンツと記す)を提供する情報提供装置として情報提供サーバ10と、情報提供サーバ10が配信するコンテンツを閲覧するユーザが所持するユーザPC50とから構成され、それぞれのサーバはインターネット60を介して接続されている。
図1において、情報提供サーバ10は、実社会で発生した新しい出来事などの話題となるトピックス情報として、ニュースサーバ20からニュース記事を、論評情報としてブログ運営サーバ30から個人がブログサービスを利用して発信している情報(以下、ブログコンテンツと記す)を収集する。そして、情報提供サーバ10は、収集したニュース記事にこのニュース記事に関連するブログコンテンツを関連付けて集約したコンテンツを生成し、インターネット60を介して生成したコンテンツを配信する。
このような構成によって、以下に述べる内容で、情報提供サーバ10は、固定されたトピックスではなく、世の中で発生した様々なトピックス情報と論評情報とを収集し、収集した情報を集約して配信する。様々なトピックス情報に対する論評情報を集約して配信することは、企業に対してマーケティング活動支援を提供できるのみならず、生活者に対しては、情報収集の利便性に加えてコミュニケーションの楽しみをも提供することができる(ブログに書き込んだあるトピックス情報に対するコメントが、情報提供サーバ10が配信するコンテンツに反映される)。
なお、図1においては、説明を分かり易くするために、ニュースサーバ20、更新通知pingサーバ40およびユーザPC50は一台としているが、当然、これらのサーバは複数台のサーバがインターネット60に接続されていても本発明を適用することができる。また、図1においては、便宜上、情報提供サーバ10を単独のサーバとしているが、情報提供サーバ10は複数台のコンピュータによって構成されていても構わない。
図2は、情報提供サーバのブロック図である。図1のニュースサーバ20は、インターネット60を介して配信するニュース記事210と、ニュース記事210のタイトルや要約などをRSS(Rich Site Summary,RDF Site Summary)フォーマットで記述した見出し情報220を有している。なお、本実施の形態においては、見出し情報220はRSSフォーマットで記述されているが、ニュース記事210の要約(見出し)はRDF(Resource Description Framework)フォーマット等の他のフォーマットで記述されていてもよい。
ブログ運営サーバ30では、大勢の人が、ある出来事に対する内容や個人的な内容を記述したがブログコンテンツ310を、ブログサービスを利用して公開している。ブログコンテンツ310が更新するごとに、更新されるブログコンテンツ310の要約・URL等の情報は更新通知pingサーバ40に送信され、RSSフォーマット(もしくはRDFフォーマット)で記述された更新情報410が更新通知pingサーバ40に記憶される。すなわち、情報提供サーバ10は、更新通知pingサーバ40に記憶された更新情報410を入手することで、ブログサービスを利用して公開されているブログコンテンツ310を取得できる。
情報提供サーバ10は、世の中で発生した新しい出来事などの話題となるトピックス情報として、ニュースサーバ20からニュース記事210を取得するトピックス情報収集手段110と、ブログ運営サーバ30からブログコンテンツ310を収集し、収集したブログコンテンツ310のインデックス情報311を生成する論評情報収集手段120と、ニュース記事210に関連するブログコンテンツ310を抽出する機能を備え、ニュース記事210と抽出したブログコンテンツ310とを集約したコンテンツ131を生成し配信するコンテンツ生成手段130と、情報を記憶する記憶装置140とを備え、記憶装置を除く情報提供サーバ10に備えられたこれらの手段は、情報提供サーバ10に組み込まれたプログラムで実現される。
<・ニュース記事の収集についての説明>
情報提供サーバ10に備えられたトピックス情報収集手段110について説明する。情報提供サーバ10は、国内外の経済状況、新製品、または天候など、世の中で発生する様々なニュース記事210(もしくは見出し情報220)を収集するために、トピックス情報収集手段110を備えている。トピックス情報収集手段110は、ある一定時間(例えば、数時間)が経過するごと、もしくは、ニュースサーバ20から更新通知情報が送信されるごとに、ニュースサーバ20からニュース記事210(もしくは見出し情報220)を収集し、収集した情報を記憶装置140に記憶する。
ここから、情報提供サーバ10に備えられたトピックス情報収集手段110がニュースサーバ20からニュース記事210(もしくは見出し情報220)を収集する手順について説明する。図3は、ニュース記事210を収集する手順を示したフロー図である。ニュース記事210を収集する手順を説明することで、情報提供サーバ10に備えられたトピックス情報収集手段110の詳細な内容についても明らかになる。
ニュース記事210を収集する手順の最初のステップS10は、ニュースサーバ20にアクセスし、配信されているニュース記事210の見出し情報220を取得するステップである。トピックス情報収集手段110は、インターネット60を利用してニュース記事210を配信しているニュースサーバ20のURLを記憶し、記憶しているURLのニュースサーバ20にアクセスして見出し情報220を取得する。なお、トピックス情報収集手段110が記憶しているニュースサーバ20のURLは一つ以上であることが望ましい。
図4は、ニュースサーバ20に格納されている見出し情報220を説明する図である。見出し情報220はRSSフォーマットで記述され、図4(a)に示したように見出し情報220には、RSSフォーマットの定義情報、ニュースサーバ20に関する情報(例えば、URL)および配信されているニュース記事210のリスト(例えば、ニュース記事210のインデックス)を含むチャンネル情報に加えて、複数(ここではM個)の配信されているニュース記事210の要約情報221などが含まれる。
図4(b)は、見出し情報220の要約情報221を説明する図である。図4(b)に示したようにニュース記事210の要約情報221には、ニュース記事210のタイトル、ニュース記事210が公開されているWebページのURL、ニュース記事210の要約などの情報が含まれる。トピックス情報収集手段110は見出し情報220を取得し解析することで、ニュース記事210が公開されているWebページのURLにアクセスすることでニュースサーバ20から配信されているニュース記事210を取得できる。
図4を用いて説明したように、ステップS10で取得する見出し情報220には、ニュース記事210の要約が含まれるため、ニュース記事210の代わりとして見出し情報220を利用することができる。見出し情報220のみを収集する場合は、このステップS10をもって手順は終了する。
次のステップS11は、ステップS10で取得した見出し情報220を解析し、見出し情報220で示されるニュース記事210を収集するステップである。このステップS11をもって、ニュース記事を収集する工程は終了する。なお、ステップS10で見出し情報220を取得できない場合は、このステップS11では、ニュースサーバ20の各Webページで公開されているニュース記事210を収集する。
<・論評情報の収集についての説明>
情報提供サーバ10に備えられた論評情報収集手段120について説明する。情報提供サーバ10は、国内外の経済状況、新製品、または天候など、世の中で発生する様々なトピックスに対して、個人が発信している論評を収集するために論評情報収集手段120を備える。本実施の形態においては、論評情収集手段120は、ある一定時間(例えば、数時間)が経過するごと、もしくは、更新通知pingサーバ40から更新通知情報が送信されるごとに、インターネット60を介してブログコンテンツ310を論評情報として収集し、ブログコンテンツ310を収集した後、収集したブログコンテンツ310のインデックス情報311を生成し、収集したブログコンテンツ310とインデックス情報311とを記憶装置140に記憶する。なお、論評情報収集手段120が収集する論評情報としては更新情報410でもよい。
論評情報収集手段120がインデックス情報311を生成するのは、ニュース記事210に関連するブログコンテンツ310の探索を迅速に行うためである。また、収集したブログコンテンツ310を記憶装置140に記憶するのは、情報を提供する度に、インターネット60を介してブログコンテンツ310を収集することは非効率だからである。実際には、インターネット60上で公開されているブログコンテンツ310の情報量は膨大になるため、インデックス情報311のみを平文で記憶装置140に記憶し、ブログコンテンツ310は圧縮した状態で記憶装置140に記憶することが望ましい。
ブログコンテンツ310を収集する他の手段としてはインターネット60上に電子掲示板を設置する手段も知られているが、電子掲示板にコメントを書く人は決まっている場合が多く、電子掲示板に掲示された論評には偏りがあることが多い。このため、本実施の形態において情報提供サーバ10に備えられた論評情報収集手段120は、ブログサービスを利用して個人が発信しているブログコンテンツ310を収集する。ブログサービスを運営しているブログ運営サーバ30からブログコンテンツ310を収集することで、偏りのないブログコンテンツ310を収集することができる。
ここから、情報提供サーバ10に備えられた論評情報収集手段120がブログ運営サーバ30からブログコンテンツ310を収集する手順およびブログコンテンツ310のインデックス情報311を生成する手順について説明する。図5は、ブログ運営サーバ30からブログコンテンツ310を収集する手順を示したフロー図である。ブログコンテンツ310を収集する手順を説明することで、情報提供サーバ10に備えられた論評情報収集手段120の詳細な内容についても明らかになる。
ブログ運営サーバ30からブログコンテンツ310を収集する手順の最初のステップS20は、情報提供サーバ10に備えられた論評情報収集手段120が更新通知pingサーバ40にアクセスし、更新通知pingサーバ40から更新情報410を取得するステップである。上述したように、ブログ運営サーバ30で公開されているブログコンテンツ310が更新された情報は、更新通知pingサーバ40に送信され、更新通知pingサーバ40にはブログコンテンツ310が更新された内容を示す更新情報410が格納されている。
論評情報収集手段120はインターネット60上にある代表的な複数の更新通知pingサーバ40のURLを記憶し、記憶しているそれぞれの更新通知pingサーバ40から更新情報410を取得する。なお、複数の更新通知pingサーバ40から更新情報410を取得すると、重複している情報が含まれることが多く、論評情報取得手段は、取得した更新情報410に含まれる重複した情報を削除する機能を備えていることが望ましい。
図6は、更新通知pingサーバ40に格納される更新情報410を説明する図である。更新通知pingサーバ40に格納された更新情報410はRSSフォーマットで記述され、図6(a)に示したように更新情報410には、RSSフォーマットの定義情報、更新通知pingサーバ40情報および更新されたブログコンテンツ310のリストを含むチャンネル情報などに加えて、複数(ここではN個)の更新されたブログコンテンツ310の要約などが記述されたアイテム情報411などが含まれる。
図6(b)は、アイテム情報411を説明する図である。図6(b)に示したようにアイテム情報411には、ブログコンテンツ310のタイトル、ブログコンテンツ310が公開されているURL、ブログコンテンツ310の要約などの情報が含まれる。論評情報収集手段120はアイテム情報411を取得し解析することで、ブログ運営サーバ30から更新されたブログコンテンツ310を取得でき、アイテム情報411をそれぞれ比較することで重複しているブログコンテンツ310をも削除できる。
また、図6を用いて説明したように、アイテム情報411にはブログコンテンツ310の要約が含まれるため、アイテム情報411をブログコンテンツ310の代わりとして利用することもできる。アイテム情報411をブログコンテンツ310の代わりとして利用する場合は、取得したアイテム情報411を記憶し、このステップS20をもって手順は終了する。
ブログ運営サーバ30からブログコンテンツ310を収集する手順の次のステップS21は、更新情報410で示されるブログ運営サーバ30から、更新されたブログコンテンツ310を収集するステップである。論評情報収集手段120は、更新通知pingサーバ40から取得したアイテム情報411に記述されたブログコンテンツ310のURLを参照し、このURLで示されるWebページで公開されている情報(例えば、感想、コメントなど)をブログコンテンツ310として収集し、更新情報410および収集したブログコンテンツ310は記憶装置140に記憶される。
ブログ運営サーバ30からブログコンテンツ310を収集する手順の次のステップS22は、収集したブログコンテンツ310のインデックス情報311を生成するステップである。論評情報収集手段120は、更新通知pingサーバ40から更新情報410を取得し、更新情報410で示されるブログコンテンツ310を収集した後、収集したブログコンテンツ310のインデックス情報311を生成し、生成したインデックス情報311は記憶装置140に記憶される。なお、生成したインデックス情報311は、ニュース記事210に関連するブログコンテンツ310を探索・抽出するときに利用される。
図7はインデックス情報311を説明する図である。図7(a)はインデックス情報311の構造を示した図で、インデックス情報311には、インデックス情報311のフォーマット情報(例えば、収集しているブログコンテンツ310の数)、収集したブログコンテンツ310のリストなどに加えて、収集したブログコンテンツ310の索引情報312が含まれる。
図7(b)は索引情報312を説明する図である。索引情報312は、ブログコンテンツ310が探索し易いフォーマットで記述されていることが望ましく、本実施の形態においては、図4(b)で示したアイテム情報411に、ブログコンテンツ310に張られている他のWebページのリンク先に関する情報を加えた情報312a(以降、ブログリンク情報と呼ぶ)や、索引情報312に対応するブログコンテンツ310が記憶装置140に記憶されたときのパス情報312bなどが含まれる。
索引情報312にこのブログリンク情報312aを加えることで、あるニュース記事210にリンクを張っているブログコンテンツ310を容易に抽出することができる。なお、ブログリンク情報312aは、ブログコンテンツ310を記述しているHTML(Hypertext Markup Language)やXML(Extensible Markup Language)などの構造化文書を解析することで抽出される。
<・コンテンツ配信についての説明>
情報提供サーバ10は、適時(例えば、新しいトピック情報を収集してから数時間後)、トピックス情報収集手段110および論評情報収集手段120がそれぞれ収集したニュース記事210およびブログコンテンツ310を集約したコンテンツ131を生成し、生成したコンテンツ131を配信するためにコンテンツ生成手段130を備える。コンテンツ生成手段130は、ニュース記事210とブログコンテンツ310に関連するブログコンテンツ310を抽出する機能、抽出したブログコンテンツ310とニュース記事210に関連付けたコンテンツ131を生成する機能、生成したコンテンツ131を配信する機能を有する。
更に詳しくは、情報提供サーバ10が有するコンテンツ生成手段130は、ニュース記事210に関連するブログコンテンツ310を抽出する機能として、ニュース記事210にリンクを張っているブログコンテンツ310を抽出する機能と、言語解析を用いてニュース記事210とブログコンテンツ310との類似度を演算し、ニュース記事210との類似度の高いブログコンテンツ310を抽出する機能を有する。
ここから、収集した情報を集約したコンテンツ131を配信する手順について説明しながら、コンテンツ生成手段130の機能についても詳細に説明する。図8は、収集した情報を集約したコンテンツ131を生成し配信する手順を示したフロー図である。
収集した情報を集約したコンテンツ131を配信する手順の最初のステップS30は、収集したニュース記事210を参照し、配信するニュース記事210のリストを、所定の基準に基づいて生成するステップである。ここで、所定の基準とは、最新のニュース記事210と、多くのブログコンテンツ310でコメントされている過去のニュース記事210などとすればよい。
次のステップS31は、ステップS30で生成したリストに含まれるニュース記事210に関連する情報を含むコンテンツ131を生成するステップである。このステップS31の詳細な手順は後述する。次のステップS32は、コンテンツ131を配信するステップである。このステップS32で配信されるコンテンツ131は、ユーザPC50のブラウザ510で閲覧される。このステップS32をもってコンテンツ131の生成し配信する手順は終了する。
図9は、収集した情報を集約したコンテンツ131を配信する手順に含まれるコンテンツ131を生成するステップS31の詳細な手順を示したフロー図である。コンテンツ131を生成する最初のステップS40は、ニュース記事210に埋め込まれ、他のWebページの位置情報を示しているURLが埋め込まれているテキスト情報であるハイパーテキストを抽出するステップである。ニュース記事210に埋め込まれているハイパーテキストを抽出することで、ニュース記事210に関連した他のニュース記事210またはプレスリリースなどの企業情報を抽出することができる。ニュース記事210に埋め込まれているハイパーテキストの抽出は、ニュース記事210のHTMLやXMLなどの構造化文書を解析することで抽出される。
次のステップS41は、インデックス情報311を用いて、ニュース記事210にリンクを張っているブログコンテンツ310を抽出するステップである。本実施の形態においては、ブログコンテンツ310に対応するインデックス情報311を探索することで(例えば、図7(b)のブログリンク情報312aを解析することで)、ニュース記事210にリンクを張っているブログコンテンツ310を抽出される。ニュース記事210にリンクを張っているブログコンテンツ310を抽出することは、ニュース記事210に直接的にコメントしているブログコンテンツ310を抽出することを意味する。
次のステップS42は、ニュース記事210とブログコンテンツ310の自然言語処理を行い、ニュース記事210との類似度の高いブログコンテンツ310を抽出するステップである。本実施の形態においては、本出願人が既に開示している特開2002−215665や特開2004−102407の技術を用いて、ニュース記事210との類似度の高いブログコンテンツ310に加えて、ニュース記事210のキーワードが抽出される。なお、このステップの詳細な手順は後述する。
次のステップS43は、ステップS41およびステップS42で抽出したブログコンテンツ310をニュース記事210に関連付けた情報と、ステップS40で取得したニュース記事210に関連する情報、ステップS42で抽出したキーワード等を集約したコンテンツ131を生成するステップである。このステップS43をもって、コンテンツ131の生成の手順は終了する。
図10は、コンテンツ131の生成の手順に含まれるニュース記事210との類似度の高いブログコンテンツ310を抽出するステップS42の詳細な手順を示したフロー図である。ニュース記事210との類似度の高いブログコンテンツ310を抽出する手順の最初のステップS50は、ニュース記事210の日本語を解析し、ニュース記事210からキーワードを抽出するステップである。
キーワードの抽出は、本出願に係る特開2002−215665で述べられているように、ニュース記事210に含まれる単語は、公知技術である形態素解析により、ニュース記事210を構成する個々の文を品詞毎に分解し、名詞と固有名詞を切出すことで得られる。また、このようにして得た用語(名詞、固有名詞)の重要度は、例えば公知の技術であるTF/IDF法を用いて計算される。そして、各々の単語を重要度の高い順に降順にソートして、上位の単語(例えば上からL個の)がキーワードとして抽出される。
次のステップS51は、抽出したキーワードに基づいて、ニュース記事210との類似度の高いブログコンテンツ310を抽出するステップである。このステップS51では、特開2004−102407で開示されている技術を用いて、ブログコンテンツ310とニュース記事210との類似度が演算され、ニュース記事210との類似度の高いブログコンテンツ310が抽出される。このステップS51をもって、類似度の高いブログコンテンツ310を抽出するステップは終了する。
図11、図12は情報提供サーバ10から配信されるコンテンツの一例を示した図である。ユーザPC50が情報提供サーバ10にアクセスすると、情報提供サーバ10からユーザPC50に図11のコンテンツ70が配信される。図11のコンテンツ70は、図8のステップS32で生成されたリストに含まれるニュース記事210のタイトル71が列挙された情報である。なお、表示するニュース記事210のタイトル71は、ニュースサーバ20から取得し、RSSフォーマットで記述された見出し情報220に含まれるタイトルをそのまま使用することが望ましいが、見出し情報220に含まれるタイトルを加工した情報(例えば、ニュースの分野情報を付加する)であってもよい。
図11のタイトル71の一つをクリックすると、図12に示したように、クリックしたタイトル71を親とし、タイトル71に関連するブログコンテンツ310を子として、これらの情報の親子関係が、コンテンツ80で階層表示される。なお、コンテンツ80においてブログコンテンツ310を表示する際は、トラックバックされているブログコンテンツ310を親とし、トラックバックしているブログコンテンツ310を子とし、この親子関係を階層表示してもよい。
また、コンテンツ80においては、クリックされたタイトル71やブログコンテンツ310の他に、ニュース記事210の関連情報81(ニュース記事210に埋め込まれたハイパーテキスト)、コンテンツ生成手段130が抽出したブログコンテンツ310のタイトル82(ブログコンテンツ310にトラックバックしているブログコンテンツ310も含む)や、ニュース記事210との類似度の高いブログコンテンツ310を抽出したときに抽出されるニュース記事210のキーワード83などの情報である。
また、図11および12はコンテンツ表示の一例にしか過ぎず、情報提供サーバ10からユーザPC50に配信されるコンテンツ131には、抽出したキーワードを用いてサーチエンジンで関連サイトを探索する機能などの他の機能を組み入れることもできる。更には、コンテンツ80にはピアツピア通信のフレームワークであるトラックバックのためのトラックバック情報84が含まれ、コンテンツ80を有するWebサイトにトラックバックの機能を持たせることができる。
<情報提供方法の説明>
ここから、本発明に係る情報提供方法について説明する。図13は情報提供方法の手順を示したフロー図である。情報提供方法の最初のステップS60は、ネットワーク(例えば、インターネット60)を利用してトピックス情報を収集するステップである。トピックス情報の収集は、ネットワーク上に設置され、複数のトピックス情報を記憶しているWebサーバ(例えば、ニュースサーバ20)から一括して収集することで、効率的にトピックス情報を収集できる。なお、収集するトピックス情報はトピックス情報を要約した情報であってもよい。
次のステップS61は、ネットワークを利用して論評情報を収集するステップである。トピックス情報と同じく、論評情報の収集は、ネットワーク上に設置され、多くの論評情報を記憶しているWebサイト(例えば、ウェブログサービスを運営しているWebサーバ30)から一括して収集することで、効率的に論評情報を収集できる。なお、ウェブログから論評情報を収集する際は、更新通知pingサーバからブログの更新情報を取得することで、更新された論評情報のみを取得できるとともに、論評情報の探索にも役立てることができる。
次のステップS62は、収集したトピックス情報から配信するトピックス情報のリストを生成するステップである。トピックス情報がニュース記事である場合は、リストに含ませるトピックス情報は、ニュースサイトで配信されているトピックス情報のすべてでもよく、またあるカテゴリーに属するトピックス情報のみを選択してもよい。ただし、カテゴリーを設定する際は、広いカテゴリー(政治、経済等)にすることが望ましい。広いカテゴリーに設定することで、幅広くトピックス情報を提供できる。
また、リストを生成する際は、カテゴリーごとにトピックス情報を分類して、ディレクトリ構造で一覧表を生成することが望ましい。ディレクトリ構造でリストを生成することで、ユーザが自分の知りたい分野のトピックス情報を容易に閲覧することができる。
次のステップS63は、ステップS61で収集された論評情報の中で、配信するトピックス情報に関連する論評情報を抽出するステップである。トピックス情報にリンクを張っている論評情報や、トピックス情報と類似度の高い論評情報が、配信するトピックス情報に関連する論評情報として抽出することができる。
次のステップS64は、一覧表に含まれるすべてのトピックス情報それぞれについて、このトピック情報と関連する論評情報とを集約した情報を含む提供情報を生成するステップである。なお、このステップS64で生成される提供情報には、トピックス情報や論評情報以外に、トピック情報から抽出したキーワード、トピックス情報に関連する他のトピックス情報(例えば、プレスリリースなどの企業情報)などの情報を含ませることもできる。
次にステップS65は、ステップS64で生成した提供情報を、ネットワークを介して配信するステップである。このステップS65をもって、情報提供方法は終了する。
ここで、特筆すべき点は、図13で示した一連の手順は、本発明に係る情報提供方法を説明するために、あえて各ステップを一連のシーケンスで記載している点である。ステップS60とステップS61は、ネットワークを利用して情報を収集することを目的とした情報収集工程で、ステップS62からステップS65は、情報収集工程で収集した情報から提供情報を生成し、生成した情報を配信することを目的とした情報提供工程であり、情報収集工程と情報提供工程とは、必ずしもシーケンシャルに実行される必要はない。
図14は、情報収集工程と情報提供工程とが実行される一例を時系列で示した図である。図14に示したように、情報収集工程90は情報提供工程91よりも短い周期で実行されることが望ましい。なぜならば、ウェブログで更新される情報は膨大な量であり、ウェブログから一度に大量の情報を収集することは処理的(例えば、インデックス情報311の生成など)に非効率になるからである。
更に詳しくは、情報収集工程に含まれるステップS60とステップS61も、シーケンシャルに実行される必要はなく、ステップS60とステップS61はと、それぞれ異なる条件が成立したときに、例えば、ある一定時間(例えば、数時間)が経過したとき、もしくは、あるWebサーバから更新通知情報が送信されたとき、それぞれ単独で実行される。
本発明に係る情報提供サーバを配置したネットワークシステムの一例。 情報提供サーバのブロック図。 ニュース記事を収集する手順を示したフロー図。 見出し情報を説明する図。 ブログコンテンツを収集する手順を示したフロー図。 ブログコンテンツの更新情報を説明する図。 インデックス情報を説明する図。 コンテンツを生成・配信する手順を示したフロー図。 コンテンツを生成する詳細な手順を示したフロー図。 類似度の高いブログコンテンツを抽出する詳細な手順を示したフロー図。 コンテンツの一例を示した第1図。 コンテンツの一例を示した第2図。 情報提供方法の手順を示したフロー図。 情報収集工程と情報提供工程とが実行される一例を時系列で示した図。
符号の説明
10 情報提供サーバ
110 トピックス情報収集手段
120 論評情報収集手段
130 コンテンツ生成手段
131 コンテンツ
140 記憶装置
20 ニュースサーバ
210 ニュース記事
220 見出し情報
30 ブログ運営サーバ
310 ブログコンテンツ
311 インデックス情報
40 更新通知pingサーバ
410 更新情報
50 ユーザPC

Claims (18)

  1. ネットワーク上に存在するWebサイトから情報を収集し、収集した情報を集約して提供する情報提供方法であって、前記情報提供方法は、前記ネットワークを介してWebサイトで公開されている情報を収集する情報収集工程と、収集した情報を集約した提供情報を、前記ネットワークを介して提供する情報提供工程とを、任意の順で実行し、
    前記情報収集工程は、定められた第1のトリガが成立するごとに、予め設定された前記Webサイトにアクセスし、新しい出来事などの話題となるトピックス情報を収集するトピックス情報収集ステップと、定められた第2のトリガが成立するごとに、前記ネットワーク上に存在し、多くの人が意見を発信している情報源から、個人または団体の論評を掲載している論評情報を収集する論評情報収集ステップと実行する工程であって、
    前記情報提供工程は、適時、前記情報収集工程で収集した前記トピックス情報の中から前記提供情報に含ませる前記トピックス情報を、所定の基準に基づいて選択し、前記提供情報に含ませる前記トピックス情報のリストを生成するリスト生成ステップ、前記リストに含まれる各々の前記トピックス情報ごとに、この前記トピックス情報と関連度の高い前記論評情報を前記情報収集工程で収集した前記論評情報の中から抽出する論評情報抽出ステップ、前記リストに含まれる各々の前記トピックス情報ごとに、この前記トピックス情報と関連度の高い前記論評情報とを関連付けて表示する前記提供情報を生成する提供情報生成ステップ、前記ネットワークを介し生成した前記提供情報を提供する情報提供ステップを順に実行する工程、
    であることを特徴とする情報提供方法。
  2. 請求項1に記載の情報提供方法において、前記情報提供工程に含まれる前記提供情報生成ステップで生成される前記提供情報は、前記トピックス情報が記載された前記リストと、前記リストに含まれる一つの前記トピックス情報が選択されると、選択された前記トピックス情報とこの前記トピックス情報と関連度の高い前記論評情報とが階層表示される情報であることを特徴とする情報提供方法。
  3. 請求項1または請求項2に記載の情報提供方法において、前記情報収集工程に含まれる前記トピックス情報収集ステップで収集されるトピックス情報は、ニュースサイトで公開されているニュース記事、もしくは、前記ニュース記事のタイトルや要約などが記述された見出し情報をであることを特徴とする情報提供方法。
  4. 請求項1から請求項3のいずれかに記載の情報提供方法において、前記情報収集工程に含まれる前記論評情報収集ステップで収集される前記論評情報は、ウェブログで公開されているウェブログコンテンツ、もしくは、前記ウェブログコンテンツの更新日時、タイトルおよび要約などが記述された更新情報であり、前記論評情報収集ステップは、前記更新情報が記憶されている更新情報通知サーバにアクセスすることで、前記ウェブログコンテンツもしくは前記更新情報を収集することを特徴とする情報提供方法。
  5. 請求項1から請求項4のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記論評情報抽出ステップは、少なくとも、前記トピックス情報が掲載されているURLにリンクをはっている前記論評情報を抽出する手順を実行するステップであることを特徴とする情報提供方法。
  6. 請求項1から請求項5のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記論評情報抽出ステップは、少なくとも、前記トピックス情報と前記論評情報との類似度を演算し、演算した前記類似度に基づいて前記論評情報を抽出する手順を実行するステップであることを特徴とする情報提供方法。
  7. 請求項1から請求項6のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記提供情報生成ステップで生成される前記提供情報は、前記トピックス情報に記述されたテキスト情報が含まれ、前記テキスト情報は、他のWebページの位置を示すリンクが埋め込まれている情報であって、前記提供情報生成ステップでは、前記テキスト情報を取得する手順が実行されることを特徴とする情報提供方法。
  8. 請求項1から請求項7のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記提供情報生成ステップで生成される前記提供情報は、前記トピックス情報に関連するキーワード情報を含み、前記論評情報抽出ステップもしくは前記提供情報生成ステップでは、提供する前記トピックス情報からキーワード情報を抽出する手順が実行されることを特徴とする情報提供方法。
  9. この辺が修正ポイントです
    請求項1から請求項8のいずれかに記載の情報提供方法において、前記情報提供工程に含まれる前記提供情報生成ステップは、前記提供情報に含まれる情報をカテゴリーごとに区別して表示する情報を生成するステップであることを特徴とする情報提供方法。
  10. ネットワーク上に存在するWebサイトから情報を収集し、収集した情報を集約して提供する情報提供装置であって、
    前記情報提供装置は、前記ネットワークを介して、定められた第1の条件が成立するごとに、予め設定された前記Webサイトにアクセスし、新しい出来事などの話題となるトピックス情報を収集するトピック情報収集手段と、定められた第2の条件が成立するごとに、前記ネットワーク上に存在し、多くの人が意見を発信している情報源から、個人または団体の論評を掲載している論評情報を収集する論評情報収集手段と、適時、前記トピックス情報収集手段および前記論評情報収集手段がそれぞれに収集した前記トピックス情報および前記論評情報を集約した提供情報を生成し、前記ネットワークを介して生成した前記提供情報を提供する情報提供手段とを備え、
    前記情報提供手段は、前記情報収集手段が収集した前記トピックス情報の中から前記提供情報に含ませる前記トピックス情報を、、所定の基準に基づいて選択し、前記提供情報に含ませる前記トピックス情報のリストを生成し、前記リストに含まれる各々の前記トピックス情報ごとに、この前記トピックス情報と関連度の高い前記論評情報を収集された前記論評情報の中から抽出し、前記リストに含まれる各々の前記トピックス情報ごとに、この前記トピックス情報と関連度の高い前記論評情報とを関連付けて表示する前記提供情報を生成する手段であることを特徴とする情報提供装置。
  11. 請求項10に記載の情報提供装置において、前記情報提供手段が生成する前記提供情報は、前記トピックス情報が記載された前記リストと、前記リストに含まれる一つの前記トピックス情報が選択されると、選択された前記トピックス情報とこの前記トピックス情報と関連度の高い前記論評情報とが階層表示される情報であることを特徴とする情報提供装置。
  12. 請求項10または請求項11に記載の情報提供装置において、前記情報提供装置に備えられた前記トピックス情報収集手段は、ニュースサイトにアクセスし、前記ニュースサイトが配信しているニュース記事、および/または、構造化文書で記述された前記ニュース記事の見出し情報を、前記トピックス情報として収集する手段であることを特徴とする情報提供装置。
  13. 請求項10から請求項12のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記論評情報収集手段が収集する前記論評情報は、ウェブログで公開されているウェブログコンテンツ、もしくは、前記ウェブログコンテンツの更新日時、タイトルおよび要約などが記述された更新情報であって、前記論評情報収集手段は、前記更新情報を記憶している更新情報通知サーバにアクセスすることで、前記ウェブログコンテンツもしくは前記更新情報を収集することを特徴とする情報提供装置。
  14. 請求項10から請求13のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段は、前記提供情報を生成する際に、少なくとも、前記リストに含まれる前記トピックス情報が掲載されているURLにリンクをはっている前記論評情報を抽出することを特徴とする情報提供装置。
  15. 請求項10から請求項14のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段は、前記提供情報を生成する際に、前記トピックス情報と前記論評情報との類似度を演算する機能を有し、少なくとも、演算した前記類似度に基づいて前記論評情報を抽出することを特徴とする情報提供方法。
  16. 請求項10から請求項15のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段で生成される前記提供情報は、前記トピックス情報に記述されたテキスト情報が含まれ、前記テキスト情報は、他のWebページの位置を示すリンクが埋め込まれている情報であって、前記提供情報手段は、前記提供情報を生成するために前記テキスト情報を取得することを特徴とする情報提供方法。
  17. 請求項10から請求項16のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段で生成される前記提供情報は、前記トピックス情報に関連するキーワード情報を含み、前記情報提供手段は、前記提供情報を生成するために、前記トピックス情報から前記キーワード情報を抽出することを特徴とする情報提供装置。
  18. 請求項10から請求項17のいずれかに記載の情報提供装置において、前記情報提供装置に備えられた前記情報提供手段は、前記提供情報に含まれる情報をカテゴリーごとに区別して表示する情報を生成することを特徴とする情報提供装置。

JP2005041038A 2005-02-17 2005-02-17 情報提供方法および情報提供装置 Pending JP2006227925A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005041038A JP2006227925A (ja) 2005-02-17 2005-02-17 情報提供方法および情報提供装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005041038A JP2006227925A (ja) 2005-02-17 2005-02-17 情報提供方法および情報提供装置

Publications (1)

Publication Number Publication Date
JP2006227925A true JP2006227925A (ja) 2006-08-31

Family

ID=36989261

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005041038A Pending JP2006227925A (ja) 2005-02-17 2005-02-17 情報提供方法および情報提供装置

Country Status (1)

Country Link
JP (1) JP2006227925A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146333A (ja) * 2006-12-08 2008-06-26 Sony Corp 情報処理装置および方法、並びにプログラム
JP2008204392A (ja) * 2007-02-22 2008-09-04 Rakuten Inc ネットワークシステム、サーバ装置、管理装置、サーバ処理プログラム、管理処理プログラム、及びページ提供方法
JP2013084068A (ja) * 2011-10-06 2013-05-09 Yahoo Japan Corp 情報表示装置、サーバ、プログラム、情報表示方法及び情報表示システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146333A (ja) * 2006-12-08 2008-06-26 Sony Corp 情報処理装置および方法、並びにプログラム
US7668933B2 (en) 2006-12-08 2010-02-23 Sony Corporation Information processing apparatus and method and program
JP2008204392A (ja) * 2007-02-22 2008-09-04 Rakuten Inc ネットワークシステム、サーバ装置、管理装置、サーバ処理プログラム、管理処理プログラム、及びページ提供方法
JP2013084068A (ja) * 2011-10-06 2013-05-09 Yahoo Japan Corp 情報表示装置、サーバ、プログラム、情報表示方法及び情報表示システム

Similar Documents

Publication Publication Date Title
JP2006309515A (ja) 情報配信方法および情報配信サーバ
US7596571B2 (en) Ecosystem method of aggregation and search and related techniques
US20190147005A1 (en) Extracting structured data from weblogs
Vargiu et al. Exploiting web scraping in a collaborative filtering-based approach to web advertising.
US7660783B2 (en) System and method of ad-hoc analysis of data
US20110087647A1 (en) System and method for providing web search results to a particular computer user based on the popularity of the search results with other computer users
JP5092252B2 (ja) トレンド解析サーバおよびトレンド解析方法
US20080147487A1 (en) Methods and apparatus for conversational advertising
JP2007122513A (ja) コンテンツ検索方法、及び、コンテンツ検索サーバ
WO2007015990A2 (en) Techniques for analyzing and presenting information in an event-based data aggregation system
WO2007140364A2 (en) Method for scoring changes to a webpage
CN102169501A (zh) 基于搜索结果对应文档的类型信息生成摘要的方法与设备
US20090187516A1 (en) Search summary result evaluation model methods and systems
Cha et al. The spread of media content through blogs
JP2010044462A (ja) コンテンツ評価サーバ、コンテンツ評価方法及びコンテンツ評価プログラム
JP2006099341A (ja) 更新履歴生成装置及びプログラム
JP2008117267A (ja) 閲覧履歴提供システム、閲覧履歴提供装置、閲覧履歴提供方法、および閲覧履歴提供プログラム
JP2006164256A (ja) 属性評価プログラム、属性評価システムおよび属性評価方法
JP2006227925A (ja) 情報提供方法および情報提供装置
JP2008234231A (ja) サイト内検索における検索キーワードの管理システム
JP2005346609A (ja) Webページ情報融合表示装置、Webページ情報融合表示方法、Webページ情報融合表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20080082318A1 (en) Semantic retrieval method and computer product
JP2007207202A (ja) ウェブログを利用した情報提供システム
US9372927B1 (en) Original authorship identification of electronic publications
Ohmukai et al. Personal knowledge publishing suite with Weblog

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070509

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070704

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070807