JP2009080624A - 情報表示装置、方法及びプログラム - Google Patents

情報表示装置、方法及びプログラム Download PDF

Info

Publication number
JP2009080624A
JP2009080624A JP2007249017A JP2007249017A JP2009080624A JP 2009080624 A JP2009080624 A JP 2009080624A JP 2007249017 A JP2007249017 A JP 2007249017A JP 2007249017 A JP2007249017 A JP 2007249017A JP 2009080624 A JP2009080624 A JP 2009080624A
Authority
JP
Japan
Prior art keywords
topic
node
instance
display
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007249017A
Other languages
English (en)
Inventor
Shinichi Nagano
伸一 長野
Masumi Inaba
真純 稲葉
Kenta Cho
健太 長
Yumiko Shimogoori
祐美子 下郡
Takahiro Kawamura
隆浩 川村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007249017A priority Critical patent/JP2009080624A/ja
Priority to US12/212,740 priority patent/US20090083261A1/en
Publication of JP2009080624A publication Critical patent/JP2009080624A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

【課題】検索対象の対象物と当該対象物に関連する情報との関係性を効率的、且つ、多角的に表すことが可能な情報表示装置、方法及びプログラムを提供する。
【解決手段】トピックオントロジに基づいて、検索対象の対象物を表すキーワードについて取得したウェブ文書に含まれる文字列から、このキーワードと当該キーワードに関連する情報のインスタンスを抽出し、これらインスタンス間の関係をトピックノードの大きさとトピックリンクの長さとで表した第1トピックグラフで視覚化するとともに、情報元となったウェブ文書間の参照関係をブログノードとブログリンクとで表したブロググラフで視覚化する。
【選択図】 図15

Description

本発明は、特定のキーワードに関連する情報を表示することが可能な情報表示装置、方法及びプログラムに関する。
インターネット上での評判や口コミを参考にして、商品を購入する消費者が増えてきている。特に、ブログ(ウェブログ)やSNS(Social Network Service)等の消費者作成メディア(CGM:Consumer Generated Media)では、ユーザが自らの立場に根ざした分析や意見を表す媒体として用いられることが多くあるため、特定の対象に対する評判を知る上で有用な情報源となっている。そのため、CGMを対象としたマーケティング調査が重要となってきており、商品等の対象物に関連する情報間の関係を視覚化することが求められている。特に、分析の対象となる特定の商品と、当該商品に関連する商品や現在話題の商品とを対比し、該当する商品の話題性等の関係性を視覚化することが求められている。
上記の要請に関しては、従来、ウェブサイト間の関連度や特定カテゴリ間の関連度を計算し、その結果を表示する技術が提案されている(例えば、特許文献1参照)。また、自己組織化マップを用いて情報項目の集合からマップを表し、このマップに基づいてユーザが選択した情報項目に対する情報を検索・表示する技術が提案されている(例えば、特許文献2参照)。
特開2005−251157号公報 特開2004−178605号公報
しかしながら、特許文献1の技術では、ウェブサイト間の関連度やウェブサイトのカテゴリ間の関連度といった観点で検索対象の情報に関連する関連情報を表示するのみであるため、検索対象となる商品等の対象物と、当該対象物に関連する関連物との関係性を視覚化することはできない。また、特許文献2の技術では、検索対象となる対象物に関連する情報を検索する際に、不要な用語を抽出する可能性が高いため、ノイズが増加するという問題がある。
本発明は上記に鑑みてなされたものであって、検索対象の対象物と当該対象物に関連する情報との関係性を効率的、且つ、多角的に表すことが可能な情報表示装置、方法及びプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、表示手段と、検索対象となるキーワードの入力を受け付ける第1受付手段と、前記キーワードに関係する1又は複数のウェブ文書をネットワーク上から受信する受信手段と、前記ウェブ文書の各々に含まれる文字列を1又は複数の単語に分割する分割手段と、複数の単語を夫々表すインスタンスを当該インスタンスが属するクラスと対応付けて定義するとともに、前記インスタンス間の関連性を前記クラス間の距離により定義したオントロジを記憶する第1記憶手段と、前記分割手段により分割された各単語と一致するインスタンスを、前記オントロジから抽出するオントロジ抽出手段と、前記オントロジ抽出手段により抽出された各インスタンスを、当該インスタンスと一致する単語を含んだ前記ウェブ文書と関連付けるとともに、当該ウェブ文書間の繋がりを示す参照関係を記憶する第2記憶手段と、前記第2記憶手段に記憶された各インスタンスをトピックノードとして表示する際の当該トピックノードの大きさを、当該各インスタンスに関連付けられたウェブ文書の個数に応じて決定するとともに、前記キーワードの単語を表すインスタンスのトピックノードと、当該インスタンス以外の他のインスタンスのトピックノードとを接続するトピックリンクの長さを、前記オントロジに定義された前記各インスタンスが属するクラス間の距離に応じて決定する第1表示条件決定手段と、前記第2記憶手段に記憶された各ウェブ文書をウェブノードとして表示する際の当該ウェブノード間を接続するウェブリンクの接続関係を、前記各ウェブ文書の参照関係に基づいて決定する第2表示条件決定手段と、前記第1表示条件決定手段で決定されたトピックノードの大きさとトピックリンクの長さとに基づいて、前記第2記憶手段に記憶されたインスタンス間の関係を前記トピックノードと前記トピックリンクとにより表した第1グラフを、前記表示手段の第1表示領域に表示させる第1画面表示手段と、前記第2表示条件決定手段で決定されたウェブリンクの接続関係に基づいて、前記第2記憶手段に記憶されたウェブ文書間の関係を前記ウェブノードと前記ウェブリンクとにより表した第2グラフを、前記表示手段の第2表示領域に表示させる第2画面表示手段と、を備えたことを特徴とする。
また、本発明は、情報表示装置で実行される情報表示方法であって、前記情報表示装置は、表示手段と、複数の単語を夫々表すインスタンスを、当該インスタンスが属するクラスと対応付けて定義するとともに、前記インスタンス間の関連性を前記クラス間の距離により定義したオントロジを記憶する第1記憶手段とを備え、受付手段が、検索対象となるキーワードの入力を受け付ける受付ステップと、受信手段が、前記キーワードに関係する1又は複数のウェブ文書をネットワーク上から受信する受信ステップと、分割手段が、前記ウェブ文書の各々に含まれる文字列を1又は複数の単語に分割する分割ステップと、オントロジ抽出手段が、前記分割ステップで分割された各単語と一致するインスタンスを、前記第1記憶手段に記憶されたオントロジから抽出するオントロジ抽出ステップと、記憶制御手段が、前記オントロジ抽出ステップで抽出された各インスタンスを、当該インスタンスと一致する単語を含んだ前記ウェブ文書と関連付けるとともに、当該ウェブ文書間の繋がりを示す参照関係を第2記憶手段に記憶する記憶ステップと、第1表示条件決定手段が、前記記憶ステップで記憶された各インスタンスをトピックノードとして表示する際の当該トピックノードの大きさを、当該各インスタンスに関連付けられたウェブ文書の個数に応じて決定するとともに、前記キーワードの単語を表すインスタンスのトピックノードと、当該インスタンス以外の他のインスタンスのトピックノードとを接続するトピックリンクの長さを、前記オントロジに定義された前記各インスタンスが属するクラス間の距離に応じて決定する第1表示条件決定ステップと、第2表示条件決定手段が、前記記憶ステップで記憶された各ウェブ文書をウェブノードとして表示する際の当該ウェブノード間を接続するウェブリンクの接続関係を、前記各ウェブ文書の参照関係に基づいて決定する第2表示条件決定ステップと、第1画面表示手段が、前記第1表示条件決定ステップで決定されたトピックノードの大きさとトピックリンクの長さとに基づいて、前記記憶ステップで記憶されたインスタンス間の関係を前記トピックノードと前記トピックリンクとにより表した第1グラフを、前記表示手段の第1表示領域に表示させる第1画面表示ステップと、第2画面表示手段が、前記第2表示条件決定ステップで決定されたウェブリンクの接続関係に基づいて、前記記憶ステップで記憶されたウェブ文書間の関係を前記ウェブノードと前記ウェブリンクとにより表した第2グラフを、前記表示手段の第2表示領域に表示させる第2画面表示ステップと、を含むことを特徴とする。
また、本発明は、表示手段を備えたコンピュータを、検索対象となるキーワードの入力を受け付ける第1受付手段と、前記キーワードに関係する1又は複数のウェブ文書をネットワーク上から受信する受信手段と、前記ウェブ文書の各々に含まれる文字列を1又は複数の単語に分割する分割手段と、複数の単語を夫々表すインスタンスを当該インスタンスが属するクラスと対応付けて定義するとともに、前記インスタンス間の関連性を前記クラス間の距離により定義したオントロジから、前記分割手段により分割された各単語と一致するインスタンスを抽出するオントロジ抽出手段と、前記オントロジ抽出手段により抽出された各インスタンスを、当該インスタンスと一致する単語を含んだ前記ウェブ文書と関連付けるとともに、当該ウェブ文書間の繋がりを示す参照関係を記憶手段に記憶する記憶制御手段と、前記記憶手段に記憶された各インスタンスをトピックノードとして表示する際の当該トピックノードの大きさを、当該各インスタンスに関連付けられたウェブ文書の個数に応じて決定するとともに、前記キーワードの単語を表すインスタンスのトピックノードと、当該インスタンス以外の他のインスタンスのトピックノードとを接続するトピックリンクの長さを、前記オントロジに定義された前記各インスタンスが属するクラス間の距離に応じて決定する第1表示条件決定手段と、前記記憶手段に記憶された各ウェブ文書をウェブノードとして表示する際の当該ウェブノード間を接続するウェブリンクの接続関係を、前記各ウェブ文書の参照関係に基づいて決定する第2表示条件決定手段と、前記第1表示条件決定手段で決定されたトピックノードの大きさとトピックリンクの長さとに基づいて、前記記憶手段に記憶されたインスタンス間の関係を前記トピックノードと前記トピックリンクとにより表した第1グラフを、前記表示手段の第1表示領域に表示させる第1画面表示手段と、前記第2表示条件決定手段で決定されたウェブリンクの接続関係に基づいて、前記記憶手段に記憶されたウェブ文書間の関係を前記ウェブノードと前記ウェブリンクとにより表した第2グラフを、前記表示手段の第2表示領域に表示させる第2画面表示手段と、して機能させることを特徴とする。
本発明によれば、オントロジに基づいて、検索対象の対象物を表すキーワードについて取得したウェブ文書に含まれる文字列から、このキーワードと当該キーワードに関連する情報のインスタンスを抽出することで、検索対象の対象物に関連する情報を効率的に抽出することができる。また、インスタンス間の関係をトピックノードの大きさとトピックリンクの長さとで表した第1グラフで視覚化するとともに、ウェブ文書間の参照関係をブログノードとブログリンクとで表した第2グラフで視覚化することができるため、検索の対象となる対象物と当該検索対象物に関連する関連物との関係性を効率的、且つ、多角的に表すことができる。
以下に添付図面を参照して、情報表示装置、方法及びプログラムの最良な実施形態を詳細に説明する。
図1は、情報表示システム100の構成を示したブロック図である。図1に示したように、情報表示システム100は、関連情報抽出サーバ10とクライアント端末20とを有しており、各装置はネットワークNを介して通信可能に接続されている。
ここで、ネットワークNは、インターネット等の通信網であって、図示しないブログサイト等のウェブサイトや、検索エンジン等の他のサーバ装置が、関連情報抽出サーバ10及びクライアント端末20と通信可能に接続されている。なお、ネットワークNに接続される関連情報抽出サーバ10、クライアント端末20の個数は特に問わないものとする。
関連情報抽出サーバ10は、クライアント端末20から送信された検索対象の対象物を表す単語(キーワード)に応じ、このキーワードと当該キーワードに関連する関連対象物(以下、連想トピックという)との関係を視覚的に表すための表示用データを生成するサーバ装置である。以下、関連情報抽出サーバ10について詳細に説明する。
図2は、関連情報抽出サーバ10のハードウェア構成を示したブロック図である。図2に示したように、関連情報抽出サーバ10は、CPU(Central Processing Unit)11、操作部12、表示部13、ROM(Read Only Memory)14、RAM(Random Access Memory)15、通信部16及び記憶部17等を備え、各部はバス18により接続されている。なお、後述する関連情報抽出サーバ30、60、80についても同様のハードウェア構成を有するものとする。
CPU11は、RAM15の所定領域を作業領域として、ROM14又は記憶部17に予め記憶された各種制御プログラムとの協働により各種処理を実行し、関連情報抽出サーバ10を構成する各部の動作を統括的に制御する。
また、CPU11は、ROM14又は記憶部17に予め記憶された所定のプログラムとの協働により、後述する各機能部の機能を実現させる。なお、各機能部の動作については後述する。
操作部12は、各種入力キーを備え、ユーザから操作入力された情報を指示信号として受け付け、その指示信号をCPU11に出力する。
表示部13は、LCD(Liquid Crystal Display)等の表示デバイスにより構成され、CPU11からの表示信号に基づいて、各種情報を表示する。なお、表示部13は、操作部12と一体的にタッチパネルを構成する態様としてもよい。
ROM14は、関連情報抽出サーバ10の制御にかかるプログラムや各種設定情報等を書き換え不可能に記憶する。
RAM15は、SDRAM等の記憶手段であって、CPU11の作業エリアとして機能し、バッファ等の役割を果たす。
通信部16は、ネットワークNを通じ外部の機器との間で通信を行うインタフェースであって、外部機器から送信された各種情報(例えば、後述する検索要求)をCPU11に出力し、また、CPU11から出力される各種情報(例えば、後述する表示用データ等)を外部機器へと送信する。
記憶部17は、磁気的又は光学的に記録可能な記憶媒体を有し、関連情報抽出サーバ10の制御にかかるプログラムや各種設定情報等を書き換え可能に記憶する。また、記憶部17は、形態素解析用の辞書である形態素解析辞書171と、複数の単語(商品名)を夫々表すインスタンスを当該インスタンスが属するクラスと対応付けて定義するとともに、インスタンス間の関連性をクラス間の距離により定義した商品オントロジ172と、を予め記憶している。
形態素解析辞書171は、後述する形態素解析部1122による形態素解析処理の際に用いられる辞書データであって、使用する言語の文法を定義した文法ルールや、品詞等の情報が付加された単語群が予め登録されている。
商品オントロジ172は、オントロジ技術を利用したデータモデルにより構成されたツリー構造状のデータである。ここで、「オントロジ」とは、対象世界を特定の観点から知識表現言語を用いてモデリングしたものであって、言葉の持つ概念(コンセプト)を体系的に整理したものである。概念には主にクラスとインスタンスの2種類が利用され、直感的には、クラスは概念の分類名を、インスタンスは概念の実例を表す。
図3は、商品オントロジ172の一例を模式的に示した図である。商品オントロジ172では、オントロジの対象を商品に限定しており、商品の種別や製造メーカ名等にも基づいて、クラス分けが行われている。
ここで、商品オントロジ172は、7つのクラスC1〜C7と、7つのインスタンスI1〜I7から構成されており、クラスは商品のジャンル名を、インスタンスは具体的な商品名を夫々表している。なお、図3では、7つのインスタンスI1〜7は、何れも携帯電話機の端末名を表しており、携帯電話機のキャリアを表すクラスC5〜C7の下に定義されている。また、クラスC5〜7は、携帯電話自体を表す上位概念のクラスC4の下に定義されている。なお、商品オントロジ172の態様は、図3の例に限定されず、商品以外の他の対象物について作成された商品オントロジ172を予め記憶する態様としてもよい。
図4は、関連情報抽出サーバ10の機能構成を示したブロック図である。図4に示したように、関連情報抽出サーバ10は、ブログ検索部111、関連情報抽出部112、表示用データ生成部113、通信処理部114を備えている。
ブログ検索部111は、クライアント端末20から送信された検索要求を、通信処理部114の制御により通信部16を介して受け付けると、この検索要求に含まれたキーワードを含むウェブ文書をネットワークNに接続されたブログサイトから検索し、該当したウェブ文書の取得を行う。また、ブログ検索部111は、後述するブログ構造分析部1121から指示されたURL(Uniform Resource Locator)のブログサイトに接続し、このブログサイトからウェブ文書の取得を行う。
ブログ検索部111が取得するウェブ文書は、キーワードを含む記事の部分のみとしてもよいし、この記事をも含んだウェブ文書全体としてもよい。また、ブログ検索部111は、取得したウェブ文書を、当該ウェブ文書に関するURLやサイト名、更新日時等の識別情報と対応付け、RAM15又は記憶部17に一時的に記憶する。以下、ウェブ文書と識別情報との組を「ブログ」という。なお、ブログの検索は、外部のサーバ装置(図示せず)に搭載された検索エンジンにキーワードを渡し、この検索エンジンによる検索結果を取得する態様としてもよいし、関連情報抽出サーバ10に検索エンジンを別途備えることで、関連情報抽出サーバ10自体が行う態様としてもよいし。
関連情報抽出部112は、図4に示したように、ブログ構造分析部1121、形態素解析部1122、オントロジ抽出部1123を有している。
ブログ構造分析部1121は、ブログ検索部111により取得された各ブログのデータ構造を分析し、各ブログに含まれたトラックバック欄から当該ブログとトラックバックの関係にある他のブログ(以下、参照先ブログという)のURLを抽出し、ブログ検索部111に出力することで、参照先ブログをブログ検索部111に取得させる。
ここで、ブログ構造分析部1121は、キーワードについて取得されたブログを基点(ルートブログ)とし、当該ルートブログから2連鎖目の参照先ブログ、即ち、ルートブログとトラックバックの関係にある1連鎖目の参照先ブログ、及び、この1連鎖目の参照先ブログとトラックバックの関係にある2連鎖目の参照先ブログまでを取得させるものとする。なお、参照先ブログの取得範囲は、この例に限らず、3連鎖目や5連鎖目まで取得する等、任意の設定が可能であるものとする。
また、ブログ構造分析部1121は、トラックバックの参照元となるブログ(参照元ブログ)と参照先ブログとの関係を表すトラックバック情報を、ブログ検索部111により取得されたトラックバックの関係にある各ブログに関連付けて記憶する。
また、ブログ構造分析部1121は、ブログ検索部111により取得された各ブログのコメント欄に記述されたコメント数を夫々計数し、ブログ検索部111により取得された対応するブログと関連付けて記憶する。
形態素解析部1122は、ブログ検索部111により取得された各ブログに対し、形態素解析辞書171を用いて形態素解析を施すことで、当該各ブログに含まれた文字列を1又は複数の単語に分割する。
オントロジ抽出部1123は、商品オントロジ172に定義された各クラス、インスタンスに基づいて、形態素解析部1122により分割されたブログ毎の単語群から、キーワードの単語に関連する商品名(単語)を抽出し、該当するブログと関連付けて記憶する。以下、商品オントロジ172から抽出された商品名を「連想トピック」という。また、キーワードに対応する商品名を「ルートトピック」と呼び、ルートトピック及び連想トピックを総称して「トピック」という。
具体的に、オントロジ抽出部1123は、キーワードの単語に一致する商品名を、商品オントロジ172に定義された各インスタンスから検索し、該当インスタンスの商品名をルートトピックとして特定する。また、オントロジ抽出部1123は、ルートトピックが所属するクラスの他のインスタンスの名称とともに、このクラスから所定のホップ数内のクラスに属するインスタンスの商品名を連想トピック候補とする。また、オントロジ抽出部1123は、連想トピック候補に含まれた何れかの商品名のうち、各ブログを構成する単語群と一致するものについては連想トピックとして抽出し、一致する単語を含んだブログと関連付けて保持する。なお、ホップ数とは経由するクラスの数を意味している。
例えば、キーワードが「911SH」、ホップ数が「2」であった場合、図3の商品オントロジ172を用いて説明すると、オントロジ抽出部1123は、クラスC6(SB)に属するインスタンスI3(911SH)をルートトピックとして特定する。そして、オントロジ抽出部1123は、クラスC6から2ホップ内のクラス、即ち、自己のクラスC6に所属するインスタンスI1、I2、I4、I5、C5に所属するインスタンスI1及びC7に所属するインスタンスI6、I7の商品名を連想トピック候補とし、各ブログを構成する形態素群(単語群)との比較を行う。なお、ホップ数は予め定められた値を用いる態様としてもよいし、外部から指示される値を用いる態様としてもよい。
ここで、図5を参照して、関連情報抽出部112が実行する関連情報抽出処理について説明する。図5は、関連情報抽出処理の手順を示したフローチャートである。
まず、ブログ構造分析部1121は、ブログ検索部111により取得された各ブログから、当該ブログとトラックバックの関係にある参照先ブログのURLを抽出しブログ検索部111に出力することで、予め定められた連鎖数分の参照先ブログをブログ検索部111に取得させる(ステップS11)。
次いで、ブログ構造分析部1121は、トラックバックの参照元ブログと対になる参照先ブログとの間にトラックバックの関係があることを示すトラックバック情報を関連付けて記憶する(ステップS12)。また、ブログ構造分析部1121は、各ブログに付与されたコメント数を夫々計数し、対応するブログに関連付けて記憶する(ステップS13)。
続いて、形態素解析部1122は、形態素解析辞書171を用いて、ブログ検索部111により取得された各ブログに形態素解析を夫々施すことで、各ブログに含まれた文字列を1又は複数の単語に分割する(ステップS14)。
次に、オントロジ抽出部1123は、商品オントロジ172を参照し、キーワードに対応するインスタンス(ルートトピック)を特定する(ステップS15)。オントロジ抽出部1123は、ルートトピックが属するクラスを基点とし、このクラスから所定のホップ数内のクラスに属するインスタンスから、ステップS14で分割されたブログ毎の単語と一致するインスタンスを連想トピックとして抽出する(ステップS16)。
続いて、オントロジ抽出部1123は、トピック(ルートトピック及び連想トピック)の各々を、当該トピックに対応する単語を含んだブログと関連付けて記憶するとともに(ステップS17)、キーワードに対応するトピックであることを指示するルート識別情報をルートトピックに付加した後(ステップS18)、本処理を終了する。
図6は、上述した関連情報抽出処理後のブログの状態を模式的に示した図である。図6に示したように、ブログ検索部111により取得されたブログ(blog01〜blog12)は、関連情報抽出部112による関連情報抽出処理の結果、トラックバック情報A1とトピック(DEF01〜04、ABC01、GHI01、02)とが関連付けられた状態でRAM15又は記憶部17に保持される。以下、関連情報抽出部112により処理された後のブログを「処理結果情報」という。
同図において、トラックバック情報A1により接続されたブログはトラックバックの関係にあることを示しており、矢印の元となるブログがトラックバックの参照元ブログを、矢印の先となるブログが参照先ブログを意味している。また、各ブログに付加された「Coment:」の数値は、各ブログに対して投稿されたコメント数を表すものである。なお、トピック群のうち、キーワードに対応するトピックには「v」印で示したルート識別情報が付加されている。
図2に戻り、表示用データ生成部113は、RAM15又は記憶部17に保持された処理結果情報に基づいて、クライアント端末20の表示部23に表示させるための表示用データを生成する。ここで、生成される表示用データは、トピックグラフを表示するためのトピックグラフ表示用データと、ブロググラフを表示するためのブロググラフ表示用データとの2つに大別できる。
トピックグラフは、商品オントロジ172に定義されたインスタンス又はクラス間の関係に基づき、クライアント端末20から指示されたキーワードと、当該キーワードに関連する他の情報との関係をネットワーク状のグラフで表すものである。以下、図7、図8を参照し、インスタンス間の関係に基づいたトピックグラフを表示させるためのトピックグラフ表示用データ(インスタンス表示用データ)について説明する。
図7は、表示用データ生成部113により生成されたインスタンス表示用データの一例を示した図である。図7に示したように、インスタンス表示用データには、「トピックノード名」と、「ノード幅」と、「リンク先」と、「リンク長」と、が関連付けて登録されている。
「トピックノード名」は、処理結果情報に含まれた各トピックを後述するトピックノードTNとして表示する際の名称を指示する項目であって、各トピックの名称(商品名)が登録されるようになっている。
「ノード幅」は、トピックノードTNを表示する際の大きさの度合いを指示する項目であって、各トピックが出現するブログの記事数をベースに、各ブログのトラックバック数やコメント数に重み付けを行うことで算出したトピック毎のスコアに応じた値が登録されるようになっている。ここでノード幅は、各トピックの名称が採り上げられた度合い、つまり注目度や関心度を表すものとなっている。なお、ノード幅の数値が大きいほど、トピックノードTNが大きく表示されるものとする。
「リンク先」は、ルートトピックと連想トピックとの接続関係を指示する項目である。具体的には、「トピックノード名」に登録された名称のトピックノードTNと、「リンク先」に登録された名称(ルートトピック)のトピックノードTNと、を後述するトピックリンクTLで接続することを指示するものとなっている。
また、「リンク長」は、トピックリンクTLの長さの度合いを指示する項目であって、商品オントロジ172に定義された対応するインスタンス間の距離(クラスを基準にしたホップ数)に基づいて導出された値が登録されるようになっている。なお、リンク長の数値が大きいほど、即ち、インスタンス間の距離が離れているほど、トピックリンクTLが長く表示されるものとする。
なお、図7に示したインスタンス表示用データにおいて、「v」印が付加されたトピックノード名「911T」は、ルートトピックに対応するトピックノードであることを指示するルート識別情報であって、トピックノード名の登録時に付加されるものである。
以下、図8を参照して、表示用データ生成部113が実行するインスタンス表示用データ生成処理について説明する。図8は、インスタンス表示用データ生成処理の手順を示したフローチャートである。
まず、表示用データ生成部113は、RAM15又は記憶部17に保持された処理結果情報を参照すると、当該処理結果情報に含まれたトピックのうち、一つのトピックを処理対象に設定する(ステップS21)。次いで、表示用データ生成部113は、処理対象のトピックにルート識別情報が付加されているか否かに基づいて、処理対象のトピックがルートトピックか否かを判定する(ステップS22)。
ここで、処理対象のトピックがルートトピックと判定した場合には(ステップS22;Yes)、このトピックの名称(商品名)をインスタンス表示用データの「トピックノード名」に登録するとともに、ルートトピックであることを指示するルート識別情報を付加した後(ステップS23)、ステップS27の処理へと移行する。
一方、ステップS22において、処理対象のトピックが連想トピックと判定した場合には(ステップS22;No)、このトピックの名称をインスタンス表示用データの「トピックノード名」に登録し(ステップS24)、「リンク先」にルートトピックの名称を登録する(ステップS25)。
続いて、表示用データ生成部113は、商品オントロジ172を参照し、処理対象のトピックに対応するインスタンスと、ルートトピックに対応するインスタンスとの間の距離(クラスを基準としたホップ数)に基づいて、両インスタンス間の距離を導出し、この値をインスタンス表示用データの「リンク長」に登録した後(ステップS26)、ステップS27の処理に移行する。
続くステップS27において、表示用データ生成部113は、処理結果情報を参照し、処理対象のトピックに関連付けられたブログの総数Xを算出する(ステップS27)。続いて、表示用データ生成部113は、処理結果情報を参照し、処理対象のトピックに関連付けられた各ブログのトラックバック数の合計Yを算出するとともに(ステップS28)、当該各ブログに付加されたコメント数の合計Zを算出する(ステップS29)。ここで、トラックバック数の合計Yは、各ブログに関連付けられたトラックバック情報に基づいて行うものとし、参照元のブログから参照先のブログへの一対のトラックバック情報を1とカウントするものとする。
続いて、表示用データ生成部113は、X+αY+βZを算出することで、処理対象のトピックについてのスコアを求める(ステップS30)。ここで、「α」及び「β」は、重み成分を表す比例定数であって、任意の値が設定できるものとする。また、スコア算出のための関係式は、この例に限らないものとする。
表示用データ生成部113は、ステップS30で求めたスコアを、インスタンス表示用データの「ノード幅」に登録する(ステップS31)。
次に、表示用データ生成部113は、処理結果情報に含まれた全てのトピックを処理対象としたか否かを判定し、未処理のトピックが存在すると判定した場合には(ステップS32;No)、ステップS21に再び戻り、未処理のトピックを処理対象とする。
一方、ステップS32において、全てのトピックを処理対象としたと判定した場合には(ステップS32;Yes)、本処理を終了する。表示用データ生成部113は本処理を実行することで、図7に示したインスタンス表示用データを生成する。
次に、図9、図10を参照して、クラス間の関係に基づいたトピックグラフを表示させるためのトピックグラフ表示用データ(クラス表示用データ)について説明する。
図9は、表示用データ生成部113により生成されたクラス表示用データの一例を示した図である。図9に示したように、クラス表示用データには、「クラスノード名」と、「ノード幅」と、「リンク先」と、「リンク長」と、が関連付けて登録されている。
「クラスノード名」は、処理結果情報に含まれた各トピックが属する各クラスを後述するクラスノードCNとして表示する際の名称を指示する項目であって、各クラスの名称(ジャンル名)が登録されるようになっている。
「ノード幅」は、クラスノードCNを表示する際の大きさの度合いを指示する項目であって、各クラスに所属するトピックの数に応じた値が登録されるようになっている。ここでノード幅は、各トピックの名称が採り上げられた度合い、つまり注目度や関心度を上位概念のクラス単位で表したものとなっている。なお、ノード幅の数値が大きいほど、クラスノードCNが大きく表示されるものとする。
「リンク先」は、ルートトピックが属するクラス(ルートクラス)と他のクラスとの接続関係を指示する項目である。具体的には、「クラスノード名」に登録された名称(ジャンル名)のクラスノードCNと、「リンク先」に登録された名称のクラスノードCNと、を後述するクラスリンクCLで接続することを指示するものとなっている。
また、「リンク長」は、クラスリンクCLの長さの度合いを指示する項目であって、商品オントロジ172に定義された対応するクラス間の距離(ホップ数)に基づいて導出された値が登録されるようになっている。なお、リンク長の数値が大きいほど、即ち、クラス間の距離が離れているほど、クラスリンクCLが長く表示されるものとする。
なお、図9に示したクラス表示用データにおいて、「v」印が付加されたクラスノード名「CB」は、ルートクラスに対応するクラスノードであることを指示するルート識別情報であって、クラスノード名の登録時に付加されるものである。
以下、図10を参照して、表示用データ生成部113が実行するクラス表示用データ生成処理について説明する。図10は、クラス表示用データ生成処理の手順を示したフローチャートである。
まず、表示用データ生成部113は、関連情報抽出部112により生成された処理結果情報を参照すると、当該処理結果情報に含まれたトピックのうち、一つのトピックを処理対象に設定する(ステップS41)。次いで、表示用データ生成部113は、商品オントロジ172を参照し、処理対象のトピックに対応するインスタンスが所属するクラスを特定する(ステップS42)。
次に、表示用データ生成部113は、ステップS42で特定したクラスのジャンル名が、クラス表示用データの「クラスノード名称」に登録されているか否かを判定する(ステップS43)。ここで、「クラスノード名称」に未登録と判定した場合には(ステップS43;No)、処理対象のクラスのジャンル名をクラス表示用データの「クラスノード名称」に登録した後(ステップS44)、このクラスにルートトピックが属しているか否かを判定する(ステップS45)。
ステップS45において、ルートトピックが属していると判定した場合には(ステップS45;Yes)、表示用データ生成部113は、ルート識別情報を「クラスノード名称」に付加した後(ステップS46)、ステップS50の処理に移行する。
また、ステップS45において、ルートトピックが属していないと判定した場合には(ステップS45;No)、表示用データ生成部113は、ルートトピックが属するクラス(ルートクラス)のジャンル名をクラス表示用データの「リンク先」に登録する(ステップS47)。
続いて、表示用データ生成部113は、商品オントロジ172を参照し、処理対象のトピックが属するクラスと、ルートトピックが属するクラスとの間の距離(ホップ数)に基づいて、両クラス間の距離を導出し、この値をクラス表示用データの「リンク長」に登録した後(ステップS48)、ステップS50の処理に移行する。
一方、ステップS43において、ステップS42で特定したクラスのジャンル名が、クラス表示用データの「クラスノード名称」に既に登録されていると判定した場合(ステップS43;Yes)には、表示用データ生成部113は、重複した「クラスノード名称」の「ノード幅」に登録された値に1を加算し(ステップS49)、ステップS50の処理に移行する。なお、「ノード幅」に登録される値の初期値は0であるものとする。
ステップS50において、表示用データ生成部113は、処理結果情報に含まれた全てのトピックを処理対象としたか否かを判定し、未処理のトピックが存在すると判定した場合には(ステップS50;No)、ステップS41に再び戻り、未処理のトピックを処理対象とする。
一方、ステップS50において、全てのトピックを処理対象としたと判定した場合には(ステップS50;Yes)、本処理を終了する。表示用データ生成部113は本処理を実行することで、図9に示したクラス表示用データを生成する。
なお、表示用データ生成部113は、所定の設定内容、又は、ユーザから指示される指示内容に応じて、インスタンス表示用データ生成処理又はクラス表示用データ生成処理の何れか一方を実行し、生成したインスタンス表示用データ又はクラス表示用データを、トピックグラフ表示用データとして取り扱う。
次に、図11、図12を参照して、ブロググラフ表示用データについて説明する。ブロググラフ表示用データは、キーワードを基準にブログ検索部111により取得されたブログ間の関係を、ネットワーク状のグラフで表すブロググラフを表示させるためのデータである。表示用データ生成部113は、後述するブロググラフ生成処理(図12参照)を実行し、ブロググラフを表示させるためのブロググラフ表示用データを生成する。
図11は、表示用データ生成部113により生成されたブロググラフ表示用データの一例を示した図である。図11に示したように、ブロググラフ表示用データには「ブログノード識別情報」と、「ブログノード表示内容」と、「リンク先」と、が関連付けて登録されている。
「ブログノード識別情報」は、処理結果情報に含まれた各ブログの識別情報が登録される領域である。「ブログノード表示内容」は、処理結果情報に含まれた各ブログを後述するブログノードBNとして表示する際の表示内容を指示する項目であって、各ブログの記事の一部又は全てが登録されるようになっている。
「リンク先」は、ブログノードBN間の接続関係を指示する項目である。具体的には、「ブログノード識別情報」に対応するブログノードBNと、「リンク先」に登録されるブログノード識別情報に対応するブログノードBNと、を後述するブログリンクBLで接続することを指示するものとなっている。
なお、図11に示したブロググラフ表示用データにおいて、「v」印が付加されたブログノード識別情報「blog01」、「blog02」は、ルートトピックに関連付けられたブログであることを指示するルート識別情報であって、ブログノード識別情報の登録時に付加されるものである。
次に、図12を参照して、表示用データ生成部113が実行するブロググラフ生成処理について説明する。図12は、ブロググラフ生成処理の手順を示したフローチャートである。
まず、表示用データ生成部113は、RAM15又は記憶部17に保持された処理結果情報を参照すると、当該処理結果情報に含まれたブログのうち、一つのブログを処理対象に設定する(ステップS61)。次いで、表示用データ生成部113は、このブログの識別情報をブロググラフ表示用データの「ブログノード識別情報」に登録する(ステップS62)。
続いて、表示用データ生成部113は、処理対象のブログにルートトピックが関連付けられているか否かを判定する(ステップS63)。ここで、処理対象のブログにルートトピックが関連付けられていると判定した場合には(ステップS63;Yes)、表示用データ生成部113は、処理対象のブログがルートブログであると判断し、ルートブログであることを指示するルート識別情報を「ブログノード識別情報」に付加した後(ステップS64)、ステップS67の処理に移行する。
一方、ステップS63において、処理対象のブログがルートブログでないと判定した場合には(ステップS63;No)、表示用データ生成部113は、処理対象のブログに関連付けて登録されたトラックバック情報に基づいて、処理対象のブログの参照元ブログとなるブログを特定する(ステップS65)。次いで、表示用データ生成部113は、ステップS65で特定したブログの識別情報を、トピックグラフ表示用データの「リンク先」に登録し(ステップS66)、ステップS67の処理に移行する。
続くステップS67では、表示用データ生成部113は、処理対象のブログに含まれた記事の一部又は全てをブロググラフ表示用データの「ブログノード表示内容」に登録した後(ステップS67)、処理結果情報に含まれた全てのブログを処理対象としたか否かを判定する(ステップS68)。
ステップS68において、未処理のブログが存在すると判定した場合には(ステップS68;No)、ステップS61の処理へと再び戻り、未処理のブログを処理対象とする。
一方、ステップS68において、全てのブログを処理対象としたと判定した場合には(ステップS68;Yes)、本処理を終了する。表示用データ生成部113は本処理を実行することで、図11に示したブロググラフ表示用データを生成する。
表示用データ生成部113は、上述したトピックグラフ表示用データ(インスタンス表示用データ又はクラス表示用データ)と、ブロググラフ表示用データと、を少なくとも含んだ表示用データを生成し、通信処理部114を用いてクライアント端末20に送信する。
通信処理部114は、通信部16を介して受信した種々の情報を受け付けるとともに、通信部16を介して種々の情報をクライアント端末20等の外部装置に送信する。
次に、クライアント端末20について説明する。クライアント端末20は、携帯電話機やPDA(Personal Digital Assistance)、PC(Personal Computer)等であって、関連情報抽出サーバ10から送信される表示用データの表示を行う端末装置である。
図13は、クライアント端末20のハードウェア構成を示したブロック図である。図13に示したように、クライアント端末20は、CPU21、操作部22、表示部23、ROM24、RAM25、無線通信部26及び記憶部27等を備え、各部はバス28により接続されている。なお、後述するクライアント端末40、50、70についても同様のハードウェア構成を有するものとする。
CPU21は、RAM25の所定領域を作業領域として、ROM24又は記憶部27に予め記憶された各種制御プログラムとの協働により各種処理を実行することで、クライアント端末20を構成する各部の動作を統括的に制御する。
また、CPU21は、ROM24又は記憶部27に予め記憶された所定のプログラムとの協働により、後述する各機能部の機能を実現させる。なお、各機能部の動作については後述する。
操作部22は、各種のボタンや入力キーを備え、ユーザから操作入力された情報を指示信号として受け付け、その指示信号をCPU21に出力する。
表示部23は、LCD(Liquid Crystal Display)等の表示手段により構成され、CPU21からの表示信号に基づいて、各種情報を表示する。なお、表示部23は、操作部22と一体的にタッチパネルを構成する態様としてもよい。
ROM24は、クライアント端末20の制御にかかるプログラムや各種設定情報等を書き換え不可能に記憶する。
RAM25は、SDRAM等の記憶手段であって、CPU21の作業エリアとして機能し、バッファ等の役割を果たす。また、RAM25は、関連情報抽出サーバ10から送信された表示用データを一時記憶する一時記憶領域として機能する。
無線通信部26は、ネットワークNを通じ外部の機器との間で通信を行うインタフェースである。具体的に、無線通信部26は、外部機器から送信された表示用データ等の各種情報を受信し、CPU21に出力する。また、無線通信部26は、CPU21から出力される各種情報を外部機器へと送信する。
記憶部27は、磁気的又は光学的に記録可能な記憶媒体を有し、クライアント端末20の制御にかかるプログラムや各種設定情報等を書き換え可能に記憶する。
図14は、クライアント端末20の機能構成を示したブロック図である。図14に示したように、クライアント端末20は、画面表示部211、ユーザ操作処理部212、通信処理部213を有している。
画面表示部211は、RAM25に一時記憶された表示用データを読み出し、表示部23の表示領域に表示させる。具体的に、画面表示部211は、表示部23の表示領域内に表示用データに含まれたトピックグラフ表示用データに基づいて描画したトピックグラフと、ブロググラフ表示用データに基づいて描画したトピックグラフと、を表示する。
図15は、表示部23の表示領域に表示された表示用データの一例を示した図である。図15に示したように、表示領域は3つの表示領域P1〜P3に区分けされた3ペイン表示の構成となっており、互いに異なる種類の情報が各領域に表示されるようになっている。
表示領域P1は、検索対象となるキーワードが入力される表示領域であって、ユーザは操作部22を介し特定の商品名等を表す文字列を入力することが可能となっている。なお、キーワードが入力された後、「検索ボタン」が押下されることで、通信処理部213により、入力されたキーワードが検索要求として関連情報抽出サーバ10に送信される。なお、図15では、キーワードとして「911T」が入力された例を示している。
表示領域P2は、関連情報抽出サーバ10から送信された表示用データのうち、トピックグラフが表示される表示領域である。なお、表示領域P2に示したトピックグラフは、画面表示部211の制御により、図7のトピックグラフ表示用データ(インスタンス表示用データ)に基づいて表示されたものとなっている。以下、トピックグラフについて説明する。
表示領域P2において、トピックノードTNは、インスタンス表示用データの「トピックノード名」の夫々に対応するものであって、ルートトピックに対応するルート識別情報が付加されたトピックノードTNを二重円、連想トピックに対応するトピックノードTNを円で表している。
また、トピックグラフ表示用データの「ノード幅」に登録された数値、即ち、各トピック(商品名)の注目度や関心度に応じた大きさ(直径)で、各トピックノードTNは描画されている。そのため、ユーザは検索対象を表すキーワード(ルートトピック)と当該キーワードに関連する関連情報(連想トピック)との関係を直感的に把握することが可能となっている。
トピックノードTN間を結ぶトピックリンクTLは、インスタンス表示用データの「トピックノード名」と「リンク先」に登録されたトピックノードTNとに基づいて描画されている。また、各トピックリンクTLの長さは、トピックグラフ表示用データの「リンク長」に登録された数値に基づいて決定されている。そのため、ユーザはトピックリンクTLの長さにより、各トピック間の関係性を直感的に把握することが可能となっている。
なお、表示領域P2において、スライドバーB1、切替ボタンB2は、画面表示部211の制御により提供(描画)された、ユーザが操作可能なインタフェースである。ここでスライドバーB1は、連想トピックグラフに表示させるトピックの表示範囲を変更するためのインタフェースであって、商品オントロジ172上での距離(クラスを基準にしたホップ数)を変更するものである。
また、切替ボタンB2は、トピックグラフの表示粒度を変更するためのものであって、トピックグラフの表示をインスタンスに基づいて表示させるか、クラスに基づいて表示させるかを切り替えるためのインタフェースである。なお、スライドバーB1及び切替ボタンB2の操作にかかる動作については後述する。また、クラス表示用データに基づいて表示されるトピックグラフについては後述する。
表示領域P3は、関連情報抽出サーバ10から送信された表示用データのうち、ブロググラフが表示される表示領域である。なお、表示領域P3に示したブロググラフは、画面表示部211の制御により、図11のブロググラフ表示用データに基づいて描画されたものとなっている。以下、ブロググラフについて説明する。
表示領域P3において、ブログノードBNは、ブロググラフ表示用データの「ブログノード識別情報」の夫々に対応するものであって、当該「ブログノード識別情報」に関連付けられた「ブログノード表示内容」の全て又は一部が表示されるようになっている。ここで、ルート識別情報が付加されたブログノードBNを二重円、他のブログノードBNを円で表している。
ブログノードBN間を結ぶブログリンクBLは、ブロググラフ表示用データの「ブログノード識別情報」と「リンク先」に登録されたブログノード識別情報と、に基づいて描画されている。また、各ブログリンクBLの長さは、ブロググラフ表示用データの「リンク長」に登録された数値に基づいて描画されている。これにより、ユーザは、ブログノードBN間を接続するブログリンクBLとその長さにより、キーワードに対応するルートトピックと当該キーワードに関連する連想トピックと、の情報元となった各ブログ間のトラックバックの関係性を直感的に把握することができる。
なお、表示用データの表示形態はこの例に限らないものとする。例えば、トピックグラフを上位に、ブロググラフをその下位に表示する態様としたが、この逆に、ブロググラフを上位にトピックグラフを下位に表示する態様としてもよい。また、トピックグラフとブロググラフとを横に並べて表示する態様としてもよく、表示部23の表示領域の形状等に応じて表示することが好ましい。
図14に戻り、ユーザ操作処理部212は、ユーザから操作部22を介して入力された指示情報を受け付け、この指示情報を画面表示部211又は通信処理部213に出力する。例えば、表示部13と操作部12とによりタッチパネルを構成する場合、ユーザから表示画面を介して指示された指示情報を、画面表示部211又は通信処理部213に出力する。
通信処理部213は、無線通信部26を介して受信した種々の情報を受け付けるとともに、無線通信部26を介して種々の情報を関連情報抽出サーバ10等の外部装置に送信する。なお、通信処理部213は、関連情報抽出サーバ10から送信された表示用データを受け付けた場合、この表示用データをRAM25に一時記憶する。
以下、本実施形態の全体動作について説明する。図16は、関連情報抽出サーバ10、クライアント端末20により実行される関連情報表示処理の手順を示したフローチャートである。なお、図16のうち、ステップS71〜S73はクライアント端末20により実行される処理を示しており、ステップS81〜S85は関連情報抽出サーバ10により実行される処理を示している。
まず、クライアント端末20側では、表示領域P1に検索対象のキーワードが入力され、「検索ボタン」が押下されると、通信処理部213は、このキーワードを含んだ検索要求を、無線通信部26を介して関連情報抽出サーバ10に送信する(ステップS71)。
一方、関連情報抽出サーバ10では、クライアント端末20から送信された検索要求を受信すると(ステップS81)、ブログ検索部111は、この検索要求に含まれたキーワードに基づいて、当該キーワードを本文中に含んだブログを、ネットワークN上のブログサイトから取得する(ステップS82)。
続いて、関連情報抽出部112は、ステップS82で取得されたブログに基づいて、関連情報抽出処理を実行する(ステップS83)。なお、ステップS83の関連情報抽出処理は、図7で説明した関連情報抽出処理と同様であるため、その説明は省略する。
次いで、表示用データ生成部113は、ステップS83の処理によりRAM15又は記憶部17に保持された処理結果情報に基づいて、表示用データ生成処理を実行する(ステップS84)。以下、図17を参照して、ステップS84の表示用データ生成処理について説明する。
図17は、ステップS84の表示用データ生成処理の手順を示したフローチャートである。まず、表示用データ生成部113は、トピックグラフ生成処理を実行する(ステップS841)。このトピックグラフ生成処理では、図8で説明したインスタンス表示用データ生成処理、又は、図10で説明したクラス表示用データ生成処理の何れか一方が実行される。なお、本実施形態では、インスタンス表示用データ生成処理が実行されるよう予め設定されているものとする。
次いで、表示用データ生成部113は、ブロググラフ生成処理を実行する(ステップS842)。なお、ステップS842のブロググラフ生成処理は、図12で説明したブロググラフ表示用データ生成処理と同様であるため説明は省略する。
続いて、表示用データ生成部113は、ステップS841及びステップS842の処理で生成されたトピックグラフ表示用データ及びブロググラフ表示用データとともに、関連情報抽出処理で用いたホップ数と、ステップS841で実行した処理がインスタンス表示用データ生成処理又はクラス表示用データ生成処理の何れかを示す情報(切替情報)と、を少なくとも含んだ表示用データを生成し(ステップS843)、図16のステップS85の処理へと移行する。
図16に戻り、通信処理部114は、ステップS84の処理で生成された表示用データをクライアント端末20へと送信し(ステップS85)、関連情報抽出サーバ10側の処理は終了する。
一方、クライアント端末20では、関連情報抽出サーバ10から送信された表示用データを受信すると、通信処理部213はこの表示用データをRAM15に一時記憶させる(ステップS72)。次いで、画面表示部211は、表示用データに含まれたトピックグラフ表示用データに基づいて表示部23の表示領域P2にトピックグラフを表示させるとともに、ブロググラフ表示用データに基づいて表示領域P3にブロググラフを表示させ(ステップS73)、クライアント端末20側の処理を終了する。
ステップS73による処理の表示結果は、図15で示したとおりである。なお、表示領域P2のスライドバーB1のバーの位置は、表示用データに含まれたホップ数に基づいて表示される。また、表示領域P2の切替ボタンB2は、表示用データに含まれた切替情報が示す情報(インスタンス又はクラス)に基づいて表示されており、トピックグラフがインスタンス(instance)に基づくものか、クラス(class)に基づくものかを黒丸により明示している。
次に、表示領域P2に表示されたスライドバーB1及び/又は切替ボタンB2が操作された場合の動作について説明する。図18は、スライドバーB1、切替ボタンB2が操作された場合に実行される表示用データ更新処理の手順を示したフローチャートである。なお、本処理の前提として、クライアント端末20の表示部23には、図15で示した表示用データが表示されているものとする。
まず、クライアント端末20において、ユーザからスライドバーB1及び/又は切替ボタンB2が操作されると、ユーザ操作処理部212はこの操作内容を受け付ける(ステップS91)。次に、ユーザ操作処理部212は、現在設定されているスライドバーB1の設定値と、切替ボタンB2の設定内容と、を少なくとも含んだ表示条件変更情報を、通信処理部213を用いて関連情報抽出サーバ10に送信する(ステップS92)。
一方、関連情報抽出サーバ10では、クライアント端末20から送信された表示条件変更情報を受信すると、通信処理部114は、この表示条件変更情報を表示用データ生成部113に出力する(ステップS101)。
続いて、表示用データ生成部113は、表示条件変更情報に含まれたスライドバーB1の設定値を、商品オントロジ172から連想トピックを抽出する際のホップ数に設定し(ステップS102)、このホップ数に基づいて関連情報抽出処理を実行する(ステップS103)。なお、ステップS103の関連情報抽出処理は、図5で説明した関連情報抽出処理と同様であるため、その説明は省略する。
次いで、表示用データ生成部113は、表示条件変更情報に含まれた切替ボタンB2の設定内容に応じて、ステップS105の表示用データ生成処理で実行する処理内容(インスタンス表示用データ生成処理又はクラス表示用データ処理)を設定する(ステップS104)。そして、表示用データ生成部113は、ステップS103の関連情報抽出処理で生成された処理結果情報に基づいて、表示用データ生成処理を実行する(ステップS105)。なお、ステップS105の処理は、図17で説明したステップS84の表示用データ生成処理と同様であるため説明は省略するが、トピックグラフ生成処理ではステップS104で設定された処理内容(インスタンス表示用データ生成処理又はクラス表示用データ処理)が実行されるものとする。
次に、通信処理部114は、ステップS104の表示用データ生成処理で生成された表示用データをクライアント端末20へと送信し(ステップS106)、関連情報抽出サーバ10側の処理は終了する。
一方、クライアント端末20では、関連情報抽出サーバ10から送信された表示用データを受信すると、通信処理部213は、この表示用データをRAM25に一時記憶させる(ステップS93)。次いで、画面表示部211は、表示用データに含まれるトピックグラフ表示用データ及びブロググラフ表示用データに基づき、表示部23の表示領域P2に表示されたトピックグラフを更新するとともに、表示領域P3に表示されたブロググラフを更新し(ステップS94)、クライアント端末20側の処理を終了する。
なお、本処理では、ステップS105の表示用データ生成処理において、ブロググラフ生成処理をも実行する態様としているが、これに限らず、トピックグラフ生成処理のみを実行し、ブロググラフ生成処理を実行しない態様としてもよい。この場合、表示量データとしては、トピックグラフ表示用データのみとなるため、クライアント端末20の画面表示部211は、表示部23の表示領域P2の表示を更新することになる。
図19は、図15に示したスライドバーB1の設定値「2」の状態から、「0」に変更された場合の表示例を示した図である。スライドバーB1の設定値が「0」の場合、関連情報抽出処理で用いるホップ数も「0」となるため、キーワード「911T」に対応するインスタンスI2が属するクラスC6(ジャンル名SB)からのみ連想トピック「911SH」、「811T」、「810T」が抽出されることになる。そのため、表示領域P2に表示されるトピックノードTNは、図15で示したトピックノードTNから、「F903i」、「W42T」、「W52T」を除いたものが表示される。なお、ホップ数が「0」の場合、商品オントロジ172上での距離は等距離となるため、トピックリンクTLは全て同じ長さで表示されている。
また、図20は、図15に示した切替ボタンB2の設定内容「インスタンス」を、「クラス」に切り替えられた場合の表示例を示した図である。切替ボタンB2が「クラス」に切り替えられた場合、トピックデータ生成処理で実行される処理は、インスタンス表示用データ生成処理からクラス表示用データ生成処理に切り替えられるため、クラス表示用データが表示用データに含まれることになる。そのため、表示領域P2にはキーワードと当該キーワードに関連する連想トピックとの関係を、クラス間の関係で表したトピックグラフが表示されることになる。
この表示領域P2において、クラスノードCNは、クラス表示用データの「クラスノード名」の夫々に対応するものであって、ルートクラスに対応するクラスノードCNを二重円、他のクラスに対応するクラスノードCNを円で表している。また、各クラスノードCNを大きさ(直径)は、クラス表示用データの「ノード幅」に登録された数値に基づいて描画されている。
クラスノードCN間を結ぶクラスリンクCLは、クラス表示用データの「リンク先」に登録されたクラスノードCNの名称に基づいて描画されている。また、各クラスリンクCLの長さは、クラス表示用データの「リンク長」に登録された数値に基づいて描画されている。そのため、ユーザは検索の対象となるルートトピックと当該検索対象物に関連する連想トピックとの関係を、これらトピックの上位概念となるカテゴリ名で確認することが可能となっている。
以上のように、本実施形態によれば、トピックオントロジに基づいて、検索対象のキーワードについて取得したウェブ文書に含まれる文字列から、このキーワードと当該キーワードに関連するトピックを抽出するため、検索対象の対象物に関連する情報を効率的に抽出することができる。また、キーワードと当該キーワードに関連するトピック間の関係をトピックノードの大きさとトピックリンクの長さとで表した第1トピックグラフで視覚化するともに、情報元となったウェブ文書間の参照関係をブログノードとブログリンクとで表したブロググラフで視覚化することができるため、検索の対象のキーワードと当該キーワードに関連する連想トピックとの関係性を効率的、且つ、多角的に表すことができる。
また、キーワードに関連するトピックを検索する深度を、スライドバーB1の操作により変更できるため、多角的な観点からキーワードと当該キーワードに関連するトピックとの関係性を把握することができ、ユーザの利便性を向上させることができる。また、切替ボタンB2の操作により、キーワードと当該キーワードに関連するトピックとの関係性を、インスタンス又はクラスを基準にしたトピックグラフで視覚化できるため、多角的な観点からキーワードと当該キーワードに関連するトピックとの関係性を把握することができ、ユーザの利便性を向上させることができる。
なお、本実施形態では、関連情報抽出サーバ10により生成された表示用データをクライアント端末20で表示する態様としたが、これに限らず、関連情報抽出サーバ10側で表示用データを表示する態様としてもよい。以下、関連情報抽出サーバ側で表示用データを表示する場合の実施形態について説明する。
図21は、本実施形態の関連情報抽出サーバ10の、他の態様である関連情報抽出サーバ30の機能構成を示した図である。図21に示したように、関連情報抽出サーバ30は、図4に示した構成に加え、上述した画面表示部211を備えることで、関連情報抽出サーバ30側で表示用データを表示することが可能となり、表示用データの生成から表示に係る一連の処理をスタンドアロンで行うことが可能となる。なお、画面表示部211により表示部13に表示される画面は、図15に示した表示例と同様、3ペイン表示の構成であるものとする。
また、クライアント端末20側のみで、処理結果情報の生成と、表示用データの生成と、を行う態様としてもよい。以下、クライアント端末側で処理結果情報の生成と、表示用データの生成とを行う場合の実施形態について説明する。
図22は、本実施形態のクライアント端末20の、他の態様であるクライアント端末40の機能構成を示した図である。図22に示したように、クライアント端末40は、図14に示した構成に加え、上述したブログ検索部111、関連情報抽出部112、表示用データ生成部113を備えている。なお、形態素解析辞書171、商品オントロジ172は、クライアント端末20内に内蔵する態様としてもよいし、関連情報抽出サーバ10等、外部装置に記憶された形態素解析辞書171、商品オントロジ172を、通信部16を介して利用する態様としてもよい。このように、クライアント端末40側に処理結果情報の生成と、表示用データの生成と、にかかる機能部を備えることで、表示用データの生成と表示に係る一連の処理をクライアント端末40側で行うことが可能となる。
[第2の実施形態]
本実施形態では、トピックグラフ内のトピックノードTNに対し、所定の操作を行うことを可能にした構成を説明する。なお、上述した第1の実施形態と同様の構成については、同じ符号を付与し、その説明を省略する。
図23は、本実施形態のクライアント端末50の機能構成を示したブロック図である。図23に示したように、クライアント端末50は、通信処理部213、ユーザ操作処理部214、画面表示部215を有している。
ユーザ操作処理部214は、ユーザ操作処理部212と同様の機能を有し、操作部22を介して入力された、トピックグラフ内の特定のトピックノードTNを選択する指示情報を受け付け、この選択されたトピックノードTNのトピックノード名(例えば、W42T)を少なくとも含むノード詳細要求情報を、通信処理部213を用いて関連情報抽出サーバ10に送信させる。
画面表示部215は、画面表示部211と同様の機能を有し、ノード詳細要求情報に対する応答として関連情報抽出サーバ10から送信される後述するノード詳細情報に基づき、選択されたトピックノードTNに関する情報を表示部23に表示させる。
図24は、本実施形態の関連情報抽出サーバ60の機能構成を示したブロック図である。図24に示したように、関連情報抽出サーバ60は、ブログ検索部111、関連情報抽出部112、表示用データ生成部113、通信処理部114、ノード詳細情報抽出部115を有している。
ノード詳細情報抽出部115は、クライアント端末50から送信されたノード詳細要求情報に基づき、このノード詳細要求情報で指示されたトピックノード名に関連する情報を処理結果情報から抽出し、ノード詳細情報として通信処理部114によりクライアント端末20に送信させる。
具体的に、ノード詳細情報抽出部115は、RAM15又は記憶部17に保持された処理結果情報を参照し、ノード詳細要求情報で指示されたトピックノード名に対応するトピックに関連付けられたブログを特定する。また、ノード詳細情報抽出部115は、特定したブログの総数を算出するとともに、各ブログに付与されたトラックバック数の合計と、コメント数の合計とを算出すると、これの算出結果と、処理結果情報から特定したブログの識別情報と、ノード詳細要求情報で指示されたトピックノード名と、を少なくとも含んだノード詳細情報を生成する。
図25は、ノード詳細情報抽出部115が実行するノード詳細情報抽出処理の手順を示したフローチャートである。まず、ノード詳細情報抽出部115は、処理結果情報を参照し、ノード詳細要求情報で指示されたトピックノード名のトピックに関連付けられたブログを特定する(ステップS111)。
次いで、ノード詳細情報抽出部115は、ステップS122で特定したブログの総数を算出するとともに、これらのブログに付与されたトラックバック数の合計と、コメント数の合計を算出する(ステップS112)。次に、ノード詳細情報抽出部115は、ステップS122で特定したブログの識別情報と、ステップS112で算出した各値と、ノード詳細要求情報で指示されたトピックノードTNの名称と、を少なくとも含んだノード詳細情報(図23参照)を生成し(ステップS113)、本処理を終了する。
図26は、ノード詳細情報生成処理により生成されたノード詳細情報の一例を示した図である。図26に示したように、ノード情報には、ノード詳細要求情報で指示されたトピックノード名、特定されたブログの識別情報、ブログの総数を表すブログ記事数、トラックバックの合計数を表すトラックバック数及びコメントの合計数を表すコメント数が含まれている。なお、図23の例では、ノード詳細要求情報として「GHI01」が指示された場合の結果を示しており、トピックノード名「GHI01」、ブログ識別情報「Blog02、Blog05、Blog08、Blog09、Blog10、Blog11」、ブログ記事数「6」、トラックバック数「5」、コメント数「7」となっている。
次に、図27を参照して、表示領域P2に表示されたトピックグラフから特定のトピックノードTNが選択された場合の全体動作について説明する。図27は、クライアント端末50と関連情報抽出サーバ60とに実行されるノード詳細情報表示処理の手順を示したフローチャートである。なお、本処理の前提として、クライアント端末20の表示部23には、図15で示した表示用データが表示されているものとする。
まず、クライアント端末50において、ユーザから操作部22が操作され、表示領域P2に表示されたトピックノードTNから特定のトピックノードTNが選択されると、ユーザ操作処理部212はこの操作内容を受け付ける(ステップS121)。次に、ユーザ操作処理部212は、選択されたトピックノード名をノード詳細要求情報として、通信処理部213を用いて関連情報抽出サーバ60に送信する(ステップS122)。
一方、関連情報抽出サーバ60では、クライアント端末50から送信されたノード詳細要求情報を受信すると、通信処理部114は、このノード詳細要求情報をノード詳細情報抽出部115に出力する(ステップS131)。
続いて、ノード詳細情報抽出部115は、処理結果情報を参照し、ノード詳細情報生成処理を実行する(ステップS132)。なお、ステップS132のノード詳細情報生成処理は、図25で説明したノード詳細情報生成処理と同様であるため、その説明は省略する。
次いで、通信処理部114は、ステップS132のノード詳細情報生成処理で生成されたノード詳細情報をクライアント端末50に送信し、関連情報抽出サーバ60側の処理を終了する。
一方、クライアント端末50では、関連情報抽出サーバ10から送信されたノード詳細情報を受信すると、通信処理部213は、このノード詳細情報をRAM25に一時記憶させる(ステップS123)。次いで、画面表示部215は、ノード詳細情報に基づき、当該ノード詳細情報に含まれた情報を表示部23に表示させ(ステップS124)、クライアント端末50側の処理を終了する。
図28は、ステップS124の処理により表示部23の表示領域P2に表示されたノード詳細情報の一例を示した図である。同図では、ユーザから「W42T」の名称のトピックノードTNが選択された場合の表示結果を示しており、この「W42T」のトピックノードTNに対応付けた状態で、トピックノード名、ブログ記事数、トラックバック数及びコメント数を表示している。
また、図29は、表示部23に表示されたノード詳細情報の他の態様と示した図であって、表示領域P3に表示されたノード詳細情報を示した図である。この図29では、ノード詳細情報に含まれたブログの識別情報に対応するブログノードBNを強調表示することで、選択されたトピックノード名「W42T」のトピックノードTNに関連するブログノードBNを識別可能に表示している。
また、図30に示したように、ノード詳細情報に含まれたブログの識別情報に対応するブログノードBN(以下、関連ブログノードBNという)のみを、表示領域P3に表示するよう制御する態様としてもよい。ここで、画面表示部215は、ユーザ操作処理部214により検出される「+」記号の押下信号に応じて、表示を抑制したブログノードBNを表示させるものとし、「+」記号の押下毎に表示と非表示を切り替えるよう制御する。なお、「+」記号は表示を抑制したブログノードBNの親ノード(上位ノード)近傍に表示されることが好ましい。
さらに、関連ブログノードBNに対して、当該関連ブログノードBNに関する情報を表示する態様としてもよい。具体的に、画面表示部215は、図31に示したように、強調表示した関連ブログノードBNに対応付けて、当該関連ブログノードBNに対応するブログの記事の一部又は全てを表示するよう制御する。なお、表示する記事の内容は、ブロググラフ表示用データの「ブログノード表示内容」から読み出されるものとする。
このとき、関連ブログノードBN毎に、記事の内容の一部又は全てを順次表示させる態様としてもよく、具体的には、各関連ブログノードBNについて表示した「次へ」ボタンが押下される毎に、矢印の順に関連ブログノードBNに対応するブログの記事が順次表示するよう表示を制御してもよい。なお、表示順序は、予め定められているものとしてもよいし、各ブログの識別情報に含まれた更新日時に応じた順序で表示する態様としてもよい。また、ユーザが表示順序を指定できるインタフェースを別途提供し、ユーザから指定された順序で表示する態様としてもよい。
以上のように本実施形態によれば、表示部23に表示されたトピックグラフから、特定のトピックノードTNを選択することで、このトピックノードTNに関連する情報を表示することができるため、各トピックについての分析を効率的に行うことができる。
[第3の実施形態]
本実施形態では、ブロググラフ内のブログノードBNに対し、所定の操作を行うことを可能にした構成を説明する。なお、上述した第1の実施形態と同様の構成については、同じ符号を付与し、その説明を省略する。
図32は、本実施形態のクライアント端末70の機能構成を示したブロック図である。図32に示したように、クライアント端末70は、通信処理部213、ユーザ操作処理部216、画面表示部217を有している。
ユーザ操作処理部216は、ユーザ操作処理部212と同様の機能を有し、操作部22を介して入力されたブロググラフ内の特定のブログノードBNを選択する指示情報を受け付け、この選択されたブログノードBNのブログノード識別情報(例えば、blog04)を少なくとも含んだ絞込要求情報を、通信処理部213を用いて関連情報抽出サーバ60に送信させる。
画面表示部217は、画面表示部211と同様の機能を有し、絞込要求情報に対する応答として関連情報抽出サーバ60から送信されるインスタンス表示用データに基づき、表示部23の表示領域P2に表示されたトピックグラフを更新する。
図33は、本実施形態の関連情報抽出サーバ80の機能構成を示したブロック図である。図33に示したように、関連情報抽出サーバ80は、ブログ検索部111、関連情報抽出部112、通信処理部114、表示用データ生成部116を有している。
表示用データ生成部116は、表示用データ生成部113と同様の機能を有し、通信処理部114を介しクライアント端末20から送信された絞込要求情報を受け付けると、この絞込要求情報に含まれたブログノードBNの名称に対応するブログと、当該ブログとトラックバックの関係にある他のブログと、をRAM15又は記憶部17に保持された処理結果情報から特定する。また、表示用データ生成部116は、処理結果情報から特定した各ブログに関連付けられたトピックについて、上述したインスタンス表示用データ生成処理を実行することでインスタンス表示用データを生成し、通信処理部114を用いてクライアント端末50に送信させる。
以下、図34を参照して、表示領域P3に表示されたブロググラフから特定のブログノードBNが選択された場合の全体動作について説明する。図34は、クライアント端末70と関連情報抽出サーバ80とにより実行される絞込表示処理の手順を示したフローチャートである。なお、本処理の前提として、クライアント端末70の表示部23には、図15で示した表示用データが表示されているものとする。
まず、クライアント端末70において、操作部22を介して表示領域P3に表示されたブログノードBNから特定のブログノードBNが選択されると、ユーザ操作処理部216は、この操作内容を受け付ける(ステップS141)。次に、ユーザ操作処理部216は、選択されたブログノードBNの識別情報を少なくとも含む絞込要求情報を、通信処理部213を用いて関連情報抽出サーバ60に送信する(ステップS142)。
一方、関連情報抽出サーバ80では、クライアント端末50から送信されたノード詳細要求情報を受信すると、通信処理部114はこの絞込要求情報を表示用データ生成部116に出力する(ステップS151)。
続いて、表示用データ生成部116は、処理結果情報を参照し、絞込要求情報に含まれたブログノードBNの識別情報に対応するブログを特定する(ステップS152)。次いで、表示用データ生成部116は、特定したブログを参照元とするトラックバック情報が関連付けられたブログ、即ち、ステップS152で特定したブログとトラックバックの関係にあるブログを特定する(ステップS153)。
次に、表示用データ生成部116は、処理結果情報に基づいて、ステップS152及びステップS153で特定したブログに関連付けられた各トピックを処理対象の候補とし、インスタンス表示用データ生成処理を実行する(ステップS154)。なお、ステップS144のインスタンス表示用データ生成処理は、図8で説明したインスタンス表示用データ生成処理と同様であるため説明は省略する。
次いで、表示用データ生成部116は、ステップS154の処理で生成されたインスタンス表示用データと、ステップS152及びステップS153で特定したブログの識別情報と、を少なくとも含んだ絞込表示用データを生成する(ステップS155)。そして、通信処理部114は、ステップS145で生成された絞込表示用データをクライアント端末70に送信し、関連情報抽出サーバ80側の処理を終了する。
一方、クライアント端末70では、関連情報抽出サーバ60から送信された絞込表示用データを受信すると、通信処理部213はこの絞込表示用データをRAM25に一時記憶させる(ステップS143)。次いで、画面表示部217は、絞込表示用データに含まれたインスタンス表示用データに基づいて、表示部23の表示領域P2に表示されたトピックグラフを更新する(ステップS144)。また、画面表示部217は、表示領域P3に表示されたブログノードBNのうち、絞込表示用データに含まれたブログの識別情報に対応するブログノードBNを強調表示し(ステップS145)、クライアント端末50側の処理を終了する。
図35は、ステップS144、S145での表示結果を示した図である。なお、図35は、図15で示したブロググラフのうち、「オススメ」と表記されたブログノードBNが選択された場合の表示結果を示している。ここで、表示領域P2に表示されたトピックグラフは、表示領域P3で強調表示された4つのブログノードBNに対応するブログに基づいて生成されたものとなっている。
以上のように、本実施形態によれば、表示部23に表示されたブロググラフから、特定のブログノードBNを選択することで、トピックグラフの生成にかかるブログを絞り込むことができる。これにより、ユーザは選択したブログの範囲の下、検索の対象となるキーワードと当該キーワードに関連するトピックとの関係性を視覚化できるため、多角的な観点からキーワードと当該キーワードに関連するトピックとの関係性を把握することができる。
なお、選択されるブログノードBNによっては、キーワードに対応するトピックノードTNが消失することがある。この場合、キーワードと連想トピックとの関係が不明確となるため、図36に示したように、キーワードに対応するトピックノードTNを破線等により表すことで、その存在を明示しておくことが好ましい。
以上、発明の実施の形態について説明したが、本発明はこれに限定されるものではなく、本発明の主旨を逸脱しない範囲での種々の変更、置換、追加などが可能である。
例えば、上記実施形態の処理にかかるプログラムを、コンピュータで読み取り可能な記憶媒体として提供することも可能である。記憶媒体としては、磁気ディスク、光ディスク(CD−ROM、CD−R、DVD等)、光磁気ディスク(MO等)、半導体メモリ等、プログラムを記憶でき、且つ、コンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であってもよい。
また、上記実施形態の処理にかかるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。
情報表示システムの構成を示した図である。 関連情報抽出サーバのハードウェア構成を示した図である。 トピックオントロジの一例を模式的に示した図である。 第1の実施形態に係る関連情報抽出サーバの機能構成を示した図である。 関連情報抽出処理の手順を示したフローチャートである。 処理結果情報の一例を模式的に示した図である。 インスタンス表示用データの一例を示した図である。 インスタンス表示用データ生成処理の手順を示したフローチャートである。 クラス表示用データの一例を示した図である。 クラス表示用データ生成処理の手順を示したフローチャートである。 ブロググラフ表示用データの一例を示した図である。 ブロググラフ生成処理の手順を示したフローチャートである。 クライアント端末のハードウェア構成を示した図である。 第1の実施形態に係るクライアント端末の機能構成を示した図である。 表示領域に表示された表示用データの一例を示した図である。 関連情報表示処理の手順を示したフローチャートである。 表示用データ生成処理の手順を示したフローチャートである。 表示用データ更新処理の手順を示したフローチャートである。 表示領域に表示された表示用データの一例を示した図である。 表示領域に表示された表示用データの一例を示した図である。 第1の実施形態にかかる関連情報抽出サーバの機能構成の他の形態を示した図である。 第1の実施形態にかかるクライアント端末の機能構成の他の形態を示した図である。 第2の実施形態に係るクライアント端末の機能構成を示した図である。 第2の実施形態に係る関連情報抽出サーバの機能構成を示した図である。 ノード詳細情報抽出処理の手順を示したフローチャートである。 ノード詳細情報の一例を示した図である。 ノード詳細情報表示処理の手順を示したフローチャートである。 表示領域に表示されたノード詳細情報の一例を示した図である。 表示領域に表示されたノード詳細情報の一例を示した図である。 表示領域に表示されたノード詳細情報の一例を示した図である。 表示領域に表示されたノード詳細情報の一例を示した図である。 第3の実施形態に係るクライアント端末の機能構成を示した図である。 第3の実施形態に係る関連情報抽出サーバの機能構成を示した図である。 絞込表示処理の手順を示したフローチャートである。 表示領域に表示された表示用データの一例を示した図である。 表示領域に表示された表示用データの一例を示した図である。
符号の説明
100 情報表示システム
10 関連情報抽出サーバ
30 関連情報抽出サーバ
60 関連情報抽出サーバ
80 関連情報抽出サーバ
11 CPU
12 操作部
13 表示部
14 ROM
15 RAM
16 通信部
17 記憶部
171 形態素解析辞書
172 商品オントロジ
18 バス
111 ブログ検索部
112 関連情報抽出部
1121 ブログ構造分析部
1122 形態素解析部
1123 オントロジ抽出部
113 表示用データ生成部
114 通信処理部
115 ノード詳細情報抽出部
116 表示用データ生成部
20 クライアント端末
40 クライアント端末
50 クライアント端末
70 クライアント端末
21 CPU
22 操作部
23 表示部
24 ROM
25 RAM
26 無線通信部
27 記憶部
28 バス
211 画面表示部
212 ユーザ操作処理部
213 通信処理部
214 ユーザ操作処理部
215 画面表示部
216 ユーザ操作処理部
217 画面表示部

Claims (10)

  1. 表示手段と、
    検索対象となるキーワードの入力を受け付ける第1受付手段と、
    前記キーワードに関係する1又は複数のウェブ文書をネットワーク上から受信する受信手段と、
    前記ウェブ文書の各々に含まれる文字列を1又は複数の単語に分割する分割手段と、
    複数の単語を夫々表すインスタンスを当該インスタンスが属するクラスと対応付けて定義するとともに、前記インスタンス間の関連性を前記クラス間の距離により定義したオントロジを記憶する第1記憶手段と、
    前記分割手段により分割された各単語と一致するインスタンスを、前記オントロジから抽出するオントロジ抽出手段と、
    前記オントロジ抽出手段により抽出された各インスタンスを、当該インスタンスと一致する単語を含んだ前記ウェブ文書と関連付けるとともに、当該ウェブ文書間の繋がりを示す参照関係を記憶する第2記憶手段と、
    前記第2記憶手段に記憶された各インスタンスをトピックノードとして表示する際の当該トピックノードの大きさを、当該各インスタンスに関連付けられたウェブ文書の個数に応じて決定するとともに、前記キーワードの単語を表すインスタンスのトピックノードと、当該インスタンス以外の他のインスタンスのトピックノードとを接続するトピックリンクの長さを、前記オントロジに定義された前記各インスタンスが属するクラス間の距離に応じて決定する第1表示条件決定手段と、
    前記第2記憶手段に記憶された各ウェブ文書をウェブノードとして表示する際の当該ウェブノード間を接続するウェブリンクの接続関係を、前記各ウェブ文書の参照関係に基づいて決定する第2表示条件決定手段と、
    前記第1表示条件決定手段で決定されたトピックノードの大きさとトピックリンクの長さとに基づいて、前記第2記憶手段に記憶されたインスタンス間の関係を前記トピックノードと前記トピックリンクとにより表した第1グラフを、前記表示手段の第1表示領域に表示させる第1画面表示手段と、
    前記第2表示条件決定手段で決定されたウェブリンクの接続関係に基づいて、前記第2記憶手段に記憶されたウェブ文書間の関係を前記ウェブノードと前記ウェブリンクとにより表した第2グラフを、前記表示手段の第2表示領域に表示させる第2画面表示手段と、
    を備えたことを特徴とする情報表示装置。
  2. 前記取得手段により取得されたウェブ文書から、当該ウェブ文書と関係のある他のウェブ文書の取得先を抽出し、当該取得先から前記他のウェブ文書を前記取得手段に取得させる構造分析手段を更に備えたことを特徴とする請求項1に記載の情報表示装置。
  3. 前記オントロジ抽出手段は、前記キーワードの単語を表すインスタンスが属するクラスを基点クラスとし、当該基点クラスから所定ホップ数内の各クラスに属するインスタンスの中から、前記分割手段により分割された各単語と一致するインスタンスを抽出することを特徴とする請求項1に記載の情報表示装置。
  4. 前記ホップ数の指定を受け付ける第2受付手段を更に備え、
    前記オントロジ抽出手段は、前記基点クラスから前記第2受付手段で受け付けられたホップ数内の各クラスに属するインスタンスの中から、前記分割手段により分割された各単語と一致するインスタンスを抽出することを特徴とする請求項3に記載の情報表示装置。
  5. 前記第2記憶手段に記憶された各インスタンスが属するクラスをクラスノードとして表示する際の当該クラスノード大きさを、当該各インスタンスが属するクラス毎の個数に応じて決定するとともに、前記キーワードの単語を表すインスタンスが属するクラスのクラスノードと、当該クラス以外の他のクラスのクラスノードとを接続するクラスリンクの長さを、前記オントロジに定義されたクラス間の距離に応じて決定する第3表示条件決定手段を更に備え、
    前記第1画像表示手段は、前記第3表示条件決定手段で決定されたクラスノードの大きさとクラスリンクの長さとに基づいて、前記第2記憶手段に記憶された各インスタンスが属するクラス間の関係を、前記クラスノードと前記クラスリンクとにより表した第3グラフを、前記表示手段の第1表示領域に表示させることを特徴とする請求項1に記載の情報表示装置。
  6. 前記第1表示領域に表示されたグラフの切り替えを指示する指示情報を受け付ける第3受付手段を更に備え、
    前記第1画面表示手段は、前記第3受付手段で受け付けられた指示内容に応じて、前記第1グラフ又は第3グラフを前記表示手段の第1表示領域に表示させることを特徴とする請求項5に記載の情報表示装置。
  7. 前記第1表示領域に表示されたトピックノードのうち、特定のトピックノードの選択を受け付ける第4受付手段と、
    前記第2記憶手段から、前記特定のトピックノードに対応するインスタンスを特定し、当該インスタンスに関連付けられたウェブ文書に関する関連情報を抽出する関連情報抽出手段と、
    前記関連情報抽出手段により抽出された関連情報を、前記第1表示領域及び/又は第2表示領域に表示させる第3画面表示手段と、
    を備えたことを特徴とする請求項1に記載の情報表示装置。
  8. 前記第2表示領域に表示された前記ウェブノードのうち、特定のウェブノードの選択を受け付ける第5受付手段と、
    前記第2記憶手段から、前記特定のウェブノードに対応するウェブ文書と、このウェブ文書と参照関係にあるウェブ文書とを特定し、当該各ウェブ文書に関連付けられたインスタンスを抽出する絞込手段と、
    を更に備え、
    前記第1表示条件決定手段は、前記絞込手段で抽出された各インスタンスの範囲内で、当該各インスタンスをトピックノードとして表示する際の当該トピックノードの大きさと、前記キーワードの単語を表すインスタンスのトピックノードと当該トピックノード以外の他のトピックノードとを接続するトピックリンクの長さと、を決定することを特徴とする請求項1に記載の情報表示装置。
  9. 情報表示装置で実行される情報表示方法であって、
    前記情報表示装置は、表示手段と、複数の単語を夫々表すインスタンスを、当該インスタンスが属するクラスと対応付けて定義するとともに、前記インスタンス間の関連性を前記クラス間の距離により定義したオントロジを記憶する第1記憶手段とを備え、
    受付手段が、検索対象となるキーワードの入力を受け付ける受付ステップと、
    受信手段が、前記キーワードに関係する1又は複数のウェブ文書をネットワーク上から受信する受信ステップと、
    分割手段が、前記ウェブ文書の各々に含まれる文字列を1又は複数の単語に分割する分割ステップと、
    オントロジ抽出手段が、前記分割ステップで分割された各単語と一致するインスタンスを、前記第1記憶手段に記憶されたオントロジから抽出するオントロジ抽出ステップと、
    記憶制御手段が、前記オントロジ抽出ステップで抽出された各インスタンスを、当該インスタンスと一致する単語を含んだ前記ウェブ文書と関連付けるとともに、当該ウェブ文書間の繋がりを示す参照関係を第2記憶手段に記憶する記憶ステップと、
    第1表示条件決定手段が、前記記憶ステップで記憶された各インスタンスをトピックノードとして表示する際の当該トピックノードの大きさを、当該各インスタンスに関連付けられたウェブ文書の個数に応じて決定するとともに、前記キーワードの単語を表すインスタンスのトピックノードと、当該インスタンス以外の他のインスタンスのトピックノードとを接続するトピックリンクの長さを、前記オントロジに定義された前記各インスタンスが属するクラス間の距離に応じて決定する第1表示条件決定ステップと、
    第2表示条件決定手段が、前記記憶ステップで記憶された各ウェブ文書をウェブノードとして表示する際の当該ウェブノード間を接続するウェブリンクの接続関係を、前記各ウェブ文書の参照関係に基づいて決定する第2表示条件決定ステップと、
    第1画面表示手段が、前記第1表示条件決定ステップで決定されたトピックノードの大きさとトピックリンクの長さとに基づいて、前記記憶ステップで記憶されたインスタンス間の関係を前記トピックノードと前記トピックリンクとにより表した第1グラフを、前記表示手段の第1表示領域に表示させる第1画面表示ステップと、
    第2画面表示手段が、前記第2表示条件決定ステップで決定されたウェブリンクの接続関係に基づいて、前記記憶ステップで記憶されたウェブ文書間の関係を前記ウェブノードと前記ウェブリンクとにより表した第2グラフを、前記表示手段の第2表示領域に表示させる第2画面表示ステップと、
    を含むことを特徴とする情報表示方法。
  10. 表示手段を備えたコンピュータを、
    検索対象となるキーワードの入力を受け付ける第1受付手段と、
    前記キーワードに関係する1又は複数のウェブ文書をネットワーク上から受信する受信手段と、
    前記ウェブ文書の各々に含まれる文字列を1又は複数の単語に分割する分割手段と、
    複数の単語を夫々表すインスタンスを当該インスタンスが属するクラスと対応付けて定義するとともに、前記インスタンス間の関連性を前記クラス間の距離により定義したオントロジから、前記分割手段により分割された各単語と一致するインスタンスを抽出するオントロジ抽出手段と、
    前記オントロジ抽出手段により抽出された各インスタンスを、当該インスタンスと一致する単語を含んだ前記ウェブ文書と関連付けるとともに、当該ウェブ文書間の繋がりを示す参照関係を記憶手段に記憶する記憶制御手段と、
    前記記憶手段に記憶された各インスタンスをトピックノードとして表示する際の当該トピックノードの大きさを、当該各インスタンスに関連付けられたウェブ文書の個数に応じて決定するとともに、前記キーワードの単語を表すインスタンスのトピックノードと、当該インスタンス以外の他のインスタンスのトピックノードとを接続するトピックリンクの長さを、前記オントロジに定義された前記各インスタンスが属するクラス間の距離に応じて決定する第1表示条件決定手段と、
    前記記憶手段に記憶された各ウェブ文書をウェブノードとして表示する際の当該ウェブノード間を接続するウェブリンクの接続関係を、前記各ウェブ文書の参照関係に基づいて決定する第2表示条件決定手段と、
    前記第1表示条件決定手段で決定されたトピックノードの大きさとトピックリンクの長さとに基づいて、前記記憶手段に記憶されたインスタンス間の関係を前記トピックノードと前記トピックリンクとにより表した第1グラフを、前記表示手段の第1表示領域に表示させる第1画面表示手段と、
    前記第2表示条件決定手段で決定されたウェブリンクの接続関係に基づいて、前記記憶手段に記憶されたウェブ文書間の関係を前記ウェブノードと前記ウェブリンクとにより表した第2グラフを、前記表示手段の第2表示領域に表示させる第2画面表示手段と、
    して機能させることを特徴とする情報表示プログラム。
JP2007249017A 2007-09-26 2007-09-26 情報表示装置、方法及びプログラム Pending JP2009080624A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007249017A JP2009080624A (ja) 2007-09-26 2007-09-26 情報表示装置、方法及びプログラム
US12/212,740 US20090083261A1 (en) 2007-09-26 2008-09-18 Information display apparatus, information display method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007249017A JP2009080624A (ja) 2007-09-26 2007-09-26 情報表示装置、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2009080624A true JP2009080624A (ja) 2009-04-16

Family

ID=40472800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007249017A Pending JP2009080624A (ja) 2007-09-26 2007-09-26 情報表示装置、方法及びプログラム

Country Status (2)

Country Link
US (1) US20090083261A1 (ja)
JP (1) JP2009080624A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013069136A (ja) * 2011-09-22 2013-04-18 Fuji Xerox Co Ltd 検索装置及びプログラム
KR20150074864A (ko) * 2013-12-24 2015-07-02 주식회사 케이티 콘텐트 연결 관계 표시 장치 및 방법
JP2017167806A (ja) * 2016-03-16 2017-09-21 株式会社東芝 関係可視化装置、方法およびプログラム
JP2018005690A (ja) * 2016-07-05 2018-01-11 富士ゼロックス株式会社 情報処理装置及びプログラム
KR102368875B1 (ko) * 2021-07-19 2022-03-02 한국과학기술정보연구원 데이터셋 연관 관계 가시화 방법 및 장치
JP2022135077A (ja) * 2021-03-04 2022-09-15 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5178233B2 (ja) * 2008-02-21 2013-04-10 株式会社東芝 表示データ生成装置及び方法
US8719308B2 (en) * 2009-02-16 2014-05-06 Business Objects, S.A. Method and system to process unstructured data
CN101887437B (zh) * 2009-05-12 2016-03-30 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
JP4862072B2 (ja) * 2009-09-09 2012-01-25 株式会社日立製作所 設計チェック知識構築方法及びシステム
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US8903794B2 (en) 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8150859B2 (en) * 2010-02-05 2012-04-03 Microsoft Corporation Semantic table of contents for search results
US8260664B2 (en) * 2010-02-05 2012-09-04 Microsoft Corporation Semantic advertising selection from lateral concepts and topics
US8880548B2 (en) * 2010-02-17 2014-11-04 Microsoft Corporation Dynamic search interaction
US20110307819A1 (en) * 2010-06-09 2011-12-15 Microsoft Corporation Navigating dominant concepts extracted from multiple sources
US8903782B2 (en) 2010-07-27 2014-12-02 Microsoft Corporation Application instance and query stores
US8683389B1 (en) * 2010-09-08 2014-03-25 The New England Complex Systems Institute, Inc. Method and apparatus for dynamic information visualization
AU2011298991B2 (en) * 2010-09-10 2016-09-08 Vocus, Inc Systems and methods for consumer-generated media reputation management
CN102779114B (zh) * 2011-05-12 2018-06-29 商业对象软件有限公司 利用自动规则生成的非结构化数据支持
US9275476B1 (en) * 2012-06-27 2016-03-01 Amazon Technologies, Inc. Multi-way and multi-thread conversation system
CN103425763B (zh) * 2013-08-05 2016-12-28 微梦创科网络科技(中国)有限公司 基于sns的用户推荐方法及装置
US9785317B2 (en) * 2013-09-24 2017-10-10 Palantir Technologies Inc. Presentation and analysis of user interaction data
US8812960B1 (en) 2013-10-07 2014-08-19 Palantir Technologies Inc. Cohort-based presentation of user interaction data
US9977830B2 (en) * 2014-01-31 2018-05-22 Verint Systems Ltd. Call summary
JP5959068B2 (ja) * 2014-02-26 2016-08-02 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 接続関係の可視化を支援する装置及び方法
US9912546B2 (en) 2014-03-28 2018-03-06 Sciencelogic, Inc. Component detection and management using relationships
CN104102713B (zh) * 2014-07-16 2018-01-19 百度在线网络技术(北京)有限公司 推荐结果的展现方法和装置
US9852132B2 (en) * 2014-11-25 2017-12-26 Chegg, Inc. Building a topical learning model in a content management system
CN106095858A (zh) * 2016-06-02 2016-11-09 海信集团有限公司 一种音视频搜索方法、装置和终端
US10489456B2 (en) 2016-11-08 2019-11-26 International Business Machines Corporation Topic bridging determination using topical graphs
US10839013B1 (en) * 2018-05-10 2020-11-17 Facebook, Inc. Generating a graphical representation of relationships among a set of articles and information associated with the set of articles
US11244013B2 (en) * 2018-06-01 2022-02-08 International Business Machines Corporation Tracking the evolution of topic rankings from contextual data
US11475065B2 (en) * 2019-10-29 2022-10-18 Neo4J Sweden Ab Pre-emptive graph search for guided natural language interactions with connected data systems
WO2023057988A1 (en) * 2021-10-08 2023-04-13 Graphite Growth, Inc. Generation and use of content briefs for network content authoring

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
NO316480B1 (no) * 2001-11-15 2004-01-26 Forinnova As Fremgangsmåte og system for tekstuell granskning og oppdagelse
WO2006108069A2 (en) * 2005-04-06 2006-10-12 Google, Inc. Searching through content which is accessible through web-based forms
AU2005203250A1 (en) * 2005-07-26 2007-02-15 Victoria Lesley Redfern Online contemporary and natural language core concept subject specific semantic thesaurus
JP4427500B2 (ja) * 2005-09-29 2010-03-10 株式会社東芝 意味解析装置、意味解析方法および意味解析プログラム
JP4542993B2 (ja) * 2006-01-13 2010-09-15 株式会社東芝 構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム
JP2008084193A (ja) * 2006-09-28 2008-04-10 Toshiba Corp インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム
JP4171757B2 (ja) * 2006-09-28 2008-10-29 株式会社東芝 オントロジー統合支援装置、オントロジー統合支援方法及びオントロジー統合支援プログラム
JP2008245082A (ja) * 2007-03-28 2008-10-09 Toshiba Corp 番組グラフ作成装置及び方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013069136A (ja) * 2011-09-22 2013-04-18 Fuji Xerox Co Ltd 検索装置及びプログラム
KR20150074864A (ko) * 2013-12-24 2015-07-02 주식회사 케이티 콘텐트 연결 관계 표시 장치 및 방법
KR101625174B1 (ko) 2013-12-24 2016-06-07 주식회사 케이티 콘텐트 연결 관계 표시 장치 및 방법
JP2017167806A (ja) * 2016-03-16 2017-09-21 株式会社東芝 関係可視化装置、方法およびプログラム
JP2018005690A (ja) * 2016-07-05 2018-01-11 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2022135077A (ja) * 2021-03-04 2022-09-15 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7159373B2 (ja) 2021-03-04 2022-10-24 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
KR102368875B1 (ko) * 2021-07-19 2022-03-02 한국과학기술정보연구원 데이터셋 연관 관계 가시화 방법 및 장치

Also Published As

Publication number Publication date
US20090083261A1 (en) 2009-03-26

Similar Documents

Publication Publication Date Title
JP2009080624A (ja) 情報表示装置、方法及びプログラム
KR101793222B1 (ko) 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트
CN102822815B (zh) 用于利用浏览器历史进行动作建议的方法和系统
JP5939588B2 (ja) 関連ノードを探索する方法、並びに、そのコンピュータ、及びコンピュータ・プログラム
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
CN105518661B (zh) 经由挖掘的超链接文本的片段来浏览图像
US20140229476A1 (en) System for Information Discovery & Organization
CN102648466A (zh) 用于取回视图中的数据项批注的方法
CA2932401A1 (en) Systems and methods for in-memory database search
CN104063476A (zh) 基于社交网络的内容推荐方法和系统
JP4958968B2 (ja) 商品検索支援装置、方法及びプログラム
JP2020513128A (ja) トピック構造化方法、検索結果提供方法、コンピュータプログラムおよびトピック構造化システム
JP2004234404A (ja) データベースシステム
JP2012234340A (ja) 商品キーワード管理システム
JP2005316573A (ja) 情報検索装置
JP2017116975A (ja) 問題解決支援システム
JP2011100208A (ja) 行動推定装置、行動推定方法および行動推定プログラム
JP2005251157A (ja) 情報検索システムおよび情報検索方法ならびにプログラム
JP5380874B2 (ja) 情報検索方法、プログラム及び装置
JP5368900B2 (ja) 情報提示装置、情報提示方法およびプログラム
JP2015026345A (ja) 検索装置、検索システムおよびプログラム
JP2022021131A (ja) Kpiツリーから部分ツリーを抽出するシステム
KR100312430B1 (ko) 인터넷 쇼핑몰 상품정보 학습 시스템 및 그 방법
JP6707410B2 (ja) 文献検索装置、文献検索方法およびコンピュータプログラム
JP2008134952A (ja) 情報公開システムおよび情報公開方法