JP4728063B2 - 興味情報生成装置、興味情報生成方法および興味情報生成プログラム - Google Patents

興味情報生成装置、興味情報生成方法および興味情報生成プログラム Download PDF

Info

Publication number
JP4728063B2
JP4728063B2 JP2005229290A JP2005229290A JP4728063B2 JP 4728063 B2 JP4728063 B2 JP 4728063B2 JP 2005229290 A JP2005229290 A JP 2005229290A JP 2005229290 A JP2005229290 A JP 2005229290A JP 4728063 B2 JP4728063 B2 JP 4728063B2
Authority
JP
Japan
Prior art keywords
ontology
personal
class
blog
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005229290A
Other languages
English (en)
Other versions
JP2007047903A (ja
Inventor
真 中辻
優 三好
辰幸 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005229290A priority Critical patent/JP4728063B2/ja
Publication of JP2007047903A publication Critical patent/JP2007047903A/ja
Application granted granted Critical
Publication of JP4728063B2 publication Critical patent/JP4728063B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は興味情報生成装置、興味情報生成方法および興味情報生成プログラムに関し、特に、プログエントリを参照しつつ、個人の興味情報が概念階層化されたパーソナルオントロジを自動的に生成する方法に適用して好適なものである。
インターネット上などで情報検索を実施する場合、主としてキーワード入力による情報検索が行われている。このキーワード検索では、例えば、ビデオ録画装置の分野においては、録画内容がキーワードによって指定されるため、ユーザが適切なキーワードを思いつかないと、意図したビデオ内容を録画することができなかった。
また、gooなどの検索エンジンを利用した検索においても、ユーザが適切なキーワードを思いつかないと、意図した内容を検索することができないだけでなく、不要な検索結果が多数含まれていた。
さらに、doblogなどのブログプロバイダにおいても、ユーザはキーワードベースで興味のある情報を検索し、検索結果にかかったブログサイトにアクセスするというレベルにとどまっており、ユーザが興味のある未知のキーワードやコミュニティあるいはブログサイトを発見することができなかった。
この理由の一つとして、現在の検索方法はキーワード検索のみであり、クラス(概念)体系やクラスの持つ属性、すなわちクラス名やインスタンス(実体)を利用した精度の高い検索を実施できないことが挙げられる。キーワードはただの文字列であるが、クラスは複数のインスタンスをメンバーとして持つものであり、どのようなインスタンスをクラスの構成メンバーとするかによって、各個人の嗜好をクラスに反映させることができる。また、クラス階層の取り方によっても、各個人の嗜好をクラスに反映させることができる。
また、非特許文献1には、個人の登録するブックマークや個人が保持するフォルダなどの階層構造と、ブックマークやフォルダに格納されるファイル情報に基づいて個人の興味情報を階層的に構築する方法が開示されている。
また、非特許文献2には、個人がP2Pネットワークを利用して公開する文書やマルチメディアファイルなどの共有ファイルに対してインデックスを構築することで、インデックスファイルを利用したトピック(内容)主導のP2P型検索を実現する方法が開示されている。
また、非特許文献3には、WEBマイニングで効率的とされているPageRankアルゴリズムやグラフ分割によるクラスタリングに基づいて、ブログコミュニティを自動的に抽出する方法が開示されている。
佐保田圭介他、"ブックマークの階層構造情報を組み込んだ協調フィルタリングによるWebページの推薦手法"、DEWS2004 6−B−04 中辻真、川原稔、河野浩之:"トピック手動型P2P情報検索システムの提案と性能評価"、電子情報通信学会論文誌 vol.J87−D1 No.2(データ工学特集号)2004 谷口智哉、松尾豊、石塚満:"Blogコミュニティの抽出と分析"、人口知能学会研究会資料 SIG−SWO−A401−08、2004
しかしながら、ユーザの興味が概念階層化されたパーソナルオントロジを生成するにはコストが高くつくため、各個人のパーソナルオントロジをインターネットを介して流通させることが困難である。このため、各個人のパーソナルオントロジを他のユーザのパーソナルオントロジとマッピングさせることにより、興味の一致するユーザ間で自動的にコミュニティを形成することができなかった。また、Web上の音楽ファイルなどのコンテンツのメタデータとパーソナルオントロジとの間でのマッチングによる自動的かつ高精度な情報検索および推薦ができないという問題があった。
また、非特許文献1に開示された方法では、個人の興味がブックマークやフォルダに的確に表現されているとは言えないため、これらの情報に基づく興味マッチングでは、各個人の興味に適合したコミュニティを発見したり、情報を推薦したりすることができないという問題があった。
また、非特許文献2に開示された方法では、各個人の端末で構築されるインデックスファイルは、文書やマルチメディアファイルの持つメタデータを利用する程度である。各個人が蓄積する文書やマルチメディアファイルがその各個人の興味を示すとは限らず、また、インデックスファイルは、個人の興味を概念階層化したものではない。このため、個人の興味情報が概念階層化されたパーソナルオントロジの構築には至らず、個人の興味情報主導の自動的な情報検索ができないという問題があった。
また、非特許文献3に開示された方法では、ブログコミュニティを抽出するに当たってブログエントリ間のリンク構造のみに基づいているため、ユーザの興味情報に即したブログコミュニティを抽出することができないという問題があった。また、パーソナルオントロジのように各個人の興味情報のオントロジ化が行われないため、オンラインストアのコンテンツの自動推薦などのブログコミュニティの抽出以外の方法には利用できなかった。
そこで、本発明の目的は、作成にかかるコストを抑制しつつ、個人の興味が反映されたパーソナルオントロジを生成することが可能な興味情報生成装置、興味情報生成方法および興味情報生成プログラムを提供することである。
上述した課題を解決するために、請求項1記載の興味情報生成装置によれば、各個人のブログエントリに含まれる単語を抽出する単語抽出手段と、単語が概念階層化されてなり且つブログプロバイダにより形成された雛形オントロジから前記単語抽出手段で抽出された単語を含むクラスまたはインスタンスを抽出する分類子適用手段と、前記雛形オントロジにおいて前記抽出されたクラスまたはインスタンスの上位のクラスに割りつけられた単語が前記ブログエントリに含まれる、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、各個人の興味情報を表すパーソナルオントロジとして前記雛形オントロジから抽出するパーソナルオントロジ抽出手段と、前記パーソナルオントロジ抽出手段で抽出されたパーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスの追加や、ユーザが興味のないクラスまたはインスタンスの削除を行なうカスタマイズ手段と、を備えることを特徴とする。
これにより、単なる文字列ではなく概念間の一致性に基づいて、自分の嗜好に適合した情報を検索することが可能となるとともに、各個人のブログエントリに含まれる単語を雛形オントロジ上で照合することにより、個人の興味が反映されたパーソナルオントロジを生成することができる。このため、作成にかかるコストを抑制しつつ、パーソナルオントロジを生成することが可能となり、情報検索の精度を向上させることが可能となるとともに、各個人のパーソナルオントロジをインターネット上で広く流通させることが可能となり、個人の嗜好に適合したコミュニティを形成することができる。
また、請求項2記載の興味情報生成方法によれば、各個人のブログエントリに含まれる単語が概念階層化されてなるパーソナルオントロジを興味情報として生成する興味情報生成装置が実行する興味情報生成方法であって、前記ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、単語が概念階層化されてなり且つブログプロバイダにより形成された雛形オントロジを選択するステップと、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、前記雛形オントロジにおいて前記抽出されたクラスまたはインスタンスの上位のクラスに割りつけられた単語が前記ブログエントリに含まれる、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を前記パーソナルオントロジとして前記雛形オントロジから抽出するステップと、前記雛形オントロジから抽出された前記パーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスの追加や、ユーザが興味のないクラスまたはインスタンスの削除を行なうステップと、を備えることを特徴とする。
これにより、単なる文字列ではなく意味を考慮しながら、自分の嗜好に適合した情報を検索することが可能となるとともに、ブログエントリに含まれる単語を雛形オントロジ上で照合することにより、個人の興味が反映されたパーソナルオントロジを生成することができる。このため、作成にかかるコストを抑制しつつ、パーソナルオントロジを生成することが可能となり、情報検索の精度を向上させることが可能となるとともに、各個人のパーソナルオントロジをインターネット上で広く流通させることが可能となり、個人の嗜好に適合したコミュニティを形成することができる。
また、請求項3記載の興味情報生成プログラムによれば、ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、単語が概念階層化されてなり且つブログプロバイダにより形成された雛形オントロジを選択するステップと、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、前記雛形オントロジにおいて前記抽出されたクラスまたはインスタンスの上位のクラスに割りつけられた単語が前記ブログエントリに含まれる、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を前記パーソナルオントロジとして前記雛形オントロジから抽出するステップと、前記雛形オントロジから抽出された前記パーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスの追加や、ユーザが興味のないクラスまたはインスタンスの削除を行なうステップと、をコンピュータに実行させることを特徴とする。
これにより、興味情報生成プログラムをコンピュータに実行させることにより、作成にかかるコストを抑制しつつ、パーソナルオントロジを生成することが可能となり、情報検索の精度を向上させることが可能となるとともに、各個人のパーソナルオントロジをインターネット上で広く流通させることが可能となり、個人の嗜好に適合したコミュニティを形成することができる。
以上説明したように、本発明によれば、自分の嗜好に適合した情報を精度よく検索することが可能となるとともに、分の嗜好に適合した情報をインターネット上で広く流通させることが可能となり、個人の嗜好に適合したコミュニティを形成することができる。
以下、本発明の実施形態に係る興味情報生成装置およびその方法について図面を参照しながら説明する。
図1は、本発明の一実施形態に係る興味情報生成装置が適用されるシステムの概略構成を示すブロック図である。
図1において、端末2〜4およびサーバ5が通信網1を介して接続されている。なお、通信網1としては、例えば、IP通信を行う公衆通信網を用いることができ、インターネットであってもよい。また、企業間の専用通信網であっても、公衆通信網であってもよいが、高信頼性とセキュリティとを備えた専用通信を提供できるIP−VPN(Internet Protocol−Virtual Private Network)のような網であってもよい。また、端末2〜4としては、ノート型パーソナルコンピュータあるいはデスクトップ型パーソナルコンピュータでもよく、携帯電話端末やPDA(Personal Data Assistant)などでもよい。また、サーバ5は、プログプロバイダやISP(Information Service Provider)上に設置することができる。
ここで、サーバ5には、端末2〜4にそれぞれ対応したブログサイト7〜9が設けられ、各ブログサイト7〜9には、ブログエントリ7a〜7n、8a〜8n、9a〜9nがそれぞれ保持されている。なお、ブログエントリ7a〜7n、8a〜8n、9a〜9nはブログにおける記事の最小単位を表し、日にちごとに設けることができる。また、サーバ5には雛形オントロジ6が保持され、雛形オントロジ6には、個人の興味情報が概念階層化されたパーソナルオントロジの雛形が設けられている。
なお、雛形オントロジ6は、ブログプロバイダ側で恣意的に作成することができる。例えば、ブログプロバイダが音楽に関するパーソナルオントロジを各端末2〜4のユーザに構築させたければ、音楽に関する雛形オントロジ6を構築すればよい。ここで、各端末2〜4のユーザの興味を細やかに表現するために、可能な限り細分化された網羅性の高い雛形オントロジ6を構築することが好ましい。また、雛形オントロジ6の実体は、オントロジ記述言語OWLなどのXML言語で記述されたテキストファイルである。また、情報の整理の簡単化のため、インスタンスは最下位クラスにのみ分類してもよい。
さらに、サーバ5には、ブログエントリ7a〜7n、8a〜8n、9a〜9nに対して形態素解析をそれぞれ適用することにより、ブログエントリ7a〜7n、8a〜8n、9a〜9nに頻出する単語を抽出する頻出単語抽出手段5a、ブログエントリ7a〜7n、8a〜8n、9a〜9nに頻出する単語を含むクラスまたはインスタンスを雛形オントロジか6から抽出する分類子適用手段5bおよび分類子適用手段5bにて抽出されたクラスまたはインスタンスおよびそれらの上位の全てのクラスをパーソナルオントロジとして雛形オントロジ6から抽出するパーソナルオントロジ抽出手段5cが設けられている。
そして、頻出単語抽出手段5aは、ブログエントリ7a〜7n、8a〜8n、9a〜9nに対して形態素解析をそれぞれ適用する。そして、同一ユーザの持つ複数のブログエントリ7a〜7n、8a〜8n、9a〜9nで頻出する形態素を抽出する。この際、明らかに興味でない形態素(例えば、私・もの・が、など)はフィルタリングする。
次に、分類子適用手段5bは、ブログエントリ7a〜7n、8a〜8n、9a〜9nで頻出する各形態素を雛形オントロジ6に適用し、雛形オントロジ6内のクラスまたはインスタンスに一致する文字列があるかどうかを調べる。そして、雛形オントロジ6内のクラスまたはインスタンスに一致する文字列がある場合、パーソナルオントロジ抽出手段5cは、雛形オントロジ6のルートクラスから、そのクラスまたはインスタンスまでの直接的な子孫クラスおよびインスタンスをパーソナルオントロジとして抽出する。
これにより、単なる文字列ではなく意味を考慮しながら、自分の嗜好に適合した情報を検索することが可能となるとともに、ブログエントリ7a〜7n、8a〜8n、9a〜9nに含まれる単語を雛形オントロジ6上で照合することにより、個人の興味が反映されたパーソナルオントロジを生成することができる。このため、作成にかかるコストを抑制しつつ、パーソナルオントロジを生成することが可能となり、情報検索の精度を向上させることが可能となるとともに、各個人のパーソナルオントロジを通信網1上で広く流通させることが可能となり、個人の嗜好に適合したコミュニティを形成することができる。
なお、雛形オントロジ6は、デスクワークにて人手で作成してサーバ5に保持させるようにしてもよいし、パーソナルオントロジ抽出手段5cにて抽出されたパーソナルオントロジを既存の雛形オントロジ6とマージすることにより作成してもよい。さらに、雛形オントロジ6から抽出されたパーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスを追加したり、ユーザが興味のないクラスまたはインスタンスを削除したりするようにしてもよい。
また、頻出単語抽出手段5a、分類子適用手段5bおよびパーソナルオントロジ抽出手段5cは、これらのブロックで行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させることにより実現することができる。
そして、このプログラムをCD−ROMなどの記憶媒体に記憶しておけば、サーバ5のコンピュータに記憶媒体を装着し、そのプログラムをコンピュータにインストールすることにより、頻出単語抽出手段5a、分類子適用手段5bおよびパーソナルオントロジ抽出手段5cで行われる処理を実現することができる。また、このプログラムを通信網1を介してダウンロードすることにより、このプログラムを容易に普及させることができる。
また、頻出単語抽出手段5a、分類子適用手段5bおよびパーソナルオントロジ抽出手段5cで行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させる場合、スタンドアロン型コンピュータで実行させるようにしてもよく、ネットワークに接続された複数のコンピュータに分散処理させるようにしてもよい。
図2は、本発明の一実施形態に係るパーソナルオントロジの生成方法を示す図である。
図2(a)において、雛形オントロジ6として、例えば、音楽に関するパーソナルオントロジが構築されているものとする。ここで、“音楽”というクラスの直下には、“ロック”というクラスが存在し、“ロック”というクラスの直下には、“フレンチ”、“UK”および“US”というクラスが存在し、“UK”というクラスの直下には、“オルタナティブ”というクラスが存在し、“オルタナティブ”というクラスの直下には、“スコットランド”というクラスが存在し、“スコットランド”というクラスの直下には、“グラスゴー”というクラスが存在し、“グラスゴー”というクラスには、“travis”および“teenage”というインスタンスが存在しているものとする。また、“US”というクラスの直下には、“インディーズ”というクラスが存在し、“インディーズ”というクラスというクラスの直下には、“レーベル”および“グランジ”というクラスが存在し、“レーベル”というクラスというクラスの直下には、“subpop”というクラスが存在し、“subpop”および“グランジ”というクラスには、“nirvana”というインスタンスがそれぞれ存在しているものとする。
そして、頻出単語抽出手段5aは、端末2に対応したブログサイト7のブログエントリ7a〜7nから、例えば“nirvana”という形態素を高頻度で抽出したものとする。そして、分類子適用手段5bは、“nirvana”という形態素が高頻度で抽出されると、図2(a)の雛形オントロジ6のルートから末端ノードまで辿りながら、図2(a)の雛形オントロジ6のクラスまたはインスタンスと、“nirvana”という形態素を順次比較する。そして、“nirvana”という形態素に一致するクラスまたはインスタンスが雛形オントロジ6に存在する場合、雛形オントロジ6のルートクラスから、そのクラスまたはインスタンスまでの直接的な子孫クラスおよびインスタンスをパーソナルオントロジとして抽出する。
例えば、図2(a)の雛形オントロジ6には、“subpop”および“グランジ”というクラスには、“nirvana”というインスタンスがそれぞれ存在しているので、図2(b)に示すように、“音楽”というクラスから“subpop”および“グランジ”というクラスまでの直接的な子孫クラスならびに“nirvana”というインスタンスをパーソナルオントロジとして抽出する。
また、雛形オントロジ6を利用することにより、間違ったパーソナルオントロジが生成されることを防止することができる。例えば、“nirvana”は、仏教用語で涅槃という意味を持つ。このため、図2(a)の音楽に関する雛形オントロジ6では、“nirvana”というインスタンスは、“subpop”および“グランジ”というクラスに存在しないものと考えられる。このため、このようなパーソナルオントロジが自動的に生成されることを防止するためには、例えば、図2(a)の音楽に関する雛形オントロジ6における“グランジ”、“インディーズ”、“US”、“ロック”または“音楽”などの“nirvana”の上位クラスの名前のうちいずれかがブログエントリ7a〜7nに存在するかどうかで判断することができる。“グランジ”、“インディーズ”、“US”、“ロック”または“音楽”などの名前のうちいずれかが“nirvana”と同一のブログエントリ7a〜7nに存在すれば、“nirvana”はグランジアーティストの名称である可能性が高くなり、正しいパーソナルオントロジとして生成することができる。
一方、グランジ”、“インディーズ”、“US”、“ロック”または“音楽”などの名前のうちいずれかが“nirvana”という文字列とともにブログエントリ7a〜7nに存在しなければ、“nirvana”は仏教用語の涅槃という意味の可能性が高くなるため、パーソナルオントロジとして生成されないようにすることができる。このようにして、雛形オントロジ6を利用することにより、文字列の意味を考慮したパーソナルオントロジを生成することが可能となる。
さらに、雛形オントロジ6からパーソナルオントロジが抽出されると、このようなパーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスを追加したり、ユーザが興味のないクラスまたはインスタンスを削除したりすることができる。
図3は、本発明の一実施形態に係るパーソナルオントロジのカスタマイズ例を示す図である。
図3(a)において、端末2に対応したブログサイト7のブログエントリ7a〜7nに基づいてパーソナルオントロジ11が抽出されたものとする。ここで、パーソナルオントロジ11では、“音楽”というクラスの直下には、“ロック”および“クラシック”というクラスが存在し、“ロック”というクラスの直下には、“UK”および“US”というクラスが存在し、“UK”というクラスの直下には、“グラムロック”および“バンク”というクラスが存在し、“US”というクラスの直下には、“バンク”、“インディーズ”および“ニューヨーク”というクラスが存在しているものとする。
そして、図3(b)に示すように、“UK”というクラスの直下に“ハウスロック”というクラスを追加することにより、端末2のユーザが興味のあるクラスが追加されたパーソナルオントロジ12を生成することができ、ユーザの嗜好により適合したパーソナルオントロジ12を構築することができる。
図4は、本発明の一実施形態に係るパーソナルオントロジの一例を示す図である。
図4において、例えば、端末3に対応したブログサイト8のブログエントリ8a〜8nに基づいてパーソナルオントロジ21が生成され、端末4に対応したブログサイト9のブログエントリ9a〜9nに基づいてパーソナルオントロジ22が生成される。
図5は、本発明の一実施形態に係る興味情報生成システムの概略構成の一例を示すブロック図である。
図5において、パーソナルオントロジ間のマッピングを行うマッピングサーバ32、ISP34、35および端末36〜38が通信網31を介して接続されている。ここで、各端末36〜38にはユーザ36a〜38aが存在し、ユーザ36a〜38aはブログサイトを通信網31上で保有しているものとする。また、ISP34、35には、ユーザ36a〜38aに提供する情報を格納するデータベース34a、35aが設けられている。
そして、マッピングサーバ32は雛形オントロジを端末36〜38に提供し、端末36〜38は、ブログエントリを雛形オントロジにそれぞれ適用することにより、パーソナルオントロジを生成することができる。そして、各端末36〜38においてパーソナルオントロジが生成されると、パーソナルオントロジ間の近似度に基づいてパーソナルオントロジ間のマッピングを行うことができる。そして、近似度の高いパーソナルオントロジを保有する端末36〜38間で情報交換を行うことにより、端末36〜38間でコミュニティを形成することができ、コミュニティが形成された端末36〜38がISP34、35にアクセスすることにより、互いに興味のある情報を端末36〜38間で共有することができる。
なお、パーソナルオントロジ間の近似度を計測する方法としては、クラスの持つクラス名やインスタンスなどのクラス属性間の近似度またはクラス間の接続形態であるトポロジの近似度に基づいて推論学習照合し、オントロジの持つクラス間の意味的な近似度を計測することができる。あるいは、クラス属性間の近似度およびトポロジの近似度の両方に基づいて推論学習照合し、オントロジの持つクラス間の意味的な近似度を計測するようにしてもよい。
図6は、本発明の一実施形態に係るパーソナルオントロジの共有化方法を示すフローチャートである。
図6において、マッピングサーバ32は、パーソナルオントロジの雛形の作成を行い、作成したパーソナルオントロジの雛形を端末36に提供する(ステップS1)。
次に、端末36は、マッピングサーバ32にアクセスすることにより、パーソナルオントロジの雛形を取得する(ステップS2)。
次に、端末36は、パーソナルオントロジの雛形に対して、ユーザ36aのブログエントリを適用することにより、ユーザ36aのパーソナルオントロジを生成する。そして、このようなパーソナルオントロジに対してユーザ36aが興味のあるクラスまたはインスタンスを追加したり、ユーザ36aが興味のないクラスまたはインスタンスを削除したりすることにより、ユーザ36aのパーソナルオントロジをカスタマイズし、マッピングサーバ32に登録する(ステップS3)。
次に、マッピングサーバ32は、ユーザ36aのパーソナルオントロジが端末36にて登録されると、ユーザ36aのパーソナルオントロジをデータベース33に記録する(ステップS4)。
次に、マッピングサーバ32は、データベース33に記録されている複数のパーソナルオントロジを互いにマッピングし、パーソナルオントロジ間の近似度の計測を行う。そして、パーソナルオントロジ間の近似度が端末36、37間で高かったものとすると、パーソナルオントロジ間の近似度の高い端末37のユーザ37aや情報を提供するISP34のURL(Uniform Resource Locator)を端末36に通知する(ステップS5)。
次に、端末36は、パーソナルオントロジ間の近似度の高い情報を提供するISP34のURLにアクセスする(ステップS6)。そして、ISP34は、パーソナルオントロジ間の近似度の高い情報を提供するURLから興味情報を収集し、その興味情報を端末36に提供する(ステップS7)。
次に、端末36のユーザ36aは、パーソナルオントロジ間の近似度の高い端末37のユーザ37aとの間でP2Pによる情報交換を行う(ステップS8)。また、端末37のユーザ37aは、パーソナルオントロジ間の近似度の高い端末36のユーザ36aとの間でP2Pによる情報交換を行う(ステップS9)。
図7は、本発明の一実施形態に係る興味情報生成システムの概略構成のその他の例を示すブロック図である。
図7において、パーソナルオントロジ間のマッピングを行うマッピングサーバ42、ISP44、端末46および商品情報オントロジデータベース45が通信網41を介して接続されている。ここで、端末46にはユーザ46aが存在し、ユーザ46aはブログサイトを通信網41上で保有しているものとする。また、ISP44には、ユーザ46aに提供する情報を格納するパーソナルオントロジデータベース44aが設けられている。さらに、マッピングサーバ42には、ユーザ46aのパーソナルオントロジを格納するパーソナルオントロジデータベース43が設けられている。また、商品情報オントロジデータベース45には、商品情報オントロジが格納されている。ここで、マッピングサーバ42は、オントロジのマッピングとオントロジ間の近似度計測技術を使ってお勧めの商品情報を端末46に提供することができる。
すなわち、マッピングサーバ42は、パーソナルオントロジデータベース43に保持されているパーソナルオントロジと、商品情報オントロジデータベース45に格納されている商品情報オントロジとのマッピングを行い、パーソナルオントロジと商品情報オントロジとの間の近似度を計測する。そして、マッピングサーバ42は、ユーザ46aのパーソナルオントロジと最も近似度が高い商品情報オントロジを選択し、その商品情報オントロジをお勧めの商品情報として端末46に提供することができる。
なお、図7の方法では、パーソナルオントロジと商品情報オントロジとの間の近似度をマッピングサーバ42が計測し、商品情報オントロジを端末46に提供する方法について説明したが、パーソナルオントロジデータベース43および商品情報オントロジデータベース45にアクセスすることでパーソナルオントロジと商品情報オントロジとを取得し、それらのパーソナルオントロジと商品情報オントロジとの間の近似度の計測結果に基づいて、商品情報オントロジを端末46に提供するサービス提供サーバを設けるようにしてもよい。
また、マッピングサーバ42が提供するパーソナルオントロジの雛形を、テジビジョン端末、ビデオ再生録画装置、DVD再生録画装置あるいは携帯電話などの情報機器に搭載して利用できるようにするために、パーソナルオントロジの雛形やそれを利用するソフトウェアを提供して対価を得るサービスも可能である。
図8は、本発明の一実施形態に係る興味情報に即したコミュニティの可視化方法の一例を示す図である。
図8において、例えば、図8(a)のブログユーザ“mako”に対して、図8(b)に示すように、音楽に関するパーソナルオントロジが構築されているものとする。この場合、ブログユーザ“mako”の興味情報に即したコミュニティがパーソナルオントロジ間のマッピングにて自動的に生成され、ブログユーザ“mako”の所属するコミュニティが、そのコミュニティ名とそのコミュニティに属するユーザとともに可視化して表示画面上に表示させることができる。
例えば、“mako”のブログエントリ101を中心として、パーソナルオントロジ間の近似度が近いほど同心距離が近くなるようにして他のユーザのブログエントリ102を同心円状に配置することができる。また、ブログエントリ間のリンク関係を表示したり、“mako”のパーソナルオントロジと連携をとることで、ユーザは直感的に自分の所属するコミュニティを把握することができる。例えば、図8(b)の“mako”のパーソナルオントロジから抽出された“teenage”というインスタンスを持つブログエントリを“teenage”グループとして連携表示させたり、“mako”のパーソナルオントロジから抽出された“nirvana”というインスタンスを持つブログエントリを“nirvana”グループとして連携表示させたりすることができる。
図9は、本発明の一実施形態に係る興味情報に即したコミュニティの可視化方法のその他の例を示す図である。
図9において、例えば、図8(a)の表示画面上でブログエントリ102を選択したものとする。なお、表示画面上でブログエントリ102を選択する方法としては、ブログエントリ102上にカーソルを移動させてクリックする方法を挙げることができる。ここで、ブログエントリ102はブログユーザ“Boby”に所属し、ブログユーザ“Boby”に対して、図9(b)に示すように、音楽に関するパーソナルオントロジが構築されているものとする。
そして、図8(a)の表示画面上でブログエントリ102が選択されると、図9(a)に示すように、“Boby”のブログエントリ102を中心として、パーソナルオントロジ間の近似度が近いほど同心距離が近くなるようにして他のユーザのブログエントリ101を同心円状に配置することができる。
そして、例えば、図9(b)の“Boby”のパーソナルオントロジから抽出された“nirvana”というインスタンスを持つブログエントリを“nirvana”グループとして連携表示させたり、“Boby”のパーソナルオントロジから抽出された“super chunk”というインスタンスを持つブログエントリを“super chunk”グループとして連携表示させたり、“Boby”のパーソナルオントロジから抽出された“Foo Fighters”というインスタンスを持つブログエントリを“Foo Fighters”グループとして連携表示させたりすることができる。
これにより、ブログユーザ“mako”は、ブログユーザ“Boby”の持つコミュニティを図9(a)の表示画面上で閲覧することができ、ブログユーザ“mako”が興味を持つ“nirvana”のコミュニティと関連がある“super chunk”のコミュニティを容易に発見することができる。このように、ブログユーザ“mako”は、ブログユーザ“Boby”が興味を持つ情報を閲覧しながら、自分が興味を持つキーワードやコミュニティを新たに発見することができる。
図10は、本発明の一実施形態に係る興味情報に即したコミュニティの可視化方法のさらにその他の例を示す図である。
図10において、図9(a)の表示画面が表示された状態で上位階層の閲覧を指定したものとする。この場合、“Boby”のパーソナルオントロジから抽出された“nirvana”、“super chunk”および“Foo Fighters”というインスタンスが属する“グランジ”というクラスに含まれるブログエントリを“グランジ”グループとして連携表示させることができる。これにより、“nirvana”、“super chunk”および“Foo Fighters”というインスタンスよりも抽象度の高い“グランジ”のコミュニティを閲覧することができる。このように、ユーザが楽しみながら、自分の興味に即したコミュニティや、自分の興味に関連するキーワードやコミュニティを新たに発見することができる。
本発明は、パーソナルオントロジを簡易に作成して自分の興味にマッチングする情報を速やかに入手することができ、情報通信システムが持つ情報源から自分の興味にマッチングする情報を自動的かつ効率的に活用することができる。
本発明の一実施形態に係る興味情報生成装置が適用されるシステムの概略構成を示すブロック図である。 本発明の一実施形態に係るパーソナルオントロジの生成方法を示す図である。 本発明の一実施形態に係るパーソナルオントロジのカスタマイズ例を示す図である。 本発明の一実施形態に係るパーソナルオントロジの一例を示す図である。 本発明の一実施形態に係る興味情報生成システムの概略構成の一例を示すブロック図である。 本発明の一実施形態に係るパーソナルオントロジの共有化方法を示すフローチャートである。 本発明の一実施形態に係る興味情報生成システムの概略構成のその他の例を示すブロック図である。 本発明の一実施形態に係る興味情報に即したコミュニティの可視化方法の一例を示す図である。 本発明の一実施形態に係る興味情報に即したコミュニティの可視化方法のその他の例を示す図である。 本発明の一実施形態に係る興味情報に即したコミュニティの可視化方法のさらにその他の例を示す図である。
符号の説明
1、31、41 通信網
2〜4、36〜38、46 端末
5 サーバ
5a 頻出単語抽出手段
5b 分類子適用手段
5c パーソナルオントロジ抽出手段
6 雛形オントロジ
7〜9 ブログサイト
7a〜7n、8a〜8n、9a〜9n、101、102 ブログエントリ
11、12、21、22 パーソナルオントロジ
32、42 マッピングサーバ
33、34a、35a、43、44a データベース
34、35、44 ISP
36a〜38a、46a ユーザ
45 商品情報オントロジデータベース

Claims (3)

  1. 各個人のブログエントリに含まれる単語を抽出する単語抽出手段と、
    単語が概念階層化されてなり且つブログプロバイダにより形成された雛形オントロジから前記単語抽出手段で抽出された単語を含むクラスまたはインスタンスを抽出する分類子適用手段と、
    前記雛形オントロジにおいて前記抽出されたクラスまたはインスタンスの上位のクラスに割りつけられた単語が前記ブログエントリに含まれる、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、各個人の興味情報を表すパーソナルオントロジとして前記雛形オントロジから抽出するパーソナルオントロジ抽出手段と、
    前記パーソナルオントロジ抽出手段で抽出されたパーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスの追加や、ユーザが興味のないクラスまたはインスタンスの削除を行なうカスタマイズ手段と、を備えることを特徴とする興味情報生成装置。
  2. 各個人のブログエントリに含まれる単語が概念階層化されてなるパーソナルオントロジを興味情報として生成する興味情報生成装置が実行する興味情報生成方法であって、
    前記ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、
    単語が概念階層化されてなり且つブログプロバイダにより形成された雛形オントロジを選択するステップと、
    前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、
    前記雛形オントロジにおいて前記抽出されたクラスまたはインスタンスの上位のクラスに割りつけられた単語が前記ブログエントリに含まれる、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を前記パーソナルオントロジとして前記雛形オントロジから抽出するステップと、
    前記雛形オントロジから抽出された前記パーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスの追加や、ユーザが興味のないクラスまたはインスタンスの削除を行なうステップと、を備えることを特徴とする興味生成方法。
  3. ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、
    単語が概念階層化されてなり且つブログプロバイダにより形成された雛形オントロジを選択するステップと、
    前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、
    前記雛形オントロジにおいて前記抽出されたクラスまたはインスタンスの上位のクラスに割りつけられた単語が前記ブログエントリに含まれる、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を前記パーソナルオントロジとして前記雛形オントロジから抽出するステップと、
    前記雛形オントロジから抽出された前記パーソナルオントロジに対してユーザが興味のあるクラスまたはインスタンスの追加や、ユーザが興味のないクラスまたはインスタンスの削除を行なうステップと、をコンピュータに実行させることを特徴とする興味情報生成プログラム。
JP2005229290A 2005-08-08 2005-08-08 興味情報生成装置、興味情報生成方法および興味情報生成プログラム Active JP4728063B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005229290A JP4728063B2 (ja) 2005-08-08 2005-08-08 興味情報生成装置、興味情報生成方法および興味情報生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005229290A JP4728063B2 (ja) 2005-08-08 2005-08-08 興味情報生成装置、興味情報生成方法および興味情報生成プログラム

Publications (2)

Publication Number Publication Date
JP2007047903A JP2007047903A (ja) 2007-02-22
JP4728063B2 true JP4728063B2 (ja) 2011-07-20

Family

ID=37850694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005229290A Active JP4728063B2 (ja) 2005-08-08 2005-08-08 興味情報生成装置、興味情報生成方法および興味情報生成プログラム

Country Status (1)

Country Link
JP (1) JP4728063B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9867424B2 (en) 2012-03-13 2018-01-16 New Balance Athletics, Inc. Foamed parts having a fabric component, and systems and methods for manufacturing same

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100898154B1 (ko) 2007-08-17 2009-05-19 울산대학교 산학협력단 온톨로지 자동 구축을 위한 개념 및 인스턴스 분류 시스템
CN102567394B (zh) * 2010-12-30 2015-02-25 国际商业机器公司 获取平面数据的层级信息的方法和装置
US8956232B2 (en) * 2011-05-03 2015-02-17 Sony Computer Entertainment America Llc Special regional online video game forum based on location
JP5827874B2 (ja) * 2011-11-11 2015-12-02 株式会社ドワンゴ キーワード取得装置、コンテンツ提供システム、キーワード取得方法、プログラム及びコンテンツ提供方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073677A (ja) * 2000-09-05 2002-03-12 Zenrin Co Ltd 閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置
JP2004341672A (ja) * 2003-05-14 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> 情報提示方法及び情報提示装置
JP2005010848A (ja) * 2003-06-16 2005-01-13 Sharp Corp 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0778167A (ja) * 1993-06-30 1995-03-20 Nippon Telegr & Teleph Corp <Ntt> 知識作成方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073677A (ja) * 2000-09-05 2002-03-12 Zenrin Co Ltd 閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置
JP2004341672A (ja) * 2003-05-14 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> 情報提示方法及び情報提示装置
JP2005010848A (ja) * 2003-06-16 2005-01-13 Sharp Corp 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9867424B2 (en) 2012-03-13 2018-01-16 New Balance Athletics, Inc. Foamed parts having a fabric component, and systems and methods for manufacturing same

Also Published As

Publication number Publication date
JP2007047903A (ja) 2007-02-22

Similar Documents

Publication Publication Date Title
Baca Introduction to metadata
US10997244B2 (en) Method and system for identifying and discovering relationships between disparate datasets from multiple sources
Bizer et al. Dbpedia-a crystallization point for the web of data
TWI493367B (zh) 搜尋結果之先進過濾方法
Khalili et al. The rdfa content editor-from wysiwyg to wysiwym
Candela et al. Reusing digital collections from GLAM institutions
Estellés et al. Social bookmarking tools as facilitators of learning and research collaborative processes: The Diigo case
US20080195495A1 (en) Notebook system
Seifert et al. Ubiquitous access to digital cultural heritage
Kules et al. From keyword search to exploration: How result visualization aids discovery on the web
Amento et al. Experiments in social data mining: The TopicShop system
Alahmari et al. Evaluating Semantic Browsers for Consuming Linked Data.
Bellini et al. Modeling performing arts metadata and relationships in content service for institutions
Terveen et al. Finding and visualizing inter-site clan graphs
Khusro et al. Linked open data: towards the realization of semantic web-a review
JP2013065271A (ja) インターネットによる情報伝達・共有システム
JP4728063B2 (ja) 興味情報生成装置、興味情報生成方法および興味情報生成プログラム
US20160188595A1 (en) Semantic Network Establishing System and Establishing Method Thereof
Cantador et al. Semantic contextualisation of social tag-based profiles and item recommendations
Hunter et al. Harvesting community annotations on 3D models of museum artefacts to enhance knowledge, discovery and re-use
Miller et al. Visualizing linked Jazz: A web‐based tool for social network analysis and exploration
Mora-Mcginity et al. Musicweb: Music discovery with open linked semantic metadata
Burrows Reproducibility, verifiability, and computational historical research
Lohvynenko et al. Usage of semantic web in Austrian regional tourism organizations
JP4672578B2 (ja) 興味情報提供装置、興味情報提供方法および興味情報提供プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070815

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090501

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090501

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110412

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110414

R150 Certificate of patent or registration of utility model

Ref document number: 4728063

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350