JP2008210335A - 意識体系構築装置、意識体系構築方法および意識体系構築プログラム - Google Patents

意識体系構築装置、意識体系構築方法および意識体系構築プログラム Download PDF

Info

Publication number
JP2008210335A
JP2008210335A JP2007048799A JP2007048799A JP2008210335A JP 2008210335 A JP2008210335 A JP 2008210335A JP 2007048799 A JP2007048799 A JP 2007048799A JP 2007048799 A JP2007048799 A JP 2007048799A JP 2008210335 A JP2008210335 A JP 2008210335A
Authority
JP
Japan
Prior art keywords
ontology
interest
approximation
degree
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007048799A
Other languages
English (en)
Other versions
JP4745993B2 (ja
Inventor
Makoto Nakatsuji
真 中辻
Makoto Yoshida
吉田  誠
Miki Hirano
美貴 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007048799A priority Critical patent/JP4745993B2/ja
Publication of JP2008210335A publication Critical patent/JP2008210335A/ja
Application granted granted Critical
Publication of JP4745993B2 publication Critical patent/JP4745993B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】網羅的かつ専門的な知識を利用したコンテンツ体系を維持しつつ、ユーザの意識が反映された直観的なコンテンツ体系を構築する。
【解決手段】嗜好解析エンジン5は、サービスオントロジ12aを雛形オントロジとして用いることで、ユーザ14の興味オントロジを構築し、ユーザ14の興味オントロジ間の近似度に基づいてユーザネットワークを生成し、そのユーザネットワークを分割してユーザ14の意識を階層化することで、ユーザ14の意識体系13を構築し、その結果としてユーザ14の意識13a〜13cとサービスオントロジを構成するクラス12a〜12cとの間のマッピングを得る。
【選択図】 図1

Description

本発明は意識体系構築装置、意識体系構築方法および意識体系構築プログラムに関し、特に、サービスプロバイダが販売するコンテンツの販売体系(棚割り)に対して、ユーザ嗜好マイニング結果をフィードバックすることで、ユーザ嗜好に沿いつつユーザに分かり易いコンテンツ体系を構築する方法に適用して好適なものである。
なお、棚割りとは、買い物客が見やすく、取りやすく、選びやすいように、用途や機能やデザインや価格帯などのテーマによって多種多様な商品を分類・整理し、互いに関連する商品を効果的に組み合わせて陳列位置を決めることを言う。
近年、ユーザの興味などのユーザコンテクストを用い、その場その時の状況に沿った適切なコンテンツをネットワークを介してユーザに提供するサービスが注目されている。
また、ユーザの興味対象をインターネット上で発信し、ユーザ間での議論を促進するブログサービスや、互いに友人として承認し合ったユーザ間で興味対象を議論するソーシャル・ネットワークサービスなどが注目されており、このようなサービスを利用するユーザの数や、このようなサービスを利用するサービスが今後ますます拡大すると考えられている。
その他にも、AmazonやLast.fmなどユーザによる商品の購買や再生履歴に基づいてユーザの興味対象をユーザプロファイルとして自動構築し、そのユーザプロファイルに基づいて商品の推薦を行うサービスも登場し、ユーザの発信する多様な興味情報に基づく極め細やかな情報提供を行うサービスへの関心も高まっている。
そして、この種の情報流通サービスは、ユーザが自分自身の興味対象を発信し、興味の近いユーザの発信する記事や楽曲情報およびコミュニティにおける議論内容を閲覧することを通じて、各ユーザの興味対象を拡大する基盤となる可能性を持っている。
また、非特許文献1には、ユーザの興味対象としてユーザが興味を持つキーワードだけでなく、そのキーワードの背景となる情報をも保持するユーザプロファイルを自動構築し、そのユーザプロファイルに基づいてブログ検索機能を提供する方法が開示されている。
すなわち、非特許文献1には、ユーザが蓄積した記事を音楽や映画などのサービスプロバイダが与えるサービスオントロジへ分類することで、その記事に対してその話題対象であるインスタンスとインスタンスの背景知識を自動的にタグ付けするオートタギング手法と、ユーザの興味がクラス階層化された興味オントロジをユーザプロファイルとして自動抽出する興味オントロジ生成手法が開示されている。
そして、興味オントロジ間の近似度を計測し、近似度が高い興味オントロジ間で一部クラス階層が異なるクラスを検出し、そのクラスに属する記事を意外な興味記事としてユーザに推薦することで、ユーザの興味幅を拡大し、他のユーザ間とのコミュニケーションを促進するための検証実験を実際のブログサイト上で実施している。
この方法では、サービスプロバイダが作成する専門的なコンテンツの分類体系(タクソノミと言う)に基づいた網羅的かつ専門的な知識を利用したコンテンツの検索や推薦に有効である。
一方、ネットワーク上のコンテンツに対してユーザが与えるタグからコンテンツ間の関係を構築するフォークソノミがユーザドリブンなサービスオントロジの構築法として期待されている。フォークソノミは、ユーザの直観に基づいて膨大なコンテンツを体系化できる可能性を持つため、ユーザの意識に沿ったコンテンツの発見に役立つと期待されている。
なお、フォークソノミとは、写真や映像や文書などのコンテンツの投稿者が、インターネットのウェブサイト上で投稿されているコンテンツなどにタグを自由に追加したり分類したりして検索などのシステムに役立てることを言う。このフォークソノミでは、サイトの作者や管理者自身が閲覧者に関わらせることなくコンテンツの分類作業を行う従来の分類・検索手法と異なり、分類作業が万人に開かれ終わりのないオープンなもので共同作業によることが特徴である。また、タグ(tag)とは、「猫の写真」、「漁業」、「人工知能」などのコンテンツの内容や属性を一言で記述する索引語やキーワードやラベルのようなもので、コンテンツのタグを付けることをタグ付けと言う。
中辻真、三好優、大塚祥広:"ユーザ興味オントロジ抽出によるブログコミュニティ形成手法",日本データベース学会 Letters,Vol.5,No.1(2006)
しかしながら、現状のブログサービスにおける情報検索では、GoogleなどのWebページ検索エンジンやRDF Site Summary(RSS)という簡単なメタデータを記述を利用したキーワードベースの検索でしかないため、大量に発信されるブログ記事から自分自身の興味に沿った情報を掲載する記事を適切に選択するのが困難であるという問題があった。
すなわち、ユーザはブログ検索を行うたびに、自分自身の興味に即した検索目的語を適切に構成する必要があり、検索キーワードの選択に手間がかかっていた。また、事前に検索対象をある程度把握してないと、キーワード自体を構成することができないため、興味を持つ可能性があるにもかかわらずキーワードを特定できない場合には、情報検索自体ができなくなっていた。
また、非特許文献1に開示された方法では、サービスプロバイダが作成する専門的なコンテンツの分類体系が採用され、サービスプロバイダにとっては管理し易いが、その分類体系がユーザ自身のイメージする体系と異なっていることから、コンテンツへの直観的なアクセスができないという問題があった。また、このようなコンテンツの分類体系ではユーザからのアクセスの増大があまり見込めないため、コンテンツの売り上げの増大にあまり寄与しないという問題があった。
また、従来のフォークソノミで得られるタグ間の関係は、同値・背反関係を構築する方法には有効であるが、クラス間の継承関係などの専門的な知識表現のためのオントロジを構築する方法には適してないという問題があった。また、ユーザがタギングしたコンテンツのみが対象とされ、ユーザが把握していないコンテンツについては考慮されないという問題があった。
そこで、本発明の目的は、網羅的かつ専門的な知識を利用したコンテンツ体系を維持しつつ、ユーザの意識が反映された直観的なコンテンツ体系を構築することが可能な意識体系構築装置、意識体系構築方法および意識体系構築プログラムを提供することである。
上述した課題を解決するために、請求項1記載の意識体系構築装置によれば、個人の興味情報が概念階層化された興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測する近似度計測手段と、興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するユーザネットワーク生成手段と、前記ユーザネットワークを分割することにより、前記ユーザの意識を階層化するネットワーク分割手段とを備えることを特徴とする。
また、請求項2記載の意識体系構築装置によれば、興味情報が概念階層化された雛形オントロジに含まれるクラスまたはインスタンスおよびそれらの上位のクラスを抽出することにより、前記興味オントロジを生成することを特徴とする。
また、請求項3記載の意識体系構築装置によれば、前記近似度計測手段は、前記雛形オントロジから割り振られたクラスIDが前記興味オントロジにて保有されているかどうかの判定結果に基づいて、前記興味オントロジ間のトポロジの近似度を計測するとともに、前記雛形オントロジから割り振られたインスタンスIDが前記興味オントロジにて保有されているかどうかの判定結果に基づいて、前記興味オントロジ間のクラスの近似度を計測し、前記トポロジの近似度と前記クラスの近似度に基づいて、前記興味オントロジ間の近似度を計測することを特徴とする。
また、請求項4記載の意識体系構築装置によれば、前記ネットワーク分割手段は、2番目以降に分割されるクラスタに所属するユーザの数がある閾値を越える場合にのみ分割を許可し、2番目以降に分割されるクラスタに所属するユーザの数が前記閾値以下の場合に最初に結合するエッジの組み合わせを変更することを特徴とする。
また、請求項5記載の意識体系構築装置によれば、ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、興味情報が概念階層化された雛形オントロジを選択するステップと、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを興味オントロジとして前記雛形オントロジから抽出するステップと、前記興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測するステップと、前記興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するステップと、集団間のリンクに対する集団内部のリンクの密度の濃さに基づいて前記ユーザネットワークを分割することにより、ユーザの意識を階層化するステップとを備えることを特徴とする。
また、請求項6記載の意識体系構築装置によれば、ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、興味情報が概念階層化された雛形オントロジを選択するステップと、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを興味オントロジとして前記雛形オントロジから抽出するステップと、前記興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測するステップと、前記興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するステップと、集団間のリンクに対する集団内部のリンクの密度の濃さに基づいて前記ユーザネットワークを分割することにより、ユーザの意識を階層化するステップとをコンピュータに実行させることを特徴とする。
以上説明したように、本発明によれば、雛形オントロジが保有するトポロジを継承させつつ、個人の興味が反映された興味オントロジを生成することが可能となるとともに、興味オントロジ間の近似度が反映されたユーザネットワークを分割することで、サービスプロバイダが作成する雛形オントロジとユーザの意識とをマッピングすることができ、網羅的かつ専門的な知識を利用したコンテンツ体系を維持しつつ、ユーザの意識が反映された直観的なコンテンツ体系を構築することができる。
以下、本発明の実施形態に係る意識体系構築装置およびその方法について図面を参照しながら説明する。
図1は、本発明の一実施形態に係る意識体系構築装置が適用されるシステムの概略構成を示すブロック図である。
図1において、サービスプロバイダ1には、ユーザのコンテンツや商品などの購買履歴1bが保持されるとともに、その購買履歴1bに対応したユーザID1aが保持されている。また、ブログ事業者2には、日付入りの記事ページを中心としたブログ2bが保持されるとともに、ブログ2bに対応したユーザID2aが保持されている。なお、ブログ2bはブログエントリごとに保持することができる。ここで、ブログエントリはブログにおける記事の最小単位を表し、日にちごとに設けることができる。
また、サービスプロバイダ3には、ユーザが蓄積した記事をサービスオントロジへ分類することで、その記事に対してその話題対象であるインスタンスとインスタンスの背景知識がタグ付けされたコンテンツ体系3aが保持されている。
また、ユーザ嗜好抽出手段4には、購買履歴やブログマイニングにて得られた個人の嗜好に関する情報が格納された嗜好知識ベース4aが設けられている。
また、嗜好解析エンジン5には、個人の興味情報が概念階層化された興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測する近似度計測手段5a、興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するネットワーク生成手段5b、ネットワーク生成手段5bにて生成されたユーザネットワークを分割することにより、ユーザの意識を階層化するネットワーク分割手段5cが設けられている。
そして、サービスプロバイダ1、3、ブログ事業者2、ユーザ嗜好抽出手段4および嗜好解析エンジン5はインターネットなどのネットワークを介して接続することができる。
そして、嗜好解析エンジン5は、サービスオントロジに基づいてユーザの興味オントロジを構築し、その興味オントロジ間の近似度に基づいて生成されたユーザネットワークを分割することにより、ユーザの意識体系を構築し、その結果としてユーザの意識とサービスオントロジとの間のマッピングを得ることができる。
図2は、本発明の一実施形態に係るユーザの意識とサービスオントロジとの間の関係を示す図である。
図2において、サービスプロバイダ3が音楽に関するサービスをユーザに提供するものとすると、音楽サービスデータベース11aには、コンテンツ体系3aとして音楽に関するサービスオントロジ12を保持することができる。
そして、嗜好解析エンジン5は、サービスオントロジ12aを雛形オントロジとして用いることで、ユーザ14の興味オントロジを構築する。そして、ユーザ14の興味オントロジ間の近似度に基づいてユーザネットワークを生成し、そのユーザネットワークを分割してユーザ14の意識を階層化することで、ユーザ14の意識体系13を構築し、その結果としてユーザ14の意識13a〜13cとサービスオントロジを構成するクラス12a〜12cとの間のマッピングを得ることができる。
なお、雛形オントロジとは、個人の興味情報が概念階層化された興味オントロジの雛形である。そして、雛形オントロジは、サービスプロバイダ3側で恣意的に作成することができる。例えば、サービスプロバイダ3が音楽に関するコンテンツ体系3aを保持している場合、音楽に関する雛形オントロジを構築することができる。ここで、ユーザの興味を細やかに表現するために、可能な限り細分化された網羅性の高い雛形オントロジを構築することが好ましい。また、雛形オントロジの実体は、オントロジ記述言語OWLなどのXML言語で記述されたテキストファイル等、クラス・インスタンスツリーをDB上で表現したものである。また、情報の整理の簡単化のため、インスタンスは最下位クラスにのみ分類してもよい。
これにより、雛形オントロジが保有するトポロジを継承させつつ、個人の興味が反映された興味オントロジを生成することが可能となるとともに、興味オントロジ間の近似度が反映されたユーザネットワークを分割することで、サービスプロバイダ3が作成するサービスオントロジ12aとユーザ14の意識13a〜13cとをマッピングすることができ、網羅的かつ専門的な知識を利用したコンテンツ体系3aを維持しつつ、ユーザ14の意識が反映された直観的なコンテンツ体系3aを構築することができる。
以下、図1の嗜好解析エンジン5の動作についてより詳細に説明する。
図1の嗜好解析エンジン5は、ユーザ嗜好抽出手段4にて抽出された嗜好知識ベース4aと、サービスプロバイダ3が持つコンテンツ体系3aが入力されると、コンテンツ体系3aを構成するサービスオントロジに基づいて記事に対するオートタギングを実施することで、ユーザの興味オントロジを生成することができる。
ここで、嗜好解析エンジン5は、雛形オントロジとしてのサービスオントロジに含まれるクラスまたはインスタンスおよびそれらの上位のクラスを抽出することで、個人の興味情報が概念階層化された興味オントロジを生成することができる。
すなわち、嗜好解析エンジン5は、嗜好知識ベース4aとして入力されたブログエントリに対して形態素解析をそれぞれ適用することで、同一ユーザの持つ複数のブログエントリで頻出する形態素を抽出する。そして、ブログエントリで頻出する各形態素を雛形オントロジに適用し、雛形オントロジ内のクラスまたはインスタンスに一致する文字列があるかどうかを調べる。そして、雛形オントロジ内のクラスまたはインスタンスに一致する文字列がある場合、雛形オントロジのルートクラスから、そのクラスまたはインスタンスまでの直接的な子孫クラスおよびインスタンスを興味オントロジとして抽出することができる。
そして、近似度計測手段5aは、ユーザ14の興味オントロジが生成されると、その興味オントロジ間の近似度を計測することにより、ユーザ14間の興味の近似度を計測する。
ここで、近似度計測手段5aは、ユーザ14の興味オントロジのトポロジを形成するクラス集合間の共起度に基づいて、興味オントロジ間のトポロジの近似度を計測することができる。例えば、近似度計測手段5aは、興味オントロジのクラス集合間の積集合のメンバ数を、雛形オントロジ6のクラス集合のメンバ数で割った値に基づいて、興味オントロジ間のトポロジの近似度を計測することができる。
また、近似度計測手段5aは、ユーザ14の興味オントロジに含まれるインスタンス集合間の共起度に基づいて、興味オントロジ間のクラスの近似度を計測することができる。例えば、近似度計測手段5aは、興味オントロジのインスタンス集合間の積集合のメンバ数を、雛形オントロジのインスタンス集合のメンバ数で割った値に基づいて、興味オントロジ間のクラスの近似度を計測することができる。そして、近似度計測手段5aは、興味オントロジ間のトポロジの近似度および興味オントロジ間のクラスの近似度を総合的に判断することにより、興味オントロジ間の近似度を計測することができる。
図3は、本発明の一実施形態に係る興味オントロジ間の近似度計測方法を示す図である。なお、以下の説明では、あるオントロジに対する別のオントロジとの間の近似度を計測する場合、前者をソースオントロジ、後者をターゲットオントロジと呼ぶ。
図3において、雛形オントロジOHの“a1”というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”および“c2”というクラスが存在し、“c1”というクラスの直下には、“d1”および“d2”というクラスが存在しているものとする。また、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在し、“b3”というクラスの直下には、“c5”というクラスが存在しているものとする。
また、“d1”というクラスには、“j”および“k”というインスタンスが存在し、“d2”というクラスには、“l”というインスタンスが存在し、“c2”というクラスには、“m”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“e”、“c”、“f”、“b”、“d”および“g”というインスタンスが存在し、“c4”というクラスには、“p”、“g”、“j”および“h”というインスタンスが存在しているものとする。
そして、各ユーザのブログエントリに頻出する単語をそれぞれ抽出し、その単語を含むクラスまたはインスタンスおよびそれらの上位の全てのクラスを雛形オントロジOHからそれぞれ抽出することにより、興味オントロジOA、OBが作成されたものとする。
ここで、興味オントロジOAの“a1というクラスの直下には、“b1”および“b2”というクラスが存在し、“b1”というクラスの直下には、“c1”および“c2”というクラスが存在し、“c1”というクラスの直下には、“d1”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“d1”というクラスには、“j”および“k”というインスタンスが存在し、“c2”というクラスには、“m”というインスタンスが存在し、“c3”というクラスには、“a”、“c”、“b”および“d”というインスタンスが存在し、“c4”というクラスには、“q”および“h”というインスタンスが存在しているものとする。
また、興味オントロジOBの“a1”というクラスの直下には、“b1”、“b2”および“b3”というクラスが存在し、“b1”というクラスの直下には、“c1”というクラスが存在し、“c1”というクラスの直下には、“d1”というクラスが存在し、“b2”というクラスの直下には、“c3”および“c4”というクラスが存在しているものとする。また、“d2”というクラスには、“l”というインスタンスが存在し、“b2”というクラスには、“n”というインスタンスが存在し、“c3”というクラスには、“a”、“c”、“e”および“f”というインスタンスが存在し、“c4”というクラスには、“p”および“j”というインスタンスが存在しているものとする。
そして、雛形オントロジOHおよび興味オントロジOA、OB間で末端クラスを除く共通クラスを分析し、共通クラスを親クラスとした親子クラスからなるトポロジを抽出する。なお、図3の例では、末端クラスは、“d1”、“d2”、“c3”および“c4”とする。この結果、雛形オントロジOHおよび興味オントロジOA、OB間において、クラス“a1”を親クラスとした子クラス集合G1、クラス“b1”を親クラスとした子クラス集合G2、クラス“c1”を親クラスとした子クラス集合G3、クラス“b2”を親クラスとした子クラス集合G4、クラス“b3”を親クラスとした子クラス集合G5を抽出することができる。
なお、この共通クラスの分析は、同じクラスIDが雛形オントロジOHおよび興味オントロジOA、OB間に存在するかということだけを確認すればよい。このため、クラスの名前属性やインスタンス集合プロパティなどの近似度を計測する必要がなくなり、クラス間の対応関係を正確に維持しつつ、計算量を減らすことができる。
次に、興味オントロジOA、OB間で各トポロジを形成する子クラス集合X、Y間の近似度を深さ優先で計算する。ここで、雛形オントロジOHを構成するクラスの子クラスの集合をZとすると、子クラス集合X、Y間の近似度は、|X∩Y|/|Z|にて求めることができる。そして、各トポロジの子クラス集合間の近似度を足し合わせることにより、興味オントロジOA、OB間でのトポロジの近似度Sを計測することができる。
例えば、子クラス集合G1において、雛形オントロジOHには“b1”、“b2”および“b3”という子クラスが含まれているので、子クラス集合G1における雛形オントロジOHの子クラス集合のメンバ数は3となる。また、子クラス集合G1において、興味オントロジOAには“b1”および“b2”という子クラスが含まれ、興味オントロジOBには“b1”、“b2”および“b3”という子クラスが含まれているので、興味オントロジOA、OBに共通に含まれている子クラスは“b1”およびb2”だけとなり、子クラス集合G1における興味オントロジOA、OBの子クラス集合の積集合のメンバ数は2となる。この結果、興味オントロジOA、OBの子クラス集合G1間における近似度は2/3となる。
同様に、興味オントロジOA、OBの子クラス集合G2間における近似度は1/2、子クラス集合G3間における近似度は0/2、子クラス集合G4間における近似度は2/2となる。この結果、興味オントロジOA、OB間でのトポロジの近似度Sは2/3+1/2+0/2+2/2となる。
なお、興味オントロジOA、OB間でのトポロジの近似度の計算でも、雛形オントロジOHから割り振られたクラスIDを参照し、雛形オントロジOHの接続形態に沿ったものが興味オントロジOA、OB間に存在するかということだけを確認すればよい。例えば、興味オントロジOA、OBにおけるa1−b1−c1という接続形態は雛形オントロジOHの接続形態と同じであるかどうかは、“a1”、“b1”および“c1”というクラスが興味オントロジOA、OBにて保持されているかどうかということを確認するだけで判断することができる。
このため、興味オントロジOA、OB間のトポロジの一致度を確認するために、興味オントロジOA、OBが持つクラスIDを調べるだけでよく、対応クラスを起点として、上下クラスにさらに対応クラスがあるかを調べる必要がなくなり、興味オントロジOA、OB間でのトポロジの近似度の計算量を減らすことができる。
次に、興味オントロジOA、OBの共通クラス間の近似度を計算する。ここで、興味オントロジOA、OBの共通クラス間の近似度を計算する場合、クラスに所属するインスタンス集合を用いることができる。すなわち、あるクラスC1において、ソースオントロジのインスタンス集合をx、ターゲットオントロジのインスタンス集合をy、雛形オントロジOHのインスタンス集合をzとすると、興味オントロジOA、OBの共通クラス間の近似度は、|x∩y|/|z|にて求めることができる。そして、共通クラス間の近似度を足し合わせることにより、興味オントロジOA、OBのクラス間の近似度Sを計測することができる。
例えば、興味オントロジOA、OB間の共通クラス“b2”において、興味オントロジOAの共通クラス“b2”におけるインスタンス集合G6には、インスタンス“n”が存在し、興味オントロジOBの共通クラス“b2”におけるインスタンス集合G6には、インスタンス“n”が存在し、雛形オントロジOHの共通クラス“b2”にはインスタンス“n”が存在している。この結果、雛形オントロジOHの共通クラス“b2”のインスタンスのメンバ数は1、興味オントロジOA、OBのインスタンス集合G6の積集合のメンバ数は1となり、“b2”という共通クラス間の近似度は1/1となる。
また、興味オントロジOA、OB間の共通クラス“c2”において、興味オントロジOAの共通クラス“c2”におけるインスタンス集合G7には、インスタンス“a”、“c”、“b”および“d”が存在し、興味オントロジOBの共通クラス“c3”におけるインスタンス集合G7には、インスタンス“a”、“c”、“e”および“f”が存在し、雛形オントロジOHの共通クラス“c3”にはインスタンス“a”、“e”、“c”、“f”、“b”、“d”および“g”が存在している。
この結果、雛形オントロジOHの共通クラス“c3”のインスタンスのメンバ数は7、興味オントロジOA、OBのインスタンス集合G7の積集合のメンバ数は2となり、“c3”という共通クラス間の近似度は2/7となる。
従って、興味オントロジOA、OBのクラス間の近似度Sは1/1+2/7となる。
なお、興味オントロジOA、OBの共通クラス間の近似度の計算でも、雛形オントロジOHから割り振られたインスタンスIDが興味オントロジOA、OB間に存在するかということだけを確認すればよい。このため、興味オントロジOA、OBのクラス間の近似度を計算するために、インスタンスの名前の一致性などによるインスタンスの対応関係を予め確認する必要がなくなり、計算量を減らすことができる。
そして、興味オントロジOA、OBにおけるトポロジの近似度Sおよびクラス間の近似度Sが求まると、トポロジとクラスに対する重要度に応じた評価関数f(X)を用いることにより、以下の(1)式にて興味オントロジOA、OB間の近似度S(AB)を与えることができる。
(AB)=S+f(S) ・・・(1)
これにより、雛形オントロジOHの持つクラス特性を継承させつつ興味オントロジOA、OBを構築することが可能となるとともに、インスタンス集合間の共起度を興味オントロジOA、OB間の近似度の計測に直接用いることができ、計算量を抑制しつつ、個人の嗜好に適合した興味オントロジOA、OBを適正に抽出することが可能となるとともに、興味オントロジOA、OBが雛形オントロジOHの持つドメインの知識を保有しているかの相対的な尺度として利用することができ、そのドメインに対する知識を多く持つユーザを有効的に絞り込むことができる。
また、興味オントロジOA、OBにおけるトポロジの近似度Sを計測する場合、雛形オントロジのクラス集合のメンバ数を基準として、興味オントロジOA、OB間のトポロジの近似度を計測することにより、興味オントロジOA、OBのクラス集合のメンバ数が増大した場合においても、興味オントロジOA、OB間のトポロジの近似度が小さくなることを防止することができ、クラスが豊富にあるという意味で知識量の多い興味オントロジOA、OBとの近似度を大きくすることができる。
図4は本発明の一実施形態に係る興味オントロジ間の近似度計測方法の優位性を示す図である。
図4において、オントロジOCでは、図3のオントロジOBの“b3”というクラスがないものとする。この場合、オントロジOBでは、“b1”、“b2”および“b3”という子クラスが子クラス集合G1に含まれ、オントロジOCでは、“b1”および“b2”という子クラスが子クラス集合G1に含まれるにもかかわらず、興味オントロジOA、OCの子クラス集合G1間における近似度は、興味オントロジOA、OBの子クラス集合G1間における近似度と同様に2/3となる。
この結果、オントロジOCでは、図3のオントロジOBの“b3”というクラスがないにもかかわらず、興味オントロジOA、OC間の近似度が興味オントロジOA、OB間の近似度よりも大きくなることを防止することができ、クラスが豊富にあるという意味で知識量の多い興味オントロジとの近似度が相対的に小さくなることを防止することができる。
次に、図1において、近似度計測手段5aにてユーザ14の興味オントロジ間の近似度が計測されると、ネットワーク生成手段5bは、興味の近似度が所定の範囲内にあるユーザ14間にリンクを張ることで、ユーザネットワークを生成する。
すなわち、ネットワーク生成手段5bは、興味オントロジ間の近似度が近いユーザ集合が共有するインスタンス集合は、ユーザ集合の意識を反映しているとみなし、そのようなインスタンス集合を抽出する。そのため、(1)式を適用することで、ユーザiから見たユーザjの近似度S(ij)を求め、X>S(ij)>Yという条件を満たす場合、ユーザi、j間の興味が近いとして、ユーザi、j間で関係を構築する。そして、図5に示すように、ユーザi、jをノードに対応させ、興味が近いユーザi、j間にリンクを張ることで、ユーザネットワークを生成する。
ここで、S(ij)が非常に大きなユーザは、興味の幅が広過ぎるユーザである。このため、興味が近いユーザi、j間にリンクを張る場合、X>S(ij)という条件を設定することで、興味の幅が広過ぎるユーザを除去することができ、ネットワーク分割が阻害されるのを防止することができる。
なお、ユーザi、j間で関係を構築する場合、ユーザiから見て上位Z(Zは正の整数)人のユーザ間にのみリンクを張るようにしてもよい。
次に、図1において、ネットワーク生成手段5bにてユーザネットワークが生成されると、ネットワーク分割手段5cは、ネットワーク生成手段5bにて生成されたユーザネットワークを分割することにより、ユーザの意識を階層化する。
図6は、本発明の一実施形態に係るユーザネットワークを分割化する方法を示す図である。
図6において、図1のネットワーク生成手段5bにてユーザA〜Jについてのユーザネットワークが生成されたものとすると、ネットワーク分割手段5cは、そのユーザネットワークを分割することにより、ユーザA〜Jの意識が階層化されたユーザ集合Q1〜Q3を生成する。
ここで、ユーザネットワークを分割する方法として、“Newman,M.E.J.:Fast algorithm for detecting community structure in networks(2003)”に記載されているように、集団間のリンクに対する集団内部のリンクの密度の濃さに基づいて評価することができる。そして、この度合いをモジュール性Qという値で定義している。
ここで、上記の文献に記載されている手法で分割された後に生成されるユーザ集合に所属するユーザの数のばらつきが大きかったり、各ユーザ集合に所属するユーザの数が少な過ぎる場合、適正なユーザ集合の階層を得ることができない。すなわち、上記の文献に記載されている手法では、最初に結合させるエッジを決める時に、結合後にモジュール性Qが大きくなる指標を示すスコアΔQが同じ値のエッジの組み合わせが複数ある場合、エッジの組み合わせがランダムに決められる。このため、上記の文献に記載されている手法で分割された後に生成されるユーザ集合に所属するユーザの数のばらつきが大きくなり、ジャンル体系が深すぎる部分と浅すぎる部分とに分かれることになることから、ユーザ集合の階層が扱い難くなる。
そこで、ネットワーク生成手段5bは、最初に結合するエッジの組み合わせはランダムに決定する。そして、それにより最終的に分割されるクラスタ(集合)において、2番目以降に分割されるクラスタに所属するユーザの数がある閾値θを越える場合にのみ分割を許可し、2番目以降に分割されるクラスタに所属するユーザの数が閾値θ以下の場合に最初に結合するエッジの組み合わせを変更することができる。
そして、1番目に分割されたクラスタは、そこに所属するユーザの数が非常に大きい場合が多く、細やかなユーザ集合とならないと考えられるため、閾値θ以下になるまで分割を繰り返すことができる。そして、このように分割されたクラスタを一意識に沿ったアーチスト集合とすることができる。これにより、分割されたクラスタに所属するユーザの数のばらつきを抑え、階層化された意識の粒度を均等化することができる。
なお、分割を複数回繰り返しても、閾値θを超えるクラスタが生成されない場合、パラメータX、Zを小さくすることで、ユーザネットワーク内のリンクの数を抑え、分割可能なようにユーザネットワークを整えることができる。
そして、ネットワーク生成手段5bは、ユーザの数が閾値θを超える分割されたクラスタを、閾値θを変更して再分割し、ユーザ14の意識13a〜13cの階層化を図ることができる。
そして、嗜好解析エンジン5は、階層化されたユーザ14の意識13a〜13cをユーザ嗜好マイニング結果としてサービスプロバイダ3が保持するコンテンツ体系3aにフィードバックすることができる。
これにより、ユーザ14の嗜好に沿ったユーザ14にとって分かり易いコンテンツ体系3aを再構築することが可能となるとともに、サービスプロバイダ3が望む網羅的かつ専門的なコンテンツ体系3aとの間のマッピングを得ることができる。このため、ユーザ14は、直観的にコンテンツを発見することができ、自分の興味に沿った商品を効率よく発見することが可能となる。また、サービスプロバイダ3は、自分が管理しやすいコンテンツ体系3aを維持したまま商品を管理することができ、ユーザ14の興味の動向をマーケティングし易くなるとともに、コンテンツ体系3aへのユーザ14からのアクセスを促進させることを可能として、商品の販売を促進することが可能となる。
図7は、本発明の一実施形態に係る興味オントロジの近似性を利用したコミュニティ形成方法を示す図である。
図7において、各ユーザA、BのブログエントリPA、PBを雛形オントロジに対してそれぞれ分類することにより、各ユーザA、Bの興味オントロジKA、KBがそれぞれ生成されたものとする(ステップS1)。そして、各ユーザA、Bの興味オントロジKA、KB間の近似度を計測し(ステップS2)、近似度の高い興味オントロジKA、KB間で共起するクラスやインスタンスを分析することで、トポロジが異なるにも関わらず興味を持つ可能性が高い情報を他のユーザのエントリを介して意外な情報としてユーザに推奨することができる(ステップS3)。
例えば、各ユーザA、Bの興味オントロジKA、KB間の近似度を計測することにより、“Madchester”などのクラスや“Happy Mondays”などのインスタンスに興味を持つユーザは、“Glasgow”というクラスや“Teenage Fanclub”というインスタンスにも興味を持つ可能性が高いことが判る。
また、このような興味オントロジKA、KBをブログに適用することで、単純なキーワード検索ではなく、興味オントロジKA、KB間の近似度に基づく意外なエントリ推薦によるコミュニティの形成を支援することができ、ユーザの興味を自然に広げることができる(ステップS4)。
なお、近似度計測手段5a、ネットワーク生成手段5bおよびネットワーク分割手段5cは、これらの手段で行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させることにより実現することができる。
そして、このプログラムをCD−ROMなどの記憶媒体に記憶しておけば、嗜好解析エンジン5のコンピュータに記憶媒体を装着し、そのプログラムをコンピュータにインストールすることにより、近似度計測手段5a、ネットワーク生成手段5bおよびネットワーク分割手段5cで行われる処理を実現することができる。また、このプログラムをネットワークを介してダウンロードすることにより、このプログラムを容易に普及させることができる。
また、近似度計測手段5a、ネットワーク生成手段5bおよびネットワーク分割手段5cで行われる処理を遂行させる命令が記述されたプログラムをコンピュータに実行させる場合、スタンドアロン型コンピュータで実行させるようにしてもよく、ネットワークに接続された複数のコンピュータに分散処理させるようにしてもよい。
本発明は、網羅的かつ専門的な知識を利用したコンテンツ体系を維持しつつ、ユーザの意識が反映された直観的なコンテンツ体系を構築することができ、サービスプロバイダによる商品管理の効率性を損なうことなく、サービスプロバイダが保持するコンテンツ体系へのユーザからのアクセスを促進することができ、商品の販売を増大させることができる。
本発明の一実施形態に係る意識体系構築装置が適用されるシステムの概略構成を示すブロック図である。 本発明の一実施形態に係るユーザの意識とサービスオントロジとの間の関係を示す図である。 本発明の一実施形態に係る興味オントロジ間の近似度計測方法を示す図である。 本発明の一実施形態に係る興味オントロジ間の近似度計測方法の優位性を示す図である。 本発明の一実施形態に係るユーザ間の興味関係をネットワーク化する方法を示す図である。 本発明の一実施形態に係るユーザネットワークを分割化する方法を示す図である。 本発明の一実施形態に係る興味オントロジの近似性を利用したコミュニティ形成方法を示す図である。
符号の説明
1、3 サービスプロバイダ
1a、2a ユーザID
1b 購買履歴
2 ブログ事業者
2b ブログ
3a コンテンツ体系
4 ユーザ嗜好抽出手段
4a 嗜好知識ベース
5 嗜好解析エンジン
5a 近似度計測手段
5b ネットワーク生成手段
5c ネットワーク分割手段

Claims (6)

  1. 個人の興味情報が概念階層化された興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測する近似度計測手段と、
    興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するユーザネットワーク生成手段と、
    前記ユーザネットワークを分割することにより、前記ユーザの意識を階層化するネットワーク分割手段とを備えることを特徴とする意識体系構築装置。
  2. 興味情報が概念階層化された雛形オントロジに含まれるクラスまたはインスタンスおよびそれらの上位のクラスを抽出することにより、前記興味オントロジを生成することを特徴とする請求項1記載の意識体系構築装置。
  3. 前記近似度計測手段は、前記雛形オントロジから割り振られたクラスIDが前記興味オントロジにて保有されているかどうかの判定結果に基づいて、前記興味オントロジ間のトポロジの近似度を計測するとともに、前記雛形オントロジから割り振られたインスタンスIDが前記興味オントロジにて保有されているかどうかの判定結果に基づいて、前記興味オントロジ間のクラスの近似度を計測し、前記トポロジの近似度と前記クラスの近似度に基づいて、前記興味オントロジ間の近似度を計測することを特徴とする請求項1または2記載の意識体系構築装置。
  4. 前記ネットワーク分割手段は、2番目以降に分割されるクラスタに所属するユーザの数がある閾値を越える場合にのみ分割を許可し、2番目以降に分割されるクラスタに所属するユーザの数が前記閾値以下の場合に最初に結合するエッジの組み合わせを変更することを特徴とする請求項1から3のいずれか1項記載の意識体系構築装置。
  5. ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、
    興味情報が概念階層化された雛形オントロジを選択するステップと、
    前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、
    前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを興味オントロジとして前記雛形オントロジから抽出するステップと、
    前記興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測するステップと、
    前記興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するステップと、
    集団間のリンクに対する集団内部のリンクの密度の濃さに基づいて前記ユーザネットワークを分割することにより、ユーザの意識を階層化するステップとを備えることを特徴とする意識体系構築方法。
  6. ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、
    興味情報が概念階層化された雛形オントロジを選択するステップと、
    前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを前記雛形オントロジから抽出するステップと、
    前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを興味オントロジとして前記雛形オントロジから抽出するステップと、
    前記興味オントロジ間の近似度を計測することにより、ユーザ間の興味の近似度を計測するステップと、
    前記興味の近似度が所定の範囲内にあるユーザ間にリンクを張ることで、ユーザネットワークを生成するステップと、
    集団間のリンクに対する集団内部のリンクの密度の濃さに基づいて前記ユーザネットワークを分割することにより、ユーザの意識を階層化するステップとをコンピュータに実行させることを特徴とする意識体系構築プログラム。
JP2007048799A 2007-02-28 2007-02-28 意識体系構築装置および意識体系構築プログラム Active JP4745993B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007048799A JP4745993B2 (ja) 2007-02-28 2007-02-28 意識体系構築装置および意識体系構築プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007048799A JP4745993B2 (ja) 2007-02-28 2007-02-28 意識体系構築装置および意識体系構築プログラム

Publications (2)

Publication Number Publication Date
JP2008210335A true JP2008210335A (ja) 2008-09-11
JP4745993B2 JP4745993B2 (ja) 2011-08-10

Family

ID=39786550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007048799A Active JP4745993B2 (ja) 2007-02-28 2007-02-28 意識体系構築装置および意識体系構築プログラム

Country Status (1)

Country Link
JP (1) JP4745993B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011141666A (ja) * 2010-01-06 2011-07-21 Nippon Telegr & Teleph Corp <Ntt> 興味情報推薦装置、興味情報推薦方法および興味情報推薦プログラム
WO2012096388A1 (ja) * 2011-01-12 2012-07-19 日本電気株式会社 意外性判定システム、意外性判定方法およびプログラム
JP2016536675A (ja) * 2013-10-07 2016-11-24 フェイスブック,インク. クラスタリングに基づくマッピングおよびルーティングのためのシステムおよび方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143517A (ja) * 1996-11-13 1998-05-29 Fuji Xerox Co Ltd 文書作成装置
JP2001014349A (ja) * 1999-06-28 2001-01-19 Nippon Telegr & Teleph Corp <Ntt> 協調情報フィルタリング用レイティングシステム
JP2004310199A (ja) * 2003-04-02 2004-11-04 Terukazu Kanazawa 文書分類方法及び文書分類プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143517A (ja) * 1996-11-13 1998-05-29 Fuji Xerox Co Ltd 文書作成装置
JP2001014349A (ja) * 1999-06-28 2001-01-19 Nippon Telegr & Teleph Corp <Ntt> 協調情報フィルタリング用レイティングシステム
JP2004310199A (ja) * 2003-04-02 2004-11-04 Terukazu Kanazawa 文書分類方法及び文書分類プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011141666A (ja) * 2010-01-06 2011-07-21 Nippon Telegr & Teleph Corp <Ntt> 興味情報推薦装置、興味情報推薦方法および興味情報推薦プログラム
WO2012096388A1 (ja) * 2011-01-12 2012-07-19 日本電気株式会社 意外性判定システム、意外性判定方法およびプログラム
JP2016536675A (ja) * 2013-10-07 2016-11-24 フェイスブック,インク. クラスタリングに基づくマッピングおよびルーティングのためのシステムおよび方法

Also Published As

Publication number Publication date
JP4745993B2 (ja) 2011-08-10

Similar Documents

Publication Publication Date Title
Meo et al. Analyzing user behavior across social sharing environments
JP5154975B2 (ja) 興味体系グラフ形成装置、興味体系グラフ形成方法、および、興味体系グラフ形成プログラム
US20150095303A1 (en) Knowledge Graph Generator Enabled by Diagonal Search
Amato et al. Multimedia summarization using social media content
JP5320307B2 (ja) 興味情報推薦装置、興味情報推薦方法および興味情報推薦プログラム
Shao et al. Personalized travel recommendation based on sentiment-aware multimodal topic model
Lalithsena et al. Automatic domain identification for linked open data
Magnani et al. Conversation retrieval for microblogging sites
Ibba et al. Hashtag of Instagram: From Folksonomy to Complex Network.
Gao et al. SeCo-LDA: Mining service co-occurrence topics for composition recommendation
Yager et al. Looking for like-minded individuals in social networks using tagging and e fuzzy sets
US20160188595A1 (en) Semantic Network Establishing System and Establishing Method Thereof
Desolda Enhancing workspace composition by exploiting linked open data as a polymorphic data source
JP4745993B2 (ja) 意識体系構築装置および意識体系構築プログラム
Eda et al. The effectiveness of latent semantic analysis for building up a bottom-up taxonomy from folksonomy tags
Spitz et al. Topexnet: entity-centric network topic exploration in news streams
Yeung et al. Context-aware news recommender in mobile hybrid P2P network
Kavitha et al. Tourism recommendation using social media profiles
KR101132974B1 (ko) 멀티모달 소셜 네트워크의 온톨로지 구축 장치 및 방법
KR20140135100A (ko) 시맨틱 매쉬업 기술을 이용한 프로그램 제공 방법
Gawinecki et al. Representing users in a travel support system
JP5439261B2 (ja) クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
Sperlì et al. Multimedia social network modeling using hypergraphs
Noor Ifada et al. An efficient tagging data interpretation and representation scheme for item recommendation
Vassilakis et al. Database knowledge enrichment utilizing trending topics from Twitter

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081224

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090501

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090501

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110512

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4745993

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350