JP4580351B2 - 興味情報生成装置、興味情報生成方法および興味情報生成プログラム - Google Patents
興味情報生成装置、興味情報生成方法および興味情報生成プログラム Download PDFInfo
- Publication number
- JP4580351B2 JP4580351B2 JP2006045903A JP2006045903A JP4580351B2 JP 4580351 B2 JP4580351 B2 JP 4580351B2 JP 2006045903 A JP2006045903 A JP 2006045903A JP 2006045903 A JP2006045903 A JP 2006045903A JP 4580351 B2 JP4580351 B2 JP 4580351B2
- Authority
- JP
- Japan
- Prior art keywords
- class
- ontology
- blog entry
- instance
- personal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
また、gooなどの検索エンジンを利用した検索においても、ユーザが適切なキーワードを思いつかないと、意図した内容を検索することができないだけでなく、不要な検索結果が多数含まれることがあった。
この理由の一つとして、現在の検索方法はキーワード検索のみであり、クラス(概念)体系やクラスの持つ属性、すなわちクラス名やインスタンス(実体)を利用した精度の高い検索を実施できないことが挙げられる。キーワードはただの文字列であるが、クラスは複数のインスタンスをメンバーとして持つものであり、どのようなインスタンスをクラスの構成メンバーとするかによって、各個人の嗜好をクラスに反映させることができる。また、クラス階層の取り方によっても、各個人の嗜好をクラスに反映させることができる。
佐保田圭介他、"ブックマークの階層構造情報を組み込んだ協調フィルタリングによるWebページの推薦手法"、DEWS2004 6−B−04
そこで、本発明の目的は、作成にかかるコストを抑制しつつ、個人の興味が高精度に反映されたパーソナルオントロジを生成することが可能な興味情報生成装置、興味情報生成方法および興味情報生成ブログラムを提供することである。
これにより、興味がクラスや複数のクラスに跨るユーザ数の分布を解析することができ、ユーザの興味に関するコミュニティの活性状況を把握することができる。
図1は、本発明の一実施形態に係る興味情報生成装置が適用されるシステムの概略構成を示すブロック図である。
図1において、端末2〜4およびサーバ5が通信網1を介して接続されている。なお、通信網1としては、例えば、IP通信を行う公衆通信網を用いることができ、インターネットであってもよい。また、企業間の専用通信網であっても、公衆通信網であってもよいが、高信頼性とセキュリティとを備えた専用通信を提供できるIP−VPN(Internet Protocol−Virtual Private Network)のような網であってもよい。また、端末2〜4としては、ノート型パーソナルコンピュータあるいはデスクトップ型パーソナルコンピュータでもよく、携帯電話端末やPDA(Personal Data Assistant)などでもよい。また、サーバ5は、ブログプロバイダやISP(Information Service Provider)上に設置することができ、サーバ5としては、例えば、ブログの更新情報を収集して提供するpingサーバを用いることができる。
そして、クラスCiに所属するインスタンスIi以外のインスタンスIkやクラスCiの記述がそのユーザの蓄積するエントリのいずれかにある場合、エントリEiはクラスCiに所属するインスタンスIiを話題にするエントリとしてパーソナルオントロジに分類し、クラスCiに所属するインスタンスIi以外のインスタンスIkやクラスCiの記述がそのユーザの蓄積するエントリのいずれにもない場合、そのエントリEiがパーソナルオントロジに分類されないようにすることができる。
そして、クラスCiに所属するインスタンスIi以外のインスタンスIkやクラスCiの記述が同一エントリEi内にある場合、エントリEiはクラスCiに所属するインスタンスIiを話題にするエントリとしてパーソナルオントロジに分類し、クラスCiに所属するインスタンスIi以外のインスタンスIkやクラスCiの記述が同一エントリEiない場合、エントリEiがパーソナルオントロジに分類されないようにすることができる。
そして、このブログラムをCD−ROMなどの記憶媒体に記憶しておけば、サーバ5のコンピュータに記憶媒体を装着し、そのブログラムをコンピュータにインストールすることにより、頻出単語抽出手段5a、分類子適用手段5b、パーソナルオントロジ抽出手段5cおよびフィルタリング手段5dで行われる処理を実現することができる。また、このブログラムを通信網1を介してダウンロードすることにより、このブログラムを容易に普及させることができる。
図2において、pingサーバなどを通じ、ユーザA、B、・・・、Xのエントリ集合をそれぞれ収集し、これらの収集した全てのブログエントリに対して形態素解析を行うことにより、インデックスを作成する(ステップS1)。
次に、pingサーバにて収集された全てのブログエントリを雛形オントロジOHに対して分類する(ステップS2)。ここで、ブログエントリの分類方法としては、雛形オントロジOHのあるクラスCiの名前属性があるエントリ内の記述にあれば、そのエントリをクラスCiに分類することができる。また、雛形オントロジOHのあるクラスCiに所属するインスタンスIi(∈Ci)の名前属性があるエントリ内の記述にあれば、そのエントリをクラスCiに所属するインスタンスIiに分類することができる。なお、同一のエントリが複数のクラスに分類されてもよい。
次に、雛形オントロジOHを形成する最下層クラスClの持つ各インスタンスに興味を持つユーザA、B、・・・、Xの数を計測する(ステップS3)。なお、クラスClのインスタンスに興味を持つユーザA、B、・・・、Xの数を計測する場合、同一のユーザが複数のエントリにおいてインスタンスIlを記述している場合においても、ユーザ数は1と計測する。
ここで、pingサーバにて収集された全てのブログエントリを雛形オントロジOHに対して分類する場合、オントロジの持つ同一クラスに所属するインスタンスは同一の性質を持つという特性と、クラス階層の近いクラス間の性質は近く、両者のインスタンス間の性質も近いという特性を用いることにより、分類の誤りを除去することができる。
図3において、雛形オントロジOHのクラス“Madchester”に所属するインスタンス“Farm”に対する記述が、あるユーザのエントリEi内に存在し、そのユーザの全ての蓄積エントリ内に、例えば、雛形オントロジOHのクラス“Madchester”に所属する“Milltown Brothers”の記述がある場合、エントリEiは、クラス“Madchester”に所属するインスタンス“Farm”に関するエントリとして分類することができる。
図4において、各ユーザA、BのブログエントリPA、PBを雛形オントロジに対してそれぞれ分類することにより、各ユーザA、Bの興味オントロジKA、KBがそれぞれ生成されたものとする(ステップS11)。そして、各ユーザA、Bの興味オントロジKA、KB間の近似度を計測し(ステップS12)、近似度の高い興味オントロジKA、KB間で共起するクラスやインスタンスを分析することで、トポロジが異なるにも関わらず興味を持つ可能性が高い情報を他のユーザのエントリを介して意外な情報としてユーザに推奨することができる(ステップS13)。
また、このような興味オントロジKA、KBをブログに適用することで、単純なキーワード検索ではなく、興味オントロジKA、KB間の近似度に基づく意外なエントリ推薦によるコミュニティの形成を支援することができ、ユーザの興味を自然に広げることができる(ステップS14)。
図5において、雛形オントロジの設計者は、どのドメインについて雛形オントロジを生成するかを選択する。そして、そのドメインにおいて、ユーザの興味を反映するメタデータを選択する。なお、選択材料としては、掲示板などの既存のコミュニティの傾向を分析することができる。例えば、音楽ドメインは、タイトル、レーベル、ジャンル、アーチスト、製作国などでコミュニティが生成されていることを考慮すると、それらのメタデータがユーザの嗜好を反映するものとして選択することができる。
2〜4 端末
5 サーバ
5a 頻出単語抽出手段
5b 分類子適用手段
5c パーソナルオントロジ抽出手段
5d フィルタリング手段
6 雛形オントロジ
7〜9 ブログサイト
7a〜7n、8a〜8n、9a〜9n ブログエントリ
Claims (4)
- ブログエントリに含まれる単語を抽出する単語抽出手段と、
予め設定された単語が概念階層化されてなる雛形オントロジから前記単語抽出手段で抽出された単語を含むクラスまたはインスタンスを抽出する分類子適用手段と、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、ユーザの興味情報を表すパーソナルオントロジとして前記雛形オントロジから抽出するパーソナルオントロジ抽出手段と、
前記パーソナルオントロジ抽出手段で抽出されるパーソナルオントロジをフィルタリングするフィルタリング手段と、を備え、
当該フィルタリング手段は、前記単語抽出手段で抽出された単語が所属するクラスと同一クラスまたは近隣クラスに所属するインスタンス、または前記近隣クラスの記述が同一ユーザのブログエントリ内に存在するときにのみ、前記単語が前記パーソナルオントロジに含まれるようにフィルタリングすることを特徴とする興味情報生成装置。 - ユーザ数計測手段を有し、
前記分類子適用手段は、前記雛形オントロジのクラスまたは前記クラスに所属するインスタンスの記述に対応する単語を含んでいる前記ブログエントリを、前記雛形オントロジのクラスまたは前記クラスに所属するインスタンスに分類し、前記ブログエントリのユーザ毎に、当該ユーザのブログエントリが分類されている前記雛形オントロジのクラスまたは前記クラスに所属するインスタンスを抽出し、
前記ユーザ数計測手段は、前記分類子適用手段で抽出された前記雛形オントロジのクラスまたは前記クラスに所属するインスタンスごとに、当該クラスまたはインスタンスの記述に対応する単語を前記ブログエントリに含むユーザ数を計測することを特徴とする請求項1記載の興味情報生成装置。 - ブログエントリに含まれる単語が概念階層化されてなるパーソナルオントロジを興味情報として生成する興味情報生成装置が実行する興味情報生成方法であって、
前記ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、
予め設定された単語が概念階層化されてなる雛形オントロジを選択するステップと、
前記雛形オントロジから、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを抽出するステップと、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、ユーザの興味情報を表すパーソナルオントロジとして前記雛形オントロジから抽出するステップと、
前記ブログエントリから抽出された単語が所属するクラスと同一クラスまたは近隣クラスに所属するインスタンス、または前記近隣クラスの記述が同一ユーザのブログエントリ内に存在するときにのみ、前記単語が前記パーソナルオントロジに含まれるように前記パーソナルオントロジをフィルタリングするステップと、を備えることを特徴とする興味情報生成方法。 - ブログエントリに対して形態素解析を適用することにより、前記ブログエントリに含まれる単語を抽出するステップと、
予め設定された単語が概念階層化されてなる雛形オントロジを選択するステップと、
前記雛形オントロジから、前記ブログエントリから抽出された単語を含むクラスまたはインスタンスを抽出するステップと、
前記抽出されたクラスまたはインスタンスおよびそれらの上位のクラスを含む階層構造を、ユーザの興味情報を表すパーソナルオントロジとして前記雛形オントロジから抽出するステップと、
前記ブログエントリから抽出された単語が所属するクラスと同一クラスまたは近隣クラスに所属するインスタンス、または前記近隣クラスの記述が同一ユーザのブログエントリ内に存在するときにのみ、前記単語が前記パーソナルオントロジに含まれるように前記パーソナルオントロジをフィルタリングするステップと、をコンピュータに実行させることを特徴とする興味情報生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006045903A JP4580351B2 (ja) | 2006-02-22 | 2006-02-22 | 興味情報生成装置、興味情報生成方法および興味情報生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006045903A JP4580351B2 (ja) | 2006-02-22 | 2006-02-22 | 興味情報生成装置、興味情報生成方法および興味情報生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007226467A JP2007226467A (ja) | 2007-09-06 |
JP4580351B2 true JP4580351B2 (ja) | 2010-11-10 |
Family
ID=38548240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006045903A Active JP4580351B2 (ja) | 2006-02-22 | 2006-02-22 | 興味情報生成装置、興味情報生成方法および興味情報生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4580351B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8073682B2 (en) * | 2007-10-12 | 2011-12-06 | Palo Alto Research Center Incorporated | System and method for prospecting digital information |
CN103389979B (zh) * | 2012-05-08 | 2018-10-12 | 深圳市世纪光速信息技术有限公司 | 在输入法中推荐分类词库的系统、装置及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000057090A (ja) * | 1998-08-12 | 2000-02-25 | Nippon Telegr & Teleph Corp <Ntt> | 他者グループ嗜好情報を利用した情報提供方法及び情報提供装置、並びに、情報提供プログラムを記録した記録媒体 |
JP2004070504A (ja) * | 2002-08-02 | 2004-03-04 | Hewlett Packard Co <Hp> | 個人プロファイル情報に基づく情報検索方法及びシステム |
JP2004280280A (ja) * | 2003-03-13 | 2004-10-07 | Hitachi Ltd | 語義関連ネットワークを用いた文書検索システム |
JP2005309907A (ja) * | 2004-04-23 | 2005-11-04 | Hewlett-Packard Development Co Lp | ユーザコメントダイジェストの生成方法・装置・プログラム |
JP2005339119A (ja) * | 2004-05-26 | 2005-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報管理装置、情報管理方法および情報管理プログラム |
JP2005352874A (ja) * | 2004-06-11 | 2005-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索システム、情報検索装置、情報検索支援装置および情報検索プログラムおよび情報検索支援プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10187727A (ja) * | 1996-12-25 | 1998-07-21 | Fuji Xerox Co Ltd | 文書処理装置 |
-
2006
- 2006-02-22 JP JP2006045903A patent/JP4580351B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000057090A (ja) * | 1998-08-12 | 2000-02-25 | Nippon Telegr & Teleph Corp <Ntt> | 他者グループ嗜好情報を利用した情報提供方法及び情報提供装置、並びに、情報提供プログラムを記録した記録媒体 |
JP2004070504A (ja) * | 2002-08-02 | 2004-03-04 | Hewlett Packard Co <Hp> | 個人プロファイル情報に基づく情報検索方法及びシステム |
JP2004280280A (ja) * | 2003-03-13 | 2004-10-07 | Hitachi Ltd | 語義関連ネットワークを用いた文書検索システム |
JP2005309907A (ja) * | 2004-04-23 | 2005-11-04 | Hewlett-Packard Development Co Lp | ユーザコメントダイジェストの生成方法・装置・プログラム |
JP2005339119A (ja) * | 2004-05-26 | 2005-12-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報管理装置、情報管理方法および情報管理プログラム |
JP2005352874A (ja) * | 2004-06-11 | 2005-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索システム、情報検索装置、情報検索支援装置および情報検索プログラムおよび情報検索支援プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2007226467A (ja) | 2007-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kong et al. | Academic social networks: Modeling, analysis, mining and applications | |
Hulpus et al. | Unsupervised graph-based topic labelling using dbpedia | |
Jäschke et al. | Tag recommendations in folksonomies | |
CN103577579B (zh) | 基于用户潜在需求的资源推荐方法及系统 | |
KR20090015434A (ko) | 사용자 중심 정보탐색 방법 및 시스템 | |
Schatten et al. | An introduction to social semantic web mining & big data analytics for political attitudes and mentalities research | |
Silvello | Learning to cite framework: How to automatically construct citations for hierarchical data | |
US20160188595A1 (en) | Semantic Network Establishing System and Establishing Method Thereof | |
Nakatsuji et al. | Detecting innovative topics based on user-interest ontology | |
Fell et al. | The WASABI song corpus and knowledge graph for music lyrics analysis | |
Németh | A scoping review on the use of natural language processing in research on political polarization: trends and research prospects | |
JP4728063B2 (ja) | 興味情報生成装置、興味情報生成方法および興味情報生成プログラム | |
Cantador et al. | Semantic contextualisation of social tag-based profiles and item recommendations | |
JP4580351B2 (ja) | 興味情報生成装置、興味情報生成方法および興味情報生成プログラム | |
JP4672578B2 (ja) | 興味情報提供装置、興味情報提供方法および興味情報提供プログラム | |
JP4607830B2 (ja) | 興味情報生成装置、興味情報生成方法および興味情報生成プログラム | |
Ma et al. | API prober–a tool for analyzing web API features and clustering web APIs | |
Mora-Mcginity et al. | Musicweb: Music discovery with open linked semantic metadata | |
Coll Ardanuy et al. | Person-centric mining of historical newspaper collections | |
Jäschke et al. | Analysis of the publication sharing behaviour in BibSonomy | |
Lee et al. | Effective music searching approach based on tag combination by exploiting prototypical acoustic content | |
JP2008210335A (ja) | 意識体系構築装置、意識体系構築方法および意識体系構築プログラム | |
JP4607831B2 (ja) | オントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測プログラム | |
Benz et al. | Position Paper: Ontology Learning from Folksonomies. | |
Vassilakis et al. | Database knowledge enrichment utilizing trending topics from Twitter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080206 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090501 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090501 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100518 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100714 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100824 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100827 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4580351 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |