JP2011227633A - コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム - Google Patents
コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム Download PDFInfo
- Publication number
- JP2011227633A JP2011227633A JP2010095578A JP2010095578A JP2011227633A JP 2011227633 A JP2011227633 A JP 2011227633A JP 2010095578 A JP2010095578 A JP 2010095578A JP 2010095578 A JP2010095578 A JP 2010095578A JP 2011227633 A JP2011227633 A JP 2011227633A
- Authority
- JP
- Japan
- Prior art keywords
- content
- annotation
- relevance
- annotations
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】コンテンツ管理装置10は,A−A関連度算出部112により,コンテンツに付加されたアノテーション間の組み合わせごとにアノテーション間の関連度(A−A関連度)を算出する。次に,A−C関連度算出部113により,各アノテーションが同一コンテンツに付加された他のアノテーション群とどの程度強い関係で結ばれているかをA−A関連度から計算することにより,各アノテーションがコンテンツについてどれくらい典型的であるかを表すアノテーションとコンテンツ間の関連度(A−C関連度)を算出し,ユーザに提示する。
【選択図】図2
Description
ここで,f(ti )およびf(tj )は,タグti およびタグtj が付加された画像数,f(ti ,tj )は,f(ti )とf(tj )とが共に付加された画像数,Gは,全画像数である。
[知見1]:より多くのアノテーションにより重複して表現されている内容は,コンテンツの主要な内容である。
[知見2]:主要な内容を表現するアノテーションは,コンテンツとの関連性が高い。
例えば,同一のコンテンツaに付加されたアノテーションAとアノテーションBのA−A関連度R(A,B)の第1の実施例として,あるアノテーションが付加されたコンテンツ集合に対する別のアノテーションも付加されたコンテンツ集合の包含率により定義してもよい。このとき,A−A関連度R(A,B)は,次の式(2) で与えられる。
…式(2)
ここで,A,Bを共に含むコンテンツ数とは,アノテーション蓄積装置100において蓄積されているコンテンツ集合の中で,アノテーションAおよびアノテーションBが共に付加されたコンテンツの総数のことである。また,Bを含むコンテンツ数とは,アノテーション蓄積装置100において蓄積されているコンテンツ集合の中で,アノテーションBが付加されたコンテンツの総数のことである。
R(電車, 江ノ電) =20/25=0.8
〔A−A関連度の第2の実施例〕
A−A関連度R(A,B)の第2の実施例として,A−A関連度をアノテーションの同一コンテンツにおける共起頻度により定義してもよい。このとき,A−A関連度R(A,B)は,次の式(3) で与えられる。
={A,Bを共に含むコンテンツ数}/{AまたはBを含むコンテンツ数}…式(3)
ここで,AまたはBを共に含むコンテンツ数とは,アノテーション蓄積装置100において蓄積されているコンテンツ集合の中で,アノテーションAまたはアノテーションBが付加されたコンテンツの総数のことである。
また,別のA−A関連度R(A,B)の第3の実施例として,アノテーションの出現頻度に対するカイ二乗値により定義してもよい。このとき,A−A関連度R(A,B)は,次の式(4) で与えられる。
A−A関連度の第3の実施例に挙げた手法を用いることにより,統計情報を利用するため,各アノテーションが付加される傾向に相関性があるかどうかを反映した精度の高いA−A関連度を算出することができる。
図6に示したコンテンツにおけるアノテーション群の例では,例えば,A−C関連度の第1の実施例として,コンテンツaに対するアノテーションAのA−C関連度S(a,A)をアノテーションAと同一コンテンツに付加された他のアノテーション群とのA−A関連度の総和により定義してもよい。このとき,A−C関連度S(a,A)は,次の式(5) で与えられる。
なお,Tはコンテンツaに付加されたアノテーションA以外のアノテーション群を含む集合である。
=R(神奈川県,旅行)+R(電車,旅行)+R(江ノ電,旅行)+R(江ノ島,旅行)+R(鎌倉,旅行)
=0.1+0.3+0.01+0.01+0.03=0.45
他のアノテーションについてのA−C関連度についても,それぞれ同様に算出される。このようにして算出されたA−C関連度から,図9に示すA−A関連度テーブルでは,タグ「江ノ島」のA−C関連度が「3.7」で,最も高くなることがわかる。
A−C関連度S(a,A)の第2の実施例として,A−C関連度を他のアノテーション群とのA−A関連度の中央値により定義してもよい。このとき,A−C関連度S(a,A)は,次の式(6) で与えられる。同一コンテンツに付加されている他のアノテーションの総数をnとする。
S(a,A)=R(t′(n+1)/2 ,A)
・nが偶数の場合 …式(6)
S(a,A)=(R(t′n/2 ,A)+R(t′n/2+1 ,A))/2
ここで,t′i は同一コンテンツに付加された他の全てのアノテーションとの間のA−A関連度を小さい順に並べ替えたときにi番目となるアノテーションである。
また,別のA−C関連度S(a,A)の第3の実施例として,各アノテーションをノードとし,他のアノテーション群とのA−A関連度の比率をエッジの強さとするランダムサーファーモデル(参考文献2参照)により定義してもよい。このとき,A−C関連度S(a,A)は,以下に示す式で与えられる。
以下の式において,ti はコンテンツaに付加されたアノテーションのうち,i番目に付加されたアノテーションであり,Tj はコンテンツaに付加されたアノテーションのうちアノテーションtj 以外のアノテーションを含む集合とする。
1.Ma (i,j)を(i,j)成分とする行列Ma を定義する。
・i≠jの場合: Ma (i,j)=R(tj ,ti )/ΣR(tj ,t)
〔ただし,Σはt∈Tj の総和〕
2.Ma の固有値と固有ベクトル列の全ての組み合わせを計算し,絶対値が最大となる固有ベクトルを長さが1になるように正規化したベクトルVを求める。
3.ベクトルVのi行目の値をS(a,ti )とする。
A−C関連度を算出済みのアノテーションが付加されたコンテンツを利用することにより,ユーザがアノテーションを指定して検索を行った際における検索結果のコンテンツ集合を,指定したアノテーションとの関連が強い順に並べて提示することが可能である。これにより,検索を行ったユーザは,同じアノテーションが付けられたコンテンツ集合の中でも,アノテーションによって表現される特徴をより多く持ったコンテンツを発見し,閲覧することができるようになる。
さらに,A−C関連度を算出したアノテーションが付加されたコンテンツを利用することにより,あるコンテンツに関連する別のコンテンツを発見することが可能である。これにより,ユーザはあるコンテンツを閲覧したときに,閲覧したコンテンツに関連する別のコンテンツを推薦する情報を自動的に入手することができ,続けて関連コンテンツを閲覧することができるようになる。
20 入出力装置
100 アノテーション蓄積装置
101 コンテンツ情報管理テーブル
102 アノテーション情報管理テーブル
110 情報関連度算出部
111 コンテンツ選択部
112 A−A関連度算出部
113 A−C関連度算出部
120 A−C関連度記憶装置
121 A−C関係管理テーブル
130 コンテンツランキング部
131 コンテンツ選択部
132 アノテーション並べ替え部
133 コンテンツ並べ替え部
140 関連コンテンツ取得部
141 ベクトル作成部
142 ベクトル類似度算出部
143 関連コンテンツ提示部
Claims (8)
- コンテンツに付加されたアノテーション群を記憶し管理するコンテンツ管理装置であって,
コンテンツに付加されたアノテーション群を格納したアノテーション蓄積手段と,
指定されたコンテンツを選択し,コンテンツに付加されたアノテーション群を前記アノテーション蓄積手段から取得するコンテンツ選択手段と,
前記アノテーション群におけるアノテーション同士の関係の強さを数値で表すアノテーション間の関連度を算出するアノテーション間関連度算出手段と,
前記アノテーション間の関連度から,各アノテーションとコンテンツとの関係の強さを数値で表すアノテーションとコンテンツ間の関連度を算出するアノテーション−コンテンツ間関連度算出手段と,
算出されたアノテーションとコンテンツ間の関連度を記憶または出力するアノテーション−コンテンツ間関連度出力手段とを備える
ことを特徴とするコンテンツ管理装置。 - 前記アノテーション間関連度算出手段は,
あるアノテーションが付加されたコンテンツ集合に対する別のアノテーションも付加されたコンテンツ集合の包含率による関連度の算出手段,
または,アノテーションの同一コンテンツにおける共起頻度による関連度の算出手段,
または,アノテーションの出現頻度に対する独立性検定の値による関連度の算出手段の少なくともいずれかを備える
ことを特徴とする請求項1に記載のコンテンツ管理装置。 - 前記アノテーション−コンテンツ間関連度算出手段は,
他のアノテーション群とのアノテーション間の関連度の総和による関連度の算出手段,
または,他のアノテーション群とのアノテーション間の関連度の中央値による関連度の算出手段,
または,他のアノテーション群とのアノテーション間の関連度の比率をリンクの強さとするランダムサーファーモデルによる関連度の算出手段の少なくともいずれかを備える
ことを特徴とする請求項1または請求項2に記載のコンテンツ管理装置。 - 前記アノテーションとコンテンツ間の関連度の算出対象となったアノテーション群と前記アノテーションとコンテンツ間の関連度とをもとに,前記アノテーションとコンテンツ間の関連度が高い順もしくは低い順に並べ替えて,順序づけされたアノテーション群を出力する出力処理手段をさらに備える
ことを特徴とする請求項1,請求項2または請求項3に記載のコンテンツ管理装置。 - コンテンツに付加されたアノテーション群を記憶し管理するコンテンツ管理装置であって,
コンテンツに付加されたアノテーション群を格納したアノテーション蓄積手段と,
請求項1から請求項4までのいずれか1項に記載の,前記コンテンツ選択手段および前記アノテーション間関連度算出手段および前記アノテーション−コンテンツ間関連度算出手段によって算出されたアノテーションとコンテンツ間の関連度を記憶するアノテーション−コンテンツ間関連度記憶手段と,
前記アノテーション蓄積手段に格納された各コンテンツに付加されたアノテーション群の情報と,前記アノテーション−コンテンツ間関連度記憶手段に記憶されたアノテーションとコンテンツ間の関連度の情報とをもとに,あるコンテンツに付加されたアノテーション群の順序をアノテーションとコンテンツ間の関連度が高い順に並べ替えるアノテーション並べ替え手段と,
コンテンツ集合中の各コンテンツに付加されたアノテーション群とそれらのアノテーションとコンテンツ間の関連度とをもとに,コンテンツ集合の順序を並べ替えるコンテンツ並べ替え手段とを備える
ことを特徴とするコンテンツ管理装置。 - コンテンツに付加されたアノテーション群を記憶し管理するコンテンツ管理装置であって,
コンテンツに付加されたアノテーション群を格納したアノテーション蓄積手段と,
請求項1から請求項4までのいずれか1項に記載の,前記コンテンツ選択手段および前記アノテーション間関連度算出手段および前記アノテーション−コンテンツ間関連度算出手段によって算出されたアノテーションとコンテンツ間の関連度を記憶するアノテーション−コンテンツ間関連度記憶手段と,
前記アノテーション蓄積手段に格納された各コンテンツに付加されたアノテーション群のアノテーションとコンテンツ間の関連度を値とするアノテーションとコンテンツ間の関連度ベクトルを作成するベクトル作成手段と,
コンテンツごとに作成した前記アノテーションとコンテンツ間の関連度ベクトル同士の類似度を算出するベクトル類似度算出手段と,
算出したアノテーションとコンテンツ間の関連度ベクトル同士の類似度の情報をもとに,あるコンテンツに関連する他のコンテンツを取得して提示する関連コンテンツ提示手段とを備える
ことを特徴とするコンテンツ管理装置。 - コンテンツに付加されたアノテーション群を格納したアノテーション蓄積手段を備えるコンテンツ管理装置が実行する情報関連度算出方法であって,
指定されたコンテンツを選択し,コンテンツに付加されたアノテーション群を前記アノテーション蓄積手段から取得するコンテンツ選択ステップと,
前記アノテーション群におけるアノテーション同士の関係の強さを数値で表すアノテーション間の関連度を算出するアノテーション間関連度算出ステップと,
前記アノテーション間の関連度から,各アノテーションとコンテンツとの関係の強さを数値で表すアノテーションとコンテンツ間の関連度を算出するアノテーション−コンテンツ間関連度算出ステップと,
算出されたアノテーションとコンテンツ間の関連度を記憶または出力するアノテーション−コンテンツ間関連度出力ステップとを実行する
ことを特徴とする情報関連度算出方法。 - 請求項7に記載の情報関連度算出方法を,コンピュータに実行させるための情報関連度算出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010095578A JP5234836B2 (ja) | 2010-04-19 | 2010-04-19 | コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010095578A JP5234836B2 (ja) | 2010-04-19 | 2010-04-19 | コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011227633A true JP2011227633A (ja) | 2011-11-10 |
JP5234836B2 JP5234836B2 (ja) | 2013-07-10 |
Family
ID=45042916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010095578A Active JP5234836B2 (ja) | 2010-04-19 | 2010-04-19 | コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5234836B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014038519A (ja) * | 2012-08-17 | 2014-02-27 | Dainippon Printing Co Ltd | サーバ装置、プログラム及び通信システム |
JP2014149689A (ja) * | 2013-02-01 | 2014-08-21 | Toshiba Corp | レポート作成支援システム及びレポート作成支援プログラム |
US9286360B2 (en) | 2012-09-28 | 2016-03-15 | Melco Holdings Inc. | Information processing system, information processing device, information processing method, and computer readable recording medium |
JP7433374B2 (ja) | 2019-03-22 | 2024-02-19 | 株式会社日立製作所 | ストレージシステム、及び、記憶コスト適正化方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006048286A (ja) * | 2004-08-03 | 2006-02-16 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP2009503751A (ja) * | 2005-08-03 | 2009-01-29 | ウィンク テクノロジ−ズ インコ−ポレイテッド | 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム |
JP2009217367A (ja) * | 2008-03-07 | 2009-09-24 | Fujifilm Corp | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム |
-
2010
- 2010-04-19 JP JP2010095578A patent/JP5234836B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006048286A (ja) * | 2004-08-03 | 2006-02-16 | Sony Corp | 情報処理装置および方法、並びにプログラム |
JP2009503751A (ja) * | 2005-08-03 | 2009-01-29 | ウィンク テクノロジ−ズ インコ−ポレイテッド | 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム |
JP2009217367A (ja) * | 2008-03-07 | 2009-09-24 | Fujifilm Corp | 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014038519A (ja) * | 2012-08-17 | 2014-02-27 | Dainippon Printing Co Ltd | サーバ装置、プログラム及び通信システム |
US9286360B2 (en) | 2012-09-28 | 2016-03-15 | Melco Holdings Inc. | Information processing system, information processing device, information processing method, and computer readable recording medium |
JP2014149689A (ja) * | 2013-02-01 | 2014-08-21 | Toshiba Corp | レポート作成支援システム及びレポート作成支援プログラム |
JP7433374B2 (ja) | 2019-03-22 | 2024-02-19 | 株式会社日立製作所 | ストレージシステム、及び、記憶コスト適正化方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5234836B2 (ja) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI524193B (zh) | 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法 | |
US8868558B2 (en) | Quote-based search | |
US8131734B2 (en) | Image based annotation and metadata generation system with experience based learning | |
US8046368B2 (en) | Document retrieval system and document retrieval method | |
US20150213027A1 (en) | Objective and subjective ranking of comments | |
US20070055657A1 (en) | System for generating and managing context information | |
EP3048540A1 (en) | Picture ordering method and device | |
US8392429B1 (en) | Informational book query | |
US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
CN106095738B (zh) | 推荐表单片段 | |
US20100106732A1 (en) | Identifying Visually Similar Objects | |
US20180144059A1 (en) | Animated snippets for search results | |
US20160283564A1 (en) | Predictive visual search enginge | |
JPWO2016135905A1 (ja) | 情報処理システム及び情報処理方法 | |
CN107870915B (zh) | 对搜索结果的指示 | |
JP2010224622A (ja) | タグ付与方法およびタグ付与プログラム | |
US20080147631A1 (en) | Method and system for collecting and retrieving information from web sites | |
JP5234836B2 (ja) | コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム | |
JPWO2010013472A1 (ja) | データ分類システム、データ分類方法、及びデータ分類プログラム | |
US20140095465A1 (en) | Method and apparatus for determining rank of web pages based upon past content portion selections | |
WO2013080493A1 (en) | Contextual search for modeling notations | |
US20140149378A1 (en) | Method and apparatus for determining rank of web pages based upon past content portion selections | |
JP6727097B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP2007233752A (ja) | 検索装置、コンピュータプログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110921 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130321 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5234836 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |