JP2009086859A - コンテンツ表示装置、コンテンツ表示方法、プログラムおよび記録媒体 - Google Patents

コンテンツ表示装置、コンテンツ表示方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2009086859A
JP2009086859A JP2007253753A JP2007253753A JP2009086859A JP 2009086859 A JP2009086859 A JP 2009086859A JP 2007253753 A JP2007253753 A JP 2007253753A JP 2007253753 A JP2007253753 A JP 2007253753A JP 2009086859 A JP2009086859 A JP 2009086859A
Authority
JP
Japan
Prior art keywords
tag
content
map
coordinates
tag map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007253753A
Other languages
English (en)
Other versions
JP4979528B2 (ja
Inventor
Takashi Fujimura
考 藤村
Shigeru Fujimura
滋 藤村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007253753A priority Critical patent/JP4979528B2/ja
Publication of JP2009086859A publication Critical patent/JP2009086859A/ja
Application granted granted Critical
Publication of JP4979528B2 publication Critical patent/JP4979528B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】タグマップ上の位置を、ユーザがマウス等によって指定するだけで、特定のジャンルの検索結果を優先的に表示することができるコンテンツ表示装置を提供することを目的とする。
【解決手段】検索結果等の膨大なコンテンツ集合を、コンテンツに含まれているテキスト中の単語の頻度等の統計的な分析に基づいて、自動的にジャンル分類し、タグマップと呼ぶ類似するタグを、二次元平面上に配置した画像を表示し、タグマップ上の位置をユーザがマウス等によって指定させるコンテンツ表示装置である。
【選択図】図1

Description

本発明は、キーワード検索における検索結果や、RSSで配信されるフィード情報等のテキストを含むコンテンツ集合を分類し、提示するコンテンツ表示装置および方法に係る。特に、互いに概念的に関連するタグを、二次元空間上に互いに近くに配置したタグマップと連動して、コンテンツを表示させ、タグマップ上の表示位置に関連する情報を優先的に表示することによって、コンテンツ集合から、特定のジャンルに属するコンテンツのみを絞り込んで表示するコンテンツ表示装置および方法に関する。
インターネット上の情報量の増加と、検索エンジンの技術の進歩とに伴い、インターネットから、膨大な量の情報を取得することができる。キーワード検索における検索結果が膨大になる一方、利用者が内容を確認するのは、検索結果の上位20件程度であると言われ、目的の結果に辿り着くことは、ますます困難になりつつある。このような状況で、利用者は、より検索内容を限定するクエリを与える。このように、より検索内容を限定するクエリを考えるための負担は、ますます増大している。
近年、これらの利用者側の負担を少しでも軽減させるために、次の第1〜3の従来方法が開発された。第1の従来方法は、検索結果に含まれている単語の頻度の統計的な分析に応じて、検索結果の絞り込みのヒントになる語をいくつか提示し、利用者が、それらをマウス等によって選択することによって、この選択された語と検索キーワードとのAND検索を行い、これによって、より適切な検索結果を提示する方法である(たとえば、特許文献1参照)。
第2の従来方法は、Google(登録商標)社の検索エンジンで使われているGoogle(登録商標)suggestのように、利用者が過去に検索した多数のクエリの履歴を分析し、入力した語の一部が一致する別のクエリの候補を、利用者が、履歴から抽出し、提示し、利用者に、その中から選択させることによって検索する方法である。この第2の従来方法によれば、クエリ入力の手間を軽減し、また、より絞り込んだ適切なクエリを与えることを支援し、より適切な検索結果を取得することができる。
第3の従来方法は、多数の検索語を自然文等で与え、概念的に関連性の高い検索結果を検索する潜在的意味インデキシングまたは概念検索と呼ばれる方法等である(たとえば、「北研二 他,情報検索アルゴリズム、共立出版,ISBN 4320120361, 2002」(非特許文献1)の4.5節)。
特開2005−339139号公報 北研二 他,情報検索アルゴリズム、共立出版,ISBN 4320120361, 2002
しかし、利用者が検索結果の絞り込みのヒントとなる語を提示する上記第1、2の従来方法では、そもそも利用者に提示したいくつかの語やクエリの候補から、適切なものを選択する作業を避けることができないという問題がある。
また、そもそも、絞り込みのヒントとして提示された語そのものを、利用者が知らなければ、どのクエリを選択すればよいかを適切に判断することができないという問題がある。
また、上記第3の従来方法では、概念を正確に表すためには、クエリとして多数の語を与える必要があり、利用者にとって、クエリ入力の負担が大きいという問題がある。
特に、携帯電話やゲーム機のようにキーボードがないデバイスにおいて、文章または複数のクエリを入力することが困難であるという問題がある。
本発明は、タグマップ上の位置を、ユーザがマウス等によって指定するだけで、特定のジャンルの検索結果を優先的に表示することができるコンテンツ表示装置を提供することを目的とする。
本発明は、テキストを含むコンテンツの集合を、テキストに含まれている単語の統計情報に基づいて分類し、利用者が求めるコンテンツの選択を支援するコンテンツ表示装置において、分類のキーワードであるタグが付与されている学習用文書集合の統計情報に基づいて、タグ同士の類似度を測定し、記憶装置に記憶するタグ間類似度算出手段と、上記タグ間類似度が高いタグ同士が、互いに近くに配置されるように、二次元平面上の座標であるタグ座標を算出し、記憶装置に記憶するタグ座標算出手段と、上記タグ座標に、上記タグが配置されているタグマップを生成し、記憶装置に記憶するタグマップ生成手段と、上記コンテンツの集合を取得するコンテンツ集合取得手段と、上記コンテンツ集合の中に含まれている各コンテンツについて、上記コンテンツに含まれているテキストの統計情報と、上記タグ統計情報との類似度に基づいて、上記コンテンツに対応するタグを与えるオートタギング手段と、上記コンテンツを、タグまたはタグマップ上の座標に関連付けて記憶装置に記憶するコンテンツ登録手段と、上記タグマップを利用者端末に表示するタグマップ表示手段と、上記タグマップ上に配置されているタグを選択するタグ選択手段と、上記タグ選択手段を介して選択されたタグまたはタグマップ上の座標に関連付けられているコンテンツを、利用者端末に表示するコンテンツ表示手段とを有するコンテンツ表示装置である。
本発明によれば、タグマップ上の位置を、ユーザがマウス等によって指定するだけで、特定のジャンルの検索結果を優先的に表示することができるという効果を奏する。
発明を実施するための最良の形態は、以下の実施例である。
図1は、本発明の実施例1であるコンテンツ表示装置100の全体の構成を示す図である。
また、実施例1におけるコンテンツは、インターネット上のWebぺ一ジ、検索結果集合、RSS等のフィード情報、画像、音声、動画のディジタルコンテンツ、および、商品、サービス等タグが付与できる現実空間のオブジェクトも含む。ただし、コンテンツが概念的にどのジャンルに属するかを判定するために、これらのコンテンツには、テキスト情報が含まれていることが必要である。
コンテンツ表示装置100は、所定のプログラムに基づいて動作する一般的なコンピュータ装置によって構成され、テキストを含むコンテンツの集合を、テキストに含まれている単語の出現頻度等の統計情報に基づいて分類し、利用者が求めるコンテンツの選択を支援するコンテンツ表示装置である。
また、コンテンツ表示装置100は、タグ間類似度算出手段10と、タグ座標算出手段20と、タグマップ生成手段30と、コンテンツ集合取得手段40と、オートタギング手段50と、コンテンツ登録手段60と、タグマップ表示手段70と、タグ選択手段80と、コンテンツ表示手段90とを有する。
タグ間類似度算出手段10は、分類のキーワードであるタグが付与されている学習用文書集合11の統計情報に基づいて、タグ同士の類似度を測定し、記憶装置に記憶する。つまり、タグ間類似度算出手段10は、タグが付与されている学習用文書集合11から、タグが付与されているコンテンツに含まれている単語の頻度情報(タグ統計情報)に基づいて、タグの特徴ベクトルを生成し、タグの特徴ベクトルの類似度に基づいて、タグ間類似度を算出する。
タグ座標算出手段20は、上記タグ間類似度が高いタグ同士が、互いに近くに配置されるように、二次元平面上の座標であるタグ座標を算出し、記憶装置に記憶する。つまり、タグ座標算出手段20は、タグをノードとし、タグ間類似度をリンクとするネットワーク情報が与えられたときに、強いリンクを持つノード同士を、二次元平面上に互いに近い位置に配置し、タグの属性を高度座標として算出する。
タグマップ生成手段30は、上記タグ座標に、上記タグが配置されているタグマップを生成し、記憶装置に記憶する。つまり、タグマップ生成手段30は、任意の位置に設定された(x,y,z)のデータ集合から三次元の地表モデルを作成し、斜めから光を当て上部から撮影した立体感のある二次元画像をタグマップとして生成する。
コンテンツ集合取得手段40は、上記コンテンツの集合を取得する。つまり、コンテンツ集合入力手段40は、検索エンジンの検索結果や、ブログやニュース等をはじめとする様々なWebぺ一ジの更新情報が配信されるフィード情報を、コンテンツ集合として、コンテンツ表示装置100の入力として受理する。
すなわち、コンテンツ集合入力手段40は、利用者端末装置から取得したクエリを、検索エンジンに送信する検索要求手段と、検索エンジンから検索結果を取得する検索結果取得手段とを有し、上記検索結果に含まれているテキスト集合を、上記コンテンツ集合として記憶する手段である、
また、コンテンツ集合入力手段40は、利用者端末装置から取得したフィード情報配信URLで指定されるフィード情報であるRSSを取得するRSS取得手段を有し、上記フィード情報に含まれているテキストのリストを、上記コンテンツ集合として記憶する手段である。
オートタギング手段50は、上記コンテンツ集合の中に含まれている各コンテンツについて、上記コンテンツに含まれているテキストの統計情報と、上記タグ統計情報との類似度に基づいて、上記コンテンツに対応するタグを与える。つまり、オートタギング手段50は、コンテンツ集合の各コンテンツに概念的に内容をよく表すタグを、自動的に付与する。
コンテンツ登録手段60は、上記コンテンツを、タグまたはタグマップ上の座標に関連付けて記憶装置に記憶する。つまり、コンテンツ登録手段60は、コンテンツ集合の各コンテンツを、タグマップ上のタグまたは座標に関連付けて、記憶装置に記憶する。
タグマップ表示手段70は、上記タグマップを利用者端末に表示する。つまり、タグマップ表示手段70は、タグマップ生成手段30が生成したタグマップを、利用者端末装置に表示する。タグマップ表示手段70は、ある特定のタグをURLで指定し、そのタグを中心とする近傍のタグマップを常に表示することによって、あるタグの地図を常に表示することもでき、タグマップの表示を上下左右にスクロール可能なスクローラブルマップとして実現することもできる。
タグ選択手段80は、上記タグマップ上に配置されているタグを選択する。つまり、タグ選択手段80は、利用者端末装置によってタグマップ上のマウス等の位置を取得し、利用者によって指定されたタグを取得する。タグ選択手段80は、単純にタグマップ上のタグをマウス等によってクリックすることによって実現してもよく、タグマップを、上下左右にスクロール可能なスクローラブルマップとして実現し、ドラッグ等移動させたタグマップの位置の変化を取得し、タグマップの中心付近の座標を取得するマーカ座標取得手段と、マーカ座標取得手段によって取得したタグマップの中心付近のタグを選択されたタグとして実現してもよい。
すなわち、上記タグ選択手段80は、マーカ座標取得手段と、近傍タグ取得手段とを有する。上記マーカ座標取得手段は、マウス操作によって上記タグマップを上下左右にスクロールするスクローラブルな画像として実現し、タグマップの中心の位置を、マーカ座標として取得する。上記近傍タグ取得手段は、上記タグマップ上に配置されているタグの中から、上記マーカ座標の近傍に存在するタグを取得する。
上記実施例では、スクローラブルマップについて詳しく記載するが、必ずしもスクローラブルマップによって実現しなくてもよい。
コンテンツ表示手段90は、上記タグ選択手段80を介して選択されたタグまたはタグマップ上の座標に関連付けられているコンテンツを、利用者端末に表示する。コンテンツ表示手段90は、上記近傍タグとコンテンツとの関連度に応じてコンテンツを、他のコンテンツよりも、優先的に表示する手段である。
次に、実施例1の動作について説明する。
図2は、実施例1において、タグマップを生成する処理を示すフローチャートである。
図2に示すタグマップを生成する処理は、毎日1回または週1回等の頻度で、一定間隔で繰り返し実行する。応用によっては月1回または年1回位の頻度で更新してもよい。
図3は、実施例1における学習用文書集合11の例を示す図である。
タグ間類似度算出手段10は、図3に示すように、タグが付与された学習用文書の集合11から、タグが付与されている文書に含まれている単語の頻度情報(タグ統計情報)に基づいて、タグの特徴ベクトルを生成し、タグの特徴ベクトルの類似度から、タグ間類似度を算出する。
タグが付与された学習用文書集合11の例としては、たとえば、del.icio.us等のソーシャルブックマークサービスのように、利用者がWebぺ一ジをブックマーク登録する際に、タグを付与したブックマーク情報がある。また、ブログ記事ではRSSの<dc:subject>フィールドにおいて、キーワードを指定するので、このようなRSSが与えられているブログ記事も、タグが付与された学習用文書集合11である。
学習用文書集合11は、図3に示すように、文書ID、タグ、本文等を文書単位に関連付けを行った形でデータとして保持している。文書IDは、文書毎にユニークに与えられている識別子である。タグは、文書作成者によって設定された本文の内容を端的に表している語句である。本文は、文書のテキストそのものである。また、図3に示すように、URLや登録日時、タイトル等、付加的な情報を加え、データを保持するようにしてもよい。
図4は、実施例1におけるタグ統計情報12の例を示す図である。
タグ間類似度算出手段10は、図4に示すタグ統計情報12を取得する。学習用文書集合11から、タグ毎に本文の単語の出現頻度を集計し、タグID、タグ、文書数、タグ特徴ベクトル、類似タグをタグ毎に関連付けしたデータとして保持している。
タグIDは、タグ毎にユニークに与えられる識別子である。文書数は、学習文書集合中でそのタグが設定された文書の数である。タグ特徴ベクトルは、タグが付与された文書に特徴的に出現する単語のスコアのベクトルであり、ある実数値の集合によるリスト型のデータである。タグ特徴ベクトルを生成する場合、単純にタグが付与された文書に多く出現する単語の頻度を用いてもよいが、より内容を反映した特徴的なベクトルを得る方法もあり、これについては以下で述べる。
類似タグは、上記タグ特徴ベクトルを利用し、ベクトル間のコサイン類似度を算出することによって、タグ間の類似度を計算し、類似度の高いものを、特定の閾値に至るまで、降順に並べたものであり、数値の対の集合によるリスト型のデータである。たとえば、Ci、Cjをタグの特徴ベクトルとすると、類似度は、次の式(1)で求めることができる。
Similarity=C・C/|C||C| … 式(1)
タグの特徴がより表現されたタグ特徴ベクトルを生成する場合、そのタグが設定された文書集合11に記憶されている文書中の語句と、その残差DF値との対を要素とする語句ベクトルを用いる(「藤村滋,藤村考,片岡良治,奥雅博,Blogのタグ間類似度のスコアリング,日本データベース学会Letterrs,Vol.15, No.4, pp.33-36, 2006」参照)。
上記残差DF値は、語句の文書集合中での文書頻度とポアソン分布とによって推定されたその文書集合中での文書頻度の差によって表される。たとえば、検索結果の文書集合の総数を、nとし、文書集合中の語句iの文書頻度を、dfとし、全文書数を、Nとし、全文書中での語句iの大域的頻度を、Fとすると、残差DF値は、以下の式(2)によって求められる。
Figure 2009086859
一例として、「サッカー」というタグが付与されたブログ記事集合中の語句「Jリーグ」の残差DF値は、収集したブログエントリ数を400000とし、「サッカー」というタグが付与されたブログエントリ数を1000とし、この記事集合中での「Jリーグ」の文書頻度を300とし、収集したブログ記事全体での「Jリーグ」の大域的頻度を700とすると、残差DFは、300−1000(1−exp(−700/400000))=298.25…である。
上記残差DF値は、次の仮定に基づいた指標である。同一のタグが付与されている文書集合は、内容的にも、用いられている語句的にも、似ている可能性が高いので、文書の内容を代表する特徴語の文書頻度は大きい。一方、文意に関係がなく、どのような文書にも現れる一般的な語句の文書中での出現回数の確率分布は、ポアソン分布によって、よく近似されることが知られている。したがって、両者の差分を取ることによって、一般語の影響を打ち消し、特徴語の値をより際立たせることができる。
タグ座標算出手段20は、タグ間類似度算出手段10が算出したタグ毎の類似タグリストを利用して、互いに類似度の高いタグ同士が、二次元平面上に近くになる各タグの座標(x,y)を算出する手段である。タグ座標算出手段20は、タグをノードとし、各タグiから類似タグjへのリンクをエッジとするネットワークとみなしたときに、このネットワークは、一般的なネットワークになるので、従来から提案されているネットワークの可視化技術を利用することができる。
たとえば、「特開2004−318739号公報」または「Kamada,T. and Kawai,S., An algorithm for drawing general undirected graphs, Information Processing Letters, Vol.12, No.31, pp.7-15, 1989」に記載されているアルゴリズムを利用することができる。
ただし、各タグiから、類似する全てのタグjを利用し、これらのアルゴリズムを利用すると、リンクの数が多すぎ、計算時間が膨大になるケースがある。この場合、類似するタグjを選択する閾値を高めること等によって、リンクを減らして計算するようにしてもよい。
たとえば、タグiとの間で閾値q以上の類似度を有するタグの集合を、N(i)とすると、類似度が高いリンクから降順で並べ、次の式(3)のように、k(i)本のリンクのみを考慮するようにしてもよい。
(i)=αlog(1+|N(i)|)+1 … 式(3)
これによって、強いリンクが多数存在する場合でも、類似タグ数をある程度絞ることができる。また、強いリンクが少ないケースでも、少なくとも1つのリンクをどれかに隣接させることができる。この結果、多数の弱いリンクによって、中途半端な位置にタグが配置されることを防ぐことができる。
また、ネットワーク可視化アルゴリズムが、リンクの重みを考慮できない場合、すなわち、リンクの重みが1か0しか許されない場合、上記閾値よりも大きい類似度を有するリンクを1(リンクあり)とし、それ以外を0(リンクなし)とし、リンク情報としてアルゴリズムに与えることによって、タグ座標を算出することができる。
タグ座標算出手段20は、上記(x,y)座標に加えて、高度座標であるz座標を計算する。なお、z座標は、タグマップ生成手段30において、2次元のタグマップに濃淡または着色し、タグ間の関係を分かり易く表示するために必要な座標である。ただし、このような着色は必須ではなく、必須としない場合、z座標の算出は必要ではない。
z座標の算出は、単純にタグが付与されているコンテンツの数の対数値を[0,1]の間に正規化し、利用するようにしてもよい。多くの人が付与するタグは、一般的なタグであるので、一般的なタグが標高の高い目立つ位置にあると、タグマップの話題構造を理解し易い。
また、タグが付与されているコンテンツの数が自動計数されている場合、たとえば、「阪神」の話題の記事に、「野球」、「スポーツ」等、上位の概念のタグも同時に付与されることが想定される。この結果として、概念的に上位のタグの頻度が高く、スポーツ>野球>阪神のような関係で、z座標が求められる。また、「スポーツ」等、上位の概念のタグは、類似するタグの件数も多いので、x−y平面上でも、中心に配置される可能性が高い。
図5は、実施例1におけるタグマップの表示例を示す図である。
この結果として、図5に示すように、タグの高低と位置関係とから、各タグの概念的な関係を容易に把握することができる。
z座標の別の算出方法は、上記式(3)で抽出されたリンクを、iからjへの有向グラフとみなし、このリンクから、「S.Brin and L.Page, The Anatomy of a Large-scale Hypertextual Web Search Engine, In Proceedings of 7th International World Wide Web Conference, 1998.」に記載されているPageRank(登録商標)の式、つまり、次の式(4)を利用して算出するようにしてもよい。
Figure 2009086859
ここで、dは、ランダムジャンプの確率で[0,1]の間の実数であり、たとえば0.15を用いる。IN(i)は、タグiへのリンクを持つタグの集合であり、Out(j)は、タグjから出ているリンクの重みの和である。この方法は、多くのタグに類似するタグが多くの被リンクを持つが、多くの類似するタグを持つことは、より一般的な概念を表す可能性が高い。したがって、タグの頻度と同様に、スポーツ>野球>阪神のような関係で、z座標が求められる。
z座標のさらに別の算出方法は、単純に各タグの類似度リンクの総和を利用する方法や、タグが(x,y)座標に配置されている空間において、各タグが持つ類似度リンクの長さの総和を、z座標の計算に利用する方法である。
リンクの長さの総和が大きければ、類似したタグがx−y平面上に幅広く分散していることを意味するので、各タグの類似度のリンクの長さの総和とする方法は、多くの概念に関係する概念的に広いタグである。これによって、タグの頻度やPageRank(登録商標)を用いたときと同等の効果を得ることができる。
タグマップ生成手段30は、上記座標軸算出によって取得した各タグの(x,y,z)座標の集合から、三次元立体モデルを生成し、斜めから光源を当てることによって、立体感のあるタグマップを作成する。タグマップ生成手段30は、以下の手順によって画像を生成する。
図6は、実施例1において、タグマップ表示例を示す図である。
(1)タグ座標算出手段20が生成した(x,y,z)座標の集合から、等間隔のグリッドデータを生成する。この座標は、図6に示すタグマップテーブルに記録する。
(2)グリッドデータから、三次元モデルを生成し、斜めから光を当て、陰影をつける。
(3)標高に応じて、色分けし、真上からの三次元モデルを撮影し、二次元画像を出力する。
これらの処理を、「Wessel,P., and Smith,W.H.F.., The Generic Mapping Tools, Version 4.2.0, Manual, http://www.soest.hawaii.edu/gmt/, 2007」に記載されているツールを利用することによって、容易に実現できる。このツールにおいて、(1)〜(3)の処理に対応するコマンドとして、(1)surface,(2)grdgradient,(3)grdimage等を備えている。
このようにして作られたタグマップ画像は、利用者端末に配信するための準備としてタグマップ生成手段30が生成した10000×10000ピクセル程度の巨大な背景画像を250×250ピクセル程度のタイル状に、タグマップ表示手段70が分割する。この場合1600枚に分割する。これらは、図6に示すタグマップテーブルとは別に、画像ファイル集合として、サーバ上の記憶装置に保管する。
次に、検索結果または、RSSのフィード情報等の膨大なコンテンツの集合の中から利用者が関心のあるジャンルに該当するコンテンツのみに容易に絞り込むことができるコンテンツを優先的に表示する利用者インタフェース部の実施例について説明する。
また、このときの利用者端末には、図5に示すように表示される。
図7は、実施例1において、利用者端末装置に、タグマップや検索結果を表示する利用者インタフェース処理を示すフローチャートである。
図7に示す処理は、一度起動されると、オペレータによって明示的に停止されるまで常時繰り返し実行される。
図2に示す処理と、図7に示す処理とは、互いに独立して実行される。
S11で、コンテンツ集合を取得する。利用者画面には、図5の上部に示すように、検索クエリを入力するフィールドを備え、利用者から入力されたキーワードを取得する。このクエリを、外部検索エンジンに送り、検索結果集合を取得する。外部検索エンジンとして、たとえば、ブログ検索を利用した場合、取得した検索結果集合は、図3に示す学習用文書集合11と同様のデータを取得することができる。ただし、タグのフィールドは与えられていないので、空欄である。上記取得した検索結果集合を、コンテンツ集合として、実施例1の入力とする。
検索結果以外の変形例として、たとえばRSSのフィード情報を表示する場合、利用者端末装置から、RSSのURLを取得し、この取得したURLに、HTTPリクエストを送信し、RSSを取得する。この場合でも、RSSから、図3に示す学習用文書集合11と同様のデータを取得することができる。ただし、タグのフィールドは与えられていないので、空欄である。これをコンテンツ集合とし、実施例1の入力とする。
S12で、オートタギングする。つまり、S11のコンテンツ集合取得ステップで取得したコンテンツ集合の各要素であるコンテンツに対して、オートタギング手段50がタグを付与する。オートタギングを実現する場合、いくつかの方法があり、実施例1では、タグが明示的に付与されている学習用文書集合11を学習データとし、タグが付与されていないテキストに、学習用文書集合11中の類似した文書に付与されているタグに基づいて、タグを自動的に付与する方法(「藤村滋 他,ブログ記事への自動マルチタグ付与,人工知能学会全国大会論文集,3G8-3, 2007」参照)を利用する。
S13で、コンテンツを登録する。つまり、図6に示すタグマップテーブルに示すように、コンテンツ集合の各コンテンツを、S12のオートタギングステップで取得したタグに関連づけて記録する。
S14で、タグマップを表示する。つまり、タイル上に分割されたタグマップのうちで、デフォールト位置または利用者によって指定された中心座標(以下、「マーカ座標」と呼ぶ)を含むタイルを中心とし、近傍の上下左右斜めの8つのタイルとともに、合計9つのタイル画像を端末に送付する。具体的には、上記マーカ座標を中心とする9つのタイルの内側の領域の表示するHTML文書を生成し、端末装置のWebブラウザに送付し、Webブラウザは、そのHTML文書に記載されている9つのタイルの画像を、サーバから取得して表示する。なお、「競馬」等のタグのテキストは、タグマップ生成手段30がタグマップ画像に予め埋め込むようにしてもよく、または、HTML文書にタグマップを背景画像とし、マーカ座標近傍のタグの名称を座標とともに、サーバから取得するJava(登録商標)Scriptコードを埋め込み、タグのテキストを、タグマップの上位レイヤに配置することによってタグのテキストを表示するようにしてもよい。
S15で、マーカ座標を取得する。つまり、ブラウザに送られたHTML文書には、Java(登録商標)Scriptを埋め込むことによって、利用者のドラッグ等の操作イベントを取得し、タグマップをドラッグするという直感的な操作によって、タグマップをスクロールするとともに、マーカ位置を移動できるようにしてもよい。これは、「Fuchs,t., et.al., script.aculo.us, http://script.aculo.us/」に記載されているJava(登録商標)Scriptライブラリを利用することによって、容易に実現することができる。また、マーカ位置の移動に伴い、マーカの位置を、随時サーバに送信し、上下左右斜めの9つのタイルをサーバから随時取得し、マーカの位置を中心とするタグマップを常に表示し、また、マーカの付近にあるタグが付与されている関連コンテンツをリクエストする。
S16で、タグを選択する。つまり、サーバ側では、取得したマーカ座標と、タグ座標算出手段20が生成したタグ座標の集合の各要素との間のユークリッド距離を計算することによって、マーカ座標の近傍のタグを、近い順に、K個取得する。Kは、任意の数である。
S17で、コンテンツを表示する。つまり、取得したK個のタグをキーとして、タグマップテーブルを引き、コンテンツIDを取得する。S16のステップを実行する代わりに、マーカ座標とタグマップテーブルに記録されているコンテンツの座標とを比較し、現在表示中のエリアに含まれているコンテンツIDを取得するようにしてもよい。
次に、取得したコンテンツIDをキーとして、コンテンツ集合から、そのコンテンツのタイトル、URL本文のサマリ等、検索結果の表示に必要な情報を取得する。これらを表示するためのHTML文書を生成し、利用者端末装置に送る。この結果、図5に示す検索結果表示部において、タグマップの現在の位置に、関連コンテンツを表示することができる。単純にK個のタグのOR条件検索の結果を表示するのではなく、K個のタグのうちで、マーカ座標に、より近いコンテンツが上位に来るように、優先度をつけて表示するようにしてもよい。
図8は、実施例1におけるタグマップの表示例を示す図である。
また、検索結果は、図5に示す検索結果表示部に表示する以外にも、タグマップ上に噴出しとして表現し、または、図8に示すように、タグマップ上にアイコンを表示し、この表示されているアイコンと関連づけて、検索結果表示部に検索結果を表示するようにしてもよい。また、利用者がタグマップをドラッグする等、アクションを検知した場合、Java(登録商標)Scriptによって、表示対象の検索結果を再表示する。これによって、タグマップ上の位置に追随して、関連するコンテンツを表示することができる。
なお、上記S15、S16のように、タグマップを、マウスのドラッグ等の操作によって動かすようなスクローラブルマップとして実現せずに、S15において、単に利用者のクリックによって、タグマップ上のタグを選択するようにしてもよい。この場合、マーカ座標取得手段は不要である。
なお、上記実施例は、検索結果の表示に留まらず、RSS等によって配信されるフィード情報をはじめとして、様々なコンテンツの表示に適用可能である。
上記実施例によれば、利用者は、互いに類似度の高いタグ同士が互いに近くになるように配置したタグマップ上の位置を指定するだけで、利用者が関心のあるジャンルを容易に指定することができる。したがって、検索結果集合等の膨大なコンテンツの集合の中から利用者が関心のあるジャンルに該当するコンテンツのみを容易に絞り込むことができる。
これによって、検索結果を絞り込むためのクエリを対話的に選択することによるコンテンツの絞り込み作業、または検索履歴からクエリを選択することによるコンテンツの絞り込み作業を軽減することができる。タグは、分類のための概念を表すキーワードであり、必ずしも検索結果にそのキーワードが含まれる必要がなく、検索結果や検索履歴から、検索結果を絞り込むためのクエリを提示する方法とは異なり、利用者が知らない単語が提示されることは少ない。また、先にジャンルを指定した上で、連続した複数回の検索を行うことも可能であり、この場合、タグマップ上の位置における指定は、1回だけで足りる。
また、従来の概念検索では、複数のキーワードを入力することが必要であるが、上記実施例では、タグマップ上のタグや位置をマウスでクリックするだけで概念を指定することができる。この特徴は、携帯電話やゲーム機等のキーボードのないデバイスで指定するときには、特に有利である。
上記実施例によれば、概念を指定するタグマップは、上下左右にスクロールできるスクローラブルマップとして表示されるので、画面のサイズに依存せずに、携帯電話や解像度の低いTV等でも、広い面積を持つタグマップの一部を表示できる。そして、利用者がマウス等の操作によって、タグマップをスクロールすることによって、タグマップの表示位置に連動して、関連したコンテンツを次々と自動的に表示することができる。また、コンテンツの表示は、タグマップの中心座標から近いタグをOR条件で順番に表示するので、たとえば「野球」と「阪神」等、意味的に近いタグを、利用者が、明示的に複数個指定して検索しなくて足りる。しかも、どちらを優先的に表示するかを座標位置によって簡単に指定することができる。
上記実施例によれば、所定のタグの場所に、アイコンまたはタグに対する着色によって、タグマップ上の検索結果が、地図上にどのように分布しているかを把握することができる。
さらに、上記実施例によれば、検索結果の表示に留まらず、RSSで配信されるフィード情報やニュース記事、掲示板の書き込み、テキスト付の写真や動画等、様々なコンテンツに対しても、検索結果と同様に適用可能であり、タグマップ上の位置を指定することによって、利用者が関心を持つコンテンツのみを、優先的に表示することができる。
上記実施例において、上記タグ選択手段は、マウス操作によって上記タグマップを上下左右にスクロールするスクローラブルな画像を表示し、タグマップの中心の位置を、マーカ座標として取得するマーカ座標取得手段と、上記タグマップ上に配置されているタグの中から、上記マーカ座標の近傍に存在するタグを取得する近傍タグ取得手段とを有する手段であり、上記コンテンツ表示手段は、上記近傍タグとコンテンツとの関連度に応じてコンテンツを優先的に表示する手段である。
また、上記コンテンツ集合入力手段は、利用者端末装置から取得したクエリを、検索エンジンに送信する検索要求手段と、検索エンジンから検索結果を取得する検索結果取得手段とを有し、上記検索結果に含まれているテキスト集合を、上記コンテンツ集合として記憶する手段である。
さらに、上記コンテンツ集合入力手段は、利用者端末装置から取得したフィード情報配信URLで指定されるフィード情報であるRSSを取得するRSS取得手段を有し、上記フィード情報に含まれているテキストのリストを、上記コンテンツ集合として記憶する手段である。
また、上記実施例を、方法の発明として把握することができる.つまり、上記実施例は、テキストを含むコンテンツの集合を、テキストに含まれている単語の統計情報に基づいて分類し、利用者が求めるコンテンツの選択を支援するコンテンツ表示装置の制御方法において、分類のキーワードであるタグが付与されている学習用文書集合の統計情報に基づいて、タグ同士の類似度を測定し、記憶装置に記憶するタグ間類似度算出工程と、
上記タグ間類似度が高いタグ同士が、互いに近くに配置されるように、二次元平面上の座標であるタグ座標を算出し、記憶装置に記憶するタグ座標算出工程と、上記タグ座標に、上記タグが配置されているタグマップを生成し、記憶装置に記憶するタグマップ生成工程と、上記コンテンツの集合を取得するコンテンツ集合取得工程と、上記コンテンツ集合の中に含まれている各コンテンツについて、上記コンテンツに含まれているテキストの統計情報と、上記タグ統計情報との類似度に基づいて、上記コンテンツに対応するタグを与えるオートタギング工程と、上記コンテンツを、タグまたはタグマップ上の座標に関連付けて記憶装置に記憶するコンテンツ登録工程と、上記タグマップを利用者端末に表示するタグマップ表示工程と、上記タグマップ上に配置されているタグを選択するタグ選択工程と、
上記タグ選択工程で選択されたタグまたはタグマップ上の座標に関連付けられているコンテンツを、利用者端末に表示するコンテンツ表示工程とを有するコンテンツ表示装置の制御方法の例である。
さらに、上記実施例は、上記コンテンツ表示装置をコンピュータに実現させるプログラムの例である。
しかも、上記実施例は、上記プログラムを記録したコンピュータ読み取り可能な記録媒体の例である。記録媒体としては、CD、DVD、FD、HD、光ディスク、光磁気ディスク、半導体メモリが考えられる。
本発明の実施例1であるコンテンツ表示装置100の全体の構成を示す図である。 実施例1において、タグマップを生成する処理を示すフローチャートである。 実施例1における学習用文書集合11の例を示す図である。 実施例1におけるタグ統計情報12の例を示す図である。 実施例1におけるタグマップの表示例を示す図である。 実施例1において、タグマップ表示例を示す図である。 実施例1において、利用者端末装置に、タグマップや検索結果を表示する利用者インタフェース処理を示すフローチャートである。 実施例1におけるタグマップの表示例を示す図である。
符号の説明
100…コンテンツ表示装置、
10…タグ間類似度算出手段、
11…学習用文書集合、
12…タグ統計情報、
20…タグ座標算出手段、
30…タグマップ生成手段、
31…タグマップテーブル、
40…コンテンツ集合取得手段、
41…検索/RSS取得、
50…オートタギング手段、
60…コンテンツ登録手段、
70…タグマップ表示手段、
80…タグ選択手段、
90…コンテンツ表示手段。

Claims (7)

  1. テキストを含むコンテンツの集合を、テキストに含まれている単語の統計情報に基づいて分類し、利用者が求めるコンテンツの選択を支援するコンテンツ表示装置において、
    分類のキーワードであるタグが付与されている学習用文書集合の統計情報に基づいて、タグ同士の類似度を測定し、記憶装置に記憶するタグ間類似度算出手段と;
    上記タグ間類似度が高いタグ同士が、互いに近くに配置されるように、二次元平面上の座標であるタグ座標を算出し、記憶装置に記憶するタグ座標算出手段と;
    上記タグ座標に、上記タグが配置されているタグマップを生成し、記憶装置に記憶するタグマップ生成手段と;
    上記コンテンツの集合を取得するコンテンツ集合取得手段と;
    上記コンテンツ集合の中に含まれている各コンテンツについて、上記コンテンツに含まれているテキストの統計情報と、上記タグ統計情報との類似度に基づいて、上記コンテンツに対応するタグを与えるオートタギング手段と;
    上記コンテンツを、タグまたはタグマップ上の座標に関連付けて記憶装置に記憶するコンテンツ登録手段と;
    上記タグマップを利用者端末に表示するタグマップ表示手段と;
    上記タグマップ上に配置されているタグを選択するタグ選択手段と;
    上記タグ選択手段を介して選択されたタグまたはタグマップ上の座標に関連付けられているコンテンツを、利用者端末に表示するコンテンツ表示手段と;
    を有することを特徴とするコンテンツ表示装置。
  2. 請求項1において、
    上記タグ選択手段は、
    マウス操作によって上記タグマップを上下左右にスクロールするスクローラブルな画像を表示し、タグマップの中心の位置を、マーカ座標として取得するマーカ座標取得手段と;
    上記タグマップ上に配置されているタグの中から、上記マーカ座標の近傍に存在するタグを取得する近傍タグ取得手段と;
    を有する手段であり、
    上記コンテンツ表示手段は、上記近傍タグとコンテンツとの関連度に応じてコンテンツを優先的に表示する手段であることを特徴とするコンテンツ表示装置。
  3. 請求項1または請求項2において、
    上記コンテンツ集合入力手段は、
    利用者端末装置から取得したクエリを、検索エンジンに送信する検索要求手段と;
    検索エンジンから検索結果を取得する検索結果取得手段と;
    を有し、上記検索結果に含まれているテキスト集合を、上記コンテンツ集合として記憶する手段であることを特徴とするコンテンツ表示装置。
  4. 請求項1または請求項2において、
    上記コンテンツ集合入力手段は、利用者端末装置から取得したフィード情報配信URLで指定されるフィード情報であるRSSを取得するRSS取得手段を有し、上記フィード情報に含まれているテキストのリストを、上記コンテンツ集合として記憶する手段であることを特徴とするコンテンツ表示装置。
  5. テキストを含むコンテンツの集合を、テキストに含まれている単語の統計情報に基づいて分類し、利用者が求めるコンテンツの選択を支援するコンテンツ表示装置の制御方法において、
    分類のキーワードであるタグが付与されている学習用文書集合の統計情報に基づいて、タグ同士の類似度を測定し、記憶装置に記憶するタグ間類似度算出工程と;
    上記タグ間類似度が高いタグ同士が、互いに近くに配置されるように、二次元平面上の座標であるタグ座標を算出し、記憶装置に記憶するタグ座標算出工程と;
    上記タグ座標に、上記タグが配置されているタグマップを生成し、記憶装置に記憶するタグマップ生成工程と;
    上記コンテンツの集合を取得するコンテンツ集合取得工程と;
    上記コンテンツ集合の中に含まれている各コンテンツについて、上記コンテンツに含まれているテキストの統計情報と、上記タグ統計情報との類似度に基づいて、上記コンテンツに対応するタグを与えるオートタギング工程と;
    上記コンテンツを、タグまたはタグマップ上の座標に関連付けて記憶装置に記憶するコンテンツ登録工程と;
    上記タグマップを利用者端末に表示するタグマップ表示工程と;
    上記タグマップ上に配置されているタグを選択するタグ選択工程と;
    上記タグ選択工程で選択されたタグまたはタグマップ上の座標に関連付けられているコンテンツを、利用者端末に表示するコンテンツ表示工程と;
    を有することを特徴とするコンテンツ表示方法。
  6. 請求項1〜請求項4のいずれか1項に記載のコンテンツ表示装置をコンピュータに実現させるプログラム。
  7. 請求項6記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2007253753A 2007-09-28 2007-09-28 コンテンツ表示装置、コンテンツ表示方法、プログラムおよび記録媒体 Active JP4979528B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007253753A JP4979528B2 (ja) 2007-09-28 2007-09-28 コンテンツ表示装置、コンテンツ表示方法、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007253753A JP4979528B2 (ja) 2007-09-28 2007-09-28 コンテンツ表示装置、コンテンツ表示方法、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2009086859A true JP2009086859A (ja) 2009-04-23
JP4979528B2 JP4979528B2 (ja) 2012-07-18

Family

ID=40660230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007253753A Active JP4979528B2 (ja) 2007-09-28 2007-09-28 コンテンツ表示装置、コンテンツ表示方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP4979528B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100992524B1 (ko) 2009-03-04 2010-11-05 한국과학기술원 태그를 이용한 웹 페이지 간의 유사도 측정 방법 및 시스템
JP2011232987A (ja) * 2010-04-28 2011-11-17 Lafla Inc 管理サーバ、および情報管理プログラム
JP2014235723A (ja) * 2013-06-05 2014-12-15 日本電信電話株式会社 情報提示装置、方法、及びプログラム
JP2015018290A (ja) * 2013-06-21 2015-01-29 株式会社Ubic デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263514A (ja) * 1995-03-27 1996-10-11 Mitsubishi Electric Corp 文書の自動分類方法、および情報空間の可視化方法、ならびに情報検索システム
JP2003167914A (ja) * 2001-11-30 2003-06-13 Fujitsu Ltd マルチメディア情報検索方法、プログラム、記録媒体及びシステム
JP2003345829A (ja) * 2002-05-24 2003-12-05 Hitachi East Japan Solutions Ltd 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム
JP2005316897A (ja) * 2004-04-30 2005-11-10 Nippon Telegr & Teleph Corp <Ntt> 視覚的分類方法及び装置及びプログラム及び視覚的分類プログラムを格納した記憶媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263514A (ja) * 1995-03-27 1996-10-11 Mitsubishi Electric Corp 文書の自動分類方法、および情報空間の可視化方法、ならびに情報検索システム
JP2003167914A (ja) * 2001-11-30 2003-06-13 Fujitsu Ltd マルチメディア情報検索方法、プログラム、記録媒体及びシステム
JP2003345829A (ja) * 2002-05-24 2003-12-05 Hitachi East Japan Solutions Ltd 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム
JP2005316897A (ja) * 2004-04-30 2005-11-10 Nippon Telegr & Teleph Corp <Ntt> 視覚的分類方法及び装置及びプログラム及び視覚的分類プログラムを格納した記憶媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100992524B1 (ko) 2009-03-04 2010-11-05 한국과학기술원 태그를 이용한 웹 페이지 간의 유사도 측정 방법 및 시스템
JP2011232987A (ja) * 2010-04-28 2011-11-17 Lafla Inc 管理サーバ、および情報管理プログラム
JP2014235723A (ja) * 2013-06-05 2014-12-15 日本電信電話株式会社 情報提示装置、方法、及びプログラム
JP2015018290A (ja) * 2013-06-21 2015-01-29 株式会社Ubic デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム

Also Published As

Publication number Publication date
JP4979528B2 (ja) 2012-07-18

Similar Documents

Publication Publication Date Title
CN106372087B (zh) 一种面向信息检索的信息地图生成方法及其动态更新方法
US20180004850A1 (en) Method for inputting and processing feature word of file content
Van Zwol et al. Faceted exploration of image search results
KR102281186B1 (ko) 검색 결과에 대한 애니메이션 스니핏
US20090070321A1 (en) User search interface
US20110078140A1 (en) Method and system for user guided search navigation
CN103455487B (zh) 一种搜索词的提取方法及装置
WO2001031502A1 (fr) Dispositif et procede de classement et de rangement d&#39;informations multimedia
JP2010092476A (ja) 表示方法、システムおよび格納媒体
JP4878591B2 (ja) コンテンツ検索装置、コンテンツ検索方法、プログラムおよび記録媒体
JP2003167914A (ja) マルチメディア情報検索方法、プログラム、記録媒体及びシステム
JP5469046B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
CN102207960B (zh) 一种触控设备的搜索引擎及方法
CN104090904B (zh) 一种用于提供目标搜索结果的方法与设备
CN109952571B (zh) 基于上下文的图像搜索结果
JP2020166843A (ja) 方法、プログラム、及び演算装置
JP4955843B2 (ja) 情報検索システム、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20160335359A1 (en) Processing search queries and generating a search result page including search object related information
JP4979528B2 (ja) コンテンツ表示装置、コンテンツ表示方法、プログラムおよび記録媒体
JP2012256176A (ja) 情報提示装置
WO2015198113A1 (en) Processing search queries and generating a search result page including search object related information
JP5196569B2 (ja) コンテンツ検索装置、コンテンツ検索方法及びプログラム
CN111460259B (zh) 一种同类元素确定方法、装置、计算机设备及存储介质
WO2015198114A1 (en) Processing search queries and generating a search result page including search object information
JP2004265097A (ja) プレゼンテーション資料検索システムおよびその方法並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120413

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120417

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150427

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4979528

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350