JP4743915B2 - タグクラウドを視覚化する方法、装置およびコンピュータプログラム - Google Patents

タグクラウドを視覚化する方法、装置およびコンピュータプログラム Download PDF

Info

Publication number
JP4743915B2
JP4743915B2 JP2009147771A JP2009147771A JP4743915B2 JP 4743915 B2 JP4743915 B2 JP 4743915B2 JP 2009147771 A JP2009147771 A JP 2009147771A JP 2009147771 A JP2009147771 A JP 2009147771A JP 4743915 B2 JP4743915 B2 JP 4743915B2
Authority
JP
Japan
Prior art keywords
tag
correlation
importance
tags
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009147771A
Other languages
English (en)
Other versions
JP2010015558A (ja
Inventor
セバスティアン・ベーム
マルコ・ルター
マティアス・ヴァーグナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JP2010015558A publication Critical patent/JP2010015558A/ja
Application granted granted Critical
Publication of JP4743915B2 publication Critical patent/JP4743915B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes

Description

本発明はタグクラウド(tag cloud)を視覚化する方法および装置に関する。
タグクラウドは、集められた複数のタグ内の各タグに(所与のデータセット内での頻度に基づいて)重要度値を割り当てることによって(構造化されていない)データを表現する一般的な方法になってきている。いわゆるタグクラウドとは、特定の順序の有無にかかわらず、多数のタグの集合体と見なすことができる。例えば、クラウド内のタグはアルファベット順に並べられていることが多い。タグの重要度は各々のタグに用いられるフォントサイズによって示されるので、あるタグについて、重要度が低いほど小さいフォントサイズで示される。なお、タグは、特定の情報片を参照するキーワードであるから、シンプルな分類や類別が可能となる。以下の記載中、「タグ」という用語は、クラウド構成内に示すことができ且つ基本的にまず見ることができない数個の属性によって限定することもできる、いずれか1個の情報に対する包括的用語として用いられる。今日、タグクラウドの主用途は、後から参照できるように特定のキーワードで予めマーキング(タグ付け)された人気の高いデータ項目を探すこと、および、大きなデータセット内の人気の高いデータ項目をそのデータセット内での頻度に基づいて表示すること、である。それぞれのタグに用いられるフォントサイズによってタグの重要度が示される従来のタグクラウドの例が図1に示されている。
その人気の高さにもかかわらず、タグクラウドは、視覚化できるメタデータ(実際の情報に関する記述)の量に関してにかなり限定されており、表現されたデータセット内をナビゲートする限られた手段であるに過ぎない。一般的なタグクラウド視覚化技術の大きな欠点の1つは、特定の瞬間の所与のデータセットのスナップショットしか表示できないため、データセットの最新サンプルしか表現できないことである。その結果、現在のタグクラウド視覚化では、ある時間にわたる1つまたは複数のタグの重要度に関して一定の結論を引き出すことができない。このように、特定の瞬間の人気の高い項目しか強調表示できないので、動的で履歴的な情報表現へのタグクラウドの応用性は限られている。これまで、ある時間にわたるデータセット内の重要度および相関分布が考慮されたことはなかった。
非構造化情報の視覚化および表現に主として用いられるクラウド内の各タグは、同一クラウド内の他のタグとは無関係に処理および表現される。これでは、基本的な共起度(co-occurrence)測定または潜在的に更に高度な意味論的類似性を示すタグ間の単純な相関関係さえも表現することができないため、タグ間の相関関係が各シングルタグの視覚的重要度に影響を及ぼすことはない。同一クラウドのタグ間の一定の相関関係や連結性を表示する可能性が現状のタグクラウドに欠如していることは明らかである。従って、タグクラウドの範囲は、暗黙の情報を明示的に視覚化することに限定され、表現されたデータとインタラクション(interaction)するごく基本的な手段でしかない。
これまで、ある時間にわたる重要度および相関分布に基づいてデータセットの履歴サンプルをナビゲートしたり照会(query)を制限したりするために用いることもできる時間的コヒーレンスを識別することを目的として2次元(2D)タグクラウド内の複数のシングルタグまたは複数のタググループ内の時間的な重要度および相関分布を視覚化できるソリューションは、知られていない。基本的に既存のクラウド表現は、ある瞬間の所与のデータセット内のシングルタグの頻度を視覚化することに限定されている。その結果、所与のデータセット内をナビゲートするためのタグクラウド適用範囲は非常に限られている。
非特許文献1において、著者らは、「類似している」と識別されてきたクラウド構成内のタグを相対的な共起度測定値に基づいてグループ分けするクラスタリング技術を提案している。この手法は類似タグを視覚的に識別するのに役立つが、タグの重要度分布ならびにタグの相関分布に関する時間的側面は考慮されていない。また、提案された視覚化技法は、所与のデータセットのナビゲーションに関するタグクラウドの機能性を向上させるものではない。また、グループ分けアルゴリズムでは、一般的な動向(trend)、すなわちある時間にわたる相関分布ではなく、共起度測定値しか考慮されない。
非特許文献2で著者らは、クラウド内の白色スペースの量と配置を最適化することについて、既存のタグクラウド視覚化技術を向上させるためのアルゴリズムに注目している。著者らは、シングルタグの視覚的な重みおよび重要度を示すためにフォント間隔(spacing)属性を利用することも提案しているが、タグ内のスペースは一定のままであり、時間的な重要度または相関分布を符号化するものではない。共起度測定に基づいたタグのグループ分けがクラウド内に適用される。
非特許文献3には、ある時間にわたってタグを視覚化しようという試みが記載されている。著者らは動画を用いた方法を採用しているが、これが彼らの方法を静的な2次元クラウドに適用できない理由となっている。基本概念は、タイムスライダによって選択された既定の時間間隔を表現するようになっているタグ選集を提示することである。しかし、この手法は、ある時間にわたってタグを記述することではなく、(タグ選集によって)一定期間を特徴づけることに関するものである。また、タグとのインタラクションによる照会制限を実現できない。このタグ選集は、所与の時間間隔内のタグ頻度にのみ基づいている。
非特許文献4で、著者は基本的な共起度測定法を超える類似性測定法を定義している。この類似性測定では、実際のタグコントリビュータ(contributor)およびこのコントリビュータの過去のタグ選集に関する情報が考察されている。その結果、距離に基づいた類似タグの視覚化が提案されている。繰り返すが、実際のタグ視覚化についても、提案されるクラウドとのインタラクションパターンについても、ある時間にわたるタグの重要度および相関分布に関する時間的側面は考慮されない。従って、タグの時間的側面(タグの動向(trend)、すなわちある時間にわたる相関分布)に基づくタグのグループ分けは適用できない。
Yusef Hassan-Montero and Victor Herrero-Solana, "Improving Tag Clouds as Visual Information Retrieval Interfaces", International Conference on Multidisciplinary Information Sciences & Technologies, 2006 Owen Kaser and Daniel Lemire, "Tag-Cloud Drawing: Algorithms for Cloud Visualization, Tagging and Metadata for Social Information Organization", World Wide Web Conference, 2007 Micah Dubinko, Ravi Kumar and Joseph Magnani,"Visualizing Tags over Time", World Wide Web Conference, 2007 Blake Shaw, "Utilizing Folksonomy: Similarity Metadata from the Del.icio.us System", http://www.metablake.com/webfolk/web-project.pdf
本発明が解決しようとする課題は、複数の個別タグを備えるタグクラウドを視覚化する方法および装置を提供することである。
一実施形態によれば、複数の個別タグを備えるタグクラウドを視覚化する方法が提供される。ここで、各タグは特定の情報片であり、1つまたは複数の文字で形成されており、タグのメタ情報測定値ベクトルが存在するように一定時間ごとに前記タグのメタ情報の測定が行われており、前記ベクトルの各成分はある時刻のあるメタ情報測定値を表す。この方法は、
タグを複数のスライスに分割するステップと、
前記タグの各スライスが1つまたは複数の前記メタ情報測定値と対応するように、ある時間にわたる前記タグの前記メタ情報測定値ベクトルをマッピングするステップと、
前記対応する1つまたは複数のメタ情報測定値に応じて、前記スライスのそれぞれについて、下記パラメータ
フォントサイズ、
彩度、
前記スライス間の内部スペース
のうちの1つを変化させることによって、前記タグの前記メタ情報測定値の時間的変化を視覚化するステップと
を備える。
このようにして、特定のタグについてある時間にわたって記録されたメタ情報をタグクラウド内に視覚化することができるので、結果として得られたタグクラウドによって、ある時間にわたって測定(または入力)データがどのように変化するかに関する時間的情報が提供される。従って、このような時間的側面に基づいて前記データの照会および閲覧を可能にするインタフェースとしてタグクラウドを用いることができ、それによって照会および閲覧の目的のためにタグクラウドによって表示されるデータとのインタラクション法およびそのようなデータの処理法の新たな次元が開かれる。
一実施形態によれば、前記メタ情報は、タグの重要度およびタグ間の相関重要度のうちの一方である。これら2種類の情報は、データセット閲覧時またはデータ照会時のユーザにとって深い関心事であるので、これらのうちの一方または両方が表示できれば有利である。
一実施形態によれば、あるタグにマッピングした合計期間は前記タグの全長によって図表的に表現される。
これにより、タグクラウド内に示されるある時間の時間範囲に関する印象がユーザに与えられる。
一実施形態によれば、本方法は、予め定められた複数の時間的パターン(temporal pattern)のうち、各タグがどの時間的パターンに属するかを識別するステップと、同一パターンに属するタグをグループ分けするステップとを含む。
これによって、同じ時間的パターンを示すタグをユーザが識別しやすくなり、ユーザはそのうちの1つの選択できる。また、例えば、グループ内のタグについて詳細情報を読み出すことができる特定グループを選択することにより、このようなグループ分けを閲覧または照会に用いることもできる。
一実施形態によれば、同一タググループに属する複数のタグは、類似度判定基準によって選択されるか、またはユーザによって任意に選択され、前記グループのタグについて、メタ情報は、
フォントサイズの変化、
彩度の変化、
のうちの1つまたは2つ以上によって表示される。
ユーザまたは類似度判定基準(ある時間にわたる重要度の類似形状など)によるタグ選択によるタグのグループ分けは理にかなっており、その後、このグループのタグについて、フォントサイズまたは彩度を変化させることによってメタ情報を表示させてもよい。
一実施形態によれば、グループを形成する複数のタグが1列に配列され、前記グループがスライスに分割され、各スライスはある期間を表し、視覚化されるべきメタ情報のベクトルは、ある時間にわたる前記グループの前記要素間の相関重要度を表しており、前記メタ情報のベクトルは、前記タググループの可視表現がフォントサイズまたは彩度の変化に基づいてある時間にわたる前記グループのタグ間の相関関係の変化を示すように、前記タググループの前記スライスにマッピングされる。
これにより、ある時間にわたるタググループの要素間の全体的相関関係の時間的変化を視覚的に表示することが可能となる。
一実施形態では、これによって、相関重要度が最高の場所(フォントサイズが最大となる位置または彩度が最高となる位置を意味することもある)に、最高個別重要度を有する個別タグが配置されるように前記グループ内のタグの配列順序が選ばれる。
一実施形態によれば、本方法は、類似度判定基準に基づいてタググループを選択するステップと、前記タグを1列に配列するステップとを備え、前記グループはスライスに分割され、グループの全体形状は、類似度判定基準に対応するメタ情報の時間的変化に基づいており、および/または、グループのタグは、最高個別重要度を有するグループのタグが最高フォントサイズまたは最高彩度の位置に配置されるとともに、他のタグが最高重要度を有するタグに対する相関関係に従って順序付けられるように、配列される。
グループの全体形状が類似度判定基準の時間的変化によって決まることにより、類似度判定基準(例えば、「上昇型」または「下降型」など、個別タグの重要度の特定パタ―ンであってもよい)がどのように見えるか、すぐに分かるようになる。また、最高重要度を有するタグとの相関関係に従ってタグを一列に配列することによって、相関関係情報までも視覚化できる。
一実施形態によれば、タググループは、前記グループのメンバーが一定の類似度を有する基準とされる類似度判定基準に基づいて選択されている。ある時間にわたるグループメンバー間の相関関係の全体相関重要度は、ある時間にわたる相関重要度の変化に従って変わるフォントサイズの変化、または、ある時間にわたる相関重要度に従って変わる彩度の変化、によって視覚化される。
このようにして、グループのメンバー間の全体的相関関係を視覚化できる。
一実施形態によれば、本方法は、1つのタグを基準タグとして選択するステップと、前記選択された基準タグと他のタグとの相関関係の度合いが、前記他のタグのフォントサイズ、または、前記他のタグの彩度、によって表現されるように他のタグを表示することによって、前記選択された基準タグと前記他のタグとの相関関係を図表的に視覚化するステップとを備える。
このようにして基準タグと他のタグとの間の相関関係を視覚化できる。
一実施形態によれば、ある時間にわたるタグの内部重要度が、タグのフォントサイズまたは彩度のうちの一方によって表現され、ある時間にわたる前記選択されたタグに対するタグの相関重要度が、前記フォントサイズまたは前記彩度のうちの他方によって表現される。このようにして、タグ自体の重要度および基準タグに対するこのタグの相関重要度の両方をある時間にわたって視覚化できる。
一実施形態によれば、本方法は、選択された基準タグと他のタグとが、ある時間にわたる前記選択されたタグに対する個々の相関関係が示されるように、同時に表示され、前記相関関係が、前記相関関係の変化に従って変化するタグのスライス間または文字間のスペース、または、前記相関関係の変化に従って変化する彩度、によって示される。
一実施形態によれば、本方法は、タグと前記基準タグとのある時間にわたる相関関係を視覚化するステップに加え、前記タグと前記基準タグとの全体的相関関係をさらに視覚化するステップを備える。
これにより、ある時間にわたって変化するあるタグと基準タグとの相関関係に加えて、あるタグと基準タグとの全体的相関関係を視覚化することも可能となる。全体的相関関係は、例えば、タグの近くに配置された単線の延び具合によって表示してもよい。
一実施形態によれば、タグクラウドの視覚化により、前記タグクラウド内に表現されたメタ情報に基づいて、前記タグクラウドによって表される内容情報をユーザが照会または閲覧することが可能となり、前記メタ情報は、
ある時間にわたるタグの重要度の時間的変化、
ある時間にわたるタグ間の相関重要度の時間的変化、
前記タグクラウドによって図表的に視覚化された前記タグクラウドのタグに関するメタ情報、
のうちの1つ以上である。
一実施形態によれば、複数の個別タグを備えるタグクラウドを視覚化する装置が提供される。ここで、各タグは特定の情報片であり、1つまたは複数の文字で形成されており、タグについて、前記タグのメタ情報測定値ベクトルが存在するように一定時間ごとにメタ情報の測定が行われており、前記ベクトルの各成分は特定のメタ情報測定値を表す。前記装置は、タグを複数のスライスに分割する手段と、前記タグの各スライスが1つまたは複数の前記メタ情報測定値と対応するように、ある時間にわたる前記タグの前記メタ情報測定値ベクトルをマッピングする手段と、前記対応する1つまたは複数のメタ情報測定値に応じて、前記スライスのそれぞれについて、フォントサイズおよび彩度というパラメータのうちの1つを変化させることによって、前記タグの前記メタ情報測定値の時間的変化を視覚化する手段とを備える。
このようにして、本発明の一実施形態に従う装置を実施できる。
別の実施形態によれば、本装置は、本発明の実施形態のうちのいずれか1つに従う方法を実施する手段を備える。
本発明のさらに別の実施形態によれば、実行時に本発明のいずれかの実施形態に従う方法をコンピュータが実行することができるコンピュータプログラムコードを含むコンピュータプログラムが提供される。
業界公知のタグクラウドを示す図である。 本発明の実施形態に従うタグクラウド表現の略図である。 本発明の別の実施形態に従うタグクラウド表現の略図である。 本発明のさらに別の実施形態に従うタグクラウド表現の略図である。 本発明のさらに別の実施形態に従うタグクラウド表現の略図である。 本発明のさらに別の実施形態に従うタグクラウド表現の略図である。 本発明のさらに別の実施形態に従うタグクラウド表現の略図である。 本発明のさらに別の実施形態に従うタグクラウド表現の略図である。 本発明のさらに別の実施形態に従うタグクラウド表現の略図である。 本発明のさらに別の実施形態に従うタグクラウド表現の略図である。 本発明のさらに別の実施形態に従うタグクラウド表現の略図である。 本発明のさらに別の実施形態に従うタグクラウド表現の略図である。
本発明の実施形態に従う概念は、相関関係という側面のみならず時間的な側面を考慮することによって、データの視覚化およびナビゲーションに対するタグクラウドの基本概念を大きく広げるものである。以下の記載で明らかになるであろうが、ここで提案される視覚化およびインタラクション法によれば、大きなデータセットを表現したり照会したりするための新しい方法が実現される。
詳細には、ある時間にわたる1つのタグおよび複数の相関タグの重要度を強調表示するためにタグクラウド内の付加的な情報(メタ情報)を符号化する新規な視覚化技術に基づいて、大きなデータセット内の重要データ項目をどのように視覚的に記述してどのように閲覧に役立てることができるかを説明する。
メタ情報は、例えばGPSセンサからのデータを一定間隔で記録することによって自動的に記録できる。このデータに基づいて位置情報が判断され、また、この位置情報に基づいて、例えば、その位置の都市名、場所の名称(例えば、事務所)等といった、対応タグを自動的に記録することもできる。なお、タグは、ユーザによって入力されたメタ情報であってもよく、例えば、ユーザのそのときの気分(だるい、幸せ、悲しい、等)やユーザの行動(運動、読書、歩行)など、ユーザの状況を表すメタ情報に基づくものであってもよい。そのようなメタ情報がユーザによって入力され、その後、対応する時間と一緒に記録されてもよい。従って「測定」という用語は、ある時刻にユーザがメタ情報を入力することも、ある時点におけるメタ情報の「測定」と見なされる場合があることを理解されたい。
ユーザ入力に由来するものであっても、自動測定に由来するものであっても、そのようなメタ情報はすべて、数種類または数タイプのメタ情報からなる集約体となり、異なる種類または異なるタイプは対応するタグによって表現され、ある時間にわたってタグの重要度(例えば、一定時間間隔内の発生回数によって)が記録される。
このようにして収集された、ある時間にわたる内容情報を表す内容データ(すなわち「測定データ」)のプールは、ユーザがこの情報プールを有意味に表示、閲覧、および照会できるようにするために本発明の視覚化メカニズムを適用するためのベースとなり得る。内容情報は全く異なっていることがあるし、時間的情報も含んでいるので、そのような情報プールを表示および照会するためには現在のインタフェースは適していない。以下に記載の本発明の各実施形態によれば、これまで不可能であった態様によりユーザがこのデータにアクセスし、照会し、閲覧するのを支援することができる。
メタ情報の収集に使用できるツールは、携帯電話、スマートフォン等の携帯デバイスとすることができる。このような携帯デバイスは、自動測定(位置測定、またはデバイスのセンサに由来する他のデータ測定)を実行できるようになっていてもよいし、ユーザがメタ情報を入力し、入力されたメタ情報が対応する時刻と一緒に記録されるようになっていてもよい。その後、携帯デバイスは、対応する機能を実行するコンピュータプログラムを実行することによって本発明の実施形態に記載の視覚化方法を実行してもよいし、対応タグに対応し、対応タグによって表現されるメタ情報をある時間にわたって記録する「測定」によるデータ収集によって得られたメタ情報をユーザが照会および閲覧できるようにしてもよい。
一実施形態において提案される手法によれば、1つのタグの表現内でそのフォント特性を変化させる(例えば、種々のフォントサイズを使用することなどによって)ことで、ある時間にわたるタグの重要度分布を記述できる。従って、タグの重要度が著しく減少した場合、固有(distinct)タグのフォントサイズも小さくなるし、重要度が増加した場合は固有タグのフォントサイズも大きくなる。その結果、観測対象の複数タグの重要度の動向を1つの(静的な)クラウド内に視覚化することができ、従って、現時点の重要度のみならず、ある時間にわたるその重要度分布にも基づき、タグをより確実に識別および選択することが可能となる。また、複数のシングルデータ項目や複数項目から成る複数グループの動向を視覚的に識別できるので、提供された情報を深く理解できるようになることに加え、過去に記録された該当データの履歴サンプルを閲覧することも可能となる。1つのタグ表現の固有部分を選択することによって、このデータ項目の履歴サンプルを明らかにすることができる。同様に、ある時間にわたるタグの重要度分布を視覚化することにより、所与のデータセットを、動向という観点から閲覧することが可能となる。例えば、ある時間にわたって望ましい動向(例えば、重要度の増加)を有するタグを選択することができ、また、ある時間にわたって同じ動向を有する他のタグ(および、その関連情報)をサーチすることができる。従って、本発明の実施形態による視覚化法は、ある時間にわたって記録されたデータを視覚化することのみならず、新規なインタフェースによってそのようなデータを照会および閲覧できるようにするものでもある。
今日、クラウド内のタグの重要度は、所与のデータセット内の頻度に基づいたものに過ぎない。しかし、時として、タグの重要度および重要度の適切な指標は頻度だけではない。そうではなく、タグの重要度は、同一クラウド内の他のタグとの相関関係すなわち結びつき、ならびに、ある時間にわたる相関関係の重要度によっても、大きく左右される。2つ以上のタグの相関度が共起度測定値に基づくこともあり、タグの意味論的または統計的類似性(近さ)を示す場合もある。既存のタグクラウド表現は相関関係の度合いを視覚化することができないため、1つのクラウド内のタグ同士を区別するための適切な区別因子が欠如している。その結果、データセットをナビゲートすることもできないし、相関性のある数行のタグに沿った所与の照会を制限することもできない。
本発明の実施形態による視覚化法およびインタラクション法は、固有のグループ分け、色分け、または距離表示により、タグ間の相関関係因子を視覚化することによって、この制約に取り組むものである。ある時間にわたるタググループの相関重要度は、その関連重要度と一致するようにグループ全体の形状を調整することによって視覚化できる。色分けパラダイムにより、彩度100%の基準色で強調表示された特定のタグを選択することが可能となる。一実施形態において、すべての相関タグが同一色調で強調されるが、その相関度に基づいて、相関度が高いほど彩度が高くなるように彩度選択が行われる。一実施形態において、タグ内の白色スペースを調節することによって、ある時間にわたる相関度を表現できる。また、さらに別の実施形態では、所与の2つのタグの全体的相関度について、最新の相関度に高い強調が施されてもよい。
提案される視覚化法およびインタラクション法では、高度なタグクラウド表現を生成することにより、大きなデータセットをナビゲートおよび閲覧する新たな方法が可能となる。照会は、複数のシングル項目または複数のタググループの重要度分布に基づいて制限可能であり、関連項目による閲覧を可能にし、所与のデータセットの履歴サンプルをナビゲートする手段を提供する。従って、ある時間にわたって識別された、時間的な条件、特定の相関関係従属性、または類似した動向に基づいて、照会を制限することもできる。
提案される視覚化およびインタラクションパラダイムでは、データセット内の重要項目は、その時点の重要度だけでなく、ある時間にわたるその重要度およびある時間にわたる他のタグとの相関関係の重要度に基づいて、強調表示することが可能である。従って最近のみ人気の高い(短期間)タグを切り離すことができ、より長期間にわたって高い相関度を備えた重要なタグが高い視覚的に重みを得る。また、提案される手法によれば、ある時間にわたるその重要度および相関関係の分布に基づいて、複数のシングルデータ項目または複数の項目グループを効率的に選択することが可能となり、また、過去に記録された履歴データサンプルを照会することが可能となり、類似した重要度および相関関係を備えたタグのグループを隔離する手段およびタグ間の相関度に基づいて所与のデータセットを閲覧する手段が提供される。
ここで、本発明の実施形態を幾分か詳細に説明する。
まず、タグ内の重要度分布が視覚化された実施形態を説明する。複数のシングルタグの重要度分布は、一定期間内に記録された重要度測定回数によって定められる。これにより、タグの重要度すなわち関心度の何らかの傾向をある時間にわたって示すことができる。
提案される視覚化およびインタラクション技法は、既存のタグクラウド表現を著しく拡大し、付加的なメタ情報を静的なクラウド内に視覚化することを可能にし、新規なインタラクションパターンおよび新規な照会制限パターンを可能にするものである。メタデータにより、クラウド内の複数のシングルタグのある時間にわたる重要度分布および複数タグ間のある時間にわたる相関関係を識別および強調表示することが可能となる。
提案される視覚化およびインタラクションパラダイムによれば、タグの重要度は、ある瞬間の所与のデータセット内の頻度(1つの単一値)だけに基づくのではなく、ある時間にわたって記録された複数の重要度レベルだけで構成することもできる。このようにして得られる重要度分布により、タグの人気が減少しているか、増加しているか、無変化であるかとは別に、一定期間中のタグの重要度に関する貴重な情報が保持される。提案される視覚化パラダイムによれば、この傾向は、図2に示されるような1つの静的なタグクラウド内に可視化できる。下記の例では、タグ"coffee"の重要度が増加したことが、大きくなっていくフォントサイズによって示されているが、一方、タグ"commuting"はフォントサイズが小さくなりつつあり、ある時間にわたるその対応重要度が低下している。
所与のタグに使用される実際のフォントサイズおよびその重要度分布は、所与のタグ内の固有セクションの個数(セクションとは、例えば、文字列の一部、すなわちタグの分割可能部分など、タグの文字またはタグの小部分であってもよい)が、対象の重要度測定回数をも制限すると仮定することによって算出できる。
ここで、
max: 最大重要度値
max: 最大フォントサイズ
min: 最小フォントサイズ
とする。
次式により、任意の重要度値範囲が固有タグの個々のフォントサイズにマッピングされる。フォントサイズは、結果として生じるフォントサイズベクトル
によって示される。
タグの重要度分布を視覚表示することにより、時間的照会制限(temporal query restriction)を定めることができる。タグの水平表示が、観測された時間間隔を表すのに対し、タグの固有セクションは、この時間間隔の時間サブセットを表す。識別可能な時間スライス(=タグのセクション)の個数ならびに実際の重要度測定回数は、特定のタグの全体サイズに依存する場合もある。特定の時間スライスの選択は時間的照会制限として見なすこともでき、その結果のセットは選択され時間間隔に対応している。このように、観測する時間間隔を狭めることにより、大きなデータセット内の1個の情報を検索することができる。タグのスライスはタグの一文字に対応していてもよいし、文字の一部(「スライス」)に対応していてもよい。前者の場合、重要度の指標は、文字ごとに変化するが単一文字内では同じままである。後者の場合、重要度の指標は文字内で変化することさえある。すなわち、個々の文字のフォントサイズがその文字内であっても変化することさえもある。
タグのセクションの個数および時間的測定回数が同じでない場合、すなわち、所与のタグの固有セクションのベクトルの成分数と、ある時間にわたる所与のタグの重要度測定値ベクトルの成分数が異なる場合、一方のベクトルの複数の成分が他方のベクトルの一成分にマッピングされるようにマッチングを行ってもよい。これは、例えば、数個の重要度成分を1つのタグセクションにマッピングさせる場合、複数の重要度の平均重要度値を求めることによって行うことができる。
タグクラウドのタグによって表現される時間間隔は、予め決めておいてもよいし(例えば、1日、1週間、1カ月等)、ユーザが選択してもよい。例えば、ユーザが自分にとって最も関心のある時間間隔を選ぶこともできるし、収集されたメタ情報に基づいて、重要度データの時間的推移を視覚化するタグクラウドが算出されて表示されてもよい。
一実施形態によれば、タグクラウドを形成する全部のタグが、必ずしも同一観測時間間隔を表すわけではないので(例えば、視覚化させようとユーザが選択した間隔全体を網羅する十分なメタ情報データが全タグについて存在するとは限らないので)、一実施形態によれば、対象とされる相対時間のための別の指標が用いられる。この実施形態では、タグの(水平方向の)全長は、重要度測定を展開する全期間の長さである。異なるタグによって別々の時間間隔を表すための長さ変更は、例えば、タグ内の白色スペースを変えることによって行うことができる。図3に示されるように、タグ内の白色スペースを変えるとその水平方向の長さが増し、これは比較的長い期間に相当する。図3に示される例では、例えば、"commuting"というタグは"nuremberg"というタグよりも長い期間をカバーしている。
この付加的なタグ内の白色スペースすなわちフォント間隔は、次式によって概算できる。
ここで:
: タグ内の2つのセクション(例えば、文字)間のスペースすなわち距離
min : タグ内の2つのセクション(例えば、文字)間の最小(デフォルト)スペース
max : タグ内の2つのセクション(例えば、文字)間の最大スペース
: 関心タグの観測時間間隔
max : 特定クラウド内のタグの最大観測時間間隔
である。
タグ内の白色スペースを変化させる代わりに、異なるフォントタイプすなわち変体を用いることもできる。密集したフォント(例えば、Arial Narrow)によって形成されているタグは短い時間間隔を表し、標準または幅広のフォント(例えば、Arial Regular)は長い期間を表す。
上述のタグクラウドの視覚化により、ユーザは、そのようなタグクラウドによって表される内容情報を時間的情報に基づいてナビゲートできるようになる。例えば、時間的変化の観点から上昇傾向を示すタグは最近になって重要度が高まってきているものであるので、ユーザはそのようなタグを選択することによって、時間的情報に基づいてデータセットをナビゲートするための内容情報を選ぶことができる。別の可能性は、1つのタグではなく、このタグによって示される全時間間隔のサブセットである特定の時間間隔を表すタグの一部を選択することである。そのような選択は、例えば、周知の方法でマウスまたはカーソルを用いてタグの選択部分を枠で囲むことによって行うことができる。また、そのように選択された時間間隔は、選択されたタグおよび時間に関連する他の情報など、さらに詳細な情報を入手する際のフィルタすなわち選択判定基準として適用される。一実施形態において、時間のサブセットの選択により、そのように選択された時間のサブセットのタグクラウド全体の再計算をもたらし、それによってタグクラウドを効率的に拡張することもできる。
比較的シンプルな場合、前述の時間的選択および照会制限を既に表現しているタグの固有セクション(例えば、1文字)を選択(例えば、このセクション上でクリックすることによって)できる。また、一実施形態において、ワードプロセッシング時に特定のテキストにマーキングするのと同様に、このタグの複数部分を選択することもできる。この選択は、マウスのクリックによって確定できる。
結果として得られる照会を観測期間について制限するためにタグの固有の部分を選択するのとは対照的に、一実施形態に従うタグ内スペースの選択には逆の効果がある。この場合、一実施形態によれば、対象期間が延長され、その結果、クラウド内の各シングルタグの再計算がもたらされる。
ここで、傾向に基づいたタグのグループ分けを用いる別の実施形態を説明する。
図2に例示されているようにシングルタグのある時間にわたる重要度分布を計算すると、その(意味論的)類似性に基づいて、または単純な共起度測定値に基づいて固有タグをグループ分けすることができるだけでなく、類似の重要度の動向に基づいてグループ分けすることも可能となる。これについて、数タイプの動向を(一例として)下掲のように識別することができる。
類似した重要度分布を有するタググループを識別したことによって再フォーマットされたタグクラウドが図4に示されている。
類似した重要度の動向に基づいてタグクラウド構成内の特定グループを識別した後、一実施形態によるグループベースの照会制限により、選択された重要度の動向だけについてのみ、所与の結果セットが再考される。
一実施形態による、結果として得られたタグクラウド構成の配置は、次のパラダイムによって決まる。各タググループは、原則として、独立したクラウドのように見える。最大タググループは、結果として得られた(複合)タグクラウドの中央に配置され、それに続く全グループが、この中央のグループを囲んで配置される。図4に示される例では、例えば、"laim"および"busy"等のタグを含むクラウドが最大クラウドとして識別されているため、このタグが、結果として得られた複合タグクラウドの中央に配置されている。フィールド数が識別された動向(およびそのようなタググループ)の総数よりも大きくなくてはならない場合、その配置はマトリックス(matrix)に基づく。このように、付加的な視覚的重みが最大すなわち最も重要なタググループに置かれ、これにより、シングルタグが更に迅速にナビゲーション、選択、および識別するのがしやすくなる。図5は、図4に示されるタグクラウドのマトリックス構造を示す。
以下に、色分けによる相関重要度分布を使用する実施形態を説明する。
タグの時間的重要度分布に加え、このタグと同じクラウド内の別のタグとの、ある時間にわたる相関関係もまた、価値のあるメタデータである。時間的相関分布は、指定された時間間隔中に記録される特定タググループの相関関係測定回数と定めることができる。そのような相関関係は、共起度測定結果、意味論的従属性、または、時間、物理的空間、若しくはこのグループ内に存在しない他のデータ項目の通常存在について識別されるこれらの概念間の結びつきを基礎とすることができる。
ある時間にわたって共通の重要度分布を有する、識別されたタググループを考えることにより、グループの相関重要度を一列状(あるいは円形状)に視覚化することが可能となる。一列状の場合、列中、x軸の左側が最新の測定のタイムスケールであり、右側が最古の測定のタイムスケールである。一列にグループ分けされたこれら多数のタグは、またも2次元タグクラウドを形成している。グループ内の各タグは、自己の重要度分布に関する固有情報を依然として保持しているが、ある時間にわたるグループの相関重要度は、彩度100%が最高相関重要度を表す、漸次増減配色(fading color schema)によって示される。このようなタグクラウドは、図6に示されるように見えることができる。
図6のグループに属するタグの選択は、類似の時間的重要度分布だけに基づく選択に限られなくてもよく、例えばユーザによって任意に選択されてもよい。その後、ある時間にわたるタグ間の相関関係は、図6に示されるように、すなわち、時間に対応するx軸に沿って変化する彩度によって、表示してもよい。
ここではグループのメンバーを選択するための種々の選択判定基準を記載したが、これらの選択判定基準をどのような組合せで組み合わせることもできることは言うまでもないことを記載しておく。例えば、別の実施形態に記載されるように、タグをその意味論的類似性に基づいて選択できる。これとは別に、またはこれに追加して、一実施形態では、ユーザによる任意選択も常時可能である。
グループの「相関分布」を表す彩度は次式によって記述できる。
ここで、
: タググループ内の個々のセクションの彩度、
max: 最大彩度
min: 最小彩度、
: 任意の相関重要度サンプル、
max: グループの最大相関重要度
である。
一実施形態によれば、グループ内のタグの順番も特定のパラダイムに従っている。最も重要なシングルタグが、グループの相関重要度ピーク位置に置かれる(図6では、"coffee"が最も重要なシングルタグとして識別されているので、グループの最大相関重要度と評価される、左から2番目の位置に置かれている)。
グループの判定基準: 類似した重要度分布(または任意のタグ選択)
タグの形状:個々のタグの重要度分布
タグの配置:最も重要なシングルタグの位置とグループ形状の最大相関重要度の位置と一致する
グループの形状: −
色分け: ある時間にわたるグループの相関重要度を色の漸減によって示す
インタラクション: 期間および共通のグループ判定基準(類似した重要度分布)に基づく照会制限
ここで、この視覚化パターンをどのようにナビゲーション目的に使えるかを示す例を説明する。例えば、所与の照会をさらに精緻なものとし結果セットを小さくするために、グループの固有部分を選択することができる。これにより、データ項目を記録しておかなければならない期間が、表示された相関重要度の選択領域に対応するように制限される。クラウド内では、期間が識別されるだけでなく、特定のグループも選択されているので、結果として生じる照会は、一実施形態では、共通のグループ判定基準(上の例では、ある期間にわたって類似した重要度分布)によって定められる。
以下に、グループベースの重要度分布を使用する実施形態を説明する。
この実施形態では、グループ内のタグ間の実際の相関関係ならびにグループの共通判定基準は、後からの関心事である。そういうものとしてグループに目を向けると、その共通判定基準ならびにグループ内のタグ間の相関関係を図7に示されるように視覚化できる。
ここでは、グループの共通判定基準(類似の重要度分布)がグループ全体の形状を形成し、一列に再配列されているが、グループの最も重要なタグ(この場合は"coffee")が識別され、その後、最も目立つタグとして視覚化される(図7ではフォントサイズで目立たせているが、重要度を表現するために選択されるのであれば、彩度で目立たせることも可能である)。グループ形態内の所与のタグの順序は、グループの最重要タグに対する特定タグの相関度に基づいている。相関度は、グループ内の2つの固有タグ間の従属性を示す。上の例では、タグ"munich"は、"traveler"との相関度よりも、"coffee"との相関度の方が高い。
形状レンダリングは、第1の例で様式化されたシングルタグの重要度分布のように数学的に記述できるが、タググループは連結された1つのシングルタグとして扱われる。
グループの判定基準: 類似の重要度分布
タグの形状:グループの形状を決定(従って、形成)する
タグの配置:最も重要なシングルタグがグループの最重要位置に置かれる。残りのタグは、この最重要シングルタグに対する相関度に基づいて順序付けられる。
グループの形状: 共通の判断基準(ある時間にわたる重要度分布)がグループの形状を定める
色分け: −
インタラクション: 期間および共通のグループ判断基準(類似の重要度分布)に基づく照会制限
ここで、グループ形状を有する相関重要度分布を使用する実施形態を説明する。
ある時間にわたる数個のタグの相関関係を特徴描写することによって、グループの相関関係の重要度がそれなりに示される。従って、グループ内のすべてのタグが、上記の例で論じられたように類似の重要度分布に基づいてではなく、特定の相関関係に基づいて(例えば、意味論的類似性に基づいて)選択されている。提案される視覚化パラダイムは、次いで、ある時間にわたるグループ全体の相関重要度を示すが、それぞれの固有タグの重要度分布は、図8に示されるように、もはや主目的ではない。
選択され、図8に視覚化されている例に示されているのは、類似タグ(すべてのタグが空間的概念を表現しており、従って、この場合の類似度判定基準は「空間的概念を表現するタグ」である)のグループと、ある時間にわたるグループの相関重要度である。なお、上記グループの重要度は最初に増加し、次に相関重要度が着実に減少している。各シングルタグの形状は、グループ形状にそれなりに適合しており、その結果、グループ全体ならびにある時間にわたるその相関重要度が更に目立つように視覚化されている。やはり、グループ内のタグの順序は特定の原理に従っている。すなわち、最も重要なシングルタグが、最高重要度値が存在する位置を取る。その結果、グループの最重要タグとして"munich"がクラウド構成の第1の部分内に置かれ、"nuremberg"、"laim"、および"berlin"がそれに続く。
グループの相関重要度の分布は、(上に説明されたように)タグ内重要度分布と同様に記述できるが、結果として生じるフォントサイズベクトルは、ここの重要度測定によって記述されるのではなく、実際には、グループの相関関係測定によって求められる。
ここで、
max: 最大相関値
max: 最大フォントサイズ
min: 最小フォントサイズ
である。
グループの判定基準: 意味論的または統計的類似性
タグの形状: グループの形状に適合(従って、形成)する
タグの配置: グループがその最高相関重要度を有する場所に配置される
グループの形状: ある時間にわたるグループの相関重要度を示す
色分け: −
インタラクション: 期間および共通のグループ判定基準(類似のタグカテゴリ)に基づく照会制限
ここで、基準タグ選択および相関度視覚化を使用する実施形態を説明する。
ある時間にわたるタグの重要度、タググループの構成、および、ある時間にわたるそれらの相関重要度に注目することに加え、タグ間の相関度は、表現されたデータの別の有益メタ情報である。特定の配色を適用することによってそのような相関関係を可視化し、単純な共起性、意味論的類似性、または統計的解釈を示すことができる。タグ間の相関関係を強調表示するために、基準タグが選択される。特定の基準色を彩度100%のそのフォントに割り当てることにより、基準タグの選択を示す。従って、すべての相関タグは選択タグと同色で強調表示されるが、選択タグとの相関度は相関タグに適用される色の彩度と同等となる。これは、高い相関度は高い色飽和百分率で示されるが、低い色飽和百分率は低い関連度に相当することを意味する。図9は、選択タグとして"coffee"を含むサンプルタグクラウドを示す。このタグクラウド中、"commuting"または"busy"などの相関タグは、漸次増減する彩度によって示されている。
実際のタグ選択には、2通りの効果がある場合がある。一方では、上述の相関度視覚化により、所与のクラウド内の相関従属性に焦点を当てることができる。別の実施可能パターンは、データセット内における相関関係に基づくナビゲーションである。なそ、特定のタグが選択されるたびに、相関タグだけを検索するように照会を対応させることも可能である。このように、相関情報のサブセットだけが、有意義な情報を見つけ出すための効率的な手段となると見なされる。
ここで、時間的相関度の視覚化を使用する実施形態を説明する。
タグ内の白色間隔(white spacing)またはフォント間隔を利用することによって、(上に例示したように)シングルタグ表現内に相対的な期間を符号化できるだけでなく、(基準タグに対する)ある時間にわたるその相関度を示すことも可能である。なお、タグ内スペースの増加は相関度の減少を示し、スペースの減少は相関度の増加を示す。タグ内スペースが無変化であることは、ある時間にわたって安定した相関度であることを示す。また、2つのタグの平均相関度を重み付けすることも可能であるが、新しい相関度が高い重みを有する。これは図10に概略図示されている。図中、基準タグは"commuting"であり、タグ"nurenmerg"の白色スペースが広くなっていくことは、タグ"commuting"に対する"nurenmerg"の相関関係が、ある時間にわたって減少していることを示す。他方、タグ"working"については、文字間の白色スペースが狭くなっていくことによって示されるように、ある時間にわたってタグ"commuting"との相関関係が増加している。
また、y方向の個々の単線で示されるように、各タグについて、(例えば、より新しい相関値に、より高い重みが与えられる場合に、ある時間にわたって平均化された)全体的相関度が示される。タグ"commuting"との全体的相関関係は、タグ"transportation"と"working"とでほぼ同じであり、タグ"nuremberg"の場合より幾分か低いことが分かるであろう。
白色間隔の相関分布は次式によって記述できる。
ここで、
: タグ内の2セクション(例えば、文字)間のスペース
min : タグ内の2セクション(例えば、文字)間の最小(デフォルト)スペース
max : タグ内の2セクション(例えば、文字)間の最大スペース
: 関連タグについて測定された相関度
max : 最大相関度
である。
平均重み付け相関度Aは次式によって記述できる。
ここで、
A: 平均重み付け相関度
max: 最大相関値
W: 重み係数
である。
基準タグ("commuting")が選択されると、固有数の相関タグが上方に配置され、基準タグと相関タグとの間の視覚的な距離増加または減少効果を強めるために僅かに回転させられる。そのような視覚化に基づく照会または閲覧は、例えば、前述の基準タグが再選択されるたびに、更に相関関係が小さい次グループタグの相関タグが同様に配置され、前に示された相関タグのグループと置き換わる。
下記では、上で説明された実施形態のうちのいくつかについて、対応するグラフィカルな視覚化表現と組み合わせて表示されるメタ情報を示すことによって簡単にまとめる。
今まで記載した実施形態では、フォントサイズ、彩度、スライス間の内部スペース、という3通りのタグのメタ情報視覚化法が主として用いられてきた。しかし、その時間的変化を示すために個々のタグスライスのメタ情報を視覚化するための更に別の方法についても記載する。タグのスライスについて、このタグと関連のある特定量のメタ情報に対応する情報を図表的に視覚化するのに適した方法であれば、どのような方法も使用可能である。そのような一例が図11に示されている。図中、タグの微小要素(「スライス」)は、仮想階段上に配置されており、ある固有重要度測定値は、基線に対する実際の高さによって示されている。従って、重要度の高い要素は、重要度の低い要素よりも高く配置される。実際の高さ値の計算は、これまでのフォントサイズ計算と同様である。
ここで、
max: 最大重要度値
max: 基線に対する最大高さ
min: 基線に対する最小高さ
とする。
次式により、所与の範囲の重要度値が、結果として生じる高さベクトル
によって示される固有タグの高さ値の個々の範囲にマッピングされる。
履歴上の重要度値測定の時間間隔が異なる場合もあるので、タグ内スペースによってこの時間的相違を示してもよい。一実施形態において、図11の左側に示されているように、小さいスペースは短い時間間隔に相当し、大きいスペースは長い時間間隔を意味する。
原則として、重要度、相関分布、または特定時間間隔を示すためにシングルタグに種々のフォントを使用することも可能であることは既に述べた(これは、Arial RegularおよびArial Narrowというフォントの使用を記載する例として与えられた先行する実施形態で説明された) 。
しかし、これに加え、タグ"docomo"について図12に示されているように、特殊なタイプのフォントを使用できる。そのようなフォントの場合、文字内でさえもサイズを変更できる。そのようなフォントは、図12から分かるように、視覚化されるべき重要度値に従ってそのサイズを変えられる各文字の個々のスライスを提供することによって構成できる。
さらに一般的に言うと、一実施形態において、メタ情報の視覚化は、メタ情報の量に基づいてタグの個々のスライスの視覚化パラメータを変更することによって実行され、この視覚化パラメータは、フォントスライスがそのようなメタ情報量を示すことができるように選ばれる。
上記各実施形態は、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアとの組合せによって実施できることが当業者には分かるであろう。本発明の実施形態に関連して記載されたモジュールおよび機能は、本発明の実施形態に関連して説明された方法に従って動作するように適切にプログラミングされたマイクロプロセッサまたはコンピュータによって、全体的または部分的に実施できる。本発明の実施形態を実施する装置は、例えば、計算装置または携帯電話または本発明の実施形態で記載された委任された処理(delegated transaction)を実行できるように適切にプログラミングされた任意の携帯デバイス等を含むことができる。
本発明の実施形態によれば、データ媒体に格納されるか、または、記録媒体もしくは伝送リンクなど一定の物理的手段によって具現化された他の手段に格納される、コンピュータ上で実行されると上記本発明の実施形態に従ってコンピュータを作動させることができるコンピュータプログラムが提供される。

Claims (15)

  1. 複数の個別タグを備えるタグクラウド(tag cloud)を視覚化する方法であって、各タグが特定の情報片であり、1つまたは複数の文字で形成されており、タグのメタ情報測定値ベクトルが存在するように一定時間ごとに前記タグのメタ情報が測定され、前記ベクトルの各成分が特定のメタ情報測定値を表し、前記方法が、
    タグを複数のスライスに分割するステップと、
    前記タグの各スライスが1つまたは複数の前記メタ情報測定値と対応するように、ある時間にわたる前記タグの前記メタ情報測定値ベクトルをマッピングするステップと、
    前記対応する1つまたは複数のメタ情報測定値に応じて、前記スライスのそれぞれについて、以下のパラメータ
    フォントサイズ、
    彩度、
    前記スライス間の内部スペース、
    1つの固有な重要度測定値が基線に対する実際の高さによって示される、個々の前記スライスが仮想階段状に置かれたときの実際の高さ、
    のうちの1つまたは複数を変更することによって前記タグの前記メタ情報測定値の時間的変化を視覚化するステップと、
    を備える方法。
  2. 前記メタ情報が、
    タグの重要度、
    タグ間の相関重要度、
    のうちの一方である、請求項1に記載の方法。
  3. あるタグにマッピングした合計期間が前記タグの全長によって図表的に表現される、請求項1または2に記載の方法。
  4. 予め定められた時間的パターンのどの時間的パターンに各タグが属するかを識別するステップと、
    同じパターンに属するタグ同士をグループ分けするステップと、
    を更に備える、請求項1〜3のいずれか1項に記載の方法。
  5. 同一タググループに属する複数のタグが、類似度判定基準によって選択されるか、または、ユーザによって任意に選択され、
    前記グループの前記タグについて、メタ情報が、フォントサイズの変化または彩度の変化、のうちの1つ以上によって表示される、
    請求項1〜4のいずれか1項に記載の方法。
  6. グループを形成する複数のタグが一列に配列され、前記グループがスライスに分割され、各スライスが特定の期間を表し、視覚化されるべきメタ情報のベクトルが、ある時間にわたる前記グループの前記要素間の相関重要度を表しており、前記タググループの視覚表現がある時間にわたる前記グループの前記タグ間の相関関係の変化をフォントサイズまたは彩度の変化に基づいて示すように、前記メタ情報ベクトルが前記タググループの前記スライスにマッピングされる、請求項1〜5のいずれか1項に記載の方法。
  7. 類似度判定基準に基づいてタググループを選択するステップと、前記タグを1列に配列するステップとを備え、前記グループがスライスに分割され、前記グループの全体形状は、前記類似度判定基準に対応する前記メタ情報の前記時間的変化に基づいている、ステップ、および/または、
    前記グループの前記タグについて、最高個別重要度を有する前記グループのタグが最高フォントサイズまたは最高彩度の位置に配置され、他のタグが前記最高重要度を有するタグに対する相関関係に従って順序付けられるように、配列されるステップ
    とを備える、請求項1〜6のいずれか1項に記載の方法。
  8. 前記グループのメンバーが一定の類似度を有する基準とされる類似度判定基準に基づいてタググループが選択され、
    ある時間にわたる前記グループメンバー間の前記相関関係の全体的相関重要度が、ある時間にわたる前記相関重要度の変化に従って変わるフォントサイズの変化、または、ある時間にわたる相関重要度に従って変わる彩度の変化、によって視覚化される、請求項1〜7のいずれか1項に記載の方法。
  9. 1つのタグを基準タグとして選択するステップと、
    前記選択された基準タグと前記他のタグとの相関関係の度合いが、
    前記他のタグのフォントサイズ、または、
    前記他のタグの彩度、
    によって表現されるように前記他のタグを表示することによって、前記選択された基準タグと前記他のタグとの相関関係を図表的に視覚化するステップと
    を備える、請求項1〜8のいずれか1項に記載の方法。
  10. ある期間にわたるタグの内部重要度がそのフォントサイズおよび彩度のうちの一方によって表現され、
    ある期間にわたる前記選択されたタグに対する、あるタグの相関重要度が、前記フォントサイズおよび前記彩度のうちの他方によって表現される、
    請求項9に記載の方法。
  11. 基準タグが選択され、他のタグは、ある期間にわたる前記選択タグとの個々の相関関係が示されるように同時に表示され、前記相関関係が、
    前記相関関係の変化に従って変化するタグのスライス間または文字間のスペース、または
    前記相関関係の変化に従って変化する彩度、
    によって示される、請求項1〜10のいずれか1項に記載の方法。
  12. ある期間にわたるタグと前記基準タグとの前記相関関係を視覚化するステップに加え、前記タグと前記基準タグとの全体的相互関係をさらに視覚化するステップを備える、請求項11に記載の方法。
  13. 前記タグクラウドの前記視覚化により、前記タグクラウド内に表現されたメタ情報に基づいて、前記タグクラウドによって表される内容情報をユーザが照会または閲覧することが可能となり、前記メタ情報は、
    ある時間にわたるタグの重要度の時間的変化、
    ある時間にわたるタグ間の相関重要度の時間的変化、
    前記タグクラウドによって図表的に視覚化された前記タグクラウドの前記タグに関するメタ情報、
    のうちの1つ以上である、請求項1〜12のいずれか1項に記載の方法。
  14. 個別のタグを備えるタグクラウドを視覚化する計算装置であって、各タグは特定の情報片であり、1つまたは複数の文字で形成されており、タグのメタ情報測定値ベクトルが存在するように一定時間ごとに前記タグのメタ情報が測定され、このベクトルの各成分が特定のメタ情報測定値を表し、前記装置が、
    タグを複数のスライスに分割する手段と、
    前記タグの各スライスが1つまたは複数の前記メタ情報測定値と対応するように、ある時間にわたる前記タグの前記メタ情報測定値ベクトルをマッピングする手段と、
    前記スライスごとに1つまたは複数の視覚化パラメータを変化させることによって、前記タグの前記メタ情報測定値の時間的変化を視覚化する手段と、
    を備え、前記視覚化パラメータは、好ましくは、対応する1つまたは複数のメタ情報測定値に応じて、
    フォントサイズ、
    彩度、
    前記スライス間の内部スペース、
    1つの固有の重要度測定値が基線に対する実際の高さによって示される、個々の前記スライスが仮想階段状に置かれたときの実際の高さ、
    のうちの1つまたは複数を備えている、装置。
  15. コンピュータプログラムコードを含むコンピュータプログラムであって、前記コンピュータプログラムコードがコンピュータ上で実行されると、請求項1〜13のうちのいずれか1項に記載の方法を前記コンピュータが実行することができる、コンピュータプログラム。
JP2009147771A 2008-06-20 2009-06-22 タグクラウドを視覚化する方法、装置およびコンピュータプログラム Expired - Fee Related JP4743915B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP08158690.1 2008-06-20
EP08158690A EP2136301A1 (en) 2008-06-20 2008-06-20 Method and apparatus for visualising a tag cloud

Publications (2)

Publication Number Publication Date
JP2010015558A JP2010015558A (ja) 2010-01-21
JP4743915B2 true JP4743915B2 (ja) 2011-08-10

Family

ID=39766815

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009147771A Expired - Fee Related JP4743915B2 (ja) 2008-06-20 2009-06-22 タグクラウドを視覚化する方法、装置およびコンピュータプログラム

Country Status (2)

Country Link
EP (1) EP2136301A1 (ja)
JP (1) JP4743915B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010106573A1 (ja) * 2009-03-17 2010-09-23 富士通株式会社 目的icタグ判別システム、目的icタグ判別装置、目的icタグ判別方法、およびコンピュータプログラム
US8996451B2 (en) * 2010-03-23 2015-03-31 Nokia Corporation Method and apparatus for determining an analysis chronicle
US9189873B2 (en) 2010-03-23 2015-11-17 Nokia Technologies Oy Method and apparatus for indicating historical analysis chronicle information
EP2393018A3 (en) 2010-06-01 2015-01-21 Deutsche Telekom AG Method for improved visualization
US9021118B2 (en) 2010-07-30 2015-04-28 Avaya Inc. System and method for displaying a tag history of a media event
US8863034B2 (en) 2010-08-11 2014-10-14 International Business Machines Corporation 3D tag clouds for visualizing federated cross-system tags
EP2575055A1 (en) * 2011-09-29 2013-04-03 France Telecom Enhanced tag cloud
US10739938B2 (en) 2012-01-05 2020-08-11 International Business Machines Corporation Customizing a tag cloud
US20130212093A1 (en) 2012-02-15 2013-08-15 International Business Machines Corporation Generating visualizations of a display group of tags representing content instances in objects satisfying a search criteria
US9360982B2 (en) 2012-05-01 2016-06-07 International Business Machines Corporation Generating visualizations of facet values for facets defined over a collection of objects
US9129024B2 (en) 2012-10-25 2015-09-08 International Business Machines Corporation Graphical user interface in keyword search
US10394936B2 (en) 2012-11-06 2019-08-27 International Business Machines Corporation Viewing hierarchical document summaries using tag clouds
US9483520B1 (en) 2013-12-18 2016-11-01 EMC IP Holding Company LLC Analytic data focus representations for visualization generation in an information processing system
JP6027580B2 (ja) * 2014-08-27 2016-11-16 京セラドキュメントソリューションズ株式会社 情報表示システムおよび情報表示プログラム
EP3358836B1 (en) 2015-09-30 2021-08-25 Sony Group Corporation Information processing system and information processing method
US10347025B2 (en) 2017-02-09 2019-07-09 International Business Machines Corporation Personalized word cloud embedded emblem generation service
US20190156826A1 (en) * 2017-11-18 2019-05-23 Cogi, Inc. Interactive representation of content for relevance detection and review
JP7069766B2 (ja) * 2018-02-02 2022-05-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP7139631B2 (ja) * 2018-03-13 2022-09-21 富士通株式会社 情報処理プログラム、情報処理方法、および情報処理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5092252B2 (ja) * 2006-02-27 2012-12-05 大日本印刷株式会社 トレンド解析サーバおよびトレンド解析方法
GB2444284A (en) * 2006-09-18 2008-06-04 Yann Emmanuel Motte Method and apparatus for selection of information and web page generation
US7752534B2 (en) * 2006-09-19 2010-07-06 International Business Machines Corporation Method and apparatus for customizing the display of multidimensional data

Also Published As

Publication number Publication date
JP2010015558A (ja) 2010-01-21
EP2136301A1 (en) 2009-12-23

Similar Documents

Publication Publication Date Title
JP4743915B2 (ja) タグクラウドを視覚化する方法、装置およびコンピュータプログラム
US11269476B2 (en) Concurrent display of search results from differing time-based search queries executed across event data
JP6448207B2 (ja) ビジュアル検索の構築、文書のトリアージおよびカバレッジの追跡
JP5501373B2 (ja) 複数のウェブサイトからデータを収集及びランク付けするためのシステム及び方法
CN103827863B (zh) 动态图像显示区域和在web搜索结果内的图像显示
CA2892814C (en) Systems and methods for identifying and visualizing elements of query results
CN104281701B (zh) 分布式多尺度空间数据查询方法及系统
US8862574B2 (en) Providing a search-result filters toolbar
US8732621B2 (en) Method and apparatus for information visualized expression, and visualized human computer interactive expression interface thereof
US9141703B1 (en) Systems and methods for browsing historical content
JP2009534752A (ja) データセット用モデルの自動生成用のコンピュータシステムおよび方法
US9344507B2 (en) Method of processing web access information and server implementing same
JP2009500747A5 (ja)
US20160103861A1 (en) Method and system for establishing a performance index of websites
CN103678325B (zh) 一种用于提供与初始页面相对应的浏览页面的方法和设备
US20160103913A1 (en) Method and system for calculating a degree of linkage for webpages
JP6431055B2 (ja) 文献のテキストマイニングのシステムおよび方法
KR20090077073A (ko) 퍼스널 음악 추천 매핑
CN104090904B (zh) 一种用于提供目标搜索结果的方法与设备
US20150302090A1 (en) Method and System for the Structural Analysis of Websites
JP4894580B2 (ja) 旬度解析システム、旬度解析方法、及び旬度解析プログラム
JP2012141985A (ja) ユーザグループごとにキーワードの順位を決定するシステムおよび方法
JP4769151B2 (ja) 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体
JP2008210024A (ja) 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体
CN109791797B (zh) 在大数据库中根据化学结构相似性搜索和显示可用信息的系统、装置和方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110509

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees