JP2004086262A - 視覚的情報分類方法、視覚的情報分類装置、視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体 - Google Patents

視覚的情報分類方法、視覚的情報分類装置、視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2004086262A
JP2004086262A JP2002242775A JP2002242775A JP2004086262A JP 2004086262 A JP2004086262 A JP 2004086262A JP 2002242775 A JP2002242775 A JP 2002242775A JP 2002242775 A JP2002242775 A JP 2002242775A JP 2004086262 A JP2004086262 A JP 2004086262A
Authority
JP
Japan
Prior art keywords
information
reference map
distance
unarranged
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002242775A
Other languages
English (en)
Other versions
JP3996470B2 (ja
Inventor
Etsuro Fujita
藤田 悦郎
Shinji Miyahara
宮原 伸二
Shinji Abe
安部 伸治
Yasuhito Hayashi
林 泰仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002242775A priority Critical patent/JP3996470B2/ja
Publication of JP2004086262A publication Critical patent/JP2004086262A/ja
Application granted granted Critical
Publication of JP3996470B2 publication Critical patent/JP3996470B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2137Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps

Abstract

【課題】本発明は、大量の情報を情報間の内容的類似性に基づいて2次元に分類配置するときに、短い時間で分類配置を行えるようにすることを目的とする。
【解決手段】情報に付与されたメタ情報に従って情報の持つ概念ベクトル間の距離を補正し、その補正した距離に従って多次元尺度法などを用いて基準マップを作成した後、未配置の情報が与えられると、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離(あるいは、その距離を補正した距離)の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出することで、基準マップ上に配置されていない情報を基準マップに逐次的に分類配置する。このようにして、個々の情報を基準マップに逐次的に分類配置できるようになることから、情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようになる。
【選択図】     図1

Description

【0001】
【発明の属する技術分野】
本発明は、大量の情報を情報間の内容的類似性に基づいて2次元平面上に分類配置する視覚的情報分類方法およびその装置と、その視覚的情報分類方法の実現に用いられる視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体とに関し、特に、2次元配置の対象となる情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようにする視覚的情報分類方法およびその装置と、その視覚的情報分類方法の実現に用いられる視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体とに関する。
【0002】
【従来の技術】
従来、大量コンテンツを2次元上に視覚的に分類配置する技術が、例えば下記の文献で提案されている。
〔参考文献1〕James A. Wise, et. al. Visualizing the non−visual:Spatial analysis and interaction with information from text documents. Proc. of IEEE Information Visualization ’95, pp.51−58(1995)。
【0003】
この文献では、コンテンツがテキスト文書である場合を対象として、テキスト文書の概念を計量化して概念ベクトルを抽出し、これに多次元尺度法を適用してコンテンツの2次元配置およびそれを用いたブラウジングインタフェースを実現している。
【0004】
【発明が解決しようとする課題】
コンテンツにメタ情報が付与されている場合、これをコンテンツの探索に利用することは効果的である。例えばウェブページの探索の場合なら、多くのポータルサイトなどが提供しているディレクトリサービスを用いることで目的のウェブページを効率的に絞り込むといったことができる。
【0005】
このようなことを考慮し、本発明者は、先に出願した特願2001−352056 や特願2002−55461で、情報にあらかじめ付与された分類カテゴリと概要説明文などのテキストとから情報間の類似性すなわち距離を算出して、多次元尺度法を用いて情報を2次元平面上に分類配置するという発明を出願した。
【0006】
この発明の特徴は、コンテンツを分類カテゴリの単位にクラスター化して配置するという点にある。
【0007】
しかるに、従来のようなコンテンツの2次元配置を行うにしろ、本発明者が先に出願した特願2001−352056 や特願2002−55461に従って情報の2次元配置を行うにしろ、いずれの場合にも、2次元配置の対象となる情報の数が増大すると、多次元尺度法の実施に要する時間が増加するという問題がある。
【0008】
そして、従来のようなコンテンツの2次元配置を行うにしろ、本発明者が先に出願した特願2001−352056 や特願2002−55461に従って情報の2次元配置を行うにしろ、いずれの場合にも、新たに入力された情報を2次元平面的に追加的に配置することができないことから、新たに情報が追加される場合には、新たに入力された情報を含める形で分類配置の処理を最初からやり直さなくてはならないという問題がある。
【0009】
本発明はかかる事情に鑑みてなされたものであって、大量の情報を情報間の内容的類似性に基づいて2次元平面上に分類配置した後に、個々の情報をその分類配置のマップに逐次的に分類配置できるようにすることで、2次元配置の対象となる情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようにする新たな視覚的情報分類技術の提供を目的とする。
【0010】
【課題を解決するための手段】
(1)この目的を達成するために、本発明の視覚的情報分類装置は、大量の情報を情報間の内容的類似性に基づいて2次元平面上に配置するにあたって、分類対象となる情報に分類カテゴリなどのような階層構造をとるメタ情報が付与されていない場合には、▲1▼各々の情報の持つ概念ベクトルの間の距離に基づいて、各々の情報の2次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する作成手段と、▲2▼未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出する算出手段とを備えるように構成する。
【0011】
以上の各処理手段はコンピュータプログラムで実現できるものであり、このコンピュータプログラムは、半導体メモリなどの記録媒体に記録して提供することができる。
【0012】
このように構成される本発明の視覚的情報分類装置では、情報の持つ概念ベクトル間の距離に従って多次元尺度法などを用いて基準マップを作成した後、未配置の情報が与えられると、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出することで、基準マップ上に配置されていない情報を基準マップに逐次的に分類配置する。
【0013】
この分類配置の実現にあたって、未配置情報は、基準マップを構成する情報の中に含まれる概念ベクトル間距離が最も小さなものとなる情報の近傍に配置されることが予想されるので、基準マップを構成する情報の中から、未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、未配置情報の基準マップ上における配置座標を算出するように処理することがある。
【0014】
そして、この分類配置の実現にあたって、これまでに配置座標を算出した未配置情報を基準マップを構成する情報に含める形で、新たに与えられる未配置情報の基準マップ上における配置座標を算出するように処理することがある。
【0015】
(2)また、この目的を達成するために、本発明の視覚的情報分類装置は、大量の情報を情報間の内容的類似性に基づいて2次元平面上に配置するにあたって、分類対象となる情報に分類カテゴリなどのような階層構造をとるメタ情報が付与される場合には、▲1▼各々の情報の持つ概念ベクトルの間の距離を、情報に予め付与された階層構造をとるメタ情報の一致度合いに応じて補正して、その補正した距離に基づいて、各々の情報の2次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する作成手段と、▲2▼未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造、あるいは、その距離をメタ情報の一致度合いに応じて補正した距離の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出する算出手段とを備えるように構成する。
【0016】
以上の各処理手段はコンピュータプログラムで実現できるものであり、このコンピュータプログラムは、半導体メモリなどの記録媒体に記録して提供することができる。
【0017】
このように構成される本発明の視覚的情報分類装置では、情報に付与されたメタ情報に従って情報の持つ概念ベクトル間の距離を補正し、その補正した距離に従って多次元尺度法などを用いて基準マップを作成した後、未配置の情報が与えられると、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造、あるいは、その距離をメタ情報の一致度合いに応じて補正した距離の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出することで、基準マップ上に配置されていない情報を基準マップに逐次的に分類配置する。
【0018】
この分類配置の実現にあたって、未配置情報は、未配置情報に付与されたメタ情報と同一のメタ情報を持つ情報の近傍に配置されることが予想されるので、基準マップを構成する全ての情報を処理対象として、未配置情報の配置座標の算出を行うのではなくて、基準マップを構成する情報の中に含まれる未配置情報に付与されたメタ情報と同一のメタ情報を持つ情報を処理対象として、未配置情報の配置座標の算出を行うように処理することがある。
【0019】
さらに、この分類配置の実現にあたって、未配置情報は、未配置情報に付与されたメタ情報と同一のメタ情報を持ち、かつ、未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報の近傍に配置されることが予想されるので、基準マップを構成する情報の中から、そのような情報を選択して、その選択した情報に焦点を合わせつつ、未配置情報の基準マップ上における配置座標を算出するように処理することがある。
【0020】
そして、この分類配置の実現にあたって、これまでに配置座標を算出した未配置情報を基準マップを構成する情報に含める形で、新たに与えられる未配置情報の基準マップ上における配置座標を算出するように処理することがある。
【0021】
このようにして、本発明によれば、大量の情報を情報間の内容的類似性に基づいて2次元平面上に分類配置した後に、個々の情報をその分類配置のマップに逐次的あるいは追加的に分類配置できるようになることから、2次元配置の対象となる情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようになる。
【0022】
【発明の実施の形態】
以下、コンテンツの視覚的分類に適用した実施の形態に従って、本発明について詳細に説明する。
【0023】
図1は、本発明の一実施形態に係る視覚的コンテンツ分類方法を実施するシステムの構成を示す図である。
【0024】
図1に示す視覚的コンテンツ分類システムは、コンピュータ10と、このコンピュータ10にネットワーク30を介して接続されるコンテンツデータベース(コンテンツDB)20、メタ情報データベース(メタ情報DB)21、概念ベクトルデータベース(概念ベクトルDB)22および配置座標データベース(配置座標DB)23から構成されている。
【0025】
コンピュータ10は、RAM、ROM、磁気ディスクなどからなるメモリ、CPU、ディスプレイによる表示部11、およびマウスやキーボードなどからなる指示入力部12から構成されており、CPUが実行するソフトウェアプログラムによって実現される基準マップ作成部40およびコンテンツ配置部41を備えている。
【0026】
コンテンツDB20には、処理対象となるコンテンツと、その内容を表すテキスト(概要説明文)とが格納されている。
【0027】
また、メタ情報DB21には、コンテンツDB20に格納されている各々のコンテンツに付与された分類カテゴリの情報(実際には最下層の分類カテゴリの情報)が格納されている。
【0028】
この分類カテゴリの情報は、事前に与えられたコンテンツの分類体系に従ってコンテンツ毎に付与されることになる。この実施形態例では、分類カテゴリ情報は、深さN(Nは正の整数である)の階層構造を有しているものとする。
【0029】
図2に、コンテンツを分類するための分類カテゴリの体系の一例を示す。この分類体系に従う場合、コンテンツDB20に格納されている各コンテンツには、図2に示すLij(i,j=1,2,3)のいずれかの適切な分類カテゴリが事前に割り当てられており、この割り当てられた分類カテゴリの情報がメタ情報DB21に格納されている。
【0030】
また、概念ベクトルDB22には、以下で説明する処理によって、コンテンツDB20に格納されている各コンテンツに関しての概念ベクトルが格納されている。
【0031】
また、配置座標DB23には、以下で説明する処理によって、各々のコンテンツの2次元配置座標が格納されている。
【0032】
基準マップ作成部40およびコンテンツ配置部41は、このように構成される視覚的コンテンツ分類システムの下で、以下に説明する処理を実行することで本発明を実現するように動作する。
【0033】
〔1〕基準マップ作成部40の処理
基準マップ作成部40は、コンテンツDB20に格納されているコンテンツを処理対象として、それらの全ての2つのコンテンツの組み合わせについてコンテンツ間の距離を算出して、それに基づいて各々のコンテンツの2次元上での配置座標を算出し、同じ分類カテゴリに含まれるコンテンツ同士が2次元上で集団をなすように近接して配置されるという図3や図4に示すようなコンテンツの散布図画像を作成して、ユーザに提示するという処理を実行する。
【0034】
ここで、図4に示す散布図画像は、図3に示す散布図画像の矩形領域50を拡大表示した場合の例を示しており、この矩形領域50を指定して、拡大縮小操作つまみ51をマウス等により操作することにより表示することが可能となるものである。
【0035】
このようにして作成されるコンテンツの散布図画像は、コンテンツDB20に格納されているコンテンツを使って作成されるものであることから、以下、基準マップと呼ぶことにする。
【0036】
図5に、基準マップ作成部40の実行する処理フローの一実施形態例を図示する。
【0037】
基準マップ作成部40は、図5の処理フローに示すように、先ず最初に、ステップ10で、コンテンツDB20に格納されている各コンテンツの概要説明文をメモリに読み出し、続くステップ11で、メタ情報DB21に格納されている各コンテンツに付与された分類カテゴリの情報(実際には最下層の分類カテゴリの情報)をメモリに読み出す。
【0038】
続いて、ステップ12で、読み出した概要説明文から1つ又は複数の概念ベクトルを算出して、図6に示すように、読み出した最下層分類カテゴリの情報と対応をとる形で概念ベクトルDB22に格納する。
【0039】
ここで、図6では図示していないが、概念ベクトルDB22に格納した概念ベクトルがどのコンテンツのものであるのかについて示すリンク情報についても概念ベクトルDB22に格納することになる。
【0040】
この概念ベクトルは多次元の実数値ベクトルとして表される。なお、概要説明文からの概念ベクトル(事前に定められた語彙に関する重みベクトルとして与えられる)の算出方法については、下記文献に詳述されているのでここでは説明を省略する。
〔参考文献2〕熊本睦他,概念ベースの情報検索への適用−概念ベースを用いた検索の特性評価−,信学技報 AI98−63(1999)。
【0041】
また、概念ベクトルの算出方法として、概念ベースに分類カテゴリの代表語が入力されると、その代表語から連想される語彙や説明文から概念ベクトルを算出するという方法が提案されているので、それを用いることでもよい。この方法については、参考文献2ならびに下記文献に詳述されているのでここでは説明を省略する。
〔参考文献3〕笠原要他,国語辞書を利用した日常語の類似性判別,情処論,Vol.38,No7,pp1272−1283,(1997) 。
【0042】
続いて、ステップ13で、概念ベクトルDB22に格納した各コンテンツの概念ベクトルとそれに対応付けられる最下層分類カテゴリの情報とをメモリに読み出し、続くステップ14で、表示対象となるコンテンツに含まれる2つのコンテンツの全ての組合せについて、コンテンツ間の距離を算出する。
【0043】
なお、2つのコンテンツの全ての組合せとは、必ずしもコンテンツDB20に格納されているコンテンツの全てでなくてもよく、例えば表示対象があらかじめ検索条件等によって絞られている場合には、その表示対象となっているコンテンツから抽出可能な2つのコンテンツの全ての組合せを意味する。
【0044】
このコンテンツ間の距離の算出処理については、後述する図10および図11の処理フローで詳細に説明する。
【0045】
続いて、ステップ15で、算出した距離を使い、多次元尺度構成法によって、各々のコンテンツの2次元平面上での配置座標を算出して、配置座標DB23に格納する。
【0046】
多次元尺度構成法は、高次元ベクトル空間から低次元空間への圧縮アルゴリズムであって、以下に示す目的関数の最小化問題として解かれる。
【0047】
【数1】
Figure 2004086262
【0048】
すなわち、この目的関数の最小値を与える(xa,ya )(a=1,2,....,n)の組が、各々のコンテンツaの2次元上での配置座標となる。ただし、この目的関数で、dab* はコンテンツaとコンテンツbとの間の距離(後述する図10および図11の処理フローで算出する距離)を示し、dabは、
dab ={(xa −xb )2 +(ya −yb )2 1/2 
を示し、nは表示対象となっているコンテンツの総数を示している。
【0049】
この目的関数の最小化問題は、いわゆる最急降下法を用いて求められるが、これについては下記文献に詳述されているのでここでは説明を省略する。
〔参考文献4〕J. W. Sammon. A nonlinear mapping for data structure analysis. IEEE Transactions on Computers, C−18(5):401−409(1969)。
【0050】
続いて、ステップ16で、配置座標DB23に格納した各コンテンツの2次元座標情報をメモリに読み出して、これに基づいてユーザに提示するコンテンツの散布図画像を作成し、続くステップ17で、作成したコンテンツの散布図画像をコンピュータ10の表示部11へ出力する。
【0051】
このようにして作成されるコンテンツの散布図画像は、後述する図10および図11の処理フローで説明するように、コンテンツ間の距離を単に概念ベクトル間の距離で与えるのではなく、コンテンツが分類される分類カテゴリ間の類似性まで考慮して定義することで、多次元尺度構成法の結果にコンテンツの分類カテゴリ情報をも組み込める点に特徴がある。
【0052】
これによって、図3や図4に示したように、同じ分類カテゴリに含まれるコンテンツ同士は、2次元上で集団をなすように近接して配置されるという効果が得られる。
【0053】
次に、図5の処理フローのステップ14で実行するコンテンツ間の距離の算出処理について説明する。
【0054】
図7に例示するように、分類カテゴリ情報は、深さNの階層構造を有している。すなわち、各々のコンテンツは第1階層における分類として、
Li1   : 第1階層の分類カテゴリ
ここで、i1=1,....,M
のいずれかに分類されており(Mは正の整数)、分類カテゴリLi1に分類されたコンテンツは第2階層における分類として、
Li1i2  : Li1を親カテゴリとする第2階層の分類カテゴリ
ここで、i2=i2(i1)=1,....,Mi1
のいずれかに分類されている(Mi1は正の整数)。
【0055】
同様に、第k−1階層においてある分類カテゴリLi1i2i3....i(k−1)に分類されたコンテンツは第k階層における分類として、
Li1i2i3....ik : Li1i2i3....i(k−1)を親カテゴリとする
第k階層の分類カテゴリ
ここで、ik=ik(i1,i2,....,i(k−1))=1,....,Mi1i2i3....i(k−1)
のいずれかに分類されており(Mi1i2i3....i(k−1)は正の整数)、これがk=Nまで続けられる。
【0056】
そして、N階層目における分類カテゴリLi1i2i3....iNの名前が、上述の分類カテゴリ情報としてメタ情報DB21に格納されている。
【0057】
図5の処理フローのステップ14で実行するコンテンツ間の距離の算出処理について、図7に示す分類体系を前提として具体的に説明するならば、視覚的コンテンツ分類システムは、分類カテゴリの第1階層の距離係数行列として、分類カテゴリの第1階層が3つのクラスで構成されることに対応して、例えば、図8(a)に示すように、対角成分については1より小さな値を示すA(A1 <1)を持ち、非対角成分については1よりも大きな値を示すB(B1 ≧1)を持つものを用いる。
【0058】
すなわち、2つのコンテンツの分類カテゴリの第1階層が同一カテゴリにあるときには、1より小さな値を示すA(A1 <1)が割り当てられ、同一カテゴリにないときには、1よりも大きな値を示すB(B1 ≧1)が割り当てられることになる第1階層の距離係数行列を用いるのである。
【0059】
また、分類カテゴリの第2階層の距離係数行列として、分類カテゴリの第2階層が3つのクラスで構成されることに対応して、例えば、図8(b)に示すように、対角成分については1より小さな値を示すA(A2 <1)を持ち、非対角成分については1よりも大きな値を示すB(B2 ≧1)を持つものを用いる。
【0060】
すなわち、2つのコンテンツの分類カテゴリの第2階層が同一カテゴリにあるときには、1より小さな値を示すA(A2 <1)が割り当てられ、同一カテゴリにないときには、1よりも大きな値を示すB(B2 ≧1)が割り当てられることになる第2階層の距離係数行列を用いるのである。
【0061】
また、分類カテゴリの第3階層の距離係数行列として、分類カテゴリの第3階層が3つのクラスで構成されることに対応して、例えば、図8(c)に示すように、対角成分については1より小さな値を示すA(A3 <1)を持ち、非対角成分については1よりも大きな値を示すB(B3 ≧1)を持つものを用いる。
【0062】
すなわち、2つのコンテンツの分類カテゴリの第3階層が同一カテゴリにあるときには、1より小さな値を示すA(A3 <1)が割り当てられ、同一カテゴリにないときには、1よりも大きな値を示すB(B3 ≧1)が割り当てられることになる第3階層の距離係数行列を用いるのである。
【0063】
視覚的コンテンツ分類システムは、この距離係数行列により特定される補正係数wを使って、コンテンツci の概念ベクトルvi と、コンテンツcj の概念ベクトルvj とにより算出されるコンテンツci とコンテンツcj との間の距離“dist(vi,j )”を、“w×dist(vi,j ) ”という算出式に従って補正することで、概念ベクトル間の距離の算出に対して分類カテゴリ情報を反映させるように処理している。
【0064】
このとき用いる補正係数wは、例えば、図9に示すように、2つのコンテンツの分類カテゴリが第1および第2階層のレベルまで一致するときには、分類カテゴリの第3階層が一致するのか否かに応じて、
w=A1 ×A2 ×A3 (第3階層まで一致)
w=A1 ×A2 ×B3 (第3階層は不一致)
と算出し、2つのコンテンツの分類カテゴリが第1階層のレベルまで一致し、かつ第2階層のレベルでは一致しないときには、
w=A1 ×B2 
と算出し、2つのコンテンツの分類カテゴリが第1階層のレベルで一致しないときには、
w=B1 
と算出するようにしている。
【0065】
このようにして算出される補正係数wを用いると、2つのコンテンツの分類カテゴリがより深い階層レベルまで一致する程、“w×dist(vi,j ) ”という算出式に従って算出される2つのコンテンツの距離がより小さなものになるように補正されることになる。
【0066】
図10および図11に、図5の処理フローのステップ14で実行することになるコンテンツ間の距離の算出処理の詳細な処理フローを図示する。
【0067】
この処理フローの実行にあたって、先ず最初に、コンテンツci とコンテンツcj との間のユークリッド距離“dist(vi,j )”を算出する。
【0068】
次に、分類カテゴリ間の距離を表す距離行列(上述した距離係数行列から導出される)をメモリ上に変数として次の通り構成する。
【0069】
まず、第1階層の分類カテゴリLi1(i1=1,....,M)に関する距離行列(wpq)を構成する。ただし、(wpq)はM次非負対称行列である。
【0070】
次に、全てのLi1について、Li1の直下の分類カテゴリLi1i2(i2=i2(i1)=1,....,Mi1)に関する距離行列(w[Li1]pq)を、
w[Li1]pq  : =wi1i1*s[Li1]pq
wi1i1       : 上述の(wpq)の(i1,i1)成分
(s[Li1]pq): Mi1次非負対称行列
のように構成する。ただし、(w[Li1]pq)はMi1次非負対称行列である。
【0071】
次に、全てのLi1i2について、Li1i2の直下の分類カテゴリLi1i2i3(i3=i3(i1,i2) =1,....,Mi1i2)に関する距離行列(w[Li1i2]pq)を、
w [Li1i2]pq  : =w[Li1]i2i2*s[Li1i2]pq
w [Li1]i2i2   : 上述の(w[Li1]pq)の(i2,i2 )成分
(s[Li1i2]pq): Mi1i2次非負対称行列
のように構成する。ただし、(w[Li1i2]pq)はMi1i2次非負対称行列である。
【0072】
以下同様に、k階層目における全てのLi1i2....ikについて、Li1i2....ikの直下の分類カテゴリLi1i2....iki(k+1)(i(k+1)=i(k+1)(i1,i2,....,ik) に関する距離行列(w[Li1i2....ik]pq)を、
w[Li1i2..ik]pq:=w[Li1i2..i(k−1)]ikik *s[Li1i2..ik]pq
w [Li1i2..i(k−1)]ikik :(w[Li1i2..i(k−1)]pq)の(ik,ik)成分
(s[Li1i2..ik]pq):Mi1i2..ik次非負対称行列
のように構成する。ただし、(w[Li1i2....ik]pq)はMi1i2....ik次非負対称行列として定義される。
【0073】
そして、k=N−1まで、この距離行列(w[Li1i2....ik]pq)を構成する。
【0074】
そして、(wpq)および(s[Li1]pq),(s[Li1i2]pq),...,(s[Li1i2....i(N−2)]pq),(s[Li1i2....i(N−1)]pq)の各成分を、対角成分については1より小さい任意の値、非対角成分については1あるいは1より大きい任意の値に設定して、上述の距離行列(wpq),(w[Li1]pq),(w[Li1i2]pq),...,(w[Li1i2....i(N−2)]pq),(w[Li1i2....i(N−1))]pq)の変数全てを初期化する。
【0075】
コンテンツci とコンテンツcj との間の距離の算出では、上記の距離行列を用いて、分類カテゴリ間の距離を考慮した距離dist * ( vi,j )を、
dist * ( vi,j )=w*dist ( vi,j 
という算出式に従って新たに計算してメモリに記録する。
【0076】
ここで、wは、コンテンツci のN階層目の分類カテゴリ名がLi1i2....iN、コンテンツcj のN階層目の分類カテゴリがLj1j2....jNのときに、
Figure 2004086262
のように与えられる。
【0077】
そして、この分類カテゴリ間の距離を考慮した距離dist * ( vi,j )をコンテンツの全ての組合せについて算出し、上記読み出したデータに関する距離行列を構成する。これが上述した多次元尺度法適用処理で用いる距離行列となる。
【0078】
次に、図10および図11の処理フローに従って、図5の処理フローのステップ14で実行することになるコンテンツ間の距離の算出処理について具体的に説明する。
【0079】
視覚的コンテンツ分類システムは、上述した多次元尺度法適用処理のために、コンテンツci とコンテンツcj との間の距離を算出する場合、図10および図11の処理フローに示すように、先ず最初に、ステップ20で、コンテンツci の概念ベクトルvi と、コンテンツcj の概念ベクトルvj との間のユークリッド距離“dist(vi,j )”を算出する。
【0080】
続いて、ステップ21で、分類カテゴリの階層レベルを示す変数kに、第1階層を示す“1”をセットする。
【0081】
続いて、ステップ22で、コンテンツci の分類カテゴリLp の持つ第1階層の分類カテゴリ値と、コンテンツcj の分類カテゴリLq の持つ第1階層の分類カテゴリ値とを特定する。
【0082】
続いて、ステップ23で、その特定した分類カテゴリ値の指す第1階層の距離係数行列の成分値を特定する。すなわち、図8(a)に示すような行列で定義される分類カテゴリの第1階層に対応付けて用意される距離係数行列を参照することで、その特定した分類カテゴリ値の指す成分値(図8(a)の例で説明するならば、A1 かB1 )を特定するのである。
【0083】
続いて、ステップ24で、その特定した成分値を変数wに代入する。続いて、ステップ25で、ステップ22で特定した2つの分類カテゴリ値が一致するのか否かを判断して、一致しないことを判断するときには、ステップ26に進んで、変数wの値とステップ20で算出した距離“dist(vi,j )”とを乗算することで、コンテンツci とコンテンツcj との間の距離を算出して、処理を終了する。
【0084】
一方、ステップ25で、ステップ22で特定した2つの分類カテゴリ値が一致することを判断するときには、ステップ27に進んで、変数kの値を1つインクリメントし、続くステップ28で、変数kの値が分類カテゴリの深さNよりも大きくなったのか否かを判断する。
【0085】
この判断処理により、変数kの値が分類カテゴリの深さNよりも大きくなっていないことを判断するときには、ステップ30に進んで、コンテンツci の分類カテゴリLp の持つ第k階層の分類カテゴリ値と、コンテンツcj の分類カテゴリLq の持つ第k階層の分類カテゴリ値とを特定する。
【0086】
続いて、ステップ31で、その特定した分類カテゴリ値の指す第k階層の距離係数行列の成分値を特定する。すなわち、k=2のときには、図8(b)に示すような行列で定義される分類カテゴリの第2階層に対応付けて用意される距離係数行列を参照することで、その特定した分類カテゴリ値の指す成分値(図8(b)の例で説明するならば、A2 かB2 )を特定するのである。
【0087】
続いて、ステップ32で、その特定した成分値と変数wの値とを乗算して、その乗算結果を新たな変数wの値として変数wに代入する。続いて、ステップ33で、ステップ30で特定した2つの分類カテゴリ値が一致するのか否かを判断して、一致しないことを判断するときには、ステップ34に進んで、変数wの値とステップ20で算出した距離“dist(vi,j )”とを乗算することで、コンテンツci とコンテンツcj との間の距離を算出して、処理を終了する。
【0088】
一方、ステップ33で、ステップ31で特定した2つの分類カテゴリ値が一致することを判断するときには、1つ下の階層レベルの分類カテゴリへの処理に進むべく、ステップ27に戻る。
【0089】
そして、ステップ27〜ステップ33の処理を繰り返していくことで、ステップ28で、変数kの値が分類カテゴリの深さNよりも大きくなったことを判断するときには、ステップ29に進んで、変数wの値とステップ20で算出した距離“dist(vi,j )”とを乗算することで、コンテンツci とコンテンツcj との間の距離を算出して、処理を終了する。
【0090】
このようにして、視覚的コンテンツ分類システムは、例えば、図9に示したように、2つのコンテンツの分類カテゴリが第1および第2階層のレベルまで一致するときには、分類カテゴリの第3階層が一致するのか否かに応じて、補正係数wを、
w=A1 ×A2 ×A3 (第3階層まで一致)
w=A1 ×A2 ×B3 (第3階層は不一致)
と算出し、2つのコンテンツの分類カテゴリが第1階層のレベルまで一致し、かつ第2階層のレベルでは一致しないときには、
w=A1 ×B2 
と算出し、2つのコンテンツの分類カテゴリが第1階層のレベルで一致しないときには、
w=B1 
と算出するように処理して、そのようにして算出した補正係数wと、概念ベクトル間のユークリッド距離“dist(vi,j )”とを乗算することで、コンテンツci とコンテンツcj との間の距離を算出するように処理するのである。
【0091】
このようにして算出される補正係数wを用いると、2つのコンテンツの分類カテゴリがより深い階層レベルまで一致する程、“w×dist(vi,j ) ”という算出式に従って算出される2つのコンテンツの距離がより小さなものになるように補正されることになる。
【0092】
以上説明したように、基準マップ作成部40は、コンテンツDB20に格納されているコンテンツを処理対象として、それらの全ての2つのコンテンツの組み合わせについてコンテンツ間の距離を算出して、それに基づいて各々のコンテンツの2次元上での配置座標を算出し、同じ分類カテゴリに含まれるコンテンツ同士が2次元上で集団をなすように近接して配置されるという図3や図4に示すようなコンテンツの散布図画像(基準マップ)を作成して、ユーザに提示するように処理するのである。
【0093】
〔2〕コンテンツ配置部41の処理
コンテンツ配置部41は、基準マップ作成部40により基準マップ(コンテンツの散布図画像)が作成された後に、基準マップに配置されていないコンテンツが与えられると、そのコンテンツの基準マップ上の配置座標を算出して基準マップに配置するとともに、そのコンテンツに関する情報をコンテンツDB20/メタ情報DB21/概念ベクトルDB22/配置座標DB23に登録するという処理を実行する。
【0094】
図12および図13に、コンテンツ配置部41の実行する処理フローの一実施形態例を図示する。
【0095】
次に、この処理フローに従って、コンテンツ配置部41の実行する処理について詳細に説明する。
【0096】
コンテンツ配置部41は、基準マップに配置されていないコンテンツの配置要求が発行されると、図12および図13の処理フローに示すように、先ず最初に、ステップ40で、配置対象コンテンツの分類カテゴリ情報(実際には最下層の分類カテゴリの情報)を取得する。
【0097】
続いて、ステップ41で、配置対象コンテンツの概要説明文を入手して、上述した基準マップ作成部40と同様の処理に従って、それから配置対象コンテンツの概念ベクトル(以下、この概念ベクトルをVで表す)を算出する。
【0098】
続いて、ステップ42で、配置座標DB23および概念ベクトルDB22から、基準マップ上に配置される各コンテンツ、すなわち各概念ベクトル{Xi}の2次元座標{xi}を読み出すとともに、それらの各概念ベクトル{Xi}の属する分類カテゴリ情報(最下層分類カテゴリの情報)を読み出す。
【0099】
続いて、ステップ43で、読み出した概念ベクトルを処理対象として、配置対象コンンテツの属する最下層分類カテゴリ配下の概念ベクトルの内、配置対象コンテンツの概念ベクトルVとの間の距離が最も近い概念ベクトル(以下、この概念ベクトルをYで表す)を特定する。
【0100】
なお、このとき算出する距離については、同一の分類カテゴリに属していることから、上述したような補正を行う必要はない。
【0101】
続いて、ステップ44で、ステップ43で求めた概念ベクトルYの2次元座標yを中心とする近傍領域Ny(t)の初期値として、全ての概念ベクトル{Xi}の2次元座標{xi}を含むものを設定する。なお、変数tは、以下の説明から分かるように、処理の繰り返し回数を表している。
【0102】
続いて、ステップ45で、配置対象コンテンツの概念ベクトルVを基準マップに投影したときの2次元座標v(t) の初期値として、適当な2次元座標を設定する。
【0103】
このとき、2次元座標v(t) の初期値として、概念ベクトルYの2次元座標yを設定したり、その近傍の2次元座標を設定することが好ましいが、それに限られるものではない。
【0104】
続いて、ステップ46で、近傍領域Ny(t)に属する全ての概念ベクトル{Xi}の2次元座標{xi}について処理を行ったのか否かを判断して、全ての2次元座標{xi}について処理を行っていないことを判断するときには、ステップ47に進んで、未処理の2次元座標{xi}(未処理の概念ベクトル{Xi})を1つ選択する。
【0105】
続いて、ステップ48で、配置対象コンテンツの概念ベクトルVおよびその2次元座標v(t) と、選択した概念ベクトル{Xi}およびその2次元座標{xi}とを使い、
v2(t)=v(t)+a(t)*h(d*(V,Xi))*[xi−v(t)] ‥‥‥(i)式
v(t)=v2(t)               ‥‥‥ (ii) 式
という計算式に従って、配置対象コンテンツの2次元座標v(t) を修正して、ステップ46に戻る。
【0106】
すなわち、先ず最初に、配置対象コンテンツの概念ベクトルVおよびその2次元座標v(t) と、選択した概念ベクトル{Xi}およびその2次元座標{xi}とを使って(i)式を計算することでv2(t)を計算し、それを新たなv(t) と修正することで、配置対象コンテンツの2次元座標v(t) を修正して、ステップ46に戻るように処理するのである。
【0107】
ここで、「a(t) 」は、tとともに単調に減少する正値関数を表している。また、「d*(V,Xi)」は、概念ベクトルVとステップ47で選択した概念ベクトル{Xi}との間の距離を表している。この距離としては、上述のアルゴリズムに従って分類カテゴリ情報により補正した距離を用いることが好ましいが、そのような補正を行わない距離を用いることも可能である。
【0108】
また、「h(・)」は、tに依存しない正値の単調減少関数を表し、概念ベクトルVと概念ベクトル{Xi}との間の距離が大きくなるに従って小さな値を示す関数である。
【0109】
この(i)式は、配置対象コンテンツの概念ベクトルVの2次元座標v(t) を、ステップ47で選択した概念ベクトル{Xi}の2次元座標{xi}に近づける形で修正することを意味しているが、この修正にあたって、概念ベクトルVとステップ47で選択した概念ベクトル{Xi}との間の距離が大きいときにはh(・)の値が小さくなることで、その近づける量を小さなものとなるようにしている。
【0110】
このようにしてステップ46〜ステップ48を繰り返していくことで、図14で説明するならば、図中の▲1▼に示すように、ある概念ベクトル{Xi}/2次元座標{xi}を選択すると、図中の▲2▼に示すように、それを使ってv2(t)を計算して、図中の▲3▼に示すように、その計算したv2(t)を新たなv(t) とすることでv(t) を修正し、次に、図中の▲4▼に示すように、別の概念ベクトル{Xi}/2次元座標{xi}を選択すると、図中の▲5▼に示すように、それを使ってv2(t)を計算して、図中の▲6▼に示すように、その計算したv2(t)を新たなv(t) とすることでv(t) を修正するという処理を繰り返していくことになる。
【0111】
そして、このようにしてステップ46〜ステップ48を繰り返していくときに、ステップ46で、近傍領域Ny(t)に属する全ての概念ベクトル{Xi}の2次元座標{xi}について処理を行ったことを判断するときには、ステップ49に進んで、配置対象コンテンツの2次元座標v(t) をv(t+1) に更新する。
【0112】
続いて、ステップ50で、ステップ44で設定した概念ベクトルYの2次元座標yを中心とする近傍領域Ny(t)を、例えば規定の縮小率に従って、その大きさが縮小する形でNy(t+1)に更新する。
【0113】
続いて、ステップ51で、その縮小した近傍領域Ny(t+1)の中に、概念ベクトルYの2次元座標yしか存在しないという状態に到達したのか否かを判断して、そのような状態に到達していないことを判断するときには、ステップ54に進んで、(i)式の係数a(t) を、例えば規定の縮小率に従って、その大きさが小さくなる形でa(t+1) に更新し、続くステップ55で、v(t+1) を新たなv(t) とし、Ny(t+1) を新たなNy(t) とし、a(t+1) を新たなa(t) として、ステップ46に戻る。
【0114】
一方、ステップ51で、近傍領域Ny(t+1)の中に、概念ベクトルYの2次元座標yしか存在しないという状態に到達したことを判断するときには、ステップ52に進んで、ステップ49で更新したv(t+1) を配置対象コンテンツの配置位置として決定し、続くステップ53で、コンテンツDB20、メタ情報DB21、概念ベクトルDB22、配置座標DB23のそれぞれに、配置対象コンテンツに関する情報を登録して、処理を終了する。
【0115】
このようにして決定されることになる配置対象コンテンツの配置位置v(t+1) は、コンテンツの概念ベクトル間の距離構造を保存するような形で決定されることになることから、基準マップ作成部40により作成された基準マップの形態を崩すことなく、配置対象コンテンツを基準マップ上に配置することができるようになる。
【0116】
このようにして、コンテンツ配置部41は、基準マップ作成部40により基準マップ(コンテンツの散布図画像)が作成された後に、基準マップに配置されていないコンテンツが与えられると、図15に示すように、そのコンテンツの基準マップ上の配置座標を算出して基準マップに配置する(図中の▲印)とともに、そのコンテンツに関する情報をコンテンツDB20/メタ情報DB21/概念ベクトルDB22/配置座標DB23に登録するように処理するのである。
【0117】
ここで、図12および図13の処理フローでは、(i)式に示すように、近傍領域Ny(t)に属する全ての2次元座標{xi}を順番に選択しながら、配置対象コンテンツの2次元座標v(t) を逐次的に修正していくように処理したが、この(i)式に代えて、
v(t)←v(t)+Σa(t)*h(d*(V,Xi))*[xi−v(t)]
但し、Σは全ての2次元座標{xi}についての総和
というように、配置対象コンテンツの2次元座標v(t) を一度に修正するようにしてもよい。
【0118】
また、図12および図13の処理フローでは、基準マップに配置される全ての概念ベクトル{Xi}を処理対象として、配置対象コンテンツの概念ベクトルVの2次元座標v(t) を修正するようにしたが、配置対象コンンテツの属する最下層分類カテゴリ配下の概念ベクトル{Xi}との間の距離が小さいことで、その影響度が大きいことを考慮して、配置対象コンンテツの属する最下層分類カテゴリ配下の概念ベクトル{Xi}のみを処理対象として、配置対象コンテンツの概念ベクトルVの2次元座標v(t) を修正するようにしてもよい。このようにすると、計算量を削減できることで高速化を図れるようになる。
【0119】
また、図12および図13の処理フローでは説明しなかったが、次から次へと配置対象コンテンツが与えられる場合には、これまでに配置座標を算出した配置対象コンテンツについての情報を含めることなく、基準マップ作成部40が作成対象としたコンテンツについての情報のみを使って、新たに与えられる配置対象コンテンツの配置座標を決定するようにしてもよいし、これまでに配置座標を算出した配置対象コンテンツについての情報を基準マップ作成部40が作成対象としたコンテンツの情報に含める形で、新たに与えられる配置対象コンテンツの配置座標を決定するようにしてもよい。
【0120】
図示実施形態例に従って本発明を説明したが、本発明はこれに限定されるものではない。例えば、実施形態例では、コンテンツを分類カテゴリを単位にクラスター化して配置することで基準マップを作成して、未配置のコンテンツをそれに追加するという処理例に従って本発明を説明したが、本発明は分類カテゴリを単位としないで基準マップを作成する場合にもそのまま適用できるものである。
【0121】
また、実施形態例では、分類カテゴリを概念ベクトル間の距離の算出に反映させることで基準マップを作成するということで説明したが、その他のメタ情報を概念ベクトル間の距離の算出に反映させることで基準マップを作成するようにしてもよい。
【0122】
また、実施形態例では、コンテンツの分類を具体例にして本発明を説明したが、本発明はその適用がコンテンツの分類に限られるものではない。
【0123】
【発明の効果】
以上説明したように、本発明によれば、大量の情報を情報間の内容的類似性に基づいて2次元平面上に分類配置した後に、個々の情報をその分類配置のマップに逐次的あるいは追加的に分類配置できるようになることから、2次元配置の対象となる情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようになる。
【0124】
これによって、従来の多次元尺度法を用いたコンテンツの一括配置手法に比べて、処理時間を短縮することが可能になるとともに、日々追加更新されるインターネットなどのディジタルコンテンツを対象とした視覚的分類が可能になるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の一実施形態例である。
【図2】分類カテゴリの体系の一例を示す図である。
【図3】散布図画像の一例を示す図である。
【図4】散布図画像の一例を示す図である。
【図5】基準マップ作成部の実行する処理フローの一実施形態例である。
【図6】概念ベクトルDBの説明図である。
【図7】分類カテゴリの体系の一例を示す図である。
【図8】距離係数行列の説明図である。
【図9】補正係数の説明図である。
【図10】基準マップ作成部の実行する処理フローの一実施形態例である。
【図11】基準マップ作成部の実行する処理フローの一実施形態例である。
【図12】コンテンツ配置部の実行する処理フローの一実施形態例である。
【図13】コンテンツ配置部の実行する処理フローの一実施形態例である。
【図14】コンテンツ配置部の実行する処理の説明図である。
【図15】コンテンツ配置部の実行する処理の説明図である。
【符号の説明】
10 コンピュータ
11 表示部
12 指示入力部
20 コンテンツDB
21 メタ情報DB
22 概念ベクトルDB
23 配置座標DB
30 ネットワーク
40 基準マップ作成部
41 コンテンツ配置部

Claims (14)

  1. 大量の情報を情報間の内容的類似性に基づいて2次元平面上に配置する視覚的情報分類方法であって、
    各々の情報の持つ概念ベクトルの間の距離に基づいて、各々の情報の2次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する過程と、
    未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと上記基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造を保存するような形で、その未配置情報の上記基準マップ上における配置座標を算出する過程とを備えることを、
    特徴とする視覚的情報分類方法。
  2. 請求項1記載の視覚的情報分類方法において、
    上記配置座標を算出する過程では、上記基準マップを構成する情報の中から、上記未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、上記未配置情報の上記基準マップ上における配置座標を算出することを、
    特徴とする視覚的情報分類方法。
  3. 大量の情報を情報間の内容的類似性に基づいて2次元平面上に配置する視覚的情報分類方法であって、
    各々の情報の持つ概念ベクトルの間の距離を、情報に予め付与された階層構造をとるメタ情報の一致度合いに応じて補正して、その補正した距離に基づいて、各々の情報の2次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する過程と、
    未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと上記基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造、あるいは、その距離をメタ情報の一致度合いに応じて補正した距離の構造を保存するような形で、その未配置情報の上記基準マップ上における配置座標を算出する過程とを備えることを、
    特徴とする視覚的情報分類方法。
  4. 請求項3記載の視覚的情報分類方法において、
    上記配置座標を算出する過程では、上記基準マップを構成する情報に代えて、上記基準マップを構成する情報の中に含まれる上記未配置情報に付与されたメタ情報と同一のメタ情報を持つ情報を用いて、上記未配置情報の上記基準マップ上における配置座標を算出することを、
    特徴とする視覚的情報分類方法。
  5. 請求項3又は4記載の視覚的情報分類方法において、
    上記配置座標を算出する過程では、上記未配置情報に付与されたメタ情報と同一のメタ情報を持ち、かつ、上記未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、上記未配置情報の上記基準マップ上における配置座標を算出することを、
    特徴とする視覚的情報分類方法。
  6. 請求項1ないし5のいずれか1項に記載の視覚的情報分類方法において、
    上記配置座標を算出する過程では、これまでに配置座標を算出した未配置情報を上記基準マップを構成する情報に含める形で、新たに与えられる未配置情報の上記基準マップ上における配置座標を算出することを、
    特徴とする視覚的情報分類方法。
  7. 大量の情報を情報間の内容的類似性に基づいて2次元平面上に配置する視覚的情報分類装置であって、
    各々の情報の持つ概念ベクトルの間の距離に基づいて、各々の情報の2次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する手段と、
    未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと上記基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造を保存するような形で、その未配置情報の上記基準マップ上における配置座標を算出する手段とを備えることを、
    特徴とする視覚的情報分類装置。
  8. 請求項7記載の視覚的情報分類装置において、
    上記配置座標を算出する手段は、上記基準マップを構成する情報の中から、上記未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、上記未配置情報の上記基準マップ上における配置座標を算出することを、
    特徴とする視覚的情報分類装置。
  9. 大量の情報を情報間の内容的類似性に基づいて2次元平面上に配置する視覚的情報分類装置であって、
    各々の情報の持つ概念ベクトルの間の距離を、情報に予め付与された階層構造をとるメタ情報の一致度合いに応じて補正して、その補正した距離に基づいて、各々の情報の2次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する手段と、
    未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと上記基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造、あるいは、その距離をメタ情報の一致度合いに応じて補正した距離の構造を保存するような形で、その未配置情報の上記基準マップ上における配置座標を算出する手段とを備えることを、
    特徴とする視覚的情報分類装置。
  10. 請求項9記載の視覚的情報分類装置において、
    上記配置座標を算出する手段は、上記基準マップを構成する情報に代えて、上記基準マップを構成する情報の中に含まれる上記未配置情報に付与されたメタ情報と同一のメタ情報を持つ情報を用いて、上記未配置情報の上記基準マップ上における配置座標を算出することを、
    特徴とする視覚的情報分類装置。
  11. 請求項9又は10記載の視覚的情報分類装置において、
    上記配置座標を算出する手段は、上記未配置情報に付与されたメタ情報と同一のメタ情報を持ち、かつ、上記未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、上記未配置情報の上記基準マップ上における配置座標を算出することを、
    特徴とする視覚的情報分類装置。
  12. 請求項7ないし11のいずれか1項に記載の視覚的情報分類装置において、
    上記配置座標を算出する手段は、これまでに配置座標を算出した未配置情報を上記基準マップを構成する情報に含める形で、新たに与えられる未配置情報の上記基準マップ上における配置座標を算出することを、
    特徴とする視覚的情報分類装置。
  13. 請求項1ないし6のいずれか1項に記載の視覚的情報分類方法の実現に用いられる処理をコンピュータに実行させるための視覚的情報分類プログラム。
  14. 請求項1ないし6のいずれか1項に記載の視覚的情報分類方法の実現に用いられる処理をコンピュータに実行させるための視覚的情報分類プログラムを記録した記録媒体。
JP2002242775A 2002-08-23 2002-08-23 視覚的情報分類方法、視覚的情報分類装置、視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体 Expired - Lifetime JP3996470B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002242775A JP3996470B2 (ja) 2002-08-23 2002-08-23 視覚的情報分類方法、視覚的情報分類装置、視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002242775A JP3996470B2 (ja) 2002-08-23 2002-08-23 視覚的情報分類方法、視覚的情報分類装置、視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2004086262A true JP2004086262A (ja) 2004-03-18
JP3996470B2 JP3996470B2 (ja) 2007-10-24

Family

ID=32051721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002242775A Expired - Lifetime JP3996470B2 (ja) 2002-08-23 2002-08-23 視覚的情報分類方法、視覚的情報分類装置、視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3996470B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309763A (ja) * 2004-04-21 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> コンテンツ連携度計算装置及び方法、並びにプログラム
JP2006135388A (ja) * 2004-11-02 2006-05-25 Pioneer Electronic Corp 情報処理装置、表示制御装置、情報処理方法、そのプログラム、およびそのプログラムを記録した記録媒体
JP2007334865A (ja) * 2006-05-15 2007-12-27 Data Keekibeeka Kk データ処理方法、データ処理装置およびプログラム
JP2007334871A (ja) * 2006-05-15 2007-12-27 Data Keekibeeka Kk データ処理方法、データ処理装置、プログラムおよび記録媒体
JP2008146219A (ja) * 2006-12-07 2008-06-26 Fuji Xerox Co Ltd データ検索システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2008287437A (ja) * 2007-05-16 2008-11-27 Canon Inc 情報処理方法、情報処理装置
JP2009110508A (ja) * 2007-09-19 2009-05-21 Nec (China) Co Ltd オブジェクト間の競合指標計算方法およびシステム
JP2013065336A (ja) * 2012-11-22 2013-04-11 Canon Inc 情報処理方法、情報処理装置
US9400927B2 (en) 2014-12-03 2016-07-26 Fuji Xerox Co., Ltd. Information processing apparatus and non-transitory computer readable medium
JP2020166426A (ja) * 2019-03-28 2020-10-08 株式会社日立ソリューションズ東日本 文書分析装置および文書分析方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309763A (ja) * 2004-04-21 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> コンテンツ連携度計算装置及び方法、並びにプログラム
JP2006135388A (ja) * 2004-11-02 2006-05-25 Pioneer Electronic Corp 情報処理装置、表示制御装置、情報処理方法、そのプログラム、およびそのプログラムを記録した記録媒体
JP2007334865A (ja) * 2006-05-15 2007-12-27 Data Keekibeeka Kk データ処理方法、データ処理装置およびプログラム
JP2007334871A (ja) * 2006-05-15 2007-12-27 Data Keekibeeka Kk データ処理方法、データ処理装置、プログラムおよび記録媒体
JP2008146219A (ja) * 2006-12-07 2008-06-26 Fuji Xerox Co Ltd データ検索システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2008287437A (ja) * 2007-05-16 2008-11-27 Canon Inc 情報処理方法、情報処理装置
JP2009110508A (ja) * 2007-09-19 2009-05-21 Nec (China) Co Ltd オブジェクト間の競合指標計算方法およびシステム
JP2013065336A (ja) * 2012-11-22 2013-04-11 Canon Inc 情報処理方法、情報処理装置
US9400927B2 (en) 2014-12-03 2016-07-26 Fuji Xerox Co., Ltd. Information processing apparatus and non-transitory computer readable medium
JP2020166426A (ja) * 2019-03-28 2020-10-08 株式会社日立ソリューションズ東日本 文書分析装置および文書分析方法
JP7272846B2 (ja) 2019-03-28 2023-05-12 株式会社日立ソリューションズ東日本 文書分析装置および文書分析方法

Also Published As

Publication number Publication date
JP3996470B2 (ja) 2007-10-24

Similar Documents

Publication Publication Date Title
EP1304627B1 (en) Methods, systems, and articles of manufacture for soft hierarchical clustering of co-occurring objects
JP4335335B2 (ja) ドキュメント画像のソート方法
JP3942290B2 (ja) ドキュメント画像のクライアント・ワークステーションへの送信方法
JP2003167914A (ja) マルチメディア情報検索方法、プログラム、記録媒体及びシステム
JP6800825B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP4906900B2 (ja) 画像検索装置、画像検索方法及びプログラム
US20230409645A1 (en) Search needs evaluation apparatus, search needs evaluation system, and search needs evaluation method
Mueen et al. Automatic multilevel medical image annotation and retrieval
WO2016175785A1 (en) Topic identification based on functional summarization
JP2004086262A (ja) 視覚的情報分類方法、視覚的情報分類装置、視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体
US20220300696A1 (en) Text style and emphasis suggestions
Neto et al. Efficient computation and visualization of multiple density-based clustering hierarchies
US9516089B1 (en) Identifying and processing a number of features identified in a document to determine a type of the document
JP4143234B2 (ja) 文書分類装置、文書分類方法及び記憶媒体
Pengcheng et al. Fast Chinese calligraphic character recognition with large-scale data
KR101055363B1 (ko) 다중 자원 기반 검색정보 제공 장치 및 방법
JP2004240887A (ja) 検索情報表示システム及び検索キーワード情報表示方法及び検索キーワード情報表示プログラム
US20140181124A1 (en) Method, apparatus, system and storage medium having computer executable instrutions for determination of a measure of similarity and processing of documents
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
JP4453440B2 (ja) 視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体
JP4359075B2 (ja) 概念抽出システム、概念抽出方法、概念抽出プログラム及び記憶媒体
JP2006251975A (ja) テキスト分類方法ならびにその方法によるプログラム、およびテキスト分類装置
WO2014170965A1 (ja) 文書処理方法、文書処理装置および文書処理プログラム
JPH10111869A (ja) 情報分類装置とその方法
JP6924450B2 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070523

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070802

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 3996470

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110810

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120810

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130810

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term