JP2004086262A

JP2004086262A - 視覚的情報分類方法、視覚的情報分類装置、視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体

Info

Publication number: JP2004086262A
Application number: JP2002242775A
Authority: JP
Inventors: Etsuro Fujita; 藤田　悦郎; Shinji Miyahara; 宮原　伸二; Shinji Abe; 安部　伸治; Yasuhito Hayashi; 林　泰仁
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2002-08-23
Filing date: 2002-08-23
Publication date: 2004-03-18
Anticipated expiration: 2022-08-23
Also published as: JP3996470B2

Abstract

【課題】本発明は、大量の情報を情報間の内容的類似性に基づいて２次元に分類配置するときに、短い時間で分類配置を行えるようにすることを目的とする。
【解決手段】情報に付与されたメタ情報に従って情報の持つ概念ベクトル間の距離を補正し、その補正した距離に従って多次元尺度法などを用いて基準マップを作成した後、未配置の情報が与えられると、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離（あるいは、その距離を補正した距離）の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出することで、基準マップ上に配置されていない情報を基準マップに逐次的に分類配置する。このようにして、個々の情報を基準マップに逐次的に分類配置できるようになることから、情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようになる。
【選択図】　　　　　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、大量の情報を情報間の内容的類似性に基づいて２次元平面上に分類配置する視覚的情報分類方法およびその装置と、その視覚的情報分類方法の実現に用いられる視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体とに関し、特に、２次元配置の対象となる情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようにする視覚的情報分類方法およびその装置と、その視覚的情報分類方法の実現に用いられる視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体とに関する。
【０００２】
【従来の技術】
従来、大量コンテンツを２次元上に視覚的に分類配置する技術が、例えば下記の文献で提案されている。
〔参考文献１〕Ｊａｍｅｓ　Ａ．　Ｗｉｓｅ，　ｅｔ．　ａｌ．　Ｖｉｓｕａｌｉｚｉｎｇ　ｔｈｅ　ｎｏｎ−ｖｉｓｕａｌ：Ｓｐａｔｉａｌ　ａｎａｌｙｓｉｓ　ａｎｄ　ｉｎｔｅｒａｃｔｉｏｎ　ｗｉｔｈ　ｉｎｆｏｒｍａｔｉｏｎ　ｆｒｏｍ　ｔｅｘｔ　ｄｏｃｕｍｅｎｔｓ．　Ｐｒｏｃ．　ｏｆ　ＩＥＥＥ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｖｉｓｕａｌｉｚａｔｉｏｎ　’９５，　ｐｐ．５１−５８（１９９５）。
【０００３】
この文献では、コンテンツがテキスト文書である場合を対象として、テキスト文書の概念を計量化して概念ベクトルを抽出し、これに多次元尺度法を適用してコンテンツの２次元配置およびそれを用いたブラウジングインタフェースを実現している。
【０００４】
【発明が解決しようとする課題】
コンテンツにメタ情報が付与されている場合、これをコンテンツの探索に利用することは効果的である。例えばウェブページの探索の場合なら、多くのポータルサイトなどが提供しているディレクトリサービスを用いることで目的のウェブページを効率的に絞り込むといったことができる。
【０００５】
このようなことを考慮し、本発明者は、先に出願した特願２００１−３５２０５６　や特願２００２−５５４６１で、情報にあらかじめ付与された分類カテゴリと概要説明文などのテキストとから情報間の類似性すなわち距離を算出して、多次元尺度法を用いて情報を２次元平面上に分類配置するという発明を出願した。
【０００６】
この発明の特徴は、コンテンツを分類カテゴリの単位にクラスター化して配置するという点にある。
【０００７】
しかるに、従来のようなコンテンツの２次元配置を行うにしろ、本発明者が先に出願した特願２００１−３５２０５６　や特願２００２−５５４６１に従って情報の２次元配置を行うにしろ、いずれの場合にも、２次元配置の対象となる情報の数が増大すると、多次元尺度法の実施に要する時間が増加するという問題がある。
【０００８】
そして、従来のようなコンテンツの２次元配置を行うにしろ、本発明者が先に出願した特願２００１−３５２０５６　や特願２００２−５５４６１に従って情報の２次元配置を行うにしろ、いずれの場合にも、新たに入力された情報を２次元平面的に追加的に配置することができないことから、新たに情報が追加される場合には、新たに入力された情報を含める形で分類配置の処理を最初からやり直さなくてはならないという問題がある。
【０００９】
本発明はかかる事情に鑑みてなされたものであって、大量の情報を情報間の内容的類似性に基づいて２次元平面上に分類配置した後に、個々の情報をその分類配置のマップに逐次的に分類配置できるようにすることで、２次元配置の対象となる情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようにする新たな視覚的情報分類技術の提供を目的とする。
【００１０】
【課題を解決するための手段】
（１）この目的を達成するために、本発明の視覚的情報分類装置は、大量の情報を情報間の内容的類似性に基づいて２次元平面上に配置するにあたって、分類対象となる情報に分類カテゴリなどのような階層構造をとるメタ情報が付与されていない場合には、▲１▼各々の情報の持つ概念ベクトルの間の距離に基づいて、各々の情報の２次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する作成手段と、▲２▼未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出する算出手段とを備えるように構成する。
【００１１】
以上の各処理手段はコンピュータプログラムで実現できるものであり、このコンピュータプログラムは、半導体メモリなどの記録媒体に記録して提供することができる。
【００１２】
このように構成される本発明の視覚的情報分類装置では、情報の持つ概念ベクトル間の距離に従って多次元尺度法などを用いて基準マップを作成した後、未配置の情報が与えられると、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出することで、基準マップ上に配置されていない情報を基準マップに逐次的に分類配置する。
【００１３】
この分類配置の実現にあたって、未配置情報は、基準マップを構成する情報の中に含まれる概念ベクトル間距離が最も小さなものとなる情報の近傍に配置されることが予想されるので、基準マップを構成する情報の中から、未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、未配置情報の基準マップ上における配置座標を算出するように処理することがある。
【００１４】
そして、この分類配置の実現にあたって、これまでに配置座標を算出した未配置情報を基準マップを構成する情報に含める形で、新たに与えられる未配置情報の基準マップ上における配置座標を算出するように処理することがある。
【００１５】
（２）また、この目的を達成するために、本発明の視覚的情報分類装置は、大量の情報を情報間の内容的類似性に基づいて２次元平面上に配置するにあたって、分類対象となる情報に分類カテゴリなどのような階層構造をとるメタ情報が付与される場合には、▲１▼各々の情報の持つ概念ベクトルの間の距離を、情報に予め付与された階層構造をとるメタ情報の一致度合いに応じて補正して、その補正した距離に基づいて、各々の情報の２次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する作成手段と、▲２▼未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造、あるいは、その距離をメタ情報の一致度合いに応じて補正した距離の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出する算出手段とを備えるように構成する。
【００１６】
以上の各処理手段はコンピュータプログラムで実現できるものであり、このコンピュータプログラムは、半導体メモリなどの記録媒体に記録して提供することができる。
【００１７】
このように構成される本発明の視覚的情報分類装置では、情報に付与されたメタ情報に従って情報の持つ概念ベクトル間の距離を補正し、その補正した距離に従って多次元尺度法などを用いて基準マップを作成した後、未配置の情報が与えられると、その未配置情報の持つ概念ベクトルと基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造、あるいは、その距離をメタ情報の一致度合いに応じて補正した距離の構造を保存するような形で、その未配置情報の基準マップ上における配置座標を算出することで、基準マップ上に配置されていない情報を基準マップに逐次的に分類配置する。
【００１８】
この分類配置の実現にあたって、未配置情報は、未配置情報に付与されたメタ情報と同一のメタ情報を持つ情報の近傍に配置されることが予想されるので、基準マップを構成する全ての情報を処理対象として、未配置情報の配置座標の算出を行うのではなくて、基準マップを構成する情報の中に含まれる未配置情報に付与されたメタ情報と同一のメタ情報を持つ情報を処理対象として、未配置情報の配置座標の算出を行うように処理することがある。
【００１９】
さらに、この分類配置の実現にあたって、未配置情報は、未配置情報に付与されたメタ情報と同一のメタ情報を持ち、かつ、未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報の近傍に配置されることが予想されるので、基準マップを構成する情報の中から、そのような情報を選択して、その選択した情報に焦点を合わせつつ、未配置情報の基準マップ上における配置座標を算出するように処理することがある。
【００２０】
そして、この分類配置の実現にあたって、これまでに配置座標を算出した未配置情報を基準マップを構成する情報に含める形で、新たに与えられる未配置情報の基準マップ上における配置座標を算出するように処理することがある。
【００２１】
このようにして、本発明によれば、大量の情報を情報間の内容的類似性に基づいて２次元平面上に分類配置した後に、個々の情報をその分類配置のマップに逐次的あるいは追加的に分類配置できるようになることから、２次元配置の対象となる情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようになる。
【００２２】
【発明の実施の形態】
以下、コンテンツの視覚的分類に適用した実施の形態に従って、本発明について詳細に説明する。
【００２３】
図１は、本発明の一実施形態に係る視覚的コンテンツ分類方法を実施するシステムの構成を示す図である。
【００２４】
図１に示す視覚的コンテンツ分類システムは、コンピュータ１０と、このコンピュータ１０にネットワーク３０を介して接続されるコンテンツデータベース（コンテンツＤＢ）２０、メタ情報データベース（メタ情報ＤＢ）２１、概念ベクトルデータベース（概念ベクトルＤＢ）２２および配置座標データベース（配置座標ＤＢ）２３から構成されている。
【００２５】
コンピュータ１０は、ＲＡＭ、ＲＯＭ、磁気ディスクなどからなるメモリ、ＣＰＵ、ディスプレイによる表示部１１、およびマウスやキーボードなどからなる指示入力部１２から構成されており、ＣＰＵが実行するソフトウェアプログラムによって実現される基準マップ作成部４０およびコンテンツ配置部４１を備えている。
【００２６】
コンテンツＤＢ２０には、処理対象となるコンテンツと、その内容を表すテキスト（概要説明文）とが格納されている。
【００２７】
また、メタ情報ＤＢ２１には、コンテンツＤＢ２０に格納されている各々のコンテンツに付与された分類カテゴリの情報（実際には最下層の分類カテゴリの情報）が格納されている。
【００２８】
この分類カテゴリの情報は、事前に与えられたコンテンツの分類体系に従ってコンテンツ毎に付与されることになる。この実施形態例では、分類カテゴリ情報は、深さＮ（Ｎは正の整数である）の階層構造を有しているものとする。
【００２９】
図２に、コンテンツを分類するための分類カテゴリの体系の一例を示す。この分類体系に従う場合、コンテンツＤＢ２０に格納されている各コンテンツには、図２に示すＬｉｊ（ｉ，ｊ＝１，２，３）のいずれかの適切な分類カテゴリが事前に割り当てられており、この割り当てられた分類カテゴリの情報がメタ情報ＤＢ２１に格納されている。
【００３０】
また、概念ベクトルＤＢ２２には、以下で説明する処理によって、コンテンツＤＢ２０に格納されている各コンテンツに関しての概念ベクトルが格納されている。
【００３１】
また、配置座標ＤＢ２３には、以下で説明する処理によって、各々のコンテンツの２次元配置座標が格納されている。
【００３２】
基準マップ作成部４０およびコンテンツ配置部４１は、このように構成される視覚的コンテンツ分類システムの下で、以下に説明する処理を実行することで本発明を実現するように動作する。
【００３３】
〔１〕基準マップ作成部４０の処理
基準マップ作成部４０は、コンテンツＤＢ２０に格納されているコンテンツを処理対象として、それらの全ての２つのコンテンツの組み合わせについてコンテンツ間の距離を算出して、それに基づいて各々のコンテンツの２次元上での配置座標を算出し、同じ分類カテゴリに含まれるコンテンツ同士が２次元上で集団をなすように近接して配置されるという図３や図４に示すようなコンテンツの散布図画像を作成して、ユーザに提示するという処理を実行する。
【００３４】
ここで、図４に示す散布図画像は、図３に示す散布図画像の矩形領域５０を拡大表示した場合の例を示しており、この矩形領域５０を指定して、拡大縮小操作つまみ５１をマウス等により操作することにより表示することが可能となるものである。
【００３５】
このようにして作成されるコンテンツの散布図画像は、コンテンツＤＢ２０に格納されているコンテンツを使って作成されるものであることから、以下、基準マップと呼ぶことにする。
【００３６】
図５に、基準マップ作成部４０の実行する処理フローの一実施形態例を図示する。
【００３７】
基準マップ作成部４０は、図５の処理フローに示すように、先ず最初に、ステップ１０で、コンテンツＤＢ２０に格納されている各コンテンツの概要説明文をメモリに読み出し、続くステップ１１で、メタ情報ＤＢ２１に格納されている各コンテンツに付与された分類カテゴリの情報（実際には最下層の分類カテゴリの情報）をメモリに読み出す。
【００３８】
続いて、ステップ１２で、読み出した概要説明文から１つ又は複数の概念ベクトルを算出して、図６に示すように、読み出した最下層分類カテゴリの情報と対応をとる形で概念ベクトルＤＢ２２に格納する。
【００３９】
ここで、図６では図示していないが、概念ベクトルＤＢ２２に格納した概念ベクトルがどのコンテンツのものであるのかについて示すリンク情報についても概念ベクトルＤＢ２２に格納することになる。
【００４０】
この概念ベクトルは多次元の実数値ベクトルとして表される。なお、概要説明文からの概念ベクトル（事前に定められた語彙に関する重みベクトルとして与えられる）の算出方法については、下記文献に詳述されているのでここでは説明を省略する。
〔参考文献２〕熊本睦他，概念ベースの情報検索への適用−概念ベースを用いた検索の特性評価−，信学技報　ＡＩ９８−６３（１９９９）。
【００４１】
また、概念ベクトルの算出方法として、概念ベースに分類カテゴリの代表語が入力されると、その代表語から連想される語彙や説明文から概念ベクトルを算出するという方法が提案されているので、それを用いることでもよい。この方法については、参考文献２ならびに下記文献に詳述されているのでここでは説明を省略する。
〔参考文献３〕笠原要他，国語辞書を利用した日常語の類似性判別，情処論，Ｖｏｌ．３８，Ｎｏ７，ｐｐ１２７２−１２８３，（１９９７）　。
【００４２】
続いて、ステップ１３で、概念ベクトルＤＢ２２に格納した各コンテンツの概念ベクトルとそれに対応付けられる最下層分類カテゴリの情報とをメモリに読み出し、続くステップ１４で、表示対象となるコンテンツに含まれる２つのコンテンツの全ての組合せについて、コンテンツ間の距離を算出する。
【００４３】
なお、２つのコンテンツの全ての組合せとは、必ずしもコンテンツＤＢ２０に格納されているコンテンツの全てでなくてもよく、例えば表示対象があらかじめ検索条件等によって絞られている場合には、その表示対象となっているコンテンツから抽出可能な２つのコンテンツの全ての組合せを意味する。
【００４４】
このコンテンツ間の距離の算出処理については、後述する図１０および図１１の処理フローで詳細に説明する。
【００４５】
続いて、ステップ１５で、算出した距離を使い、多次元尺度構成法によって、各々のコンテンツの２次元平面上での配置座標を算出して、配置座標ＤＢ２３に格納する。
【００４６】
多次元尺度構成法は、高次元ベクトル空間から低次元空間への圧縮アルゴリズムであって、以下に示す目的関数の最小化問題として解かれる。
【００４７】
【数１】

【００４８】
すなわち、この目的関数の最小値を与える（ｘａ，ｙａ　）（ａ＝１，２，．．．．，ｎ）の組が、各々のコンテンツａの２次元上での配置座標となる。ただし、この目的関数で、ｄａｂ^＊はコンテンツａとコンテンツｂとの間の距離（後述する図１０および図１１の処理フローで算出する距離）を示し、ｄａｂは、
ｄａｂ　＝｛（ｘａ　−ｘｂ　）^２＋（ｙａ　−ｙｂ　）^２｝^１／２
を示し、ｎは表示対象となっているコンテンツの総数を示している。
【００４９】
この目的関数の最小化問題は、いわゆる最急降下法を用いて求められるが、これについては下記文献に詳述されているのでここでは説明を省略する。
〔参考文献４〕Ｊ．　Ｗ．　Ｓａｍｍｏｎ．　Ａ　ｎｏｎｌｉｎｅａｒ　ｍａｐｐｉｎｇ　ｆｏｒ　ｄａｔａ　ｓｔｒｕｃｔｕｒｅ　ａｎａｌｙｓｉｓ．　ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｃｏｍｐｕｔｅｒｓ，　Ｃ−１８（５）：４０１−４０９（１９６９）。
【００５０】
続いて、ステップ１６で、配置座標ＤＢ２３に格納した各コンテンツの２次元座標情報をメモリに読み出して、これに基づいてユーザに提示するコンテンツの散布図画像を作成し、続くステップ１７で、作成したコンテンツの散布図画像をコンピュータ１０の表示部１１へ出力する。
【００５１】
このようにして作成されるコンテンツの散布図画像は、後述する図１０および図１１の処理フローで説明するように、コンテンツ間の距離を単に概念ベクトル間の距離で与えるのではなく、コンテンツが分類される分類カテゴリ間の類似性まで考慮して定義することで、多次元尺度構成法の結果にコンテンツの分類カテゴリ情報をも組み込める点に特徴がある。
【００５２】
これによって、図３や図４に示したように、同じ分類カテゴリに含まれるコンテンツ同士は、２次元上で集団をなすように近接して配置されるという効果が得られる。
【００５３】
次に、図５の処理フローのステップ１４で実行するコンテンツ間の距離の算出処理について説明する。
【００５４】
図７に例示するように、分類カテゴリ情報は、深さＮの階層構造を有している。すなわち、各々のコンテンツは第１階層における分類として、
Ｌｉ１　　　：　第１階層の分類カテゴリ
ここで、ｉ１＝１，．．．．，Ｍ
のいずれかに分類されており（Ｍは正の整数）、分類カテゴリＬｉ１に分類されたコンテンツは第２階層における分類として、
Ｌｉ１ｉ２　　：　Ｌｉ１を親カテゴリとする第２階層の分類カテゴリ
ここで、ｉ２＝ｉ２（ｉ１）＝１，．．．．，Ｍｉ１
のいずれかに分類されている（Ｍｉ１は正の整数）。
【００５５】
同様に、第ｋ−１階層においてある分類カテゴリＬｉ１ｉ２ｉ３．．．．ｉ（ｋ−１）に分類されたコンテンツは第ｋ階層における分類として、
Ｌｉ１ｉ２ｉ３．．．．ｉｋ　：　Ｌｉ１ｉ２ｉ３．．．．ｉ（ｋ−１）を親カテゴリとする
第ｋ階層の分類カテゴリ
ここで、ｉｋ＝ｉｋ（ｉ１，ｉ２，．．．．，ｉ（ｋ−１））＝１，．．．．，Ｍｉ１ｉ２ｉ３．．．．ｉ（ｋ−１）
のいずれかに分類されており（Ｍｉ１ｉ２ｉ３．．．．ｉ（ｋ−１）は正の整数）、これがｋ＝Ｎまで続けられる。
【００５６】
そして、Ｎ階層目における分類カテゴリＬｉ１ｉ２ｉ３．．．．ｉＮの名前が、上述の分類カテゴリ情報としてメタ情報ＤＢ２１に格納されている。
【００５７】
図５の処理フローのステップ１４で実行するコンテンツ間の距離の算出処理について、図７に示す分類体系を前提として具体的に説明するならば、視覚的コンテンツ分類システムは、分類カテゴリの第１階層の距離係数行列として、分類カテゴリの第１階層が３つのクラスで構成されることに対応して、例えば、図８（ａ）に示すように、対角成分については１より小さな値を示すＡ_１（Ａ_１＜１）を持ち、非対角成分については１よりも大きな値を示すＢ_１（Ｂ_１≧１）を持つものを用いる。
【００５８】
すなわち、２つのコンテンツの分類カテゴリの第１階層が同一カテゴリにあるときには、１より小さな値を示すＡ_１（Ａ_１＜１）が割り当てられ、同一カテゴリにないときには、１よりも大きな値を示すＢ_１（Ｂ_１≧１）が割り当てられることになる第１階層の距離係数行列を用いるのである。
【００５９】
また、分類カテゴリの第２階層の距離係数行列として、分類カテゴリの第２階層が３つのクラスで構成されることに対応して、例えば、図８（ｂ）に示すように、対角成分については１より小さな値を示すＡ_２（Ａ_２＜１）を持ち、非対角成分については１よりも大きな値を示すＢ_２（Ｂ_２≧１）を持つものを用いる。
【００６０】
すなわち、２つのコンテンツの分類カテゴリの第２階層が同一カテゴリにあるときには、１より小さな値を示すＡ_２（Ａ_２＜１）が割り当てられ、同一カテゴリにないときには、１よりも大きな値を示すＢ_２（Ｂ_２≧１）が割り当てられることになる第２階層の距離係数行列を用いるのである。
【００６１】
また、分類カテゴリの第３階層の距離係数行列として、分類カテゴリの第３階層が３つのクラスで構成されることに対応して、例えば、図８（ｃ）に示すように、対角成分については１より小さな値を示すＡ_３（Ａ_３＜１）を持ち、非対角成分については１よりも大きな値を示すＢ_３（Ｂ_３≧１）を持つものを用いる。
【００６２】
すなわち、２つのコンテンツの分類カテゴリの第３階層が同一カテゴリにあるときには、１より小さな値を示すＡ_３（Ａ_３＜１）が割り当てられ、同一カテゴリにないときには、１よりも大きな値を示すＢ_３（Ｂ_３≧１）が割り当てられることになる第３階層の距離係数行列を用いるのである。
【００６３】
視覚的コンテンツ分類システムは、この距離係数行列により特定される補正係数ｗを使って、コンテンツｃ_ｉの概念ベクトルｖ_ｉと、コンテンツｃ_ｊの概念ベクトルｖ_ｊとにより算出されるコンテンツｃ_ｉとコンテンツｃ_ｊとの間の距離“ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）”を、“ｗ×ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）　”という算出式に従って補正することで、概念ベクトル間の距離の算出に対して分類カテゴリ情報を反映させるように処理している。
【００６４】
このとき用いる補正係数ｗは、例えば、図９に示すように、２つのコンテンツの分類カテゴリが第１および第２階層のレベルまで一致するときには、分類カテゴリの第３階層が一致するのか否かに応じて、
ｗ＝Ａ_１×Ａ_２×Ａ_３（第３階層まで一致）
ｗ＝Ａ_１×Ａ_２×Ｂ_３（第３階層は不一致）
と算出し、２つのコンテンツの分類カテゴリが第１階層のレベルまで一致し、かつ第２階層のレベルでは一致しないときには、
ｗ＝Ａ_１×Ｂ_２
と算出し、２つのコンテンツの分類カテゴリが第１階層のレベルで一致しないときには、
ｗ＝Ｂ_１
と算出するようにしている。
【００６５】
このようにして算出される補正係数ｗを用いると、２つのコンテンツの分類カテゴリがより深い階層レベルまで一致する程、“ｗ×ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）　”という算出式に従って算出される２つのコンテンツの距離がより小さなものになるように補正されることになる。
【００６６】
図１０および図１１に、図５の処理フローのステップ１４で実行することになるコンテンツ間の距離の算出処理の詳細な処理フローを図示する。
【００６７】
この処理フローの実行にあたって、先ず最初に、コンテンツｃ_ｉとコンテンツｃ_ｊとの間のユークリッド距離“ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）”を算出する。
【００６８】
次に、分類カテゴリ間の距離を表す距離行列（上述した距離係数行列から導出される）をメモリ上に変数として次の通り構成する。
【００６９】
まず、第１階層の分類カテゴリＬｉ１（ｉ１＝１，．．．．，Ｍ）に関する距離行列（ｗｐｑ）を構成する。ただし、（ｗｐｑ）はＭ次非負対称行列である。
【００７０】
次に、全てのＬｉ１について、Ｌｉ１の直下の分類カテゴリＬｉ１ｉ２（ｉ２＝ｉ２（ｉ１）＝１，．．．．，Ｍｉ１）に関する距離行列（ｗ［Ｌｉ１］ｐｑ）を、
ｗ［Ｌｉ１］ｐｑ　　：　＝ｗｉ１ｉ１＊ｓ［Ｌｉ１］ｐｑ
ｗｉ１ｉ１　　　　　　　：　上述の（ｗｐｑ）の（ｉ１，ｉ１）成分
（ｓ［Ｌｉ１］ｐｑ）：　Ｍｉ１次非負対称行列
のように構成する。ただし、（ｗ［Ｌｉ１］ｐｑ）はＭｉ１次非負対称行列である。
【００７１】
次に、全てのＬｉ１ｉ２について、Ｌｉ１ｉ２の直下の分類カテゴリＬｉ１ｉ２ｉ３（ｉ３＝ｉ３（ｉ１，ｉ２）　＝１，．．．．，Ｍｉ１ｉ２）に関する距離行列（ｗ［Ｌｉ１ｉ２］ｐｑ）を、
ｗ　［Ｌｉ１ｉ２］ｐｑ　　：　＝ｗ［Ｌｉ１］ｉ２ｉ２＊ｓ［Ｌｉ１ｉ２］ｐｑ
ｗ　［Ｌｉ１］ｉ２ｉ２　　　：　上述の（ｗ［Ｌｉ１］ｐｑ）の（ｉ２，ｉ２　）成分
（ｓ［Ｌｉ１ｉ２］ｐｑ）：　Ｍｉ１ｉ２次非負対称行列
のように構成する。ただし、（ｗ［Ｌｉ１ｉ２］ｐｑ）はＭｉ１ｉ２次非負対称行列である。
【００７２】
以下同様に、ｋ階層目における全てのＬｉ１ｉ２．．．．ｉｋについて、Ｌｉ１ｉ２．．．．ｉｋの直下の分類カテゴリＬｉ１ｉ２．．．．ｉｋｉ（ｋ＋１）（ｉ（ｋ＋１）＝ｉ（ｋ＋１）（ｉ１，ｉ２，．．．．，ｉｋ）　に関する距離行列（ｗ［Ｌｉ１ｉ２．．．．ｉｋ］ｐｑ）を、
ｗ［Ｌｉ１ｉ２．．ｉｋ］ｐｑ：＝ｗ［Ｌｉ１ｉ２．．ｉ（ｋ−１）］ｉｋｉｋ　＊ｓ［Ｌｉ１ｉ２．．ｉｋ］ｐｑ
ｗ　［Ｌｉ１ｉ２．．ｉ（ｋ−１）］ｉｋｉｋ　：（ｗ［Ｌｉ１ｉ２．．ｉ（ｋ−１）］ｐｑ）の（ｉｋ，ｉｋ）成分
（ｓ［Ｌｉ１ｉ２．．ｉｋ］ｐｑ）：Ｍｉ１ｉ２．．ｉｋ次非負対称行列
のように構成する。ただし、（ｗ［Ｌｉ１ｉ２．．．．ｉｋ］ｐｑ）はＭｉ１ｉ２．．．．ｉｋ次非負対称行列として定義される。
【００７３】
そして、ｋ＝Ｎ−１まで、この距離行列（ｗ［Ｌｉ１ｉ２．．．．ｉｋ］ｐｑ）を構成する。
【００７４】
そして、（ｗｐｑ）および（ｓ［Ｌｉ１］ｐｑ），（ｓ［Ｌｉ１ｉ２］ｐｑ），．．．，（ｓ［Ｌｉ１ｉ２．．．．ｉ（Ｎ−２）］ｐｑ），（ｓ［Ｌｉ１ｉ２．．．．ｉ（Ｎ−１）］ｐｑ）の各成分を、対角成分については１より小さい任意の値、非対角成分については１あるいは１より大きい任意の値に設定して、上述の距離行列（ｗｐｑ），（ｗ［Ｌｉ１］ｐｑ），（ｗ［Ｌｉ１ｉ２］ｐｑ），．．．，（ｗ［Ｌｉ１ｉ２．．．．ｉ（Ｎ−２）］ｐｑ），（ｗ［Ｌｉ１ｉ２．．．．ｉ（Ｎ−１））］ｐｑ）の変数全てを初期化する。
【００７５】
コンテンツｃ_ｉとコンテンツｃ_ｊとの間の距離の算出では、上記の距離行列を用いて、分類カテゴリ間の距離を考慮した距離ｄｉｓｔ　^＊（　ｖ_ｉ，ｖ_ｊ）を、
ｄｉｓｔ　^＊（　ｖ_ｉ，ｖ_ｊ）＝ｗ＊ｄｉｓｔ　（　ｖ_ｉ，ｖ_ｊ）
という算出式に従って新たに計算してメモリに記録する。
【００７６】
ここで、ｗは、コンテンツｃ_ｉのＮ階層目の分類カテゴリ名がＬｉ１ｉ２．．．．ｉＮ、コンテンツｃ_ｊのＮ階層目の分類カテゴリがＬｊ１ｊ２．．．．ｊＮのときに、

のように与えられる。
【００７７】
そして、この分類カテゴリ間の距離を考慮した距離ｄｉｓｔ　^＊（　ｖ_ｉ，ｖ_ｊ）をコンテンツの全ての組合せについて算出し、上記読み出したデータに関する距離行列を構成する。これが上述した多次元尺度法適用処理で用いる距離行列となる。
【００７８】
次に、図１０および図１１の処理フローに従って、図５の処理フローのステップ１４で実行することになるコンテンツ間の距離の算出処理について具体的に説明する。
【００７９】
視覚的コンテンツ分類システムは、上述した多次元尺度法適用処理のために、コンテンツｃ_ｉとコンテンツｃ_ｊとの間の距離を算出する場合、図１０および図１１の処理フローに示すように、先ず最初に、ステップ２０で、コンテンツｃ_ｉの概念ベクトルｖ_ｉと、コンテンツｃ_ｊの概念ベクトルｖ_ｊとの間のユークリッド距離“ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）”を算出する。
【００８０】
続いて、ステップ２１で、分類カテゴリの階層レベルを示す変数ｋに、第１階層を示す“１”をセットする。
【００８１】
続いて、ステップ２２で、コンテンツｃ_ｉの分類カテゴリＬｐ　の持つ第１階層の分類カテゴリ値と、コンテンツｃ_ｊの分類カテゴリＬｑ　の持つ第１階層の分類カテゴリ値とを特定する。
【００８２】
続いて、ステップ２３で、その特定した分類カテゴリ値の指す第１階層の距離係数行列の成分値を特定する。すなわち、図８（ａ）に示すような行列で定義される分類カテゴリの第１階層に対応付けて用意される距離係数行列を参照することで、その特定した分類カテゴリ値の指す成分値（図８（ａ）の例で説明するならば、Ａ_１かＢ_１）を特定するのである。
【００８３】
続いて、ステップ２４で、その特定した成分値を変数ｗに代入する。続いて、ステップ２５で、ステップ２２で特定した２つの分類カテゴリ値が一致するのか否かを判断して、一致しないことを判断するときには、ステップ２６に進んで、変数ｗの値とステップ２０で算出した距離“ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）”とを乗算することで、コンテンツｃ_ｉとコンテンツｃ_ｊとの間の距離を算出して、処理を終了する。
【００８４】
一方、ステップ２５で、ステップ２２で特定した２つの分類カテゴリ値が一致することを判断するときには、ステップ２７に進んで、変数ｋの値を１つインクリメントし、続くステップ２８で、変数ｋの値が分類カテゴリの深さＮよりも大きくなったのか否かを判断する。
【００８５】
この判断処理により、変数ｋの値が分類カテゴリの深さＮよりも大きくなっていないことを判断するときには、ステップ３０に進んで、コンテンツｃ_ｉの分類カテゴリＬｐ　の持つ第ｋ階層の分類カテゴリ値と、コンテンツｃ_ｊの分類カテゴリＬｑ　の持つ第ｋ階層の分類カテゴリ値とを特定する。
【００８６】
続いて、ステップ３１で、その特定した分類カテゴリ値の指す第ｋ階層の距離係数行列の成分値を特定する。すなわち、ｋ＝２のときには、図８（ｂ）に示すような行列で定義される分類カテゴリの第２階層に対応付けて用意される距離係数行列を参照することで、その特定した分類カテゴリ値の指す成分値（図８（ｂ）の例で説明するならば、Ａ_２かＢ_２）を特定するのである。
【００８７】
続いて、ステップ３２で、その特定した成分値と変数ｗの値とを乗算して、その乗算結果を新たな変数ｗの値として変数ｗに代入する。続いて、ステップ３３で、ステップ３０で特定した２つの分類カテゴリ値が一致するのか否かを判断して、一致しないことを判断するときには、ステップ３４に進んで、変数ｗの値とステップ２０で算出した距離“ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）”とを乗算することで、コンテンツｃ_ｉとコンテンツｃ_ｊとの間の距離を算出して、処理を終了する。
【００８８】
一方、ステップ３３で、ステップ３１で特定した２つの分類カテゴリ値が一致することを判断するときには、１つ下の階層レベルの分類カテゴリへの処理に進むべく、ステップ２７に戻る。
【００８９】
そして、ステップ２７〜ステップ３３の処理を繰り返していくことで、ステップ２８で、変数ｋの値が分類カテゴリの深さＮよりも大きくなったことを判断するときには、ステップ２９に進んで、変数ｗの値とステップ２０で算出した距離“ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）”とを乗算することで、コンテンツｃ_ｉとコンテンツｃ_ｊとの間の距離を算出して、処理を終了する。
【００９０】
このようにして、視覚的コンテンツ分類システムは、例えば、図９に示したように、２つのコンテンツの分類カテゴリが第１および第２階層のレベルまで一致するときには、分類カテゴリの第３階層が一致するのか否かに応じて、補正係数ｗを、
ｗ＝Ａ_１×Ａ_２×Ａ_３（第３階層まで一致）
ｗ＝Ａ_１×Ａ_２×Ｂ_３（第３階層は不一致）
と算出し、２つのコンテンツの分類カテゴリが第１階層のレベルまで一致し、かつ第２階層のレベルでは一致しないときには、
ｗ＝Ａ_１×Ｂ_２
と算出し、２つのコンテンツの分類カテゴリが第１階層のレベルで一致しないときには、
ｗ＝Ｂ_１
と算出するように処理して、そのようにして算出した補正係数ｗと、概念ベクトル間のユークリッド距離“ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）”とを乗算することで、コンテンツｃ_ｉとコンテンツｃ_ｊとの間の距離を算出するように処理するのである。
【００９１】
このようにして算出される補正係数ｗを用いると、２つのコンテンツの分類カテゴリがより深い階層レベルまで一致する程、“ｗ×ｄｉｓｔ（ｖ_ｉ，ｖ_ｊ）　”という算出式に従って算出される２つのコンテンツの距離がより小さなものになるように補正されることになる。
【００９２】
以上説明したように、基準マップ作成部４０は、コンテンツＤＢ２０に格納されているコンテンツを処理対象として、それらの全ての２つのコンテンツの組み合わせについてコンテンツ間の距離を算出して、それに基づいて各々のコンテンツの２次元上での配置座標を算出し、同じ分類カテゴリに含まれるコンテンツ同士が２次元上で集団をなすように近接して配置されるという図３や図４に示すようなコンテンツの散布図画像（基準マップ）を作成して、ユーザに提示するように処理するのである。
【００９３】
〔２〕コンテンツ配置部４１の処理
コンテンツ配置部４１は、基準マップ作成部４０により基準マップ（コンテンツの散布図画像）が作成された後に、基準マップに配置されていないコンテンツが与えられると、そのコンテンツの基準マップ上の配置座標を算出して基準マップに配置するとともに、そのコンテンツに関する情報をコンテンツＤＢ２０／メタ情報ＤＢ２１／概念ベクトルＤＢ２２／配置座標ＤＢ２３に登録するという処理を実行する。
【００９４】
図１２および図１３に、コンテンツ配置部４１の実行する処理フローの一実施形態例を図示する。
【００９５】
次に、この処理フローに従って、コンテンツ配置部４１の実行する処理について詳細に説明する。
【００９６】
コンテンツ配置部４１は、基準マップに配置されていないコンテンツの配置要求が発行されると、図１２および図１３の処理フローに示すように、先ず最初に、ステップ４０で、配置対象コンテンツの分類カテゴリ情報（実際には最下層の分類カテゴリの情報）を取得する。
【００９７】
続いて、ステップ４１で、配置対象コンテンツの概要説明文を入手して、上述した基準マップ作成部４０と同様の処理に従って、それから配置対象コンテンツの概念ベクトル（以下、この概念ベクトルをＶで表す）を算出する。
【００９８】
続いて、ステップ４２で、配置座標ＤＢ２３および概念ベクトルＤＢ２２から、基準マップ上に配置される各コンテンツ、すなわち各概念ベクトル｛Ｘｉ｝の２次元座標｛ｘｉ｝を読み出すとともに、それらの各概念ベクトル｛Ｘｉ｝の属する分類カテゴリ情報（最下層分類カテゴリの情報）を読み出す。
【００９９】
続いて、ステップ４３で、読み出した概念ベクトルを処理対象として、配置対象コンンテツの属する最下層分類カテゴリ配下の概念ベクトルの内、配置対象コンテンツの概念ベクトルＶとの間の距離が最も近い概念ベクトル（以下、この概念ベクトルをＹで表す）を特定する。
【０１００】
なお、このとき算出する距離については、同一の分類カテゴリに属していることから、上述したような補正を行う必要はない。
【０１０１】
続いて、ステップ４４で、ステップ４３で求めた概念ベクトルＹの２次元座標ｙを中心とする近傍領域Ｎｙ（ｔ）の初期値として、全ての概念ベクトル｛Ｘｉ｝の２次元座標｛ｘｉ｝を含むものを設定する。なお、変数ｔは、以下の説明から分かるように、処理の繰り返し回数を表している。
【０１０２】
続いて、ステップ４５で、配置対象コンテンツの概念ベクトルＶを基準マップに投影したときの２次元座標ｖ（ｔ）　の初期値として、適当な２次元座標を設定する。
【０１０３】
このとき、２次元座標ｖ（ｔ）　の初期値として、概念ベクトルＹの２次元座標ｙを設定したり、その近傍の２次元座標を設定することが好ましいが、それに限られるものではない。
【０１０４】
続いて、ステップ４６で、近傍領域Ｎｙ（ｔ）に属する全ての概念ベクトル｛Ｘｉ｝の２次元座標｛ｘｉ｝について処理を行ったのか否かを判断して、全ての２次元座標｛ｘｉ｝について処理を行っていないことを判断するときには、ステップ４７に進んで、未処理の２次元座標｛ｘｉ｝（未処理の概念ベクトル｛Ｘｉ｝）を１つ選択する。
【０１０５】
続いて、ステップ４８で、配置対象コンテンツの概念ベクトルＶおよびその２次元座標ｖ（ｔ）　と、選択した概念ベクトル｛Ｘｉ｝およびその２次元座標｛ｘｉ｝とを使い、
ｖ２（ｔ）＝ｖ（ｔ）＋ａ（ｔ）＊ｈ（ｄ＊（Ｖ，Ｘｉ））＊［ｘｉ−ｖ（ｔ）］　‥‥‥（ｉ）式
ｖ（ｔ）＝ｖ２（ｔ）　　　　　　　　　　　　　　　‥‥‥　（ｉｉ）　式
という計算式に従って、配置対象コンテンツの２次元座標ｖ（ｔ）　を修正して、ステップ４６に戻る。
【０１０６】
すなわち、先ず最初に、配置対象コンテンツの概念ベクトルＶおよびその２次元座標ｖ（ｔ）　と、選択した概念ベクトル｛Ｘｉ｝およびその２次元座標｛ｘｉ｝とを使って（ｉ）式を計算することでｖ２（ｔ）を計算し、それを新たなｖ（ｔ）　と修正することで、配置対象コンテンツの２次元座標ｖ（ｔ）　を修正して、ステップ４６に戻るように処理するのである。
【０１０７】
ここで、「ａ（ｔ）　」は、ｔとともに単調に減少する正値関数を表している。また、「ｄ＊（Ｖ，Ｘｉ）」は、概念ベクトルＶとステップ４７で選択した概念ベクトル｛Ｘｉ｝との間の距離を表している。この距離としては、上述のアルゴリズムに従って分類カテゴリ情報により補正した距離を用いることが好ましいが、そのような補正を行わない距離を用いることも可能である。
【０１０８】
また、「ｈ（・）」は、ｔに依存しない正値の単調減少関数を表し、概念ベクトルＶと概念ベクトル｛Ｘｉ｝との間の距離が大きくなるに従って小さな値を示す関数である。
【０１０９】
この（ｉ）式は、配置対象コンテンツの概念ベクトルＶの２次元座標ｖ（ｔ）　を、ステップ４７で選択した概念ベクトル｛Ｘｉ｝の２次元座標｛ｘｉ｝に近づける形で修正することを意味しているが、この修正にあたって、概念ベクトルＶとステップ４７で選択した概念ベクトル｛Ｘｉ｝との間の距離が大きいときにはｈ（・）の値が小さくなることで、その近づける量を小さなものとなるようにしている。
【０１１０】
このようにしてステップ４６〜ステップ４８を繰り返していくことで、図１４で説明するならば、図中の▲１▼に示すように、ある概念ベクトル｛Ｘｉ｝／２次元座標｛ｘｉ｝を選択すると、図中の▲２▼に示すように、それを使ってｖ２（ｔ）を計算して、図中の▲３▼に示すように、その計算したｖ２（ｔ）を新たなｖ（ｔ）　とすることでｖ（ｔ）　を修正し、次に、図中の▲４▼に示すように、別の概念ベクトル｛Ｘｉ｝／２次元座標｛ｘｉ｝を選択すると、図中の▲５▼に示すように、それを使ってｖ２（ｔ）を計算して、図中の▲６▼に示すように、その計算したｖ２（ｔ）を新たなｖ（ｔ）　とすることでｖ（ｔ）　を修正するという処理を繰り返していくことになる。
【０１１１】
そして、このようにしてステップ４６〜ステップ４８を繰り返していくときに、ステップ４６で、近傍領域Ｎｙ（ｔ）に属する全ての概念ベクトル｛Ｘｉ｝の２次元座標｛ｘｉ｝について処理を行ったことを判断するときには、ステップ４９に進んで、配置対象コンテンツの２次元座標ｖ（ｔ）　をｖ（ｔ＋１）　に更新する。
【０１１２】
続いて、ステップ５０で、ステップ４４で設定した概念ベクトルＹの２次元座標ｙを中心とする近傍領域Ｎｙ（ｔ）を、例えば規定の縮小率に従って、その大きさが縮小する形でＮｙ（ｔ＋１）に更新する。
【０１１３】
続いて、ステップ５１で、その縮小した近傍領域Ｎｙ（ｔ＋１）の中に、概念ベクトルＹの２次元座標ｙしか存在しないという状態に到達したのか否かを判断して、そのような状態に到達していないことを判断するときには、ステップ５４に進んで、（ｉ）式の係数ａ（ｔ）　を、例えば規定の縮小率に従って、その大きさが小さくなる形でａ（ｔ＋１）　に更新し、続くステップ５５で、ｖ（ｔ＋１）　を新たなｖ（ｔ）　とし、Ｎｙ（ｔ＋１）　を新たなＮｙ（ｔ）　とし、ａ（ｔ＋１）　を新たなａ（ｔ）　として、ステップ４６に戻る。
【０１１４】
一方、ステップ５１で、近傍領域Ｎｙ（ｔ＋１）の中に、概念ベクトルＹの２次元座標ｙしか存在しないという状態に到達したことを判断するときには、ステップ５２に進んで、ステップ４９で更新したｖ（ｔ＋１）　を配置対象コンテンツの配置位置として決定し、続くステップ５３で、コンテンツＤＢ２０、メタ情報ＤＢ２１、概念ベクトルＤＢ２２、配置座標ＤＢ２３のそれぞれに、配置対象コンテンツに関する情報を登録して、処理を終了する。
【０１１５】
このようにして決定されることになる配置対象コンテンツの配置位置ｖ（ｔ＋１）　は、コンテンツの概念ベクトル間の距離構造を保存するような形で決定されることになることから、基準マップ作成部４０により作成された基準マップの形態を崩すことなく、配置対象コンテンツを基準マップ上に配置することができるようになる。
【０１１６】
このようにして、コンテンツ配置部４１は、基準マップ作成部４０により基準マップ（コンテンツの散布図画像）が作成された後に、基準マップに配置されていないコンテンツが与えられると、図１５に示すように、そのコンテンツの基準マップ上の配置座標を算出して基準マップに配置する（図中の▲印）とともに、そのコンテンツに関する情報をコンテンツＤＢ２０／メタ情報ＤＢ２１／概念ベクトルＤＢ２２／配置座標ＤＢ２３に登録するように処理するのである。
【０１１７】
ここで、図１２および図１３の処理フローでは、（ｉ）式に示すように、近傍領域Ｎｙ（ｔ）に属する全ての２次元座標｛ｘｉ｝を順番に選択しながら、配置対象コンテンツの２次元座標ｖ（ｔ）　を逐次的に修正していくように処理したが、この（ｉ）式に代えて、
ｖ（ｔ）←ｖ（ｔ）＋Σａ（ｔ）＊ｈ（ｄ＊（Ｖ，Ｘｉ））＊［ｘｉ−ｖ（ｔ）］
但し、Σは全ての２次元座標｛ｘｉ｝についての総和
というように、配置対象コンテンツの２次元座標ｖ（ｔ）　を一度に修正するようにしてもよい。
【０１１８】
また、図１２および図１３の処理フローでは、基準マップに配置される全ての概念ベクトル｛Ｘｉ｝を処理対象として、配置対象コンテンツの概念ベクトルＶの２次元座標ｖ（ｔ）　を修正するようにしたが、配置対象コンンテツの属する最下層分類カテゴリ配下の概念ベクトル｛Ｘｉ｝との間の距離が小さいことで、その影響度が大きいことを考慮して、配置対象コンンテツの属する最下層分類カテゴリ配下の概念ベクトル｛Ｘｉ｝のみを処理対象として、配置対象コンテンツの概念ベクトルＶの２次元座標ｖ（ｔ）　を修正するようにしてもよい。このようにすると、計算量を削減できることで高速化を図れるようになる。
【０１１９】
また、図１２および図１３の処理フローでは説明しなかったが、次から次へと配置対象コンテンツが与えられる場合には、これまでに配置座標を算出した配置対象コンテンツについての情報を含めることなく、基準マップ作成部４０が作成対象としたコンテンツについての情報のみを使って、新たに与えられる配置対象コンテンツの配置座標を決定するようにしてもよいし、これまでに配置座標を算出した配置対象コンテンツについての情報を基準マップ作成部４０が作成対象としたコンテンツの情報に含める形で、新たに与えられる配置対象コンテンツの配置座標を決定するようにしてもよい。
【０１２０】
図示実施形態例に従って本発明を説明したが、本発明はこれに限定されるものではない。例えば、実施形態例では、コンテンツを分類カテゴリを単位にクラスター化して配置することで基準マップを作成して、未配置のコンテンツをそれに追加するという処理例に従って本発明を説明したが、本発明は分類カテゴリを単位としないで基準マップを作成する場合にもそのまま適用できるものである。
【０１２１】
また、実施形態例では、分類カテゴリを概念ベクトル間の距離の算出に反映させることで基準マップを作成するということで説明したが、その他のメタ情報を概念ベクトル間の距離の算出に反映させることで基準マップを作成するようにしてもよい。
【０１２２】
また、実施形態例では、コンテンツの分類を具体例にして本発明を説明したが、本発明はその適用がコンテンツの分類に限られるものではない。
【０１２３】
【発明の効果】
以上説明したように、本発明によれば、大量の情報を情報間の内容的類似性に基づいて２次元平面上に分類配置した後に、個々の情報をその分類配置のマップに逐次的あるいは追加的に分類配置できるようになることから、２次元配置の対象となる情報の数が増大したり、新たに情報が追加される場合にも、短い時間で分類配置を行えるようになる。
【０１２４】
これによって、従来の多次元尺度法を用いたコンテンツの一括配置手法に比べて、処理時間を短縮することが可能になるとともに、日々追加更新されるインターネットなどのディジタルコンテンツを対象とした視覚的分類が可能になるという効果が得られる。
【図面の簡単な説明】
【図１】本発明の一実施形態例である。
【図２】分類カテゴリの体系の一例を示す図である。
【図３】散布図画像の一例を示す図である。
【図４】散布図画像の一例を示す図である。
【図５】基準マップ作成部の実行する処理フローの一実施形態例である。
【図６】概念ベクトルＤＢの説明図である。
【図７】分類カテゴリの体系の一例を示す図である。
【図８】距離係数行列の説明図である。
【図９】補正係数の説明図である。
【図１０】基準マップ作成部の実行する処理フローの一実施形態例である。
【図１１】基準マップ作成部の実行する処理フローの一実施形態例である。
【図１２】コンテンツ配置部の実行する処理フローの一実施形態例である。
【図１３】コンテンツ配置部の実行する処理フローの一実施形態例である。
【図１４】コンテンツ配置部の実行する処理の説明図である。
【図１５】コンテンツ配置部の実行する処理の説明図である。
【符号の説明】
１０　コンピュータ
１１　表示部
１２　指示入力部
２０　コンテンツＤＢ
２１　メタ情報ＤＢ
２２　概念ベクトルＤＢ
２３　配置座標ＤＢ
３０　ネットワーク
４０　基準マップ作成部
４１　コンテンツ配置部

Claims

大量の情報を情報間の内容的類似性に基づいて２次元平面上に配置する視覚的情報分類方法であって、
各々の情報の持つ概念ベクトルの間の距離に基づいて、各々の情報の２次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する過程と、
未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと上記基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造を保存するような形で、その未配置情報の上記基準マップ上における配置座標を算出する過程とを備えることを、
特徴とする視覚的情報分類方法。
請求項１記載の視覚的情報分類方法において、
上記配置座標を算出する過程では、上記基準マップを構成する情報の中から、上記未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、上記未配置情報の上記基準マップ上における配置座標を算出することを、
特徴とする視覚的情報分類方法。
大量の情報を情報間の内容的類似性に基づいて２次元平面上に配置する視覚的情報分類方法であって、
各々の情報の持つ概念ベクトルの間の距離を、情報に予め付与された階層構造をとるメタ情報の一致度合いに応じて補正して、その補正した距離に基づいて、各々の情報の２次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する過程と、
未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと上記基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造、あるいは、その距離をメタ情報の一致度合いに応じて補正した距離の構造を保存するような形で、その未配置情報の上記基準マップ上における配置座標を算出する過程とを備えることを、
特徴とする視覚的情報分類方法。
請求項３記載の視覚的情報分類方法において、
上記配置座標を算出する過程では、上記基準マップを構成する情報に代えて、上記基準マップを構成する情報の中に含まれる上記未配置情報に付与されたメタ情報と同一のメタ情報を持つ情報を用いて、上記未配置情報の上記基準マップ上における配置座標を算出することを、
特徴とする視覚的情報分類方法。
請求項３又は４記載の視覚的情報分類方法において、
上記配置座標を算出する過程では、上記未配置情報に付与されたメタ情報と同一のメタ情報を持ち、かつ、上記未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、上記未配置情報の上記基準マップ上における配置座標を算出することを、
特徴とする視覚的情報分類方法。
請求項１ないし５のいずれか１項に記載の視覚的情報分類方法において、
上記配置座標を算出する過程では、これまでに配置座標を算出した未配置情報を上記基準マップを構成する情報に含める形で、新たに与えられる未配置情報の上記基準マップ上における配置座標を算出することを、
特徴とする視覚的情報分類方法。
大量の情報を情報間の内容的類似性に基づいて２次元平面上に配置する視覚的情報分類装置であって、
各々の情報の持つ概念ベクトルの間の距離に基づいて、各々の情報の２次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する手段と、
未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと上記基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造を保存するような形で、その未配置情報の上記基準マップ上における配置座標を算出する手段とを備えることを、
特徴とする視覚的情報分類装置。
請求項７記載の視覚的情報分類装置において、
上記配置座標を算出する手段は、上記基準マップを構成する情報の中から、上記未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、上記未配置情報の上記基準マップ上における配置座標を算出することを、
特徴とする視覚的情報分類装置。
大量の情報を情報間の内容的類似性に基づいて２次元平面上に配置する視覚的情報分類装置であって、
各々の情報の持つ概念ベクトルの間の距離を、情報に予め付与された階層構造をとるメタ情報の一致度合いに応じて補正して、その補正した距離に基づいて、各々の情報の２次元上での配置座標を算出することで、それらの情報をクラスター化して配置する基準マップを作成する手段と、
未配置の情報が与えられる場合に、その未配置情報の持つ概念ベクトルと上記基準マップを構成する情報の持つ概念ベクトルとの間の距離の構造、あるいは、その距離をメタ情報の一致度合いに応じて補正した距離の構造を保存するような形で、その未配置情報の上記基準マップ上における配置座標を算出する手段とを備えることを、
特徴とする視覚的情報分類装置。
請求項９記載の視覚的情報分類装置において、
上記配置座標を算出する手段は、上記基準マップを構成する情報に代えて、上記基準マップを構成する情報の中に含まれる上記未配置情報に付与されたメタ情報と同一のメタ情報を持つ情報を用いて、上記未配置情報の上記基準マップ上における配置座標を算出することを、
特徴とする視覚的情報分類装置。
請求項９又は１０記載の視覚的情報分類装置において、
上記配置座標を算出する手段は、上記未配置情報に付与されたメタ情報と同一のメタ情報を持ち、かつ、上記未配置情報との間の概念ベクトル間距離が最も小さなものとなる情報を選択して、その選択した情報に焦点を合わせつつ、上記未配置情報の上記基準マップ上における配置座標を算出することを、
特徴とする視覚的情報分類装置。
請求項７ないし１１のいずれか１項に記載の視覚的情報分類装置において、
上記配置座標を算出する手段は、これまでに配置座標を算出した未配置情報を上記基準マップを構成する情報に含める形で、新たに与えられる未配置情報の上記基準マップ上における配置座標を算出することを、
特徴とする視覚的情報分類装置。
請求項１ないし６のいずれか１項に記載の視覚的情報分類方法の実現に用いられる処理をコンピュータに実行させるための視覚的情報分類プログラム。
請求項１ないし６のいずれか１項に記載の視覚的情報分類方法の実現に用いられる処理をコンピュータに実行させるための視覚的情報分類プログラムを記録した記録媒体。