JP2000181934A - 部分一致検索方法,その装置,及び部分一致検索プログラムを記録した記録媒体 - Google Patents

部分一致検索方法,その装置,及び部分一致検索プログラムを記録した記録媒体

Info

Publication number
JP2000181934A
JP2000181934A JP10362749A JP36274998A JP2000181934A JP 2000181934 A JP2000181934 A JP 2000181934A JP 10362749 A JP10362749 A JP 10362749A JP 36274998 A JP36274998 A JP 36274998A JP 2000181934 A JP2000181934 A JP 2000181934A
Authority
JP
Japan
Prior art keywords
vector
feature vector
weighted average
objects
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10362749A
Other languages
English (en)
Inventor
Yutaka Kidawara
豊 木俵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
National Institute of Information and Communications Technology
Original Assignee
Kobe Steel Ltd
Telecommunications Advancement Organization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd, Telecommunications Advancement Organization filed Critical Kobe Steel Ltd
Priority to JP10362749A priority Critical patent/JP2000181934A/ja
Publication of JP2000181934A publication Critical patent/JP2000181934A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 データベース内の各オブジェクトの特徴ベク
トルよりも低次元の特徴ベクトルを有する問い合わせ情
報に最も近いオブジェクトを検索する部分一致検索方法
において,問い合わせに偶然一致する特異なオブジェク
トの選択を防止して最もふさわしいオブジェクトを確実
に選択することが可能な部分一致検索方法を提供する。 【解決手段】 データベース内の各オブジェクトの特徴
ベクトルに対してそれぞれ問い合わせベクトルとの類似
度に基づく重み付けを行った上で,上記全オブジェクト
の平均ベクトルを算出し(ステップS2),得られた重
み付け平均ベクトルと上記問い合わせベクトルとの交点
を終点とする最適ベクトルを求め(ステップS3),該
最適ベクトルに最も類似する特徴ベクトルを持つオブジ
ェクトを抽出する(ステップS4)。これにより,オブ
ジェクト全体の傾向を考慮した検索が行えるため,問い
合わせに偶然一致する特異なオブジェクトの選択を防止
して最もふさわしいオブジェクトを確実に選択すること
が可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】例えば,3次元仮想空間など
のマルチメディアコンテンツは,複数の素材となるコン
テンツを組み合わせることによって制作される。この場
合,マルチメディアコンテンツは複数の素材コンテンツ
を複合化させた編集コンテンツと考えることができる。
このようなマルチメディアコンテンツにおいては,その
素材コンテンツの組み合わせ方にその制作者の意図や個
性が表れる。複数の制作者に同じ素材を与えても,制作
される編集コンテンツは各制作者の経験の有無等により
大きく異なる。また,経験の浅い制作者は,経験の豊富
な制作者が行った素材の組合せ傾向を参考にすること
で,より良いコンテンツの制作を行うことができる。従
って,複合化したコンテンツを効率よく制作するために
は,素材のデータベースを整備する一方で,過去にそれ
らの素材コンテンツを複合化させて制作されたマルチメ
ディアコンテンツのデータベース化を行い,類似した素
材コンテンツの検索や過去の傾向を反映した素材コンテ
ンツの組合せの探索などを行えるようにすることが有効
である。本発明は,上記のようなマルチメディアコンテ
ンツのデータベースから,部分的に決定された素材にふ
さわしい組合せを有するコンテンツを検索するような場
合に特に有効な部分一致検索方法に関するものである。
【0002】
【従来の技術】まず,マルチメディアコンテンツの検索
に関する一般的な技術背景等について説明する。 [特徴ベクトル]マルチメディアコンテンツは,多数の
素材を組み合わせることによって制作される。例えば,
動画像コンテンツは各種のシーンから構成され,VRM
L等で実現されている3次元仮想空間は多数の3次元仮
想物体から構築される。それらの素材となるコンテンツ
を,制作者の個性や表現と共に素材オブジェクトとして
管理するためには,まずそれぞれのコンテンツの特徴量
を表現する必要がある。従って,マルチメディアコンテ
ンツの場合には,その特徴量として,例えば制作者の印
象や感性などを数値化することが必要となる。例えば,
ある制作者が仮想空間構築のための素材コンテンツとし
て,椅子のモデリングデータを制作する場合を考える。
そして,その制作者が椅子のオブジェクトを“クールな
印象を与える直線的で近代的な上にモダンなものにした
い”という意思を持って制作していたとすると,それら
がその素材オブジェクトの特徴となるはずである。従っ
て,素材オブジェクトの特徴を表すキーワードとして,
“クール”,“直線的”,“近代的”等のようにそれぞ
れの概念が直交性を持つものを選択し,それらの度合い
を数値化したベクトルを作成することで,素材オブジェ
クトの特徴を定義することができる。また,異なる素材
オブジェクト間でそれらのベクトルを比較することで,
類似度の判定を行うことが可能となる。従って,素材オ
ブジェクトの特徴を表現する直交性を持ったm個のキー
ワードがあるとすると,素材オブジェクトoの特徴ベク
トルvector(o) は,それぞれのキーワードの度合いを数
値化した要素を持つベクトルとして,次のように定義さ
れる。 vector(o) = ( w1, w2, ... ,w m ) …(1)
【0003】[編集コンテンツの特徴ベクトル]素材コ
ンテンツを組み合わせることによって制作される編集コ
ンテンツは,多数の素材から構成された複合的なデータ
として扱われる。例えば,仮想空間内のある部屋を作成
する場合には,机,椅子,壁,装飾品等のある程度決ま
ったカテゴリの素材が必要となる。従って,編集コンテ
ンツにおいては,素材コンテンツのカテゴリの組合せに
よってその編集コンテンツの概念が形成され,それぞれ
のカテゴリを要素とする複合オブジェクトとして表現す
ることができる。そして,素材を同じカテゴリに含まれ
る別の素材に変更することで異なる事例を構築すること
ができる。従って,n種類のカテゴリc1,c2,...,cnに属
する素材コンテンツを組み合わせた編集コンテンツo
editは,次のように定義される。 oedit = ( o c1,o c2, ... ,ocn ) …(2) oc1∈c1,oc2∈c2,...,ocn∈cn 複合オブジェクトとして管理される編集コンテンツの特
徴は,組み合わされる構成要素のカテゴリと,それらの
カテゴリ毎に選択された構成要素の特徴で表現できる。
従って,複合オブジェクトの構成要素となる素材オブジ
ェクトの特徴ベクトルを用いて複合オブジェクトの特徴
ベクトルを表す事が可能である。n個の素材オブジェク
トを組み合わせた編集オブジェクトoeditの特徴を表現
する特徴ベクトルvector(oedit) は,素材オブジェクト
の特徴ベクトルを連結させたベクトルとして次の様に定
義される。 vector(oedit) = vector(o1)×vector(o2)×... ×vector(on ) = (woc11,woc12,...,woc1m,woc21,...,wocnm ) …(3)
【0004】[ベクトル空間モデルを用いたマルチメデ
ィアコンテンツの検索(最近傍検索)]以上説明したよ
うな特徴ベクトル空間を用いたマルチメディアコンテン
ツの類似度検索においては,通常,上述したような特徴
ベクトルによって表現される問い合わせ情報(以下,問
い合わせ情報を表現する特徴ベクトルを問い合わせベク
トルという)が与えられ,その問い合わせベクトルとデ
ータベース内の編集コンテンツ等の特徴ベクトルとの間
の距離やコサイン相関値等を用いて類似度が特定され,
その類似度が最大となるオブジェクトが選択され,検索
結果として出力される。例えば,m次元の特徴ベクトル
を持つ素材コンテンツa,bがあるとすると,特徴ベク
トルはそれぞれ vector(a) = (wa1,wa2,...,wam) vector(b) = (wb1,wb2,...,wbm) …(4) として表現される。そして,類似度sim(a,b)は例えば次
のように定義される。
【数1】 この時,類似度が最大となるのは,ベクトル間の距離が
0,つまり全ての要素が一致したときであり,最大値は
1となる。
【0005】ここで,データベース内の素材コンテンツ
の中から,ユーザの要求するコンテンツに最も類似した
コンテンツを検索する場合を考える。問い合わせベクト
ルvector(q)=(wq1,wq2,...,wqm) が与えられると,デー
タベースに含まれる全ての素材コンテンツの類似度を調
査し,問い合わせ情報に最も近い素材コンテンツを選択
する。一例として,2次元の特徴ベクトルを持つ素材コ
ンテンツの検索方法を図11に示す。図11では,×印
がデータベース内の各素材コンテンツを表している。こ
の例では,問い合わせベクトルvector(q)=(wq1,wq2) に
最も近い(類似度の高い)素材コンテンツo1が選択され
る。同様に,データベース内の編集コンテンツの中か
ら,ユーザの要求するコンテンツに最も類似したコンテ
ンツを検索する場合を考える。あるカテゴリの組合せに
よって構築された編集コンテンツは,それぞれのカテゴ
リに含まれる複数の素材コンテンツの組合せによって多
数の事例が作成される。例えば, 3次元仮想空間の構築
を行う場合,部屋を表す複合オブジェクトは,壁,机,
床,椅子等を組み合わせることによって制作される。こ
のカテゴリの組合せは部屋という概念を表す物であり,
制作された和室,子供部屋などは,部屋オブジェクトの
事例として扱うことができる。従って,n種類の異なる
カテゴリに属する素材オブジェクトを組み合わせて構築
した編集オブジェクトの事例を格納したデータベースH
は次の様に定義される。 H = {(oc1,oc2,...,ocn) | oc1∈c1,oc2∈c2,...,ocn∈cn}…(6) このデータベースに対して,ユーザが問い合わせを行う
と問い合わせベクトルが作成され,問い合わせベクトル
に最も類似した組合せを持つ編集コンテンツを検索す
る。このときの間い合わせ情報qは次の様に表される。 q = ( oc1,oc2,...,ocn ) …(7) oq1∈c1,oq2∈c2,...,ocn∈cn 従って,各素材オブジェクトがm次元の特徴ベクトルを
持つとすると,問い合わせqの特徴ベクトルは次の様に
表される。 vector(q) = vector(oq1) ×vector(oq2) ×... ×vector(oqn) = (woq11,woq12,...,woq1m,woq21,...,woqnm ) …(8) この問い合わせベクトルに対して最も類似度の高い編集
コンテンツが問い合わせの答えとしてユーザに提供され
る。一例を図12に示す。この例は,素材コンテンツが
1次元の特徴ベクトルを持ち, 2つの素材コンテンツの
カテゴリから組み合わされる編集コンテンツの類似検索
を示している。そして,問い合わせ情報q=(oq1,oq2) の
問い合わせベクトルvector(q) に対して特徴ベクトルの
距離が最も近い(最も類似性の高い)編集コンテンツh1
が問い合わせの解として選択される事を示している。
【0006】以上,ベクトル空間モデルを用いた素材コ
ンテンツ,編集コンテンツの検索について述べた。しか
しながら,以上説明した手法は問い合わせベクトルと各
コンテンツの特徴ベクトルの次元が完全に一致している
事が前提であった。ところが,特に編集コンテンツの検
索においては,ユーザがその組合せの全てを指定でさな
い場合が考えられる。例えば,仮想空間の構築を行う場
合には,様々な素材コンテンツを組み合わせて編集コン
テンツが制作される。前述の部屋を構築する場合を考え
ると,部屋には壁,机,床,椅子等の素材コンテンツが
必要となるが,ユーザによっては全ての素材コンテンツ
を決定できずに壁や机だけを決定し,それにふさわしい
組合せとなる床や椅子の組合せを検索したいと考えるか
もしれない。このような場合には,上述のような手法は
適用できず,部分的な問い合わせ情報からそれにふさわ
しい組合せを検索する部分一致検索が必要となる。しか
しながら,単純な部分一致検索ではユーザの要求に十分
な解を得られない場合がある。例えば, 2つのカテゴリ
ca ,cb の素材コンテンツを組み合せた編集コンテンツ
が格納されたデータベースHがあるとする。また,デー
タベースH中には(oca1, ocb1),(oca2, ocb2),(oca3,
ocb3)という編集コンテンツがあるとする。この時, o
ca1 ,oca2 ,oca3 はそれぞれ類似度が高く, ocb1 ,o
cb2 の類似度は低いとする。このような場合に, oca1
にふさわしい組合せとなる cbカテゴリの素材コンテン
ツを問い合わせる部分一致問い合わせ情報として(oca1,
*)(* は検索要求カテゴリ)が与えられたとする。この
問い合わせに対して,単純な部分一致検索を行うと解は
ocb1 となる。しかし,データベースH内の全体の傾向
として oca1 に類似した素材コンテンツとして ocb2
選択されているとすると, oca1 の解として本当にふさ
わしい組合せとなるのは ocb2 となるかもしれない。従
って,ベクトル空間モデルを用いた部分一致検索の場合
には,単純に決定要素のオブジェクトに最も類似したオ
ブジェクトを選択するのではなく,その他の類似度が高
いオブジェクトがどのようなオブジェクトと組み合わさ
れているかについての全体の傾向を判断して,解を決定
する事が望ましい。
【0007】そこで,ベクトル空間モデルの組合せ傾向
を考慮した部分一致検索を行う方法としては,例えば以
下のようなものが考えられる。検索対象となるデータベ
ースHに含まれるコンテンツがm次元の特徴ベクトルを
持つものとする。この時,k(<m)次元の問い合わせ
ベクトルが与えられると,類似度の判定が不可能とな
る。類似度を計算するためには,同次元の特徴ベクトル
を作成する必要があるため,問い合わせベクトル中の決
定されている要素が座標軸となる次元へ特徴ベクトルを
射影させた部分特徴ベクトルを作成し,そのベクトル間
の距離を計算して類似度を判定することが必要である。
例えば, n個のカテゴリから構成された編集コンテンツ
が含まれたデータベースHに対して,問い合わせqを与
えたとする。この時,問い合わせ情報は次の様になる。 q = ( oc1,*,oc3,・・・,*,ocl,・・・ ) …(9) 但し,l<nであり,“*”は検索要求カテゴリを表
す。そして,問い合わせベクトルは次のように定義され
る。
【数2】 従って,部分一致検索に用いられる類似度は,データベ
ース中の編集コンテンツを表す編集オブジェクトhの特
徴ベクトルを問い合わせベクトルの決定要素の次元に射
影させたベクトルとの類似度になり,以下のように定義
される。
【数3】 図13に例を示す。この例では,簡単のため,2つのカ
テゴリから組み合わされる編集コンテンツに対する検索
を行うことを考える。また,組み合わされる素材コンテ
ンツは1次元の特徴ベクトルを持つものとする。そし
て,編集コンテンツのデータを格納するデータベースを
次の様に定義する。 H = {(oc1,oc2) | oc1∈c1,oc2∈c2} …(12) そして,問い合わせ情報q=(q1,*)が与えられたとする。
この間い合わせ情報は,直観的には“c1カテゴリに含ま
れるq1オブジェクトにふさわしい組合せとなるc2カテゴ
リのコンテンツを検索せよ”というものである。この
時,類似度は次のように表される。 sim(Πc1vector(q),Πc1vector(h)) …(13) h ∈ H 図13の例では,類似度の最も大さい hi = (oi1,oi2)
が選択される。そして, hi のカテゴリc2の要素 o
i2が,q1に最もふさわしい組合せとして選択される。そ
の結果,(q1, oi2) が問い合わせqの解とされる。これ
は直観的には,q1と組み合わされた編集オブジェクトは
存在しなかったので,q1に最も類似しているoi1の組合
せを調べて,その組合せ相手であった oi2を最もふさわ
しい組合せと判断している。
【0008】
【発明が解決しようとする課題】しかしながら,上記の
ような部分一致検索では,直観的には類似度が最も高い
ふさわしい組合せを選択しているといえるが,それが最
も適切な答えだとは限らない。例えば,図13の様な場
合には,解として最も近い hi が選択されるが,全体の
分布を見てみると少し離れたところにデータのクラスタ
が存在する。問い合わせqの意味は,q1にふさわしい組
合せとなるカテゴリc2の素材コンテンツを発見する事で
あり,これらのクラスタの存在を無視できない。もしか
すると解として選んだ hi は特殊な組合せであり,むし
ろ多くの組合せが存在するクラスタ内のデータを選択す
べきかもしれない。このような編集コンテンツ hi を選
択した原因は,データベース内の組合せ傾向を考慮して
おらず,単純に類似度の高いものを選んでいるからであ
る。特に,ふさわしい組合せを持つ編集コンテンツを部
分的な問い合わせで検索する場合には,全体の傾向を考
慮しながら,最もふさわしいと考えられる組合せを選択
する必要がある。本発明は上記事情に鑑みてなされたも
のであり,その目的とするところは,データベース内の
各オブジェクトの特徴ベクトルよりも低次元の特徴ベク
トルを有する問い合わせ情報に最も近いオブジェクトを
検索する部分一致検索方法において,問い合わせに偶然
一致する特異なオブジェクトの選択を防止して最もふさ
わしいオブジェクトを確実に選択することが可能な部分
一致検索方法を提供することである。
【0009】
【課題を解決するための手段】データベース内の各複合
オブジェクトの組合せ傾向を表現する最も単純な手法
は,全てのオブジェクトの特徴ベクトルの平均ベクトル
を計算することである。しかし,例えば図3の様に複数
のクラスタが存在するような場合には,単純な平均ベク
トルでは全く特徴を表現できなくなる。これは,全ての
特徴ベクトルを同一の尺度で平均化している事に原因が
ある。図3の様な部分一致検索の場合にユーザが求めて
いるのは,q1にふさわしい組合せとなるカテゴリc2の素
材コンテンツである。従って,q1やq1に類似したもの
が,カテゴリc2のどのようなコンテンツと組み合わされ
ているかを考慮することが大切である。そのためには,
単にデータベース内の全てのオブジェクトの平均ベクト
ルを計算するのではなく,各オブジェクトの特徴ベクト
ルに問い合わせベクトルとの類似度に基づく重み付けを
行った上で,平均ベクトルを計算することが有効である
と考えられる。そこで,上記目的を達成するために第1
の発明は,所定の次元の特徴ベクトルが付与された複数
のオブジェクトの中から,上記オブジェクトの特徴ベク
トルよりも低次元の特徴ベクトルを有する問い合わせ情
報に最も近いオブジェクトを検索する部分一致検索方法
において,上記各オブジェクトの特徴ベクトルに対して
それぞれ上記問い合わせ情報の特徴ベクトルとの類似度
に基づく重み付けを行った上で,上記全オブジェクトの
平均ベクトルを算出する第1の重み付け平均ベクトル算
出工程と,上記第1の重み付け平均ベクトル算出工程で
得られた上記全オブジェクトの重み付け平均ベクトルと
上記問い合わせ情報の特徴ベクトルとの交点を終点とす
る最適ベクトルを求める第1の最適ベクトル算出工程
と,上記第1の最適ベクトル算出工程で得られた最適ベ
クトルに最も類似する特徴ベクトルを持つオブジェクト
を抽出する第1の最適オブジェクト抽出工程とを具備し
てなることを特徴とする部分一致検索方法として構成さ
れている。また,上記各オブジェクトと上記問い合わせ
ベクトルとは次元が異なるため,上記第1の重み付け平
均ベクトル算出工程においては,上記オブジェクトの特
徴ベクトルを上記問い合わせ情報の特徴ベクトルのベク
トル空間に射影して得られた射影ベクトルと上記問い合
わせ情報の特徴ベクトルとの類似度を用いればよい。こ
こで,上記第1の発明に係る方法では,重み付け平均ベ
クトルを算出する際に全てのオブジェクトに対して総当
たり計算をする必要があるため,計算量が多くなるが,
更に上記重み付け平均ベクトルの算出を開始するために
はユーザからの問い合わせ情報が決定されている必要が
あるため,全ての計算が検索開始後に行われることにな
る。従って,データベースの規模が大きくなったり,或
いは各オブジェクトの特徴ベクトルが高次元の場合に
は,ユーザが問い合わせ情報を入力して検索を開始した
後,検索結果が得られるまでに長時間を要する場合があ
る。そこで,検索精度を多少犠牲にしたとしても,ユー
ザが問い合わせ情報を入力した後(即ち検索が開始され
た後)の計算量を少なくすることができれば,検索時間
の削減という面において非常に有効である。これを実現
するためには,まず対象となるデータの数を減らすこと
が考えられる。そこで,データベース内のオブジェクト
についてある一定距離にあるものをクラスタリングし,
その代表点となるセントロイドでそのクラスタに含まれ
るデータを代表させる手法が考えられる。このようなク
ラスクリング情報を利用することは,計算量の削減にお
いて非常に有効である。たとえば,前述の重み付け平均
ベクトルとして,クラスタのセントロイドと問い合わせ
ベクトルとの類似度を用いて近似したものを用いれば,
計算量を大幅に減少させることができる。しかし,この
手法ではクラスタの大きさやクラスタ内のデータ数など
が考慮されないため,全体の傾向を反映することが困難
である。そこで,クラスタのセントロイドを解としたと
きの重み付け平均ベクトルを各クラスタ毎に予め計算
し,問い合わせベクトルが指定された後(検索が開始さ
れた後)は,その問い合わせベクトルと上記予め計算さ
れた各クラスタ毎の重み付け平均ベクトルとに基づいて
検索を行うようにすれば,上記第1の発明に係る方法に
比べて精度的には多少劣るものの,検索を開始してから
の計算時間が大幅に短縮されると考えられる。そこで,
第2の発明は,所定の次元の特徴ベクトルが付与された
複数のオブジェクトの中から,上記オブジェクトの特徴
ベクトルよりも低次元の特徴ベクトルを有する問い合わ
せ情報に最も近いオブジェクトを検索する部分一致検索
方法において,上記各オブジェクトの特徴ベクトルを,
その終点位置に基づいてクラスタリングするクラスタリ
ング工程と,上記各オブジェクトの特徴ベクトルに対し
てそれぞれ上記クラスタリング工程で得られたクラスタ
のセントロイドを終点とするベクトルとの類似度に基づ
く重み付けを行った上で,上記全オブジェクトの平均ベ
クトルを算出する処理を,上記クラスタリング工程で得
られた各クラスタ毎に行う第2の重み付け平均ベクトル
算出工程と,上記第2の重み付け平均ベクトル算出工程
で得られた各クラスタに関する重み付け平均ベクトルと
上記問い合わせ情報の特徴ベクトルとに基づいて最適ベ
クトルを求める第2の最適ベクトル算出工程と,上記第
2の最適ベクトル算出工程で得られた最適ベクトルに最
も類似する特徴ベクトルを持つオブジェクトを抽出する
第2の最適オブジェクト抽出工程とを具備してなること
を特徴とする部分一致検索方法として構成されている。
上記第2の最適ベクトル算出工程においては,例えば次
のように,上記問い合わせ情報の特徴ベクトルと各クラ
スタのセントロイドとの位置関係によって上記最適ベク
トルの求め方を変えることが望ましい。即ち,上記問い
合わせ情報の特徴ベクトルが,ある2つのクラスタのセ
ントロイド間に存在する場合には,それら2つのクラス
タに関する重み付け平均ベクトルの終点を結んだベクト
ルと上記問い合わせ情報の特徴ベクトルとの交点を最適
ベクトルの終点とする。また,上記問い合わせ情報の特
徴ベクトルの片側に全てのクラスタのセントロイドが存
在する場合には,上記問い合わせ情報の特徴ベクトルに
最も近いクラスタに関する重み付け平均ベクトルを上記
問い合わせ情報の特徴ベクトルに射影させて得られたベ
クトルを最適ベクトルとする。また,上記第1,第2の
発明に係る方法は,いずれも例えば主としてハードウェ
アの組合せによって構成される装置,或いは上記方法の
手順を記述したプログラムを搭載したコンピュータ等の
装置(第3,第4の発明)により実施可能である。
【0010】
【発明の実施の形態】以下添付図面を参照して,本発明
の実施の形態及び実施例につき説明し,本発明の理解に
供する。尚,以下の実施の形態及び実施例は,本発明を
具体化した一例であって,本発明の技術的範囲を限定す
る性格のものではない。ここに,図1は第1の発明に係
る部分一致検索方法における処理手順の一例を示すフロ
ーチャート,図2は第3の発明に係る部分一致検索装置
A1の概略構成を示すブロック図,図3は上記第1の発
明に係る部分一致検索方法における重み付け平均ベクト
ルhw average 及びそれに基づくオブジェクト選択方法
を示す説明図,図4は第2の発明に係る部分一致検索方
法における処理手順の一例を示すフローチャート,図5
は第4の発明に係る部分一致検索装置A2の概略構成を
示すブロック図,図6は上記第2の発明に係る部分一致
検索方法において,問い合わせベクトルvector(q) =(w
q1) が2つのセントロイドCentroid1,Centroid2 間に存
在する場合のオブジェクト選択方法を示す説明図,図7
は上記第2の発明に係る部分一致検索方法において,問
い合わせベクトルvector(q) =(wq1) の片側に全てのセ
ントロイド間が存在する場合のオブジェクト選択方法を
示す説明図,図8,図9は実験1の結果を示すグラフ
図,図10は実験2の結果を示すグラフ図である。
【0011】本実施の形態に係る部分一致検索装置A1
(第3の発明の一例)は,第1の発明に係る部分一致検
索方法を実施可能な装置であり,図2に示す如く,デー
タベースH,入力部1,重み付け平均ベクトル算出部
2,検索部3,及び出力部4で構成されている。尚,上
記部分一致検索装置A1は,上記部分一致検索方法の手
順を記述したプログラムを搭載したコンピュータにより
実現されている。データベースHは,半導体メモリやハ
ードディスクなどの記憶装置上に構築されており,特徴
ベクトルが設定された複数の複合オブジェクト(例え
ば,素材コンテンツを組み合わせた編集コンテンツなど
のマルチメディアコンテンツ)の情報が予め格納されて
いる。入力部1は,キーボードやマウス等の入力デバイ
スにより構成されており,ユーザにより検索のための問
い合わせ情報(ベクトル)が入力される。重み付け平均
ベクトル算出部2(第1の重み付け平均ベクトル算出手
段に相当)は,上記データベースH内の各オブジェクト
の特徴ベクトルに対して,それぞれ上記入力部1から入
力された問い合わせベクトルとの類似度に基づく重み付
けを行った上で,上記データベースH内の全オブジェク
トの平均ベクトル(重み付け平均ベクトル)を算出す
る。検索部3(第1の最適ベクトル算出手段,及び第1
の最適オブジェクト抽出手段の一例)は,上記重み付け
平均ベクトル算出部2で得られた重み付け平均ベクトル
と上記問い合わせベクトルとの交点を終点とする最適ベ
クトルを求めると共に,上記データベースH内のオブジ
ェクトの中から,上記最適ベクトルに最も類似する特徴
ベクトルを持つオブジェクトを抽出する。尚,上記重み
付け平均ベクトル算出部2及び抽出部3は,プログラム
によってCPUやメモリを動作させることにより仮想的
に実現される。出力部4は,ディスプレイ装置やプリン
タ等の出力デバイスにより構成されており,上記検索部
3で抽出されたオブジェクトを上記問い合わせ情報に対
する検索結果として出力する。
【0012】続いて,上記部分一致検索装置A1上で実
施される部分一致検索方法の処理手順の一例を,図1に
示すフローチャートに従って説明する。尚,ここでは,
素材オブジェクトが1次元の特徴ベクトルを持ち, 2つ
の素材オブジェクトのカテゴリc1,c2 から組み合わされ
る複合オブジェクトhi の類似検索を例に挙げて説明す
る。まず,ユーザにより,入力部1から問い合わせ情報
q=(q1,*)が入力される(ステップS1)。この問い合わ
せ情報は,例えば,カテゴリc1が椅子,カテゴリc2が机
であれば,所望の椅子についての情報q1のみが指定され
ており,その椅子のイメージに最もふさわしい机の検索
要求を表している。上記問い合わせ情報に関する問い合
わせベクトルvector(q) =(wq1) は,上記問い合わせ情
報に基づいて装置側で変換してもよいし,ユーザが直接
問い合わせベクトルの形で入力するようにしてもよい。
ユーザから問い合わせ情報(若しくは問い合わせベクト
ル)が入力されると,重み付け平均ベクトル算出部2に
おいて,次式により重み付け平均ベクトルhw average
が算出される(ステップS2,第1の重み付け平均ベク
トル算出工程に相当)。
【数4】 ここで,問い合わせベクトルはデータベースH内のオブ
ジェクトの特徴ベクトルよりも低次元であるため,問い
合わせベクトル中の決定されている要素が座標軸となる
次元へ特徴ベクトルを射影させた部分特徴ベクトルを作
成し,そのベクトル間の距離を計算して類似度を判定し
ている。例えば,図3においては,各オブジェクト(×
印で表示)を,問い合わせベクトル中の決定されている
要素に関する座標軸(横軸)に射影した部分特徴ベクト
ルを作成し,この部分特徴ベクトルと問い合わせベクト
ルとの類似度を判定する。この場合には,問い合わせベ
クトルと各オブジェクトの特徴ベクトルにおける横軸方
向の距離によって類似度が判定されることになる。上記
(12)式より明らかなように,上記重み付け平均ベク
トルhw averageは,上記データベースH内の各オブジ
ェクトhi の特徴ベクトルに対して,それぞれ上記入力
部2から入力された問い合わせベクトルとの類似度に基
づく重み付けを行った上での上記データベースH内の全
オブジェクトの平均ベクトルである。このように,単に
全オブジェクトの平均ベクトルをとるのではなく,問い
合わせベクトルとの類似度に基づく重み付けを行った重
み付け平均ベクトルとすることで,得られるベクトルは
類似度の高い要素を含む組合せを重視した傾向を示す。
図3に,同じデータベースに対して算出された平均ベク
トルhaverage と上記重み付け平均ベクトルh
w average の一例を示す。上記重み付け平均ベクトルh
w average は,平均ベクトルhaverage と比べて問い合
わせベクトルに近いクラスタ側に表れており,類似度の
高い要素を含む組合せを重視した傾向を示していること
がわかる。
【0013】重み付け平均ベクトルhw average が算出
されると,続いて,検索部3において上記重み付け平均
ベクトルhw average と上記問い合わせベクトルvector
(q)=(wq1) との交点が求められ,その交点を終点とす
る最適ベクトルが求められる(ステップS3,第1の最
適ベクトル算出工程に相当)。この最適ベクトルが,上
記問い合わせ情報に対して最適なオブジェクトの特徴ベ
クトルを示す。従って,上記最適ベクトルと一致する特
徴ベクトルを有するオブジェクトが存在すれば,これが
最適な検索結果となる。しかしながら,上記最適ベクト
ルと一致する特徴ベクトルを有するオブジェクトが必ず
存在するとは限らないため,上記最適ベクトルと最も類
似度の高い特徴ベクトルを持つオブジェクトを探索し
(ステップS4,第1の最適オブジェクト抽出工程に相
当),得られたオブジェクトに基づいて上記問い合わせ
に対する検索結果を出力部4より出力する。図3の例で
は,複合オブジェクトhj=(oj1,oj2) が選択され,その
要素 oj2を,問い合わせqに対するふさわしい組合せの
解とし,検索結果として(q1, oj2) が出力される。
【0014】以上説明したように,本実施の形態に係る
部分一致検索方法によれば,問い合わせベクトルとの類
似度に基づく重み付けを行った重み付け平均ベクトルを
用いることによりデータベース全体の組合せ傾向を考慮
した検索が行えるため,問い合わせに偶然一致する特異
なオブジェクトが選択されることがなく,最もふさわし
いオブジェクトを確実に選択することが可能となる。
【0015】
【実施例】上記実施の形態に係る部分一致検索方法(第
1の発明)では,重み付け平均ベクトルを算出する際に
全てのオブジェクトに対して総当たり計算をする必要が
あるため,計算量が多くなる。しかも,上記重み付け平
均ベクトルの算出(ステップS2)を開始するためには
ユーザからの問い合わせ情報が決定(ステップS1)さ
れている必要があるため,全ての計算が検索開始後に行
われることになる。従って,データベースの規模が大き
くなったり,或いは各オブジェクトの特徴ベクトルが高
次元の場合には,ユーザが問い合わせ情報を入力して検
索を開始した後,検索結果が得られるまで(ステップS
2〜S4)に長時間を要する場合がある。そこで,検索
精度を多少犠牲にしたとしても,ユーザが問い合わせ情
報を入力した後(即ち検索が開始された後)の計算量を
少なくすることができれば,検索時間の削減という面に
おいて非常に有効である。これを実現するためには,ま
ず対象となるデータの数を減らすことが考えられる。こ
れには,データベース内のオブジェクトについてある一
定距離にあるものをクラスタリングし,その代表点とな
るセントロイドでそのクラスタに含まれるデータを代表
させる手法が考えられる。このようなクラスクリング情
報を利用することは,計算量の削減において非常に有効
である。たとえば,前述の重み付け平均ベクトルとし
て,クラスタのセントロイドと問い合わせベクトルとの
類似度を用いて近似したものを用いれば,計算量を大幅
に減少させることができる。しかし,この手法ではクラ
スタの大きさやクラスタ内のデータ数などが考慮されな
いため,全体の傾向を反映することが困難である。そこ
で,クラスタのセントロイドを解と仮定したときの重み
付け平均ベクトルをあらかじめ計算することで,ユーザ
が問い合わせ情報を入力した後(即ち検索が開始された
後)の計算量を少なくした部分一致検索方法(第2の発
明)の例を説明する。
【0016】本実施例に係る部分一致検索方法を実施可
能な部分一致検索装置A2(第4の発明の一例)は,図
5に示す如く,データベースH,入力部1,クラスタリ
ング部11,重み付け平均ベクトル算出部12,検索部
13,及び出力部4で構成されている。ここで,データ
ベースH,入力部1,及び出力部4の構成及び機能につ
いては上述した部分一致検索装置A1と同様である。ク
ラスタリング部11は,データベースH内の各オブジェ
クトの特徴ベクトルを,その終点位置に基づいてクラス
タリングし,複数のクラスタを生成する。重み付け平均
ベクトル算出部12(第2の重み付け平均ベクトル算出
手段に相当)は,データベースH内の各オブジェクトの
特徴ベクトルに対して,それぞれ上記クラスタリング部
11で得られたクラスタのセントロイドを終点とするベ
クトルとの類似度に基づく重み付けを行った上で,上記
全オブジェクトの平均ベクトル(重み付け平均ベクト
ル)を算出する処理を,上記クラスタリング部11で得
られた各クラスタ毎に行う。検索部13(第2の最適ベ
クトル算出手段,及び第2の最適オブジェクト抽出手段
の一例)は,上記重み付け平均ベクトル算出部12で得
られた各クラスタに関する重み付け平均ベクトルと入力
部1から入力された問い合わせベクトルとに基づいて最
適ベクトルを求めると共に,上記データベースH内のオ
ブジェクトの中から,上記最適ベクトルに最も類似する
特徴ベクトルを持つオブジェクトを抽出する。尚,上記
最適ベクトルを求める際には,上記問い合わせベクトル
が,ある2つのクラスタのセントロイド間に存在するか
否かで場合分けが行われ,それぞれ異なる方法が用いら
れる(詳細は後述する)。
【0017】続いて,上記部分一致検索装置A2上で実
施される部分一致検索方法の処理手順の一例を,図4に
示すフローチャートに従って説明する。尚,ここでは,
上記実施の形態と同様,素材オブジェクトが1次元の特
徴ベクトルを持ち, 2つの素材オブジェクトのカテゴリ
c1,c2 から組み合わされる複合オブジェクトhi の類似
検索を例に挙げて説明する。本検索方法では,上記実施
の形態に係る検索方法と異なり,ユーザから問い合わせ
情報が入力される(ステップS13)前に,予め以下に
示すステップS11,S12の処理が行われる。まず,
クラスタリング部11において,データベースH内の全
てのオブジェクトを対象としてクラスタリングが行わ
れ,複数のクラスタが生成される(ステップS11,ク
ラスタリング工程に相当)。このクラスタリングの手法
は既に広く知られているためここでの説明は省略する。
続いて,重み付け平均ベクトル算出部12において,デ
ータベースH内の各オブジェクトの特徴ベクトルに対し
て,それぞれ上記クラスタリング部11で得られたクラ
スタのセントロイドを終点とするベクトルとの類似度に
基づく重み付けを行った上で,上記全オブジェクトの平
均ベクトル(重み付け平均ベクトル)を算出する処理
が,上記クラスタリング部11で得られた各クラスタ毎
に行われる(ステップS12,第2の重み付け平均ベク
トル算出工程に相当)。ここで,i番目のクラスタ(セ
ントロイドci )に関する上記重み付け平均ベクトルh
ci w averageは次式により求められる。
【数5】 この重み付け平均ベクトルは,対象としたセントロイド
に類似したオブジェクトを重視した傾向を表している。
また,問い合わせベクトルがいずれかのセントロイドを
通る場合には,そのセントロイドに関する上記重み付け
平均ベクトルがユーザの問い合わせベクトルに対する重
み付け平均ベクトルとなる。従って,このステップS1
2において各セントロイドに関する重み付け平均ベクト
ルをあらかじめ計算しておけば,ユーザからの問い合わ
せが入力された後はそれらの結果を用いて近似する事に
より,ユーザが問い合わせ情報を入力した後(即ち検索
が開始された後)の計算量を少なくすることができる。
以上説明したステップS11,S12の処理が,ユーザ
から問い合わせ情報が入力される(ステップS13)前
に予め行われる。
【0018】その後,ユーザから問い合わせ情報が入力
されると(ステップS13),検索部13において,問
い合わせベクトルが上記ステップS11で生成された複
数のクラスタの内のある2つのクラスタのセントロイド
間に存在するか否かにより,次のステップS15,S1
6(第2の最適ベクトル算出工程に相当)のいずれかの
処理が行われる。 問い合わせベクトルが,ある2つのセントロイド間
に存在する場合(ステップS15) この場合の処理を図6を用いて具体的に説明する。図6
の例では,2つのクラスタ(それぞれ,Centroid1,Cent
roid2 を有する)が存在し,各セントロイドCentroid1,
Centroid2 に関する重み付け平均ベクトルh
c1 w average,hc2 w ave rageがぞれぞれ図のように求
められており,問い合わせベクトルvector(q) =(w q1)
が上記2つのセントロイドCentroid1,Centroid2 間に存
在する。この場合には,2つの重み付け平均ベクトルh
c1 w average,hc2 w averageそれぞれの終点を結んだ
ベクトルと上記問い合わせベクトルvector(q) =(wq1)
との交点が求められ,その交点を終点とする最適ベクト
ルh' w average が求められる。 問い合わせベクトルが,ある2つのセントロイド間
に存在しない場合(問い合わせベクトルの片側に全ての
クラスタのセントロイドが存在する場合)(ステップS
16) 図7に示すように,問い合わせベクトルvector(q) =(w
q1) の片側に全てのクラスタのセントロイドが存在する
場合には,上記問い合わせベクトルに最も近いクラスタ
に関する重み付け平均ベクトルhc2 w averageを上記問
い合わせベクトルに射影し,得られたベクトルを最適ベ
クトルh' w average とする。上記ステップS15若し
くはS16により最適ベクトルh' w average が求めら
れると,該最適ベクトルh' w average と最も類似度の
高いオブジェクトが選択され(ステップS17,第2の
最適オブジェクト抽出工程に相当),得られたオブジェ
クトに基づいて上記問い合わせに対する検索結果が出力
部4より出力される。
【0019】以上説明したように,本実施例に係る部分
一致検索方法では,問い合わせ情報が入力される前に計
算量の多い処理を予め済ませておき(ステップS11,
S12),問い合わせ情報が入力された後は予め求めら
れている情報(各クラスタのセントロイドに関する重み
付け平均ベクトル)を用いた計算量の少ない処理(ステ
ップS15/S16,S17)のみを行えばよいため,
検索時間(問い合わせ情報が入力されてから検索結果が
出力されるまでに要する時間)を極めて短く抑えること
が可能である。
【0020】続いて,上記実施の形態に係る検索方法
(第1の発明)と上記実施例に係る検索方法(第2の実
施例)の有効性を検証するため,所定のシミュレータを
用いてシミュレーションを行った結果について述べる。
検索対象は,1次元の特徴ベクトルを持つ素材オブジェ
クトを2種類組み合わせた編集オブジェクト(ox,oy) で
ある。その編集オブジェクトに対し,問い合わせ(qx ,
*) を与え,単純に問い合わせベクトルに最も近いオブ
ジェクトを選択する従来の方法(以下,従来方法とい
う),上記実施の形態に係る方法(以下,第1の方法と
いう),上記実施例に係る方法(以下,第2の方法とい
う)の3種類の解を求め,後述する方法で評価した。検
索対象は, 10個のクラスタを形成する1000個のデ
ータ(編集オブジェクト)である。検索対象となるオブ
ジェクトhは,次のような特徴ベクトルを持つものとす
る。 vector(h) = ( wx ,wy ) 0 ≦ wx ≦ 20, 0 ≦ wy ≦ 20 実験では,同一のデータに対して,q=(qx ,*) ,0≦ qx
≦20となる問い合わせを与え, qx を0.1刻みに変化
させた200種類の問い合わせベクトルによる検索(実
験1)と,問い合わせベクトルを(10,*)に固定し,10
00パターンの異なるデータに対する検索(実験2)を
行った。全ての実験において,類似度(上記(5)式)
のパラメータkは5.0とした。実験1の結果を図8,
図9に,実験2の結果を図10にそれぞれ示す。図8
は,横軸を200種類のそれぞれの問い合わせベクトル
の値,縦軸を問い合わせの解として選択されたc2カテゴ
リの oy オブジェクトの1次元特徴ベクトルの値とし
て,上記3つの方法による結果をそれぞれプロットした
ものである。同図より,従来方法の解は広い範囲で振動
を起こしていることがわかる。これは,全体の傾向を考
慮せずに問い合わせに最も近いオブジェクトを選択して
いる事が原因であると考えられる。それに対して,第1
の方法と第2の方法は,若干異なる部分があるものの,
同様な解の傾向を表している。これは,問い合わせベク
トルに対して類似性の高い組合せの傾向が反映される第
1,第2の方法の有効性を示しているといえる。更に,
総当たり計算によって重み付け平均ベクトルを算出する
上記第1の方法の解が最もふさわしい組合せであると仮
定し,その他の2つの方法の解について評価する。図9
は,横軸を200種類のそれぞれの問い合わせベクトル
の値として,第1の方法で得られた oy オブジェクトの
特徴ベクトルの値を基準としたときの従来方法,及び第
2の方法で得られた oy オブジェクトの特徴ベクトルの
値の誤差をそれぞれプロットしたものである。同図よ
り,第1の方法と従来方法の誤差は,第2の方法と従来
方法の誤差よりも大きい。この傾向は,横軸に実験2に
おけるデータパターンをとった図10の結果でも同様で
あり,殆どの部分で第2の方法が従来方法の解よりも信
頼性が高いといえる。従って,クラスタリングを用いた
簡略化手法である第2の方法においても,従来の単純な
最近傍検索手法と比較すると,よりふさわしい組合せと
なる解の探索が可能であるといえる。
【0021】
【発明の効果】以上説明したように,第1の発明は,所
定の次元の特徴ベクトルが付与された複数のオブジェク
トの中から,上記オブジェクトの特徴ベクトルよりも低
次元の特徴ベクトルを有する問い合わせ情報に最も近い
オブジェクトを検索する部分一致検索方法において,上
記各オブジェクトの特徴ベクトルに対してそれぞれ上記
問い合わせ情報の特徴ベクトルとの類似度に基づく重み
付けを行った上で,上記全オブジェクトの平均ベクトル
を算出する第1の重み付け平均ベクトル算出工程と,上
記第1の重み付け平均ベクトル算出工程で得られた上記
全オブジェクトの重み付け平均ベクトルと上記問い合わ
せ情報の特徴ベクトルとの交点を終点とする最適ベクト
ルを求める第1の最適ベクトル算出工程と,上記第1の
最適ベクトル算出工程で得られた最適ベクトルに最も類
似する特徴ベクトルを持つオブジェクトを抽出する第1
の最適オブジェクト抽出工程とを具備してなることを特
徴とする部分一致検索方法として構成されているため,
オブジェクト全体の傾向を考慮した検索が行え,問い合
わせに偶然一致する特異なオブジェクトの選択を防止し
て最もふさわしいオブジェクトを確実に選択することが
可能となる。また,第2の発明は,所定の次元の特徴ベ
クトルが付与された複数のオブジェクトの中から,上記
オブジェクトの特徴ベクトルよりも低次元の特徴ベクト
ルを有する問い合わせ情報に最も近いオブジェクトを検
索する部分一致検索方法において,上記各オブジェクト
の特徴ベクトルを,その終点位置に基づいてクラスタリ
ングするクラスタリング工程と,上記各オブジェクトの
特徴ベクトルに対してそれぞれ上記クラスタリング工程
で得られたクラスタのセントロイドを終点とするベクト
ルとの類似度に基づく重み付けを行った上で,上記全オ
ブジェクトの平均ベクトルを算出する処理を,上記クラ
スタリング工程で得られた各クラスタ毎に行う第2の重
み付け平均ベクトル算出工程と,上記第2の重み付け平
均ベクトル算出工程で得られた各クラスタに関する重み
付け平均ベクトルと上記問い合わせ情報の特徴ベクトル
とに基づいて最適ベクトルを求める第2の最適ベクトル
算出工程と,上記第2の最適ベクトル算出工程で得られ
た最適ベクトルに最も類似する特徴ベクトルを持つオブ
ジェクトを抽出する第2の最適オブジェクト抽出工程と
を具備してなることを特徴とする部分一致検索方法とし
て構成されているため,検索時間(問い合わせ情報が入
力されてから検索結果が出力されるまでに要する時間)
を極めて短く抑えることが可能である。また,検索精度
についても,上記第1の発明よりは劣るものの,単純に
問い合わせベクトルに最も近いオブジェクトを選択する
従来の方法と比べると格段に有利である。
【図面の簡単な説明】
【図1】 第1の発明に係る部分一致検索方法における
処理手順の一例を示すフローチャート。
【図2】 第3の発明に係る部分一致検索装置A1の概
略構成を示すブロック図。
【図3】 上記第1の発明に係る部分一致検索方法にお
ける重み付け平均ベクトルhw average 及びそれに基づ
くオブジェクト選択方法を示す説明図。
【図4】 第2の発明に係る部分一致検索方法における
処理手順の一例を示すフローチャート。
【図5】 第4の発明に係る部分一致検索装置A2の概
略構成を示すブロック図。
【図6】 上記第2の発明に係る部分一致検索方法にお
いて,問い合わせベクトルvector(q) =(wq1) が2つの
セントロイドCentroid1,Centroid2 間に存在する場合の
オブジェクト選択方法を示す説明図。
【図7】 上記第2の発明に係る部分一致検索方法にお
いて,問い合わせベクトルvector(q) =(wq1) の片側に
全てのセントロイド間が存在する場合のオブジェクト選
択方法を示す説明図。
【図8】 実験1の結果を示すグラフ図。
【図9】 実験1の結果を示すグラフ図。
【図10】 実験2の結果を示すグラフ図。
【図11】 2次元の特徴ベクトルをもつコンテンツの
検索方法を示す説明図。
【図12】 素材コンテンツが1次元の特徴ベクトルを
もち,2つの素材オブジェクトのカテゴリから組み合わ
される編集コンテンツの類似検索方法を示す説明図。
【図13】 問い合わせ情報q=(q1,*)に基づいて,単に
問い合わせベクトルに最も近いオブジェクトを選択する
類似検索方法を示す説明図。
【符号の説明】
1…入力部 2…重み付け平均ベクトル算出部(第1の重み付け平均
ベクトル算出手段に相当) 3…検索部(第1の最適ベクトル算出手段,及び第1の
最適オブジェクト抽出手段の一例) 4…出力部 11…クラスタリング部 12…重み付け平均ベクトル算出部(第2の重み付け平
均ベクトル算出手段に相当) 13…検索部(第2の最適ベクトル算出手段,及び第2
の最適オブジェクト抽出手段の一例) H…データベース
フロントページの続き Fターム(参考) 5B075 ND16 NK06 NR05 NR12 PP12 PP30 PR06 QM08 5L096 BA08 CA22 DA02 EA39 FA10 FA32 FA34 FA38 JA03 JA11 JA22 MA07 9A001 FF03 GZ21 JJ01 JZ19

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 所定の次元の特徴ベクトルが付与された
    複数のオブジェクトの中から,上記オブジェクトの特徴
    ベクトルよりも低次元の特徴ベクトルを有する問い合わ
    せ情報に最も近いオブジェクトを検索する部分一致検索
    方法において,上記各オブジェクトの特徴ベクトルに対
    してそれぞれ上記問い合わせ情報の特徴ベクトルとの類
    似度に基づく重み付けを行った上で,上記全オブジェク
    トの平均ベクトルを算出する第1の重み付け平均ベクト
    ル算出工程と,上記第1の重み付け平均ベクトル算出工
    程で得られた上記全オブジェクトの重み付け平均ベクト
    ルと上記問い合わせ情報の特徴ベクトルとの交点を終点
    とする最適ベクトルを求める第1の最適ベクトル算出工
    程と,上記第1の最適ベクトル算出工程で得られた最適
    ベクトルに最も類似する特徴ベクトルを持つオブジェク
    トを抽出する第1の最適オブジェクト抽出工程とを具備
    してなることを特徴とする部分一致検索方法。
  2. 【請求項2】 上記第1の重み付け平均ベクトル算出工
    程において,上記オブジェクトの特徴ベクトルを上記問
    い合わせ情報の特徴ベクトルのベクトル空間に射影して
    得られた射影ベクトルと上記問い合わせ情報の特徴ベク
    トルとの類似度を用いる請求項1記載の部分一致検索方
    法。
  3. 【請求項3】 所定の次元の特徴ベクトルが付与された
    複数のオブジェクトの中から,上記オブジェクトの特徴
    ベクトルよりも低次元の特徴ベクトルを有する問い合わ
    せ情報に最も近いオブジェクトを検索する部分一致検索
    方法において,上記各オブジェクトの特徴ベクトルを,
    その終点位置に基づいてクラスタリングするクラスタリ
    ング工程と,上記各オブジェクトの特徴ベクトルに対し
    てそれぞれ上記クラスタリング工程で得られたクラスタ
    のセントロイドを終点とするベクトルとの類似度に基づ
    く重み付けを行った上で,上記全オブジェクトの平均ベ
    クトルを算出する処理を,上記クラスタリング工程で得
    られた各クラスタ毎に行う第2の重み付け平均ベクトル
    算出工程と,上記第2の重み付け平均ベクトル算出工程
    で得られた各クラスタに関する重み付け平均ベクトルと
    上記問い合わせ情報の特徴ベクトルとに基づいて最適ベ
    クトルを求める第2の最適ベクトル算出工程と,上記第
    2の最適ベクトル算出工程で得られた最適ベクトルに最
    も類似する特徴ベクトルを持つオブジェクトを抽出する
    第2の最適オブジェクト抽出工程とを具備してなること
    を特徴とする部分一致検索方法。
  4. 【請求項4】 上記第2の最適ベクトル算出工程におい
    て,上記問い合わせ情報の特徴ベクトルが,ある2つの
    クラスタのセントロイド間に存在する場合に,それら2
    つのクラスタに関する重み付け平均ベクトルの終点を結
    んだベクトルと上記問い合わせ情報の特徴ベクトルとの
    交点を最適ベクトルの終点とする請求項3記載の部分一
    致検索方法。
  5. 【請求項5】 上記第2の最適ベクトル算出工程におい
    て,上記問い合わせ情報の特徴ベクトルの片側に全ての
    クラスタのセントロイドが存在する場合に,上記問い合
    わせ情報の特徴ベクトルに最も近いクラスタに関する重
    み付け平均ベクトルを上記問い合わせ情報の特徴ベクト
    ルに射影させて得られたベクトルを最適ベクトルとする
    請求項3又は4記載の部分一致検索方法。
  6. 【請求項6】 上記オブジェクトがマルチメディアコン
    テンツである請求項1〜5のいずれかに記載の部分一致
    検索方法。
  7. 【請求項7】 所定の次元の特徴ベクトルが付与された
    複数のオブジェクトの中から,上記オブジェクトの特徴
    ベクトルよりも低次元の特徴ベクトルを有する問い合わ
    せ情報に最も近いオブジェクトを検索する部分一致検索
    装置において,上記各オブジェクトの特徴ベクトルに対
    してそれぞれ上記問い合わせ情報の特徴ベクトルとの類
    似度に基づく重み付けを行った上で,上記全オブジェク
    トの平均ベクトルを算出する第1の重み付け平均ベクト
    ル算出手段と,上記第1の重み付け平均ベクトル算出手
    段で得られた上記全オブジェクトの重み付け平均ベクト
    ルと上記問い合わせ情報の特徴ベクトルとの交点を終点
    とする最適ベクトルを求める第1の最適ベクトル算出手
    段と,上記第1の最適ベクトル算出手段で得られた最適
    ベクトルに最も類似する特徴ベクトルを持つオブジェク
    トを抽出する第1の最適オブジェクト抽出手段とを具備
    してなることを特徴とする部分一致検索装置。
  8. 【請求項8】 所定の次元の特徴ベクトルが付与された
    複数のオブジェクトの中から,上記オブジェクトの特徴
    ベクトルよりも低次元の特徴ベクトルを有する問い合わ
    せ情報に最も近いオブジェクトを検索する部分一致検索
    装置において,上記各オブジェクトの特徴ベクトルを,
    その終点位置に基づいてクラスタリングするクラスタリ
    ング手段と,上記各オブジェクトの特徴ベクトルに対し
    てそれぞれ上記クラスタリング手段で得られたクラスタ
    のセントロイドを終点とするベクトルとの類似度に基づ
    く重み付けを行った上で,上記全オブジェクトの平均ベ
    クトルを算出する処理を,上記クラスタリング工程で得
    られた各クラスタ毎に行う第2の重み付け平均ベクトル
    算出手段と,上記第2の重み付け平均ベクトル算出手段
    で得られた各クラスタに関する重み付け平均ベクトルと
    上記問い合わせ情報の特徴ベクトルとに基づいて最適ベ
    クトルを求める第2の最適ベクトル算出手段と,上記第
    2の最適ベクトル算出手段で得られた最適ベクトルに最
    も類似する特徴ベクトルを持つオブジェクトを抽出する
    第2の最適オブジェクト抽出手段とを具備してなること
    を特徴とする部分一致検索装置。
  9. 【請求項9】 所定の次元の特徴ベクトルが付与された
    複数のオブジェクトの中から,上記オブジェクトの特徴
    ベクトルよりも低次元の特徴ベクトルを有する問い合わ
    せ情報に最も近いオブジェクトを検索する部分一致検索
    プログラムを記録した記録媒体において,該プログラム
    は,上記各オブジェクトの特徴ベクトルに対してそれぞ
    れ上記問い合わせ情報の特徴ベクトルとの類似度に基づ
    く重み付けを行った上で,上記全オブジェクトの平均ベ
    クトルを算出する第1の重み付け平均ベクトル算出工程
    と,上記第1の重み付け平均ベクトル算出工程で得られ
    た上記全オブジェクトの重み付け平均ベクトルと上記問
    い合わせ情報の特徴ベクトルとの交点を終点とする最適
    ベクトルを求める第1の最適ベクトル算出工程と,上記
    第1の最適ベクトル算出工程で得られた最適ベクトルに
    最も類似する特徴ベクトルを持つオブジェクトを抽出す
    る第1の最適オブジェクト抽出工程とをコンピュータに
    実行させるものであることを特徴とする部分一致検索プ
    ログラムを記録した記録媒体。
  10. 【請求項10】 所定の次元の特徴ベクトルが付与され
    た複数のオブジェクトの中から,上記オブジェクトの特
    徴ベクトルよりも低次元の特徴ベクトルを有する問い合
    わせ情報に最も近いオブジェクトを検索する部分一致検
    索プログラムを記録した記録媒体において,該プログラ
    ムは,上記各オブジェクトの特徴ベクトルを,その終点
    位置に基づいてクラスタリングするクラスタリング工程
    と,上記各オブジェクトの特徴ベクトルに対してそれぞ
    れ上記クラスタリング工程で得られたクラスタのセント
    ロイドを終点とするベクトルとの類似度に基づく重み付
    けを行った上で,上記全オブジェクトの平均ベクトルを
    算出する処理を,上記クラスタリング工程で得られた各
    クラスタ毎に行う第2の重み付け平均ベクトル算出工程
    と,上記第2の重み付け平均ベクトル算出工程で得られ
    た各クラスタに関する重み付け平均ベクトルと上記問い
    合わせ情報の特徴ベクトルとに基づいて最適ベクトルを
    求める第2の最適ベクトル算出工程と,上記第2の最適
    ベクトル算出工程で得られた最適ベクトルに最も類似す
    る特徴ベクトルを持つオブジェクトを抽出する第2の最
    適オブジェクト抽出工程とをコンピュータに実行させる
    ものであることを特徴とする部分一致検索プログラムを
    記録した記録媒体。
JP10362749A 1998-12-21 1998-12-21 部分一致検索方法,その装置,及び部分一致検索プログラムを記録した記録媒体 Pending JP2000181934A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10362749A JP2000181934A (ja) 1998-12-21 1998-12-21 部分一致検索方法,その装置,及び部分一致検索プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10362749A JP2000181934A (ja) 1998-12-21 1998-12-21 部分一致検索方法,その装置,及び部分一致検索プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2000181934A true JP2000181934A (ja) 2000-06-30

Family

ID=18477644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10362749A Pending JP2000181934A (ja) 1998-12-21 1998-12-21 部分一致検索方法,その装置,及び部分一致検索プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2000181934A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004171215A (ja) * 2002-11-19 2004-06-17 Yamatake Corp 文書管理装置
JP2007329779A (ja) * 2006-06-09 2007-12-20 Fuji Xerox Co Ltd 欠陥分類システム、画像形成装置および欠陥分類プログラム
US8370139B2 (en) 2006-04-07 2013-02-05 Kabushiki Kaisha Toshiba Feature-vector compensating apparatus, feature-vector compensating method, and computer program product
JP5327973B2 (ja) * 2007-12-05 2013-10-30 芝浦メカトロニクス株式会社 特徴解析装置
JP2015206585A (ja) * 2014-04-11 2015-11-19 パナソニックIpマネジメント株式会社 レシピ情報処理装置、調理装置、およびレシピ情報処理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004171215A (ja) * 2002-11-19 2004-06-17 Yamatake Corp 文書管理装置
US8370139B2 (en) 2006-04-07 2013-02-05 Kabushiki Kaisha Toshiba Feature-vector compensating apparatus, feature-vector compensating method, and computer program product
JP2007329779A (ja) * 2006-06-09 2007-12-20 Fuji Xerox Co Ltd 欠陥分類システム、画像形成装置および欠陥分類プログラム
JP4631809B2 (ja) * 2006-06-09 2011-02-16 富士ゼロックス株式会社 欠陥分類システム、画像形成装置および欠陥分類プログラム
JP5327973B2 (ja) * 2007-12-05 2013-10-30 芝浦メカトロニクス株式会社 特徴解析装置
JP2015206585A (ja) * 2014-04-11 2015-11-19 パナソニックIpマネジメント株式会社 レシピ情報処理装置、調理装置、およびレシピ情報処理方法

Similar Documents

Publication Publication Date Title
US12051160B2 (en) Tagging virtualized content
US8036432B2 (en) System and method of saving digital content classified by person-based clustering
EP1395916B1 (en) Meta-descriptor for multimedia information
US7171060B2 (en) Method of perceptual 3D shape description and method and apparatus for searching 3D graphics model database using the description method
JP4074366B2 (ja) 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体
US8037105B2 (en) Computer apparatus
JP5721233B2 (ja) 画像認識システム
US5671328A (en) Method and apparatus for automatic creation of a voice recognition template entry
US20210263964A1 (en) Systems and methods for generating improved content based on matching mappings
Gupta Visual information retrieval technology: A virage perspective
JP2011096286A (ja) 画像または画像シーケンス内のオブジェクトを検索する方法と装置
Li et al. DPF-a perceptual distance function for image retrieval
US7716169B2 (en) System for and method of extracting and clustering information
JPH11161670A (ja) 情報フィルタリング方法、装置及びシステム
CN116034401A (zh) 用于使用自然语言描述检索视频的系统和方法
JP2000181934A (ja) 部分一致検索方法,その装置,及び部分一致検索プログラムを記録した記録媒体
JP2001118075A (ja) 物体領域情報記述方法及び物体領域情報生成装置並びに映像情報処理方法及び情報処理装置
JP4166678B2 (ja) 知覚的に認識可能な3次元形状の記述方法と、それを利用した3次元グラフィックモデルのデータベース検索方法及び装置
Wu Perspectives on content-based multimedia systems
JP6793169B2 (ja) サムネイル出力装置、サムネイル出力方法およびサムネイル出力プログラム
JPH10111869A (ja) 情報分類装置とその方法
Hou et al. Dynamic query interface for 3D shape search
JP2008181515A (ja) 物体領域情報記述方法、映像情報処理方法及び情報処理装置
JP2002245051A (ja) 動画像検索装置及び方法、その方法をコンピュータに実行させるためのプログラム並びにそのプログラムを記録した記録媒体
Natsev et al. Active selection for multi-example querying by content

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040506