JP2005010931A - 画像データの類似検索装置および該類似検索装置における類似判定方法 - Google Patents
画像データの類似検索装置および該類似検索装置における類似判定方法 Download PDFInfo
- Publication number
- JP2005010931A JP2005010931A JP2003172217A JP2003172217A JP2005010931A JP 2005010931 A JP2005010931 A JP 2005010931A JP 2003172217 A JP2003172217 A JP 2003172217A JP 2003172217 A JP2003172217 A JP 2003172217A JP 2005010931 A JP2005010931 A JP 2005010931A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- colors
- color
- similarity
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
【課題】類似検索の精度を向上させる類似検索方法および類似検索装置を提供する。
【解決手段】特徴項目として選択される色の類似性を反映させた線形独立なベクトルを作成し、その線形独立なベクトルを並べた行列を用いて画像データの類似性を、ベクトル間距離によって判定することにより、より人間の感覚を反映させた類似検索を行うことが可能となる画像データの類似検索方法および類似検索装置を提供する。従って、類似検索の精度を向上させることができる。本類似検索方法は、静止画に限らず、動画データにも適用可能である。
【選択図】 図9
【解決手段】特徴項目として選択される色の類似性を反映させた線形独立なベクトルを作成し、その線形独立なベクトルを並べた行列を用いて画像データの類似性を、ベクトル間距離によって判定することにより、より人間の感覚を反映させた類似検索を行うことが可能となる画像データの類似検索方法および類似検索装置を提供する。従って、類似検索の精度を向上させることができる。本類似検索方法は、静止画に限らず、動画データにも適用可能である。
【選択図】 図9
Description
【0001】
【発明の属する技術分野】
本発明は、画像データを類似検索する類似検索装置に関する。
【0002】
【従来の技術】
ディジタルカメラ、スキャナなどの普及やインターネットのブロードバンド化に伴い、画像データが急速に作成、蓄積されつつある。これに伴い、大量のデータの中から所望のデータを検索する技術への期待が高まっている。
【0003】
従来、データベースに蓄積されたデータから所望の画像データを検索する場合、
データベースに画像データを蓄積する際に、その画像データの特徴を表すキーワード等を登録しておき、検索する際入力されたキーワードに合致するあるいは類似する画像データが検索結果として出力される。
【0004】
しかし、近年の画像データの急増により、すべての画像データにキーワードを付けることは難しい。また作業者の主観によりキーワードが付けられるため、そのデータの特徴を正しく表現していない可能性があり、その場合検索者が所望する画像とは異なる画像データが検索の結果として出力されてしまう。
【0005】
そこで、キーワードによる検索ではなく、画像データそのものを使用し、その画像データに類似するデータを検索する類似検索が注目されている。例えば、ハンドバッグが写っている写真を入力することにより、データベースに格納された画像データの中からハンドバッグが写っている画像データが検索結果として出力されたり、指紋の画像データを入力することにより、データベースに格納された画像データの中からその指紋に類似する指紋の画像データが検索結果として出力される。
【0006】
従来の類似検索では、データベースに画像データを蓄積する際に、画像データの特徴が複数の項目に分類され、項目ごとの特徴量によって数値化(ベクトル化)して登録される。例えば、画像データの特徴を色で分類する場合、画像データに含まれる各色の割合によりその画像データを特徴付ける。
【0007】
検索する際に入力される画像データの特徴も同様に数値化(ベクトル化)し、データベースに蓄積された各画像データのベクトルと入力された画像データのベクトル間の距離を画像データの類似性の判定に用い、データベースの中から類似すると判定された画像データが検索結果として出力される。
【0008】
図1は、従来の類似検索において、画像データの特徴をベクトル化する場合の例を説明する図である。図1の例においては、すべての画像データの特徴を赤、赤橙、緑の3色で分類しようとするものである。すなわち、画像データに含まれる3色の割合を数値化することで、すべての画像データをベクトル化する。
【0009】
なお、簡単化のために、画像データをピクセル(画素)単位で分類するものとし、どのピクセルも3色のうちのいずれかの色に属するものとする。図1に描かれているのは、特徴を表す項目数に対応する互いに直交する3次元の座標である。画像データをこの3次元空間の点として、つまりベクトルとして表す。
【0010】
x、y、z座標軸は、それぞれ特徴項目である赤、赤橙、緑の3色に対応し、各座標の数値は、その座標に対応する色が画像データに含まれる割合を示す。例えば、点A(0.7、0.2、0.1)は、赤が全ピクセルの70%、赤橙が20%、緑が10%を占める画像データを示す点(ベクトル)である。
【0011】
点Aと同じように、画像データが赤1色である場合、赤橙1色である場合、緑1色である場合それぞれ、点B(1,0,0)、点C(0,1,0)、点D(0,0,1)と表される。ここで3次元空間の2点間X=(x1,x2,x3)、Y=(y1,y2,y3)の距離d(X,Y)を次式で定義すると、
【0012】
【数1】
【0013】
BC間の距離d(B,C)とBD間の距離d(B,D)はそれぞれ、
【0014】
【数2】
【0015】
となる。点Bから見て、点Cと点Dは同じ距離にある。
【0016】
よって、図1の3次元空間を使用して類似検索を行うと、赤1色のみ画像データに類似する画像データとして、赤橙1色のみの画像データと緑1色の画像データが結果として出力される可能性がある。しかしながら、人間の感覚から言えば、赤1色のみの画像データに対して、赤橙と緑の画像データが同程度に類似するという結果は受け入れがたく、従来の方法は、検索者が所望する画像データではない画像データが検索結果として出力される可能性が高い、つまり類似検索の精度としては低いものであった。
【0017】
これは、特徴を表す項目を直交する座標軸に単純に対応させるためである。このため、その項目間の類似性が直交座標軸の持つ直交性によって失われ、上記のように人間の感覚から見て類似とみなせない画像データが、同じ距離となるようなベクトルとして表現されてしまう。
【0018】
項目間に類似性があるとは、上記例の赤と赤橙のように項目同士に類似性や相関性のある場合である。逆に項目間が独立であるとは、例えば、物体の特徴を縦、横、高さで表す場合、縦が何センチであるかは、横が何センチであるかに関係ない場合である。つまり、特徴を表す項目同士が互いに依存しない関係であるものを指す。
【0019】
また、類似度を数値化する例として、非特許文献1には、2つのヒストグラムの類似度をさまざまな距離関数によって数値化することが提案されているが、いずれも項目間の類似性を反映させる方法が具体的に示されたものではない。
【0020】
【非特許文献1】Michael S. Lew; Princilpes of Visual Information Retrieval; Springer, 2001
【0021】
【発明が解決しようとする課題】
このように従来の画像データの類似検索は、特徴を表す項目として複数の色を使用し、その複数の色同士に類似性があること、またその特徴を表す項目を単純に直交座標に対応させて各画像データの特徴をベクトル化し、類似判定を行っていること、この2点が類似検索の精度を落とす原因となっていた。
【0022】
そこで本発明の目的は、画像データの特徴を表す項目として複数の色を使用し、その複数の色同士の類似性を反映させた、より人間の感覚に近い座標軸を作成し、その座標軸に対応する座標空間上の距離により類似判定を行うことで類似検索の精度をあげることができる類似検索装置を提供することにある。
【0023】
【課題を解決するための手段】
上記目的は、複数の画像データのそれぞれに対して、前記画像データのピクセルが複数の色によって分類される第一のステップと、前記色ごとのピクセル数を全ピクセル数で除算して各色の割合が算出される第二のステップと、前記割合を並べたベクトルが変換行列によって特徴ベクトルに変換される第三のステップとを有し、前記特徴ベクトルが該画像データごとに対応付けられて予め蓄積装置に蓄積され、前記蓄積装置と接続された類似検索装置に、検索対象として画像データが入力され、前記検索対象として入力された画像データに対して、前記第一のステップから前記第三のステップが行われ、該検索対象として入力された画像データの特徴ベクトルが生成され、該検索対象として入力された画像データの特徴ベクトルである第一の特徴ベクトルと、前記蓄積装置に蓄積された特徴ベクトルから選択された特徴ベクトルである第二の特徴ベクトルの距離を算出し、前記距離の大小により、前記第一の特徴ベクトルに対応する、検索対象として入力された画像データと、前記第二の特徴ベクトルに対応付けられた画像データの類似性が判定され、前記蓄積装置に蓄積された複数の画像データに対応付けられた複数の特徴ベクトルに対して前記類似判定を行うことで、前記蓄積装置に蓄積された複数の画像データから、検索対象として入力された画像データに類似する画像データを検索する類似画像検索方法において、前記変換行列は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを、前記色の数だけ横に並べて作成される行列であることを特徴とする、請求項1に記載の類似画像検索方法を提供することにより達成される。
【0024】
また上記目的は、請求項1において、前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする、請求項2に記載の類似画像検索方法を提供することにより達成される。
【0025】
また上記目的は、請求項2において、前記複数の色は、色相環に表される色から選択され、前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする、請求項3に記載の類似画像検索方法を提供することにより達成される。
【0026】
また上記目的は、予め画像データと該画像データに対する第一の特徴ベクトルが対応付けられ複数蓄積された画像データベースと、検索対象の画像データが入力される画像入力部と、入力された画像データを第二の特徴ベクトルに対応させる特徴抽出部と、入力された画像データが蓄積された画像データと類似するかを前記第一の特徴ベクトルと前記第二の特徴ベクトルの距離により判定する類似判定部と、情報を格納する記憶部とを備え、前記記憶部は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを前記色の数だけ横に並べた変換行列を含み、前記特徴抽出部は、画像データのピクセルを複数の色によって分類し、色ごとのピクセル数を全ピクセル数で除算して各色の割合を画像データごとに算出し、前記割合を並べてベクトルとし、前記変換行列により前記ベクトルを変換することを特徴とする、請求項4に記載の類似画像検索装置を提供することにより達成される。
【0027】
また上記目的は、請求項4において、前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする、請求項5に記載の類似画像検索装置を提供することにより達成される。
【0028】
また上記目的は、請求項5において、前記複数の色は、色相環に表される色から選択され、前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする、請求項6に記載の類似画像検索装置を提供することにより達成される。
【0029】
【発明の実施の形態】
以下、本発明の実施の形態について図面に従って説明する。しかしながら、本発明の技術的範囲はかかる実施の形態に限定されるものではない。
【0030】
本発明の実施形態を説明する前に、空間上での点、ベクトル、ベクトルの線形独立性について説明する。空間上での点の座標は、原点からのベクトルと捉えることができる。従来の類似検索においては、画像データの特徴を表すn個の項目にn個の正規直交ベクトルを対応させ、各項目の特徴量を掛け合わせて、n次元空間座標として各画像データを表現するものであった。
【0031】
n個の正規直交ベクトルとは、n行n列の対角線上に1を配置し、残りの要素がすべて0である行列(n次元単位行列)の各列ベクトルを指す。正規とはベクトルの大きさが1であることを意味し、ベクトルの直交性は、任意の正規直交ベクトル同士の内積が0であることを意味する。
【0032】
例えば、特徴を表す項目数が3で、各特徴項目の特徴量がx1、x2、x3であるとすれば、互いに直交する3つの正規直交ベクトルに特徴量をかけてできる点(ベクトル)がその画像データの座標である。
【0033】
【数3】
【0034】
ここで、各正規直交ベクトルを
【0035】
【数4】
【0036】
とおく。ところが、
【0037】
【数5】
【0038】
の直交性により、類似検索の精度が落ちていることは従来の技術に述べた通りである。
【0039】
そこで本発明では、
【0040】
【数6】
【0041】
に変えて直交ベクトルではない(すなわち、いくつかのベクトル同士が直交していてもよいが、直交しないベクトルの組が必ず存在する)新たな3つの列ベクトル
【0042】
【数7】
【0043】
を用いて画像データを表す。一般に項目数がn個であれば、n個の列ベクトル
【0044】
【数8】
【0045】
を特徴と表す項目に対応させる。
【0046】
本発明の類似検索方法は、この3つ(一般にはn個)の列ベクトルを作成する際に、項目同士の類似性を反映させることで、より人間の感覚を反映した類似検索を行うことを可能にするものである。列ベクトル
【0047】
【数9】
【0048】
の行数は何行でもよく、例えばm行1列であるとすれば、新たな列ベクトルによって表される画像データは、m次元空間上の点となる。
【0049】
【数10】
【0050】
変換後の点
【0051】
【数11】
【0052】
と変換前の点
【0053】
【数12】
【0054】
が1対1に対応する必要がある。変換前と変換後の点の対応が多対1の関係では、変換前の座標空間において異なる2点が変換後の座標空間において距離0となる恐れがあり、変換前の特徴量が意味をなさなくなる。
【0055】
この問題は、n個の列ベクトル
【0056】
【数13】
【0057】
が線形独立であれば回避される。一般にn個の列ベクトルが線形独立であるとは、次式が成立することをいう。
【0058】
【数14】
【0059】
以上を踏まえて本発明の実施形態を説明する。本発明の実施形態は、画像データの特徴を表す項目として複数の色を使用し、その複数の色同士の類似性を反映させた線形独立な複数のベクトルを作成し、各画像データを複数のベクトルに対応する座標空間上の点(ベクトル)として表し、ベクトル同士の距離により類似性を判定するものである。ただし、複数のベクトルは、必ず直交しないベクトルの組を含むものとする。さらに複数の色が、色相環に表される色である場合と、マンセルの色立体に表される色である場合の例を説明する。
【0060】
図2は、本発明の類似検索方法を行うための類似検索システムの全体構成を示す図である。画像入力装置1は、スキャナーやデジタルカメラである。画像入力装置1により取り込まれた画像データが類似検索処理装置2に送信される。
【0061】
類似検索処理装置2は、入力された画像データの特徴を表すために設定された項目ごとの特徴量を算出し、類似検索処理装置2に蓄積された変換行列により別のベクトルに変換し、変換後のベクトル(以降本明細書においては変換行列による変換後のベクトルを特徴ベクトルと呼ぶ)をデータベース4に蓄積する処理と、検索対象として入力された画像データから特徴ベクトルを作成し、データベースに蓄積された各画像データの特徴ベクトルとの距離により類似性を判定する処理を行う。画像データの特徴を表す項目としては、例えば、色を使用し、画像データを構成する最小単位であるピクセルが属する色を決定し、色ごとにヒストグラムとして表せばその画像データの特徴を表すことが可能である。
【0062】
データベース4は、類似検索処理装置2に接続され、画像データ5や画像データごとの特徴ベクトルを格納する特徴ベクトル表6を含む。類似と判定された後の処理はさまざまあってよいが、一例としては、類似と判定された画像データの一覧を類似検索処理装置に備えられたCRT(Cathode Ray Tube)等の出力装置に表示する。また、類似検索の結果が、ネットワークを介して接続された端末に送信されてもよい。
【0063】
なお、類似検索処理装置2に入力される画像は、ネットワーク5を介して類似検索処理装置2と接続された端末3に備えられた画像入力装置1にて入力されてもよい。これは、データベース4に蓄積される画像データでも、検索対象の画像データであっても構わない。
【0064】
図3は、類似検索処理装置2の構成例を示す図である。CPU11は類似検索処理装置2における制御を実行する。CPU11は、入力された画像データを特徴ベクトルに対応させる特徴抽出部として、また入力された画像データが蓄積された画像データと類似するかを前記特徴ベクトルの距離により判定する類似判定部としても機能する。
【0065】
記憶装置12は、メモリやハードディスクで実現され、CPU11を制御する為の制御プログラムや制御プログラム実行時の作業データ、変換行列を含む記憶部として機能する。通信インタフェース13は、ネットワークと接続するためのインタフェースを備え、ネットワーク5を介して接続される端末3等とのデータ送受信を可能にする。
【0066】
入力装置14は、キーボードやマウス等であり、利用者が各種命令やデータの入力に使用する。出力装置15は、液晶モニタやCRT等であり、利用者に制御装置の制御結果等を表示する。周辺機器インタフェース16は、プリンタ、スキャナ、デジタルカメラ等の周辺機器を類似検索処理装置2に接続するためのインタフェースを備え、ケーブル等を介して接続される周辺機器とのデータ送受信を可能にし、検索対象の画像データが入力される画像入力部として機能する。
【0067】
なお、ネットワークを介して端末から画像データが入力される場合は、通信インタフェースが画像入力部として機能する。そして、これらの装置が信号線17により互いに接続される。
【0068】
図4は、類似検索に使用するデータベースに画像データを蓄積する処理を説明するフローチャートである。まず、画像データが入力される(S1)。画像データは、図2の画像入力装置1を介して類似検索処理装置2へ入力され、データベース4に蓄積される。
【0069】
そして、入力された画像データから特徴項目ごとの特徴量を抽出する(S2)。上述したように、色による分類等が考えられる。そして、変換行列により特徴ベクトルに変換する(S3)。
【0070】
変換行列は、図3の記憶装置12に蓄積されている。変換行列の作成法については後述する。そして、同じく後述するようにこの変換行列によって変換された特徴ベクトルは、特徴項目ごとの類似性が反映されたベクトルである。そして、ステップS3で算出された特徴ベクトルを、その画像データと対応付けてデータベースに蓄積し、データベースへの蓄積処理は終了する。
【0071】
図5は、図4の処理によって蓄積装置に蓄積される、画像データの特徴をベクトル化して格納する表のデータ構成例である。基になるデータは、デジタルカメラやスキャナー等の画像入力装置1から取り込んだ画像データである。
【0072】
図5では、画像データが識別子51により管理され、識別子51により特定される画像データの変換後のm次元ベクトル(mは自然数)が識別子毎に格納される。図5の要素52である
【0073】
【数15】
【0074】
は、従来の技術の記述に合わせたものであり、実際は変換行列により変換後の特徴ベクトルの次元数分の要素52が格納される。なお、図5の例では、本体の画像データはこの表とは別に管理されるが、同一の表により管理することも可能である。
【0075】
図6は、類似検索装置2を使用して類似検索を行う際の処理を説明するフローチャートである。本発明の実施形態においては、n色を用いて画像データを分類するものとする。すると、n色に対応するn個の数値が特徴量として算出される。このn色に対応して、n色の類似性を反映させたn個の線形独立な列ベクトルに基づく変換行列が類似検索装置2に格納されており、n個の数値を持つ特徴量(ベクトル)とこの変換行列の積によって別のベクトルへ変換する。
【0076】
こうして、類似検索処理装置は予めデータベースに画像データと対応する特徴ベクトルを蓄積しておく。そして、検索対象の画像データが入力されると、類似検索処理装置は、検索対象の画像データから特徴ベクトルを作成し、データベースに蓄積された画像データの特徴ベクトルのうち、検索対象の画像データの特徴ベクトルと所定の距離以下になるものがあるかを判定し、所定の距離以下であれば類似と判定する。所定の距離は、類似の精度に依存して決定されるものであり、管理者が自由に変更可能である。
【0077】
まず、検索対象の画像データが入力される(S1)。画像データは、図2の画像入力装置1を介して類似検索処理装置2へ入力される。そして、入力された画像データから特徴項目ごとの特徴量を抽出する(S2)。本実施形態においては、色による分類を行う。そして、変換行列により特徴ベクトルに変換する(S3)。
【0078】
以上ステップS3までの処理は、図4の処理と同じである。次に、データベースに蓄積された特徴ベクトルを読み出し(S11)、その特徴ベクトルと検索対象の画像データの特徴ベクトルとの距離を算出する(S12)。n次元のベクトル
【0079】
【数16】
【0080】
とした時、ベクトル間の距離
【0081】
【数17】
【0082】
を
【0083】
【数18】
【0084】
により算出することができる。
【0085】
ステップS12で算出された距離が画像データ間の類似性を示す指標である。従って、所定の値が類似検索の厳密性を左右する。つまり、所定の値を小さくすれば、類似と判定される画像データは少なくなり、所定の値を大きくすれば基準が緩和され、類似と判定される画像データは多くなる。
【0086】
この所定の値は、類似検索処理装置を管理する者が自由に決定できる。例えば、図2の記憶装置12に初期パラメータとして格納し、本処理の開始時に自動的に読み込まれるように設定しておくことが可能である。
【0087】
そして、ステップS12で算出された距離が所定の値以下であるかを判定する(S13)。ステップS13で所定の距離以下である場合、ステップS11で読み出された特徴ベクトルに対応する画像データが、ステップS1で入力された検索対象の画像データと類似すると判定される(S14)。
【0088】
ステップS13で所定の距離を越える場合、類似とは判定されず、ステップS14は省略される。ステップS14が済むと、データベースに蓄積されたすべての特徴ベクトルについて判定が完了したかを判定する(S15)。まだ、データベースにステップS13の判定が済んでいない特徴ベクトルが残されていれば(ステップS15でNoの場合)、ステップS11に戻り処理を続ける。
【0089】
データベースに格納されたすべての特徴ベクトルについて判定が完了したら(ステップS15でYesの場合)、ステップS14で類似と判定された特徴ベクトルに対応する画像データを出力する(S16)。ステップS16では、類似検索処理装置2に備えられた出力装置に類似検索結果が表示される。また、ネットワーク5を介して類似検索結果が端末3に送信され、端末3にて表示される、あるいは端末3にて更なる処理に使用されてもよい。
【0090】
続いて、図4や図6の処理において、画像データから抽出されたn個の特徴項目に対応する特徴量(ベクトル)を変換する際に使用される変換行列を作成する方法の例を説明する。変換行列は、n個の線形独立なベクトルを並べたものであり、行列の作成は、n個の線形独立なベクトルの作成と置き換えることができる。
【0091】
画像データの特徴を表すn個の特徴項目としては、さまざまな要素を選択することができるが、まず一例として、色相環に表される色を特徴項目として全ての画像データを分類する場合に、色相環に表される色の類似性を反映させたn個の線形独立なベクトルを作成する方法を説明する。
【0092】
図7は、本実施形態で用いる12色の色相環を示す図である。色相環とは、ある色に対し向かい合う位置に、補色と呼ばれるその色と性格が正反対の色が配置され、ある色に隣接する色は、隣接色と呼ばれる色の性格が互いに類似する色を配置し、全体で環状になるように配置された色のことである。図7では、黄61から反時計回りに黄橙62、赤橙63、赤64、赤紫65、紫66、青紫67、青68、緑青69、青緑70、緑71、黄緑72の12色が配置される。
【0093】
本実施形態では、画像データの各ピクセルが色相環に表された赤、赤橙、緑のいずれに該当するか決定し、各色ごとのピクセル数をその画像データの総ピクセル数で割ることにより求めた、その画像データに含まれる3色の割合によってすべての画像データを分類する場合を説明する。
【0094】
図8は、図7の色相環に表される色を円周を12個に等分割する点に対応させた図である。色の関係を数式的に説明するために2次元座標を導入する。図8では、半径1の円の中心をO、中心Oを通り、黄と青紫に対応する位置を結ぶ軸をx軸、中心Oを通り、赤と青緑に対応する位置を結ぶ軸をy軸とする。
【0095】
各色に対応する点を原点Oからのベクトルとして表すものとし、黄を
【0096】
【数19】
【0097】
として黄から反時計回りに各点を
【0098】
【数20】
【0099】
で表すとすると、円周(360度=2πラジアン)を12分割しているため、各点
【0100】
【数21】
【0101】
は、
【0102】
【数22】
【0103】
と表せる。ここで、
【0104】
【数23】
【0105】
は、ベクトルの転置を表す。つまり、
【0106】
【数24】
【0107】
が2行1列の列ベクトルであることを意味する。
【0108】
色相環の各点を式(2)のように表すことで、次の2つのことを確認できる。一般にn次元のベクトル
【0109】
【数25】
【0110】
を
【0111】
【数26】
【0112】
で定義したとき、
【0113】
【数27】
【0114】
が成立する。前者は、補色の関係にある点の位置が最も遠い位置にあり(円周上の2点間の距離は、直径が最も遠い距離である)、後者は、類似色同士の距離がすべて等しいことを意味する。
【0115】
こうして、式(2)により表される各点は、色相環の性質を良く表したものとなっている。本実施形態においては、まず一例として、赤、赤橙、緑の3色を用いてすべての画像データを分類するものとする。この色相環の性質に近似する3個の線形独立なベクトルが必要になる。
【0116】
その一例となるベクトル
【0117】
【数28】
【0118】
は、
【0119】
【数29】
【0120】
である。ただし、u(≠0)は任意の実数とする。今列ベクトル
【0121】
【数30】
【0122】
を横に並べてできる5行3列の行列をFとおく。
【0123】
【数31】
【0124】
は赤橙を表す
【0125】
【数32】
【0126】
に、
【0127】
【数33】
【0128】
は赤を表す
【0129】
【数34】
【0130】
に、
【0131】
【数35】
【0132】
は緑を表す
【0133】
【数36】
【0134】
にそれぞれ対応する。
【0135】
行列Fは以下のようにして作成される。まず、特徴項目が図8に表される色相環の赤橙、赤、緑なので、それぞれ図8において3色に対応するベクトル
【0136】
【数37】
【0137】
を行列Fの2行目までに配置する。すると以下のようになる。NAは未定値である。
【0138】
【数38】
【0139】
次に、上記未定値で埋められた箇所に対応する3行3列の対角線に0でない実数であるuを、それ以外の要素を0とすれば行列Fが完成する。こうして作成された列ベクトル
【0140】
【数39】
【0141】
は、正規直交ベクトルを使用する従来と異なり、座標空間において、赤と赤橙との距離が、赤と緑との距離よりも短くなっている。
【0142】
これは以下により確認できる。
【0143】
【数40】
【0144】
また、列ベクトル
【0145】
【数41】
【0146】
は、線形独立なベクトルである。これは以下により確認できる。
【0147】
【数42】
【0148】
を仮定する。すると、
【0149】
【数43】
【0150】
が成立する。u≠0であることから、上記仮定の下で、
【0151】
【数44】
【0152】
となることが容易に確認できる。よって、列ベクトル
【0153】
【数45】
【0154】
は、線形独立なベクトルである。また、ベクトルの内積を*で表すとすると、
【0155】
【数46】
【0156】
であって、0でないことから、
【0157】
【数47】
【0158】
は直交しない。
【0159】
こうして作成された行列Fの各列ベクトルを、それぞれ赤橙、赤、緑に対応させ、画像データに含まれる各色の割合を掛けることで、5行1列の列ベクトルに変換される。
【0160】
例えば、赤が全ピクセルの70%、赤橙が20%、緑が10%を占める画像データの場合、
【0161】
【数48】
【0162】
それぞれ対応することから、変換後の画像データは、
【0163】
【数49】
【0164】
で表される。以上に述べたように、3色の割合によって表される画像データの特徴を5次元の列ベクトルに変換し、この5次元空間上の点ベクトルの距離を比較することにより類似性を判定することで、より人間の感覚を反映させた類似検索を行うことができ、結果として類似検索の精度を向上させることが可能になる。
【0165】
上記実施形態は、特徴項目数が赤、赤橙、緑の3色であったため、図8に配置された12個の点のうち3点のみを使用したが、一般に12色から何色選択しても行列Fを作成することが可能である。例えば、n色(nは12までの自然数)である場合、その色に対応する列ベクトル
【0166】
【数50】
【0167】
をn個横に並べて、その下に、n行n列の対角線上にu(≠0)を配置し、残りの要素を0にした行列を作成すればよい。すると、(n+2)行n列の行列Fができる。
【0168】
【数51】
【0169】
例えば、12色すべてを使用した場合は、
【0170】
【数52】
【0171】
こうして作成された行列Fの各列ベクトル
【0172】
【数53】
【0173】
という性質を持つ。前者は、12次元空間上でも補色の関係にある点の位置は、他のどの2点間の距離よりも距離が遠くなっていることを意味し、後者は、値が添え字iに依存しないことから、12次元空間上でも隣接色の距離が互いに等しいことを意味する。つまり、2次元空間での色相環の性質を継承している。
【0174】
また、色同士の類似性も反映されている。例えば、
【0175】
【数54】
【0176】
は、それぞれ
【0177】
【数55】
【0178】
となり、赤と赤橙の距離
【0179】
【数56】
【0180】
の方が、赤と緑の距離
【0181】
【数57】
【0182】
よりも短く、人間の感覚を反映したものであることになる。
【0183】
次に、12個の列ベクトルの線形独立性を調べる。
【0184】
【数58】
【0185】
が線形独立かを調べるには、
【0186】
【数59】
【0187】
が成立すればよい。今、上記仮定により、行列の3行目以下を見れば、
【0188】
【数60】
【0189】
が成立する。u≠0であることから、上記仮定の下で、
【0190】
【数61】
【0191】
となることが容易に確認できる。従ってこの12個の列ベクトルは線形独立である。
【0192】
またuを調整することにより、類似検索の精度を調整することが可能となる。uの値を限りなくゼロに近づけることは、12次元空間の各点の性質を限りなく2次元の色相環の性質に近づけるものとなる。しかし一方で、uの値を限りなくゼロに近づけることは線形独立性を失わせることになる。よって、線形独立性を失わせなることなく、また、2次元の色相環の性質との誤差が許容される範囲でuの値を調整することができる。
【0193】
こうして、2次元平面状の色相環として表される色を12次元空間上の点ベクトルに対応させることにより、各色の類似性を反映させた座標軸を設定することができ、これにより類似検索の結果がより人間の感覚を反映させたものが出力され、類似検索の精度を高めることが可能となる。
【0194】
なお、式(2)の列ベクトル
【0195】
【数62】
【0196】
は12色の色相環に対するものであるが、一般にn色(nは自然数)にまで拡張することが可能である。その場合、色相環の各点を
【0197】
【数63】
【0198】
と表し、式(2)の行列の例と同じく、2行目までを上記式によるベクトル、残りのn行n列の対角線上にu(≠0)となる要素を配置したn行(n+2)列の行列の各列ベクトルを対応させることで、一般のn色の色相環に対応させることができる。
【0199】
図9は、以上の処理を一般化したフローチャートである。まず、画像データの特徴を表す項目として使用する色を色相環から選択する(S21)。例えば、n色の色相環から色数sとして、s色選択する。色相環の色に番号付けをすることで、色番号集合
【0200】
【数64】
【0201】
ができる。例えば、12色相環から、赤、赤橙、緑を選択すれば、黄色が色番号1であり、
【0202】
【数65】
【0203】
となる。
【0204】
次に、色相環に表される色に対応する2次元ベクトルを決定する(S22)。n色の色相環であれば、
【0205】
【数66】
【0206】
と一般的に表すことができる。そして、その2次元ベクトルと対角行列を組み合わせて変換行列Fを作成する(S23)。変換行列Fは、一例として、
【0207】
【数67】
【0208】
という(s+2)行s列で作成する。ただし、Uは、
【0209】
【数68】
【0210】
で、対角要素のみがu(≠0)であるs行s列の正方行列である。
【0211】
こうして、図9のフローチャートに従って、2次元平面状にn色の色相環として表される色から任意のs色を選択し、s次元空間上の点ベクトルに対応させることにより、各色の類似性を反映させた座標軸を設定することができ、これにより類似検索の結果がより人間の感覚を反映させたものが出力され、類似検索の精度を高めることが可能となる。
【0212】
次に、マンセルの色立体に表される色を特徴項目としてすべての画像データを分類する場合に本発明の類似検索方法を適用する場合の例について説明する。
【0213】
図10は、マンセルの色立体を説明する図である。マンセルの色立体は、色合いを表す色相、明るさを示す明度、鮮やかさを示す彩度を立体的に配置したものである。図10Aにあるように、縦軸方向に明度81、縦軸からの距離として彩度82、明度を固定してできる円周方向に色相83が決定される。色立体の外側に近づくにつれ、彩度は高く、色はより鮮やかになり、色立体の内側に近づくにつれ、彩度は低く、色はより淡くなる。
【0214】
明度が高い色は明るさが増し、より縦軸の上側に配置される。明度を上げていくと白くなり、明度を下げていくと黒くなる。図10Bは、以上のような特徴を踏まえ実際に色を配置した例である。図10Bにおいて、明度、彩度を固定した際にできる色相は、図7のような色相環となる。
【0215】
図11は、マンセルの色立体に表される色の関係を数式的に説明するために3次元座標を導入した図である。マンセルの色立体に表される色は、図11の球内の点に対応させることができる。また、図11において、xy平面に平行に球を切った切り口は、図8のような12色の色相環であるとする。
【0216】
図11には、明度0の赤橙と、明度hの赤と、明度−hの緑が描かれている。まず、図11に描かれる3個の点に対応する色によりすべての画像データを分類する場合の変換行列の作成方法について説明する。
【0217】
図12は、マンセルの色立体に表される色を特徴項目として使用する場合の変換行列を作成する処理を説明するフローチャートである。処理内容は、図9の色相環の処理と共通するステップは、そちらを引用する。
【0218】
まず、画像データの特徴を表す項目として使用する色を色立体から選択する(S31)。これは、図9における色相環からの色の選択処理と同じである。図9と同様に色数をsとすれば、本実施形態ではs=3である。ここでは、図11に示された明度の異なる3色(赤、赤橙、緑)を使用する。
【0219】
次に、色立体に表される色に対応する3次元ベクトルを決定する(S32)。ステップS32で決定される3次元ベクトルを、
【0220】
【数69】
【0221】
とする。色相環は2次元ベクトルとして表されたが、色立体では3次元ベクトルとなる。例えば、ステップS31で選択された3色の場合、赤は
【0222】
【数70】、
【0223】
赤橙は
【0224】
【数71】、
【0225】
緑は
【0226】
【数72】
【0227】
で表される。ただし、
【0228】
【数73】、
【0229】
Rは球の半径、hは赤の明度、−hは緑の明度である。赤橙の明度は0である。
【0230】
そして、その3次元ベクトルと対角行列を組み合わせて変換行列Fを作成する(S33)。変換行列Fは、一例として、
【0231】
【数74】
【0232】
という(s+3)行s列で作成する。ただし、本実施形態ではs=3である。Uは、
【0233】
【数75】
【0234】
で、対角要素のみがu(≠0)であるs行s列の正方行列である。
【0235】
次に、3個の列ベクトルの線形独立性を調べる。
【0236】
【数76】
【0237】
が線形独立かを調べるには、
【0238】
【数77】
【0239】
が成立すればよい。今、上記仮定により、行列の4行目以下を見れば、
【0240】
【数78】
【0241】
が成立する。u≠0であることから、上記仮定の下で、
【0242】
【数79】
【0243】
となることが容易に確認できる。従ってこの3個の列ベクトルは線形独立である。
【0244】
なおここでは、3色の例で説明したが、図12の処理は、色立体から任意のs色を選択した場合にも適用が可能である。その場合ステップS2で選択された色に対応する3次元ベクトルを
【0245】
【数80】
【0246】
とすればよい。また、無彩色であっても、3次元ベクトルで表すことができるため、任意のs色には無彩色が含まれていても構わない。
【0247】
こうしてできたs個の線形独立なベクトルは次のような性質を持つ。xy平面に平行な面で球を切った時にできる平面上にある点に対応するベクトルの中で補色の関係にある色に対応するベクトル同士の距離は、その平面上にある他の点に対応するベクトル同士の距離よりも長い。また、xy平面に平行な面で球を切った時にできる平面上にある点に対応するベクトル同士の距離の関係は、xy平面に平行な面で球を切った時にできる平面上にある点同士の関係と同じである。
【0248】
またuを調整することにより、類似検索の精度を調整することが可能となる。uの値を限りなくゼロに近づけることは、s次元空間の各点の性質を限りなく2次元の色相環の性質に近づけるものとなる。しかし一方で、uの値を限りなくゼロに近づけることは線形独立性を失わせることになる。よって、線形独立性を失わせなることなく、また、2次元の色相環の性質との誤差が許容される範囲でuの値を調整することができる。
【0249】
こうして3次元球状の色立体の点として表される色をs次元空間上の点ベクトル(s個の列ベクトル)に対応させることにより、各色の類似性を反映させた座標軸を設定することができ、これにより類似検索の結果がより人間の感覚を反映させたものが出力され、類似検索の精度を高めることが可能となる。
【0250】
次に、マンセルの色立体に表される色を特徴項目としてすべての画像データを分類する場合に本発明の類似検索方法を適用する場合の別の例について説明する。
本変形例においては、マンセルの色立体からの色の選択の仕方に一定の制約がある。
【0251】
図13は、本変形例の処理を説明するフローチャートである。まずは、選択される色に無彩色が含まれない場合を説明する。まず、画像データの特徴を表す項目として使用する色を色相環から選択し、明度、彩度を変更し、数種類のパターンを作成する(S41)。
【0252】
ここでは、明度0の色相から選択する色数sと明度数l、彩度数mを決定する。明度数分の明度を集めた明度の集合hとして
【0253】
【数81】
【0254】
、同様に彩度の集合bとして
【0255】
【数82】
【0256】
ができる。明度は高さに対応し、彩度は、明度を固定してできる最大の色相環(最も外側の円)の半径を何倍するかという倍率である。従って、明度を固定してできる最大の色相環の半径に彩度を掛ければ、その色のz軸からの距離が求まる。
【0257】
図14は、本変形例にて使用される色を球状の点として配置した図である。色数が4、明度が3、彩度が2とした例である。また、
【0258】
【数83】
【0259】
となっている例である。ここでは、色数sが決まると円をs等分する点の色が自動的に選択されたものとし、基準となる色は、例えば図8の黄色とする。
【0260】
従って、12色の色相環で色数4と決まれば、基準となる黄色から順に、黄、赤、青紫、青緑が選択される。基準となる色は黄色以外でも構わない。ちなみに、円をs等分する点の色を自動的に選択する場合、色数sとして選択可能な数は、n色の色相環の場合、nの約数となる。
【0261】
図14では、全部で29個の点が描かれている。明度0においては、黄109、赤110、青紫111、青緑112と、内側の円に彩度の異なる黄113、赤114、青紫115、青緑116が存在する。同様に、明度、彩度の異なる黄、赤、青紫、青緑がそれぞれ存在する。
【0262】
図13に戻り説明を続ける。色相環から選択された色数次元の巡回行列を、彩度数と明度数の積の分作成する(S42)。巡回行列とは、ある列ベクトルの要素を1つずつずらした列ベクトルを配置した行列である。つまり、列ベクトルの要素がs個あれば、
【0263】
【数84】
【0264】
というs行s列の形式である。巡回行列は、列ベクトル同士が等距離にあり、従って、各列ベクトルを円周を色数sで分割した点(ベクトル)に対応させると、色相環上の色の対応をよく表すことになる。
【0265】
ここでは、巡回行列Sとして、半環状巡回行列を作成する。半環状巡回行列とは、各列にsが奇数であれば、(s+1)/2個の、sが偶数であればs/2個の0を含むものである。そして、色相環の特徴として、補色の関係にある点同士の距離が直径に等しいという条件を課すことにより、色数が4である場合の巡回行列Sの一例として、
【0266】
【数85】
【0267】
とすることができる。そして、この基本となる巡回行列Sの各要素に、明度を固定した際にできる同心円の半径と彩度を掛けることによって、色相環から選択された色数次元の巡回行列が彩度数と明度数の積の分作成される。
【0268】
次に、その巡回行列と、明度と、対角行列を組み合わせて変換行列Fを作成する(S43)。今、色数s、明度数l、彩度数mを掛けた数をtとおくと、変換行列Fを次のように一般化して作成できる。
【0269】
【数86】
【0270】
ただし、Sはs行s列の行列、
【0271】
【数87】
【0272】
の1行m列のベクトルである。また、Uは、
【0273】
【数88】
【0274】
で、t行t列の正方行列である。
【0275】
変換行列Fの各列ベクトルが線形独立となるのは、対角行列Uの存在から明らかであり、また巡回行列Sの作成の際、色立体上の色の類似性を反映させていることから、変換行列Fの各列ベクトルを色立体上の点に対応させることにより、これにより類似検索の結果がより人間の感覚を反映させたものが出力され、類似検索の精度を高めることが可能となる。
【0276】
なおステップS42で用いる巡回行列の別の例として、相反環状行列を用いることもできる。相反環状行列とは、s行s列の巡回行列S
【0277】
【数89】
【0278】
において、さらに要素が
【0279】
【数90】
【0280】
なる関係を満たす列ベクトル(基準ベクトルと呼ぶ)が存在するものである。ただし、sが偶数の場合
【0281】
【数91】
【0282】
、sが奇数の場合
【0283】
【数92】
【0284】
である。色数が4の相反環状行列の一例として、
【0285】
【数93】
【0286】
とすることができる。この行列Sでは、第一列目が基準ベクトルである。そして隣接する左右の列ベクトルにおいて、行要素が1つずつ縦にずれている。
【0287】
次に、選択される色に無彩色が含まれる場合について説明する。この場合は、ステップS43で作成される変換行列Fに、無彩色に対応するl+2個の要素を追加し、追加した要素に合わせて対角行列となるように対角行列Uを調整してやればよい。すなわち、一般化すれば、
【0288】
【数94】
【0289】
という(w+s+1)行w列の行列となる。ただし、
【0290】
【数95】
【0291】
、Sはs行s列の行列であり、有彩色の場合と同様、半環状行列、相反巡回行列等の巡回行列が使用される。
【0292】
【数96】
【0293】
は1行m列のベクトルである。また、Uは、
【0294】
【数97】
【0295】
となる、w行w列の正方行列である。
【0296】
無彩色の場合の行列Fには、各明度に対応する位置の無彩色に対応する列ベクトルに加えて、両極、つまり白と黒に対応する列ベクトルが追加されている。無彩色を考慮した場合であっても、変換行列Fの各列ベクトルは線形独立となる。これは、対角行列Uの存在から明らかである。
【0297】
また巡回行列Sの作成の際、色立体上の色の類似性を反映させていることから、変換行列Fの各列ベクトルを色立体上の点に対応させると、類似検索の結果がより人間の感覚を反映させたものが出力されることになる。これにより、類似検索の精度を高めることが可能となる。
【0298】
図13のフローチャートにより作成される変換行列Fの具体例として、図14に表された色数4、明度数3、彩度数2の24色に加え、明度数3に対応する3つの無彩色、それに両極である白、黒(ともに無彩色)を加えた29色による変換行列Fの例を示しておく。作成される変換行列Fは、
【0299】
【数98】
【0300】
であるため、(w+s+1)行w列、つまり34行29列の行列となる。
【0301】
列数が大きいため、16列目で分けて書くと、
【0302】
【数99】
【0303】
となる。ただし、
【0304】
【数100】
【0305】
はi行i列の対角行列である。Oは、すべての要素が0であるゼロ行列である。16列目までに対応するOは、13行16列、17行目以降に対応するOは、16行13列である。
【0306】
以上説明したように本発明によれば、特徴項目として選択される色の類似性を反映させた線形独立なベクトルを作成し、その線形独立なベクトルを並べた行列を用いて画像データの類似性を、ベクトル間距離によって判定することにより、より人間の感覚を反映させた類似検索を行うことが可能となる。従って、類似検索の精度を向上させることができる。なお本発明の画像データの類似検索方法は、静止画に限らず、動画データにも適用可能である。
【0307】
本発明の画像データの類似検索方法は、例えば、電子ショッピング、不正画像検出、図面検索、衛星画像による遠隔探査、医療画像検索等において、検索者の所望する画像データを大量のデータの中からの検索することに適用が可能である。
【0308】
以上、実施の形態例をまとめると以下の付記の通りである。
【0309】
(付記1) 複数の画像データのそれぞれに対して、前記画像データのピクセルが複数の色によって分類される第一のステップと、前記色ごとのピクセル数を全ピクセル数で除算して各色の割合が算出される第二のステップと、前記割合を並べたベクトルが変換行列によって特徴ベクトルに変換される第三のステップとを有し、前記特徴ベクトルが該画像データごとに対応付けられて予め蓄積装置に蓄積され、前記蓄積装置と接続された類似検索装置に、検索対象として画像データが入力され、前記検索対象として入力された画像データに対して、前記第一のステップから前記第三のステップが行われ、該検索対象として入力された画像データの特徴ベクトルが生成され、該検索対象として入力された画像データの特徴ベクトルである第一の特徴ベクトルと、前記蓄積装置に蓄積された特徴ベクトルから選択された特徴ベクトルである第二の特徴ベクトルの距離を算出し、前記距離が所定の値以下である場合、前記第一の特徴ベクトルに対応する、検索対象として入力された画像データと、前記第二の特徴ベクトルに対応付けられた画像データが類似すると判定され、前記蓄積装置に蓄積された複数の画像データに対応付けられた複数の特徴ベクトルに対して前記類似判定を行うことで、前記蓄積装置に蓄積された複数の画像データから、検索対象として入力された画像データに類似する画像データを検索する類似画像検索方法において、前記変換行列は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを、前記色の数だけ横に並べて作成される行列であることを特徴とする類似画像検索方法。
【0310】
(付記2)付記1において、
前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする類似画像検索方法。
【0311】
(付記3)付記2において、
前記複数の色は、色相環に表される色から選択され、前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索方法。
【0312】
(付記4)付記3において、前記変換行列は、
【0313】
【数101】
【0314】
であり、ただし、sは前記選択された色の数を表し、Uは、s行s列の行列で、
【0315】
【数102】
【0316】
を満たし、また
【0317】
【数103】
【0318】
は、それぞれ前記色相環に表される色が2次元座標空間に配置された点に対応する2行1列のベクトルを表すことを特徴とする類似画像検索方法。
【0319】
(付記5)付記2において、前記複数の色は、色立体に表される色から選択され、前記複数の色同士の類似性は、前記色立体に表される色が3次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索方法。
【0320】
(付記6)付記5において、前記変換行列は、
【0321】
【数104】
【0322】
であり、ただし、sは前記選択された色の数を表し、Uは、s行s列の行列で、
【0323】
【数105】
【0324】
を満たし、また
【0325】
【数106】
【0326】
は、それぞれ前記色立体に表される色が3次元座標空間に配置された点に対応する3行1列のベクトルを表すことを特徴とする類似画像検索方法。
【0327】
(付記7)付記5において、前記複数の色は、色立体にて明度および彩度を固定してできる色相環から選択された第一の個数分の色、該第一の個数分の色の明度を第二の個数段階、彩度を第三の個数段階変化させてできる、計第一の個数および第二の個数および第三の個数の積の分の色であり、前記変換行列は、s行s列の巡回行列の各要素に、対応する係数を掛けたものをm個列方向に並べたブロックをl個列方向に並べてできる部分と、1行m列のブロックをl個列方向に並べてできる部分と、s行s・m・l列(ただし・は積を表す)の対角行列部分を含んでなる
【0328】
【数107】
【0329】
であり、ただし、sは前記第一の個数数を表し、lは前記第二の個数を表し、mは前記第三の個数を表し、Uは、s・m・l行s・m・l列の行列で、
【0330】
【数108】
【0331】
を満たし、
【0332】
【数109】
【0333】
は、前記第二の個数分の明度を表し、
【0334】
【数110】
【0335】
であり、Rは色立体を表す球の半径であり、
【0336】
【数111】
【0337】
は、前記第三の個数分の彩度を表し、
【0338】
【数112】
【0339】
の1行m列のベクトルを表し、Sは、s行s列の巡回行列で、各列ベクトルが前記色相環から選択された第一の個数分の色に対応し、前記色相環にて補色の関係にある色に対応する列ベクトルの距離が色立体を表す球の直径となる条件を満たすことを特徴とする類似画像検索方法。
【0340】
(付記8)付記7において、前記複数の色は、さらに無彩色を含み、前記変換行列は、
【0341】
【数113】
【0342】
であり、ただし、Uは、
【0343】
【数114】
【0344】
を満たす(s・m・l+l+2)行(s・m・l+l+2)列の行列である
ことを特徴とする類似画像検索方法。
【0345】
(付記9)予め画像データと該画像データに対する第一の特徴ベクトルが対応付けられ複数蓄積された画像データベースと、検索対象の画像データが入力される画像入力部と、入力された画像データを第二の特徴ベクトルに対応させる特徴抽出部と、入力された画像データが蓄積された画像データと類似するかを前記第一の特徴ベクトルと前記第二の特徴ベクトルの距離により判定する類似判定部と、情報を格納する記憶部とを備え、前記記憶部は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを前記色の数だけ横に並べた変換行列を含み、前記特徴抽出部は、画像データのピクセルを複数の色によって分類し、色ごとのピクセル数を全ピクセル数で除算して各色の割合を画像データごとに算出し、前記割合を並べてベクトルとし、前記変換行列により前記ベクトルを変換することを特徴とする類似画像検索装置。
【0346】
(付記10)付記9において、前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする類似画像検索装置。
【0347】
(付記11)付記10において、前記複数の色は、色相環に表される色から選択され、前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索装置。
【0348】
(付記12)付記11において、前記変換行列は、
【0349】
【数115】
【0350】
であり、ただし、sは前記選択された色の数を表し、Uは、s行s列の行列で、
【0351】
【数116】
【0352】
を満たし、また
【0353】
【数117】
【0354】
は、それぞれ前記色相環に表される色が2次元座標空間に配置された点に対応する2行1列のベクトルを表すことを特徴とする類似画像検索装置。
【0355】
(付記13)付記10において、前記複数の色は、色立体に表される色から選択され、前記複数の色同士の類似性は、前記色立体に表される色が3次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索装置。
【0356】
(付記14)付記13において、前記変換行列は、
【0357】
【数118】
【0358】
であり、ただし、sは前記選択された色の数を表し、Uは、s行s列の行列で、
【0359】
【数119】
【0360】
を満たし、また
【0361】
【数120】
【0362】
は、それぞれ前記色立体に表される色が3次元座標空間に配置された点に対応する3行1列のベクトルを表すことを特徴とする類似画像検索装置。
【0363】
(付記15)付記13において、前記複数の色は、色立体にて明度および彩度を固定してできる色相環から選択された第一の個数分の色、該第一の個数分の色の明度を第二の個数段階、彩度を第三の個数段階変化させてできる、計第一の個数および第二の個数および第三の個数の積の分の色であり、前記変換行列は、s行s列の巡回行列の各要素に、対応する係数を掛けたものをm個列方向に並べたブロックをl個列方向に並べてできる部分と、1行m列のブロックをl個列方向に並べてできる部分と、s行s・m・l列(ただし・は積を表す)の対角行列部分を含んでなる
【0364】
【数121】
【0365】
であり、ただし、sは前記第一の個数数を表し、lは前記第二の個数を表し、mは前記第三の個数を表し、Uは、s・m・l行s・m・l列の行列で、
【0366】
【数122】
【0367】
を満たし、
【0368】
【数123】
【0369】
は、前記第二の個数分の明度を表し、
【0370】
【数124】
【0371】
であり、Rは色立体を表す球の半径であり、
【0372】
【数125】
【0373】
は、前記第三の個数分の彩度を表し、
【0374】
【数126】
【0375】
の1行m列のベクトルを表し、Sは、s行s列の巡回行列で、各列ベクトルが前記色相環から選択された第一の個数分の色に対応し、前記色相環にて補色の関係にある色に対応する列ベクトルの距離が色立体を表す球の直径となる条件を満たすことを特徴とする類似画像検索装置。
【0376】
(付記16)付記15において、前記複数の色は、さらに無彩色を含み、前記変換行列は、
【0377】
【数127】
【0378】
であり、ただし、Uは、
【0379】
【数128】
【0380】
を満たす(s・m・l+l+2)行(s・m・l+l+2)列の行列であることを特徴とする類似画像検索装置。
【0381】
【発明の効果】
以上説明したように本発明によれば、特徴項目として選択される色の類似性を反映させた線形独立なベクトルを作成し、その線形独立なベクトルを並べた行列を用いて画像データの類似性を、ベクトル間距離によって判定することにより、より人間の感覚を反映させた類似検索を行うことが可能となる。従って、類似検索の精度を向上させることができる。なお本発明の画像データの類似検索方法は、静止画に限らず、動画データにも適用可能である。
【0382】
本発明の画像データの類似検索方法は、例えば、電子ショッピング、不正画像検出、図面検索、衛星画像による遠隔探査、医療画像検索等において、検索者の所望する画像データを大量のデータの中からの検索することに適用が可能であり、これらの分野におけるいっそうのサービス向上に貢献することが可能である。
【図面の簡単な説明】
【図1】従来の類似検索において、画像データの特徴をベクトル化する場合の例を説明する図である。
【図2】本発明の類似検索方法を行うための類似検索システムの全体構成を示す図である。
【図3】類似検索処理装置の構成例を示す図である。
【図4】類似検索に使用するデータベースに画像データを蓄積する処理を説明するフローチャートである。
【図5】蓄積装置に蓄積される、画像データの特徴をベクトル化して格納する表のデータ構成例である。
【図6】類似検索装置を使用して類似検索を行う際の処理を説明するフローチャートである。
【図7】本実施形態で用いる色相環を示す図である。
【図8】色相環に表される色を円周を12個に等分割する点に対応させた図である。
【図9】色相環に表される色を特徴項目として使用する場合の変換行列を作成する処理を説明するフローチャートである。
【図10】本実施形態で用いるマンセルの色立体を説明する図である。
【図11】マンセルの色立体に表される色の関係を数式的に説明するために3次元座標を導入した図である。
【図12】マンセルの色立体に表される色を特徴項目として使用する場合の変換行列を作成する処理を説明するフローチャートである。
【図13】マンセルの色立体に表される色を特徴項目として使用する場合の変換行列を作成する処理の変形例を説明するフローチャートである。
【図14】変形例にて使用される色を球状の点として配置した図である。
【符号の説明】
1 画像入力装置、2 類似検索処置装置、3 端末、4 データベース、5 画像データ、6 特徴ベクトル表、7 ネットワーク
【発明の属する技術分野】
本発明は、画像データを類似検索する類似検索装置に関する。
【0002】
【従来の技術】
ディジタルカメラ、スキャナなどの普及やインターネットのブロードバンド化に伴い、画像データが急速に作成、蓄積されつつある。これに伴い、大量のデータの中から所望のデータを検索する技術への期待が高まっている。
【0003】
従来、データベースに蓄積されたデータから所望の画像データを検索する場合、
データベースに画像データを蓄積する際に、その画像データの特徴を表すキーワード等を登録しておき、検索する際入力されたキーワードに合致するあるいは類似する画像データが検索結果として出力される。
【0004】
しかし、近年の画像データの急増により、すべての画像データにキーワードを付けることは難しい。また作業者の主観によりキーワードが付けられるため、そのデータの特徴を正しく表現していない可能性があり、その場合検索者が所望する画像とは異なる画像データが検索の結果として出力されてしまう。
【0005】
そこで、キーワードによる検索ではなく、画像データそのものを使用し、その画像データに類似するデータを検索する類似検索が注目されている。例えば、ハンドバッグが写っている写真を入力することにより、データベースに格納された画像データの中からハンドバッグが写っている画像データが検索結果として出力されたり、指紋の画像データを入力することにより、データベースに格納された画像データの中からその指紋に類似する指紋の画像データが検索結果として出力される。
【0006】
従来の類似検索では、データベースに画像データを蓄積する際に、画像データの特徴が複数の項目に分類され、項目ごとの特徴量によって数値化(ベクトル化)して登録される。例えば、画像データの特徴を色で分類する場合、画像データに含まれる各色の割合によりその画像データを特徴付ける。
【0007】
検索する際に入力される画像データの特徴も同様に数値化(ベクトル化)し、データベースに蓄積された各画像データのベクトルと入力された画像データのベクトル間の距離を画像データの類似性の判定に用い、データベースの中から類似すると判定された画像データが検索結果として出力される。
【0008】
図1は、従来の類似検索において、画像データの特徴をベクトル化する場合の例を説明する図である。図1の例においては、すべての画像データの特徴を赤、赤橙、緑の3色で分類しようとするものである。すなわち、画像データに含まれる3色の割合を数値化することで、すべての画像データをベクトル化する。
【0009】
なお、簡単化のために、画像データをピクセル(画素)単位で分類するものとし、どのピクセルも3色のうちのいずれかの色に属するものとする。図1に描かれているのは、特徴を表す項目数に対応する互いに直交する3次元の座標である。画像データをこの3次元空間の点として、つまりベクトルとして表す。
【0010】
x、y、z座標軸は、それぞれ特徴項目である赤、赤橙、緑の3色に対応し、各座標の数値は、その座標に対応する色が画像データに含まれる割合を示す。例えば、点A(0.7、0.2、0.1)は、赤が全ピクセルの70%、赤橙が20%、緑が10%を占める画像データを示す点(ベクトル)である。
【0011】
点Aと同じように、画像データが赤1色である場合、赤橙1色である場合、緑1色である場合それぞれ、点B(1,0,0)、点C(0,1,0)、点D(0,0,1)と表される。ここで3次元空間の2点間X=(x1,x2,x3)、Y=(y1,y2,y3)の距離d(X,Y)を次式で定義すると、
【0012】
【数1】
【0013】
BC間の距離d(B,C)とBD間の距離d(B,D)はそれぞれ、
【0014】
【数2】
【0015】
となる。点Bから見て、点Cと点Dは同じ距離にある。
【0016】
よって、図1の3次元空間を使用して類似検索を行うと、赤1色のみ画像データに類似する画像データとして、赤橙1色のみの画像データと緑1色の画像データが結果として出力される可能性がある。しかしながら、人間の感覚から言えば、赤1色のみの画像データに対して、赤橙と緑の画像データが同程度に類似するという結果は受け入れがたく、従来の方法は、検索者が所望する画像データではない画像データが検索結果として出力される可能性が高い、つまり類似検索の精度としては低いものであった。
【0017】
これは、特徴を表す項目を直交する座標軸に単純に対応させるためである。このため、その項目間の類似性が直交座標軸の持つ直交性によって失われ、上記のように人間の感覚から見て類似とみなせない画像データが、同じ距離となるようなベクトルとして表現されてしまう。
【0018】
項目間に類似性があるとは、上記例の赤と赤橙のように項目同士に類似性や相関性のある場合である。逆に項目間が独立であるとは、例えば、物体の特徴を縦、横、高さで表す場合、縦が何センチであるかは、横が何センチであるかに関係ない場合である。つまり、特徴を表す項目同士が互いに依存しない関係であるものを指す。
【0019】
また、類似度を数値化する例として、非特許文献1には、2つのヒストグラムの類似度をさまざまな距離関数によって数値化することが提案されているが、いずれも項目間の類似性を反映させる方法が具体的に示されたものではない。
【0020】
【非特許文献1】Michael S. Lew; Princilpes of Visual Information Retrieval; Springer, 2001
【0021】
【発明が解決しようとする課題】
このように従来の画像データの類似検索は、特徴を表す項目として複数の色を使用し、その複数の色同士に類似性があること、またその特徴を表す項目を単純に直交座標に対応させて各画像データの特徴をベクトル化し、類似判定を行っていること、この2点が類似検索の精度を落とす原因となっていた。
【0022】
そこで本発明の目的は、画像データの特徴を表す項目として複数の色を使用し、その複数の色同士の類似性を反映させた、より人間の感覚に近い座標軸を作成し、その座標軸に対応する座標空間上の距離により類似判定を行うことで類似検索の精度をあげることができる類似検索装置を提供することにある。
【0023】
【課題を解決するための手段】
上記目的は、複数の画像データのそれぞれに対して、前記画像データのピクセルが複数の色によって分類される第一のステップと、前記色ごとのピクセル数を全ピクセル数で除算して各色の割合が算出される第二のステップと、前記割合を並べたベクトルが変換行列によって特徴ベクトルに変換される第三のステップとを有し、前記特徴ベクトルが該画像データごとに対応付けられて予め蓄積装置に蓄積され、前記蓄積装置と接続された類似検索装置に、検索対象として画像データが入力され、前記検索対象として入力された画像データに対して、前記第一のステップから前記第三のステップが行われ、該検索対象として入力された画像データの特徴ベクトルが生成され、該検索対象として入力された画像データの特徴ベクトルである第一の特徴ベクトルと、前記蓄積装置に蓄積された特徴ベクトルから選択された特徴ベクトルである第二の特徴ベクトルの距離を算出し、前記距離の大小により、前記第一の特徴ベクトルに対応する、検索対象として入力された画像データと、前記第二の特徴ベクトルに対応付けられた画像データの類似性が判定され、前記蓄積装置に蓄積された複数の画像データに対応付けられた複数の特徴ベクトルに対して前記類似判定を行うことで、前記蓄積装置に蓄積された複数の画像データから、検索対象として入力された画像データに類似する画像データを検索する類似画像検索方法において、前記変換行列は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを、前記色の数だけ横に並べて作成される行列であることを特徴とする、請求項1に記載の類似画像検索方法を提供することにより達成される。
【0024】
また上記目的は、請求項1において、前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする、請求項2に記載の類似画像検索方法を提供することにより達成される。
【0025】
また上記目的は、請求項2において、前記複数の色は、色相環に表される色から選択され、前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする、請求項3に記載の類似画像検索方法を提供することにより達成される。
【0026】
また上記目的は、予め画像データと該画像データに対する第一の特徴ベクトルが対応付けられ複数蓄積された画像データベースと、検索対象の画像データが入力される画像入力部と、入力された画像データを第二の特徴ベクトルに対応させる特徴抽出部と、入力された画像データが蓄積された画像データと類似するかを前記第一の特徴ベクトルと前記第二の特徴ベクトルの距離により判定する類似判定部と、情報を格納する記憶部とを備え、前記記憶部は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを前記色の数だけ横に並べた変換行列を含み、前記特徴抽出部は、画像データのピクセルを複数の色によって分類し、色ごとのピクセル数を全ピクセル数で除算して各色の割合を画像データごとに算出し、前記割合を並べてベクトルとし、前記変換行列により前記ベクトルを変換することを特徴とする、請求項4に記載の類似画像検索装置を提供することにより達成される。
【0027】
また上記目的は、請求項4において、前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする、請求項5に記載の類似画像検索装置を提供することにより達成される。
【0028】
また上記目的は、請求項5において、前記複数の色は、色相環に表される色から選択され、前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする、請求項6に記載の類似画像検索装置を提供することにより達成される。
【0029】
【発明の実施の形態】
以下、本発明の実施の形態について図面に従って説明する。しかしながら、本発明の技術的範囲はかかる実施の形態に限定されるものではない。
【0030】
本発明の実施形態を説明する前に、空間上での点、ベクトル、ベクトルの線形独立性について説明する。空間上での点の座標は、原点からのベクトルと捉えることができる。従来の類似検索においては、画像データの特徴を表すn個の項目にn個の正規直交ベクトルを対応させ、各項目の特徴量を掛け合わせて、n次元空間座標として各画像データを表現するものであった。
【0031】
n個の正規直交ベクトルとは、n行n列の対角線上に1を配置し、残りの要素がすべて0である行列(n次元単位行列)の各列ベクトルを指す。正規とはベクトルの大きさが1であることを意味し、ベクトルの直交性は、任意の正規直交ベクトル同士の内積が0であることを意味する。
【0032】
例えば、特徴を表す項目数が3で、各特徴項目の特徴量がx1、x2、x3であるとすれば、互いに直交する3つの正規直交ベクトルに特徴量をかけてできる点(ベクトル)がその画像データの座標である。
【0033】
【数3】
【0034】
ここで、各正規直交ベクトルを
【0035】
【数4】
【0036】
とおく。ところが、
【0037】
【数5】
【0038】
の直交性により、類似検索の精度が落ちていることは従来の技術に述べた通りである。
【0039】
そこで本発明では、
【0040】
【数6】
【0041】
に変えて直交ベクトルではない(すなわち、いくつかのベクトル同士が直交していてもよいが、直交しないベクトルの組が必ず存在する)新たな3つの列ベクトル
【0042】
【数7】
【0043】
を用いて画像データを表す。一般に項目数がn個であれば、n個の列ベクトル
【0044】
【数8】
【0045】
を特徴と表す項目に対応させる。
【0046】
本発明の類似検索方法は、この3つ(一般にはn個)の列ベクトルを作成する際に、項目同士の類似性を反映させることで、より人間の感覚を反映した類似検索を行うことを可能にするものである。列ベクトル
【0047】
【数9】
【0048】
の行数は何行でもよく、例えばm行1列であるとすれば、新たな列ベクトルによって表される画像データは、m次元空間上の点となる。
【0049】
【数10】
【0050】
変換後の点
【0051】
【数11】
【0052】
と変換前の点
【0053】
【数12】
【0054】
が1対1に対応する必要がある。変換前と変換後の点の対応が多対1の関係では、変換前の座標空間において異なる2点が変換後の座標空間において距離0となる恐れがあり、変換前の特徴量が意味をなさなくなる。
【0055】
この問題は、n個の列ベクトル
【0056】
【数13】
【0057】
が線形独立であれば回避される。一般にn個の列ベクトルが線形独立であるとは、次式が成立することをいう。
【0058】
【数14】
【0059】
以上を踏まえて本発明の実施形態を説明する。本発明の実施形態は、画像データの特徴を表す項目として複数の色を使用し、その複数の色同士の類似性を反映させた線形独立な複数のベクトルを作成し、各画像データを複数のベクトルに対応する座標空間上の点(ベクトル)として表し、ベクトル同士の距離により類似性を判定するものである。ただし、複数のベクトルは、必ず直交しないベクトルの組を含むものとする。さらに複数の色が、色相環に表される色である場合と、マンセルの色立体に表される色である場合の例を説明する。
【0060】
図2は、本発明の類似検索方法を行うための類似検索システムの全体構成を示す図である。画像入力装置1は、スキャナーやデジタルカメラである。画像入力装置1により取り込まれた画像データが類似検索処理装置2に送信される。
【0061】
類似検索処理装置2は、入力された画像データの特徴を表すために設定された項目ごとの特徴量を算出し、類似検索処理装置2に蓄積された変換行列により別のベクトルに変換し、変換後のベクトル(以降本明細書においては変換行列による変換後のベクトルを特徴ベクトルと呼ぶ)をデータベース4に蓄積する処理と、検索対象として入力された画像データから特徴ベクトルを作成し、データベースに蓄積された各画像データの特徴ベクトルとの距離により類似性を判定する処理を行う。画像データの特徴を表す項目としては、例えば、色を使用し、画像データを構成する最小単位であるピクセルが属する色を決定し、色ごとにヒストグラムとして表せばその画像データの特徴を表すことが可能である。
【0062】
データベース4は、類似検索処理装置2に接続され、画像データ5や画像データごとの特徴ベクトルを格納する特徴ベクトル表6を含む。類似と判定された後の処理はさまざまあってよいが、一例としては、類似と判定された画像データの一覧を類似検索処理装置に備えられたCRT(Cathode Ray Tube)等の出力装置に表示する。また、類似検索の結果が、ネットワークを介して接続された端末に送信されてもよい。
【0063】
なお、類似検索処理装置2に入力される画像は、ネットワーク5を介して類似検索処理装置2と接続された端末3に備えられた画像入力装置1にて入力されてもよい。これは、データベース4に蓄積される画像データでも、検索対象の画像データであっても構わない。
【0064】
図3は、類似検索処理装置2の構成例を示す図である。CPU11は類似検索処理装置2における制御を実行する。CPU11は、入力された画像データを特徴ベクトルに対応させる特徴抽出部として、また入力された画像データが蓄積された画像データと類似するかを前記特徴ベクトルの距離により判定する類似判定部としても機能する。
【0065】
記憶装置12は、メモリやハードディスクで実現され、CPU11を制御する為の制御プログラムや制御プログラム実行時の作業データ、変換行列を含む記憶部として機能する。通信インタフェース13は、ネットワークと接続するためのインタフェースを備え、ネットワーク5を介して接続される端末3等とのデータ送受信を可能にする。
【0066】
入力装置14は、キーボードやマウス等であり、利用者が各種命令やデータの入力に使用する。出力装置15は、液晶モニタやCRT等であり、利用者に制御装置の制御結果等を表示する。周辺機器インタフェース16は、プリンタ、スキャナ、デジタルカメラ等の周辺機器を類似検索処理装置2に接続するためのインタフェースを備え、ケーブル等を介して接続される周辺機器とのデータ送受信を可能にし、検索対象の画像データが入力される画像入力部として機能する。
【0067】
なお、ネットワークを介して端末から画像データが入力される場合は、通信インタフェースが画像入力部として機能する。そして、これらの装置が信号線17により互いに接続される。
【0068】
図4は、類似検索に使用するデータベースに画像データを蓄積する処理を説明するフローチャートである。まず、画像データが入力される(S1)。画像データは、図2の画像入力装置1を介して類似検索処理装置2へ入力され、データベース4に蓄積される。
【0069】
そして、入力された画像データから特徴項目ごとの特徴量を抽出する(S2)。上述したように、色による分類等が考えられる。そして、変換行列により特徴ベクトルに変換する(S3)。
【0070】
変換行列は、図3の記憶装置12に蓄積されている。変換行列の作成法については後述する。そして、同じく後述するようにこの変換行列によって変換された特徴ベクトルは、特徴項目ごとの類似性が反映されたベクトルである。そして、ステップS3で算出された特徴ベクトルを、その画像データと対応付けてデータベースに蓄積し、データベースへの蓄積処理は終了する。
【0071】
図5は、図4の処理によって蓄積装置に蓄積される、画像データの特徴をベクトル化して格納する表のデータ構成例である。基になるデータは、デジタルカメラやスキャナー等の画像入力装置1から取り込んだ画像データである。
【0072】
図5では、画像データが識別子51により管理され、識別子51により特定される画像データの変換後のm次元ベクトル(mは自然数)が識別子毎に格納される。図5の要素52である
【0073】
【数15】
【0074】
は、従来の技術の記述に合わせたものであり、実際は変換行列により変換後の特徴ベクトルの次元数分の要素52が格納される。なお、図5の例では、本体の画像データはこの表とは別に管理されるが、同一の表により管理することも可能である。
【0075】
図6は、類似検索装置2を使用して類似検索を行う際の処理を説明するフローチャートである。本発明の実施形態においては、n色を用いて画像データを分類するものとする。すると、n色に対応するn個の数値が特徴量として算出される。このn色に対応して、n色の類似性を反映させたn個の線形独立な列ベクトルに基づく変換行列が類似検索装置2に格納されており、n個の数値を持つ特徴量(ベクトル)とこの変換行列の積によって別のベクトルへ変換する。
【0076】
こうして、類似検索処理装置は予めデータベースに画像データと対応する特徴ベクトルを蓄積しておく。そして、検索対象の画像データが入力されると、類似検索処理装置は、検索対象の画像データから特徴ベクトルを作成し、データベースに蓄積された画像データの特徴ベクトルのうち、検索対象の画像データの特徴ベクトルと所定の距離以下になるものがあるかを判定し、所定の距離以下であれば類似と判定する。所定の距離は、類似の精度に依存して決定されるものであり、管理者が自由に変更可能である。
【0077】
まず、検索対象の画像データが入力される(S1)。画像データは、図2の画像入力装置1を介して類似検索処理装置2へ入力される。そして、入力された画像データから特徴項目ごとの特徴量を抽出する(S2)。本実施形態においては、色による分類を行う。そして、変換行列により特徴ベクトルに変換する(S3)。
【0078】
以上ステップS3までの処理は、図4の処理と同じである。次に、データベースに蓄積された特徴ベクトルを読み出し(S11)、その特徴ベクトルと検索対象の画像データの特徴ベクトルとの距離を算出する(S12)。n次元のベクトル
【0079】
【数16】
【0080】
とした時、ベクトル間の距離
【0081】
【数17】
【0082】
を
【0083】
【数18】
【0084】
により算出することができる。
【0085】
ステップS12で算出された距離が画像データ間の類似性を示す指標である。従って、所定の値が類似検索の厳密性を左右する。つまり、所定の値を小さくすれば、類似と判定される画像データは少なくなり、所定の値を大きくすれば基準が緩和され、類似と判定される画像データは多くなる。
【0086】
この所定の値は、類似検索処理装置を管理する者が自由に決定できる。例えば、図2の記憶装置12に初期パラメータとして格納し、本処理の開始時に自動的に読み込まれるように設定しておくことが可能である。
【0087】
そして、ステップS12で算出された距離が所定の値以下であるかを判定する(S13)。ステップS13で所定の距離以下である場合、ステップS11で読み出された特徴ベクトルに対応する画像データが、ステップS1で入力された検索対象の画像データと類似すると判定される(S14)。
【0088】
ステップS13で所定の距離を越える場合、類似とは判定されず、ステップS14は省略される。ステップS14が済むと、データベースに蓄積されたすべての特徴ベクトルについて判定が完了したかを判定する(S15)。まだ、データベースにステップS13の判定が済んでいない特徴ベクトルが残されていれば(ステップS15でNoの場合)、ステップS11に戻り処理を続ける。
【0089】
データベースに格納されたすべての特徴ベクトルについて判定が完了したら(ステップS15でYesの場合)、ステップS14で類似と判定された特徴ベクトルに対応する画像データを出力する(S16)。ステップS16では、類似検索処理装置2に備えられた出力装置に類似検索結果が表示される。また、ネットワーク5を介して類似検索結果が端末3に送信され、端末3にて表示される、あるいは端末3にて更なる処理に使用されてもよい。
【0090】
続いて、図4や図6の処理において、画像データから抽出されたn個の特徴項目に対応する特徴量(ベクトル)を変換する際に使用される変換行列を作成する方法の例を説明する。変換行列は、n個の線形独立なベクトルを並べたものであり、行列の作成は、n個の線形独立なベクトルの作成と置き換えることができる。
【0091】
画像データの特徴を表すn個の特徴項目としては、さまざまな要素を選択することができるが、まず一例として、色相環に表される色を特徴項目として全ての画像データを分類する場合に、色相環に表される色の類似性を反映させたn個の線形独立なベクトルを作成する方法を説明する。
【0092】
図7は、本実施形態で用いる12色の色相環を示す図である。色相環とは、ある色に対し向かい合う位置に、補色と呼ばれるその色と性格が正反対の色が配置され、ある色に隣接する色は、隣接色と呼ばれる色の性格が互いに類似する色を配置し、全体で環状になるように配置された色のことである。図7では、黄61から反時計回りに黄橙62、赤橙63、赤64、赤紫65、紫66、青紫67、青68、緑青69、青緑70、緑71、黄緑72の12色が配置される。
【0093】
本実施形態では、画像データの各ピクセルが色相環に表された赤、赤橙、緑のいずれに該当するか決定し、各色ごとのピクセル数をその画像データの総ピクセル数で割ることにより求めた、その画像データに含まれる3色の割合によってすべての画像データを分類する場合を説明する。
【0094】
図8は、図7の色相環に表される色を円周を12個に等分割する点に対応させた図である。色の関係を数式的に説明するために2次元座標を導入する。図8では、半径1の円の中心をO、中心Oを通り、黄と青紫に対応する位置を結ぶ軸をx軸、中心Oを通り、赤と青緑に対応する位置を結ぶ軸をy軸とする。
【0095】
各色に対応する点を原点Oからのベクトルとして表すものとし、黄を
【0096】
【数19】
【0097】
として黄から反時計回りに各点を
【0098】
【数20】
【0099】
で表すとすると、円周(360度=2πラジアン)を12分割しているため、各点
【0100】
【数21】
【0101】
は、
【0102】
【数22】
【0103】
と表せる。ここで、
【0104】
【数23】
【0105】
は、ベクトルの転置を表す。つまり、
【0106】
【数24】
【0107】
が2行1列の列ベクトルであることを意味する。
【0108】
色相環の各点を式(2)のように表すことで、次の2つのことを確認できる。一般にn次元のベクトル
【0109】
【数25】
【0110】
を
【0111】
【数26】
【0112】
で定義したとき、
【0113】
【数27】
【0114】
が成立する。前者は、補色の関係にある点の位置が最も遠い位置にあり(円周上の2点間の距離は、直径が最も遠い距離である)、後者は、類似色同士の距離がすべて等しいことを意味する。
【0115】
こうして、式(2)により表される各点は、色相環の性質を良く表したものとなっている。本実施形態においては、まず一例として、赤、赤橙、緑の3色を用いてすべての画像データを分類するものとする。この色相環の性質に近似する3個の線形独立なベクトルが必要になる。
【0116】
その一例となるベクトル
【0117】
【数28】
【0118】
は、
【0119】
【数29】
【0120】
である。ただし、u(≠0)は任意の実数とする。今列ベクトル
【0121】
【数30】
【0122】
を横に並べてできる5行3列の行列をFとおく。
【0123】
【数31】
【0124】
は赤橙を表す
【0125】
【数32】
【0126】
に、
【0127】
【数33】
【0128】
は赤を表す
【0129】
【数34】
【0130】
に、
【0131】
【数35】
【0132】
は緑を表す
【0133】
【数36】
【0134】
にそれぞれ対応する。
【0135】
行列Fは以下のようにして作成される。まず、特徴項目が図8に表される色相環の赤橙、赤、緑なので、それぞれ図8において3色に対応するベクトル
【0136】
【数37】
【0137】
を行列Fの2行目までに配置する。すると以下のようになる。NAは未定値である。
【0138】
【数38】
【0139】
次に、上記未定値で埋められた箇所に対応する3行3列の対角線に0でない実数であるuを、それ以外の要素を0とすれば行列Fが完成する。こうして作成された列ベクトル
【0140】
【数39】
【0141】
は、正規直交ベクトルを使用する従来と異なり、座標空間において、赤と赤橙との距離が、赤と緑との距離よりも短くなっている。
【0142】
これは以下により確認できる。
【0143】
【数40】
【0144】
また、列ベクトル
【0145】
【数41】
【0146】
は、線形独立なベクトルである。これは以下により確認できる。
【0147】
【数42】
【0148】
を仮定する。すると、
【0149】
【数43】
【0150】
が成立する。u≠0であることから、上記仮定の下で、
【0151】
【数44】
【0152】
となることが容易に確認できる。よって、列ベクトル
【0153】
【数45】
【0154】
は、線形独立なベクトルである。また、ベクトルの内積を*で表すとすると、
【0155】
【数46】
【0156】
であって、0でないことから、
【0157】
【数47】
【0158】
は直交しない。
【0159】
こうして作成された行列Fの各列ベクトルを、それぞれ赤橙、赤、緑に対応させ、画像データに含まれる各色の割合を掛けることで、5行1列の列ベクトルに変換される。
【0160】
例えば、赤が全ピクセルの70%、赤橙が20%、緑が10%を占める画像データの場合、
【0161】
【数48】
【0162】
それぞれ対応することから、変換後の画像データは、
【0163】
【数49】
【0164】
で表される。以上に述べたように、3色の割合によって表される画像データの特徴を5次元の列ベクトルに変換し、この5次元空間上の点ベクトルの距離を比較することにより類似性を判定することで、より人間の感覚を反映させた類似検索を行うことができ、結果として類似検索の精度を向上させることが可能になる。
【0165】
上記実施形態は、特徴項目数が赤、赤橙、緑の3色であったため、図8に配置された12個の点のうち3点のみを使用したが、一般に12色から何色選択しても行列Fを作成することが可能である。例えば、n色(nは12までの自然数)である場合、その色に対応する列ベクトル
【0166】
【数50】
【0167】
をn個横に並べて、その下に、n行n列の対角線上にu(≠0)を配置し、残りの要素を0にした行列を作成すればよい。すると、(n+2)行n列の行列Fができる。
【0168】
【数51】
【0169】
例えば、12色すべてを使用した場合は、
【0170】
【数52】
【0171】
こうして作成された行列Fの各列ベクトル
【0172】
【数53】
【0173】
という性質を持つ。前者は、12次元空間上でも補色の関係にある点の位置は、他のどの2点間の距離よりも距離が遠くなっていることを意味し、後者は、値が添え字iに依存しないことから、12次元空間上でも隣接色の距離が互いに等しいことを意味する。つまり、2次元空間での色相環の性質を継承している。
【0174】
また、色同士の類似性も反映されている。例えば、
【0175】
【数54】
【0176】
は、それぞれ
【0177】
【数55】
【0178】
となり、赤と赤橙の距離
【0179】
【数56】
【0180】
の方が、赤と緑の距離
【0181】
【数57】
【0182】
よりも短く、人間の感覚を反映したものであることになる。
【0183】
次に、12個の列ベクトルの線形独立性を調べる。
【0184】
【数58】
【0185】
が線形独立かを調べるには、
【0186】
【数59】
【0187】
が成立すればよい。今、上記仮定により、行列の3行目以下を見れば、
【0188】
【数60】
【0189】
が成立する。u≠0であることから、上記仮定の下で、
【0190】
【数61】
【0191】
となることが容易に確認できる。従ってこの12個の列ベクトルは線形独立である。
【0192】
またuを調整することにより、類似検索の精度を調整することが可能となる。uの値を限りなくゼロに近づけることは、12次元空間の各点の性質を限りなく2次元の色相環の性質に近づけるものとなる。しかし一方で、uの値を限りなくゼロに近づけることは線形独立性を失わせることになる。よって、線形独立性を失わせなることなく、また、2次元の色相環の性質との誤差が許容される範囲でuの値を調整することができる。
【0193】
こうして、2次元平面状の色相環として表される色を12次元空間上の点ベクトルに対応させることにより、各色の類似性を反映させた座標軸を設定することができ、これにより類似検索の結果がより人間の感覚を反映させたものが出力され、類似検索の精度を高めることが可能となる。
【0194】
なお、式(2)の列ベクトル
【0195】
【数62】
【0196】
は12色の色相環に対するものであるが、一般にn色(nは自然数)にまで拡張することが可能である。その場合、色相環の各点を
【0197】
【数63】
【0198】
と表し、式(2)の行列の例と同じく、2行目までを上記式によるベクトル、残りのn行n列の対角線上にu(≠0)となる要素を配置したn行(n+2)列の行列の各列ベクトルを対応させることで、一般のn色の色相環に対応させることができる。
【0199】
図9は、以上の処理を一般化したフローチャートである。まず、画像データの特徴を表す項目として使用する色を色相環から選択する(S21)。例えば、n色の色相環から色数sとして、s色選択する。色相環の色に番号付けをすることで、色番号集合
【0200】
【数64】
【0201】
ができる。例えば、12色相環から、赤、赤橙、緑を選択すれば、黄色が色番号1であり、
【0202】
【数65】
【0203】
となる。
【0204】
次に、色相環に表される色に対応する2次元ベクトルを決定する(S22)。n色の色相環であれば、
【0205】
【数66】
【0206】
と一般的に表すことができる。そして、その2次元ベクトルと対角行列を組み合わせて変換行列Fを作成する(S23)。変換行列Fは、一例として、
【0207】
【数67】
【0208】
という(s+2)行s列で作成する。ただし、Uは、
【0209】
【数68】
【0210】
で、対角要素のみがu(≠0)であるs行s列の正方行列である。
【0211】
こうして、図9のフローチャートに従って、2次元平面状にn色の色相環として表される色から任意のs色を選択し、s次元空間上の点ベクトルに対応させることにより、各色の類似性を反映させた座標軸を設定することができ、これにより類似検索の結果がより人間の感覚を反映させたものが出力され、類似検索の精度を高めることが可能となる。
【0212】
次に、マンセルの色立体に表される色を特徴項目としてすべての画像データを分類する場合に本発明の類似検索方法を適用する場合の例について説明する。
【0213】
図10は、マンセルの色立体を説明する図である。マンセルの色立体は、色合いを表す色相、明るさを示す明度、鮮やかさを示す彩度を立体的に配置したものである。図10Aにあるように、縦軸方向に明度81、縦軸からの距離として彩度82、明度を固定してできる円周方向に色相83が決定される。色立体の外側に近づくにつれ、彩度は高く、色はより鮮やかになり、色立体の内側に近づくにつれ、彩度は低く、色はより淡くなる。
【0214】
明度が高い色は明るさが増し、より縦軸の上側に配置される。明度を上げていくと白くなり、明度を下げていくと黒くなる。図10Bは、以上のような特徴を踏まえ実際に色を配置した例である。図10Bにおいて、明度、彩度を固定した際にできる色相は、図7のような色相環となる。
【0215】
図11は、マンセルの色立体に表される色の関係を数式的に説明するために3次元座標を導入した図である。マンセルの色立体に表される色は、図11の球内の点に対応させることができる。また、図11において、xy平面に平行に球を切った切り口は、図8のような12色の色相環であるとする。
【0216】
図11には、明度0の赤橙と、明度hの赤と、明度−hの緑が描かれている。まず、図11に描かれる3個の点に対応する色によりすべての画像データを分類する場合の変換行列の作成方法について説明する。
【0217】
図12は、マンセルの色立体に表される色を特徴項目として使用する場合の変換行列を作成する処理を説明するフローチャートである。処理内容は、図9の色相環の処理と共通するステップは、そちらを引用する。
【0218】
まず、画像データの特徴を表す項目として使用する色を色立体から選択する(S31)。これは、図9における色相環からの色の選択処理と同じである。図9と同様に色数をsとすれば、本実施形態ではs=3である。ここでは、図11に示された明度の異なる3色(赤、赤橙、緑)を使用する。
【0219】
次に、色立体に表される色に対応する3次元ベクトルを決定する(S32)。ステップS32で決定される3次元ベクトルを、
【0220】
【数69】
【0221】
とする。色相環は2次元ベクトルとして表されたが、色立体では3次元ベクトルとなる。例えば、ステップS31で選択された3色の場合、赤は
【0222】
【数70】、
【0223】
赤橙は
【0224】
【数71】、
【0225】
緑は
【0226】
【数72】
【0227】
で表される。ただし、
【0228】
【数73】、
【0229】
Rは球の半径、hは赤の明度、−hは緑の明度である。赤橙の明度は0である。
【0230】
そして、その3次元ベクトルと対角行列を組み合わせて変換行列Fを作成する(S33)。変換行列Fは、一例として、
【0231】
【数74】
【0232】
という(s+3)行s列で作成する。ただし、本実施形態ではs=3である。Uは、
【0233】
【数75】
【0234】
で、対角要素のみがu(≠0)であるs行s列の正方行列である。
【0235】
次に、3個の列ベクトルの線形独立性を調べる。
【0236】
【数76】
【0237】
が線形独立かを調べるには、
【0238】
【数77】
【0239】
が成立すればよい。今、上記仮定により、行列の4行目以下を見れば、
【0240】
【数78】
【0241】
が成立する。u≠0であることから、上記仮定の下で、
【0242】
【数79】
【0243】
となることが容易に確認できる。従ってこの3個の列ベクトルは線形独立である。
【0244】
なおここでは、3色の例で説明したが、図12の処理は、色立体から任意のs色を選択した場合にも適用が可能である。その場合ステップS2で選択された色に対応する3次元ベクトルを
【0245】
【数80】
【0246】
とすればよい。また、無彩色であっても、3次元ベクトルで表すことができるため、任意のs色には無彩色が含まれていても構わない。
【0247】
こうしてできたs個の線形独立なベクトルは次のような性質を持つ。xy平面に平行な面で球を切った時にできる平面上にある点に対応するベクトルの中で補色の関係にある色に対応するベクトル同士の距離は、その平面上にある他の点に対応するベクトル同士の距離よりも長い。また、xy平面に平行な面で球を切った時にできる平面上にある点に対応するベクトル同士の距離の関係は、xy平面に平行な面で球を切った時にできる平面上にある点同士の関係と同じである。
【0248】
またuを調整することにより、類似検索の精度を調整することが可能となる。uの値を限りなくゼロに近づけることは、s次元空間の各点の性質を限りなく2次元の色相環の性質に近づけるものとなる。しかし一方で、uの値を限りなくゼロに近づけることは線形独立性を失わせることになる。よって、線形独立性を失わせなることなく、また、2次元の色相環の性質との誤差が許容される範囲でuの値を調整することができる。
【0249】
こうして3次元球状の色立体の点として表される色をs次元空間上の点ベクトル(s個の列ベクトル)に対応させることにより、各色の類似性を反映させた座標軸を設定することができ、これにより類似検索の結果がより人間の感覚を反映させたものが出力され、類似検索の精度を高めることが可能となる。
【0250】
次に、マンセルの色立体に表される色を特徴項目としてすべての画像データを分類する場合に本発明の類似検索方法を適用する場合の別の例について説明する。
本変形例においては、マンセルの色立体からの色の選択の仕方に一定の制約がある。
【0251】
図13は、本変形例の処理を説明するフローチャートである。まずは、選択される色に無彩色が含まれない場合を説明する。まず、画像データの特徴を表す項目として使用する色を色相環から選択し、明度、彩度を変更し、数種類のパターンを作成する(S41)。
【0252】
ここでは、明度0の色相から選択する色数sと明度数l、彩度数mを決定する。明度数分の明度を集めた明度の集合hとして
【0253】
【数81】
【0254】
、同様に彩度の集合bとして
【0255】
【数82】
【0256】
ができる。明度は高さに対応し、彩度は、明度を固定してできる最大の色相環(最も外側の円)の半径を何倍するかという倍率である。従って、明度を固定してできる最大の色相環の半径に彩度を掛ければ、その色のz軸からの距離が求まる。
【0257】
図14は、本変形例にて使用される色を球状の点として配置した図である。色数が4、明度が3、彩度が2とした例である。また、
【0258】
【数83】
【0259】
となっている例である。ここでは、色数sが決まると円をs等分する点の色が自動的に選択されたものとし、基準となる色は、例えば図8の黄色とする。
【0260】
従って、12色の色相環で色数4と決まれば、基準となる黄色から順に、黄、赤、青紫、青緑が選択される。基準となる色は黄色以外でも構わない。ちなみに、円をs等分する点の色を自動的に選択する場合、色数sとして選択可能な数は、n色の色相環の場合、nの約数となる。
【0261】
図14では、全部で29個の点が描かれている。明度0においては、黄109、赤110、青紫111、青緑112と、内側の円に彩度の異なる黄113、赤114、青紫115、青緑116が存在する。同様に、明度、彩度の異なる黄、赤、青紫、青緑がそれぞれ存在する。
【0262】
図13に戻り説明を続ける。色相環から選択された色数次元の巡回行列を、彩度数と明度数の積の分作成する(S42)。巡回行列とは、ある列ベクトルの要素を1つずつずらした列ベクトルを配置した行列である。つまり、列ベクトルの要素がs個あれば、
【0263】
【数84】
【0264】
というs行s列の形式である。巡回行列は、列ベクトル同士が等距離にあり、従って、各列ベクトルを円周を色数sで分割した点(ベクトル)に対応させると、色相環上の色の対応をよく表すことになる。
【0265】
ここでは、巡回行列Sとして、半環状巡回行列を作成する。半環状巡回行列とは、各列にsが奇数であれば、(s+1)/2個の、sが偶数であればs/2個の0を含むものである。そして、色相環の特徴として、補色の関係にある点同士の距離が直径に等しいという条件を課すことにより、色数が4である場合の巡回行列Sの一例として、
【0266】
【数85】
【0267】
とすることができる。そして、この基本となる巡回行列Sの各要素に、明度を固定した際にできる同心円の半径と彩度を掛けることによって、色相環から選択された色数次元の巡回行列が彩度数と明度数の積の分作成される。
【0268】
次に、その巡回行列と、明度と、対角行列を組み合わせて変換行列Fを作成する(S43)。今、色数s、明度数l、彩度数mを掛けた数をtとおくと、変換行列Fを次のように一般化して作成できる。
【0269】
【数86】
【0270】
ただし、Sはs行s列の行列、
【0271】
【数87】
【0272】
の1行m列のベクトルである。また、Uは、
【0273】
【数88】
【0274】
で、t行t列の正方行列である。
【0275】
変換行列Fの各列ベクトルが線形独立となるのは、対角行列Uの存在から明らかであり、また巡回行列Sの作成の際、色立体上の色の類似性を反映させていることから、変換行列Fの各列ベクトルを色立体上の点に対応させることにより、これにより類似検索の結果がより人間の感覚を反映させたものが出力され、類似検索の精度を高めることが可能となる。
【0276】
なおステップS42で用いる巡回行列の別の例として、相反環状行列を用いることもできる。相反環状行列とは、s行s列の巡回行列S
【0277】
【数89】
【0278】
において、さらに要素が
【0279】
【数90】
【0280】
なる関係を満たす列ベクトル(基準ベクトルと呼ぶ)が存在するものである。ただし、sが偶数の場合
【0281】
【数91】
【0282】
、sが奇数の場合
【0283】
【数92】
【0284】
である。色数が4の相反環状行列の一例として、
【0285】
【数93】
【0286】
とすることができる。この行列Sでは、第一列目が基準ベクトルである。そして隣接する左右の列ベクトルにおいて、行要素が1つずつ縦にずれている。
【0287】
次に、選択される色に無彩色が含まれる場合について説明する。この場合は、ステップS43で作成される変換行列Fに、無彩色に対応するl+2個の要素を追加し、追加した要素に合わせて対角行列となるように対角行列Uを調整してやればよい。すなわち、一般化すれば、
【0288】
【数94】
【0289】
という(w+s+1)行w列の行列となる。ただし、
【0290】
【数95】
【0291】
、Sはs行s列の行列であり、有彩色の場合と同様、半環状行列、相反巡回行列等の巡回行列が使用される。
【0292】
【数96】
【0293】
は1行m列のベクトルである。また、Uは、
【0294】
【数97】
【0295】
となる、w行w列の正方行列である。
【0296】
無彩色の場合の行列Fには、各明度に対応する位置の無彩色に対応する列ベクトルに加えて、両極、つまり白と黒に対応する列ベクトルが追加されている。無彩色を考慮した場合であっても、変換行列Fの各列ベクトルは線形独立となる。これは、対角行列Uの存在から明らかである。
【0297】
また巡回行列Sの作成の際、色立体上の色の類似性を反映させていることから、変換行列Fの各列ベクトルを色立体上の点に対応させると、類似検索の結果がより人間の感覚を反映させたものが出力されることになる。これにより、類似検索の精度を高めることが可能となる。
【0298】
図13のフローチャートにより作成される変換行列Fの具体例として、図14に表された色数4、明度数3、彩度数2の24色に加え、明度数3に対応する3つの無彩色、それに両極である白、黒(ともに無彩色)を加えた29色による変換行列Fの例を示しておく。作成される変換行列Fは、
【0299】
【数98】
【0300】
であるため、(w+s+1)行w列、つまり34行29列の行列となる。
【0301】
列数が大きいため、16列目で分けて書くと、
【0302】
【数99】
【0303】
となる。ただし、
【0304】
【数100】
【0305】
はi行i列の対角行列である。Oは、すべての要素が0であるゼロ行列である。16列目までに対応するOは、13行16列、17行目以降に対応するOは、16行13列である。
【0306】
以上説明したように本発明によれば、特徴項目として選択される色の類似性を反映させた線形独立なベクトルを作成し、その線形独立なベクトルを並べた行列を用いて画像データの類似性を、ベクトル間距離によって判定することにより、より人間の感覚を反映させた類似検索を行うことが可能となる。従って、類似検索の精度を向上させることができる。なお本発明の画像データの類似検索方法は、静止画に限らず、動画データにも適用可能である。
【0307】
本発明の画像データの類似検索方法は、例えば、電子ショッピング、不正画像検出、図面検索、衛星画像による遠隔探査、医療画像検索等において、検索者の所望する画像データを大量のデータの中からの検索することに適用が可能である。
【0308】
以上、実施の形態例をまとめると以下の付記の通りである。
【0309】
(付記1) 複数の画像データのそれぞれに対して、前記画像データのピクセルが複数の色によって分類される第一のステップと、前記色ごとのピクセル数を全ピクセル数で除算して各色の割合が算出される第二のステップと、前記割合を並べたベクトルが変換行列によって特徴ベクトルに変換される第三のステップとを有し、前記特徴ベクトルが該画像データごとに対応付けられて予め蓄積装置に蓄積され、前記蓄積装置と接続された類似検索装置に、検索対象として画像データが入力され、前記検索対象として入力された画像データに対して、前記第一のステップから前記第三のステップが行われ、該検索対象として入力された画像データの特徴ベクトルが生成され、該検索対象として入力された画像データの特徴ベクトルである第一の特徴ベクトルと、前記蓄積装置に蓄積された特徴ベクトルから選択された特徴ベクトルである第二の特徴ベクトルの距離を算出し、前記距離が所定の値以下である場合、前記第一の特徴ベクトルに対応する、検索対象として入力された画像データと、前記第二の特徴ベクトルに対応付けられた画像データが類似すると判定され、前記蓄積装置に蓄積された複数の画像データに対応付けられた複数の特徴ベクトルに対して前記類似判定を行うことで、前記蓄積装置に蓄積された複数の画像データから、検索対象として入力された画像データに類似する画像データを検索する類似画像検索方法において、前記変換行列は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを、前記色の数だけ横に並べて作成される行列であることを特徴とする類似画像検索方法。
【0310】
(付記2)付記1において、
前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする類似画像検索方法。
【0311】
(付記3)付記2において、
前記複数の色は、色相環に表される色から選択され、前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索方法。
【0312】
(付記4)付記3において、前記変換行列は、
【0313】
【数101】
【0314】
であり、ただし、sは前記選択された色の数を表し、Uは、s行s列の行列で、
【0315】
【数102】
【0316】
を満たし、また
【0317】
【数103】
【0318】
は、それぞれ前記色相環に表される色が2次元座標空間に配置された点に対応する2行1列のベクトルを表すことを特徴とする類似画像検索方法。
【0319】
(付記5)付記2において、前記複数の色は、色立体に表される色から選択され、前記複数の色同士の類似性は、前記色立体に表される色が3次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索方法。
【0320】
(付記6)付記5において、前記変換行列は、
【0321】
【数104】
【0322】
であり、ただし、sは前記選択された色の数を表し、Uは、s行s列の行列で、
【0323】
【数105】
【0324】
を満たし、また
【0325】
【数106】
【0326】
は、それぞれ前記色立体に表される色が3次元座標空間に配置された点に対応する3行1列のベクトルを表すことを特徴とする類似画像検索方法。
【0327】
(付記7)付記5において、前記複数の色は、色立体にて明度および彩度を固定してできる色相環から選択された第一の個数分の色、該第一の個数分の色の明度を第二の個数段階、彩度を第三の個数段階変化させてできる、計第一の個数および第二の個数および第三の個数の積の分の色であり、前記変換行列は、s行s列の巡回行列の各要素に、対応する係数を掛けたものをm個列方向に並べたブロックをl個列方向に並べてできる部分と、1行m列のブロックをl個列方向に並べてできる部分と、s行s・m・l列(ただし・は積を表す)の対角行列部分を含んでなる
【0328】
【数107】
【0329】
であり、ただし、sは前記第一の個数数を表し、lは前記第二の個数を表し、mは前記第三の個数を表し、Uは、s・m・l行s・m・l列の行列で、
【0330】
【数108】
【0331】
を満たし、
【0332】
【数109】
【0333】
は、前記第二の個数分の明度を表し、
【0334】
【数110】
【0335】
であり、Rは色立体を表す球の半径であり、
【0336】
【数111】
【0337】
は、前記第三の個数分の彩度を表し、
【0338】
【数112】
【0339】
の1行m列のベクトルを表し、Sは、s行s列の巡回行列で、各列ベクトルが前記色相環から選択された第一の個数分の色に対応し、前記色相環にて補色の関係にある色に対応する列ベクトルの距離が色立体を表す球の直径となる条件を満たすことを特徴とする類似画像検索方法。
【0340】
(付記8)付記7において、前記複数の色は、さらに無彩色を含み、前記変換行列は、
【0341】
【数113】
【0342】
であり、ただし、Uは、
【0343】
【数114】
【0344】
を満たす(s・m・l+l+2)行(s・m・l+l+2)列の行列である
ことを特徴とする類似画像検索方法。
【0345】
(付記9)予め画像データと該画像データに対する第一の特徴ベクトルが対応付けられ複数蓄積された画像データベースと、検索対象の画像データが入力される画像入力部と、入力された画像データを第二の特徴ベクトルに対応させる特徴抽出部と、入力された画像データが蓄積された画像データと類似するかを前記第一の特徴ベクトルと前記第二の特徴ベクトルの距離により判定する類似判定部と、情報を格納する記憶部とを備え、前記記憶部は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを前記色の数だけ横に並べた変換行列を含み、前記特徴抽出部は、画像データのピクセルを複数の色によって分類し、色ごとのピクセル数を全ピクセル数で除算して各色の割合を画像データごとに算出し、前記割合を並べてベクトルとし、前記変換行列により前記ベクトルを変換することを特徴とする類似画像検索装置。
【0346】
(付記10)付記9において、前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする類似画像検索装置。
【0347】
(付記11)付記10において、前記複数の色は、色相環に表される色から選択され、前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索装置。
【0348】
(付記12)付記11において、前記変換行列は、
【0349】
【数115】
【0350】
であり、ただし、sは前記選択された色の数を表し、Uは、s行s列の行列で、
【0351】
【数116】
【0352】
を満たし、また
【0353】
【数117】
【0354】
は、それぞれ前記色相環に表される色が2次元座標空間に配置された点に対応する2行1列のベクトルを表すことを特徴とする類似画像検索装置。
【0355】
(付記13)付記10において、前記複数の色は、色立体に表される色から選択され、前記複数の色同士の類似性は、前記色立体に表される色が3次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索装置。
【0356】
(付記14)付記13において、前記変換行列は、
【0357】
【数118】
【0358】
であり、ただし、sは前記選択された色の数を表し、Uは、s行s列の行列で、
【0359】
【数119】
【0360】
を満たし、また
【0361】
【数120】
【0362】
は、それぞれ前記色立体に表される色が3次元座標空間に配置された点に対応する3行1列のベクトルを表すことを特徴とする類似画像検索装置。
【0363】
(付記15)付記13において、前記複数の色は、色立体にて明度および彩度を固定してできる色相環から選択された第一の個数分の色、該第一の個数分の色の明度を第二の個数段階、彩度を第三の個数段階変化させてできる、計第一の個数および第二の個数および第三の個数の積の分の色であり、前記変換行列は、s行s列の巡回行列の各要素に、対応する係数を掛けたものをm個列方向に並べたブロックをl個列方向に並べてできる部分と、1行m列のブロックをl個列方向に並べてできる部分と、s行s・m・l列(ただし・は積を表す)の対角行列部分を含んでなる
【0364】
【数121】
【0365】
であり、ただし、sは前記第一の個数数を表し、lは前記第二の個数を表し、mは前記第三の個数を表し、Uは、s・m・l行s・m・l列の行列で、
【0366】
【数122】
【0367】
を満たし、
【0368】
【数123】
【0369】
は、前記第二の個数分の明度を表し、
【0370】
【数124】
【0371】
であり、Rは色立体を表す球の半径であり、
【0372】
【数125】
【0373】
は、前記第三の個数分の彩度を表し、
【0374】
【数126】
【0375】
の1行m列のベクトルを表し、Sは、s行s列の巡回行列で、各列ベクトルが前記色相環から選択された第一の個数分の色に対応し、前記色相環にて補色の関係にある色に対応する列ベクトルの距離が色立体を表す球の直径となる条件を満たすことを特徴とする類似画像検索装置。
【0376】
(付記16)付記15において、前記複数の色は、さらに無彩色を含み、前記変換行列は、
【0377】
【数127】
【0378】
であり、ただし、Uは、
【0379】
【数128】
【0380】
を満たす(s・m・l+l+2)行(s・m・l+l+2)列の行列であることを特徴とする類似画像検索装置。
【0381】
【発明の効果】
以上説明したように本発明によれば、特徴項目として選択される色の類似性を反映させた線形独立なベクトルを作成し、その線形独立なベクトルを並べた行列を用いて画像データの類似性を、ベクトル間距離によって判定することにより、より人間の感覚を反映させた類似検索を行うことが可能となる。従って、類似検索の精度を向上させることができる。なお本発明の画像データの類似検索方法は、静止画に限らず、動画データにも適用可能である。
【0382】
本発明の画像データの類似検索方法は、例えば、電子ショッピング、不正画像検出、図面検索、衛星画像による遠隔探査、医療画像検索等において、検索者の所望する画像データを大量のデータの中からの検索することに適用が可能であり、これらの分野におけるいっそうのサービス向上に貢献することが可能である。
【図面の簡単な説明】
【図1】従来の類似検索において、画像データの特徴をベクトル化する場合の例を説明する図である。
【図2】本発明の類似検索方法を行うための類似検索システムの全体構成を示す図である。
【図3】類似検索処理装置の構成例を示す図である。
【図4】類似検索に使用するデータベースに画像データを蓄積する処理を説明するフローチャートである。
【図5】蓄積装置に蓄積される、画像データの特徴をベクトル化して格納する表のデータ構成例である。
【図6】類似検索装置を使用して類似検索を行う際の処理を説明するフローチャートである。
【図7】本実施形態で用いる色相環を示す図である。
【図8】色相環に表される色を円周を12個に等分割する点に対応させた図である。
【図9】色相環に表される色を特徴項目として使用する場合の変換行列を作成する処理を説明するフローチャートである。
【図10】本実施形態で用いるマンセルの色立体を説明する図である。
【図11】マンセルの色立体に表される色の関係を数式的に説明するために3次元座標を導入した図である。
【図12】マンセルの色立体に表される色を特徴項目として使用する場合の変換行列を作成する処理を説明するフローチャートである。
【図13】マンセルの色立体に表される色を特徴項目として使用する場合の変換行列を作成する処理の変形例を説明するフローチャートである。
【図14】変形例にて使用される色を球状の点として配置した図である。
【符号の説明】
1 画像入力装置、2 類似検索処置装置、3 端末、4 データベース、5 画像データ、6 特徴ベクトル表、7 ネットワーク
Claims (6)
- 複数の画像データのそれぞれに対して、前記画像データのピクセルが複数の色によって分類される第一のステップと、前記色ごとのピクセル数を全ピクセル数で除算して各色の割合が算出される第二のステップと、前記割合を並べたベクトルが変換行列によって特徴ベクトルに変換される第三のステップとを有し、前記特徴ベクトルが該画像データごとに対応付けられて予め蓄積装置に蓄積され、
前記蓄積装置と接続された類似検索装置に、検索対象として画像データが入力され、
前記検索対象として入力された画像データに対して、前記第一のステップから前記第三のステップが行われ、該検索対象として入力された画像データの特徴ベクトルが生成され、
該検索対象として入力された画像データの特徴ベクトルである第一の特徴ベクトルと、前記蓄積装置に蓄積された特徴ベクトルから選択された特徴ベクトルである第二の特徴ベクトルの距離を算出し、
前記距離の大小により、前記第一の特徴ベクトルに対応する、検索対象として入力された画像データと、前記第二の特徴ベクトルに対応付けられた画像データの類似性が判定され、
前記蓄積装置に蓄積された複数の画像データに対応付けられた複数の特徴ベクトルに対して前記類似判定を行うことで、前記蓄積装置に蓄積された複数の画像データから、検索対象として入力された画像データに類似する画像データを検索する類似画像検索方法において、
前記変換行列は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを、前記色の数だけ横に並べて作成される行列であることを特徴とする類似画像検索方法。 - 請求項1において、
前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする類似画像検索方法。 - 請求項2において、
前記複数の色は、色相環に表される色から選択され、
前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索方法。 - 予め画像データと該画像データに対する第一の特徴ベクトルが対応付けられ複数蓄積された画像データベースと、
検索対象の画像データが入力される画像入力部と、
入力された画像データを第二の特徴ベクトルに対応させる特徴抽出部と、
入力された画像データが蓄積された画像データと類似するかを前記第一の特徴ベクトルと前記第二の特徴ベクトルの距離により判定する類似判定部と、
情報を格納する記憶部とを備え、
前記記憶部は、線形独立な複数の列ベクトルであって、少なくとも1組の直交しない列ベクトルを含む複数の列ベクトルを前記色の数だけ横に並べた変換行列を含み、
前記特徴抽出部は、画像データのピクセルを複数の色によって分類し、色ごとのピクセル数を全ピクセル数で除算して各色の割合を画像データごとに算出し、前記割合を並べてベクトルとし、前記変換行列により前記ベクトルを変換することを特徴とする類似画像検索装置。 - 請求項4において、
前記複数の列ベクトルは、前記複数の色同士の類似性を反映させるように作成されることを特徴とする類似画像検索装置。 - 請求項5において、
前記複数の色は、色相環に表される色から選択され、
前記複数の色同士の類似性は、前記色相環に表される色が2次元座標空間に配置された点のうち前記選択された色に対応する点同士の距離に基づいて決定されることを特徴とする類似画像検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003172217A JP2005010931A (ja) | 2003-06-17 | 2003-06-17 | 画像データの類似検索装置および該類似検索装置における類似判定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003172217A JP2005010931A (ja) | 2003-06-17 | 2003-06-17 | 画像データの類似検索装置および該類似検索装置における類似判定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005010931A true JP2005010931A (ja) | 2005-01-13 |
Family
ID=34096436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003172217A Withdrawn JP2005010931A (ja) | 2003-06-17 | 2003-06-17 | 画像データの類似検索装置および該類似検索装置における類似判定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005010931A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8032505B2 (en) | 2008-03-11 | 2011-10-04 | Fuji Xerox Co., Ltd. | Relative document representing system, relative document representing method, and computer readable medium |
US8099413B2 (en) | 2008-03-21 | 2012-01-17 | Fuji Xerox Co., Ltd. | Relative document presenting system, relative document presenting method, and computer readable medium |
CN102393967A (zh) * | 2011-06-27 | 2012-03-28 | 中国科学院软件研究所 | 基于虚拟驾驶的线形要素矢量化作业方法 |
-
2003
- 2003-06-17 JP JP2003172217A patent/JP2005010931A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8032505B2 (en) | 2008-03-11 | 2011-10-04 | Fuji Xerox Co., Ltd. | Relative document representing system, relative document representing method, and computer readable medium |
US8099413B2 (en) | 2008-03-21 | 2012-01-17 | Fuji Xerox Co., Ltd. | Relative document presenting system, relative document presenting method, and computer readable medium |
CN102393967A (zh) * | 2011-06-27 | 2012-03-28 | 中国科学院软件研究所 | 基于虚拟驾驶的线形要素矢量化作业方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9741137B2 (en) | Image-based color palette generation | |
US9552656B2 (en) | Image-based color palette generation | |
US10831819B2 (en) | Hue-based color naming for an image | |
JP5236785B2 (ja) | カラー画像を探索する方法、カラー画像を探索する装置、カラー画像を探索するシステム、並びにコンピュータによる実行可能命令からなるプログラム | |
US9311889B1 (en) | Image-based color palette generation | |
US9177391B1 (en) | Image-based color palette generation | |
US9633448B1 (en) | Hue-based color naming for an image | |
JP5229744B2 (ja) | 画像分類装置および画像分類プログラム | |
US20100110455A1 (en) | Language based color selection method | |
US20080025647A1 (en) | Image management methods, image management systems, and articles of manufacture | |
CN107077474A (zh) | 快速颜色搜索 | |
JP5997545B2 (ja) | 信号処理方法及び信号処理装置 | |
US20080104020A1 (en) | Handwritten Query Builder | |
US10134149B2 (en) | Image processing | |
Khosla et al. | Evaluation of Euclidean and Manhanttan metrics in content based image retrieval system | |
CN110222829A (zh) | 基于卷积神经网络的特征提取方法、装置、设备及介质 | |
KR100312331B1 (ko) | 내용기반영상검색방법및장치 | |
CN110019898A (zh) | 一种动漫图像处理系统 | |
JP2005010931A (ja) | 画像データの類似検索装置および該類似検索装置における類似判定方法 | |
Kekre et al. | Comparative study of color histogram based bins approach in RGB, XYZ, Kekre's LXY and L′ X′ Y′ color spaces | |
JP2011014052A (ja) | 画像識別装置、画像識別方法、識別器作成装置、識別器作成方法、および撮像システム | |
Li et al. | Illumination-independent descriptors using color moment invariants | |
De Oliveira et al. | Hybrid visualization: a new approach to display instances relationship and attributes behaviour in a single view | |
Schaefer | Content-based retrieval from image databases: colour, compression, and browsing | |
Admile | A survey on different image retrieval techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060905 |