[第1の実施の形態]
次に、本発明の第1の実施の形態について図面を参照して詳細に説明する。図4は、第1の実施の形態にかかる画像特徴量抽出装置01の構成を示したブロック図である。
画像特徴量抽出装置01は、画像が入力されると、あらかじめ規定された画像の量子化対象領域ごとに、あらかじめ規定された階層的に量子化を行う方法である階層的量子化方法に従い、階層的に量子化を行って複数の階層の量子化インデックスを算出し、各量子化対象領域の各階層の量子化インデックスが一意に特定できる符号化形式である階層的量子化インデックス符号を算出し、画像の特徴量として出力する。ここで、各量子化対象領域の各階層の量子化インデックスが一意に特定できるとは、各量子化対象領域とその量子化インデックスとの対応が一意に特定でき、且つ、各階層の量子化インデックスが一意に特定できることを意味する。
ここで量子化対象領域とは、階層的に量子化を行って量子化インデックスを算出する対象とする領域のことである。量子化対象領域は、例えば画像を空間的に領域分割して得られた複数の局所領域であってもよい。例えば、画像を長方形の局所領域(ブロック)に分割して(ブロックが互いに一部が重なっていてもよい)得られた複数の局所領域(ブロック)であってもよい。この場合、画像サイズの変換に対処できるように、例えば、画像サイズを正規化して得られた正規化画像に対して局所領域を定めてもよい。また例えば、画像全体を1つの量子化対象領域としてもよい。また量子化対象領域は、画像の空間的な領域である必要はなく、例えば画像信号の周波数領域における部分領域などであってもよい。量子化対象領域は、画像信号に基づいて量子化を行うことができるのであれば、どのような領域であってもかまわない。
ここで階層的量子化方法とは、画像信号に基づいて量子化対象領域を、ある量子化方法によって有限数の量子化インデックスに分類し、各量子化インデックスに分類されるサンプルを、更に別の量子化方法によって有限数の量子化インデックスに階層的に分類していく方法である。この方法に従って階層的に量子化を行うことにより、各量子化対象領域に対して、複数の階層の量子化インデックスが算出されることになる。なお量子化方法とは、量子化に用いる特徴量の種別、およびその特徴量を量子化して量子化インデックスを算出する手順・パラメータのことである。図6に階層的量子化方法の一例を模式的に示す。図6において、番号は量子化インデックスを表し、点線で囲われた部分は1つの量子化方法で量子化された量子化インデックスのセットを示す。以後、具体例を説明する際に、図6を参照する。
階層的量子化方法は、その上位の階層の量子化インデックスによって、その下位の階層の量子化方法が決定する。すなわち、上位の階層の量子化インデックスによって、その下位の階層の量子化方法(量子化に用いる特徴量の種別や、特徴量を量子化して量子化インデックスを算出する手順・パラメータ)が異なる(ただし、同じ量子化方法であっても構わない)。図6を例に説明すると、量子化インデックスが1の場合はその下位の階層の量子化方法が量子化方法Bであり、量子化インデックスが2の場合はその下位の階層の量子化方法が量子化方法Cであり、異なっている。この場合、量子化方法Bが用いる特徴量と、量子化方法Cが用いる特徴量が異なっていてもよい。また上位の階層の量子化方法が用いる特徴量の種別と、その下位の階層の量子化方法が用いる特徴量の種別が異なってもよい。
また階層的量子化方法は、その上位の階層の量子化インデックスによって、その下位の階層で分類される量子化インデックスの数が異なってもよい。図6を例に説明すると、量子化インデックスが1の場合はその下位の階層で分類される量子化インデックスの数は2であり、量子化インデックスが5の場合はその下位の階層で分類される量子化インデックスの数は4であり、異なっている。また上位の階層の量子化インデックスによって、それより下位の階層の深さ(階層の数)が異なってもよい。図6を例に説明すると、量子化インデックスが1の場合はそれより下位の階層の深さ(階層の数)が最大で3であり(最上位階層を含めると4)、量子化インデックスが3の場合はそれより下位の階層の深さ(階層の数)が1であり(最上位階層を含めると2)、異なっている。
また階層的量子化方法においては、最上位階層の量子化方法は全てのサンプルを、一意に、かつ未分類がないように、有限数の量子化インデックスに分類する方法である必要がある。またそれ以外の階層の量子化方法は、その上位の階層の量子化インデックスに分類される全てのサンプルを、一意に、かつ未分類がないように、有限数のインデックスに分類する方法である必要がある。図6を例に説明すると、最上位階層の量子化方法である量子化方法Aは、全てのサンプルを、一意に、かつ未分類がないように、量子化インデックス1、2、3、4、5のいずれかに分類する方法となる(1つのサンプルが、例えば同時に量子化インデックス1と2に分類されてはならない)。また例えば、量子化方法Gは、その上位の階層の量子化インデックスである量子化インデックス5に分類される全てのサンプルを、一意に、かつ未分類がないように、量子化インデックス18、19、20、21のいずれかに分類する方法となる(1つのサンプルが、例えば同時に量子化インデックス18と19に分類されてはならない)。
また階層的量子化方法は、それぞれが上記の条件を満たす量子化方法であれば、上位の階層の量子化インデックスに対して、異なる複数の量子化方法が並列に存在してもよい(最上位階層の量子化方法が複数、並列に存在してもよい)。図6を例に説明すると、量子化インデックス4に対して、異なる量子化方法である量子化方法Eと量子化方法Fが並列に存在している。
量子化方法は、画像信号にもとづいて量子化を行うことができるのであれば、どのような特徴量を用いてもよいし、またその特徴量を用いてどのような手順・パラメータで量子化インデックスを算出してもよい。例えば、量子化対象領域からスカラー量の特徴量(例えば画像の平均輝度値)を抽出し、それを線形スカラー量子化あるいは非線形スカラー量子化する方法であってもよい。また例えば、量子化対象領域からベクトル量の特徴量(例えば画像の輝度ヒストグラム)を抽出し、それをベクトル量子化する方法であってもよい。スカラー量子化やベクトル量子化をする際のパラメータは任意でよい。また例えば、単純な算術演算ではなくルールに基づいた量子化方法であってもよい。例えば、量子化対象領域から、画像の勾配の強度と方向に関する特徴量を抽出し、強度が規定の量に満たない場合は「勾配無し」を示す量子化インデックスに分類し、それ以外の場合は勾配の方向を4方向に量子化し、全体として5つの量子化インデックスに分類する方法であってもよい。
階層的量子化方法にあっては、本質的に、より上位の階層の量子化インデックスを、比較に用いる量子化インデックスのセットとして選択するほど、頑健性が高まることを考慮すると、上位の階層ほど、画像への各種改変処理に対して頑健な量子化方法であること、すなわち各種改変処理に対して算出される量子化インデックスが変化しにくい量子化方法であること、が望ましい(ただし、そうである必要はない)。図6を例に説明すると、例えば、量子化方法Aのほうが、量子化方法B、C、D、E、F、Gよりも頑健な量子化方法であるほうが望ましい。例えば一般的に、画像の輝度成分の勾配を特徴量として用いた量子化方法のほうが、画像の色成分を特徴量として用いた量子化方法よりも頑健であるとした場合に、前者の量子化方法が後者の量子化方法よりも上位の階層であるほうが望ましい。ある量子化方法の頑健性は、例えば、学習用の画像群に対して各種改変処理を施して複製画像を作成し、元画像と複製画像からその量子化方法で量子化対象領域ごとに量子化インデックスを算出し、対応する量子化対象領域において量子化インデックスが一致する割合で測ることができる。一致する割合が高い量子化方法であるほど、画像への各種改変処理に対して頑健な量子化方法であるといえる。階層的量子化方法を設計する際には、例えばこの方法を用いて測った頑健性に基づいて、頑健性の高い量子化方法を頑健性の低い量子化方法よりも上位の階層にするように構成してもよい。
また階層的量子化方法の各階層での量子化方法は、特定の母集団を仮定しない一般的な画像において、その量子化方法で分類される複数の量子化インデックスに対して、できるだけ均等に分類されるような量子化方法であることが望ましい(ただし、そうである必要はない)。図6を例に説明すると、特定の母集団を仮定しない一般的な画像において、量子化方法Aで量子化を行った場合に、量子化インデックス1、2、3、4、5のそれぞれにできるだけ均等な度合いで分類されることが望ましい。階層的量子化方法を設計する際には、例えば学習用の画像群に対して、できるだけ均等に分類されるように量子化方法のパラメータを設定するようにしてもよい。
また階層的量子化方法は、特定の母集団を仮定しない一般的な画像群において、その最上位階層の量子化方法によって算出される量子化インデックスのセットが、十分に異なる画像を識別できる度合いである識別能力を有する方法であることが望ましい(ただし、そうである必要はない)。図6を例に説明すると、特定の母集団を仮定しない一般的な画像において、量子化方法Aによって算出される量子化インデックス1、2、3、4、5が、十分に識別能力を有する方法であることが望ましい。ここで、例えば最上位階層の量子化方法によって算出される量子化インデックスの数が少なすぎると(例えば2つなど)、十分な識別能力を得ることができないため、望ましくない(ただし、そうであってもよい)。また階層的量子化方法は、最上位階層以外の階層の量子化方法によって算出される量子化インデックスの数は少ないほうが、量子化インデックスの出現頻度の均等化が図りやすい(つまり、調整の自由度が高い)ので、望ましい(ただし、そうである必要はない)。図6のように、最上位階層の量子化方法によって算出される量子化インデックスの数(5)が最大であり、それより下の階層の量子化方法によって算出される量子化インデックスの数がそれよりも少ない(2、3、4)ことが望ましい(ただし、そうである必要はない)。例えば、最上位階層の量子化方法によって算出される量子化インデックスの数を10程度とし、それより下の階層の量子化方法によって算出される量子化インデックスを2とする(すなわち2分割していく)ことが、望ましい一例である。
図4を参照すると、画像特徴量抽出装置01は、次階層量子化方法選択手段011と、特徴量抽出手段012と、量子化インデックス算出手段013と、階層的量子化インデックス符号出力手段014と、から構成されている。
次階層量子化方法選択手段011は、量子化対象領域ごとに、あらかじめ規定された階層的量子化方法に従って、(上位階層の)量子化インデックスが供給される場合は、その量子化インデックスに対応する下位階層の量子化方法を選択し、量子化インデックスが供給されない場合は、最上位階層の量子化方法を選択し、選択した量子化方法の情報を特徴量抽出手段012と量子化インデックス算出手段013に供給する。なお、次階層量子化方法選択手段011に入力される量子化インデックスは、後述する量子化インデックス算出手段013からフィードバックされる情報である。図6を例に説明すると、量子化インデックスが供給されない場合は、最上位階層の量子化方法である量子化方法Aを選択する。また例えば量子化インデックス算出手段013から、量子化インデックス6が供給された場合は、量子化インデックス6の下位階層の量子化方法である量子化方法Hを選択する。なお、階層的量子化方法において、ある量子化インデックスの下位階層に(または最上位階層に)異なる複数の量子化方法が並列に存在する場合は、それぞれの量子化方法を選択し、それぞれの量子化方法の情報を供給する。図6を例に説明すると、量子化インデックス4が供給された場合は、量子化インデックス4の下位階層に並列に存在する量子化方法Eと量子化方法Fのそれぞれを選択し、供給する。
特徴量抽出手段012は、量子化対象領域ごとに、次階層量子化方法選択手段011から供給される量子化方法の情報に従い、その量子化方法が用いる特徴量を、入力される画像から抽出し、抽出した特徴量を量子化インデックス算出手段013へ供給する。なお特徴量抽出手段012は、階層的量子化方法において、ある量子化インデックスの下位階層に(または最上位階層に)異なる複数の量子化方法が並列に存在する場合に伴って、複数の量子化方法の情報が供給される場合は、それぞれの量子化方法が用いる特徴量を抽出し、供給する。なお、特徴量抽出手段012は、事前に全て必要な特徴量を抽出しておいて、次階層量子化方法選択手段011から量子化方法の情報が供給されたときに、特徴量を出力するようにしてもよい。また、必要な特徴量が上位階層の量子化方法で既に使われている場合には、その特徴量を保持しておき、再度抽出することなくそのまま出力するようにしてもよい。
量子化インデックス算出手段013は、量子化対象領域ごとに、特徴量抽出手段012から供給される特徴量を、次階層量子化方法選択手段011から供給される量子化方法の情報に従って量子化を行い、量子化インデックスを算出する。算出した量子化インデックスが最下位階層でない場合、すなわち更に下位の量子化方法が存在する場合は、算出した量子化インデックスを次階層量子化方法選択手段011へ供給(フィードバック)する。また算出した量子化インデックスが最下位階層である場合は、算出した量子化インデックスを、階層的量子化インデックス符号出力手段014へ供給する。なお、量子化インデックス算出手段013は、最下位階層の量子化インデックスを算出した場合だけに限らず、各階層の量子化インデックスを算出する度に、算出した量子化インデックスを階層的量子化インデックス出力手段014へ供給するようにしてもよい。図6を例に説明すると、量子化インデックス8、9、11、12、14、15、16、17、20、21、22、23、25、26、27、28、29、30、32、33、34、35、36、37は最下位階層の量子化インデックスであり、それ以外の量子化インデックスは、最下位階層の量子化インデックスではない。なお、量子化インデックス算出手段013は、階層的量子化方法において、ある量子化インデックスの下位階層に(または最上位階層に)異なる複数の量子化方法が並列に存在することにより、複数の量子化方法の情報が供給される場合は、それぞれの量子化方法で量子化を行って量子化インデックスを算出し、それぞれ供給する。図6を例に説明すると、量子化方法Eと量子化方法Fの情報が供給される場合は、それぞれの量子化方法でそれぞれ量子化インデックスを算出する。
階層的量子化インデックス符号出力手段014は、量子化対象領域ごとに、量子化インデックス算出手段013から最下位階層の量子化インデックスが供給されると、各量子化対象領域の各階層の量子化インデックス(量子化インデックス算出手段013が算出した各々の量子化インデックス)が一意に特定できる符号化形式である階層的量子化インデックス符号を算出し、出力する。階層的量子化インデックス符号は、量子化対象領域ごとに、各階層の量子化インデックスが一意に特定できる。これを一意に復号可能な符号化形式であればよい。図6を例に説明すると、例えば最下位階層の量子化インデックスとして量子化インデックス27が供給されると、各階層の量子化インデックスが最上位階層から順に量子化インデックス2、10、27となり、各階層の量子化インデックスが量子化インデックス2、10、27と特定できる符号化形式であればよい。ただし、階層的量子化方法において、ある量子化インデックスの下位階層に(または最上位階層に)異なる複数の量子化方法が並列に存在することにより、複数の異なる最下位階層の量子化インデックスが供給される場合は、それぞれに対する各階層の量子化インデックスが一意に特定できる符号化形式であればよい。図6を例に説明すると、例えば最下位階層の量子化インデックスとして量子化インデックス28と17が供給される場合は、それぞれに対する各階層の量子化インデックスである量子化インデックス4、13、28と、量子化インデックス4、17の(量子化インデックス4は共通)それぞれ(それぞれの階層的量子化のパス)が一意に特定できる符号化形式であればよい。
階層的量子化インデックス符号は、例えば、量子化対象領域ごとの、最下位階層の量子化インデックスのみを符号化したものであってもよい。なぜならば、図6に示されるような階層的量子化方法が、抽出側(画像特徴量抽出装置)と比較側(画像特徴量比較装置)とで共有されており、それぞれが参照できるならば、最下位階層の量子化インデックスから、それより上位の量子化インデックスを一意に特定できるからである。図6を例に説明すると、最下位階層の量子化インデックスが例えば量子化インデックス27であるとすると、量子化インデックス27のみを符号化してもよい(階層的量子化方法に従い、量子化インデックス27から、それより上位の量子化インデックス2、10が一意に特定できる)。また階層的量子化インデックス符号は、最下位階層の量子化インデックスを含む全階層の量子化インデックスを符号化したものであってもよい。図6を例に説明すると、最下位階層の量子化インデックスが例えば量子化インデックス27であるとすると、全階層の量子化インデックス2、10、27を符号化してもよい。前者のほうが符号のサイズが小さくなるため、一般的には前者のほうが望ましい。なお後者は符号のサイズは大きくなるが、階層的量子化インデックス符号の比較の際に、最下位階層の量子化インデックスから、それに対応する上位階層の量子化インデックスを再現する必要がなくなるため、演算量を低減できるメリットがある。また階層的量子化インデックス符号は、各量子化対象領域とその量子化インデックスとの対応が一意に特定できる符号化形式であればよい。例えばあらかじめ規定された量子化対象領域の順番に従って符号化したものであってもよい。また例えば、量子化対象領域が特定できる情報を付加して符号化したものであってもよい。
なお、これまで説明した、階層的量子化方法は、全ての量子化対象領域に対して共通であることが望ましいが、量子化対象領域ごと、または複数の量子化対象領域のグループごとに(量子化対象領域が画像の複数の局所領域である場合、例えば画像の左上領域に属する局所領域のグループ、右上領域に属する局所領域のグループ、左下領域に属する局所領域のグループ、右下領域に属する局所領域のグループなど)、異なってもよい。すなわち、例えば、階層的量子化方法が、量子化対象領域ごとに、または複数の量子化対象領域のグループごとに、異なってもよい。このように、量子化対象領域ごとに、または複数の量子化対象領域のグループごとに、階層的量子化方法を、異なるようにすることによって、量子化対象領域ごと、または複数の量子化対象領域のグループごと、の特性に適合した最適化を行うことができる。例えば、量子化対象領域を画像の複数の局所領域とした場合に、画像の中央領域が前景オブジェクトである可能性が高く、画像の周辺領域が背景である可能性が高いとすると、この特性を利用して、例えば画像の中央領域に属する局所領域は前景オブジェクトを記述するのに適した量子化方法(例えばエッジ情報を特徴量として用いた量子化方法)から構成される階層的量子化方法を用い、画像の周辺領域に属する局所領域は背景を記述するのに適した量子化方法(例えば色情報を特徴量として用いて量子化方法)から構成される階層的量子化方法を用いてもよい。
[動作の説明]
次に、図7のフローチャートを利用して、第1の実施の形態における画像特徴量抽出装置01の動作を説明する。図7は、第1の実施の形態における画像特徴量抽出装置01の動作を示すフローチャートである。
まず、次階層量子化方法選択手段011は、最初の量子化対象領域に対して、階層的量子化方法に従って、最上位階層の量子化方法を選択し、選択した量子化方法の情報を特徴量抽出手段012と量子化インデックス算出手段013に供給する(ステップA01)。次に、特徴量抽出手段012は、現在対象としている量子化対象領域に対して、次階層量子化方法選択手段011から供給される量子化方法の情報に従い、その量子化方法が用いる特徴量を、入力される画像から抽出し、抽出した特徴量を量子化インデックス算出手段013へ供給する(ステップA02)。次に、量子化インデックス算出手段013は、現在対象としている量子化インデックス対象領域に対して、特徴量抽出手段012から供給される特徴量を、次階層量子化方法選択手段011から供給される量子化方法の情報に従って量子化を行い、量子化インデックスを算出する(ステップA03)。算出した量子化インデックスが階層的量子化方法の最下位階層であるか否かを判定する(ステップA04)。算出した量子化インデックスが最下位階層でない場合は、次に、量子化インデックス算出手段013は算出した量子化インデックスを次階層量子化方法選択手段011へ供給(フィードバック)し、次階層量子化方法選択手段011は、供給(フィードバック)された(上位階層の)量子化インデックスの下位階層の量子化インデックスを選択し、選択した量子化方法の情報を特徴量抽出手段012と量子化インデックス算出手段013に供給する(ステップA05)。そして再度、ステップA02に進む。ステップA04で、算出した量子化インデックスが最下位階層であると判定された場合は、次に、全ての量子化対象領域の処理が終了したか否かを判定する(ステップA06)。全ての量子化対象領域の処理が終了していない場合は、次の量子化対象領域を定め、再度ステップA01に進み、次の量子化対象領域に対して処理を行う。全ての量子化対象領域の処理が終了している場合は、次に、階層的量子化インデックス符号出力手段014は、各量子化対象領域の各階層の量子化インデックスが一意に特定できる符号化形式である階層的量子化インデックス符号を算出し、出力する(ステップA07)。
[第1の実施の形態の効果]
次に、本発明の第1の実施の形態の効果について説明する。
本発明の第1の実施の形態では、画像の同一性の判定能力の尺度である識別能力と頑健性とのバランスを調整することのできる画像特徴量を画像から抽出することができる。その理由は、画像の量子化対象領域ごとに算出された複数の階層の量子化インデックスのうちのどの階層の量子化インデックスを比較に用いるかによって、画像の同一性の判定能力が変わってくるためである。具体的には、より下位の階層の量子化インデックスを比較に用いることによって、画像の同一性の判定能力のうち、異なる画像を識別できる度合いである識別能力を高めることができる。逆に、より上位の階層の量子化インデックスを比較に用いることによって、画像の同一性の判定能力のうち、画像への各種改変処理によって量子化インデックスが変化しない度合いである頑健性を高めることができる。
また、画像特徴量抽出装置01が、階層的な量子化方法に基づいて算出された複数階層の量子化インデックスを画像特徴量として抽出するため、画像特徴量抽出装置01が出力した画像特徴量を比較して同一性尺度を算出する際に、比較の対象とする画像の母集団(比較を行う2つの画像の少なくとも一方が属する母集団)の特性に基づいて、比較に用いる量子化インデックスのセットを適応的に選択することが可能となる、という効果がある。
また、比較の対象とする画像の母集団の特性に基づいて、その母集団に対して、算出される同一性尺度に基づいた画像の同一性の判定の精度が高くなるように、比較に用いる量子化インデックスのセットを適応的に選択することにより、母集団ごとに、算出される同一性尺度に基づいた画像の同一性の判定の精度を最適化できるという効果がある。これにより、算出される同一性尺度に基づいた画像の同一性の判定の精度が、画像の母集団によって大きく低下することがない。
また、画像特徴量抽出装置01が抽出した画像特徴量を用いて、母集団に対して適応的に最適化して同一性尺度を算出することが可能なため、特徴量の抽出方法(すなわち階層的量子化方法)は母集団に依存せず共通にすることができる。このため、母集団ごとに最適な特徴量の抽出方法(すなわち階層的量子化方法)を学習する必要がないという効果がある。またこれにより、画像の特徴量を抽出する時点で、画像の比較が行われる母集団が未定の場合でも、問題がない。
[第2の実施の形態]
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。図3は、第2の実施の形態の構成を示したブロック図である。図3を参照すると、本発明の第2の実施の形態は、画像特徴量抽出装置01と、画像特徴量比較装置02と、から構成されている。第2の実施の形態は、図4に示した本発明の第1の実施の形態にかかる画像特徴量抽出装置01に、画像特徴量比較装置02が追加された構成である。ここで追加された画像特徴量比較装置02は、画像特徴量抽出装置01が抽出した画像特徴量を比較し、画像が同一である度合いを示す同一性尺度を出力する。このように、画像特徴量抽出装置01に画像特徴量比較装置02が加わった構成を、画像同一性尺度算出システムと呼ぶことにする。なお、図5は、第2の実施の形態にかかる画像同一性尺度算出システムにおける画像特徴量比較装置02の具体的な構成を示したブロック図である。
画像特徴量抽出装置01は、第1の実施の形態における画像特徴量抽出装置01と同一であるため、ここでは説明を省略する。
画像特徴量比較装置02は、画像特徴量抽出装置01によって算出される2つの画像の階層的量子化インデックス符号を入力とし、2つの画像の両方あるいは少なくとも一方が属する母集団の特性を示す母集団特性情報に基づいて、比較に用いる量子化インデックスのセットを比較用量子化インデックスセットとして選択し、比較用量子化インデックスセットを用いて2つの画像の階層的量子化インデックス符号を比較し、2つの画像が同一である度合いを示す同一性尺度を算出し、出力する。
ここで母集団とは、入力として階層的量子化インデックス符号が供給される2つの画像の両方あるいは少なくとも一方が属する母集団であれば、どのような母集団であってもよい。母集団は、本発明の画像同一性尺度算出システムを適用する対象としてもよい。これにより、その母集団の画像群に対して、本発明の画像同一性尺度算出システムの効果を得ることができる。例えば、ある画像・動画像の共有サービスにおいて、画像の違法な複製を検知するために、本発明の画像同一性尺度算出システムを適用する場合には、その対象はその画像・動画像の共有サービスのデータベースであるため、母集団をその共有サービスのデータベース(に含まれる画像群)としてもよい。
母集団は、例えば、2つの画像の両方あるいは少なくとも一方が属する分類に含まれる画像群であってもよい。ここで分類とは、何かしら同じ特性を有する画像の集合体のことであり、例えば画像の内容に基づく種別(例えば、自然画像、人工物画像、風景画像、人物画像、花画像、動物画像など)などである。また特に、画像が動画像のフレームとした場合、分類は例えばジャンル(例えば、ニュース、スポーツ、バラエティ、ドラマ、ドキュメンタリーなど)や、放送局、放送時間帯、放送番組などであってもよい。
母集団は、例えば、2つの画像の両方あるいは少なくとも一方が属するデータベースまたはその特定の部分集合に含まれる画像群であってもよい。例えば、画像や動画像の共有サービスにおいて、本発明の画像同一性尺度算出システムを適用する場合は、そのサービスの画像・動画像のデータベースまたはその特定の部分集合に含まれる画像群を母集団としてもよい。この場合、本発明の画像同一性尺度算出システムは、例えば2つの画像の両方がデータベース(母集団)に属する場合は、そのサービスのデータベース内における同一画像の重複を検知するシステムとして機能するし、また例えば2つの画像の一方がデータベース(母集団)に属し、もう一方が外部から与えられるとする場合は、そのサービスのデータベースに対する同一画像のクエリ検索として機能することになる。また例えば、2つの画像の両方あるいは少なくとも一方がインターネット上の画像の場合、インターネット上の画像群またはその部分集合を母集団としてもよい。また例えば、インターネット上の特定のサイトに投稿された画像群を母集団としてもよい。また例えば、2つの画像の両方あるいは少なくとも一方が特定の個人が所有する画像の場合、その特定の個人が所有する画像群またはその部分集合を母集団としてもよい。
また例えば、2つの画像の両方あるいは少なくとも一方が動画像のフレームである場合、2つの画像の両方あるいは少なくとも一方が属する動画像または動画像の部分区間に含まれるフレーム群を母集団としてもよい。例えば、2つの画像がそれぞれ動画像Aと動画像Bに属するフレームである場合、動画像A(または動画像Aの部分区間)と動画像B(または動画像Bの部分区間)の両方あるいは少なくとも一方に含まれるフレーム群を母集団としてもよい。
なおここで、入力として階層的量子化インデックス符号が供給される2つの画像の両方あるいは少なくとも一方が属する母集団とは、必ずしもその画像が1枚の画像として含まれる画像集合体である必要はなく、同じ特性を有する画像集合体であればよい。例えば、入力として階層的量子化インデックス符号が供給される画像の内容に基づく種別が「自然画像」であるとして、「自然画像」の画像群を母集団とする場合、この母集団としての「自然画像」の画像群は、必ずしも入力として階層的量子化インデックス符号が供給される画像を含んでいなくてもよい。また例えば、入力として階層的量子化インデックス符号が供給される画像があるデータベースに属している場合、その画像を含むそのデータベース全体を母集団としてもよいが、例えばその画像を含まないそのデータベースの部分集合を母集団としてもよい。
ここで母集団特性情報とは母集団の特性を示す情報であって、特に、母集団の画像群において、(候補として)選択した量子化インデックスのセットを用いて算出される同一性尺度に基づいた画像の同一性の判定(2つの画像が同一であるか否かの判定)の精度、と相関がある情報である。この情報に基づけば、算出される同一性尺度に基づいた画像の同一性の判定の精度が高くなるように、比較用量子化インデックスセットを選択することができる。なお、算出される同一性尺度に基づいた画像の同一性の判定の精度は、同一性尺度の信頼度と考えることもできる。このため、母集団画像情報は、母集団の画像において、選択した量子化インデックスのセットを用いて算出される同一性尺度の信頼度、と相関がある情報、と考えてもよい。
ここで、選択した量子化インデックスのセットを用いて算出される同一性尺度に基づいた画像の同一性の判定の精度は、(1)選択した量子化インデックスのセットが有する、異なる画像を識別できる度合いである識別能力と、(2)選択した量子化インデックスのセットが有する、画像への各種改変処理によって量子化インデックスが変化しない度合いである頑健性、の2つの尺度で決まる。すなわち、識別能力が高いほど、また頑健性が高いほど、算出される同一性尺度に基づいた画像の同一性の判定の精度は高くなる(なお、識別能力と頑健性はトレードオフの関係にあり、一般的に識別能力が高くなると頑健性は低くなり、頑健性が高くなると識別能力が低くなる)。そこで、母集団特性情報は、母集団の画像群において、選択した量子化インデックスのセットが有する、異なる画像を識別できる度合いである識別能力、と相関がある情報であってもよい。この情報に基づけば、識別能力が高くなるように、比較用量子化インデックスセットを選択することができる。また母集団特性情報は、母集団の画像群において、選択した量子化インデックスのセットが有する、画像への各種改変処理によって量子化インデックスが変化しない度合いである頑健性、と相関がある情報であってもよい。この情報に基づけば、頑健性が高くなるように、比較用量子化インデックスセットを選択することができる。
母集団の画像群において選択した量子化インデックスのセットが有する識別能力、と相関がある情報としては、例えば、母集団の画像群における量子化インデックスごとの出現頻度であってもよい(この場合は、この母集団の画像群における量子化インデックスごとの出現頻度が母集団特性情報となる)。これは一般的に、量子化インデックスのセットに含まれる量子化インデックスの数が同じである場合は、量子化インデックスごとの出現頻度が均等であるほど、識別能力が高くなるからである。この情報に基づけば、量子化インデックスごとの出現頻度が均等に近づくように比較用量子化インデックスセットを選択し、識別能力が高くなるようにできる。また母集団特性情報は、母集団の画像群における量子化インデックスごとの出現頻度でなくても、例えば、母集団の画像群における特定の量子化インデックスへの出現頻度の偏りを示す情報、または間接的にそれが推定できるような情報であってもよい。これは、選択した量子化インデックスのセットに、特定の量子化インデックスへの出現頻度の偏りがある(特定の量子化インデックスの出現頻度が多い)と、その量子化インデックスが要因として識別能力が低くなるからである(これは、出現頻度が高い量子化インデックスは、偶然に異なる画像の間でも共通に出現する確率が高くなり、異なる画像を識別しにくくなるからである)。母集団特性情報は例えば、「母集団の画像群は“空”を含む画像が多い」ことを示す情報などでもよい。これは、この情報に基づき特定の量子化インデックス(この場合、具体的には例えば、色が青であることを示す量子化インデックスなど)への出現頻度の偏りがあると推定でき、その量子化インデックスが要因として識別能力が低くなるからである。なお、母集団特性情報が、母集団の画像群における量子化インデックスごとの出現頻度とする例は、第3の実施の形態にて詳細に説明する。
母集団の画像群において選択した量子化インデックスのセットが有する頑健性、と相関がある情報としては、例えば、母集団の画像群における、量子化インデックスごとの、画像への各種改変処理によって量子化インデックスが変化しない度合いを示す改変不変度、であってもよい(この場合は、この母集団の画像群における、量子化インデックスごとの改変不変度が母集団特性情報となる)。これは、量子化インデックスごとの改変不変度が高いほど、頑健性が高くなるからである。この情報に基づけば、量子化インデックスのセット全体に対する改変不変度が高くなるように比較用量子化インデックスセットを選択し、頑健性が高くなるようにできる。また母集団特性情報は、母集団の画像群における量子化インデックスごとの改変不変度でなくても、例えば、母集団の画像群における特定の量子化インデックスの改変不変度が直接的または間接的に推定できるような情報であってもよい。母集団特性情報は例えば、「母集団の画像群にはグレイスケール画像が多い」ことを示す情報などでもよい。これは、この情報に基づき特定の量子化インデックス(この場合、具体的には例えば、色情報を用いた量子化方法により算出された量子化インデックス)の改変不変度が低いと推定でき、その量子化インデックスが要因として頑健性が低くなるからである。なお、母集団特性情報が、母集団の画像群における量子化インデックスごとの改変不変度とする例は、第5の実施の形態にて詳細に説明する。
また母集団特性情報は、例えば、母集団に画像を加える際に画像に対して変換が施される(例えば画像の圧縮、画像サイズの変換)場合に、母集団に加える前の画像と後の画像の両方の画像が入手可能な場合には、それらの画像を用いて学習し、得られた情報であってもよい。例えば、母集団がインターネット上のある投稿サイトの場合に、投稿前の画像と、投稿して画像が変換された後の画像とを比較し、得られる改変の種別や度合いを示す情報や量子化インデックスごとの改変不変度などであってもよい。
図5を参照すると、画像特徴量比較装置02は、比較用量子化インデックスセット選択部021、比較用量子化インデックス取得手段022と、量子化インデックス比較手段023と、から構成されている。
比較用量子化インデックスセット選択部021は、入力される母集団特性情報に基づいて、比較に用いる量子化インデックスのセットを比較用量子化インデックスセットとして選択する。選択した比較用量子化インデックスセットの情報を、比較用量子化インデックス取得手段022へ供給する。
ここで、比較用量子化インデックスセット選択部021が選択する比較用量子化インデックスセットの選択に関する条件を説明する。選択される比較用量子化インデックスセットは、各量子化対象領域が、一意に量子化インデックスに分類されるような、量子化インデックスのセットである必要がある。すなわち、階層的量子化方法のある量子化インデックスを選択した場合は、その量子化インデックスに対応する、それより上位階層の量子化インデックス(先祖のノード)や、それより下位階層の量子化インデックス(子孫のノード)を選択してはならない。また、階層的量子化方法においてある量子化インデックスの下位階層に(または最上位階層に)異なる複数の量子化方法が並列に存在する場合は、この並列に存在する量子化方法により算出される量子化インデックスを同時に選択してはならない。図6を例に説明すると、例えば比較用量子化インデックスセットを、{1、2、3、4、5}や、{6、7、2、3、16、17、30、31、19、20、21}や、{22、23、7、8、9、26、27、3、16、17、30、36、37、19、20、21}や、{22、23、34、35、8、9、26、27、11、12、28、29、14、15、30、36、37、32、33、20、21}など、と選択すると一意に量子化インデックスに分類されるので、適切である。例えば、量子化インデックス24とそれに対応する上位階層の量子化インデックスである量子化インデックス7を同時に選択したり、量子化インデックス24とそれに対応する2階層上位の階層の量子化インデックスである量子化インデックス1を同時に選択することはできない。また例えば、量子化インデックス7とそれに対応する下位階層の量子化インデックスである量子化インデックス24や25を同時に選択したり、量子化インデックス7とそれに対応する2階層下位の階層の量子化インデックスである量子化インデックス34や35を同時に選択することはできない。また選択される比較用量子化インデックスセットは、各量子化対象領域が、未分類がないようにいずれかの量子化インデックスに分類されるような、量子化インデックスのセットであることが望ましいが、必ずしもそうでなくてもよい。図6を例に説明すると、例えば比較用量子化インデックスセットを、{1、2、3、4、5}や、{6、7、2、3、16、17、30、31、19、20、21}や、{22、23、7、8、9、26、27、3、16、17、30、36、37、19、20、21}や、{22、23、34、35、8、9、26、27、11、12、28、29、14、15、30、36、37、32、33、20、21}など、と選択すると、未分類がなくいずれかの量子化インデックスに分類されるので、望ましい。一方例えば、比較用量子化インデックスセットを、{1、2、3、4}と選択すると、量子化インデックス5とそれに対応する下位階層の量子化インデックスに分類されるサンプルが未分類となり、望ましくはないがそのように選択しても構わない。
比較用量子化インデックスセット選択部021は、母集団特性情報に基づいて比較用量子化インデックスセットを選択する。例えば母集団特性情報が、母集団の画像群において、選択した量子化インデックスのセットを用いて算出される同一性尺度に基づいた画像の同一性の判定の精度と相関がある情報である場合、この情報に基づいて、算出される同一性尺度に基づいた画像の同一性の判定の精度が高くなるように、比較用量子化インデックスセットを選択してもよい。また例えば母集団特性情報が、母集団の画像群において、選択した量子化インデックスのセットが有する、異なる画像を識別できる度合いである識別能力、と相関がある情報である場合、この情報に基づいて、識別能力が高くなるように、比較用量子化インデックスセットを選択してもよい。識別能力を高くするためには、例えば、より下位階層の量子化インデックスを選択してもよい。例えば、母集団特性情報が、母集団の画像群における特定の量子化インデックスへの出現頻度の偏りを示す情報(特定の量子化インデックスの出現頻度が高いことを示す情報)、または間接的にそれが推定できるような情報(例えば「母集団の画像群は“空”を含む画像が多い」ことを示す情報)である場合、識別能力を高くするために、その特定の量子化インデックス(母集団特性情報が「母集団の画像群は“空”を含む画像が多い」ことを示す情報である場合には、典型的な空領域に対する量子化インデックス、例えば色が青であること示す量子化インデックス、が特定の量子化インデックスとなる)に対する下位階層の量子化方法で算出される量子化インデックスを選択するようにして、比較用量子化インデックスセットを選択してもよい(出現頻度が高い量子化インデックスは、異なる画像の間でも共通に出現する確率が高くなり、異なる画像を識別しにくくなるため識別能力を低くする要因となる。そこでその量子化インデックスに対する下位階層の量子化インデックスを選択することで、出現頻度を分割して出現頻度の偏りを抑えることができ、識別能力を高くすることができる)。図6を例に説明すると、例えば、まず最上位階層の量子化インデックスのセット{1、2、3、4、5}を候補としたときに、母集団特性情報に基づいて、母集団の画像群において量子化インデックス3の出現頻度が高いと推定される場合に、識別能力を上げるために、量子化インデックス3に対する下位階層の量子化方法で算出される量子化インデックスである量子化インデックス11、12を選択し、比較用量子化インデックスセットを{1、2、11、12、4、5}としてもよい。なお、母集団特性情報が、母集団の画像群における量子化インデックスごとの出現頻度である場合については、第3の実施の形態にて詳細に説明する。また例えば母集団特性情報が、母集団の画像群において、選択した量子化インデックスのセットが有する、画像への各種改変処理によって量子化インデックスが変化しない度合いである頑健性、と相関がある情報である場合、この情報に基づいて、頑健性が高くなるように、比較用量子化インデックスセットを選択してもよい。頑健性を高くするためには、例えばより上位階層の量子化インデックスを選択してもよい。例えば、母集団特性情報が、母集団の画像群における特定の量子化インデックスの改変不変度が推定できるような情報(例えば「母集団の画像群にはグレイスケール画像が多い」ことを示す情報)である場合、頑健性を高くするために、その特定の量子化インデックス(母集団特性情報が「母集団の画像群にはグレイスケール画像が多い」ことを示す情報である場合には、色情報を用いた量子化方法により算出された量子化インデックスが特定のインデックスとなる)に対する上位階層の量子化インデックスを選択するようにして、比較用量子化インデックスセットを選択してもよい(上位階層の量子化インデックスを選択することで、同一階層の複数の量子化インデックスが統合され、その複数の量子化インデックスをまたいだ量子化インデックスの変化がなくなるため、頑健性が高くなる)。なお、母集団特性情報が、母集団の画像群における量子化インデックスごとの改変不変度である場合については、第5の実施の形態にて詳細に説明する。
また比較用量子化インデックスセット選択部021は、母集団特性情報として、母集団の画像群において、選択した量子化インデックスのセットが有する識別能力と相関がある情報と、頑健性と相関がある情報の両方が入力された場合、その両方を考慮して、比較用量子化インデックスセットを選択してもよい。識別能力と頑健性はトレードオフの関係にあるため(一般的に識別能力が高くなると頑健性は低くなり、頑健性が高くなると識別能力が低くなる)、例えば識別能力と頑健性の各々がある一定の基準に近くづくように比較用量子化インデックスセットを選択してもよいし、また例えば識別能力と頑健性の一方が一定の基準を満たす中で、もう一方が高くなるように比較用量子化インデックスセットを選択してもよいし、また例えば識別能力と頑健性のそれぞれを数値化して融合した尺度に基づいて比較用量子化インデックスセットを選択してもよい。
また比較用量子化インデックスセット選択部021は、母集団特性情報に加えて、母集団に依存しなく識別能力や頑健性と相関がある情報を考慮して、比較用量子化インデックスセットを選択してもよい。このような情報としては、例えば、選択した量子化インデックスのセットに含まれる量子化インデックスの数(一般的に量子化インデックスの数が多いほど識別能力は高くなり、頑健性は低くなる)、選択した量子化インデックスのセットの階層の深さ、などが挙げられる。例えば、量子化インデックスの数を一定の基準を満たす(例えば量子化インデックスの数を10程度など)量子化インデックスのセットの中から、母集団特性情報に基づいて識別能力や頑健性が高くなるように比較用量子化インデックスセットを選択してもよい。
また比較用量子化インデックスセット選択部021は、候補となる全ての組み合わせの量子化インデックスのセットの中から、母集団特性情報を用いて判断される上述のいずれかの基準に基づいて、最適な量子化インデックスのセットを、比較用量子化インデックスセットとして選択してもよい。
また比較用量子化インデックスセット選択部021は、例えば、階層的量子化方法の上位階層の量子化インデックスを、下位階層の量子化インデックスよりも優先的に選択するようにして、比較用量子化インデックスセットを選択してもよい。また比較用量子化インデックスセット選択部021は、例えば、階層的量子化方法の最上位階層から順に量子化インデックスのセットを候補として選択し、母集団特性情報に基づいて規定の基準(例えば上述のいずれかの基準)を満たす量子化インデックスのセットが出現するまで、下位階層の量子化インデックスを候補として選択していき、比較用量子化インデックスを選択してもよい。例えば、母集団特性情報に基づいて判定される識別能力が規定の基準を満たさない場合に、下位階層の量子化インデックスを候補として選択していき、比較用量子化インデックスを選択してもよい。このとき下位階層の量子化インデックスを選択する際に、上述の、母集団の画像群における特定の量子化インデックスへの出現頻度の偏りを示す情報に基づき、その特定の量子化インデックスに対する下位階層の量子化方法で算出される量子化インデックスを選択するようにしてもよい。図6を例に説明すると、例えば、まず最上位階層の量子化インデックスのセット{1、2、3、4、5}を候補として選択し、このセットが母集団特性情報に基づいて判定される識別能力が規定の基準を満たさない場合に、下位階層の量子化インデックスを候補として選択してもよい。このとき、母集団特性情報に基づいて、母集団の画像群において量子化インデックス3の出現頻度が高いと推定される場合に、量子化インデックス3に対する下位階層の量子化方法で算出される量子化インデックスである量子化インデックス11、12を選択し、量子化インデックスのセット{1、2、11、12、4、5}を候補としてもよい。このような操作を、母集団特性情報に基づいて判定される識別能力が規定の基準を満たすまで再帰的に繰返し、比較用量子化インデックスセットを選択してもよい。また例えば、下位階層の量子化インデックスを選択するか否かを判断する際に、母集団特性情報に基づいて判定される頑健性が規定の基準を満たさない場合は、下位階層の量子化インデックスを選択しないようにして、比較用量子化インデックスを選択してもよい。
なお、比較用量子化インデックスセット選択部021のより具体的な例は、第3の実施の形態、第4の実施の形態、第5の実施の形態、および第6の実施の形態にて詳細に説明する。
なお、比較用量子化インデックスセット選択部021は、画像特徴量比較装置02に2つの画像の階層的量子化インデックス符号が入力されるタイミングで処理を行うのではなく、あらかじめ本発明の同一性尺度算出システムを適用する母集団に対して処理を行っておくことが望ましい。ある母集団に対して、比較用量子化インデックスセット選択部021は、一度だけ処理を行うことが望ましく(なお、母集団の更新によって、定期的に処理を行うことは有効である)、2つの画像の階層的量子化インデックスが新たに入力される度に処理を行う必要はない。こうすることにより、画像特徴量比較装置02は、同じ母集団に属する大量の画像の階層的量子化インデックス符号が連続して入力された場合に(すなわち、同じ母集団に属する大量の画像に対して、同一性尺度の算出を行っていく場合に)、効率的かつ高速に、同一性尺度の算出を行うことができる。
比較用量子化インデックス取得手段022は、画像特徴量抽出装置01によって算出される2つの画像(画像1と画像2)の各々の階層的量子化インデックス符号を入力とし、各々の画像に対して、量子化対象領域ごとに、階層的量子化インデックス符号が一意に特定する各階層の量子化インデックスの中から、比較用量子化インデックスセット選択部021から供給される比較用量子化インデックスセットの情報が示す比較用量子化インデックスセットに含まれる量子化インデックスを取得する。各々の画像に対して取得した量子化対象領域ごとの量子化インデックスを、比較用量子化インデックスとして量子化インデックス比較手段023へ供給する。比較用量子化インデックスセットに含まれる量子化インデックスを取得する場合に、階層的量子化インデックス符号が、最下位階層の量子化インデックスのみを符号化したものである場合は、階層的量子化方法に従って最下位階層の量子化インデックスから、それより上位階層の量子化インデックスを求め、その各階層の量子化インデックスの中から、比較用量子化インデックスセットに含まれる量子化インデックスを取得すればよい。図6を例に説明すると、例えば比較用量子化インデックスセットが{6、7、2、3、16、17、30、31、19、20、21}であるとする。ここで、(階層的量子化インデックス符号から)ある量子化対象領域の最下位階層の量子化インデックスが34である場合、階層的量子化方法に従って各階層の量子化インデックスが上位階層順に1、7、24、34と求めることができる。この中で量子化インデックス7が、比較用量子化インデックスに含まれるため、量子化インデックス7をその量子化対象領域の比較用量子化インデックスとして取得する。また、ある量子化対象領域の最下位階層の量子化インデックスが27である場合、階層的量子化方法に従って各階層の量子化インデックスが上階層順に2、10、27と求めることができる。この中で量子化インデックス2が、比較用量子化インデックスに含まれるため、量子化インデックス2をその量子化対象領域の比較用量子化インデックスとして取得する。また、階層的量子化方法において、ある量子化インデックスの下位階層に(または最上位階層に)異なる複数の量子化方法が並列に存在する場合に伴って、階層的量子化インデックス符号が、1つの量子化対象領域に対して複数の階層的量子化のパスを含む場合は、それぞれの階層的量子化のパスの各階層の量子化インデックスの中から、比較用量子化インデックスセットに含まれる量子化インデックスを取得する。図6を例に説明すると、例えば比較用量子化インデックスセットが{6、7、2、3、16、17、30、31、19、20、21}であるとする。ここで例えば、(階層的量子化インデックス符号から)ある量子化対象領域の最下位層の量子化インデックスが29と17の2つである場合、前者の各階層の量子化インデックスが上位階層順に4、13、29であり、後者の各階層の量子化インデックスが上位階層順に4、17と、それぞれ求めることができる(量子化インデックス4は共通)。これらの中で、量子化インデックス17が、比較用量子化インデックスに含まれるため、量子化インデックス17をその量子化対象領域の比較用量子化インデックスとして取得する。なお、比較用量子化インデックスセット選択部021から供給される比較用量子化インデックスセットが、未分類が存在するようなセットである場合は、比較用量子化インデックスが未分類(不定)となる量子化対象領域が発生することになる。図6を例に説明すると、例えば比較用量子化インデックスセットが{1、2、3、4}であるとした場合、ある量子化対象領域の最下位階層の量子化インデックスが32である場合、階層的量子化方法に従って各階層の量子化インデックスが上位階層順に5、19、32と求まるが、この中のいずれも比較用量子化インデックスセットに含まれないため、その量子化対象領域の比較用量子化インデックスは未分類(不定)となる。
なお、比較用量子化インデックス取得手段022は、階層的量子化インデックス符号が入力される2つの画像(画像1と画像2)のうち、母集団に属する方の画像に関しては、同一性尺度の算出を行う直前に、比較用量子化インデックスを取得するのではなく、比較用量子化インデックスセットの情報が用意された段階で、あらかじめ比較用量子化インデックスを取得しておくのが望ましい。すなわち、母集団の画像群に対しては、あらかじめ比較用量子化インデックスを取得しておくことが望ましい。こうすることにより、画像特徴量比較装置02は、効率的かつ高速に、同一性尺度の算出を行うことができる。またこうすることにより、同一の画像に対して繰り返し同一性尺度の算出を行う場合に、毎回比較用量子化インデックスを取得する必要がなくなる。例えば、あるデータベースを母集団として、2つの画像の一方がデータベースに属し、もう一方の画像がクエリとして外部から与えられる場合に、データベースに属する画像に関しては、あらかじめ比較用量子化インデックスを取得しておくことで、外部からクエリが与えられる度に比較用量子化インデックスを取得する必要がなくなるため、高速に同一性尺度の算出を行うことができる。また例えば、あるデータベースを母集団として、2つの画像の両方がデータベースに属し、データベース内における全ての画像対に対する同一性尺度の算出を行う場合には、データベースに属する全ての画像に対してあらかじめ比較用量子化インデックスを取得しておくことで、画像対ごとの同一性尺度算出の度に比較用量子インデックスを取得する必要がなくなるため、同一性尺度の算出の速度を大幅に高速化することができる。
量子化インデックス比較手段023は、比較用量子化インデックス取得手段022から供給される2つの画像(画像1と画像2)の比較用量子化インデックスを、対応する量子化対象領域ごとに比較し、量子化インデックスが一致する量子化対象領域の数に基づいて、2つの画像が同一である度合いを示す同一性尺度を算出し、出力する。同一性尺度は、例えば量子化インデックスが一致する量子化対象領域の数としてもよい。また同一性尺度は、例えば量子化インデックスが一致しない量子化対象領域の数(ハミング距離)に基づいて算出してもよい。また同一性尺度は、例えば、量子化インデックスごとに、一致する量子化対象領域の数を求め、それらに量子化インデックスごとにあらかじめ定められた重み値を作用させて加算した値としてもよい。また同一性尺度は、例えば、量子化対象領域ごとに量子化インデックスが一致するか否かを求めて数値化し(例えば一致する場合は1、一致しない場合は0)、量子化対象領域ごとにあらかじめ定められた重み値(例えば量子化対象領域が画像の局所領域であるとした場合に、局所領域が画像の中心に近いほど重み値を大きくするなど)を作用させて加算した値としてもよい。なお、対応する量子化対象領域ごとに比較を行う際に、ある量子化対象領域において、2つの画像の比較用量子化インデックスの両方あるいは少なくとも一方が未定(不定)である場合は、その量子化対象領域は同一性尺度の算出に寄与しないようにしてもよい。
なお、これまで説明した、階層的量子化方法、母集団特性情報、および比較用量子化インデックスセット選択部021が選択する比較用量子化インデックスセットは、全ての量子化対象領域に対して共通であることが望ましいが、量子化対象領域ごと、または複数の量子化対象領域のグループごとに(量子化対象領域が画像の複数の局所領域である場合、例えば画像の左上領域に属する局所領域のグループ、右上領域に属する局所領域のグループ、左下領域に属する局所領域のグループ、右下領域に属する局所領域のグループなど)、異なってもよい。すなわち、例えば、階層的量子化方法が、量子化対象領域ごとに、または複数の量子化対象領域のグループごとに、異なってもよい。また例えば、入力として供給される母集団特性情報が、量子化対象領域ごとに、または複数の量子化対象領域のグループごとに、異なってもよい。また例えば、比較用量子化インデックスセット選択部021は、量子化対象領域ごとに、または複数の量子化対象領域のグループごとに、選択する比較用量子化インデックスセットが異なってもよい。このように、量子化対象領域ごとに、または複数の量子化対象領域のグループごとに、階層的量子化方法、母集団特性情報、または比較用量子化インデックスセット選択部021が選択する比較用量子化インデックスセットを、異なるようにすることによって、量子化対象領域ごと、または複数の量子化対象領域のグループごと、の特性に適合した最適化を行うことができる。例えば、量子化対象領域を画像の複数の局所領域とした場合に、画像の中央領域が前景オブジェクトである可能性が高く、画像の周辺領域が背景である可能性が高いとすると、この特性を利用して、例えば画像の中央領域に属する局所領域は前景オブジェクトを記述するのに適した量子化方法(例えばエッジ情報を特徴量として用いた量子化方法)から構成される階層的量子化方法を用い、画像の周辺領域に属する局所領域は背景を記述するのに適した量子化方法(例えば色情報を特徴量として用いて量子化方法)から構成される階層的量子化方法を用いてもよい。
[動作の説明]
次に、図8のフローチャートを利用して、第2の実施の形態の動作を説明する。
第2の実施の形態における画像特徴量抽出装置01の動作は、第1の実施の形態における画像特徴量抽出装置01の動作と同一であるため、ここでは説明を省略する。
第2の実施の形態における画像特徴量比較装置02の動作を説明する。図8は、第2の実施の形態における画像特徴量比較装置02の動作を示すフローチャートである。
まず、比較用量子化インデックスセット選択部021は、入力される母集団特性情報に基づいて、比較用量子化インデックスセットを選択し、選択した比較用量子化インデックスセットの情報を比較用量子化インデックス取得手段022へ供給する(ステップB01)。なおステップB01は、画像特徴量比較装置02に2つの画像の階層的量子化インデックス符号が入力されるタイミングで処理されるのではなく、あらかじめ本発明の同一性尺度算出システムを適用する母集団に対して処理しておくほうが望ましい。次に、比較用量子化インデックス取得手段022は、入力される2つの画像の各々の階層的量子化インデックス符号から、比較用量子化インデックスセット選択部021から供給される比較用量子化インデックスセットの情報に基づき、各々の画像に対して比較用量子化インデックスを取得し、取得した比較用量子化インデックスを量子化インデックス比較手段023へ供給する(ステップB02)。次に、量子化インデックス比較手段023は、比較用量子化インデックス取得手段022から供給される2つの画像の比較用量子化インデックスを比較し、同一性尺度を算出し、出力する(ステップB03)。
[第2の実施の形態の効果]
次に、本発明の第2の実施の形態の効果について説明する。
本発明の第2の実施の形態では、階層的な量子化方法に基づいて算出された複数階層の量子化インデックスを特徴量とし、画像特徴量比較装置02が同一性尺度の算出を行う2つの画像の少なくとも一方が属する母集団の特性情報に基づいて、比較に用いる量子化インデックスのセットを選択し、それに基づき同一性尺度を算出することにより、比較する画像の母集団に適応的に最適化できるという効果がある。
また、母集団特性情報が、母集団の画像群において、選択した量子化インデックスのセットを用いて算出される同一性尺度に基づいた画像の同一性の判定の精度と相関がある情報とすると、それに基づいて、比較用量子化インデックスセット選択部021が算出される同一性尺度に基づいた画像の同一性の判定の精度が高くなるように比較用量子化インデックスセットを選択することにより、母集団ごとに、算出される同一性尺度に基づいた画像の同一性の判定の精度を最適化できるという効果がある。これにより、算出される同一性尺度に基づいた画像の同一性の判定の精度が、画像の母集団によって大きく低下することがない。
また、画像特徴量抽出装置01が抽出した特徴量を用いて、画像特徴量比較装置02が母集団に対して適応的に最適化して同一性尺度を算出することにより、特徴量の抽出方法(すなわち階層的量子化方法)は母集団に依存せず共通にすることができる。このため、母集団ごとに最適な特徴量の抽出方法(すなわち階層的量子化方法)を学習する必要がないという効果がある。またこれにより、画像の特徴量を抽出する時点で、画像の比較が行われる母集団が未定の場合でも、問題がない。
[第3の実施の形態]
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。第3の実施の形態は、第2の実施の形態における画像特徴量比較装置02において、入力される母集団特性情報と、比較用量子化インデックスセット選択部021がより具体的になったものである。第3の実施の形態における画像特徴量抽出装置は、図4に示した第1の実施の形態の画像特徴量抽出装置01と同じである。図9は、第3の実施の形態にかかる画像同一性尺度算出システムの画像特徴量比較装置の構成を示したブロック図である。図9を参照すると、本発明の第3の実施の形態は、図4と図5に示された第2の実施の形態の構成に、母集団量子化インデックス出現頻度算出手段03が加わり、さらに比較用量子化インデックスセット選択部021が比較用量子化インデックスセット選択部021Aに置き換わる点で異なる。なお、それ以外の点については第2の実施の形態と同じであるため、ここでは第2の実施の形態とは異なる点のみを説明する。
母集団量子化インデックス出現頻度算出手段03は、画像特徴量抽出装置01によって算出される母集団の画像群の階層的量子化インデックス符号を入力とし、母集団の画像群における、階層的量子化方法の各量子化インデックスの出現頻度を算出し、算出した母集団における量子化インデックスごとの出現頻度を母集団量子化インデックス出現頻度として比較用量子化インデックスセット選択部021Aへ供給する。ここで、母集団の画像群は、母集団に含まれる全ての画像でもよいし、母集団の特性を反映していれば、適当にサンプリングして抽出される画像群のみであってもよい。母集団量子化インデックス出現頻度算出手段03は、入力された母集団の画像群の階層的量子化インデックス符号のそれぞれが一意に特定する各階層の量子化インデックスから、階層的量子化方法の全ての量子化インデックスに対して出現頻度を算出する。図6を例に説明すると、母集団量子化インデックス出現頻度算出手段03は、量子化インデックス1から37の全ての量子化インデックスの出現頻度を算出する。階層的量子化インデックス符号が、最下位階層の量子化インデックスを符号化したものである場合は、階層的量子化方法に従って最下位階層の量子化インデックスから、それより上位階層の量子化インデックスを求め、出現頻度の算出に加える。図6を例に説明すると、例えば母集団の画像群の階層的量子化インデックス符号から、ある画像のある量子化対象領域の最下位階層の量子化インデックスが34である場合、量子化インデックス1、7、24、34のそれぞれに対して、出現頻度が1回分加算されることになる。このため、ある量子化インデックスの出現頻度は、その1つ下位の階層の全ての量子化インデックスの出現頻度の合計となる。例えば、量子化インデックス24の出現頻度は量子化インデックス34と35の出現頻度の合計となり、量子化インデックス7の出現頻度は量子化インデックス24と25の合計となり、量子化インデックス1の出現頻度は、量子化インデックス6と7の合計となる。
なお、母集団量子化インデックス出現頻度算出手段03が出力する量子化インデックスごとの出現頻度は、厳密に出現頻度そのものではなくても、例えば、出現確率などであってもよい。なお、量子化インデックスごとの出現確率は、上記の方法で集計した量子化インデックスごとの出現頻度のそれぞれを、全ての量子化対象領域の数で割った値となる。
比較用量子化インデックスセット選択部021Aは、母集団量子化インデックス出現頻度算出手段03から供給される母集団量子化インデックス出現頻度に基づいて、量子化インデックスの出現頻度が均等に近づくように比較用量子化インデックスセットを選択する。選択した比較用量子化インデックスセットの情報を、比較用量子化インデックス取得手段022へ供給する。比較用量子化インデックスセット選択部021Aは、第2の実施の形態の比較用量子化インデックスセット選択部021が、入力される母集団特性情報が具体的に母集団量子化インデックス出現頻度である場合の一形態であり、その比較用量子化インデックスセットの選択に関する条件などは第2の実施の形態での説明に準じる。
比較用量子化インデックスセット選択部021Aは、量子化インデックスの出現頻度が均等に近づくように比較用量子化インデックスを選択することにより、異なる画像を識別できる度合いである識別能力を高くすることができる。これは、量子化インデックスのセットに含まれる量子化インデックスの数が同じ場合、特定の量子化インデックスに偏りがあると(特定の量子化インデックスの出現頻度が多くなると)、その出現頻度の高い量子化インデックスが、偶然に異なる画像の間でも共通に出現する確率が高くなり、識別能力が低くなるためである。
比較用量子化インデックスセット選択部021Aは、母集団量子化インデックス出現頻度に基づいて、量子化インデックスの出現頻度が均等に近づくように比較用量子化インデックスを選択する方法として、例えば、候補として選択した量子化インデックスのセットにおいて、量子化インデックスの出現頻度が均等である度合いを示す出現頻度均等度合いを算出し、出現頻度均等度合いに基づいて出現頻度均等度合いが高くなるような量子化インデックスのセットを、比較用量子化インデックスセットとして選択してもよい。比較用量子化インデックスセット選択部021Aは、例えば、候補となる全ての組み合わせの量子化インデックスのセットのそれぞれに対して、出現頻度均等度合いを算出し、出現頻度均等度合いが最大となる量子化インデックスのセットを、比較用量子化インデックスセットとして選択してもよい。
出現頻度均等度合いは、例えば、量子化インデックスの出現頻度(あるいは出現確率)の分散に基づいて算出してもよい。例えば候補として選択した量子化インデックスのセットの集合をSと表し、候補として選択した量子化インデックスのセットに含まれる量子化インデックスの数(すなわち集合の要素数)をNと表し、ある量子化インデックスをiと表し、量子化インデックスiの出現頻度をFiと表すと、量子化インデックスの出現頻度の分散Vは、次式で計算できる。ただし、Faは、出現頻度の平均値である。
V=1/N{Σj∈S(Fa-Fi)2} …(式1)
ここで、式1で計算される量子化インデックスの出現頻度の分散Vが小さいほど、出現頻度均等度合いは高くなる。このため、出現頻度均等度合いは、出現頻度の分散Vが小さいほど、出現頻度均等度合いが高くなるように算出されれば、どのような算出方法であってもよい(すなわち、出現頻度の分散Vに対して、単調減少な関数に基づいて算出される方法であればよい)。例えば、出現頻度均等度合いは、出現頻度の分散Vの逆数として算出してもよい。
また出現頻度均等度合いは、例えば、母集団量子化インデックス出現頻度に基づいて、量子化インデックスの出現頻度(あるいは出現確率)と、量子化インデックスの出現頻度の平均値(あるいは出現確率の平均値)との差分が、ある規定の値以下である量子化インデックスの数(すなわち、平均値から離れている量子化インデックスの数)、あるいはその割合、に基づいて算出してもよい。この場合、規定の値以下である量子化インデックスの数が大きいほど、出現頻度均等度合いが高くなる。ここで、出現頻度均等度合いは、規定の値以下である量子化インデックスの数が大きいほど、出現頻度均等度合いが高くなるように算出されれば、どのような算出方法であってもよい(すなわち、この数に対して、単調増加な関数に基づいて算出される方法であればよい)。例えば、規定の値以下である量子化インデックスの数そのものを、出現頻度均等度合いとしてもよい。
また出現頻度均等度合いは、例えば、母集団量子化インデックス出現頻度に基づいて算出される、情報エントロピー(平均情報量)に基づいて算出してもよい。例えば、量子化インデックスiの出現確率をPiと表すと、情報エントロピーHは、次式で計算できる。
H=−Σj∈S Pi
log(Pi) …(式2)
ここで、式2で計算される情報エントロピーHが大きいほど、出現頻度均等度合いは高くなる。ここで、出現頻度均等度合いは、情報エントロピーHが大きいほど、出現頻度均等度合いが高くなるように算出されれば、どのような算出方法であってもよい(すなわち、情報エントロピーHに対して、単調増加な関数に基づいて算出される方法であればよい)。例えば、情報エントロピーHそのものを、出現頻度均等度合いとしてもよい。
これらの方法は、出現頻度均等度合いを算出する一例であり、出現頻度均等度合いを算出する方法は、量子化インデックスの出現頻度が均等である度合いを示す尺度を算出する方法であれば、どのような方法であってもよい。
また比較用量子化インデックスセット選択部021Aは、上述の出現頻度均等度合いに加えて、例えば、候補として選択した量子化インデックスのセットに含まれる量子化インデックスの数(あるいは選択した量子化インデックスのセットの階層の深さ)などを共に考慮して、比較用量子化インデックスセットを選択してもよい。これは、量子化インデックスの数(あるいは階層の深さ)は、量子化インデックスの出現頻度の均等度合いとは独立した情報として、また母集団に依存しない情報として、量子化インデックスのセットの量子化インデックスの数が多くなるほど(あるいは階層が深くなるほど)、異なる画像を識別できる度合いである識別能力は高くなるものの、画像への各種改変処理によって量子化インデックスが変化しない度合いである頑健性は低くなるためであり、量子化インデックスの出現頻度の均等度合いと量子化インデックスの数(あるいは階層の深さ)の双方を考慮して、比較用量子化インデックスセットを選択したほうが良い場合があるからである。例えば、あらかじめ識別能力と頑健性の観点から、適切な量子化インデックスの数の範囲(例えば量子化インデックスの数を10程度とするなど)を設定し、その条件を満たす量子化インデックスのセットの中から、上述の出現頻度均等度合いを算出する方法を用いて算出される出現頻度均等度合いが高くなるようなセットを、比較用量子化インデックスセットとして選択してもよい。
また比較用量子化インデックスセット選択部021Aは、上述の出現頻度均等度合いに加えて、例えば、量子化インデックスごとの、画像への各種改変処理によって量子化インデックスが変化しない度合いを示す改変不変度、を共に考慮して、比較用量子化インデックスセットを選択してもよい。量子化インデックスごとの改変不変度は、例えば、あらかじめ、学習用の画像群に対して各種改変処理を施して複製画像を作成し、元画像と複製画像から画像特徴量抽出装置01を用いて階層的量子化インデックス符号を算出し、対応する量子化対象領域において量子化インデックスが一致する割合を、量子化インデックスごとに測定して求めることができる。比較用量子化インデックスセット選択部021Aは、例えば、出現頻度均等度合いが高くなり、かつ、量子化インデックスごとの改変不変度から算出される量子化インデックスのセット全体の改変不変度(例えば量子化インデックスごとの改変不変度の平均値)が大きくなるような量子化インデックスのセットを、比較用量子化インデックスセットとして選択してもよい。また例えば比較用量子化インデックスセット選択部021Aは、例えば、出現頻度均等度合いが高くなり、かつ、量子化インデックスごとの改変不変度が低い量子化インデックスが含まれないように、比較用量子化インデックスセットを選択してもよい。なお、母集団の画像群における、量子化インデックスごとの改変不変度を母集団特性情報として用いる例は、第5の実施の形態にて詳細に説明する。
また比較用量子化インデックスセット選択部021Aは、母集団量子化インデックス出現頻度に基づいて、量子化インデックスの出現頻度が均等に近づくように比較用量子化インデックスを選択する方法として、例えば、ある候補として選択した量子化インデックスのセットにおいて、特定の量子化インデックスの出現頻度が高い場合に(出現頻度が特定の量子化インデックスに偏っている場合に)、その量子化インデックスに対しては、下位階層の量子化インデックスを選択するようにしてもよい。図6を例に説明すると、例えば、まず最上位階層の量子化インデックスのセット{1、2、3、4、5}を候補としたときに、母集団量子化インデックス出現頻度に基づいて、量子化インデックス3の出現頻度が他の量子化インデックスの頻度よりも高い場合に、量子化インデックス3に対する下位階層の量子化方法で算出される量子化インデックスである量子化インデックス11、12を選択し、比較用量子化インデックスセットを{1、2、11、12、4、5}としてもよい。
<比較用量子化インデックスセット選択部021Aの構成例1>
また、比較用量子化インデックスセット選択部021Aは、母集団量子化インデックス出現頻度算出手段03から供給される母集団量子化インデックス出現頻度に基づき、階層的量子化方法の最上位階層の量子化インデックスのセットから順に、規定の条件を満たすまで、出現頻度の高い量子化インデックスに対してその下位階層の量子化インデックスのセットを選択していき(その量子化インデックスをその下位階層の量子化インデックスのセットと置き換える)、比較用量子化インデックスセットを選択してもよい。ここで規定の条件は、例えば、上述した、量子化インデックスのセットの出現頻度均等度合い、量子化インデックスのセットに含まれる量子化インデックスの数(あるいは階層の深さ)や、セット全体の改変不変度や、それらの組み合わせが、あらかじめ規定した値の範囲内であるか否か、などであってもよい。また例えば、上述した、量子化インデックスのセットの出現頻度均等度合い、量子化インデックスのセットに含まれる量子化インデックスの数(あるいは階層の深さ)や、セット全体の改変不変度や、さらに量子化インデックスごとの出現頻度や、量子化インデックスごとの改変不変度や、その組み合わせに基づいたものであってもよい。例えば、出現頻度均等度合いの最小値を設定し、最上位階層の量子化インデックスのセットから順に、出現頻度均等度合いの最小値を超える量子化インデックスのセットが現れるまで、出現頻度の高い量子化インデックスに対してその下位階層の量子化インデックスのセットを選択していき、比較用量子化インデックスセットを選択してもよい。また例えば、量子化インデックスの数の最小値を設定し、最上位階層の量子化インデックスのセットから順に、量子化インデックスの数の最小値を超える量子化インデックスのセットが現れるまで、出現頻度の高い量子化インデックスに対してその下位階層の量子化インデックスのセットを選択していき、比較用量子化インデックスセットを選択してもよい。また例えば、出現頻度均等度合いの最小値と、量子化インデックスの数の最小値の2つを設定し、最上位階層の量子化インデックスのセットから順に、各々の最小値を超える量子化インデックスのセットが現れるまで、出現頻度の高い量子化インデックスに対してその下位階層の量子化インデックスのセットを選択していき、比較用量子化インデックスセットを選択してもよい。また出現頻度の高い量子化インデックスは、例えば、現在候補となっている量子化インデックスのセットの中から最も出現頻度の高い量子化インデックスとしてもよい。なお、例えば現在候補となる量子化インデックスのセットが規定の条件を満たしていない段階で、その量子化インデックスのセットの中の最も出現頻度の高い量子化インデックスが、最下位階層の量子化インデックスである場合は、例えば、2番目に出現頻度の高い量子化インデックスに対してその下位階層の量子化インデックスのセットを選択するようにしてもよい。また、現在候補となっている量子化インデックスのセットの中から出現頻度の高い複数の量子化インデックス(例えば、出現頻度がある閾値を超える全ての量子化インデックス)としてもよい。また、出現頻度の高い量子化インデックスの下位階層に、複数の異なる量子化方法によって算出される複数の量子化インデックスのセットが存在する場合は、そのいずれかのセットを選択する(図6を例に説明すると、例えば出現頻度の高い量子化インデックスが量子化インデックス4であるとして、その下位階層の量子化インデックスとして量子化インデックス13、14、15のセット、あるいは量子化インデックス16、17のセットのいずれかを選択できる)。どれを選択するかは、例えば、上述した、量子化インデックスのセットの出現頻度均等度合い、量子化インデックスのセットに含まれる量子化インデックスの数(あるいは階層の深さ)や、セット全体の改変不変度や、その組み合わせに基づいて決定してもよい。例えば、各々の量子化方法によって算出される量子化インデックスのセットで置き換えて候補量子化インデックスセットを生成した場合に、量子化インデックスのセットの出現頻度均等度合いや、量子化インデックスのセットに含まれる量子化インデックスの数(あるいは階層の深さ)や、セット全体の改変不変度、に基づいて最適となるセットを選択してもよい。
例えば、規定の条件が「量子化インデックスの数が10以上」とした場合を、図6を例に説明する。ここでは、候補となっている量子化インデックスのセットの最も出現頻度の高い量子化インデックスに対して、その下位階層の量子化インデックスのセットを選択していく方法を説明する。まず最上位階層の量子化インデックスのセット{1、2、3、4、5}を候補として選択する。選択した量子化インデックスの数が5なので、規定の条件を満たさない。ここで、最も出現頻度の高い量子化インデックスが2だとすると、次に量子化インデックス2に対してその下位階層の量子化インデックスである量子化インデックス8、9、10を選択し、量子化インデックスのセット{1、8、9、10、3、4、5}を次の候補として選択する。選択した量子化インデックスの数が7なので、規定の条件を満たさない。ここで、最も出現頻度の高い量子化インデックスが3だとすると、次に量子化インデックス3に対してその下位階層の量子化インデックスである量子化インデックス11、12を選択し、量子化インデックスのセット{1、8、9、10、11、12、4、5}を次の候補として選択する。選択した量子化インデックスの数が8なので、規定の条件を満たさない。ここで、最も出現頻度の高い量子化インデックスが10だとすると、次に量子化インデックス10に対してその下位階層の量子化インデックスである量子化インデックス26、27を選択し、量子化インデックスのセット{1、8、9、26、27、11、12、4、5}を次の候補として選択する。選択した量子化インデックスの数が9なので、規定の条件を満たさない。ここで、最も出現頻度の高い量子化インデックスが4だとすると、次の量子化インデックス4に対してその下位階層の量子化インデックスのセットを選択する。量子化インデックス4に対しては、その下位階層の量子化インデックスとして量子化インデックス13、14、15のセット、あるいは量子化インデックス16、17のセットのいずれかを選択できる。どれを選択するかは、例えば、上述した、量子化インデックスのセットの出現頻度均等度合い、量子化インデックスの数(あるいは階層の深さ)や、セット全体の改変不変度や、その組み合わせに基づいて決定してもよい。ここでは例えば量子化インデックスのセット16、17を選択し、量子化インデックスのセット{1、8、9、26、27、11、12、16、17、5}を次の候補として選択する。選択した量子化インデックスの数が10なので、規定の条件を満たすため、選択した量子化インデックスのセット{1、8、9、26、27、11、12、16、17、5}を比較用量子化インデックスセットとする。
図10は、上記の、階層的量子化方法の最上位階層の量子化インデックスのセットから順に下位階層の量子化インデックスのセットを選択していく方法を採用した場合における、比較用量子化インデックスセット選択部021Aの構成例(構成例1)を示したものである。図10を参照すると、比較用量子化インデックスセット選択部021Aの構成例1は、候補量子化インデックスセット選択手段021A1と、規定条件判定手段021A2と、から構成されている。
候補量子化インデックスセット選択手段021A1は、階層的量子化方法に従って、(上位階層の)量子化インデックスが供給されない場合は、最上位階層の量子化インデックスのセットを候補の量子化インデックスのセットとして選択し、量子化インデックスが供給される場合は、その量子化インデックスをその下位階層の量子化インデックスのセットと置き換えて候補の量子化インデックスのセットとして選択する。選択した候補量子化インデックスセットの情報を規定条件判定手段021A2へ供給する。なお、候補量子化インデックスセット選択手段021A1に入力される量子化インデックスは、規定条件判定手段021A2からフィードバックされる情報である。
規定条件判定手段021A2は、候補量子化インデックスセット選択手段021A1から供給される候補量子化インデックスセットの情報が示す候補の量子化インデックスのセットがあらかじめ定められた規定の条件を満たすか否かを判定する。規定の条件を満たす場合は、その候補の量子化インデックスのセットを比較用量子化インデックスセットとして出力する。規定の条件を満たさない場合は、その候補の量子化インデックスのセットの中から、母集団量子化インデックス出現頻度算出手段03から供給される母集団量子化インデックス出現頻度に基づいて、出現頻度の高い量子化インデックスを求め、求めた量子化インデックスを候補量子化インデックスセット選択手段021A1へ供給(フィードバック)する。ここで規定の条件は、上述した説明の通りである。
以上の比較用量子化インデックスセット選択部021Aの構成例1の説明では、母集団量子化インデックス出現頻度に基づき、階層的量子化方法の最上位階層の量子化インデックスのセットから順に、下位階層の量子化インデックスのセットを選択していく方法において、下位階層の量子化インデックスのセットで置き換える量子化インデックスを選択する基準として、現在候補となっている量子化インデックスのセットの中から、「出現頻度の高い」量子化インデックスを選択する場合について述べた。以下では、「出現頻度の高い」量子化インデックスを選択する方法とは別の方法について説明する。
例えば、現在候補となっている量子化インデックスのセットの中から、下位階層の量子化インデックスのセットで置き換えることによって、新たに生成される候補量子化インデックスセットの出現頻度均等度合いが高くなる(例えば最大となる)量子化インデックスを、下位階層の量子化インデックスのセットで置き換える量子化インデックスとして選択してもよい。図6を例に説明すると、例えば現在候補となっている量子化インデックスのセットが{1、2、3、4、5}である場合に、量子化インデックス1を下位階層の量子化インデックスのセットで置き換えて生成されるセット{6、7、2、3、4、5}、量子化インデックス2を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、8、9、10、3、4、5}、量子化インデックス3を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、2、11、12、4、5}、量子化インデックス4を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、2、3、13、14、15、5}または{1、2、3、16、17、5}、量子化インデックス5を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、2、3、4、18、19、20、21}、の中で、例えば量子化インデックスのセット3を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、2、11、12、4、5}が最も出現頻度均等度合いが高くなるとする場合に、下位階層の量子化インデックスのセットで置き換える量子化インデックスを3として選択し、新たな候補量子化インデックスセットを{1、2、11、12、4、5}とするようにしてもよい。また選択する際に、新たに生成される候補量子化インデックスセットに含まれる量子化インデックスの数も考慮して選択してもよい。
また例えば、現在候補となっている量子化インデックスのセットの中から、各々の量子化インデックスに対する下位階層の量子化インデックスの出現頻度、に基づいて、下位階層の量子化インデックスのセットで置き換える量子化インデックスを選択してもよい。例えば、各々の量子化インデックスごとに、その下位階層の量子化インデックスのセットの出現頻度均等度合いを算出し、それが最大となるセットを下位階層に持つ量子化インデックスを選択してもよい。図6を例に説明すると、例えば現在候補となっている量子化インデックスのセットが{1、2、3、4、5}である場合に、各々の量子化インデックスの下位階層の量子化インデックスのセット{6、7}、{8、9、10}、{11、12}、{13、14、15}または{16、17}、{18、19、20、21}、の中で、例えば量子化インデックス3の下位階層の量子化インデックスのセット{11、12}の出現頻度均等度合いが最大となる場合に、下位階層の量子化インデックスのセットで置き換える量子化インデックスを3として選択し、新たな候補量子化インデックスセットを{1、2、11、12、4、5}とするようにしてもよい。また選択する際に、下位階層の量子化インデックスのセットの量子化インデックスの数も考慮して選択してもよい。
また例えば、下位階層の量子化インデックスのセットで置き換える量子化インデックスを選択する場合に、各々の出現頻度に加えて、例えば、(a)各々の量子化インデックスに対する下位階層の量子化インデックスの数や、(b)各々の量子化インデックスの改変不変度や、(c)各々の量子化インデックスに対する下位階層の量子化インデックスの改変不変度、なども考慮して選択してもよい。図6を例に(a)の例を説明すると、例えば現在候補となっている量子化インデックスのセットが{1、2、3、4、5}である場合に、例えば、量子化インデックス3と5の出現頻度が高い場合に、各々の下位階層の量子化インデックスの数(それぞれ2と4)を比較し、例えばより量子化インデックスの数が大きい量子化インデックス5を、下位階層の量子化インデックスのセットで置き換える量子化インデックスとして選択してもよい。また逆により量子化インデックスの数が小さい量子化インデックス3を、下位階層の量子化インデックスのセットで置き換える量子化インデックスとして選択してもよい。図6を例に(a)の例を説明すると、例えば現在候補となっている量子化インデックスのセットが{1、2、3、4、5}である場合に、例えば、量子化インデックス3と5の出現頻度が高い場合に、量子化インデックス3のほうが量子化インデックス5よりも改変不変度が高い場合に、量子化インデックス3を、下位階層の量子化インデックスのセットで置き換える量子化インデックスとして選択してもよい。こうすることにより、より改変不変度の高い量子化インデックスを優先的に分割できるため、新たに候補として選択される量子化インデックスのセットの各種改変処理に対する頑健性を高めることができる。図6を例に(c)の例を説明すると、例えば現在候補となっている量子化インデックスのセットが{1、2、3、4、5}である場合に、例えば、量子化インデックス3と5の出現頻度が高い場合に、それぞれの量子化インデックスに対する下位階層の量子化インデックスのセット{11、12}と{18、19、20、21}に対して、例えばそのセット全体にかかる改変不変度(例えば各量子化インデックスの改変不変度の平均値)を求め、量子化インデックス3と5のうち、その値がより大きいほうを、下位階層の量子化インデックスのセットで置き換える量子化インデックスとして選択してもよい。
このように、母集団量子化インデックス出現頻度に基づき、下位階層の量子化インデックスのセットで置き換える量子化インデックスを選択する方法は様々あり、どの方法を用いても構わない。また、ここで説明した方法に限らず、母集団量子化インデックス出現頻度に基づき、下位階層の量子化インデックスのセットで置き換える量子化インデックスを選択する方法であれば構わない。
[第3の実施の形態の動作の説明]
次に、第3の実施の形態において、特に比較用量子化インデックスセット選択部021Aが構成例1を取る場合の動作を、説明する。
図11は、第3の実施の形態において、特に比較用量子化インデックスセット選択部021Aが構成例1を取る場合の動作(出現頻度の高い量子化インデックスに対してその下位階層の量子化インデックスのセットを選択していく場合)を示すフローチャートである。
まず、画像特徴量抽出装置01は、母集団の画像群から、母集団の画像群の階層的量子化インデックス符号を算出し、母集団量子化インデックス出現頻度算出手段03へ供給する(ステップC01)。次に、母集団量子化インデックス出現頻度算出手段03は、画像特徴量抽出装置01から供給される母集団の画像群の階層的量子化インデックス符号を入力とし、母集団の画像群における、量子化インデックスごとの出現頻度を母集団量子化インデックス出現頻度として算出し、比較用量子化インデックスセット選択部021Aに供給する(ステップC02)。次に、比較用量子化インデックスセット選択部021Aの候補量子化インデックスセット選択手段021A1は、まず階層的量子化方法の最上位階層の量子化インデックスのセットを候補の量子化インデックスのセットとして選択し、選択した候補量子化インデックスセットの情報を規定条件判定手段021A2へ供給する(ステップC03)。次に、規定条件判定手段021A2は、候補量子化インデックスセット選択手段021A1から供給される候補量子化インデックスセットの情報が示す候補の量子化インデックスのセットが、あらかじめ定められた規定の条件を満たすか否かを判定する(ステップC04)。規定の条件を満たさない場合は、規定条件判定手段021A2は、その候補の量子化インデックスのセットの中から、母集団量子化インデックス出現頻度算出手段03から供給される母集団量子化インデックス出現頻度に基づいて、出現頻度の高い量子化インデックスを求め、求めた量子化インデックスを候補量子化インデックスセット選択手段021A1へ供給(フィードバック)する(ステップC05)。候補量子化インデックスセット選択手段021A1は、規定条件判定手段021A2から供給される(上位階層の)量子化インデックスを、その下位階層の量子化インデックスのセットと置き換えて候補の量子化インデックスのセットとして選択し、選択した候補量子化インデックスセットの情報を規定条件判定手段021A2へ供給する(ステップC06)そして再度ステップC04へ進む。ステップC04において、規定の条件を満たす場合は、規定条件判定手段021A2は、その候補の量子化インデックスのセットを、比較用量子化インデックスセットとして出力する。そして、図8に示した第2の実施の形態における画像特徴量比較装置02の動作を示すフローチャートにおけるステップB02へ進む。
[第3の実施の形態の効果]
次に、本発明の第3の実施の形態の効果について説明する。
本発明の第3の実施の形態では、第2の実施の形態における効果に加えて、比較用量子化インデックスセット選択部021Aが、母集団量子化インデックス出現頻度に基づいて、量子化インデックスの出現頻度が均等に近づくように比較用量子化インデックスを選択することにより、選択された比較用量子化インデックスを用いて表現される画像特徴量(量子化対象領域ごとの量子化インデックス)の、母集団における異なる画像を識別できる度合いである識別能力を高くすることができる、という効果がある。これは、量子化インデックスの数が同じ場合、特定の量子化インデックスに偏りがあると(特定の量子化インデックスの出現頻度が多くなると)、その出現頻度の高い量子化インデックスが、偶然に異なる画像の間でも共通に出現する確率が高くなり、識別能力が低くなるためである。また画像特徴量の識別能力が高くなることにより、算出される同一性尺度に基づいた画像の同一性の判定の精度が高くなる、という効果がある。
[第4の実施の形態]
次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。図12は、第4の実施の形態にかかる画像同一性尺度算出システムの画像特徴量比較装置の構成を示したブロック図である。図12を参照すると、本発明の第4の実施の形態は、第3の実施の形態の画像特徴量比較装置02における比較用量子化インデックスセット選択部021Aが、さらに量子化インデックス重み値を出力する比較用量子化インデックスセット選択部021Bに置き換わり、また量子化インデックス比較手段023が、さらに量子化インデックス重み値が入力として供給される量子化インデックス比較手段023Aに置き換わる点で異なる。それ以外の点については第3の実施の形態と同じであるため、ここでは第3の実施の形態と異なる点のみを説明する。
比較用量子化インデックスセット選択部021Bは、第3の実施の形態の比較用量子化インデックスセット選択部021Aの動作に加えて、母集団量子化インデックス出現頻度算出手段03から供給される母集団量子化インデックス出現頻度に基づき、選択した比較用量子化インデックスセットの各々の量子化インデックスに対して、出現頻度が高いほど重み値を小さくするように重み値を算出し、算出した量子化インデックスごとの重み値を量子化インデックス重み値として量子化インデックス比較手段023Aへ供給する。ここで、出現頻度が高いほど重み値を小さくする理由は、出現頻度の高い量子化インデックスは他の画像も同じ量子化インデックスを有している可能性が高いために他の画像との識別に寄与できる可能性が低いからである。逆の言い方をすると、出現頻度が低いほど、他の画像が同じ量子化インデックスを有している可能性が低くなり、他の画像との識別に寄与できる可能性が高いため、重みを大きくする。なお、量子化インデックス重み値は、出現頻度が高いほど重み値を小さくするように算出されたものであれば、どのような方法で算出されてもよい(すなわち、出現頻度に対して単調減少な関数に基づいて算出される方法であればよい)。例えば、母集団量子化インデックス出現頻度から、量子化インデックスごとの出現確率を算出し、量子化インデックス重み値を、1から出現確率を引いた値としてもよい。
量子化インデックス比較手段023Aは、比較用量子化インデックス取得手段022から供給される2つの画像(画像1と画像2)の比較用量子化インデックスを、対応する量子化対象領域ごとに比較し、量子化インデックスが一致する量子化対象領域の数を、量子化インデックスごとに求め、それらに比較用量子化インデックスセット選択部021Bから供給される量子化インデックス重み値を作用させて、同一性尺度を算出する。ここで同一性尺度は、例えば、量子化インデックスごとに求められた一致する量子化対象領域の数と、量子化インデックス重み値の積を算出し、それらを加算した値として算出してもよい。
上述した動作が、第4の実施の形態の望ましい動作であるが、別の動作を行うこともできる。例えば、比較用量子化インデックスセット選択部021Bが、選択した比較用量子化インデックスに含まれない量子化インデックスの重み値を0として(あるいは低くして)、階層的量子化方法の全ての量子化インデックス(図6を例に説明すると量子化インデックス1から37の全て)の重み値を、量子化インデックス重み値として量子化インデックス比較手段023Aへ供給してもよい。この場合、選択した比較用量子化インデックスに含まれない量子化インデックスの重み値が0として(あるいは低い値として)量子化インデックス比較手段023Aへ供給されるため、量子化インデックス比較手段023Aには、間接的に、選択した比較用量子化インデックスセットの情報が供給されることになる。このため、比較用量子化インデックスセット選択部021Bは、比較用量子化インデックスセットの情報として、比較用量子化インデックス取得手段022へ特に何も供給する必要はなく、比較用量子化インデックス取得手段022は、入力された階層的量子化インデックス符号から、量子化対象領域ごとに、階層的量子化方法の全階層の量子化インデックスを取得し、量子化インデックス比較手段023Aへ供給してもよい。そして、量子化インデックス比較手段023Aは、対応する量子化対象領域ごとに、各階層ごとに量子化インデックスを比較し、量子化インデックスが一致する量子化対象領域の数を、量子化インデックスごとに求め、それらに比較用量子化インデックスセット選択部021Bから供給される量子化インデックス重み値を作用させて、同一性尺度を算出してもよい。
[第4の実施の形態の効果]
次に、本発明の第4の実施の形態の効果について説明する。
本発明の第4の実施の形態では、第3の実施の形態における効果に加えて、比較用量子化インデックスセット選択部021Bが、母集団量子化インデックス出現頻度に基づき、選択した比較用量子化インデックスセットの各々の量子化インデックスに対して重み値を算出し、量子化インデックス比較手段023Aが算出した重み値を作用させて同一性尺度を算出することにより、算出される同一性尺度に基づいた画像の同一性判定の精度を、第3の実施の形態により算出される同一性尺度に基づいた画像の同一性判定の精度よりも、さらに高くすることができる、という効果がある。
[第5の実施の形態]
次に、本発明の第5の実施の形態について図面を参照して詳細に説明する。第5の実施の形態は、第2の実施の形態における画像特徴量比較装置02において、入力される母集団特性情報と、比較用量子化インデックス選択部021がより具体的になったものである。第5の実施の形態における画像特徴量抽出装置は、図4に示した第1の実施の形態の画像特徴量抽出装置01と同じである。図13は、第5の実施の形態にかかる画像同一性尺度算出システムの画像特徴量比較装置の構成を示したブロック図である。図13を参照すると、本発明の第5の実施の形態は、図5に示された第2の実施の形態の構成の画像特徴量比較装置02の比較用量子化インデックスセット選択部021が、比較用量子化インデックスセット選択部021Cに置き換わる点で異なる。なお、それ以外の点については第2の実施の形態と同じであるため、ここでは第2の実施の形態とは異なる点のみを説明する。
比較用量子化インデックスセット選択部021Cには、母集団特性情報として、母集団量子化インデックス改変不変度が入力される。母集団量子化インデックス改変不変度は、母集団の画像群において、階層的量子化方法の各量子化インデックスが、各種改変処理によって(量子化インデックスが)変化しない度合いである改変不変度を表すものである。母集団の画像群において、階層的量子化方法の各量子化インデックスの改変不変度を求めるには、例えば、母集団の画像群(あるいは母集団の画像群を適当にサンプリングして抽出した画像群)に対して各種改変処理を施して複製画像を作成し、元画像と複製画像から画像特徴量抽出装置01を用いて階層的量子化インデックス符号を算出し、対応する量子化対象領域において量子化インデックスが一致する割合を、量子化インデックスごとに測定し、測定した量子化インデックスごとの一致の割合を、量子化インデックスごとの改変不変度、としてもよい。
比較用量子化インデックスセット選択部021Cは、入力される母集団量子化インデックス改変不変度に基づいて、選択した量子化インデックスのセット全体にかかる量子化インデックスの改変不変度が高くなるように、比較用量子化インデックスセットを選択する。選択した比較用量子化インデックスセットの情報を、比較用量子化インデックス取得手段022へ供給する。比較用量子化インデックスセット選択部021Cは、第2の実施の形態の比較用量子化インデックスセット選択部021が、入力される母集団特性情報が具体的に母集団量子化インデックス改変不変度である場合の一形態であり、その比較用量子化インデックスセットの選択に関する条件などは第2の実施の形態での説明に準じる。
比較用量子化インデックスセット選択部021Cは、選択した量子化インデックスのセット全体にかかる量子化インデックスの改変不変度が高くなるように、比較用量子化インデックスセットを選択することにより、画像への各種改変処理によって量子化インデックスが変化しない度合いである頑健性を高くすることができる。
比較用量子化インデックスセット選択部021Cは、母集団量子化インデックス改変不変度に基づいて、選択した量子化インデックスのセット全体にかかる量子化インデックスの改変不変度が高くなるように比較用量子化インデックスセットを選択する方法として、例えば、母集団量子化インデックス改変不変度が低い量子化インデックスが含まれないように、比較用量子化インデックスセットを選択してもよい。
また比較用量子化インデックスセット選択部021Cは、母集団量子化インデックス改変不変度に基づいて、選択した量子化インデックスのセット全体にかかる量子化インデックスの改変不変度が高くなるように比較用量子化インデックスセットを選択する方法として、例えば、候補として選択した量子化インデックスのセットにおいて、量子化インデックスのセット全体にかかる量子化インデックスの改変不変度を、量子化インデックスセット改変不変度として算出し、量子化インデックスセット改変不変度に基づいて量子化インデックスセット改変不変度が高くなるように量子化インデックスのセットを、比較用量子化インデックスセットとして選択してもよい。比較用量子化インデックスセット選択部021Cは、例えば、候補となる全ての組み合わせの量子化インデックスのセットのそれぞれに対して、量子化インデックスセット改変不変度を算出し、量子化インデックスセット改変不変度が最大となる量子化インデックスのセットを、比較用量子化インデックスセットとして選択してもよい。
量子化インデックスのセット全体にかかる量子化インデックスの改変不変度である量子化インデックスセット改変不変度は、量子化インデックスのセットに含まれる各々の量子化インデックスの改変不変度に基づいて算出される方法であれば、どのような方法であってもよい。例えば、量子化インデックスセット改変不変度を、各々の量子化インデックスの改変不変度の平均値として算出してもよい。また例えば、量子化インデックスセット改変不変度を、ある一定の値を超える量子化インデックスの数、あるいはその割合、として算出してもよい。
また比較用量子化インデックスセット選択部021Cは、上述の量子化インデックスセット改変不変度に加えて、例えば、候補として選択した量子化インデックスのセットに含まれる量子化インデックスの数(あるいは選択した量子化インデックスのセットの階層の深さ)などを共に考慮して、比較用量子化インデックスセットを選択してもよい。これは、量子化インデックスの数(あるいは階層の深さ)は、量子化インデックスセット改変不変度とは独立した情報として、また母集団に依存しない情報として、量子化インデックスのセットの量子化インデックスの数が多くなるほど(あるいは階層が深くなるほど)、異なる画像を識別できる度合いである識別能力は高くなるものの、画像への各種改変処理によって量子化インデックスが変化しない度合いである頑健性は低くなるためであり、量子化インデックスセット改変不変度と量子化インデックスの数(あるいは階層の深さ)の双方を考慮して、比較用量子化インデックスセットを選択したほうが良い場合があるからである。例えば、あらかじめ識別能力と頑健性の観点から、適切な量子化インデックスの数の範囲(例えば量子化インデックスの数を10程度とするなど)を設定し、その条件を満たす量子化インデックスのセットの中から、上述の量子化インデックスセット改変不変度を算出する方法を用いて算出される量子化インデックスセット改変不変度が高くなるようなセットを、比較用量子化インデックスセットとして選択してもよい。
また比較用量子化インデックスセット選択部021Cは、上述の量子化インデックスセット改変不変度に加えて、第3の実施の形態で説明した出現頻度均等度合いを算出し(この場合、比較用量子化インデックスセット選択部021Cには、母集団量子化インデックス出現頻度も、入力として供給される必要がある)、量子化インデックスセット改変不変度と出現頻度均等度合いの双方を考慮して、比較用量子化インデックスセットを選択してもよい。比較用量子化インデックスセット選択部021Cは、例えば、量子化インデックスセット改変不変度が高くなり、かつ出現頻度均等度合いが高くなるような量子化インデックスのセットを、比較用量子化インデックスセットとして選択してもよい。また例えば比較用量子化インデックスセット選択部021Cは、例えば、出現頻度均等度合いが高くなり、かつ、母集団量子化インデックス改変不変度が低い量子化インデックスが含まれないように、比較用量子化インデックスセットを選択してもよい。
また比較用量子化インデックスセット選択部021Cは、階層的量子化方法の最上位階層の量子化インデックスのセットから順に、規定の条件を満たすまで、入力として供給される母集団量子化インデックス改変不変度に基づき、量子化インデックスのセット全体にかかる量子化インデックスの改変不変度が高くなるように、下位階層の量子化インデックスのセットを選択していき、比較用量子化インデックスセットを選択してもよい。ここで規定の条件は、例えば、上述した、量子化インデックスセット改変不変度や、量子化インデックスごとの改変不変度や、量子化インデックスのセットに含まれる量子化インデックスの数(あるいは階層の深さ)や、それらの組み合わせが、あらかじめ規定した値の範囲内であるか否か、などであってもよい。また、第3の実施の形態で説明した量子化インデックスのセットの出現頻度均等度合いに基づいた条件であってもよい。例えば、量子化インデックスセット改変不変度の最小値と、量子化インデックスの数の最小値を設定し、最上位階層の量子化インデックスのセットから順に、量子化インデックスの数を超え、かつ量子化インデックスセット改変不変度を下回らない量子化インデックスのセットが現れるまで、下位階層の量子化インデックスのセットを選択していってもよい。また例えば、第3の実施の形態の<比較用量子化インデックスセット選択部021Aの構成例1>で説明した規定の条件と同様のものであってもよい。(なお、ある量子化インデックスの下位階層に、複数の異なる量子化方法によって算出される複数の量子化インデックスのセットが存在する場合は、そのいずれかのセットを選択する。)
母集団量子化インデックス改変不変度に基づき下位階層の量子化インデックスのセットを選択していく方法としては、例えば、現在候補となる量子化インデックスのセットにおいて、改変不変度が高い量子化インデックスに対して、その下位階層の量子化インデックスのセットを選択する(その量子化インデックスをその下位階層の量子化インデックスのセットと置き換える)ようにしてもよい。図6を例に説明すると、例えば現在候補となっている量子化インデックスのセットが{1、2、3、4、5}である場合に、その中で量子化インデックス3の改変不変度が最大である場合に、量子化インデックス3を、下位階層の量子化インデックスのセットと置き換える量子化インデックスとして選択し、新たに候補となる量子化インデックスのセットを{1、2、11、12、4、5}として選択してもよい。また選択する際に、下位階層の量子化インデックスのセットの量子化インデックスの数も考慮して選択してもよい。
また母集団量子化インデックス改変不変度に基づき下位階層の量子化インデックスのセットを選択していく別の方法としては、例えば、現在候補となっている量子化インデックスのセットの中から、下位階層の量子化インデックスのセットで置き換えることによって、新たに生成される候補量子化インデックスセットのセット全体にかかる量子化インデックスの改変不変度である量子化インデックスセット改変不変度が高くなる(例えば最大となる)量子化インデックスを、下位階層の量子化インデックスのセットで置き換える量子化インデックスとして選択してもよい。図6を例に説明すると、例えば現在候補となっている量子化インデックスのセットが{1、2、3、4、5}である場合に、量子化インデックス1を下位階層の量子化インデックスのセットで置き換えて生成されるセット{6、7、2、3、4、5}、量子化インデックス2を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、8、9、10、3、4、5}、量子化インデックス3を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、2、11、12、4、5}、量子化インデックス4を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、2、3、13、14、15、5}または{1、2、3、16、17、5}、量子化インデックス5を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、2、3、4、18、19、20、21}、の中で、例えば量子化インデックスのセット3を下位階層の量子化インデックスのセットで置き換えて生成されるセット{1、2、11、12、4、5}が最も量子化インデックスセット改変不変度が高くなるとする場合に、下位階層の量子化インデックスのセットで置き換える量子化インデックスを3として選択し、新たな候補量子化インデックスセットを{1、2、11、12、4、5}とするようにしてもよい。また選択する際に、新たに生成される候補量子化インデックスセットに含まれる量子化インデックスの数も考慮して選択してもよい。
また母集団量子化インデックス改変不変度に基づき下位階層の量子化インデックスのセットを選択していくさらに別の方法としては、例えば、現在候補となっている量子化インデックスのセットの中から、各々の量子化インデックスに対する下位階層の量子化インデックスの改変不変度に基づいて、下位階層の量子化インデックスのセットで置き換える量子化インデックスを選択してもよい。例えば、各々の量子化インデックスごとに、その下位階層の量子化インデックスのセット全体にかかる量子化インデックスの改変不変度(例えば平均値)を算出し、それが最大となるセットを下位階層に持つ量子化インデックスを選択してもよい。図6を例に説明すると、例えば現在候補となっている量子化インデックスのセットが{1、2、3、4、5}である場合に、各々の量子化インデックスの下位階層の量子化インデックスのセット{6、7}、{8、9、10}、{11、12}、{13、14、15}または{16、17}、{18、19、20、21}、の中で、例えば量子化インデックス3の下位階層の量子化インデックスのセット{11、12}のセット全体にかかる量子化インデックスの改変不変度(例えば平均値)が最大となる場合に、下位階層の量子化インデックスのセットで置き換える量子化インデックスを3として選択し、新たな候補量子化インデックスセットを{1、2、11、12、4、5}とするようにしてもよい。また選択する際に、下位階層の量子化インデックスのセットの量子化インデックスの数も考慮して選択してもよい。
また母集団量子化インデックス改変不変度に基づき下位階層の量子化インデックスのセットを選択していく際に、母集団量子化インデックス改変不変度に加えて、第3の実施の形態で説明した母集団量子化インデックス出現頻度に基づき(この場合、比較用量子化インデックスセット選択部021Cには、母集団量子化インデックス出現頻度も、入力として供給される必要がある)、その双方を考慮して、下位階層の量子化インデックスのセットで置き換える量子化インデックスを選択してもよい。
なお、階層的量子化方法の最上位階層の量子化インデックスのセットから順に、規定の条件を満たすまで、母集団量子化インデックス改変不変度に基づき、下位階層の量子化インデックスのセットを選択していく方法を採用した場合における比較用量子化インデックス選択部021Cの構成は、個々の手段の具体的な動作が異なる以外は、図10に示した、第3の実施の形態における比較用量子化インデックスセット選択部021Aとほぼ同一である。すなわち、候補となる量子化インデックスのセットを選択する候補量子化インデックスセット選択手段と、候補として選択された量子化インデックスのセットが規定の条件を満たすか否かを判定する規定条件判定手段と、から構成される。個々の手段の具体的な動作は、上述した説明に従うものとし、ここでは詳細な説明を省略する。
[第5の実施の形態の効果]
次に、本発明の第5の実施の形態の効果について説明する。
本発明の第5の実施の形態では、第2の実施の形態における効果に加えて、比較用量子化インデックスセット選択部021Cが、母集団量子化インデックス改変不変度に基づいて、選択した量子化インデックスのセット全体にかかる量子化インデックスの改変不変度が高くなるように、比較用量子化インデックスセットを選択することにより、選択された比較用量子化インデックスを用いて表現される画像特徴量(量子化対象領域ごとの量子化インデックス)の、母集団における各種改変処理に対する頑健性を高くすることができる、という効果がある。また画像特徴量の頑健性が高くなることにより、算出される同一性尺度に基づいた画像の同一性の判定の精度が高くなる、という効果がある。
[第6の実施の形態]
次に、本発明の第6の実施の形態について図面を参照して詳細に説明する。図14は、第6の実施の形態にかかる画像同一性尺度算出システムの画像特徴量比較装置の構成を示したブロック図である。図14を参照すると、本発明の第6の実施の形態は、第5の実施の形態の画像特徴量比較装置02における比較用量子化インデックスセット選択部021Cが、さらに量子化インデックス重み値を出力する比較用量子化インデックスセット選択部021Dに置き換わり、また量子化インデックス比較手段023が、さらに量子化インデックス重み値が入力として供給される量子化インデックス比較手段023Aに置き換わる点で異なる。それ以外の点については第5の実施の形態と同じであるため、ここでは第5の実施の形態と異なる点のみを説明する。
比較用量子化インデックスセット選択部021Dは、第5の実施の形態の比較用量子化インデックスセット選択部021Cの動作に加えて、入力として供給される母集団量子化インデックス改変不変度に基づき、選択した比較用量子化インデックスセットの各々の量子化インデックスに対して、改変不変度が高いほど重み値を大きくするように重み値を算出し、量子化インデックス比較手段023Aへ供給する。なお、量子化インデックス重み値は、改変不変度が高いほど重み値を大きくするように算出されたものであれば、どのような方法で算出されてもよい(すなわち、改変不変度に対して単調増加な関数に基づいて算出される方法であればよい)。例えば、母集団量子化インデックス改変不変度そのものを、量子化インデックス重み値としてもよい。
量子化インデックス比較手段023Aは、第4の実施の形態における量子化インデックス比較手段023Aと同一なので、ここでは説明を省略する。
上述した動作が、第6の実施の形態の望ましい動作であるが、別の動作を行うこともできる。例えば、比較用量子化インデックスセット選択部021Dが、選択した比較用量子化インデックスに含まれない量子化インデックスの重み値を0として(あるいは低くして)、階層的量子化方法の全ての量子化インデックス(図6を例に説明すると量子化インデックス1から37の全て)の重み値を、量子化インデックス重み値として量子化インデックス比較手段023Aへ供給してもよい。この場合、選択した比較用量子化インデックスに含まれない量子化インデックスの重み値が0として(あるいは低い値として)量子化インデックス比較手段023Aへ供給されるため、量子化インデックス比較手段023Aには、間接的に、選択した比較用量子化インデックスセットの情報が供給されることになる。このため、比較用量子化インデックスセット選択部021Dは、比較用量子化インデックスセットの情報として、比較用量子化インデックス取得手段022へ特に何も供給する必要はなく、比較用量子化インデックス取得手段022は、入力された階層的量子化インデックス符号から、量子化対象領域ごとに、階層的量子化方法の全階層の量子化インデックスを取得し、量子化インデックス比較手段023Aへ供給してもよい。そして、量子化インデックス比較手段023Aは、対応する量子化対象領域ごとに、各階層ごとに量子化インデックスを比較し、量子化インデックスが一致する量子化対象領域の数を、量子化インデックスごとに求め、それらに比較用量子化インデックスセット選択部021Dから供給される量子化インデックス重み値を作用させて、同一性尺度を算出してもよい。
[第6の実施の形態の効果]
次に、本発明の第6の実施の形態の効果について説明する。
本発明の第6の実施の形態では、第5の実施の形態における効果に加えて、比較用量子化インデックスセット選択部021Dが、母集団量子化インデックス改変不変度に基づき、選択した比較用量子化インデックスセットの各々の量子化インデックスに対して重み値を算出し、量子化インデックス比較手段023Aが算出した重み値を作用させて同一性尺度を算出することにより、算出される同一性尺度に基づいた画像の同一性判定の精度を、第5の実施の形態により算出される同一性尺度に基づいた画像の同一性判定の精度よりも、さらに高くすることができる、という効果がある。
[第7の実施の形態]
次に、本発明の第7の実施の形態について図面を参照して詳細に説明する。第7の実施の形態は、第2から第6の実施の形態のいずれかの画像同一性尺度算出システムを用いて、画像が同一であるか否かを判定する画像同一性判定システムに関する。図15は、第7の実施の形態にかかる画像同一性判定システムの構成を示したブロック図である。図15を参照すると、本発明の第7の実施の形態は、本発明の第2から第6の実施の形態のいずれかの構成に、同一性判定手段04が加わる点で異なる。なお、それ以外の点については第2から第6の実施の形態のいずれかの構成をとるため、ここでは第2から第6の実施の形態とは異なる点のみを説明する。
同一性判定手段04は、画像特徴量比較装置02が出力する、2つの画像(画像1と画像2)の同一性尺度を、入力として供給される規定の閾値と比較し、2つの画像が同一であるか否かを判定し、その判定結果を同一性判定結果として出力する。同一性尺度が閾値よりも大きい場合は、2つの画像が同一であると判定し、同一性尺度が閾値よりも小さい場合は、2つの画像が同一でないと判定する。なお、ここで入力される閾値は、比較用量子化インデックスセット選択部021で選択された比較用量子化インデックスセットに応じて、異なる値であってもよい。また閾値は、あらかじめ学習用の画像群を用いて、学習によって設定するようにしてもよい。
[第7の実施の形態の効果]
次に、本発明の第7の実施の形態の効果について説明する。
本発明の第7の実施の形態では、第2から第6の実施の形態のいずれかの画像同一性尺度算出システムが算出する同一性尺度を用いて画像の同一性の判定を行うため、第2から第6の実施の形態の効果を有する同一性尺度に基づいて、画像の同一性の判定が行われる。母集団ごとに適応的に最適化されて画像の同一性の判定が行われ、母集団によらず、画像の同一性の判定を高い精度で保つことができる、という効果がある。
[第8の実施の形態]
次に、図16を参照して、本発明の第8の実施の形態について説明する。第8の実施の形態は、上記の第2から第7の実施の形態の何れかの画像同一性尺度算出システムにおいて、図16に示すような階層的量子化方法を用いた実施の形態である。図16において、量子化方法Aは、最上位階層の量子化方法である。量子化方法Aは量子化対象領域における画像の勾配(エッジ)の強度と方向に関する特徴量を算出し、強度が規定の量に満たない場合は「勾配無し」を示す量子化インデックスである9に分類し、それ以外の場合は、支配的な勾配の方向を8方向(例えば画像の水平右方向を0度とし、右廻り方向に順に45度、90度、135度、180度、225度、270度、315度とする)に量子化(分類)する。すなわち支配的な勾配の方向が0度に量子化される場合は量子化インデックス1に、45度に量子化される場合は量子化インデックス2に、90度に量子化される場合は量子化インデックス3に、135度に量子化される場合は量子化インデックス4に、180度に量子化される場合は量子化インデックス5に、225度に量子化される場合は量子化インデックス6に、270度に量子化される場合は量子化インデックス7に、315度に量子化される場合は量子化インデックス8に、分類する。
量子化対象領域における画像の支配的な勾配(エッジ)の方向を算出する具体的な方法としては、例えば、量子化対象領域の中心における勾配の強度と方向を算出して求めてもよい。また例えば、量子化対象領域内の複数の小領域(例えば量子化対象領域内の各画素)ごとに勾配(エッジ)の強度と方向を算出し、強度がある規定量以上となる場合に勾配の方向を8方向に量子化し、8方向の各々に対応するビンを有するヒストグラムに投票し、最大の投票数を有する方向を支配的な勾配方向としてもよい(投票数が規定の数に満たない場合は「勾配無し」を示す量子化インデックス9に分類する)。なお、この例では支配的な勾配の方向を8方向に量子化しているが、4方向に量子化してもよいし、16方向に量子化してもよく、何方向に量子化するかは任意でよい。
勾配無しを示す量子化インデックス9に分類された以外の場合(勾配有りの場合)、すなわち量子化インデックス1から8のいずれかに分類された場合は、その下位階層の量子化方法として量子化方法Bによる量子化を行う。量子化方法Bは、勾配に関する副次的な特徴に基づいて量子化を行う。例えば、量子化方法Bは、勾配の強度の量に基づいて2分類してもよい。また例えば、最上位階層で分類された支配的な勾配の方向に対して、2番目に支配的な勾配の方向が存在するか否か(2番目に支配的な勾配の方向の強度が規定量以上あるか否か)に基づいて2分類してもよい。また、2番目に支配的な勾配の方向を量子化したものであってもよい。なお、図16では量子化方法Bによる分類を2分類として示しているが、2分類である必要はない。
図16では量子化インデックス1から8の全てに対してその下位階層の量子化方法として同様に量子化方法Bを適用しているが、例えば、支配的な勾配の方向が特定の角度の場合のみに量子化方法Bを適用してもよい。例えば、一般的な画像において多く存在する(すなわち分類される頻度が高くなる)勾配方向である0度、90度、180度、270度に(人工物には上下左右方向のエッジが多く存在するため、人工物を写した画像にはこの4つの勾配方向が多く存在する)対応する量子化インデックス1、3、5、7に対してのみ、その下位階層の量子化方法として量子化方法Bを適用してもよい(それ以外の量子化インデックス2、4、6、8は、最下位階層としてもよい)。また例えば、量子化インデックス1から8の全てに対して量子化方法Bを適用し、さらに最上位階層の量子化インデックスが1、3、5、7となる量子化インデックス10、11、14、15、18、19、22、23に対しては、さらにその下位階層の量子化方法を設けてもよい。これらは、一般的に分類される頻度が高くなると想定される量子化インデックスに対しては、より詳細に分類できるようにしておくことが効果的であるためである。
勾配無しを示す量子化インデックス9に分類される場合、その下位階層の量子化方法として量子化方法Cによる量子化を行う。量子化方法Cは、画像の勾配(エッジ)とは異なる特徴に基づいて量子化を行う。例えば量子化方法Cは、量子化対象領域の画像の輝度に基づいて量子化してもよい。例えば、量子化対象領域の画像の平均輝度値に基づいてNレベル(Nは2以上の数値)に量子化してもよい。また例えば量子化方法Cは、量子化対象領域の画像の色情報に基づいて量子化してもよい。例えば、量子化対象領域の画像から色相に関する特徴を抽出し、色相の角度に基づいて量子化してもよい。なお、図16では量子化方法Cによる分類を3分類として示しているが、3分類である必要はない。
ここで説明した階層的量子化方法における最上位階層の量子化方法が、勾配(エッジ)の方向に基づいているのは、一般的に画像の勾配(エッジ)に関する特徴、特に勾配(エッジ)の方向に関する特徴は、画像の圧縮、ぼかしなどのフィルタ処理、明度調整、色調調整などの種々の改変処理に対して頑健であるためである。そのため、支配的な勾配方向が存在する量子化インデックス1から8に対しては、その下位階層の量子化方法も、頑健な特徴である勾配(エッジ)基づいている(勾配の強度、2番目に支配的な勾配の方向など)。勾配無しを示す量子化インデックス9に分類される場合のみ、その下位階層の量子化方法として勾配の情報を用いることはできないため(勾配が無いため)、勾配とは異なる特徴(輝度、色情報など)に基づいて量子化を行っている。
[第9の実施の形態]
次に、図17を参照して、本発明の第9の実施の形態について説明する。第9の実施の形態は、上記の第2から第8の実施の形態の何れかの画像同一性尺度算出システムにおいて、画像特徴量抽出装置で作成された階層的量子化インデックス符号を記憶する記憶手段におけるデータ構造として図17に示すようなデータ構造を用いた実施の形態である。図17(a)は画像上に設定される量子化対象領域の例を示しており、この例では、画像を縦横に4分割した各々の領域をそれぞれ1つの量子化対象領域としている。このように、1画像当たりの量子化対象領域の数があらかじめ固定されている場合、図17(b)に示すように、各量子化対象領域から抽出された量子化インデックスを所定の順番で配列したデータ構造を用いて、階層的量子化インデックス符号を記憶手段に記憶することができる。ここで、所定の順番はあらかじめ定められていれば任意でよく、例えば、量子化対象領域(1)、量子化対象領域(2)、量子化対象領域(3)、量子化対象領域(4)の順番に配列される。
また、1画像当たりの量子化対象領域の数が可変の場合、図17(c)に示すように、1画像当たりの量子化対象領域の数を先頭部分に格納し、次いで、各量子化対象領域から抽出された量子化インデックスを所定の順番で配列したデータ構造を用いて、階層的量子化インデックス符号を記憶手段に記憶することができる。
それぞれの量子化インデックスは、最下位階層の量子化インデックスのみを含むものであってもよいし、全階層の量子化インデックスを含むものであってもよい。例えば、図16に示した階層的量子化方法を例にすると、量子化対象領域(1)について、量子化インデックス11が求められた場合、量子化インデックス(1)に量子化インデックス11だけを格納してもよいし、量子化インデックス1と量子化インデックス11を格納してもよい。
[第10の実施の形態]
次に、本発明の第10の実施の形態を図18を参照して説明する。図18は、本実施の形態における画像特徴量抽出装置の構成を示すブロック図である。なお、本実施の形態は、上述した画像特徴量抽出装置の概略を説明する。
本実施の形態における画像特徴量抽出装置は、あらかじめ定められた階層的量子化方法に従って、画像の量子化対象領域ごとに、階層的に量子化を行って複数の階層の量子化インデックスを算出し、各量子化対象領域の各階層の量子化インデックスが一意に特定できる符号化形式である階層的量子化インデックス符号を出力する、という構成を採る。
また、上記画像特徴量抽出装置では、前記算出を行う第1の手段2Aと、前記出力を行う第2の手段2Bとを備える、という構成を採る。
また、上記画像特徴量抽出装置では、量子化対象領域ごとに、上記階層的量子化方法に従って、上位階層の量子化インデックスがフィードバックとして供給される場合は、この供給された量子化インデックスに対応する下位階層の量子化方法を選択し、量子化インデックスが供給されない場合は、最上位階層の量子化方法を選択する次階層量子化方法選択手段と、量子化対象領域ごとに、上記選択された量子化方法が用いる特徴量を、上記入力される画像から抽出する特徴量抽出手段と、量子化対象領域ごとに、上記抽出された特徴量を、上記選択された量子化方法に従って量子化を行って量子化インデックスを算出し、算出した量子化インデックスが最下位階層でない場合に上記量子化インデックスを上記次階層量子化方法選択手段へフィードバックとして供給する量子化インデックス算出手段と、量子化対象領域ごとに各階層の量子化インデックスが算出されると、各量子化対象領域の各階層の量子化インデックスが一意に特定できる符号化形式である階層的量子化インデックス符号を算出し、出力する階層的量子化インデックス符号出力手段と、を備えるという構成を採る。
また、上記画像特徴量抽出装置では、上記量子化対象領域が、画像の1つまたは複数の局所領域である、という構成を採る。
また、上記画像特徴量抽出装置では、上記階層的量子化方法が、より上位の階層ほど、画像への各種改変処理に対して算出される量子化インデックスが変化しにくい量子化方法で構成されている、という構成を採る。
また、上記画像特徴量抽出装置では、上記階層的量子化方法の各階層での量子化方法は、特定の母集団を仮定しない一般的な画像において、その量子化方法で分類される複数の量子化インデックスに対して、均等に近く分類される量子化方法で構成されている、という構成を採る。
また、上述した画像特徴量抽出装置が作動することにより実行される、本発明の他の形態である画像特徴量抽出方法は、あらかじめ定められた階層的量子化方法に従って、画像の量子化対象領域ごとに、階層的に量子化を行って複数の階層の量子化インデックスを算出し、各量子化対象領域の各階層の量子化インデックスが一意に特定できる符号化形式である階層的量子化インデックス符号を出力する、という構成を採る。
また、上述した画像特徴量抽出方法では、次階層量子化方法選択手段が、量子化対象領域ごとに、前記階層的量子化方法に従って、上位階層の量子化インデックスがフィードバックとして供給される場合は、該供給された量子化インデックスに対応する下位階層の量子化方法を選択し、量子化インデックスが供給されない場合は、最上位階層の量子化方法を選択し、特徴量抽出手段が、量子化対象領域ごとに、前記選択された量子化方法が用いる特徴量を、前記入力される画像から抽出し、量子化インデックス算出手段が、量子化対象領域ごとに、前記抽出された特徴量を、前記選択された量子化方法に従って量子化を行って量子化インデックスを算出し、算出した量子化インデックスが最下位階層でない場合に前記量子化インデックスを前記次階層量子化方法選択手段へフィードバックとして供給し、階層的量子化インデックス符号出力手段が、量子化対象領域ごとに各階層の量子化インデックスが算出されると、各量子化対象領域の各階層の量子化インデックスが一意に特定できる符号化形式である階層的量子化インデックス符号を算出し、出力する、という構成を採る。
また、上述した画像特徴量抽出装置は、コンピュータに、プログラムが組み込まれることで実現できる。具体的には、本発明の他の形態であるプログラムは、コンピュータを、あらかじめ定められた階層的量子化方法に従って、画像の量子化対象領域ごとに、階層的に量子化を行って複数の階層の量子化インデックスを算出する第1の手段、各量子化対象領域の各階層の量子化インデックスが一意に特定できる符号化形式である階層的量子化インデックス符号を出力する第2の手段、として機能させる、という構成を採る。
また、上述したプログラムでは、上記第1の手段は、画像の量子化対象領域ごとに、あらかじめ定められた階層的量子化方法に従って、上位階層の量子化インデックスがフィードバックとして供給される場合は、この供給された量子化インデックスに対応する下位階層の量子化方法を選択し、量子化インデックスが供給されない場合は、最上位階層の量子化方法を選択する次階層量子化方法選択手段と、量子化対象領域ごとに、上記選択された量子化方法が用いる特徴量を、上記入力される画像から抽出する特徴量抽出手段と、量子化対象領域ごとに、上記抽出された特徴量を、上記選択された量子化方法に従って量子化を行って量子化インデックスを算出し、算出した量子化インデックスが最下位階層でない場合に上記量子化インデックスを上記次階層量子化方法選択手段へフィードバックとして供給する量子化インデックス算出手段と、を含み、上記第2の手段は、量子化対象領域ごとに各階層の量子化インデックスが算出されると、各量子化対象領域の各階層の量子化インデックスが一意に特定できる符号化形式である階層的量子化インデックス符号を算出し、出力する階層的量子化インデックス符号出力手段、を含む、という構成を採る。
また、本発明の他の形態であるデータ構造は、画像の特徴を表す画像特徴量を記憶手段に記憶するデータ構造であって、あらかじめ定められた階層的量子化方法に従って画像の量子化対象領域ごとに階層的に量子化を行って算出した複数の階層の量子化インデックスが一意に特定できる符号化形式である階層的量子化インデックス符号を含む、という構成を採る。
上述した構成を有する画像特徴量抽出方法、または、プログラム、またはデータ構造の発明であっても、上記画像特徴量抽出装置と同様の作用を有するため、上述した本発明の目的を達成することができる。
以上、上記各実施の形態を参照して本発明を説明したが、本発明は、上述した実施の形態に限定されるものではない。本発明の構成や詳細には、本発明の範囲内で当業者が理解しうる様々な変更をすることができる。
なお、本発明は、日本国にて2008年09月01日に特許出願された特願2008−223389の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。