JP4735786B2

JP4735786B2 - 画像識別子照合装置

Info

Publication number: JP4735786B2
Application number: JP2011506922A
Authority: JP
Inventors: 浩太岩元; 亮磨大網
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2009-06-16
Filing date: 2010-06-02
Publication date: 2011-07-27
Anticipated expiration: 2030-06-02
Also published as: JPWO2010146786A1; KR101355258B1; KR20120033308A; US20110229042A1; EP2352126A1; WO2010146786A1; US8200021B2; EP2352126A4; CN102822864B; CN102822864A

Description

本発明は、画像を識別する（同一性を判定する）ための特徴量である画像識別子を照合する装置に関する。

画像識別子は、画像を識別する（同一性を判定する）ための画像特徴量である。ある画像から抽出した画像識別子と、別の画像から抽出した画像識別子とを比較し、その比較結果から、２つの画像が同一である度合いを示す同一性尺度（一般的には、類似度または距離という）を算出することができる。また、算出した同一性尺度をある閾値と比較することにより、２つの画像が同一であるか否かを判定することができる。ここで「２つの画像が同一」とは、画像信号（画像を構成する画素の画素値）のレベルで２つの画像が同一である場合だけに限らず、画像の圧縮形式（フォーマット）の変換、画像のサイズ・アスペクト比の変換、画像の色調の調整、画像への各種フィルタ処理（鮮鋭化、平滑化など）、画像への局所的な加工（テロップ重畳、切抜きなど）、画像の再キャプチャリング、などの各種改変処理によって、一方の画像が他方の画像の複製された画像である場合も含む。画像識別子を用いれば、例えば、画像、または画像の集合体である動画像の複製を検知できるため、画像または動画像の違法コピー検知システムなどに応用することができる。

画像識別子の一例が、特許文献１に記載されている。図１８は、特許文献１に記載されている画像識別子の抽出方法を示す図である。この画像識別子は、複数の次元（図１８では１６次元）の特徴ベクトルである。画像２４０内のあらかじめ定められた位置の３２個の長方形領域２４４（図１８ではそのうち１６個の長方形領域が描かれている）からそれぞれ平均輝度値を算出し、対となる長方形領域の間（図１８では対となる長方形領域を点線２４８で結んでいる）で平均輝度値の差を算出し、１６次元の差ベクトル２５０を求める。差ベクトル２５０に対してベクトル変換により合成ベクトルを生成し、合成ベクトルの各次元を量子化して得られた１６次元の量子化インデックスベクトルを画像識別子とする。

特表平８−５００４７１号公報

複数の次元の特徴ベクトルで構成される画像識別子は、次元間の相関が小さいほど、特徴ベクトルが持つ情報量が大きい（冗長性が小さい）ので、異なる画像を識別できる度合いである識別能力が高くなる。反対に、特徴ベクトルの次元間の相関が大きいと、特徴ベクトルが持つ情報量が小さい（冗長性が大きい）ので、識別能力が低くなる。ここで次元間の相関とは、次元の特徴量の生起の類似性の度合いであり、数学的には、例えば、各次元の特徴量の生起を確率変数とした場合の、確率変数間の相関係数や、相互情報量として算出できる値である。このため、複数の次元の特徴ベクトルで構成される画像識別子は、次元間の相関が小さくなるように設計されていることが望ましい。

画像信号（画像を構成する画素の画素値）は、画像の局所領域間において相関がある。一般的に、局所領域間の距離が近いほど、相関は大きくなる。特に、例えば、ある特定の画像パターンが繰り返し出現する（特にそれが規則正しい周期で出現する場合に）画像（例えば格子状に配置されたビルの窓の画像など、図１９（Ａ）を参照）や、ある特定のテクスチャで構成されている画像（図１９（Ｂ）を参照）などは、画像の局所領域間の相関が大きくなる。

[第１の問題点]
特許文献１に記載されているような、画像の複数の局所領域から抽出した特徴量から成る特徴ベクトルで構成されている画像識別子は、画像の局所領域間の相関が大きい画像に対して、各次元において特徴量を抽出する局所領域の形状が同一であるため（特許文献１の例では同一の形状の長方形領域）、抽出される特徴量の次元間の相関が大きくなる。そのため、画像識別子（特徴ベクトル）の識別能力が低くなる、という第１の問題点がある。ここで形状が同一とは、領域の大きさや角度（傾き或いは姿勢）も含めて同一であるということである。

例えば、ある特定の画像パターンが繰り返し出現する画像（図１９（Ａ）参照）や、ある特定のテクスチャで構成されている画像（図１９（Ｂ）参照）などに対しては、特許文献１で記載されているような画像識別子は、識別能力が低くなる。

[第２の問題点]
特許文献１に記載されている画像識別子の第２の問題点は、特徴量（特徴ベクトル）を算出するための各次元の領域の形状（大きさ、角度も含めて）が同一の長方形であるため、長方形の辺の長さと同じ、あるいは、その整数分の１の周期を持つ周波数成分を検知できないという、周波数上の盲点が存在するということである。その理由は、この特定の周波数の信号成分を領域内で平均すると、信号成分の大小によらず0となってしまい、その周波数成分の信号を全く検知できなくなるためである。より具体的には、長方形の辺の長さと同じ周期を持つ周波数をf₀とすると，周波数nf₀(n=1,2,3,…)の成分が検知できなくなる。このため、直流成分とこの周波数成分に信号が集中している画像に対しては、画素値の平均値は直流成分と同じになってしまい、領域間で値の差がなくなる結果、領域間の平均画素値の差として抽出される特徴量は全て0になってしまい、識別できなくなる（識別能力が著しく低下する）。実際には、周波数nf₀(n=1,2,3,…)の成分のみではなく、その近傍の一定の周波数領域に対しては同様に検知困難となるため、上記特定周波数に信号成分が集中していなくても、その周波数帯の信号成分が使えないことにより、識別能力が低下する。この問題を軽減するには、周波数f₀の値を大きくし、上記検知困難な周波数帯に陥る信号電力を下げることが考えられる。しかしながら、周波数f₀の値を大きくすることは、領域の大きさを小さくすることを意味し、特徴量の頑健性（各種改変処理やノイズに対して特徴量が変化しない度合い）の低下につながる。例えば、領域が小さくなることで、多少の位置ずれに対しても、特徴量の値が大きく変化することになり、特徴量の頑健性が下がる。このように、同一の長方形領域を用いる場合には、識別能力をあげた上で頑健性を確保することが極めて難しい。

本発明の目的は、上述した課題、すなわち異なる画像を識別できる度合いである識別能力の低い画像識別子を用いた照合では照合精度が低下する、という課題を解決する画像識別子照合装置を提供することにある。

本発明の一形態にかかる画像識別子照合装置は、画像中の、複数の部分領域対の、各部分領域から領域特徴量を抽出し、部分領域対ごとに、対をなす２つの部分領域の上記領域特徴量の差分値を量子化し、部分領域対ごとに算出された量子化値を要素とした集合を上記画像の識別に用いる画像識別子として生成する、生成方法によって生成された、第１の画像の画像識別子と第２の画像の画像識別子とから、各々の画像の余白領域を特定する余白領域特定手段と、上記第１の画像の画像識別子と上記第２の画像の画像識別子とを、対をなす２つの部分領域の少なくとも一方が上記特定された余白領域に含まれる要素の重みが小さくなる方法で照合する照合手段とを備える。

本発明は上述したように構成されているため、異なる画像を識別できる度合いである識別能力の高い画像識別子を用いて、第１の画像と第２の画像とを精度良く照合することができる。特に、画像の局所領域間の相関が大きい画像に対して、この効果は顕著である。

また本発明によれば、特定の周波数に信号が集中している画像に対しても、識別能力が低下しない画像識別子を用いて、照合を行うことができる。

さらに本発明によれば、第１の画像と第２の画像の余白領域を特定し、対をなす２つの部分領域の少なくとも一方が上記特定された余白領域に含まれる要素の重みが小さくなる方法で照合するため、より正確な照合が可能である。また、画像識別子自体から余白領域を特定しているため、画像識別子の抽出側（抽出の段階）で、余白領域を別途特定する手段が必要ない、という効果もある。

本発明の第１の実施の形態のブロック図である。次元別抽出情報が示す次元ごとの抽出領域の対の例を示す図である。本発明の第１の実施の形態における比較手段の一例を示すブロック図である。本発明の第１の実施の形態における比較手段の別の例を示すブロック図である。本発明の第１の実施の形態の処理の流れを示すフローチャートである。本発明の第２の実施の形態の要部ブロック図である。本発明の第２の実施の形態の処理の流れを示すフローチャートである。本発明の第３の実施の形態のブロック図である。次元ごとの領域特徴量算出方法の例を示す図である。本発明の第３の実施の形態の処理の流れを示すフローチャートである。本発明の第４の実施の形態のブロック図である。次元ごとの比較・量子化方法の例を示す図である。本発明の第４の実施の形態の処理の流れを示すフローチャートである。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第７の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第７の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第７の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第７の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第７の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別比較・量子化方法情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別比較・量子化方法情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別比較・量子化方法情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別比較・量子化方法情報を示す図である。本発明の第６および第７の実施の形態で使用する次元別比較・量子化方法情報を示す図である。特許文献１に記載されている画像識別子の抽出方法を示す図である。局所領域間の相関が大きくなる画像の例を示す図である。量子化インデックスベクトルを照合する照合手段のブロック図である。量子化インデックスベクトルを照合する照合手段の処理例を示すフローチャートである。量子化インデックスベクトルを照合する照合手段の別の処理例を示すフローチャートである。量子化インデックスベクトルを照合する照合手段の更に別の処理例を示すフローチャートである。画像を縦方向３２、横方向３２に分割してできる１０２４個のブロックに対して付与するインデックスの一例を示す図である。本発明の第８の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第８の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第８の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第８の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第８の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第８の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第８の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。各次元の領域タイプと次元数、閾値に対応するインデックスとの関係を示す図である。領域タイプａの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｂの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｃの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｄの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｅの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｆの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｇの次元の第１、第２の抽出領域の一例を示す図である。量子化インデックスベクトルを照合する照合手段の第２の実施の形態の構成を示すブロック図である。余白領域（黒帯）が付加された画像の例を示す図である。本発明の第９の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第９の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第９の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第９の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第９の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第９の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第９の実施の形態の各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。各次元の領域タイプと次元数、閾値に対応するインデックスとの関係を示す図である。単調非増加関数ｆ(Ｄ)の例を図示したグラフである。本発明の第５の実施の形態のブロック図である。量子化インデックスベクトルを照合する照合手段のまた更に別の処理例を示すフローチャートである。量子化インデックスベクトルを照合する照合手段の他の処理例を示すフローチャートである。量子化インデックスベクトルを照合する照合手段の第３の実施の形態の構成を示すブロック図である。量子化インデックスベクトルを照合する照合手段の第３の実施の形態の処理例を示すフローチャートである。量子化インデックスベクトルを照合する照合手段の第３の実施の形態の別の処理例を示すフローチャートである。

[第１の実施の形態]
[第１の実施の形態の構成]
次に、本発明の第１の実施の形態について図面を参照して詳細に説明する。

図１を参照すると、本発明の第１の実施の形態に係る画像識別子抽出装置は、入力された画像に対して、複数の次元から成る特徴ベクトル（より具体的には量子化インデックスベクトル）を画像識別子として出力するシステムであり、次元決定手段１と、抽出領域取得手段２と、領域特徴量算出手段３と、比較手段４と、から構成されている。

次元決定手段１は、次に抽出する特徴ベクトルの次元を決定し、抽出領域取得手段２へ供給する。次元決定手段１は、順次、抽出する特徴ベクトルの次元を供給し、抽出領域取得手段２以降の構成要素は、供給された次元に対応する特徴量を抽出する。例えば、特徴ベクトルがＮ次元から構成される場合、次元決定手段１は第１次元から第Ｎ次元までを順に抽出領域取得手段２へ供給してもよい。最終的に特徴ベクトルの全ての次元が供給されれば、供給する次元の順番は任意でよい。複数の次元が並列に供給されてもよい。

抽出領域取得手段２には、次元決定手段１からの次元とは別に、入力として次元別抽出領域情報が供給される。

次元別抽出領域情報は、あらかじめ規定された、特徴ベクトルの次元ごとに対応付けられた、その次元の特徴量を抽出するための第１の抽出領域と第２の抽出領域の対を示す情報である。第１および第２の抽出領域は必須条件として、以下の特徴を有する。

［第１および第２の抽出領域の必須条件］
第１および第２の抽出領域の必須条件は、次元間で抽出領域対の相対的な位置が異なることに加えて、次元間で抽出領域対の形状の組み合わせが異なることである。

上記必須条件を満たす、次元別抽出情報が示す次元ごとの抽出領域の対の例を図２に示す。図１８に示した画像識別子の抽出領域とは異なり、次元間の抽出領域の対の形状の組み合わせが異なる。ここで異なる形状とは、角度の異なる合同な形状や（例えば、図２の第１次元の第２の抽出領域と、第７次元の第１の抽出領域）、大きさの異なる相似な形状（例えば、図２の第１次元の第２の抽出領域と、第９次元の第２の抽出領域）も含む。なお、特徴ベクトルの全次元の中に、抽出領域の対の形状の組み合わせの異なる次元のペアが、少なくとも１つ存在することが最低条件である。抽出領域の対の形状（の組み合わせ）が相互に異なる次元が多いほど、望ましい。これは、抽出領域の対の形状（の組み合わせ）が相互に異なる次元が多いほど、特徴ベクトルのより多くの次元間で相関が小さくなり、識別能力が高くなるからである。例えば、特徴ベクトルの全ての次元間で、抽出領域の対の形状（の組み合わせ）が相互に異なっていてもよい。

ある次元における第１の抽出領域と、第２の抽出領域とは、図２の第９次元のように、同じ形状である必要はなく、図２の他の次元のように、形状が異なっていてもよい。各次元での第１の抽出領域と第２の抽出領域の形状が異なっていると、第１の抽出領域と第２の抽出領域から抽出される特徴量の相関が小さくなり、識別能力が高くなるため、望ましい。また、第１の抽出領域と第２の抽出領域が同時に同じ周波数に関して周波数的な盲点となる可能性が低くなるため、識別能力が高くなる。

各々の抽出領域の形状は任意である。例えば、図２の第６次元の第２の抽出領域のような、任意の複雑な形状であっても構わない。画像の複数の画素で構成されるものであれば、例えば、図２の第７次元や第１０次元のように、線分や曲線であっても構わない。また例えば、第８次元の第１の抽出領域、第１１次元の第１と第２の抽出領域、第１２次元の第１の抽出領域のように、抽出領域が、連続しない複数の小領域から構成されるものであってもよい。このように、任意の複雑な形状の抽出領域を含むことによって、そこから抽出される特徴量の次元間の相関を小さくすることができ、識別能力を高くすることができる。

また、例えば、図２の第５次元のように、第１の抽出領域と第２の抽出領域の一部が重複していてもよい。また抽出領域対のいずれか一方が、もう一方の中に内包されていてもよい。このように、抽出領域の対に重複を許容することにより、より多くの抽出領域対のパターン（相対的位置・距離）を取れるため、次元間の相関を小さくすることができるパターンを増やすことができ、識別能力をより高くする可能性が増える。

また、図１８に示した画像識別子の抽出領域とは異なり、図２に示した各次元のように、次元間で抽出領域が一部重複していてもよい。図１８に示した画像識別子の抽出領域のように、次元間で抽出領域を排他的に取ると、取れる抽出領域対のパターンが限られてしまう。図２に示したように、次元間での抽出領域に重複を許容することにより、より多くの抽出領域対のパターンを取れるため、次元間の相関を小さくすることができるパターンを増やすことができ、識別能力をより高くする可能性が増える。ただし、次元間での抽出領域の重複が多すぎると、次元間の相関が大きくなってしまい、識別能力が低くなるため、望ましくない。

また、抽出領域が互いに近傍に存在する次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせは互いに異なることが望ましい。例えば、抽出領域が互いに近傍に存在する次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。この場合、抽出領域が互いに近傍に存在する全ての次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。また、抽出領域が互いに近傍に存在する次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。また、抽出領域が互いに近傍に存在する次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。

ここで、抽出領域が互いに近傍に存在する次元ペアは、ある所定の方法によって算出される、２つの次元の抽出領域（第１の抽出領域と第２の抽出領域）の間の距離が、ある所定の閾値よりも小さくなるような次元のペアのことである。２つの次元の抽出領域（第１の抽出領域と第２の抽出領域）の距離は、例えば、それぞれの次元の抽出領域（第１の抽出領域と第２の抽出領域）に含まれる全画素の間の距離の平均値として算出してもよい。また例えば、それぞれの次元の抽出領域（第１の抽出領域と第２の抽出領域）に含まれる全画素の間の距離の最小値として算出してもよい。また例えば、それぞれの次元の抽出領域の重心座標を算出し（第１の抽出領域の重心座標と第２の抽出領域の重心座標）、それらの間の距離を算出し（計４つの距離が計算できる）、それらの平均値や最小値として、２つの次元の抽出領域の距離を定義してもよい。ただし、２つの次元の抽出領域の距離は、これらの算出方法に限られない。

抽出領域が互いに近傍に存在する次元間（次元ペア）で、それらの次元間の抽出領域の対の形状の組み合わせを互いに異なるようにすることで、以下の効果がある。抽出領域が互いに近傍に存在する次元間では、抽出される特徴量の相関が大きくなる傾向になる。それらの次元間の抽出領域の対の形状の組み合わせが同じであると、特徴量の相関はさらに大きくなり、特徴ベクトル全体としての冗長性が高くなり、識別能力が低下する。従って、抽出領域が互いに近傍に存在することにより、抽出される特徴量の相関が大きくなるのを打ち消すように、それらの次元間の抽出領域の対の形状の組み合わせを異なるようにすることにより、特徴量の相関を小さくでき、特徴ベクトル全体としての冗長性を小さくし、識別能力の低下を防ぐことができる。

また逆の観点から、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域の間の距離が大きいほうが望ましい。例えば、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。この場合、例えば、抽出領域の対の形状の組み合わせが同一である全ての次元間（次元ペア）において、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。

また、抽出領域が隣接する次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせは互いに異なることが望ましい。ここで、抽出領域が隣接する次元間（次元ペア）とは、抽出領域の一部の周囲が互いに接している、ということである。例えば、抽出領域が隣接する次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。この場合、抽出領域が隣接する全ての次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。また、抽出領域が隣接する次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。また、抽出領域が隣接する次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。

抽出領域が互いに隣接する次元間（次元ペア）で、それらの次元間の抽出領域の対の形状の組み合わせを互いに異なるようにすることで、以下の効果がある。抽出領域が互いに隣接する次元間では、抽出される特徴量の相関が大きくなる傾向になる。これは抽出領域が互いに隣接する次元間では、２つの次元の抽出領域の間の距離が近いためである（画像内の近い領域の間は相関が高いため）。それらの次元間の抽出領域の対の形状の組み合わせが同じであると、特徴量の相関はさらに大きくなり、特徴ベクトル全体としての冗長性が高くなり、識別能力が低下する。従って、抽出領域が互いに隣接して存在することにより、抽出される特徴量の相関が大きくなるのを打ち消すように、それらの次元間の抽出領域の対の形状の組み合わせを異なるようにすることにより、特徴量の相関を小さくでき、特徴ベクトル全体としての冗長性を小さくし、識別能力の低下を防ぐことができる。

また逆の観点から、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が隣接しないようにすることが望ましい。例えば、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。この場合、例えば、抽出領域の対の形状の組み合わせが同一である全ての次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。

また、抽出領域が一部重複している次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせは互いに異なることが望ましい。例えば、抽出領域が一部重複している次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。この場合、抽出領域が一部重複している全ての次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。また、抽出領域が一部重複している次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。また、抽出領域が一部重複している次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域の対の形状の組み合わせを互いに異なるようにしてもよい。

抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の抽出領域の対の形状の組み合わせを互いに異なるようにすることで、以下の効果がある。抽出領域が一部重複している次元間では、抽出される特徴量の相関が大きくなる傾向になる。これは抽出領域が一部重複する次元間では、特徴量の算出に用いられる領域を一部共有しているためである。それらの次元間の抽出領域の対の形状の組み合わせが同じであると、特徴量の相関はさらに大きくなり、特徴ベクトル全体としての冗長性が高くなり、識別能力が低下する。従って、抽出領域が一部重複することにより、抽出される特徴量の相関が大きくなるのを打ち消すように、それらの次元間の抽出領域の形状の組み合わせを異なるようにすることにより、特徴量の相関を小さくでき、特徴ベクトル全体としての冗長性を小さくし、識別能力の低下を防ぐことができる。

また、抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の抽出領域の対の形状の組み合わせを互いに異なるようにすることで、さらに別の以下の効果がある。抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の抽出領域の対の形状の組み合わせを互いに異なるようにすることで、画像の改竄（特に悪意のある改竄）に対する耐性を強化できる、という効果がある。画像に対する悪意のある改竄は、その画像から抽出される画像識別子（特徴ベクトル）による同一性判定の精度を劣化させる目的で、例えば画像の一部の領域の画素値を変更するなどして行われる。抽出領域が一部重複している次元間では、その画像の重複領域を改竄、すなわちその重複領域の画素値を変更した場合に、そこから抽出される特徴量（領域特徴量）が影響され、改竄前の領域から抽出した特徴量と異なってしまう可能性が高くなる。それらの次元間の抽出領域の対の形状の組み合わせが同じであると、各々の次元の抽出領域から抽出される特徴量（領域特徴量）は同様な影響を受け、同時に特徴量が変更されてしまう可能性が高くなるため、頑健性は低い。それらの次元間の抽出領域の対の形状の組み合わせが異なっていると、重複領域に改竄が行われた場合にも、特徴量が同様な影響を受け、同時に特徴量が変更されてしまう可能性を低くすることができるため、頑健性を確保することができる。すなわち、重複領域を改竄することにより、その重複領域を共有している複数の次元の特徴量を同時に変更してしまうことがより困難となる。従って、抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の抽出領域の対の形状の組み合わせを互いに異なるようにすることで、画像の改竄に対する耐性を強化できる。

また逆の観点から、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が重複しないようにすることが望ましい。例えば、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。この場合、例えば、抽出領域の対の形状の組み合わせが同一である全ての次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。

また、全ての次元の抽出領域を統合した場合に、画像内で特徴量が抽出されない領域が小さくなるような（すなわち、画像のほぼ全画面をカバーする）抽出領域の取り方であることが望ましい。これは、図１８のように、画像内で特徴量が抽出されない領域が多く含まれていると、画像信号（画像を構成する画素の画素値）に含まれる多くの情報を使用しないことになり、識別能力が高くならないためである。全ての次元の抽出領域を統合した場合に、画像内で特徴量が抽出されない領域が小さくなるような（すなわち、画像のほぼ全画面をカバーする）抽出領域の取り方であることにより、画像信号に含まれるより多くの情報を特徴量に反映できるため、識別能力を高くすることができる。また、全ての次元の抽出領域を統合した場合に、抽出領域に偏りがなく、画像全体から満遍なく取得されていることが望ましい。ただし、ある特定の領域にテロップ重畳などの局所的な加工が施される確率が高い場合は、その領域を避けて抽出領域が取得されていることが望ましい。また、画像の縁などの周辺領域には画像の特徴部分が一般的に存在しないことが多いため、周辺領域を避けて抽出領域が取得されていることが望ましい。

その他、抽出領域の大きさ、相対的位置（距離、方向）が一定の分布（例えば一様分布）に従うことが望ましい。その理由は、相対的位置（距離、方向）が一様分布に従うことによって、距離や方向に対して偏りがなく、特定の距離や方向に集中することがないため、より多くの多様性がとれるためである。また、相対的位置が近いほど、その領域間の相関が大きくなるため、それを打ち消すために、相対的位置が近いものほどより形状の差が大きいほうが望ましい。

次元別抽出領域情報は、次元ごとの第１の抽出領域と第２の抽出領域とが一意に特定できる情報であれば、どのような形式の情報であっても構わない。また抽出領域は、如何なるサイズやアスペクト比の画像に対しても、常に同じ領域である必要があるため、次元別抽出領域情報は、如何なるサイズやアスペクト比の画像に対しても、同じ抽出領域を取得できる形式の情報である必要がある。例えば、次元別抽出領域情報は、ある規定のサイズとアスペクト比の画像（例えば、横幅３２０画素×縦幅２４０画素の画像）に対して、その抽出領域の位置・形状を記述したものであってもよい。この場合、ある任意のサイズとアスペクト比で入力された画像に対しては、まず画像をその規定のサイズとアスペクト比にリサイズしてから、次元別抽出領域情報に記述されている抽出領域の位置・形状に従って、抽出領域を特定すればよい。あるいは逆に、入力された画像の任意のサイズとアスペクト比の画像に合わせて、次元別抽出領域情報に記述されている抽出領域の位置・形状を変換して、抽出領域を特定してもよい。

次元別抽出領域情報に含まれる各々の抽出領域を示す情報は、例えば、ある規定のサイズとアスペクト比の画像（例えば、横幅３２０画素×縦幅２４０画素の画像）に対して、抽出領域を構成する全ての画素の座標値の集合を記述した情報であってもよい。また次元別抽出領域情報に含まれる各々の抽出領域を示す情報は、例えば、ある規定のサイズとアスペクト比の画像に対して、抽出領域の位置・形状をパラメータ記述した情報であってもよい。例えば抽出領域の形が四角形である場合は、四角形の四隅の座標値を記述した情報であってもよい。また例えば抽出領域の形が円である場合は、円の中心の座標値と半径の値としてもよい。

また、擬似乱数の種（シード）を次元別抽出領域情報として、抽出領域取得手段２の内部でその種からスタートして擬似乱数を発生させて、乱数に従って異なる形状の抽出領域を生成していく（例えば乱数に従って四角形の四隅を決定していくなど）、という方法も採用することができる。具体的には、例えば以下の手順で、次元別抽出領域を取得することができる。
（1）擬似乱数の種（シード）が次元別抽出領域情報として供給される。
（2）次元ｎ＝１とする。
（3）擬似乱数を発生させ、次元ｎの第１の抽出領域の四角形の四隅を決定する。
（4）擬似乱数を発生させ、次元ｎの第２の抽出領域の四角形の四隅を決定する。
（5）次元ｎ＝ｎ＋１として、（3）へ戻る。

乱数に基づいて抽出領域を決定しているので、生成される抽出領域は次元毎に異なる形状になる。また、擬似乱数のシードが同じであれば、毎回（どの画像に対しても）同じ乱数列が発生されるため、異なる画像に対しても同じ抽出領域が再現される。

抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元決定手段１から供給される次元に対応する第１の抽出領域と第２の抽出領域を示す情報を取得し、抽出領域代表値算出手段３へ供給する。

領域特徴量算出手段３には、抽出領域取得手段２からの入力（第１の抽出領域と第２の抽出領域を示す情報）とは別に、入力として、画像識別子の抽出対象となる画像が供給される。領域特徴量算出手段３は、第１の領域特徴量算出手段３１と第２の領域特徴量算出手段３２とを有する。領域特徴量算出手段３は、第１の領域特徴量算出手段３１を用いて、入力として供給される画像から、次元ごとに、抽出領域取得手段２から供給される第１の抽出領域を示す情報に基づき、第１の抽出領域の特徴量を第１の領域特徴量として算出し、比較手段４へ供給する。また、領域特徴量算出手段３は、第２の領域特徴量算出手段３２を用いて、入力として供給される画像から、次元ごとに、抽出領域取得手段２から供給される第２の抽出領域を示す情報に基づき、第２の抽出領域の特徴量を第２の領域特徴量として算出し、比較手段４へ供給する。

なお、第１の抽出領域と第２の抽出領域を示す情報に基づいて、入力される画像に対するそれぞれの抽出領域を特定するためには、必要に応じて領域特徴量算出手段３は、次元別抽出領域情報の規定のサイズとアスペクト比に画像をリサイズする。

領域特徴量算出手段３は、それぞれの抽出領域に含まれる画素群の画素値を用いて、それぞれの抽出領域の領域特徴量を算出する。ここで画素値とは、画像の各画素が持つ信号の値であり、スカラー量またはベクトル量である。例えば、画像が輝度画像の場合は、画素値は輝度値（スカラー量）である。また例えば、画像がカラー画像の場合は、画素値は色成分を表すベクトル量である。例えばカラー画像がＲＧＢ画像である場合は、画素値はＲ成分、Ｇ成分、Ｂ成分の３次元のベクトル量である。また例えばカラー画像がＹＣｂＣｒ画像である場合は、画素値はＹ成分、Ｃｂ成分、Ｃｒ成分の３次元のベクトル量である。

抽出領域の領域特徴量を算出する方法は、その次元の抽出領域（第１の抽出領域と第２の抽出領域）における算出方法が一定である（どの入力画像に対しても同じ算出方法である）限りは、任意の方法でよい。

また、算出する領域特徴量は、スカラー量でもよいし、ベクトル量であってもよい。例えば、画素値が輝度値などのスカラー量である場合、領域特徴量を、その抽出領域に含まれる画素値の、平均値、メディアン値、最頻値、最大値、最小値、などと算出してもよい（いずれもスカラー量である）。また例えば、抽出領域に含まれる画素値をソートし、分布（ソートされた順列）の上位または下位から規定の割合の位置にある画素値を、領域特徴量として算出してもよい（これもスカラー量である）。より具体的に、規定の割合として、百分率でＰ％とした場合（例えばＰ＝２５％）を例に挙げて説明する。抽出領域に含まれる計Ｎ個の画素の画素値（輝度値）を昇順にソートし、昇順にソートされた画素値（輝度値）の集合をＹ(ｉ)＝｛Ｙ(０)、Ｙ(１)、Ｙ(２)、…、Ｙ(Ｎ−１)｝と表す。ここで、昇順にソートされた順列の下位からＰ％の位置にある画素値は、例えば、Ｙ(ｆｌｏｏｒ(Ｎ×Ｐ／１００))となり、この値を抽出領域の領域特徴量として算出する。なお、ｆｌｏｏｒ(）は、小数点以下の切り捨てを行う関数である。ここで、抽出領域に含まれる画素の輝度値に対して、この式（Ｙ（ｆｌｏｏｒ（Ｎ×Ｐ／１００）））を適用して算出された領域特徴量を、「パーセンタイル輝度値特徴量」と呼ぶことにする。

また例えば、画素値が色成分などのベクトル量の場合は、まずそれらを任意の方法でスカラー量に変換してから、上述した方法によって領域特徴量を算出してもよい。例えば、画素値がＲＧＢ成分の３次元のベクトル量である場合は、まずそれらをスカラー量である輝度値に変換してから、上述した方法によって領域特徴量を算出してもよい。また画素値がベクトル量の場合は、例えば、その抽出領域に含まれる画素値の平均ベクトルを領域特徴量としてもよい。

また例えば、抽出領域に対してエッジ検出や、テンプレートマッチングなどの任意の演算（微分演算、フィルタ演算）を行い、その演算結果を領域特徴量としてもよい。例えば、エッジの方向（勾配の方向）を表す２次元のベクトル量であってもよい。また例えば、あるテンプレートとの類似度などを表すスカラー量であってもよい。

また例えば、抽出領域に含まれる色分布や、エッジの方向分布、エッジの強度分布を表すヒストグラムを、領域特徴量として算出してもよい（いずれもベクトル量である）。

また例えば、国際標準規格ＩＳＯ／ＩＥＣ１５９３８−３に規定されている各種特徴量、すなわち、ＤｏｍｉｎａｎｔＣｏｌｏｒ、ＣｏｌｏｒＬａｙｏｕｔ、ＳｃａｌａｂｌｅＣｏｌｏｒ、ＣｏｌｏｒＳｔｒｕｃｔｕｒｅ、ＥｄｇｅＨｉｓｔｏｇｒａｍ、ＨｏｍｏｇｅｎｅｏｕｓＴｅｘｔｕｒｅ、ＴｅｘｔｕｒｅＢｒｏｗｓｉｎｇ、ＲｅｇｉｏｎＳｈａｐｅ、ＣｏｎｔｏｕｒＳｈａｐｅ、Ｓｈａｐｅ３Ｄ、ＰａｒａｍｅｔｒｉｃＭｏｔｉｏｎ、ＭｏｔｉｏｎＡｃｔｉｖｉｔｙなどであってもよい。

比較手段４は、次元ごとに、領域特徴量算出手段３から供給される第１の領域特徴量と、第２の領域特徴量とを比較し、比較した結果を量子化して得られた量子化インデックスを出力する。比較手段４が、次元ごとに、量子化インデックスを出力することで、最終的に、複数の次元の量子化インデックスから成る量子化インデックスベクトルが出力されることになる。

比較手段４が、第１の領域特徴量と、第２の領域特徴量とを比較して、量子化する方法は、任意である。また、１つの次元当たりの量子化インデックスの数も任意である。

比較手段４は、例えば、領域特徴量がスカラー量である場合（例えば輝度値の平均値）、その大小を比較して第１の領域特徴量のほうが大きい場合は量子化インデックスを＋１、それ以外の場合は量子化インデックスを−１とする、のようにして＋１と−１の２値の量子化インデックスに量子化してもよい。ここで、次元ｎの第１の領域特徴量をＶｎ１、第２の領域特徴量をＶｎ２とすると、次元ｎの量子化インデックスＱｎは、次式で算出することができる。

［式１］
Ｑｎ＝＋１（Ｖｎ１＞Ｖｎ２の場合）
−１（Ｖｎ１≦Ｖｎ２の場合）

ここで、比較手段４が、上述の式１に基づいた比較・量子化を行う場合における、比較手段４のより詳細な構成図を図３に示す。

図３を参照すると、比較手段４は、大小比較手段４１と、量子化手段４２と、から構成されている。

大小比較手段４１は、第１の領域特徴量と、第２の領域特徴量とが供給されると、第１の領域特徴量の値と第２の領域特徴量の値との大小を比較し、その比較結果を量子化手段４２へ供給する。すなわち、大小比較手段４１は、Ｖｎ１とＶｎ２の大小を比較し、比較結果が、Ｖｎ１＞Ｖｎ２であるか、Ｖｎ１≦Ｖｎ２であるか、のいずれであるかを示す情報を、大小比較結果として量子化手段４２へ供給する。

量子化手段４２は、大小比較手段４１から供給される大小比較結果に基づいて、式１に従って量子化を行い、量子化インデックスを出力する。すなわち量子化手段４２は、比較結果がＶｎ１＞Ｖｎ２であることを示す情報が供給される場合は、量子化インデックスを＋１、比較結果がＶｎ１≦Ｖｎ２であることを示す情報が供給される場合は、量子化インデックスを−１、として量子化インデックスを出力する。

なお、この式１に基づいた比較・量子化方法を比較・量子化方法Ａと呼ぶことにする。

また、比較手段４は、例えば、領域特徴量がスカラー量である場合（例えば輝度値の平均値）、差分値の絶対値がある規定の閾値以下の場合は、第１の領域特徴量と第２の領域特徴量との差がないものをみなし、差がないことを示す量子化インデックス０とし、それ以外の場合は、その大小を比較して第１の領域特徴量のほうが大きい場合は量子化インデックスを＋１、それ以外の場合は量子化インデックスを−１とする、のようにして＋１、０、−１の３値の量子化インデックスに量子化してもよい。ここで、次元ｎの第１の領域特徴量をＶｎ１、第２の領域特徴量をＶｎ２とし、規定の閾値をｔｈとすると、次元ｎの量子化インデックスＱｎは、次式で算出することができる。

［式２］
Ｑｎ＝＋１（｜Ｖｎ１−Ｖｎ２｜＞ｔｈかつＶｎ１＞Ｖｎ２の場合）
０（｜Ｖｎ１−Ｖｎ２｜≦ｔｈの場合）
−１（｜Ｖｎ１−Ｖｎ２｜＞ｔｈかつＶｎ１≦Ｖｎ２の場合）

ここで、比較手段４が、上述の式２に基づいた比較・量子化を行う場合における、比較手段４のより詳細な構成図を図４に示す。

図４を参照すると、比較手段４は、差分値算出手段４３と、量子化手段４４と、から構成されている。量子化手段４４には、あらかじめ規定された、量子化の境界を表す情報（量子化境界情報）である閾値が、入力として供給される。

差分値算出手段４３は、第１の領域特徴量と、第２の領域特徴量とが供給されると、第１の領域特徴量の値と第２の領域特徴量の値との差分値を算出し、算出した差分値を量子化手段４４へ供給する。すなわち、差分値算出手段４３は、Ｖｎ１−Ｖｎ２を算出し、その値を量子化手段４４へ供給する。

量子化手段４４は、差分値算出手段４３から供給される差分値と、入力として供給されるあらかじめ規定された量子化の境界を表す情報（量子化境界情報）である閾値とに基づいて、式２に従って量子化を行い、量子化インデックスを出力する。すなわち量子化手段４２は、差分値算出手段４１から供給されるＶｎ１−Ｖｎ２の値と、入力として供給される閾値ｔｈとに基づいて、｜Ｖｎ１−Ｖｎ２｜＞ｔｈかつＶｎ１−Ｖｎ２＞０の場合は量子化インデックスを＋１、｜Ｖｎ１−Ｖｎ２｜＞ｔｈかつＶｎ１−Ｖｎ２≦０の場合は量子化インデックスを−１、｜Ｖｎ１−Ｖｎ２｜≦ｔｈの場合は量子化インデックスを０、として量子化インデックスを出力する。

なお、この式２に基づいた比較・量子化方法を比較・量子化方法Ｂと呼ぶことにする。

また、ここでは差分値に基づいて３値に量子化しているが、差分値の大きさに応じて、より多数（のレベルの）の量子化インデックスに量子化してもよい。この場合も、比較手段４は、図４に示した構成をとり、量子化手段４４には、あらかじめ規定された、各レベルの量子化の境界を表す情報（量子化境界情報）として複数の閾値が、入力として供給される。なお、この差分値と、入力として供給される複数の閾値とに基づいて、４レベル以上の複数のレベルの量子化インデックスに量子化する比較・量子化方法を比較・量子化方法Ｃと呼ぶことにする。

このように、第１の領域特徴量と第２の領域特徴量との差が小さい（規定の閾値以下の）ときに、差がないものとして、差がないことを表す量子化インデックスを導入することで、式１の方法に比べて、領域特徴量の差が小さい抽出領域の対の次元の特徴量（量子化インデックス）をより安定に、すなわち各種改変処理やノイズに対してより頑健に、することができる。そのため、局所領域間の特徴の差が全体的に少ない、全体的に変化の少ない平坦な画像（例えば青空の画像）に対しても安定した、すなわち各種改変処理やノイズに対しても頑健な、画像識別子（量子化インデックスベクトル）を出力することができる。

また、比較手段４は、例えば、領域特徴量がベクトル量である場合は、ベクトル量をまずそれらを任意の方法でスカラー量に変換してから、上述した方法によって量子化を行ってもよい（この比較・量子化方法を比較・量子化方法Ｄと呼ぶことにする）。また例えば、第１の抽出領域のベクトルから第２の抽出領域のベクトルとの差分である差分ベクトルを算出し、差分ベクトルをベクトル量子化して量子化インデックスを算出してもよい。この場合は、例えば、あらかじめ規定された量子化インデックスごとの代表ベクトル（重心ベクトルなど）が供給され、それら代表ベクトルと差分ベクトルとの類似度が最も大きく（距離が最も小さく）なる量子化インデックスに分類してもよい（この比較・量子化方法を比較・量子化方法Ｅと呼ぶことにする）。また、上述の式２によるスカラー量の量子化と同様に、差分ベクトルのノルムがある規定の閾値以下の場合は、第１の領域特徴量と第２の領域特徴量との差がないものをみなし、差がないことを示す量子化インデックス０として、差がないことを表す量子化インデックスを導入してもよい。

なお、本発明で出力される量子化インデックスベクトルを照合する際（ある画像から抽出した量子化インデックスベクトルと、別の画像から抽出した量子化インデックスベクトルとを比較して、それらの画像が同一であるか否かを判定する際）は、量子化インデックスが一致する次元数（類似度）、あるいは量子化インデックスが非一致である次元数（ハミング距離）を同一性尺度として算出し、算出された同一性尺度をある閾値と比較して、画像の同一性の判定を行うことができる。

また、比較手段４において、量子化インデックスが式２に基づいて算出された場合は、以下のように同一性尺度（類似度）を算出することができる。まず、２つの画像の量子化インデックスベクトルを対応する次元どうしで比較して、「共に量子化インデックスが０」ではない次元の数を算出する（この値をＡとする）。次に、「共に量子化インデックスが０」ではない次元において、量子化インデックスが一致する次元の数を算出する（この値をＢとする）。そして、類似度をＢ／Ａとして算出する。ここでＡ＝０の場合（すなわち、全ての次元が共に量子化インデックスが０となる場合）は、類似度を規定の数値（例えば０．５）とする。

また、「共に量子化インデックスが０」ではない次元において、量子化インデックスが非一致である次元の数を算出し（この値をＣとする）、同一性尺度（距離）をＣ／Ａとして算出してもよい。ここでＡ＝０の場合（すなわち、全ての次元が共に量子化インデックスが０となる場合）は、同一性尺度（距離）を規定の数値（例えば０．５）とする。この同一性尺度をＣ／Ａとして算出する方法の効果を、同一性尺度をＢ／Ａとして算出する方法と対比して、以下に示す。ここで、Ｂ＋Ｃ＝Ａであるため、Ｂ（量子化インデックスが一致する次元の数）を算出してＢ／Ａを算出するのと、Ｃ（量子化インデックスが非一致である次元の数）を算出してＣ／Ａを算出するのとでは、画像の同一性判定の判定精度には影響しない（なぜならば、Ｂ／Ａ＝１−Ｃ／Ａ、Ｃ／Ａ＝１−Ｂ／Ａ、であり、Ｂ／Ａは同一性尺度を「類似度」として算出しているのに対して、Ｃ／Ａは同一性尺度を「距離」として算出している、という違いだけであるため）しかしながら、算出される同一性尺度をあらかじめ与えられた閾値と比較して同一性の判定を行う際に、計算コストを軽減するために同一性尺度の算出の打ち切りを行う場合に、２つの方法の間に計算コストの差が発生する。同一性尺度の算出の打ち切りは次のように行う。あらかじめ、同一性判定のための閾値が与えられる。次元ごとに逐次、量子化インデックスが｛一致・非一致｝であるかを判定し、量子化インデックスが｛一致する・非一致である｝次元数の値を算出（増分）していき、逐次閾値と比較していく。量子化インデックスが｛一致する・非一致である｝次元数が、閾値を超えた時点で、計算を打ち切ることができる（それ以上計算しても、閾値を超えることは自明であるため）。ここで一般的に、同一性判定の閾値は、同一性尺度（類似度）をＢ／Ａと算出する場合は０．５（半分）よりも大きな値を、同一性尺度（距離）をＣ／Ａと算出する場合は０．５（半分）よりも小さな値を設定する（前者の場合は算出した値が閾値よりも大きければ同一と判定し、後者の場合は算出した値が閾値よりも小さければ同一と判定する）。例えばＢ／Ａと算出する場合には閾値を０．８と設定し、Ｃ／Ａと算出する場合には閾値を０．２などと設定する。ここでＡ＝１００とすると、Ｂ／Ａと算出する場合はＢの値を次元ごとに逐次計算していき、Ｂが８０を超えた場合に計算を打ち切ることができる。Ｃ／Ａと算出する場合はＣの値を次元ごとに逐次計算していき、Ｃが２０を超えた場合に計算を打ち切ることができる。すなわち、Ｂを計算する場合は値が８０を超えるまで打ち切ることができないが、Ｃを計算する場合は値が２０を超えた時点で打ち切ることができる。そのため、同一性尺度をＣ／Ａと算出するほうが、Ｂ／Ａと算出するよりも、より早い時点で計算を打ちきることができるため、計算コストを軽減することができる、という効果がある。

またここで、「共に量子化インデックスが０」である次元の数をＤとして算出し（ここで全次元数をＮとすると、Ａ＋Ｄ＝Ｎ）、任意の、Ｄの単調非増加関数ｆ(Ｄ)を用いて、同一性尺度をＢ／ｆ(Ｄ)、または、Ｃ／ｆ(Ｄ)、として算出してもよい。なおＤの単調非増加関数ｆ(Ｄ)とは、Ｄ１＜Ｄ２に対してｆ(Ｄ１)≧ｆ(Ｄ２)が成り立つ関数である。Ｄに対するｆ(Ｄ)の例を図示したグラフを図３２に示す（横軸がＤで、縦軸がｆ(Ｄ)である）。図３２において関数(i)は、ｆ(Ｄ)＝定数であり、同一性尺度を、単にＢまたはＣとして算出するのと同値になる。また関数(ii)は、ｆ(Ｄ)＝Ｎ−Ｄ＝Ａであり、上述した、同一性尺度をＢ／ＡやＣ／Ａとして算出する方法と同値になる。ここでｆ(Ｄ)は関数(i)や関数(ii)のようにＤに対して線形である必要はなく、Ｄの単調非増加関数である限りは、関数(iii)や関数(iv)のように非線形な関数であってもよい。このように、任意の、Ｄの単調非増加関数ｆ(Ｄ)を用いて同一性尺度をＢ／ｆ(Ｄ)またはＣ／ｆ(Ｄ)として算出することの効果を以下に述べる。量子化インデックス０は、式２を参照すると、２つの抽出領域の領域特徴量の値に差がない（閾値以下である）ことを示している。局所領域間の特徴の差が全体的に少ない、全体的に変化の少ない平坦な画像領域（空の領域、白い壁の領域、など）では、量子化インデックス０が多発する傾向があり（例えば全体的に平坦な青空の画像などでは、ほとんど全ての次元が量子化インデックス０となる）、またこのような平坦な画像領域は多くの画像に含まれるため、量子化インデックスが０である次元は、画像の同一性を判定する上での有効性が低いと考えられる。比較している２つの画像の量子化インデックスベクトルで、「共に量子化インデックスが０」である次元は、２つの画像の量子化インデックスベクトルを比較して同一性を判定するうえで有効性の低い次元であるということが考えられる。ＢやＣは、有効性の低い「共に量子化インデックスが０」である次元を除外し、有効性の高い「共に量子化インデックスが０」でない次元に限定して、量子化インデックスが一致する次元数（Ｂ）、あるいは量子化インデックスが非一致である次元数（Ｃ）として算出している。有効性の低い次元を除外し、有効性の高い次元に限定して同一性尺度を算出することで、画像の同一性判定の高精度な照合を実現することができる。そして、ｆ(Ｄ)は、「共に量子化インデックスが０」である次元数、すなわち有効性が低い次元の数に応じて、ＢやＣの値を正規化している（Ｄが大きいほどＡが小さくなり、ＢやＣの値が小さくなるため、Ｄに対して単調非増加な関数で正規化する）。ここで正規化の関数を任意の単調非増加関数とすることで、同一性尺度の振る舞いを調整（制御）することができ、同一性判定を行う画像データベースや、アプリケーションに応じて最適化することができる、という効果がある。

前段落（段落００７６）で述べた同一性尺度の算出方法は、有効性の低い「共に量子化インデックスが０」である次元を除外し、有効性の高い「共に量子化インデックスが０」でない次元に限定して、同一性尺度を算出した。しかし有効性の低い「共に量子化インデックスが０」である次元を完全に除外せずに、「共に量子化インデックスが０」である次元数であるＤに対して単調非減少関数ｇ(Ｄ)を用いて、同一性尺度を(Ｂ／f(Ｄ))＋ｇ(Ｄ)として算出してもよい。ここで、前半のＢ／f（Ｄ）は、有効性の高い「共に量子化インデックスが０」でない次元から算出された同一性尺度、後半のｇ(Ｄ)は有効性の低い「共に量子化インデックスが０」である次元から算出された同一性尺度であり、その和として全体の同一性尺度を定義している。ここで、前半のＢ／f(Ｄ)よりも後半のｇ(Ｄ)の影響（重み）が小さくなるように、単調非減少関数ｇ(Ｄ)を設計することで、有効性の高い前半のＢ／f(Ｄ)の重みを大きくした形で同一性尺度を算出することができる。例えばある小さな重み値βを用いて、同一性尺度を(Ｂ／f(Ｄ))＋β×Ｄ、として算出してもよい。さらに、また例えば、ｆ(Ｄ)＝定数である場合に、1／ｆ(Ｄ)＝αと置くと、同一性尺度をα×Ｂ＋β×Ｄ、として算出してもよい。このように、有効性の高い「共に量子化インデックスが０」でない次元と、有効性の低い「共に量子化インデックスが０」である次元とを分けて同一性尺度を算出することで、全ての次元を考慮しつつ、有効性の高い次元と有効性の低い次元との相対的な重みを調整（制御）することができ（有効性の高い次元の重みを大きくする、など）、同一性判定を行う画像データベースや、アプリケーションに応じて最適化することができる、という効果がある。

なお、段落００７４から段落００７７においては、比較する２つの量子化インデックスベクトルにおいて、「共に量子化インデックスが０」である次元（の数）、および「共に量子化インデックスが０」でない次元（の数）、を基準に同一性尺度の算出方法を説明しているが、それぞれを「いずれか一方の量子化インデックスが０」である次元（の数）、および「いずれか一方の量子化インデックスが０」でない次元（の数）、を基準に、同様な計算方法で同一性尺度を算出してもよい。すなわち、段落００７４から段落００７７における「共に量子化インデックスが０」である次元（の数）、および「共に量子化インデックスが０」でない次元（の数）を、それぞれ、「いずれか一方の量子化インデックスが０」である次元（の数）、および「いずれか一方の量子化インデックスが０」でない次元（の数）と読み替えてもよい。

段落００７４から段落００７８で述べた照合方法（同一性尺度の算出方法）は、量子化インデックスが式２に基づいて算出された場合として説明しているが、量子化インデックスが式２に基づいて算出された場合に限らず、比較手段４において、２つの抽出領域（第１の抽出領域と第２の抽出領域）の特徴量である第１の領域特徴量と第２の領域特徴量との差がない（差が小さい、差が規定の閾値以下）ことを表す量子化インデックスを導入した量子化方法を用いていれば、適用することができる。すなわち、段落００７４から段落００７８における量子化インデックス０を、「第１の領域特徴量と第２の領域特徴量との差がない（差が小さい、差が規定の閾値以下）ことを表す量子化インデックス」と解釈すればよい。

段落００７３から段落００７９において説明した、２つの画像から抽出した量子化インデックスベクトルを照合する方法により同一性尺度を算出する手段を照合手段とすると、照合手段を構成要素とする画像識別子照合装置を構成することができる。照合手段は、比較手段４から出力される第１の画像の量子化インデックスベクトルと第２の画像の量子化インデックスベクトルを比較し、同一性尺度を算出して出力する。また、画像識別子照合装置は、照合手段に加えて同一性判定手段を備えることもできる。同一性判定手段は、照合手段から供給される同一性尺度を、あらかじめ与えられる閾値と大小の比較をし、第１の画像と第２の画像が同一であるか否かを判定し、その判定結果を出力する。

なお、段落００７３から段落００８０において説明した量子化インデックスベクトルを照合する方法は、後述する全ての実施の形態（第２の実施の形態、第３の実施の形態、第４の実施の形態、その他の実施の形態）に対しても適用できる。

［第１の実施の形態の動作］
次に、図５のフローチャートを参照して、第１の実施の形態における画像識別子抽出装置の動作を説明する。図５のフローチャートでは、特徴ベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。

まず、次元決定手段１は、抽出する特徴ベクトルの最初の次元として、次元１を決定し（ｎ＝１）、抽出領域取得手段２へ供給する（ステップＡ１）。

次に、抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元ｎの第１の抽出領域と第２の抽出領域とを示す情報を取得し、領域特徴量算出手段３へ供給する（ステップＡ２）。

次に、領域特徴量算出手段３は、入力として供給される画像から、次元ｎの第１の領域特徴量と、第２の領域特徴量とを算出し、比較手段４へ供給する（ステップＡ３）。

次に、比較手段４は、次元ｎの第１の領域特徴量と第２の領域特徴量とを比較し、比較した結果を量子化して、量子化インデックスを出力する（ステップＡ４）。

次に、全ての次元に対して量子化インデックスの出力が終了したか否かを判定（すなわちｎ＜Ｎが真であるか偽であるかを判定）する（ステップＡ５）。全ての次元に対して量子化インデックスの出力が終了した場合（すなわちｎ＜Ｎが偽である場合）は処理を終了する。全ての次元に対して量子化インデックスの出力が終了していない場合（すなわちｎ＜Ｎが真である場合）は、ステップＡ６へ移行する。ステップＡ６では、次元決定手段１が、抽出する特徴ベクトルの次元として、次の次元を決定し（ｎ＝ｎ＋１）、抽出領域取得手段２へ供給する。そして、再度ステップＡ２へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。またこの処理手順に限らず、複数の次元に対する抽出処理を並列に行うようにしてもよい。

[第１の実施の形態の効果]
次に、本発明の第１の実施の形態の効果について説明する。

第１の効果は、複数の次元から成る特徴ベクトルで構成される画像識別子の、異なる画像を識別できる度合いである識別能力を高くすることができることである。特に、画像の局所領域間の相関が大きい画像に対して、この効果は顕著である。

その理由は、次元間で特徴量を抽出する領域の形状が異なる（領域の形状に多様性がある）ことにより、次元間の相関を小さくできるからである。

第２の効果は、特定の周波数に信号が集中している画像に対しても、識別能力が低下することがないことである。

その理由は、次元間で特徴量を抽出する領域の形状が異なる（領域の形状に多様性がある）ことにより、ある特定の周波数に信号が集中している画像に対しても、同時に全ての（多くの）抽出領域の対（次元）の間で特徴量の差が無くなり識別能力が低下するようなことが発生しにくくなるからである。

[第２の実施の形態]
[第２の実施の形態の構成]
次に、本発明の第２の実施の形態について図面を参照して詳細に説明する。

本発明の第２の実施の形態は、図１に示した第１の実施の形態における比較手段４が、図６に詳細を示す比較手段４Ａに置き換わる点において、異なる。比較手段４Ａ以外に関しては、第１の実施の形態と同様であるため、ここでは説明を省略する。

図６を参照すると、比較手段４Ａは、差分値算出手段４３と、量子化境界決定手段４５と、量子化手段４４と、から構成されている。

差分値算出手段４３は、次元ごとに、領域特徴量算出手段３から供給される第１の領域特徴量と、第２の領域特徴量との差分値を算出し、量子化境界決定手段４５と、量子化手段４４とへ供給する。

差分値は、領域特徴量がスカラー量の場合（例えば輝度値の平均値）は、例えば、第１の領域特徴量から第２の領域特徴量を（あるいはその逆）減算して得られたスカラー量である。また、領域特徴量がベクトル量の場合は、例えば、それぞれのベクトルを任意の方法でスカラー量に変換してから、スカラー量の差分値を求めてもよい。また、領域特徴量がベクトル量の場合は、第１の領域特徴量と第２の領域特徴量との差分ベクトルを、差分値（ベクトル量）としてもよい。

量子化境界決定手段４５は、差分値算出手段４３から供給される特徴ベクトルの全ての次元の差分値が供給されると、全ての次元の差分値の分布に基づいて、量子化の境界を決定し、決定した量子化境界の情報を量子化手段４４へ供給する。ここで全ての次元の差分値の分布とは、差分値（あるいは差分ベクトル）に対する生起の頻度（確率）である。

また量子化の境界を決定するとは、差分値を量子化する際に、漏れなく、かつ排他的に量子化インデックスに割り当てるためのパラメータを決定する、ということである。差分値がスカラー量である場合は、例えば、各量子化インデックス（量子化レベル）に対する値域（すなわち閾値）を決定し、その値域（閾値）を量子化境界の情報として量子化手段４３へ供給する。また差分値がベクトル量である場合は、例えばベクトル量子化を行うためのパラメータ、例えば、各量子化インデックスの代表ベクトル（重心ベクトルなど）を決定し、それを量子化境界の情報として量子化手段４４へ供給する。

量子化境界決定手段４５は、差分値がスカラー量の場合であって、Ｍ値の量子化を行う場合（Ｍ＝２、３、…など）に、全ての次元の差分値の分布に基づいて、それぞれの量子化インデックスの全次元に対する割合が均等になるように、量子化の値域（閾値）を決定してもよい。

例えば、前記式１の変形として、定数αを用いて、Ｖｎ１＋α＞Ｖｎ２の場合は量子化インデックス＋１、Ｖｎ１＋α≦Ｖｎの場合は量子化インデックス−１とする２値の量子化（Ｍ＝２）の場合に、量子化インデックスの＋１と−１の割合が均等になるように、差分値の分布の中央の点（左右の分布の積分値が等しくなる点）を量子化の閾値αとして決定してもよい。また差分値がベクトル量である場合も同様に、Ｍ値の量子化を行う場合に、全ての次元の差分ベクトルの分布に基づいて、それぞれの量子化インデックスの全次元に対する割合が均等になるように、各量子化インデックスに割り当てられるベクトル空間の領域を決定したり、ベクトル量子化を行う際の各量子化インデックスの代表ベクトル（重心ベクトルなど）を決定してもよい。このように、どの画像に対しても、全次元に対する量子化インデックスの割合を均等にすることで（すなわち、量子化インデックスの偏りを無くす）、エントロピーを高くすることができるため、識別能力を高くすることができる。

なお、量子化境界決定手段４５が、量子化インデックスの全次元に対する割合が均等になるように量子化の境界を決定し、それに基づいて量子化手段４４が量子化を行う比較・量子化方法を、比較・量子化方法Ｆと呼ぶことにする。

また例えば、量子化境界決定手段４５は、差分値がスカラー量の場合であって、上述の式２による３値の量子化を行う場合に（量子化インデックスが＋１、０、−１）、差分がないことを示す量子化インデックス０に量子化する際の閾値ｔｈ（この閾値以下の場合に量子化インデックスを０とする）を、全ての次元の差分値の分布に基づいて決定し、決定した閾値ｔｈを量子化手段４４へ供給してもよい（第１の実施の形態の図４の比較手段４では、この閾値ｔｈはあらかじめ規定されているものである）。例えば、全ての次元の差分値の絶対値を算出し、算出した差分値の絶対値をソートして、その上位または下位から、ある規定の割合（なおこの規定の割合は、例えば、入力として供給されるとする）の点を閾値ｔｈとしてもよい（この比較・量子化方法を比較・量子化方法Ｇと呼ぶことにする）。またここで規定の割合ではなく、＋１、０、−１の量子化インデックスの割合が均等に近づくように、閾値ｔｈを決定してもよい（この比較・量子化方法を比較・量子化方法Ｈと呼ぶことにする）。比較・量子化方法Ｈは、式２に従った場合の、比較・量子化方法Ｆの具体例に相当する。

比較・量子化方法Ｇのより具体的な方法を、規定の割合として、百分率でＰ％とした場合（例えばＰ＝２５％）を例に挙げて説明する。全ての次元（次元数＝Ｎとする）の差分値の絶対値を、昇順にソートし、昇順にソートされた差分値の絶対値の集合をＤ(ｉ)＝｛Ｄ(０)、Ｄ(１)、Ｄ(２)、…、Ｄ(Ｎ−１)｝と表す。ここで、昇順にソートされた順列の下位からＰ％の位置にある値は、例えば、Ｄ(ｆｌｏｏｒ(Ｎ×Ｐ／１００))となり、閾値ｔｈ＝Ｄ(ｆｌｏｏｒ(Ｎ×Ｐ／１００))となる。なお、ｆｌｏｏｒ(）は、小数点以下の切り捨てを行う関数である。

本実施の形態における方法は、第１の実施の形態における、比較手段４が図４の構成をとる場合と対比することができる。第１の実施の形態における図４の構成では、あらかじめ規定された閾値ｔｈが入力として供給されるのに対して、第２の実施の形態における上述の方法は、量子化境界決定手段４５において、全ての次元の差分値の分布に基づいて、画像に対して適応的に閾値ｔｈが算出される。このように第１の実施の形態では閾値ｔｈが固定化されており、第２の実施の形態では閾値ｔｈが画像に適応的に算出される。画像に適応的に閾値ｔｈが算出されることで、閾値ｔｈが固定化されている場合と比較して、特徴ベクトルの次元の値が、特定の量子化インデックスに偏る（特定の量子化インデックスの出現確率が高い）ことを抑えることができるため（特に起伏の少ない画像に対してなど）、識別能力を高くすることができる。例えば、第１の実施の形態における固定化された閾値ｔｈを用いた場合、起伏の少ない画像は、特徴ベクトルの大多数の次元（または全ての次元）が量子化インデックス０になってしまうのに対して、第２の実施の形態における適応的な閾値ｔｈを用いると、起伏の少ない画像に対しては閾値ｔｈが小さい値に自動的に調整されるため、特徴ベクトルの大多数の次元が量子化インデックス０になるような事態が発生しない。

量子化手段４４は、次元ごとに、差分値算出手段４３から供給される次元ごとの差分値と、量子化境界決定手段４５から供給される量子化境界の情報とに基づいて、量子化を行い、量子化インデックスを出力する。

なお、量子化手段４４は、量子化境界決定手段４５が出力した量子化境界の情報を無視した量子化を行っては意味がなくなるため、量子化境界決定手段４５で量子化境界を決定した際に想定していた量子化方法に従う必要がある。

[第２の実施の形態の動作]
次に、図７のフローチャートを参照して、第２の実施の形態における画像識別子抽出装置の動作を説明する。図７のフローチャートでは、特徴ベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。

まず、次元決定手段１は、抽出する特徴ベクトルの最初の次元として、次元１を決定し（ｎ＝１）、抽出領域取得手段２へ供給する（ステップＢ１）。

次に、抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元ｎの第１の抽出領域と第２の抽出領域とを示す情報を取得し、抽出領域代表値算出手段３へ供給する（ステップＢ２）。

次に、抽出領域代表値算出手段３は、入力として供給される画像から、次元ｎの第１の領域特徴量と、第２の領域特徴量とを算出し、差分値算出手段４３へ供給する（ステップＢ３）。

次に、差分値算出手段４３は、次元ｎの第１の領域特徴量と第２の領域特徴量との差分値を算出し、量子化境界決定手段４５と、量子化手段４４とへ供給する（ステップＢ４）。

次に、全ての次元に対する差分値の算出までの処理が終了したか否かを判定（すなわちｎ＜Ｎが真であるか偽であるかを判定）する（ステップＢ５）。全ての次元に対する差分値算出までの処理を終了した場合（すなわちｎ＜Ｎが偽である場合）はステップＢ７へ移行する。全ての次元に対する処理が終了していない場合（すなわちｎ＜Ｎが真である場合）は、ステップＢ６へ移行する。ステップＢ６では、次元決定手段１が、抽出する特徴ベクトルの次元として、次の次元を決定し（ｎ＝ｎ＋１）、抽出領域取得手段２へ供給する。そして、再度ステップＢ２へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。

次に、量子化境界決定手段４５は、差分値算出手段４３から供給される特徴ベクトルの全ての次元の差分値が供給されると、全ての次元の差分値の分布に基づいて、量子化の境界を決定し、決定した量子化境界の情報を量子化手段４４へ供給する（ステップＢ７）。

次にステップＢ８では、量子化を行う（量子化インデックスを算出する）特徴ベクトルの最初の次元として、次元１をセット（ｎ＝１）する。

次に、量子化手段４４は、次元ｎの差分値と、量子化境界決定手段４５から供給される量子化境界とに基づいて、量子化を行い、量子化インデックスを出力する（ステップＢ９）。

次に、全ての次元に対する量子化インデックスの出力が終了したか否かを判定（すなわちｎ＜Ｎが真であるか偽であるかを判定）する（ステップＢ１０）。全ての次元に対する量子化インデックスの出力を終了した場合（すなわちｎ＜Ｎが偽である場合）は処理を終了する。全ての次元に対する量子化インデックスの出力が終了していない場合（すなわちｎ＜Ｎが真である場合）は、ステップＢ１１へ移行する。ステップＢ１１では、量子化を行う（量子化インデックスを算出する）特徴ベクトルの次元として、次の次元をセットする（ｎ＝ｎ＋１）。そして、再度ステップＢ９へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に量子化処理を行っているが、順番はこれに限らず任意でよい。

[第２の実施の形態の効果]
第２の実施の形態では、量子化の境界が固定されている第１の実施の形態と比較して、量子化の境界が画像に対して適応的に（動的に）算出される点が異なる。第１の実施の形態のように、量子化の境界が固定化されていると、特定の画像（例えば起伏の少ない平坦な画像など）に対して、特徴ベクトルの次元の値が、特定の量子化インデックスに偏る（特定の量子化インデックスの出現確率が高い）という事態が発生し（エントロピーが低くなる）、これらの画像に対して識別能力が低下するという問題が発生する。一方で第２の実施の形態のように、量子化の境界が画像に対して適応的に（動的に）算出されることにより、どの画像に対しても、特徴ベクトルの次元の値が、特定の量子化インデックスに偏る（特定の量子化インデックスの出現確率が高い）ことを抑えることができるため、識別能力を高くすることができる。

[第３の実施の形態]
[第３の実施の形態の構成]
次に、本発明の第３の実施の形態について図面を参照して詳細に説明する。

図８を参照すると、本発明の第３の実施の形態は、図１に示した第１の実施の形態の構成に、領域特徴量算出方法取得手段５が追加され、領域特徴量算出手段３が、第１および第２の領域特徴量算出手段３１Ａおよび３２Ａを有する領域特徴量算出手段３Ａに置き換わる点で異なる。なお、それ以外の構成に関しては、第１の実施の形態の構成と同様であるため、ここでは説明を省略する。なお、ここでは、第１の実施の形態との組み合わせとして説明しているが、第２の実施の形態との組み合わせであってもよい。

領域特徴量算出方法取得手段５には、次元決定手段１からの次元と、次元別領域特徴量算出方法情報とが供給される。

次元別領域特徴量算出方法情報は、あらかじめ規定された、特徴ベクトルの次元ごとに対応付けられた、その次元での領域特徴量の算出方法を示す情報であり、次元間で領域特徴量算出方法が異なることが必須条件である。なおここで、領域特徴量算出方法が異なるとは、同一の手順に対して異なるパラメータ（閾値など）を適用する場合も含む。

ここで領域特徴量算出方法とは、例えば、第１の実施の形態の領域特徴量算出手段３の説明で記述した各種方法、またそれに伴うパラメータなどである。

なお次元別領域特徴量算出方法情報が示す次元ごとの領域特徴量算出方法は、特徴ベクトルの全次元の中に、領域特徴量算出方法の異なる次元のペアが、少なくとも１つ存在することが最低条件である。領域特徴量算出方法が相互に異なる次元が多いほど、望ましい。これは、領域特徴量算出方法が相互に異なる次元が多いほど、特徴ベクトルのより多くの次元間で相関が小さくなり、識別能力が高くなるからである。例えば、特徴ベクトルの全ての次元間で、領域特徴量算出方法が相互に異なっていてもよい。

なお、次元ごとの領域特徴量算出方法を示す情報の形式は、領域特徴量を算出する方法が一意に特定される限りは、任意の形式であってよい。

図９に、次元ごとの領域特徴量算出方法の例を示す。図９に示すように、次元間で領域特徴量算出方法が異なる。また図９に示した例のように、スカラー量とベクトル量の特徴量が混在していてもよい（第１、３、５、６、８、９、１０、１２次元はスカラー量、第２、４、７、１１次元はベクトル量）。

また、抽出領域が互いに近傍に存在する次元間（次元ペア）では、それらの次元間（次元ペア）の領域特徴量算出方法が異なることが望ましい。例えば、抽出領域が互いに近傍に存在する次元間（次元ペア）では、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。この場合、抽出領域が互いに近傍に存在する全ての次元間（次元ペア）において、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。また、抽出領域が互いに近傍に存在する次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。また、抽出領域が互いに近傍に存在する次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。

抽出領域が互いに近傍に存在する次元間（次元ペア）で、それらの次元間の領域特徴量算出方法が異なるようにすることで、以下の効果がある。抽出領域が互いに近傍に存在する次元間では、抽出される特徴量の相関が大きくなる傾向になる。それらの次元間の領域特徴量算出方法が同じであると、特徴量の相関はさらに大きくなり、特徴ベクトル全体としての冗長性が高くなり、識別能力が低下する。従って、抽出領域が互いに近傍に存在することにより、抽出される特徴量の相関が大きくなるのを打ち消すように、それらの次元間の領域特徴量算出方法が異なるようにすることにより、特徴量の相関を小さくでき、特徴ベクトル全体としての冗長性を小さくし、識別能力の低下を防ぐことができる。

また逆の観点から、領域特徴量算出方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域の間の距離が大きいほうが望ましい。例えば、領域特徴量算出方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。この場合、例えば、領域特徴量算出方法が同一である全ての次元間（次元ペア）において、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。また、領域特徴量算出方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。また、領域特徴量算出方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。

また、抽出領域が隣接する次元間（次元ペア）では、それらの次元間（次元ペア）の領域特徴量算出方法が異なることが望ましい。ここで、抽出領域が隣接する次元間（次元ペア）とは、抽出領域の一部の周囲が互いに接している、ということである。例えば、抽出領域が隣接する次元間（次元ペア）では、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。この場合、抽出領域が隣接する全ての次元間（次元ペア）において、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。また、抽出領域が隣接する次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。また、抽出領域が隣接する次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。

抽出領域が互いに隣接する次元間（次元ペア）で、それらの次元間の領域特徴量算出方法が異なるようにすることで、以下の効果がある。抽出領域が互いに隣接する次元間では、抽出される特徴量の相関が大きくなる傾向になる。これは抽出領域が互いに隣接する次元間では、２つの次元の抽出領域の間の距離が近いためである（画像内の近い領域の間は相関が高いため）。それらの次元間の領域特徴量算出方法が同じであると、特徴量の相関はさらに大きくなり、特徴ベクトル全体としての冗長性が高くなり、識別能力が低下する。従って、抽出領域が互いに隣接して存在することにより、抽出される特徴量の相関が大きくなるのを打ち消すように、それらの次元間の領域特徴量算出方法が異なるようにすることにより、特徴量の相関を小さくでき、特徴ベクトル全体としての冗長性を小さくし、識別能力の低下を防ぐことができる。

また逆の観点から、領域特徴量算出方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が隣接しないようにすることが望ましい。例えば、領域特徴量算出方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。この場合、例えば、領域特徴量算出方法が同一である全ての次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。また、領域特徴量算出方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。また、領域特徴量算出方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。

また、抽出領域が一部重複している次元間（次元ペア）では、それらの次元間（次元ペア）の領域特徴量算出方法が異なることが望ましい。例えば、抽出領域が一部重複している次元間（次元ペア）では、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。この場合、抽出領域が一部重複している全ての次元間（次元ペア）において、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。また、抽出領域が一部重複している次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。また、抽出領域が一部重複している次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の領域特徴量算出方法が異なるようにしてもよい。

抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の領域特徴量算出方法が異なるようにすることで、以下の効果がある。抽出領域が一部重複している次元間では、抽出される特徴量の相関が大きくなる傾向になる。これは抽出領域が一部重複する次元間では、特徴量の算出に用いられる領域を一部共有しているためである。それらの次元間の領域特徴量算出方法が同じであると、特徴量の相関はさらに大きくなり、特徴ベクトル全体としての冗長性が高くなり、識別能力が低下する。従って、抽出領域が一部重複することにより、抽出される特徴量の相関が大きくなるのを打ち消すように、それらの次元間の領域特徴量算出方法が異なるようにすることにより、特徴量の相関を小さくでき、特徴ベクトル全体としての冗長性を小さくし、識別能力の低下を防ぐことができる。

また、抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の領域特徴量算出方法が異なるようにすることで、さらに別の以下の効果がある。抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の領域特徴量算出方法が異なるようにすることで、画像の改竄（特に悪意のある改竄）に対する耐性を強化できる、という効果がある。画像に対する悪意のある改竄は、その画像から抽出される画像識別子（特徴ベクトル）による同一性判定の精度を劣化させる目的で、例えば画像の一部の領域の画素値を変更するなどして行われる。抽出領域が一部重複している次元間では、その画像の重複領域を改竄、すなわちその重複領域の画素値を変更した場合に、そこから抽出される特徴量（領域特徴量）が影響され、改竄前の領域から抽出した特徴量と異なってしまう可能性が高くなる。それらの次元間の領域特徴量算出方法が同じであると、各々の次元の抽出領域から抽出される特徴量（領域特徴量）は同様な影響を受け、同時に特徴量が変更されてしまう可能性が高くなるため、頑健性は低い。それらの次元間の領域特徴量算出方法が異なっていると、重複領域に改竄が行われた場合にも、特徴量が同様な影響を受け、同時に特徴量が変更されてしまう可能性を低くすることができるため、頑健性を確保することができる。すなわち、重複領域を改竄することにより、その重複領域を共有している複数の次元の特徴量を同時に変更してしまうことがより困難となる。従って、抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の領域特徴量算出方法が異なるようにすることで、画像の改竄に対する耐性を強化できる。

また逆の観点から、領域特徴量算出方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が重複しないようにすることが望ましい。例えば、領域特徴量算出方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。この場合、例えば、領域特徴量算出方法が同一である全ての次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。また、領域特徴量算出方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。また、領域特徴量算出方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。

また同様な観点から、領域特徴量抽出方法が同一である次元間（次元ペア）では、抽出領域の対の形状の組み合わせが異なるようにすることが望ましい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、領域特徴量抽出方法が異なるようにすることが望ましい。例えば、領域特徴量抽出方法が同一である次元間（次元ペア）では、抽出領域の対の形状の組み合わせが異なるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、領域特徴量抽出方法が異なるようにしてもよい。この場合、例えば、領域特徴量抽出方法が同一である全ての次元間（次元ペア）において、抽出領域の対の形状の組み合わせが異なるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である全ての次元間（次元ペア）において、領域特徴量抽出方法が異なるようにしてもよい。また例えば、領域特徴量抽出方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、抽出領域の対の形状の組み合わせが異なるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、領域特徴量抽出方法が異なるようにしてもよい。また例えば、領域特徴量抽出方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、抽出領域の対の形状の組み合わせが異なるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、領域特徴量抽出方法が異なるようにしてもよい。

領域特徴量算出方法取得手段５は、入力として供給される次元別領域特徴量算出方法情報から、次元決定手段１から供給される次元に対応する領域特徴量算出方法を示す情報を取得し、領域特徴量算出手段３Ａへ供給する。

領域特徴量算出手段３Ａは、入力として供給される画像から、次元ごとに、抽出領域取得手段２から供給される第１の抽出領域と第２の抽出領域とを示す情報に基づき、領域特徴量算出方法取得手段５から供給される領域特徴量算出方法を示す情報に従って、第１の抽出領域の特徴量と、第２の抽出領域の特徴量とを、それぞれ第１の領域特徴量と第２の領域特徴量として算出し、比較手段４へ供給する。

領域特徴量算出手段３Ａでは、供給される抽出領域を示す情報の次元と、領域特徴量算出方法を示す情報の次元との同期が取れている必要がある。

[第３の実施の形態の動作]
次に、図１０のフローチャートを参照して、第３の実施の形態における画像識別子抽出装置の動作を説明する。図１０のフローチャートでは、特徴ベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。

まず、次元決定手段１は、抽出する特徴ベクトルの最初の次元として、次元１を決定し（ｎ＝１）、抽出領域取得手段２と領域特徴量算出方法取得手段５とへ供給する（ステップＣ１）。次に、抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元ｎの第１の抽出領域と第２の抽出領域とを示す情報を取得し、領域特徴量算出手段３Ａへ供給する（ステップＣ２）。

次に、領域特徴量算出方法取得手段５は、入力として供給される次元別領域特徴量算出方法情報から、次元ｎに対応する領域特徴量算出方法を示す情報を取得し、領域特徴量算出手段３Ａへ供給する（ステップＣ３）。

次に、領域特徴量算出手段３Ａは、入力として供給される画像から、次元ｎの第１の領域特徴量と、第２の領域特徴量とを算出し、比較手段４へ供給する（ステップＣ４）。次に、比較手段４は、次元ｎの第１の領域特徴量と第２の領域特徴量とを比較し、比較した結果を量子化して、量子化インデックスを出力する（ステップＣ５）。次に、全ての次元に対して量子化インデックスの出力が終了したか否かを判定する（ステップＣ６）。全ての次元に対して量子化インデックスの出力が終了した場合は処理を終了する。全ての次元に対して量子化インデックスの出力が終了していない場合は、ステップＣ７へ移行する。ステップＣ７では、次元決定手段１が、抽出する特徴ベクトルの次元として、次の次元を決定し（ｎ＝ｎ＋１）、抽出領域取得手段２と領域特徴量算出方法取得手段５とへ供給する。そして、再度ステップＣ２へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。またこの処理手順に限らず、複数の次元に対する抽出処理を並列に行うようにしてもよい。さらに、ステップＣ２とステップＣ３の順序を逆にしてもよい。

[第３の実施の形態の効果]
第１の実施の形態の効果に加えて、異なる画像を識別できる度合いである識別能力を更に高くすることができる。

その理由は、次元間で領域特徴量算出方法が異なる（領域特徴量算出方法に多様性がある）ことにより、次元間の相関をより小さくできるからである。

[第４の実施の形態]
[第４の実施の形態の構成]
次に、本発明の第４の実施の形態について図面を参照して詳細に説明する。

図１１を参照すると、本発明の第４の実施の形態は、図１に示した第１の実施の形態の構成に、比較方法取得手段６が追加され、比較手段４が比較手段４Ｂに置き換わる点で異なる。なお、それ以外の構成に関しては、第１の実施の形態の構成と同様であるため、ここでは説明を省略する。なお、ここでは、第１の実施の形態との組み合わせとして説明しているが、第２の実施の形態および第３の実施の形態との組み合わせであってもよい。

比較方法取得手段６には、次元決定手段１からの次元と、次元別比較方法情報とが供給される。

次元別比較・量子化方法情報は、あらかじめ規定された、特徴ベクトルの次元ごとに対応付けられた、その次元での領域特徴量を比較して量子化を行う方法を示す情報であり、次元間で比較・量子化方法が異なることが必須条件である。なおここで、比較・量子化方法が異なるとは、同一の手順に対して異なるパラメータ（閾値、量子化インデックス数など）を適用する場合も含む。

ここで比較・量子化方法とは、例えば第１の実施の形態の比較手段４の説明で記述した各種比較・量子化の方法、またそれに伴うパラメータ（閾値、量子化インデックス数など）や、第２の実施の形態の比較手段４Ａの説明で記述した各種比較・量子化の方法、またそれに伴うパラメータ（閾値、量子化インデックス数など）などである。

なお次元別比較・量子化方法情報が示す次元ごとの比較・量子化方法は、特徴ベクトルの全次元の中に、比較・量子化方法の異なる次元のペアが、少なくとも１つ存在することが最低条件である。比較・量子化方法が相互に異なる次元が多いほど、望ましい。これは、比較・量子化方法が相互に異なる次元が多いほど、特徴ベクトルのより多くの次元間で相関が小さくなり、識別能力が高くなるからである。例えば、特徴ベクトルの全ての次元間で、比較・量子化方法が相互に異なっていてもよい。

なお、次元ごとの比較・量子化方法を示す情報の形式は、領域特徴量を比較して量子化する方法が一意に特定される限りは、任意の形式であってよい。

図１２に、次元ごとの比較・量子化方法の例を示す。図１２に示すように、次元間で比較・量子化方法が異なる。また、第３、５、１２次元のように、同じ比較・量子化方法で、異なるパラメータ（閾値ｔｈ）を設定してもよい。なお、図１２に示した、次元ごとの比較・量子化方法の例は、図９に示した、次元ごとの領域特徴量算出方法の例と対応させており、スカラー量の領域特徴量に対してはスカラー量の比較・量子化方法を、ベクトル量の領域特徴量に対してはベクトル量の比較・量子化方法を例として示した。

また、抽出領域が互いに近傍に存在する次元間（次元ペア）では、それらの次元間（次元ペア）の比較・量子化方法が異なることが望ましい。例えば、抽出領域が互いに近傍に存在する次元間（次元ペア）では、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。この場合、抽出領域が互いに近傍に存在する全ての次元間（次元ペア）において、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。また、抽出領域が互いに近傍に存在する次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。また、抽出領域が互いに近傍に存在する次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。

抽出領域が互いに近傍に存在する次元間（次元ペア）で、それらの次元間の比較・量子化方法が異なるようにすることで、以下の効果がある。抽出領域が互いに近傍に存在する次元間では、抽出される特徴量の相関が大きくなる傾向になる。それらの次元間の比較・量子化方法が同じであると、特徴量の相関はさらに大きくなり、特徴ベクトル全体としての冗長性が高くなり、識別能力が低下する。従って、抽出領域が互いに近傍に存在することにより、抽出される特徴量の相関が大きくなるのを打ち消すように、それらの次元間の比較・量子化方法が異なるようにすることにより、特徴量の相関を小さくでき、特徴ベクトル全体としての冗長性を小さくし、識別能力の低下を防ぐことができる。

また逆の観点から、比較・量子化方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域の間の距離が大きいほうが望ましい。例えば、比較・量子化方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。この場合、例えば、比較・量子化方法が同一である全ての次元間（次元ペア）において、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。また、比較・量子化方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。また、比較・量子化方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の間の距離がある所定の閾値よりも大きくなるようにしてもよい。

また、抽出領域が隣接する次元間（次元ペア）では、それらの次元間（次元ペア）の比較・量子化方法が異なることが望ましい。ここで、抽出領域が隣接する次元間（次元ペア）とは、抽出領域の一部の周囲が互いに接している、ということである。例えば、抽出領域が隣接する次元間（次元ペア）では、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。この場合、抽出領域が隣接する全ての次元間（次元ペア）において、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。また、抽出領域が隣接する次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。また、抽出領域が隣接する次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。

抽出領域が互いに隣接する次元間（次元ペア）で、それらの次元間の比較・量子化方法が異なるようにすることで、以下の効果がある。抽出領域が互いに隣接する次元間では、抽出される特徴量の相関が大きくなる傾向になる。これは抽出領域が互いに隣接する次元間では、２つの次元の抽出領域の間の距離が近いためである（画像内の近い領域の間は相関が高いため）。それらの次元間の比較・量子化方法が同じであると、特徴量の相関はさらに大きくなり、特徴ベクトル全体としての冗長性が高くなり、識別能力が低下する。従って、抽出領域が互いに隣接して存在することにより、抽出される特徴量の相関が大きくなるのを打ち消すように、それらの次元間の比較・量子化方法が異なるようにすることにより、特徴量の相関を小さくでき、特徴ベクトル全体としての冗長性を小さくし、識別能力の低下を防ぐことができる。

また逆の観点から、比較・量子化方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が隣接しないようにすることが望ましい。例えば、比較・量子化方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。この場合、例えば、比較・量子化方法が同一である全ての次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。また、比較・量子化方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。また、比較・量子化方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が隣接しないようにしてもよい。

また、抽出領域が一部重複している次元間（次元ペア）では、それらの次元間（次元ペア）の比較・量子化方法が異なることが望ましい。例えば、抽出領域が一部重複している次元間（次元ペア）では、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。この場合、抽出領域が一部重複している全ての次元間（次元ペア）において、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。また、抽出領域が一部重複している次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。また、抽出領域が一部重複している次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の比較・量子化方法が異なるようにしてもよい。

抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の比較・量子化方法が異なるようにすることで、以下の効果がある。抽出領域が一部重複している次元間では、抽出される特徴量の相関が大きくなる傾向になる。これは抽出領域が一部重複する次元間では、特徴量の算出に用いられる領域を一部共有しているためである。それらの次元間の比較・量子化方法が同じであると、特徴量の相関はさらに大きくなり、特徴ベクトル全体としての冗長性が高くなり、識別能力が低下する。従って、抽出領域が一部重複することにより、抽出される特徴量の相関が大きくなるのを打ち消すように、それらの次元間の比較・量子化方法が異なるようにすることにより、特徴量の相関を小さくでき、特徴ベクトル全体としての冗長性を小さくし、識別能力の低下を防ぐことができる。

また、抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の比較・量子化方法が異なるようにすることで、さらに別の以下の効果がある。抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の比較・量子化方法が異なるようにすることで、画像の改竄（特に悪意のある改竄）に対する耐性を強化できる、という効果がある。画像に対する悪意のある改竄は、その画像から抽出される画像識別子（特徴ベクトル）による同一性判定の精度を劣化させる目的で、例えば画像の一部の領域の画素値を変更するなどして行われる。抽出領域が一部重複している次元間では、その画像の重複領域を改竄、すなわちその重複領域の画素値を変更した場合に、そこから抽出される特徴量（領域特徴量）が影響され、改竄前の領域から抽出した特徴量と異なってしまう可能性が高くなる。それらの次元間の比較・量子化方法が同じであると、各々の次元の抽出領域から抽出される特徴量（領域特徴量）は同様な影響を受け、同時に特徴量が変更されてしまう可能性が高くなるため、頑健性は低い。それらの次元間の比較・量子化方法が異なっていると、重複領域に改竄が行われた場合にも、特徴量が同様な影響を受け、同時に特徴量が変更されてしまう可能性を低くすることができるため、頑健性を確保することができる。すなわち、重複領域を改竄することにより、その重複領域を共有している複数の次元の特徴量を同時に変更してしまうことがより困難となる。従って、抽出領域が一部重複している次元間（次元ペア）で、それらの次元間の比較・量子化方法が異なるようにすることで、画像の改竄に対する耐性を強化できる。

また逆の観点から、比較・量子化方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が重複しないようにすることが望ましい。例えば、比較・量子化方法が同一である次元間（次元ペア）では、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。この場合、例えば、比較・量子化方法が同一である全ての次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。また、比較・量子化方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。また、比較・量子化方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、それらの次元間（次元ペア）の抽出領域が重複しないようにしてもよい。

また同様な観点から、比較・量子化方法が同一である次元間（次元ペア）では、抽出領域の対の形状の組み合わせが異なるようにすることが望ましい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、比較・量子化方法が異なるようにすることが望ましい。例えば、比較・量子化方法が同一である次元間（次元ペア）では、抽出領域の対の形状の組み合わせが異なるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）では、比較・量子化方法が異なるようにしてもよい。この場合、例えば、比較・量子化方法が同一である全ての次元間（次元ペア）において、抽出領域の対の形状の組み合わせが異なるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である全ての次元間（次元ペア）において、比較・量子化方法が異なるようにしてもよい。また例えば、比較・量子化方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、抽出領域の対の形状の組み合わせが異なるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、比較・量子化方法が異なるようにしてもよい。また例えば、比較・量子化方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、抽出領域の対の形状の組み合わせが異なるようにしてもよい。また、抽出領域の対の形状の組み合わせが同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、比較・量子化方法が異なるようにしてもよい。

また同様な観点から、比較・量子化方法が同一である次元間（次元ペア）では、領域特徴量算出方法が異なるようにすることが望ましい。また、領域特徴量算出方法が同一である次元間（次元ペア）では、比較・量子化方法が異なるようにすることが望ましい。例えば、比較・量子化方法が同一である次元間（次元ペア）では、領域特徴量算出方法が異なるようにしてもよい。また、領域特徴量算出方法が同一である次元間（次元ペア）では、比較・量子化方法が異なるようにしてもよい。この場合、例えば、比較・量子化方法が同一である全ての次元間（次元ペア）において、領域特徴量算出方法が異なるようにしてもよい。また、領域特徴量算出方法が同一である全ての次元間（次元ペア）において、比較・量子化方法が異なるようにしてもよい。また例えば、比較・量子化方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、領域特徴量算出方法が異なるようにしてもよい。また、領域特徴量算出方法が同一である次元間（次元ペア）のうち、ある所定の割合以上の次元間（次元ペア）において、比較・量子化方法が異なるようにしてもよい。また例えば、比較・量子化方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、領域特徴量算出方法が異なるようにしてもよい。また、領域特徴量算出方法が同一である次元間（次元ペア）のうち、少なくとも１以上の次元間（次元ペア）において、比較・量子化方法が異なるようにしてもよい。

比較方法取得手段６は、入力として供給される次元別比較・量子化方法情報から、次元決定手段１から供給される次元に対応する比較・量子化方法を示す情報を取得し、比較手段４Ｂへ供給する。

比較手段４Ｂは、次元ごとに、領域特徴量算出手段３から供給される第１の領域特徴量と、第２の領域特徴量とを、比較方法取得手段６から供給される比較・量子化方法を示す情報に従って、比較・量子化して、量子化インデックスを出力する。比較手段４Ｂは、比較・量子化方法によって、必要に応じて、第１の実施の形態の比較手段４と、第２の実施の形態の比較手段４Ｂの両方を内包した構成となる場合もある。

比較手段４Ｂでは、供給される領域特徴量の次元と、比較・量子化方法を示す情報の次元の同期が取れている必要がある。

[第４の実施の形態の動作]
次に、図１３のフローチャートを参照して、第４の実施の形態における画像識別子抽出装置の動作を説明する。図１３のフローチャートでは、特徴ベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。

まず、次元決定手段１は、抽出する特徴ベクトルの最初の次元として、次元１を決定し（ｎ＝１）、抽出領域取得手段２と比較方法取得手段６とへ供給する（ステップＤ１）。次に、抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元ｎの第１の抽出領域と第２の抽出領域とを示す情報を取得し、領域特徴量算出手段３へ供給する（ステップＤ２）。

次に、比較方法取得手段６は、入力として供給される次元別比較・量子化方法情報から、次元ｎに対応する比較・量子化方法を示す情報を取得し、比較手段４Ｂへ供給する（ステップＤ３）。

次に、領域特徴量算出手段３は、入力として供給される画像から、次元ｎの第１の領域特徴量と、第２の領域特徴量とを算出し、比較手段４Ｂへ供給する（ステップＤ４）。次に、比較手段４Ｂは、次元ｎの第１の領域特徴量と第２の領域特徴量とを比較し、比較した結果を量子化して、量子化インデックスを出力する（ステップＤ５）。次に、全ての次元に対して量子化インデックスの出力が終了したか否かを判定する（ステップＤ６）。全ての次元に対して量子化インデックスの出力が終了した場合は処理を終了する。全ての次元に対して量子化インデックスの出力が終了していない場合は、ステップＤ７へ移行する。ステップＤ７では、次元決定手段１が、抽出する特徴ベクトルの次元として、次の次元を決定し（ｎ＝ｎ＋１）、抽出領域取得手段２と比較方法取得手段６とへ供給する。そして、再度ステップＤ２へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。またこの処理手順に限らず、複数の次元に対する抽出処理を並列に行うようにしてもよい。さらに、ステップＤ２とステップＤ３との順序を逆にしてもよく、ステップＤ３をステップＤ５の直前に実行するようにしてもよい。

[第４の実施の形態の効果]
第１の実施の形態の効果に加えて、異なる画像を識別できる度合いである識別能力を更に高くすることができる。

その理由は、次元間で比較・量子化方法が異なる（比較・量子化方法に多様性がある）ことにより、次元間の相関をより小さくできるからである。

[第５の実施の形態]
[第５の実施の形態の構成]
次に、本発明の第５の実施の形態について図面を参照して詳細に説明する。

図３３を参照すると、本発明の第５の実施の形態は、図１に示した第１の実施の形態の構成に、符号化手段７が追加される点で異なる。なお、それ以外の構成に関しては、第１の実施の形態の構成と同様であるため、ここでは説明を省略する。なお、ここでは、第１の実施の形態との組み合わせとして説明しているが、第２の実施の形態、または第３の実施の形態、または第４の実施の形態との組み合わせであってもよい。

符号化手段７は、比較手段４から供給される量子化インデックスベクトルを、データ量が小さくなるように一意に復号可能な形式に符号化し、符号化された量子化インデックスベクトルを出力する。

符号化手段７は、例えば、量子化インデックスベクトルの各次元を独立に符号化するのではなく、複数の次元をまとめて符号化することによって、データ量を小さく符号化してもよい。

ここで、量子化インデックスが式２に基づいて算出された場合において、符号化手段７が効率的に符号化する方法について述べる。式２に基づいて量子化インデックスを算出すると、各次元の量子化インデックスは、（＋１、０、−１）の３値のいずれかの値をとる。各次元を独立に符号化する場合は、各次元に対して２ビット（＝４状態）が必要となる。ここで、５次元をまとめて符号化することを考えると（この５次元はどのような組合せでもよい。例えば連続する５次元でもよい）、その状態数は３の５乗＝２４３状態となり、１バイト＝８ビット（＝２５６状態）で表す（２５６状態以内に収めることができる）ことができる。こうすると、１次元あたりに必要な平均ビット数は８／５＝１．６ビットとなり、各次元を独立に符号する場合よりも、データ量を小さくすることができる（１次元あたり０．４ビットの削減が可能）。例えば、量子化インデックスベクトルの全次元数が３００次元の場合、各次元を独立に符号化した場合は２ビット×３００＝６００ビット＝７５バイトとなる。一方で、５次元ごとにまとめて符号化すると、１．６ビット×３００＝４８０ビット＝６０バイトとなり、１５バイト削減できる。

式２で算出される（＋１、０、−１）の３値の状態を５次元ごとに符号化する具体例を以下に示す。各５次元の組合せは、どのような組合せでも良いが、例えば、連続する５つの次元ごとに符号化する方法がある。すなわち、第１次元から第５次元をまとめて符号化し、第６次元から第１０次元をまとめて符号化し、第１１次元から第１５次元をまとめて符号化していくことができる（もちろん、重複がない限りは、どのような５つの次元の組み合わせでもよい）。ここで、まとめて符号化する５次元の量子化インデックスの値をＱ_ｎ、Ｑ_ｎ＋１、Ｑ_ｎ＋２、Ｑ_ｎ＋３、Ｑ_ｎ＋４とすると（それぞれは＋１、０、−１のいずれかの値をとる）、例えば、以下の式に従って符号化された値Ｚを算出することができる。

[式３]
Ｚ＝｛３^４×（Ｑ_ｎ＋１）｝＋｛３^３×（Ｑ_ｎ＋１＋１）｝＋｛３^２×（Ｑ_ｎ＋２＋１）｝＋｛３^１×（Ｑ_ｎ＋３＋１）｝＋｛３^０×（Ｑ_ｎ＋４＋１）｝

この符号化された値Ｚは、０から２４２の値をとるため（２４３状態）、１バイト（８ビット）のデータとして符号化されることになる。なお、まとめて符号化する５次元の量子化インデックスの値をＱ_ｎ、Ｑ_ｎ＋１、Ｑ_ｎ＋２、Ｑ_ｎ＋３、Ｑ_ｎ＋４を、０から２４２の値（２４３状態）にマッピングする方法は、[式３]だけに限られず、５次元の量子化インデックスの異なる組み合わせに対して、異なる値（２４３状態の値）にマッピングされる方法であれば、どのような方法であってもよい。[式３]のように与えられた式に基づいて、マッピング（符号化後の値）を算出し、符号化してもよいし、またあらかじめマッピングの対応表を生成・記憶しておき、記憶された対応表を参照しながらマッピング（符号化後の値）を取得し、符号化してもよい。

段落０１８７から段落０１９０において説明した、量子化インデックスが式２に基づいて算出された場合において効率的に符号化する方法は、量子化インデックスが式２に基づいて算出された場合に限らず、量子化インデックスが３値の状態の量子化インデックスベクトルであれば、同様に適用可能である。すなわち、量子化インデックスベクトルが、３値の状態の量子化インデックスから成る場合は、５次元をまとめて１バイト＝８ビットとして符号化することができる。３値の状態を持つ５次元の量子化インデックスは、５次元の量子化インデックスの異なる組み合わせが２４３種類可能であるため、それぞれの組み合わせを０から２４２の値（２４３状態）にマッピングすることによって、１バイト＝８ビットで符号化することができる。なおこのマッピングは、[式３]のように与えられた式に基づいて、マッピング（符号化後の値）を算出し、符号化してもよいし、またあらかじめマッピングの対応表を生成・記憶しておき、記憶された対応表を参照しながらマッピング（符号化後の値）を取得し、符号化してもよい。

このように、量子化インデックスベクトルの各次元を独立に符号化するのではなく、複数の次元をまとめて符号化することによって、量子化インデックスベクトルの各次元を独立に符号化する場合と比較して、データ量を小さく符号化できる、という効果がある。

これは、量子化インデックスが３値の状態で表現される場合に限られない。例えば、量子化インデックスが５値の状態で表現される場合は、３次元をまとめて符号化することにより５の３乗＝１２５状態となり、７ビット＝１２８状態で符号化する（１２８状態以内に収めることができる）ことができる。３次元を独立に符号化すると３ビット（８状態）×３次元＝９ビット必要となるため、３次元をまとめて符号化することにより２ビット削除することができる。

なお、符号化手段７から出力される符号化された量子化インデックスベクトルを照合する際（ある画像から抽出した量子化インデックスベクトルと、別の画像から抽出した量子化インデックスベクトルとを比較して、それらの画像が同一であるか否かを判定する際）は、符号化された状態から、各次元ごとの量子化インデックスの値を復号し（例えば上記の例では、各次元ごとに＋１、０、−１の量子化インデックス値に復号し）、復号された量子化インデックスをもとに同一性尺度（量子化インデックスが一致する次元数（類似度）、あるいは量子化インデックスが非一致である次元数（ハミング距離））を算出してもよい。

また、ルックアップテーブルを用いることで、符号化された状態のままで、各次元ごとの量子化インデックスの値に復号することなしに、照合を行うこともできる。すなわち、符号化された単位ごとに、あらかじめ同一性尺度（類似度や距離）をテーブル（ルックアップテーブル）の形で保存しておき、ルックアップテーブルを参照することにより、符号化された単位ごとの同一性尺度（類似度や距離）を取得し、それらを総計することで（例えば総和を算出する）、全次元の同一性尺度を算出することができる。

例えば上記の、５次元ごとにまとめて１バイト（８ビット）に符号化された場合には、それぞれの５次元単位が２４３状態のいずれかであるため、２４３×２４３のサイズのルックアップテーブルをあらかじめ生成しておくことで、対処することができる。すなわち、比較する２つの５次元単位の符号の、可能な全ての組合せの状態（２４３状態×２４３状態）の間の同一性尺度、すなわち５次元のうち量子化インデックスが一致する数（類似度）、あるいは５次元のうち量子化インデックスが非一致である数（ハミング距離）をあらかじめ算出しておく。そしてそれを２４３×２４３のサイズのルックアップテーブルとして記憶しておく。そうすると、５次元単位ごとに、ルックアップテーブルを参照して（各次元ごとの量子化インデックスに復号することなしに）、５次元単位ごとの同一性尺度を取得することができる。例えば、量子化インデックスベクトルの全次元数が３００次元の場合、５次元ごとに１バイトで、合計６０バイトで符号化されているため、ルックアップテーブルを６０回参照して、それぞれの５次元単位の同一性尺度を取得し、それらを総和することで全体（３００次元）の同一性尺度（類似度あるいはハミング距離）を算出することができる。ルックアップテーブルを用いることで、各次元ごとの量子化インデックスへの復号を行うことなしに照合（同一性尺度の算出）が可能になるので、照合（同一性尺度の算出）の際の処理コストを低減することができ、高速な照合（同一性尺度の算出）が可能になる、という効果がある。

また、２つの量子化インデックスベクトルの間の同一性尺度を、単純に量子化インデックスが一致する次元数（類似度）や、量子化インデックスが非一致である次元数（ハミング距離）として算出するのではなく、より複雑な計算式に基づいて算出する場合においても、ルックアップテーブルを用いることで、各次元ごとの量子化インデックスへの復号を行うことなしに照合（同一性尺度の算出）することができる。例えば、量子化インデックスが式２に基づいて算出された量子化インデックスベクトルの同一性尺度として、以下のような同一性尺度の算出方法を考える。まず、２つの画像の量子化インデックスベクトルを対応する次元どうしで比較して、「共に量子化インデックスが０」ではない次元の数を算出し、この値をＡとする。次に、「共に量子化インデックスが０」ではない次元において、量子化インデックスが一致する次元数をＢとして算出する（または、「共に量子化インデックスが０」ではない次元において、量子化インデックスが非一致である次元数をＣとして算出する）。そして、同一性尺度をＢ／Ａとして算出する（または、同一性尺度をＣ／Ａとして算出する）。ただし、Ａ＝０の場合（すなわち、全ての次が共に量子化インデックスが０となる場合）は、同一性尺度を規定の数値（例えば０．５）とする。このような同一性尺度の算出方法を採用した場合、Ａの値とＢの値（またはＣの値）の２つの値を算出する必要がある。この場合、５次元ごとのＡの値を参照するための２４３×２４３のサイズのルックアップテーブルと、５次元ごとのＢの値（またはＣの値）を参照するための２４３×２４３のサイズのルックアップテーブルの、２つのルックアップテーブルをあらかじめ生成しておくことで、対処することができる。すなわち、比較する２つの５次元単位の符号の、可能な全ての組み合わせの状態（２４３状態×２４３状態）の間のＡの値（「共に量子化インデックスが０」ではない次元数）と、可能な全ての組み合わせの状態（２４３状態×２４３状態）の間のＢの値（またはＣの値）をあらかじめ算出しておく。そしてそれぞれを２４３×２４３のサイズのルックアップテーブルとして記憶しておく。そうすると、５次元単位ごとに、ルックアップテーブルを参照して（各次元ごとの量子化インデックスを復号することなしに）、５次元単位ごとのＡの値と、Ｂの値（またはＣの値）を取得することができる。例えば、量子化インデックスベクトルの全次元数が３００次元の場合、５次元ごとに１バイトで、合計６０バイトで符号化されているため、ルックアップテーブルを６０回×２参照して、それぞれの５次元単位のＡの値とＢの値（またはＣの値）を取得し、全て５次元単位のＡの値とＢの値（またはＣの値）を総和することで、全次元（３００次元）のＡの値とＢの値（またはＣの値）を算出することができる。そして、最後にＢ／Ａ（またはＣ／Ａ）を算出することで、同一性尺度を算出できる。このように、同一性尺度を、単純に量子化インデックスが一致する次元数（類似度）や、量子化インデックスが非一致である次元数（ハミング距離）として算出するのではなく、より複雑な計算式に基づいて算出する場合においても、複数のルックアップテーブルを用いることで、各次元ごとの量子化インデックスへの復号を行うことなしに照合（同一性尺度の算出）が可能になるので、照合（同一性尺度の算出）の際の処理コストを低減することができ、高速な照合（同一性尺度の算出）が可能になる、という効果がある。

[第５の実施の形態の効果]
より小さいデータ量として、量子化インデックスベクトルを出力することができる。

次に、本発明におけるその他の実施の形態を示す。

［第６の実施の形態］
本実施の形態では、抽出する特徴ベクトルの次元数は３００次元（第１次元から第３００次元）である。

本実施の形態では、次元ごとの抽出領域（第１の抽出領域と第２の抽出領域）は、様々な形状の四角形から構成される。本実施の形態において、抽出領域取得手段２に入力として供給される次元別抽出領域情報を図１４に示す。図１４は、規定の画像サイズである、横幅３２０画素×縦幅２４０画素の画像サイズに対する、次元ごとの抽出領域（第１の抽出領域と第２の抽出領域）の四角形の四隅のXY座標値を示す。例えば、第１次元の抽出領域は、座標値(262.000,163.000)、座標値(178.068,230.967)、座標値(184.594,67.411)、座標値(100.662,135.378)を四隅とする四角形で構成される第１の抽出領域と、座標値(161.000,133.000)、座標値(156.027,132.477)、座標値(164.240,102.170)、座標値(159.268,101.647)を四隅とする四角形で構成される第１の抽出領域とで構成される。

次元ごとの抽出領域（第１の抽出領域と第２の抽出領域）は、横幅３２０画素×縦幅２４０画素の画像サイズに正規化された画像に対して、この四隅の座標値で囲まれる領域の中に含まれる整数値の座標値の画素の集合となる。ただし、四隅の座標値で囲まれる領域の中に含まれる負の座標値は、抽出領域に含まない。

本実施の形態において、領域特徴量算出方法取得手段５に入力として供給される次元別領域特徴量算出方法情報を図１５に示す。第６の実施の形態では、全ての次元に対して、それぞれの抽出領域（第１の抽出領域と第２の抽出領域）に含まれる画素群の輝度値の平均値が、それぞれの抽出領域の領域特徴量となる。

本実施の形態において、比較方法取得手段６に入力として供給される次元別比較・量子化方法情報を図１７に示す。本実施の形態では、次元ごとに、比較・量子化方法Bまたは比較・量子化方法Gが用いられ、次元ごとにそのパラメータの値も異なる。例えば、第１次元は、比較・量子化方法Ｇで、閾値th=D(floor(300×5.0/100))である。また、例えば第２次元は、比較・量子化方法Ｇで、閾値th=D(floor(300×10.0/100))である。また、例えば第９次元は、比較・量子化方法Ｂで、閾値th=3.0である。

［第７の実施の形態］
本実施の形態は、第６の実施形態と同じく、抽出する特徴ベクトルの次元数は３００次元（第１次元から第３００次元）である。また本実施の形態では、抽出領域取得手段２に入力として供給される次元別抽出領域情報として、第６の実施の形態と同じく図１４に示す情報を使用する。さらに本実施の形態では、比較方法取得手段６に入力として供給される次元別比較・量子化方法情報として、第６の実施形態と同じく図１７に示す情報を使用する。

本実施の形態において、領域特徴量算出方法取得手段５に入力として供給される次元別領域特徴量算出方法情報を図１６に示す。本実施の形態では、次元ごとに、抽出領域（第１の抽出領域と第２の抽出領域）に含まれる画素群の輝度値の平均値、または、パーセンタイル輝度値特徴量が用いられ、同じパーセンタイル輝度値特徴量を用いる場合でも、次元ごとにその特徴量は異なる。例えば、第１次元は、抽出領域に含まれる画素の輝度値の平均値である。また、例えば第４次元は、パーセンタイル輝度値特徴量で、Y(floor(N×20.0/100)である。また、第８次元は、パーセンタイル輝度値特徴量で、Y(floor(N×80.0/100)である。

［第８の実施の形態］
本実施の形態は、抽出する特徴ベクトルの次元数は３２５次元（第１次元から第３２５次元）である。本実施の形態の場合は、各領域は、画像を縦方向３２、横方向３２に分割してできる１０２４個のブロックの組み合わせによって構成されている。ここで、各ブロックに対して、図２４に示すように、左上から順に０から始まるインデックスを付与し、このインデックスを用いて領域を記述する。具体的には、長方形領域を、その左上のブロックのインデックスａと右下のブロックのインデックスｂを用いてａ−ｂのように表現する。例えば、インデックス０、１、３２、３３の４つのブロックからなる長方形は、０−３３のように記述する。また、このようにしてできる長方形を記号“｜”によって繋げた場合は、その記号の前後の長方形を連結してできる領域を表現するものとする。例えば、０−３３｜２−６７は、０−３３で定義される長方形と、２−６７で定義される長方形を連結してできる領域、すなわち、ブロック番号０、１、２、３、３２、３３、３４、３５、６６、６７によって構成される領域を表している。

この表記によって本実施の形態の各次元に対応する領域を示したものが図２５である。図では、領域のタイプ別に図２５−ａ、図２５−ｂ、図２５−ｃ、図２５−ｄ、図２５−ｅ、図２５−ｆ、図２５−ｇに分けて上述の３２５次元を記述している。ここで、領域のタイプとは、第1、第２の抽出領域間の相対位置や形状の組み合わせによって定まる領域パターンが似たもの同士でグループ化（類型化）したものである。

具体的には、図２５−ａの場合は、図２７−ａに一例を示すように、縦横４ブロックからなる正方形を縦方向か横方向に２等分してできる２つの領域を第１、第２の抽出領域とした場合に相当する。このため、第１、第２の抽出領域の形状は、ともに縦４ブロック、横２ブロックからなる長方形、あるいは縦２ブロック、横４ブロックからなる長方形である。また、第１、第２の抽出領域の相対的な位置関係を見ると、長方形の長い辺同士が重なるように隣接する位置に存在する。

図２５−ｂの場合は、図２７−ｂに一例を示すように、縦横８ブロックからなる正方形を縦横２等分してできる４つの正方形のうち、左上と右下、右上と左下をそれぞれ組み合わせてできる２つの領域を第１、第２の抽出領域とした場合に相当する。このため、第１、第２の抽出領域の形状は、ともに縦横２ブロックからなる正方形を１つの頂点を共有するように４５度あるいは１３５度の対角線上に２つ配置した形状となっている。また、領域の相対的な位置関係を見ると、第２の領域を構成する２つの正方形が、第１の領域の左上の正方形のすぐ左と下に隣接する位置に第２の領域が存在する。

図２５−ｃの場合は、図２７−ｃに一例を示すように、第１、第２の抽出領域の形状は、ともに縦横１０ブロックからなる正方形である。また、第１、第２の抽出領域の相対的な位置関係を見ると、縦横ともに１０ブロックの整数倍だけ離れた位置に存在する。

図２５−ｄの場合は、図２７−ｄに一例を示すように、第１、第２の抽出領域の形状は、ともに縦横６ブロックからなる正方形である。また第１、第２の抽出領域の相対的な位置関係を見ると、縦横ともに６ブロックの整数倍だけ離れた位置に存在する。

図２５−ｅの場合は、図２７−ｅに一例を示すように、正方形領域を中心部分の正方形とその外側の２つに分けてできる２つの領域を第１、第２の抽出領域とした場合に相当する。このため、領域の形状は、第２の抽出領域が中心部分の正方形、第１の正方形は全体の正方形から第２の抽出領域をくりぬいた形状である。また、領域の相対的な位置関係を見ると、第１の抽出領域の中央の穴の位置に第２の抽出領域が存在する。

図２５−ｆの場合は、図２７−ｆに一例を示すように、領域の形状は、第１の抽出領域は縦６ブロック、横１０ブロックの長方形、第２の抽出領域は縦１０ブロック、横６ブロックの長方形である。また、第１、第２の抽出領域の相対的な位置関係を見ると、中心位置が一致するように配置されている。

図２５−ｇの場合には、図２７−ｇに一例を示すように、縦４ブロック、横１２ブロックからなる長方形、あるいは縦１２ブロック、横４ブロックからなる長方形を、長い辺を３等分してできる中央の正方形とそれ以外の２領域を第１、第２の抽出領域とした場合に相当する。このため、領域の形状は、第１の抽出領域は縦横４ブロックからなる正方形を２つ、縦か横に４ブロック離れて配置した形状で、第２の抽出領域は縦横４ブロックからなる正方形である。また、領域の相対的な位置関係を見ると、第１の抽出領域の間に第２の抽出領域が存在する。

以後、図２５−ａ、図２５−ｂ、図２５−ｃ、図２５−ｄ、図２５−ｅ、図２５−ｆ、図２５−ｇの領域タイプを、それぞれ領域タイプａ、領域タイプｂ、領域タイプｃ、領域タイプｄ、領域タイプｅ、領域タイプｆ、領域タイプｇと呼ぶことにする。

本実施の形態では、図２５で示した各領域において、領域特徴量として輝度値の平均を算出し、各次元の特徴量を算出する。もちろん、輝度値の平均のかわりにメディアンや最大値など、前述の様々な抽出方法によって抽出した値を領域特徴量として求めるようにしてもよい。

各次元の特徴量の量子化では、上述の領域のタイプ別に閾値を定め、量子化を行うようにする。例えば、式２に従って特徴量を３値に量子化する場合には、領域のタイプ別に、０、１、−１の生起の割合が均等になるように量子化の閾値ｔｈを決定し、量子化を行うようにする。具体的には、段落０１０４で記述した方法をＰ＝３３．３３３％、Ｎを領域タイプ別の次元数として領域タイプ別に適用し、閾値ｔｈを求める。例えば、領域タイプａの場合にはＮ＝１１３となるため、ｔｈ＝Ｄ（ｆｌｏｏｒ（１１３×３３．３３３／１００））＝Ｄ（３７）により閾値を算出する。ここで、Ｄ（ｉ）（ｉ＝０、１、…、Ｎ−１）は、領域タイプａに該当する第１次元から第１１３次元の差分値の絶対値を昇順にソートした集合になる。この場合は閾値に対応するインデックスが３７となる。同様に、他の領域タイプに対しても、閾値に対応するインデックスを求めることができる。これを示したのが図２６である。このように領域タイプ別に閾値を求める方が、全体で閾値を決める場合に比べて各次元での０、１、−１の発生確率を均一化できるようになり、識別能力が向上する。もちろん、前述の他の様々な量子化方法によって量子化するようにしてもよい。

なお、本実施の形態の場合には、図２４で示したブロックごとに代表値（例えば、ブロック内の画素の輝度値の平均値）を先に算出し、それから領域特徴量を抽出するようにしてもよい。これにより、領域内の全画素から直接領域特徴量を抽出する場合よりも高速に抽出できるようになる。また、各領域タイプの抽出領域は、全体として対称性を有する。このため、画像の右と左を反転させたり、上下を反転させたりした場合でも、次元の対応関係と符号を適切に変更することによって、左右または上下反転した画像から抽出された特徴量からもとの画像の特徴量を復元できる。このため、左右あるいは上下を反転させた画像とも照合することができるようになる。

［第９の実施の形態］
本実施の形態は、抽出するベクトルの次元数は３２８次元（第１次元から第３２５次元）である。第８の実施の形態の場合と同様に、図２４に示す１０２４個のブロックの組み合わせによって構成されており、第８の実施の形態と同じ領域のタイプ別に図３０―ａ、図３０―ｂ、図３０―ｃ、図３０―ｄ、図３０―ｅ、図３０―ｆ、図３０―ｇに分けて上述の３２８次元を記述している。

本実施の形態でも、図３０で示した各領域において、領域特徴量として輝度値の平均を算出し、各次元の特徴量を算出する。もちろん、輝度値の平均のかわりにメディアンや最大値など、前述の様々な抽出方法によって抽出した値を領域特徴量として求めるようにしてもよい。

各次元の量子化も第８の実施の形態と同様である。この場合の閾値に対応するインデックスを示したものが図３１である。もちろん、前述の他の様々な量子化方法によって量子化するようにしてもよい。

［照合手段の実施の形態］
次に、本発明で出力される量子化インデックスベクトルを照合する照合手段についてブロック図を用いて説明する。

図２０を参照すると、本発明で出力される量子化インデックスベクトルを照合する照合手段１００のブロック図が示されており、次元決定手段１０１、量子化値取得手段１０２、１０３、尺度算出手段１０４とからなる。

次元決定手段１０１は量子化値取得手段１０２、１０３へ接続され、決定された次元情報を出力する。量子化値取得手段１０２は、第1の量子化インデックスベクトルから、次元決定手段１０１から入力される次元の量子化インデックス値を取得し、第1の量子化インデックス値として尺度算出手段１０４へ出力する。量子化値取得手段１０３は、第２の量子化インデックスベクトルから、次元決定手段１０１から入力される次元の量子化インデックス値を取得し、第２の量子化インデックス値として尺度算出手段１０４へ出力する。尺度算出手段１０４は、量子化値取得手段１０２、１０３からそれぞれ出力される第1、第２の量子化インデックス値から同一性を表す尺度を算出し、出力する。

次に、図２０の照合手段１００の動作について説明する。

まず、照合手段１００へは、第１の画像から抽出される量子化インデックスベクトルである第１の量子化インデックスベクトルと、第２の画像から抽出される量子化インデックスベクトルである第２の量子化インデックスベクトルとが入力される。入力された第１、第２の量子化インデックスベクトルは、それぞれ量子化値取得手段１０２、１０３へ入力される。

量子化値取得手段１０２、１０３へは、次元決定手段１０１から出力される次元情報も入力される。次元決定手段１０１では、Ｎ次元ベクトルである量子化インデックスベクトルの各次元を指定する情報を順次出力する。出力する順序は必ずしも1からＮまで1つずつ増えていく必要はなく、1からＮまでの次元が過不足なく指定される順序であれば、どのような順序であってもよい。

量子化値取得手段１０２、１０３では、入力された量子化インデックスベクトルから、次元決定手段１０１から出力される次元情報で指定される次元の量子化インデックス値を取得する。そして、取得した量子化インデックス値を尺度算出手段１０４へ出力する。

尺度算出手段１０４では、量子化値取得手段１０２から出力される第1の量子化インデックス値と第２の量子化インデックス値とを比較する。この比較を各次元に対して行い、第1、第２の量子化インデックスベクトル間の類似尺度（あるいは距離尺度）を同一性尺度として算出する。

得られた同一性尺度値は予め定めた閾値と比較し、同一性の判定を行う。同一性尺度が類似度をあらわす尺度である場合には、尺度値が閾値以上の場合に同一と判定する。一方、同一性尺度が距離をあらわす尺度である場合には、尺度値が閾値以下の場合に同一と判定する。

次に、フローチャートを用いて図２０の照合手段１００の動作を説明する。まず、同一性尺度として類似度を用いる場合の動作について説明する。

図２１は、照合手段１００の動作を示すフローチャートである。図２１のフローチャートでは、量子化インデックスベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。また、類似度を算出する変数をＢで表すこととする。

まず、次元決定手段１０１は、照合する量子化インデックスベクトルの最初の次元として、次元１を決定し（ｎ＝１）、量子化値取得手段１０２、１０３へ供給するとともに、尺度算出手段１０４において変数Ｂを０にセットする。（ステップＳ１００）。

次に、量子化値取得手段１０２、１０３において、第１の量子化インデックスベクトル、第２の量子化インデックスベクトルから、次元ｎの第１の量子化インデックス値と第２の量子化インデックス値とを取得し、尺度算出手段１０４へ供給する（ステップＳ１０２）。

次に、尺度算出手段１０４において、第１の量子化インデックス値と第２の量子化インデックス値とから、それぞれの量子化インデックスに対応する特徴量の間の類似度ΔＢを算出する（ステップＳ１０４）。例えば、量子化インデックスが一致する場合にはΔＢ＝１とし、それ以外の場合はΔＢ＝０とする。あるいは、量子化インデックスから量子化前の特徴量の代表値を算出し、代表値間の差分が小さいほど大きくなる値をΔＢとして用いてもよい。この際、特徴量の代表値を算出して差分を求めるかわりに、量子化インデックス値の組み合わせによってΔＢの値を引くことができるテーブルを保持しておき、量子化インデックス値の組み合わせからこのテーブルを用いてΔＢの値を直接求めるようになっていてもよい。

次に、ΔＢの値は変数Ｂに加算される（ステップＳ１０６）。この際、ΔＢの値が０の場合には、変数Ｂに０を加算するかわりに、加算しないように制御してもよい。

次に、次元の番号ｎが次元数Ｎに到達したかどうかを調べ（ステップＳ１０８）、到達しない場合はステップＳ１１２へ移行し、到達した場合には、そのときの変数Ｂの値を同一性尺度（類似度を表す尺度）として出力し（ステップＳ１１０）、処理を終了する。

ステップ１１２では、次元決定手段１０１が、取得する量子化インデックスの次元として、ｎ＝ｎ＋１によって次の次元を決定し、量子化値取得手段１０２、１０３へ供給する。そして、再度ステップＳ１０２へ移行する。

なお、ここでは、次元１からＮまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。

次に、同一性尺度として距離を用いる場合の動作について説明する。

図２２は、照合手段１００の動作を示す別のフローチャートである。図２２のフローチャートでも、量子化インデックスベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。また、距離尺度を算出する変数をＣで表すこととする。

基本的なフローは、図２１の場合と同じであるが、ステップＳ１００、Ｓ１０４、Ｓ１０６、Ｓ１１０がそれぞれステップＳ２００、Ｓ２０４、Ｓ２０６、Ｓ２１０に置き換わっている点が異なる。

まず、ステップＳ２００では、次元決定手段１０１において、照合する量子化インデックスベクトルの最初の次元として、次元１を決定し（ｎ＝１）、量子化値取得手段１０２、１０３へ供給するとともに、尺度算出手段１０４において変数Ｃを０にセットする。

ステップＳ２０４では、尺度算出手段１０４において、第１の量子化インデックス値と第２の量子化インデックス値とから、それぞれの量子化インデックスに対応する特徴量の距離ΔＣを算出する。例えば、量子化インデックスが一致する場合にはΔＣ＝０とし、それ以外の場合はΔＣ＝１とする。あるいは、量子化インデックスから量子化前の特徴量の代表値を算出し、代表値間の差分が小さいほど小さくなる値をΔＣとして用いてもよい。この際、特徴量の代表値を算出して差分を求めるかわりに、量子化インデックス値の組み合わせによってΔＣの値を引くことができるテーブルを保持しておき、量子化インデックス値の組み合わせからこのテーブルを用いてΔＣの値を直接求めるようになっていてもよい。

ステップＳ２０６では、ΔＣの値は変数Ｃに加算される。この際、ΔＣの値が０の場合には、変数Ｃに０を加算するかわりに、加算しないように制御してもよい。

ステップＳ２１０では、そのときの変数Ｃの値を同一性尺度（距離を表す尺度）として出力し、処理を終了する。

それ以外のステップについては、図２１の場合と同様である。ただし、ステップＳ１０８で次元の番号ｎが次元数Ｎに到達した場合にはステップＳ２１０へ移行する。

次に、第１の量子化インデックス値と第２の量子化インデックス値とで、「共に量子化インデックスが０」である次元を除外し、同一性尺度として類似度を用いる場合の動作について説明する。

図２３は、照合手段１００の動作を示す別のフローチャートである。図２３のフローチャートでも、量子化インデックスベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。また、類似度を算出する変数をＢで表すこととし、「共に量子化インデックスが０」ではない次元をカウントするための変数をＡで表すこととする。

まず、次元決定手段１０１は、照合する量子化インデックスベクトルの最初の次元として、次元１を決定し（ｎ＝１）、量子化値取得手段１０２、１０３へ供給するとともに、尺度算出手段１０４において変数Ａ、Ｂを０にセットし（ステップＳ３００）、ステップＳ１０２へ移行する。

ステップＳ１０２は図２１の場合と同様であり、終了後、ステップＳ３１４へ移行する。

ステップＳ３１４では、尺度算出手段１０４において、第１の量子化インデックス値と第２の量子化インデックス値とがともに０であるかどうかを調べる。ともに０である場合には、ステップＳ１０８へ移行し、どちらか一方が０でない場合には、変数Ａの値をひとつ増やし（ステップＳ３１６）、ステップＳ１０４へ移行する。

ステップＳ１０４、Ｓ１０６、Ｓ１０８、Ｓ１１２の処理は図２１の場合と同様である。ステップＳ１０８で次元の番号ｎが次元数Ｎに到達した場合には、ステップＳ３１０へ移行する。

ステップＳ３１０では、尺度算出手段１０４において、Ｂ／Ａの値を算出し、同一性尺度として出力し、処理を終了する。ただし、Ａ＝０の場合には、規定の値（例えば０．５）を出力する。

また、段落００７６で述べたように、ステップＳ３１０では、Ｂ／Ａを算出するかわりに、Ｄ＝Ｎ−Ａを求め、Ｂ／ｆ（Ｄ）（ｆ（Ｄ）はＤの単調非増加関数）によって同一性尺度を算出するようにしてもよい。あるいは、段落００７７で述べたように、同一性尺度を（Ｂ／ｆ（Ｄ））＋ｇ（Ｄ）として算出してもよい。

また、Ａを求めずにＤの値を直接算出するようになっていてもよい。この場合のフローを示したのが図３５である。基本的には図２３と同様であるが、ステップＳ５００でＡのかわりに変数Ｄに０をセットし、ステップＳ３１４で量子化インデックスがともに０の場合にステップＳ５１６でＤを１つ増やしてステップＳ１０８へ移行し、どちらか一方の量子化インデックスが０でない場合にステップＳ１０４へ移行し、ステップＳ５１０でＢとＤとから同一性尺度を上述の方法によって算出する点が異なる。

次に、第１の量子化インデックス値と第２の量子化インデックス値とで、「共に量子化インデックスが０」である次元を除外し、同一性尺度として距離を用いる場合の動作について説明する。

図３４は、照合手段１００の動作を示す別のフローチャートである。図３４のフローチャートでも、量子化インデックスベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。また、距離尺度を算出する変数をＣで表すこととし、「共に量子化インデックスが０」ではない次元をカウントするための変数をＡで表すこととする。

基本的なフローは、図２３の場合と同じであるが、ステップＳ３００、Ｓ１０４、Ｓ１０６、Ｓ３１０がそれぞれステップＳ４００、Ｓ２０４、Ｓ２０６、Ｓ４１０に置き換わっている点が異なる。

まず、ステップＳ４００では、次元決定手段１００において、照合する量子化インデックスベクトルの最初の次元として、次元１を決定し（ｎ＝１）、量子化値取得手段１０２、１０３へ供給するとともに、尺度算出手段１０４において変数Ａ、変数Ｃを０にセットする。

ステップＳ２０４、ステップＳ２０６については、図２２の場合と同様である。

ステップＳ４１０では、尺度算出手段１０４において、Ｃ／Ａの値を算出し、同一性尺度として出力し、処理を終了する。ただし、Ａ＝０の場合には、規定の値（例えば０．５）を出力する。

それ以外のステップについては、図２３の場合と同様である。ただし、ステップＳ１０８で次元の番号ｎが次元数Ｎに到達した場合にはステップＳ４１０へ移行する。

なお、ここでは、次元１からＮまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。また、図２３のステップＳ３１０の場合と同様に、Ｃ／Ａを算出するかわりに、Ｄ＝Ｎ−Ａを求め、Ｃ／ｆ（Ｄ）などによって同一性尺度を算出してもよい。また、図３５と同様にして、Ａを求めずにＤの値を直接算出するようになっていてもよい。

［照合手段の第２の実施の形態］
次に、本発明で出力される量子化インデックスベクトルを照合する照合手段の第２の実施の形態についてブロック図を用いて説明する。

図２８を参照すると、本発明で出力される量子化インデックスベクトルを照合する照合手段１１０のブロック図が示されており、次元決定手段１０１、量子化値取得手段１０２、１０３、余白領域特定手段１０５、補正付尺度算出手段１０６とからなる。

次元決定手段１０１は量子化値取得手段１０２、１０３へ接続され、決定された次元情報を出力する。量子化値取得手段１０２は、第１の量子化インデックスベクトルから、次元決定手段１０１から入力される次元の量子化インデックス値を取得し、第１の量子化インデックス値として余白領域特定手段１０５へ出力する。量子化値取得手段１０３は、第２の量子化インデックスベクトルから、次元決定手段１０１から入力される次元の量子化インデックス値を取得し、第２の量子化インデックス値として余白領域特定手段１０５へ出力する。

余白領域特定手段１０５は、量子化値取得手段１０２、１０３からそれぞれ出力される、次元ごとの第1、第２の量子化インデックス値（量子化インデックスベクトルの各次元の値）から、それぞれが抽出された元の画像（量子化インデックスベクトルが抽出された画像。ここでは第１の画像と第２の画像と呼ぶ）における余白領域を特定し、特定した余白領域を表す情報（余白領域情報）を、補正付尺度算出手段１０６へ供給する。例えば、余白領域特定手段１０５は、予め定めた１以上の余白領域の候補毎に、その候補における余白領域に少なくとも一方の抽出領域が含まれる次元の取り得る量子化インデックスと実際の量子化インデックスとが一致する程度を示す数値を閾値と比較して、余白領域を特定する。なお、ここで余白領域が無いと判断されたら、余白領域が無いという情報を、余白領域情報として、補正付尺度算出手段１０６へ供給する。

ここで余白領域とは、画像・映像の表示のアスペクト比の調整や、付随情報を提示するために、画像の主となる（中心）領域の外側（縁）に付加される領域である。

余白領域の代表的な例は、黒帯である。黒帯は、映像を表示する際に、映像自体のアスペクト比と、表示画面のアスペクト比が異なる場合などに、アスペクト比を調整するためなどに付加される（このように黒帯が付加された画像をレターボックスと呼ぶ）。一般的に黒色であるが、黒色に限らない（本明細書では、黒色でないものも含めて黒帯と呼ぶ）。

図２９に、黒帯が付加された画像の例を示す。図２９に示すように、画像の主となる（中心）領域（花が写っている領域）の外側（上下、左右、四方、Ｌ字などのパターンがある）に黒帯が付加されている。

余白領域の他の例としては、データ放送などの画面のデータ提示領域や、Ｌ字放送などの画面のＬ字領域などが挙げられる。なお、余白領域は、画像の主となる領域の外側に付加される領域であれば、これらに限られない。

なお、余白領域を除いた、画像の主となる（中心）領域のことを、主領域と呼ぶことにする。

また、特定した余白領域を表す情報（余白領域情報）としては、それぞれの元画像である第１の画像と、第２の画像の、それぞれに対して特定された余白領域を表す情報を出力してもよい。また第１の画像の余白領域と、第２の画像の余白領域の重なる領域（重複領域）を表す情報を出力してもよい。また第１の画像の余白領域と、第２の画像の余白領域の総和の領域（総和領域）を表す情報を出力してもよい。

また余白領域情報は、例えば、特定された余白領域に抽出領域が含まれる次元（の集合）を識別する情報（例えば次元を特定する番号）などでもよい。ここで、特定された余白領域に抽出領域が含まれる次元とは、２つの抽出領域の両方、あるいはどちらか一方が特定された余白領域に含まれる次元のことである。また逆に、特定された余白領域以外の領域（すなわち主領域）に抽出領域が含まれる次元（の集合）を識別する情報などでもよい。

余白領域特定手段１０５が、次元ごとの第１、第２の量子化インデックス値（量子化インデックスベクトルの各次元の値）から、それぞれが抽出された元の画像（量子化インデックスベクトルが抽出された画像）における余白領域を特定する方法の例を、以下に示す。

この方法では、あらかじめ余白領域の候補領域（余白候補領域）を設定しておく。設定された余白候補領域に抽出領域が含まれる次元の量子化インデックス値が、領域特徴量の「差がない」ことを示す量子化インデックス値である次元の割合を算出する。そしてこの割合がある閾値よりも大きい場合に、設定された余白候補領域が、余白領域であると特定する。例えば、量子化インデックスが式２に基づいて算出された場合は、設定された余白候補領域に抽出領域が含まれる次元のうち、「量子化インデックスが０」である次元の割合が、ある閾値よりも大きい場合に、設定された余白候補領域が、余白領域であると特定する。この方法は、余白領域内（特に黒帯など）では、２つの抽出領域の領域特徴量（輝度値など）に差がない（例えば黒帯では、黒帯領域内の２つの抽出領域の輝度値は同じである）、という特性を利用している。なお、ここでの、余白候補領域に抽出領域が含まれる次元とは、２つの抽出領域の両方が余白候補領域に含まれる次元のことである。

以下では、抽出する特徴量ベクトルが[第８の実施の形態]で説明した３２５次元であるとした場合の、余白領域判定手段１０５の具体例を示す。

まず、あらかじめ余白候補領域を設定しておく。例えば、余白候補領域として、図２９の（ａ）上下黒帯（横黒帯）と、（ｂ）左右黒帯（縦黒帯）を設定する。また、それぞれに対して、黒帯の幅に応じて２段階の幅（幅小、幅大）を設定することにする。そして、設定した余白候補領域に抽出領域が含まれる次元の集合を定める。ここでは、余白候補領域に含まれる図２５−aのタイプの次元（全１１３次元）を対象とすることにする。例えば、（a）上下黒帯（幅小）、（a）上下黒帯（幅大）、（ｂ）左右黒帯（幅小）、（ｂ）左右黒帯（幅大）、に含まれる次元は、以下のように設定できる（図２５−aを参照）。

（ａ）上下黒帯（幅小）に抽出領域が含まれる次元は｛１、２、３、４、１７、１８，１９、２０、４５、４６、４７、４８、６１、６２、６３、６４｝となる。
（ａ）上下黒帯（幅大）に抽出領域が含まれる次元は｛１、２、３、４、１７、１８，１９、２０、４５、４６、４７、４８、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、１０７、１０８、１０９、１１０、１１１、１１２、１１３｝となる。
（ｂ）左右黒帯（幅小）に抽出領域が含まれる次元は｛１、５、９、１３、２０、２４、２８、３２、３３、３７、４１、４５、５２、５６、６０、６４｝となる。
（ｂ）左右黒帯（幅大）に抽出領域が含まれる次元は｛１、５、９、１３、２０、２４、２８、３２、３３、３７、４１、４５、５２、５６、６０、６４、６５、７１、７２、７８、７９、８５、８６、９２、９３、９９、１００、１０６、１０７、１１３｝となる。

このようにして設定した余白候補領域に含まれる次元の情報を、余白領域特定手段１０５へ入力として与えておく。

余白領域特定手段１０５は、供給された量子化インデックス値（量子化インデックスベクトルの各次元の値）から、上記のように設定された余白候補領域に抽出領域が含まれる次元のうち、量子化インデックスが０（差がない）である次元の割合を算出する。例えば、（a）上下黒帯（幅小）に含まれる１６次元のうち、量子化インデックスが０である次元が７次元の場合は、７／１６となる。そして、この割合があらかじめ設定された閾値よりも大きい場合に、設定された余白候補領域が、その量子化インデックスベクトルが抽出された元画像の余白領域であると特定する。

例えば、閾値を０．９と設定したとする。そして、あらかじめ設定された余白候補領域、上下黒帯（幅小）、上下黒帯（幅大）、左右黒帯（幅小）、左右黒帯（幅大）のそれぞれに対して算出した量子化インデックスが０である次元の割合が、それぞれ１６／１６（１．０）、２０／３０（０．６６６）、５／１６（０．３１２５）、１０／３０（０．３３３）、である場合は、上下黒帯（幅小）の余白候補領域が、余白領域であると特定できる。また例えば、それぞれの割合が、１６／１６（１．０）、３０／３０（１．０）、５／１６（０．３１２５）、１０／３０（０．３３３）、である場合は、上下黒帯（幅大）の余白候補領域が、余白領域であると特定できる（幅小は幅大に含まれるので）。また例えば、それぞれの割合が、１６／１６（１．０）、２０／３０（０．６６６）、１５／１６（０．９３７５）、１８／３０（０．６）である場合は、上下黒帯（幅小）と左右黒帯（幅小）の２つの余白候補領域の総和の領域が、余白領域であると特定できる。また例えば、それぞれの割合が、１／１６（０．０６２５）、４／３０（０．１３３３）、５／１６（０．３１２５）、１０／３０（０．３３３）、である場合は、余白領域は無いと判定することができる。

余白領域特定手段１０５は、供給される第1、第２の量子化インデックス値（量子化インデックスベクトルの各次元の値）のそれぞれに対して、上記の処理を行い、それぞれが抽出された元画像である第１の画像と第２の画像の余白領域の特定を行う。

余白領域を表す情報（余白領域情報）としては、例えば、第１の画像と、第２の画像の、それぞれに対して特定された余白領域を表す情報を出力してもよい。例えば、第１の画像に対して余白領域が上下黒帯（幅小）と特定され、第２の画像に対して余白領域が左右黒帯（幅大）と特定された場合に、第１の画像に対して余白領域が上下黒帯（幅小）であることを示す情報（例えば余白候補領域を指し示すインデックス番号など）、第２の画像に対して余白領域が左右黒帯（幅大）であることを示す情報を出力してもよい。また、それぞれの画像の特定された余白領域の重複領域や総和領域の情報を出力してもよい。

また余白領域を表す情報（余白領域情報）としては、例えば、特定された余白領域に抽出領域が含まれる次元（の集合）を示す情報を出力してもよい。例えば、第１の画像に対して余白領域が上下黒帯（幅小）と特定された、第２の画像に対して余白領域が左右黒帯（幅大）と特定された場青に、第１の画像に対して次元｛１、２、３、４、１７、１８，１９、２０、４５、４６、４７、４８、６１、６２、６３、６４｝を示す情報を（例えば、次元の番号の集合）、第２の画像に対して次元｛１、５、９、１３、２０、２４、２８、３２、３３、３７、４１、４５、５２、５６、６０、６４、６５、７１、７２、７８、７９、８５、８６、９２、９３、９９、１００、１０６、１０７、１１３｝を示す情報を、出力してもよい。また例えば、それぞれの画像の特定された余白領域の重複領域や総和領域に、含まれる次元（の集合）を示す情報を出力してもよい。また、ここでは特定された余白領域に含まれる図２５−aのタイプの次元（全１１３次元）を出力例として示したが、特定された余白領域に含まれる他のタイプの次元（図２５−ｂから図２５−ｇ）を出力してもよい。また例えば、逆に、特定された余白領域以外の領域（すなわち主領域）に抽出領域が含まれる次元（の集合）を示す情報を出力してもよい。

上記の例では、余白領域特定手段１０５は、あらかじめ設定した余白候補領域に抽出領域が含まれる次元が「量子化インデックスが０」である次元の割合を利用したが、例えば、余白候補領域の内と外（主領域）の双方に抽出領域を含む次元（つまり一方の抽出領域が余白候補領域内に存在し、もう一方の余白候補領域内に存在しない）において、「量子化インデックスが０」ではない次元の割合を算出し、その割合がある閾値より大きい場合に、余白候補領域が余白領域であると特定してもよい。これは、余白領域と主領域との間は、領域特徴量に差がある、という特性を利用している。また、黒帯の場合は、余白領域（黒帯領域）の輝度値は小さくなり、一般的に余白領域内の抽出領域の輝度値が主領域の抽出領域の輝度値よりも小さくなることを利用して、＋１、−１の符号までも考慮して、割合を算出してもよい。

また、例えば余白候補領域に含まれる次元の典型的な量子化インデックス値をテンプレートとして保存し、供給される次元ごとの量子化インデックス値（量子化インデックスベクトルの各次元の値）との類似度を判定し、類似度がある閾値より大きい場合に、余白候補領域が余白領域であると特定してもよい。

またここで述べた方法に限らず、供給される次元ごとの量子化インデックス値（量子化インデックスベクトルの各次元の値）自体から、余白領域を特定する方法であれば、どのような方法でも構わない。

補正付尺度算出手段１０６は、量子化値取得手段１０２、１０３からそれぞれ出力される、次元ごとの第1、第２の量子化インデックス値（量子化インデックスベクトルの各次元の値）から、余白領域特定手段１０５から供給される余白領域を表す情報（余白領域情報）が示す余白領域に抽出領域が含まれる次元の重みを下げて、画像の同一性（類似度）を表す尺度を算出し、同一性尺度として出力する。

またここで、余白領域に抽出領域が含まれる次元とは、２つの抽出領域の両方、あるいはどちらか一方が余白領域に含まれる次元のことである。

ここで、第１の画像と第２の画像のそれぞれに対して、余白領域情報が供給される場合は、それらの余白領域情報が示す余白領域の重なる領域（重複領域）や総和の領域（総和領域）を求めるなどして、余白領域を一元化するとよい。

また、余白領域に抽出領域が含まれる次元は、余白領域情報が、余白領域に抽出領域が含まれる次元（の集合）を示す情報の場合、ここで供給される次元（の集合）の集合に含まれる次元に限らず、同じ余白領域に抽出領域が含まれる次元であればよい。例えば、抽出する特徴量ベクトルが[第８の実施の形態]で説明した３２５次元であるとした場合に、余白領域情報が、図２５−aのタイプの次元の中から選定された次元に限定している場合に、その他の図２５−ｂから図２５−ｇのタイプに含まれる次元も、同じ余白領域に抽出領域が含まれれば、「余白領域に抽出領域が含まれる次元」の対象とすることができる。

なお、余白領域に含まれる次元の重みを下げるということは、相対的に余白領域に含まれない次元、すなわち主領域に含まれる次元の重みを上げて、同一性尺度を算出することと同値である。従って、明示的に、余白領域に含まれない次元（主領域に含まれる次元）の重みを上げて、同一性尺度を算出してもよい。

また、余白領域に含まれる次元の重みを０にして、同一性尺度を算出してもよい。すなわち、余白領域に含まれる次元を除外して、余白領域に含まれない次元（主領域に含まれる次元）だけで同一性尺度を算出してもよい。例えば、余白領域に、いずれの抽出領域も含まれない次元のみを用いて、同一性尺度を算出してもよい。

また、補正付尺度算出手段１０６は、余白領域に含まれる次元の重みを下げて、画像の同一性尺度を算出する方法であれば、同一性尺度の算出方法は任意でよい。例えば、これまでに述べた、次元ごとの第1、第２の量子化インデックス値（量子化インデックスベクトルの各次元の値）から、対応する次元どうしで比較して、量子化インデックスが一致する次元数（類似度）や、量子化インデックスが非一致である次元数（ハミング距離）を同一性尺度の算出方法として用いてもよい。または、Ｌ１距離やＬ２距離（ユークリッド距離）（ただし式２に基づいて量子化インデックスが算出された場合）などを用いてもよい。また、その他、これまでに説明した同一性尺度の算出方法を用いてもよい。

なお、余白領域情報として、余白領域が無いことを示す情報が供給された場合は、通常の尺度算出手段１０４と同様に、同一性尺度を算出すればよい。

例えば、余白領域に含まれる次元の重みを０として、すなわち、余白領域に含まれる次元を除外して、主領域に含まれる次元を選定し、それら主領域に含まれる次元のみを用いて、量子化インデックスが一致する次元数（類似度）、量子化インデックスが非一致である次元数（ハミング距離）、Ｌ１距離やＬ２距離、を算出し、同一性尺度として出力してもよい。

また例えば、余白領域に含まれる次元の重み値をＷ１、余白領域に含まれない次元（主領域に含まれる次元）の重み値をＷ２として、Ｗ１＜Ｗ２とした場合に、次元ごとの第1、第２の量子化インデックス値（量子化インデックスベクトルの各次元の値）から、対応する次元どうしで比較して、量子化インエックスが一致する次元に対して、その次元の重み値を加算していき（すなわち余白領域に含まれる次元の量子化インデックスが一致したらＷ１を加算、余白領域に含まれない次元の量子化インデックスが一致したらＷ２を加算、量子化インデックスが一致しない次元は０を加算）、重み付き類似度として、同一性尺度を算出してもよい。

また例えば、抽出する特徴量ベクトルが[第８の実施の形態]で説明した３２５次元であるとした場合に、上下黒帯（幅小）に該当する次元｛１、２、３、４、１７、１８，１９、２０、４５、４６、４７、４８、６１、６２、６３、６４｝が、余白領域情報として供給された場合についての例を示す。この場合、単純にこれらの次元｛１、２、３、４、１７、１８，１９、２０、４５、４６、４７、４８、６１、６２、６３、６４｝（１６次元）が余白領域に含まれる次元とし、それ以外の次元（３２５−１６＝３０９次元）を余白領域に含まれない次元（主領域に含まれる次元）としてもよい。また、上下黒帯（幅小）に該当するため、上下黒帯（幅小）の領域に抽出領域が含まれる全ての次元を余白領域とすることもできる。例えば、上下黒帯（幅小）の領域にいずれかの抽出領域の部分領域が含まれる次元、例えば次元｛１１４、１１５、１１６、１１７、１２６、１２７、１２８、１２９｝なども余白領域に含まれる次元としてもよい。この場合、それ以外の次元、すなわち上下黒帯（幅小）の領域といずれの抽出領域も重ならない次元、が、余白領域に含まれない次元（主領域に含まれる次元）となる。

こうして求められた余白領域に抽出領域が含まれる次元と、余白領域に抽出領域が含まれない次元（主領域に含まれる次元）に対して、例えば、余白領域に抽出領域が含まれない次元（主領域に含まれる次元）のみを対象に、量子化インデックスが一致する次元数（類似度）、量子化インデックスが非一致である次元数（ハミング距離）、Ｌ１距離やＬ２距離、を算出し、同一性尺度として出力してもよい。また、余白領域に含まれる次元の重み値をＷ１、余白領域に含まれない次元（主領域に含まれる次元）の重み値をＷ２として、Ｗ１＜Ｗ２とし、次元ごとの第1、第２の量子化インデックス値（量子化インデックスベクトルの各次元の値）から、対応する次元どうしで比較して、量子化インエックスが一致する次元に対して、その次元の重み値を加算していき、重み付き類似度として、同一性尺度を算出し、出力してもよい。

［照合手段の第２の実施の形態の効果］
照合手段の第２の実施の形態の効果について説明する。

照合手段の第２の実施の形態では、余白領域特定手段１０５により、同一性の判定とは無関係な余白領域（黒帯など）を特定し、補正付尺度算出手段１０６で、余白領域に含まれる次元の重みを下げて同一性尺度を算出するため（逆の言い方をすれば、同一性の判定の主の領域の重みを上げて同一性尺度を算出するため）、より正確に同一性尺度を算出することができる。従って、より高精度に同一性の判定を行うことができる。

特に、黒帯などの余白領域を含む異なる２つの画像を照合した場合、余白領域（黒帯）は共通となるため、主領域が異なる画像であっても、通常の照合手段１００では、同一性尺度を大きい値として算出してしまうという問題があった。照合手段の第２の実施の形態（照合手段１１０）では、余白領域の重みを下げて同一性尺度の算出を行うため、このような問題は発生しない。

また、照合手段の第２の実施の形態では、余白領域特定手段１０５が、量子化インデックスベクトル自体から余白領域を特定しているため、画像識別子の抽出側（抽出の段階）で、余白領域を別途特定する手段が必要ない、という効果もある。従って、画像識別子の抽出側での負担（処理速度、実装コストなどの負担）がかからない、という効果がある。

また、これまでに説明した［照合手段の第２の実施の形態］（図２８、照合手段１１０）は、図２０（照合手段１００）に示した［照合手段の実施の形態］に接続し、階層的な照合を行うこともできる。すなわち、まず、照合手段１００により、通常の同一性尺度（尺度算出手段１０４の出力）を出力する。照合手段１００から出力された通常の同一性尺度を、ある規定の閾値と比較する。同一性尺度が閾値よりも小さい（同一である度合いが小さい）場合は、そのまま通常の同一性尺度を出力する。同一性尺度が閾値よりも大きい（同一である度合いが大きい）場合は、次に、照合手段１１０により、余白領域を特定し、余白領域に含まれる次元の重みを下げて算出した補正付きの同一性尺度を算出し、出力する。

このように照合手段１００と照合手段１１０により階層的な照合を行うことにより、照合手段１００による通常の同一性尺度が大きい場合にのみ、照合手段１１０の補正付きの同一性尺度の算出を行うため、照合の処理速度を高速化することができる、という効果がある。通常、異なる画像が多く含まれているデータベースでの同一性判定を行う場合は、大半の場合において、照合手段１００による通常の同一性尺度が、閾値よりも小さくなるため、照合手段１００で終了することが多くなるため、処理速度を大幅に高速化することができる。

［照合手段の第３の実施の形態］
次に、本発明で出力される量子化インデックスベクトルを照合する照合手段の第３の実施の形態についてブロック図を用いて説明する。

図３６を参照すると、本発明で出力される量子化インデックスベクトルを照合する照合手段２００のブロック図が示されており、符号決定手段２０１、符号値取得手段２０２、２０３、尺度算出手段２０４とからなる。

符号決定手段２０１は符号値取得手段２０２、２０３へ接続され、決定された符号指定情報を出力する。符号値取得手段２０２は、第1の符号化量子化インデックスベクトルから、符号決定手段２０１から入力される符号指定情報により定まる符号の値を取得し、第1の符号値として尺度算出手段２０４へ出力する。符号値取得手段２０３は、第２の符号化量子化インデックスベクトルから、符号決定手段２０１から入力される符号指定情報により定まる符号の値を取得し、第２の符号値として尺度算出手段２０４へ出力する。尺度算出手段２０４は、符号値取得手段２０２、２０３からそれぞれ出力される第1、第２の符号値から同一性を表す尺度を算出し、出力する。

次に、図３６の照合手段２００の動作について説明する。

まず、照合手段２００へは、第１の画像から抽出される量子化インデックスベクトルを符号化したベクトルである第１の符号化量子化インデックスベクトルと、第２の画像から抽出される量子化インデックスベクトルを符号化したベクトルである第２の符号化量子化インデックスベクトルとが入力される。ここで、符号化量子化インデックスベクトルは、量子化インデックスベクトルの量子化インデックス値を複数次元分まとめて符号化して得られる符号からなる符号列である。段落０１８７で説明したように、特徴ベクトルの各次元の特徴量を３値に量子化し、５次元分まとめて符号化する場合には、５次元ごとに１つの符号が生成される。よって、特徴ベクトルの次元数がＮの場合には、Ｎ／５個の符号が生成される。この場合、符号化量子化インデックスベクトルはＮ／５個の符号からなる符号列となる。

入力された第１、第２の符号化量子化インデックスベクトルは、それぞれ符号値取得手段２０２、２０３へ入力される。

符号値取得手段２０２、２０３へは、符号決定手段２０１から出力される符号指定情報も入力される。符号決定手段２０１では、符号列中の各符号を指定する情報を順次出力する。符号列中の符号の数をＭ（上述の例ではＭ＝Ｎ／５）とすると、出力する順序は必ずしも1からＭまで1つずつ増えていく必要はなく、1からＭまでの値が過不足なく指定される順序であれば、どのような順序であってもよい。

符号値取得手段２０２、２０３では、入力された符号化量子化インデックスベクトルから、符号決定手段２０１から出力される符号指定情報で指定される符号の値を取得する。そして、取得した符号値を尺度算出手段２０４へ出力する。

尺度算出手段２０４では、符号取得手段２０１、２０２から出力される第1の符号値と第２の符号値とを比較する。この際、符号値を復号して量子化インデックス値に戻してから比較するのではなく、符号値のまま比較する。段落０１９５から段落０１９７で説明したように、尺度算出手段２０４では、２つの符号値からそれらの符号の間の同一性尺度をひくことができるルックアップテーブルが用意されており、これを用いて符号単位で同一性尺度を算出する。これを各符号に対して行い、第1、第２の符号値間の類似尺度（あるいは距離尺度）を同一性尺度として算出する。

次に、フローチャートを用いて図３６の照合手段２００の動作を説明する。ここでは、同一性尺度として類似度を用いる場合の動作について説明する。

図３７は、照合手段２００の動作を示すフローチャートである。図３７のフローチャートでは、符号化量子化インデックスベクトルの符号の番号をｍで表し、番号は１からＭまでの合計Ｍ個の符号があるものとする。また、類似度を算出する変数をＢで表すこととする。

まず、符号決定手段２０１は、照合する符号化量子化インデックスベクトルの最初の符号として、１番目の符号を取得することを決定し（ｍ＝１）、符号値取得手段２０２、２０３へ供給するとともに、尺度算出手段２０４において変数Ｂを０にセットする。（ステップＳ６００）。

次に、符号値取得手段２０２、２０３において、第１の符号化量子化インデックスベクトル、第２の符号化量子化インデックスベクトルから、ｍ番目の第１の符号値と第２の符号値とを取得し、尺度算出手段２０４へ供給する（ステップＳ６０２）。

次に、尺度算出手段２０４において、第１の符号値と第２の符号値とから、それぞれの符号値に対応する複数次元の特徴量間の類似度ΔＢを、段落０１９５〜０１９７で説明したルックアップテーブルを参照することにより算出する（ステップＳ６０４）。

次に、符号の番号ｍが符号数Ｍに到達したかどうかを調べ（ステップＳ６０８）、到達しない場合はステップＳ６１２へ移行し、到達した場合には、そのときの変数Ｂの値を同一性尺度（類似度を表す尺度）として出力し（ステップＳ１１０）、処理を終了する。

ステップ６１２では、符号決定手段２０１が、取得する量子化インデックスの次元として、ｍ＝ｍ＋１によって次の符号の番号を決定し、符号指定情報として符号値取得手段２０２、２０３へ供給する。そして、再度ステップＳ６０２へ移行する。

なお、ここでは、符号の番号ｍからＭまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。また、ここでは類似度を算出する場合について述べたが、同様にして、距離尺度を同一性尺度として算出することもできる。この場合、ルックアップテーブルには、類似度の変わりに距離尺度を保持しておくようにする。

図３８は、照合手段２００の動作を示す別のフローチャートである。図３８のフローチャートでも、符号化量子化インデックスベクトルの符号の番号をｍで表し、番号は１からＭまでの合計Ｍ個の符号があるものとする。また、類似度を算出する変数をＢで表すこととし、「共に量子化インデックスが０」ではない次元をカウントするための変数をＡで表すこととする。

まず、符号決定手段２０１は、照合する符号化量子化インデックスベクトルの最初の符号として、１番目の符号を取得することを決定し（ｍ＝１）、符号値取得手段２０２、２０３へ供給するとともに、尺度算出手段２０４において変数Ａ、Ｂを０にセットし（ステップＳ７００）、ステップＳ６０２へ移行する。

ステップＳ６０２は図３７の場合と同様であり、終了後、ステップＳ７１４へ移行する。

ステップＳ７１４では、尺度算出手段２０４において、第１の符号値と第２の符号値とから、符号値に対応する複数の特徴ベクトルの次元内に、「ともに０」とはならない次元がいくつあるかを調べる。この数をΔＡとする。これも、段落０１９７で述べたように、符号値とΔＡとの関係を記述したルックアップテーブルを用いることによって算出できる。

次に、ΔＡの値は変数Ａに加算される（ステップＳ７１６）。この際、ΔＡの値が０の場合には、変数Ａに０を加算するかわりに、加算しないように制御してもよい。

ステップＳ６０４、Ｓ１０６、Ｓ６０８、Ｓ６１２の処理は図３７の場合と同様である。ステップＳ６０８で符号の番号ｍが符号数Ｍに到達した場合には、ステップＳ３１０へ移行する。

ステップＳ３１０では、尺度算出手段２０４において、Ｂ／Ａの値を算出し、同一性尺度として出力し、処理を終了する。ただし、Ａ＝０の場合には、規定の値（例えば０．５）を出力する。

以上本発明の実施の形態について説明したが、本発明は以上の実施の形態にのみ限定されず、その他各種の付加変更が可能である。また、本発明の画像識別子抽出装置および照合装置は、その有する機能をハードウェア的に実現することは勿論、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における画像識別子抽出装置および照合装置として機能させる。

なお、本発明は、日本国にて２００９年６月１６日に特許出願された特願２００９−１４３３５２の特許出願、および日本国にて２００９年６月２４日に特許出願された特願２００９−１４９８９３の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。

１…次元決定手段
２…抽出領域取得手段
３、３Ａ…領域特徴量算出手段
３１、３１Ａ…第１の領域特徴量算出手段
３２、３２Ａ…第２の領域特徴量算出手段
４、４Ｂ…比較手段
４１…大小比較手段
４２、４４…量子化手段
４３…差分値算出手段
４５…量子化境界決定手段
５…領域特徴量算出方法取得手段
６…比較方法取得手段
７…符号化手段
１００、１１０、２００…照合手段
１０１…次元決定手段
１０２、１０３…量子化値取得手段
１０４、２０４…尺度算出手段
１０５…余白領域特定手段
１０６…補正付尺度算出手段
２０１…符号決定手段
２０２、２０３…符号値取得手段

Claims

画像中の、複数の部分領域対の、各部分領域から領域特徴量を抽出し、部分領域対ごとに、対をなす２つの部分領域の前記領域特徴量の差分値を量子化し、部分領域対ごとに算出された量子化値を要素とした集合を前記画像の識別に用いる画像識別子として生成する、生成方法によって生成された、第１の画像の画像識別子と第２の画像の画像識別子とから、各々の画像の余白領域を特定する余白領域特定手段と、
前記第１の画像の画像識別子と前記第２の画像の画像識別子とを、対をなす２つの部分領域の少なくとも一方が前記特定された余白領域に含まれる要素の重みが小さくなる方法で照合する照合手段と、
を備えることを特徴とする画像識別子照合装置。
前記余白領域特定手段は、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１に記載の画像識別子照合装置。
前記余白領域特定手段は、対をなす２つの部分領域の少なくとも一方が候補領域に含まれる複数の要素の量子化値に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１または２に記載の画像識別子照合装置。
前記余白領域特定手段は、対をなす２つの部分領域の少なくとも一方が候補領域に含まれる複数の要素の量子化値を予め定められた値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１乃至３の何れかに記載の画像識別子照合装置。
前記余白領域特定手段は、対をなす２つの部分領域の少なくとも一方が候補領域に含まれる複数の要素の量子化値を予め定められた値と比較し、一致する要素の割合を閾値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１乃至４の何れかに記載の画像識別子照合装置。
前記余白領域特定手段は、対をなす２つの部分領域の少なくとも一方が候補領域に含まれる複数の要素の量子化値を予め定められた値と比較し、一致しない要素の割合を閾値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１乃至４の何れかに記載の画像識別子照合装置。
前記余白領域特定手段は、対をなす２つの部分領域の双方が候補領域に含まれる複数の要素の量子化値を、前記差分値の絶対値がある規定値よりも小さいときに求まる量子化値と比較し、一致する要素の割合を閾値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１乃至４の何れかに記載の画像識別子照合装置。
前記余白領域特定手段は、対をなす２つの部分領域の双方が候補領域に含まれる複数の要素の量子化値を、前記差分値の絶対値がある規定値よりも小さいときに求まる量子化値と比較し、一致しない要素の割合を閾値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１乃至４の何れかに記載の画像識別子照合装置。
前記余白領域は、画像の外側の領域である、
ことを特徴とする請求項１乃至８の何れかに記載の画像識別子照合装置。
前記照合手段は、前記第１の画像の画像識別子と前記第２の画像の画像識別子とを、対をなす２つの部分領域の少なくとも一方が前記特定された余白領域に含まれる要素を除外して照合する、
ことを特徴とする請求項１乃至９の何れかに記載の画像識別子照合装置。
前記照合手段は、前記第１の画像の画像識別子と前記第２の画像の画像識別子との対応する要素を比較して、前記第１の画像と前記第２の画像とが同一である度合いを示す同一性尺度を算出する、
ことを特徴とする請求項１乃至１０の何れかに記載の画像識別子照合装置。
前記複数の部分領域対は、対をなす２つの部分領域の形状の組み合わせと、対をなす２つの部分領域の相対的な位置関係との双方が、他の少なくとも１つの部分領域対と相違する１以上の部分領域対を含む、
ことを特徴とする請求項１乃至１１の何れかに記載の画像識別子照合装置。
画像中の、複数の部分領域対の、各部分領域から領域特徴量を抽出し、部分領域対ごとに、対をなす２つの部分領域の前記領域特徴量の差分値を量子化し、部分領域対ごとに算出された量子化値を要素とした集合を前記画像の識別に用いる画像識別子として生成する、生成方法によって生成された、第１の画像の画像識別子と第２の画像の画像識別子とから、各々の画像の余白領域を特定し、
前記第１の画像の画像識別子と前記第２の画像の画像識別子とを、対をなす２つの部分領域の少なくとも一方が前記特定された余白領域に含まれる要素の重みが小さくなる方法で照合する、
ことを特徴とする画像識別子照合方法。
前記余白領域の特定では、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１３に記載の画像識別子照合方法。
前記余白領域の特定では、対をなす２つの部分領域の少なくとも一方が候補領域に含まれる複数の要素の量子化値に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１３または１４に記載の画像識別子照合方法。
前記余白領域の特定では、対をなす２つの部分領域の少なくとも一方が候補領域に含まれる複数の要素の量子化値を予め定められた値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１３乃至１５の何れかに記載の画像識別子照合方法。
前記余白領域の特定では、対をなす２つの部分領域の少なくとも一方が候補領域に含まれる複数の要素の量子化値を予め定められた値と比較し、一致する要素の割合を閾値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１３乃至１６の何れかに記載の画像識別子照合方法。
前記余白領域の特定では、対をなす２つの部分領域の少なくとも一方が候補領域に含まれる複数の要素の量子化値を予め定められた値と比較し、一致しない要素の割合を閾値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１３乃至１６の何れかに記載の画像識別子照合方法。
前記余白領域の特定では、対をなす２つの部分領域の双方が候補領域に含まれる複数の要素の量子化値を、前記差分値の絶対値がある規定値よりも小さいときに求まる量子化値と比較し、一致する要素の割合を閾値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１３乃至１６の何れかに記載の画像識別子照合方法。
前記余白領域の特定では、対をなす２つの部分領域の双方が候補領域に含まれる複数の要素の量子化値を、前記差分値の絶対値がある規定値よりも小さいときに求まる量子化値と比較し、一致しない要素の割合を閾値と比較した結果に基づいて、１以上の余白領域の候補領域のうちから、各々の画像の余白領域を特定する、
ことを特徴とする請求項１３乃至１６の何れかに記載の画像識別子照合方法。
前記余白領域は、画像の外側の領域である、
ことを特徴とする請求項１３乃至２０の何れかに記載の画像識別子照合方法。
前記照合では、前記第１の画像の画像識別子と前記第２の画像の画像識別子とを、対をなす２つの部分領域の少なくとも一方が前記特定された余白領域に含まれる要素を除外して照合する、
ことを特徴とする請求項１３乃至２１の何れかに記載の画像識別子照合方法。
前記照合では、前記第１の画像の画像識別子と前記第２の画像の画像識別子との対応する要素を比較して、前記第１の画像と前記第２の画像とが同一である度合いを示す同一性尺度を算出する、
ことを特徴とする請求項１３乃至２２の何れかに記載の画像識別子照合方法。
前記複数の部分領域対は、対をなす２つの部分領域の形状の組み合わせと、対をなす２つの部分領域の相対的な位置関係との双方が、他の少なくとも１つの部分領域対と相違する１以上の部分領域対を含む、
ことを特徴とする請求項１３乃至２３の何れかに記載の画像識別子照合方法。
コンピュータを、
画像中の、複数の部分領域対の、各部分領域から領域特徴量を抽出し、部分領域対ごとに、対をなす２つの部分領域の前記領域特徴量の差分値を量子化し、部分領域対ごとに算出された量子化値を要素とした集合を前記画像の識別に用いる画像識別子として生成する、生成方法によって生成された、第１の画像の画像識別子と第２の画像の画像識別子とから、各々の画像の余白領域を特定する余白領域特定手段と、
前記第１の画像の画像識別子と前記第２の画像の画像識別子とを、対をなす２つの部分領域の少なくとも一方が前記特定された余白領域に含まれる要素の重みが小さくなる方法で照合する照合手段と、
して機能させるためのプログラム。