JP5573863B2

JP5573863B2 - 画像識別子抽出装置

Info

Publication number: JP5573863B2
Application number: JP2012037128A
Authority: JP
Inventors: 亮磨大網; 浩太岩元
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2009-04-14
Filing date: 2012-02-23
Publication date: 2014-08-20
Anticipated expiration: 2030-04-12
Also published as: JP4935961B2; US20120027309A1; JP2012123832A; EP2420973A1; KR20120023607A; EP2420973A4; CN102395998B; JP5573862B2; JPWO2010119657A1; JP2012099159A; CN102395998A; JP5573864B2; US8861871B2; KR20130116379A; WO2010119657A1; JP2012099158A; EP2420973B1; JP2012099160A; KR101355299B1; KR101353104B1

Description

本発明は、画像を識別する（同一性を判定する）ための特徴量である画像識別子を抽出する画像識別子抽出装置に関する。

画像識別子は、画像を識別する（同一性を判定する）ための画像特徴量である。ある画像から抽出した画像識別子と、別の画像から抽出した画像識別子とを比較し、その比較結果から、２つの画像が同一である度合いを示す同一性尺度（一般的には、類似度または距離という）を算出することができる。また、算出した同一性尺度をある閾値と比較することにより、２つの画像が同一であるか否かを判定することができる。ここで「２つの画像が同一」とは、画像信号（画像を構成する画素の画素値）のレベルで２つの画像が同一である場合だけに限らず、画像の圧縮形式（フォーマット）の変換、画像のサイズ・アスペクト比の変換、画像の色調の調整、画像への各種フィルタ処理（鮮鋭化、平滑化など）、画像への局所的な加工（テロップ重畳、切抜きなど）、画像の再キャプチャリング、などの各種改変処理によって、一方の画像が他方の画像の複製された画像である場合も含む。画像識別子を用いれば、例えば、画像、または画像の集合体である動画像の複製を検知できるため、画像または動画像の違法コピー検知システムなどに応用することができる。

画像識別子の一例が、特許文献１に記載されている。図１８は、特許文献１に記載されている画像識別子の抽出方法を示す図である。この画像識別子は、複数の次元（図１８では１６次元）の特徴ベクトルである。画像２４０内のあらかじめ定められた位置の３２個の長方形領域２４４（図１８ではそのうち１６個の長方形領域が描かれている）からそれぞれ平均輝度値を算出し、対となる長方形領域の間（図１８では対となる長方形領域を点線２４８で結んでいる）で平均輝度値の差を算出し、１６次元の差ベクトル２５０を求める。差ベクトル２５０に対してベクトル変換により合成ベクトルを生成し、合成ベクトルの各次元を量子化して得られた１６次元の量子化インデックスベクトルを画像識別子とする。

特表平８−５００４７１号公報

複数の次元の特徴ベクトルで構成される画像識別子は、次元間の相関が小さいほど、特徴ベクトルが持つ情報量が大きい（冗長性が小さい）ので、異なる画像を識別できる度合いである識別能力が高くなる。反対に、特徴ベクトルの次元間の相関が大きいと、特徴ベクトルが持つ情報量が小さい（冗長性が大きい）ので、識別能力が低くなる。ここで次元間の相関とは、次元の特徴量の生起の類似性の度合いであり、数学的には、例えば、各次元の特徴量の生起を確率変数とした場合の、確率変数間の相関係数や、相互情報量として算出できる値である。このため、複数の次元の特徴ベクトルで構成される画像識別子は、次元間の相関が小さくなるように設計されていることが望ましい。

画像信号（画像を構成する画素の画素値）は、画像の局所領域間において相関がある。一般的に、局所領域間の距離が近いほど、相関は大きくなる。特に、例えば、ある特定の画像パターンが繰り返し出現する（特にそれが規則正しい周期で出現する場合に）画像（例えば格子状に配置されたビルの窓の画像など、図１９（Ａ）を参照）や、ある特定のテクスチャで構成されている画像（図１９（Ｂ）を参照）などは、画像の局所領域間の相関が大きくなる。

[第１の問題点]
特許文献１に記載されているような、画像の複数の局所領域から抽出した特徴量から成る特徴ベクトルで構成されている従来の画像識別子は、画像の局所領域間の相関が大きい画像に対して、各次元において特徴量を抽出する局所領域の形状が同一であるため（特許文献１の例では同一の形状の長方形領域）、抽出される特徴量の次元間の相関が大きくなる。そのため、画像識別子（特徴ベクトル）の識別能力が低くなる、という第１の問題点がある。ここで形状が同一とは、領域の大きさや角度（傾き或いは姿勢）も含めて同一であるということである。

例えば、ある特定の画像パターンが繰り返し出現する画像（図１９（Ａ）参照）や、ある特定のテクスチャで構成されている画像（図１９（Ｂ）参照）などに対しては、特許文献１で記載されているような従来の画像識別子は、識別能力が低くなる。

[第２の問題点]
特許文献１に記載されている従来の画像識別子の第２の問題点は、特徴量（特徴ベクトル）を算出するための各次元の領域の形状（大きさ、角度も含めて）が同一の長方形であるため、長方形の辺の長さと同じ、あるいは、その整数分の１の周期を持つ周波数成分を検知できないという、周波数上の盲点が存在するということである。その理由は、この特定の周波数の信号成分を従来手法に従って領域内で平均をとると、信号成分の大小によらず0となってしまい、その周波数成分の信号を全く検知できなくなるためである。より具体的には、長方形の辺の長さと同じ周期を持つ周波数をf₀とすると，周波数nf₀(n=1,2,3,…)の成分が検知できなくなる。このため、直流成分とこの周波数成分に信号が集中している画像に対しては、画素値の平均値は直流成分と同じになってしまい、領域間で値の差がなくなる結果、領域間の平均画素値の差として抽出される特徴量は全て0になってしまい、識別できなくなる（識別能力が著しく低下する）。実際には、周波数nf₀(n=1,2,3,…)の成分のみではなく、その近傍の一定の周波数領域に対しては同様に検知困難となるため、上記特定周波数に信号成分が集中していなくても、その周波数帯の信号成分が使えないことにより、識別能力が低下する。この問題を軽減するには、周波数f₀の値を大きくし、上記検知困難な周波数帯に陥る信号電力を下げることが考えられる。しかしながら、周波数f₀の値を大きくすることは、領域の大きさを小さくすることを意味し、特徴量の頑健性（各種改変処理やノイズに対して特徴量が変化しない度合い）の低下につながる。例えば、領域が小さくなることで、多少の位置ずれに対しても、特徴量の値が大きく変化することになり、特徴量の頑健性が下がる。このように、同一の長方形領域を用いる場合には、識別能力をあげた上で頑健性を確保することが極めて難しい。

［発明の目的］
本発明の目的は、画像の局所領域間の相関が大きい画像や特定の周波数に信号が集中している画像から抽出される画像識別子は異なる画像を識別できる度合いである識別能力が低下する、という課題を解決する画像識別子抽出装置を提供することである。

本発明の一形態にかかる画像識別子抽出装置は、画像を識別する情報である画像識別子を構成する各次元に関連付けられる、画像中の、２つの部分領域から領域特徴量を当該次元毎に算出する算出手段を備え、上記２つの部分領域は、各々の大きさ、および、相対的な位置関係が一様分布に従うように構成され、ある次元に関連付けられる２つの部分領域のパターンは、他の少なくとも１つの次元に関連付けられる２つの部分領域のパターンと相違する。

本発明は上述したように構成されているため、画像識別子の、異なる画像を識別できる度合いである識別能力を高くすることができる。特に、画像の局所領域間の相関が大きい画像に対して、この効果は顕著である。

また本発明によれば、特定の周波数に信号が集中している画像に対しても、識別能力が低下しないという効果がある。

本発明の第１の実施の形態のブロック図である。次元別抽出情報が示す次元ごとの抽出領域の対の例を示す図である。本発明の第１の実施の形態における比較手段の一例を示すブロック図である。本発明の第１の実施の形態における比較手段の別の例を示すブロック図である。本発明の第１の実施の形態の処理の流れを示すフローチャートである。本発明の第２の実施の形態の要部ブロック図である。本発明の第２の実施の形態の処理の流れを示すフローチャートである。本発明の第３の実施の形態のブロック図である。次元ごとの領域特徴量算出方法の例を示す図である。本発明の第３の実施の形態の処理の流れを示すフローチャートである。本発明の第４の実施の形態のブロック図である。次元ごとの比較・量子化方法の例を示す図である。本発明の第４の実施の形態の処理の流れを示すフローチャートである。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別抽出領域情報を示す図である。本発明の第５の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第５の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第５の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第５の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第５の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第６の実施の形態で使用する次元別領域特徴量算出方法情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別比較・量子化方法情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別比較・量子化方法情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別比較・量子化方法情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別比較・量子化方法情報を示す図である。本発明の第５および第６の実施の形態で使用する次元別比較・量子化方法情報を示す図である。特許文献１に記載されている画像識別子の抽出方法を示す図である。局所領域間の相関が大きくなる画像の例を示す図である。量子化インデックスベクトルを照合する照合手段のブロック図である。量子化インデックスベクトルを照合する照合手段の処理例を示すフローチャートである。量子化インデックスベクトルを照合する照合手段の別の処理例を示すフローチャートである。量子化インデックスベクトルを照合する照合手段の更に別の処理例を示すフローチャートである。画像を縦方向３２、横方向３２に分割してできる１０２４個のブロックに対して付与するインデックスの一例を示す図である。本発明の第７の実施の形態における各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第７の実施の形態における各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第７の実施の形態における各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第７の実施の形態における各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第７の実施の形態における各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第７の実施の形態における各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。本発明の第７の実施の形態における各次元に対応する領域のうち或る１つのタイプに属する領域を示す図である。各次元の領域タイプと次元数、閾値に対応するインデックスとの関係を示す図である。領域タイプａの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｂの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｃの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｄの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｅの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｆの次元の第１、第２の抽出領域の一例を示す図である。領域タイプｇの次元の第１、第２の抽出領域の一例を示す図である。

[第１の実施の形態]
[第１の実施の形態の構成]
次に、本発明の第１の実施の形態について図面を参照して詳細に説明する。

図１を参照すると、本発明の第１の実施の形態に係る画像識別子抽出装置は、入力された画像に対して、複数の次元から成る特徴ベクトル（より具体的には量子化インデックスベクトル）を画像識別子として出力するシステムであり、次元決定手段１と、抽出領域取得手段２と、領域特徴量算出手段３と、比較手段４と、から構成されている。

次元決定手段１は、次に抽出する特徴ベクトルの次元を決定し、抽出領域取得手段２へ供給する。次元決定手段１は、順次、抽出する特徴ベクトルの次元を供給し、抽出領域取得手段２以降の構成要素は、供給された次元に対応する特徴量を抽出する。例えば、特徴ベクトルがＮ次元から構成される場合、次元決定手段１は第１次元から第Ｎ次元までを順に抽出領域取得手段２へ供給してもよい。最終的に特徴ベクトルの全ての次元が供給されれば、供給する次元の順番は任意でよい。複数の次元が並列に供給されてもよい。

抽出領域取得手段２には、次元決定手段１からの次元とは別に、入力として次元別抽出領域情報が供給される。

次元別抽出領域情報は、あらかじめ規定された、特徴ベクトルの次元ごとに対応付けられた、その次元の特徴量を抽出するための第１の抽出領域と第２の抽出領域の対を示す情報である。第１および第２の抽出領域は必須条件として、以下の特徴を有する。

［第１および第２の抽出領域の必須条件］
第１および第２の抽出領域の必須条件は、次元間で抽出領域対の相対的な位置が異なることに加えて、次元間で抽出領域対の形状の組み合わせが異なることである。

上記必須条件を満たす、次元別抽出情報が示す次元ごとの抽出領域の対の例を図２に示す。図１８に示した従来の画像識別子の抽出領域とは異なり、次元間の抽出領域の対の形状の組み合わせが異なる。ここで異なる形状とは、角度の異なる合同な形状や（例えば、図２の第１次元の第２の抽出領域と、第７次元の第１の抽出領域）、大きさの異なる相似な形状（例えば、図２の第１次元の第２の抽出領域と、第９次元の第２の抽出領域）も含む。なお、特徴ベクトルの全次元の中に、抽出領域の対の形状の組み合わせの異なる次元のペアが、少なくとも１つ存在することが最低条件である。抽出領域の対の形状（の組み合わせ）が相互に異なる次元が多いほど、望ましい。これは、抽出領域の対の形状（の組み合わせ）が相互に異なる次元が多いほど、特徴ベクトルのより多くの次元間で相関が小さくなり、識別能力が高くなるからである。例えば、特徴ベクトルの全ての次元間で、抽出領域の対の形状（の組み合わせ）が相互に異なっていてもよい。

ある次元における第１の抽出領域と、第２の抽出領域とは、図２の第９次元のように、同じ形状である必要はなく、図２の他の次元のように、形状が異なっていてもよい。各次元での第１の抽出領域と第２の抽出領域の形状が異なっていると、第１の抽出領域と第２の抽出領域から抽出される特徴量の相関が小さくなり、識別能力が高くなるため、望ましい。また、第１の抽出領域と第２の抽出領域が同時に同じ周波数に関して周波数的な盲点となる可能性が低くなるため、識別能力が高くなる。

各々の抽出領域の形状は任意である。例えば、図２の第６次元の第２の抽出領域のような、任意の複雑な形状であっても構わない。画像の複数の画素で構成されるものであれば、例えば、図２の第７次元や第１０次元のように、線分や曲線であっても構わない。また例えば、第８次元の第１の抽出領域、第１１次元の第１と第２の抽出領域、第１２次元の第１の抽出領域のように、抽出領域が、連続しない複数の小領域から構成されるものであってもよい。このように、任意の複雑な形状の抽出領域を含むことによって、そこから抽出される特徴量の次元間の相関を小さくすることができ、識別能力を高くすることができる。

また、例えば、図２の第５次元のように、第１の抽出領域と第２の抽出領域の一部が重複していてもよい。また抽出領域対のいずれか一方が、もう一方の中に内包されていてもよい。このように、抽出領域の対に重複を許容することにより、より多くの抽出領域対のパターン（相対的位置・距離）を取れるため、次元間の相関を小さくすることができるパターンを増やすことができ、識別能力をより高くする可能性が増える。

また、図１８に示した従来の画像識別子の抽出領域とは異なり、図２に示した各次元のように、次元間で抽出領域が一部重複していてもよい。図１８に示した従来の画像識別子の抽出領域のように、次元間で抽出領域を排他的に取ると、取れる抽出領域対のパターンが限られてしまう。図２に示したように、次元間での抽出領域に重複を許容することにより、より多くの抽出領域対のパターンを取れるため、次元間の相関を小さくすることができるパターンを増やすことができ、識別能力をより高くする可能性が増える。ただし、次元間での抽出領域の重複が多すぎると、次元間の相関が大きくなってしまい、識別能力が低くなるため、望ましくない。

また、全ての次元の抽出領域を統合した場合に、画像内で特徴量が抽出されない領域が小さくなるような（すなわち、画像のほぼ全画面をカバーする）抽出領域の取り方であることが望ましい。これは、図１８のように、画像内で特徴量が抽出されない領域が多く含まれていると、画像信号（画像を構成する画素の画素値）に含まれる多くの情報を使用しないことになり、識別能力が高くならないためである。全ての次元の抽出領域を統合した場合に、画像内で特徴量が抽出されない領域が小さくなるような（すなわち、画像のほぼ全画面をカバーする）抽出領域の取り方であることにより、画像信号に含まれるより多くの情報を特徴量に反映できるため、識別能力を高くすることができる。また、全ての次元の抽出領域を統合した場合に、抽出領域に偏りがなく、画像全体から満遍なく取得されていることが望ましい。ただし、ある特定の領域にテロップ重畳などの局所的な加工が施される確率が高い場合は、その領域を避けて抽出領域が取得されていることが望ましい。また、画像の縁などの周辺領域には画像の特徴部分が一般的に存在しないことが多いため、周辺領域を避けて抽出領域が取得されていることが望ましい。

その他、抽出領域の大きさ、相対的位置（距離、方向）が一定の分布（例えば一様分布）に従うことが望ましい。その理由は、相対的位置（距離、方向）が一様分布に従うことによって、距離や方向に対して偏りがなく、特定の距離や方向に集中することがないため、より多くの多様性がとれるためである。また、相対的位置が近いほど、その領域間の相関が大きくなるため、それを打ち消すために、相対的位置が近いものほどより形状の差が大きいほうが望ましい。

次元別抽出領域情報は、次元ごとの第１の抽出領域と第２の抽出領域とが一意に特定できる情報であれば、どのような形式の情報であっても構わない。また抽出領域は、如何なるサイズやアスペクト比の画像に対しても、常に同じ領域である必要があるため、次元別抽出領域情報は、如何なるサイズやアスペクト比の画像に対しても、同じ抽出領域を取得できる形式の情報である必要がある。例えば、次元別抽出領域情報は、ある規定のサイズとアスペクト比の画像（例えば、横幅３２０画素×縦幅２４０画素の画像）に対して、その抽出領域の位置・形状を記述したものであってもよい。この場合、ある任意のサイズとアスペクト比で入力された画像に対しては、まず画像をその規定のサイズとアスペクト比にリサイズしてから、次元別抽出領域情報に記述されている抽出領域の位置・形状に従って、抽出領域を特定すればよい。あるいは逆に、入力された画像の任意のサイズとアスペクト比の画像に合わせて、次元別抽出領域情報に記述されている抽出領域の位置・形状を変換して、抽出領域を特定してもよい。

次元別抽出領域情報に含まれる各々の抽出領域を示す情報は、例えば、ある規定のサイズとアスペクト比の画像（例えば、横幅３２０画素×縦幅２４０画素の画像）に対して、抽出領域を構成する全ての画素の座標値の集合を記述した情報であってもよい。また次元別抽出領域情報に含まれる各々の抽出領域を示す情報は、例えば、ある規定のサイズとアスペクト比の画像に対して、抽出領域の位置・形状をパラメータ記述した情報であってもよい。例えば抽出領域の形が四角形である場合は、四角形の四隅の座標値を記述した情報であってもよい。また例えば抽出領域の形が円である場合は、円の中心の座標値と半径の値としてもよい。

また、擬似乱数の種（シード）を次元別抽出領域情報として、抽出領域取得手段２の内部でその種からスタートして擬似乱数を発生させて、乱数に従って異なる形状の抽出領域を生成していく（例えば乱数に従って四角形の四隅を決定していくなど）、という方法も採用することができる。具体的には、例えば以下の手順で、次元別抽出領域を取得することができる。
（1）擬似乱数の種（シード）が次元別抽出領域情報として供給される。
（2）次元ｎ＝１とする。
（3）擬似乱数を発生させ、次元ｎの第１の抽出領域の四角形の四隅を決定する。
（4）擬似乱数を発生させ、次元ｎの第２の抽出領域の四角形の四隅を決定する。
（5）次元ｎ＝ｎ＋１として、（3）へ戻る。

乱数に基づいて抽出領域を決定しているので、生成される抽出領域は次元毎に異なる形状になる。また、擬似乱数のシードが同じであれば、毎回（どの画像に対しても）同じ乱数列が発生されるため、異なる画像に対しても同じ抽出領域が再現される。

抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元決定手段１から供給される次元に対応する第１の抽出領域と第２の抽出領域を示す情報を取得し、抽出領域代表値算出手段３へ供給する。

領域特徴量算出手段３には、抽出領域取得手段２からの入力（第１の抽出領域と第２の抽出領域を示す情報）とは別に、入力として、画像識別子の抽出対象となる画像が供給される。領域特徴量算出手段３は、第１の領域特徴量算出手段３１と第２の領域特徴量算出手段３２とを有する。領域特徴量算出手段３は、第１の領域特徴量算出手段３１を用いて、入力として供給される画像から、次元ごとに、抽出領域取得手段２から供給される第１の抽出領域を示す情報に基づき、第１の抽出領域の特徴量を第１の領域特徴量として算出し、比較手段４へ供給する。また、領域特徴量算出手段３は、第２の領域特徴量算出手段３２を用いて、入力として供給される画像から、次元ごとに、抽出領域取得手段２から供給される第２の抽出領域を示す情報に基づき、第２の抽出領域の特徴量を第２の領域特徴量として算出し、比較手段４へ供給する。

なお、第１の抽出領域と第２の抽出領域を示す情報に基づいて、入力される画像に対するそれぞれの抽出領域を特定するためには、必要に応じて領域特徴量算出手段３は、次元別抽出領域情報の規定のサイズとアスペクト比に画像をリサイズする。

領域特徴量算出手段３は、それぞれの抽出領域に含まれる画素群の画素値を用いて、それぞれの抽出領域の領域特徴量を算出する。ここで画素値とは、画像の各画素が持つ信号の値であり、スカラー量またはベクトル量である。例えば、画像が輝度画像の場合は、画素値は輝度値（スカラー量）である。また例えば、画像がカラー画像の場合は、画素値は色成分を表すベクトル量である。例えばカラー画像がＲＧＢ画像である場合は、画素値はＲ成分、Ｇ成分、Ｂ成分の３次元のベクトル量である。また例えばカラー画像がＹＣｂＣｒ画像である場合は、画素値はＹ成分、Ｃｂ成分、Ｃｒ成分の３次元のベクトル量である。

抽出領域の領域特徴量を算出する方法は、その次元の抽出領域（第１の抽出領域と第２の抽出領域）における算出方法が一定である（どの入力画像に対しても同じ算出方法である）限りは、任意の方法でよい。

また、算出する領域特徴量は、スカラー量でもよいし、ベクトル量であってもよい。例えば、画素値が輝度値などのスカラー量である場合、領域特徴量を、その抽出領域に含まれる画素値の、平均値、メディアン値、最頻値、最大値、最小値、などと算出してもよい（いずれもスカラー量である）。また例えば、抽出領域に含まれる画素値をソートし、分布（ソートされた順列）の上位または下位から規定の割合の位置にある画素値を、領域特徴量として算出してもよい（これもスカラー量である）。より具体的に、規定の割合として、百分率でＰ％とした場合（例えばＰ＝２５％）を例に挙げて説明する。抽出領域に含まれる計Ｎ個の画素の画素値（輝度値）を昇順にソートし、昇順にソートされた画素値（輝度値）の集合をＹ(ｉ)＝｛Ｙ(０)、Ｙ(１)、Ｙ(２)、…、Ｙ(Ｎ−１)｝と表す。ここで、昇順にソートされた順列の下位からＰ％の位置にある画素値は、例えば、Ｙ(ｆｌｏｏｒ(Ｎ×Ｐ／１００))となり、この値を抽出領域の領域特徴量として算出する。なお、ｆｌｏｏｒ(）は、小数点以下の切り捨てを行う関数である。ここで、抽出領域に含まれる画素の輝度値に対して、この式（Ｙ（ｆｌｏｏｒ（Ｎ×Ｐ／１００）））を適用して算出された領域特徴量を、「パーセンタイル輝度値特徴量」と呼ぶことにする。

また例えば、画素値が色成分などのベクトル量の場合は、まずそれらを任意の方法でスカラー量に変換してから、上述した方法によって領域特徴量を算出してもよい。例えば、画素値がＲＧＢ成分の３次元のベクトル量である場合は、まずそれらをスカラー量である輝度値に変換してから、上述した方法によって領域特徴量を算出してもよい。また画素値がベクトル量の場合は、例えば、その抽出領域に含まれる画素値の平均ベクトルを領域特徴量としてもよい。

また例えば、抽出領域に対してエッジ検出や、テンプレートマッチングなどの任意の演算（微分演算、フィルタ演算）を行い、その演算結果を領域特徴量としてもよい。例えば、エッジの方向（勾配の方向）を表す２次元のベクトル量であってもよい。また例えば、あるテンプレートとの類似度などを表すスカラー量であってもよい。

また例えば、抽出領域に含まれる色分布や、エッジの方向分布、エッジの強度分布を表すヒストグラムを、領域特徴量として算出してもよい（いずれもベクトル量である）。

また例えば、国際標準規格ＩＳＯ／ＩＥＣ１５９３８−３に規定されている各種特徴量、すなわち、ＤｏｍｉｎａｎｔＣｏｌｏｒ、ＣｏｌｏｒＬａｙｏｕｔ、ＳｃａｌａｂｌｅＣｏｌｏｒ、ＣｏｌｏｒＳｔｒｕｃｔｕｒｅ、ＥｄｇｅＨｉｓｔｏｇｒａｍ、ＨｏｍｏｇｅｎｅｏｕｓＴｅｘｔｕｒｅ、ＴｅｘｔｕｒｅＢｒｏｗｓｉｎｇ、ＲｅｇｉｏｎＳｈａｐｅ、ＣｏｎｔｏｕｒＳｈａｐｅ、Ｓｈａｐｅ３Ｄ、ＰａｒａｍｅｔｒｉｃＭｏｔｉｏｎ、ＭｏｔｉｏｎＡｃｔｉｖｉｔｙなどであってもよい。

比較手段４は、次元ごとに、領域特徴量算出手段３から供給される第１の領域特徴量と、第２の領域特徴量とを比較し、比較した結果を量子化して得られた量子化インデックスを出力する。比較手段４が、次元ごとに、量子化インデックスを出力することで、最終的に、複数の次元の量子化インデックスから成る量子化インデックスベクトルが出力されることになる。

比較手段４が、第１の領域特徴量と、第２の領域特徴量とを比較して、量子化する方法は、任意である。また、１つの次元当たりの量子化インデックスの数も任意である。

比較手段４は、例えば、領域特徴量がスカラー量である場合（例えば輝度値の平均値）、その大小を比較して第１の領域特徴量のほうが大きい場合は量子化インデックスを＋１、それ以外の場合は量子化インデックスを−１とする、のようにして＋１と−１の２値の量子化インデックスに量子化してもよい。ここで、次元ｎの第１の領域特徴量をＶｎ１、第２の領域特徴量をＶｎ２とすると、次元ｎの量子化インデックスＱｎは、次式で算出することができる。

［式１］
Ｑｎ＝＋１（Ｖｎ１＞Ｖｎ２の場合）
−１（Ｖｎ１≦Ｖｎ２の場合）

ここで、比較手段４が、上述の式１に基づいた比較・量子化を行う場合における、比較手段４のより詳細な構成図を図３に示す。

図３を参照すると、比較手段４は、大小比較手段４１と、量子化手段４２と、から構成されている。

大小比較手段４１は、第１の領域特徴量と、第２の領域特徴量とが供給されると、第１の領域特徴量の値と第２の領域特徴量の値との大小を比較し、その比較結果を量子化手段４２へ供給する。すなわち、大小比較手段４１は、Ｖｎ１とＶｎ２の大小を比較し、比較結果が、Ｖｎ１＞Ｖｎ２であるか、Ｖｎ１≦Ｖｎ２であるか、のいずれであるかを示す情報を、大小比較結果として量子化手段４２へ供給する。

量子化手段４２は、大小比較手段４１から供給される大小比較結果に基づいて、式１に従って量子化を行い、量子化インデックスを出力する。すなわち量子化手段４２は、比較結果がＶｎ１＞Ｖｎ２であることを示す情報が供給される場合は、量子化インデックスを＋１、比較結果がＶｎ１≦Ｖｎ２であることを示す情報が供給される場合は、量子化インデックスを−１、として量子化インデックスを出力する。

なお、この式１に基づいた比較・量子化方法を比較・量子化方法Ａと呼ぶことにする。

また、比較手段４は、例えば、領域特徴量がスカラー量である場合（例えば輝度値の平均値）、差分値の絶対値がある規定の閾値以下の場合は、第１の領域特徴量と第２の領域特徴量との差がないものをみなし、差がないことを示す量子化インデックス０とし、それ以外の場合は、その大小を比較して第１の領域特徴量のほうが大きい場合は量子化インデックスを＋１、それ以外の場合は量子化インデックスを−１とする、のようにして＋１、０、−１の３値の量子化インデックスに量子化してもよい。ここで、次元ｎの第１の領域特徴量をＶｎ１、第２の領域特徴量をＶｎ２とし、規定の閾値をｔｈとすると、次元ｎの量子化インデックスＱｎは、次式で算出することができる。

［式２］
Ｑｎ＝＋１（｜Ｖｎ１−Ｖｎ２｜＞ｔｈかつＶｎ１＞Ｖｎ２の場合）
０（｜Ｖｎ１−Ｖｎ２｜≦ｔｈの場合）
−１（｜Ｖｎ１−Ｖｎ２｜＞ｔｈかつＶｎ１≦Ｖｎ２の場合）

ここで、比較手段４が、上述の式２に基づいた比較・量子化を行う場合における、比較手段４のより詳細な構成図を図４に示す。

図４を参照すると、比較手段４は、差分値算出手段４３と、量子化手段４４と、から構成されている。量子化手段４４には、あらかじめ規定された、量子化の境界を表す情報（量子化境界情報）である閾値が、入力として供給される。

差分値算出手段４３は、第１の領域特徴量と、第２の領域特徴量とが供給されると、第１の領域特徴量の値と第２の領域特徴量の値との差分値を算出し、算出した差分値を量子化手段４４へ供給する。すなわち、差分値算出手段４３は、Ｖｎ１−Ｖｎ２を算出し、その値を量子化手段４４へ供給する。

量子化手段４４は、差分値算出手段４３から供給される差分値と、入力として供給されるあらかじめ規定された量子化の境界を表す情報（量子化境界情報）である閾値とに基づいて、式２に従って量子化を行い、量子化インデックスを出力する。すなわち量子化手段４２は、差分値算出手段４１から供給されるＶｎ１−Ｖｎ２の値と、入力として供給される閾値ｔｈとに基づいて、｜Ｖｎ１−Ｖｎ２｜＞ｔｈかつＶｎ１−Ｖｎ２＞０の場合は量子化インデックスを＋１、｜Ｖｎ１−Ｖｎ２｜＞ｔｈかつＶｎ１−Ｖｎ２≦０の場合は量子化インデックスを−１、｜Ｖｎ１−Ｖｎ２｜≦ｔｈの場合は量子化インデックスを０、として量子化インデックスを出力する。

なお、この式２に基づいた比較・量子化方法を比較・量子化方法Ｂと呼ぶことにする。

また、ここでは差分値に基づいて３値に量子化しているが、差分値の大きさに応じて、より多数（のレベルの）の量子化インデックスに量子化してもよい。この場合も、比較手段４は、図４に示した構成をとり、量子化手段４４には、あらかじめ規定された、各レベルの量子化の境界を表す情報（量子化境界情報）として複数の閾値が、入力として供給される。なお、この差分値と、入力として供給される複数の閾値とに基づいて、４レベル以上の複数のレベルの量子化インデックスに量子化する比較・量子化方法を比較・量子化方法Ｃと呼ぶことにする。

このように、第１の領域特徴量と第２の領域特徴量との差が小さい（規定の閾値以下の）ときに、差がないものとして、差がないことを表す量子化インデックスを導入することで、式１の方法に比べて、領域特徴量の差が小さい抽出領域の対の次元の特徴量（量子化インデックス）をより安定に、すなわち各種改変処理やノイズに対してより頑健に、することができる。そのため、局所領域間の特徴の差が全体的に少ない、全体的に変化の少ない平坦な画像（例えば青空の画像）に対しても安定した、すなわち各種改変処理やノイズに対しても頑健な、画像識別子（量子化インデックスベクトル）を出力することができる。

また、比較手段４は、例えば、領域特徴量がベクトル量である場合は、ベクトル量をまずそれらを任意の方法でスカラー量に変換してから、上述した方法によって量子化を行ってもよい（この比較・量子化方法を比較・量子化方法Ｄと呼ぶことにする）。また例えば、第１の抽出領域のベクトルから第２の抽出領域のベクトルとの差分である差分ベクトルを算出し、差分ベクトルをベクトル量子化して量子化インデックスを算出してもよい。この場合は、例えば、あらかじめ規定された量子化インデックスごとの代表ベクトル（重心ベクトルなど）が供給され、それら代表ベクトルと差分ベクトルとの類似度が最も大きく（距離が最も小さく）なる量子化インデックスに分類してもよい（この比較・量子化方法を比較・量子化方法Ｅと呼ぶことにする）。また、上述の式２によるスカラー量の量子化と同様に、差分ベクトルのノルムがある規定の閾値以下の場合は、第１の領域特徴量と第２の領域特徴量との差がないものをみなし、差がないことを示す量子化インデックス０として、差がないことを表す量子化インデックスを導入してもよい。

なお、本発明で出力される量子化インデックスベクトルを照合する際（ある画像から抽出した量子化インデックスベクトルと、別の画像から抽出した量子化インデックスベクトルとを比較して、それらの画像が同一であるか否かを判定する際）は、量子化インデックスが一致する次元数（類似度）、あるいは量子化インデックスが非一致である次元数（ハミング距離）を同一性尺度として算出し、算出された同一性尺度をある閾値と比較して、画像の同一性の判定を行うことができる。また、比較手段４において、量子化インデックスが式２に基づいて算出された場合は、以下のように同一性尺度（類似度）を算出することができる。まず、２つの画像の量子化インデックスベクトルを対応する次元どうしで比較して、「共に量子化インデックスが０」ではない次元の数を算出する（この値をＡとする）。次に、「共に量子化インデックスが０」ではない次元において、量子化インデックスが一致する次元の数を算出する（この値をＢとする）。そして、類似度をＢ／Ａとして算出する。ここでＡ＝０の場合（すなわち、全ての次元が共に量子化インデックスが０となる場合）は、類似度を規定の数値（例えば０．５）とする。

［第１の実施の形態の動作］
次に、図５のフローチャートを参照して、第１の実施の形態における画像識別子抽出装置の動作を説明する。図５のフローチャートでは、特徴ベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。

まず、次元決定手段１は、抽出する特徴ベクトルの最初の次元として、次元１を決定し（ｎ＝１）、抽出領域取得手段２へ供給する（ステップＡ１）。

次に、抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元ｎの第１の抽出領域と第２の抽出領域とを示す情報を取得し、領域特徴量算出手段３へ供給する（ステップＡ２）。

次に、領域特徴量算出手段３は、入力として供給される画像から、次元ｎの第１の領域特徴量と、第２の領域特徴量とを算出し、比較手段４へ供給する（ステップＡ３）。

次に、比較手段４は、次元ｎの第１の領域特徴量と第２の領域特徴量とを比較し、比較した結果を量子化して、量子化インデックスを出力する（ステップＡ４）。

次に、全ての次元に対して量子化インデックスの出力が終了したか否かを判定（すなわちｎ＜Ｎが真であるか偽であるかを判定）する（ステップＡ５）。全ての次元に対して量子化インデックスの出力が終了した場合（すなわちｎ＜Ｎが偽である場合）は処理を終了する。全ての次元に対して量子化インデックスの出力が終了していない場合（すなわちｎ＜Ｎが真である場合）は、ステップＡ６へ移行する。ステップＡ６では、次元決定手段１が、抽出する特徴ベクトルの次元として、次の次元を決定し（ｎ＝ｎ＋１）、抽出領域取得手段２へ供給する。そして、再度ステップＡ２へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。またこの処理手順に限らず、複数の次元に対する抽出処理を並列に行うようにしてもよい。

[第１の実施の形態の効果]
次に、本発明の第１の実施の形態の効果について説明する。

第１の効果は、複数の次元から成る特徴ベクトルで構成される画像識別子の、異なる画像を識別できる度合いである識別能力を高くすることができることである。特に、画像の局所領域間の相関が大きい画像に対して、この効果は顕著である。

その理由は、次元間で特徴量を抽出する領域の形状が異なる（領域の形状に多様性がある）ことにより、次元間の相関を小さくできるからである。

第２の効果は、特定の周波数に信号が集中している画像に対しても、識別能力が低下することがないことである。

その理由は、次元間で特徴量を抽出する領域の形状が異なる（領域の形状に多様性がある）ことにより、ある特定の周波数に信号が集中している画像に対しても、同時に全ての（多くの）抽出領域の対（次元）の間で特徴量の差が無くなり識別能力が低下するようなことが発生しにくくなるからである。

[第２の実施の形態]
[第２の実施の形態の構成]
次に、本発明の第２の実施の形態について図面を参照して詳細に説明する。

本発明の第２の実施の形態は、図１に示した第１の実施の形態における比較手段４が、図６に詳細を示す比較手段４Ａに置き換わる点において、異なる。比較手段４Ａ以外に関しては、第１の実施の形態と同様であるため、ここでは説明を省略する。

図６を参照すると、比較手段４Ａは、差分値算出手段４３と、量子化境界決定手段４５と、量子化手段４４と、から構成されている。

差分値算出手段４３は、次元ごとに、領域特徴量算出手段３から供給される第１の領域特徴量と、第２の領域特徴量との差分値を算出し、量子化境界決定手段４５と、量子化手段４４とへ供給する。

差分値は、領域特徴量がスカラー量の場合（例えば輝度値の平均値）は、例えば、第１の領域特徴量から第２の領域特徴量を（あるいはその逆）減算して得られたスカラー量である。また、領域特徴量がベクトル量の場合は、例えば、それぞれのベクトルを任意の方法でスカラー量に変換してから、スカラー量の差分値を求めてもよい。また、領域特徴量がベクトル量の場合は、第１の領域特徴量と第２の領域特徴量との差分ベクトルを、差分値（ベクトル量）としてもよい。

量子化境界決定手段４５は、差分値算出手段４３から供給される特徴ベクトルの全ての次元の差分値が供給されると、全ての次元の差分値の分布に基づいて、量子化の境界を決定し、決定した量子化境界の情報を量子化手段４４へ供給する。ここで全ての次元の差分値の分布とは、差分値（あるいは差分ベクトル）に対する生起の頻度（確率）である。

また量子化の境界を決定するとは、差分値を量子化する際に、漏れなく、かつ排他的に量子化インデックスに割り当てるためのパラメータを決定する、ということである。差分値がスカラー量である場合は、例えば、各量子化インデックス（量子化レベル）に対する値域（すなわち閾値）を決定し、その値域（閾値）を量子化境界の情報として量子化手段４３へ供給する。また差分値がベクトル量である場合は、例えばベクトル量子化を行うためのパラメータ、例えば、各量子化インデックスの代表ベクトル（重心ベクトルなど）を決定し、それを量子化境界の情報として量子化手段４４へ供給する。

量子化境界決定手段４５は、差分値がスカラー量の場合であって、Ｍ値の量子化を行う場合（Ｍ＝２、３、…など）に、全ての次元の差分値の分布に基づいて、それぞれの量子化インデックスの全次元に対する割合が均等になるように、量子化の値域（閾値）を決定してもよい。

例えば、前記式１の変形として、定数αを用いて、Ｖｎ１＋α＞Ｖｎ２の場合は量子化インデックス＋１、Ｖｎ１＋α≦Ｖｎの場合は量子化インデックス−１とする２値の量子化（Ｍ＝２）の場合に、量子化インデックスの＋１と−１の割合が均等になるように、差分値の分布の中央の点（左右の分布の積分値が等しくなる点）を量子化の閾値αとして決定してもよい。また差分値がベクトル量である場合も同様に、Ｍ値の量子化を行う場合に、全ての次元の差分ベクトルの分布に基づいて、それぞれの量子化インデックスの全次元に対する割合が均等になるように、各量子化インデックスに割り当てられるベクトル空間の領域を決定したり、ベクトル量子化を行う際の各量子化インデックスの代表ベクトル（重心ベクトルなど）を決定してもよい。このように、どの画像に対しても、全次元に対する量子化インデックスの割合を均等にすることで（すなわち、量子化インデックスの偏りを無くす）、エントロピーを高くすることができるため、識別能力を高くすることができる。

なお、量子化境界決定手段４５が、量子化インデックスの全次元に対する割合が均等になるように量子化の境界を決定し、それに基づいて量子化手段４４が量子化を行う比較・量子化方法を、比較・量子化方法Ｆと呼ぶことにする。

また例えば、量子化境界決定手段４５は、差分値がスカラー量の場合であって、上述の式２による３値の量子化を行う場合に（量子化インデックスが＋１、０、−１）、差分がないことを示す量子化インデックス０に量子化する際の閾値ｔｈ（この閾値以下の場合に量子化インデックスを０とする）を、全ての次元の差分値の分布に基づいて決定し、決定した閾値ｔｈを量子化手段４４へ供給してもよい（第１の実施の形態の図４の比較手段４では、この閾値ｔｈはあらかじめ規定されているものである）。例えば、全ての次元の差分値の絶対値を算出し、算出した差分値の絶対値をソートして、その上位または下位から、ある規定の割合（なおこの規定の割合は、例えば、入力として供給されるとする）の点を閾値ｔｈとしてもよい（この比較・量子化方法を比較・量子化方法Ｇと呼ぶことにする）。またここで規定の割合ではなく、＋１、０、−１の量子化インデックスの割合が均等に近づくように、閾値ｔｈを決定してもよい（この比較・量子化方法を比較・量子化方法Ｈと呼ぶことにする）。比較・量子化方法Ｈは、式２に従った場合の、比較・量子化方法Ｆの具体例に相当する。

比較・量子化方法Ｇのより具体的な方法を、規定の割合として、百分率でＰ％とした場合（例えばＰ＝２５％）を例に挙げて説明する。全ての次元（次元数＝Ｎとする）の差分値の絶対値を、昇順にソートし、昇順にソートされた差分値の絶対値の集合をＤ(ｉ)＝｛Ｄ(０)、Ｄ(１)、Ｄ(２)、…、Ｄ(Ｎ−１)｝と表す。ここで、昇順にソートされた順列の下位からＰ％の位置にある値は、例えば、Ｄ(ｆｌｏｏｒ(Ｎ×Ｐ／１００))となり、閾値ｔｈ＝Ｄ(ｆｌｏｏｒ(Ｎ×Ｐ／１００))となる。なお、ｆｌｏｏｒ(）は、小数点以下の切り捨てを行う関数である。

本実施の形態における方法は、第１の実施の形態における、比較手段４が図４の構成をとる場合と対比することができる。第１の実施の形態における図４の構成では、あらかじめ規定された閾値ｔｈが入力として供給されるのに対して、第２の実施の形態における上述の方法は、量子化境界決定手段４５において、全ての次元の差分値の分布に基づいて、画像に対して適応的に閾値ｔｈが算出される。このように第１の実施の形態では閾値ｔｈが固定化されており、第２の実施の形態では閾値ｔｈが画像に適応的に算出される。画像に適応的に閾値ｔｈが算出されることで、閾値ｔｈが固定化されている場合と比較して、特徴ベクトルの次元の値が、特定の量子化インデックスに偏る（特定の量子化インデックスの出現確率が高い）ことを抑えることができるため（特に起伏の少ない画像に対してなど）、識別能力を高くすることができる。例えば、第１の実施の形態における固定化された閾値ｔｈを用いた場合、起伏の少ない画像は、特徴ベクトルの大多数の次元（または全ての次元）が量子化インデックス０になってしまうのに対して、第２の実施の形態における適応的な閾値ｔｈを用いると、起伏の少ない画像に対しては閾値ｔｈが小さい値に自動的に調整されるため、特徴ベクトルの大多数の次元が量子化インデックス０になるような事態が発生しない。

量子化手段４４は、次元ごとに、差分値算出手段４３から供給される次元ごとの差分値と、量子化境界決定手段４５から供給される量子化境界の情報とに基づいて、量子化を行い、量子化インデックスを出力する。

なお、量子化手段４４は、量子化境界決定手段４５が出力した量子化境界の情報を無視した量子化を行っては意味がなくなるため、量子化境界決定手段４５で量子化境界を決定した際に想定していた量子化方法に従う必要がある。

[第２の実施の形態の動作]
次に、図７のフローチャートを参照して、第２の実施の形態における画像識別子抽出装置の動作を説明する。図７のフローチャートでは、特徴ベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。

まず、次元決定手段１は、抽出する特徴ベクトルの最初の次元として、次元１を決定し（ｎ＝１）、抽出領域取得手段２へ供給する（ステップＢ１）。

次に、抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元ｎの第１の抽出領域と第２の抽出領域とを示す情報を取得し、抽出領域代表値算出手段３へ供給する（ステップＢ２）。

次に、抽出領域代表値算出手段３は、入力として供給される画像から、次元ｎの第１の領域特徴量と、第２の領域特徴量とを算出し、差分値算出手段４３へ供給する（ステップＢ３）。

次に、差分値算出手段４３は、次元ｎの第１の領域特徴量と第２の領域特徴量との差分値を算出し、量子化境界決定手段４５と、量子化手段４４とへ供給する（ステップＢ４）。

次に、全ての次元に対する差分値の算出までの処理が終了したか否かを判定（すなわちｎ＜Ｎが真であるか偽であるかを判定）する（ステップＢ５）。全ての次元に対する差分値算出までの処理を終了した場合（すなわちｎ＜Ｎが偽である場合）はステップＢ７へ移行する。全ての次元に対する処理が終了していない場合（すなわちｎ＜Ｎが真である場合）は、ステップＢ６へ移行する。ステップＢ６では、次元決定手段１が、抽出する特徴ベクトルの次元として、次の次元を決定し（ｎ＝ｎ＋１）、抽出領域取得手段２へ供給する。そして、再度ステップＢ２へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。

次に、量子化境界決定手段４５は、差分値算出手段４３から供給される特徴ベクトルの全ての次元の差分値が供給されると、全ての次元の差分値の分布に基づいて、量子化の境界を決定し、決定した量子化境界の情報を量子化手段４４へ供給する（ステップＢ７）。

次にステップＢ８では、量子化を行う（量子化インデックスを算出する）特徴ベクトルの最初の次元として、次元１をセット（ｎ＝１）する。

次に、量子化手段４４は、次元ｎの差分値と、量子化境界決定手段４５から供給される量子化境界とに基づいて、量子化を行い、量子化インデックスを出力する（ステップＢ９）。

次に、全ての次元に対する量子化インデックスの出力が終了したか否かを判定（すなわちｎ＜Ｎが真であるか偽であるかを判定）する（ステップＢ１０）。全ての次元に対する量子化インデックスの出力を終了した場合（すなわちｎ＜Ｎが偽である場合）は処理を終了する。全ての次元に対する量子化インデックスの出力が終了していない場合（すなわちｎ＜Ｎが真である場合）は、ステップＢ１１へ移行する。ステップＢ１１では、量子化を行う（量子化インデックスを算出する）特徴ベクトルの次元として、次の次元をセットする（ｎ＝ｎ＋１）。そして、再度ステップＢ９へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に量子化処理を行っているが、順番はこれに限らず任意でよい。

[第２の実施の形態の効果]
第２の実施の形態では、量子化の境界が固定されている第１の実施の形態と比較して、量子化の境界が画像に対して適応的に（動的に）算出される点が異なる。第１の実施の形態のように、量子化の境界が固定化されていると、特定の画像（例えば起伏の少ない平坦な画像など）に対して、特徴ベクトルの次元の値が、特定の量子化インデックスに偏る（特定の量子化インデックスの出現確率が高い）という事態が発生し（エントロピーが低くなる）、これらの画像に対して識別能力が低下するという問題が発生する。一方で第２の実施の形態のように、量子化の境界が画像に対して適応的に（動的に）算出されることにより、どの画像に対しても、特徴ベクトルの次元の値が、特定の量子化インデックスに偏る（特定の量子化インデックスの出現確率が高い）ことを抑えることができるため、識別能力を高くすることができる。

[第３の実施の形態]
[第３の実施の形態の構成]
次に、本発明の第３の実施の形態について図面を参照して詳細に説明する。

図８を参照すると、本発明の第３の実施の形態は、図１に示した第１の実施の形態の構成に、領域特徴量算出方法取得手段５が追加され、領域特徴量算出手段３が、第１および第２の領域特徴量算出手段３１Ａおよび３２Ａを有する領域特徴量算出手段３Ａに置き換わる点で異なる。なお、それ以外の構成に関しては、第１の実施の形態の構成と同様であるため、ここでは説明を省略する。なお、ここでは、第１の実施の形態との組み合わせとして説明しているが、第２の実施の形態との組み合わせであってもよい。

領域特徴量算出方法取得手段５には、次元決定手段１からの次元と、次元別領域特徴量算出方法情報とが供給される。

次元別領域特徴量算出方法情報は、あらかじめ規定された、特徴ベクトルの次元ごとに対応付けられた、その次元での領域特徴量の算出方法を示す情報であり、次元間で領域特徴量算出方法が異なることが必須条件である。なおここで、領域特徴量算出方法が異なるとは、同一の手順に対して異なるパラメータ（閾値など）を適用する場合も含む。

ここで領域特徴量算出方法とは、例えば、第１の実施の形態の領域特徴量算出手段３の説明で記述した各種方法、またそれに伴うパラメータなどである。

なお次元別領域特徴量算出方法情報が示す次元ごとの領域特徴量算出方法は、特徴ベクトルの全次元の中に、領域特徴量算出方法の異なる次元のペアが、少なくとも１つ存在することが最低条件である。領域特徴量算出方法が相互に異なる次元が多いほど、望ましい。これは、領域特徴量算出方法が相互に異なる次元が多いほど、特徴ベクトルのより多くの次元間で相関が小さくなり、識別能力が高くなるからである。例えば、特徴ベクトルの全ての次元間で、領域特徴量算出方法が相互に異なっていてもよい。

なお、次元ごとの領域特徴量算出方法を示す情報の形式は、領域特徴量を算出する方法が一意に特定される限りは、任意の形式であってよい。

図９に、次元ごとの領域特徴量算出方法の例を示す。図９に示すように、次元間で領域特徴量算出方法が異なる。また図９に示した例のように、スカラー量とベクトル量の特徴量が混在していてもよい（第１、３、５、６、８、９、１０、１２次元はスカラー量、第２、４、７、１１次元はベクトル量）。

領域特徴量算出方法取得手段５は、入力として供給される次元別領域特徴量算出方法情報から、次元決定手段１から供給される次元に対応する領域特徴量算出方法を示す情報を取得し、領域特徴量算出手段３Ａへ供給する。

領域特徴量算出手段３Ａは、入力として供給される画像から、次元ごとに、抽出領域取得手段２から供給される第１の抽出領域と第２の抽出領域とを示す情報に基づき、領域特徴量算出方法取得手段５から供給される領域特徴量算出方法を示す情報に従って、第１の抽出領域の特徴量と、第２の抽出領域の特徴量とを、それぞれ第１の領域特徴量と第２の領域特徴量として算出し、比較手段４へ供給する。

領域特徴量算出手段３Ａでは、供給される抽出領域を示す情報の次元と、領域特徴量算出方法を示す情報の次元との同期が取れている必要がある。

[第３の実施の形態の動作]
次に、図１０のフローチャートを参照して、第３の実施の形態における画像識別子抽出装置の動作を説明する。図１０のフローチャートでは、特徴ベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。

まず、次元決定手段１は、抽出する特徴ベクトルの最初の次元として、次元１を決定し（ｎ＝１）、抽出領域取得手段２と領域特徴量算出方法取得手段５とへ供給する（ステップＣ１）。次に、抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元ｎの第１の抽出領域と第２の抽出領域とを示す情報を取得し、領域特徴量算出手段３Ａへ供給する（ステップＣ２）。

次に、領域特徴量算出方法取得手段５は、入力として供給される次元別領域特徴量算出方法情報から、次元ｎに対応する領域特徴量算出方法を示す情報を取得し、領域特徴量算出手段３Ａへ供給する（ステップＣ３）。

次に、領域特徴量算出手段３Ａは、入力として供給される画像から、次元ｎの第１の領域特徴量と、第２の領域特徴量とを算出し、比較手段４へ供給する（ステップＣ４）。次に、比較手段４は、次元ｎの第１の領域特徴量と第２の領域特徴量とを比較し、比較した結果を量子化して、量子化インデックスを出力する（ステップＣ５）。次に、全ての次元に対して量子化インデックスの出力が終了したか否かを判定する（ステップＣ６）。全ての次元に対して量子化インデックスの出力が終了した場合は処理を終了する。全ての次元に対して量子化インデックスの出力が終了していない場合は、ステップＣ７へ移行する。ステップＣ７では、次元決定手段１が、抽出する特徴ベクトルの次元として、次の次元を決定し（ｎ＝ｎ＋１）、抽出領域取得手段２と領域特徴量算出方法取得手段５とへ供給する。そして、再度ステップＣ２へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。またこの処理手順に限らず、複数の次元に対する抽出処理を並列に行うようにしてもよい。さらに、ステップＣ２とステップＣ３の順序を逆にしてもよい。

[第３の実施の形態の効果]
第１の実施の形態の効果に加えて、異なる画像を識別できる度合いである識別能力を更に高くすることができる。

その理由は、次元間で領域特徴量算出方法が異なる（領域特徴量算出方法に多様性がある）ことにより、次元間の相関をより小さくできるからである。

[第４の実施の形態]
[第４の実施の形態の構成]
次に、本発明の第４の実施の形態について図面を参照して詳細に説明する。

図１１を参照すると、本発明の第４の実施の形態は、図１に示した第１の実施の形態の構成に、比較方法取得手段６が追加され、比較手段４が比較手段４Ｂに置き換わる点で異なる。なお、それ以外の構成に関しては、第１の実施の形態の構成と同様であるため、ここでは説明を省略する。なお、ここでは、第１の実施の形態との組み合わせとして説明しているが、第２の実施の形態および第３の実施の形態との組み合わせであってもよい。

比較方法取得手段６には、次元決定手段１からの次元と、次元別比較方法情報とが供給される。

次元別比較・量子化方法情報は、あらかじめ規定された、特徴ベクトルの次元ごとに対応付けられた、その次元での領域特徴量を比較して量子化を行う方法を示す情報であり、次元間で比較・量子化方法が異なることが必須条件である。なおここで、比較・量子化方法が異なるとは、同一の手順に対して異なるパラメータ（閾値、量子化インデックス数など）を適用する場合も含む。

ここで比較・量子化方法とは、例えば第１の実施の形態の比較手段４の説明で記述した各種比較・量子化の方法、またそれに伴うパラメータ（閾値、量子化インデックス数など）や、第２の実施の形態の比較手段４Ａの説明で記述した各種比較・量子化の方法、またそれに伴うパラメータ（閾値、量子化インデックス数など）などである。

なお次元別比較・量子化方法情報が示す次元ごとの比較・量子化方法は、特徴ベクトルの全次元の中に、比較・量子化方法の異なる次元のペアが、少なくとも１つ存在することが最低条件である。比較・量子化方法が相互に異なる次元が多いほど、望ましい。これは、比較・量子化方法が相互に異なる次元が多いほど、特徴ベクトルのより多くの次元間で相関が小さくなり、識別能力が高くなるからである。例えば、特徴ベクトルの全ての次元間で、比較・量子化方法が相互に異なっていてもよい。

なお、次元ごとの比較・量子化方法を示す情報の形式は、領域特徴量を比較して量子化する方法が一意に特定される限りは、任意の形式であってよい。

図１２に、次元ごとの比較・量子化方法の例を示す。図１２に示すように、次元間で比較・量子化方法が異なる。また、第３、５、１２次元のように、同じ比較・量子化方法で、異なるパラメータ（閾値ｔｈ）を設定してもよい。なお、図１２に示した、次元ごとの比較・量子化方法の例は、図９に示した、次元ごとの領域特徴量算出方法の例と対応させており、スカラー量の領域特徴量に対してはスカラー量の比較・量子化方法を、ベクトル量の領域特徴量に対してはベクトル量の比較・量子化方法を例として示した。

比較方法取得手段６は、入力として供給される次元別比較・量子化方法情報から、次元決定手段１から供給される次元に対応する比較・量子化方法を示す情報を取得し、比較手段４Ｂへ供給する。

比較手段４Ｂは、次元ごとに、領域特徴量算出手段３から供給される第１の領域特徴量と、第２の領域特徴量とを、比較方法取得手段６から供給される比較・量子化方法を示す情報に従って、比較・量子化して、量子化インデックスを出力する。比較手段４Ｂは、比較・量子化方法によって、必要に応じて、第１の実施の形態の比較手段４と、第２の実施の形態の比較手段４Ｂの両方を内包した構成となる場合もある。

比較手段４Ｂでは、供給される領域特徴量の次元と、比較・量子化方法を示す情報の次元の同期が取れている必要がある。

[第４の実施の形態の動作]
次に、図１３のフローチャートを参照して、第４の実施の形態における画像識別子抽出装置の動作を説明する。図１３のフローチャートでは、特徴ベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。

まず、次元決定手段１は、抽出する特徴ベクトルの最初の次元として、次元１を決定し（ｎ＝１）、抽出領域取得手段２と比較方法取得手段６とへ供給する（ステップＤ１）。次に、抽出領域取得手段２は、入力として供給される次元別抽出領域情報から、次元ｎの第１の抽出領域と第２の抽出領域とを示す情報を取得し、領域特徴量算出手段３へ供給する（ステップＤ２）。

次に、比較方法取得手段６は、入力として供給される次元別比較・量子化方法情報から、次元ｎに対応する比較・量子化方法を示す情報を取得し、比較手段４Ｂへ供給する（ステップＤ３）。

次に、領域特徴量算出手段３は、入力として供給される画像から、次元ｎの第１の領域特徴量と、第２の領域特徴量とを算出し、比較手段４Ｂへ供給する（ステップＤ４）。次に、比較手段４Ｂは、次元ｎの第１の領域特徴量と第２の領域特徴量とを比較し、比較した結果を量子化して、量子化インデックスを出力する（ステップＤ５）。次に、全ての次元に対して量子化インデックスの出力が終了したか否かを判定する（ステップＤ６）。全ての次元に対して量子化インデックスの出力が終了した場合は処理を終了する。全ての次元に対して量子化インデックスの出力が終了していない場合は、ステップＤ７へ移行する。ステップＤ７では、次元決定手段１が、抽出する特徴ベクトルの次元として、次の次元を決定し（ｎ＝ｎ＋１）、抽出領域取得手段２と比較方法取得手段６とへ供給する。そして、再度ステップＤ２へ移行する。

なお、ここでは、次元１から次元Ｎまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。またこの処理手順に限らず、複数の次元に対する抽出処理を並列に行うようにしてもよい。さらに、ステップＤ２とステップＤ３との順序を逆にしてもよく、ステップＤ３をステップＤ５の直前に実行するようにしてもよい。

[第４の実施の形態の効果]
第１の実施の形態の効果に加えて、異なる画像を識別できる度合いである識別能力を更に高くすることができる。

その理由は、次元間で比較・量子化方法が異なる（比較・量子化方法に多様性がある）ことにより、次元間の相関をより小さくできるからである。

［第５の実施の形態］
第５の実施の形態では、抽出する特徴ベクトルの次元数は３００次元（第１次元から第３００次元）である。

第５の実施の形態では、次元ごとの抽出領域（第１の抽出領域と第２の抽出領域）は、様々な形状の四角形から構成される。第５の実施の形態において、抽出領域取得手段２に入力として供給される次元別抽出領域情報を図１４に示す。図１４は、規定の画像サイズである、横幅３２０画素×縦幅２４０画素の画像サイズに対する、次元ごとの抽出領域（第１の抽出領域と第２の抽出領域）の四角形の四隅のXY座標値を示す。例えば、第１次元の抽出領域は、座標値(262.000,163.000)、座標値(178.068,230.967)、座標値(184.594,67.411)、座標値(100.662,135.378)を四隅とする四角形で構成される第１の抽出領域と、座標値(161.000,133.000)、座標値(156.027,132.477)、座標値(164.240,102.170)、座標値(159.268,101.647)を四隅とする四角形で構成される第１の抽出領域とで構成される。

次元ごとの抽出領域（第１の抽出領域と第２の抽出領域）は、横幅３２０画素×縦幅２４０画素の画像サイズに正規化された画像に対して、この四隅の座標値で囲まれる領域の中に含まれる整数値の座標値の画素の集合となる。ただし、四隅の座標値で囲まれる領域の中に含まれる負の座標値は、抽出領域に含まない。

第５の実施の形態において、領域特徴量算出方法取得手段５に入力として供給される次元別領域特徴量算出方法情報を図１５に示す。第５の実施の形態では、全ての次元に対して、それぞれの抽出領域（第１の抽出領域と第２の抽出領域）に含まれる画素群の輝度値の平均値が、それぞれの抽出領域の領域特徴量となる。

第５の実施の形態において、比較方法取得手段６に入力として供給される次元別比較・量子化方法情報を図１７に示す。第５の実施の形態では、次元ごとに、比較・量子化方法Bまたは比較・量子化方法Gが用いられ、次元ごとにそのパラメータの値も異なる。例えば、第１次元は、比較・量子化方法Ｇで、閾値th=D(floor(300×5.0/100))である。また、例えば第２次元は、比較・量子化方法Ｇで、閾値th=D(floor(300×10.0/100))である。また、例えば第９次元は、比較・量子化方法Ｂで、閾値th=3.0である。

［第６の実施の形態］
第６の実施の形態は、第５の実施の形態と同じく、抽出する特徴ベクトルの次元数は３００次元（第１次元から第３００次元）である。また第６の実施の形態では、抽出領域取得手段２に入力として供給される次元別抽出領域情報として、第５の実施の形態と同じく図１４に示す情報を使用する。さらに第６の実施の形態では、比較方法取得手段６に入力として供給される次元別比較・量子化方法情報として、第５の実施の形態と同じく図１７に示す情報を使用する。

第６の実施の形態において、領域特徴量算出方法取得手段５に入力として供給される次元別領域特徴量算出方法情報を図１６に示す。第６の実施の形態では、次元ごとに、抽出領域（第１の抽出領域と第２の抽出領域）に含まれる画素群の輝度値の平均値、または、パーセンタイル輝度値特徴量が用いられ、同じパーセンタイル輝度値特徴量を用いる場合でも、次元ごとにその特徴量は異なる。例えば、第１次元は、抽出領域に含まれる画素の輝度値の平均値である。また、例えば第４次元は、パーセンタイル輝度値特徴量で、Y(floor(N×20.0/100)である。また、第８次元は、パーセンタイル輝度値特徴量で、Y(floor(N×80.0/100)である。

［第７の実施の形態］
第７の実施の形態は、抽出する特徴ベクトルの次元数は３２５次元（第１次元から第３２５次元）である。第７の実施の形態の場合は、各領域は、画像を縦方向３２、横方向３２に分割してできる１０２４個のブロックの組み合わせによって構成されている。ここで、各ブロックに対して、図２４に示すように、左上から順に０から始まるインデックスを付与し、このインデックスを用いて領域を記述する。具体的には、長方形領域を、その左上のブロックのインデックスａと右下のブロックのインデックスｂを用いてａ−ｂのように表現する。例えば、インデックス０、１、３２、３３の４つのブロックからなる長方形は、０−３３のように記述する。また、このようにしてできる長方形を記号“｜”によって繋げた場合は、その記号の前後の長方形を連結してできる領域を表現するものとする。例えば、０−３３｜２−６７は、０−３３で定義される長方形と、２−６７で定義される長方形を連結してできる領域、すなわち、ブロック番号０、１、２、３、３２、３３、３４、３５、６６、６７によって構成される領域を表している。

この表記によって第７の実施の形態の各次元に対応する領域を示したものが図２５である。図では、領域のタイプ別に図２５−ａ、図２５−ｂ、図２５−ｃ、図２５−ｄ、図２５−ｅ、図２５−ｆ、図２５−ｇに分けて上述の３２５次元を記述している。ここで、領域のタイプとは、第1、第２の抽出領域間の相対位置や形状の組み合わせによって定まる領域パターンが似たもの同士でグループ化（類型化）したものである。

具体的には、図２５−ａの場合は、図２７−ａに一例を示すように、縦横４ブロックからなる正方形を縦方向か横方向に２等分してできる２つの領域を第１、第２の抽出領域とした場合に相当する。このため、第１、第２の抽出領域の形状は、ともに縦４ブロック、横２ブロックからなる長方形、あるいは縦２ブロック、横４ブロックからなる長方形である。また、第１、第２の抽出領域の相対的な位置関係を見ると、長方形の長い辺同士が重なるように隣接する位置に存在する。

図２５−ｂの場合は、図２７−ｂに一例を示すように、縦横８ブロックからなる正方形を縦横２等分してできる４つの正方形のうち、左上と右下、右上と左下をそれぞれ組み合わせてできる２つの領域を第１、第２の抽出領域とした場合に相当する。このため、第１、第２の抽出領域の形状は、ともに縦横２ブロックからなる正方形を１つの頂点を共有するように４５度あるいは１３５度の対角線上に２つ配置した形状となっている。また、領域の相対的な位置関係を見ると、第２の領域を構成する２つの正方形が、第１の領域の左上の正方形のすぐ左と下に隣接する位置に第２の領域が存在する。

図２５−ｃの場合は、図２７−ｃに一例を示すように、第１、第２の抽出領域の形状は、ともに縦横１０ブロックからなる正方形である。また、第１、第２の抽出領域の相対的な位置関係を見ると、縦横ともに１０ブロックの整数倍だけ離れた位置に存在する。

図２５−ｄの場合は、図２７−ｄに一例を示すように、第１、第２の抽出領域の形状は、ともに縦横６ブロックからなる正方形である。また第１、第２の抽出領域の相対的な位置関係を見ると、縦横ともに６ブロックの整数倍だけ離れた位置に存在する。

図２５−ｅの場合は、図２７−ｅに一例を示すように、正方形領域を中心部分の正方形とその外側の２つに分けてできる２つの領域を第１、第２の抽出領域とした場合に相当する。このため、領域の形状は、第２の抽出領域が中心部分の正方形、第１の正方形は全体の正方形から第２の抽出領域をくりぬいた形状である。また、領域の相対的な位置関係を見ると、第１の抽出領域の中央の穴の位置に第２の抽出領域が存在する。

図２５−ｆの場合は、図２７−ｆに一例を示すように、領域の形状は、第１の抽出領域は縦６ブロック、横１０ブロックの長方形、第２の抽出領域は縦１０ブロック、横６ブロックの長方形である。また、第１、第２の抽出領域の相対的な位置関係を見ると、中心位置が一致するように配置されている。

図２５−ｇの場合には、図２７−ｇに一例を示すように、縦４ブロック、横１２ブロックからなる長方形、あるいは縦１２ブロック、横４ブロックからなる長方形を、長い辺を３等分してできる中央の正方形とそれ以外の２領域を第１、第２の抽出領域とした場合に相当する。このため、領域の形状は、第１の抽出領域は縦横４ブロックからなる正方形を２つ、縦か横に４ブロック離れて配置した形状で、第２の抽出領域は縦横４ブロックからなる正方形である。また、領域の相対的な位置関係を見ると、第１の抽出領域の間に第２の抽出領域が存在する。

以後、図２５−ａ、図２５−ｂ、図２５−ｃ、図２５−ｄ、図２５−ｅ、図２５−ｆ、図２５−ｇの領域タイプを、それぞれ領域タイプａ、領域タイプｂ、領域タイプｃ、領域タイプｄ、領域タイプｅ、領域タイプｆ、領域タイプｇと呼ぶことにする。

第７の実施の形態では、図２５で示した各領域において、領域特徴量として輝度値の平均を算出し、各次元の特徴量を算出する。もちろん、輝度値の平均のかわりにメディアンや最大値など、前述の様々な抽出方法によって抽出した値を領域特徴量として求めるようにしてもよい。

各次元の特徴量の量子化では、上述の領域のタイプ別に閾値を定め、量子化を行うようにする。例えば、式２に従って特徴量を３値に量子化する場合には、領域のタイプ別に、０、１、−１の生起の割合が均等になるように量子化の閾値ｔｈを決定し、量子化を行うようにする。具体的には、段落００８５で記述した方法をＰ＝３３．３３３％、Ｎを領域タイプ別の次元数として領域タイプ別に適用し、閾値ｔｈを求める。例えば、領域タイプａの場合にはＮ＝１１３となるため、ｔｈ＝Ｄ（ｆｌｏｏｒ（１１３×３３．３３３／１００））＝Ｄ（３７）により閾値を算出する。ここで、Ｄ（ｉ）（ｉ＝０、１、…、Ｎ−１）は、領域タイプａに該当する第１次元から第１１３次元の差分値の絶対値を昇順にソートした集合になる。この場合は閾値に対応するインデックスが３７となる。同様に、他の領域タイプに対しても、閾値に対応するインデックスを求めることができる。これを示したのが図２６である。このように領域タイプ別に閾値を求める方が、全体で閾値を決める場合に比べて各次元での０、１、−１の発生確率を均一化できるようになり、識別能力が向上する。もちろん、前述の他の様々な量子化方法によって量子化するようにしてもよい。

なお、第７の実施の形態の場合には、図２４で示したブロックごとに代表値（例えば、ブロック内の画素の輝度値の平均値）を先に算出し、それから領域特徴量を抽出するようにしてもよい。これにより、領域内の全画素から直接領域特徴量を抽出する場合よりも高速に抽出できるようになる。また、各領域タイプの抽出領域は、全体として対称性を有する。このため、画像の右と左を反転させたり、上下を反転させたりした場合でも、次元の対応関係と符号を適切に変更することによって、左右または上下反転した画像から抽出された特徴量からもとの画像の特徴量を復元できる。このため、左右あるいは上下を反転させた画像とも照合することができるようになる。

［照合手段の実施の形態］
次に、本発明で出力される量子化インデックスベクトルを照合する照合手段についてブロック図を用いて説明する。

図２０を参照すると、本発明で出力される量子化インデックスベクトルを照合する照合手段１００のブロック図が示されており、次元決定手段１０１、量子化値取得手段１０２、１０３、尺度算出手段１０４とからなる。

次元決定手段１０１は量子化値取得手段１０２、１０３へ接続され、決定された次元情報を出力する。量子化値取得手段１０２は、第1の量子化インデックスベクトルから、次元決定手段１０１から入力される次元の量子化インデックス値を取得し、第1の量子化インデックス値として尺度算出手段１０４へ出力する。量子化値取得手段１０３は、第２の量子化インデックスベクトルから、次元決定手段１０１から入力される次元の量子化インデックス値を取得し、第２の量子化インデックス値として尺度算出手段１０４へ出力する。尺度算出手段１０４は、量子化値取得手段１０２、１０３からそれぞれ出力される第1、第２の量子化インデックス値から同一性を表す尺度を算出し、出力する。

次に、図２０の照合手段１００の動作について説明する。

まず、照合手段１００へは、第１の画像から抽出される量子化インデックスベクトルである第１の量子化インデックスベクトルと、第２の画像から抽出される量子化インデックスベクトルである第２の量子化インデックスベクトルとが入力される。入力された第１、第２の量子化インデックスベクトルは、それぞれ量子化値取得手段１０２、１０３へ入力される。

量子化値取得手段１０２、１０３へは、次元決定手段１０１から出力される次元情報も入力される。次元決定手段１０１では、Ｎ次元ベクトルである量子化インデックスベクトルの各次元を指定する情報を順次出力する。出力する順序は必ずしも1からＮまで1つずつ増えていく必要はなく、1からＮまでの次元が過不足なく指定される順序であれば、どのような順序であってもよい。

量子化値取得手段１０２、１０３では、入力された量子化インデックスベクトルから、次元決定手段１０１から出力される次元情報で指定される次元の量子化インデックス値を取得する。そして、取得した量子化インデックス値を尺度算出手段１０４へ出力する。

尺度算出手段１０４では、量子化値取得手段１０２から出力される第1の量子化インデックス値と第２の量子化インデックス値とを比較する。この比較を各次元に対して行い、第1、第２の量子化インデックスベクトル間の類似尺度（あるいは距離尺度）を同一性尺度として算出する。

得られた同一性尺度値は予め定めた閾値と比較し、同一性の判定を行う。同一性尺度が類似度をあらわす尺度である場合には、尺度値が閾値以上の場合に同一と判定する。一方、同一性尺度が距離をあらわす尺度である場合には、尺度値が閾値以下の場合に同一と判定する。

次に、フローチャートを用いて図２０の照合手段１００の動作を説明する。まず、同一性尺度として類似度を用いる場合の動作について説明する。

図２１は、照合手段１００の動作を示すフローチャートである。図２１のフローチャートでは、量子化インデックスベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。また、類似度を算出する変数をＢで表すこととする。

まず、次元決定手段１０１は、照合する量子化インデックスベクトルの最初の次元として、次元１を決定し（ｎ＝１）、量子化値取得手段１０２、１０３へ供給するとともに、尺度算出手段１０４において変数Ｂを０にセットする。（ステップＳ１００）。

次に、量子化値取得手段１０２、１０３において、第１の量子化インデックスベクトル、第２の量子化インデックスベクトルから、次元ｎの第１の量子化インデックス値と第２の量子化インデックス値とを取得し、尺度算出手段１０４へ供給する（ステップＳ１０２）。

次に、尺度算出手段１０４において、第１の量子化インデックス値と第２の量子化インデックス値とから、それぞれの量子化インデックスに対応する特徴量の間の類似度ΔＢを算出する（ステップＳ１０４）。例えば、量子化インデックスが一致する場合にはΔＢ＝１とし、それ以外の場合はΔＢ＝０とする。あるいは、量子化インデックスから量子化前の特徴量の代表値を算出し、代表値間の差分が小さいほど大きくなる値をΔＢとして用いてもよい。この際、特徴量の代表値を算出して差分を求めるかわりに、量子化インデックス値の組み合わせによってΔＢの値を引くことができるテーブルを保持しておき、量子化インデックス値の組み合わせからこのテーブルを用いてΔＢの値を直接求めるようになっていてもよい。

次に、ΔＢの値は変数Ｂに加算される（ステップＳ１０６）。この際、ΔＢの値が０の場合には、変数Ｂに０を加算するかわりに、加算しないように制御してもよい。

次に、次元の番号ｎが次元数Ｎに到達したかどうかを調べ（ステップＳ１０８）、到達しない場合はステップＳ１１２へ移行し、到達した場合には、そのときの変数Ｂの値を同一性尺度（類似度を表す尺度）として出力し（ステップＳ１１０）、処理を終了する。

ステップ１１２では、次元決定手段１０１が、取得する量子化インデックスの次元として、ｎ＝ｎ＋１によって次の次元を決定し、量子化値取得手段１０２、１０３へ供給する。そして、再度ステップＳ１０２へ移行する。

なお、ここでは、次元１からＮまで順番に抽出処理を行っているが、順番はこれに限らず任意でよい。

次に、同一性尺度として距離を用いる場合の動作について説明する。

図２２は、照合手段１００の動作を示す別のフローチャートである。図２２のフローチャートでも、量子化インデックスベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。また、距離尺度を算出する変数をＣで表すこととする。

基本的なフローは、図２１の場合と同じであるが、ステップＳ１００、Ｓ１０４、Ｓ１０６、Ｓ１１０がそれぞれステップＳ２００、Ｓ２０４、Ｓ２０６、Ｓ２１０に置き換わっている点が異なる。

まず、ステップＳ２００では、次元決定手段１０１において、照合する量子化インデックスベクトルの最初の次元として、次元１を決定し（ｎ＝１）、量子化値取得手段１０２、１０３へ供給するとともに、尺度算出手段１０４において変数Ｃを０にセットする。

ステップＳ２０４では、尺度算出手段１０４において、第１の量子化インデックス値と第２の量子化インデックス値とから、それぞれの量子化インデックスに対応する特徴量の距離ΔＣを算出する。例えば、量子化インデックスが一致する場合にはΔＣ＝０とし、それ以外の場合はΔＣ＝１とする。あるいは、量子化インデックスから量子化前の特徴量の代表値を算出し、代表値間の差分が小さいほど小さくなる値をΔＣとして用いてもよい。この際、特徴量の代表値を算出して差分を求めるかわりに、量子化インデックス値の組み合わせによってΔＣの値を引くことができるテーブルを保持しておき、量子化インデックス値の組み合わせからこのテーブルを用いてΔＣの値を直接求めるようになっていてもよい。

ステップＳ２０６では、ΔＣの値は変数Ｃに加算される。この際、ΔＣの値が０の場合には、変数Ｃに０を加算するかわりに、加算しないように制御してもよい。

ステップＳ２１０では、そのときの変数Ｃの値を同一性尺度（距離を表す尺度）として出力し、処理を終了する。

それ以外のステップについては、図２１の場合と同様である。ただし、ステップＳ１０８で次元の番号ｎが次元数Ｎに到達した場合にはステップＳ２１０へ移行する。

次に、第１の量子化インデックス値と第２の量子化インデックス値とで、「共に量子化インデックスが０」である次元を除外し、同一性尺度として類似度を用いる場合の動作について説明する。

図２３は、照合手段１００の動作を示す別のフローチャートである。図２３のフローチャートでも、量子化インデックスベクトルの次元（の番号）をｎで表し、次元は１からＮまでの合計Ｎ次元あるものとする。また、類似度を算出する変数をＢで表すこととし、「共に量子化インデックスが０」ではない次元をカウントするための変数をＡで表すこととする。

まず、次元決定手段１０１は、照合する量子化インデックスベクトルの最初の次元として、次元１を決定し（ｎ＝１）、量子化値取得手段１０２、１０３へ供給するとともに、尺度算出手段１０４において変数Ａ、Ｂを０にセットし（ステップＳ３００）、ステップＳ１０２へ移行する。

ステップＳ１０２は図２１の場合と同様であり、終了後、ステップＳ３１４へ移行する。

ステップＳ３１４では、尺度算出手段１０４において、第１の量子化インデックス値と第２の量子化インデックス値とがともに０であるかどうかを調べる。ともに０である場合には、ステップＳ１０８へ移行し、どちらか一方が０でない場合には、変数Ａの値をひとつ増やし（ステップＳ３１６）、ステップＳ１０４へ移行する。

ステップＳ１０４、Ｓ１０６、Ｓ１０８、Ｓ１１２の処理は図２１の場合と同様である。ステップＳ１０８で次元の番号ｎが次元数Ｎに到達した場合には、ステップＳ３１０へ移行する。

ステップＳ３１０では、尺度算出手段１０４において、Ｂ／Ａの値を算出し、同一性尺度として出力し、処理を終了する。ただし、Ａ＝０の場合には、規定の値（例えば０．５）を出力する。

以上、上記各実施形態を参照して本発明を説明したが、本発明は、上述した実施形態に限定されるものではない。本発明の構成や詳細には、本発明の範囲内で当業者が理解しうる様々な変更をすることができる。また、本発明の画像識別子抽出装置は、その有する機能をハードウェア的に実現することは勿論、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における次元決定手段、抽出領域取得手段、領域特徴量算出手段、比較手段、領域特徴量算出方法取得手段、比較方法取得手段として機能させる。

なお、本発明は、日本国にて２００９年４月１４日に特許出願された特願２００９−９７８６１の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。

１…次元決定手段
２…抽出領域取得手段
３、３Ａ…領域特徴量算出手段
３１、３１Ａ…第１の領域特徴量算出手段
３２、３２Ａ…第２の領域特徴量算出手段
４、４Ｂ…比較手段
４１…大小比較手段
４２、４４…量子化手段
４３…差分値算出手段
４５…量子化境界決定手段
５…領域特徴量算出方法取得手段
６…比較方法取得手段

Claims

画像を識別する情報である画像識別子を構成する各次元に関連付けられる、画像中の、２つの部分領域から領域特徴量を当該次元毎に算出する算出手段を備え、
前記２つの部分領域は、各々の大きさ、および、相対的な位置関係が一様分布に従い、かつ前記２つの部分領域と他の２つの部分領域との間の相対的位置が近いほど、２つの部分領域の形状の差が大きいように構成され、
ある次元に関連付けられる２つの部分領域のパターンは、他の少なくとも１つの次元に関連付けられる２つの部分領域のパターンと相違する、画像識別子抽出装置。
画像を識別する情報である画像識別子を構成する各次元に関連付けられる、画像中の、２つの部分領域から領域特徴量を当該次元毎に算出し、
前記２つの部分領域は、各々の大きさ、および、相対的な位置関係が一様分布に従い、かつ前記２つの部分領域と他の２つの部分領域との間の相対的位置が近いほど、２つの部分領域の形状の差が大きいように構成され、
ある次元に関連付けられる２つの部分領域のパターンは、他の少なくとも１つの次元に関連付けられる２つの部分領域のパターンと相違する、画像識別子抽出方法。
コンピュータを、
画像を識別する情報である画像識別子を構成する各次元に関連付けられる、画像中の、２つの部分領域から領域特徴量を当該次元毎に算出する算出手段として機能させ、
前記２つの部分領域は、各々の大きさ、および、相対的な位置関係が一様分布に従い、かつ前記２つの部分領域と他の２つの部分領域との間の相対的位置が近いほど、２つの部分領域の形状の差が大きいように構成され、
ある次元に関連付けられる２つの部分領域のパターンは、他の少なくとも１つの次元に関連付けられる２つの部分領域のパターンと相違する、プログラム。