JP2012221070A

JP2012221070A - 特徴選択情報作成装置、画像識別装置、特徴選択情報作成方法、および特徴選択情報作成プログラム

Info

Publication number: JP2012221070A
Application number: JP2011084104A
Authority: JP
Inventors: Akira Suzuki; 章鈴木; Hideki Koike; 秀樹小池; Masashi Morimoto; 正志森本; Katsuyoshi Tanabe; 勝義田邊; Shunichi Yonemura; 俊一米村
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2011-04-05
Filing date: 2011-04-05
Publication date: 2012-11-12

Abstract

【課題】識別率の低下を防止するとともに、特徴量から作成される、元の画像を類推するための閲覧用の画像の視認性を低減することができる特徴選択情報作成装置、画像識別装置、特徴選択情報作成方法、および特徴選択情報作成プログラムを提供する。
【解決手段】識別対象の特徴を示す識別辞書データと、入力する画像の特徴情報とを照合して、識別対象に対する識別率を取得する個別評価値算出手段と、前記識別率に基づき、遺伝的アルゴリズムに用いられる前記特徴選択情報の適応度を算出する特徴選択情報評価制御手段と、前記適応度に基づき、前記識別率が予め決められている基準識別率以上であるか否かを判定し、前記識別率が前記基準識別率以上である場合、当該適応度に対応する特徴選択情報を格納手段に書き込む特徴選択情報作成手段と、前記格納手段に書き込まれた特徴選択情報のうち、適応度に基づき、一の前記特徴選択情報を選択する制御手段と、を備える。
【選択図】図８

Description

本発明は、特徴選択情報作成装置、画像識別装置、特徴選択情報作成方法、および特徴選択情報作成プログラムに関するものである。

入力する画像を予め決められているカテゴリーに分類する際、画像の特徴量に基づき、どのカテゴリーに属する画像であるかを識別する装置がある。この装置は、入力する画像の特徴量と、データベース内に保管されている識別辞書と呼ばれるデータとを照合して、該当するカテゴリーを判定する。識別辞書は、複数の画像から抽出した特徴量のデータベースを統計的に解析して得られる情報であり、この識別辞書の情報から元の画像を類推することはできないため、仮にこの統計的な解析の対象とした画像が複数の人物の顔画像であっても、この識別辞書には個人情報は含まれない。しかしながら、識別辞書を作成するために統計的な解析の対象として用いた、特徴量のデータベースには、それが人物の顔画像から抽出された特徴量であった場合には、個人情報が含まれる場合がある。それは、特徴量の種類として、元の画像を類推できる特徴量を用いる場合である。
仮に、そのような種類の特徴量を用いて、かつ、それが複数の人物の顔画像から抽出した特徴量であった場合には、その特徴量のデータベースの情報が漏洩したときには当該人物のプライバシーが害されるおそれがある。
上記のデータベースに保管されている特徴量のデータが万一漏洩しても、その特徴量が示す元の画像を類推できないようにするため、例えば、暗号化した特徴量のデータをデータベース内に保存し、データベースから読み出す際に復号化する装置がある（例えば、特許文献１参照）。

特開２００５−１７２８６６号公報

しかしながら、暗号化にどれほど強度の高い技術を用いたとしても、技術進歩により、今後解読されるようになるかもしれないという問題がある。この場合、データベース内に保存されている特徴量により、元の画像が類推されるおそれがある。
一方、元の画像の視認性を低減するような特徴量を用意したとしても、重要な特徴量を示す情報が欠落している場合、カテゴリーに分類する際の識別率が低下するおそれがある。

本発明は、このような事情を考慮してなされたものであり、その目的は、識別率の低下を防止するとともに、特徴量から作成される、元の画像を類推するための閲覧用の画像の視認性を低減することができる特徴選択情報作成装置、画像識別装置、特徴選択情報作成方法、および特徴選択情報作成プログラムを提供することにある。

上述の課題を鑑み、本発明に係る特徴選択情報作成装置は、画像識別装置において用いられる特徴選択情報を作成する特徴選択情報作成装置であって、前記画像識別装置の識別対象の特徴を示す識別辞書データと、入力する画像の特徴を示す特徴情報とを照合することにより、前記画像を正しい前記識別対象と識別する確率を示す識別率を取得する個別評価値算出手段と、前記識別率に基づき、遺伝的アルゴリズムに用いられる前記特徴選択情報の適応度を算出する特徴選択情報評価制御手段と、前記適応度に基づき、前記識別率が予め決められている基準識別率以上であるか否かを判定し、前記識別率が前記基準識別率以上である場合、当該適応度に対応する特徴選択情報を格納手段に書き込む特徴選択情報作成手段と、前記格納手段に書き込まれた特徴選択情報のうち、適応度に基づき、一の前記特徴選択情報を選択する制御手段と、を備えることを特徴とする。

上述の特徴選択情報作成装置において、前記個別評価値算出手段は、画像の画質の評価を示す画質評価情報を算出し、当該画質評価情報と前記識別率に基づき、前記適応度を算出することを特徴とする。

上述の課題を鑑み、本発明に係る画像識別装置は、上述のいずれか一つの特徴選択情報作成装置から出力する前記特徴選択情報を入力する入力部と、学習画像用の画像データから、当該学習用画像の特徴を示す特徴情報を抽出する特徴抽出手段と、前記特徴抽出手段によって抽出された前記学習用画像の特徴を示す特徴情報のうち、前記特徴選択情報が選択することを示す情報に対応する情報を用いて、前記特徴情報のうち一部の情報量が低減された圧縮特徴情報を作成する特徴選択手段と、前記圧縮特徴情報に基づき、識別対象の特徴を示す識別辞書データを作成する辞書作成手段と、を備えることを特徴とする。

上述の画像識別装置において、前記特徴抽出手段は、前記学習画像用の画像データに対して、異なる方向の勾配を有する勾配フィルタを重畳して積和計算を行うことにより算出される勾配画像データを作成し、当該勾配画像データに基づき、前記学習用画像の特徴を示す特徴情報を算出することを特徴とする。

上述の課題を鑑み、本発明に係る特徴選択情報作成方法は、画像識別装置において用いられる特徴選択情報を作成する特徴選択情報作成方法であって、前記画像識別装置の識別対象の特徴を示す識別辞書データと、入力する画像の特徴を示す特徴情報とを照合することにより、前記画像を正しい前記識別対象と識別する確率を示す識別率を取得するステップと、前記識別率に基づき、遺伝的アルゴリズムに用いられる前記特徴選択情報の適応度を算出するステップと、前記適応度に基づき、前記識別率が予め決められている基準識別率以上であるか否かを判定し、前記識別率が前記基準識別率以上である場合、当該適応度に対応する特徴選択情報を格納手段に書き込むステップと、前記格納手段に書き込まれた特徴選択情報のうち、適応度に基づき、一の前記特徴選択情報を選択するステップと、を備えることを特徴とする。

上述の課題を鑑み、本発明に係る特徴選択情報作成プログラムは、コンピュータを、画像識別装置の識別対象の特徴を示す識別辞書データと、入力する画像の特徴を示す特徴情報とを照合することにより、前記画像を正しい前記識別対象と識別する確率を示す識別率を取得する個別評価値算出手段、前記画像識別装置において用いられる特徴選択情報についての遺伝的アルゴリズムに用いられる適応度を前記識別率に基づき算出する特徴選択情報評価制御手段、前記適応度に基づき、前記識別率が予め決められている基準識別率以上であるか否かを判定し、前記識別率が前記基準識別率以上である場合、当該適応度に対応する特徴選択情報を格納手段に書き込む特徴選択情報作成手段、前記格納手段に書き込まれた特徴選択情報のうち、適応度に基づき、一の前記特徴選択情報を選択する制御手段、として機能させるための特徴選択情報作成プログラムであることを特徴とする。

本発明によると、識別率の低下を防止するとともに、元の画像の視認性を低減することができる。

本発明の実施形態にかかる画像識別システムの構成の一例を示す図である。本発明の実施形態に係る特徴抽出手段の構成の一例を示す図である。本発明の実施形態に係る特徴抽出手段の処理対象である顔画像データの一例を示す図である。本発明の実施形態に係る勾配画像作成手段による処理を説明するための図である。本発明の実施形態に係る特徴抽出手段によって抽出された特徴量に基づく閲覧画像データの一例を示す図である。本発明の実施形態に係る特徴選択情報を適用して圧縮特徴ベクトルの作成方法の一例を説明するための図である。本発明の実施形態に係る圧縮特徴ベクトルによる画像の視認性について説明するための図である。本発明の実施形態に係る特徴選択情報作成装置の構成の一例について説明するための図である。本発明の実施形態に係る染色体評価手段の構成の一例を示す図である。本発明の実施形態に係る個別評価値算出手段の構成の一例を図である。本発明の実施形態に係る画像識別方法の一例について説明するためのフローチャートである。本発明の実施形態に係る全世代染色体集合格納手段の構成の一例を説明するための図である。本発明の実施形態に係る交叉実行手段による二点交叉の一例を説明するための図である。

［第１実施形態］
以下、本発明の一実施形態にかかる画像識別システムの一例について説明する。図１は、本実施形態にかかる画像識別システムの構成の一例を示す図である。
図１に示す通り、本実施形態に係る画像識別システムは、特徴選択情報作成装置１と画像識別装置２とを備える。
特徴選択情報作成装置１は、画像識別装置２によって利用される特徴選択情報を作成し、画像識別装置２に出力する。この特徴選択情報とは、画像識別装置２によって識別される識別対象の特徴を示す特徴情報から、識別率の低下を防止し、かつ、視認性を低下させるための特徴情報を選択的に取得するための情報である。画像識別装置２は、この特徴選択情報を用いて、元の画像の特徴情報から、識別率への寄与が低い情報を削除して、識別用特徴情報を作成する。これにより、適当な識別率を確保することができるとともに、この識別用特徴情報を用いて画像を再現することにより視認性を低くすることができる。
この特徴選択情報作成装置１については、図８〜１３を参照して、以下に詳細に説明する。

画像識別装置２は、学習処理部２０１と、識別処理部２０２と、入力部２０３と、識別辞書記憶部２０４と、出力部２０５とを備える。この画像識別装置２は、例えば、人物の顔が映った画像データに基づき、当該人物の性別を識別する。つまり、画像識別装置２は、入力する識別用画像が、女性の顔を含む女性カテゴリーに属する画像であるか、あるいは、男性の顔を含む男性カテゴリーに属する画像であるかを判定する。なお、本発明に係る画像識別装置２はこれに限られず、予め決められているカテゴリーのうち、どのカテゴリーに属する画像であるかを識別するものであればよい。

学習処理部２０１は、学習用画像データベース２０１１と、特徴抽出手段２０１２と、特徴選択手段２０１３と、辞書作成手段２０１４とを含む。この学習処理部２０１は、学習対象である複数の画像データから識別対象の特徴を示す特徴量を抽出し、識別対象の特徴を学習して、識別の基準となるデータ（以下、識別辞書データという）を作成する処理部である。

学習用画像データベース２０１１は、学習対象である画像データ（以下、学習用画像データＥという）を格納するデータベースである。この学習用の画像は、例えば、人物の顔を含む画像である。この学習用画像データベース２０１１は、正解カテゴリーがわかっている学習用画像の画像データを複数枚格納する。例えば、正解カテゴリーがわかっている学習用画像として、男性の顔を含む男性カテゴリーに属する画像の画像データを複数枚格納する。また、学習用画像データベース２０１１は、正解カテゴリーがわかっている学習用画像として、女性の顔を含む女性カテゴリーに属する画像の画像データを複数枚格納する。

特徴抽出手段２０１２は、図２に示す通り、顔検出手段２１２１と、勾配画像作成手段２１２２と、原特徴ベクトル算出手段２１２３と、閲覧画像作成手段２１２４とを備える。
図２は特徴抽出手段２０１２の構成の一例を示す図である。
顔検出手段２１２１は、学習用画像データベース２０１１から学習用画像データＥを一枚ずつ読み出し、識別対象である人物の顔を検出する。例えば、顔検出手段２１２１は、人物の顔を検出するためのパターンデータを内蔵するメモリに記憶しておき、このパターンデータを参照して、顔のパターン認識を実行する。これにより、顔検出手段２１２１は、学習用画像データＥから人物の顔を検出する。
この顔検出手段２１２１は、検出した人物の顔および若干の周辺を含む領域を顔領域画像の画像データ（以下、顔画像データＪという）を学習用画像データから切り出す。この顔検出手段２１２１は、切り出す顔画像データの画像サイズを、例えば、縦と横の大きさを８０×８０画素のサイズに正規化する。顔検出手段２１２１は、この正規化された画像データである顔画像データＪを、勾配画像作成手段２１２２に出力する。

なお、顔検出手段２１２１による顔画像データの取得処理は、これに限られず、例えば、参考文献（１）に記述された方法を用いるものであってもよい。
参考文献（１）
Li Tian, Shingo Ando, Akira Suzuki, Hideki Koike：”A probabilistic approach for fast and robustmulti-view face detection using compact local patterns ”proceedings of IEVC2010

この顔検出手段２１２１によって取得された顔画像データＪの一例を図３に示す。図３（ａ）には、顔画像データＪ１を、図３（ｂ）には、顔画像データＪ２を、それぞれ示す。
図３に示す通り、顔画像データＪ１、Ｊ２は、異なる人物の顔を含む画像であって、人物はともに男性である。

勾配画像作成手段２１２２は、入力する顔画像データＪに基づき、勾配画像データＩｇを作成し、原特徴ベクトル算出手段２１２３に出力する。この勾配画像作成手段２１２２の処理について、図４を参照して説明する。図４は、勾配画像作成手段２１２２による処理を説明するための図である。
入力データである顔画像データＪは、Ｎ×Ｎ画素（例えば、Ｎ＝８０）の画像サイズを有する。つまり、顔画像データＪは、Ｎ^２個の画素（０，０）〜（Ｎ−１，Ｎ−１）によって構成される画像データである。この顔画像データＪにおける座標（ｉ，ｊ）は、図４に示す通り、垂直方向の座標がｉ、水平方向の座標がｊである。

勾配画像作成手段２１２２は、顔画像データＪを代表する画素として予め決められている位置の画素をサンプル点Ｓ（図において●で示す画素）として抽出する。このサンプル点Ｓは、顔画像データＪの全画素から均一的に選択される画素である。本実施形態において、勾配画像作成手段２１２２は、例えば、ｉ、ｊの両方に対して１画素置きにサンプル点Ｓを設定し、かつ、顔画像データＪの端（最も外側の１周分の画素）にはサンプル点Ｓを設定しない。つまり、勾配画像作成手段２１２２は、｛（Ｎ−２）／２｝^２＝Ｍ^２個のサンプル点Ｓ_１（ｉ，ｊ）〜Ｓ_Ｍ２（ｉ，ｊ）を、顔画像データＪから抽出する。なお、Ｓ_Ｍ２（ｉ，ｊ）は、Ｍ^２番目のサンプル点である。

勾配画像作成手段２１２２は、これらサンプル点Ｓ_１〜Ｓ_Ｍ２により構成される画像に対して、例えば、異なる方向の勾配を有する勾配フィルタを重畳して積和計算を行う。本実施形態において、この勾配フィルタは、３×３画素の４種類のフィルタであって、例えば、水平方向の勾配を有する勾配フィルタｆ_１、垂直方向の勾配を有する勾配フィルタｆ_２、左斜め方向の勾配を有する勾配フィルタｆ_３、右斜め方向の勾配を有する勾配フィルタｆ_４である。
つまり、勾配画像作成手段２１２２は、顔画像データＪに対して、勾配フィルタｆ_１〜ｆ_４を重畳して積和計算を行うことにより、水平、垂直、左斜め、および右斜め、の４方向の微分演算を実施する。勾配画像作成手段２１２２は、演算結果の数値の絶対値を、対応する４枚の勾配画像データＩ_ｇ１〜Ｉ_ｇ４に書き込む。この勾配画像データＩ_ｇの一辺のサイズは、Ｍ＝（Ｎ−２）／２であり、本実施形態において、Ｍ＝３９である。
つまり、この勾配画像作成手段２１２２は、サンプル点Ｓの座標（ｉ，ｊ）に対応する演算結果を、勾配画像データＩ_ｇの座標（ｉ／２，ｊ／２）に書き込む。

このようにして、勾配画像作成手段２１２２は、各フィルタｆ_ｘに対応する勾配画像データＩ_ｇｘを作成する。例えば、勾配画像作成手段２１２２は、水平方向の勾配を有する勾配フィルタｆ_１に対応する勾配画像データＩ_ｇ１を生成する。勾配画像作成手段２１２２は、垂直方向の勾配を有する勾配フィルタｆ_２に対応する勾配画像データＩ_ｇ２を生成する。勾配画像作成手段２１２２は、左斜め方向の勾配を有する勾配フィルタｆ_３に対応する勾配画像データＩ_ｇ３を生成する。勾配画像作成手段２１２２は、右斜め方向の勾配を有する勾配フィルタｆ_４に対応する勾配画像データＩ_ｇ４を生成する。
これら勾配画像データＩ_ｇ１〜Ｉ_ｇ４は、原画像である顔画像データＪと同様に、垂直方向の座標をｉ、水平方向の座標をｊと表わす。そして、勾配画像データＩ_ｇｘ（ｘ＝１，２，３，４）の座標（ｉ，ｊ）の画素値を、画素値Ｉ_ｇｘ（ｉ，ｊ）と表わす。
勾配画像作成手段２１２２は、作成した勾配画像データＩ_ｇ１〜Ｉ_ｇ４を、原特徴ベクトル算出手段２１２３に出力する。

原特徴ベクトル算出手段２１２３は、入力する勾配画像データＩ_ｇ１〜Ｉ_ｇ４に基づき、原特徴ベクトルＧを算出し、閲覧画像作成手段２１２４に出力する。
原特徴ベクトル算出手段２１２３は、例えば、勾配画像データＩ_ｇ１〜Ｉ_ｇ４に含まれる値を中間的なベクトルｇとして記述する。この原特徴ベクトル算出手段２１２３は、このベクトルｇを、以下の式に従って正規化して、原特徴ベクトルＧを作成する。

なお、原特徴ベクトルＧの要素の並べ方は、以下に示す通り、勾配画像データＩ_ｇ１〜Ｉ_ｇ４の座標（ｉ，ｊ）に対応する４つの値をまとめたものを座標（ｉ，ｊ）の順番に配列することが好ましい。

なお、式（１）における各要素は、以下のように示すことができる。

原特徴ベクトルＧの次元数をＫで表わす。Ｋ＝４Ｍ^２である。

閲覧画像作成手段２１２４は、入力する原特徴ベクトルＧに基づき、閲覧画像データＩ_ｇＤを作成し、特徴選択手段１２１３に出力する。
この閲覧画像作成手段２１２４は、原特徴ベクトルＧにおける要素のうち、座標（ｉ，ｊ）が同一の以下の４つの要素

を一つの値にまとめることで１枚の画像に統合する。かつ、閲覧画像作成手段２１２４は、画像の輝度を反転させることで閲覧画像データＩ_ｇＤを生成する。この閲覧画像データＩ_ｇＤの画像サイズは、勾配画像データＩ_ｇ１〜Ｉ_ｇ４と同じくＭ^２＝３９×３９画素である。なお、閲覧画像データＩ_ｇＤの座標（ｉ，ｊ）の画素に該当する値を、画素値Ｉ_ｇＤ（ｉ，ｊ）と表す。閲覧画像作成手段２１２４は、以下の式（２）に従って、画素値Ｉ_ｇＤ（ｉ，ｊ）を算出する。

なお、式（２）において、「Ｉ_ｍａｘ」は、閲覧画像データＩ_ｇＤに含まれる画素値のうち最大値の画素値である。本実施形態では、画素値を８ビットで表すため、最大画素値Ｉ_ｍａｘ＝２５５である。また、「α」は、閲覧画像データＩ_ｇＤで表示するエッジの強さを調整するためのパラメータであり、人が目視により確認して実験的に調整した値である。
また、パラメータαを乗算することで、式（２）の右辺の二項目の数値が最大画素値Ｉ_ｍａｘを超えてしまう可能性がある。このため、式（２）では、２引数の中の最小値を出力する関数ｍｉｎを導入して、最大値をＩ_ｍａｘとした。つまり、関数ｍｉｎは、式（２）の右辺の二項目の数値が最大画素値Ｉ_ｍａｘを超えないようにするための関数であって、予め決められている。

図３に示す顔画像データＪ１、Ｊ２から生成される閲覧画像データＩ_ｇＤ１と閲覧画像データＩ_ｇＤ２の一例を図５に示す。
図５に示す通り、閲覧画像データＩ_ｇＤ１に示される人物の顔は、ある程度視認できるものであり、顔画像データＪ１に映る人物の顔であると視認される可能性が高い。また、閲覧画像データＩ_ｇＤ２に示される人物の顔も、ある程度視認できるものであり、顔画像データＪ２に映る人物の顔であると視認される可能性が高い。

特徴選択手段２０１３は、入力する原特徴ベクトルＧに対して、特徴選択情報である染色体ベクトルＦを適用して、圧縮特徴ベクトルＨを作成し、辞書作成手段２０１４に出力する。この特徴選択手段２０１３は、特徴選択情報である染色体ベクトルＦを用いて、原特徴ベクトルＧのうち、識別率への寄与が低い情報を削除することにより、圧縮特徴ベクトルＨを作成する。
この特徴選択手段２０１３による圧縮特徴ベクトルＨの作成の一例について、図６を参照して説明する。図６は、特徴選択情報を適用して圧縮特徴ベクトルＨの作成方法の一例を説明するための参考図である。

特徴選択ベクトルＦは、例えば、原特徴ベクトルＧと同じ長さＭ^２のビット列である。この特徴選択ベクトルＦは、個々のビットを要素とするＭ^２次元のベクトルで表すことができる。この特徴選択ベクトルＦは、原特徴ベクトルＧの上記の４つの要素

を一括して選択する値を表すビット

をすべてのｉ，ｊについて並べた構成とする。

なお、

は、以下、Ｆ^ｉ _ｊと記す。

また、

は、以下、Ｇ^ｉ _ｊと記す。

さらに、

は、以下、Ｈ^ｉ _ｊと記す。

本実施形態において、特徴選択ベクトルＦは、要素Ｆ^ｉ _ｊの値が“０”である場合、この要素Ｆ^ｉ _ｊに対応する原特徴ベクトルＧの要素^ｘＧ^ｉ _ｊ｛ｘ＝１〜４｝の値を圧縮特徴ベクトルＨの要素^ｘＨ^ｉ _ｊとして使用しないことを意味する。一方、特徴選択ベクトルＦは、要素Ｆ^ｉ _ｊの値が“１”である場合、この要素Ｆ^ｉ _ｊに対応する原特徴ベクトルＧの要素^ｘＧ^ｉ _ｊ｛ｘ＝１〜４｝の値を圧縮特徴ベクトルＨの要素^ｘＨ^ｉ _ｊとして使用することを意味する。

よって、特徴選択手段２０１３は、特徴選択ベクトルＦを原特徴ベクトルＧに適用することにより、特徴選択ベクトルＦの要素Ｆ^ｉ _ｊ＝０である場合、この要素Ｆ^ｉ _ｊに対応する原特徴ベクトルＧの要素^ｘＧ^ｉ _ｊ｛ｘ＝１〜４｝の値を０に書き換えて圧縮特徴ベクトルＨの要素^ｘＨ^ｉ _ｊとする。また、特徴選択手段２０１３は、特徴選択ベクトルＦを原特徴ベクトルＧに適用することにより、特徴選択ベクトルＦの要素Ｆ^ｉ _ｊ＝１である場合、この要素Ｆ^ｉ _ｊに対応する原特徴ベクトルＧの要素^ｘＧ^ｉ _ｊ｛ｘ＝１〜４｝の値をそのまま圧縮特徴ベクトルＨの要素^ｘＨ^ｉ _ｊとする。

圧縮特徴ベクトルＨの要素^ｘＨ^ｉ _ｊは、原特徴ベクトルＧの要素^ｘＧ^ｉ _ｊと一対一で対応している。
特徴選択手段２０１３は、このようにして作成した圧縮特徴ベクトルＨを辞書作成手段２０１４に出力する。

原特徴ベクトルＧから閲覧画像データＩ_ｇＤを作成した手順により、原特徴ベクトルＧと圧縮特徴ベクトルＨから作成した閲覧画像データＩ_ｇＤの一例を図７に示す．
図７（ａ）は、原特徴ベクトルＧに基づき再現した画像の一例を示す。
図７（ｂ）は、圧縮特徴ベクトルＨに基づき再現した画像の一例を示す。
図７（ｂ）に示す圧縮特徴ベクトルＨに基づき再現した画像は、図７（ａ）に示す原特徴ベクトルＧに基づき再現した画像に比べて、大きく視認性が低下していることがわかる。
このように、特徴選択情報を適用することにより、識別率が低下せずに視認性ができる限り低下させることができる。

辞書作成手段２０１４は、入力する圧縮特徴ベクトルＨに基づき識別辞書データを作成する。本実施例において、辞書作成手段２０１４は、例えば、各カテゴリーにおける学習データの特徴ベクトルの平均値とのユークリッド距離の大小を比較する方法を用いている。このため、辞書作成手段２０１４は、圧縮特徴ベクトルＨを正解カテゴリーによって２つの集合に分け、各々の集合で平均ベクトルを作成してこれを識別辞書データとする。
この辞書作成手段２０１４は、男性の顔を含む画像の学習用画像データＥに基づく作成した圧縮特徴ベクトルＨの辞書画像データとして、例えば、識別辞書ベクトルＤ_１＝Ｄ_１１，Ｄ_１２，・・・Ｄ_１Ｎを識別辞書記憶部２０４に格納する。この識別辞書ベクトルＤ_１に対しては、それぞれ、正解カテゴリー番号Ｃ_１が対応付けられている。
また、辞書作成手段２０１４は、女性の顔を含む画像の学習用画像データＥに基づく作成した圧縮特徴ベクトルＨの辞書画像データとして、例えば、識別辞書ベクトルＤ_２＝Ｄ_２１，Ｄ_２２，・・・Ｄ_２Ｎを識別辞書記憶部２０４に格納する。この識別辞書ベクトルＤ_２に対しては、それぞれ、正解カテゴリー番号Ｃ_２が対応付けられている。

上述の通り、特徴選択情報作成装置１の特徴抽出手段２０１２は、顔画像データＪに基づき、勾配画像データＩ_ｇ１〜Ｉ_ｇ４を作成する。
勾配ベースの画像では低周波成分が抑制されるので、原理的に照明の不均一性の影響を受けにくい特長がある。また、ぼかしや小ブロックへの分割・ヒストグラム化により位置ずれへのロバスト性もある。したがって、勾配ベースの特徴は、シンプルな特徴量であるにもかかわらず識別能力が高い。

例えば、勾配ベースの特徴量の例としては、以下の参考文献（２）において、画像の輝度値を対数に変換した画像に対して水平方向と垂直方向の微分とぼかしを行った画像が特徴として用いられている。
参考文献（２）
高橋裕子、田中久子、鈴木章、塩昭夫、大塚作一: ”多値テンプレートマッチングを用いたナンバープレート認識法: 雑音抑制フィルタと文字配置規則の効果的利用”、電子情報通信学会論文誌、Vol.J87DII,No.7,pp.1451-1461(2004)

また、勾配ベクトルの角度を量子化し、画像を小ブロックに分割してブロック内でヒストグラム化した特徴が以下の参考文献（３）にある。
参考文献（３）
・N.Danal,B.Triggs: ”Histgram of oriented gradients for human detection ”, Proc.of IEEE Conferenceon Conputer Vision and Pattern Recognition(CVPR),pp.886- 893(2005)

本実施形態に係る画像識別装置２は、識別辞書データを作成するために、学習用の画像データである顔画像データＪに基づき、勾配画像データＩ_ｇ１〜Ｉ_ｇ４を作成することにより、画像認識のための有力な特徴量である、画像から生成された勾配ベクトルの画像をベースとする特徴量（勾配ベースの特徴量）を保護することができる。

次に、識別処理部２０２について説明する。この識別処理部２０２は、特徴抽出手段２０２１と、特徴選択手段２０２２と、識別手段２０２３とを含む。
特徴抽出手段２０２１は、入力する画像に基づき、この画像の特徴を示す原特徴ベクトルＧを算出し、特徴選択手段２０２２に出力する。この特徴抽出手段２０２１は、特徴抽出手段２０１２と同様に、顔検出手段２１２１と、勾配画像作成手段２１２２と、原特徴ベクトル算出手段２１２３と、閲覧画像作成手段２１２４とを備える構成を備え、上述のようにして、原特徴ベクトルＧを算出する。

特徴選択手段２０２２は、入力する原特徴ベクトルＧに対して、特徴選択情報である染色体ベクトルＦを適用して、圧縮特徴ベクトルＨを作成し、識別手段２０２３に出力する。この特徴選択手段２０２２は、上述の特徴選択手段２０１３のようにして、圧縮特徴ベクトルＨを作成する。

識別手段２０２３は、入力する圧縮特徴ベクトルＨに基づき、識別辞書記憶部２０４を参照して、圧縮特徴ベクトルＨと識別辞書ベクトルＤ_１とのユークリッド距離ｒ_１と、圧縮特徴ベクトルＨと識別辞書ベクトルＤ_２とのユークリッド距離ｒ_２とを算出する。
識別手段２０２３は、圧縮特徴ベクトルＨごとに、算出したユークリッド距離ｒ_１とユークリッド距離ｒ_２とを比較する。
例えば、圧縮特徴ベクトルＨに対応するユークリッド距離ｒ_１、ｒ_２を比較した結果、ユークリッド距離ｒ_１＜ｒ_２である場合、識別手段２０２３は、この圧縮特徴ベクトルＨに基づく顔画像データＪは、男性の顔を含む画像であり、識別結果としてカテゴリー番号＝１を示す情報を、出力部２０５に出力する。
一方、圧縮特徴ベクトルＨに対応するユークリッド距離ｒ_１、ｒ_２を比較した結果、ユークリッド距離ｒ_１≧ｒ_２である場合、識別手段２０２３は、この圧縮特徴ベクトルＨに基づく顔画像データＪは、女性の顔を含む画像であり、識別結果としてカテゴリー番号＝２を示す情報を、出力部２０５に出力する。

このような特徴を用いて画像を識別するには、一般に、次の２段階の処理を行う。
まず、正解カテゴリーがわかっている大量の画像から特徴を抽出し、正解カテゴリーの情報が付与された特徴のデータベースを作成する。これを学習用特徴データベースと呼ぶ。そして学習用特徴データベースのデータを学習して識別の基準となるデータを作成する処理をあらかじめ行っておく。この識別の基準となるデータを識別辞書データと呼ぶ。
そして正解の不明な画像の識別を行う際には、特徴抽出を行い、抽出した特徴と識別辞書を照合して正解の可能性の高いカテゴリーを結果として出力する。

特徴量の学習と識別の技術は非常に多くが提案されているが、説明の例として、ここではカテゴリー内の学習サンプルの特徴量の平均を識別辞書とし、未知サンプルの識別の際には、未知サンプルの特徴と識別辞書とのユークリッド距離を測定し、最小のユークリッド距離が得られたカテゴリーを識別結果とする方法を用いる。
学習処理は、男女の正解付の顔画像領域が蓄積された画像のデータベースから一枚ずつ画像を取り出し、特徴抽出と特徴選択を行って特徴ベクトルを生成し、特徴データベースに蓄積する。

すべての画像に対して以上の処理が完了した後で、特徴データベースに蓄積された特徴ベクトルを基に学習処理が動作し、識別辞書を作成する。識別対象とするカテゴリーを区別する情報として番号を用い、カテゴリー番号と呼ぶ。男性をカテゴリー番号＝１、女性をカテゴリー番号＝２で表わす。男性のカテゴリーの学習サンプルの特徴の平均をＭ_１、女性のカテゴリーの学習サンプルの特徴の平均をＭ_２とする。

識別処理は、未知の顔領域画像の入力に対して、特徴抽出を行い、抽出された特徴とＭ_１とのユークリッド距離ｒ_１およびＭ_２とのユークリッド距離ｒ_２を測定し、ｒ_１＜ｒ_２であれば、識別結果をカテゴリー番号＝１とし、それ以外であればカテゴリー番号＝２とする。

◇勾配ベースの特徴量からの閲覧用画像の構成
この特徴量を顔画像から性別や年代の識別に用いた場合には、上記のように、最初に識別辞書を作成する必要がある。ただし、一度作成するとは限らず、識別性能を高めるために後に学習用の画像を追加して再度識別辞書を作成する場合がある。
この場合、学習処理で用いる原画像の集合もしくは学習用特徴データベースを一定期間保存しておく必要がある。本特許では、学習用特徴データベースを保管することを想定する。
学習用特徴データベースを構成する個々の特徴は、顔領域の画像１枚分に相当するが、特徴の種類によっては元の画像をある程度類推できるように構成することができる場合がある。

次に、図８を参照して、本実施形態に係る特徴選択情報作成装置１の構成の一例について説明する。図８は、本実施形態に係る特徴選択情報作成装置１の構成の一例について説明するための図である。

特徴選択情報作成装置１は、染色体評価手段１０と、全体制御手段２０と、世代数カウンター３０と、初期染色体集合作成手段４０と、全世代染色体集合格納手段５０と、選択確率値算出手段６０と、個別世代実行部７０とを備える。この特徴選択情報作成装置１は、遺伝的アルゴリズムを用いて、適応度の高い固体を優先的に選択して、交叉や突然変異等の操作を繰り返しながら、最も適用度の高い固体を解として算出する。特徴選択情報作成装置１は、算出された解である固体の「染色体」を、特徴選択情報として、出力部８０を介して、画像識別装置２に出力する。ここで示す「遺伝子」、「染色体」等の用語は、遺伝的アルゴリズムにおいて用いられる用語を意味する。

染色体評価手段１０は、特徴選択情報である染色体が特徴選択手段によって適用された場合に、識別率の低下を抑制する特徴選択情報として評価を示す情報を作成する。本実施形態において、染色体評価手段１０は、識別率Ｐ_αとＰＳＮＲを示す情報を作成する。なお、識別率Ｐ_αとは、識別対象の特徴を示す識別辞書データと、入力する画像の特徴を示す特徴情報とを識別率Ｐ_αとが照合することにより、当該画像を正しい識別対象と識別する確率である。また、ＰＳＮＲは、当該画像の画質の評価を示す情報（以下、画質評価情報という）の一例である。

この染色体評価手段１０は、例えば、図９に示す通り、染色体評価制御手段１１と、個別評価値算出手段１２とを含む。図９は、染色体評価手段１０の構成の一例を示す図である。
染色体評価制御手段１１は、動作制御手段１１１と、評価値統合手段１１２と、基準識別率格納手段１１３とを備える。

この染色体評価制御手段１１は、個別評価値算出手段１２を制御する機能を有する。染色体評価制御手段１１は、この機能を使う際には、個別評価値算出手段１２に対して、１個の「染色体」を出力する。個別評価値算出手段１２は、入力する「染色体」に基づき、処理結果として識別率Ｐ_αとＰＳＮＲを、染色体評価制御手段１１に出力する。
染色体評価制御手段１１の動作としては、以下に示す２種類方法を適用することができる。
１種類目は、特徴選択情報作成装置１全体が動作を開始した時に、外部からの指示無しで自動的に１回だけ動作するもので、染色体評価制御手段１１が、全ビットに１を設定した「染色体」を個別評価値算出手段１２に出力する。
染色体評価制御手段１１は、結果として、個別評価値算出手段１２から返された識別率Ｐ_αとＰＳＮＲの中で、識別率Ｐ_αを基準識別率格納手段１３３に格納することで動作を完了する。
この動作を「基準識別率格納手段設定処理」という。基準識別率格納手段１３３に格納された値を基準識別率Ｐ_α０という。すなわち、基準識別率格納手段１３３に格納される基準識別率Ｐ_α０とは、全ビットに１を設定した「染色体」を用いたときに個別評価値算出手段１２で算出される識別率Ｐ_αである。

もう１種類は、特徴選択情報作成装置１内の染色体評価手段１０以外の他の機能ブロックから１個の「染色体」が入力された時に染色体評価制御手段１１が動作するものである。染色体評価制御手段１１は、入力する「染色体」を、個別評価値算出手段１２に送り、個別評価値算出手段１２の処理結果として返された識別率Ｐ_αとＰＳＮＲ（Peak Signal−to−Noise−Ratio）に基づき、以下の式（３）に従って単一の評価値ψに統合する。そして、染色体評価制御手段１１は、算出した評価値ψを、「染色体」を送ってきた他機能ブロックに返すことで動作を完了する。この評価値ψは、遺伝的アルゴリズムにおける適応度である。また、この動作を「個別染色体評価処理」と呼ぶ。

式（３）において、「ｓｉｇｎ」は符号関数であり、この符号関数は、入力が正であれば１、入力が負であれば−１、入力が０であれば０を出力する関数である。ＰＳＮＲは、負になることはないので、ψ≧０であれば「識別率Ｐ_αが基準識別率Ｐ_α０と同一もしくは上回る（Ｐ_α≧Ｐ_α０）」という範囲に収まっていることを意味する。一方、ψ＜０であれば、識別率Ｐ_αがこの範囲の外に出ていることを意味する。つまり、「識別率Ｐ_αが基準識別率Ｐ_α０未満（Ｐ_α＜Ｐ_α０）」という範囲に収まっていることを意味する。

個別評価値算出手段１２の構成の一例を図１０に示す。図１０は、個別評価値算出手段１２の構成の一例を図である。
図１０に示す通り、個別評価値算出手段１２は、「学習およびＰＳＮＲ算出部１２１」と「識別率算出部１２２」と、識別辞書記憶部１２３とを備える。

学習およびＰＳＮＲ算出部１２１は、学習用画像データベース１２１１と、特徴抽出手段１２１２と、特徴選択手段１２１３と、辞書作成手段１２１４と、ＰＳＮＲ算出手段１２１５とを含む。
識別率算出部１２２は、識別率算出対象画像データベース１２２１と、特徴抽出手段１２２２と、特徴選択手段１２２３と、辞書作成手段１２２４と、識別率集計手段１２２５とを含む。
なお、学習およびＰＳＮＲ算出部１２１と識別率算出部１２２に含まれる構成は、上述した画像識別装置２の構成を適用することができる。同様の機能を有する構成については、同一名称を付すことにより、詳細な説明は省略する。

特徴選択情報作成装置１全体が動作する前に、事前の準備段階において、学習用画像データベース１２１１と、識別率算出対象画像データベース１２２１には、それぞれ異なる顔画像データＪを格納しておく。学習用画像データベース１２１１は、Ｌ枚の顔画像データＪ１_１〜Ｊ１_Ｌを格納する。識別率算出対象画像データベース１２２１は、Ｎ_ｔ枚の顔画像データＪ２_１〜Ｊ２_Ｎｔを格納する。

本実施例においても、男性の顔を含む画像のカテゴリーをカテゴリー番号＝１で示す。また、女性の顔を含む画像のカテゴリーをカテゴリー番号＝２で示す。学習用画像データベース１２１１に格納されている顔画像データＪ１_１〜Ｊ１_Ｌを識別するための固有の通番を１〜Ｌとし、通番ｉの顔画像データＪ１_ｉの正解カテゴリー番号をＣ_ｉで表わす。例えば、顔画像データＪ１_ｉが、男性の顔を含む画像の画像データであれば、正解カテゴリー番号をＣ_ｉ＝１である。一方、顔画像データＪ１_ｉが、女性の顔を含む画像の画像データであれば、正解カテゴリー番号をＣ_ｉ＝２である。
また、個別評価値算出手段１２における評価対象の「染色体」をＦと示す。

◇「学習およびＰＳＮＲ算出部」の動作
特徴抽出手段１２１２は、例えば、特徴抽出手段２０１２の勾配画像作成手段２１２２と原特徴ベクトル算出手段２１２３とを備える構成を備え、上述のようにして、原特徴ベクトルＧを算出する。なお、特徴抽出手段１２１２は、特徴抽出手段２０１２と同様に、顔検出手段２１２１と閲覧画像作成手段２１２４をさらに備える構成であってもよい。
勾配画像作成手段２１２２は、学習用画像データベース１２１１から顔画像データＪ１_１〜Ｊ１_Ｌを読み出す。勾配画像作成手段２１２２は、各顔画像データＪ１_１〜Ｊ１_Ｌに対応する勾配画像データＩ_ｇ１〜Ｉ_ｇＬを作成し、原特徴ベクトル算出手段２１２３に出力する。

この勾配画像作成手段２１２２は、図４を参照して上述したような処理を実行する。
つまり、勾配画像作成手段２１２２は、例えば、顔画像データＪ１_１を代表する画素として予め決められている位置の画素をサンプル点Ｓ_１〜Ｓ_Ｍ２として抽出する。勾配画像作成手段２１２２は、これらサンプル点Ｓ_１〜Ｓ_Ｍ２からなる画像に対して、例えば、異なる方向の勾配を有する勾配フィルタｆ_１〜ｆ_４を重畳して積和計算を行う。勾配画像作成手段２１２２は、演算結果の数値の絶対値を、対応する４枚の勾配画像データＩ_ｇ１〜Ｉ_ｇ４に書き込む。勾配画像作成手段２１２２は、作成した勾配画像データＩ_ｇ１〜Ｉ_ｇ４を、原特徴ベクトル算出手段２１２３に出力する。
この勾配画像作成手段２１２２は、顔画像データＪ１_１〜Ｊ１_Ｌのそれぞれに対応する勾配画像データＩ_ｇ１〜Ｉ_ｇＬを作成する。

原特徴ベクトル算出手段２１２３は、入力する勾配画像データＩ_ｇ１〜Ｉ_ｇ４に基づき、顔画像データＪ１_１〜Ｊ１_Ｌのそれぞれに対応する原特徴ベクトルＧ_１〜Ｇ_Ｌを算出し、特徴選択手段１２１３に出力する。
原特徴ベクトル算出手段２１２３は、例えば、上述の通り、式（１）に従って原特徴ベクトルＧ_１〜Ｇ_Ｌを作成する。

特徴選択手段１２１３は、入力する原特徴ベクトルＧ_１〜Ｇ_Ｌに対して染色体ベクトルＦを適用して、圧縮特徴ベクトルＨ_１〜Ｈ_Ｌを作成し、辞書作成手段１２１４とＰＳＮＲ算出手段１２１５に出力する。

ＰＳＮＲ算出手段１２１５は、圧縮特徴ベクトルＨ_１〜Ｈ_Ｌに基づき、それぞれ、閲覧画像データＩ^＾ _ｇＤ１〜Ｉ^＾ _ｇＤＬを作成する。
このＰＳＮＲ算出手段１２１５は、閲覧画像作成手段２１２４が閲覧画像データＩ_ｇＤを作成する方法と同様の方法を用いて、閲覧画像データＩ^＾ _ｇＤ１〜Ｉ^＾ _ｇＤＬを作成する。
つまり、ＰＳＮＲ算出手段１２１５は、圧縮特徴ベクトルＨ_１〜Ｈ_Ｌにおける要素のうち、座標（ｉ，ｊ）が同一の４つの要素

を一つの値にまとめることで１枚の画像に統合する。かつ、ＰＳＮＲ算出手段１２１５は、画像の輝度を反転させることで閲覧画像データＩ^＾ _ｇＤ１〜Ｉ^＾ _ｇＤＬを生成する。この閲覧画像データＩ^＾ _ｇＤ１〜Ｉ^＾ _ｇＤＬの画像サイズは、勾配画像データＩ_ｇ１〜Ｉ_ｇ４と同じくＭ^２＝３９×３９画素である。なお、閲覧画像データＩ^＾ _ｇＤ１〜Ｉ^＾ _ｇＤＬの座標（ｉ，ｊ）の画素に該当する値を、画素値Ｉ^＾ _ｇＤＬ（ｉ，ｊ）と表す。ＰＳＮＲ算出手段１２１５は、上述の式（２）に従って、画素値Ｉ^＾ _ｇＤＬ（ｉ，ｊ）を算出する。
このＰＳＮＲ算出手段１２１５は、閲覧画像データＩ^＾ _ｇＤ１〜Ｉ^＾ _ｇＤＬに基づき、以下に示す式（４）に従って、ＰＳＮＲを算出する。

式（４）において、ＭＳＥは、以下に示す式（５）によって算出される値である。

なお、上記ＰＳＮＲは、静止画像の品質測定に一般的に用いられる値である。これを説明した文献の例としては、以下の参考文献（４）が挙げられる。
参考文献（４）
「ベクトル量子化と情報圧縮」Allen Gersho 他著、古井貞煕、田崎三郎、小寺博、渡辺裕訳コロナ社 1998 年発行（４６１頁）

辞書作成手段１２１４は、入力する圧縮特徴ベクトルＨ_１〜Ｈ_Ｌに基づき識別辞書データを作成する。本実施例において、辞書作成手段１２１４は、例えば、各カテゴリーにおける学習データの特徴ベクトルの平均値とのユークリッド距離の大小を比較する方法を用いている。このため、辞書作成手段１２１４は、圧縮特徴ベクトルＨ_１〜Ｈ_Ｌを正解カテゴリーによって２つの集合に分け、各々の集合で平均ベクトルを作成してこれを識別辞書とする。
正解カテゴリー番号Ｃ_１の識別辞書データは、例えば、識別辞書ベクトルＤ_１＝Ｄ_１１，Ｄ_１２，・・・Ｄ_１Ｎを含む。
正解カテゴリー番号Ｃ_２の識別辞書データは、例えば、識別辞書ベクトルＤ_２＝Ｄ_２１，Ｄ_２２，・・・Ｄ_２Ｎを含む。

識別率算出部１２２は、識別率算出対象画像データベース１２２１と、特徴抽出手段１２２２と、特徴選択手段１２２３と、識別手段１２２４と、識別率集計手段１２２５とを備える。

識別率算出部１２２は、識別率算出対象画像データベース１２２１から顔画像データＪ２_１〜Ｊ２_Ｎｔを読み出し、顔画像データＪ２_１〜Ｊ２_Ｎｔの画像１枚ずつに対して特徴抽出を行い、その画像に含まれる１つずつの特徴に対して以下の（ａ）、（ｂ）、（ｃ）の処理を行う。なお、１個の特徴を、ベクトルＷで表わす。

（ａ）特徴Ｗに対して染色体ベクトルＦを用いた特徴選択を行い、これをＷ_１とする。
（ｂ）Ｗ_１とＤ_１とＤ_２のユークリッド距離を測定し、それをｒ_１、ｒ_２で表わす。
（ｃ）ｒ_１＜ｒ_２であれば、識別結果をカテゴリー番号＝１とし、それ以外であればカテゴリー番号＝２とする。

（ａ）の処理
特徴抽出部手段１２２２は、例えば、特徴抽出手段２０１２の勾配画像作成手段２１２２と原特徴ベクトル算出手段２１２３とを備える構成を備え、上述のようにして、原特徴ベクトルＧを算出する。なお、特徴抽出手段１２２２は、特徴抽出手段２０１２と同様に、顔検出手段２１２１と閲覧画像作成手段２１２４をさらに備える構成であってもよい。
勾配画像作成手段２１２２は、読み出した顔画像データＪ２_１〜Ｊ２_Ｎｔに対応する勾配画像データＩ_ｇ１〜Ｉ_ｇＮｔを作成し、原特徴ベクトル算出手段２１２３に出力する。
勾配画像作成手段２１２２は、図４を参照して上述したような処理を実行する。
つまり、勾配画像作成手段２１２２は、例えば、顔画像データＪ２_１を代表する画素として予め決められている位置の画素をサンプル点Ｓ_１〜Ｓ_Ｍ２として抽出する。勾配画像作成手段２１２２は、これらサンプル点Ｓ_１〜Ｓ_Ｍ２からなる画像に対して、例えば、異なる方向の勾配を有する勾配フィルタｆ_１〜ｆ_４を重畳して積和計算を行う。勾配画像作成手段２１２２は、演算結果の数値の絶対値を、対応する４枚の勾配画像データＩ_ｇ１〜Ｉ_ｇ４に書き込む。勾配画像作成手段２１２２は、作成した勾配画像データＩ_ｇ１〜Ｉ_ｇ４を、原特徴ベクトル算出手段２１２３に出力する。

原特徴ベクトル算出手段２１２３は、入力する勾配画像データＩ_ｇ１〜Ｉ_ｇ４に基づき、顔画像データＪ２_１〜Ｊ２_Ｎｔのそれぞれに対応する特徴ベクトルＷ_１〜Ｗ_Ｎｔを算出し、特徴選択手段１２２３に出力する。
原特徴ベクトル算出手段２１２３は、例えば、上述の通り、式（１）に従って原特徴ベクトルＧを作成するようにして、特徴ベクトルＷ_１〜Ｗ_Ｎｔを算出する。
特徴選択手段１２２３は、入力する特徴ベクトルＷ_１〜Ｗ_Ｎｔに対して染色体ベクトルＦを適用して、圧縮特徴ベクトルＷ１_１〜Ｗ１_Ｎｔを作成し、識別手段１２２４に出力する。

（ｂ）の処理
識別手段１２２４は、入力する圧縮特徴ベクトルＷ１_１〜Ｗ１_Ｎｔに基づき、識別辞書１２３を参照して、圧縮特徴ベクトルＷ１_１〜Ｗ１_Ｎｔと識別辞書ベクトルＤ_１とのユークリッド距離ｒ_１と、圧縮特徴ベクトルＷ１_１〜Ｗ１_Ｎｔと識別辞書ベクトルＤ_２とのユークリッド距離ｒ_２とを算出する。

（ｃ）の処理
識別手段１２２４は、圧縮特徴ベクトルＷ１_１〜Ｗ１_Ｎｔごとに、算出したユークリッド距離ｒ_１とユークリッド距離ｒ_２とを比較する。
例えば、圧縮特徴ベクトルＷ１_１に対応するユークリッド距離ｒ_１、ｒ_２を比較した結果、ユークリッド距離ｒ_１＜ｒ_２である場合、識別手段１２２４は、この圧縮特徴ベクトルＷ１_１に基づく顔画像データＪ２_１は、男性の顔を含む画像であり、識別結果としてカテゴリー番号＝１を示す情報を識別率集計手段１２２５に出力する。
一方、圧縮特徴ベクトルＷ１_１に対応するユークリッド距離ｒ_１、ｒ_２を比較した結果、ユークリッド距離ｒ_１≧ｒ_２である場合、識別手段１２２４は、この圧縮特徴ベクトルＷ１_１に基づく顔画像データＪ２_１は、女性の顔を含む画像であり、識別結果としてカテゴリー番号＝２を示す情報を識別率集計手段１２２５に出力する。

識別率集計手段１２２５は、例えば、識別手段１２２４による識別結果を出力する出力部（例えば、ディスプレイやプリンター）と、管理者からの操作入力を受け付ける入力部とを備える。
識別率集計手段１２２５は、出力部に識別結果を出力する。例えば、顔画像データＪ２_１の画像と、識別結果であるカテゴリー番号を対応付けて出力する。この出力部による出力を、人間が目視により確認し、識別手段１２２４による識別結果が正解か否かを判断する。カテゴリー番号が正解である場合、顔画像データＪ２_１の画像の識別結果が正解であることを示す情報を入力部を介して識別率集計手段１２２５に入力する。一方。カテゴリー番号が不正解である場合、顔画像データＪ２_１の画像の識別結果が不正解であることを示す情報を入力部を介して識別率集計手段１２２５に入力する。
識別率集計手段１２２５は、識別結果の正解率を集計し、この正解率を識別率Ｐ_αとして染色体評価制御手段１１に出力する。この識別率集計手段１２２５は、例えば、顔画像データＪ２_１〜Ｊ２_Ｎｔの全画像に対する識別が行われた後、識別結果が正解であったときは正解、誤っていたときは不正解として集計し、入力パターン数をＮ_ｔ、入力パターンの中で正解となったパターンを数Ｎ_Ｃとすると、識別率Ｐ_αをＰ_α＝Ｎ_Ｃ／Ｎ_Ｔで算出する。

次に、図１１を参照して、本実施形態に係る画像識別方法の一例について説明する。図１１は、本実施形態に係る画像識別方法の一例について説明するためのフローチャートである。上述の通り、本実施形態に係る画像識別システムは、遺伝的アルゴリズム（以下、ＧＡという）に基づいて動作することを基本とするものである。また、装置全体の制御は全体制御手段２０によって行われる。

（ステップＳＴ１）
装置を起動した後の最初の処理は、全体制御手段２０とは無関係に、染色体評価手段１０が行う「基準識別率格納手段設定処理」の動作である。この「基準識別率格納手段設定処理」により基準識別率Ｐ_α０が算出される。この基準識別率Ｐ_α０は、染色体評価手段１０の染色体評価制御手段１１の基準識別率格納手段１１３に格納される。

例えば、特徴選択情報作成装置１が起動した場合、染色体評価手段１０の染色体評価制御手段１１は、全ビットに“１”を設定した染色体ベクトルＦを個別評価値算出手段１２に出力する。
そして、個別評価値算出手段１２は、事前に作成された識別辞書を参照して、識別率算出対象である顔画像データＪの識別を実行する。そして、識別率集計手段１２２５は、識別手段１２２４の識別率Ｐ_α０を、染色体評価制御手段１１に出力する。また、個別評価値算出手段１２の学習およびＰＳＮＲ算出部１２１のＰＳＮＲ算出手段１２１５は、ＰＳＮＲを算出し、染色体評価制御手段１１に出力する。

染色体評価制御手段１１の動作制御手段１１１は、個別評価値算出手段１２から入力する識別率Ｐ_αとＰＳＮＲの中で、全ビットに１を設定した染色体を用いたときに個別評価値算出手段１２で算出される識別率Ｐ_αを基準識別率格納手段１３３に格納する。この基準識別率格納手段１３３に格納された値が基準識別率Ｐ_α０である。

（ステップＳＴ２）
次に、全体制御手段２０により制御された動作に移る。ＧＡにおける世代の番号をＧＮとする。全体制御手段２０は、まず、ＧＮ＝１とし、この値を世代数カウンター３０にセットする。
そして、全体制御手段２０は、初期染色体集合作成手段４０に動作開始を指示する。

ここで、図１２を参照して、全世代染色体集合格納手段５０の構成の一例を説明する。図１２（ａ）は、全世代染色体集合格納手段５０の構成例であり、ＧＮ_ｍａｘ個の染色体集合格納手段５００を含む。全世代染色体集合格納手段５０における個別の染色体集合格納手段５００は各世代番号ＧＮに対応しており、ＧＮの染色体集合格納手段５００をＡ（ＧＮ）で表わす。

個別の染色体集合格納手段５００のそれぞれに格納するのは、図１２（ｂ）に示すような染色体格納手段５０１である。この染色体格納手段５０１は、１個の染色体格納手段５０１は、染色体を示す情報を格納する染色体格納領域５０１ａと、適応度を示す情報を格納する適応度領域５０１ｂと、選択される確率を示す情報を格納する選択確率領域５０１ｃとを含む。
個別の染色体集合格納手段５００には、最大Ｋ_β個の染色体格納手段５０１を格納できる。個別の染色体集合格納手段５００は、すべて、特徴選択情報作成装置１の起動時は空である。

ここで、図１１に戻って、処理の続きについて説明する。
（ステップＳＴ３）
初期染色体集合作成手段４０は、以下のようにして、最初の染色体集合格納手段５００であるＡ（１）を設定する。まず、初期染色体集合作成手段４０は、１個の染色体の全ビットを１に設定した後で、一定の確率Ｐ_ｄで染色体のビット列に反転を生じさせることで染色体ベクトルＦを生成する。そして、初期染色体集合作成手段４０は、生成した染色体ベクトルＦを染色体評価手段１０に出力する。染色体評価手段１０は、この染色体ベクトルＦに対応する適応度ψを算出する。

初期染色体集合作成手段４０は、染色体評価手段１０から入力する適応度ψに基づき、識別率Ｐ_αが予め決められている基準識別率Ｐ_α０以上であるか否かを判定する。つまり、初期染色体集合作成手段４０は、適応度ψの符号に応じて、識別率Ｐ_αが予め決められている基準識別率Ｐ_α０以上であるか否かを判定する。
ψ≧０であれば、初期染色体集合作成手段４０は、適応度ψの値とあわせて１個の染色体格納手段５０１を作成して染色体集合格納手段Ａ（１）に追加する。
一方ψ＜０であれば、初期染色体集合作成手段４０は、設定した染色体ベクトルＦが、致死性の染色体とみなして不採用とする。つまり、初期染色体集合作成手段４０は、この染色体ベクトルＦに対応する染色体集合格納手段５００を全世代染色体集合格納手段５０に作成することなく、この染色体ベクトルＦと適応度ψを保存しない。

初期染色体集合作成手段４０は、この処理を初期の染色体集合格納手段Ａ（１）の個体数（染色体格納手段５０１）がＫ_βに達するまで繰り返す。その後で、初期染色体集合作成手段４０は、全世代染色体集合格納手段５０に格納されている染色体集合格納手段Ａ（１）の各個体を、適応度ψの大きさの降順に並べ替える。
そして、各順位の染色体が選択される確率を選択確率値算出手段６０により算出し、染色体格納手段５０１の選択確率領域５０１ｃに書き込む。

ここで選択確率値算出手段６０の動作を説明する。選択確率値算出手段６０は、第ｒ位の染色体が選択される確率値Ｐ_Ｓ（ｒ）を、下記に示す式（６）に従って算出する。

式（６）においてＭａｘは、２変数の中の最大値を出力する関数である。

（ステップＳＴ４）
初期染色体集合作成手段４０の動作完了後、個別世代実行部７０の動作に移る。
全体制御手段２０は、まず世代数カウンター３０に格納されたＧＮの値を＋１する。そして、全体制御手段２０は、ＧＮ＝ＧＮ_ｍａｘであるか否かを確認し、ＧＮ＝ＧＮ_ｍａｘであればそこで動作を完了して、全世代染色体集合格納手段５０において、Ａ（ＧＮ_ｍａｘ）の第１位の染色体格納手段５０１の染色体を取り出して、最終結果として出力部８０を介して出力する。ＧＮ＝ＧＮ_ｍａｘで無ければ、全体制御手段２０は、以下の動作を行う。

（ステップＳＴ５）
まず、全体制御手段２０は、交叉実行手段７０１に実行を指示する。
交叉実行手段７０１は、全世代染色体集合格納手段５０に格納されている染色体集合格納手段Ａ（ＧＮ−１）から、各染色体格納手段５０１の選択確率領域５０１ｃに書かれた確率値によりランダムに染色体格納手段５０１のペアを選ぶ。言い換えると、選択確率領域５０１ｃに書かれた確率値は、交叉実行手段７０１が染色体格納手段５０１のペアを選択する確率である。この確率値が高い染色体格納手段５０１は、交叉実行手段７０１によって選択されやすい。すなわち、各染色体格納手段５０１の中では確率値の高い染色体ほど多くの頻度で選ばれてペアの要素となることになる。そして、交叉実行手段７０１は、選択した２つの染色体を複製し、複製した染色体のペアを用いて、遺伝的アルゴリズムにおける交叉操作を行い、新たに２つの染色体を生成する。そして、交叉実行手段７０１は、それら新たに生成された２つの染色体を染色体評価手段１０に出力し、各々染色体の適応度ψを算出させる。
次いで、染色体評価手段１０は、各々染色体の適応度ψを算出し、交叉実行手段７０１に出力する。

そして、交叉実行手段７０１は、各々の染色体について適応度ψの符号を判定する。ψ≧０であれば適応度ψの値とともに染色体を染色体集合格納手段Ａ（ＧＮ）に追加する。
例えば、染色体ベクトルＦ_ＧＮ１の適応度ψ_ＧＮ１が、ψ_ＧＮ１≧０であれば、交叉実行手段７０１は、全世代染色体集合格納手段５０の染色体集合格納手段Ａ（ＧＮ）に対して、その染色体格納手段５０１の染色体領域５０１ａに染色体ベクトルＦ_ＧＮ１を示す情報を書き込み、適応度領域５０１ｂに適応度ψ_ＧＮ１を示す情報を書き込む。一方、ψ＜０であれば、交叉実行手段７０１は、致死性の染色体とみなして不採用とする。
すなわち、１回の交叉操作の結果として、０個〜２個の染色体が染色体集合格納手段Ａ（ＧＮ）の染色体格納手段５０１の染色体領域５０１ａに追加されることとなる。

交叉実行手段７０１は、この交叉操作を染色体集合格納手段Ａ（ＧＮ）の染色体格納手段５０１の染色体領域５０１ａに追加された染色体の個体数（染色体格納手段５０１）がＫ１に達するまで繰り返す。
本実施例では、交叉操作の方法として、染色体の２箇所をランダムに選んで中間ビット列を交換する二点交叉を採用する。二点交叉の一例を図１３に示す。

（ステップＳＴ６）
次に、全体制御手段２０は、突然変異実行手段７０２に実行を指示する。
突然変異実行手段７０２は、全世代染色体集合格納手段５０に格納されている染色体集合格納手段Ａ（ＧＮ−１）から各染色体格納手段５０１の選択確率領域５０１ｃに書かれた確率値によりランダムに１個の染色体格納手段５０１を選ぶ。そして、突然変異実行手段７０２は、選択した１つの染色体格納手段５０１の染色体の複製を行い、複製した染色体に対して一定の確率Ｐ_ｍで染色体のビット列に反転を生じさせる。その後、突然変異実行手段７０２は、ビット列に反転を生じさせた染色体を染色体評価手段１０に出力し、この染色体の適応度ψを算出させる。
次いで、染色体評価手段１０は、当該染色体の適応度ψを算出し、突然変異実行手段７０２に出力する。

そして、突然変異実行手段７０２は、当該染色体の適応度ψの符号を判定する。ψ≧０であれば適応度ψの値とともに染色体を染色体集合格納手段Ａ（ＧＮ）に追加する。
例えば、染色体ベクトルＦ_ＧＮ１の適応度ψ_ＧＮ１が、ψ_ＧＮ１≧０であれば、突然変異実行手段７０２は、全世代染色体集合格納手段５０の染色体集合格納手段Ａ（ＧＮ）に対して、その染色体格納手段５０１の染色体領域５０１ａに染色体ベクトルＦ_ＧＮ１を示す情報を書き込み、適応度領域５０１ｂに適応度ψ_ＧＮ１を示す情報を書き込む。一方、ψ＜０であれば、突然変異実行手段７０２はは、致死性の染色体とみなして不採用とする。
突然変異実行手段７０２は、この突然変異操作を、染色体集合格納手段Ａ（ＧＮ）の染色体格納手段５０１の染色体領域５０１ａに追加された個体数（染色体格納手段５０１）がＫ２に達するまで繰り返す。

（ステップＳＴ７）
次に、全体制御手段２０は、複製実行手段７０３に実行を指示する。
複製実行手段７０３は、全世代染色体集合格納手段５０に格納されている染色体集合格納手段Ａ（ＧＮ−１）から、各染色体格納手段５０１の選択確率領域５０１ｃに書かれた確率値によりランダムにＫ３個の染色体格納手段５０１を選び、各々の染色体と適応度を全世代染色体集合格納手段５０に格納されている染色体集合格納手段Ａ（ＧＮ）に追加する。
以上の中で、Ｋ１，Ｋ２，Ｋ３の合計はＫ_βに等しい値とする。なお、Ｋ１、Ｋ２、Ｋ３は、これらの合計がＫ_βになるように予め決められている値である。

（ステップＳＴ８）
最後に、全体制御手段２０は、染色体集合並べ替え手段７０４に実行を指示する。
染色体集合並べ替え手段７０４は、全世代染色体集合格納手段５０に格納されている染色体集合格納手段Ａ（ＧＮ）の各個体を適応度ψの大きさの降順に並べ替える。
以上が１つの世代の遺伝的アルゴリズム（ＧＡ）の処理である。
（ステップＳＴ９）
全体制御手段２０は、このステップＳＴ４〜９を繰り返し、世代数がＧＮ_ＭＡＸになるまで、各世代の各個体を算出する。
（ステップＳＴ１０）
全体制御手段２０は、染色体集合格納手段Ａ（ＧＮ）に格納されている複数の染色体格納手段５０１のうち、最も高い確率値が格納されている選択確率領域５０１ｃと対応付けられている染色体格納領域５０１ａに格納されている染色体を“１位の染色体”と決定し、出力する。なお、全体制御手段２０は、全世代の染色体集合格納手段Ａ（１）〜Ａ（ＧＮ_ｍａｘ）のそれぞれに対応する“１位の染色体”と決定する。

したがって、原特徴ベクトルＧを変換処理して新たな圧縮特徴ベクトルＨを作成することができる。この変換処理が満足する条件としては、原特徴ベクトルＧと同様な方法で圧縮特徴ベクトルＨから閲覧用画像を作成した場合、その視認性が非常に低いことと、原特徴ベクトルＧの代わりに学習と識別に用いた場合に識別能力は低下しないこと、の２点である。
本発明では、特徴選択ベクトルＦというデータを用いて、特徴抽出手段の処理の後段に、原特徴ベクトルの一部の要素を強制的に０に設定する「特徴選択手段」を置いたことである。つまり、特徴抽出手段によって抽出された学習用画像の特徴を示す特徴情報のうち、特徴選択情報が選択することを示す情報に対応する情報を用いて、特徴情報のうち一部の情報量が低減された圧縮特徴情報を作成する。これにより、識別率の低減を抑制するとともに、視認性を低減させることができる。

以上のように、本発明によれば、ＧＡの各世代の処理における染色体の生成ではすべて、「ψ≧０であれば採用し、ψ＜０であれば致死性の染色体とみなして不採用とする」という基準を用いている。このため、特徴選択情報を行わずに原特徴ベクトルＧを用いた場合と比べて、識別率は下がらないという条件は満足する。また、その条件を満足する範囲内で適応度ψを最大化する、すなわちＰＳＮＲを最大化する探索を行う処理をＧＡにより効率的に行うことができるという顕著な効果を有する。

なお、この特徴量を顔画像から性別や年代の識別に用いた場合には、上記のように最初に識別辞書を作成する必要がある。ただし、一度作成するとは限らず、識別性能を高めるために後に学習用の画像を追加して再度識別辞書を作成する場合がある。
この場合、学習処理で用いる原画像の集合もしくは学習用特徴データベースを一定期間保存しておく必要がある。本特許では、学習用特徴データベースを保管することを想定する。
学習用特徴データベースを構成する個々の特徴は、顔領域の画像１枚分に相当するが、特徴の種類によっては元の画像をある程度類推できるように構成することができる場合がある。

なお、上述の特徴選択情報作成装置１と画像識別装置２は、内部にコンピュータシステムを有している。そして、特徴選択情報作成装置１と画像識別装置２の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいう「コンピュータシステム」とは、ＣＰＵ及び各種メモリやＯＳ、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。

また、各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、また、特徴選択情報作成装置１と画像識別装置２はこの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、検出対象物の形状情報の推定値を算出する処理を行ってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、フラッシュメモリ等の書き込み可能な不揮発性メモリ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。

さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（例えばＤＲＡＭ（Dynamic Random Access Memory））のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク（通信網）や電話回線等の通信回線（通信線）のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル（差分プログラム）であっても良い。

１・・・特徴選択情報作成装置、２・・・画像識別装置、２０１・・・学習処理部、２０２・・・識別処理部、２０３・・・入力部、２０４・・・識別辞書記憶部、２０５・・・出力部

Claims

画像識別装置において用いられる特徴選択情報を作成する特徴選択情報作成装置であって、
前記画像識別装置の識別対象の特徴を示す識別辞書データと、入力する画像の特徴を示す特徴情報とを照合することにより、前記画像を正しい前記識別対象と識別する確率を示す識別率を取得する個別評価値算出手段と、
前記識別率に基づき、遺伝的アルゴリズムに用いられる前記特徴選択情報の適応度を算出する特徴選択情報評価制御手段と、
前記適応度に基づき、前記識別率が予め決められている基準識別率以上であるか否かを判定し、前記識別率が前記基準識別率以上である場合、当該適応度に対応する特徴選択情報を格納手段に書き込む特徴選択情報作成手段と、
前記格納手段に書き込まれた特徴選択情報のうち、適応度に基づき、一の前記特徴選択情報を選択する制御手段と、
を備えることを特徴とする特徴選択情報作成装置。
前記個別評価値算出手段は、
画像の画質の評価を示す画質評価情報を算出し、当該画質評価情報と前記識別率に基づき、前記適応度を算出することを特徴とする請求項１に記載の特徴選択情報作成装置。
上述の請求項１あるいは２に記載の特徴選択情報作成装置から出力する前記特徴選択情報を入力する入力部と、
学習画像用の画像データから、当該学習用画像の特徴を示す特徴情報を抽出する特徴抽出手段と、
前記特徴抽出手段によって抽出された前記学習用画像の特徴を示す特徴情報のうち、前記特徴選択情報が選択することを示す情報に対応する情報を用いて、前記特徴情報のうち一部の情報量が低減された圧縮特徴情報を作成する特徴選択手段と、
前記圧縮特徴情報に基づき、識別対象の特徴を示す識別辞書データを作成する辞書作成手段と、
を備えることを特徴とする画像識別装置。
前記特徴抽出手段は、
前記学習画像用の画像データに対して、異なる方向の勾配を有する勾配フィルタを重畳して積和計算を行うことにより算出される勾配画像データを作成し、当該勾配画像データに基づき、前記学習用画像の特徴を示す特徴情報を算出することを特徴とする請求項３に記載の画像識別装置。
画像識別装置において用いられる特徴選択情報を作成する特徴選択情報作成方法であって、
前記画像識別装置の識別対象の特徴を示す識別辞書データと、入力する画像の特徴を示す特徴情報とを照合することにより、前記画像を正しい前記識別対象と識別する確率を示す識別率を取得するステップと、
前記識別率に基づき、遺伝的アルゴリズムに用いられる前記特徴選択情報の適応度を算出するステップと、
前記適応度に基づき、前記識別率が予め決められている基準識別率以上であるか否かを判定し、前記識別率が前記基準識別率以上である場合、当該適応度に対応する特徴選択情報を格納手段に書き込むステップと、
前記格納手段に書き込まれた特徴選択情報のうち、適応度に基づき、一の前記特徴選択情報を選択するステップと、
を備えることを特徴とする特徴選択情報作成方法。
コンピュータを、
画像識別装置の識別対象の特徴を示す識別辞書データと、入力する画像の特徴を示す特徴情報とを照合することにより、前記画像を正しい前記識別対象と識別する確率を示す識別率を取得する個別評価値算出手段、
前記画像識別装置において用いられる特徴選択情報についての遺伝的アルゴリズムに用いられる適応度を前記識別率に基づき算出する特徴選択情報評価制御手段、
前記適応度に基づき、前記識別率が予め決められている基準識別率以上であるか否かを判定し、前記識別率が前記基準識別率以上である場合、当該適応度に対応する特徴選択情報を格納手段に書き込む特徴選択情報作成手段、
前記格納手段に書き込まれた特徴選択情報のうち、適応度に基づき、一の前記特徴選択情報を選択する制御手段、
として機能させるための特徴選択情報作成プログラム。