JP6361387B2 - 識別装置および識別装置の制御方法 - Google Patents

識別装置および識別装置の制御方法 Download PDF

Info

Publication number
JP6361387B2
JP6361387B2 JP2014181638A JP2014181638A JP6361387B2 JP 6361387 B2 JP6361387 B2 JP 6361387B2 JP 2014181638 A JP2014181638 A JP 2014181638A JP 2014181638 A JP2014181638 A JP 2014181638A JP 6361387 B2 JP6361387 B2 JP 6361387B2
Authority
JP
Japan
Prior art keywords
classifiers
class
reliability
classification
classification result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014181638A
Other languages
English (en)
Other versions
JP2016057701A (ja
Inventor
淳 入江
淳 入江
睦起 高際
睦起 高際
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2014181638A priority Critical patent/JP6361387B2/ja
Priority to EP15181490.2A priority patent/EP2993624A3/en
Priority to KR1020150116547A priority patent/KR101725651B1/ko
Priority to CN201510535915.7A priority patent/CN105404848A/zh
Priority to US14/840,109 priority patent/US9691007B2/en
Publication of JP2016057701A publication Critical patent/JP2016057701A/ja
Application granted granted Critical
Publication of JP6361387B2 publication Critical patent/JP6361387B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/24765Rule-based classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Description

本発明は、識別装置および識別装置の制御方法に関する。
近年、画像を解析することで、当該画像に含まれている様々な情報を直接的または間接的に識別する技術についての研究が進められている。例えば、人物の顔が含まれている画像(顔画像)に基づいて、当該人物の性別、年齢、表情などを識別することができる。
例えば、特許文献1には、画像から特徴量を抽出し、当該特徴量に基づいて、人物の年齢を推定する年齢推定装置が開示されている。具体的には、画像から取得した特徴量を、年齢によるクラス分類を行う多クラス識別器に入力し、当該識別器の出力に基づいて推定年齢を決定し、出力する。
特許第5287333号公報
取得した特徴量に基づいてクラス分類を行う場合、その分類精度は、用いる識別器の精度に大きく依存する。そこで、識別器の出力に基づいて、分類結果がどの程度信頼できるかという値を算出する手法が知られている。例えば、特許文献1に記載の装置では、識別器が出力した帰属確率に基づいて信頼度を求め、当該信頼度に基づいて、年齢の誤差(±n歳)を算出している。
特許文献1に記載の装置では、2クラス識別器を複数個組み合わせて構成した多クラス識別器を用いて年齢を推定している。一方で、複数の多クラス識別器を用いて分類を行うという手法がある。例えば、異なる手法によって分類を行う複数の多クラス識別器や、異なる学習データによって学習させた複数の多クラス識別器を用いて年齢の推定を行い、出力された複数の結果を統合して、推定年齢を得る。このような手法はアンサンブル学習と呼ばれ、分類精度を向上させるための方法として利用されている。
しかし、複数の識別器を併用すると、それぞれ異なる精度を持つ複数の識別器から結果が得られるため、全体の信頼度を求めることが困難になる。
本発明は上記の課題を考慮してなされたものであり、複数の識別器を用いてクラス分類を行う識別装置において、分類結果に対する信頼度を算出することを目的とする。
上記課題を解決するため、本発明に係る識別装置は、
入力データを取得するデータ取得手段と、前記入力データに対応する特徴量を取得する特徴量取得手段と、入力された特徴量に基づいてクラス分類を行う複数の識別器と、前記取得した特徴量を、前記複数の識別器にそれぞれ入力し、得られた複数の分類結果に基づいて、単一の分類結果である第二の分類結果を生成する識別手段と、前記複数の分類結果のばらつきに基づいて、前記第二の分類結果に対する信頼度を生成する信頼度生成手段と、を有し、前記識別器は多クラス識別器であり、分類結果のクラスに対応する値であるクラス値を出力し、前記信頼度生成手段は、複数の前記識別器が出力したクラス値の中央値または最頻値を用いて、前記複数の識別器が出力したクラス値の分散または標準偏差を求め、前記分散または前記標準偏差に基づいて、前記第二の分類結果に対する信頼度を生成することを特徴とする。
入力データとは、典型的には画像であるが、これに限られない。
特徴量取得手段は、入力データから特徴量を取得する手段である。特徴量は、入力データ全体に対応するものであってもよいし、入力データの一部のみに対応するものであってもよい。例えば、入力データが画像である場合、当該画像に含まれる一部の領域のみから特徴量を取得してもよい。
識別器は、入力された特徴量に基づいてクラス分類を行う手段である。分類先のクラスは、入力データの内容に関連付いたものであれば、どのようなものであってもよい。例えば、入力データが、人物の顔が含まれた画像(以下、顔画像)である場合、対応する人物の年齢、性別、顔の向き、特定の表情(喜び、悲しみ、怒り等)の度合いなどであってもよい。
識別手段は、各識別器から得た複数の分類結果に基づいて、単一の分類結果(第二の分類結果)を生成する手段である。例えば、識別対象が年齢である場合、複数の識別器から推定年齢をそれぞれ取得し、当該複数の推定年齢に基づいて単一の推定年齢を生成する。単一の分類結果は、例えば、複数の分類結果に対応する値の平均値や中央値、最頻値などをとることで生成してもよいし、他の手法によって生成してもよい。
信頼度生成手段は、第二の分類結果に対する信頼度を生成する手段である。第二の分類結果に対する信頼度は、複数の識別器が出力した分類結果のばらつきに基づいて決定することができる。
例えば、前記信頼度生成手段は、前記複数の分類結果のばらつきの大きさと前記信頼度の大きさが負の相関をもつように、前記信頼度を決定するとよい。
複数の識別器が出力した分類結果が広範囲に分散しているような場合、全体として識別精度が低いことを意味する。よって、分類結果のばらつきが大きい場合は、第二の分類結果に対する信頼度をより小さくし、分類結果のばらつきが小さい場合は、第二の分類結果に対する信頼度をより大きくするようにしてもよい。
多クラス識別器とは、複数のクラスの中から、入力された特徴量に最も適合するクラス(最も尤度の高いクラス)を出力する識別器である。多クラス識別器は、単一の識別器であってもよいし、複数の2クラス識別器を組み合わせたものであってもよい。
分散または標準偏差を求める際にクラス値の平均を用いると、外れ値(他の識別器の出力と大きくかけ離れた分類結果)を出力した識別器があった場合において、生成した信頼度が不正確になるおそれがある。そこで、クラス値の中央値または最頻値を用いることで、このようなノイズの影響を抑制することができる。
また、本発明に係る識別装置は、前記複数の識別器の精度をそれぞれ評価する評価手段をさらに有し、前記識別手段または信頼度生成手段は、前記評価の結果に基づいて、前記
複数の分類結果に対して重み付けを行ったうえで、前記第二の分類結果または信頼度を生成することを特徴としてもよい。
識別器の精度が良いということは、当該識別器が出力したクラス値が真値に近いことを意味する。よって、識別器の精度に基づいて、当該識別器が出力した結果に対して重み付けを行うことで、第二の分類結果や信頼度をより正確に求めることができるようになる。
また、前記評価手段は、テストデータを用いて各識別器の精度をそれぞれ評価することを特徴としてもよく、前記評価手段は、前記複数の識別器を学習した際の学習サンプル数に基づいて、各識別器の精度を評価することを特徴としてもよい。
識別器の精度は、テストデータ(すなわち、正解がわかっているデータ)を用いて評価してもよいし、学習サンプル数に基づいて評価してもよい。例えば、学習サンプル数が多い識別器であるほど、精度が高いという評価を行うようにしてもよい。
また、前記入力データは画像であることを特徴としてもよい。本発明に係る識別装置は、画像に含まれる事象を識別する装置に好適に適用することができる。
また、前記識別器が分類を行う対象は、画像に含まれる人物の属性または状態の少なくともいずれかであることを特徴としてもよい。
人物の属性とは、例えば、当該人物の年齢、年代、性別、人種などであり、状態とは、顔の向き、視線の向き、特定の表情の度合いなどである。もちろん、これ以外であってもよい。
なお、本発明は、上記手段の少なくとも一部を含む識別装置として特定することができる。また、本発明は、上記識別装置の制御方法として特定することもできる。また、本発明は、上記識別装置を制御するプログラムとして特定することもできる。上記処理や手段は、技術的な矛盾が生じない限りにおいて、自由に組み合わせて実施することができる。
本発明によれば、複数の識別器を用いてクラス分類を行う識別装置において、分類結果に対する信頼度を算出することができる。
第一の実施形態に係る年齢推定装置のシステム構成図である。 識別部の詳細な構成を説明する図である。 画像に含まれる顔領域を説明する図である。 推定年齢の分布例を示す図である。 推定年齢の分布例を示す第二の図である。 利用者に提供される画面の例である。 第一の実施形態に係る年齢推定装置が行う処理のフローチャートである。
(第一の実施形態)
<システム構成>
以下、本発明の好ましい実施形態について図面を参照しながら説明する。
第一の実施形態に係る年齢推定装置は、画像に含まれる人物の顔に基づいて、当該人物の年齢を推定する装置である。図1は、本実施形態に係る年齢推定装置10のシステム構成図である。
年齢推定装置10は、画像取得部11、特徴量取得部12、識別部13、入出力部14から構成される。
画像取得部11は、処理対象の画像(顔画像)を取得する手段であり、典型的には、固定ディスクドライブやフラッシュメモリといった記憶装置である。なお、画像取得部11は、装置の外部から画像を取得する手段(例えば、インタフェース装置や無線通信装置)であってもよいし、レンズと撮像素子を介して画像を撮像する手段であってもよい。
特徴量取得部12は、画像取得部11が取得した画像に対応する特徴量を取得する手段である。具体的には、取得した画像を構成する画素の中から、人の顔に対応する領域(顔領域)を抽出し、当該顔領域に含まれる特徴量の集合(特徴量ベクトル)を取得する。なお、特徴量取得部12が取得する特徴量は、顔領域に対応する特徴量の集合であってもよいし、顔領域に含まれる一部の画素のみに対応する特徴量の集合であってもよい。
識別部13は、入力された特徴量に基づいて、分類結果(被写体である人物の推定年齢)と、当該分類結果に対する評価値(推定年齢が、どの程度信頼できるかを表す値)を出力する手段である。より具体的には、識別部13は、複数の多クラス識別器を包含しており、当該複数の識別器が出力した結果に基づいて、単一の分類結果と、当該分類結果に対する評価値を生成する。
図2は、本実施形態に係る識別部13の構成を説明する図である。識別部13に包含される複数の識別器(識別器130A〜130P)は、それぞれ、複数のSVM(サポートベクタマシン)で構成される多クラス識別器である。SVMは2クラス識別器であるため、複数のものを組み合わせることで、多クラス識別器を実現している。これらの識別器は、教師データによって事前に学習が行われたものである。
なお、本実施形態では、SVMを組み合わせて多クラス識別器を構成したが、各識別器は、SVM以外の2クラス識別器を組み合わせることで実現してもよい。また、多クラス識別器の構成方法についても、公知の手法を採用することができる。例えば、年齢の範囲を二分する複数の2クラス識別器を用いて、二分探索によって範囲を絞り込んでいく方法を用いてもよいし、複数の2クラス識別器から取得した帰属確率に基づいて、真値を推定する方法などを用いてもよい。
また、各識別器は、それぞれ単一の多クラス識別器によって実現してもよい。
具体的なアルゴリズムとしては、複数の決定木を用いたランダムフォレスト、複数の弱識別器からなるブースティング(Boosting)、ブースティングにおいて誤分類率に応じて重みづけを行うアダブースト(AdaBoost)、これらの組み合わせなどを採用することができる。複数のクラスの中から、特徴量に対応するクラスを決定することができれば、各識別器が用いるアルゴリズムは、どのようなものであってもよい。
また、各識別器は、それぞれ異なる手法(アルゴリズム)によって識別を行うものであるか、それぞれ異なる学習データによって学習されたものであることが好ましい。
本実施形態では、識別器130A〜130Pの16個の識別器を用いて、複数の分類結果を取得し、提供年齢算出部131(識別手段)が、当該複数の分類結果に基づいて、単一の分類結果(第二の分類結果)を生成する。また、評価値算出部132(信頼度生成手段)が、当該複数の分類結果のばらつきに基づいて、当該第二の分類結果に対する信頼度を表す評価値を算出する。本実施形態では、複数の分類結果のばらつきの大きさと第二の分類結果の信頼度の大きさとが負の相関をもつように、信頼度(評価値)を算出する。例えば、複数の分類結果のばらつきを表す値(分散、標準偏差など)がそのとりうる範囲のなかで最小値となる場合に信頼度が最も大きくなり、ばらつきを表す値が最大値となる場
合に信頼度が最も小さくなり、ばらつきを表す値が最小値と最大値のあいだの値をとる場合にはばらつきを表す値の大きさに応じて信頼度が連続的または段階的に小さくなるように、評価値を算出するとよい。分類結果の生成及び評価値算出の具体的な方法については後述する。
入出力部14は、ユーザが行った入力操作を受け付け、ユーザに対して情報を提示する手段である。具体的には、タッチパネルとその制御手段、液晶ディスプレイとその制御手段から構成される。タッチパネルおよび液晶ディスプレイは、本実施形態では一つのタッチパネルディスプレイからなる。
なお、以上に説明した各手段は、専用に設計されたハードウェアによって実現されてもよいし、ソフトウェアモジュールによって実現されてもよい。また、FPGA(Field Programmable Gate Array)やASIC(Application Specific Integrated Circuit)などによって実現されてもよいし、これらの組合せによって実現されてもよい。
前述した手段がソフトウェアとして構成される場合、補助記憶装置に記憶されたプログラムが主記憶装置にロードされ、CPUによって実行されることによって各手段が機能する。(CPU、補助記憶装置、主記憶装置はいずれも不図示)
<年齢推定処理の概要>
次に、年齢推定装置10が行う年齢推定処理の概要について説明する。年齢推定装置10が行う処理は、顔画像に基づいて特徴量を取得するフェーズと、当該特徴量に基づいて、年齢を推定するフェーズに分けることができる。
(1)特徴量取得フェーズ
まず、顔画像に基づいて特徴量を取得するフェーズ(特徴量取得フェーズ)について説明する。顔画像に対応する特徴量は、特徴量取得部12が、以下の処理を実行することで取得される。
まず、特徴量取得部12は、画像取得部11から顔画像を取得し、当該顔画像から人の顔が含まれる領域(顔領域)を検出する。図3の例では、符号30が顔画像であり、符号31が検出した顔領域である。顔領域の検出は、例えば、テクスチャ情報を用いたパターンマッチングや、顔全体の輪郭に対応したテンプレートを用いたテンプレートマッチングによって行うことができる。この他、顔を構成する器官に基づいたテンプレートマッチングを行ってもよいし、顔の一部を表す領域または点を抽出し、抽出結果に基づいて顔領域を判定してもよい。この他にも、顔画像中の肌色領域を検出することで顔領域を判定してもよい。顔領域を検出する処理は、既知のどのような方法によって行われてもよい。
次に、検出した顔領域に、複数の特徴点を配置する。特徴点は、例えば、顔の器官(例えば、目、鼻、鼻孔、口、眉、顎、額など)の位置に基づいて配置される。検出対象の器官は、予め設定されたものであってもよいし、動的に決定してもよい。
そして、検出した器官の位置に基づいて、特徴点を配置する。なお、特徴点は、器官に近いほど密に、離れるほど粗に配置することが好ましい。また、対象人物の属性がある程度わかっている場合、当該属性に応じて特徴点の配置方法を変更してもよい。
次に、配置した特徴点に基づいて、特徴量を算出する。特徴量は、例えば、ガボールフィルタなどのフィルタ処理によって得られた値をもとに算出することができる。
なお、本例では、顔領域を検出した後で、特徴点を配置し、当該特徴点を用いて特徴量を算出したが、他の方法によって特徴量を取得してもよい。例えば、取得した顔領域から、直接特徴量を算出するようにしてもよい。
本フェーズによって、顔領域に対応する複数次元の特徴量(以下、特徴量ベクトル)が
得られる。
(2)年齢推定フェーズ
特徴量取得部12が取得した特徴量ベクトルは、識別部13が有する複数の識別器130A〜130Pにそれぞれ入力され、各識別器において、当該特徴量ベクトルに基づいたクラス分類が行われる。分類の結果(各識別器が出力したクラス。本実施形態では、被写体である人物の推定年齢)は、提供年齢算出部131および評価値算出部132にそれぞれ入力される。すなわち、提供年齢算出部131および評価値算出部132には、それぞれ16個の推定年齢が入力される。
図4は、16個の識別器がそれぞれ出力した推定年齢と、当該推定年齢の分布をヒストグラムで表した例である。
次に、提供年齢算出部131が、取得した複数の推定年齢に基づいて、利用者に提供する単一の推定年齢(以下、提供年齢)を算出し、出力する。具体的には、取得した複数の推定年齢の平均値を提供年齢として出力する。例えば、図4の例の場合、平均値は31.1となる。なお、提供年齢は必ずしも平均値でなくてもよい。例えば、中央値(メディア
ン)、最頻値(モード)などであってもよい。図4の例の場合、中央値は30.5、最頻
値は30.0となる。提供年齢は、各識別器から取得した複数の推定年齢に基づいて算出されたものであれば、その算出方法は特に限定されない。
次に、評価値算出部132が、取得した複数の推定年齢に基づいて評価値を算出し、出力する。評価値は、提供年齢に対する信頼度に関連付いた値であり、例えば、以下のように定義することができる。なお、σは標準偏差であり、nは2以上の整数である。
(パターン1)分散値(σ2)または標準偏差値(σ)を評価値とする。
(パターン2)パターン1を整数倍したもの、すなわち、nσ2またはnσを評価値とす
る。
(パターン3)分散値の逆数(1/σ2)または標準偏差値の逆数(1/σ)を評価値と
する。
(パターン4)パターン3を整数倍したもの、すなわち、n/σ2またはn/σを評価値
とする。
パターン1および2の場合、評価値が大きいほど信頼度が低い(提供年齢の推定精度が低い)ことを意味し、パターン3および4の場合、評価値が大きいほど信頼度が高い(提供年齢の推定精度が高い)ことを意味する。
第一の実施形態では、このうち、分散値(σ2)を評価値として用いる。分散値を評価
値とした場合、図4の例では、評価値は6.8となるが、図5のように推定年齢にばらつきがある場合、評価値は12.9となり、年齢の推定精度が低いことがかわる。
算出した評価値は、利用者にそのまま提供してもよいが、所定の範囲を取るように正規化(例えば、0〜100の範囲をとるスコアに置き換え)してもよい。図6(A)は、評価値をスコアに置き換えた場合の画面例である。評価値をスコアに変換するための手法は、特定のものに限定されない。また、そのためのデータを、例えば評価値算出部132に記憶させておいてもよい。
<処理フローチャート>
図6は、本実施形態に係る年齢推定装置10が行う年齢推定処理のフローチャートである。当該処理は、利用者の操作(例えば、記憶された画像を読み込む操作)によって開始される。
まず、ステップS11で、画像取得部11が顔画像を取得する。本実施形態では、予め記憶されている画像を記憶装置から取得するが、通信手段や撮像手段を介して画像を取得してもよい。
次に、ステップS12で、特徴量取得部12が、前述した処理によって、当該顔画像から特徴量ベクトルを取得する。
ステップS13では、識別部13が、特徴量取得部12によって取得された特徴量ベクトルを、各識別器に入力する。
次に、ステップS14で、提供年齢算出部131が、各識別器から出力された推定年齢を取得して、平均値を算出し、提供年齢とする。
次に、ステップS15で、評価値算出部132が、各識別器から出力された推定年齢を取得して、分散値を算出し、評価値とする。
そして、ステップS16で、入出力部15が、提供年齢と評価値(または、評価値に基づいて生成したスコア)を、画面を通して利用者に提供する。
以上説明したように、第一の実施形態に係る年齢推定装置は、複数の多クラス識別器を用いてクラスの分類を行い、複数の分類結果に基づいて、単一の推定年齢と、当該推定年齢に対する評価値を生成し、提示する。これにより利用者は、表示された推定年齢がどの程度信頼できる値であるかを把握することができる。
(第二の実施形態)
第二の実施形態は、識別部13が有する各識別器の出力に重みを付したうえで、提供年齢および評価値を算出する実施形態である。
第二の実施形態に係る年齢推定装置の構成は、第一の実施形態と同様であるため、詳細な説明は省略し、処理の相違点のみを説明する。
第二の実施形態では、提供年齢算出部131が提供年齢を算出する際、および、評価値算出部132が評価値を算出する際に、識別器ごとに重みを乗算したうえで処理を行う。
各識別器に与える重みは、当該識別器の精度に対応させることが好ましい。具体的には、識別器の精度がよいほど重みを大きくし、精度が悪いほど重みを小さくする。例えば、学習に用いたデータの数が多いほど、精度が良い識別器であるとみなし、重みを大きくしてもよい。また、予め正解がわかっている評価用のデータを用いてテストを行い、成績が良い識別器であるほど重みを大きくしてもよい。
この他にも、ランダムフォレストを用いる場合、木の深さによって、識別器の精度の良し悪しを推定してもよい。例えば、木が浅い場合と比較して、木が深い場合において、より重みを大きくしてもよい。
第二の実施形態では、このように、識別器の精度に応じた重みを用いることで、提供年齢および評価値の算出精度を向上させることができる。なお、本実施形態では、提供年齢の算出と、評価値の算出のそれぞれにおいて同一の重みを用いるが、重みはそれぞれ異なってもよい。また、いずれか片方の処理においてのみ重みを用いてもよい。
(変形例)
上記の実施形態はあくまでも一例であって、本発明はその要旨を逸脱しない範囲内で適宜変更して実施しうる。
例えば、各実施形態では、年齢を推定する装置の例を挙げたが、推定の対象は、性別、顔向き(カメラに対する顔の方位角や仰角)、視線の方向、特定の表情の度合い(例えば、喜び、怒り、悲しみ、驚き、恐怖、嫌悪、無表情)などであってもよいし、これ以外であってもよい。
また、実施形態の説明では、分類結果を数値で出力する識別器の例を挙げたが、識別器は、直接数値を出力するものでなくてもよい。ただし、分散や標準偏差を算出する必要があるため、このような場合、分類結果を数値に置き換える処理を追加する必要がある。
また、各実施形態では、識別部13が有する複数の識別器に、特徴量取得部12が取得した特徴量ベクトルがそれぞれ入力されるものとしたが、各識別器は、当該特徴量ベクトルに含まれる全ての次元を用いて識別を行う必要はない。例えば、各識別器において特徴量ベクトルをフィルタリングし、所定の次元の特徴量のみを用いて識別を行うようにしてもよい。
また、特徴量取得部12が、異なる方法を用いて複数の特徴量ベクトルを取得し、識別器ごとに異なる特徴量ベクトルを入力するようにしてもよい。
また、各実施形態では、評価値あるいはスコアを用いて信頼度を提示する例を挙げたが、評価値を、年齢に対する誤差(±n歳)という形式に変換し、提示してもよい。例えば、評価値と誤差との関係をテーブルや数式によって保持し、当該情報を用いて、具体的な年齢の範囲を求めるようにしてもよい。図6(B)は、評価値を年齢に対する誤差に置き換えた場合の画面例である。
また、評価値を算出するための分散値または標準偏差値は、一般的に、各識別器が出力した推定年齢の平均値を用いて求めるが、平均値のかわりに中央値または最頻値を用いてもよい。すなわち、中央値または最頻値との差の二乗和を用いて求めてもよい。
また、各実施形態では、画面を通して提供年齢および評価値を利用者に提示する装置を挙げたが、入出力部のかわりに通信手段を設け、提供年齢および評価値を他の装置に送信する構成としてもよい。
また、各実施形態では、単一の画像を入力データとして年齢の推定を行ったが、入力データとなる画像は、動画のフレームに対応するものであってもよい。また、音声やその他のバイナリデータなどであってもよい。特徴量を算出することができれば、対象はどのようなものであってもよい。
また、各実施形態では、信頼度に関連する値である評価値を定義し、ばらつきと評価値との関係として、パターン1〜4を例示したが、各識別器が分類を行った結果のばらつきに基づいて信頼度を決定することができれば、他の方法を採用してもよい。
10 年齢推定装置
11 画像取得部
12 特徴量取得部
13 識別部
130A〜P 識別器
131 提供年齢算出部
132 評価値算出部
14 入出力部

Claims (8)

  1. 入力データを取得するデータ取得手段と、
    前記入力データに対応する特徴量を取得する特徴量取得手段と、
    入力された特徴量に基づいてクラス分類を行う複数の識別器と、
    前記取得した特徴量を、前記複数の識別器にそれぞれ入力し、得られた複数の分類結果に基づいて、単一の分類結果である第二の分類結果を生成する識別手段と、
    前記複数の分類結果のばらつきに基づいて、前記第二の分類結果に対する信頼度を生成する信頼度生成手段と、
    を有し、
    前記識別器は多クラス識別器であり、分類結果のクラスに対応する値であるクラス値を出力し、
    前記信頼度生成手段は、
    複数の前記識別器が出力したクラス値の中央値または最頻値を用いて、前記複数の識別器が出力したクラス値の分散または標準偏差を求め、
    前記分散または前記標準偏差に基づいて、前記第二の分類結果に対する信頼度を生成する
    ことを特徴とする、識別装置。
  2. 前記複数の識別器の精度をそれぞれ評価する評価手段をさらに有し、
    前記識別手段または信頼度生成手段は、前記評価の結果に基づいて、前記複数の分類結果に対して重み付けを行ったうえで、前記第二の分類結果または信頼度を生成する
    ことを特徴とする、請求項1に記載の識別装置。
  3. 前記評価手段は、テストデータを用いて各識別器の精度をそれぞれ評価する
    ことを特徴とする、請求項に記載の識別装置。
  4. 前記評価手段は、前記複数の識別器を学習した際の学習サンプル数に基づいて、各識別器の精度を評価する
    ことを特徴とする、請求項に記載の識別装置。
  5. 前記入力データは画像である
    ことを特徴とする、請求項1からのいずれか1項に記載の識別装置。
  6. 前記識別器が分類を行う対象は、画像に含まれる人物の属性または状態の少なくともいずれかである
    ことを特徴とする、請求項に記載の識別装置。
  7. 入力された特徴量に基づいてクラス分類を行う複数の識別器を有する識別装置の制御方法であって、
    入力データを取得するデータ取得ステップと、
    前記入力データに対応する特徴量を取得する特徴量取得ステップと、
    前記取得した特徴量を、前記複数の識別器にそれぞれ入力し、得られた複数の分類結果に基づいて、単一の分類結果である第二の分類結果を生成する識別ステップと、
    前記複数の分類結果のばらつきに基づいて、前記第二の分類結果に対する信頼度を生成する信頼度生成ステップと、
    を含み、
    前記識別器は多クラス識別器であり、分類結果のクラスに対応する値であるクラス値を出力し、
    前記信頼度生成ステップでは、
    複数の前記識別器が出力したクラス値の中央値または最頻値を用いて、前記複数の識別器が出力したクラス値の分散または標準偏差を求め、
    前記分散または前記標準偏差に基づいて、前記第二の分類結果に対する信頼度を生成する
    ことを特徴とする、識別装置の制御方法。
  8. 請求項に記載の識別装置の制御方法の各ステップをコンピュータに実行させるプログラム。
JP2014181638A 2014-09-05 2014-09-05 識別装置および識別装置の制御方法 Active JP6361387B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2014181638A JP6361387B2 (ja) 2014-09-05 2014-09-05 識別装置および識別装置の制御方法
EP15181490.2A EP2993624A3 (en) 2014-09-05 2015-08-19 Identification apparatus and method for controlling identification apparatus
KR1020150116547A KR101725651B1 (ko) 2014-09-05 2015-08-19 식별 장치 및 식별 장치의 제어 방법
CN201510535915.7A CN105404848A (zh) 2014-09-05 2015-08-27 识别装置以及识别装置的控制方法
US14/840,109 US9691007B2 (en) 2014-09-05 2015-08-31 Identification apparatus and method for controlling identification apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014181638A JP6361387B2 (ja) 2014-09-05 2014-09-05 識別装置および識別装置の制御方法

Publications (2)

Publication Number Publication Date
JP2016057701A JP2016057701A (ja) 2016-04-21
JP6361387B2 true JP6361387B2 (ja) 2018-07-25

Family

ID=53938168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014181638A Active JP6361387B2 (ja) 2014-09-05 2014-09-05 識別装置および識別装置の制御方法

Country Status (5)

Country Link
US (1) US9691007B2 (ja)
EP (1) EP2993624A3 (ja)
JP (1) JP6361387B2 (ja)
KR (1) KR101725651B1 (ja)
CN (1) CN105404848A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7402931B2 (ja) 2021-09-30 2023-12-21 コニカ ミノルタ ビジネス ソリューションズ ユー.エス.エー., インコーポレイテッド 方法、コンピュータ可読プログラムおよびシステム

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI618562B (zh) * 2016-04-27 2018-03-21 寶凱電子企業股份有限公司 具影像資料判斷功能之遊戲機
KR101931128B1 (ko) 2017-01-25 2018-12-20 한국과학기술원 사물 인터넷 환경에서 디바이스의 신뢰도를 평가하는 방법과 장치, 및 컴퓨터 판독가능 매체
JP6583316B2 (ja) * 2017-03-08 2019-10-02 カシオ計算機株式会社 識別装置、識別方法及びプログラム
JP6785181B2 (ja) * 2017-04-12 2020-11-18 株式会社日立製作所 物体認識装置、物体認識システム、及び物体認識方法
CN108985133B (zh) * 2017-06-01 2022-04-12 北京中科奥森数据科技有限公司 一种人脸图像的年龄预测方法及装置
JP6897360B2 (ja) 2017-06-21 2021-06-30 オムロン株式会社 制御装置、制御プログラムおよび制御システム
US10502443B2 (en) 2017-07-18 2019-12-10 Ademco Inc. Smart human machine interface
CN108108668B (zh) * 2017-12-01 2021-04-27 北京小米移动软件有限公司 基于图像的年龄预测方法及装置
JP2019215747A (ja) * 2018-06-13 2019-12-19 富士ゼロックス株式会社 情報処理装置及びプログラム
CN109086680A (zh) * 2018-07-10 2018-12-25 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质和电子设备
US10747989B2 (en) * 2018-08-21 2020-08-18 Software Ag Systems and/or methods for accelerating facial feature vector matching with supervised machine learning
EP3951709A4 (en) * 2019-03-29 2022-09-07 Sony Group Corporation INFORMATION PROCESSING DEVICE AND INFORMATION PROCESSING METHOD
CN111209977B (zh) * 2020-01-16 2024-01-05 北京百度网讯科技有限公司 分类模型的训练和使用方法、装置、设备和介质
CN115552460A (zh) * 2020-05-22 2022-12-30 富士胶片株式会社 图像数据处理装置及图像数据处理系统
JP2021196711A (ja) * 2020-06-10 2021-12-27 日立造船株式会社 情報処理装置、判定方法、および情報処理プログラム
CN113095388B (zh) * 2021-04-01 2023-06-30 福建师范大学 基于双层分类算法的固废塑料材质识别方法
JP7251590B1 (ja) 2021-10-07 2023-04-04 株式会社Sumco 機械学習の評価方法及び機械学習による推定モデルの生成方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5287333A (en) 1976-01-17 1977-07-21 Agency Of Ind Science & Technol Multi-dimensional irregular signal generator
DE19955919C1 (de) * 1999-11-20 2001-05-31 Daimler Chrysler Ag Verfahren zur Erkennung von Objekten in Bildern auf der Bildpixelebene
JP2006048322A (ja) * 2004-08-04 2006-02-16 Seiko Epson Corp オブジェクト画像検出装置、顔画像検出プログラムおよび顔画像検出方法
US7742641B2 (en) * 2004-12-06 2010-06-22 Honda Motor Co., Ltd. Confidence weighted classifier combination for multi-modal identification
US7720289B2 (en) * 2005-12-14 2010-05-18 Mitsubishi Electric Research Laboratories, Inc. Method for constructing covariance matrices from data features
JP4273359B2 (ja) * 2007-09-28 2009-06-03 Necソフト株式会社 年齢推定システム及び年齢推定方法
JP5287333B2 (ja) * 2008-02-25 2013-09-11 オムロン株式会社 年令推定装置
JP5218139B2 (ja) * 2009-02-19 2013-06-26 株式会社デンソー 血圧測定装置及びプログラム並びに記録媒体
US8140450B2 (en) * 2009-03-27 2012-03-20 Mitsubishi Electric Research Laboratories, Inc. Active learning method for multi-class classifiers
JP5257274B2 (ja) * 2009-06-30 2013-08-07 住友電気工業株式会社 移動体検出装置、移動体検出方法及びコンピュータプログラム
US8644624B2 (en) * 2009-07-28 2014-02-04 Samsung Electronics Co., Ltd. System and method for indoor-outdoor scene classification
EP2487646A4 (en) * 2009-10-05 2015-04-01 Fujitsu Ltd DEVICE FOR PROCESSING BIOINFORMATION, METHOD FOR PROCESSING BIOINFORMATION PROCESSING METHOD AND COMPUTER PROGRAM FOR PROCESSING BIOINFORMATION
US8594385B2 (en) * 2011-04-19 2013-11-26 Xerox Corporation Predicting the aesthetic value of an image
JP5320443B2 (ja) * 2011-07-19 2013-10-23 富士フイルム株式会社 高速判別装置および高速判別装置を高速化する方法、並びに高速判別装置プログラム
US8498491B1 (en) * 2011-08-10 2013-07-30 Google Inc. Estimating age using multiple classifiers
US9031293B2 (en) 2012-10-19 2015-05-12 Sony Computer Entertainment Inc. Multi-modal sensor based emotion recognition and emotional interface

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7402931B2 (ja) 2021-09-30 2023-12-21 コニカ ミノルタ ビジネス ソリューションズ ユー.エス.エー., インコーポレイテッド 方法、コンピュータ可読プログラムおよびシステム

Also Published As

Publication number Publication date
KR20160029655A (ko) 2016-03-15
EP2993624A2 (en) 2016-03-09
US9691007B2 (en) 2017-06-27
CN105404848A (zh) 2016-03-16
KR101725651B1 (ko) 2017-04-10
US20160070987A1 (en) 2016-03-10
JP2016057701A (ja) 2016-04-21
EP2993624A3 (en) 2016-04-27

Similar Documents

Publication Publication Date Title
JP6361387B2 (ja) 識別装置および識別装置の制御方法
US10699102B2 (en) Image identification apparatus and image identification method
De Marsico et al. Robust face recognition for uncontrolled pose and illumination changes
JP6664163B2 (ja) 画像識別方法、画像識別装置及びプログラム
JP6041996B2 (ja) 視覚的属性を修正する装置、システム及び方法
US9639779B2 (en) Feature point detection device, feature point detection method, and computer program product
JP5424819B2 (ja) 画像処理装置、画像処理方法
US8498454B2 (en) Optimal subspaces for face recognition
JP2022501729A (ja) 顔写真に基づくリスク認識方法、装置、コンピュータ設備および記憶媒体
US9858501B2 (en) Reliability acquiring apparatus, reliability acquiring method, and reliability acquiring program
JP5241606B2 (ja) オブジェクト識別装置及びオブジェクト識別方法
US9779286B2 (en) Feature point location estimation device, feature point location estimation method, and feature point location estimation program
CN110688941A (zh) 人脸图像的识别方法及其装置
JP6287827B2 (ja) 情報処理装置、情報処理方法、及びプログラム
KR101796027B1 (ko) 얼굴 영상 기반 성별 인식 방법 및 장치
WO2017167313A1 (zh) 一种表情识别方法及装置
Sanil et al. 2d-3d facial image analysis for identification of facial features using machine learning algorithms with hyper-parameter optimization for forensics applications
Mangla et al. Sketch-based facial recognition: a weighted component-based approach (WCBA)
CN113436735A (zh) 基于人脸结构度量的体重指数预测方法、设备和存储介质
WO2023068956A1 (ru) Способ и система для определения синтетически измененных изображений лиц на видео
JP6397439B2 (ja) 属性推定装置
JP2018200592A (ja) 顔認証装置、顔認証方法、及びプログラム
Appati et al. On the selection of appropriate kernel function for svm in face recognition
Baluni et al. Automatic Face Naming Using Image Processing: A Review Study Based on Face Name Detection in Images or Videos
NARAYANA et al. Robust Face Recognition for Uncontrolled Pose and Illumination Changes Identification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180529

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180611

R150 Certificate of patent or registration of utility model

Ref document number: 6361387

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250