JP5588180B2 - パターン識別装置及びその制御方法 - Google Patents

パターン識別装置及びその制御方法 Download PDF

Info

Publication number
JP5588180B2
JP5588180B2 JP2010007445A JP2010007445A JP5588180B2 JP 5588180 B2 JP5588180 B2 JP 5588180B2 JP 2010007445 A JP2010007445 A JP 2010007445A JP 2010007445 A JP2010007445 A JP 2010007445A JP 5588180 B2 JP5588180 B2 JP 5588180B2
Authority
JP
Japan
Prior art keywords
identification
data
unit
pattern
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010007445A
Other languages
English (en)
Other versions
JP2011145958A (ja
Inventor
博 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010007445A priority Critical patent/JP5588180B2/ja
Priority to US12/986,051 priority patent/US8626782B2/en
Publication of JP2011145958A publication Critical patent/JP2011145958A/ja
Application granted granted Critical
Publication of JP5588180B2 publication Critical patent/JP5588180B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding

Description

本発明は、識別対象のパターンの追加登録が可能なパターン識別装置及びその制御方法に関する。
パターン認識における識別技術、典型的には、画像データ中の被写体であるオブジェクトが、別の画像中の被写体であるオブジェクトと同一のものであると識別する技術として、例えば、個人の顔を識別する顔識別技術がある。以下、本明細書では、パターンの識別とは、パターンの個体の違い(例えば、個人としての人物の違い)を判定することを意味する。一方、パターンの検出とは、個体を区別せず同じ範疇に入るものを判定する(例えば、個人を区別せず、顔を検出する)ことを意味するものとする。
顔識別技術として、例えば非特許文献1のような方法がある。これは、顔による個人の識別問題を、差分顔と呼ばれる特徴クラスの2クラス識別問題に置き換えることによって、顔の登録・追加学習をリアルタイムに行うことを可能にしたアルゴリズムである。
例えば、一般によく知られているサポートベクターマシン(SVM)を用いた顔識別では、n人分の人物の顔を識別するために、登録された人物の顔と、それ以外の顔を識別するn個のSVM識別器が必要になる。人物の顔を登録する際には、SVMの学習が必要となる。SVMの学習には、登録したい人物の顔と、既に登録されている人物とその他の人物の顔データが大量に必要で、非常に計算時間がかかるため、予め計算しておく手法が一般的であった。
しかし、非特許文献1の方法によれば、個人識別の問題を、次に挙げる2クラスの識別問題に置き換えることよって、追加学習を実質的に不要にすることが出来る。即ち、intra-personal class:同一人物の画像間の、照明変動、表情・向きなどの変動特徴クラスextra-personal class:異なる人物の画像間の、変動特徴クラスの2クラスである。上記2クラスの分布は、特定の個人によらず一定であると仮定して、個人の顔識別問題を、上記2クラスの識別問題に帰着させて識別器を構成する。予め、大量の画像を準備して、同一人物間の変動特徴クラスと、異なる人物間の変動特徴クラスの識別を行う識別器を学習する。新たな登録者は、顔の画像(若しくは顔の画像から必要な特徴を抽出した結果)のみを保持すればよい。識別する際には2枚の画像から差分特徴を取り出し、上記識別器で、同一人物なのか異なる人物なのかを判定する。これにより、個人の顔登録の際にSVMなどで必要とされていた大量の学習が不要になり、リアルタイムでオブジェクトの登録を行うことが出来る。
ところで、追加学習が不要なアルゴリズムであっても、識別性能を向上させる上で追加学習が有効な方法であることには変わりがない。例えば、上述のような2クラスの識別問題として識別を行う構成であっても、新たな登録画像を正しく識別できるように識別パラメータを調整する追加学習により、識別性能を向上させることができる。ユーザによって登録されたデータに特化して識別パラメータを調整し、識別性能を向上させる追加学習の導入は、寧ろ以前より要求が高まってきているといえる。例えば、人物の顔を用いた個人認識において、前述のような変動へのロバスト性向上を優先すると、似た人物の識別性能の劣化を招く場合がある。デジタルカメラなどコンシューマ機器では、親子や兄弟など、特に似た人物が登録される場合が多くなる。変動へのロバスト性を維持しつつ、似た人物間の識別性能を向上させるために、追加学習が有効な手段として考えられている。追加学習を行うことによって、ユーザが登録した人物、特に似た人物の識別に特化したパラメータを生成し、識別性能を向上させることが期待できる。
Baback Moghaddam, Beyond Eigenfaces :Probabilistic Matching for Face Recognition (M.I.T Media Laboratory Perceptual Computing Section Technical Report No.433), Probabilistic Visual Learning for Object Representation (IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 19, No. 7, JULY 1997)
しかしながら、複数の装置を有するユーザが識別性能を向上させるために個々の装置で追加学習を行うと、装置毎に追加学習の内容が異なってしまい、装置毎に識別性能が異なってくることがある。また、ユーザが複数の装置で同等の識別性能を持たせることを望む場合、装置間で登録された識別対象に対する識別結果を同じにするためには装置毎に当該識別対象を用いた追加学習を行うことが必要となり、ユーザに過大な負荷がかかるとともに、多くの学習時間を費やしてしまう。
本発明は、上記課題に鑑みてなされたものであり、他の装置との間で追加学習の結果を共有することを可能とし、追加学習に要する手間、時間を削減することを目的とする。
上記の目的を達成するための本発明の一態様によるパターン識別装置は以下の構成を備える。すなわち、
参照パターンのデータまたはその特徴量を含む登録データと、入力データと前記登録データとを比較するための処理内容を規定する識別パラメータとを用いて、前記入力データに存在するパターンを識別するパターン識別装置であって、
登録データと識別パラメータとをラベルに関連付けて保持する保持手段と、
外部装置で生成された登録データと識別パラメータとラベルを取得する取得手段と、
他の機種のそれぞれとの間で共有可能な識別パラメータの種類を示す互換性情報と前記外部装置の機種とを参照して、前記取得手段により取得した識別パラメータのうち共有可能な種類の識別パラメータを判定する判定手段と、
前記取得手段により取得した識別パラメータのうち前記判定手段により共有可能でないと判定された種類の識別パラメータをデフォルト値または追加学習により補完する補完手段と、
前記取得手段で取得した登録データと、前記取得手段により取得された識別パラメータのうち前記判定手段により共有可能と判定された種類の識別パラメータ及び前記補完手段により補完された識別パラメータとを、前記取得手段で取得したラベルに関連付けて前記保持手段に追加する追加手段とを備える
本発明によれば、他の装置との間で追加学習の結果を共有することが可能となり、追加学習に要する手間、時間を削減することができる。
パターン識別装置を適用したデジタルカメラの構成例を示すブロック図。 実施形態に係るパターン識別装置の処理フロー図。 入力データ識別部の構成例を示すブロック図。 入力データ識別部の処理例を示すフロー図。 (a)は第1実施形態によるデータ登録部の構成例を示すブロック図、(b)第2実施形態によるデータ登録部の構成例を示すブロック図。 データ共有処理部の構成例を示すブロック図。 登録データ/識別パラメータ共有処理の例を示すフロー図。 (a)は互換性確認部の構成例を表すブロック図、(b)は互換性情報保持部が保持する互換性情報テーブルの例を示す図。 第2実施形態による識別パラメータ共有処理の例を示すフロー図。
以下、添付の図面を参照して本発明の第1の実施形態を詳細に説明する。
[第1実施形態]
<パターン識別装置の構成>
図1は、第1実施形態によるパターン識別装置が適用されたデジタルカメラ100の構成例を示すブロック図である。なお、本実施形態では、パターン識別装置をデジタルカメラに適用した例を説明するがこれに限られるものではなく、パーソナルコンピュータ等の情報処理装置に適用できることは明らかである。
デジタルカメラ100において、結像光学系1は、ズーム機構を備えた光学レンズで構成される。また、パン・チルト軸方向の駆動機構を備えてもよい。撮像部2の映像センサとしては、典型的にはCCDまたはCMOSイメージセンサが用いられる。撮像部2は、不図示のセンサ駆動回路からの読み出し制御信号にしたがって所定の映像信号(例えば、サブサンプリング、ブロック読み出しして得られる信号)を画像データとして出力する。撮像制御部3は、撮影者からの指示(画角調整指示、シャッター押下、など)および、データ登録部5または入力データ識別部6からの情報を元に、実際に撮影が行われるタイミングを制御する。画像記録部4は、半導体メモリ等で構成され、撮像部2から転送された画像データを保持する。また、画像記録部4は、データ登録部5、入力データ識別部6からの要求に応じて、所定のタイミングで、画像データを転送する。
データ登録部5は、典型的には画像データから、識別の対象とするオブジェクトの情報を抽出し、記録・保持する。データ登録部5のより詳細な構成および実際に行われる処理の具体的な内容については、後で述べることにする。入力データ識別部6は、入力データおよびデータ登録部5から取得したデータを元に、対象オブジェクト、より典型的には、画像データ中のオブジェクトの識別を行う。入力データ識別部6に関しても、具体的な構成および行われる処理の詳細については、後で詳しく説明する。なお、データ登録部5、入力データ識別部6は、それぞれ専用回路(ASIC)、プロセッサ(リコンフィギュラブルプロセッサ、DSPなど)であってもよい。また、単一の専用回路および汎用回路(PC用CPU)内部において実行されるプログラムとして存在してもよい。
外部入出力部7は、外部装置との間でデータを交換するのに用いられる。典型的には、コンパクトフラッシュ(登録商標)などの外部記憶装置を用いて外部装置との間でデータを交換することが考えられる。また、ネットワーク装置を介して入出力を行うようにしても良いし、外部装置との直接的な接続(例えばUSB等の有線接続や、Bluetooth、赤外線通信等の無線接続)を利用しても良い。外部入出力部7は、データ登録部5、入力データ識別部6の結果出力を電子データとして、外部装置との間で入出力する。データ登録部5とのデータ入出力については、あとで詳しく説明する。また、識別結果の出力として、外部入出力部7にCRTやTFT液晶などのモニタを含むようにしても良い。撮像部2および画像記録部4から取得した画像データを表示、または、画像データにデータ登録部5、入力データ識別部6の結果出力を重畳表示する。
また、ユーザは、操作部8を介してデータの登録動作を行うためのモード設定や、登録データに関する操作を含む各種操作を行うことができる。接続バス9は、上記構成要素間の制御・データ接続を行うためのバスである。
<全体フロー>
図2は、本実施形態におけるパターン識別装置の全体処理の一例を示したものである。以下、図2を参照しながら、パターン識別装置が、入力パターンの識別を行う際の処理について説明する。以下に説明するように、パターン識別装置は、入力データに存在するパターンを識別するにおいて、参照パターンを表す登録データと、入力データと登録データとを比較するための処理内容を規定する識別パラメータを用いる。登録データは、例えば、参照パターンの全体のデータ、局所領域のデータ、特徴量などのいずれかを含む。なお、以下では、識別するパターン(識別対象のパターン)が、画像中のオブジェクト、より具体的には、人物の顔である場合について説明するが、本発明がこれに限るものでないことは、言うまでもない。すなわち、文字画像データや音声データなど種々のものが、本発明に適用できる。
まず、入力データ識別部6は、画像記録部4から画像データを取得する(S00)。続いて、入力データ識別部6は、取得した画像データに対して、対象オブジェクトの検出、具体的には人の顔の検出処理を行う(S01)。画像中から、人物の顔を検出する方法については、公知の技術を用いればよい。例えば、特許第3078166号公報や特開2002−8032号公報で提案されているような技術を用いることが出来る。人物の顔以外を検出する場合でも、前述の技術を用いて、所望のオブジェクトを訓練データとすることにより、検出が可能である。
入力画像中に、対象オブジェクトが存在しなければ(S02でNoの場合)、処理を終了する。一方、入力画像中に対象パターンが存在する場合(S02でYesの場合)、入力データ識別部6は処理モードが登録モードであるか識別モードであるかの判定を行う(S03)。登録モードか識別モードかは、操作部8を用いることによりユーザが予め設定しておくことができる。登録モードであると判定された場合(S03でYesの場合)、データ登録部5がデータ登録処理を行う(S04)。データ登録処理の具体的な内容は、後で詳しく説明する。識別モードであった場合(S03でNoの場合)は、入力データ識別部6が入力データの識別処理を行う(S05)。入力データ識別処理についても、後述する。最後に、データ登録処理または入力データ識別処理の結果が外部入出力部7に出力される(S06)。以上が、本実施形態にかかるパターン識別装置の全体処理である。
<入力データ識別部6について>
入力データ識別部6による入力データ識別処理(S05)について説明する。図3は、入力データ識別部6の詳細な一構成例を示したブロック図である。入力データ識別部6において、識別用データ生成部21は、識別パラメータ保持部24に保持されている識別パラメータを用いて、画像記録部4から取得した画像データから、対象オブジェクトの識別に必要な情報を抽出する。登録データ取得部22は、データ登録部5より、入力データの識別に必要な登録データを取得する。入力データ識別演算部23は、識別用データ生成部21が取得した識別用データと、登録データ取得部22が取得した登録データとを用いて、入力データの識別処理を行う。識別パラメータ保持部24は、識別処理の際に使用される各種パラメータを保持する。すなわち、識別パラメータ保持部24は、識別のために、入力データ(画像データ)と登録データとを比較するための処理内容を規定する識別パラメータを保持する。なお、識別パラメータ保持部24に、データ登録部5での処理結果(すなわち登録データ)を格納するようにしても良い。識別パラメータは、登録データに固有のパラメータとして、登録データごとに、すなわち、登録データのラベル情報とともに格納される。こうして、登録データと識別パラメータはラベルに関連付けて保持されることになる。
図4は、入力データ識別部6による識別処理の一例を示したフロー図である。まず、登録データ取得部22は、データ登録部5から登録データを取得する(S10)。登録データは、典型的には、入力画像から対象となるオブジェクトを切り出したあとに、傾きなどを補正し、所定の大きさに拡大または縮小した正規化画像である。また、あらかじめ後述の識別用データ生成処理と同様の処理を施しておき、特徴量を抽出したものを登録データとしてもよい。この処理については、データ登録部5の説明で改めて述べる。識別用データ生成部21は、画像記録部4より処理対象の入力データ(本例では入力画像)を取得する(S11)。続いて、識別用データ生成部21は、識別パラメータ保持部24から識別用のパラメータ(以下、識別パラメータ)を取得する(S12)。ここで、識別パラメータとは、典型的には後述する特徴量の抽出方法や、次元圧縮の次元数、などを含む。
次に、識別用データ生成部21は、処理対象の入力データと識別パラメータを用いて識別用データ生成処理を行う(S13)。なお、登録データが画像である場合は、ここで入力画像だけでなく、登録データについても識別用データ生成処理を行う。識別用データ生成処理において、識別用データ生成部21は、入力データから対象オブジェクト(典型的には人の顔)を切り出し、所定の大きさや回転方向の正規化を施した後、識別パラメータにしたがって特徴量の抽出を行う。ここで、例えば、画像の輝度をそのまま用いて特徴量を算出するようにしても良いが、変動に対してより頑健な特徴量として、輝度に対して、Local Binary Pattern や増分符号などへの変換を施したものを用いてもよい。また、特徴量に対して、主成分分析法(PCA: Principal Component Analysis)や独立成分分析法(ICA: Independent Component Analysis)によって、特徴ベクトルの次元を削減したものを新たな特徴量として用いてもよい。また、特徴量を部分的な領域を設定した後に抽出するようにしても良い。以下、この部分的な領域を局所領域と呼ぶ。例えば、対象オブジェクトが人物の顔である場合、顔の目や口の周りなど、個人の特徴の現れやすいところに局所領域を設定し、上記のような変換を施した後、特徴量として抽出するようにしても良い。局所領域をいくつ用いるか、局所領域を何処に設定するかなどは、全て識別パラメータとして、識別パラメータ保持部24に予め保持されている。
続いて、入力データ識別演算部23は、S10で取得した登録データとS11で取得した入力データから得られた識別用データ(S13で得られた特徴量)についてマッチング処理を行う(S14)。マッチング処理は、典型的には、登録データと入力データそれぞれから抽出した特徴ベクトルの相関演算を行う。登録データが複数ある場合には、それらすべてとの総当たりで行う。相関演算は、単純な内積でもよいし、相関係数を求めてもよい。
例えば、前述のような局所領域を設定して特徴抽出を行った場合は、入力データと登録データの両者で対応する局所領域同士の特徴量のマッチングを行う。マッチングの結果は、局所領域の数だけ得られることになるが、最終的な出力には、それら複数の値を平均すればよい。単純な平均ではなく、予め学習などで求めた重み付け平均をとっても良い。このように、局所的なマッチングを行うことによって、照明変動や顔の一部が隠れてしまうなどの変動に対して頑健になることが知られている。
また、マッチング処理の出力として、登録データとの一致をバイナリ(0または1)で出力する場合と、正規化した出力値(0〜1の実数値)を尤度として出力する場合が考えられる。さらに登録データ(登録者)が複数(複数人)ある場合には、それぞれの登録データ(登録者)に対して、尤度を出力しても良い。また、最も良く一致した登録データに対する結果だけを出力するようにしても良い。他に、個々の登録データに対する尤度ではなく、登録データが属するクラスに対しての尤度を出力するようにしてもよい。すなわち、人物の場合には、個々の登録顔画像への結果ではなく、人物のID(名前)に対する尤度を出力するようにする。
以上が、入力データ識別部6における処理フロー例の説明である。
<データ登録部5>
次に、データ登録部5によるデータ登録処理について説明する。図5の(a)は、第1実施形態によるデータ登録部5の詳細な構成例を示したブロック図である。データ登録部5において、登録データ生成部31は、画像記録部4から取得した画像データから対象オブジェクトの個体を識別するために必要な登録データを生成する。例えば、非特許文献1にあるようなintra-classおよびextra-classの2クラス問題を判別する場合は、典型的には、人物の顔画像を登録データとすればよい。また、顔検出処理によって検出された人物の顔画像データを、大きさや向き(面内回転方向)などを正規化したのち、登録データ保持部32に格納するようにする。この際、登録画像に対して、ユーザが操作部8などを通じて設定したラベル情報も一緒に登録データ保持部32に記録される。なお、画像データそのものではなく、識別時に必要なデータのみを登録データとして登録データ保持部32に保持するようにすることによって、データ量を削減することも出来る。例えば、当該オブジェクトの局所領域のベクトル相関をとって識別演算を行う場合、データ登録部5は予めその局所領域のみを切り出して、登録データとして保持しておけばよい。
以上のように、登録データ生成部31は、適宜必要な情報を画像から抽出し、上述したような所定の変換を行って得られたデータを、オブジェクトの識別を行うための特徴ベクトルとして、登録データ保持部32に格納する。
学習部34は、登録データ生成部31から登録データを受け取って、登録データの識別性能が向上するように追加学習を行う。例えば、入力データ識別部6の説明で述べた、局所領域を設定して識別を行う方式を採用する場合、その局所領域の数、局所領域の特徴ベクトルの次元圧縮方法および次元数、などを登録データごとに学習する。学習部34による学習の方法には、公知の技術を用いることができる。例えば、前述の局所領域ごとにマッチングをとる方法の場合、局所領域とそのパラメータの組み合わせを1つの弱判別器とみなし、AdaBoostなどに代表されるブースティングの手法を適用することができる。学習データには、最も単純には、登録データを用いればよい。すなわち、すでに登録済みの登録データとこれから登録するデータを用いて、追加学習を行う。また、追加学習用に予め学習専用のデータを保持しておいても良い。このようにして、追加学習したパラメータは、識別パラメータ保持部24に格納するようにする。
登録データ選択部33は、前述の入力データ識別部6の要求に応じて、登録データ保持部32から必要な登録データを読み出して、入力データ識別部6に登録データを転送する。データ共有処理部35は、外部入出力部7などを介して、他の機器との登録データおよび登録データ識別パラメータの共有を行うための処理を担う。以下、データ共有処理部35の処理の詳しい内容について説明する。
<データ共有処理部35>
データ共有処理部35で行われる処理について説明する。図6は、データ共有処理部35の構成例を示したブロック図である。データ共有処理部35において、登録データ共有部41は、登録データを共有するための処理を行う。例えば、パターン識別のための画像データを他の装置との間で共有する処理を行う。登録データ共有部41は、ラベル情報と画像データ(登録データ)のペアを、外部入出力部7を介して取得し、すでに保持している登録データと比較する。この比較の結果、保持していないラベル情報を持つ登録データに関しては、それを登録データ保持部32にコピーして格納する。他方、すでに同一のラベルが登録されている場合は、所定の基準にしたがって、格納を行うか判定する。所定の基準としては、例えば、同一ラベルに対する登録データの数や、全体の登録データ数が、記憶容量に対して余裕があるか、などが挙げられる。なお、登録データの同一性を判定するようにしてもよい。同じ登録データに対して、違うラベルが割り当てられている場合もあり得るからである。このような場合には、操作部8を介して、ユーザにどちらのラベルに統一するか指示するように促してもよい。
識別パラメータ共有部42は、識別パラメータを共有するための処理を行う。また、識別パラメータ再設定部43は、識別パラメータ共有部42で行われる処理に応じて識別パラメータが共有前後で整合するように、識別パラメータの再設定を行う。識別パラメータ共有部42および識別パラメータ再設定部43で行われる処理の具体的な内容について、以下に、詳しく説明する。
なお、上述のように、本実施形態では、複数の登録データが一つのラベルに関連付けて登録され得るようにしている。これに対して、識別パラメータは後述するように一つのラベルに対して1種類の識別パラメータが登録される。このように、同じラベルの画像については同じ識別パラメータで識別するようにすることで識別性能の向上とメモリの節約を実現している。但し、例えば1つのラベルを特定の人物に対応させた場合に、同一のラベルであっても正面の画像と横向きの画像が存在すると、単一の識別パラメータで識別を行うことが却って識別性能を劣化させる可能性がある。従って、ラベルに撮影方向(正面、横)や撮影環境(太陽光、蛍光灯)などのような属性を付加し、ラベルと属性が一致する場合に同一の識別パラメータを利用するようにしても良い。この場合、以下の共有処理において「ラベルが一致する」といった場合には、「ラベルとその属性が一致する」ということになる。また、ラベルを、人物名+撮影方向のような記述として上記課題を回避することもできる。
<識別パラメータ共有処理・再設定処理>
図7は、登録データ共有部41、識別パラメータ共有部42および識別パラメータ再設定部43での処理の一例を示したフロー図である。まず、登録データ共有部41は、外部入出力部7から、共有の対象である登録データとラベルを含む外部データを取得する(S21)。次に、識別パラメータ共有部42は、外部データに登録データを識別するために用いられる識別パラメータが存在するか調べる(S22)。ここで、識別パラメータとは、例えば学習部34で追加学習されたような、対象となる登録データに固有のパラメータである。識別パラメータが存在するか否かの判定は、外部データに予め識別パラメータの存在を判定するためのデータを用意しておき、識別パラメータ共有部42がそれを読み取って判定すればよい。識別パラメータが存在しない場合(S22でNoの場合)は、登録データ共有部41が登録データ共有処理(S27)に進む。
一方、識別パラメータが存在する場合(S22でYesの場合)には、識別パラメータ共有部42は、外部データより識別パラメータを取得する(S23)。続いて、識別パラメータ再設定部43は、取得した識別パラメータに対して、再設定が必要かどうか判定する(S24)。ここで、再設定の必要性の判定は、例えば以下のように行う。まず、外部データに含まれる識別パラメータと同一ラベルの識別パラメータが識別パラメータ保持部24に存在するか調べる。そして、存在する場合は、同一ラベルに関する識別パラメータ同士の同一性を判定する。両識別パラメータが全く同じパラメータである場合は、何もしなくてよい(再設定が不要である)が、異なっている場合には再設定が必要になる。再設定が不要の場合(S24でNoの場合)は、識別パラメータの共有処理(S26)に進む。再設定が必要な場合(S24でYesの場合)、識別パラメータ再設定部43は識別パラメータ再設定処理を行う(S25)。この識別パラメータ再設定処理は、例えば、以下のようにして、識別パラメータを一方に統一することで実現される。即ち、取得した識別パラメータとすでに保持している識別パラメータとで、同一ラベルに属する登録データを評価データとして用いて、識別率の高い方に統一する。或いは、より単純には、予め識別パラメータを学習した時刻(識別パラメータを生成した時刻)を記録しておいて、より新しい方に統一するようにしてもよい。また、操作部8などを介して、どの識別パラメータに統一するかをユーザに選択させるようにしてもよい。
次に、識別パラメータ共有部42は、識別パラメータの共有を行う(S26)。これは、S25で再設定が行われた場合にはそのパラメータに更新すればよいし、取得した識別パラメータの対応するラベルが登録データ保持部32に保持されていない場合には、単純にコピーを行って、識別パラメータ保持部24に格納すればよい。S27において、登録データ共有部41は、外部データに含まれている登録データを、上述したようにして登録する。なお、S27の処理はS21の直後に実行されてもよい。
以上のように、第1実施形態のパターン識別装置によれば、登録データだけでなく、識別パラメータをも共有することを実現することによって、機器間で識別性能を共有することが可能になる。このため、使用する機器によって識別性能が著しくことなる、といった不都合を低減することができる。また、追加学習時間の短縮を実現することが可能になる。
[第2実施形態]
次に、第2実施形態を説明する。第2実施形態では、第1実施形態における登録データ/識別パラメータの共有化機能に、識別処理の異なる装置間での共有化を実現する機能を実現する構成を説明する。なお、説明の重複を避けるため、第1実施形態と同様の構成については説明を省略する。また、説明の便宜上、識別する対象となるパターンを、画像中の人物の顔としているが、本発明が、人物の顔以外のパターンに適用可能であることは第1実施形態でも述べたとおりである。
<データ登録部>
図5の(b)は、第2実施形態によるデータ登録部5の構成例を示したブロック図である。第1実施形態と比べて、互換性確認部36が追加された点と、データ共有処理部35の処理内容の一部が異なる。
互換性確認部36は、登録データおよび識別パラメータの共有を行う機器間で、入力データ識別部6での識別方式が異なる場合でも、できるだけパラメータの共有が出来るようにする。以下、データ共有処理部35および互換性確認部36の具体的な処理内容について詳しく説明する。
図8の(a)は、互換性確認部36の構成例を示したブロック図である。互換性確認部36において、互換性判定部141は、外部入出力部7を介して取得した外部データに含まれる識別パラメータが、当該データ識別装置が使用可能なパラメータであるか(互換性があるか)どうかを判定する。互換性情報保持部142は、複数の識別方式間(機種間)で互換性がある識別パラメータについての情報を格納している。図8の(b)は、互換性情報保持部142に格納されている互換性情報の一例である。図8の(b)のように、互換性情報は、テーブルの形式をとるとよい。この互換性情報テーブル143には、機種間で互換性がある、すなわち利用が可能な識別パラメータを示す。互換性情報テーブル143の内容は、予め機器が保持してもよいが、例えば外部入出力部7を介して、外部から更新出来るようにしてもよい。
互換性情報テーブル143の内容について説明する。テーブルの行はそれぞれ識別パラメータの登録元(source)の機器の種類を表し、列はそれぞれ登録先(destination)の機器の種類を表している。テーブルで対角線上にあるものは、同機種間でのデータの登録になるので、全てのパラメータに対して互換性がある(完全互換)。対角線上にないものは、異なる機種でのデータの登録になるので、一部互換性のないものが含まれる。また、互換性情報テーブル143には、互換性のあるパラメータが記載されている。したがって、例えば、機種がカメラ1の識別パラメータを、機種がカメラ2の機器に登録する場合は、次元圧縮方法と局所領域に関して互換性があるので、基底ベクトル及び局所領域の数や位置を共有できることが分かる。これに対して、カメラ2の識別パラメータをカメラ1が共有しようとする場合には、局所領域の識別パラメータのみが共有可能である。これは、例えば、カメラ2の方がカメラ1よりも上位機種であることに起因する。
なお、パラメータ互換性の情報は、図8の(b)に示したものに限られるものではない。例えば、パターン識別方法が局所領域ごとの相関値を統合する方式である場合、局所領域の数や、局所領域の位置、局所領域ごとの次元圧縮方法、局所領域の特徴ベクトル次元数などを含むようにしてもよい。また、互換性情報として、学習アルゴリズムや、相関演算方法、計算リソースなどを含むようにしてもよい。例えば、学習アルゴリズムを互換性情報に含めることによって、学習方式が同じ機器間で、学習の初期値などを共有できるようになる。また、計算リソースを互換性情報に含めることによって、時間のかかる追加学習を適切なタイミング(必要なリソースを確保できたタイミング)および適切な機器(必要なリソースを確保できる機器)で実行するように制御することが可能になる。また、外部データ(登録データ、識別パラメータ、ラベル)を提供する機種の情報は、例えば外部データに保持させておけばよい。或いは、外部入出力部7が外部記憶装置から外部データを取得する場合には、当該外部記憶装置に所定のデータ名で機種の情報を記録しておくようにしても良い。また、外部入出力部7が他の機器との通信により外部データを取得する場合には、例えば通信の確立時に機種の情報を取得しておくようにしてもよい。さらに、互換性情報テーブルには当該機種を登録元とする情報のみを保持するようにしてもよい。
図7のS26において、識別パラメータ共有部42は互換性のある識別パラメータのみを登録し、不足する識別パラメータをデフォルト値で補う。或いは、不足する識別パラメータを追加学習により補うようにしても良い。S26における識別パラメータ共有処理について図9を参照して以下に説明する。
まず、識別パラメータ再設定部43は、互換性情報保持部142から識別パラメータの互換性情報を取得する(S31)。次に、識別パラメータ再設定部43は、取得した互換性情報をもとに、外部データから登録可能な識別パラメータを取得する(S32)。続いて、識別パラメータ再設定部43は、S32で取得した識別パラメータをもとに、識別性能を計測する(S33)。このとき、互換性の関係により外部データから取得することができなかった識別パラメータ(不足したパラメータ)にはデフォルト値が設定されるものとする。また、識別性能は、登録データを評価データとして識別率を計測すればよい。次に、識別パラメータ再設定部43は、計測した識別性能が所定値を上回っているか判定する(S34)。計測した識別性能が所定値を上回っている場合は(S34でYesの場合)処理を終了する。計測した識別性能が所定値を下回っている場合(S34でNoの場合)、識別パラメータ再設定部43は学習部34に追加学習を実行させる(S35)。追加学習は、所定閾値を上回るまで、例えば初期値を変えながら続けてもよいが、いつまでも終了しない場合もあるので、学習回数が所定回数を超えないように制限をつけてもよい。なお、外部から取得した識別パラメータに互換性が全くない場合は、実質的に登録データのみが追加され、識別パラメータはデフォルト値となり、追加学習が行われる。
以上のように、第2実施形態によれば、登録データを識別するために追加学習を行ったパラメータを、識別方式が異なる装置でも最大限共有することが可能になる。
なお、上記の例では追加学習を駆動するか否かを識別率の評価に従って決定したが、これに限られるものではない。新たに登録データが保持される度に識別パラメータの追加学習を行うようにしても良い。或いは、識別パラメータの互換性情報に、追加学習の駆動の要否を示す要否情報を含めておき、これに従って追加学習を行うか否かを決定するようにしてもよい。例えば、図8の(b)において、機種がカメラ1の機器に登録されていた識別パラメータを、機種がサーバの機器に登録した際、追加学習を行うフラグが有効なら、学習部34に追加学習を実行させる。その際、学習アルゴリズムに互換性があるなら、共有するパラメータを、追加学習の初期値に設定することが出来る。そのような追加学習の初期値としては、典型的には、局所特徴の位置や、局所特徴の数を採用することが出来る。
以上のように、第2実施形態によれば、登録データ識別パラメータの共有後に、所定条件を満たす場合に限り、追加学習を行うことによって、時間のかかる追加学習をむやみに実行することを抑制することが出来る。したがって、第2実施形態によれば、登録データと機器固有の識別方法による登録データ識別のためのパラメータを、複数の機器間で共有することが可能になり、識別性能の平準化や、追加学習時間の短縮を実現することが可能になる。
本発明は、デジタルカメラやカムコーダー、ネットワークカメラなど、撮像装置に適用することが可能である。また、PCや携帯機器、その他の組み込みアプリケーションにも適用可能である。
以上、実施形態を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (7)

  1. 参照パターンのデータまたはその特徴量を含む登録データと、入力データと前記登録データとを比較するための処理内容を規定する識別パラメータとを用いて、前記入力データに存在するパターンを識別するパターン識別装置であって、
    登録データと識別パラメータとをラベルに関連付けて保持する保持手段と、
    外部装置で生成された登録データと識別パラメータとラベルを取得する取得手段と、
    他の機種のそれぞれとの間で共有可能な識別パラメータの種類を示す互換性情報と前記外部装置の機種とを参照して、前記取得手段により取得した識別パラメータのうち共有可能な種類の識別パラメータを判定する判定手段と、
    前記取得手段により取得した識別パラメータのうち前記判定手段により共有可能でないと判定された種類の識別パラメータをデフォルト値または追加学習により補完する補完手段と、
    前記取得手段で取得した登録データと、前記取得手段により取得された識別パラメータのうち前記判定手段により共有可能と判定された種類の識別パラメータ及び前記補完手段により補完された識別パラメータとを、前記取得手段で取得したラベルに関連付けて前記保持手段に追加する追加手段とを備えことを特徴とするパターン識別装置。
  2. 前記互換性情報は、他の機種との間で識別パラメータの共有を行った際の追加学習の要否を示す要否情報を含み、
    前記補完手段は、前記共有可能でないと判定された種類の識別パラメータを補完する際に、前記要否情報によって追加学習が必要であることが示されている場合に前記追加学習を実行することを特徴とする請求項に記載のパターン識別装置。
  3. 前記補完手段は、前記共有可能でないと判定された種類の識別パラメータをデフォルト値で補完した後、当該識別パラメータの識別率を評価し、識別率が所定値を下回った場合に当該識別パラメータについて前記追加学習を行うことを特徴とする請求項に記載のパターン識別装置。
  4. 前記入力データは画像データであることを特徴とする請求項1乃至のいずれか1項に記載のパターン識別装置。
  5. 参照パターンのデータまたはその特徴量を含む登録データと、入力データと前記登録データとを比較するための処理内容を規定する識別パラメータとを用いて、前記入力データに存在するパターンを識別するパターン識別装置の制御方法であって、
    登録手段が、登録データと識別パラメータとをラベルに関連付けて保持手段に保持する保持工程と、
    取得手段が、外部装置で生成された登録データと識別パラメータとラベルを取得する取得工程と、
    判定手段が、他の機種のそれぞれとの間で共有可能な識別パラメータの種類を示す互換性情報と前記外部装置の機種とを参照して、前記取得工程で取得した識別パラメータのうち共有可能な種類の識別パラメータを判定する判定工程と、
    補完手段が、前記取得工程で取得した識別パラメータのうち前記判定工程で共有可能でないと判定された種類の識別パラメータをデフォルト値または追加学習により補完する補完工程と、
    追加手段が、前記取得工程で取得した登録データと、前記取得工程で取得した識別パラメータのうち前記判定工程で共有可能と判定された種類の識別パラメータ及び前記補完工程で補完された識別パラメータとを、前記取得工程で取得したラベルに関連付けて前記保持手段に追加する追加工程とを備えことを特徴とするパターン識別装置の制御方法。
  6. コンピュータを、請求項1乃至のいずれか1項に記載のパターン識別装置の各手段として機能させることを特徴とするプログラム。
  7. コンピュータを、請求項1乃至のいずれか1項に記載のパターン識別装置の各手段として機能させることを特徴とするプログラムを格納したコンピュータで読み取り可能な記憶媒体。
JP2010007445A 2010-01-15 2010-01-15 パターン識別装置及びその制御方法 Active JP5588180B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010007445A JP5588180B2 (ja) 2010-01-15 2010-01-15 パターン識別装置及びその制御方法
US12/986,051 US8626782B2 (en) 2010-01-15 2011-01-06 Pattern identification apparatus and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010007445A JP5588180B2 (ja) 2010-01-15 2010-01-15 パターン識別装置及びその制御方法

Publications (2)

Publication Number Publication Date
JP2011145958A JP2011145958A (ja) 2011-07-28
JP5588180B2 true JP5588180B2 (ja) 2014-09-10

Family

ID=44278320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010007445A Active JP5588180B2 (ja) 2010-01-15 2010-01-15 パターン識別装置及びその制御方法

Country Status (2)

Country Link
US (1) US8626782B2 (ja)
JP (1) JP5588180B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5653131B2 (ja) 2010-08-25 2015-01-14 キヤノン株式会社 オブジェクト認識装置およびその認識方法
JP5323035B2 (ja) 2010-12-10 2013-10-23 キヤノン株式会社 画像形成装置及びその画像形成方法
JP5869805B2 (ja) * 2011-08-25 2016-02-24 キヤノン株式会社 情報処理装置、撮像装置、およびそれらの制御方法、プログラム、並びに記憶媒体
JP5997545B2 (ja) 2012-08-22 2016-09-28 キヤノン株式会社 信号処理方法及び信号処理装置
US10534995B2 (en) * 2013-03-15 2020-01-14 Qylur Intelligent Systems, Inc. Network of intelligent machines
JP6351243B2 (ja) 2013-11-28 2018-07-04 キヤノン株式会社 画像処理装置、画像処理方法
JP6456031B2 (ja) 2014-03-25 2019-01-23 キヤノン株式会社 画像認識装置、画像認識方法およびプログラム
JP6410450B2 (ja) 2014-03-31 2018-10-24 キヤノン株式会社 オブジェクト識別装置、オブジェクト識別方法及びプログラム
JP2017033979A (ja) * 2015-07-29 2017-02-09 ファナック株式会社 実装タクトおよび消費電力を低減する部品マウンタ及び機械学習器
JP7063052B2 (ja) 2018-03-28 2022-05-09 富士通株式会社 適合度算出プログラム、適合度算出方法、適合度算出装置、識別プログラム、識別方法及び識別装置
JP7215491B2 (ja) * 2018-11-29 2023-01-31 日本電気株式会社 個体識別装置
JP7243486B2 (ja) * 2019-06-27 2023-03-22 トヨタ自動車株式会社 学習装置、歩行訓練システム、方法、及びプログラム
JP7293915B2 (ja) * 2019-06-28 2023-06-20 トヨタ自動車株式会社 学習装置、歩行訓練装置、システム、方法、プログラム、及び学習済みモデル
WO2021001996A1 (ja) * 2019-07-04 2021-01-07 株式会社Fuji 部品実装システム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3078166B2 (ja) 1994-02-02 2000-08-21 キヤノン株式会社 物体認識方法
US6463176B1 (en) 1994-02-02 2002-10-08 Canon Kabushiki Kaisha Image recognition/reproduction method and apparatus
JP3416325B2 (ja) 1995-03-28 2003-06-16 キヤノン株式会社 座標入力装置及びその制御方法
JPH08335134A (ja) 1995-06-07 1996-12-17 Canon Inc 情報処理装置
JPH0922324A (ja) 1995-07-05 1997-01-21 Canon Inc 座標入力装置
US5761087A (en) 1996-01-10 1998-06-02 Canon Kabushiki Kaisha Coordinate input device and a control method therefor
JPH09190268A (ja) 1996-01-11 1997-07-22 Canon Inc 情報処理装置およびその方法
US6225986B1 (en) 1997-01-06 2001-05-01 Canon Kabushiki Kaisha Coordinate input apparatus and its control method
JPH11249803A (ja) 1998-03-03 1999-09-17 Canon Inc 座標入力装置及びその制御方法、コンピュータ可読メモリ
US7054850B2 (en) 2000-06-16 2006-05-30 Canon Kabushiki Kaisha Apparatus and method for detecting or recognizing pattern by employing a plurality of feature detecting elements
JP4478296B2 (ja) 2000-06-16 2010-06-09 キヤノン株式会社 パターン検出装置及び方法、画像入力装置及び方法、ニューラルネットワーク回路
JP3659914B2 (ja) * 2000-10-31 2005-06-15 松下電器産業株式会社 物体認識装置、物体を認識する方法、プログラムおよび記録媒体
JP4157322B2 (ja) * 2002-04-25 2008-10-01 株式会社東芝 人物認識システム
JP2005122480A (ja) * 2003-10-16 2005-05-12 Konica Minolta Photo Imaging Inc Idカードシステム及び認証方法
JP5008269B2 (ja) 2005-04-08 2012-08-22 キヤノン株式会社 情報処理装置、情報処理方法
JP2006338092A (ja) * 2005-05-31 2006-12-14 Nec Corp パタン照合方法、パタン照合システム及びパタン照合プログラム
JP4357473B2 (ja) * 2005-11-04 2009-11-04 株式会社ソニー・コンピュータエンタテインメント データ処理システムおよびプログラム
US8014572B2 (en) * 2007-06-08 2011-09-06 Microsoft Corporation Face annotation framework with partial clustering and interactive labeling
JP2009086749A (ja) 2007-09-27 2009-04-23 Canon Inc パターン識別手法、識別用パラメータ学習方法、及び装置
US8331655B2 (en) 2008-06-30 2012-12-11 Canon Kabushiki Kaisha Learning apparatus for pattern detector, learning method and computer-readable storage medium
US8325999B2 (en) * 2009-06-08 2012-12-04 Microsoft Corporation Assisted face recognition tagging

Also Published As

Publication number Publication date
JP2011145958A (ja) 2011-07-28
US8626782B2 (en) 2014-01-07
US20110179052A1 (en) 2011-07-21

Similar Documents

Publication Publication Date Title
JP5588180B2 (ja) パターン識別装置及びその制御方法
US8819015B2 (en) Object identification apparatus and method for identifying object
JP4908505B2 (ja) 撮影者を利用した画像の分類
US7564994B1 (en) Classification system for consumer digital images using automatic workflow and face detection and recognition
US7555148B1 (en) Classification system for consumer digital images using workflow, face detection, normalization, and face recognition
US7551755B1 (en) Classification and organization of consumer digital images using workflow, and face detection and recognition
US10558851B2 (en) Image processing apparatus and method of generating face image
JP4914398B2 (ja) 表情認識装置、撮像装置、方法及びプログラム
JP4501937B2 (ja) 顔特徴点検出装置、特徴点検出装置
US9626553B2 (en) Object identification apparatus and object identification method
US10074029B2 (en) Image processing system, image processing method, and storage medium for correcting color
KR102566998B1 (ko) 이미지 선명도를 결정하기 위한 장치 및 방법
JP2012038106A (ja) 情報処理装置、情報処理方法、およびプログラム
KR102383129B1 (ko) 이미지에 포함된 오브젝트의 카테고리 및 인식률에 기반하여 이미지를 보정하는 방법 및 이를 구현한 전자 장치
JP2011096136A (ja) オブジェクト識別装置及びオブジェクト識別方法
JP5241606B2 (ja) オブジェクト識別装置及びオブジェクト識別方法
US20090309700A1 (en) Authentication apparatus, image sensing apparatus, authentication method and program therefor
JP2015106197A (ja) 画像処理装置、画像処理方法
JP2007013480A (ja) 監視システム、監視方法、及び監視プログラム
JP2006139369A (ja) 画像処理方法および装置並びにプログラム
JP2010257158A (ja) オブジェクト識別装置及びオブジェクト識別方法
JP2015069580A (ja) 人物画像分類装置、人物画像分類方法、及び、プログラム
JP2012234497A (ja) オブジェクト識別装置、オブジェクト識別方法、及びプログラム
JP2006018707A (ja) 被写体識別装置、その識別方法とその識別プログラム、および被写体識別器設定装置、その設定方法とその設定プログラム
JP2012027617A (ja) パターン識別装置、パターン識別方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140725

R151 Written notification of patent or utility model registration

Ref document number: 5588180

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151