JP2014153837A - 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム - Google Patents

識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム Download PDF

Info

Publication number
JP2014153837A
JP2014153837A JP2013021863A JP2013021863A JP2014153837A JP 2014153837 A JP2014153837 A JP 2014153837A JP 2013021863 A JP2013021863 A JP 2013021863A JP 2013021863 A JP2013021863 A JP 2013021863A JP 2014153837 A JP2014153837 A JP 2014153837A
Authority
JP
Japan
Prior art keywords
data
classifier
identification device
identification
soft cascade
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013021863A
Other languages
English (en)
Inventor
Takao Onoe
孝雄 尾上
Ryusuke Miyamoto
龍介 宮本
Jaehoon Yu
載勲 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka University NUC
Original Assignee
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC filed Critical Osaka University NUC
Priority to JP2013021863A priority Critical patent/JP2014153837A/ja
Priority to PCT/JP2014/052641 priority patent/WO2014123141A1/ja
Publication of JP2014153837A publication Critical patent/JP2014153837A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

【課題】入力された画像データから対象物を精度よく、且つ、短時間に検出できる識別装置を提供する。
【解決手段】外部から画像データの入力を受付けて、入力された画像データが所定のデータを含むか否かを識別する識別装置は、SVM識別器の部分演算を弱識別器とし、これらを所定の規則に従って並べ替え(S14)、連続して接続したソフトカスケード識別装置である。SVM識別器は、予め画像データが所定のデータを含むか否かを識別する学習を行う(S11〜S13)。
【選択図】図2

Description

この発明は識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、および、データの識別方法に関し、特に、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラムに関する。
従来から様々な応用分野において、入力されたデータから所定のデータを含む箇所を検出する技術が必要となっている。例えば、画像処理分野においては、画像の特徴を抽出して人等を検出する識別装置が提案されている。このような装置においては、一般に機械学習技術を用いて識別を行っており、予め訓練サンプルを用いて識別器の構築を行い、これを実際に解くべき問題に適用することによって処理が実現されている。このとき、訓練サンプルから特徴空間への写像が行われ、識別器の構築が行われる。人の検出処理においても同様であり、識別対象のサンプルから特徴抽出を行い、得られた特徴ベクトルに基づき識別が行われる。
具体的な人の検出装置としては、例えば、特許第4970381号公報(特許文献1)に記載があり、ここでは、共起輝度勾配方向ヒストグラム(CoHOG)を用いて人を検出している。
また、ソフカスケードを用いて画像から対象物を検出する方法が、例えば、米国特許第7,634,142号公報(特許文献2)に開示されている。
また、ソフカスケードを用いて画像の識別処理を高速化する方法が、例えば、米国特許公開第2009/0018980号公報(特許文献3)に開示されている。
特許第4970381号公報 米国特許第7,634,142号公報 米国特許公開第2009/0018980号公報
従来の人を検出するような識別装置は上記のように構成されていた。このような識別装置においては、精度を向上させるためには特徴ベクトルの大きさが増大する傾向にあり、精度の向上と処理の高速化との両立が困難であった。また、代表的な高速化の手法の一つとして特許文献2や3のようなカスケード構造の導入があるが、従来はブースティングを対象としたものしか存在せず、より汎用性能の高いサポートベクターマシン(以下。「SVM」と省略する)を用いる場合に精度の向上と高速化とを両立できる装置が存在しなかった。
この発明は上記のような問題点を解消するためになされたもので、入力された画像データのようなデータから対象物を精度よく、且つ、短時間に検出できる識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラムを提供することを目的とする。
この発明に係る識別装置は、外部からデータの入力を受付けて、入力されたデータが所定のデータを含むか否かを識別する。識別装置は、複数の弱識別器を連続して接続したソフトカスケード識別装置である。弱識別器は、予めデータが所定のデータを含むか否かを識別する学習を行ったSVMにおける分類予測演算の部分演算を行う。識別装置は、複数の弱識別器を所定の規則に従って並べ替える整列手段を含む。
好ましくは、弱識別器のそれぞれの識別結果が誤っている割合を示す重みを演算する重み演算手段を含み、整列手段は、弱識別器の接続順を、重み演算手段による、誤識別が少ない順に並べ替える。
この発明の他の局面においては、データ判別装置は上記の識別装置を含む。
好ましくは、データ判別装置は入力されたデータから部分データを抽出するデータ抽出手段と、データ抽出手段が抽出した部分データから特徴データを抽出する特徴抽出手段とを含む。
この発明のさらに他の局面は、外部から入力されるデータが所定のデータを含むか否かを識別する識別装置用のソフトカスケード識別器を構成する方法である。ソフトカスケード識別器を構成する方法は、予めポジティブ訓練サンプルとネガティブ訓練サンプルを準備するステップと、外部から入力されるデータが所定のデータを含むか否かを、SVMで識別するための学習を行うステップと、複数の弱識別器を連続して接続することによりソフトカスケード識別装置を構成するステップと、ソフトカスケード識別装置で、訓練サンプルを用いて弱識別器を並べ替えるステップと、ソフトカスケード識別装置を構成する弱識別器の初期閾値を決定するステップとを含む。
好ましくは、初期閾値を決定するステップは、MIPによって決定するステップを含む。
この発明のさらに他の局面によれば、データの識別方法は、任意のデータの入力を受付けるステップと、入力されたデータから部分データを抽出するステップと、抽出された部分データから特徴ベクトルを抽出するステップとを含み、それぞれが、予め学習を行った複数の弱識別器で構成された識別装置に対して、予め定められた目標最終閾値に基づいて、各弱識別器の閾値を設定し、識別装置を用いて抽出された特徴ベクトルを用いてデータの識別を行う。
この発明のさらに他の局面は、コンピュータに、外部から入力されるデータが所定のデータを含むか否かを識別する識別装置用のソフトカスケード識別器を構成する方法を実行させるプログラムである。プログラムはコンピュータに、予めポジティブ訓練サンプルとネガティブ訓練サンプルを準備するステップと、外部から入力されるデータが所定のデータを含むか否かをSVMで識別するための学習を行うステップと、複数の弱識別器を連続して接続することによりソフトカスケード識別装置を構成するステップと、ソフトカスケード識別装置で、訓練サンプルを用いて弱識別器を並べ替えるステップと、ソフトカスケード識別装置を構成する弱識別器の初期閾値を決定するステップとを含む。
複数の弱識別器を連続して接続したソフトカスケード識別装置を構成する弱識別器は、予めデータが所定のデータを含むか否かを識別する学習を行ったSVMを用いた識別のための予測演算における部分演算であり、複数の弱識別器を所定の規則に従って並べ替えるため、入力されたデータから対象物を精度よく、且つ、短時間に検出できる。
識別装置構築部の構成を示す機能ブロック図である。 識別装置構築部の動作を示すフローチャートである。 SVM識別器の識別方法の概要を示す図である。 SVM識別器のカスケード構造を示す図である。 ソフトカスケードの並べ替え処理内容を示す模式図である。 ソフトカスケードの並べ替え処理内容を示すフローチャートである。 識別器の並べ替えを行わなかった場合、並べ替えた場合の累積拒否率のグラフである。 画像データ判別装置の構成を示す機能ブロック図である。 最終閾値を推定した図である。 画像データ判別装置の動作を示すフローチャートである。
以下、この発明に係る所望の対象物の識別が可能な識別装置を人の検出のための人検出装置として用いる場合の一実施の形態を、図面を参照して説明する。人検出装置は、訓練サンプルデータに基づいて学習を行う識別装置を構築する識別装置構築処理部と、構築された識別装置によって任意の画像データから人を識別する識別処理部とで構成される。
識別装置構築処理を行う識別装置構築処理部も識別処理部も共に、基本的に外部からのデータの入力を受付ける入力部と、所定の出力を行う出力部とを有するコンピュータで構成されている。
図1は識別装置構築部の構成を示す機能ブロック図である。図1を参照して、識別装置構築部10は、外部からポジティブ訓練サンプルおよびネガティブ訓練サンプルの入力を受ける、ポジティブ訓練サンプル入力部15およびネガティブ訓練サンプル入力部16と、ポジティブ訓練サンプル入力部15およびネガティブ訓練サンプル入力部16に接続され、最初に識別器を構築する初期識別器構築部11と、ポジティブ訓練サンプル入力部15およびネガティブ訓練サンプル入力部16および初期識別器構築部11に接続され、初期識別器の部分演算に相当する識別器が複数連続して接続されたカスケード識別装置を構築するカスケード識別装置構築部12と、カスケード識別装置構築部12に接続され、それぞれの識別器の閾値を決定する閾値決定部13とを含む。ここで、カスケード識別装置を構成する個々の識別器を弱識別器という場合がある。また、識別装置構築部10が構築したカスケード識別装置を出力部18が出力する。また、出力されるソフトカスケード識別装置はプログラムコンピュータで処理可能なデータである。
次に識別処理構築部10の動作について説明する。図2は識別装置構築部10の動作を示すフローチャートである。図1および図2を参照して、まず、ポジティブ訓練サンプルおよびネガティブ訓練サンプルをそれぞれの入力部15,16から入力して(S11)、初期識別器構築部11で初期識別器を構築する(S12)。ここで、初期識別器はSVMを用いたSVM識別器である。SVM識別器は、図3に示すように、識別可能な異なる2つのクラスに対して、マージンが最大になる超平面を識別器として用いたものである。
ここで、SVM識別器は、識別のための分類を予測する分類予測演算(SVMprediction)として、次の式で表される演算を行う。
g(x)=sign(w・x+b)
これは、超平面と特徴ベクトルの符号付距離を表す。
このようにしてSVM識別器を予め訓練サンプルで学習させる。ここでは線形SVMを例示しているが、非線形SVMであっても構わない。
次に、構築されたSVM識別器をT段に分割する(S13)。但し、Tは識別の応用に適した定数である。分割された識別器の各段はSVM予測演算の部分演算に相当しており、各段の部分演算を弱識別器とみなして、ソフトカスケード識別装置を構成する。このようにして構成されたSVM識別器のソフトカスケード識別装置の概要を図4に示す。図4を参照して、入力される訓練サンプルを識別器1、識別器2、…識別器Nの順に接続して続けて処理を行う。ここで、これらの識別器が先に述べた部分演算、すなわち、弱識別器に相当する。このとき、それぞれの識別器における拒否閾値をθで表示する。具体的には後述する。
分割の結果得られた複数の部分識別器を後に説明する所定の規則に従って並べ替え(S14)、各識別器における閾値をMIPにより設定する(S15)。
したがって、コンピュータのCPUは整列手段および閾値決定手段として作動する。
なお、MIPの詳細については後述する。
上記の並べ替えの処理について図5を参照して説明する。図5はソフトカスケード識別装置の並べ替え処理内容を示す模式図であり、処理の順を(1)〜(4)で示している。図5を参照して、ここではまず、(1)重みの初期値としてポジティブ訓練サンプルに0をネガティブ訓練サンプルに例えば0.2を割り当てている。ここで、ネガティブ訓練サンプルの重みが高いのは拒否率の向上が目的のため、ネガティブ訓練サンプルにのみ注目するためである。次いで、(2)T個の識別器について誤検出の重み和を計算し、(3)誤識別が最小の識別器を選択する。ここでは、識別器3の誤識別データの重み和が0.4と最も低いため識別器3を第1識別器として選択する。次に、(4)ネガティブ訓練サンプルの重みを更新する。次の識別器の選択は、前の識別器では識別できなかったデータに重点をおいて行う。そして、誤検出の重み和の計算、誤検出が最小の識別器の選択、および、ネガティブサンプルの重みの更新処理、すなわち、処理(2)〜(4)を全ての識別器T個について繰り返す。
このように、ソフトカスケードを構成する識別器を並べ替える方が好ましいのは、効率よく拒否できる識別器を早いうちに用いることによって処理が高速になるためである。
この処理の内容、すなわち、図2のS14で示した識別器の並べ替え処理内容を一般化して示したのが、図6のフローチャートである。図6を参照して、ポジティブ訓練サンプルに1を、ネガティブ訓練サンプルに0を割り当てる(S21)。T段に分割された弱識別器をh1(識別器1),h2(識別器2)…,hT(識別器T)とし(S22)、上記のように重みを初期化する(S23)。変数tを1にセットする(S24)。重みを正規化して(S25)、重み付き誤差を最小化する弱識別器hjを選択する(S26)。t段目の弱識別器をhjとする(S27)。hjを弱識別器の集合から削除する(S28)。重みの更新をする(S29)。これを全ての識別器(T個)について行う。具体的には、t段目は最終段か否かを判別する(S30)。最終段であれば(S30でYES)、処理を終了する。最終段でなければ(S30でNO)、変数を1増加させて上記したS25〜S30までの処理を繰り返す。
したがって、コンピュータのCPUは重み演算手段として、また、整列手段として作動する。
ここで、識別器の並べ替え処理の方法としては、次の二通りある。第1の方法はアダブーストの考え方を用いた方法である。この場合の並べ替えの方法を以下に示す。
Figure 2014153837
この方法においては弱識別器の閾値は最も効率のよい識別器を選択するためだけに用いられ全ての弱識別器が最終識別器として利用される。この方法によってでも、ある程度の高速処理が可能である。しかしながら、アダブーストは最終の強力な識別器検出効率を最大にすることであるため、ネガティブサンプルを拒否するという観点からは最適化されていない。ここでは、全ての弱識別器を最終識別器として利用しているため、最終識別結果は識別器の選択に依存しない。
第2の方法は第1の方法を修正したものである。この場合の並べ替えの方法を以下に示す。
Figure 2014153837
上記を参照して、ここでは、ポジティブデータに対する重みの初期値が先の例のように平均ではなく、0である点が異なる。ここでポジティブサンプルの重みの初期値を0にしたのは、ネガティブサンプルの拒否率のみを考慮するためである。
ここで閾値θはポジティブxkのいかなるhj(xk)よりも小さい。というのは、ソフトカスケードの拒否閾値はどのポジティブサンプルデータも拒否しないはずだからである。
また、hj(xk)の代わりに、個々のhi(xk)の総和がhj(xk、θ)の計算のために用いられている。これは、ソフトカスケードの拒否閾値は、弱識別器の累積値を用いており、それによってより効率の良い処理が可能だからである。
図7に識別器の並べ替えを行わなかった場合、第1の方法による場合、第2の方法による場合の、累積拒否率のグラフを示す。図から明らかなように、第2の方法が最も早く、次いで第1の方法である。両者とも、並べ替えない場合に比べて格段に高速化されている。
次に、図1に示した複数の弱識別器を用いたソフトカスケード識別装置を組み込んだ画像データ判別装置について説明する。図8は、入力された画像データに人が含まれているか否かを識別する画像データ判別装置の構成を示す機能ブロック図である。図8を参照して、画像データ判別装置20は、外部からの画像データの入力を受付ける画像データ入力部21と、画像データ入力部21に接続され、画像データに含まれる部分画像に基づいて画像データの部分情報を抽出する部分情報抽出部22と、部分情報抽出部22に接続され、部分情報から特徴ベクトルを抽出する特徴抽出部23と、特徴抽出部23に接続され、入力された画像データに人が含まれているか否かの識別処理を行う識別処理実行部24とを含む。この識別処理実行部24が図1の出力から得られるソフトカスケード識別装置である。この識別装置は予め画像データ判別装置20に入力されているものとするが、目標最終閾値等と同様に外部から入力されてもよい。
ここで、画像データ入力部21に入力される画像データは、カメラ、ビデオカメラ、スキャナ等を含む、任意の画像入力装置である。
画像データ判別装置20は、さらに、外部から識別のための目標最終閾値の入力を受ける閾値入力部26と、閾値入力部26に接続され、識別処理実行部24において識別を行う場合の最終閾値を決定する最終閾値決定部27とを含み、この最終閾値が識別処理実行部24に入力される。
次に、識別処理実行部24について説明する。
背景技術で述べた特許文献3は、その実施の形態の中で複数の識別器を多段接続して構成された識別装置における多段拒否処理(Multiple Instance Pruning、以下、「MIP」という)という考え方を開示している。このMIP処理という考え方は、一般に、多数のポジティブウインドウが単一の対象物の周りに検出されるが、各対象物の検出には1つのポジティブウインドウがあれば十分であるという考えである。
Figure 2014153837
ここで、このMIPについて説明する。機械式のブースティング識別器において、サンプルxkに割り当てられたスコアは弱識別器の重み和として式(1)で表される。ここで、Tは弱識別器の全数であり、hj(xk)はサンプルxkで演算されたj番目の特徴であり、αjは弱識別器jの重みである。
最終的な識別は式(2)で行われる。
ここで、θ(T)は最終閾値である。ソフトカスケードにおいては、重み和の演算はステージtにおいて部分和が拒否閾値θ(t)以下になると直ちに終了する。それゆえ、どのように拒否閾値θ(t)(ここでtは{1、…,T−1})を定めるのかが、検出精度の向上と処理速度に関係する。
一般に、ソフトカスケードは、単純には直接バックワード拒否(以下、「DBP」という)方法を使用する。これは、最終スコアsk(T)が最終閾値θ(T)より小さくなると全ての処理を除去する。拒否閾値は式(3)で表される。
ここで、{xk,yk}は訓練データ、yk=1,y=0はそれぞれポジティブおよびネガティブウインドウを示す。DBPは拒否閾値を設定するには非常に単純な方法であるが、識別誤差を増やすことなく高速識別器の構築が可能になる。
MIPにおいては、各対象物について1つのポジティブウインドウを維持するために、拒否閾値を式(4)で定義する。
ここで、iは真の訓練データであり、Fiは真の訓練データiに対応するポジティブウインドウの組であり、Riは維持されたウインドウの組である。その結果、式(5)で表される最終閾値以上の少なくとも一つの受け入れ可能なウインドウを有する真の訓練データの組Pを求める。
特許文献3は、複数の識別器を有する識別装置において、それぞれの処理に用いられる閾値はMIPによって学習されるという点を開示している。この処理によれば、元の識別器の組合わせによって検出された対象物は学習されたソフト識別装置によっても確実に検出され、それによって、訓練サンプルによる訓練結果の識別率が変わらない。さらに、識別装置の誤識別率は訓練サンプルによる元の識別器よりも大きくならない。訓練で必要な唯一のパラメータは最終拒否識別器の目標検出率であり、これが識別時の最終閾値となる。その結果、訓練サンプルによる訓練処理は全自動化が可能である。
また、この特許文献は、訓練サンプルによって訓練されたソフト識別装置と中間閾値とを識別装置に入力することにより最終識別装置を構成するという点を開示する。この実施の形態においても、画像データ判別装置20の有する識別処理実行部24は、同様の構成を有しているため同様の効果を奏する。
すなわち、図2のS15で示した各部分識別器におけるMIPは上記のことをいう。
次に、閾値の調整方法について説明する。ソフトカスケード処理においては、拒絶閾値の学習は最終段の閾値θ(T)に強く依存する。もし、利用したい閾値が初期学習における最終段の閾値θ(T)と異なるときは、各段の閾値は初めから再学習する必要がある。
そこで、この発明の発明者は、前もって学習した内容から閾値を推定できると期待して、各段における最終閾値は、以下の式(6)で表される単純な線形補間によって近似することとした。式(6)において、左辺(θの上に山型が付されているもの)は、推定された最終閾値である。
Figure 2014153837
図9は上記によって線形補間を行って拒否閾値を推定した図である。図において、初期学習における最終段の拒否閾値であるθ(T)=1.0のときの推定された最終段における拒否閾値が0.0の場合と、0.5の場合と、1.0の場合の各段における最終閾値を示す。このグラフから、最終拒否閾値とソフトカスケード識別装置を構成するカスケード段数が分かれば、拒否閾値を推定できる。
そこで、この実施の形態においては、これらの情報を入力して、所望の対象物の識別を行う。
次に、画像データ判別装置の動作について説明する。図10は画像データ判別装置20のCPUが行う動作を示すフローチャートである。図8および図10を参照して、画像データ入力部21を介して外部から画像データの入力を受け取る(S31)。入力された画像データは部分情報抽出部22および特徴抽出部23を経て特徴ベクトルに変換される(S32)。一方、入力された目標閾値から各段の閾値を設定する(S33)。これらの特徴ベクトルと閾値とに基づいて識別処理実行部24で識別処理が行われる。識別処理実行部24を構成するカスケード識別装置10は複数(T個)の弱識別器で構成されているため、処理としては、変数kを1に、Skを0にセットし(S34)、k段目の識別器の出力skをSkに加算し、Skが閾値θkより小さいか比較する(S35)。Skが閾値θkより小さいと判断されたときは(S35でSk<θk)、入力画像データは検出対象ではないと判定する(S38)。Skが閾値θk以上であると判断されたときは(S35でSk≧θk)、k段目は最終段か否かを判断する(S36)。最終段でなければ(S36でNO)、変数kを1増加させて(S39)、S35に戻る。S36で最終段であると判断されれば(S36でYES)、入力された画像データは検出対象であると判定する(S37)そして、その判定結果を識別結果出力部30に出力する。
したがって、コンピュータのCPUはデータ抽出手段、特徴データ抽出手段および識別手段として作動する。
なお、目標閾値の入力とこれに基づく各段の最終閾値の設定は図1に示した学習側に組み込んでもよい。
なお、上記実施の形態においては、画像データが所定の対象物として人を含むか否かを識別する場合について説明したが、これに限らず、人以外の任意の対象物の識別に用いてもよい。
また、画像データに限らず、音声データが所定の音声を含むか否か等の識別に用いてもよい。
以上、図面を参照してこの発明の実施形態を説明したが、この発明は、図示した実施形態のものに限定されない。図示した実施形態に対して、この発明と同一の範囲内において、あるいは均等の範囲内において、種々の修正や変形を加えることが可能である。
この発明に係る識別装置は、精度よく且つ高速に、入力されたデータから所望の対象物を識別する識別装置として有利に利用される。
10 識別装置構築部、12 カスケード識別装置構築部、13 閾値決定部、15 ポジティブ教師サンプル入力部、16 ネガティブ教師サンプル入力部、18 出力部、20 画像データ判別装置、21 画像データ入力部、22 部分情報抽出部、23 特徴抽出部、24 識別処理実行部、26 閾値入力部、27 最終閾値決定部、30 識別結果出力部。

Claims (8)

  1. 外部からデータの入力を受付けて、入力されたデータが所定のデータを含むか否かを識別する識別装置であって、
    前記識別装置は、複数の弱識別器を連続して接続したソフトカスケード識別装置であって、
    前記弱識別器は、予めデータが所定のデータを含むか否かを識別する学習を行ったSVMにおける分類予測演算の部分演算を行い、
    前記複数の弱識別器を所定の規則に従って並べ替える整列手段を含む、識別装置。
  2. 前記弱識別器のそれぞれの識別結果が誤っている割合を示す重みを演算する重み演算手段を含み、
    前記整列手段は、前記弱識別器の接続順を、前記重み演算手段による、誤識別が少ない順に並べ替える、請求項1に記載の識別装置。
  3. 請求項1または2に記載された識別装置を用いたデータ判別装置。
  4. 入力されたデータから部分データを抽出するデータ抽出手段と、
    前記データ抽出手段が抽出した部分データから特徴データを抽出する特徴抽出手段とを含む、請求項3の記載のデータ判別装置。
  5. 外部から入力されるデータが所定のデータを含むか否かを識別する識別装置用のソフトカスケード識別器を構成する方法であって、
    予めポジティブ訓練サンプルとネガティブ訓練サンプルを準備するステップと、
    前記入力されるデータが所定のデータを含むか否かを、SVMで識別するための学習を行うステップと、
    前記複数の弱識別器を連続して接続することによりソフトカスケード識別装置を構成するステップと、
    前記ソフトカスケード識別装置で、前記訓練サンプルを用いて弱識別器を並べ替えるステップと、
    前記ソフトカスケード識別装置を構成する弱識別器の初期閾値を決定するステップとを含む、ソフトカスケード識別器を構成する方法。
  6. 前記初期閾値を決定するステップは、MIPによって決定するステップを含む、請求項5に記載の方法。
  7. 任意のデータの入力を受付けるステップと、
    入力されたデータから部分データを抽出するステップと、
    抽出された部分データから特徴ベクトルを抽出するステップと、
    それぞれが、予め学習を行った複数の弱識別器で構成された識別装置に対して、予め定められた目標最終閾値に基づいて、各弱識別器の閾値を設定し、
    前記識別装置を用いて前記抽出された特徴ベクトルを用いてデータの識別を行うデータの識別方法。
  8. コンピュータに、外部から入力されるデータが所定のデータを含むか否かを識別する識別装置用のソフトカスケード識別器を構成する方法を実行させるプログラムであって、
    識別装置用のソフトカスケード識別器を構成する方法は、
    予めポジティブ訓練サンプルとネガティブ訓練サンプルを準備するステップと、
    前記入力されるデータが所定のデータを含むか否かをSVMで識別するための学習を行うステップと、
    前記複数の弱識別器を連続して接続することによりソフトカスケード識別装置を構成するステップと、
    前記ソフトカスケード識別装置で、前記訓練サンプルを用いて弱識別器を並べ替えるステップと、
    前記ソフトカスケード識別装置を構成する弱識別器の初期閾値を決定するステップとを含む、プログラム。
JP2013021863A 2013-02-07 2013-02-07 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム Pending JP2014153837A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013021863A JP2014153837A (ja) 2013-02-07 2013-02-07 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム
PCT/JP2014/052641 WO2014123141A1 (ja) 2013-02-07 2014-02-05 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013021863A JP2014153837A (ja) 2013-02-07 2013-02-07 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム

Publications (1)

Publication Number Publication Date
JP2014153837A true JP2014153837A (ja) 2014-08-25

Family

ID=51299733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013021863A Pending JP2014153837A (ja) 2013-02-07 2013-02-07 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム

Country Status (2)

Country Link
JP (1) JP2014153837A (ja)
WO (1) WO2014123141A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165673A (zh) * 2018-07-18 2019-01-08 广东工业大学 基于度量学习和多示例支持向量机的图像分类方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447888B (zh) * 2015-11-16 2018-06-29 中国航天时代电子公司 一种基于有效目标判断的无人机机动目标检测方法
CN107153843B (zh) * 2017-05-03 2020-07-10 西安电子科技大学 基于支持向量机的地面沉降预测系统和方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090018980A1 (en) * 2007-07-13 2009-01-15 Microsoft Corporation Multiple-instance pruning for learning efficient cascade detectors
JP2010224922A (ja) * 2009-03-24 2010-10-07 Denso Corp クラス識別器生成装置
JP2011257805A (ja) * 2010-06-04 2011-12-22 Sony Corp 情報処理装置および方法、並びにプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090018980A1 (en) * 2007-07-13 2009-01-15 Microsoft Corporation Multiple-instance pruning for learning efficient cascade detectors
JP2010224922A (ja) * 2009-03-24 2010-10-07 Denso Corp クラス識別器生成装置
JP2011257805A (ja) * 2010-06-04 2011-12-22 Sony Corp 情報処理装置および方法、並びにプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165673A (zh) * 2018-07-18 2019-01-08 广东工业大学 基于度量学习和多示例支持向量机的图像分类方法
CN109165673B (zh) * 2018-07-18 2021-08-31 广东工业大学 基于度量学习和多示例支持向量机的图像分类方法

Also Published As

Publication number Publication date
WO2014123141A1 (ja) 2014-08-14

Similar Documents

Publication Publication Date Title
JP6397986B2 (ja) 画像オブジェクト領域の認識方法及び装置
CN113255694B (zh) 训练图像特征提取模型和提取图像特征的方法、装置
WO2018121690A1 (zh) 对象属性检测、神经网络训练、区域检测方法和装置
US9002101B2 (en) Recognition device, recognition method, and computer program product
CN112598643B (zh) 深度伪造图像检测及模型训练方法、装置、设备、介质
JP5521881B2 (ja) 画像識別情報付与プログラム及び画像識別情報付与装置
CN109471938A (zh) 一种文本分类方法及终端
JP6532190B2 (ja) 画像検索装置、画像検索方法
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
JP2012104111A (ja) 多角度の人間顔検知方法及びシステム
CN108537168B (zh) 基于迁移学习技术的面部表情识别方法
WO2022188315A1 (zh) 一种视频检测方法、装置、电子设备及存储介质
CN106372624B (zh) 人脸识别方法及系统
CN104463128A (zh) 用于人脸识别的眼镜检测方法及系统
CN113239807B (zh) 训练票据识别模型和票据识别的方法和装置
Freytag et al. Labeling examples that matter: Relevance-based active learning with gaussian processes
US20230113643A1 (en) Leveraging unsupervised meta-learning to boost few-shot action recognition
WO2014123141A1 (ja) 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム
CN107729877B (zh) 一种基于级联分类器的人脸检测方法及装置
US10096127B2 (en) Classifying image samples
JP5171362B2 (ja) 強識別器の学習装置及びその方法並びに強識別器の学習プログラム
US20140169688A1 (en) Crosstalk cascades for use in object detection
Masoumzadeh et al. HydraPicker: Fully Automated Particle Picking in Cryo-EM by Utilizing Dataset Bias in Single Shot Detection.
Salimian Najafabadi et al. AgriNet: a New Classifying Convolutional Neural Network for Detecting Agricultural Products’ Diseases
EP4195162A1 (en) Machine-learning based evaluation of lateral flow tests

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170526

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170926