JP2023022031A - 適応ブースティング(afdaboost)分類器における効率的なディシジョンツリートラバース - Google Patents

適応ブースティング(afdaboost)分類器における効率的なディシジョンツリートラバース Download PDF

Info

Publication number
JP2023022031A
JP2023022031A JP2022176623A JP2022176623A JP2023022031A JP 2023022031 A JP2023022031 A JP 2023022031A JP 2022176623 A JP2022176623 A JP 2022176623A JP 2022176623 A JP2022176623 A JP 2022176623A JP 2023022031 A JP2023022031 A JP 2023022031A
Authority
JP
Japan
Prior art keywords
vector
feature
leaf
decision tree
window positions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022176623A
Other languages
English (en)
Inventor
ジャガンナサン シャイヤム
Jagannathan Shyam
クマール スワミ プラモッド
Kumar Swami Pramod
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JP2023022031A publication Critical patent/JP2023022031A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
    • G06F9/3887Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7747Organisation of the process, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】適応ブースティング(AdaBoost)分類器における効率的なデシジョンツリートラバースを提供する。【解決手段】単一命令多重データ(SIMD)プロセッサに実装されるディシジョンツリーベースの適応ブースティング(AdaBoost)分類器におけるオブジェクト分類のための方法の説明される例において、方法は、SIMDプロセッサに結合されるメモリ内の画像におけるN個の連続ウィンドウ位置から抽出される特徴ベクトルを受け取ること(700)及び特徴ベクトル及びSIMDプロセッサのベクトル命令を用いてAdaBoost分類器によってN個の連続ウィンドウ位置を同時に評価すること(708)を含む。AdaBoost分類器は、N個の連続ウィンドウ位置についての分類が完了する(712)まで、N個の連続ウィンドウ位置についてディシジョンツリーを同時にトラバースする(714)。【選択図】図7

Description

本願は、概して適応ブースティング(AdaBoost)分類器に関し、より特定していえば、AdaBoost分類器における効率的なディシジョンツリートラバースに関する。
「適応ブースティング(adaptive boosting)」の略語であるAdaBoostは、ディシジョンツリーなどの弱い分類器のリニア結合として強力な分類器を構築するためのアルゴリズムである。AdaBoost分類器では、弱い分類器の出力が組み合わされて、ブーストされた分類器の最終出力を表す重み付け和となる。AdaBoostは、前の分類器によって誤分類されたインスタンスを優先して後続の弱い学習器を微調整することによって適性を有する。(ディシジョンツリーが弱い学習器として用いられる)AdaBoostは、しばしば、最良のそのまますぐに使用できる分類器と呼ばれ、視覚及びデータ解析のための一般的な分類器である。例えば、AdaBoostの詳細な説明が、Y.Fruend及びR.Schapireの「オンラインラーニングの決定理論的生成、及びブースティングへの適用」、Journal of Computer and System Sciences、55巻、1号、1997年8月、頁119-139に見られる。
Y.Fruend and R.Schapire、"A Decision-Theoretic Generalization of On-line Learning and an Application to Boosting"、Journal of Computer and System Sciences、Vol.55、Issue 1、August 1997、pp.119-139
単一命令多重データ(SIMD)プロセッサに実装されるディシジョンツリーベースの適応ブースティング(AdBoost)分類器におけるオブジェクト分類のための方法の説明する例において、この方法は、SIMDプロセッサに結合されるメモリ内の画像におけるN個の連続ウィンドウ位置から抽出される特徴ベクトルを受け取ることを含み、ここで、Nは、特徴のビットサイズで除算されるSIMDプロセッサのベクトル幅であり、特徴ベクトルはN個の特徴値を含み、N個の連続ウィンドウ位置の各々に対して1つの特徴値がある。この方法はさらに、特徴ベクトル及びSIMDプロセッサのベクトル命令を用いてAdBoost分類器によってN個の連続ウィンドウ位置を同時に評価することを含み、ここで、AdBoost分類器は、N個の連続ウィンドウ位置について分類が完了するまで、N個の連続ウィンドウ位置についてディシジョンツリーを同時にトラバースし、ディシジョンツリーは、ノード、各ノードについての閾値、及びリーフを含み、各リーフは部分スコアを含む。
他の説明される例において、デジタルシステムが、単一命令多重データ(SIMD)プロセッサと、SIMDプロセッサに結合されるメモリ構成要素であって、画像から抽出される特徴をストアするように構成されるメモリ構成要素と、メモリ構成要素にストアされるディシジョンツリーであって、各ディシジョンツリーが、ノード、各ノードについての閾値、及びリーフを含み、各リーフが部分スコアを含むディシジョンツリーと、メモリ構成要素にストアされるオブジェクト分類についてトレーニングされるディシジョンツリーベースの適応ブースティング(AdBoost)分類器とを含む。AdBoost分類器はSIMDプロセッサ上で実行可能である。AdBoost分類器は、オブジェクト分類のためにディシジョンツリーを用いる。AdBoost分類器は、特徴及びSIMDプロセッサのベクトル命令を用いてN個の連続ウィンドウ位置を同時に評価するように構成される。AdBoost分類器は、N個の連続ウィンドウ位置について分類が完了するまで、N個の連続ウィンドウ位置についてディシジョンツリーを同時にトラバースする。Nは、特徴のビットサイズで除算されるSIMDプロセッサのベクトル幅である。
さらに説明される例において、非一時的コンピュータ可読媒体がソフトウェア命令をストアする。ソフトウェア命令が単一命令多重データ(SIMD)プロセッサ上で実行されると、ソフトウェア命令は、ディシジョンツリーベースの適応ブースティング(AdBoost)分類器におけるオブジェクト分類のための方法を実行させる。この方法は、SIMDプロセッサに結合されるメモリ内の画像におけるN個の連続ウィンドウ位置から抽出される特徴ベクトルを受け取ることを含む。ここで、Nは、特徴のビットサイズで除算されるSIMDプロセッサのベクトル幅であり、特徴ベクトルはN個の特徴値を含み、N個の連続ウィンドウ位置の各々に対して1つの特徴値がある。この方法はさらに、特徴ベクトル及びSIMDプロセッサのベクトル命令を用いてAdBoost分類器によってN個の連続ウィンドウ位置を同時に評価することを含む。AdBoost分類器は、N個の連続ウィンドウ位置について分類が完了するまで、N個の連続ウィンドウ位置についてディシジョンツリーを同時にトラバースし、ディシジョンツリーは、ノード、各ノードについての閾値、及びリーフを含み、各リーフは部分スコアを含む。
或る画像のシーンにおける歩行者検出のためのスライドウィンドウ手法を図示する例である。
或る画像についての特徴抽出、及びオブジェクト検出のためのメモリにおける得られた特徴の配置を図示する例である。
AdBoost分類器のための例示の2進ディシジョンツリーである。
AdBoost分類器における特徴タプルの一般的概念を図示する例である。
AdBoost分類器の各ディシジョンツリーのリーフにおける部分スコアの一般的概念を図示する例である。
特徴ベクトルを図示する例である。
単一命令多重データ(SIMD)プロセッサ上でAdBoost分類器を実行するための方法のフローチャートである。
例である。 例である。 例である。 例である。 例である。 例である。 例である。 例である。 例である。 例である。 例である。
図7の方法の実施形態を実行するように構成される例示のデジタルシステムの簡略化されたブロック図である。
例示のSIMDデジタルシグナルプロセッサのブロック図である。
様々な図における同様の要素は、一貫性を保つため同様の参照数字によって示される。
上述したように、AdaBoost分類器が、ディシジョンツリーなどの弱い分類器のリニア結合として構築され得る。本開示の実施形態は、ディシジョンツリーベースのAdaBoost分類器に向けられている。例えば、実施形態は、ベクトルプロセッサとしても知られる広範な単一命令多重データ(SIMD)プロセッサにディシジョンツリーベースのAdaBoost分類を実装することを対象とする。ベクトルプロセッサは、複数データポイント、すなわち、データポイントのベクトル、を同時に処理する命令を実装する。より具体的には、複数データポイントが1つのデータワードにまとめられ得、ベクトル命令が各データポイントに対する演算を同時に実行し得る。例えば、128ビットベクトルプロセッサでは、画像の8つの16ビット画素が1つの128ビットワードにまとめられ得、これら8つの画素が同時に処理され得る。
説明を簡単にするために、本明細書では、本開示の実施形態は、画像内のオブジェクト(歩行者など)を検出するようにトレーニングされる例示のAdaBoost分類器を用いて説明される。画像内の歩行者を検出するためにスライディングウィンドウ手法が用いられる。図1は、或る画像のシーンにおける歩行者検出のためのスライディングウィンドウ手法を図示する例である。一般に、従来の手法では、ウィンドウ(ボックス又はオブジェクトモデル或いはオブジェクトパッチとも称する)が、重なり合う水平及び垂直位置で画像内を移動され、特徴(各位置においてウィンドウ内の画素値に基づいて計算される)が分類器によって解析される。ウィンドウのサイズは、歩行者の予想サイズに基づき、36×68であると仮定される。ウィンドウは垂直及び水平に4画素毎に検査される。異なるサイズの歩行者、すなわち、あるシーンにおいて異なる距離における歩行者、を特定するために、画像の複数の異なるスケールで歩行者検出が実施される。
分類は、或る画像について複数の異なるスケールで計算される特徴に基づいて実施される。オブジェクト検出の場合、例示の特徴は、傾きの大きさ、傾きの方位、ブロック和、輝度、及び色情報を含み得る。従来の分類器が用いられ得る。また、或る画像についての複数スケールでの特徴の計算は、従来の方式で成され得る。この例では、8×8のセルサイズを用いて計算される10個の特徴の使用を仮定する。すなわち、色空間の成分、言い換えれば、Y(輝度成分)、Cb(青の色差成分)、及びCr(赤の色差成分)、傾きの大きさ、及び、0度~180度の6つのビンについての傾きのヒストグラム(HOG)である。そのため、36×38のウィンドウサイズを仮定すると、8×16×10=1280個の特徴がウィンドウ毎に存在する。また、画像の各スケールにおいて、4×4のブロック毎に1つのウィンドウが存在する。
図2は、或る画像についての特徴抽出、及びオブジェクト検出のためのメモリにおける得られた特徴の配置を図示する例である。上述したように、歩行者検出のための特徴が、オリジナル画像(ベース解像度)について、及び、この画像の複数のスケールについて計算される。(上述したような)スライディングウィンドウ手法を用いてこれらの特徴が計算され、各スケールに対する各ウィンドウに10個の特徴チャネルのセットが得られる。特徴チャネルは、或るウィンドウについて特定のタイプの特徴の計算値を含む。この例では、特徴チャネル0~5はHOGのビンであり、チャネル6は傾きの大きさであり、チャネル7~9はそれぞれの色成分である。
画像の或る行における2つの連続ウィンドウの特徴チャネルは、1つの位置を除くすべての位置で重なり合う。例えば、位置x、yにおけるウィンドウA、及び後続の位置x+4、yにおけるウィンドウBを考える。ウィンドウBの各特徴チャネルは、ウィンドウAの対応する特徴チャネルから1だけオフセットされている。例えば、ウィンドウAの特徴チャネル0が8つの値v1、v2、・・・、v8を含む場合、ウィンドウBの特徴チャネル0は8つの値v2、・・・、v8、v9を含む。同様に、位置x+8、yにおけるウィンドウCの特徴チャネル0は、8つの値v3、・・・、v8、v9、v10を含む。
画像の各スケールに対する特徴データは、図2に示すようにメモリにおいて配置される。行0で始まる画像の4行毎に、10個の特徴チャネルに対応する10行の特徴データが、或るスケールの或る行に対応する特徴データの行における連続値がベクトルロード命令によってロードされ得るように、メモリにおいて「スタック」される。このように、或るスケールの行0についての10行の特徴データがストアされ、その後、行4についての10行の特徴データ、行8についての10行の特徴データなどが続く。
分類器は、1280個の2進2レベルディシジョンツリーで構成され、各ツリーは各ノードにおいて特徴を評価する。図3の例に示すように、2進ディシジョンツリーはノード及びリーフを含み、2進数が各ノードで分割される。ノードはツリーにおけるディシジョンポイントであり、リーフは部分スコアを保持する。集合的決定が、或るウィンドウ内の複数のディシジョンツリーのトラバースから得られる部分スコアに基づいて形成される。各ノードにおいて、特徴値が閾値と比較される。比較の結果により、ノードから左分岐又は右分岐のいずれが選択されるかが決定される。各ノードにおいてディシジョンツリーに入力される特徴値により、4つのリーフの1つが選択される。
図4は、特徴タプルの一般的概念を図示する例である。特徴タプルは、分類器におけるディシジョンツリーにマッピングされる特徴のセットである。このマッピングは、AdBoost分類器のトレーニングの間に形成される。より具体的には、タプルにおける各特徴のウィンドウ内の位置が確立される。異なるディシジョンツリーは、入力として異なるタプルを有し得る。タプルにおける特徴の数は、ディシジョンツリーにおけるノードの数に等しい。
図5は、各ディシジョンツリーのリーフにおける部分スコアの一般的概念を図示する例である。特徴タプルがそのそれぞれのディシジョンツリーを介してトラバースされるとき、リーフの1つが選択され、このリーフはこの特定の特徴タプルについての部分スコアを含む。これらの部分スコアは、加算され、最小値、出口閾値、又はソフトカスケード閾値とも呼ばれる閾値と比較される。最小値が観察される場合、この時点で分類プロセスは終了され得る(終了され得る)か、或いは、付加的な極小値がある場合、付加的な極小値を観察するため残りのツリーのトラバースが継続し得る。任意の最小値で終了することに関する決定はアプリケーション固有であり得る。例示の分類器では、所与のウィンドウにおけるツリートラバースは、このウィンドウの評価の間に閾値と交差するとき終わる。
上述したように、各特徴タプルに含まれる特定の特徴、及びディシジョンツリーへのタプルのマッピングは、AdBoost分類器のトレーニングの間に決められる。各ツリーにおける各ノードに対し、そのノードで検討されるべき特徴のウィンドウ内の場所がトレーニングの間に決定される。また、上述したように、2つの連続オブジェクトパッチ間の対応する特徴のメモリストレージオフセットは1である。このように、各特徴タプルに対する特徴のベクトルがメモリにおいて利用可能である。これらの特徴ベクトルは、複数のオブジェクトパッチに対して同時に分類を実施するために、ベクトルプロセッサにおいて活用され得る。図7の方法を参照して説明されるように、N個の候補オブジェクトパッチが同時に評価され得る。ここで、Nは特徴サイズで除算されるベクトル幅である。例えば、ベクトル幅が512であり、特徴サイズが16ビットである場合、N=32である。
図6は、32個の連続候補オブジェクトパッチを仮定する場合の特徴ベクトルを図示する例である。この例では、最初の10行(0~9で示す)は、上述の10個の特徴チャネルにそれぞれ対応する。ディシジョンツリー600及びディシジョンツリー602両方に対し、各オブジェクトパッチに対する各ノードについての特徴値はメモリにおいて隣接しており、そのため、各ノードに対して32個の値のベクトルロードが可能である。
図7は、SIMDプロセッサ上でディシジョンツリーベースのAdBoost分類器を実行するための方法のフローチャートである。例えば、この方法は、N個の連続ウィンドウ(オブジェクトパッチ)を同時に評価する。ここで、Nは、特徴サイズで除算されたSIMDプロセッサベクトル幅である。説明のため、特徴サイズは16ビットであり、Nは32であると仮定する。また、分類器は、歩行者分類についてトレーニングされると仮定する。説明を明瞭にするために、この方法を図8~図18の例を参照して説明する。
AdBoost分類器は、2レベル2進ディシジョンツリーのリニア結合として構築されると仮定する。図3を参照して説明したように、及び、図8の例に示すように、2レベル2進ディシジョンツリーは、3つのノード及び4つのリーフを有する。図9の例に示すように、各ノードは論理的に、閾値T、オフセット値O、及び特徴Fを含む。特徴Fの値は、閾値Tと比較するためにオフセットOにおいてメモリからフェッチされる。分類器がトレーニングされるとき、各ツリーの各ノードに対して、閾値、オフセット、及び特定の特徴が特定され、各ツリーに対してリーフ値も特定される。幾つかの実施形態において、図10に示すように、AdBoost分類器の各ツリーのツリーパラメータ、すなわち、閾値、オフセット、及びリーフ値、がメモリに線形にストアされる。歩行者の存在についてAdBoost分類器が評価しようとする画像の特徴の抽出、及びこれらの特徴がメモリにどのようにストアされるかについては上述されている。
図11の例を参照すると、ウィンドウサイズが歩行者の予想サイズに基づく、スライディングウィンドウ手法を用いて歩行者について画像がサーチされる。サーチされるウィンドウ位置は、垂直及び水平両方に1ずつオフセットされる。また、ウィンドウ位置はラスタースキャン順にサーチされる。
図7の方法を再度参照すると、32個の連続ウィンドウ位置をサーチするために、特徴のベクトルが、分類器の第1のディシジョンツリーの各ノードに対してロードされる(600)。したがって、特徴の3つベクトルがツリーの各ノードに対してロードされる。各特徴に対するベクトルのメモリアドレスは、ツリーにおける特徴についてのオフセットOによって決定される。特徴がメモリに縞状に並べられる方式、ウィンドウ位置間のオフセットが1であること、及びSIMDプロセッサのベクトルロード能力のため、32個の連続ウィンドウ位置についての特徴が自動的にロードされる。図12は、このステップを図示する例である。
次いで、ツリーの各ノードに対して閾値ベクトルが生成される。すなわち、3つの閾値ベクトルが生成される。或るノードについての閾値ベクトルは、そのノードについて閾値を32回複製することによって生成される。SIMDプロセッサにおける複製は、メモリから1つのスカラー値を読み出し、このスカラー値でベクトルのすべての要素を満たす演算である。
次いで、ロードされた特徴ベクトルとそれぞれの対応する閾値ベクトルとの間でベクトル比較が実施されて(704)、それぞれの比較の結果を示す3つのマスクベクトルが生成される。各マスクベクトルは、各特徴値について比較が真であったか否かの指示を含む。図13は、閾値ベクトル及びそれらの比較を図示する例である。図13及び他の図において用いられる命名規則は、F<node><position>である。ここで、nodeはツリーのノード番号であり、positionは相対的なウィンドウ位置である。例えば、F23は、ウィンドウ位置3についてツリーのノード2において評価される特徴である。図14は、ベクトル比較演算から得られるマスクベクトルを図示する例である。この例では、各特徴とそれに対応する閾値との比較に対応するマスク値は、比較が偽の場合は0x0000であり、比較が真の場合は0xFFFFである。また、比較演算の結果を示すために他のマスク値が有用である。
次いで、32個のオブジェクトパッチの各々についてのツリートラバースについて部分スコア値、すなわちリーフ値、を選択するため、及び、各エントリが、ツリートラバースから対応するオブジェクトパッチについて得られる部分スコア(リーフ値)である、部分スコアベクトルを生成するために、3つのマスクベクトルが用いられる(706)。幾つかの実施形態では、部分スコア値のベクトルの生成は、図15~図17の例に図示するように実施される。図15に示すように、3つのマスクベクトルM1、M2、及びM3を用いて、ツリーの4つのリーフ値の各々に対して1つの、4つのリーフ選択マスクベクトルK1、K2、K3、及びK4が生成される。これらのリーフ選択マスクベクトルは、4つのリーフベクトルLV1、LV2、LV3、LV4からリーフ値を選択するために用いられる。ツリーのリーフについてのリーフベクトルは、図16に示されるとおりであり、対応するベクトルにおける各リーフ値L1、L2、L3、及びL4を32回複製することによって生成される。
マスクベクトルM1、M2、M3は、図15に示すように論理的に結合されて、リーフ選択マスクベクトルK1、K2、K3、K4が生成される。この論理は以下のとおりである。1)M1及びM2における対応する場所が真である場合、リーフ選択マスクベクトルK1におけるこの対応する場所を、リーフベクトルLV1における対応する場所を選択するためにセットする。2)M1における場所が真であり、M2における対応する場所が偽である場合、リーフ選択マスクベクトルK2におけるこの対応する場所を、リーフベクトルLV2における対応する場所を選択するためにセットする。3)M1における場所が偽であり、M3における対応する場所が真である場合、リーフ選択マスクベクトルK3におけるこの対応する場所を、リーフベクトルLV3における対応する場所を選択するためにセットする。4)M1及びM3における対応する場所が偽である場合、リーフ選択マスクベクトルK4におけるこの対応する場所を、リーフベクトルLV4における対応する場所を選択するためにセットする。論理マスクの組合せによってリーフ値を選択するためにセットされないリーフ選択マスクベクトルにおける場所は、リーフ値を選択しないようにセットされる。この例では、リーフ選択マスクベクトルにおける選択値は、対応するリーフベクトルにおける対応するリーフ値が選択されない場合は0x0000であり、対応するリーフ値が選択される場合は0xFFFFである。リーフ選択マスクベクトルは、対応するリーフに達するディシジョンツリーのトラバースパスにおけるノードについてのマスクベクトルの論理結合である。
結果のリーフ選択マスクベクトルK1、K2、K3、K4が図16に示されている。論理AND演算が、各リーフベクトルと、対応するリーフ選択マスクベクトルとの間で実施されて、各リーフベクトルからリーフ値(部分スコア)が選択される。これら4つの論理AND演算の結果は、図17に図示するような、4つのリーフ値ベクトルである。これらの4つのベクトルは論理OR演算と組み合わされて、各エントリが32個のウィンドウ位置のうち対応するウィンドウ位置についてディシジョンツリーを評価する結果である、部分スコアベクトルが生成される。
図7を再度参照すると、部分スコアベクトルは、累積されて(708)、32個のウィンドウの各々に対して1つのエントリを有する累積スコアベクトルとなる。例えば、部分スコアベクトルは、前のツリートラバースからのすべての前の部分スコアの合計をストアする、累積スコアベクトルに加算され得る。これ以降により詳細に説明するように、幾つかの実施形態では、分類を終了する基準を満足したウィンドウ位置についての部分スコアをマスク除去するため、部分スコアを累積する前に、出口マスクベクトルが部分スコアベクトルに適用され得る。
累積スコアベクトルは、出口ベクトルと比較され(710)、出口閾値未満のいかなる累積部分スコア値も最終スコアとして保存される。所与のウィンドウ位置についての累積部分スコア値が出口閾値未満である場合、このウィンドウについてのツリー評価、すなわち分類、が完了する。32個すべてのウィンドウについての分類プロセスが完了すると(712)、すなわち、すべての累積スコアが出口閾値未満であるか又はすべてのツリーがトラバースされると(714)、32個のウィンドウについての分類プロセスが終わり、最終累積スコアベクトルが戻される(716)。そうでない場合、分類器における次のツリーを用いて分類が継続する(700)。ツリーがトラバースされる順は、トレーニングプロセスの間に決定される。
幾つかの実施形態では、分類が32個のウィンドウ位置のすべてについて完了しないことがあるので、どのウィンドウ位置で分類プロセスが完了し、どの位置で完了していないかを示す、出口マスクベクトルが維持される。出口マスクベクトルの生成及び使用は、図18の例において図示されている。累積スコアベクトルの出口閾値ベクトルとのベクトル比較演算の結果、どの累積スコアが出口基準を満たし、どれが満たしていないかを示す、出口マスクベクトルが得られる。分類の次の反復では、出口マスクベクトルの逆ベクトル(「~」はビット反転)と部分スコアベクトルの論理AND演算が実施されて、前に存在したいかなるウィンドウ位置についての部分スコアもマスク除去される。結果として得られる部分スコアベクトルは、累積スコアベクトルに加算され、出口閾値ベクトルとの比較が実施され、更新された出口マスクが生成される。
図19は、図7の方法の実施形態を実行するように構成される、例示のデジタルシステム1900の簡略化ブロック図である。幾つかの実施形態では、このデジタルシステムは集積回路、すなわちシステムオンチップ、とされ得る。説明を簡潔にするため、他の図の説明で用いるような歩行者分類を仮定する。デジタルシステム1900は、マスタプロセッサ1902、カメラ1904、画像信号プロセッサ(ISP)1906、特徴抽出構成要素1908、SIMD命令セットデジタルシグナルプロセッサ(DSP)1910、及び共用メモリ1912を含む。マスタプロセッサ1902は、カメラ1904によって取り込まれるシーンにおける歩行者分類に必要とされる演算を実施するように他の構成要素の動作を制御する。マスタプロセッサ1902は、ARMリミテッドから入手可能な中央処理装置などの任意の好適なプロセッサとされ得る。
カメラ1904は、或るシーンの画像を取り込み、これらの画像をISP1906に提供する。ISP1906は、各画像に画像処理を実施して、特徴抽出のための画像を準備する。例えば、ISP1906は、画像に対して、ホワイトバランス処理、黒レベル調整、ノイズフィルタリング、RGBからYCbCrへの変換、及びエッジ強調などの演算を実施し得る。
特徴抽出構成要素1908は、ISP1906からの画像に対して特徴抽出を実施する。特徴抽出については上述されている。抽出された特徴は、共用メモリ1912にストアされて本方法において用いられる。
共用メモリ構成要素1912は、オンチップメモリ、外部メモリ、又はこれらの組合せとされ得る。任意の好適なメモリ設計が用いられ得る。例えば、メモリ構成要素1902は、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、同期DRAM(SDRAM)、読出し専用メモリ(ROM)、フラッシュメモリ、又はこれらの組合せを含み得る。
また、メモリ構成要素1902は、図6の方法の実施形態を実施するためのソフトウェア命令を含むAdBoost分類器1916のためのソフトウェア命令をストアする。また、メモリ構成要素は、特徴抽出構成要素1908よって計算される特徴1914、及び分類器1916によって用いられるディシジョンツリー1918をストアする。これらのソフトウェア命令及びディシジョンツリーの一部又は全部が、コンパクトディスク(CD)、ディスク、テープ、ファイル、又は任意の他のコンピュータ可読ストレージデバイスなどのコンピュータ可読媒体に初期的にストアされ得、デジタルシステム1900にロード及びストアされ得る。幾つかの場合、ソフトウェア命令は、また、コンピュータ可読媒体及びコンピュータ可読媒体のためのパッケージング材料を含む、コンピュータプログラム製品において販売され得る。幾つかの場合において、ソフトウェア命令は、リムーバブルコンピュータ可読媒体(例えば、フロッピーディスク、光ディスク、フラッシュメモリ、USBキー)を介して、又は別のコンピュータシステム(例えば、サーバ)上のコンピュータ可読媒体から伝送経路を介して、デジタルシステム1900に配信され得る。
DSP1910は、分類器1916のソフトウェア命令を実行し、抽出された特徴1914を用いて歩行者分類が実施される。DSPは、少なくとも、ベクトルロード演算、ベクトル比較演算、ベクトル加減算演算、ベクトル論理演算、並びに複製演算を提供するSIMD命令セットを実装する。適切なSIMD命令セットを備える任意の好適なDSPが用いられ得る。このようなDSPの1つを、図20を参照して説明する。分類の結果は、分類結果に基づく歩行者検出、及び歩行者検出の結果に基づく決定などのさらなる処理のため、マスタプロセッサ1902に通信される。
図20は、図7の方法の1つ又は複数の実施形態を実行するために適する、例示のSIMDデジタルシグナルプロセッサ(DSP)2000のハイレベルブロック図である。図示されるDSPは、テキサス・インスツルメンツ・インコーポレイテッドから入手可能なTMS32(320?)C66x DSPである。C66x DSP2000は、8個の機能ユニット、2個のレジスタファイル、及び2個のデータパスを含む。2個の汎用レジスタファイルは各々32個の32ビットレジスタ、合わせて64個のレジスタ、を含む。これらの汎用レジスタは、データのために有用であり、又は、データアドレスポインタとなり得る。サポートされるデータタイプには、パック8ビットデータ、パック16ビットデータ、32ビットデータ、40ビットデータ、及び64ビットデータが含まれる。C66x DSP2000は、16ビットデータのための4ウェイSIMD演算まで、及び8ビットデータのための8ウェイSIMD演算までサポートする。そのため、各データパスについてのSIMD幅は、128ビットのパックデータまで扱い得る幾つかの乗算演算以外は、64ビットである。C66x及び命令セットの詳細な説明は、「TMS320C66x DSP CPU及び命令セットリファレンスガイド」、SPRUGH7、2010年11月に記載されており、このリファレンスガイドは、参照により本明細書に組み込まれる。
上述したように、図7の方法は、N個のウィンドウ(オブジェクトパッチ)を同時に評価する。ここで、Nは特徴サイズで除算されるSIMD幅である。そのため、DSP2000では、方法の実施形態における特徴サイズが8ビットである場合、N=8となり、方法の実施形態における特徴サイズが16ビットである場合、N=4となる。
他の実施形態
例えば、ディシジョンツリーが2レベル2進ディシジョンツリーである仮定される実施形態を記載してきた。なお、ディシジョンツリーは、2レベルより多くのレベルを含み得、及び/又は2進数である必要はない。
別の例において、或るオブジェクトパッチについてのツリートラバースが、そのオブジェクトパッチについての累積部分スコアが出口閾値未満に下がるとき終わる実施形態を記載してきた。なお、このようなオブジェクトパッチについてのツリートラバースを終わらせるのではなく、付加的な極小値がある場合、それを観察するために残りのツリーのトラバースが継続し得る。
別の例において、分類器が歩行者分類を実施していると仮定して実施形態を記載してきた。例えば、交通標識、車両、自転車に乗る人、及び動物など、画像における他のタイプのオブジェクト分類について他の実施形態が可能である。
図面に示され本明細書において記載されるステップの1つ又は複数が、同時に実施され得、組み合わされ得、及び/又は、図面に示され及び/又は本明細書において記載される順と異なる順で実施され得る。したがって、実施形態は、図面に示され及び/又は本明細書で記載されるステップの特定の順に限定されない。
構成要素は、記載される機能性から逸脱することなく、異なる名称で呼ばれ得、及び/又は、本明細書において示されていない方式で組み合わされ得る。また、例えば、第1のデバイスが第2のデバイスに結合する場合、その接続は、直接的な電気接続を介して、他のデバイス及び接続を介する間接的な電気接続を介して、光学電気接続を介して、及び/又は、無線電機接続を介して、成され得る。
特許請求の範囲内で、記載された実施形態の改変が可能であり、他の実施形態が可能である。

Claims (20)

  1. 単一命令多重データ(SIMD)プロセッサに実装されるディシジョンツリーベースの適応ブースティング(AdBoost)分類器におけるオブジェクト分類のための方法であって、
    前記SIMDプロセッサに結合されるメモリ内の画像におけるN個の連続ウィンドウ位置から抽出される特徴ベクトルを受け取ること、及び
    前記特徴ベクトル及び前記SIMDプロセッサのベクトル命令を用いて前記AdBoost分類器によって前記N個の連続ウィンドウ位置を同時に評価すること、
    を含み、
    Nが、特徴のビットサイズで除算される前記SIMDプロセッサのベクトル幅であり、特徴ベクトルが、前記N個の連続ウィンドウ位置の各々に対して1つの特徴値の、N個の特徴値を含み、
    前記N個の連続ウィンドウ位置について分類が完了するまで、前記AdBoost分類器が、前記N個の連続ウィンドウ位置についてディシジョンツリーを同時にトラバースし、ディシジョンツリーが、複数のノードと、各ノードについての閾値と、複数のリーフとを含み、各リーフが部分スコアを含む、方法。
  2. 請求項1に記載の方法であって、
    前記N個の連続ウィンドウ位置を評価することが、
    前記SIMDプロセッサのベクトルロード命令を用いて前記特徴ベクトルの複数をロードすることであって、前記AdBoost分類器の1つのディシジョンツリーの各ノードに対して1つの特徴ベクトルがロードされる、前記ロードすること、
    各ノードに対するマスクベクトルを生成するため、前記SIMDプロセッサのベクトル比較命令を用いて各特徴ベクトルを対応する閾値ベクトルと比較することであって、前記対応する閾値ベクトルが、前記特徴ベクトルに対応する前記ノードについての前記閾値のN個のコピーを含み、前記マスクベクトルが、前記特徴ベクトルの前記N個の特徴の各々に対して1つの比較結果の、N個の比較結果を含む、前記比較すること、
    前記マスクベクトルと前記ディシジョンツリーの前記リーフの前記部分スコア値とに基づいて部分スコアベクトルを生成することであって、前記部分スコアベクトルが、前記N個の連続ウィンドウ位置の各々に対して1つの部分スコア値の、N個の部分スコア値を含む、前記部分スコアベクトルを生成すること、
    前記部分スコアを累積されたスコアベクトルへと累積することであって、前記累積されたスコアベクトルが、前記N個の連続ウィンドウ位置の各々に対して1つの累積されたスコア値の、N個の累積されたスコア値を含む、前記累積すること、及び
    オブジェクト分類が前記N個の連続ウィンドウ位置の1つ又は複数について終了され得るか否かを決定するため、前記SIMDプロセッサのベクトル比較命令を用いて、前記累積されたスコアベクトルを出口閾値ベクトルと比較すること、
    を含む、方法。
  3. 請求項2に記載の方法であって、
    部分スコアベクトルを生成することが、
    前記マスクベクトルに基づいて前記ディシジョンツリーの前記リーフの各々についてリーフ選択マスクベクトルを生成すること、及び
    前記N個のウィンドウ位置の各々について部分スコアを前記リーフベクトルから選択するため、各リーフ選択マスクベクトルの、対応するリーフベクトルとの論理AND演算を実施すること、
    を含み、
    リーフ選択マスクベクトルが、前記リーフ選択マスクベクトルに対応する前記リーフに達する前記1つのディシジョンツリーのトラバースパスにおけるノードについてのマスクベクトルの論理結合であり、
    対応するリーフベクトルが、前記リーフの部分スコアのN個のコピーを含む、方法。
  4. 請求項1に記載の方法であって、
    前記ディシジョンツリーが2レベル2進ディシジョンツリーである、方法。
  5. 請求項1に記載の方法であって、
    前記AdBoost分類器が歩行者分類についてトレーニングされる、方法。
  6. 請求項1に記載の方法であって、
    前記SIMDプロセッサがデジタルシグナルプロセッサである、方法。
  7. デジタルシステムであって、
    単一命令多重データ(SIMD)プロセッサ、
    前記SIMDプロセッサに結合され、画像から抽出される特徴をストアするように構成される、メモリ構成要素、
    前記メモリ構成要素にストアされる複数のディシジョンツリーであって、各ディシジョンツリーが、複数のノードと、各ノードについての閾値と、複数のリーフとを含み、各リーフが部分スコアを含む、前記複数のディシジョンツリー、及び
    前記メモリ構成要素にストアされるオブジェクト分類についてトレーニングされるディシジョンツリーベースの適応ブースティング(AdBoost)分類器、
    を含み、
    前記AdBoost分類器が前記SIMDプロセッサ上で実行可能であり、前記AdBoost分類器がオブジェクト分類について前記複数のディシジョンツリーを用い、前記AdBoost分類器が、前記特徴及び前記SIMDプロセッサのベクトル命令を用いてN個の連続ウィンドウ位置を同時に評価するように構成され、前記AdBoost分類器が、前記N個の連続ウィンドウ位置について分類が完了するまで、前記N個の連続ウィンドウ位置についてディシジョンツリーを同時にトラバースし、Nが、特徴のビットサイズで除算される前記SIMDプロセッサのベクトル幅である、デジタルシステム。
  8. 請求項7に記載のデジタルシステムであって、
    前記メモリ構成要素に結合され、画像における前記N個の連続ウィンドウ位置から前記特徴を抽出するように構成される、特徴抽出構成要素を含む、デジタルシステム。
  9. 請求項8に記載のデジタルシステムであって、
    前記画像を提供するために前記特徴抽出構成要素に結合されるカメラを含む、デジタルシステム。
  10. 請求項7に記載のデジタルシステムであって、
    前記AdBoost分類器が、前記N個の連続ウィンドウ位置を評価するように構成され、前記評価することが、
    前記SIMDプロセッサのベクトルロード命令を用いて前記メモリ構成要素から複数の特徴ベクトルをロードすることであって、前記複数のディシジョンツリーの1つのディシジョンツリーの各ノードに対して1つの特徴ベクトルがロードされ、特徴ベクトルが、前記N個の連続ウィンドウ位置の各々に対して1つの特徴値の、N個の特徴値を含む、前記ロードすること、
    各ノードに対するマスクベクトルを生成するため、前記SIMDプロセッサのベクトル比較命令を用いて各特徴ベクトルを対応する閾値ベクトルと比較することであって、前記対応する閾値ベクトルが、前記特徴ベクトルに対応する前記ノードについての前記閾値のN個のコピーを含み、前記マスクベクトルが、前記特徴ベクトルの前記N個の特徴の各々に対して1つの比較結果の、N個の比較結果を含む、前記比較すること、
    前記マスクベクトルと前記ディシジョンツリーの前記リーフの前記部分スコア値とに基づいて部分スコアベクトルを生成することであって、前記部分スコアベクトルが、前記N個の連続ウィンドウ位置の各々に対して1つの部分スコア値の、N個の部分スコア値を含む、前記部分スコアベクトルを生成すること、
    前記部分スコアを累積して累積されたスコアベクトルにすることであって、前記累積されたスコアベクトルが、前記N個の連続ウィンドウ位置の各々に対して1つの累積されたスコア値の、N個の累積されたスコア値を含む、前記累積すること、及び
    前記N個の連続ウィンドウ位置の1つ又は複数についてオブジェクト分類が終了され得るかを決定するため、前記SIMDプロセッサのベクトル比較命令を用いて前記累積されたスコアベクトルを出口閾値ベクトルと比較すること、
    によって成される、デジタルシステム。
  11. 請求項10に記載のデジタルシステムであって、
    部分スコアベクトルを生成することが、
    前記マスクベクトルに基づいて前記ディシジョンツリーの前記リーフの各々についてリーフ選択マスクベクトルを生成すること、及び
    前記N個のウィンドウ位置の各々について前記リーフベクトルから部分スコアを選択するため、各リーフ選択マスクベクトルの、対応するリーフベクトルとの論理AND演算を実施すること、
    を含み、
    リーフ選択マスクベクトルが、前記リーフ選択マスクベクトルに対応する前記リーフに達する前記1つのディシジョンツリーのトラバースパスにおけるノードについてのマスクベクトルの論理結合であり、
    対応するリーフベクトルが前記リーフの部分スコアのN個のコピーを含む、デジタルシステム。
  12. 請求項7に記載のデジタルシステムであって、
    前記ディシジョンツリーが、2レベル2進ディシジョンツリーである、デジタルシステム。
  13. 請求項7に記載のデジタルシステムであって、
    前記AdBoost分類器が歩行者分類についてトレーニングされる、デジタルシステム。
  14. 請求項7に記載のデジタルシステムであって、
    前記SIMDプロセッサがデジタルシグナルプロセッサである、デジタルシステム。
  15. 単一命令多重データ(SIMD)プロセッサ上で実行されるとき、ディシジョンツリーベースの適応ブースティング(AdBoost)分類器における物体分類のための方法を実行させるソフトウェア命令をストアする非一時的コンピュータ可読媒体であって、前記方法が、
    前記SIMDプロセッサに結合されるメモリ内の画像におけるN個の連続ウィンドウ位置から抽出される特徴ベクトルを受け取ることであって、Nが、特徴のビットサイズで除算される前記SIMDプロセッサのベクトル幅であり、特徴ベクトルが、前記N個の連続ウィンドウ位置の各々に対して1つの特徴値の、N個の特徴値を含む、前記特徴ベクトルを受け取ること、及び
    前記特徴ベクトル及び前記SIMDプロセッサのベクトル命令を用いて前記AdBoost分類器によって前記N個の連続ウィンドウ位置を同時に評価すること、
    を含み、
    前記AdBoost分類器が、前記N個の連続ウィンドウ位置について分類が完了するまで、前記N個の連続ウィンドウ位置についてディシジョンツリーを同時にトラバースし、ディシジョンツリーが、複数のノードと、各ノードについての閾値と、複数のリーフとを含み、各リーフが部分スコアを含む、非一時的コンピュータ可読媒体。
  16. 請求項15に記載の非一時的コンピュータ可読媒体であって、
    前記N個の連続ウィンドウ位置を評価することが、
    前記SIMDプロセッサのベクトルロード命令を用いて前記特徴ベクトルの複数をロードすることであって、前記AdBoost分類器の1つのディシジョンツリーの各ノードに対して1つの特徴ベクトルがロードされる、前記特徴ベクトルの複数をロードすること、
    各ノードに対してマスクベクトルを生成するため、前記SIMDプロセッサのベクトル比較命令を用いて各特徴ベクトルを対応する閾値ベクトルと比較することであって、前記対応する閾値ベクトルが、前記特徴ベクトルに対応する前記ノードについての前記閾値のN個のコピーを含み、前記マスクベクトルが、前記特徴ベクトルの前記N個の特徴の各々に対して1つの比較結果の、N個の比較結果を含む、前記比較すること、
    前記マスクベクトルと前記ディシジョンツリーの前記リーフの前記部分スコア値とに基づいて部分スコアベクトルを生成することであって、前記部分スコアベクトルが、前記N個の連続ウィンドウ位置の各々に対して1つの部分スコア値の、N個の部分スコア値を含む、前記部分スコアベクトルを生成すること、
    前記部分スコアを累積して累積されたスコアベクトルにすることであって、前記累積されたスコアベクトルが、前記N個の連続ウィンドウ位置の各々に対して1つの累積されたスコア値の、N個の累積されたスコア値を含む、前記累積すること、及び
    前記N個の連続ウィンドウ位置の1つ又は複数についてオブジェクト分類が終了され得るかを決定するため、前記SIMDプロセッサのベクトル比較命令を用いて前記累積されたスコアベクトルを出口閾値ベクトルと比較すること、
    を含む、非一時的コンピュータ可読媒体。
  17. 請求項16に記載の非一時的コンピュータ可読媒体であって、
    部分スコアベクトルを生成することが、
    前記マスクベクトルに基づいて前記ディシジョンツリーの前記リーフの各々についてリーフ選択マスクベクトルを生成することであって、リーフ選択マスクベクトルが、前記リーフ選択マスクベクトルに対応する前記リーフに達する前記1つのディシジョンツリーのトラバースパスにおけるノードについてのマスクベクトルの論理結合である、前記リーフ選択マスクベクトルを生成すること、及び
    前記N個のウィンドウ位置の各々について前記リーフベクトルから部分スコアを選択するため、各リーフ選択マスクベクトルの、対応するリーフベクトルとの論理AND演算を実施すること、
    を含み、
    対応するリーフベクトルが前記リーフの部分スコアのN個のコピーを含む、非一時的コンピュータ可読媒体。
  18. 請求項15に記載の非一時的コンピュータ可読媒体であって、
    前記ディシジョンツリーが2レベル2進ディシジョンツリーである、非一時的コンピュータ可読媒体。
  19. 請求項15に記載の非一時的コンピュータ可読媒体であって、
    前記AdBoost分類器が歩行者分類についてトレーニングされる、非一時的コンピュータ可読媒体。
  20. 請求項15に記載の非一時的コンピュータ可読媒体であって、
    前記SIMDプロセッサがデジタルシグナルプロセッサである、非一時的コンピュータ可読媒体。
JP2022176623A 2015-07-06 2022-11-02 適応ブースティング(afdaboost)分類器における効率的なディシジョンツリートラバース Pending JP2023022031A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US14/792,596 2015-07-06
US14/792,596 US10325204B2 (en) 2015-07-06 2015-07-06 Efficient decision tree traversal in an adaptive boosting (AdaBoost) classifier
PCT/US2016/041159 WO2017007831A1 (en) 2015-07-06 2016-07-06 Efficient decision tree traversals in an adaptive boosting (adaboost) classifier
JP2018500704A JP7242975B2 (ja) 2015-07-06 2016-07-06 ディシジョンツリーベースの適応ブースティング分類器におけるオブジェクト分類のための方法、デジタルシステム、並びに非一時的コンピュータ可読記憶媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018500704A Division JP7242975B2 (ja) 2015-07-06 2016-07-06 ディシジョンツリーベースの適応ブースティング分類器におけるオブジェクト分類のための方法、デジタルシステム、並びに非一時的コンピュータ可読記憶媒体

Publications (1)

Publication Number Publication Date
JP2023022031A true JP2023022031A (ja) 2023-02-14

Family

ID=57686191

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018500704A Active JP7242975B2 (ja) 2015-07-06 2016-07-06 ディシジョンツリーベースの適応ブースティング分類器におけるオブジェクト分類のための方法、デジタルシステム、並びに非一時的コンピュータ可読記憶媒体
JP2022176623A Pending JP2023022031A (ja) 2015-07-06 2022-11-02 適応ブースティング(afdaboost)分類器における効率的なディシジョンツリートラバース

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018500704A Active JP7242975B2 (ja) 2015-07-06 2016-07-06 ディシジョンツリーベースの適応ブースティング分類器におけるオブジェクト分類のための方法、デジタルシステム、並びに非一時的コンピュータ可読記憶媒体

Country Status (5)

Country Link
US (2) US10325204B2 (ja)
EP (1) EP3320488A4 (ja)
JP (2) JP7242975B2 (ja)
CN (1) CN107851197B (ja)
WO (1) WO2017007831A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10268923B2 (en) * 2015-12-29 2019-04-23 Bar-Ilan University Method and system for dynamic updating of classifier parameters based on dynamic buffers
US11449789B2 (en) * 2016-02-16 2022-09-20 Micro Focus Llc System and method for hierarchical classification
US10579493B2 (en) * 2016-08-22 2020-03-03 Oath Inc. Systems and methods for determining user engagement with electronic devices
CN106650806B (zh) * 2016-12-16 2019-07-26 北京大学深圳研究生院 一种用于行人检测的协同式深度网络模型方法
CN107403424B (zh) * 2017-04-11 2020-09-18 阿里巴巴集团控股有限公司 一种基于图像的车辆定损方法、装置及电子设备
JP7069898B2 (ja) * 2018-03-16 2022-05-18 株式会社リコー 学習識別装置および学習識別方法
US11144637B1 (en) * 2018-08-24 2021-10-12 Ca, Inc. Systems and methods for executing decision trees
CN111046926B (zh) * 2019-11-26 2023-09-19 山东浪潮科学研究院有限公司 一种计算机视觉图像分类集成学习方法
US20230237097A1 (en) * 2020-06-25 2023-07-27 Nec Corporation Information processing device, information processing method, and recording medium
US11971953B2 (en) 2021-02-02 2024-04-30 Inait Sa Machine annotation of photographic images
JP2024506691A (ja) 2021-02-18 2024-02-14 アイエヌエイアイティ エスエイ 2d画像において視認可能な使用形跡を使用した3dモデルの注釈付け
US11544914B2 (en) 2021-02-18 2023-01-03 Inait Sa Annotation of 3D models with signs of use visible in 2D images

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2642039B2 (ja) 1992-05-22 1997-08-20 インターナショナル・ビジネス・マシーンズ・コーポレイション アレイ・プロセッサ
US7515756B2 (en) * 2003-06-23 2009-04-07 Shoestring Research, Llc. Region segmentation and characterization systems and methods for augmented reality
CN100560025C (zh) * 2007-07-26 2009-11-18 上海交通大学 带有弱分类器的组合系数的人脸检测方法
CN101236608B (zh) * 2008-01-25 2010-08-04 清华大学 基于图片几何结构的人脸检测方法
US8533129B2 (en) 2008-09-16 2013-09-10 Yahoo! Inc. Efficient data layout techniques for fast machine learning-based document ranking
US8923631B2 (en) * 2011-08-17 2014-12-30 Volcano Corporation Method and device for classifying vascular objects using classification trees evaluated on a graphics processing unit
US8923585B1 (en) 2012-01-31 2014-12-30 Given Imaging Ltd. Method and system for image-based ulcer detection
US9235769B2 (en) * 2012-03-15 2016-01-12 Herta Security, S.L. Parallel object detection method for heterogeneous multithreaded microarchitectures
CN103902591B (zh) * 2012-12-27 2019-04-23 中国科学院深圳先进技术研究院 构建决策树分类器的方法及装置
US9971959B2 (en) 2013-03-15 2018-05-15 Nvidia Corporation Performing object detection operations via a graphics processing unit
US20150036942A1 (en) * 2013-07-31 2015-02-05 Lsi Corporation Object recognition and tracking using a classifier comprising cascaded stages of multiple decision trees
US9286217B2 (en) * 2013-08-26 2016-03-15 Qualcomm Incorporated Systems and methods for memory utilization for object detection

Also Published As

Publication number Publication date
CN107851197B (zh) 2022-06-07
US20170011294A1 (en) 2017-01-12
JP7242975B2 (ja) 2023-03-22
US10325204B2 (en) 2019-06-18
EP3320488A4 (en) 2018-07-18
WO2017007831A1 (en) 2017-01-12
JP2018520443A (ja) 2018-07-26
CN107851197A (zh) 2018-03-27
US10977560B2 (en) 2021-04-13
EP3320488A1 (en) 2018-05-16
US20190251451A1 (en) 2019-08-15

Similar Documents

Publication Publication Date Title
JP7242975B2 (ja) ディシジョンツリーベースの適応ブースティング分類器におけるオブジェクト分類のための方法、デジタルシステム、並びに非一時的コンピュータ可読記憶媒体
CN104933420B (zh) 一种场景图像识别方法和场景图像识别设备
JP2014531097A (ja) マルチレイヤ連結成分をヒストグラムと共に用いるテキスト検出
CN107330027B (zh) 一种弱监督的深度台标检测方法
JP2012058787A (ja) 情報処理装置、およびその処理方法
CN116595208B (zh) 高光谱图像的分类方法、装置及电子设备
US20140169684A1 (en) Distance Metric for Image Comparison
WO2016095068A1 (en) Pedestrian detection apparatus and method
Samangouei et al. Face-magnet: magnifying feature maps to detect small faces
Li et al. What is happening in a still picture?
CN115439718A (zh) 一种结合监督学习和特征匹配技术的工业检测方法、系统、存储介质
CN111177811A (zh) 一种应用于云平台的消防点位自动布图的方法
US9858293B2 (en) Image processing apparatus and image processing method
Mace et al. Overhead detection: Beyond 8-bits and rgb
CN111709951B (zh) 目标检测网络训练方法及系统及网络及装置及介质
JP2009110525A (ja) 画像検索方法及び画像検索装置
CN111680691B (zh) 文字检测方法、装置、电子设备和计算机可读存储介质
CN110222657B (zh) 单步人脸检测器优化系统、方法、装置
CN113989671A (zh) 基于语义感知与动态图卷积的遥感场景分类方法及系统
Estrada et al. Appearance-based keypoint clustering
Ghahremani et al. Interwoven texture-based description of interest points in images
Chen et al. FPAN: fine-grained and progressive attention localization network for data retrieval
CN115222940B (zh) 一种语义分割方法、系统、设备和存储介质
Kamal et al. Traffic-sign detection and classification under challenging conditions: a deep neural network based approach
Wu et al. Receptive field pyramid network for object detection

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221125

A625 Written request for application examination (by other person)

Free format text: JAPANESE INTERMEDIATE CODE: A625

Effective date: 20221125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231107

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240408