JP2014002734A - オブジェクト認識設備及び方法 - Google Patents

オブジェクト認識設備及び方法 Download PDF

Info

Publication number
JP2014002734A
JP2014002734A JP2013124489A JP2013124489A JP2014002734A JP 2014002734 A JP2014002734 A JP 2014002734A JP 2013124489 A JP2013124489 A JP 2013124489A JP 2013124489 A JP2013124489 A JP 2013124489A JP 2014002734 A JP2014002734 A JP 2014002734A
Authority
JP
Japan
Prior art keywords
object recognition
edge direction
edge
local
distribution pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013124489A
Other languages
English (en)
Inventor
Wei Fan
ファヌ・ウエイ
Akihiro Minagawa
明洋 皆川
Shun Son
俊 孫
Yoshinobu Hotta
悦伸 堀田
Satoshi Naoi
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2014002734A publication Critical patent/JP2014002734A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】オブジェクト認識設備及び方法を提供する。
【解決手段】かかるオブジェクト認識設備は、候補オブジェクトの複数のローカル領域のうちの各ローカル領域のエッジ方向分布パターンを計算し、前記候補オブジェクトの複数のローカルエッジ方向分布パターン特徴とするためのエッジ方向分布パターン計算装置;及び、前記複数のローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行うための分類器を含む。
【選択図】図2

Description

本発明は、画像処理分野に関し、具体的に、パターン認識及びヒューマン・マシン相互作用分野に関し、より具体的には、本発明は、オブジェクト認識に用いる設備及び方法に関する。
コンピュータ視覚(computer vision)応用では、デジタル画像又はビデオ入力に基づく自動オブジェクト認識は一つの重要な技術である。オブジェクト認識システムの一部として、快速且つ有効なオブジェクト認識方法は、非常に重要であり、計算能力が低い装置、例えば、携帯電話、タブレットコンピュータ等について言えば特にそうである。オブジェクト認識における難点は、オブジェクトを記述する安定な特徴を如何に抽出するかにある。
従来の方法では、通常、幾つかの簡単なルールを設計して大量の基本特徴を定義し、それから、機械学習方法、例えば、boostingを用いて、大量の訓練サンプルにより、幾つかの最有効な特徴を選択して分類器(classifier)を構成し、ターゲット・オブジェクトと背景とを区分する。従来の特徴は、例えば、Haar-like矩形特徴、ローカル・バイナリ・パターン(LBP)、勾配方向ヒストグラム(HOG)等を含む。
しかしながら、これらの方法には、幾つかの欠点が存在する。例えば、Haar-like特徴は、簡単過ぎて、満足なパフォーマンスを取得するために、学習により得られた分類器は、通常、千以上の矩形特徴を有する必要がある。大量の特徴抽出により、訓練プロセス及びテストプロセスでは、時間がかなりかかる。また、LBP特徴を採用する利点は、画像のグレースケール全体の変換の影響を受けないことにあるが、グレースケールが反転の場合、該特徴は大きく変わることがある。図1に示すように、オブジェクト(例えば、カップ)が、異なる輝度の背景、例えば、図1aに示すような暗い背景及び図1bに示すような明るい背景に位置する時に、同じ位置におけるLBP特徴は全く異なる。比べて言えば、HOG特徴は、背景グレースケール反転に比較的ロバストであるが、該特徴ベクトルは、4つのローカル・ヒストグラムのカスケード接続により得られた高次元ベクトル(例えば、36次元)である。このような高次元の特徴空間では、弱い分類器の訓練は時間がかなりかかるので、比較的簡単な弱い分類器、例えば、線形サポート・ベクター・マシン(SVM)しか受けることができない。
従来技術における上述のようなニーズに鑑み、本発明の目的は、ローカルエッジ方向分布パターン特徴を採用して分類を行うことによりオブジェクトを認識することにある。採用される特徴の候補セットは小さく、記述が簡単であり、且つ背景グレースケール反転の影響を受けることがないので、本発明は、計算量を削減することができると同時に、より良い認識パフォーマンスを提供することができる。
上述の目的を達成するために、本発明の一側面によれば、オブジェクト認識設備が提供される。かかる設備は、候補オブジェクトの複数のローカル領域のうち各ローカル領域のエッジ方向分布パターンを計算し、前記候補オブジェクトの複数のローカルエッジ方向分布パターン特徴とするためのエッジ方向分布パターン計算装置;及び、前記複数のローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行うための分類器を含む。
本発明の他の側面によれば、オブジェクト認識方法が提供される。かかる方法は、候補オブジェクトの複数のローカル領域のうち各ローカル領域のエッジ方向分布パターンを計算し、前記候補オブジェクトの複数のローカルエッジ方向分布パターン特徴とし;及び、分類器を用いて、前記複数のローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行うことを含む。
本発明の他の側面によれば、対応するコンピュータ・プログラム・コード、コンピュータ読み取り可能な記憶媒体、及びコンピュータ・プログラム・プロダクトが提供される。
オブジェクトが暗い背景に位置する様子を示す図である。 オブジェクトが明るい背景に位置する様子を示す図である。 本発明の一実施例によるオブジェクト認識設備の構造図である。 本発明の一実施例によるオブジェクト認識設備におけるエッジ方向分布パターン計算装置の構造図である。 本発明の一実施例においてエッジ方向の確率分布を計算する一例を示す図である。 本発明の一実施例において図4中のヒストグラムに対して二値化を行う様子を示す図である。 本発明の一実施例によるオブジェクト認識方法のフローチャートである。 本発明の一実施例によるオブジェクト認識方法において各ローカル領域のエッジ方向分布パターンを計算するステップのフローチャートである。 本発明の実施例による方法及び/又は設備を実現し得る汎用パーソナルコンピュータの例示的な構造を示すブロック図である。
以下、添付した図面を参照しながら本発明の好適な実施形態について説明する。
なお、以下の説明は、次のような順序で行われる。
1.オブジェクト認識設備
1-1.エッジ方向分布パターン計算装置
i)エッジ抽出モジュール
ii)確率分布計算モジュール
iii)二値化モジュール
1-2.分類器
2.オブジェクト認識方法
3.本発明の設備及び方法を実施するための計算設備
また、本開示の一つの図面又は一つの実施例に記載の要素及び特徴は、一つ以上の他の図面又は実施例に示す要素及び特徴と組み合わせることができる。
[1.オブジェクト認識設備]
まず、図2を参照して、本発明の実施例によるオブジェクト認識設備の構造を説明する。図2に示すように、オブジェクト認識設備100は、エッジ方向分布パターン計算装置101及び分類器102を含む。そのうち、エッジ方向分布パターン計算装置101は、候補オブジェクトの複数のローカル領域のうちの各ローカル領域のエッジ方向分布パターンを計算し、上述の候補オブジェクトの複数のローカルエッジ方向分布パターン特徴とするように構成される。分類器102は、上述の複数のローカルエッジ方向分布パターン特徴に基づいて、上述の候補オブジェクトに対して分類を行うように構成される。
具体的に、オブジェクト認識設備100に画像が入力された時に、オブジェクト認識設備100は、異なるサイズのスライディング・ウィンドウを用いて画像をスキャンし、異なる位置及び異なるサイズのオブジェクトを検出することができる。それ相応に、各スライディング・ウィンドウにおける画像は、候補オブジェクトである。候補オブジェクトに対して、エッジ方向分布パターン計算装置101は、所定のサイズを有する特徴ウィンドウを用いて候補オブジェクトに対してスキャンを行う。特徴ウィンドウにより限定された各ローカル領域に対して、そのエッジ方向分布パターンを計算する。そのうち、特徴ウィンドウのサイズ、位置及びアスペクト比は、該特徴ウィンドウが候補オブジェクトの範囲内に位置することができれば、任意に指定し又は変更することができる。
候補オブジェクトのスキャンが完成した後に、エッジ方向分布パターン計算装置101は、一組のエッジ方向分布パターンを、該候補オブジェクトの複数のローカルエッジ方向分布パターン特徴として取得し、そして、これらの特徴を分類器102に送信する。
分類器102は、例えば、大量の正のサンプル(オブジェクトであることを示す)及び負のサンプル(オブジェクトではないことを示す)を採用して予め訓練を行うことにより得られたものである。よって、訓練により得られた分類器102は、エッジ方向分布パターン計算装置101からの複数のローカルエッジ方向分布パターン特徴に基づいて、候補オブジェクトに対して分類を行い、例えば、候補オブジェクトが検出すべきオブジェクトであるかどうかを判断することができる。
次に、図3を参照してエッジ方向分布パターン計算装置101の構造について更に詳しく説明する。
<1-1.エッジ方向分布パターン計算装置>
図3に示すように、エッジ方向分布パターン計算装置101は、エッジ抽出モジュール1001、確率分布計算モジュール1002及び二値化モジュール1003を含む。
i)エッジ抽出モジュール
エッジ抽出モジュール1001は、各ローカル領域におけるエッジを抽出するために用いられる。一例として、エッジ抽出モジュール1001は、ローカル領域における勾配ベクトルの分布を計算することにより、該ローカル領域におけるエッジを抽出することができる。
具体的に、例えば、次の式に示すように、Sobel演演算子を用いてエッジの抽出を実現することができる。
そのうち、I(x,y)は、横坐標がxであり、縦坐標がyである処の画素(ピクセル)のグレースケール値を表し、G(x,y)は、対応する画素の勾配ベクトルのノルム(norm)であり、θ(x,y)は、対応する画素の勾配ベクトルの方向である。また、Tは、背景のノイズの上限を表す閾値であり、式1では、各画素の勾配ベクトルのノルムと該閾値とを比較し、勾配ベクトルのノルムが該閾値以下である画素を除去することにより、背景を遮る(フィルタリング)する。Tの値は、実際の応用に応じて設定してもよい。
理解すべきは、上述にはエッジ抽出の一つの方法を示しているが、エッジ抽出モジュール1001の実現は、これに限られず、他の各種のエッジ検出アルゴリズム、例えば、Roberts演算子、prewitt演算子、log演算子、canny演算子等を採用してもよい。
式1による処理の後に、エッジ抽出モジュール1001は、各ローカル領域における勾配ベクトルの分布を取得し、各領域におけるエッジを抽出し、そして、それらを確率分布計算モジュール1002に送信する。
ii)確率分布計算モジュール
確率分布計算モジュール1002は、抽出されたエッジの方向の確率分布を計算するように構成される。一実施例では、確率分布計算モジュール1002は、エッジ画素の方向が同じである勾配ベクトルのノルムを累加(累積)して該方向の確率とし、エッジの方向の確率分布を取得する。
好ましくは、確率分布計算モジュール1002は、エッジの方向の値の範囲を複数の区間に分け、そして、各区間における全ての方向の確率を累加して、エッジ方向が該区間における確率とし、これにより、エッジ方向が上述の複数の区間の間における確率分布を取得してエッジの方向の確率分布とするように構成される。
具体的に、例えば、エッジの方向の値の範囲をK個の区間に分け、そして、ヒストグラムを採用して、確率を示す形式としてもよい。一つのローカル領域に対応する勾配ヒストグラムの第k個の値は、次の式により計算することができる。
そのうち、binkは、第k個の区間の値の範囲を表す。また、区間の数Kは、任意の正の整数値であってもよい。一例では、8桁からなる1バイトに合わせて、Kの値は、8であってもよい。勾配方向の範囲は、0°〜180°又は0°〜360°であってもよく、K個の区間は、該範囲に均一に分布し、また、整除できるために、まず、Kを9に設定し、それから、h0+h8でh0を置き換える。
図4は、上述のKが8である場合に計算されたエッジ方向の確率分布の一例を示す図であり、そのうち、Fは、候補オブジェクトにおける一つのローカル領域をカバーする特徴ウィンドウであり、H1及びH2は、それぞれ、得られた該特徴ウィンドウに対応する9つの柱(column;棒)のヒストグラム及び8つの柱のヒストグラムを表し、勾配方向の範囲は、0°〜180°を採用し、よって、ヒストグラムH1における各柱の範囲は、20°であり、ヒストグラムH2は、ヒストグラムH1の第一個の柱及び第9個の柱を併合した後のヒストグラムである。ヒストグラムの中間の柱は、垂直方向を表し、ヒストグラムの柱が表す値は、左から右へ順にh0、h1、…、h7に対応する。
なお、上述にはヒストグラムを採用して確率を表しているが、当業者が理解すべきは、確率を表す形式はこれに限定されない。
他の実施例では、確率分布計算モジュール1002は、エッジ画素のうち方向が同じである画素の個数を累加して該方向の確率とし、これにより、上述のエッジの方向の確率分布を取得するように構成される。同様に、該確率分布は、好ましくは、上述のヒストグラムの形式で表すこともできるが、ここでは、その詳しい説明を省略する。
確率分布計算モジュール1002は、計算により得られたエッジ方向の確率分布を二値化モジュール1003に送信する。
iii)二値化モジュール
二値化モジュール1003は、上述の確率分布を二値化し、これにより、上述のローカル領域のエッジ方向分布パターンを取得する。好ましくは、二値化モジュール1003は、バイナリ(2進数)の1及び0を用いて二値化を行い、そして、得られたバイナリの1及び0のシーケンスを上述のエッジ方向分布パターン特徴とする。一実施例では、二値化モジュール1003は、確率の平均値又は中間値を閾値として二値化を行うように構成される。具体的に、二値化モジュール1003は、各エッジ方向の確率と、確率の平均値又は中間値としての閾値との差を取得し(引き算)、そして、得られた値の正負に基づいて、該エッジ方向のバイナリ桁が1か0であることを確定し、最終的に、一つのバイナリの1及び0のシーケンスを取得して該ローカル領域のエッジ方向分布パターン特徴とする。また、このバイナリのシーケンスを他の進法(例えば、10進法)の値に変換してもよい。
一例として、ヒストグラムを採用して確率を表す場合、二値化モジュール1003は、次の式でその機能を実現することができる。
そのうち、
(外1)
は、所定の閾値を表し、且つ
(外2)
であり、式3により、K次元のヒストグラムをK個の2進数(バイナリ)に量化することができる。図5の真中の図では、8個の2進数の空間分布を示し、このような空間分布は、エッジ方向の分布パターンである。そのうち、h0、…、h7は、それぞれ、各方向区間に対応する2進数を表し、これらの2進数は、該方向区間上の勾配が主導的作用をするものであるかどうかを表すことができる。例えば、1は、該方向区間上の勾配が主導的作用をするものであることを表し、0は、その逆である。限定用ではない一つの例として、該空間分布パターンの表現として、該K個の2進数を直列接続してK桁の2進数のコード(シーケンス)を成し、ローカル領域のエッジ方向分布パターン特徴としてもよい。図4に示すヒストグラムH2を考慮する時に、二値化モジュール1003は、例えば、図5に示すように、8桁の2進数のコード「00001100」を得ることができる。また、この2進数のコードを10進法又は他の進法の値に変換してもよく、例えば、図5では、2進数のコード「00001100」は、10進数の12に変換することができる。K=8である場合、その値の範囲は、[0,255]である。
なお、上述の例では、二値化時に確率の平均値を閾値として採用しているが、閾値の選択は、これに限定されない。他の実施例では、二値化モジュール1003は、確率の中間値を閾値として採用する二値化を実施するように構成される。具体的に、確率の中間値は、確率を昇順(又は降順)に並べ換えた後に得られたシーケンスの中間に位置する値である。ヒストグラムを採用して確率を表す場合、図4に示すようなヒストグラムを得た時に、ヒストグラムの各柱が代表する確率値を昇順に並べ換え、例えば、シーケンス{h1,h7,h2,h0,h6,h3,h4,h5}を取得したとすると、このシーケンスには偶数個の項があるので、中間値が中間の二つの項の平均値であり、即ち、中間値
(外3)
を採用して閾値とする。
上述から分かるように、本発明のローカルエッジ方向分布パターン特徴は、2進数のシーケンス又は他の進法の数値であり、これに基づいて、訓練により、高効率な非線形分類器を得ることができる。また、該特徴の候補セットは小さく、且つエッジ方向分布に基づくものであるので、背景グレースケール反転の影響を受けることが無く、これにより、本発明の実施例は、より良い認識パフォーマンスを実現することができる。本発明の実施例によるオブジェクト認識設備100は、特に、一定の安定な形状を有する物体(オブジェクト)を記述するのに適する。
その後、エッジ方向分布パターン計算装置101は、得られた複数のローカルエッジ方向分布パターン特徴を分類器102に送信する。
<1-2.分類器>
分類器102は、上述の複数のローカルエッジ方向分布パターン特徴に基づいて、候補オブジェクトに対して分類を行う。一実施例では、分類器102は、上述の複数のローカルエッジ方向分布パターンからオンラインで選択されたサブセットにおけるローカルエッジ方向分布パターン特徴に基づいて、上述の候補オブジェクトに対して分類を行う。
本発明の実施例によるローカルエッジ方向分布パターン特徴は、順序なしの記述又は類別の特徴であり、即ち、特徴値の絶対サイズは意味がないので、閾値比較に基づく普通の分類器は、該特徴に適合しない。次のように特徴サブセットに基づいて分けられた分類器を採用することができる。
そのうち、Ωは、ローカルエッジ方向分布パターン特徴の値の範囲であり、K=8の場合、Ω={0、1、…、255}である。
上述のように、分類器102に関しては、予め訓練を行う必要がある。訓練では、式4におけるS1及びS2の確定を行い、例えば、CART(classification and regression tree)アルゴリズムに採用の「Gini “purity” criteria」により、この確定を行うことができる。
なお、上述には、特徴サブセットに基づいて分けられた分類器を例として示しているが、採用可能な分類器は、これに限定されない。他の実施例では、決定木分類器(Decision Tree Classifier)を採用指定もよい。
[2.オブジェクト認識方法]
以上、図面を参照して本発明によるオブジェクト認識設備の実施例について説明した。以下、図面を参照して本発明によるオブジェクト認識方法の実施例について簡単に説明するが、その細部については、上述のオブジェクト認識設備の説明を参照することができる。
図6は、本発明の一実施例によるオブジェクト認識方法のフローチャートである。該方法は、候補オブジェクトの複数のローカル領域のうちの各ローカル領域のエッジ方向分布パターンを計算し、上述の候補オブジェクトの複数のローカルエッジ方向分布パターン特徴とし(S11);及び、分類器を用いて、上述の複数のローカルエッジ方向分布パターン特徴に基づいて、上述の候補オブジェクトに対して分類を行う(S12)ことを含む。
そのうち、スライディング・ウィンドウに基づくオブジェクト認識方法の実施ステップを採用することができる。画像を入力した時に、各スライディング・ウィンドウがカバーする画像領域を候補オブジェクトとし、そして、それに対して図6のフローチャートに示す処理を行い、該候補オブジェクトが検出すべきオブジェクトであるかどうかを判断する。スライディング・ウィンドウのサイズ及び位置を変えることにより、異なるサイズのオブジェクトの認識を実現することができる。
図7は、本発明の一実施例によるオブジェクト認識方法における各ローカル領域のエッジ方向分布パターンを計算するステップのフローチャートである。該ステップは、上述のローカル領域におけるエッジを抽出し(S21);上述のエッジの方向の確率分布を計算し(S22);及び、上述の確率分布を二値化し、上述のローカル領域のエッジ方向分布パターンを取得する(S23)ことを含む。
一つの好ましい実施例では、上述のローカル領域における勾配ベクトルの分布を計算することにより、上述のローカル領域におけるエッジを抽出する。勾配ベクトルは、各画素のグレースケールに対して、例えば、Sobel演算子を用いて計算を行うことにより得ることができる。
一つの好ましい実施例では、エッジ画素の方向が同じである勾配ベクトルのノルムを累加(累積)して該方向の確率とすることにより、上述のエッジの方向の確率分布を得ることができる。
他の好ましい実施例では、エッジ画素のうち方向が同じである画素の個数を累加して該方向の確率とすることにより、上述のエッジの方向の確率分布を得ることができる。
実施にあたって、好ましくは、エッジ方向の値の範囲を複数の区間に分割し、そして、各区間における全ての方向の確率を累加して、エッジ方向が該区間における確率とすることにより、エッジ方向が上述の複数の区間の間における確率分布を得て上述のエッジの方向の確率分布とする。区間の数は、任意の正の整数であってもよいが、8桁からなる1バイトに合わせることを考慮して、区間の数は、好ましくは、8である。
一つの好ましい実施例では、上述の確率分布の二値化は、2進数(バイナリ)の1及び0を用いて二値化を行い、そして、得られた2進数のシーケンスを上述のエッジ方向分布パターン特徴とすることを含む。そのうち、上述の確率分布の二値化は、確率の平均値又は中間値を閾値として上述の二値化を行うことを含む。
上述の二値化を行った後に、2進制のコード(シーケンス)を得ることができる。一つの好ましい実施例では、さらに、上述のバイナリのシーケンスを他の進制(例えば、10進制)の数値に変換し、上述のエッジ方向分布パターン特徴の表現としてもよい。
一つの好ましい実施例では、分類器を用いて、上述の複数のローカルエッジ方向分布パターン特徴に基づいて、上述の候補オブジェクトに対して分類を行うことは、さらに、上述の複数のローカルエッジ方向分布パターン特徴からオンラインで一つのサブセットを選択し、上述の分類器を用いて、該サブセットにおけるローカルエッジ方向分布パターン特徴に基づいて、上述の候補オブジェクトに対して分類を行うことを含む。
本発明が採用するローカルエッジ方向分布パターン特徴は、順序なしの記述又は類別の特徴であり、即ち、特徴値の絶対サイズは意味がないので、閾値比較に基づく普通の分類器は、該特徴に適合しない。一つの好ましい実施例では、上述の分類器は、特徴サブセットに基づいて分けられた分類器又は決定木分類器である。
そのうち、特徴サブセットに基づいて分けられた分類器は、好ましくは、「Gini “purity” criteria」に基づいて訓練を行うことにより得られたものである。
[3.本発明の設備及び方法を実施するための計算設備]
上述の設備における各構成モジュールやユニットなどは、ソフトウェア、ファームウェア、ハードウェア又はそれらの任意の組み合わせの方式で実現されてもよい。ソフトウェア又はファームウェアにより実現される場合は、記憶媒体又はネットワークから、専用ハードウェア構造を有する装置(例えば、図8に示す汎用装置1100)に、このソフトウェア又はファームウェアを構成するプログラムをインストールすることができ、この装置は、各種のプログラムがインストールされている時に、上述の各種の機能を行うことができる。
図8は、本発明の実施例による方法及び/又は設備を実現し得る汎用パーソナルコンピュータの例示的な構造を示すブロック図である。
図8では、中央処理ユニット(CPU)1101は、ROM 1102に記憶されているプログラム、又は、記憶部1108からRAM 1103にロードされているプログラムに基づいて、各種の処理を行う。RAM 1103は、必要に応じて、CPU 1101が各種の処理などを実行する時に必要なデータを記憶する。CPU 1101、ROM 1102及びRAM 1103は、バス1104により互いに接続される。入力/出力インタフェース1105もバス1104に接続される。
また、入力/出力インタフェース1105に接続されるのは、入力部1106(キーボード、マウスなどを含み)、出力部1107(例えばCRT、LCDのような表示器及びスピーカーなどを含み)、記憶部1108(ハードディスクなどを含み)、通信部1109(例えばLANカード、モデムなどのネットワークアクセスカードを含み)をも含む。通信部1109は、ネットワーク、例えばインターネットを介して通信処理を行う。必要に応じて、ドライブ1110も入力/出力インタフェース1105に接続され得る。取り外し可能な媒体1111、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体記憶装置なども、必要に応じてドライブ1110に取り付けされてもよく、その中から読み出されたコンピュータプログラムは、必要に応じて記憶部1108にインストールされ得る。
ソフトウェアにより上述の一連の処理を実現する場合、ネットワーク、例えばインターネット、又は、記憶媒体、例えば取り外し可能な媒体1111からソフトウェアを構成するプログラムをインストールしてもよい。
なお、当業者が理解すべきは、このような記憶媒体は、中にプログラムが記憶されており、ユーザにプログラムを提供するよう装置と独立して配られる図8に示すような取り外し可能な媒体1111に限定されない。取り外し可能な媒体1111の例としては、磁気ディスク(フロッピー(登録商標)ディスクを含む)、光ディスク(CD−ROM及びDVDを含む)、光磁気ディスク(MD(登録商標)を含む)、及び半導体メモリを含む。或いは、記憶媒体はROM 1102、記憶部1108に含まれるハードディスクなどであってもよく、それらにはプログラムが記憶されており、且つそれらを含む装置とともにユーザに配られてもよい。
また、本開示は、マシン(例えば、コンピュータ)読取可能な指令コードからなるプログラムプロダクトにも関する。このような指令コードは、マシンに読み取られて実行される時に、上述の実施例による処理方法を実行することができる。それ相応に、上述のマシン読取可能な指令コードからなるプログラムプロダクトを記憶している記憶媒体も本開示に含まれている。このような記憶媒体は、磁気ディスク(フロッピーディスク)、光ディスク、光磁気ディスク、メモリカード、メモリメモリスティックなどを含むが、これらに限定されない。
また、本開示による上述の方法の各処理プロセスは、各種のマシン読み取り可能な記憶媒体に記憶されているコンピュータ実行可能なプログラムで実現され得ることも明らかである。
また、本開示の目的は、次の方法で実現されてもよい。即ち、上述の実行可能なプログラムコードを記憶している記憶媒体を直接又は間接的にシステム又は装置に提供し、且つ、このシステム又は装置内のコンピュータ又はCPUは、上述のプログラムコードを読み出して実行する。このとき、システム又は装置はプログラムを実行する機能を有すれば、本発明の実施例はプログラムに限定されず、且つ、このプログラムは任意の形式であってもよく、例えば、オブジェクトプログラム、インタープリター実行可能なプログラム、又は、オペレーティングシステムへのスクリプトプログラムであってもよい。
上述のマシン読み取り可能な記憶媒体は、各種の記憶器及び記憶ユニット、半導体装置、光、磁気及び光磁気ディスクのような磁気ディスクユニット、及び情報記憶に適する他の媒体等を含むが、これらに限定されない。
また、クライント・コンピュータは、インターネットを介して、対応するサーバに接続し、且つ、本発明によるコンピュータ・プログムラ・コードをコンピュータにダウンロードしてインストールし、それから、このプログラムを実行することにより、本発明を実現することもできる。
最後に説明すべきは、本文では、例えば、「第一」及び「第二」などのような関係を表す語は、1つの実体又は操作と、もう1つの実体又は操作とを区分するためだけのものであり、これらの実体又は操作の間にそのような実際の関係又は順序が存在するとの意味又は示唆を有しない。また、「含む」、「有する」などのような語又はその他の変形語は、非排他的な「含む」を包括するために用いられ、これにより、一連の要素を含むプロセス、方法、物品又は装置は、これらの要素だけでなく、明記されていない他の要素をも含んでもよく、或いは、このプロセス、方法、物品又は装置が所有する固有の要素をも含むものである。より多くの限定が無い場合、「・・・を含む」という語句で限定される要素は、この要素を含むプロセス、方法、物品又は装置に存在する他の同じ要素を排除しない。
また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
オブジェクト認識設備であって、
候補オブジェクトの複数のローカル領域のうちの各ローカル領域のエッジ方向分布パターンを計算し、前記候補オブジェクトの複数のローカルエッジ方向分布パターン特徴とするように構成されるエッジ方向分布パターン計算装置;及び、
前記複数のローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行うように構成される分類器を含む、オブジェクト認識設備。
(付記2)
付記1に記載のオブジェクト認識設備であって、
前記エッジ方向分布パターン計算装置は、
前記ローカル領域におけるエッジを抽出するためのエッジ抽出モジュール;
前記エッジの方向の確率分布を計算するための確率分布計算モジュール;及び、
前記確率分布を二値化し、前記ローカル領域のエッジ方向分布パターンを得るための二値化モジュールを含む、オブジェクト認識設備。
(付記3)
付記2に記載のオブジェクト認識設備であって、
前記エッジ抽出モジュールは、前記ローカル領域における勾配ベクトルの分布を計算することにより、前記ローカル領域におけるエッジを抽出するように構成される、オブジェクト認識設備。
(付記4)
付記3に記載のオブジェクト認識設備であって、
前記確率分布計算モジュールは、エッジ画素の方向が同じである勾配ベクトルのノルムを累加して該方向の確率とすることにより、前記エッジの方向の確率分布を得るように構成される、オブジェクト認識設備。
(付記5)
付記3に記載のオブジェクト認識設備であって、
前記確率分布計算モジュールは、エッジ画素のうち方向が同じである画素の個数を累加して該方向の確率とすることにより、前記エッジの方向の確率分布を得るように構成される、オブジェクト認識設備。
(付記6)
付記4又は5に記載のオブジェクト認識設備であって、
前記確率分布計算モジュールは、エッジ方向の値の範囲を複数の区間に分け、各区間における全ての方向の確率を累加して、エッジ方向が該区間における確率とすることにより、エッジ方向が前記複数の区間の間における確率分布を得て、前記エッジの方向の確率分布とするように構成される、オブジェクト認識設備。
(付記7)
付記2乃至5のうちの何れか一つに記載のオブジェクト認識設備であって、
前記二値化モジュールは、2進数の1及び0を用いて二値化を行い、得られた2進数のシーケンスを前記エッジ方向分布パターン特徴とするように構成される、オブジェクト認識設備。
(付記8)
付記2に記載のオブジェクト認識設備であって、
前記二値化モジュールは、確率の平均値又は中間値を閾値として用いて、前記二値化を行うように構成される、オブジェクト認識設備。
(付記9)
付記1乃至4のうちの何れか一つに記載のオブジェクト認識設備であって、
前記分類器は、前記複数のローカルエッジ方向分布パターンからオンラインで選択されたサブセットにおけるローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行うように構成される、オブジェクト認識設備。
(付記10)
付記1乃至4のうちの何れか一つに記載のオブジェクト認識設備であって、
前記分類器は、特徴サブセットに基づいて分けられた分類器又は決定木分類器である、オブジェクト認識設備。
(付記11)
オブジェクト認識方法であって、
候補オブジェクトの複数のローカル領域のうちの各ローカル領域のエッジ方向分布パターンを計算し、前記候補オブジェクトの複数のローカルエッジ方向分布パターン特徴とし;及び、
分類器を用いて、前記複数のローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行うことを含む、オブジェクト認識方法。
(付記12)
付記11に記載のオブジェクト認識方法であって、
前記各ローカル領域のエッジ方向分布パターンを計算するステップは、
前記ローカル領域におけるエッジを抽出し;
前記エッジの方向の確率分布を計算し;及び、
前記確率分布を二値化し、前記ローカル領域のエッジ方向分布パターンを得ることを含む、オブジェクト認識方法。
(付記13)
付記12に記載のオブジェクト認識方法であって、
前記ローカル領域における勾配ベクトルの分布を計算することにより、前記ローカル領域におけるエッジを抽出する、オブジェクト認識方法。
(付記14)
付記13に記載のオブジェクト認識方法であって、
前記エッジの方向の確率分布を計算することは、
エッジ画素の方向が同じである勾配ベクトルのノルムを累加して該方向の確率とすることにより、前記エッジの方向の確率分布を得ることを含む、オブジェクト認識方法。
(付記15)
付記13に記載のオブジェクト認識方法であって、
前記エッジの方向の確率分布を計算することは、
エッジ画素のうち方向が同じである画素の個数を累加して該方向の確率とすることにより、前記エッジの方向の確率分布を得ることを含む、オブジェクト認識方法。
(付記16)
付記14又は15に記載のオブジェクト認識方法であって、
前記エッジの方向の確率分布を計算することは、さらに、
エッジ方向の値の範囲を複数の区間に分け、各区間における全ての方向の確率を累加して、エッジ方向が該区間における確率とすることにより、エッジ方向が前記複数の区間の間における確率分布を得て、前記エッジの方向の確率分布とすることを含む、オブジェクト認識方法。
(付記17)
付記12乃至15のうちの何れか一つに記載のオブジェクト認識方法であって、
前記確率分布を二値化することは、
2進数の1及び0を用いて二値化を行い、得られた2進数のシーケンスを前記エッジ方向分布パターン特徴とすることを含む、オブジェクト認識方法。
(付記18)
付記12に記載のオブジェクト認識方法であって、
前記確率分布を二値化することは、
確率の平均値又は中間値を閾値として用いて、前記二値化を行うことを含む、オブジェクト認識方法。
(付記19)
付記11乃至14のうちの何れか一つに記載のオブジェクト認識方法であって、
分類器を用いて前記複数のローカルエッジ方向分布パターン特徴に基づいて前記候補オブジェクトに対して分類を行うことは、さらに、
前記複数のローカルエッジ方向分布パターン特徴からオンラインで一つのサブセットを選択し、前記分類器を用いて、該サブセットにおけるローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行うことを含む、オブジェクト認識方法。
(付記20)
付記11乃至14のうちの何れか一つに記載のオブジェクト認識方法であって、
前記分類器は、特徴サブセットに基づいて分けられた分類器又は決定木分類器である、オブジェクト認識方法。
(付記21)
コンピュータに、付記11乃至20の何れか1つに記載の方法を実行させるためのプログラム。
(付記22)
付記21に記載のプログラムを記録したコンピュータ読み取り可能な記憶媒体。
以上、本発明の好ましい実施形態を説明したが、本発明はこの実施形態に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の技術的範囲に属する。

Claims (10)

  1. オブジェクト認識設備であって、
    候補オブジェクトの複数のローカル領域のうちの各ローカル領域のエッジ方向分布パターンを計算し、前記候補オブジェクトの複数のローカルエッジ方向分布パターン特徴とするためのエッジ方向分布パターン計算装置;及び
    前記複数のローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行うための分類器を含む、オブジェクト認識設備。
  2. 請求項1に記載のオブジェクト認識設備であって、
    前記エッジ方向分布パターン計算装置は、
    前記ローカル領域におけるエッジを抽出するためのエッジ抽出モジュール;
    前記エッジの方向の確率分布を計算するための確率分布計算モジュール;及び
    前記確率分布に対して二値化を行い、前記ローカル領域のエッジ方向分布パターンを得るための二値化モジュールを含む、オブジェクト認識設備。
  3. 請求項2に記載のオブジェクト認識設備であって、
    前記エッジ抽出モジュールは、前記ローカル領域における勾配ベクトルの分布を計算し、前記ローカル領域におけるエッジを抽出する、オブジェクト認識設備。
  4. 請求項3に記載のオブジェクト認識設備であって、
    前記確率分布計算モジュールは、エッジ画素の方向が同じである勾配ベクトルのノルムを累積して該方向の確率とし、前記エッジの方向の確率分布を取得する、オブジェクト認識設備。
  5. 請求項3に記載のオブジェクト認識設備であって、
    前記確率分布計算モジュールは、エッジ画素のうちの方向が同じである画素の個数を累積して該方向の確率とし、前記エッジの方向の確率分布を取得する、オブジェクト認識設備。
  6. 請求項4又は5に記載のオブジェクト認識設備であって、
    前記確率分布計算モジュールは、エッジ方向の値の範囲を複数の区間に分割し、各区間における全ての方向の確率を累積して、エッジ方向が該区間における確率とし、エッジ方向が前記複数の区間の間における確率分布を取得して、前記エッジの方向の確率分布とする、オブジェクト認識設備。
  7. 請求項2乃至5のうちの何れか1項に記載のオブジェクト認識設備であって、
    前記二値化モジュールは、バイナリの1及び0を用いて二値化を行い、得られたバイナリのシーケンスを前記エッジ方向分布パターン特徴とする、オブジェクト認識設備。
  8. 請求項2に記載のオブジェクト認識設備であって、
    前記二値化モジュールは、確率の平均値又は中間値を閾値として用いて前記二値化を行う、オブジェクト認識設備。
  9. 請求項1乃至4のうちの何れか1項に記載のオブジェクト認識設備であって、
    前記分類器は、前記複数のローカルエッジ方向分布パターンからオンラインで選択されたサブセットにおけるローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行う、オブジェクト認識設備。
  10. オブジェクト認識方法であって、
    候補オブジェクトの複数のローカル領域のうちの各ローカル領域のエッジ方向分布パターンを計算し、前記候補オブジェクトの複数のローカルエッジ方向分布パターン特徴とし;及び
    分類器を用いて、前記複数のローカルエッジ方向分布パターン特徴に基づいて、前記候補オブジェクトに対して分類を行うことを含む、オブジェクト認識方法。
JP2013124489A 2012-06-15 2013-06-13 オブジェクト認識設備及び方法 Pending JP2014002734A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210203740.6A CN103514453B (zh) 2012-06-15 2012-06-15 对象识别设备和方法
CN201210203740.6 2012-06-15

Publications (1)

Publication Number Publication Date
JP2014002734A true JP2014002734A (ja) 2014-01-09

Family

ID=49897146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013124489A Pending JP2014002734A (ja) 2012-06-15 2013-06-13 オブジェクト認識設備及び方法

Country Status (2)

Country Link
JP (1) JP2014002734A (ja)
CN (1) CN103514453B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9824462B2 (en) 2014-09-19 2017-11-21 Samsung Electronics Co., Ltd. Method for detecting object and object detecting apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011203853A (ja) * 2010-03-24 2011-10-13 Toyota Central R&D Labs Inc 画像処理装置及びプログラム
JP2012088787A (ja) * 2010-10-15 2012-05-10 Canon Inc 画像処理装置、画像処理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100452081C (zh) * 2007-06-01 2009-01-14 华南理工大学 一种人眼定位及人眼状态识别方法
CN101609509B (zh) * 2008-06-20 2012-02-15 中国科学院计算技术研究所 一种基于预分类器的图像物体检测方法及系统
CN102024141A (zh) * 2010-06-29 2011-04-20 上海大学 基于Gabor小波变换和局部二值模式优化的人脸识别方法
CN102243706B (zh) * 2011-08-18 2014-12-10 杭州海康威视数字技术股份有限公司 基于目标边缘方向的目标分类方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011203853A (ja) * 2010-03-24 2011-10-13 Toyota Central R&D Labs Inc 画像処理装置及びプログラム
JP2012088787A (ja) * 2010-10-15 2012-05-10 Canon Inc 画像処理装置、画像処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
松島 千佳、外3名: "物体検出のためのRelational HOG特徴量とワイルドカードを用いたバイナリーのマスキング", 電子情報通信学会論文誌, vol. 第J94−D巻 第8号, JPN6017011731, 1 August 2011 (2011-08-01), JP, pages 1172 - 1182, ISSN: 0003531423 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9824462B2 (en) 2014-09-19 2017-11-21 Samsung Electronics Co., Ltd. Method for detecting object and object detecting apparatus

Also Published As

Publication number Publication date
CN103514453B (zh) 2017-07-11
CN103514453A (zh) 2014-01-15

Similar Documents

Publication Publication Date Title
Jin et al. A mobile application of American sign language translation via image processing algorithms
US9576196B1 (en) Leveraging image context for improved glyph classification
Lai et al. Efficient circular thresholding
US9547800B2 (en) System and a method for the detection of multiple number-plates of moving cars in a series of 2-D images
Haddad et al. Multifeature, sparse-based approach for defects detection and classification in semiconductor units
Dubey et al. Species and variety detection of fruits and vegetables from images
KR20100014092A (ko) 오브젝트 궤적에 기반한 모션 검출 시스템 및 방법
US9575566B2 (en) Technologies for robust two-dimensional gesture recognition
EP3664019A1 (en) Information processing device, information processing program, and information processing method
CN110717497B (zh) 图像相似度匹配方法、装置及计算机可读存储介质
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
O’Connor et al. Facial recognition using modified local binary pattern and random forest
US11816946B2 (en) Image based novelty detection of material samples
US10810433B2 (en) Method and system for tracking objects
Cerman et al. A mobile recognition system for analog energy meter scanning
Du et al. Context-based text detection in natural scenes
Yue et al. An efficient color quantization based on generic roughness measure
US9269017B2 (en) Cascaded object detection
JP2019220014A (ja) 画像解析装置、画像解析方法及びプログラム
WO2016192213A1 (zh) 一种图像特征提取方法和装置、存储介质
Lahiani et al. Hand gesture recognition system based on local binary pattern approach for mobile devices
Shubhangi et al. Classification of Indian classical dance forms
JP2014002734A (ja) オブジェクト認識設備及び方法
Nasiri et al. A new binarization method for high accuracy handwritten digit recognition of slabs in steel companies
Barnich et al. Robust analysis of silhouettes by morphological size distributions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170601

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171114