JP5773935B2 - シーンにおけるオブジェクトを分類する方法 - Google Patents

シーンにおけるオブジェクトを分類する方法 Download PDF

Info

Publication number
JP5773935B2
JP5773935B2 JP2012090679A JP2012090679A JP5773935B2 JP 5773935 B2 JP5773935 B2 JP 5773935B2 JP 2012090679 A JP2012090679 A JP 2012090679A JP 2012090679 A JP2012090679 A JP 2012090679A JP 5773935 B2 JP5773935 B2 JP 5773935B2
Authority
JP
Japan
Prior art keywords
image
classifier
scene
sequence
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012090679A
Other languages
English (en)
Other versions
JP2012230671A (ja
Inventor
ジュネイト・オンジェル・トゥゼル
グンゴール・ポラトゥカン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/092,408 external-priority patent/US8824548B2/en
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2012230671A publication Critical patent/JP2012230671A/ja
Application granted granted Critical
Publication of JP5773935B2 publication Critical patent/JP5773935B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、包括的には画像処理に関し、より詳細には、コンピュータービジョン応用において、レンジスキャナーを用いてオブジェクトを分類することに関する。
オブジェクト分類は、コンピュータービジョン応用で広く用いられている。最も一般的な応用は、2Dカメラ画像を用いるが、3D距離データ用の正確な分類方法が必要である。例えば、オブジェクトは、組立ライン上で移動している部品である場合がある。
新しいセンサー技術の革新により、新しいタイプのデータ収集技法がもたらされる。関連して、オートメーションの新たな応用が現れ、機械がますます多くの人間の労働に取って代わっている。
一般に、オブジェクト分類は、誘導ループ検出器、映像検出器、音響検出器、距離センサー及び赤外線検出器等のいくつかのタイプのデータ取得技法を使用することができる。1つのシステムは、オブジェクト検出及びオブジェクト分類のために距離情報及び輝度情報を出力するレーザーセンサーを使用する。
オブジェクトを分類する方法を提供することが求められている。
本発明の実施の形態は、1組の1つ又は複数の1次元レーザーラインスキャナーを備えたスキャナーによって取得される距離データの最大マージン分類及び識別確率的逐次モデリングに基づいて、オブジェクトを分類する方法を提供する。
本方法は、前処理段階及び分類段階を含む。前処理ステップ中に、メディアンフィルター処理、背景及び前景検出、3次元再構築並びにオブジェクト事前情報等の種々の技法を用いることにより、距離データからノイズを除去し、最大識別特徴を抽出する。そして、分類器は訓練される。分類器は、外観分類器(appearance classifier)、種々の推論技法を用いる系列分類器(sequence classifier)及び状態機械実施部(enforcement)から構成される。
これにより、オブジェクトを分類する方法を提供することができる。
本発明の実施の形態によるオブジェクト分類のブロック図である。 本発明の実施の形態による1次元レーザーラインスキャナーを備えたスキャナーの概略図である。
表記法
本明細書では、以下の表記法を用いて、明示的に定義されているか又は説明から明らかである、本明細書に記載する全ての変数を表す。本明細書では、太字を用いて、ベクトル、すなわちこの場合はデータ列を表し、非太字を用いて単一変数を表す。なお、本明細書の数式を除く本文では、太字に相当する文字を、当該文字にbを付して表記する(すなわち、太字のxをxbと表記する)。例えば、
Figure 0005773935
は、添え字iが付されている列であり、xi,jは、時間ステップjにおける列iの単一変数を表す。任意の単一列に対して、本明細書では、列の添え字iを省き、列をXb=<x,x,…,x>と書く。
概要
図1は、本発明の実施形態によるオブジェクト80を分類するシステム及び方法を示す。距離データ101は、スキャナー90によって本方法に対する入力としてのオブジェクト80から取得される。
図2に示すように、スキャナー90は、1次元レーザーラインセンサーを含む。スキャナーは、特定されるべきオブジェクトの近くのポール201に配置される。本発明を、1つのセンサーのみで機能させることができることが理解される。
図2は、各センサーに対する視野203も示す。センサーは、オブジェクトの1つ又は複数の側面図を取得する。
距離データの1次元(ライン)測定値が経時的に蓄積され、オブジェクトの距離プロファイルの2次元画像が構成される。2次元距離画像は、オブジェクトタイプの分類に用いられる。出力は、オブジェクトのクラス109である。
上記ステップは、本技術分野において既知であるようにメモリ及び入出力インターフェースに接続されたプロセッサにおいて実行することができる。
本方法は、前処理段階及び分類段階を含む。前処理中、本発明では、距離データからノイズを除去し(110)、無関係な背景情報を除去し(120)、距離情報及びセンサーがスキャンした幾何学的形状を用いて残りの前景画素を3次元に投影し(130)、距離を補正し(140)、特徴を抽出する(155)。
分類170のために、本発明では、多クラスサポートベクトルマシン(SVM:support vector machine)等の外観分類器の出力を、条件付き確率場(CRF:conditional random field)分類等の系列分類器に対する特徴として使用して、初期クラスラベルを取得し、オブジェクト及び特徴属性の識別特性並びに逐次構造を用いてオブジェクトの構造を実施し(180)、最後にオブジェクトクラス109を取得する。
前処理
初期ノイズ除去
距離データに関する1つの主な問題は、非ゼロの入射角、オブジェクト表面の反射率、スキャナーの不完全な動作及び環境からの干渉ノイズによるノイズである。したがって、本発明では、まず距離データのノイズを除去する。
本発明では、2次元メディアンフィルターを用いて距離データからノイズを除去する。メディアンフィルター処理は、信号からノイズを除去しながら、詳細情報、例えばエッジを保存する傾向がある。本発明では、フィルター処理されるべき入力画像の対応する画素の周囲でM×N近傍ウインドウを使用し、ここでM及びNはデータから経験的に指定される。メディアンフィルター処理は、比較的小さい近傍であっても大幅にノイズを低減する。詳細情報とノイズ除去の量とのトレードオフは、フィルターの次数によってバランスがとられる。次数が高いほどノイズ低減が高いが、画像に残る詳細が少なくなる。
背景推定及び除去
取得中にいくつかの画素が完全に破損される可能性がある。そのため、背景推定の第1のステップにおいて、本発明では、画素の各行の中央振幅に基づいて「良」画素及び「不良」画素を確定する。そして、シーンにオブジェクトがないときに各良画素の距離値の履歴に単一ガウス分布を当てはめることにより、画素に基づく背景推定を用いる。同じ画素からの新たなテストサンプル各々において、確定は、前景又は背景のいずれかとして仮説検定に基づく。不良画素の場合、判断は、信号の振幅値を用いる仮説検定に基づく。最後に、ノイズを含む画素の無関係な領域を除去するために、背景マッピングに対してメディアンフィルター処理を用いる。
3次元投影
環境条件及び配置エラーに応じて、オブジェクトに対するセンサーの位置及び向きが不正確である場合がある。この問題を解決するために、初期センサー情報を用いて良前景画素を3次元に逆投影し、基礎面(ground plane)に平面を当てはめる。平面当てはめに対して、ランダムサンプルコンセンサス(RANSAC:RANdom SAmple Consensus)プロセスを用いる。この平面は、センサー位置及び向きを変更する。推定された基準面(base plane)は、ワールド座標系のy=0面に対応するものと仮定される。基準面及びセンサーの視野に対するセンサーの相対位置及び向きが与えられると、逆投影によりワールド座標系における各センサー測定値の三次元座標を確定する。3次元投影は、以下の方法で有用である。本発明では、3次元値から、距離補正の間に用いる平面的な側面図情報、及び特徴を抽出する。さらに、画像面に対するワールドの遠近歪みの影響を受けやすい2次元画像とは異なり、3次元値から取得する特徴は、スケール不変であり、より多くの情報を含んでいる。
距離補正
測定値のノイズレベルは、表面反射に基づいて変化する。例えば、黒いオブジェクトは、ノイズを含む測定値をもたらす可能性がある。本発明では、オブジェクトの3次元情報及び平面的な側面構造を利用して、距離値を更に補正する。ここでは、測定値の各列は3次元空間の垂直線に由来するものと仮定する。しかしながら、スキャンのラインが異なると奥行き値が異なる可能性がある(ポール及び本体が異なる奥行き値にある可能性がある)。本発明では、最初に、測定値の各列に対する奥行き値の最上位30%を確定する。
次に、経験的に指定されたフィルター次数を用いて経時的にこれらの測定値をメディアンフィルター処理し、測定値の各列の奥行き値を取得する。メディアンフィルターの次数が大きいほど、同じ奥行きを有すると仮定される面積が広くなる。そして、推定された平面に投影された距離値を用いて異常な距離値を補正する。距離補正後、ノイズを含むサンプルは、正しい位置に再配置され、オブジェクトは平滑な構造を有する。
特徴
本発明では、3次元投影の量子化側面図に等しい、2値高さマップを本発明の特徴として用いる。最初に、基準面の上方のオブジェクトの一部を取得し、各画素が小さい高さ値に対応するように量子化する。いくつかのオブジェクトに対し、背景を除去したために、基準(base)に接触するオブジェクトの部分が除去される。したがって、まず、側面図におけるオブジェクトの底部を検出し、そのオブジェクトを、基準に接触するようにシフトさせる。さらに、部分的な時間情報を組み込むために、スライディングウィンドウ技法を用いて画素のオーバーラップしている70×11パッチを取得する。画像の各列に対して1つのパッチが取得される。そして、このパッチは、中心列の分類を取得するための特徴として、分類段階に渡される。
分類
分類は、以下のステップによって行われる。まず、外観分類160において高さ特徴が分類され、系列分類170を用いて、外観分類出力からノイズが除去される。この手法は、SVM等の外観分類の最大マージン性と、CRF等の識別確率的逐次モデルの能力との両方から利益を得るため、非常に正確である。最後に、有限状態機械を用いる構造実施を使用して、無効な予測、例えば単一のタイヤしかないオブジェクトといった予測を防止する。
外観分類
多クラス最大マージン分類器SVMは、画像系列の各時間ステップに初期ラベルを割り当てる。データの逐次構造は、特徴抽出におけるウインドウ生成手順を除き、このステップでの学習中は考慮されない。SVMは、上述した70×11寸法の高さ特徴を取得し、各特徴に対し、オブジェクト本体、タイヤ又はポール状態のいずれかとしてラベル付けする。長さ11のウインドウは、時間軸に沿ってシフトし、距離データの各列は、検定中にそのように分類される。本発明では、高速処理を可能にする線形カーネルSVMを用いる。
系列分類
SVMは、初期ラベルを割り当てるが、オブジェクトの逐次構造は考慮しない。したがって、本発明では、追加の層としてCRFを用いて、時間ステップ間の逐次相関を利用する。この段階は、SVMの予測に対してノイズ除去部分として働き、不整合性を除去する。逐次学習問題を、以下のように、N個の訓練系列が与えられると、yb=f(xb)を予測することができる最適な関数fを見つけるものとして定式化することができ、
Figure 0005773935
及び
Figure 0005773935
はラベル系列である。
確率的逐次モデリングを用いて系列ラベル付け問題を解決する1つの一般的な手法は、系列ラベル付け問題に対し、隠れマルコフモデル(HMM:hidden Markov models)等の生成モデルを用いるというものである。別の一般的な手法は、識別モデルを使用するというものである。こうしたモデルの1つは最大エントロピーマルコフモデル(MEMM:maximun entropy Markov model)である。MEMMは、識別モデルであることに加えて、観測系列の任意の特徴をモデル化することを可能にする。このようにオーバーラップしている特徴を扱うことができる。しかしながら、ラベルバイアス問題がMEMMの性能を制限する。
したがって、本発明では、系列ラベル付け器としてCRFを用いて、ノイズを含むSVM出力を平滑化する。線形連鎖(linear chain)条件付き確率場は以下のように定義される。
Figure 0005773935
ここで、
Figure 0005773935
は、ポテンシャル関数であり、
Figure 0005773935
は、状態からの遷移素性関数であり、
Figure 0005773935
は、状態yにおける状態素性関数であり、λ及びμは、学習プロセスにおいて推定されたパラメーターであり、Z(xb)は、観測系列の関数としての正規化係数である。上記指数型分布族の最大尤度パラメーター推定値は、最大エントロピー解に対応する。
推論
モデルパラメーターが学習された後、推論プロセスがテスト系列にラベル付けする。本明細書では、確率的逐次モデルに対する従来の推論方法を簡単に概説する。テスト系列にラベル付けする1つの方法は、同時確率密度関数yb=arg maxybp(yb|xb)を用いる最大尤度ラベル付けである。解を、以下のように再帰を用いるビタビプロセスを介して効率的に求めることができ、
Figure 0005773935
それは、最大乗法定理に基づいて最尤パスを伝播する。しかしながら、多くの応用では、ラベル系列全体を正確に予測することは非常に困難であるため、個々の予測が使用される。これは、動的プログラミング順方向−逆方向(forward−backward)手順を用いて周辺分布p(yi,t|xb)からyi,tを予測することによって達成される。
順方向再帰は、
Figure 0005773935
であり、ここでα(j)は順方向変数である。逆方向再帰は、
Figure 0005773935
であり、ここでβ(j)は逆方向変数であり、そこから周辺確率を求めることができる。
構造実施
分類の最終ステップは、オブジェクト制約の実施である。このモジュールはCRFの出力を取得する。ラベルが有効なオブジェクトに対応しない場合、言い換えれば、ラベルは何らかの有限状態機械に対応しない。本発明では、ラベルを、オブジェクト文法(object grammar)で定義される最類似(most similar)有効オブジェクトモデルのラベルに変換する。CRFの結果が有効である場合、これは、いかなる補正も不要であることを意味する。これは、オブジェクトの大半に当てはまる。プロセスは、誤り訂正正規文法パーサーである。

Claims (14)

  1. シーンにおけるオブジェクトを分類する方法であって、
    画像の系列を前処理するステップであって、スキャナーによって前記シーンにおける前記オブジェクトの各画像が取得され、前記スキャナーは1次元レーザーラインセンサーを有し、前記各画像は画素の列を含み、前記各画素は、前記各画像が距離画像であるように関連する奥行き値を有し、前記前処理するステップは、
    前記系列における前記各画像からノイズを除去することと、
    前記各画像から背景画素を除去することと、
    3次元において、前記各画像を3次元ワールド座標系に投影することと、
    奥行き値を補正することと、
    特徴を抽出することと、
    を更に含む、前処理するステップと、
    前記画像の系列を分類するステップであって、前記分類するステップは、
    前記特徴に外観分類器を適用することであって、ラベルを取得する、適用することと、
    系列分類器を適用することであって、前記ラベルを平滑化する、適用することと、
    前記オブジェクトの構造を実施することであって、前記オブジェクトのクラスを確定する、実施することと、
    を更に含む、分類するステップと、
    を含み、
    前記ステップはプロセッサで実行され、
    前記構造実施は、平滑化された前記ラベルを、オブジェクトの文法において定義される最類似有効オブジェクトモデルのラベルに変換する
    シーンにおけるオブジェクトを分類する方法。
  2. 前記1次元レーザーラインスキャナーは、前記オブジェクトの側面をスキャンする、請求項1に記載の方法。
  3. 前記ノイズを除去することは、2次元メディアンフィルターを使用する、請求項1に記載の方法。
  4. 前記シーンの背景は、前記各画素に対するガウス分布を用いてモデル化される、請求項1に記載の方法。
  5. 前記シーンにおける基礎面は、ランダムサンプルコンセンサス(RANSAC)プロセスを用いて推定される、請求項1に記載の方法。
  6. 前記オブジェクトの表面上のノイズを含む距離測定値は、垂直面を前記各列に当てはめることによって補正される、請求項1に記載の方法。
  7. 前記特徴はスケール不変である、請求項1に記載の方法。
  8. 前記特徴は、前記3次元投影の量子化された側面図に等しい2値高さマップである、請求項1に記載の方法。
  9. 前記スキャナーは前記オブジェクトの近くのポールに取り付けられる、請求項1に記載の方法。
  10. 前記ラベルは、時間軸に沿ったスライディングウィンドウ技法によって前記外観分類器を用いて評価することによって確定される、請求項1に記載の方法。
  11. 前記外観分類器はサポートベクトルマシンである、請求項1に記載の方法。
  12. 前記外観分類器の出力は、前記系列分類器を用いて平滑化される、請求項1に記載の方法。
  13. 前記系列分類器は、条件付き確率場モデル又は隠れマルコスモデルを使用する、請求項1に記載の方法。
  14. 前記構造実施は、誤り訂正正規文法パーサーを使用する、請求項1に記載の方法。
JP2012090679A 2011-04-22 2012-04-12 シーンにおけるオブジェクトを分類する方法 Expired - Fee Related JP5773935B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/092,408 2011-04-22
US13/092,408 US8824548B2 (en) 2006-03-21 2011-04-22 Object detecting with 1D range sensors

Publications (2)

Publication Number Publication Date
JP2012230671A JP2012230671A (ja) 2012-11-22
JP5773935B2 true JP5773935B2 (ja) 2015-09-02

Family

ID=47470253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012090679A Expired - Fee Related JP5773935B2 (ja) 2011-04-22 2012-04-12 シーンにおけるオブジェクトを分類する方法

Country Status (1)

Country Link
JP (1) JP5773935B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222743A (zh) * 2019-05-23 2019-09-10 山西金晖隆开关有限公司 电网事故的预案生成方法
KR20240043594A (ko) * 2022-09-27 2024-04-03 삼성전자주식회사 객체 영역과 배경 영역을 분류하기 위한 전자 장치 및 전자 장치의 동작 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009096208A1 (ja) * 2008-01-31 2009-08-06 Nec Corporation 物体認識システム,物体認識方法および物体認識用プログラム

Also Published As

Publication number Publication date
JP2012230671A (ja) 2012-11-22

Similar Documents

Publication Publication Date Title
US11360571B2 (en) Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data
KR101283262B1 (ko) 영상 처리 방법 및 장치
US8306327B2 (en) Adaptive partial character recognition
Wei et al. Tensor voting guided mesh denoising
US10216979B2 (en) Image processing apparatus, image processing method, and storage medium to detect parts of an object
JP6305171B2 (ja) シーン内の物体を検出する方法
CN108830832A (zh) 一种基于机器视觉的塑料筒表面缺陷检测算法
KR102399025B1 (ko) 개선된 데이터 비교 방법
CN111462012A (zh) 一种基于条件生成对抗网络的sar图像仿真方法
US8824548B2 (en) Object detecting with 1D range sensors
US20180122097A1 (en) Apparatus, method, and non-transitory computer-readable storage medium for storing program for position and orientation estimation
AlAzawee et al. Using morphological operations—Erosion based algorithm for edge detection
JP5773935B2 (ja) シーンにおけるオブジェクトを分類する方法
KR101129220B1 (ko) 레인지 영상의 노이즈 제거장치 및 방법
JP2013080389A (ja) 消失点推定方法、消失点推定装置及びコンピュータプログラム
Klinder et al. Lobar fissure detection using line enhancing filters
Galdran et al. An efficient non-uniformity correction technique for side-scan sonar imagery
Fan et al. Double-threshold image segmentation method based on gray gradient
CN116777935B (zh) 基于深度学习自动分割前列腺全腺体方法及系统
Yogeswaran 3D Surface Analysis for the Automated Detection of Deformations on Automotive Panels
CN117036437A (zh) 图像测距方法、装置及服务器
Palenichka et al. Detection of local objects in images with textured background by using multiscale relevance function
CN118115751A (zh) 基于测地活动轮廓正则和边缘预测的图像分割方法及系统
CN117152169A (zh) 深度图像的目标分割方法、装置、终端设备和存储介质
CN117789196A (zh) 一种目标对象的检测方法、装置及设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150202

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20150202

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20150217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150407

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20150427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150630

R150 Certificate of patent or registration of utility model

Ref document number: 5773935

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees