JP5773935B2 - シーンにおけるオブジェクトを分類する方法 - Google Patents
シーンにおけるオブジェクトを分類する方法 Download PDFInfo
- Publication number
- JP5773935B2 JP5773935B2 JP2012090679A JP2012090679A JP5773935B2 JP 5773935 B2 JP5773935 B2 JP 5773935B2 JP 2012090679 A JP2012090679 A JP 2012090679A JP 2012090679 A JP2012090679 A JP 2012090679A JP 5773935 B2 JP5773935 B2 JP 5773935B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- classifier
- scene
- sequence
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Description
本明細書では、以下の表記法を用いて、明示的に定義されているか又は説明から明らかである、本明細書に記載する全ての変数を表す。本明細書では、太字を用いて、ベクトル、すなわちこの場合はデータ列を表し、非太字を用いて単一変数を表す。なお、本明細書の数式を除く本文では、太字に相当する文字を、当該文字にbを付して表記する(すなわち、太字のxをxbと表記する)。例えば、
図1は、本発明の実施形態によるオブジェクト80を分類するシステム及び方法を示す。距離データ101は、スキャナー90によって本方法に対する入力としてのオブジェクト80から取得される。
初期ノイズ除去
距離データに関する1つの主な問題は、非ゼロの入射角、オブジェクト表面の反射率、スキャナーの不完全な動作及び環境からの干渉ノイズによるノイズである。したがって、本発明では、まず距離データのノイズを除去する。
取得中にいくつかの画素が完全に破損される可能性がある。そのため、背景推定の第1のステップにおいて、本発明では、画素の各行の中央振幅に基づいて「良」画素及び「不良」画素を確定する。そして、シーンにオブジェクトがないときに各良画素の距離値の履歴に単一ガウス分布を当てはめることにより、画素に基づく背景推定を用いる。同じ画素からの新たなテストサンプル各々において、確定は、前景又は背景のいずれかとして仮説検定に基づく。不良画素の場合、判断は、信号の振幅値を用いる仮説検定に基づく。最後に、ノイズを含む画素の無関係な領域を除去するために、背景マッピングに対してメディアンフィルター処理を用いる。
環境条件及び配置エラーに応じて、オブジェクトに対するセンサーの位置及び向きが不正確である場合がある。この問題を解決するために、初期センサー情報を用いて良前景画素を3次元に逆投影し、基礎面(ground plane)に平面を当てはめる。平面当てはめに対して、ランダムサンプルコンセンサス(RANSAC:RANdom SAmple Consensus)プロセスを用いる。この平面は、センサー位置及び向きを変更する。推定された基準面(base plane)は、ワールド座標系のy=0面に対応するものと仮定される。基準面及びセンサーの視野に対するセンサーの相対位置及び向きが与えられると、逆投影によりワールド座標系における各センサー測定値の三次元座標を確定する。3次元投影は、以下の方法で有用である。本発明では、3次元値から、距離補正の間に用いる平面的な側面図情報、及び特徴を抽出する。さらに、画像面に対するワールドの遠近歪みの影響を受けやすい2次元画像とは異なり、3次元値から取得する特徴は、スケール不変であり、より多くの情報を含んでいる。
測定値のノイズレベルは、表面反射に基づいて変化する。例えば、黒いオブジェクトは、ノイズを含む測定値をもたらす可能性がある。本発明では、オブジェクトの3次元情報及び平面的な側面構造を利用して、距離値を更に補正する。ここでは、測定値の各列は3次元空間の垂直線に由来するものと仮定する。しかしながら、スキャンのラインが異なると奥行き値が異なる可能性がある(ポール及び本体が異なる奥行き値にある可能性がある)。本発明では、最初に、測定値の各列に対する奥行き値の最上位30%を確定する。
本発明では、3次元投影の量子化側面図に等しい、2値高さマップを本発明の特徴として用いる。最初に、基準面の上方のオブジェクトの一部を取得し、各画素が小さい高さ値に対応するように量子化する。いくつかのオブジェクトに対し、背景を除去したために、基準(base)に接触するオブジェクトの部分が除去される。したがって、まず、側面図におけるオブジェクトの底部を検出し、そのオブジェクトを、基準に接触するようにシフトさせる。さらに、部分的な時間情報を組み込むために、スライディングウィンドウ技法を用いて画素のオーバーラップしている70×11パッチを取得する。画像の各列に対して1つのパッチが取得される。そして、このパッチは、中心列の分類を取得するための特徴として、分類段階に渡される。
分類は、以下のステップによって行われる。まず、外観分類160において高さ特徴が分類され、系列分類170を用いて、外観分類出力からノイズが除去される。この手法は、SVM等の外観分類の最大マージン性と、CRF等の識別確率的逐次モデルの能力との両方から利益を得るため、非常に正確である。最後に、有限状態機械を用いる構造実施を使用して、無効な予測、例えば単一のタイヤしかないオブジェクトといった予測を防止する。
多クラス最大マージン分類器SVMは、画像系列の各時間ステップに初期ラベルを割り当てる。データの逐次構造は、特徴抽出におけるウインドウ生成手順を除き、このステップでの学習中は考慮されない。SVMは、上述した70×11寸法の高さ特徴を取得し、各特徴に対し、オブジェクト本体、タイヤ又はポール状態のいずれかとしてラベル付けする。長さ11のウインドウは、時間軸に沿ってシフトし、距離データの各列は、検定中にそのように分類される。本発明では、高速処理を可能にする線形カーネルSVMを用いる。
SVMは、初期ラベルを割り当てるが、オブジェクトの逐次構造は考慮しない。したがって、本発明では、追加の層としてCRFを用いて、時間ステップ間の逐次相関を利用する。この段階は、SVMの予測に対してノイズ除去部分として働き、不整合性を除去する。逐次学習問題を、以下のように、N個の訓練系列が与えられると、yb=f(xb)を予測することができる最適な関数fを見つけるものとして定式化することができ、
モデルパラメーターが学習された後、推論プロセスがテスト系列にラベル付けする。本明細書では、確率的逐次モデルに対する従来の推論方法を簡単に概説する。テスト系列にラベル付けする1つの方法は、同時確率密度関数yb*=arg maxybp(yb|xb)を用いる最大尤度ラベル付けである。解を、以下のように再帰を用いるビタビプロセスを介して効率的に求めることができ、
分類の最終ステップは、オブジェクト制約の実施である。このモジュールはCRFの出力を取得する。ラベルが有効なオブジェクトに対応しない場合、言い換えれば、ラベルは何らかの有限状態機械に対応しない。本発明では、ラベルを、オブジェクト文法(object grammar)で定義される最類似(most similar)有効オブジェクトモデルのラベルに変換する。CRFの結果が有効である場合、これは、いかなる補正も不要であることを意味する。これは、オブジェクトの大半に当てはまる。プロセスは、誤り訂正正規文法パーサーである。
Claims (14)
- シーンにおけるオブジェクトを分類する方法であって、
画像の系列を前処理するステップであって、スキャナーによって前記シーンにおける前記オブジェクトの各画像が取得され、前記スキャナーは1次元レーザーラインセンサーを有し、前記各画像は画素の列を含み、前記各画素は、前記各画像が距離画像であるように関連する奥行き値を有し、前記前処理するステップは、
前記系列における前記各画像からノイズを除去することと、
前記各画像から背景画素を除去することと、
3次元において、前記各画像を3次元ワールド座標系に投影することと、
奥行き値を補正することと、
特徴を抽出することと、
を更に含む、前処理するステップと、
前記画像の系列を分類するステップであって、前記分類するステップは、
前記特徴に外観分類器を適用することであって、ラベルを取得する、適用することと、
系列分類器を適用することであって、前記ラベルを平滑化する、適用することと、
前記オブジェクトの構造を実施することであって、前記オブジェクトのクラスを確定する、実施することと、
を更に含む、分類するステップと、
を含み、
前記各ステップはプロセッサで実行され、
前記構造実施は、平滑化された前記ラベルを、オブジェクトの文法において定義される最類似有効オブジェクトモデルのラベルに変換する
シーンにおけるオブジェクトを分類する方法。 - 前記1次元レーザーラインスキャナーは、前記オブジェクトの側面をスキャンする、請求項1に記載の方法。
- 前記ノイズを除去することは、2次元メディアンフィルターを使用する、請求項1に記載の方法。
- 前記シーンの背景は、前記各画素に対するガウス分布を用いてモデル化される、請求項1に記載の方法。
- 前記シーンにおける基礎面は、ランダムサンプルコンセンサス(RANSAC)プロセスを用いて推定される、請求項1に記載の方法。
- 前記オブジェクトの表面上のノイズを含む距離測定値は、垂直面を前記各列に当てはめることによって補正される、請求項1に記載の方法。
- 前記特徴はスケール不変である、請求項1に記載の方法。
- 前記特徴は、前記3次元投影の量子化された側面図に等しい2値高さマップである、請求項1に記載の方法。
- 前記スキャナーは前記オブジェクトの近くのポールに取り付けられる、請求項1に記載の方法。
- 前記ラベルは、時間軸に沿ったスライディングウィンドウ技法によって前記外観分類器を用いて評価することによって確定される、請求項1に記載の方法。
- 前記外観分類器はサポートベクトルマシンである、請求項1に記載の方法。
- 前記外観分類器の出力は、前記系列分類器を用いて平滑化される、請求項1に記載の方法。
- 前記系列分類器は、条件付き確率場モデル又は隠れマルコスモデルを使用する、請求項1に記載の方法。
- 前記構造実施は、誤り訂正正規文法パーサーを使用する、請求項1に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/092,408 | 2011-04-22 | ||
US13/092,408 US8824548B2 (en) | 2006-03-21 | 2011-04-22 | Object detecting with 1D range sensors |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012230671A JP2012230671A (ja) | 2012-11-22 |
JP5773935B2 true JP5773935B2 (ja) | 2015-09-02 |
Family
ID=47470253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012090679A Expired - Fee Related JP5773935B2 (ja) | 2011-04-22 | 2012-04-12 | シーンにおけるオブジェクトを分類する方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5773935B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222743A (zh) * | 2019-05-23 | 2019-09-10 | 山西金晖隆开关有限公司 | 电网事故的预案生成方法 |
KR20240043594A (ko) * | 2022-09-27 | 2024-04-03 | 삼성전자주식회사 | 객체 영역과 배경 영역을 분류하기 위한 전자 장치 및 전자 장치의 동작 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009096208A1 (ja) * | 2008-01-31 | 2009-08-06 | Nec Corporation | 物体認識システム,物体認識方法および物体認識用プログラム |
-
2012
- 2012-04-12 JP JP2012090679A patent/JP5773935B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012230671A (ja) | 2012-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11360571B2 (en) | Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data | |
KR101283262B1 (ko) | 영상 처리 방법 및 장치 | |
US8306327B2 (en) | Adaptive partial character recognition | |
Wei et al. | Tensor voting guided mesh denoising | |
US10216979B2 (en) | Image processing apparatus, image processing method, and storage medium to detect parts of an object | |
JP6305171B2 (ja) | シーン内の物体を検出する方法 | |
CN108830832A (zh) | 一种基于机器视觉的塑料筒表面缺陷检测算法 | |
KR102399025B1 (ko) | 개선된 데이터 비교 방법 | |
CN111462012A (zh) | 一种基于条件生成对抗网络的sar图像仿真方法 | |
US8824548B2 (en) | Object detecting with 1D range sensors | |
US20180122097A1 (en) | Apparatus, method, and non-transitory computer-readable storage medium for storing program for position and orientation estimation | |
AlAzawee et al. | Using morphological operations—Erosion based algorithm for edge detection | |
JP5773935B2 (ja) | シーンにおけるオブジェクトを分類する方法 | |
KR101129220B1 (ko) | 레인지 영상의 노이즈 제거장치 및 방법 | |
JP2013080389A (ja) | 消失点推定方法、消失点推定装置及びコンピュータプログラム | |
Klinder et al. | Lobar fissure detection using line enhancing filters | |
Galdran et al. | An efficient non-uniformity correction technique for side-scan sonar imagery | |
Fan et al. | Double-threshold image segmentation method based on gray gradient | |
CN116777935B (zh) | 基于深度学习自动分割前列腺全腺体方法及系统 | |
Yogeswaran | 3D Surface Analysis for the Automated Detection of Deformations on Automotive Panels | |
CN117036437A (zh) | 图像测距方法、装置及服务器 | |
Palenichka et al. | Detection of local objects in images with textured background by using multiscale relevance function | |
CN118115751A (zh) | 基于测地活动轮廓正则和边缘预测的图像分割方法及系统 | |
CN117152169A (zh) | 深度图像的目标分割方法、装置、终端设备和存储介质 | |
CN117789196A (zh) | 一种目标对象的检测方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150202 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20150202 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20150217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150407 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150630 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5773935 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |