JP6452324B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP6452324B2 JP6452324B2 JP2014114401A JP2014114401A JP6452324B2 JP 6452324 B2 JP6452324 B2 JP 6452324B2 JP 2014114401 A JP2014114401 A JP 2014114401A JP 2014114401 A JP2014114401 A JP 2014114401A JP 6452324 B2 JP6452324 B2 JP 6452324B2
- Authority
- JP
- Japan
- Prior art keywords
- comparison
- pixel
- value
- image
- reference value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N25/00—Circuitry of solid-state image sensors [SSIS]; Control thereof
- H04N25/60—Noise processing, e.g. detecting, correcting, reducing or removing noise
- H04N25/68—Noise processing, e.g. detecting, correcting, reducing or removing noise applied to defects
- H04N25/683—Noise processing, e.g. detecting, correcting, reducing or removing noise applied to defects by defect estimation performed on the scene signal, e.g. real time or on the fly detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N25/00—Circuitry of solid-state image sensors [SSIS]; Control thereof
- H04N25/40—Extracting pixel data from image sensors by controlling scanning circuits, e.g. by modifying the number of pixels sampled or to be sampled
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Description
また、本発明の画像処理装置における他の態様は、画像から対象領域を抽出する抽出手段と、前記対象領域に含まれる画素の画素値に基づいて複数の基準値を算出する算出手段と、前記画像における複数の画素のそれぞれの画素値と前記複数の基準値のそれぞれとを比較する比較手段と、前記比較手段による比較結果に基づいて、前記複数の基準値から1つの基準値を選択する選択手段と、を有する。
また、本発明は、上述した画像処理装置による画像処理方法、及び、当該画像処理方法をコンピュータに実行させるためのプログラムを含む。
まず、本発明の第1の実施形態について説明する。
図1は、本発明の第1の実施形態に係る画像処理装置の概略構成の一例を示す図である。画像処理装置1000は、図1に示すように、学習部1001、画像入力部1010、対象領域抽出部1020、注目画素設定部1030、比較対象画素選択部1040、基準値算出部1050、比較部1060、変換テーブル1070、変換部1080、及び、出力部1090を有して構成されている。また、学習部1001は、学習画像入力部1011、対象領域抽出部1021、注目画素設定部1031、比較対象画素選択部1041、基準値算出部1051、比較部1061、評価値算出部1062、基準値決定部1063、及び、部位相対位置集計部1064を有して構成されている。なお、画像処理装置1000は、学習部1001を含まない構成であってもよく、この場合、例えば、学習部1001は、他の画像処理装置に構成されることになる。
図2は、本発明の第1の実施形態に係る画像処理装置による画像処理方法の処理手順の一例を示すフローチャートである。図1及び図2を用いて、本実施形態に係る画像処理装置1000の処理を説明する。ここで、図2には、人物の姿勢を推定する場合の処理が示されている。
このままでも使用できるが、より精度よく抽出する場合、次いで、図1の対象領域抽出部1020は、前景候補画素の深度値をカメラ座標系(3次元座標系)の点群へと変換する。そして、図1の対象領域抽出部1020は、3次元の点群の固まりの重心位置を求め、重心位置周辺の点群のうち、人体サイズに収まる範囲に存在する点を人体領域とする。このとき、人体サイズは、予め学習しておいた人体の平均サイズや最大サイズ等を使用して決めることができる。また、床との接地部分については、平面推定を行う等することにより、床と人体との境界を決定し、人体領域を決定することができる。そして、図1の対象領域抽出部1020は、人体領域とラベル付けされた点群のみを再び画像平面に投影することにより、人体領域が抽出された深度画像を取得することができる。
なお、人体領域の抽出方法は、この態様に限らず公知の方法を用いてもよい。そして、図1の対象領域抽出部1020は、抽出した人体領域部分の深度画像を基準値算出部1050と注目画素設定部1030に送る。図1の学習部1001の対象領域抽出部1021は、処理対象の画像は異なるが、その処理内容は対象領域抽出部1020と同様である。
また、図3(b)の部分310は、図3(a)に示す部分300を拡大表示したものであり、或る画素を注目画素312として設定した様子が示されている。ここで、設定した注目画素312の情報は、比較対象画素選択部1040に送られる。また、図3(b)には、基準値算出部1050で算出された基準値231に相当する基準値311に係る情報が示されている。
図3(c)において、比較対象画素323の画素値をd1、比較対象画素324の画素値をd2とし、基準値321をdu、閾値をth1、th2とすると、比較部1060は、以下の(6)式の条件式H31と以下の(7)式の条件式H32の真偽判定を行うことにより、比較を行う。
なお、ここで使用する閾値th1、th2は、学習時と同じものを使用する。また、上述した(6)式及び(7)式では、単純に引き算をして比較を行っているが、予め人体領域部分の画素値(深度値)の標準偏差σを算出しておき、上述した(5)式と同様に、以下の(8)式及び(9)式に示すように標準偏差で正規化してもよい。
まず、単純な方法として、どちらもランダムに決める方法が考えられる。例えば、比較パラメータの決め方は、注目画素を基準に方向と距離をランダムに決める。これにより、配置が決定する。比較部1061の閾値についても、ある範囲内でランダムに決定する。もちろん、選択し得る範囲において、選ばれる確率を設定して、その確率に応じて、重点的に選びたい配置や値の範囲から高い確率で選ばれるようにすることもできる。さらに、第4の実施形態で後述する評価指標を用いる方法も考えられる。
この場合、treeの各ノードの処理がステップS207及びS208に相当する。即ち、この場合、あるノードにおいて学習時に使用した注目画素と比較対象画素との配置関係を比較パラメータ222に記憶しておく。例えば、ある注目画素から方向θ、距離xの位置に比較対象画素がある場合、比較パラメータ222として方向θと距離xを記憶しておく。そして、識別時に設定した注目画素に対して、記憶した比較パラメータ222を使用して比較対象画素の位置を算出してその画素値を取得する。
続いて、比較部は、この画素値と基準値を比較し、比較値を算出する。そして、例えば、比較値が1のとき右の子ノードを辿り、比較値が0のとき左の子ノードを辿る。子ノードに移動したら、同じ処理を行い、treeのリーフに辿りつくまで処理を繰り返す。ここでは、2分岐にて説明したが、分岐数はもっと多くてもよい。
このように、ある注目画素に対して、注目画素周辺の画素(比較対象画素)と基準値との比較を繰り返し行うことにより、注目画素周辺の変化量を間接的に比較することができるため、局所的な形状比較を実現することができる。さらに、人体領域全体で共通の基準値との大小関係を比較することができ、人体領域全体に対しての関係も知ることができる。
図2のステップS210に進むと、図1の変換部1080は、比較部1060において異なる学習した配置にある画素(比較対象画素)に対して比較を繰り返し行った結果に基づいて、変換テーブル1070(223)の予め学習した対応する値を参照してステップS205で設定した注目画素の情報を決定する処理を行う。この注目画素の情報を決定する処理を行う変換部1080は、情報決定手段を構成する。
変換テーブル1070(223)は、事前に、学習部1001において学習画像である学習深度画像を利用して作成される。学習部1001においても、上述した手順に従い処理を行う。即ち、注目画素設定部1031は、人体領域部分の学習深度画像の中から或る画素を選択して注目画素とする。そして、この注目画素と人体の部位との位置関係を計算しておく。
ここで、図5は、本発明の第1の実施形態を示し、最終部位推定位置の出力形態の一例を示す図である。具体的に、図5には、深度画像500に、各最終部位推定位置235に係る各部位位置501が重ねて表示されている。
また、例えば、物体検出に適用する場合には、変換テーブル1070に、物体か否かの情報や、物体の中心位置情報等を保持することが考えられる。その結果、物体が検出されたかどうか、さらに検出された場合にはその位置を算出して出力することができる。
なお、本発明は、ここで述べた用途に限らず、色々な用途に適用することができる。
また、この比較を繰り返し行うことにより、注目画素周辺の変化量を間接的に比較することができるため、例えば局所的な形状比較を実現することができる。
次に、本発明の第2の実施形態について説明する。
図2のステップS203において、図1の基準値算出部1050は、ステップS202で抽出された対象領域である人体領域部分の深度画像に含まれる画素の画素値に基づいて基準値231を算出する。第1の実施形態と異なり、本実施形態では基準値が複数存在する。この例を図4を用いて説明する。
次に、本発明の第3の実施形態について説明する。
図6は、本発明の第3の実施形態に係る画像処理装置による画像処理方法の処理手順の一例を示すフローチャートである。ここで、図6には、人物の姿勢を推定する場合の処理が示されている。この図6において、図2に示す第1の実施形態に係る画像処理装置による画像処理方法と同様の処理ステップ及び情報については同じ符号を付しており、その説明は省略し、図2と異なる部分についてのみ説明を行う。
そして、図1の基準値算出部1050は、算出した基準値632を比較部1060に送る。図1の学習部1001の基準値算出部1051も、上述した基準値算出部1050と同様の処理を行う。
次に、本発明の第4の実施形態について説明する。
まず、人物の姿勢推定時の処理について説明する。
図7は、本発明の第4の実施形態に係る画像処理装置による画像処理方法の処理手順の一例を示すフローチャートである。ここで、図7には、人物の姿勢を推定する場合の処理が示されている。この図7において、図2及び図6に示す第1及び第3の実施形態に係る画像処理装置による画像処理方法と同様の処理ステップ及び情報については同じ符号を付しており、その説明は省略し、図2及び図6と異なる部分についてのみ説明を行う。
このように、本実施形態では、図1の基準値算出部1050は、1つ以上の複数の基準値を算出するものである。
図8は、本発明の第4の実施形態に係る画像処理装置による画像処理方法の処理手順であって学習時の処理手順の一例を示すフローチャートである。この図8において、図2、図6及び図7に示すフローチャートと同様の処理ステップ及び情報については同じ符号を付しており、その説明は省略し、図2、図6及び図7と異なる部分についてのみ説明を行う。
また、本発明は、以下の処理を実行することによっても実現される。
即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
このプログラム及び当該プログラムを記憶したコンピュータ読み取り可能な記憶媒体は、本発明に含まれる。
Claims (10)
- 画像から対象領域を抽出する抽出手段と、
前記対象領域に含まれる画素の画素値に基づいて複数の基準値を算出する算出手段と、
前記複数の基準値の中からいずれか1つを選択し、当該選択した1つの基準値と前記画像における複数の画素の画素値とを比較する比較手段と、
前記比較手段の比較結果に基づいて、前記対象領域の画素の中から設定された注目画素の情報を決定する決定手段と、
を有することを特徴とする画像処理装置。 - 前記複数の画素は、前記注目画素に対して予め学習された位置関係にある複数の画素であることを特徴とする請求項1に記載の画像処理装置。
- 前記比較手段は、前記複数の画素のそれぞれの画素値と前記選択した1つの基準値との大小関係を比較することを特徴とする請求項1または2に記載の画像処理装置。
- 前記比較手段は、前記複数の画素のそれぞれの画素値と前記選択した1つの基準値との差と、所定の閾値とを比較することを特徴とする請求項1から3のいずれか1項に記載の画像処理装置。
- 前記複数の基準値のそれぞれは、前記対象領域を複数の部分領域に分割したうちのいずれか1つの部分領域に含まれる全ての画素の画素値または当該1つの部分領域に含まれる複数の画素の画素値に基づいて算出された値であることを特徴とする請求項1から4のいずれか1項に記載の画像処理装置。
- 前記部分領域は、前記対象領域の画素の中から設定された注目画素に基づいて設定されることを特徴とする請求項5に記載の画像処理装置。
- 画像から対象領域を抽出する抽出手段と、
前記対象領域に含まれる画素の画素値に基づいて複数の基準値を算出する算出手段と、
前記画像における複数の画素のそれぞれの画素値と前記複数の基準値のそれぞれとを比較する比較手段と、
前記比較手段による比較結果に基づいて、前記複数の基準値から1つの基準値を選択する選択手段と、
を有することを特徴とする画像処理装置。 - 画像から対象領域を抽出する抽出ステップと、
前記対象領域に含まれる画素の画素値に基づいて複数の基準値を算出する算出ステップと、
前記複数の基準値の中からいずれか1つを選択し、当該選択した1つの基準値と前記画像における複数の画素の画素値とを比較する比較ステップと、
前記比較ステップの比較結果に基づいて、前記対象領域の画素の中から設定された注目画素の情報を決定する決定ステップと、
を有することを特徴とする画像処理方法。 - 画像から対象領域を抽出する抽出ステップと、
前記対象領域に含まれる画素の画素値に基づいて複数の基準値を算出する算出ステップと、
前記画像における複数の画素のそれぞれの画素値と前記複数の基準値のそれぞれとを比較する比較ステップと、
前記比較ステップによる比較結果に基づいて、前記複数の基準値から1つの基準値を選択する選択ステップと、
を有することを特徴とする画像処理方法。 - 請求項8または9に記載の画像処理方法の各ステップをコンピュータに実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014114401A JP6452324B2 (ja) | 2014-06-02 | 2014-06-02 | 画像処理装置、画像処理方法及びプログラム |
US14/727,093 US9531969B2 (en) | 2014-06-02 | 2015-06-01 | Image processing apparatus, image processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014114401A JP6452324B2 (ja) | 2014-06-02 | 2014-06-02 | 画像処理装置、画像処理方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015228188A JP2015228188A (ja) | 2015-12-17 |
JP2015228188A5 JP2015228188A5 (ja) | 2017-06-08 |
JP6452324B2 true JP6452324B2 (ja) | 2019-01-16 |
Family
ID=54703293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014114401A Active JP6452324B2 (ja) | 2014-06-02 | 2014-06-02 | 画像処理装置、画像処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9531969B2 (ja) |
JP (1) | JP6452324B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6815741B2 (ja) * | 2016-03-30 | 2021-01-20 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
US11653023B2 (en) * | 2017-12-01 | 2023-05-16 | Sony Corporation | Encoding device, encoding method, decoding device, and decoding method |
JP7086630B2 (ja) * | 2018-02-09 | 2022-06-20 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6083469A (ja) * | 1983-10-14 | 1985-05-11 | Ricoh Co Ltd | 画信号2値化装置 |
JP4825473B2 (ja) * | 2005-09-05 | 2011-11-30 | アイシン精機株式会社 | 顔向き判別装置 |
CN101470802B (zh) | 2007-12-28 | 2012-05-09 | 清华大学 | 物体检测装置和方法 |
US8379101B2 (en) * | 2009-05-29 | 2013-02-19 | Microsoft Corporation | Environment and/or target segmentation |
KR101616926B1 (ko) * | 2009-09-22 | 2016-05-02 | 삼성전자주식회사 | 영상 처리 장치 및 방법 |
US8619049B2 (en) * | 2011-05-17 | 2013-12-31 | Microsoft Corporation | Monitoring interactions between two or more objects within an environment |
JP5946294B2 (ja) * | 2012-03-02 | 2016-07-06 | ヤマハ発動機株式会社 | 対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両 |
JP5997545B2 (ja) * | 2012-08-22 | 2016-09-28 | キヤノン株式会社 | 信号処理方法及び信号処理装置 |
KR102106135B1 (ko) * | 2013-10-01 | 2020-05-04 | 한국전자통신연구원 | 행동 인식 기반의 응용 서비스 제공 장치 및 그 방법 |
-
2014
- 2014-06-02 JP JP2014114401A patent/JP6452324B2/ja active Active
-
2015
- 2015-06-01 US US14/727,093 patent/US9531969B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015228188A (ja) | 2015-12-17 |
US20150350579A1 (en) | 2015-12-03 |
US9531969B2 (en) | 2016-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10234957B2 (en) | Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data | |
CN109376681B (zh) | 一种多人姿态估计方法及系统 | |
JP6125188B2 (ja) | 映像処理方法及び装置 | |
JP4855556B1 (ja) | 動体検出装置、動体検出方法、動体検出プログラム、動体追跡装置、動体追跡方法及び動体追跡プログラム | |
JP6471448B2 (ja) | 視差深度画像のノイズ識別方法及びノイズ識別装置 | |
US8712154B2 (en) | Image processing system and method | |
EP3236418B1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2011134114A (ja) | パターン認識方法およびパターン認識装置 | |
US11334759B2 (en) | Information processing apparatus, information processing method, and medium | |
JP2019117547A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP6054771B2 (ja) | 背景モデル構築装置、背景モデル構築方法、およびプログラム | |
JP6426441B2 (ja) | 密度計測装置、密度計測方法、およびプログラム | |
JP6526527B2 (ja) | 識別装置及び認証システム | |
JP6431404B2 (ja) | 姿勢推定モデル生成装置及び姿勢推定装置 | |
JP6452324B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP5192437B2 (ja) | 物体領域検出装置、物体領域検出方法および物体領域検出プログラム | |
JP6754717B2 (ja) | 物体候補領域推定装置、物体候補領域推定方法、及び物体候補領域推定プログラム | |
JP6717049B2 (ja) | 画像解析装置、画像解析方法およびプログラム | |
JP5470529B2 (ja) | 動き検出装置、動き検出方法及び動き検出プログラム | |
JP2018049396A (ja) | 形状推定方法、形状推定装置および形状推定プログラム | |
JP3811474B2 (ja) | 顔部品位置検出方法及び顔部品位置検出装置 | |
JP6453618B2 (ja) | 算出装置、方法及びプログラム | |
JP2008003798A (ja) | 画像処理装置及び画像処理プログラム | |
JP2016207107A (ja) | 画像認識装置 | |
JP2016033717A (ja) | 対象検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170417 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170417 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181211 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6452324 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |