JP2007140805A - 画像内オブジェクトのパラメータ推定装置,方法,媒体 - Google Patents
画像内オブジェクトのパラメータ推定装置,方法,媒体 Download PDFInfo
- Publication number
- JP2007140805A JP2007140805A JP2005332316A JP2005332316A JP2007140805A JP 2007140805 A JP2007140805 A JP 2007140805A JP 2005332316 A JP2005332316 A JP 2005332316A JP 2005332316 A JP2005332316 A JP 2005332316A JP 2007140805 A JP2007140805 A JP 2007140805A
- Authority
- JP
- Japan
- Prior art keywords
- parameter estimation
- parameter
- function
- image data
- sum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
【課題】画像内オブジェクトのパラメータ推定において、背景変化とオクルージョンに対して頑健なパラメータ推定を行う画像内オブジェクトのパラメータ推定装置,方法,媒体を提供する。
【解決手段】特徴抽出部102及び特徴抽出部106によって、画像の各位置における縦方向の画素値の変化と、横方向の画素値の変化に対して、それぞれ微分を施したものを含む複素数で表現したものを特徴量として抽出し、さらに、パラメータ推定関数作成部103及びパラメータ推定部107において、局所におけるガウシアンカーネルの和として表されたカーネル関数を利用して、画像内オブジェクトのパラメータを推定する。
【選択図】図1
【解決手段】特徴抽出部102及び特徴抽出部106によって、画像の各位置における縦方向の画素値の変化と、横方向の画素値の変化に対して、それぞれ微分を施したものを含む複素数で表現したものを特徴量として抽出し、さらに、パラメータ推定関数作成部103及びパラメータ推定部107において、局所におけるガウシアンカーネルの和として表されたカーネル関数を利用して、画像内オブジェクトのパラメータを推定する。
【選択図】図1
Description
本発明は、画像内オブジェクトのパラメータ推定装置,方法,媒体であって、例えば、画像処理に関するものである。
一般的に、カメラで撮像したオブジェクトには、どの向きから撮ったものか、どこから照明をあてているか等、様々なパラメータが含まれている。
ここで、撮影角度(例えば、水平方向)をパラメータとして考えた場合の画像とパラメータの関係の一例を図3に基づいて説明する。例えば、図3中の画像Aの撮影角度(即ち、パラメータ)は、水平方向で0度である。また、画像Bの撮影角度は、水平方向で45度である。
前記のように、パラメータ情報を画像のみから推定することは、工業部品の分類,移動体の監視といった、幅広い応用が考えられ、工学的価値は高い。
なお、前記の推定を実現する方法として、例えば、線形部分空間法とサポートベクトル回帰を組み合わせた方法(例えば、非特許文献1参照)が提案されている。前記の推定方法は、パラメータを様々に変えたときの画像と、パラメータと、の関係を特徴空間における入出力関数として表現し、その関数を用いてパラメータを推定する推定方法である。なお、前記の推定方法における最適化では、例えば、凸二次計画法(例えば、非特許文献2参照)が用いられる。
また、前記の推定方法は、例えば、「パラメトリック固有空間法」(例えば、非特許文献3参照)のようにサンプル点を全て保存する方法ではなく、関数の基底ベクトルに相当するベクトル(例えば、サポートベクトル)だけを保存すれば良い。そのため、推定計算中に必要とされるメモリ容量が、計算機またはコンピュータのメモリ容量を圧迫する心配が少ない。
安藤信吾、草地良規、鈴木 章、荒川賢一,「サポートベクトル回帰による3次元物体の姿勢推定」,信学技報,社団法人 電子情報通信学会,PRMU2004−91,pp.9−15,2004。 今野浩、山下浩,「非線形計画法」,日科技連出版社,1978。 村瀬 洋、Shree K.NAYAR,「2次元照合による3次元文体認識−パラメトリック固有空間法−」,電子情報通信学会論文誌,社団法人 電子情報通信学会,D−II,Vol.J77−D−II,No.11,pp.2179−2187,1994。
安藤信吾、草地良規、鈴木 章、荒川賢一,「サポートベクトル回帰による3次元物体の姿勢推定」,信学技報,社団法人 電子情報通信学会,PRMU2004−91,pp.9−15,2004。 今野浩、山下浩,「非線形計画法」,日科技連出版社,1978。 村瀬 洋、Shree K.NAYAR,「2次元照合による3次元文体認識−パラメトリック固有空間法−」,電子情報通信学会論文誌,社団法人 電子情報通信学会,D−II,Vol.J77−D−II,No.11,pp.2179−2187,1994。
上述のような推定方法は、オブジェクトの背景がさまざまに変化したり、オクルージョンが発生するような状況に弱いという問題が存在している。
本発明は、前記課題に基づいてなされたものであり、画像内オブジェクトのパラメータ推定において、背景変化とオクルージョンに対して頑健なパラメータ推定を行う画像内オブジェクトのパラメータ推定装置,方法,媒体を提供することにある。
本発明は、前記課題の解決を図るために、請求項1記載の発明は、デジタル画像データに含まれるオブジェクトのパラメータを推定するパラメータ推定装置であって、前記デジタル画像データを入力する入力手段と、該デジタル画像データ中の各位置における第1方向及び第2方向の画素値の変化に関し、微分を施して得られる微分値で示される特徴を抽出する特徴抽出手段と、該特徴に基づき、局所におけるガウシアンカーネルの和として表されるカーネル関数及びサポートベクトル回帰を用いて、前記パラメータを推定するための関数を作成するパラメータ推定関数作成手段と、該関数に基づき、局所におけるガウシアンカーネルの和として表されるカーネル関数を用いて、パラメータ推定を行うパラメータ推定手段と、該パラメータ推定の結果を出力する出力手段と、を有することを特徴とする。
請求項2記載の発明は、請求項1記載の発明において、前記の局所におけるガウシアンカーネルの和として表されるカーネル関数を式[1]と見做したパラメータ推定関数作成手段並びにパラメータ推定手段を含むことを特徴とする。
請求項3記載の発明は、デジタル画像データに含まれるオブジェクトのパラメータを推定するパラメータ推定方法であって、前記デジタル画像データを入力する入力ステップと、該デジタル画像データ中の各位置における第1方向及び第2方向の画素値の変化に関し、微分を施して得られる微分値で示される特徴を抽出する特徴抽出ステップと、該特徴に基づき、局所におけるガウシアンカーネルの和として表されるカーネル関数及びサポートベクトル回帰を用いて、前記パラメータを推定するための関数を作成するパラメータ推定関数作成ステップと、該関数に基づき、局所におけるガウシアンカーネルの和として表されるカーネル関数を用いて、パラメータ推定を行うパラメータ推定ステップと、該パラメータ推定の結果を出力する出力ステップと、を有することを特徴とする。
請求項4記載の発明は、請求項3記載の発明において、前記の局所におけるガウシアンカーネルの和として表されるカーネル関数を式[1]と見做したパラメータ推定関数作成ステップ並びにパラメータ推定ステップを含むことを特徴とする。
請求項5記載の発明は、記録媒体であって、請求項1または2に記載のパラメータ推定方法を、コンピュータで実行可能に記載したプログラム記録したことを特徴とする。
前記の請求項1,3記載の発明によれば、特徴量の一部が変化したときの影響を小さくするパラメータ推定を行うことができる。
前記の請求項2,4記載の発明によれば、式[1]を用いたパラメータ推定を行うことができる。
前記の請求項5記載の発明によれば、パラメータ推定方法を構成したプログラムを記録媒体に記録することができる。
以上示したように、請求項1,3記載の発明によれば、画像中に含まれるオブジェクトに対し、背景変化及びオクルージョンに頑健な(かつ、精度の高い)パラメータ推定を行うことができる。
請求項2,4記載の発明によれば、式[1]を用いたパラメータ推定の結果を取得できる。
請求項5記載の発明によれば、パラメータ推定方法を構成したプログラムを記録した記録媒体を取得することができる。
これらを以って画像処理の分野に貢献できる。
以下、本発明の実施の形態における画像内オブジェクトのパラメータ推定装置,方法,媒体を図面等に基づいて詳細に説明する。
本発明の実施の形態は、サポートベクトル回帰に使用する特徴量とカーネル関数を工夫した原理に基づいている。まず、画素の画素値(例えば、輝度)自体を特徴量として用いるのではなく、画像データ中の各位置における縦方向(例えば、図3中の矢印V方向)の輝度の変化と横方向(例えば、図3中の矢印H方向)の輝度の変化に対して、それぞれ微分を施して得られた量を特徴量と見做す。なお、前提として、特徴ベクトルは式(1)及び式(2)を採用する。
なお、式(1)中のxは特徴ベクトル、Nは画素数、である。また、xは明るさの正規化が行われたものとする。
前記の式(2)中のxkは特徴ベクトルxのk番目の要素、akはk番目に対応する位置の横方向の微分値、bkはk番目に対応する位置の縦方向の微分値、である。即ち、xkはk番目に対応する位置のグラジェントを複素数で表現したものである。また、前記の微分値は、物体の輪郭などに限られた部分にのみ反応するため、背景の変化などに強い特徴量と言える。
さらに、カーネル関数k(x,y)は、局所的なガウシアンカーネルの和をとった式(即ち、式(3))を用いる。
式(3)中のxkは特徴ベクトルxのk番目の要素、ykは特徴ベクトルyのk番目の要素を表す。また、nは特徴ベクトルの次元数、σはパラメータである。さらに、
は、複素空間上での距離を表している。
通常の大局的なカーネル(例えば、ガウシアンカーネルや多項式カーネル)では、ある一部分が何らかの理由で欠けたとき、出力値に大きな影響を与える。前記の大局的なカーネルに対し、式(3)は局所的な結果の総和であるため、一部分が欠けても出力値に与える影響が少ない。したがって、式(3)をカーネル関数として利用すれば、背景変化とオクルージョンに頑健なパラメータ推定を実現できる。
即ち、本実施の形態は、画像の各位置における縦方向の画素値の変化と、横方向の画素値の変化に対して、それぞれ微分を施したものを含む複素数で表現したものを特徴量として用い、局所におけるガウシアンカーネルの和として表されたカーネル関数を利用した画像内オブジェクトのパラメータ推定装置,方法,媒体である。
本実施の形態の構成を図1に基づいて以下に説明する。なお、図1は、本実施の形態におけるパラメータ推定装置の構成図である。
図1中のパラメータ推定装置は、符号101から108で示される部から構成される。
符号101で示す部は、デジタルカメラ等で撮像された学習用のオブジェクト画像データ及びその正解パラメータ値を入力し、符号102で示す部(以後、特徴抽出部と称する)に対して伝送する部(以後、学習画像データ入力部と称する)である。
なお、前記のオブジェクト画像データは、例えば、画像データ記憶装置に記憶されても良い。
前記の特徴抽出部102は、入力されたオブジェクト画像データから、そのオブジェクトの特徴ベクトルを抽出し、該特徴ベクトルを符号103で示す部(以後、パラメータ推定関数作成部と称する)へ伝送する部である。なお、前記の特徴ベクトルは、式(1)及び式(2)を用いて抽出されるものとする。
なお、前記の特徴ベクトルの次元を減少させるための方法の一例としては、画像をメッシュ状に区切り、各領域内で平均化した特徴を用いる方法を採って良い。また、他例としては、画像上の各位置における画素値の分散の大きい位置から順に選択し、分散の小さい位置は無視することによって次元を減少する方法を採っても良い。
前記のパラメータ推定関数作成部103は、サポートベクトル回帰に基づき、パラメータ推定関数を生成する部である。前記のサポートベクトル回帰では、カーネル関数k(xi,xj)を用いて、以下のような推定式(即ち、式(4))に表す。なお、xは特徴抽出部102によって、低次元圧縮された特徴ベクトルである。
なお、式(4)中のxiは学習用の特徴ベクトル、mはその数である。また、(αi *−αi)≠0となるxiをサポートベクトルと称する。前記のαi *、αi及びbは、式(5)の最適化問題を解くことによって取得できる。
なお、式(5)中のyiはxiに対応する正解パラメータ値である。また、前記の最適化問題は、凸二次計画法を用いて解くことができる。その際に、式(5)中のカーネル関数には、前記の式(3)を用いる。
そして、前記パラメータ推定関数作成部103によって作成されたオブジェクトのパラメータ推定関数は、符号104で示される部(以後、パラメータ推定関数記憶部と称する)に伝送される。
前記のパラメータ推定関数記憶部104は、前記のパラメータ推定関数作成部103によって作成されたオブジェクトのパラメータ推定関数を所定のメモリに記憶する部である。
符号105で示される部は、デジタルカメラ等で撮像されたパラメータ推定対象となるオブジェクト画像データを入力し、符号106で示す部(以後、特徴抽出部と称する)に伝送する部(以後、対象画像データ入力部と称する)である。
前記の特徴抽出部106は、前記の特徴抽出部102と同様、オブジェクトの特徴ベクトルを抽出し、符号107で示す部(以後、パラメータ推定部と称する)へ伝送する部である。
前記のパラメータ推定部107は、前記のパラメータ推定関数記憶部104によってメモリに記憶されたパラメータ推定関数を読み出し、パラメータを推定する部である。なお、前記の式(4)が推定回帰式となる。また、前記のパラメータ推定部107は、推定されたパラメータ値を符号108で示す部(以後、出力部と称する)に伝送することも行う。
前記の出力部108部は、前記パラメータ推定部107で演算された結果を出力する部である。
次に、本実施の形態におけるパラメータ推定方法のフローチャートを図2に基づいて以下に説明する。前記のフローチャートは、学習処理フローチャート(即ち、図2Aで示すフローチャート)とパラメータ推定処理フローチャート(即ち、図2Bで示すフローチャート)から構成されている。なお、以下の説明で図1中の符号と同じものの詳細な説明は省略する。
まず、前記の学習処理フローチャート図2Aにおいては、撮像された学習用オブジェクト画像データ及びその正解パラメータが、図1中の学習画像データ入力部101に対して入力される。そして、学習画像データ入力部101は、前記の撮像された学習用のオブジェクト画像データ及びその正解パラメータを特徴抽出部102に対して伝送する(S01)。
次に、前記の特徴抽出部102が、前記の入力された学習用のオブジェクト画像データ及びその正解パラメータから、そのオブジェクトの特徴ベクトルを抽出し、該特徴ベクトルをパラメータ推定関数作成部103へ伝送する(S02)。
次に、前記のパラメータ推定関数作成部103が、前記の特徴ベクトルからパラメータ推定関数を生成し、該パラメータ推定関数をパラメータ推定関数記憶部104に対して伝送する(S03)。
次に、前記のパラメータ推定関数104は、前記パラメータ推定関数を所定のメモリに記憶する(S04)。
そして、全てのパラメータの推定関数を作成したか、否か、をチェックし、全てのパラメータの推定関数が作成された場合には、学習処理を終了する。また、全てのパラメータの推定関数が作成されていなかった場合には、符号S03で示す処理に戻る(S08)。
前記のパラメータ推定処理フローチャート図2Bにおいては、対象画像データ入力部105に対して、パラメータ推定対象となるオブジェクト画像データが入力され、該オブジェクト画像データが特徴抽出部106に対して伝送される(S05)。
次に、前記の特徴抽出部106は、前記のオブジェクト画像データから特徴ベクトルを抽出し、該特徴ベクトルをパラメータ推定部107へ伝送する(S06)。
次に、前記のパラメータ推定部107は、前記のメモリに記憶されたパラメータ推定関数を読み出し、パラメータを推定する(S07)。
次に、全てのパラメータを作成したか、否か、をチェックし、全てのパラメータが作成されていた場合には、パラメータ推定処理を終了する。また、全てのパラメータが作成されていなかった場合には、符号S07で示す処理に戻る(S09)。
なお、前記のパラメータを出力部108に対して伝送する処理は、例えば、符号S07で示す処理と符号S09で示す処理間に挿入されても良い。
また、本実施の形態の方法を実現するソフトウェアを構成するプログラムコードを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のCPU(Central Processing Unit)(または、MPU(Microprocessing Unit))が記録媒体に格納されたプログラムコードを読み出し実行することによっても、実現できる。
即ち、前記のプログラムコードを記録した記録媒体(例えば、CD−ROM(Compact Disk Read Only Memory),DVD−ROM(Digital Versatile Disk Read Only Memory),CD−R(Compact Disk Recordable),CD−RW(Compact Disk ReWritable),MO(Magneto−Optical disk),HDD(Hard Disk Drive))は、本実施の形態を構成する。
以上、本発明において、記載された具体例に対してのみ詳細に説明したが、本発明の技術思想の範囲で多彩な変形および修正が可能であることは、当業者にとって明白なことであり、このような変形および修正が特許請求の範囲に属することは当然のことである。
例えば、本実施の形態の変形例としては、前記のパラメータを出力部108に対して伝送する処理を、符号S07で示す処理中で、該パラメータを所定のメモリに蓄積し、全てのパラメータを作成したときに、出力部108に対し、一括して伝送する処理と見做しても良い。
101…学習画像データ入力部
102,106…特徴抽出部
103…パラメータ推定関数作成部
104…パラメータ推定関数記憶部
105…対象画像データ入力部
107…パラメータ推定部
108…出力部
A,B,C,D,E…画像
102,106…特徴抽出部
103…パラメータ推定関数作成部
104…パラメータ推定関数記憶部
105…対象画像データ入力部
107…パラメータ推定部
108…出力部
A,B,C,D,E…画像
Claims (5)
- デジタル画像データに含まれるオブジェクトのパラメータを推定するパラメータ推定装置であって、
前記デジタル画像データを入力する入力手段と、
該デジタル画像データ中の各位置における第1方向及び第2方向の画素値の変化に関し、微分を施して得られる微分値で示される特徴を抽出する特徴抽出手段と、
該特徴に基づき、局所におけるガウシアンカーネルの和として表されるカーネル関数及びサポートベクトル回帰を用いて、前記パラメータを推定するための関数を作成するパラメータ推定関数作成手段と、
該関数に基づき、局所におけるガウシアンカーネルの和として表されるカーネル関数を用いて、パラメータ推定を行うパラメータ推定手段と、
該パラメータ推定の結果を出力する出力手段と、
を有することを特徴とするパラメータ推定装置。 - 前記の局所におけるガウシアンカーネルの和として表されるカーネル関数を式[1]と見做したパラメータ推定関数作成手段並びにパラメータ推定手段を含むことを特徴とする請求項1に記載のパラメータ推定装置。
- デジタル画像データに含まれるオブジェクトのパラメータを推定するパラメータ推定方法であって、
前記デジタル画像データを入力する入力ステップと、
該デジタル画像データ中の各位置における第1方向及び第2方向の画素値の変化に関し、微分を施して得られる微分値で示される特徴を抽出する特徴抽出ステップと、
該特徴に基づき、局所におけるガウシアンカーネルの和として表されるカーネル関数及びサポートベクトル回帰を用いて、前記パラメータを推定するための関数を作成するパラメータ推定関数作成ステップと、
該関数に基づき、局所におけるガウシアンカーネルの和として表されるカーネル関数を用いて、パラメータ推定を行うパラメータ推定ステップと、
該パラメータ推定の結果を出力する出力ステップと、
を有することを特徴とするパラメータ推定方法。 - 前記の局所におけるガウシアンカーネルの和として表されるカーネル関数を式[1]と見做したパラメータ推定関数作成ステップ並びにパラメータ推定ステップを含むことを特徴とする請求項3に記載のパラメータ推定方法。
- 請求項3または4に記載のパラメータ推定方法を、コンピュータで実行可能に記載したプログラム記録したことを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005332316A JP2007140805A (ja) | 2005-11-17 | 2005-11-17 | 画像内オブジェクトのパラメータ推定装置,方法,媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005332316A JP2007140805A (ja) | 2005-11-17 | 2005-11-17 | 画像内オブジェクトのパラメータ推定装置,方法,媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007140805A true JP2007140805A (ja) | 2007-06-07 |
Family
ID=38203593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005332316A Pending JP2007140805A (ja) | 2005-11-17 | 2005-11-17 | 画像内オブジェクトのパラメータ推定装置,方法,媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007140805A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014197411A (ja) * | 2010-12-30 | 2014-10-16 | アイロボット コーポレイション | 可動式ロボットシステム |
JP2023516295A (ja) * | 2020-02-27 | 2023-04-19 | シーメンス・ヘルスケア・ダイアグノスティックス・インコーポレイテッド | 機械学習を用いた自動センサトレース検証 |
-
2005
- 2005-11-17 JP JP2005332316A patent/JP2007140805A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014197411A (ja) * | 2010-12-30 | 2014-10-16 | アイロボット コーポレイション | 可動式ロボットシステム |
JP2023516295A (ja) * | 2020-02-27 | 2023-04-19 | シーメンス・ヘルスケア・ダイアグノスティックス・インコーポレイテッド | 機械学習を用いた自動センサトレース検証 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Noroozi et al. | Motion deblurring in the wild | |
US7925081B2 (en) | Systems and methods for human body pose estimation | |
JP5555706B2 (ja) | 高解像度映像獲得装置およびその方法 | |
US8379120B2 (en) | Image deblurring using a combined differential image | |
CN101516001B (zh) | 数字拍摄设备及其控制方法和记录介质 | |
US8923392B2 (en) | Methods and apparatus for face fitting and editing applications | |
RU2538941C1 (ru) | Улучшения качества распознавания за счет повышения разрешения изображений | |
CN101488216A (zh) | 图像处理装置及方法以及摄像装置 | |
US8249377B1 (en) | Blurred digital image deblurring | |
Deepthi et al. | Implementation of mobile platform using Qt and OpenCV for image processing applications | |
CN112055249B (zh) | 一种视频插帧方法及装置 | |
US20180336688A1 (en) | Image processing apparatus and image processing method, and storage medium | |
CN114359665B (zh) | 全任务人脸识别模型的训练方法及装置、人脸识别方法 | |
JP2010511241A (ja) | 動きに対する繰り返しセグメンテーション | |
JP2019512821A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2013502147A (ja) | 画像シーケンスの関心領域に基づくアーティファクト低減のためのシステム及び方法 | |
Zhou et al. | DeLiEve-Net: Deblurring low-light images with light streaks and local events | |
JP4383990B2 (ja) | パラメータ推定装置、パラメータ推定方法、パラメータ推定プログラム、および、パラメータ推定プログラムの記録媒体 | |
US10430960B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2007140805A (ja) | 画像内オブジェクトのパラメータ推定装置,方法,媒体 | |
US11410278B2 (en) | Automatic artifact removal in a digital image | |
JP5737387B2 (ja) | 画像処理装置 | |
KR101438451B1 (ko) | 비고정 카메라 영상에 대한 이중모드 sgm 기반의 이동체 고속 검출 방법 및 이를 위한 컴퓨터로 판독가능한 기록매체 | |
KR101711589B1 (ko) | 초해상도 기법 기반 사전 생성 방법 및 이를 이용한 영상 확대 방법 및 그 장치 | |
JP4740889B2 (ja) | パラメータ推定装置,パラメータ推定方法,その方法を実装したプログラム及びそのプログラムを記録した記録媒体 |