JP2014092964A - 比較的低品質な観測画像から、画像内のオブジェクトの数を推定する方法、コンピュータ・プログラム、コンピュータ。 - Google Patents
比較的低品質な観測画像から、画像内のオブジェクトの数を推定する方法、コンピュータ・プログラム、コンピュータ。 Download PDFInfo
- Publication number
- JP2014092964A JP2014092964A JP2012243508A JP2012243508A JP2014092964A JP 2014092964 A JP2014092964 A JP 2014092964A JP 2012243508 A JP2012243508 A JP 2012243508A JP 2012243508 A JP2012243508 A JP 2012243508A JP 2014092964 A JP2014092964 A JP 2014092964A
- Authority
- JP
- Japan
- Prior art keywords
- image
- binarized
- observation
- parameter
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Traffic Control Systems (AREA)
- Image Analysis (AREA)
Abstract
【課題】 画像の各画素を2値化することで解像度や重なりに対して頑健にオブジェクト領域を同定し、オブジェクト領域の画素数からオブジェクト数を推定するモデルを教師データ無しに構成する。
【解決手段】 コンピュータにより画像内のオブジェクトの個数を推定する方法であり、
画像の観測を受け付けるステップと、
前記画像を所定の二値化関数に基づいて二値化し、二値化画像を取得するステップと、
前記二値化画像中の前記オブジェクトに対応する画素数を特徴量とし、前記個数を隠れ変数とし、前記個数によりモデルが切り替わる混合ガウス分布モデルを所定の予測モデルとし、前記特徴量と前記予測モデルに基づいて前記個数を予測するステップと
を備える。
【選択図】 図7
【解決手段】 コンピュータにより画像内のオブジェクトの個数を推定する方法であり、
画像の観測を受け付けるステップと、
前記画像を所定の二値化関数に基づいて二値化し、二値化画像を取得するステップと、
前記二値化画像中の前記オブジェクトに対応する画素数を特徴量とし、前記個数を隠れ変数とし、前記個数によりモデルが切り替わる混合ガウス分布モデルを所定の予測モデルとし、前記特徴量と前記予測モデルに基づいて前記個数を予測するステップと
を備える。
【選択図】 図7
Description
本発明は、情報処理技術に関係し、より詳しくは、比較的低品質な観測画像から、画像内のオブジェクトの数を推定する技術に係る。
例えば、道路の建設など、社会インフラの構築には事前に交通データ等を入手、分析し、そのインフラ構築前に綿密な計画を立てることが好ましい。一方、新興国に代表されるような今後大規模な社会インフラの構築が行われであろう国や地域ほど、GPSやセンサー等の正確な交通データを取得する手段に乏しい現実がある。他方、簡易なウェブ・カメラであれば、多くの地域に設置され手軽に用いることができ、これにより、本来多くの交通情報データを入手できる可能性がある。しかし、ウェブカメラによる画像は一般に解像度が低く、位置ずれ等の問題もある。
従来から、画像を用いて交通データを取得する技術が様々提案されている。例えば、画像からフィルタリングによって直接的に車両を検出する技術である。この技術では、背景差分法等のフィルタを組み合わせて適用することで直接車両を抽出するものである。他にも、教師データを用いて台数を推定する技術が存在する。すなわち、車を代表するテンプレートを用意し画像内で相関の高い領域を判定して車両を検知することで数える方法や、車の正例、負例の画像を用意し、識別器を学習させ、学習した識別器を用いて車両を検知することで数える方法、また画像全体から特徴量を抽出し台数を推定する回帰式を学習させ推定する方法等がある。
しかしながら、従来技術では、車両1台が一定以上の解像度で写っていることを前提としているが、現実には、数百ドット程度の人の目にも判別が難しいような画像である場合がある。また、従来技術では、車両は重なっていないことを前提としているが、現実には、多くの重なりがある。また、従来技術では、安定して使用可能な背景を必要とするが、現実には、固定カメラといえども、街灯や影等による照明の変化や、様々な外部要因によるカメラの位置ずれにより、安定して背景画像を用意することは難しい。さらに、従来技術では、教師データ、テンプレートを必要とするが、現実には、低解像度で重なりの多い画像では教師データの作成も困難であり、コストがかかる。
本発明はこのような課題に鑑みてなされたものであり、その目的は、画像の各画素を2値化することで解像度や重なりに対して頑健にオブジェクト領域を同定し、オブジェクト領域の画素数からオブジェクト数を推定するモデルを教師データ無しに構成する技術を提供することにある。
すなわち本発明は、コンピュータにより画像内のオブジェクトの個数を推定する方法であり、画像の観測を受け付けるステップと、前記画像を所定の二値化関数に基づいて二値化し、二値化画像を取得するステップと、前記二値化画像中の前記オブジェクトに対応する画素数を特徴量とし、前記個数を隠れ変数とし、前記個数によりモデルが切り替わる混合ガウス分布モデルを所定の予測モデルとし、前記特徴量と前記予測モデルに基づいて前記個数を予測するステップとを備える方法である。さらに、本発明は、前記画像の観測を受け付けるステップは、複数の前記画像の観測を受け付け、前記二値画像を取得するステップは、前記複数の画像を所定の二値化関数に基づいて二値化し、複数の二値化画像を取得し、前記複数の二値化画像中の前記オブジェクトに対応する画素数を各特徴量とし、前記所定の予測モデルの各パラメータを学習するステップを更に備えることができる。
ここで、前記各パラメータを学習するステップは、教師データなしに前記各パラメータを学習することができ、変分ベイズ法により前記各パラメータを学習することができ、前記個数の最大数をノンパラメトリック・ベイズ法により自動決定することができる。なお、前記変分ベイズ法は、複数の前記各パラメータ間が独立であると仮定し、KL情報量を基準に最適化を行うことができ、前記ノンパラメトリック・ベイズ法は、stick breaking processを前記隠れ変数の事前分布に採用することができる。さらに、前記学習された各パラメータに基づいて、前記所定の予測モデルを更新するステップを更に備えるように構成することができ、また、前記画像の観測を一定時間毎のグループに区切り、 各グループでは、前記個数の予測と前記各パラメータの学習を同時に行い、 先行するグループにより学習された各パラメータに基づいて、後続のグループの画像内のオブジェクトの個数を予測するように構成することもできる。
また、前記特徴量の観測過程は、オブジェクト側に誤って二値化されたオブジェクト以外の背景の画素数をθ0、その平均値をμ0、そのノイズをεθ0、二値化されたオブジェクト1個分の画素数をθ1、その平均値をμ1、そのノイズをεθ1、画像内のオブジェクトの個数をd、前記オブジェクトに対応する画素数をf、 前記二値化画像中の前記オブジェクトに対応する画素数の観測値をx、そのノイズをεxとして、
θ0≡μ0+εθ0
θ1≡μ1+εθ1
f(θ0,θ1,d)≡θ1*d+θ0
x≡f(θ0,θ1,d) +εx
と定式化することができる。なお、前記画素数f(θ0, θ1,d)の平均と分散は前記個数dの増加に対して線形に増加するように構成することもできる。
θ0≡μ0+εθ0
θ1≡μ1+εθ1
f(θ0,θ1,d)≡θ1*d+θ0
x≡f(θ0,θ1,d) +εx
と定式化することができる。なお、前記画素数f(θ0, θ1,d)の平均と分散は前記個数dの増加に対して線形に増加するように構成することもできる。
また、前記各パラメータを学習するステップは、η:前記個数を表す隠れ変数、β:観測ノイズの精度、ρ0,ρ1:画素数θ0,θ1の事前精度、v:stickbreaking processを表す変数、α:stick breaking processを特徴付けるパラメータとして、前記複数の二値化画像中の前記オブジェクトに対応する画素数の観測値のデータセットxの入力に対して、前記各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を出力するように構成することもできる。なお、前記各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を試験分布q(η,θ0,θ1,β,ρ0,ρ1,v,α)≡q(η)q(θ0,θ1)q(β,ρ0,ρ1,v)q(α)を導入して近似的に求めてもよい。
また、前記個数を予測するステップは、前記二値化画像中の前記オブジェクトに対応する画素数の観測値のデータxnew及び前記学習した各パラメータの事後分布確率p(θ0,θ1,β,ρ0,ρ1,v,α|x)の入力に対して、事後確率最大化により推定された前記個数の推定値argmaxp(ηnew|xnew,x)、またはその近似値を出力するように構成することもできる。
また、前記画像の観測を受け付けるステップは、複数の前記画像の観測を受け付け、前記二値画像を取得するステップは、前記複数の画像による輝度ヒストグラムの和を、ある閾値で二つのクラスに分割した際に、そのクラス間分散が最大になるような閾値を決定し、二値化するように構成することもできる。なお、前記画像の観測を一定時間毎のグループに区切り、 先行するグループにより決定された閾値に基づいて、後続のグループの画像の二値化を行うこともできる。
なお、前記オブジェクトは車両であり、前記オブジェクトの個数は、前記車両の台数でもよい。また、前記画像は、ウェブ・カメラにより定点撮影された道路の一部の画像でもよい。その他にも、例えば、前記オブジェクトが人であり、前記オブジェクトの個数は前記人の数でもよい。
本発明コンピュータ・プログラム、コンピュータ・システムとして把握した場合にも、上述した本発明を方法として把握した場合と実質的に同一の技術的特徴を備える事ができる。
本発明によれば、画像の各画素を2値化することで解像度や重なりに対して頑健にオブジェクト領域を同定し、オブジェクト領域の画素数からオブジェクト数を推定するモデルを教師データ無しに構成する技術を提供することができる。
実施形態
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて(特段の断りのない限り)同じ要素には同じ番号を付している。
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて(特段の断りのない限り)同じ要素には同じ番号を付している。
図1は、本発明の実施形態を例示する概念図である。例示されているシステムは、パーソナル・コンピュータ1と、インタネット2と、中継器3と、ウェブ・カメラ4から構成されている。ここで、カメラ4は、ビルの屋上に固定的に設置され、一定時間間隔で周辺の道路をカラー静止画撮影している(定点撮影)。また、カメラ4は、周辺の道路を走る車両の台数をカウントするために、改めて導入した専用のものである必要はなく、既存の汎用ウェブ・カメラで足り、その性能も比較的低品質のもの(例えば、数百万画素程度)でよい。また、カメラ4とコンピュータ1との間は、中継器3やインタネット2を含む有線・無線の通信ネットワークで接続されており、撮影された画像は、通信ネットワークを介してカメラ4からコンピュータ1へ送信される。また、カメラ4が自律的に撮影するものでもよいし、例えば、通信ネットワークを介して受信するコンピュータ1からの撮影指示に応答して、他律的に撮影するものでもよい。なお、ここでは、カメラ4とコンピュータ1との関係は、一対一で対応付けられているが、これに限らず、複数のカメラ4が単一のコンピュータ1と対応付けられてもよいし、単一のカメラ4が複数のコンピュータ1と対応付けられてもよいし、複数のカメラ4が複数のコンピュータ1と対応付けられてもよい。
図2は、パーソナル・コンピュータ1のハードウェア構成を説明するブロック図である。コンピュータ1のハードウェア構成は、(低速及び高速の)バス10、バス10に接続されるCPU(演算制御装置)11、RAM(ランダム・アクセス・メモリ:記憶装置)12、ROM(リード・オンリ・メモリ:記憶装置)13、HDD(ハード・ディスク・ドライブ:記憶装置)14、通信インタフェース15、入出力インタフェース16を備えている。さらに、入出力インタフェース16に接続されるマウス17、フラット・パネル・ディスプレイ(表示装置)18、キーボード19等を備えている。なお、コンピュータ1は一般的なパーソナル・コンピュータ・アーキテクチャを採用するものとして説明したが、例えば、より高いデータ処理能力や可用性を求めて、CPU11やHDD14等を多重化することができる。また、デスクトップ型の他、様々なタイプのコンピュータ・システムを採用することができる。
このコンピュータ1のソフトウェア構成は、基本的な機能を提供するオペレーティング・システム(OS)と、OSの機能を利用するアプリケーション・ソフトウェアと、入出力装置のドライバ・ソフトウェアとを備えている。これらの各ソフトウェアは、各種データと共にRAM12上にロードされ、CPU11等により実行され、コンピュータ1は全体として、図3に示す機能モジュールとして機能し、図4から図11に示す処理を実行する。
図3は、実施例に係るコンピュータ1の機能モジュールを説明するブロック図である。コンピュータ1は、二値化モジュール101、カウントモジュール102、推定モジュール103、閾値設定モジュール104、学習モジュール105として機能する。
図4は、コンピュータ1の処理を説明する概念図である。画像の観測を一定時間毎のグループに区切り、各グループには複数枚の画像が対応している。各グループでは車両台数の推定(予測フェーズ)と学習(学習フェーズ)が同時に行われる。そして、先行するグループに含まれる複数の画像に基づいて学習された各パラメータに基づいて車両台数モデルを更新し、後続のグループの画像の車両台数の推定を行う。同様に、先行するグループに含まれる複数の画像に基づいて選択された閾値に基づいて二値化関数を更新し、後続のグループの画像の二値化を行う。すなわち、このシステムが稼働し始めれば、順次車両台数モデル及び二値化関数がより適切なものに自動更新される。なお、予測フェーズは、大きく分けて、二値化処理と台数推定処理とで構成され、学習フェーズは、大きく分けて、二値化関数決定処理、二値化処理、モデル学習処理とで構成される。以下、これらの処理について、具体的な数式等を示し、より詳細に説明する。
図5は、学習フェーズを説明するフローである。学習フェーズでの入力は、図4で説明した各グループに含まれる複数枚の画像である。なお、各画像は、カメラ4で広範囲に撮影された領域の一部領域、ここでは、道路部分の領域のみが入力される(後述の予測フェーズも同様)。この領域は、車両台数を推定する目的に応じて、例えば、上り車線のみ、下り車線のみ、両車線を含む、全車線、一部車線等、適宜選択すればよい。また、本実施形態では、カメラ4は固定されていることを前提としているため、上記道路部分は固定的な座標で特定することができる。もっとも、カメラ4の位置ずれ等を考慮して、上記道路部分をよりフレキシブルな座標で特定することもできる。一方、学習フェーズでの出力は、二値化関数(閾値)と車両台数モデル(パラメータ)である。
閾値設定モジュール104が、上記道路部分に対応する複数の画像の入力を受け付ける(Step11)。次に、閾値設定モジュール104は、(一例として)判別分析法により、二値化関数を求める(Step12)。
図6は、判別分析法を説明するグラフである。数1は、判別分析法に用いる各種パラメータを説明する数式である。
閾値設定モジュール104は、道路部分に対応する複数の画像による輝度ヒストグラムの和を、ある閾値で二つのクラスに分割した際に、そのクラス間分散σb2が最大になるように閾値kを決定する。すなわち、クラス毎の輝度の平均の間の分散が最も大きくなるよう、kを階調分(例えば、256階調であれば、256通り)変化させて評価し、最大値を求める。
次に、カウントモジュール102は、二値化された画像に基づいて、その車両領域(白部分)の画素数をカウントする(Step13)。このような画素数を特徴量とすることで、解像度の低下や複数の車両に多少の重なりがあっても2値化後の白の画素数はほぼ等しく、頑健であることが期待される。
次に、学習モジュール105は、ベイジアン密度推定モデルを用いて、カウントされた車両領域の画素数を特徴量とし、車両台数モデルのパラメータを推定する(Step14)。
図7は、設定する観測モデルを説明する模式図である。数2は、設定する事前分布を説明する数式である。数3は、事前分布の各種パラメータを説明するものである。
すなわち、特徴量の観測過程は、車両側に誤って二値化された車両以外の道路部分の画素数をθ0、その平均値をμ0、そのノイズをεθ0、二値化された車両一台分の画素数をθ1、その平均値をμ1、そのノイズをεθ1、画像内の車両の台数をd、車両に対応する画素数をf、二値化画像中の車両に対応する画素数の観測値をx、そのノイズをεxとして、以下のように定式化する。
θ0≡μ0+εθ0
θ1≡μ1+εθ1
f(θ0,θ1,d)≡θ1*d+θ0
x≡f(θ0,θ1,d) +εx
なお、画素数f(θ0, θ1,d)の平均と分散は車両台数dの増加に対して線形に増加する。
θ0≡μ0+εθ0
θ1≡μ1+εθ1
f(θ0,θ1,d)≡θ1*d+θ0
x≡f(θ0,θ1,d) +εx
なお、画素数f(θ0, θ1,d)の平均と分散は車両台数dの増加に対して線形に増加する。
図8は、車両に対応する画素数f(θ0,θ1,d)の分布を示すものであり、図9は、車両に対応する画素数の観測値xの分布を示すものである。
学習モジュール105は、η:車両台数を表す隠れ変数、β:観測ノイズの精度、ρ0,ρ1:画素数θ0,θ1の事前精度、v:stickbreaking processを表す変数、α:stick breaking processを特徴付けるパラメータとして、複数の二値化画像中の車両領域に対応する画素数の観測値のデータセットxの入力に対して、各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を出力する。ここで、ノイズの分散等を含めた全ての変数の値を決める必要があるが、交差検定をするには変数が多く、膨大な処理が必要である。また、交差検定を避けるため、フルベイズなモデルを用いて1度の学習で全変数の最適化を行いたいが、周辺化処理が膨大なため困難である。そこで、学習モジュール105は、変分ベイズ法を利用し、各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を試験分布q(η,θ0,θ1,β,ρ0,ρ1,v,α)≡q(η)q(θ0,θ1)q(β,ρ0,ρ1,v)q(α)を導入して近似的に高速に求める。つまり、変分ベイズ法を用いて、変数間に独立性の仮定を置き、KL情報量を基準に最適化を行うことで、フルベイズな枠組みの推定を近似的に行い、一度の学習で全変数の推定を効率的に行うことが可能になる。
なお、車両台数dの最大数は、ノンパラメトリック・ベイズの枠組みで自動決定する。つまり、車両台数dを表す隠れ変数の次元数を適切に調整し、不要な要素を取り除くためstick breaking processを隠れ変数の事前分布に採用している。
すなわち、数4に示す、扱い易い試験分布を導入する。このように変数をいくつかのグループに分けて、グループ間が独立の因子化仮定をおく。次に、数5に示すように、KL情報量を基準として、試験分布qが真の分布pをよく近似するようにqを最適化する。ここで、変分ベイズ法の更新式は、一般には、数6に示す自己無撞着方程式となり、本実施形態においては、数7に示す自己無撞着方程式となる。数7の更新式の各試験分布は全て共役な形になるため、実質的には、数8及び数9に示す各試験分布のパラメータのみを収束条件が満たされるまで繰り返し計算する。そして、収束した時のqをpの近似解とする
学習モジュール105は、得られたパラメータにより、車両台数モデルを更新する。
図10は、予測フェーズを説明するフローである。予測フェーズでの入力は、車両台数を推定したい画像、学習フェーズ(図5参照)でその閾値を定めた二値化関数、学習フェーズ(図5参照)で学習した車両台数モデルである。一方、予測フェーズでの出力は、車両台数の推定値である。
まず、車両台数を推定したい画像と二値化関数が二値化モジュール101に入力され、車両台数モデルが推定モジュール103に入力される(Step21)。二値化モジュール101は、設定された閾値に基づいて画像を二値化する。カウントモジュール102は、二値化された画像の車両領域(白部分)の画素数(データxnew)をカウントする(Step22)。推定モジュール103は、データxnew及び学習した各パラメータの事後分布確率p(θ0,θ1,β,ρ0,ρ1,v,α|x)の入力に対して、事後確率最大化により推定された車両台数の推定値argmaxp(ηnew|xnew, x)、またはその近似値を出力する(Step23)。なお、推定された車両台数の値はディスプレイ18に表示することができる。
本発明は、全体がハードウェアの実施形態、全体がソフトウェアの実施形態、またはハードウェアおよびソフトウェア両方のエレメントを包含する実施形態の形を取ることができる。ある好適な実施形態において、本発明は、以下に限らないが、ファームウェア、常駐ソフトウェア、マイクロコード、構文解析ピココードなどを含めた、ソフトウェアに実装される。
さらに、本発明は、コンピュータまたは任意の命令実行システムによってまたはこれに関連させて使用するプログラム・コードを備えるコンピュータ・プログラム、コンピュータ可読媒体の形態を採ることもできる。本説明目的の上で、コンピュータ可読媒体は、任意の命令実行システム、装置、またはデバイスによってまたはこれに関連させて使用するためのプログラムを、収容、格納、通信、伝搬、または伝送できる任意の装置であり得る。具体的には、前述の構文解析制御モジュールは、この意味で命令実行システム、または「コンピュータ」を構成する。
媒体は、電子的、磁気的、光学的、電磁気的、赤外的、または半導体のシステム(もしくは装置もしくはデバイス)または伝搬媒体とすることができる。コンピュータ可読媒体の例には、半導体または固体メモリ、磁気テープ、着脱可能コンピュータ・ディスケット、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read−only memory)、剛体磁気ディスク、および光ディスクが含まれる。光ディスクの現時点での例には、コンパクト・ディスク読み取り専用メモリ(CD−ROM:compact disk read only memory)、コンパクト・ディスク読み取り/書き込み(CD−R/W:compact disk read/write)メモリ、およびDVDが含まれる。
プログラム・コードを格納もしくは実行またはその両方を行うのに適したデータ処理システムは、システム・バスを介して直接的または間接的にメモリ・エレメントに連結された少なくとも一つのプロセッサを含み得る。このメモリ・エレメントには、プログラム・コードの実際の実行の過程で使われるローカル・メモリ、バルク記憶装置、および、実行中にバルク記憶装置から読み出さねばならない回数を低減するために、少なくとも一部のプログラム・コードに一時的保管を提供するキャッシュ・メモリを含めることができる。
1…パーソナル・コンピュータ、
11…CPU(演算制御装置)
12…RAM(ランダム・アクセス・メモリ:記憶装置)
13…ROM(リード・オンリ・メモリ:記憶装置)
14…HDD(ハード・ディスク・ドライブ:記憶装置)
15…通信インタフェース
16…入出力インタフェース
17…マウス
18…フラット・パネル・ディスプレイ(表示装置)
101…二値化モジュール
102…カウントモジュール
103…推定モジュール
104…閾値設定モジュール
105…学習モジュール
11…CPU(演算制御装置)
12…RAM(ランダム・アクセス・メモリ:記憶装置)
13…ROM(リード・オンリ・メモリ:記憶装置)
14…HDD(ハード・ディスク・ドライブ:記憶装置)
15…通信インタフェース
16…入出力インタフェース
17…マウス
18…フラット・パネル・ディスプレイ(表示装置)
101…二値化モジュール
102…カウントモジュール
103…推定モジュール
104…閾値設定モジュール
105…学習モジュール
Claims (20)
- コンピュータにより画像内のオブジェクトの個数を推定する方法であり、
画像の観測を受け付けるステップと、
前記画像を所定の二値化関数に基づいて二値化し、二値化画像を取得するステップと、
前記二値化画像中の前記オブジェクトに対応する画素数を特徴量とし、前記個数を隠れ変数とし、前記個数によりモデルが切り替わる混合ガウス分布モデルを所定の予測モデルとし、前記特徴量と前記予測モデルに基づいて前記個数を予測するステップと
を備える方法。 - 前記画像の観測を受け付けるステップは、複数の前記画像の観測を受け付け、
前記二値画像を取得するステップは、前記複数の画像を所定の二値化関数に基づいて二値化し、複数の二値化画像を取得し、
前記複数の二値化画像中の前記オブジェクトに対応する画素数を各特徴量とし、前記所定の予測モデルの各パラメータを学習するステップを更に備える
請求項1に記載の方法。 - 前記各パラメータを学習するステップは、教師データなしに前記各パラメータを学習する請求項2に記載の方法。
- 前記各パラメータを学習するステップは、変分ベイズ法により前記各パラメータを学習する請求項2に記載の方法。
- 前記変分ベイズ法は、複数の前記各パラメータ間が独立であると仮定し、KL情報量を基準に最適化を行う請求項4に記載の方法。
- 前記各パラメータを学習するステップにおいて、前記個数の最大数をノンパラメトリック・ベイズ法により自動決定する請求項2に記載の方法。
- 前記ノンパラメトリック・ベイズ法は、stick breaking processを前記隠れ変数の事前分布に採用する請求項6に記載の方法。
- 前記学習された各パラメータに基づいて、前記所定の予測モデルを更新するステップを更に備える請求項2に記載の方法。
- 前記画像の観測を一定時間毎のグループに区切り、
各グループでは、前記個数の予測と前記各パラメータの学習を同時に行い、
先行するグループにより学習された各パラメータに基づいて、後続のグループの画像内のオブジェクトの個数を予測する請求項8に記載の方法。 - 前記特徴量の観測過程は、
オブジェクト側に誤って二値化されたオブジェクト以外の背景の画素数をθ0、その平均値をμ0、そのノイズをεθ0、
二値化されたオブジェクト1個分の画素数をθ1、その平均値をμ1、そのノイズをεθ1、
画像内のオブジェクトの個数をd、
前記オブジェクトに対応する画素数をf、
前記二値化画像中の前記オブジェクトに対応する画素数の観測値をx、そのノイズをεx
として、
θ0≡μ0+εθ0
θ1≡μ1+εθ1
f(θ0,θ1,d)≡θ1*d+θ0
x≡f(θ0,θ1,d) +εx
と定式化する請求項1又は2に記載の方法。 - 前記画素数f(θ0, θ1,d)の平均と分散は前記個数dの増加に対して線形に増加する請求項10に記載の方法。
- 前記各パラメータを学習するステップは、
η:前記個数を表す隠れ変数、
β:観測ノイズの精度、
ρ0,ρ1:画素数θ0,θ1の事前精度、
v:stick breakingprocessを表す変数、
α:stick breaking processを特徴付けるパラメータとして、
前記複数の二値化画像中の前記オブジェクトに対応する画素数の観測値のデータセットxの入力に対して、
前記各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を出力する請求項10に記載の方法。 - 前記各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を
試験分布q(η,θ0,θ1,β,ρ0,ρ1,v,α)≡q(η)q(θ0,θ1)q(β,ρ0,ρ1,v)q(α)
を導入して近似的に求める請求項12に記載の方法。 - 前記個数を予測するステップは、
前記二値化画像中の前記オブジェクトに対応する画素数の観測値のデータxnew及び前記学習した各パラメータの事後分布確率p(θ0,θ1,β,ρ0,ρ1,v,α|x)の入力に対して、
事後確率最大化により推定された前記個数の推定値argmaxp(ηnew|xnew, x) 、またはその近似値を出力する請求項12に記載の方法。 - 前記画像の観測を受け付けるステップは、複数の前記画像の観測を受け付け、
前記二値画像を取得するステップは、前記複数の画像による輝度ヒストグラムの和を、ある閾値で二つのクラスに分割した際に、そのクラス間分散が最大になるような閾値を決定し、二値化する請求項1に記載の方法。 - 前記画像の観測を一定時間毎のグループに区切り、
先行するグループにより決定された閾値に基づいて、後続のグループの画像の二値化を行う請求項15に記載の方法。 - 前記オブジェクトは車両であり、前記オブジェクトの個数は、前記車両の台数である請求項1に記載の方法。
- 前記画像は、ウェブカメラにより定点撮影された道路の一部の画像である請求項1に記載の方法。
- 画像内のオブジェクトの個数を推定するコンピュータ・プログラムであり、
実行されることにより、前記コンピュータに請求項1乃至18のいずれかに記載の方法を実行させるコンピュータ・プログラム。 - 画像内のオブジェクトの個数を推定するコンピュータであり、
画像の観測を受け付ける手段と、
前記画像を所定の二値化関数に基づいて二値化し、二値化画像を取得する手段と、
前記二値化画像中の前記オブジェクトに対応する画素数を特徴量とし、前記個数を隠れ変数とし、前記個数によりモデルが切り替わる混合ガウス分布モデルを所定の予測モデルとし、前記特徴量と前記予測モデルに基づいて前記個数を予測する手段と
を備えるコンピュータ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012243508A JP2014092964A (ja) | 2012-11-05 | 2012-11-05 | 比較的低品質な観測画像から、画像内のオブジェクトの数を推定する方法、コンピュータ・プログラム、コンピュータ。 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012243508A JP2014092964A (ja) | 2012-11-05 | 2012-11-05 | 比較的低品質な観測画像から、画像内のオブジェクトの数を推定する方法、コンピュータ・プログラム、コンピュータ。 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014092964A true JP2014092964A (ja) | 2014-05-19 |
Family
ID=50936989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012243508A Pending JP2014092964A (ja) | 2012-11-05 | 2012-11-05 | 比較的低品質な観測画像から、画像内のオブジェクトの数を推定する方法、コンピュータ・プログラム、コンピュータ。 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014092964A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112540039A (zh) * | 2020-12-31 | 2021-03-23 | 北京博奥体质宝健康科技有限公司 | 一种可用于直接计算贴壁活细胞数量的方法 |
US11189015B2 (en) | 2018-05-30 | 2021-11-30 | Samsung Electronics Co., Ltd. | Method and apparatus for acquiring feature data from low-bit image |
-
2012
- 2012-11-05 JP JP2012243508A patent/JP2014092964A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11189015B2 (en) | 2018-05-30 | 2021-11-30 | Samsung Electronics Co., Ltd. | Method and apparatus for acquiring feature data from low-bit image |
US11636575B2 (en) | 2018-05-30 | 2023-04-25 | Samsung Electronics Co., Ltd. | Method and apparatus for acquiring feature data from low-bit image |
US11893497B2 (en) | 2018-05-30 | 2024-02-06 | Samsung Electronics Co., Ltd. | Method and apparatus for acquiring feature data from low-bit image |
CN112540039A (zh) * | 2020-12-31 | 2021-03-23 | 北京博奥体质宝健康科技有限公司 | 一种可用于直接计算贴壁活细胞数量的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10282623B1 (en) | Depth perception sensor data processing | |
WO2020192469A1 (zh) | 图像语义分割网络的训练方法、装置、设备及存储介质 | |
EP3655923B1 (en) | Weakly supervised anomaly detection and segmentation in images | |
CN108229489B (zh) | 关键点预测、网络训练、图像处理方法、装置及电子设备 | |
US11501162B2 (en) | Device for classifying data | |
US10410354B1 (en) | Method and apparatus for multi-model primitive fitting based on deep geometric boundary and instance aware segmentation | |
US9760800B2 (en) | Method and system to detect objects using block based histogram of oriented gradients | |
CN108229673B (zh) | 卷积神经网络的处理方法、装置和电子设备 | |
CN110969200B (zh) | 基于一致性负样本的图像目标检测模型训练方法及装置 | |
CN110889421A (zh) | 目标物检测方法及装置 | |
WO2022141858A1 (zh) | 行人检测方法、装置、电子设备及存储介质 | |
CN110580499B (zh) | 基于众包重复标签的深度学习目标检测方法及系统 | |
CN113762327B (zh) | 机器学习方法、机器学习系统以及非暂态电脑可读取媒体 | |
CN103824307A (zh) | 一种确定无效运动目标像素的方法和装置 | |
CN111079634A (zh) | 车辆行驶中检测障碍物的方法、装置、系统及车辆 | |
Ding et al. | Mit-avt clustered driving scene dataset: Evaluating perception systems in real-world naturalistic driving scenarios | |
JP2014092964A (ja) | 比較的低品質な観測画像から、画像内のオブジェクトの数を推定する方法、コンピュータ・プログラム、コンピュータ。 | |
CN110728229B (zh) | 图像处理方法、装置、设备和存储介质 | |
CN112446428A (zh) | 一种图像数据处理方法及装置 | |
KR102546193B1 (ko) | 컬러 정보를 이용한 학습 데이터 분류 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 | |
US20240220817A1 (en) | System and method for self-supervised federated learning for automotive applications | |
CN116958113A (zh) | 一种产品检测方法、装置、设备及存储介质 | |
JP2024516642A (ja) | 行動検出方法、電子機器およびコンピュータ読み取り可能な記憶媒体 | |
CN116974735A (zh) | 模型训练的方法、电子设备和计算机程序产品 | |
CN111881833B (zh) | 一种车辆检测方法、装置、设备及存储介质 |