JP2014092964A

JP2014092964A - 比較的低品質な観測画像から、画像内のオブジェクトの数を推定する方法、コンピュータ・プログラム、コンピュータ。

Info

Publication number: JP2014092964A
Application number: JP2012243508A
Authority: JP
Inventors: Takayuki Katsuki; 孝行勝木; Tetsuo Morimura; 哲郎森村; Takeshi Ide; 剛井手; Hidemasa Muta; 英正牟田
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2012-11-05
Filing date: 2012-11-05
Publication date: 2014-05-19

Abstract

【課題】画像の各画素を２値化することで解像度や重なりに対して頑健にオブジェクト領域を同定し、オブジェクト領域の画素数からオブジェクト数を推定するモデルを教師データ無しに構成する。
【解決手段】コンピュータにより画像内のオブジェクトの個数を推定する方法であり、
画像の観測を受け付けるステップと、
前記画像を所定の二値化関数に基づいて二値化し、二値化画像を取得するステップと、
前記二値化画像中の前記オブジェクトに対応する画素数を特徴量とし、前記個数を隠れ変数とし、前記個数によりモデルが切り替わる混合ガウス分布モデルを所定の予測モデルとし、前記特徴量と前記予測モデルに基づいて前記個数を予測するステップと
を備える。
【選択図】図７

Description

本発明は、情報処理技術に関係し、より詳しくは、比較的低品質な観測画像から、画像内のオブジェクトの数を推定する技術に係る。

例えば、道路の建設など、社会インフラの構築には事前に交通データ等を入手、分析し、そのインフラ構築前に綿密な計画を立てることが好ましい。一方、新興国に代表されるような今後大規模な社会インフラの構築が行われであろう国や地域ほど、GPSやセンサー等の正確な交通データを取得する手段に乏しい現実がある。他方、簡易なウェブ・カメラであれば、多くの地域に設置され手軽に用いることができ、これにより、本来多くの交通情報データを入手できる可能性がある。しかし、ウェブカメラによる画像は一般に解像度が低く、位置ずれ等の問題もある。

従来から、画像を用いて交通データを取得する技術が様々提案されている。例えば、画像からフィルタリングによって直接的に車両を検出する技術である。この技術では、背景差分法等のフィルタを組み合わせて適用することで直接車両を抽出するものである。他にも、教師データを用いて台数を推定する技術が存在する。すなわち、車を代表するテンプレートを用意し画像内で相関の高い領域を判定して車両を検知することで数える方法や、車の正例、負例の画像を用意し、識別器を学習させ、学習した識別器を用いて車両を検知することで数える方法、また画像全体から特徴量を抽出し台数を推定する回帰式を学習させ推定する方法等がある。

特開２００６−２９３７５６号公報特開２００５−２６７５７０号公報特開２００４−２１３７５号公報特許第３９８１３９１号公報

しかしながら、従来技術では、車両１台が一定以上の解像度で写っていることを前提としているが、現実には、数百ドット程度の人の目にも判別が難しいような画像である場合がある。また、従来技術では、車両は重なっていないことを前提としているが、現実には、多くの重なりがある。また、従来技術では、安定して使用可能な背景を必要とするが、現実には、固定カメラといえども、街灯や影等による照明の変化や、様々な外部要因によるカメラの位置ずれにより、安定して背景画像を用意することは難しい。さらに、従来技術では、教師データ、テンプレートを必要とするが、現実には、低解像度で重なりの多い画像では教師データの作成も困難であり、コストがかかる。

本発明はこのような課題に鑑みてなされたものであり、その目的は、画像の各画素を２値化することで解像度や重なりに対して頑健にオブジェクト領域を同定し、オブジェクト領域の画素数からオブジェクト数を推定するモデルを教師データ無しに構成する技術を提供することにある。

すなわち本発明は、コンピュータにより画像内のオブジェクトの個数を推定する方法であり、画像の観測を受け付けるステップと、前記画像を所定の二値化関数に基づいて二値化し、二値化画像を取得するステップと、前記二値化画像中の前記オブジェクトに対応する画素数を特徴量とし、前記個数を隠れ変数とし、前記個数によりモデルが切り替わる混合ガウス分布モデルを所定の予測モデルとし、前記特徴量と前記予測モデルに基づいて前記個数を予測するステップとを備える方法である。さらに、本発明は、前記画像の観測を受け付けるステップは、複数の前記画像の観測を受け付け、前記二値画像を取得するステップは、前記複数の画像を所定の二値化関数に基づいて二値化し、複数の二値化画像を取得し、前記複数の二値化画像中の前記オブジェクトに対応する画素数を各特徴量とし、前記所定の予測モデルの各パラメータを学習するステップを更に備えることができる。

ここで、前記各パラメータを学習するステップは、教師データなしに前記各パラメータを学習することができ、変分ベイズ法により前記各パラメータを学習することができ、前記個数の最大数をノンパラメトリック・ベイズ法により自動決定することができる。なお、前記変分ベイズ法は、複数の前記各パラメータ間が独立であると仮定し、ＫＬ情報量を基準に最適化を行うことができ、前記ノンパラメトリック・ベイズ法は、stick breaking processを前記隠れ変数の事前分布に採用することができる。さらに、前記学習された各パラメータに基づいて、前記所定の予測モデルを更新するステップを更に備えるように構成することができ、また、前記画像の観測を一定時間毎のグループに区切り、各グループでは、前記個数の予測と前記各パラメータの学習を同時に行い、先行するグループにより学習された各パラメータに基づいて、後続のグループの画像内のオブジェクトの個数を予測するように構成することもできる。

また、前記特徴量の観測過程は、オブジェクト側に誤って二値化されたオブジェクト以外の背景の画素数をθ0、その平均値をμ0、そのノイズをεθ0、二値化されたオブジェクト１個分の画素数をθ1、その平均値をμ1、そのノイズをεθ1、画像内のオブジェクトの個数をd、前記オブジェクトに対応する画素数をf、前記二値化画像中の前記オブジェクトに対応する画素数の観測値をx、そのノイズをεxとして、
θ0≡μ0＋εθ0
θ1≡μ1＋εθ1
f(θ0,θ1,d)≡θ1*d+θ0
x≡f(θ0,θ1,d) +εx
と定式化することができる。なお、前記画素数f(θ0, θ1,d)の平均と分散は前記個数dの増加に対して線形に増加するように構成することもできる。

また、前記各パラメータを学習するステップは、η：前記個数を表す隠れ変数、β：観測ノイズの精度、ρ0,ρ1：画素数θ0,θ1の事前精度、v：stickbreaking processを表す変数、α：stick breaking processを特徴付けるパラメータとして、前記複数の二値化画像中の前記オブジェクトに対応する画素数の観測値のデータセットxの入力に対して、前記各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を出力するように構成することもできる。なお、前記各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を試験分布q(η,θ0,θ1,β,ρ0,ρ1,v,α)≡q(η)q(θ0,θ1)q(β,ρ0,ρ1,v)q(α)を導入して近似的に求めてもよい。

また、前記個数を予測するステップは、前記二値化画像中の前記オブジェクトに対応する画素数の観測値のデータxnew及び前記学習した各パラメータの事後分布確率p(θ0,θ1,β,ρ0,ρ1,v,α|x)の入力に対して、事後確率最大化により推定された前記個数の推定値argmaxp(ηnew|xnew,x)、またはその近似値を出力するように構成することもできる。

また、前記画像の観測を受け付けるステップは、複数の前記画像の観測を受け付け、前記二値画像を取得するステップは、前記複数の画像による輝度ヒストグラムの和を、ある閾値で二つのクラスに分割した際に、そのクラス間分散が最大になるような閾値を決定し、二値化するように構成することもできる。なお、前記画像の観測を一定時間毎のグループに区切り、先行するグループにより決定された閾値に基づいて、後続のグループの画像の二値化を行うこともできる。

なお、前記オブジェクトは車両であり、前記オブジェクトの個数は、前記車両の台数でもよい。また、前記画像は、ウェブ・カメラにより定点撮影された道路の一部の画像でもよい。その他にも、例えば、前記オブジェクトが人であり、前記オブジェクトの個数は前記人の数でもよい。

本発明コンピュータ・プログラム、コンピュータ・システムとして把握した場合にも、上述した本発明を方法として把握した場合と実質的に同一の技術的特徴を備える事ができる。

本発明によれば、画像の各画素を２値化することで解像度や重なりに対して頑健にオブジェクト領域を同定し、オブジェクト領域の画素数からオブジェクト数を推定するモデルを教師データ無しに構成する技術を提供することができる。

本発明の実施形態を例示する概念図である。コンピュータのハードウェア構成を説明するブロック図コンピュータの機能を説明するブロック図このコンピュータが実行する処理を説明する概念図学習フェーズを説明するフロー判別分析法を説明するグラフ設定する観測モデルを説明する模式図車両に対応する画素数f(θ0,θ1,d)の分布車両に対応する画素数の観測値xの分布予測フェーズを説明するフロー

実施形態
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて（特段の断りのない限り）同じ要素には同じ番号を付している。

図１は、本発明の実施形態を例示する概念図である。例示されているシステムは、パーソナル・コンピュータ１と、インタネット２と、中継器３と、ウェブ・カメラ４から構成されている。ここで、カメラ４は、ビルの屋上に固定的に設置され、一定時間間隔で周辺の道路をカラー静止画撮影している（定点撮影）。また、カメラ４は、周辺の道路を走る車両の台数をカウントするために、改めて導入した専用のものである必要はなく、既存の汎用ウェブ・カメラで足り、その性能も比較的低品質のもの（例えば、数百万画素程度）でよい。また、カメラ４とコンピュータ１との間は、中継器３やインタネット２を含む有線・無線の通信ネットワークで接続されており、撮影された画像は、通信ネットワークを介してカメラ４からコンピュータ１へ送信される。また、カメラ４が自律的に撮影するものでもよいし、例えば、通信ネットワークを介して受信するコンピュータ１からの撮影指示に応答して、他律的に撮影するものでもよい。なお、ここでは、カメラ４とコンピュータ１との関係は、一対一で対応付けられているが、これに限らず、複数のカメラ４が単一のコンピュータ１と対応付けられてもよいし、単一のカメラ４が複数のコンピュータ１と対応付けられてもよいし、複数のカメラ４が複数のコンピュータ１と対応付けられてもよい。

図２は、パーソナル・コンピュータ１のハードウェア構成を説明するブロック図である。コンピュータ１のハードウェア構成は、（低速及び高速の）バス１０、バス１０に接続されるＣＰＵ（演算制御装置）１１、ＲＡＭ（ランダム・アクセス・メモリ：記憶装置）１２、ＲＯＭ（リード・オンリ・メモリ：記憶装置）１３、ＨＤＤ（ハード・ディスク・ドライブ：記憶装置）１４、通信インタフェース１５、入出力インタフェース１６を備えている。さらに、入出力インタフェース１６に接続されるマウス１７、フラット・パネル・ディスプレイ（表示装置）１８、キーボード１９等を備えている。なお、コンピュータ１は一般的なパーソナル・コンピュータ・アーキテクチャを採用するものとして説明したが、例えば、より高いデータ処理能力や可用性を求めて、ＣＰＵ１１やＨＤＤ１４等を多重化することができる。また、デスクトップ型の他、様々なタイプのコンピュータ・システムを採用することができる。

このコンピュータ１のソフトウェア構成は、基本的な機能を提供するオペレーティング・システム（ＯＳ）と、OSの機能を利用するアプリケーション・ソフトウェアと、入出力装置のドライバ・ソフトウェアとを備えている。これらの各ソフトウェアは、各種データと共にRAM１２上にロードされ、CPU１１等により実行され、コンピュータ１は全体として、図３に示す機能モジュールとして機能し、図４から図１１に示す処理を実行する。

図３は、実施例に係るコンピュータ１の機能モジュールを説明するブロック図である。コンピュータ１は、二値化モジュール１０１、カウントモジュール１０２、推定モジュール１０３、閾値設定モジュール１０４、学習モジュール１０５として機能する。

図４は、コンピュータ１の処理を説明する概念図である。画像の観測を一定時間毎のグループに区切り、各グループには複数枚の画像が対応している。各グループでは車両台数の推定（予測フェーズ）と学習（学習フェーズ）が同時に行われる。そして、先行するグループに含まれる複数の画像に基づいて学習された各パラメータに基づいて車両台数モデルを更新し、後続のグループの画像の車両台数の推定を行う。同様に、先行するグループに含まれる複数の画像に基づいて選択された閾値に基づいて二値化関数を更新し、後続のグループの画像の二値化を行う。すなわち、このシステムが稼働し始めれば、順次車両台数モデル及び二値化関数がより適切なものに自動更新される。なお、予測フェーズは、大きく分けて、二値化処理と台数推定処理とで構成され、学習フェーズは、大きく分けて、二値化関数決定処理、二値化処理、モデル学習処理とで構成される。以下、これらの処理について、具体的な数式等を示し、より詳細に説明する。

図５は、学習フェーズを説明するフローである。学習フェーズでの入力は、図４で説明した各グループに含まれる複数枚の画像である。なお、各画像は、カメラ４で広範囲に撮影された領域の一部領域、ここでは、道路部分の領域のみが入力される（後述の予測フェーズも同様）。この領域は、車両台数を推定する目的に応じて、例えば、上り車線のみ、下り車線のみ、両車線を含む、全車線、一部車線等、適宜選択すればよい。また、本実施形態では、カメラ４は固定されていることを前提としているため、上記道路部分は固定的な座標で特定することができる。もっとも、カメラ４の位置ずれ等を考慮して、上記道路部分をよりフレキシブルな座標で特定することもできる。一方、学習フェーズでの出力は、二値化関数（閾値）と車両台数モデル（パラメータ）である。

閾値設定モジュール１０４が、上記道路部分に対応する複数の画像の入力を受け付ける（Step11）。次に、閾値設定モジュール１０４は、（一例として）判別分析法により、二値化関数を求める（Step12）。

図６は、判別分析法を説明するグラフである。数１は、判別分析法に用いる各種パラメータを説明する数式である。

閾値設定モジュール１０４は、道路部分に対応する複数の画像による輝度ヒストグラムの和を、ある閾値で二つのクラスに分割した際に、そのクラス間分散σb2が最大になるように閾値kを決定する。すなわち、クラス毎の輝度の平均の間の分散が最も大きくなるよう、kを階調分（例えば、256階調であれば、256通り）変化させて評価し、最大値を求める。

次に、カウントモジュール１０２は、二値化された画像に基づいて、その車両領域（白部分）の画素数をカウントする(Step13)。このような画素数を特徴量とすることで、解像度の低下や複数の車両に多少の重なりがあっても２値化後の白の画素数はほぼ等しく、頑健であることが期待される。

次に、学習モジュール１０５は、ベイジアン密度推定モデルを用いて、カウントされた車両領域の画素数を特徴量とし、車両台数モデルのパラメータを推定する（Step14）。

図７は、設定する観測モデルを説明する模式図である。数２は、設定する事前分布を説明する数式である。数３は、事前分布の各種パラメータを説明するものである。

すなわち、特徴量の観測過程は、車両側に誤って二値化された車両以外の道路部分の画素数をθ0、その平均値をμ0、そのノイズをεθ0、二値化された車両一台分の画素数をθ1、その平均値をμ1、そのノイズをεθ1、画像内の車両の台数をd、車両に対応する画素数をf、二値化画像中の車両に対応する画素数の観測値をx、そのノイズをεxとして、以下のように定式化する。
θ0≡μ0＋εθ0
θ1≡μ1＋εθ1
f(θ0,θ1,d)≡θ1*d+θ0
x≡f(θ0,θ1,d) +εx
なお、画素数f(θ0, θ1,d)の平均と分散は車両台数dの増加に対して線形に増加する。

図８は、車両に対応する画素数f(θ0,θ1,d)の分布を示すものであり、図９は、車両に対応する画素数の観測値xの分布を示すものである。

学習モジュール１０５は、η：車両台数を表す隠れ変数、β：観測ノイズの精度、ρ0,ρ1：画素数θ0,θ1の事前精度、v：stickbreaking processを表す変数、α：stick breaking processを特徴付けるパラメータとして、複数の二値化画像中の車両領域に対応する画素数の観測値のデータセットxの入力に対して、各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を出力する。ここで、ノイズの分散等を含めた全ての変数の値を決める必要があるが、交差検定をするには変数が多く、膨大な処理が必要である。また、交差検定を避けるため、フルベイズなモデルを用いて１度の学習で全変数の最適化を行いたいが、周辺化処理が膨大なため困難である。そこで、学習モジュール１０５は、変分ベイズ法を利用し、各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を試験分布q(η,θ0,θ1,β,ρ0,ρ1,v,α)≡q(η)q(θ0,θ1)q(β,ρ0,ρ1,v)q(α)を導入して近似的に高速に求める。つまり、変分ベイズ法を用いて、変数間に独立性の仮定を置き、KL情報量を基準に最適化を行うことで、フルベイズな枠組みの推定を近似的に行い、一度の学習で全変数の推定を効率的に行うことが可能になる。

なお、車両台数ｄの最大数は、ノンパラメトリック・ベイズの枠組みで自動決定する。つまり、車両台数ｄを表す隠れ変数の次元数を適切に調整し、不要な要素を取り除くためstick breaking processを隠れ変数の事前分布に採用している。

すなわち、数４に示す、扱い易い試験分布を導入する。このように変数をいくつかのグループに分けて、グループ間が独立の因子化仮定をおく。次に、数５に示すように、ＫＬ情報量を基準として、試験分布qが真の分布pをよく近似するようにqを最適化する。ここで、変分ベイズ法の更新式は、一般には、数６に示す自己無撞着方程式となり、本実施形態においては、数７に示す自己無撞着方程式となる。数７の更新式の各試験分布は全て共役な形になるため、実質的には、数８及び数９に示す各試験分布のパラメータのみを収束条件が満たされるまで繰り返し計算する。そして、収束した時のqをpの近似解とする

学習モジュール１０５は、得られたパラメータにより、車両台数モデルを更新する。

図１０は、予測フェーズを説明するフローである。予測フェーズでの入力は、車両台数を推定したい画像、学習フェーズ（図５参照）でその閾値を定めた二値化関数、学習フェーズ（図５参照）で学習した車両台数モデルである。一方、予測フェーズでの出力は、車両台数の推定値である。

まず、車両台数を推定したい画像と二値化関数が二値化モジュール１０１に入力され、車両台数モデルが推定モジュール１０３に入力される(Step21)。二値化モジュール１０１は、設定された閾値に基づいて画像を二値化する。カウントモジュール１０２は、二値化された画像の車両領域（白部分）の画素数（データxnew）をカウントする（Step22）。推定モジュール１０３は、データxnew及び学習した各パラメータの事後分布確率p(θ0,θ1,β,ρ0,ρ1,v,α|x)の入力に対して、事後確率最大化により推定された車両台数の推定値argmaxp(ηnew|xnew, x)、またはその近似値を出力する(Step23)。なお、推定された車両台数の値はディスプレイ１８に表示することができる。

本発明は、全体がハードウェアの実施形態、全体がソフトウェアの実施形態、またはハードウェアおよびソフトウェア両方のエレメントを包含する実施形態の形を取ることができる。ある好適な実施形態において、本発明は、以下に限らないが、ファームウェア、常駐ソフトウェア、マイクロコード、構文解析ピココードなどを含めた、ソフトウェアに実装される。

さらに、本発明は、コンピュータまたは任意の命令実行システムによってまたはこれに関連させて使用するプログラム・コードを備えるコンピュータ・プログラム、コンピュータ可読媒体の形態を採ることもできる。本説明目的の上で、コンピュータ可読媒体は、任意の命令実行システム、装置、またはデバイスによってまたはこれに関連させて使用するためのプログラムを、収容、格納、通信、伝搬、または伝送できる任意の装置であり得る。具体的には、前述の構文解析制御モジュールは、この意味で命令実行システム、または「コンピュータ」を構成する。

媒体は、電子的、磁気的、光学的、電磁気的、赤外的、または半導体のシステム（もしくは装置もしくはデバイス）または伝搬媒体とすることができる。コンピュータ可読媒体の例には、半導体または固体メモリ、磁気テープ、着脱可能コンピュータ・ディスケット、ランダム・アクセス・メモリ（ＲＡＭ：ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、読み取り専用メモリ（ＲＯＭ：ｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ）、剛体磁気ディスク、および光ディスクが含まれる。光ディスクの現時点での例には、コンパクト・ディスク読み取り専用メモリ（ＣＤ−ＲＯＭ：ｃｏｍｐａｃｔｄｉｓｋｒｅａｄｏｎｌｙｍｅｍｏｒｙ）、コンパクト・ディスク読み取り／書き込み（ＣＤ−Ｒ／Ｗ：ｃｏｍｐａｃｔｄｉｓｋｒｅａｄ／ｗｒｉｔｅ）メモリ、およびＤＶＤが含まれる。

プログラム・コードを格納もしくは実行またはその両方を行うのに適したデータ処理システムは、システム・バスを介して直接的または間接的にメモリ・エレメントに連結された少なくとも一つのプロセッサを含み得る。このメモリ・エレメントには、プログラム・コードの実際の実行の過程で使われるローカル・メモリ、バルク記憶装置、および、実行中にバルク記憶装置から読み出さねばならない回数を低減するために、少なくとも一部のプログラム・コードに一時的保管を提供するキャッシュ・メモリを含めることができる。

１…パーソナル・コンピュータ、
１１…ＣＰＵ（演算制御装置）
１２…ＲＡＭ（ランダム・アクセス・メモリ：記憶装置）
１３…ＲＯＭ（リード・オンリ・メモリ：記憶装置）
１４…ＨＤＤ（ハード・ディスク・ドライブ：記憶装置）
１５…通信インタフェース
１６…入出力インタフェース
１７…マウス
１８…フラット・パネル・ディスプレイ（表示装置）
１０１…二値化モジュール
１０２…カウントモジュール
１０３…推定モジュール
１０４…閾値設定モジュール
１０５…学習モジュール

Claims

コンピュータにより画像内のオブジェクトの個数を推定する方法であり、
画像の観測を受け付けるステップと、
前記画像を所定の二値化関数に基づいて二値化し、二値化画像を取得するステップと、
前記二値化画像中の前記オブジェクトに対応する画素数を特徴量とし、前記個数を隠れ変数とし、前記個数によりモデルが切り替わる混合ガウス分布モデルを所定の予測モデルとし、前記特徴量と前記予測モデルに基づいて前記個数を予測するステップと
を備える方法。
前記画像の観測を受け付けるステップは、複数の前記画像の観測を受け付け、
前記二値画像を取得するステップは、前記複数の画像を所定の二値化関数に基づいて二値化し、複数の二値化画像を取得し、
前記複数の二値化画像中の前記オブジェクトに対応する画素数を各特徴量とし、前記所定の予測モデルの各パラメータを学習するステップを更に備える
請求項１に記載の方法。
前記各パラメータを学習するステップは、教師データなしに前記各パラメータを学習する請求項２に記載の方法。
前記各パラメータを学習するステップは、変分ベイズ法により前記各パラメータを学習する請求項２に記載の方法。
前記変分ベイズ法は、複数の前記各パラメータ間が独立であると仮定し、ＫＬ情報量を基準に最適化を行う請求項４に記載の方法。
前記各パラメータを学習するステップにおいて、前記個数の最大数をノンパラメトリック・ベイズ法により自動決定する請求項２に記載の方法。
前記ノンパラメトリック・ベイズ法は、stick breaking processを前記隠れ変数の事前分布に採用する請求項６に記載の方法。
前記学習された各パラメータに基づいて、前記所定の予測モデルを更新するステップを更に備える請求項２に記載の方法。
前記画像の観測を一定時間毎のグループに区切り、
各グループでは、前記個数の予測と前記各パラメータの学習を同時に行い、
先行するグループにより学習された各パラメータに基づいて、後続のグループの画像内のオブジェクトの個数を予測する請求項８に記載の方法。
前記特徴量の観測過程は、
オブジェクト側に誤って二値化されたオブジェクト以外の背景の画素数をθ0、その平均値をμ0、そのノイズをεθ0、
二値化されたオブジェクト１個分の画素数をθ1、その平均値をμ1、そのノイズをεθ1、
画像内のオブジェクトの個数をd、
前記オブジェクトに対応する画素数をf、
前記二値化画像中の前記オブジェクトに対応する画素数の観測値をx、そのノイズをεx
として、
θ0≡μ0＋εθ0
θ1≡μ1＋εθ1
f(θ0,θ1,d)≡θ1*d+θ0
x≡f(θ0,θ1,d) +εx
と定式化する請求項１又は２に記載の方法。
前記画素数f(θ0, θ1,d)の平均と分散は前記個数dの増加に対して線形に増加する請求項１０に記載の方法。
前記各パラメータを学習するステップは、
η：前記個数を表す隠れ変数、
β：観測ノイズの精度、
ρ0,ρ1：画素数θ0,θ1の事前精度、
v：stick breakingprocessを表す変数、
α：stick breaking processを特徴付けるパラメータとして、
前記複数の二値化画像中の前記オブジェクトに対応する画素数の観測値のデータセットxの入力に対して、
前記各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を出力する請求項１０に記載の方法。
前記各パラメータの事後分布確率p(η,θ0,θ1,β,ρ0,ρ1,v,α|x)を
試験分布q(η,θ0,θ1,β,ρ0,ρ1,v,α)≡q(η)q(θ0,θ1)q(β,ρ0,ρ1,v)q(α)
を導入して近似的に求める請求項１２に記載の方法。
前記個数を予測するステップは、
前記二値化画像中の前記オブジェクトに対応する画素数の観測値のデータxnew及び前記学習した各パラメータの事後分布確率p(θ0,θ1,β,ρ0,ρ1,v,α|x)の入力に対して、
事後確率最大化により推定された前記個数の推定値argmaxp(ηnew|xnew, x) 、またはその近似値を出力する請求項１２に記載の方法。
前記画像の観測を受け付けるステップは、複数の前記画像の観測を受け付け、
前記二値画像を取得するステップは、前記複数の画像による輝度ヒストグラムの和を、ある閾値で二つのクラスに分割した際に、そのクラス間分散が最大になるような閾値を決定し、二値化する請求項１に記載の方法。
前記画像の観測を一定時間毎のグループに区切り、
先行するグループにより決定された閾値に基づいて、後続のグループの画像の二値化を行う請求項１５に記載の方法。
前記オブジェクトは車両であり、前記オブジェクトの個数は、前記車両の台数である請求項１に記載の方法。
前記画像は、ウェブカメラにより定点撮影された道路の一部の画像である請求項１に記載の方法。
画像内のオブジェクトの個数を推定するコンピュータ・プログラムであり、
実行されることにより、前記コンピュータに請求項１乃至１８のいずれかに記載の方法を実行させるコンピュータ・プログラム。
画像内のオブジェクトの個数を推定するコンピュータであり、
画像の観測を受け付ける手段と、
前記画像を所定の二値化関数に基づいて二値化し、二値化画像を取得する手段と、
前記二値化画像中の前記オブジェクトに対応する画素数を特徴量とし、前記個数を隠れ変数とし、前記個数によりモデルが切り替わる混合ガウス分布モデルを所定の予測モデルとし、前記特徴量と前記予測モデルに基づいて前記個数を予測する手段と
を備えるコンピュータ。