JP2016058079A

JP2016058079A - クラス事前確率を用いる画像分類のドメイン適応化

Info

Publication number: JP2016058079A
Application number: JP2015161794A
Authority: JP
Inventors: ボリス・チドロフスキー; Chidlovski Boris; ガブリエラ・チュルカ; Csurka Gabriela
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 2014-09-04
Filing date: 2015-08-19
Publication date: 2016-04-21
Also published as: US9710729B2; EP2993618A1; US20160070986A1

Abstract

【課題】クラス事前確率を用いる画像分類のドメイン適応化方法を提供する。【解決手段】カメラベースの物体ラベリングにおいて、ブースト分類器ｆは、特徴ベクトルｘにより表される画像を、同じカメラにより取得された画像を表すラベル化特徴ベクトルの対象ドメイン訓練セットＤＴ、および、他のカメラにより取得された複数のソースドメイン訓練セットＤＳ１，…，ＤＳＮを使用して分類するよう、訓練される。訓練は、基本分類器ｈｒ（ｘ）および重みβｒを生成するよう、適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムを適用する。ＡｄａＢｏｏｓｔアルゴリズムのｒ番目の反復は、各々が訓練セットＤＴ∪ＤＳｋ上で訓練された基本分類器候補ｈｋｒ（ｘ）を訓練し、ｈｒ（ｘ）を事前に訓練された基本分類器候補から選択する。対象ドメイン訓練セットＤＴは、対象ドメインに対するラベル分布の事前予測に基づいて拡張されてもよい。【選択図】なし

Description

本発明は、画像ラベリング技術、カメラベースの物体ラベリング技術、および、車両ラベリングなど、それらの適用に関する。

静止カメラまたはビデオカメラを使用するカメラベースの車両ラベリング（または、分類）は、以下に挙げるような多様な用途を有している：有料道路、橋、駐車場などに対する、自動または半自動の通行料金査定（例えば、通行料金は、車輪軸の数、または、車両の種類（例えば、トラックは乗用車より高い通行料金を払う場合がある）による場合がある）；駐車施設の自動監視（例えば、車両が駐車場所にあるか検出する（これは、実際には車両というより駐車場所をラベル化する））；速度制限または他の交通規制（車両は、その速度により、または、赤信号を通過したかにより、ラベル化される）のカメラベースの実施；カープール車線の監視（車両は乗車人数によりラベル化される）；車道の利用調査（車両は、ナンバープレートに基づいて、登録されている州または国により分類される場合がある）；その他。実施される車両ラベリングの種類によって、自動車両ラベリングに使用される車両画像は、車両全体の画像であってもよく、または、後ろのナンバープレートなど、車両の一部の画像であってもよい。

共通の導入手法において、カメラは、料金所入口、車道、駐車場入口、または、他の監視対象の位置の適切な眺望が得られるように取り付けられ、訓練車両画像のセットが取得される。人間の導入者は、各訓練画像を車両の種類により手動でラベル化する。これらのラベル化車両画像は、カメラ導入のためのラベル化訓練セットを形成し、その後、車両分類器を訓練するために使用される。訓練プロセスは、典型的には、画像の選択的な前処理（例えば、ナンバープレートラベリングの場合、前処理は、選択的に後ろのナンバープレートを示すビデオフレームを識別し、その後、フレーム画像を分割してナンバープレートを取り出すことを含んでよい）を伴って、（選択的に前処理された）画像を表す特徴ベクトルなど、定量的表現を生成し、手動で割り当てたラベルと最適に一致する特徴ベクトル表現にラベルを割り当てるよう、分類器を訓練する。その後、ラベリング段階中、カメラが車両の画像を取得すると、類似の前処理が行われて、訓練された分類器を介して行われる特徴ベクトルに変換されて、車両をラベル化する。

典型的な用途において、カメラは、様々な戦略上の位置に置かれる。例えば、様々な料金所に置かれて、各カメラは個別に訓練され、その後、その位置の（または、その位置を通過する）車両をラベル化するために使用される。

しかしながら、各カメラを個別に訓練すると、早期に導入されたカメラから収集されている可能性のある情報を活用することができない。さらに、各カメラを個別に訓練することで、カメラ間で車両ラベリングの性能に大きなばらつきが生じ得る。さらに、各カメラを個別に訓練することで、例えば、他の類似のカメラを導入することにより生成される統計値、事前の車道調査、または他のソースからの、ラベル分布に利用可能であるかもしれない事前情報を、活用できない可能性がある。

したがって、ある種の複数のカメラ導入の統合化された訓練が、有用であるように思える一方で、この手法には障害がある。異なるカメラにより取得された車両画像は、姿勢、カメラアングル、カメラ解像度または他のカメラ特性、被写体ぶれの程度、シーン照明、背景の錯乱物、その他の違いに起因して、互いに大きく異なる可能性がある。さらに、車両統計値も、位置により大きく異なる可能性がある。例えば、居住領域に近い料金所は、ほとんどが乗用車を観測する可能性があり、一方で幹線道路のインターチェンジに近い地方の料金所は、より高い割合で商業トラックを観測する可能性がある。

本明細書に開示される例示的な実施形態が、カメラベースの車両ラベリングタスクに向けられる一方で、複数の静止またはビデオカメラがラベル化対象物体の画像を取得するために使用される（または、同じカメラが異なる時間間隔および／または異なる位置で画像を取得するために使用される）、他のカメラベースの物体ラベリングタスクにおいて、類似の課題が発生することが理解されるであろう。例えば、小売りまたは広告の環境では、対象の広告を提供するために、性別、年齢、その他により、カメラベースの顧客ラベリングを適用するのに有益である可能性がある。この場合、ラベル化対象物体は人間である。イベント参加者監視システムでは、画像は、画像に示される人物の数でラベル化されてもよい。物体は動物であってもよく、または、例示的な車両など、無生物物体であってもよい。当該の無生物物体のカメラベースのラベリングにおける、さらなる例として、小売りの組み立てラインにおいて、製造品が、欠陥を観測可能な画像技術に基づいて、特定の欠陥の有無によりラベル化されてもよい。セキュリティスキャナの場合、カメラは、Ｘ線撮像装置または他の特殊画像デバイスであってよく、物体ラベリングは、拳銃、ナイフ、液体、その他など、懸念される無生物物体を識別するために探索を行う。これらは、ここでも単なる例示的な例に過ぎない。

さらに、本明細書に開示される分類器訓練システムは、画像に示される物体のラベリング以外の目的で、画像を分類するために適用されてよい。

以下に、高度な画像および物体ラベリング技術が、車両ラベリングタスクの例示的な説明を伴って、開示される。

本明細書に開示される一部の実施形態において、ラベリングシステムは、対象ドメインに属するラベル化対象画像を、対象ドメインに属し特徴ベクトルｘにより表される画像を分類するようブースト分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）を訓練すること、ラベル化対象画像を表す特徴ベクトルｘ_ｉｎを計算すること、および、ｆ^Ｔ（ｘ_ｉｎ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ_ｉｎ）を評価することを含む工程により、ラベル化対象画像に対するラベルを生成すること、を含む工程によりラベル化するよう構成される、電子データ処理デバイスを備える。訓練は、対象ドメインに属する画像を表すラベル化特徴ベクトルを備える、対象ドメイン訓練セットＤ_Ｔ、および、複数のソースドメイン訓練セットＤ_Ｓ１，…，Ｄ_ＳＮを使用し、ここで、Ｎ≧２は、それぞれソースドメインＳ_１，…，Ｓ_Ｎに属する画像を表すラベル化特徴ベクトルを備える。訓練は、基本分類器ｈ_ｒ（ｘ）およびブースト分類器ｆ^Ｔ（ｘ）の基本分類器の重みβ_ｒを生成するよう、適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムを適用することを、適切に備える。ＡｄａＢｏｏｓｔアルゴリズムのｒ番目の反復は、（ｉ）ｋ番目の副反復が、対象ドメイン訓練セットＤ_Ｔとソースドメイン訓練セットＤ_Ｓｋとを統合する訓練セット上の基本分類器候補ｈ^ｋ _ｒ（ｘ）を訓練する、Ｎ個の副反復を行うこと、および、（ｉｉ）ｈ_ｒ（ｘ）を、対象ドメイン訓練セットＤ_Ｔに対する最小誤差の基本分類器候補として選択すること、を含む。さらに、ｒ番目の反復は、（ｉｉｉ）ソース訓練セットＤ_Ｓｋ（ｋ＝１，…，Ｎ）の訓練インスタンスｉに対する重みベクトルｗ^Ｓｋ _ｉを、基本分類器ｈ_ｒ（ｘ）として選択された基本分類器候補の対象ドメイン訓練セットＤ_Ｔに対する誤差に基づいて、更新すること、を含んでもよい。一部の実施形態において、ラベリングシステムは、さらに、物体の画像を取得するよう配置されたシステムカメラを備える、カメラベースの物体ラベリングシステムであり、対象ドメインは、システムカメラにより取得される物体の画像のドメインとして規定され、ラベル化対象画像は、システムカメラにより取得される、ラベル化対象物体の画像であり、各ソースドメインＳ_１，…，Ｓ_Ｎは、システムカメラ以外のカメラにより取得される物体の画像のドメインとして規定され、および、電子データ処理デバイスは、さらに、ラベル化対象物体に対するラベルを、ラベル化対象画像のために生成されるラベルに基づいて生成するよう構成される。一部の実施形態において、カメラベースのラベリングシステムは、さらに、ラベル化対象物体の画像を物体のために生成されるラベルと共に表示するよう、電子データ処理デバイスと動作可能に接続される表示デバイスを含む。さらに、ブースト分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）は、Ａｄａｂｏｏｓｔアルゴリズムを適用する前に、対象ドメイン訓練セットＤ_Ｔおよびソース訓練セットＤ_Ｓｋ（ｋ＝１，…，Ｎ）を整列させるよう、監視されないソース−対象ドメイン整列を行うこと、および／または、対象訓練セットＤ_Ｔを対象ドメインに対するラベル分布の事前予測に基づいて拡張すること、を含んでもよい。このような拡張は、対象ドメイン訓練セットＤ_Ｔに、異なるラベルを有する追加的な合成インスタンスを追加することにより行われてよく、ここで、合成インスタンスは、ラベル分布の事前予測を使用して生成されるラベル確率に基づいて計算される、Ａｄａｂｏｏｓｔアルゴリズムに対する初期化された重みベクトルを有する。

本明細書に開示される一部の実施形態において、対象ドメインに属するラベル化対象画像をラベル化するためのラベリング方法は、以下を含む：対象ドメインに属する対象ドメイン訓練画像を表す特徴ベクトルを計算すること；対象ドメイン訓練画像を表すラベル化特徴ベクトルを備える対象ドメイン訓練セットＤ_Ｔを生成するよう、対象ドメイン訓練画像を、ラベルのセットから選択されるラベルを使用してラベリングすること；複数のソースドメイン訓練セットＤ_Ｓ１，…，Ｄ_ＳＮを受信することであって、ここで、Ｎ≧１は、ラベルのセットから選択されたラベルを使用してラベル化される対象ドメインとは異なるソースドメインに属する画像を表す特徴ベクトルを備える、受信すること；対象ドメイン訓練セットＤ_Ｔおよびソース訓練セットＤ_Ｓｋ（ｋ＝１，…，Ｎ）を整列させるよう、監視されないソース−対象ドメイン整列を行うこと；対象ドメインに属し特徴ベクトルｘにより表される画像を、整列された対象ドメイン訓練セットＤ_Ｔおよび複数のソースドメイン訓練セットＤ_Ｓ１，…，Ｄ_ＳＮを使用して分類するよう、ブースト分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）を訓練すること；ラベル化対象画像を表す特徴ベクトルｘ_ｉｎを計算すること；および、ラベル化対象画像に対するラベルを、ｆ^Ｔ（ｘ_ｉｎ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ_ｉｎ）を評価することを含む工程により、生成すること。特徴ベクトル計算工程、訓練工程、および生成工程は、電子データ処理デバイスにより適切に行われる。訓練は、基本分類器ｈ_ｒ（ｘ）およびブースト分類器ｆ^Ｔ（ｘ）の基本分類器の重みβ_ｒを生成するよう、適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムを適用し、ここで、ｒ＝１，…，Ｍである。一部の実施形態において、ラベルのセットは物体ラベルのセットであり、画像は物体の画像であり、ラベリング方法は、さらに、表示デバイス上に、物体検査結果を生成されたラベルに基づいて生成および表示すること、を含む。例えば、物体は車両であってよく、車両検査結果は車両の乗車人数であってよい。または、他の実施形態において、物体は組み立てラインにより処理される製造品であってよく、製品検査結果は、合格または不合格の結果であってよい。

本明細書に開示される一部の実施形態において、持続性保存媒体は、カメラベースの物体ラベリング方法を行い、対象カメラを使用して取得された物体の画像に基づいて物体をラベル化するよう、電子データ処理デバイスにより実行可能な命令を保存する。ラベリング方法は、以下の工程を含む：対象カメラにより取得され特徴ベクトルｘにより表される画像を、対象カメラにより取得される画像を表すラベル化特徴ベクトルを備える対象ドメイン訓練セットＤ_Ｔおよび複数のソースドメイン訓練セットＤ_Ｓ１，…，Ｄ_ＳＮを使用して、分類するよう、ブースト分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）を訓練することであって、ここで、Ｎ≧２は、対象カメラ以外のカメラにより取得される物体の画像を表すラベル化特徴ベクトルを備える、訓練すること；物体の画像を表す特徴ベクトルｘ_ｉｎを計算すること；および、物体に対するラベルを、ｆ^Ｔ（ｘ_ｉｎ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ_ｉｎ）を評価することにより、生成すること。訓練は、基本分類器ｈ_ｒ（ｘ）およびブースト分類器ｆ^Ｔ（ｘ）の基本分類器の重みβ_ｒを生成するよう、適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムを適用する。ＡｄａＢｏｏｓｔアルゴリズムはｒ＝１，…，Ｍの反復を含み、ｒ番目の反復は、複数の基本分類器候補ｈ^ｋ _ｒ（ｘ）を訓練することであって、ここで、各基本分類器候補ｈ^ｋ _ｒ（ｘ）は、訓練セットＤ_Ｔ∪Ｄ_Ｓｋ上で訓練される、訓練すること、および、ｈ_ｒ（ｘ）を事前に訓練された基本分類器候補のセットから選択すること、を含む。Ａｄａｂｏｏｓｔアルゴリズムを適用する前に、対象ドメイン訓練セットＤ_Ｔは、対象ドメインに対するラベル分布の事前予測に基づいて、例えば、対象ドメイン訓練セットＤ_Ｔに異なるラベルを有する追加的な合成インスタンスを追加することにより、拡張されてもよく、ここで合成インスタンスは、ラベル分布の事前予測を使用して生成されるラベル確率に基づいて計算される、Ａｄａｂｏｏｓｔアルゴリズムに対する初期化された重みベクトルを有する。

図１は、カメラベースの車両識別システムを図式的に示す。図２は、図１のカメラベースの車両識別システムの車両分類器訓練器コンポーネントを図式的に示す。図３は、図１のカメラベースの車両識別システムの車両分類器コンポーネントを図式的に示す。

以下の記述は、画像ラベリングシステムおよびカメラベースの物体ラベリングシステムに関する。本明細書において使用されるように、「物体」という用語は、無生物物体（または、無生物物体の群）または有生物物体（人物または人物の群、または、動物または動物の群など）を指す。本明細書において使用されるように、「物体」という用語は、ラベリングシステムにおいて使用されるカメラにより撮像され得る物理的な物体を指す。一部の限定されない例によると、当該の無生物物体は、車両（本明細書における例示的な用途である）、製造品、空港のセキュリティシステムにより精査される手荷物または輸送容器の中身、その他であってよい。ラベリングシステムにより適用されるラベルのセットは、一般的に画像に対するラベルのセット（画像ラベリングシステムの場合）または物体に対するラベルのセットであり得る。例示的な例によると、車両に対するラベルのセットは、車両の種類（乗用車、小型トラック、大型トラック、バスなど）または乗車人数（１人、２人、３人など）などであってよい。別の例示的な例として、機械視覚検査装置においては、物体は組立ラインにより加工される製造品であってよく、ラベルのセットは、「１」が検査装置により識別される欠陥を有する製品を意味し、一方で「０」が欠陥のない製品を意味する、二進集合（１，０）であってよい。

本明細書において使用されるように、「カメラ」という用語は、当該の物体の画像を取得することができる撮像デバイスを指す。一部の限定のない例によると、カメラは、以下であってよい：写真用フィルム、または、人間の視覚により観測されるのと類似のカラーまたは白黒画像を取得できるデジタル撮像アレイ（例えば、選択的にカラーフィルタを有するＣＣＤアレイ）を含む、従来のカメラ；または、Ｘ線投影画像を生成するためにＸ線ソースと連動して動作するＸ線高感度撮像アレイを含む、Ｘ線スキャナ；または、コンピュータ断層スキャナ；または、夜間または微光画像を取得するために使用される種類の赤外線カメラ；または、文書ページ画像を生成するよう動作する文書スキャナ；その他。カメラは、例えば、物体上または中にあると予測される蛍光塗料により放射される波長（複数可）に敏感であるように、波長選択フィルタを含む、特定物体ラベリングタスクに特化することが検討される。一般的に、カメラは、静止カメラ（すなわち、単一の静止画像を取得する）またはビデオカメラ（すなわち、一般的に「フレーム」と称される時系列画像を取得し、ここで、画像前処理は、当該の物体を最適に撮像するビデオバーストのフレームを選択することを伴ってよい）であってよい。コンピュータ断層スキャナなど、特定の種類のカメラにおいて、カメラにより物体から取得されるデータは、画像を生成する際に画像復元処理が施される場合がある。

図１を参照すると、例示的なカメラベースの物体ラベリングタスクは、例示的な車両ラベリングタスクにおいては車両Ｏである物体Ｏを、カメラ１０を使用して生成される物体Ｏの画像Ｉに基づいて、特定の事後データ取得（前）処理１２と選択的に統合されて、ラベル化する。事後データ取得（前）処理１２は、例えば、画像内の物体を取り出すための分割化、物体Ｏを最適に示すフレームの選択（カメラ１０が、時系列の画像（すなわち、フレーム）を備えるビデオバーストを取得するビデオカメラである場合）、画像クロッピング（可能であれば、画像の分割化と統合されて行われる）、画像回転、弾性または非弾性変形、テンプレート形状での登録、カラーフィルタリング、境界検出、その他である。選択的には前処理１２を施した後のカメラ１０の出力は、ラベル化（すなわち、分類）される物体Ｏの画像Ｉである。

例示的な図１は、典型的な車両ラベリング環境を示す。車両Ｏは、車両Ｏの運転者が、料金所１４により管理される有料道路、有料橋、その他へアクセスするための料金を支払う、料金所１４に接近している。カメラ１０は、料金所１４へ接近する際、車両Ｏを観測するよう戦略的に配置される。画像（単一静止画像またはビデオバーストであってよい）の取得は、料金所１４に接近する際に移動している車両Ｏを検出する運動センサ（図示せず）により、適切に始動される。車両ラベリングでは、カメラ１０は、適切には、デジタル撮像アレイ（例えば、カラー撮像アレイを提供するよう選択的にカラーフィルタを有する、電荷結合素子、ＣＣＤ、アレイ）を含む従来のカメラであり、人間の視覚により観測されるものと類似の車両Ｏの画像（例えば、画像Ｉが白黒画像であってもよいなど、一部の差異は予期されるが）を取得する。したがって、選択的な画像前処理１２は、様々な画像操作を含んでよいが、画像復元工程は含まない。それに反して、断層画像装置を適用する一部の他の種類の物体ラベリングタスクでは、画像前処理は、物体の画像を生成するために、カメラにより取得された画像データに施される画像復元処理を含んでよい。画像前処理１２は、ぼやけ補正、輝度および／またはコントラスト調整など、物体ラベリングタスクに特化しない、包括的な前処理を含んでよい。画像前処理１２は、追加的または代替的に、ビデオバーストの最適フレームを識別すること、画像内の物体を取り出すために画像を分割すること、無関係な背景を除去するために画像をクロッピングすること（典型的には、物体を取り出すために画像を分割した後に行われる）、テンプレートと一致させるために、弾性または非弾性変形、回転、または画像の他の操作を行うことなど、ラベリングタスクに特化した画像前処理を含んでよい。さらに、ラベリングタスクに特化した画像前処理１２は、ラベリングタスクを進めるために、画像が物体を十分に表しているか判定する、決行／中止判定を含んでもよい。例えば、例示的な車両ラベリングタスクにおいて、カメラ１０の運動センサは、風に吹かれた葉などにより意図せず始動される可能性があり、その場合、決行／中止判定は車両が撮像されていないことを検出し、その結果、画像を廃棄するであろう。

図１を引き続き参照すると、画像Ｉは、車両に対するラベル１８を画像Ｉに基づいて生成する、車両分類器１６へ入力される。これは、カメラベースの車両ラベリングプロセスの「ラベリング段階」と称される。

ラベリング段階のインスタンスを行う前に、車両分類器１６は、ラベリング工程を行うよう最適化される。そのために、「訓練段階」において、車両分類器訓練器２０は、ラベル化画像２２、２４に事前に割り当てられたラベルとほぼ一致する、画像２２、２４に対するラベルを生成するよう、車両分類器１６を最適化するために、ラベル化画像２２、２４を処理する。本明細書に開示される車両分類器訓練器２０の実施形態において、訓練プロセスは、（ｉ）分類器１６が動作するよう訓練されている、カメラベースの物体ラベリングシステムのカメラ１０に対して生成されるラベル化画像２２（本明細書において「このカメラ」とも称される）、および（ｉｉ）他の料金所で動作している類似のカメラベースの車両ラベリングシステムなど、１つ以上の他のソースにより生成されるラベル化画像２４（本明細書において「他のカメラ」とも称される）の両方を使用する。このカメラにより取得されるラベル化画像２２を生成するために、人間の料金所オペレータ、または人間の車両ラベリングシステム導入者、または他の人物は、典型的には、料金所１４を通過する各車両を観測し、その後、カメラ１０により取得される車両の画像を、観測に基づいてラベリングすることにより、カメラ１０により取得される画像の手動ラベリング２６を行う。

他のカメラからのラベル化画像２４は、（他のカメラを使用することを除いて）同様の手法で生成されてよい。しかしながら、より典型的には、他のカメラからのラベル化画像２４のラベルは、他のカメラベースの車両ラベリング導入（複数可）で動作する、訓練された分類器（分類器１６に対応するが、インスタンスは異なる）により行われる自動画像ラベリングにより生成される。このカメラに対するラベル化画像２２は手動ラベリング２６により生成され、一方で他のカメラに対するラベル化画像２４は自動で、可能であれば他の導入の標準的な車両ラベリング動作中に生成されてよいため、他のカメラからのラベル化画像２４の量は、このカメラに対する手動でラベル化されたラベル化画像２２の量より、はるかに多くなり得ることが理解されよう。言い換えれば、多くの実際の訓練状況において、データセット２４は、多くの場合データセット２２より大きくなる。

本明細書に開示される車両分類器訓練器２０の一部の実施形態において、訓練プロセスは、さらに、料金所１４で観測されると予測される（すなわち、この導入で観測されると予測される）車両ラベル分布の事前予測２８を利用する。この事前予測２８は、車両による類似の利用があると予測される他の料金所から、または、料金所１４の位置で入る交通量の手動測量からなど、様々なソースからなされ得る。事前予測２８を利用することで、可能であれば、分類器１６の訓練がない間、予想されるラベルの分布２８に従って結果を提供するよう、訓練にバイアスをかけることにより、訓練された車両分類器１６の正確性を向上させ得る。

実例的な車両ラベリングシステムは、カメラ１０、光学画像前処理コンポーネント１２、車両分類器訓練器２０、および、車両分類器訓練器２０により生成される訓練された分類器１６を有する。車両ラベリングシステムは、さらに、図１に図示されない他のコンポーネントを含んでもよい。例えば、車両ラベリングシステムが通行料金算出タスクを行っている場合、システムは、さらに、車両ラベルに基づいて通行料金を割り当てるルックアップテーブルを含んでもよい（例えば、大型トラックは小型トラックより高い料金を課されてもよく、および、乗用車は最低の通行料金であってもよい；追加的または代替的に、車両登録場所、有料道路を走行した距離など、他のラベル情報に基づいた通行料金である可能性もある）。様々なデータ処理コンポーネント１２、１６、２０は、カメラ１０に内蔵された電子機器（図示せず）、および／または料金所１４に設置されたコンピュータ３０、および／またはコンピュータ３０により、インターネットまたは他の電子データ転送ネットワークを介してアクセスされる遠隔サーバコンピュータ（図示せず）など、１つ以上の電子データ処理デバイスにより、適切に実装される。例示的な例によると、カメラ１０の電子機器は、ユーザが選択した適切なカメラ動作モードによる、ぼやけ補正および／または自動輝度／コントラスト調整など、前処理１２の包括的な部分を行うようプログラムされてよい。車両画像Ｉを取り出すよう画像を分割することなど、前処理１２の車両ラベリング特定部分は、適切なソフトウェアを実行する料金所コンピュータ３０により実装されてよい。分類器１６は、同様に、入力画像Ｉを受信する画像分類ソフトウェアを実行する料金所コンピュータ３０により実装されてよい。車両分類器訓練器２０は、入力としてローカルなラベル化画像２２およびラベル化画像２４を他のカメラから受信する、分類器訓練ソフトウェアを起動させる料金所コンピュータ３０により実装されてよい。ここでラベル化画像２４は、インターネットまたは別のデータネットワーク上で受信されるか、または、光ディスクまたは他の可搬型データ保存媒体で提供される。代替の手法において、車両分類器訓練器２０は、入力としてローカルのラベル化画像２２およびラベル化画像２４を他のカメラから受信する、分類器訓練ソフトウェアを起動させる遠隔サーバコンピュータにより実装されてよく、その後、訓練された分類器１６は、サーバから料金所コンピュータ３０へ、インターネットまたは別のデータネットワークを介して通信される。さらに、様々なデータ処理コンポーネント１２、１６、２０が、開示されるプロセスを行うために、コンピュータ３０および／または特定の他の電子データ処理デバイスにより実行可能な命令を保存する持続性保存媒体として具現化されてよいことが、理解されるであろう。持続性保存媒体は、例えば、ハードディスクまたは別の磁気保存媒体、または、ＦＬＡＳＨメモリまたは別の電子保存媒体、または、光ディスクまたは他の光学的記憶媒体、それらの様々な組み合わせなどであってよい。

ラベル１８は様々に使用されてよい。実例的な図１において、２つの例が示される。第１の例において、車両ラベルは車両種類のラベルのセット（乗用車、小型トラック、大型トラック、バス他）から選択され、ラベリングシステムは、通行料金または料金倍率を、車両Ｏの運転者により支払われる通行料金を決定する際に適用されるラベル１８により識別される車両の種類に対して決定するよう、ルックアップテーブルを適用する。実例的な例として、通行料金は、距離ベースの課金時間に料金倍率を掛けることにより、計算されてよい。典型的には、料金倍率は、有料道路上の異種の車両の異なる影響からなるよう意図される。この実例的な例において、コンピュータ３０に統合されるか、または動作可能に接続される、表示デバイス３２（ＬＣＤまたはＯＬＥＤ表示デバイスなど）は、車両Ｏに対して生成されるラベル１８であって、この場合、この実例的な例において２．５０ドルの高速道路料金に変換されるラベル１８と共に（または、共にラベル化された）車両Ｏの画像Ｉを含む表示３４を提示する。

概略的な図１において記載される別の実例的な例として、車両ラベル１８は、車両の乗車人数（１人、２人、３人など）のセットから選択される。乗車人数情報は、例えば、車両Ｏがカープール車線を使用する資格があるか判定するために使用されてよい（典型的には、車両が少なくとも最低乗車人数を乗せている場合に許可される）。実例的な表示３６は、結果に関する情報（「カープール車線：はい」）と共にラベル（「乗車人数：３」）でラベル化された車両Ｏの画像Ｉを示す。この手法の代替的な形式において、ラベルセットは、例えば、「１」は車両がカープール車線の使用を許可されることを意味し、「０」は車両が許可されないことを意味する、（１，０）の二進セットであり得る。

ここで図２を参照すると、車両分類器訓練器２０の一部の実例的な実施形態が記載されている。実例的な例がカメラベースの車両ラベリングに関連している一方で、より一般的には、開示される分類器訓練器は、画像をラベリングする分類器、または物体の入力画像に基づいて物体をラベリングする分類器を、訓練するために使用され得る。図２に示されるように、分類器訓練器２０は、入力として、ラベル化訓練画像２２をカメラ１０（例えば、「この」カメラ、または「システム」カメラ、または「対象」カメラとして、適切に記載される）から受信する。分類器訓練器２０は、追加的に、ラベル化訓練画像２４を他のカメラから受信する。訓練画像２２は、クロッピング、輝度／コントラスト調整、サイズ変更、その他の観点において、分類のために訓練画像２２が画像Ｉと比較可能となるよう、前処理器１２により前処理される。一方で、他のカメラからの訓練画像２４は、見晴らし、カメラと物体との距離、ズーム設定、絞り値設定など、画像特性の観点における相違点だけでなく、実質的に異なる前処理を有する可能性がある。

一般化するために、訓練画像２２のセットは、本明細書において、「対象」ドメインの画像と称され、一方で訓練画像２４は、本明細書において、２つ以上の異なる「ソース」ドメインの画像と称される。分類器訓練が新しい車両ラベリング導入のセットアップに使用されている、実例的な車両ラベリングシステムにおいて、対象ドメイン訓練画像セット２２の画像の数は、このセットが、導入者または他の人物に、システムカメラ１０を使用して取得される車両の画像を手動でラベル化させることにより、手動で生成されるため、比較的に少なくなる可能性が高いことが、理解されるであろう。それに反して、ソースドメイン訓練画像セット２４の画像の数は、実質的に多い。例えば、これらの画像は、図１に示されるものと類似の車両ラベリング導入の日単位、週単位、または月単位にわたる通常動作中に、自動的に生成されるラベル化画像の集合であってよい。本明細書に開示されるように、ブースト分類器を訓練するよう、適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムを有利に適用する分類器訓練器２０において、ＡｄａＢｏｏｓｔアルゴリズムのｒ番目の反復は、各々が対象ドメイン訓練セット２２をソース訓練セットの１つと統合し、その後、反復の出力として基本分類器を、対象ドメイン訓練セットに対する、最小誤差を有する基本分類器候補として選択する、訓練セット上の基本分類器候補を訓練する、副反復を含む。これにより、ソースドメイン訓練画像セット２４を有利に利用して、より正確な訓練された分類器を提供する。

効率的に処理するために、特徴ベクトル抽出コンポーネント４０は、訓練画像２２、２４を特徴ベクトルに変換する（または、前述の別の手法で、画像代表特徴ベクトルが画像から抽出される）。画像代表特徴ベクトルの要素は、画像の当該のコンテンツを表すのに有用な画像から引き出される、実質的に任意の定量値を保存し得る。特徴は様々な形式で表されてよく、例えばフィッシャーカーネルを使用して、様々に処理されてよい。一部の実施形態において、主成分分析（ＰＣＡ）などの特徴縮小プロセスが、特徴ベクトル長（すなわち、特徴ベクトルの要素の数）を妥当に維持するよう、特徴の数を削減するために使用されてもよい。一般的に、全ての画像（分類対象画像Ｉおよび様々な訓練画像２２、２４）は、同じ特徴ベクトル抽出プロセスまたはコンポーネント４０により、特徴ベクトルの所与の要素が、画像を表す全ての特徴ベクトルに対して、同じ意味または重要性、および同じ寸法または単位を有するよう、処理される。

対象ドメイン訓練画像２２の特徴ベクトル抽出４０により行われる処理は、対象ドメインラベル化データセットＤ_Ｔ４２を生成し、同様にソースドメイン訓練画像２４の特徴ベクトル抽出４０により行われる処理は、ソースドメインラベル化データセットＤ_Ｓｋ（ｋ＝１，…，Ｎ）４４を生成する。ここで、ｋは、Ｎ個のソースドメイン画像データセットの指標となる。一般的に、Ｎ≧１である。一部の実施形態において、Ｎ≧２、すなわち、複数のソースドメイン訓練画像データセットがあり、例えば、互いに別々のカメラにより生成された１つのソースドメイン訓練画像データセットである。したがって、事前に導入された、１５台の別々のカメラベースの車両ラベリングシステムが使用中である場合（実例的な例による）、これらの事前に導入されたラベリングシステムの１つにより取得された、各ソースドメイン画像データセットＤ_Ｓｋを伴って、Ｎ＝１５となる。データセットＤ_ＴおよびＤ_Ｓｋ（ｋ＝１，…，Ｎ）の各々は、各セットの画像が、見晴らし、カメラと物体との距離、絞り値または他のカメラ設定、取得後の処理（クロッピング、ぼやけ除去他）など、実質的な観点において異なる可能性があるため、異なる「ドメイン」として見なされ得る。

より一般化された形式（車両ラベリングの実例的な例に限定されない）を提供するために、ドメインＤは特徴空間Ｘおよび周辺確率分布Ｐ（Ｘ）からなり、ここでＸ＝｛ｘ_１，…，ｘ_ｎ｝およびｘ_ｉ∈Ｘである。すなわち、Ｄ：＝（Ｘ；Ｐ（Ｘ））である。タスクＴは、ラベル空間Ｙおよび関数ｆ：Ｘ→Ｙにより規定される。機械学習の文脈において、ドメインＤに対するタスクＴを学習することは、所与の訓練データセットＤ＝｛（ｘ_１；ｙ_１），…，（ｘ_ｎ；ｙ_ｎ）｝から分類器関数
を予測することになる。ここで、一定の基準によると、ｘ_ｉ∈Ｘおよびｙ_ｉ∈Ｙであり、最良の近似値ｆである。

ソース訓練セットＤ_Ｓｋ（ｋ＝１，…，Ｎ）が、対象訓練セットＤ_Ｔに対する分類器を向上させるために使用される、分類器訓練器２０の手法において、対象およびソースデータセットおよびドメインは、区別されるのがよい。対象ドメインは、本明細書において、Ｄ_Ｔ＝（Ｘ；Ｐ_Ｔ（Ｘ））のように表され、対象訓練データＤ_Ｔ＝｛（ｘ^Ｔ _１，ｙ^Ｔ _１），…，（ｘ^Ｔ _ｎＴ，ｙ^Ｔ _ｎＴ）｝から、対象タスクＴ_Ｔ＝（Ｙ；ｆ^Ｔ）を学習するのが望ましい。ここで、ｎ_Ｔは、対象ドメイン訓練データセットＤ_Ｔの訓練インスタンスの数を意味する。類似の方法において、ｋ番目のソースドメイン訓練データセット（ここで、Ｎ個のソースデータセットがある際、１≦ｋ≦Ｎ）は、ｋ番目のソースドメインＤ_Ｓｋ＝（Ｘ；Ｐ_Ｓｋ（Ｘ））にあり、ソース訓練データセットＤ_Ｓｋ＝｛（ｘ^Ｓｋ _１，ｙ^Ｓｋ _１），…，（ｘ^Ｓｋ _ｎＳｋ，ｙ^Ｓｋ _ｎＳｋ）｝として適切に表される。ここで、ｎ_Ｓｋは、ｋ番目のソースドメイン訓練データセットＤ_Ｓｋにおける訓練インスタンスの数を意味する。分類器訓練器２０により行われる帰納的転送学習は、ソースドメイン訓練データセットＤ_Ｓｋ（ｋ＝１，…，Ｎ）により提供される知識を利用することにより、対象分類器関数
の学習を向上させる。

図２を引き続き参照すると、ソースドメインおよび対象ドメイン訓練データセット４２、４４は、選択的に、監視されないソース−対象整列プロセスまたはコンポーネント５０により整列される。このような整列は、見晴らし、カメラと物体との距離、絞り値または他のカメラ設定、取得後の処理（クロッピング、ぼやけ除去、他）など、実質的な観点において、ドメインＤ_Ｔ，Ｄ_Ｓ１，…，Ｄ_ＳＮ間の差異による影響を軽減するのに役立つ。整列は、対象およびソース訓練データセットの特徴ベクトルを、（一般的に異なる）共通ドメイン空間へ変換することができ、または、ソース訓練データセットの特徴ベクトルを、対象ドメインへ変換することができる（この場合、対象ドメイン訓練データセット４２の特徴ベクトルに対する変換は行われない）。

ソース訓練データセットの特徴ベクトルを対象ドメインへ変換する、整列プロセスの例は、反復最近点（ＩＣＰ）アルゴリズムである。例えば、Ｒｕｓｉｎｋｉｅｗｉｃｚらによる、３−ＤＤｉｇｉｔａｌＩｍａｇｉｎｇａｎｄＭｏｄｅｌｉｎｇの第３回国際会議議事録１４５〜１５２頁（ＩＥＥＥ２００１）「Ｅｆｆｉｃｉｅｎｔｖａｒｉａｎｔｓｏｆｔｈｅｉｃｐａｌｇｏｒｉｔｈｍ（ＩＣＰアルゴリズムの効果的な変形）」を参照されたい。ＩＣＰは、１つのドメインにおける点と他のドメインにおける最近点との間の平均平方誤差を、それぞれ最小化する反復手順である。ＩＣＰアルゴリズムの各反復で、ソースおよび対象モデルを最良に整列させる線形変換が計算される。対象データとしてインスタンスＸ_Ｔ＝｛ｘ^Ｔ _ｉ｝の２つのセット、および、ソースデータとしてＸ_Ｓ＝｛ｘ^Ｓ _ｉ｝から始まり、最終目的は、これらの２つのデータセット間の距離を最小化する変換（Ａ，Ｂ）を見つけることである。ＩＣＰの最終目的は、ソースインスタンスｘ^Ｓ _ｉ∈Ｘ^Ｓに対する、対象セットＸ_Ｔにおける最近の対象インスタンスを決定することである。ステップｋで、フロベニウスノルムを最小化するローカル変換が、２つのセットに対して算出される：
この手順は、ローカル最小値へ収束するまで反復される。完全変換（Ａ，Ｂ）は、アルゴリズムＡ：＝Ａ_ｋ・ＡおよびＢ＝Ｂ＋Ｂ_ｋの各反復ｋで増加的に更新される。大域的最小点への収束は、初期設定が良好な場合に達成できる。このような目的で、一部の実装において、事前の粗い整列手順が、細かい整列の前に行われる。ＩＣＰは、両方のセットＳＸ_Ｓ⊂Ｘ_ＳおよびＳＸ_Ｔ⊂Ｘ^Ｔからの重み付けされた代表サンプルで最初に行われる。ここで、各サンプルインスタンスｘ^Ｓ∈ＳＸ_Ｓおよびｘ^Ｔ∈ＳＸ_ｔは、そのε近傍におけるインスタンスの数により、それぞれ重み付けされる。

対象およびソース訓練データセットの特徴ベクトルを（一般的に異なる）共通ドメイン空間へ変換する整列プロセスの例は、Ｆｅｒｎａｎｄｏらによる、ＩＣＣＶ（２０１３）における「Ｕｎｓｕｐｅｒｖｉｓｅｄｖｉｓｕａｌｄｏｍａｉｎａｄａｐｔａｔｉｏｎｕｓｉｎｇｓｕｂｓｐａｃｅａｌｉｇｎｍｅｎｔ（副空間整列を使用する監視されない視覚的ドメイン適応化）」に記載されている。この手法の動機づけは、ソースおよび対象ドメインが異なる周辺分布を使用して引き出されるため、ソースおよび対象ドメインのより強固な表現である、ソースおよび対象ドメインにおける副空間が存在する可能性があることであり、ここで、これら２つのドメイン間のずれが学習され得る。この実例的なドメイン整列手法において、主成分分析（ＰＣＡ）は、ｄ個の最大固有値に対応するｄ個の固有ベクトルを、対象およびソースドメインの両方において選択するために使用される。これらの固有ベクトルは、それぞれＳ_ＳおよびＳ_ｄにより表される、ソースおよび対象副空間の基本として使用され、ここでＳ_Ｓ，Ｓ_ｄ∈Ｒ^Ｄ×ｄである。副空間Ｓ_ＳおよびＳ_Ｓは、正規直交Ｓ_ＳＳ’_Ｓ＝Ｉ^ｄおよびＳ_ｔＳ’_ｔ＝Ｉ^ｄであり、ここで、Ｉ_ｄはｄ次の単位行列であり、Ｓ_ＳおよびＳ_ｔは２つのドメイン間のずれを学習するために使用される。線形変換は、ソース副空間を対象副空間に整列させるために使用される。このステップにより、それぞれの副空間のソースおよび対象サンプルの直接的な比較が、不必要なデータ投影なしに行える。副空間整列手法は、このタスクを達成するために適切に使用される。基本ベクトルは、変換行列Ｍを使用して、Ｓ_ＳからＳ_ｔへ整列される。Ｍは、以下のブレグマン行列ダイバージェンスを最小化することにより学習される：Ｆ（Ｍ）＝｜｜Ｓ_ＳＭ−Ｓ_ｔ｜｜^２ _Ｆ。ここで、｜｜・｜｜^Ｆ _２は、フロベニウスノルムを意味する。このノルムは正規直交動作に対する不変式であるため、以下のように書き換えられ得る：
したがって、最適な変換Ｍは、Ｍ＝Ｓ’_ＳＳ_ｔとして取得される。これは、新しい座標系が、対象整列化ソース座標系を表すＳ＝Ｓ_ＳＳ’_ＳＳ_ｔと同等であることを暗に示している。行列Ｍは、ソース副空間座標系を、対象副空間座標系へ、ソース基本ベクトルを対象基本ベクトルで整列することにより変換する。この共通空間において、対象インスタンスｘ_ｔは、Ｓ_ｔ，ｘ^ｐ _ｔ＝ｘ_ｔＳ_ｔを使用して投影され、ソースインスタンスは新しい空間へ変換Ｓ，ｘ^ｐ _Ｓ＝ｘ_ＳＳを使用して投影される。複数のソースの場合（例えば、Ｎ≧２）、１つの変換Ｓ_ｉが各ソースＳ_ｉにより生成される。

図２を引き続き参照すると、監視されないソース−対象ドメイン整列プロセスまたはコンポーネント５０の出力は、正に記載されたように、ソースドメイン整列変換５２を出力する。対象およびソース訓練データセットの特徴ベクトルを（一般的に異なる）共通ドメイン空間へ変換する、Ｆｅｒｎａｎｄｏらによるものなどの整列の実施形態では、監視されないソース−対象ドメイン整列プロセスまたはコンポーネント５０は、対象ドメイン整列変換５４を出力する。（それに反して、ソースを対象ドメインへ変換するＩＣＰなどの整列プロセスでは、対象ドメイン整列変換はない）。

工程５８において、ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）として、すなわち、基本分類器の重みβ_ｒにより重み付けされた基本分類器ｈ_ｒ（ｘ）の集合として適切に書かれる、ブースト分類器６０を訓練するために、ブースト分類器訓練が行われる。（基本分類器ｈ_ｒ（ｘ）は、本明細書において、弱い分類器ｈ_ｒ（ｘ）と称されることがあり、一般的には、「基本分類器」および「弱い分類器」という用語は、本明細書において交換可能に使用される）。基本分類器ｈ_ｒ（ｘ）は、一般的に、任意の種類の分類器であり得る。各個別の基本分類器ｈ_ｒ（ｘ）の出力は、対象ドメイン訓練セットＤ_Ｔのラベルに対して相対的に弱い関連性を有しており、したがって、代替名「弱い」分類器となる。ブースト分類器は、全体Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）における、Ｍ個のこれらの弱い分類器ｈ_ｒ（ｘ）を、強い分類器（すなわち、対象ドメイン訓練インスタンスラベルと良好な関連にある分類器）を作り出すよう統合する。制限のない例示的な例によると、基本分類器ｈ_ｒ（ｘ）は、決定木、（例えば、二進分類器の場合における学習された超平面を適用する）線形分類器、その他であり得る。

訓練されたブースト分類器６０は、システムカメラ１０により取得され特徴ベクトルｘにより表される画像を分類するために使用可能である。ブースト分類器訓練は、対象ドメイン訓練データセット４２および複数のソースドメインデータセット４４の両方を利用する。これにより、訓練は、対象ドメインと最も近い関係にあるソースドメインデータセット４４に包含される情報を、識別および活用できる。例示的なブースト分類器訓練５８は、対象カメラ１０により取得された画像を表すラベル化特徴ベクトルを備える、対象ドメイン訓練セットＤ_Ｔ４２を使用して、および、対象カメラ１０以外のカメラにより取得された物体の画像を表すラベル化特徴ベクトルを備える、複数のソースドメイン訓練セットＤ_Ｓ１，…，Ｄ_ＳＮ４４（ここでＮ≧１、および、一部の実施形態においてはＮ≧２）を使用して、ブースト分類器６０を訓練する。訓練５８は、基本分類器ｈ_ｒ（ｘ）およびブースト分類器ｆ^Ｔ（ｘ）の基本分類器の重みβ_ｒを生成するために、適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムを適用する。しかしながら、標準的なＡｄａＢｏｏｓｔアルゴリズムのｒ＝１，…，Ｍの反復（Ｆｒｅｕｎｄらによる、Ｊｏｕｒｎａｌ−ＪａｐａｎｅｓｅＳｏｃｉｅｔｙＦｏｒＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ，１４（７７１−７８０）：１６１２，１９９９における、「Ａｓｈｏｒｔｉｎｔｒｏｄｕｃｔｉｏｎｔｏｂｏｏｓｔｉｎｇ（ブースティングの簡潔な入門書）」を参照）は、ｒ番目の反復が、複数の基本分類器候補ｈ^ｋ _ｒ（ｘ）を訓練すること、および、ｈ_ｒ（ｘ）を、事前に訓練された基本分類器候補のセットから選択すること、を含む点において、修正されている。一部の実施形態において、ｈ_ｒ（ｘ）は、全ての反復１，…，ｒにおいて生成される基本分類器候補から選択される。他の実施形態において、ｈ_ｒ（ｘ）は、ｒ番目の反復において生成される基本分類器ｈ^ｋ _ｒ（ｘ）からのみ選択される。各基本分類器候補ｈ^ｋ _ｒ（ｘ）は、対象ドメイン訓練データセットＤ_Ｔとｋ番目のソースドメインデータセットＤ_Ｓｋとを統合する訓練セットで、例えば、合併集合の組み合わせ（Ｄ_Ｔ∪Ｄ_Ｓｋ）を使用して、訓練される。

適応化ブースティング（ＡｄａＢｏｏｓｔ，例えば、Ｆｒｅｕｎｄらによる上記参照）は、弱い学習器の予測のアグリゲーションによりブースティングを提供する、機械学習アルゴリズムである。全ての反復で、訓練インスタンスの重みを調整し、次の選択に対して「最も有益」であると信頼されるよう、誤って分類されたインスタンスに、より高い重要性を与えることにより、次の弱い分類器の選択の正確性を向上させる。

ソース訓練セットから対象訓練セットへの情報の転送を容易にする、従来のＡｄａＢｏｏｓｔの「転送」ＡｄａＢｏｏｓｔ（ＴｒＡｄａＢｏｏｓｔ）拡張が、説明されている。Ｄａｉらによる、ＭａｃｈｉｎｅＬｅａｒｎｉｎｇの第２４回国際会議の議事録１９３〜２００頁（ＡＣＭ２００７）「Ｂｏｏｓｔｉｎｇｆｏｒｔｒａｎｓｆｅｒｌｅａｒｎｉｎｇ（転送学習のためのブースティング）」を参照されたい。Ｄａｉらの手法は、分類器を学習させるための豊富なソース訓練データ（すなわち、大きなデータセットＤ_Ｓ）があるが、対象ドメインおよびタスクはソースと異なる（すなわち、Ｄ_Ｓ≠Ｄ_ＴおよびＴ_Ｓ≠Ｔ_Ｔ）と推定する。ＴｒＡｄａＢｏｏｓｔ学習アルゴリズムは、小さな対象訓練データセットＤ_Ｔを、ソース訓練データセットＤ_Ｓと関連して、対象分類器ｆ^Ｔのブースティングを駆動するために活用する。対象訓練インスタンスは、ＡｄａＢｏｏｓｔと同じ手法で、弱い分類器の選択を駆動する。一方で、全ての反復で、ソース訓練インスタンスは、誤って分類された際、低い重要性が所与される。これは、対象インスタンスと最も類似しないと考えられ、したがって、次の弱い分類器の選択への影響は弱い方がよいからである。

ＴｒＡｄａＢｏｏｓｔは、ソース訓練データセットＤ_Ｓｋ（ｋ＝１，…，Ｎ）など、複数のソース訓練データセットを活用する能力を提供しない。ここで、Ｎ≧２である。この問題を克服する１つの手法は統合することであり、例えば、複数のソース訓練データセットを単一のデータセットへ連結すること（すなわち、Ｄ_Ｓ＝Ｄ_Ｓ１∪Ｄ_Ｓ２∪…∪Ｄ_ＳＮ）である。その後、ＴｒＡｄａＢｏｏｓｔをこの統合されたソースデータセットに適用する。しかしながら、この手法は、異なるソースデータセットに包含される特異的な情報を失い得る。例えば、各ソース訓練データセットＤ_Ｓｋが異なるカメラ導入から提供される、カメラベースの車両ラベリングの実例的な用途を考えると、一部のカメラ導入は、見晴らし、カメラ特性、カメラと道路との距離、画像前処理など、相対的な観点において、他のカメラより対象カメラ１０と類似している場合がある。対象カメラ１０との類似性が低いソース訓練データセットと比較すると、これらの「類似性が高い」ソース訓練データセットの適応化ブースティングに、より高いプロミネンスを置くことが有利であろう。

本明細書に開示される手法において、ＡｄａＢｏｏｓｔアルゴリズムは、ｒ番目の反復において複数の基本分類器候補ｈ^ｋ _ｒ（ｘ）が訓練されるという点で、修正される。ｒ番目の反復に対する基本分類器ｈ_ｒ（ｘ）は、事前に訓練された基本分類器候補のセットから選択される。一部の実施形態において、ｒ番目の反復において生成される基本分類器候補ｈ^ｋ _ｒ（ｘ）からのみ、選択される。一方で、他の実施形態において、ｒ番目の反復において生成される基本分類器候補ｈ^ｋ _ｒ（ｘ）からだけでなく、前回の反復からの基本分類器候補（例えば、基本分類器候補ｈ^ｋ _ｒ−１（ｘ））からも選択される。後者の実施形態において、選択は、好ましくは、削除を伴ってなされる。すなわち、基本分類器ｈ_ｒ（ｘ）として選択された基本分類器候補は、利用可能な候補のプールから削除され、後の反復（例えば、ｈ_ｒ＋１（ｘ））においては選択されない。各基本分類器候補ｈ^ｋ _ｒ（ｘ）は、対象ドメイン訓練データセットＤ_Ｔとｋ番目のソースドメインデータセットＤ_Ｓｋとを統合した、例えば、Ｄ_Ｔ∪Ｄ_Ｓｋとして統合された訓練セットで、訓練される。このように、一般的に異なる様々なソース訓練データセットＤ_Ｓ１，…，Ｄ_ＳＮの独自性が保持され、ブースト分類器訓練５８において個別に活用される。

ブースト分類器訓練５８における使用に適切な実装として、本明細書に開示される一部の適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムは、以下の観点を組み込む：複数のソース（例えば、特徴ベクトル４４として表される、他のカメラ２４からのラベル化訓練画像）からの知識転送を許容する；正確な知識転送は、（基本分類器が、当該および前回の反復において生成された基本分類器候補から選択される、実施形態において）分類器候補を管理するためのヒープのような構造を使用することにより容易になる；対象誤差予測Ｃ^ｔは、ソースインスタンスを再度重み付けするために使用される（ＳａｍｉｒＡｌ−Ｓｔｏｕｈｉらによる、ＭａｃｈｉｎｅＬｅａｒｎｉｎｇａｎｄＫｎｏｗｌｅｄｇｅＤｉｓｃｏｖｅｒｙｉｎＤａｔａｂａｓｅｓ，ｅｄ．Ｇｕｎｏｐｕｌｏｓらによる、ＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅｖｏｌ．６９１１６０〜７５頁における講義ノート（Ｓｐｒｉｎｇｅｒベルリンハイデルベルク，２０１１）の「Ａｄａｐｔｉｖｅｂｏｏｓｔｉｎｇｆｏｒｔｒａｎｓｆｅｒｌｅａｒｎｉｎｇｕｓｉｎｇｄｙｎａｍｉｃｕｐｄａｔｅｓ（動的更新を使用する転送学習のための適応化ブースティング）」を参照）；および、一部の実施形態において、クラス事前確率（例えば、対象カメラ１０に対する車両ラベル分布２８の確率予測）が、ブースト分類器訓練５８に組み込まれる。

一般的に、豊富な訓練データＤ_Ｓｋ（ｋ＝１，…，Ｎ）は、１つ以上のソース（Ｎ≧１）から利用可能であると予測され、各々が対象と異なる。すなわち、Ｄ_Ｓｋ≠Ｄ_ＴおよびＴ_Ｓｋ≠Ｔ_Ｔである。各基本分類器候補ｈ^ｋ _ｒ（ｘ）を、対象訓練データセットＤ_Ｔと１つのソース訓練データセットＤ_Ｓｋとの統合を使用して訓練し、その後、ｒ番目の反復に対する基本分類器ｈ_ｒ（ｘ）を基本分類器候補のプールから選択することにより、対象と最も近い関係性が現れるソースが（ｒ番目の反復で）選択される。この手法により、対象ドメインと大まかな関連性しかない可能性がある、単一のソースドメインからの知識を転送することへの強制に起因する、負の転送の影響が削減される。開示されるブースト分類器訓練手法において、全ての反復ｒで、各ソースＳ_ｋは、他と独立して、その訓練データＤ_Ｓｋを対象訓練データＤ_Ｔと統合して、弱い分類器候補ｈ^ｋ _ｒ（ｘ）を構築する。弱い分類器のプールは、学習プロセス中に優先キュー（ＰＱ）の形式で管理され、ここから対象分類誤差を最小化するソースが、基本分類器ｈ_ｒ（ｘ）として選択される。（代替の実施形態において、ｈ_ｒ（ｘ）の選択は、当該の反復ｒ中に作り出される基本分類器ｈ^ｋ _ｒ（ｘ）からなるプールに限定される。）

アルゴリズム１は、ブースト分類器訓練器５８の実例的な実施形態を提示する。アルゴリズム１は、入力としてＮ個のソース訓練データセットＤ_Ｓ１，…，Ｄ_ＳＮおよび対象訓練データセットＤ_Ｔを取り込み、対象分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）を構成するために、Ｍ個の基本分類器ｈ_１（ｘ），…，ｈ_Ｍ（ｘ）および対応する重みβ_ｒを生成する。ソース訓練インスタンスの重み付け更新は、Ｄａｉらによる、ＭａｃｈｉｎｅＬｅａｒｎｉｎｇの第２４回国際会議の議事録１９３〜２００頁（ＡＣＭ２００７）「Ｂｏｏｓｔｉｎｇｆｏｒｔｒａｎｓｆｅｒｌｅａｒｎｉｎｇ（転送学習のためのブースティング）」の転送ＡｄａＢｏｏｓｔアルゴリズムにおけるものと同様である。対象訓練インスタンスの重み付け更新は、従来のＡｄａＢｏｏｓｔにおけるものと同様である。例えば、Ｆｒｅｕｎｄらによる、Ｊｏｕｒｎａｌ−ＪａｐａｎｅｓｅＳｏｃｉｅｔｙＦｏｒＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ１４（７７１−７８０）：１６１２，１９９９の「Ａｓｈｏｒｔｉｎｔｒｏｄｕｃｔｉｏｎｔｏｂｏｏｓｔｉｎｇ（ブースティングの簡潔な入門書）」を参照されたい。全ての反復で、アルゴリズム１の内部ループ（６〜１１行目）は、Ｎ個の基本分類器候補ｈ^１ _ｒ（ｘ），…，ｈ^Ｎ _ｒ（ｘ）をＮ個の訓練セットＤ_Ｔ∪Ｄ_Ｓ１，…，Ｄ_Ｔ∪Ｄ_ＳＮから、それぞれ計算し、対象ドメイン訓練データセットＤ_Ｔの対応する分類誤差ε^ｋ _ｒを計算する。その後、それまでに生成された（まだ取り入れられていない）全ての基本分類器候補の中で、対象分類誤差が最小の基本分類器候補が、ｈ_ｒ（ｘ）として選択される。

アルゴリズム１において、優先キュー（ＰＱ）は、３行目で空のセットとして初期化される。その後、ＰＱは、外側ループ（ｒ）反復全体で管理される蓄積を伴って、全ての構築された基本分類器候補を蓄積する。１２行目において、各反復ｒで、最小の対象ドメイン誤差を有するＰＱ内の基本分類器候補が、ｈ_ｒ（ｘ）として選択され、この選択された基本分類器候補は、ＰＱから除去（削除）される。代替の実施形態において、３行目および４行目は、ＰＱが各反復ｒの前に初期化され、当該の反復ｒにおいて生成された基本分類器候補からのみ、ｈ_ｒ（ｘ）の選択が行われるよう、交換される。この場合、１２行目の削除部分も除去され得る。
［表］

図２を引き続き参照すると、一部の実施形態において、クラス事前確率（例えば、対象カメラ１０に対する車両ラベル分布２８の事前予測）は、ブースト分類器訓練５８に組み込まれる。そのために、工程７０において、対象ドメイン訓練セットＤ_Ｔは、対象ドメインＤ_Ｔに対するラベル分布の事前予測２８に基づいて拡張される。１つの適切な手法において、工程７０は、対象ドメイン訓練セットＤ_Ｔに、異なるラベルを有する追加的な合成インスタンスを追加することを備え、ここで合成インスタンスは、ラベル分布の事前予測２８を使用して生成されるラベル確率に基づいて計算されるＡｄａｂｏｏｓｔアルゴリズムに対する重みベクトルｗ^Ｔ _ｉを、初期化している。

実例的な例として、可能なラベル＋１および−１でクラスセットＹ＝｛−１，＋１｝および確率分布π（ｙ）である、二進分類の場合が考慮される。クラス確率を考慮するために、以下の目的関数が最小化される：
ここで、第１の項Ｌ（ｙ_ｉ，Ｆ（ｘ_ｉ））は経験データ適合であり、第２の項ＫＬ（π，ｆ（ｘ_ｉ））は事前モデル適合である。パラメータλは、これらの２つの項の間のトレードオフを制御する。適応化ブースティングにおいて、経験的損失は、Ｌ（ｙ_ｉ，Ｆ（ｘ_ｉ））＝ｌｎ（１＋ｅｘｐ（−ｙ_ｉｆ（ｘ））により与えられる。事前モデル適合を測定するために、式（３）は、事前モデル分布π（ｘ_ｉ）と構築されたブースティングモデルｆ（ｘ_ｉ）と関連付けられるラベルの分布との間のカルバックライブラー（ＫＬ）ダイバージェンスを使用する。
前述のものを統合すると、最小化の関数は以下のように書かれ得る：
ここで、π_＋（ｘ）＝ｐ（ｙ＝＋１｜ｘ）およびπ₋（ｘ）＝ｐ（ｙ＝−１｜ｘ）は、それぞれクラス＋１および−１の確率である。この関数は、非負の重みを有するインスタンスの大きなセットに対応する。

式（４）を最小化するために、対象ドメイン訓練データセットＤ_Ｔは、工程７０において、各々が単位の重みを有する対象訓練インスタンス（ｘ_ｉ，ｙ_ｉ）∈Ｄ_Ｔの全てを含む、より大きな重みの訓練セットへ拡張され、追加的に、各々の元のインスタンス（ｘ_ｉ，ｙ_ｉ）に対する２つの新しい合成インスタンス、すなわち、重みλπ_＋（ｘ_ｉ）を有する合成インスタンス（ｘ_ｉ；＋１）および重みλπ₋（ｘ_ｉ）を有する合成インスタンス（ｘ_ｉ；−１）を含む。これらの重みｗ_０は、以下の式にしたがってＷ_ｔを計算する際に使用される：
ここで、指数ｉは、新しい訓練セット（合成訓練インスタンスを含む）における例の全てに及ぶ。形式を維持するために、０番目の基本関数ｈ_０が、事前確率π_＋（ｘ_ｉ），π₋（ｘ_ｉ）を始めから組み込むために、追加される。特に、初期の基本分類器ｈ_０（ｘ）＝σ^−１（π_＋（ｘ））＝ｌｎ（π＋（ｘ_ｉ）／π−（ｘ_ｉ））が規定され、ｈ_０は最終的な分類器ｆを計算する際に含まれる。

前述の二進の場合から複数クラス（クラスの数がＣ＞２）の場合への拡張は、容易である。各ラベルｙ_ｉはＣ次元二進空間ｙ_ｉ∈２^Ｃにおけるベクトルであり、ここでｋ番目のコンポーネントは、インスタンスがクラスｋであるかを示す。関数ｆ（ｘ，ｋ）は、インスタンスｘがクラスｋである、予測確率である。その後、経験的損失は、Ｌ（ｙ_ｉ，ｆ（ｘ_ｉ））＝Σ_ｉΣ_ｋ（１＋ｅｘｐ（−ｙ_ｉｋｆ（ｘ_ｉ，ｋ））となる。

図３を参照すると、実例的な車両分類器１６の工程が記載されている。これは、カメラベースの車両ラベリングプロセスの「ラベリング段階」である。車両はカメラ１０により撮影され、図１を参照して先に説明されたように、入力画像Ｉを生成するために、写真に選択的な前処理１２が施される。その後、特徴ベクトル抽出コンポーネント４０は、入力画像Ｉを特徴ベクトルへ変換する（または、別の手法では、画像代表特徴ベクトルが入力画像Ｉから抽出される）。図２の訓練の未整列のソース−対象ドメイン整列５０が対象ドメイン整列変換５４を生成する場合、入力画像Ｉを表す特徴ベクトルに適用される。その後、入力画像Ｉを表す特徴ベクトル（選択的に変換された５４）は、車両ラベル１８を生成するよう、（図２を参照して既に説明したように、訓練５８により出力された）訓練されたブースト分類器６０に入力される。選択的に、後処理（図３に図示せず）が、車両種類ラベルを、ルックアップテーブルを使用して金銭的な道路通行料金または課金へ変換する例示的な例などにより、適用されてもよい。

以下の記述において、本明細書に記載される画像および物体ラベリング技術の一部の実例的な評価が説明される。評価は、以下から５個の画像データセットを適用した：ＩｍａｇｅＣＬＥＦ’１４ＤｏｍａｉｎＡｄａｐｔａｔｉｏｎｃｈａｌｌｅｎｇｅ（ｈｔｔｐ：／／ｗｗｗ．ｉｍａｇｅｃｌｅｆ．ｏｒｇ／２０１４／ａｄａｐｔａｔｉｏｎ）；３０，６０７個の画像の集合を有する２５６個の物体カテゴリからなる、Ｃａｌｔｅｃｈ−２５６；ノードごとに平均５００個の画像を有する、ＷｏｒｄＮｅｔｈｉｅｒａｒｃｈｙにしたがって体系化された、ＩｍａｇｅＮｅｔＩＬＳＶＲＣ２０１２；２０個の物体クラスを有する物体クラス認識に対する画像データセットである、ＰＡＳＣＡＬＶＯＣ２０１２；Ｃａｌｔｅｃｈ−２５６からの２５６個のカテゴリ全てを包含し、Ｂｉｎｇを使用したテキスト検索を介して収集された、カテゴリごとに３００個のウェブ画像で増加される、Ｂｉｎｇ；および、１３０，５１９個の画像が投入された８９９個のカテゴリを包含する状況理解データセットである、Ｓｕｎ。これらのうち、以下のソースドメインが規定された：Ｓ_１はＣａｌｔｅｃｈデータセットである；Ｓ_２はＩｍａｇｅＮｅｔデータセットである；Ｓ_３はＰＡＳＣＡＬデータセットである；および、Ｓ_４はＢｉｎｇデータセットである。ＳＵＮデータセットは対象ドメインの役割を果たした。５個のデータセット全てに共通する１２個のクラスが選択された：航空機、バイク、鳥、ボート、ボトル、バス、車、犬、馬、モニタ、オートバイ、人々。各ソースは６００個の注釈インスタンスを含み、一方で対象ドメインから、６０個のラベル化された訓練画像および６００個のラベル化されていないテスト画像インスタンスが取得された。これらのデータは、開示される画像ラベリング技術にしたがって、画像ラベリング実験を行うために使用された。

基準の手法として、対象ドメインデータは単独で使用され（すなわち、いずれのソースデータセットも使用しない）、パラメータおよび核関数の最適なセットを有する基準のＳＶＭ分類器（ＬＩＢＳＶＭパッケージ，ｈｔｔｐ：／／ｗｗｗ．ｃｓｉｅ．ｎｔｕ．ｅｄｕ．ｔｗ／ｃｊｌｉｎ／ｌｉｂｓｖｍ／）を訓練した。

別の基準の手法として、Ｄａｉらによる、ＭａｃｈｉｎｅＬｅａｒｎｉｎｇの第２４回国際会議の議事録１９３〜２００頁（ＡＣＭ２００７）「Ｂｏｏｓｔｉｎｇｆｏｒｔｒａｎｓｆｅｒｌｅａｒｎｉｎｇ（転送学習に対するブースティング）」の転送ＡｄａＢｏｏｓｔ（ＴｒＡｄａＢｏｏｓｔ）アルゴリズムが使用された。ＴｒＡｄａＢｏｏｓｔは単一ソースのみを使用し得るので、４個のソースドメインは、全てのソースサブセットの網羅的列挙により取得された、２^４−１＝１５個の組み合わせに連結された。各組み合わせで、ＴｒＡｄａＢｏｏｓｔアルゴリズムは、対象ドメインに対するブースト分類器を訓練するために使用された。

さらなる評価において、アルゴリズム１は、様々な実験において、Ｎ＝２，Ｎ＝３，またはＮ＝４のソースドメインと共に使用された。

さらなる評価において、アルゴリズム１は、様々な実験において、Ｎ＝２，Ｎ＝３，またはＮ＝４のソースドメインと共に使用され、図２の選択的な工程７０を参照して説明されたように、事前知識πを含むことにより、さらに拡張された。

評価において、パラメータの数は、複数クラスのＳＶＭパラメータおよび核関数、事前知識に対するλトレードオフ、ＤＡ手法における重みの初期化、その他を含む、最良性能を取得するために調整された。追加的に、４つの評価された方法の各々は、ＩＣＰ整列方法を適用する、図２を参照して説明される対象ドメイン５０に対するソースの監視されない整列を伴ってテストされた。比較のために、いくつかの評価が、ソース−対象整列を行わずに（すなわち、「ＩＣＰなし」）実行された。クラス事前知識πを適用する評価において、全てのＣ＝１２クラスは、対象データにおいて同等に表されると推定された。すなわち、π（ｙ）＝Ｕｎｉｆｏｒｍ（１，Ｃ）である。

表１は、異なる分類器訓練方法で取得される最良の正確性を報告する。これらの結果は、テストされたデータセットで、アルゴリズム１が複数のソースドメインで動作するが、複数のソースおよび類似の性能の連結シナリオ、すなわち、ソースを連結することが、分割を維持することと同じくらい有益であったことを示す。これは、４個のテストされたソースデータセットのソースインスタンス間の近接性によるものと思われる。ソースドメインが大きく異なる分布を有する場合において、分割を維持することで、結果の向上が期待される。誤差予測Ｃ_ｒの使用が、弱い分類器の前半に対する速すぎる収束および高い感受性など、ＴｒＡｄａｂｏｏｓｔのいくつかの欠点に対処するのに役立つと思われる。

クラス事前確率の知識およびフレームワークにおけるそれらの統合は、ラベリング正確性の実質的な向上をもたらした。パラメータλを調整することは容易であり、様々な値がよい性能をもたらした。

実例的な実施形態は、カメラベースの物体ラベリングに関し、または、類似して、カメラにより取得される物体の画像のラベリングに関する。そのような実施形態において、対象ドメインおよび１つ以上のソースドメインは、画像を取得するために使用される各々のカメラにより適切に規定される。実例的な実施形態において、対象ドメインは、システムカメラ１０により取得される物体の画像のドメインとして規定され、各ソースドメインＳ_１，…，Ｓ_Ｎは、システムカメラ以外のカメラにより取得される物体の画像のドメインとして規定される。より一般的には、開示されるラベリング技術は、一般的に様々な機構により生成されるラベル画像に適用され得る。画像ドメインは、画像生成の共通機構に基づいて、そのような実施形態において適切に規定される。さらなる例示的な例によると、手書き分析は、感圧タブレットに書き込む人物により電子的に生成される手書き画像上で動作してよく、この場合カメラは関与しない。この場合の画像ドメインは、異なる人物に対応してよい。例えば、ラベル化対象画像は、感圧タブレットを使用して取得される対象人物により生成される筆跡であってよく、対象ドメイン訓練セットは、対象人物により生成されるラベル化された手書きサンプルであってよく、各ソースドメイン訓練セットは、同じ（または、異なっている可能性もある）感圧タブレットを使用して、単一の人物（対象人物以外）により生成される手書きサンプルであってよい。

Claims

対象ドメインに属するラベル化対象画像を、工程によりラベル化するよう構成される電子データ処理デバイスであって、前記工程は、
前記対象ドメインに属し特徴ベクトルｘにより表される画像を分類するよう、ブースト分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）を訓練することであって、対象ドメイン訓練セットＤ_Ｔを使用する前記訓練は、前記対象ドメインに属する画像を表すラベル化特徴ベクトルを備え、Ｎ≧２である複数のソースドメイン訓練セットＤ_Ｓ１，…，Ｄ_ＳＮは、ソースドメインＳ_１，…，Ｓ_Ｎにそれぞれ属する画像を表すラベル化特徴ベクトルを備え、前記訓練は、前記基本分類器ｈ_ｒ（ｘ）および前記ブースト分類器ｆ^Ｔ（ｘ）の前記基本分類器の重みβ_ｒを生成するために、適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムを適用することを備え、ここで前記ＡｄａＢｏｏｓｔアルゴリズムのｒ番目の反復は、（ｉ）ｋ番目の副反復が、前記対象ドメイン訓練セットＤ_Ｔと前記ソースドメイン訓練セットＤ_Ｓｋとを統合する訓練セット上の基本訓練器候補ｈ^ｋ _ｒ（ｘ）を訓練する、Ｎ回の副反復を行うこと、および、（ｉｉ）ｈ_ｒ（ｘ）を、前記対象ドメイン訓練セットＤ_Ｔに対する、最小エラーを有する前記基本分類器候補として選択すること、を含む、訓練することと、
前記ラベル化対象画像を表す特徴ベクトルｘ_ｉｎを計算することと、
前記ラベル化画像に対するラベルを、評価することｆ^Ｔ（ｘ_ｉｎ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ_ｉｎ）を含む工程により、生成することと、
を含む、電子データ処理デバイス、
を備える、ラベリングシステム。
前記ラベリングシステムは、カメラベースの物体ラベリングシステムであって、
物体の画像を取得するよう配置されるシステムカメラであって、
前記対象ドメインは、前記システムカメラにより取得される物体の画像の前記ドメインとして規定され、前記ラベル化対象画像は、前記システムカメラにより取得される、ラベル化対象物体の画像であり、
各ソースドメインＳ_１，…，Ｓ_Ｎは、前記システムカメラ以外のカメラにより取得される物体の画像の前記ドメインとして規定され、および、
前記電子データ処理デバイスは、前記物体に対するラベルを、前記ラベル化対象画像に対して生成された前記ラベルに基づいて生成するよう、さらに構成される、
システムカメラをさらに備える、請求項１に記載のラベリングシステム。
前記ラベル化対象物体の前記画像を、前記物体に対して生成される前記ラベルと共に表示するよう、前記電子データ処理デバイスと動作可能に接続される表示デバイス、
をさらに備える、請求項２に記載のカメラベースの物体ラベリングシステム。
前記ｋ番目の副反復は、前記対象ドメイン訓練セットＤ_Ｔおよび前記ソース訓練セットＤ_Ｓｋの和集合Ｄ_Ｔ∪Ｄ_Ｓｋ上の前記基本分類器候補ｈ^ｋ _ｒ（ｘ）を訓練する、請求項１に記載のラベリングシステム。
前記ブースト分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）の前記訓練は、
前記Ａｄａｂｏｏｓｔアルゴリズムを適用する前に、前記対象ドメイン訓練セットＤ_Ｔおよび前記ソース訓練セットＤ_Ｓｋ（ｋ＝１，…，Ｎ）を整列するよう、監視されないソース−対象ドメイン整列を行うこと、
をさらに備える、請求項１に記載のラベリングシステム。
前記ＡｄａＢｏｏｓｔアルゴリズムの前記ｒ番目の反復は、
（ｉｉｉ）前記ソース訓練セットＤ_Ｓｋ（ｋ＝１，…，Ｎ）の前記訓練インスタンスｉに対する重みベクトルｗ^Ｓｋ _ｉを、前記基本分類器ｈ_ｒ（ｘ）として選択された前記基本分類器候補の前記対象ドメイン訓練セットＤ_Ｔに対する前記誤差に基づいて更新すること、
をさらに含む、請求項１に記載のラベリングシステム。
前記Ａｄａｂｏｏｓｔアルゴリズムは、基本分類器候補のキューＰＱを前記Ａｄａｂｏｏｓｔアルゴリズムの反復全体にわたって管理し、前記選択する工程（ｉｉ）は、
（ｉｉ）（ａ）ｈ_ｒ（ｘ）を、前記対象ドメイン訓練セットＤ_Ｔに対する最小エラーを有する前記キューＰＱにおける前記基本分類器候補として選択すること、および、
（ｉｉ）（ｂ）前記選択された基本分類器候補を前記キューＰＱから削除すること、
を含む、請求項１に記載のラベリングシステム。
前記ブースト分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）の前記訓練は、
前記Ａｄａｂｏｏｓｔアルゴリズムを適用する前に、前記対象ドメイン訓練セットＤ_Ｔを、前記対象ドメインに対する前記ラベル分布の事前予測に基づいて拡張すること、
をさらに備える、請求項１に記載のラベリングシステム。
対象ドメインに属するラベル化対象画像をラベル化するためのラベリング方法であって、前記画像ラベリング方法は、
前記対象ドメインに属する対象ドメイン訓練画像を表す特徴ベクトルを計算することと、
前記対象ドメイン訓練画像を、ラベルのセットから選択されたラベルを使用して、前記対象ドメイン訓練画像を表すラベル化特徴ベクトルを備える対象訓練セットＤ_Ｔを生成するよう、ラベリングすることと、
複数のソースドメイン訓練セットＤ_Ｓ１，…，Ｄ_ＳＮを受信することであって、Ｎ≧１は、前記ラベルのセットから選択されたラベルを使用してラベル化された、前記対象ドメインとは異なるソースドメインに属する画像を表す特徴ベクトルを備える、受信することと、
前記対象ドメイン訓練セットＤ_Ｔおよび前記ソース訓練セットＤ_Ｓｋ（ｋ＝１，…，Ｎ）を整列させるよう、監視されないソース−対象ドメイン整列を行うことと、
前記対象ドメインに属し特徴ベクトルｘで表される画像を分類するよう、ブースト分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）を訓練することであって、前記訓練は、前記整列された対象ドメイン訓練セットＤ_Ｔおよび複数のソースドメイン訓練セットＤ_Ｓ１，…，Ｄ_ＳＮを使用し、前記訓練は、前記基本分類器ｈ_ｒ（ｘ）および前記ブースト分類器ｆ^Ｔ（ｘ）の前記基本分類器の重みβ_ｒを生成するよう、適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムを適用することを備え、ここでｒ＝１，…，Ｍである、訓練することと、
前記ラベル化対象画像を表す特徴ベクトルｘ_ｉｎを計算することと、
前記ラベル化対象画像に対するラベルを、ｆ^Ｔ（ｘ_ｉｎ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ_ｉｎ）を評価することを含む工程により、生成することと、
を備え、
ここで、前記特徴ベクトル計算工程、前記訓練工程、および前記生成工程は、電子データ処理デバイスにより行われる、方法。
物体を、対象カメラを使用して取得された前記物体の画像に基づいて、ラベル化するための、カメラベースの物体ラベリング方法を行うよう、電子データ処理デバイスにより実行可能な命令を保存する、持続性保存媒体であって、前記カメラベースの物体ラベリング方法は、
前記対象カメラにより取得され特徴ベクトルｘにより表される画像を分類するよう、ブースト分類器ｆ^Ｔ（ｘ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ）を訓練することであって、前記訓練は、前記対象カメラにより取得された画像を表すラベル化特徴ベクトルを備える対象ドメイン訓練セットＤ_Ｔおよび複数のソースドメイン訓練セットＤ_Ｓ１，…，Ｄ_ＳＮを使用し、ここでＮ≧２は、前記対象カメラ以外のカメラにより取得された物体の画像を表すラベル化特徴ベクトルを備え、前記訓練は、前記基本分類器ｈ_ｒ（ｘ）および前記ブースト分類器ｆ^Ｔ（ｘ）の前記基本分類器の重みβ_ｒを生成するよう、適応化ブースティング（ＡｄａＢｏｏｓｔ）アルゴリズムを適用することを備え、ここで前記ＡｄａＢｏｏｓｔアルゴリズムはｒ＝１，…，Ｍの反復を含み、前記ｒ番目の反復は複数の基本分類器候補ｈ^ｋ _ｒ（ｘ）を訓練することを含み、ここで各基本分類器候補ｈ^ｋ _ｒ（ｘ）は、訓練セットＤ_Ｔ∪Ｄ_Ｓｋ上で訓練され、ｈ_ｒ（ｘ）を事前に訓練された基本分類器候補のセットから選択する、訓練すること、および、
前記物体の前記画像を表す特徴ベクトルｘ_ｉｎを計算すること、および、
前記物体に対するラベルを、ｆ^Ｔ（ｘ_ｉｎ）＝Σ^Ｍ _ｒ＝１β_ｒｈ_ｒ（ｘ_ｉｎ）を評価することにより生成すること、
の前記工程を含む、持続性保存媒体。