JP4769416B2 - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP4769416B2
JP4769416B2 JP2003403530A JP2003403530A JP4769416B2 JP 4769416 B2 JP4769416 B2 JP 4769416B2 JP 2003403530 A JP2003403530 A JP 2003403530A JP 2003403530 A JP2003403530 A JP 2003403530A JP 4769416 B2 JP4769416 B2 JP 4769416B2
Authority
JP
Japan
Prior art keywords
feature amount
image processing
image
shape
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003403530A
Other languages
English (en)
Other versions
JP2005165662A (ja
Inventor
高康 山口
節之 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2003403530A priority Critical patent/JP4769416B2/ja
Publication of JP2005165662A publication Critical patent/JP2005165662A/ja
Application granted granted Critical
Publication of JP4769416B2 publication Critical patent/JP4769416B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、色の特徴量と形状の特徴量とを組み合わせて画像の判別を行う画像処理装置及び画像処理方法に関する。
従来、撮影画像から当該撮影画像に含まれる撮影対象を判別する際に用いられる特徴量には様々なものがある。特徴量の一つである色の特徴量(色ヒストグラム)は、照明条件の変化に弱いという欠点がある。又、色の変化の影響を受けないように画像の輝度を用いた形状(構図)の特徴量は、画像の持つ重要な情報であるカラー情報を破棄してしまっている。近年、これら色や形状の特徴量を用いるアルゴリズムを従属もしくは並列に適用して、対象の判別を行う方法が提案されている(例えば、特許文献1)。
特開2003−289551号公報(「0089」〜「0091」段落、図10)
しかしながら、従来の判別方法では、組み合わされた特徴量のうち、どの特徴量による推定結果を重視して判別を行えば良いのかが不明であり、個別の問題に合わせて人手によって設計を行う必要があった。
そこで、本発明は、上記の課題に鑑み、カラー情報及び構図情報を用いた一つの特徴量を抽出し、照明条件の変化があっても撮影画像から撮影画像に含まれる撮影対象を正しく判別する画像処理装置及び画像処理方法を提供することを目的とする。
上記目的を達成するため、本発明の第1の特徴は、撮影画像から撮影画像に含まれる未知の撮影対象を判別する画像処理装置であって、(イ)均等色空間で表現された撮影画像の信号を量子化し、均等色空間における各軸の量子化レベルの値の頻度を色の特徴量として抽出する第1の特徴量抽出手段と、(ロ)グレースケール画像で表現された撮影画像に基づいて、グレースケール画像における各ピクセルの輝度値を形状の特徴量として抽出する第2の特徴量抽出手段と、(ハ)色の特徴量及び形状の特徴量に基づいて、色の特徴量の次元数と形状の特徴量の次元数とを結合して得られる次元数の結合特徴量を抽出する第3の特徴量抽出手段と、(ニ)結合特徴量に基づいて、未知の撮影対象を判別する判別手段とを備える画像処理装置であることを要旨とする。ここで、「次元数」とは、ベクトルである、色の特徴量、形状の特徴量、結合特徴量の各要素数をいう。例えば、色の特徴量を100次元、形状の特徴量を150次元とすると、結合特徴量の次元は250次元となる。
第1の特徴に係る画像処理装置によると、カラー情報及び構図情報を用いた一つの特徴量を抽出し、照明条件の変化があっても撮影画像から撮影画像に含まれる撮影対象を正しく判別することができる。
又、第1の特徴に係る画像処理装置の第2の特徴量抽出手段は、撮影画像に対してローパスフィルタ処理を施した後に、各ピクセルの輝度値を形状の特徴量として抽出してもよい。又、第1の特徴に係る画像処理装置の第2の特徴量抽出手段は、撮影画像に対してモルフォロジ処理を施した後に、各ピクセルの輝度値を形状の特徴量として抽出してもよい。この画像処理装置によると、撮影画像をぼかす処理を加えることで、画像の変化があっても、より安定した判別性能を得ることができる。
又、第1の特徴に係る画像処理装置は、複数の撮影画像の結合特徴量それぞれに基づいて算出された複数の所定のパラメータを記憶する記憶手段と、所定のパラメータを算出するパラメータ算出手段とを更に備え、判別手段は、所定のパラメータを用いることにより、撮影対象を判別してもよい。この画像処理装置によると、結合特徴量を用いて算出されたパラメータを用いて、未知の撮影対象の判別を行うことができる。
又、lを既知の撮影対象の番号、N(l)をl番目の既知の撮影対象に対する撮影画像の数、vを結合特徴量の次元の番号、Vを結合特徴量の最大次元数、γを任意の値、x(l)をl番目の既知の撮影対象に対する撮影画像の結合特徴量、θを所定のパラメータ、x’を未知の撮影対象が含まれる撮影画像の結合特徴量、F(l)を未知の撮影対象がl番目の既知の撮影対象に属する度合いを示す判別値として、第1の特徴に係る画像処理装置のパラメータ算出手段は、以下の式によって、所定のパラメータを算出し、
Figure 0004769416
判別手段は、以下の式によって得られた判別値が最も大きい撮影画像を、撮影対象として認識してもよい。
Figure 0004769416
この画像処理装置によると、結合特徴量を用いて算出されたパラメータを用いて、判別値を算出し、未知の撮影対象の判別を行うことができる。
本発明の第2の特徴は、撮影画像から撮影画像に含まれる未知の撮影対象を判別する画像処理方法であって、(イ)均等色空間で表現された撮影画像の信号を量子化し、均等色空間における各軸の量子化レベルの値の頻度を色の特徴量として抽出する第1の特徴量抽出ステップと、(ロ)グレースケール画像で表現された撮影画像に基づいて、グレースケール画像における各ピクセルの輝度値を形状の特徴量として抽出する第2の特徴量抽出ステップと、(ハ)色の特徴量及び形状の特徴量に基づいて、色の特徴量の次元数と形状の特徴量の次元数とを結合して得られる次元の結合特徴量を抽出する第3の特徴量抽出ステップと、(ニ)結合特徴量に基づいて、未知の撮影対象を判別するステップとを含む画像処理方法であることを要旨とする。
第2の特徴に係る画像処理方法によると、カラー情報及び構図情報を用いた一つの特徴量を抽出し、照明条件の変化があっても撮影画像から撮影画像に含まれる撮影対象を正しく判別することができる。
本発明によると、カラー情報及び構図情報を用いた一つの特徴量を抽出し、照明条件の変化があっても、撮影画像から撮影画像に含まれる撮影対象を正しく判別する画像処理装置及び画像処理方法を提供することができる。
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一又は類似の部分には、同一又は類似の符号を付している。ただし、図面は模式的なものであることに留意すべきである。
(画像処理システム)
本実施形態に係る画像処理システムは、図1に示すように、ユーザの入力を受け付けて画像処理サーバ1(画像処理装置)に処理を依頼し、画像処理サーバ1での処理結果を出力する端末装置2a、2b、2cと、通信ネットワーク(インターネット等)3を介して、端末装置2a、2b、2cからの処理依頼を受け付けて処理を行い、端末装置2a、2b、2cに処理結果を送信する画像処理サーバ1とを備える。
ユーザは、端末装置2a、2b、2cを、学習モードと判別モードの2種類のモードを切り換えて使用することができる。「学習モード」とは、既知である撮影対象を撮影し、この撮影画像と撮影対象を特定する情報を画像処理サーバ1へ送信することにより、画像処理サーバ1が撮影画像を学習するモードである。一方、「判別モード」とは、未知である撮影対象を撮影し、この撮影画像を画像処理サーバ1へ送信することにより、画像処理サーバ1が撮影対象を判別し、判別結果を、端末装置2a、2b、2cへ送信するモードである。
学習モードである場合、画像処理サーバ1は、端末装置2a、2b、2cから受信した、撮影対象に関する情報や撮影対象を撮影した撮影画像から撮影対象のグルーピングを行い、各撮影対象情報及び画像を記憶する。
判別モードである場合、画像処理サーバ1は、端末装置2a、2b、2cの位置情報と、端末装置2a、2b、2cから受信した撮影画像が撮影された位置に近い、予め登録された撮影対象の情報を取り出し、撮影画像に含まれる撮影対象を確率的に判別する。又、画像処理サーバ1は、判別結果となる複数の撮影対象の候補と、各候補が撮影対象である確率と、それら撮影対象に関連する情報を端末装置2a、2b、2cに送信する。
画像処理サーバ1は、図2に示すように、通信手段11と、判別手段12と、特徴量抽出手段13と、登録手段14と、学習手段15と、演算装置16と、記憶装置17とを備える。
通信手段11は、通信ネットワーク3(インターネット等)を介し、端末装置2a、2b、2cから、撮影画像及び撮影対象の情報を受信する。又、通信手段11は、判別モードである場合、通信ネットワーク3(インターネット等)を介し、端末装置2a、2b、2cへ撮影対象の情報及び判別結果を送信する。
特徴量抽出手段13は、撮影対象を判別する際の指標となる結合特徴量を抽出する。ここで、「結合特徴量」とは、色の特徴量及び形状の特徴量を結合した特徴量をいう。具体的には、特徴量抽出手段13は、均等色空間で表現された撮影画像の信号を量子化し、均等色空間における各軸の量子化レベルの値の頻度を色の特徴量として抽出する。又、特徴量抽出手段13は、グレースケール画像で表現された撮影画像に基づいて、グレースケール画像における各ピクセルの輝度値を形状の特徴量として抽出する。更に、特徴量抽出手段13は、色の特徴量及び形状の特徴量に基づいて、色の特徴量の次元数と形状の特徴量の次元数とを結合して得られる次元数の結合特徴量を抽出する。即ち、特徴量抽出手段13は、既知の撮影画像1枚毎に、次元数(V)分の要素を有する結合特徴量(x)を抽出する。結合特徴量(x)は、一定の要素数を有するベクトルである。
学習手段15(パラメータ算出手段)は、式(1)を用いて、特徴量抽出手段13によって抽出された結合特徴量に基づいて、V×Lの行列からなる学習パラメータθの各要素θ(v,l)を算出する。ここで、結合特徴量は、1〜V個の次元(要素)を有する特徴量であり、各次元の番号をvと表す。
Figure 0004769416
式(1)において、lは既知の撮影対象の番号、N(l)はl番目の既知の撮影対象に対する撮影画像の数、vは結合特徴量の次元の番号、Vは結合特徴量の最大次元数、γは任意の値、 x(l)はl番目の既知の撮影対象に対する撮影画像の結合特徴量、θは学習パラメータである。以下の説明において、小文字で記された文字は変数であり、大文字で記された文字は固定値である。
具体的には、学習手段15(パラメータ算出手段)は、式(1)を用いて、l番目の既知の撮影対象に属する結合特徴量のv番目の次元の学習パラメータθ (v,l)を算出する。
判別手段12は、判別モードの際に受信した撮影画像について、式(2)を用いて、学習手段15(パラメータ算出手段)によって算出された学習パラメータを用いることにより、未知の撮影対象を判別する。
Figure 0004769416
式(2)において、x’は未知の撮影対象が含まれる撮影画像の結合特徴量、F(l)は未知の撮影対象がl番目の既知の撮影対象に属する度合いを示す判別値である。
具体的には、判別手段12は、l番目の既知の撮影対象に属する結合特徴量のv番目の次元の学習パラメータθ (v,l)を用いて、未知の撮影対象が含まれる撮影画像に属する結合特徴量x’が、l番目の既知の撮影対象に属する度合いを示すF(l)の値を算出する。ここで、F(l)の値が大きいほど、未知の撮影対象は、l番目の既知の撮影対象である確率が高いと判断する。
このように、式(2)によるF(l)の算出をL回行えば、F(l)の値に応じて、未知の撮影対象がL種類の撮影対象のどれに属するかを順位付けて判別することができる。
登録手段14は、演算装置16を介して記憶装置17に撮影画像毎の結合特徴量や学習パラメータを登録する。
演算装置16は、通信手段11と、判別手段12と、特徴量抽出手段13と、登録手段14と、学習手段15と、記憶装置17の動作を制御する。
又、本発明の実施の形態に係る画像処理サーバ1は、処理制御装置(CPU)を有し、通信手段11、判別手段12、特徴量抽出手段13、登録手段14、学習手段15などをモジュールとしてCPUに内蔵する構成とすることができる。これらのモジュールは、パーソナルコンピュータ等の汎用コンピュータにおいて、所定のプログラム言語を利用するための専用プログラムを実行することにより実現することができる。又、記憶装置17は、複数の撮影画像の結合特徴量、複数の撮影画像それぞれに基づいて算出された複数の所定の学習パラメータ、撮影画像データ、登録対象情報、登録対象関連情報、判定値などを保存する記録媒体である。記録媒体は、例えば、RAM、ROM、ハードディスク、フレキシブルディスク、コンパクトディスク、ICチップ、カセットテープなどが挙げられる。このような記録媒体によれば、撮影画像データ、学習パラメータ、登録対象情報などの保存、運搬、販売などを容易に行うことができる。
端末装置2a、2b、2cは、学習モードと判別モードの2種類のモードを切り換えることができる。
学習モードである場合、端末装置2a、2b、2cは、搭載されたカメラによって、既知の撮影対象を撮影する。端末装置2a、2b、2cは、予めユーザによって登録された登録対象情報と登録対象関連情報とともに、撮影画像を画像処理サーバ1に送信する。ここで、「登録対象情報」とは、撮影画像に写っている撮影対象を特定するための情報である。又、「登録対象関連情報」とは、撮影対象の位置情報、撮影対象に関連する情報(名称、URLなど)などである。
判別モードである場合、端末装置2a、2b、2cは、搭載されたカメラによって、未知の撮影対象を撮影する。端末装置2a、2b、2cは、位置情報とともに、撮影画像を画像処理サーバ1に送信する。そして、端末装置2a、2b、2cは、画像処理サーバ1から判別結果となる複数の撮影対象の候補と、各候補が撮影対象である確率と、それら撮影対象に関連する情報を受信し、上述したF(l)の値を元に「登録対象情報」と「登録対象関連情報」を順位付けて、ユーザに提示する。ユーザは、それら順位付けされた候補の中から所望のデータを簡単に取り出すことができる。
端末装置2は、図3に示すように、入力手段21と、通信手段22と、出力手段23と、撮影手段24と、測位手段25と、演算装置26と、記憶装置27とを備える。
通信手段22は、通信ネットワーク3(インターネット)を介し、画像処理サーバ1へ、撮影画像及び撮影対象の情報を送信する。又、通信手段22は、判別モードである場合、通信ネットワーク3(インターネット)を介し、画像処理サーバ1から、撮影対象の情報及び判別結果を受信する。
撮影手段24は、具体的には、搭載されたカメラなどを指し、対象を撮影し、撮影画像を取得する。
測位手段25は、端末装置2の位置や撮影対象の位置を測定する。
入力手段21は、タッチパネル、キーボード、マウス等の機器を指す。入力手段21から入力操作が行われると対応するキー情報が演算装置26に伝達される。出力手段23は、モニタなどの画面を指し、液晶表示装置(LCD)、発光ダイオード(LED)パネル、エレクトロルミネッセンス(EL)パネル等が使用可能である。
演算装置26は、入力手段21と、通信手段22と、出力手段23と、撮影手段24と、測位手段25と、記憶装置27の動作を制御する。又、演算装置26は、入力手段21から入力されたキー情報などによって、学習モードと判別モードを切り換える切換手段として動作する。
記憶装置27は、撮影画像、登録対象情報、登録対象関連情報などを保存する記録媒体である。
(画像処理方法)
次に、画像処理方法について、図4〜9を用いて説明する。
まず、撮影画像の登録方法について、図4を用いて説明する。
(イ)まず、ステップS101において、端末装置2は、学習モードにおいて既知の登録対象を撮影し、その画像を取得する。
(ロ)次に、ステップS102において、端末装置2は、登録対象情報を入力し、ステップS103において、端末装置2は、登録対象関連情報を入力する。登録対象情報及び登録対象関連情報の入力は、撮影前に予め行っていても構わない。
(ハ)次に、ステップS104において、端末装置2は、登録対象を撮影した地点の位置情報、測位誤差、撮影時刻、可能であれば撮影対象までの距離や方向を取得する。
(ニ)次に、ステップS105において、端末装置2は、画像処理サーバ1に登録対象情報、登録対象関連情報、位置情報、取得画像データを送信する。
(ホ)次に、ステップS106において、画像処理サーバ1は、登録対象情報、登録対象関連情報、位置情報、取得画像を送信する。そして、ステップS107において、画像処理サーバ1は、登録画像の特徴量を抽出する。この特徴量の抽出方法は、後に詳述する。
(へ)次に、ステップS108において、画像処理サーバ1は、登録対象情報、登録対象関連情報、登録対象画像、特徴量及び画像処理サーバ1での登録時刻を記憶装置17に記憶する。
次に、撮影対象を学習する方法について、図5を用いて説明する。
(イ)まず、ステップS201において、画像処理サーバ1は、記憶装置17から撮影対象情報、撮影対象関連情報、取得画像データ、特徴量を読み出す。
(ロ)次に、ステップS202において、画像処理サーバ1は、位置情報による対象のグルーピングを行って対象を絞り込む。後述する撮影対象の判別時に随時学習を行う場合は、端末装置2から端末装置2の位置情報を受信して、検索範囲内にある撮影対象を学習する。ここで、「検索範囲」とは、判別対象を中心として半径が(測位誤差)+(対象までの距離)以内のエリアを指す。又、ここで用いる位置情報は、任意の位置を受け付けることが可能である。例えば、予め判別が行われそうな位置を用いて学習を行っても良いし、端末の位置情報を用いて判別する際に随時学習を行っても良い。
(ハ)次に、ステップS203において、画像処理サーバ1は、対象の学習を行う。具体的には、上述した式(1)を用いて学習パラメータの算出を行う。
(ニ)次に、ステップS204において、画像処理サーバ1は、対象の学習結果(学習パラメータ)を記憶する。
次に、撮影対象を判別する方法について、図6を用いて説明する。
(イ)まず、ステップS301において、端末装置2は、判別モードにおいて未知の判別対象を撮影し、画像を取得する。次に、ステップS302において、端末装置2は、判別対象関連情報(判別対象の位置情報、その測位誤差、対象までの距離等)を取得する。
(ロ)次に、ステップS303において、端末装置2は、画像処理サーバ1に判別対象関連情報及び判別画像を送信する。次に、ステップS304において、画像処理サーバ1は、判別対象関連情報及び判別画像を受信する。次に、ステップS305において、画像処理サーバ1は、判別画像の特徴量を抽出する。この特徴量の抽出方法は、後に詳述する。
(ハ)次に、ステップS306において、画像処理サーバ1は、判別対象の絞り込みを行う。次に、ステップS307において、画像処理サーバ1は、検索範囲の学習が完了しているか否か判断する。完了している場合は、ステップS308の処理に進み、完了していない場合は、ステップS309の処理に進む。
(ニ)ステップS309において、画像処理サーバ1は、図5のステップS203において説明した学習を行う。そして、ステップS308において、画像処理サーバ1は、判別画像の特徴量と学習パラメータを用いて対象判別を確率的に行う。具体的には、具体的には、上述した式(2)を用いて判定値を求め、判別候補となる撮影画像を求める。
(ホ)次に、ステップS310において、画像処理サーバ1は、判別結果の候補に関する撮影対象情報及び撮影対象関連情報を記憶装置17から読み出し、撮影対象情報、撮影対象関連情報、判別結果を端末装置2に送信する。
(へ)次に、ステップS310において、端末装置2は、確率的な判別結果を元に撮影対象情報と撮影対象関連情報に優先度をつけて(例えば、確率の高い候補を画面の上部に表示するなど)ユーザに提示する。これにより、ユーザは未知の登録対象に関連したURL等のアドレスを元にして、ネットワークからさらに対象に関連する情報を引き出すことができる。
図6に示す判別処理によると、例えば、ユーザが、端末装置2によって未知の撮影対象である店舗Aを撮影し、その撮影画像を画像処理サーバ1へ送信すると、画像処理サーバ1が店舗Aを判別し、店舗Aの名称、URL等を端末装置2に送信することができる。このため、端末装置2は、撮影画像からその撮影対象に関する情報を容易に得ることができる。
次に、図4のステップS107における特徴量の抽出方法の詳細について、図7を用いて説明する。
(イ)まず、ステップS401において、画像処理サーバ1は、端末装置2に搭載したカメラによって対象の撮影画像を取得する。この取得した画像は、カメラや端末装置2の機能によりホワイトバランス等の一般的な画像補正を行われていてもよい。
(ロ)次に、ステップS402において、画像処理サーバ1は、取得画像にノイズ除去の画像補正処理を施す。この補正画像に対して、ステップS403及びS404において、色に関する特徴量と形状(構図)に関する特徴量を得る。色の特徴量及び形状(構図)の特徴量の作成方法については、後に詳述する。
(ハ)次に、ステップS405において、それらの特徴量の次元を結合して色及び形状の特徴量を同時に表現する。色の特徴量及び形状の特徴量は、一定の要素数を有するベクトル値である。例えば、色の特徴量がVc次元(Vc個の要素を有するベクトル値)、形状(構図)の特徴量がVs次元(Vs個の要素を有するベクトル値)であるとき、両者の特徴量を結合した特徴量の次元VがV=Vc+Vsとなるように、独立の次元として結合を行う。尚、色の特徴量と形状(構図)の特徴量を結合する際には、それぞれのベクトルの大きさのバランスを取るために、それぞれの特徴量の次元の値の合計値で各次元の値を割り、ベクトルを正規化してから結合を行ってもよい。
次に、図7のステップS403における色の特徴量の作成方法の詳細について、図8を用いて説明する。
(イ)まず、ステップS501において、画像処理サーバ1は、補正画像を視覚的に均等な空間である均等色空間(L*、a*、b*)で表現する。
(ロ)次に、ステップS502において、画像処理サーバ1は、均等色空間における各軸を独立に等間隔で量子化を行う。
(ハ)次に、ステップS503において、L*、a*、b*の量子化レベルの値の頻度を色の特徴量とする。例えば、L*、a*、b*の3軸の量子化レベルを8とした場合には、24(=3×8)次元の特徴量となる。
図9は、図7のステップS404における形状(構図)の特徴量の作成方法を示す。
(イ)まず、ステップS601において、補正画像を均等色空間(L*、a*、b*)で表現して、L*成分を取り出して、グレースケール画像にする。又、このとき、処理の高速化等のために必要に応じて、画像サイズを変更しても構わない。
(ロ)次に、ステップS604において、その画像の各ピクセルの値(輝度値)を構造の特徴量とする。例えば、120×120ピクセルのサイズの画像は14400(=120×120)次元の特徴量となる。
(ハ)また、ステップS602において、グレースケール画像にモルフォロジ処理や、ステップS603において、画像周波数の低い成分のみを残すローパス画像処理を施してから、その画像の各ピクセルの値(輝度値)を構造の特徴量としてもよい。画像をぼかす処理を加えることで、画像の変化があっても、より安定した判別性能が得られる。
(作用及び効果)
本実施形態に係る画像処理装置及び画像処理方法によると、色の特徴量及び形状の特徴量を結合した結合特徴量に基づいて、撮影対象を判別することができる。このため、照明条件の変化があっても撮影画像から撮影対象を正しく判別することができる。
又、本実施形態に係る画像処理装置及び画像処理方法によると、撮影画像に対してローパスフィルタ処理を施した後に、あるいは、撮影画像に対してモルフォロジ処理を施した後に、各ピクセルの輝度値を形状の特徴量として抽出することができる。このように、撮影画像をぼかす処理を加えることで、画像の変化があっても、より安定した判別性能を得ることができる。
又、本実施形態に係る画像処理装置及び画像処理方法によると、複数の撮影画像の結合特徴量それぞれに基づいて算出された複数の所定のパラメータを記憶する記憶し、所定のパラメータを用いることにより、撮影対象を判別することできる。このため、結合特徴量を用いて算出されたパラメータを用いて、撮影対象の判別を行うことができる。
又、本実施形態に係る画像処理装置及び画像処理方法によると、上述した式(1)を用いて、所定のパラメータを算出し、式(2)によって得られた判別値が最も大きい撮影画像を、撮影対象として認識することができる。このため、結合特徴量を用いて算出されたパラメータを用いて、判別値を算出し、撮影対象の判別を行うことができる。
(その他の実施の形態)
本発明は上記の実施の形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなろう。
例えば、実施形態に係る画像処理サーバ1は、通信手段11と、判別手段12と、特徴量抽出手段13と、登録手段14と、学習手段15をモジュールとしてCPUに内蔵する構成とすることができると説明したが、それらが二つあるいはそれ以上のCPUに分かれていても構わない。その際はそれらのCPU間でデータのやりとりが行えるようにバスなどで装置間を接続しているとする。
このように、本発明はここでは記載していない様々な実施の形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
本発明の実施の形態に係る画像処理システムの構成ブロック図である。 本発明の実施の形態に係る画像処理サーバの構成ブロック図である。 本発明の実施の形態に係る端末装置の構成ブロック図である。 本発明の実施の形態に係る登録処理を示すフローチャートである。 本発明の実施の形態に係る学習処理を示すフローチャートである。 本発明の実施の形態に係る判別処理を示すフローチャートである。 本発明の実施の形態に係る特徴量作成処理を示すフローチャートである。 図7のステップS403の詳細を示すフローチャートである。 図7のステップS404の詳細を示すフローチャートである。
符号の説明
1 画像処理サーバ
2 端末装置
11 通信手段
12 対象判別手段
13 特徴量抽出手段
14 登録手段
15 学習手段
16 演算装置
17 記憶装置
21 入力手段
22 通信手段
23 出力手段
24 撮影手段
25 測位手段
26 演算装置
27 記憶装置

Claims (5)

  1. 撮影画像に含まれる未知の撮影対象を判別する画像処理装置であって、
    前記撮影画像を構成する複数のピクセルについて、均等色空間を構成する複数の軸毎の値を複数の量子化レベルで量子化し、前記複数の量子化レベルのそれぞれにおいて前記複数の軸毎に量子化された値の頻度を色の特徴量として抽出する第1の特徴量抽出手段と、
    前記撮影画像を構成する複数のピクセルの輝度値を形状の特徴量として抽出する第2の特徴量抽出手段と、
    前記色の特徴量及び前記形状の特徴量を結合して、前記色の特徴量及び前記形状の特徴量の結合である結合特徴量を抽出する第3の特徴量抽出手段と、
    複数種類の既知の撮影対象に対応する前記結合特徴量と前記撮影画像に対応する前記結合特徴量との比較によって、前記未知の撮影対象が前記複数種類の既知の撮影対象のどれに属するかを順位付けて判別する判別手段とを備え、
    前記色の特徴量を構成するパラメータ数である次元数は、前記複数の量子化レベルの数と前記複数の軸の数との乗算結果であり、
    前記形状の特徴量を構成するパラメータ数である次元数は、前記複数のピクセルの数であり、
    前記結合特徴量を構成するパラメータ数である次元数は、前記色の特徴量の次元数と前記形状の特徴量の次元数との合計であり、
    前記複数種類の既知の撮影対象に対応する前記結合特徴量は、グルーピングされた撮影画像の学習によって構成されることを特徴とする画像処理装置。
  2. 前記第2の特徴量抽出手段は、前記撮影画像を構成する複数のピクセルの輝度値に対してローパスフィルタ処理を施した後に、前記ローパスフィルタ処理が施された輝度値を前記形状の特徴量として抽出することを特徴とする請求項1に記載の画像処理装置。
  3. 前記第2の特徴量抽出手段は、前記撮影画像を構成する複数のピクセルの輝度値に対してモルフォロジ処理を施した後に、前記モルフォロジ処理が施された輝度値を前記形状の特徴量として抽出することを特徴とする請求項1に記載の画像処理装置。
  4. lを前記複数種類の既知の撮影対象を識別する番号、N(l)をl番目の既知の撮影対象に対する複数の撮影画像の数、vを前記結合特徴量の次元を識別する番号、Vを前記結合特徴量の次元素、γ(l)を前記l番目の既知の撮影対象に対応するスムージング係数、x(l)を前記l番目の既知の撮影対象に対する前記複数の撮影画像に対応する前記結合特徴量、x’を前記未知の撮影対象が含まれる前記撮影画像に対応する前記結合特徴量とした場合に、
    前記l番目の既知の撮影対象に対応する前記結合特徴量θ(v,l)は、以下の式によって、算出され、
    Figure 0004769416
    前記未知の撮影対象が前記l番目の既知の撮影対象に属するかを順位付けるための判別値F(l)は、以下の式によって算出され、
    Figure 0004769416
    前記判別手段は、前記判別値F(l)に基づいて、前記未知の撮影対象が前記複数種類の既知の撮影対象のどれに属するかを順位付けて判別することを特徴とする請求項1乃至請求項3のいずれかに記載の画像処理装置。
  5. 撮影画像に含まれる未知の撮影対象を判別する画像処理方法であって、
    前記撮影画像を構成する複数のピクセルについて、均等色空間を構成する複数の軸毎の値を複数の量子化レベルで量子化し、前記複数の量子化レベルのそれぞれにおいて前記複数の軸毎に量子化された値の頻度を色の特徴量として抽出する第1の特徴量抽出ステップと、
    前記撮影画像を構成する複数のピクセルの輝度値を形状の特徴量として抽出する第2の特徴量抽出ステップと、
    前記色の特徴量及び前記形状の特徴量を結合して、前記色の特徴量及び前記形状の特徴量の結合である結合特徴量を抽出する第3の特徴量抽出ステップと、
    複数種類の既知の撮影対象に対応する前記結合特徴量と前記撮影画像に対応する前記結合特徴量との比較によって、、前記未知の撮影対象が前記複数種類の既知の撮影対象のどれに属するかを順位付けて判別する判別ステップとを備え、
    前記色の特徴量を構成するパラメータ数である次元数は、前記複数の量子化レベルの数と前記複数の軸の数との乗算結果であり、
    前記形状の特徴量を構成するパラメータ数である次元数は、前記複数のピクセルの数であり、
    前記結合特徴量を構成するパラメータ数である次元数は、前記色の特徴量の次元数と前記形状の特徴量の次元数との合計であり、
    前記複数種類の既知の撮影対象に対応する前記結合特徴量は、グルーピングされた撮影画像の学習によって構成されることを特徴とする画像処理方法。
JP2003403530A 2003-12-02 2003-12-02 画像処理装置及び画像処理方法 Expired - Fee Related JP4769416B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003403530A JP4769416B2 (ja) 2003-12-02 2003-12-02 画像処理装置及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003403530A JP4769416B2 (ja) 2003-12-02 2003-12-02 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2005165662A JP2005165662A (ja) 2005-06-23
JP4769416B2 true JP4769416B2 (ja) 2011-09-07

Family

ID=34726817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003403530A Expired - Fee Related JP4769416B2 (ja) 2003-12-02 2003-12-02 画像処理装置及び画像処理方法

Country Status (1)

Country Link
JP (1) JP4769416B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4741804B2 (ja) * 2004-02-25 2011-08-10 株式会社エヌ・ティ・ティ・ドコモ 画像処理装置及び画像処理方法
WO2010150383A1 (ja) * 2009-06-25 2010-12-29 株式会社東芝 認識装置
JP7511352B2 (ja) 2020-02-03 2024-07-05 キヤノン株式会社 情報処理システム、撮像装置及びその制御方法、プログラム

Also Published As

Publication number Publication date
JP2005165662A (ja) 2005-06-23

Similar Documents

Publication Publication Date Title
CN111052146B (zh) 用于主动学习的系统和方法
US10558851B2 (en) Image processing apparatus and method of generating face image
WO2021012484A1 (zh) 基于深度学习的目标跟踪方法、装置及计算机可读存储介质
KR100947990B1 (ko) 차영상 엔트로피를 이용한 시선 추적 장치 및 그 방법
JP6137916B2 (ja) 信号処理装置、信号処理方法、及び、信号処理システム
US7720851B2 (en) Active context-based concept fusion
US20210064859A1 (en) Image processing system, image processing method, and storage medium
CN111667001B (zh) 目标重识别方法、装置、计算机设备和存储介质
EP2701118B1 (en) Device and method for data processing of a tenprint card and a storage medium
CN112036295A (zh) 票据图像处理方法、装置、存储介质及电子设备
US20120052473A1 (en) Learning apparatus, learning method, and computer program product
CN116824203A (zh) 基于神经网络的青光眼的识别装置和识别方法
US8699788B2 (en) Introduction system, method of introduction, and introduction program
CN115205883A (zh) 基于ocr和nlp的资料审核方法、装置、设备、存储介质
JP2008067321A (ja) データ登録管理装置
JP6511950B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4769416B2 (ja) 画像処理装置及び画像処理方法
JP2015041293A (ja) 画像認識装置および画像認識方法
CN113593707B (zh) 胃早癌模型训练方法、装置、计算机设备及存储介质
JP4741804B2 (ja) 画像処理装置及び画像処理方法
JP6855175B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2022093466A (ja) 情報処理装置、情報処理システム、及びプログラム
JP4664047B2 (ja) 画像処理装置及び画像処理方法
CN113284199A (zh) 图像灰度区域确定方法、电子设备及服务器
WO2020261333A1 (ja) 学習装置、交通事象予測システム及び学習方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060424

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090907

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100108

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100120

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20100219

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110620

R150 Certificate of patent or registration of utility model

Ref document number: 4769416

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees