JP5188334B2 - 画像処理装置、画像処理方法およびプログラム - Google Patents

画像処理装置、画像処理方法およびプログラム Download PDF

Info

Publication number
JP5188334B2
JP5188334B2 JP2008226990A JP2008226990A JP5188334B2 JP 5188334 B2 JP5188334 B2 JP 5188334B2 JP 2008226990 A JP2008226990 A JP 2008226990A JP 2008226990 A JP2008226990 A JP 2008226990A JP 5188334 B2 JP5188334 B2 JP 5188334B2
Authority
JP
Japan
Prior art keywords
image
normalization
leveling
parameter
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008226990A
Other languages
English (en)
Other versions
JP2010062911A (ja
Inventor
昌弘 松下
弘隆 椎山
英智 相馬
浩一 馬養
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008226990A priority Critical patent/JP5188334B2/ja
Priority to US12/552,908 priority patent/US8515177B2/en
Publication of JP2010062911A publication Critical patent/JP2010062911A/ja
Application granted granted Critical
Publication of JP5188334B2 publication Critical patent/JP5188334B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20004Adaptive image processing
    • G06T2207/20012Locally adaptive

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像を正規化する処理をする画像処理装置、画像処理方法、およびプログラムに関する。
検索条件としての画像(以下、クエリ画像)とデータベースなどに記憶している画像(以下、記憶画像)の両方から、画像の色やエッジなどの特徴量を抽出し比較する事で類似画像を検索する方法がある。
従来、印刷やスキャンなどによって色や画質が変化した画像を検索したり、逆に色や画質に変化の生じた画像を用いて原本の画像を検索したりする際に、画像全体の画素値を参照して正規化を行っていた。例えば、画像から特徴量を抽出する前処理として、輝度成分の最大値や最小値を補正するものや、画像の色成分の少なくとも1つのダイナミックレンジ(最大値と最小値の比)を補正していた。このように正規化することで、色や画質に変化のあった画像でも定量的に扱えるようにしていた。
特許文献1には、白から黒までの連続する輝度を量子化し、量子化した各輝度の画素が画像中に均等な割合で出現するように正規化し、更に画像の濃淡に重み付けをして画像を検索する点が記載されている。
また、特許文献2には、画像の局所的な特徴量(局所特徴量)を使って類似画像を検索する点が記載されている。この方法では、DOG関数を用いて各画像から特徴的な点を選別し、選別した点に対応する特徴量を求め、この特徴量同士を比較している。
特開2007−012024号公報 特開平9−44665号公報
しかし、スキャンなどによって色や画質が変化した画像では、周囲の画素とは関係ない点のノイズ(スパイクノイズ、孤立点ノイズ、網点ノイズ)が発生する事が多い。このようなノイズを含む画素は輝度値が極端な値になる事が多く、特許文献1の技術を用いても良好な正規化を妨げてしまう事がある。
しかし一方で、点のノイズを鈍らせるフィルタを画像全体に作用させてから正規化すると、正規化した後に抽出する特徴量まで鈍くなってしまい検索精度や認識精度に影響を及ぼす事がある。
特に、特許文献2のように所定の特徴点における特徴量(以下、局所特徴量)を検索クエリとして、画像を認識・検索しようとする場合、画像全体を平準化すると局所特徴量の局所性が損なわれてしまう。
そこで、本発明では画像の輝度値や色値を正規化する際に、ノイズの影響を抑えた好適な正規化を実現する画像処理方法、画像処理装置およびプログラムを提供することを目的とする。
本発明に係る画像処理装置は、入力画像を受付ける受付け手段と、前記入力画像を平準化処理し、夫々が異なる平準化度合いで平準化されている複数の平準化画像を取得する平準化手段と、前記入力画像および前記平準化画像を含む画像群から特徴点を抽出する抽出手段と、前記特徴点を抽出した画像よりも平準化度合いの高い画像から正規化パラメータを取得するパラメータ取得手段と、前記特徴点が抽出された前記画像群の何れかの画像において前記特徴点に関する局所特徴量を算出する領域を含む領域の画素値を前記正規化パラメータに基づいて正規化する正規化手段とを有することを特徴とする。
本発明によってノイズの影響を抑えた正規化処理が可能になる。
また、本発明によって、算出する局所特徴量の局所性を維持したままノイズの影響を抑えることができるので、検索・認識精度が向上する。
<第1の実施形態>
図1は、本発明の一実施形態の画像処理装置である画像正規化装置100の機能ブロック図である。画像正規化装置100は、受付部102、平準化部103、パラメータ取得部104および正規化部105を有する。
図2は画像正規化装置100による画像正規化処理のフローチャートである。ステップS201において、受付部102が正規化対象の入力画像101を読み込む処理をする。
次に平準化部103がステップS202とステップS203において平準化処理をする。本実施形態では入力画像101の画素値の中でも輝度値に着目して正規化をするため、ステップS202において平準化部103は輝度成分を抽出する。更に、S203で縮小変換をして入力画像101を平準化する。縮小変換では、例えば画像を縦横50%に縮小する際には4画素の平均値を1画素として出力する。このような縮小変換をすることで、独立点や網点などの極端なノイズが軽減される。本実施形態では平準化画像として縮小画像を取得する。
ステップS204において縮小変換で取得した縮小画像から、画素値の正規化に用いる正規化パラメータを取得する。本実施形態では正規化パラメータとして縮小画像から最小輝度値と最大輝度値を取得する。ステップS205において正規化部105が正規化パラメータを用いて入力画像101の画素値の輝度分布を補正して正規化する。ステップS206において正規化部105が正規化した入力画像101を正規化画像106として出力する。
図3は画像中の画素の画素値の分布(ここでは輝度に関するヒストグラム・輝度分布)を示し、縦軸が所定の画素値を持つ画素の出現頻度で、横軸が画素値の大きさ(輝度)である。図3(a)が入力画像101の輝度分布、図3(b)が入力画像101を縮小して得られた縮小画像の輝度分布、図3(c)が正規化した輝度分布である。ここでは画素値が8bitで量子化されている場合を説明するので、取り得る画素値の最大値は255(破線301、302、303)である。
ここでは、入力画像101がスキャン画像であるとして説明する。電気的なスキャンで生じるノイズを含む画素は周囲の画素の画素値と無関係な値であることが一般的であり、特に画素値の小さいノイズ(黒点ノイズ)と大きいノイズ(白点ノイズ)は正規化処理に影響を及ぼす。
今、入力画像101がスキャン画像であって画像全体が実際よりも明るくなってしまったとすると、輝度分布は画素値の大きい方へそのままシフトすることが考えられる。しかし、図3(a)の箇所Aが示すように、黒点ノイズが入力画像101に出現すると、画像を正規化する際に妨げになる。図3(b)では縮小変換を行うことで画像全体が平準化されている。平準化処理を施すと、白点ノイズや黒点ノイズのように周囲の画素の画素値と無関係な値をもつ画素を特に平準化することができる。
図3(b)に示す、maxとminがそれぞれ縮小画像の最大輝度値と最小輝度値であってパラメータ取得部104の取得する正規化パラメータである。ノイズを除去した入力画像101の理想的な最大輝度値と最小輝度値に近い。
図3(c)では入力画像101の輝度分布のうち、図3(b)で取得した最大輝度値より大きい画素値をもつ画素を最大輝度値で、最小輝度値より小さい画素値をもつ画素を最小輝度値で置き換える。入力画像101の輝度分布が縮小画像の平均輝度(不図示)を基準として左右に拡大するように入力画像101の画素値を補正している。最小輝度値(min)と最大輝度値(max)と平均輝度(不図示)をそれぞれ基準値として入力画像を正規化している。この例では、最大輝度値が輝度値の上限へ先に到達したので最小輝度値が0とはなっていない。入力画像101が文書画像である等が分かっているなら最小輝度値と最大輝度値の両方へ到達するように補正してもよい。
このように第1の実施形態によると、入力画像101に対して縮小画像を生成し、縮小画像から正規化パラメータを取得することで、ノイズの影響を抑えつつ入力画像を正規化することが可能となる。
なお、平準化部103の平準化処理として縮小変換だけでなく、ガウシアンフィルタのような平準化フィルタを作用させて平準化画像に変換しても同様の効果を得ることができる。
また、輝度成分に限らず、色空間の1つの要素(色成分、チャンネル)に関して正規化してもよい。
<第2の実施形態>
〔特徴点と局所特徴量〕
まず、特徴量、特徴点および局所特徴量について説明する。画像を検索条件(クエリ画像)として指定して、類似する画像を検索する場合は2つの画像(クエリ画像とDBの画像)を比較することによって成される。一般的に画像検索をする場合、その画像の内容をよく表す数値や数列を特徴量として画像毎に算出する。そして、この特徴量が似ている画像を類似する画像として検索をする。特徴量として、画像の内容を示すキーワードを用いる事もあるが、本件では例えば色の配置情報などの、少なくとも画像の画素値から算出するものを含むものを特徴量とする。
色の配置情報を用いる検索では、画像を8×8画素の縮小画像に変換して、各画素の位置情報(0,0)〜(8,8)と出現する色を数値化したものとを関連付けて特徴量とする。
しかし、色の配置情報を用いて検索すると、部分的な検索には不向きである。例えば、特定のロゴを含む画像を検索しようとする際に、所定のロゴを含むが背景は異なる場合、所定のロゴの一部が障害物で隠れている場合、所定のロゴが拡大・縮小されている場合などは検索が困難である。
その際に、クエリ画像に含まれる局所的な特徴を用いる手法がある。
例えば、両者の対応を取り易い点を選び、更に画像間で点の対応をとる手法がある。この対応の取り易い点を特徴点(feature point)とする。特徴点はキーポイント(key point)や特異点(interest point)と表現されたり、エッジが尖ったところとして頂点(corner)と定義されたりすることもある。
本実施例では特徴点に関する局所的な特徴量を局所特徴量として、局所特徴量を用いる画像検索をする際の正規化処理を説明する。
[局所特徴量の登録処理]
以下、本実施形態における特徴点の抽出方法と局所特徴量の算出方法について具体的に説明する。
図4は本発明の一実施形態の画像処理装置である画像登録装置の機能ブロック図である。第1の実施形態と同一機能を有する構成や工程には同一符号を付すとともに、構成的、機能的にかわらないものについてはその説明を省略する。画像登録装置400は、受付部102、平準化部103、特徴点抽出部401、パラメータ取得部104、正規化部105、局所特徴量算出部402を有している。
図5は画像登録装置400による画像登録処理のフローチャートである。ステップS501〜S502は第1の実施形態の図2のステップS201〜S202と同様なので省略する。
ステップS503では平準化部103が入力画像101を縮小変換する。ここで、ステップS503の局所特徴量の算出に備えてn種類の解像度の縮小画像(n個の平準化画像)を生成する。具体的には、平準化部103は受付部102が取得した輝度成分を縮小率pに従ってn回、縮小処理を行う。(図11参照)。ここで、縮小率p及び縮小回数nは予め定められている。図11はn=8、p=2の−(1/4)乗の縮小変換処理を示している。ここでは、線形補間法より輝度成分の縮小画像を取得しているが、画像を縮小変換する処理方法であれば他の手法を用いてもよい。
ステップS504では特徴点抽出部401が縮小変換部で変換した縮小画像および入力画像101から特徴点を抽出する。
本実施形態では特徴点の候補の抽出にHarris作用素を用いることで、画像に回転変化があっても抽出される再現性のある(ロバストな)特徴点を抽出する。回転変化に対してロバストに抽出される特徴点とは、例えば画像を回転処理しても再び同じ画像内容(コーナやエッジ)から抽出されるような特徴点を意味する。
まず特徴点抽出部401が、入力画像101および平準化部103で平準化された画像に対してHarris作用素を作用させ、特徴点の候補を有する画素(候補画素)を取得する。Harris作用素などのコーナやエッジを抽出する方法はコーナ検出器として知られており、それらを用いてもよい。しかし、それらのコーナ検出器を作用させただけでは画像に変化があった場合に同じコーナ検出器を用いても抽出されなくなるような、再現性の低い特徴点を含んでいることがある。また、抽出される特徴点の候補が数百〜数千にも及び、検索や認識に用いようとすると計算処理負荷やデータ量が膨大になることもある。従って、ロバスト性の高い局所特徴点に絞り込むことで計算精度を高めつつ計算処理負荷や局所特徴量のデータ量を減らすことが可能になる。
まず、候補画素と候補画素を囲む近接の8画素の輝度値とを比較し、9画素の中で候補画素の輝度値(画素値)が最大で且つ所定値以上のものに絞る。この絞り込みにより、値の小さい不安定な点を候補から外す事が可能になる。
更に、候補画素を有する画像において輝度分布f(x,y)をラプラシアン関数E(x,y)に変換し、候補画素のラプラシアン値を算出する。そして算出したラプラシアン値を平準化方向で比較して、拡大・縮小変化にもロバストな特徴点に絞り込む。
本実施形態では式(1)をラプラシアン関数として用いる。
Figure 0005188334
ここで平準化方向とは図11に示すような多段階に縮小した際の縮小回数方向である。このような多段階に縮小した縮小画像において、同じ画像内容(コーナ、エッジ)から抽出される特徴点候補に着目する。今、i回縮小した特徴点候補に着目しこの点におけるラプラシアン値E(i)と、(i+1)回縮小した画像のラプラシアン値E(i+1)と、(i−1)回縮小した画像のラプラシアン値E(i−1)とを比較する。そしてE(i)が、E(i+1)およびE(i−1)以上である候補特徴点に絞る。
特徴点の絞り込み方法は種々の方法があり、この他の方法を用いる事も可能である。また、特徴点を抽出する画像が単純な画像であってコーナ検出器を作用させるだけで候補特徴点が適当な数や精度であれば、絞り込みを省略することも可能である。
次に、S505においてパラメータ取得部104が正規化パラメータを取得する。ステップS506において正規化部105が正規化パラメータに基づいて特徴点近傍の画素値を正規化する。
本実施形態では、平準化度合いの高い縮小画像からパラメータ取得部104が取得した正規化パラメータを用いて、正規化部105がこの特徴点を含む画素と特徴点近傍の画素値を正規化する。
本実施形態では、正規化パラメータとしてパラメータを取得する対象の領域に含まれる画素の画素値の最大値(最も明るい色の値・白色補正値)と、最小値(最も暗い色の値・黒色補正値)とを取得する。そして、正規化処理では、正規化する対象の領域に含まれる各画素の画素値について式(2)を用いて正規化処理を行う。
Figure 0005188334
ここで、hは正規化前の画素値であり、h’が正規化後の画素値である。また、bは黒色補正値であり、wは白色補正値である。また、v、v’、b、wはすべて0から1までの値であるとする。(実施形態1では0〜255)。
実施形態1のように輝度成分に限らず、色空間の1つの要素(色成分、チャンネル)に関して正規化してもよい。
ステップS507で局所特徴量算出部402が特徴点抽出部401で抽出した特徴点における局所特徴量を算出する。
局所特徴量は、特徴点を含む画素と近接する所定の領域に含まれる画素の画素値から算出する。
本実施形態では局所特徴量として式(3)のような、特徴点と特徴点近傍の領域の有する模様を数値化したLocal Jet及びそれらの導関数の組み合わせを用いる。
Figure 0005188334
V(x,y)は画像の中で座標(x,y)にある特徴点に関する局所特徴量である。
ただし、式(3)の右辺で用いている記号は、以下に示す式(4)〜(9)で定義される。ここで、式(4)右辺のG(x,y)はガウス関数、I(x,y)は画像の座標(x,y)における画素値であり、“*”は畳み込み演算を表す記号である。また、式(5)は式(4)で定義された変数Lのxに関する偏導関数、式(6)は当該変数Lのyに関する偏導関数である。式(7)は式(5)で定義された変数Lxのyに関する偏導関数、式(8)は式(5)で定義された変数Lxのxに関する偏導関数、式(9)は式(6)で定義されたLyのyに関する偏導関数である。
Figure 0005188334
ここで、G(x,y)はガウス関数であるので、通常は標準偏差σを変数として持つが、本実施形態ではσ=ar(aは定数)として予め定められる。ここでは局所特徴量を算出する際に参照する領域(模様を数値化する領域)は、着目している特徴点を中心とする半径rの部分領域に含まれる画素であるとする。この半径rは、ガウスフィルタによる重み付けがしきい値ε以上となる領域の縁に外接する円の半径と表現することもできる。
尚、特徴点を含む画素と特徴点近傍の画素の特徴を示す局所特徴量を算出可能な方法であれば、上述の方法以外でもよい。上述の局所特徴量は5つの要素から成るが、検索精度や局所特徴量のロバスト性が要求される場合は、要素の数が多い方が良いが、要素の数が増加すると計算負荷が高くなる。例えば、SIFT(要素100程度)やPCA−SIFT(要素2000程度)などの方式で求める局所特徴量は検索精度やロバスト性が高いが計算負荷が高くなる。
ステップS508で局所特徴量の算出処理が終わったかどうかを判定し、終わっている場合はステップS509に遷移する。ステップS509では画像登録装置400から、入力画像101又は縮小画像と局所特徴量とを関連付けて出力し画像特徴データベース403に登録する。また、入力画像101における座標に相当する情報とも関連付けておくことが好ましい。
[正規化パラメータの取得と正規化]
ここで、正規化パラメータの取得と正規化について更に詳細に説明する。図7は、正規化パラメータを取得する際のパラメータ取得部104の処理のフローチャートである。
まずステップS701で、パラメータ取得部104が特徴点抽出部401が抽出した特徴点ごとに、正規化パラメータを取得する縮小画像を決定する。
次にステップS702で、パラメータ取得部104が特徴点ごとに正規化パラメータを取得する領域を決定する。
ステップS703で、パラメータ取得部104が特徴点ごとに正規化パラメータを取得する。正規化パラメータの取得方法については実施形態1と同様である。
なお、特徴点ごとに正規化パラメータを取得する処理が負荷になるようであれば、特徴点の集合をいくつかのクラスに分類するクラスタリングを用いて、クラス毎に同じ正規化パラメータを用いても良い。クラスの分類は、平準化度合いで分けたり近い特徴点毎に分けたりする事が可能である。
図8は、ステップS503において平準化部103で生成した縮小画像に、ステップS504において特徴点抽出部401が抽出した特徴点を重ね合わせた図である。ここでは、それぞれ異なる解像度の4枚の縮小画像が生成された状態での画像の正規化処理について説明する。
SCは画像の縮小回数を表し、入力画像101がSC=0である。縮小回数がSC、縮小率がpのとき、縮小画像の大きさは入力画像(SC=0の画像)のpの(SC)乗となる。たとえば、縮小率pが2の−(1/4)乗、SC=4の縮小画像の大きさは、入力画像101に対して50%縮小した画像になる。
特徴点802は特徴点抽出部401でSC=1の縮小画像から抽出された特徴点の1つであり、縮小画像上での座標をN1(x2,y2)とする。特徴点803は特徴点抽出部401でスケール番号SC=3の縮小画像から抽出された特徴点の1つであり、当該縮小画像上での座標をN3(x3,y3)とする。特徴点804は特徴点抽出部401でスケール番号SC=4の縮小画像から抽出された特徴点の1つであり、当該縮小画像上での座標をN4(x4,y4)とする。
点805は、SC=1の縮小画像から抽出された特徴点802を、縮小回数SC=3の座標系に変換した場合に一致する点であり、点805の座標はN3(x2,y2)とする。点806は、SC=3の縮小画像から抽出された特徴点803を、縮小レベルSC=4の座標系に変換した場合に一致する点であり、点806の座標をN4(x3,y3)とする。
図8に基づいて、正規化する対象の特徴点が抽出された画像よりもさらに2回だけ縮小された画像を用いて正規化パラメータを取得し、局所特徴量を算出する処理を説明する。特徴点803は、特徴点803が抽出された縮小レベルSC=3の縮小画像から2回縮小している縮小画像が存在しない。従って、特徴点803の正規化パラメータはSC=4の縮小画像を用いて取得する。特徴点804は、特徴点804が抽出された縮小レベルSC=4よりも縮小した縮小画像が存在しないことから、SC=4の縮小画像を用いて正規化パラメータを取得する。
他にも、正規化パラメータを取得する対象の縮小画像として、対応する特徴点が抽出される縮小画像の中で、縮小回数の最も多い縮小画像を用いても良い。
次に、ステップS702で、パラメータ取得部104が正規化パラメータを取得する際に参照する領域を決定する。
図9は、ステップS304において特徴点抽出部401が抽出した特徴点802から正規化パラメータを取得する際に参照する領域を示す図である。本実施形態では正規化パラメータを取得する際に特徴点を中心とする円形の領域に含まれる画素を参照する。これは、回転変化があった場合の変動量を小さくするためである。
領域901は、特徴点802を中心とし、半径r1(不図示)の円形の領域である。半径r1は、あらかじめ定められた所定の値で決められる。領域902は、特徴点805を中心とし、半径r2の円形の領域である。ここで半径r2は、半径r1を縮小率pで2回縮小した大きさである。
次に、ステップS703で、パラメータ取得部104が特徴点を中心とする領域の含む画素から正規化パラメータを取得する。まず、ステップS702で決定した領域に含まれる画素の画素値(輝度値)をもとに、白色点を補正するための白色補正値および黒色点を補正するための黒色補正値を決定する。
正規化パラメータを取得する領域と正規化する対象の領域は座標変換した際に対応する領域(図9の領域901、902)である方が好適な正規化パラメータを取得できる。正規化パラメータを取得する領域の画像のうち正規化する対象の領域の画像に含まれない部分は、正規化の精度を下げる事があるからである。但し、正規化パラメータを取得する領域の決定をする処理が負荷になるならば、平準化画像の全体から取得することも考えられる。
更に、好ましくは、正規化をする対象の領域は局所特徴量を算出する領域に外接又は一致している方が良い。正規化をする対象の領域が局所特徴量を算出する領域より少し小さい場合、局所特徴量は正規化をされている領域と正規化をされていない領域が混在した領域から局所特徴量を算出されることになる。従って、正規化をする対象の領域は、局所特徴量を算出する領域を含んでいる事が好ましい。しかし、正規化をする対象の領域と局所特徴量を算出する領域は所定の特徴点に着目しており中心は一致している、従って正規化されていない領域は、局所特徴量を算出する領域の中でも特徴点から距離の遠い画素である。ここで、局所特徴量を算出する際に、前述した様にガウス関数を畳み込むことで特徴点に近い画素の画素値ほど重みが高く付けられた重み付け平均がされるので、正規化されていない領域の画素の影響は小さくなる。
一方で正規化をする対象の領域が局所特徴量を算出する領域よりも大きいと、正規化をするが局所特徴量の算出に関係ない部分は計算コストが増えるばかりである。
局所特徴量の種類によっては、局所特徴量を算出する領域は特徴点を中心とする正方形の領域の場合もある(PCA−SIFT)。
本実施形態では縮小率が高い縮小画像から正規化パラメータを取得した方が網点ノイズや孤立点ノイズの影響を低減することができる。一方で、局所特徴量の局所性を保ったまま正規化が可能であるため精度の良い局所特徴量を算出できる。
同様に、局所特徴量を求める際にガウシアンフィルタを作用させた回数を特徴量の算出領域の大きさとして用いる場合も、平準化部103でガウシアンフィルタを作用させて複数の平準化画像を生成するとよい。
本件のように、特徴点を絞り込みに用いる多重解像度の画像群と、正規化をして局所特徴量を求める際に用いる多重解像度の画像群とが一致していると、単純に処理を減らす事ができる。
<第3の実施形態>
図12は本発明の一実施形態の画像処理装置である画像検索装置の機能ブロック図である。第1、第2の実施形態と同一機能を有する構成や工程には同一符号を付すとともに、構成的、機能的にかわらないものについてはその説明を省略する。画像検索装置1200は、受付部102、平準化部103、特徴点抽出部401、パラメータ取得部104、正規化部105、局所特徴量算出部402、比較部1202を有している。
図13は画像検索装置1200による画像検索処理のフローチャートである。ステップS1301〜S1307は第2の実施形態のステップS501〜S507(図5)の処理と同様なので説明を省略する。
ステップS1308では、比較部1202が局所特徴量算出部402の算出した局所特徴量と画像特徴データベース403から取得した局所特徴量とを比較する。この比較処理は、画像特徴データベース403に登録されている画像毎に実施され、入力画像101との類似度を比較結果として算出する。類似度算出方法の詳細については後述する。
次に、ステップS1309で、比較部1202は、算出した類似度と当該類似度の算出元となった画像(画像特徴データベース403の画像)とを関連付ける。そして、類似度が高い順に画像のリストを検索結果1201として出力する。
[類似度算出方法]
類似度算出方法を説明するために、まず局所特徴量の比較方法を説明する。局所特徴量の式(3)に示す局所特徴量は5つの要素を持つ数列で示したが、要素が1つでも精度は落ちるが検索は可能である。複数以上の要素を持つ数列は多次元空間のベクトルであるので、2つのベクトルを比較して類似性の判断が可能である。例えば、本実施形態では比較する2つのベクトルの差分のベクトルの絶対値が小さい程類似度が高いと扱うが、2つのベクトル間の角度が小さい程類似度が高いとしてもよいし、それらを複合的に扱ってもよい。
次に、対応点について説明する。今、画像Aと画像を画像の中心点の周りに所定の角度だけ回転させた画像A’を含む画像Bがあるとする。そして、画像Aの各特徴点から算出した局所特徴量と画像Bの各特徴点から算出した局所特徴量を比較し、同じ画像内容(エッジやコーナ)から抽出された点同士を対応する点(以下、対応点)として選別する。この時、対応点を探すために局所特徴量を比較して、一番類似する点同士を対応点として選ぶ処理をする。しかし、こうして選ぶ対応点の中には誤った対応点を含む事がある。例えば、画像Aは画像Bの中の画像A’の中にしか対応点が無いはずだが、画像A’の外にも対応点があると処理をされる場合がある。基本的に対応点が多い程、類似する画像として検索するので、こうした誤った対応点は画像の検索・認識精度を下げる。
例えば、画像Aと画像Bの正しく対応する特徴点の座標は全て同じ変換行列で表す事ができるが、誤った対応点は異なる変換行列になる。そこで、誤った対応点を除きつつ類似度を算出していく処理が必要になる。
本実施形態ではRANSAC(RANdom SAmple Consensus)を使った類似度算出方法を説明する。比較を行う2つの画像からそれぞれ1点ずつの特徴点の対応候補をランダムに選択する。そして、その対応の妥当性を残りの特徴点の対応候補から評価し、評価値を算出する。これを所定の回数繰り返し、最も評価の良かった値を2つの画像の類似度とする。
まず、局所特徴量算出部402の算出した局所特徴量をVq1〜Vqnとする。そして、局所特徴量Vq1〜Vqnに関連付けされている特徴点Q1〜Qnの座標をQ1(x1’,y1’),・・・,Qn(xn’,yn’)とする。一方、画像特徴データベース403に登録されている画像に関連付けられている局所特徴量をVs1〜Vsmとして、局所特徴量Vs1〜Vsmに関連付けされている特徴点S1〜Smの座標をS1(x1,y1),・・・(xm,ym)とする。
図6は、類似度の算出手順を示すフローチャートである。まず、ステップS601で、最終投票数を表す変数VoteMaxを初期化する。次に、ステップS602で比較部1202は、n個の局所特徴量Vq1〜Vqnの1つとm個の局所特徴量Vsの1つとの差(距離)を全ての組み合わせについて計算する。詳細には、比較部1202は局所特徴量の差がしきい値Tv以下となり、かつ、Q1〜Qnのそれぞれの点について最小の差となるような組み合わせ(対応点)を抽出し、対応点リストとしてリストを作成する。
これ以降、対応点リストに登録されたk番目の対応点について、当該対応点の局所特徴量をそれぞれVq(k)とVs(k)と記載する。更にVq(k)とVs(k)に対応付けられている特徴点をそれぞれQk、Sk、座標をQk(x’k,y’k)、Sk(xk,yk)と記載する。またステップS602で作成した対応点リストに登録された対応点の組数をm組とする。
次に、ステップS603で、類似度算出処理の反復カウント数を表す変数Countを0に初期化する。次に、ステップS604で、反復カウント数Countが予め定められた最大反復処理回数Rnを超えていないことを判定する。ここで、超えている場合はステップS618へ進み、最終投票数VoteMaxを出力して、この処理を終了する。
また、ステップS604で、反復カウント数Countが最大反復処理回数Rnを超えていない場合はステップS605へ進み、投票数を表す変数Voteを0に初期化する。次に、ステップS606で、当該最短距離対応点リストから対応点の組の座標をランダムに2組抽出する。ここで、これらの座標をQ1(x’1,y’1)、S1(x1,y1)及びQ2(x’2,y’2)、S2(x2,y2)と記載する。次に、ステップS607で、抽出したQ1(x’1,y’1)、S1(x1,y1)及びQ2(x’2,y’2)、S2(x2,y2)が式(10)に示す変換を満たしていると仮定し、式(10)中の変数a〜fを求める。
ただし、図6に示すステップS607では、変数a〜dで構成される行列をMで示し、変数e〜fで構成される行列をTで示している。
Figure 0005188334
本実施形態では、簡略化のため、相似変換だけを考える。このとき、上記式(10)は以下の式(11)のように書き換えられる。
Figure 0005188334
このとき、変数a、b、e、fはx’1、y’1、x1、y1、x’2、y’2、x2、y2を使って式(12)から式(15)で表される。
Figure 0005188334
次に、ステップS608で、上述のステップS605で当該対応点リストからランダムに抽出された2組の点以外の点を選択するために、対応点選択変数kを3に初期化する。そして、ステップS609で、対応点選択変数kが当該対応点リストに登録されている対応点の組数mを超えていないかを判定する。ここで、超えている場合はステップS615へ処理を移すが、これについては後述する。ステップS609における判定で対応点選択変数kが当該対応点リストに登録されている対応点の組数mを超えていない場合はステップS610へ処理を移す。
このステップS610では、上述のステップS605で当該対応点リストからランダムに抽出した2組の点S1(x1,y1)及びS2(x2,y2)以外の点を当該対応点リストから抽出する。本実施形態では、抽出された点をSk(xk,yk)と記載する。
次に、ステップS611で、Sk(xk,yk)が式(11)を使って移される座標Sk’(x’k,y’k)を求める。
その後、ステップS612では、座標Sk’(x’k,y’k)と座標Qk(x’k,y’k)との幾何学的距離をユークリッド距離で計算し、当該ユークリッド距離がしきい値Td以下であるか否かを判定する。当該ユークリッド距離がしきい値Td以下の場合はステップS613へ進み、投票数Voteをインクリメントし、ステップS614へ処理を移す。また、当該ユークリッド距離がしきい値Tdより大きい場合は、何もせずにステップS614へ処理を移す。
このステップS614では、対応点選択変数kをインクリメントし、ステップS609に戻り、対応点選択変数kが当該対応点リストに登録されている対応点の組数mを超えるまで、上述の処理を繰り返す。
次に、ステップS609で、対応点選択変数kが当該対応点リストに登録されている対応点の組数mを超えた場合の処理であるステップS615を説明する。ステップS615では、投票数Voteの値と最終投票数VoteMaxの値とを比較し、投票数Voteの値が最終投票数VoteMaxの値よりも大きい場合にはステップS616へ処理を移す。
このステップS616では、最終投票数VoteMaxの値を投票数Voteの値で置き換えた後、ステップS617で反復カウント数Countをインクリメントし、上述のステップS604に処理を戻す。
また、ステップS615で、投票数Voteの値が最終投票数VoteMaxの値以下の場合にはステップS617へ処理を移し、反復カウント数Countをインクリメントし、上述のステップS604に処理を戻す。
なお、本実施形態における類似度の算出方法の説明では、相似変換だけを考えて説明したが、アフィン変換などその他の幾何学変換についても、ステップS607でそれぞれに応じた変換行列を求めることにより、対応可能である。例えば、アフィン変換の場合には、まずステップS606で、ランダムに選択する対応点の組の座標数を3とする。次に、ステップS607で、式(11)ではなく式(10)を使うこととし、ステップS606で選択した3組の対応点(合計6点)を使って変数a〜fを求めれば良い。
また、本実施形態における類似度の算出方法の説明では、ステップS618で類似度として最終投票数VoteMaxを出力する方法を説明したが、本発明はこれに限らず、他の類似度を計算するようにしても良い。即ち、ステップS603以降の処理を行わずに、ステップS602で作成された対応点リストに登録された対応点の組数mを類似度として出力するようにする。これにより、一定の検索精度を保ちつつ、検索速度を向上させることが可能になる。
以上の説明から明らかなように、本実施形態の画像検索装置では、平準化画像(縮小画像)から抽出した正規化パラメータ(画素値の最小値又は最大値)を用いて、特徴点を抽出する領域の画素値を補正することによって、画像の正規化を行う。
したがって、画質の劣化、色味の変化に耐性のある、局所特徴量を使った画像検索・認識技術に応用できる。たとえば検索システム、特徴点照合システム、ステレオマッチングシステム、認識システム、コーデックシステムなどが挙げられる。
前述の実施形態では、白色補正値と黒色補正値を置換することで正規化をおこなったが、輝度値のヒストグラムを作成してヒストグラムを平滑化する処理を行ってもよい。
図10は、図(a)は平準化前のヒストグラムを示し、(b)は理想的なヒストグラムを示し、(c)は平準化処理後の輝度値のヒストグラムを示している。
前述の実施形態では、画像の正規化を行う際、画素値として輝度値を用いている。しかしながら、この方法に限定するものではなく、カラー画像における各チャネルの値を用いて、画像の色空間における各チャネルのダイナミックレンジ(最小値と最大値の比率)を補正するようにしてもよい。例えば、RGB色空間であれば、R、G、Bの各値を用いてもよいし、L*a*b*色空間であれば、L*、a*、b*の各要素の値を用いてもよい。
なお、前述の実施形態では画素の集合で定義されるラスターイメージを用いているが、色の変化のしかたを数値化したベクターイメージにおいても本発明を適用可能である。
本発明は前述した実施形態の機能をコンピュータに実現させるプログラムを記憶した記憶媒体を、システム或いは装置に供給することによって実現しても良い。また、複数のハードウェアとソフトウェアの協同によって前述の実施形態の処理を実行させることによって実現してもよい。
例えば、図14に示す様にROM1430の中に前記実施形態で挙げたフローチャートの処理をCPU1410に実現させるプログラムを格納しておく。そして、プログラムを実行させる際にROM1430のプログラムをRAM1420に読出しCPU1410が処理できるようにする。ここで、1450はバスであり、ROM1430、RAM1420、CPU1410およびHDDのデータをやりとりする。
この記憶媒体として、例えばフレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
また、プログラムコードをCPU(中央処理装置)が読み出し、CPUが、コンピュータ上で稼働しているOS(オペレーティングシステム)の機能を使って前述の処理を行ってもよい。
第1の実施形態の画像正規化装置の機能ブロック図である。 正規化処理についてのフローチャートである。 正規化パラメータと正規化処理について説明する輝度分布図である。 第2の実施形態の画像登録装置の機能ブロック図である。 画像登録処理についてのフローチャートである。 RANSACを用いた対応点を選別する処理のフローチャートである。 正規化パラメータの取得処理を示すフローチャートである。 正規化パラメータの取得処理を示す図である。 正規化パラメータの取得処理の詳細を示す図である。 ヒストグラムの平滑化を示す図である。 複数種類の解像度の縮小画像についての図である。 第3の実施形態の画像検索装置の機能ブロック図である。 画像検索処理についてのフローチャートである。 概略ハード構成を示すブロック図である。
符号の説明
100 画像正規化装置
101 入力画像
102 受付部
103 平準化部
104 パラメータ取得部
105 正規化部
400 画像登録装置
401 特徴点抽出部
402 局所特徴量算出部
403 特徴量データベース
1200 画像検索装置
1202 特徴比較部

Claims (15)

  1. 入力画像を受付ける受付け手段と、
    前記入力画像を平準化処理し、夫々が異なる平準化度合いで平準化されている複数の平準化画像を取得する平準化手段と、
    前記入力画像および前記平準化画像を含む画像群から特徴点を抽出する抽出手段と、
    前記特徴点を抽出した画像よりも平準化度合いの高い画像から正規化パラメータを取得するパラメータ取得手段と、
    前記特徴点が抽出された前記画像群の何れかの画像において前記特徴点に関する局所特徴量を算出する領域を含む領域の画素値を前記正規化パラメータに基づいて正規化する正規化手段と
    を有することを特徴とする画像処理装置。
  2. 前記抽出手段は前記入力画像および平準化画像から複数の特徴点を抽出し、前記パラメータ取得手段は前記特徴点毎に正規化パラメータを取得し、前記正規化手段は前記特徴点毎に当該特徴点に関する局所特徴量を算出する領域を含む領域の画素値を正規化することを特徴とする請求項に記載の画像処理装置。
  3. 前記正規化手段により正規化された画素値を用いて、前記抽出された特徴点に関する局所特徴量を算出する算出手段を更に有することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記算出手段の算出した局所特徴量と、局所特徴量を算出した画像を特定する情報とを関連付けて記憶する記憶手段と、
    前記入力画像から算出した局所特徴量と前記記憶手段が記憶している局所特徴量とを比較する比較手段と
    を更に有する請求項に記載の画像処理装置。
  5. 前記比較手段が、前記入力画像と前記記憶手段が記憶している画像とを比較し、前記入力画像と前記記憶手段が記憶している画像の類似度を算出することで、前記入力画像に類似する画像を前記記憶手段が記憶している画像の中から検索することを特徴とする請求項に記載の画像処理装置。
  6. 前記正規化手段が、前記特徴点を中心とする円形の領域に含まれる画素を正規化することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  7. 前記平準化手段が前記入力画像を縮小変換し、平準化画像として縮小画像を取得することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  8. 前記平準化手段が前記入力画像に平準化フィルタを作用させることによって、平準化画像を取得することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  9. 前記パラメータ取得手段が、前記正規化パラメータを取得する対象の画像の前記特徴点に関する局所特徴量を算出する領域に対応する領域が含む画素から前記正規化パラメータを取得することを特徴とする請求項1乃至8のいずれか1項に記載の画像処理装置。
  10. 前記パラメータ取得手段が、前記正規化パラメータを取得する対象の前記特徴点が抽出された画像の位置を座標変換すると一致する位置に特徴点が抽出されている、前記特徴点を抽出した画像よりも平準化度合いの高い画像から正規化パラメータを取得することを特徴とする請求項1乃至8のいずれか1項に記載の画像処理装置。
  11. 前記画素値は輝度値であって、前記パラメータ取得手段は正規化パラメータとして、輝度値の基準値を取得し、前記正規化手段は該基準値に基づいて正規化の対象の画素の輝度値を補正することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  12. 前記画素値は色空間の色成分に関する数値であって、前記パラメータ取得手段が正規化パラメータとして少なくとも1つのチャンネルの基準値を取得し、前記正規化手段は該基準値に基づいて正規化の対象の画素の色空間の色成分に関する数値を補正することを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  13. 前記正規化手段が、正規化の対象の画素の画素値のヒストグラムを平滑化することを特徴とする請求項1乃至11のいずれか1項に記載の画像処理装置。
  14. 受付け手段と、平準化手段と、抽出手段と、パラメータ取得手段と、正規化手段とを有する画像処理装置における画像処理方法であって、
    前記受付け手段が、入力画像を受付ける受付け工程と、
    前記平準化手段が、前記入力画像を平準化処理し、夫々が異なる平準化度合いで平準化されている複数の平準化画像を取得する平準化工程と、
    前記抽出手段が、前記入力画像および前記平準化画像を含む画像群から特徴点を抽出する抽出工程と、
    前記パラメータ取得手段が、前記特徴点を抽出した画像よりも平準化度合いの高い画像から正規化パラメータを取得するパラメータ取得工程と、
    前記正規化手段が、前記特徴点が抽出された前記画像群の何れかの画像において前記特徴点に関する局所特徴量を抽出する領域を含む領域の画素値を前記正規化パラメータに基づいて正規化する正規化工程と
    を有することを特徴とする画像処理方法。
  15. コンピュータに、
    入力画像を受付ける受付け工程と、
    前記入力画像を平準化処理し、夫々が異なる平準化度合いで平準化されている複数の平準化画像を取得する平準化工程と、
    前記入力画像および前記平準化画像を含む画像群から特徴点を抽出する抽出工程と、
    前記特徴点を抽出した画像よりも平準化度合いの高い画像から正規化パラメータを取得するパラメータ取得工程と、
    前記特徴点が抽出された前記画像群の何れかの画像において前記特徴点に関する局所特徴量を抽出する領域を含む領域の画素値を前記正規化パラメータに基づいて正規化する正規化工程と
    を実行させることを特徴とするプログラム。
JP2008226990A 2008-09-04 2008-09-04 画像処理装置、画像処理方法およびプログラム Expired - Fee Related JP5188334B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008226990A JP5188334B2 (ja) 2008-09-04 2008-09-04 画像処理装置、画像処理方法およびプログラム
US12/552,908 US8515177B2 (en) 2008-09-04 2009-09-02 Image processing apparatus, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008226990A JP5188334B2 (ja) 2008-09-04 2008-09-04 画像処理装置、画像処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2010062911A JP2010062911A (ja) 2010-03-18
JP5188334B2 true JP5188334B2 (ja) 2013-04-24

Family

ID=41725543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008226990A Expired - Fee Related JP5188334B2 (ja) 2008-09-04 2008-09-04 画像処理装置、画像処理方法およびプログラム

Country Status (2)

Country Link
US (1) US8515177B2 (ja)
JP (1) JP5188334B2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8737746B2 (en) 2011-01-31 2014-05-27 Bluebeam Software, Inc. Method for multiple pass symbol and components-based visual object searching of documents
JP2012202942A (ja) * 2011-03-28 2012-10-22 Casio Comput Co Ltd 三次元モデリング装置、三次元モデリング方法、ならびに、プログラム
JP5092037B1 (ja) * 2011-05-16 2012-12-05 株式会社東芝 探索省略領域設定関数生成方法、探索省略領域設定方法、オブジェクト探索方法、探索省略領域設定関数生成装置、探索省略領域設定装置、及びオブジェクト探索装置
US8873865B2 (en) 2011-10-10 2014-10-28 Qualcomm Incorporated Algorithm for FAST corner detection
US10242650B2 (en) 2011-12-06 2019-03-26 Dolby Laboratories Licensing Corporation Perceptual luminance nonlinearity-based image data exchange across different display capabilities
DK3079055T3 (da) * 2011-12-06 2019-06-03 Dolby Laboratories Licensing Corp Indretning og fremgangsmåde til at forbedre den perceptuelle luminans ikke-lineæritetsbaserede billeddataudveksling på tværs af forskellige displayegenskaber
JP2014017808A (ja) * 2012-06-12 2014-01-30 Seiko Epson Corp 表示システム、表示プログラム及び表示方法
KR20140008746A (ko) * 2012-07-11 2014-01-22 삼성전자주식회사 움직이는 장기에 초음파를 조사하여 장기 특정 부위의 온도 변화를 나타내는 온도 맵을 생성하는 방법 및 초음파 시스템
JP6056319B2 (ja) * 2012-09-21 2017-01-11 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP6390847B2 (ja) * 2012-11-13 2018-09-19 日本電気株式会社 画像処理装置、画像処理方法及びプログラム
US10395166B2 (en) * 2013-09-04 2019-08-27 Lockheed Martin Corporation Simulated infrared material combination using neural network
JP6233842B2 (ja) * 2014-02-14 2017-11-22 Kddi株式会社 情報端末装置、方法及びプログラム
EP2963908B1 (en) * 2014-07-01 2020-10-28 Canon Kabushiki Kaisha Image processing apparatus, image processing method and storage medium
CN109767379B (zh) * 2018-12-12 2023-06-23 东软集团股份有限公司 数据归一化的处理方法、装置、存储介质和电子设备
CN109859125B (zh) * 2019-01-14 2022-10-21 广东工业大学 基于形态学检测与小波变换的图像高光修复方法
WO2020174588A1 (ja) * 2019-02-26 2020-09-03 株式会社ソシオネクスト 情報処理装置および情報処理方法
WO2021033021A1 (en) * 2019-08-19 2021-02-25 Atul Kailash Shrivastava System and method for associating identifiers to real-world objects
JP7336653B2 (ja) * 2020-10-26 2023-09-01 3アイ インコーポレイテッド ディープラーニングを利用した屋内位置測位方法
CN112966620A (zh) * 2021-03-15 2021-06-15 北京鹰瞳科技发展股份有限公司 眼底图像处理方法、模型训练方法及设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2735043B2 (ja) 1995-08-01 1998-04-02 日本電気株式会社 印影位置合わせ方法と印影位置合わせ装置
US6975755B1 (en) * 1999-11-25 2005-12-13 Canon Kabushiki Kaisha Image processing method and apparatus
JP4492036B2 (ja) * 2003-04-28 2010-06-30 ソニー株式会社 画像認識装置及び方法、並びにロボット装置
JP2006094000A (ja) * 2004-09-22 2006-04-06 Konica Minolta Photo Imaging Inc 画像処理方法、画像処理装置及び画像処理プログラム
JP2006268825A (ja) * 2005-02-28 2006-10-05 Toshiba Corp オブジェクト検出装置、学習装置、オブジェクト検出システム、方法、およびプログラム
JP4968882B2 (ja) * 2005-06-03 2012-07-04 キヤノン株式会社 画像検索装置、画像検索方法およびプログラム
JP4628882B2 (ja) * 2005-06-16 2011-02-09 富士フイルム株式会社 判別器の学習方法、顔判別方法および装置並びにプログラム
JP2007148819A (ja) * 2005-11-28 2007-06-14 Sony Corp 画像処理方法、その装置およびプログラム
JP4196302B2 (ja) * 2006-06-19 2008-12-17 ソニー株式会社 情報処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
US20100054593A1 (en) 2010-03-04
JP2010062911A (ja) 2010-03-18
US8515177B2 (en) 2013-08-20

Similar Documents

Publication Publication Date Title
JP5188334B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP4989308B2 (ja) 画像処理装置及び画像検索方法
JP6431302B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4613617B2 (ja) 画像処理システム、学習装置および方法、並びにプログラム
CN108596197B (zh) 一种印章匹配方法及装置
CN111242221B (zh) 基于图匹配的图像匹配方法、系统及存储介质
CN110298376B (zh) 一种基于改进b-cnn的银行票据图像分类方法
TW201437925A (zh) 物體識別裝置、方法及電腦程式產品
JP4772819B2 (ja) 画像検索装置および画像検索方法
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
KR20170108339A (ko) 영상에서 다수의 객체를 인식하는 방법
JP6919758B2 (ja) 画像照合装置
Van Beusekom et al. Automated ocr ground truth generation
JP4885112B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
US7508986B2 (en) Document recognition device, document recognition method and program, and storage medium
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
JP4612477B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体
US8938118B1 (en) Method of neighbor embedding for OCR enhancement
Shirazi et al. Persian logo recognition using local binary patterns
CN111695377B (zh) 一种文本检测方法、装置和计算机设备
KR101937859B1 (ko) 360도 이미지에서의 공통 객체 탐색 시스템 및 방법
JP2009259190A (ja) 文字認識プログラムおよび文字認識装置
CN110781812A (zh) 一种基于机器学习的安检仪自动识别目标物体的方法
CN113077390B (zh) 一种基于深度学习的图像摆正方法
JP2017138742A (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110629

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5188334

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees