JP2011501257A - 拡張画像識別 - Google Patents

拡張画像識別 Download PDF

Info

Publication number
JP2011501257A
JP2011501257A JP2010528467A JP2010528467A JP2011501257A JP 2011501257 A JP2011501257 A JP 2011501257A JP 2010528467 A JP2010528467 A JP 2010528467A JP 2010528467 A JP2010528467 A JP 2010528467A JP 2011501257 A JP2011501257 A JP 2011501257A
Authority
JP
Japan
Prior art keywords
image
parameter
representation
deriving
dimensional representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010528467A
Other languages
English (en)
Other versions
JP5261493B2 (ja
Inventor
ブラスネット、ポール
ボバー、ミロスロー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2011501257A publication Critical patent/JP2011501257A/ja
Application granted granted Critical
Publication of JP5261493B2 publication Critical patent/JP5261493B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/48Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation

Abstract

画像の表現を導出する方法を説明する。この方法は、画像に対応する信号を処理することを含む。画像の3次元表現が導出される。画像の3次元表現は、画像の表現を導出するのに使用される。1つの実施の形態では、画像の各線は第1のパラメータ(d)と第2のパラメータ(θ)によって定義され、各線上の位置は第3のパラメータ(t)によって定義される。これらの第1のパラメータ、第2のパラメータ、及び第3のパラメータによって3次元表現がパラメータ化される。第1のパラメータの或る値において3次元表現から値の集合を抽出し、抽出値の集合における線又は線の一部に沿って汎関数を適用する。それらの線は第2のパラメータ又は第3のパラメータの値に沿って延在する。

Description

本発明は、画像を表現する方法及び装置、並びに、例えば検索又は検証のために画像を比較又は照合する方法及び装置に関する。
本発明は、画像のトレース変換から特徴を抽出する新たな方法に関する。この方法は、同時係属中の欧州特許出願第06255239.3号、同時係属中の英国特許出願第0700468.2号、及び英国特許出願第0712388.8号に記載の画像識別方法及び画像識別装置に対する改善を提供する。欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号の内容は参照により本明細書に援用され、それらの特許文献に記載されているそれらの発明の詳細及び実施の形態は、本発明及び本発明の実施の形態にも同様に適用される。
欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号に記載されている画像識別方法及び画像識別装置のそれぞれは、画像から短いバイナリ記述子を抽出し(図2を参照)、従来技術の多くの欠点に対処し、特に以下によって特徴付けられる:
・特徴抽出及び特徴マッチングの双方の計算複雑度の低減
・画像記述子サイズの低減
・様々な画像の変更に対するロバスト性の増加、
・広範囲にわたる画像の変更に関して通常99.8%の検出率(detection rate)を維持しながら、誤検出率(false alarm rate)を0.1ppmレベルへ低減
しかしながら、実際の用途では、誤検出率が0.1ppm未満であり且つ検出率が99.8%以上に維持されることが望ましい。また、この性能レベルを、複雑な画像の変更を含む、より困難な試験条件下で維持することが望ましい。
第1の態様によれば、本発明は、添付の請求項1又は請求項21において定義される、画像の表現(representation of an image)を導出する方法を提供する。
第2の態様によれば、本発明は、本発明の第1の態様に従って導出された画像の表現を比較することによって、例えば画像マッチングのために画像を比較する方法を提供する。
本発明の他の態様は、本発明の第1の態様に従って導出された画像表現の使用、本発明の第1の態様及び/又は第2の態様による方法を実行するための装置及びコンピュータプログラムを含む。
本発明は、画像のトレース変換(又は等価な画像の2次元関数)から特徴を抽出する新たな方法に関する。この技術分野において既知のように、トレース変換は、全ての可能な線を画像上に射影し、この表現は、欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号において開示されている技法において使用される。
説明される本発明の実施の形態は、画像から円形情報(circular information)を抽出することによって従来技術による研究を拡張する。この円形情報は、トレース変換を行うのと同時に非常に効率的に抽出することができる。
欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号では、トレース変換は、画像を直線でトレースすることによって計算され、この直線に沿って画像強度又はカラー関数の特定の汎関数Tが計算される。汎関数は、通常は関数のベクトル空間V上の実数値関数である。トレース変換の場合、画像領域における線にトレース汎関数が適用される。異なる複数の汎関数Tを使用して、所与の入力画像から異なる複数のトレース変換を作成する。2D平面において、線は角θ及び距離dという2つのパラメータによって特徴付けられる。そのため、画像のトレース変換は、各トレース線のパラメータの2D関数となる。次に、トレース変換の距離パラメータに沿ってダイアメトリック汎関数(diametrical functional)Pを適用することによって、サーカス関数(circus function)が計算される。
欧州特許出願第06255239.3号では、(例えばフーリエ変換によって)サーカス関数の周波数表現を計算し、周波数振幅成分に対して定義された特定の関数(例えば、関数は任意の2つの隣り合う周波数振幅の大きさの差分とすることができる)の符号を取ることによって、成分バイナリ識別子(component binary identifier)が構築される。
英国特許出願第0700468.2号では、画像はストリップ及び/又は二重円錐を用いてさらにトレースされる。異なる幅のストリップ及び/又は異なる開口角の円錐を使用することによって、トレース変換のマルチ解像度表現、すなわちサーカス関数が得られる。欧州特許出願第06255239.3号のように、各サーカス関数からバイナリ識別子が抽出される。英国特許出願第0712388.8号では、トレース領域における空間的に制限された領域(バンド)を使用してサーカス関数を計算し、これらの空間的に制限された領域は画像領域における円錐に対応する。ここでもまた、周波数表現を計算することによって成分バイナリ識別子が構築される。この識別子は、異なる複数の汎関数を使用することによって得られる成分識別子の「族」から選択されたストリングフラグメント(string fragment)を、ストリップ及び/若しくは二重円錐と、並びに/又は空間的に制限された異なる複数のバンドと組み合わせて単一の記述子にすることによって得られる。
本発明の実施形態を添付の図面を参照して説明する。
図1aは、画像を示す図である。図1bは、図1aの画像を縮小したバージョンを示す図である。図1cは、図1aの画像を回転させたバージョンを示す図である。図1dは、図1aの画像をぼかしたバージョンを示す図である。図1eは、図1aの画像を(左右に)反転させたバージョンを示す図である。図1fは、図1aの画像を高圧縮したバージョンを示す図である。図1gは、図1aの画像をクロップしたバージョンを示す図である。 従来技術による、画像とそのビット列表現を示す図である。 バイナリ識別子の抽出を示す図である。 トレース変換の線パラメータ化を示す図である。 本明細書では「トレースキューブ」と呼ばれる、角θ、距離d、及び線上の位置tに関する画像の3D表現を示す図である。 トレースキューブから画像領域における円形情報に等価な情報を抽出する方法を示す図である。θの線に沿って汎関数を適用することによって画像領域における円に関する情報を取得し、1Dトレース円形関数は、円の半径に対応する線の上の位置tに関する。 トレースキューブから取得することができるさらなる円形情報を示す図である。線位置t上の区間に沿って汎関数を適用することによって、画像領域における円形バンドに関する情報を得ることができる。 本発明の実施形態による装置のブロック図である。
画像の表現(representation of an image)、具体的には画像識別子(image identifier)を導出し、そのような表現/識別子を、例えば1つ又は複数の画像の識別、マッチング、或いは検証のために使用する様々な実施形態を以下に説明する。本発明は、画像を識別するために特に有用であるが、画像の識別に限定されるものではない。説明する実施形態において、「画像識別子」(又は単純に「識別子」)は画像の表現の一例であり、この用語は単に画像の表現又は記述子を表すのに使用される。
当業者であれば、本発明の実施形態による画像識別装置及び画像識別方法の具体的設計の詳細、並びに、画像識別において使用するための画像識別子の導出は、ロバストであるべき画像変更の種類、識別子の大きさ、抽出及びマッチングの複雑度、目標誤検出率等に関連する要件によって決まることを理解するであろう。
実施形態において、本発明は、(i)トレース変換の3次元への拡張(本明細書において「トレースキューブ」と呼ばれる)と、(ii)効率的な円形画像特徴の新たなクラスと、(iii)トレースキューブからの特徴抽出の方法と、(iv)特徴マッチングの方法とを含む。本発明の1つの態様によれば、画像のトレース変換を行うとき、トレース変換において従来から使用されるパラメータd、θに加えて、トレース線に沿った位置を表す追加のパラメータtを導入することによって、画像の3D表現が得られる。本発明の別の態様によれば、3次元構造からスライスが切り取られ、中間表現、すなわち3次元構造から抽出された値の集合を生成する。本発明のさらなる態様によれば、d=0においてスライスが切り取られ、2種類の円形情報(circular information)が抽出されて識別子を作成するのに使用される。
以下の例では、画像に対する以下の変更に対してロバストな識別子をもたらす一般的設計を示す(これは網羅的なリストではない)。
・減色
・ぼかし
・輝度値変更
・反転(左右及び上下)
・グレースケール変換
・ヒストグラム等化
・JPEG圧縮
・ノイズ
・回転
・クロップ
・スケーリング
この一般的設計は、広範な画像に対して0.05ppm(百万分率)未満という非常に低い誤検出率を達成することができ、検出率は通常、99.7%を超えることがわかっている。
図1は、画像とその画像の変更バージョンの一例を示す。より具体的には、図1aは原画像であり、図1bは図1aの画像を縮小したバージョンであり、図1cは図1aの画像を回転させたバージョンであり、図1dは図1aの画像をぼかしたバージョンであり、図1eは図1aの画像を反転させたバージョンであり、図1fは図1aの画像を圧縮したバージョンであり、図1gは図1aの画像をクロップしたバージョンである。
本発明の実施形態は、画像の表現を導出する。より具体的には、画像に対応する信号を処理することによって画像識別子を導出する。
抽出の初期段階において、画像はサイズ変更及びフィルタリングによって任意選択で前処理される。サイズ変更ステップは、画像を処理前に正規化するために使用される。フィルタリングステップは、エイリアシング等の効果を除去するためのフィルタリングを含むことができ、また領域選択及びテーパリングも含むことができる。好ましい実施形態では、画像は192×N又はN×192の解像度にサイズ変更される。ここで、N≧192であり、画像の縦横比を維持する。別の実施形態では、画像は192×192の正方形にサイズ変更される。次に、画像は3×3のガウスカーネルを使用してローパスフィルタリングされ、さらなる処理のために画像の中心から円形領域が抽出される。いくつかの変換においては、円形中心領域を抽出するときにテーパリングされたエッジを使用することによって性能が改善される。好ましい実施形態では、7ピクセルのテーパサイズを使用する。前処理ステップは任意選択であり、上記のものの任意の組み合わせを含むことができる。代替的な値、例えば異なる画像変更サイズや、異なるガウスカーネルサイズを使用することもできる。
トレース変換は、全ての可能な線を画像に射影し、これらの線に汎関数を適用する。汎関数は、通常は関数のベクトル空間V上の実数値関数である。トレース変換の場合、画像領域における線にトレース汎関数が適用される。図4に示されるように、線は、距離d、角θ、及び線上の位置tによってパラメータ化される。トレース変換の列にさらなる汎関数を適用して、実数値ベクトルを得ることができる。この第2の汎関数はダイアメトリック汎関数として知られ、結果として得られるベクトルはサーカス関数として知られている。第3の汎関数であるサーカス汎関数(circus functional)をサーカス関数に適用して、単一の数を得ることができる。この結果の特性は、3つの異なる汎関数(トレース汎関数、ダイアメトリック汎関数、及びサーカス汎関数)を適切に選択することによって制御することができる。画像及び対応するトレース変換の例を含むトレース変換の全詳細は、例えば参照として本明細書中に援用される下記の参考文献[1]に見ることができる。
トレース変換は画像から線を抽出することに関するものであるが、トレース変換の概念及びトレース変換の抽出プロセスを、画像から或る円形情報(circular information)を効率的に抽出することに拡張することができる。本発明によれば、図5に示すように、パラメータd、θ、及びtに関する画像の3D表現が生成される。この新たな表現は3Dボリュームであり、本明細書において「トレースキューブ」と呼ばれる。トレースキューブは従来のトレース変換よりもはるかに多くの情報を保有し、円又は楕円のような画像領域における非線形領域に関する情報を含む。本発明の1つの実施形態によれば、d=0の位置においてトレースキューブからスライスが切り取られ、これによって2つの種類の円形情報を抽出することが可能になる。
図6に示す第1の種類の情報の抽出プロセスでは、θパラメータに沿って汎関数を適用する。これは汎関数を画像領域における円周に適用することと等価である。その結果、線上の位置tに関する1次元関数が得られ、この場合にはtは円の半径に関連する。本明細書において、この関数はトレース円形関数(trace-circular function)と呼ばれる。
図7に示すように、第2の種類の円形情報は、画像領域における円形領域に関する。汎関数を区間t0≦|t|≦t1における線の一部分のみに適用することによって、角θに関する1次元信号が得られる。図7はt0=0の場合を示しているが、これは必須ではなく、より大きな値t0>0を取れば環形が得られる。環形は2つの同心円から成る。t0及びt1の値は、同心円の半径を定義する。この関数を、トレース環形関数(trace-annular function)と呼ぶことにする。
実際には離散データを使用するためd=0を利用できない場合がある。その場合には、+/−Δdに対応する2つのスライスを使用することができる。これらの2つのスライスは、例えば、結果として得られるトレース円形関数及びトレース環形関数を2つのスライスに関して合算することによって組み合わされる。
本方法の1つの特定の例において、トレース汎関数は
Figure 2011501257
によって与えられる。
しかしながら、当業者であれば理解するように、用途の具体的な要件に応じて他の種類の汎関数を使用することができる。
次に、本発明によるトレース環形関数とトレース円形関数は、欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号において記載される方法と類似した、以下で完全を期して説明される方法を使用してバイナリ識別子に変換される。
上で挙げた多くの画像の変更操作に関して汎関数を適切に選択すると、画像aのトレース環形関数又はトレース円形関数f(a)は、変更された画像a’の関数f(a’)をシフト又は(振幅を)拡大縮小したものに過ぎない。
Figure 2011501257
ここで、式(2)のフーリエ変換を行うことによって次式が得られる。
Figure 2011501257
次に、式(5)の振幅を取ると次式が得られる。
Figure 2011501257
式(6)から、変更された画像と原画像とは、もはやスケーリング係数κを除いて同じであることが分かる。
図3は、フーリエ変換係数に対するバイナリ関数を定義する方法を示している。特に、ステップ171においてフーリエ変換の高調波(harmonics)を得た後、ステップ172において複数のフーリエ変換の高調波の振幅の対数を得る。
本実施形態によれば、ステップ173において、複数のフーリエ変換の高調波の振幅係数上で関数c(ω)を定義する。この関数の1つの例示は、近傍高調波の差分を取ることである。
Figure 2011501257
ステップ174において、結果として得られるベクトル(式(7))に以下のような閾値を適用することによって、バイナリ列を抽出することができる。
Figure 2011501257
Sの適切な選択には、S=0及びS=mean(c)が含まれる。次に、これらの値B={b0,...,bn}から出力画像識別子(ステップ175)が構築される。
長さが共にNの2つの異なる識別子B1とB2の間で識別子のマッチングを行うために、正規化ハミング距離を取る。
Figure 2011501257
ここで
Figure 2011501257
は排他的OR(XOR)演算子である。代替的には、識別子内の様々な成分(ビットの部分集合)が独立した情報を保有しているため、スケーラブルな識別子構造及びスケーラブルなマッチングを使用することができる。Nビットから成る識別子全体を、S個の重複しない(別個の)ビットの部分集合{B1,B2,...,BS}に分割することができる。
そして、要求される性能、或いはこの用途に利用可能な計算資源/メモリ資源/送信資源に応じて、選択された部分集合に対してマッチングを行うことができる。
好ましい実施態様では、N=512であり、要求される性能に基づいて、それぞれが128ビットから成る4つの部分集合が選択される。通常、部分集合B1によるマッチングは98.82%の検出率をもたらす。部分集合B1∪B2では99.60%、B1∪B2及びB1∪B2∪B3では99.69%の検出率を与える。全体集合Nは99.72%の標準性能を有する。
当業者であれば理解するように、集合の数及びそれらの構造は、用途の要件に応じて決まる。さらに、特定の部分集合を、特定の変更に対するロバスト性を提供するように選択することができることに留意されたい。識別子又は表現を比較する他の方法を使用することもできる。
識別子内の特定ビットを選択することによって、性能をさらに改善することができる。周波数変換における低い周波数に対応するビットは一般にロバスト性が高く、上位ビットは識別性が高い。本発明の特定の実施形態では、DC成分に対応する最初のビットb0を無視し、識別子は次の48ビットから成る。
好ましい実施形態では、本発明において説明される円形情報から抽出されたビットは、欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号のうちの1つ又は複数において記載されている方法で抽出されたビットと組み合わされる。本発明の円形情報を使用しない場合、最良の性能は、英国特許出願第0712388.8号の好ましい実施形態を使用して得られ、0.05ppm(百万分率)の誤検出率における性能は98.9%であり、本発明において説明される円形情報を加えると、性能は通常では99.7%を超えて上昇する。
好ましい実施形態では、英国特許出願第0712388.8号に記載されるように、画像から17個の基本識別子が抽出される。さらに、トレース円形関数から1つの識別子が抽出され、3つのトレース環形関数から3つの識別子が抽出される。3つのトレース環形関数は、半径が増加する環形に対応する。
上記の方法を実行する本発明の実施形態による装置の一例が図8に示されている。このアプリケーションは、データベース230内に記憶される画像に関する識別子データベース240を構築することを含む。2つのデータベース230及び240は、同じデータベース又は別個のデータベースとすることができる。この装置によって、問い合わせ画像250から抽出された識別子260を検索して、データベース内の一致するものを見つけることが可能になる。おそらく順序付けされている画像のリストがユーザ290又は問い合わせアプリケーションに返される。
代替的な実施態様
好ましい実施形態では、d=0においてトレースキューブからスライスが切り取られる。代替的には、スライスはd≠0において切り取られてもよく、このスライス内の情報は画像領域における円ではなく楕円に対応する。
トレース環形関数とトレース円形関数から導出される識別子は、好ましくは、欧州特許出願第06255239.3号、英国特許出願第0700468.2号、及び英国特許出願第0712388.8号において記載されている識別子と組み合わされる。しかしながら、この組み合わせは必須ではなく、トレース環形関数及び/又はトレース円形関数のみを使用することによっても良好な識別性能を得ることができる。
代替的なアプリケーション
識別子はまた、ビデオシーケンス内のフレームをインデックス付けするために使用することもできる。新たなシーケンスが与えられると、フレームから識別子が抽出され、同一シーケンスを見つけるために検索を行うことができる。これは、著作権の検出及びシーケンスの識別のために有用であり得る。
複数の放送会社が同一のコンテンツ、例えば広告或いは株式ニュースの映像を送信する場合が多い。放送会社間のナビゲーションのために、識別子を使用してこれらのコンテンツ間にリンクを形成することができる。
画像識別子は、画像によってコンテンツを結びつける機会を提供する。ユーザがウェブページ上の特定の画像に興味がある場合、同一画像を有する他のページを見つける有効な方法はない。識別子を使用することによって画像間のナビゲーション経路を提供することができる。
識別子を使用することによってブロードキャストフィード内の広告を検出することができる。これを用いて広告主が自社のキャンペーンを追跡するための自動監視を提供することができる。
大規模な商用セットからパーソナルコンピュータ上の小規模なコレクションまで多くの画像データベースが存在する。データベースが厳格に制御されていない限り、通常はセット内の画像に重複があり、それによって余分な記憶領域が無駄に必要となる。識別子は、これらのデータセット内の重複画像を削除又は紐付けするツールとして用いることができる。
品質の悪い、おそらく高圧縮率の画像を受信すると、ユーザはより高品質のバージョンを見つけることを望む場合がある。識別子を使用することによって、高解像度のバージョンを求めてデータベース又はインターネットを検索することができる。
本明細書中、「画像」という用語は、フィルタリング、解像度の変更、アップサンプリング、ダウンサンプリング等の後処理を含む画像単位を説明するために使用されるが、フレーム、フィールド、ピクチャ、又は画像、フレーム等のサブユニット若しくは領域等の他の同様の用語にも当てはまる。本明細書中、画像という用語は、文脈から明らかである場合を除き、画像全体又は画像の領域を意味する。同様に、画像の領域は画像全体を意味し得る。画像は、フレーム又はフィールドを含み、静止画、又はフィルム若しくはビデオのような画像シーケンス、若しくは関連画像群内の画像に関連する。画像は、グレースケール画像若しくはカラー画像、又は別の種類のマルチスペクトル画像、例えば、IR画像、UV画像若しくは他の電磁波画像、又は音響画像等であり得る。
説明された実施形態において、周波数表現はフーリエ変換を使用して導出されたが、周波数表現はハール変換等の他の技法を用いて導出することもできる。さらに、フーリエ変換という用語は、DFT及びFFT等の変形を包含することを意図する。
本発明は、適切な装置を使用して電気信号を処理することによって実施されることが好ましい。
本発明は、例えば、適切なソフトウェア及び/又はハードウェアの変更を加えたコンピュータシステムにおいて実施することができる。例えば、本発明は、プロセッサ若しくは制御装置等の制御手段若しくは処理手段、メモリ、磁気記憶装置、CD、DVD等のような画像記憶手段を含むデータ記憶手段、ディスプレイ若しくはモニタ若しくはプリンタのようなデータ出力手段、キーボードのようなデータ入力手段、及びスキャナのような画像入力手段、又はこれらの構成要素の任意の組み合わせを付加的な構成要素と共に有するコンピュータ等を使用して実施することができる。本発明の態様は、ソフトウェア及び/若しくはハードウェアの形態において提供することができる。又は、特定用途向け装置或いはチップ等の特定用途向けモジュールを提供することができる。本発明の実施形態による装置におけるシステムの構成要素は、他の構成要素から離れた場所に、例えばインターネットを介して設けられてもよい。
当業者であれば理解するように、説明した実施形態に対して多くの変形及び修正を行ってもよい。例えば、説明した実施形態では、トレース変換の概念を拡張することによって、画像の3次元表現を生成するが、他の技法を使用して画像を3次元で表現することもできる。さらに、円形情報又は楕円形情報のような非線形情報を導出する他の技法を使用することもできる。本発明の精神及び範囲に入る変形、修正、及び等価物を全て含むことが意図される。
参考文献
[1]Alexander Kadyrov、Maria Petrou著「The Trace Transform and Its Applications」(IEEE Trans. PAMI, 23(8), Aug., 2001, pp 811-828)

Claims (32)

  1. 画像に対応する信号を処理することによって該画像の表現を導出する方法であって、
    前記画像を処理して該画像の3次元表現を得ることと、
    前記画像の3次元表現を使用して前記画像の表現を導出することと
    を含む、画像の表現を導出する方法。
  2. 前記画像を横切る線が第1のパラメータと第2のパラメータによって定義され、
    該線上の位置が第3のパラメータによって定義され、
    前記画像の3次元表現は、前記第1のパラメータ、前記第2のパラメータ、及び前記第3のパラメータによってパラメータ化される、請求項1に記載の方法。
  3. 前記画像の3次元表現は、
    前記画像を横切る複数の線をトレースすることであって、それぞれの線は第1のパラメータと第2のパラメータによって定義され、それぞれの線上の位置は第3のパラメータによって定義される、トレースすることと、
    前記第1のパラメータ、前記第2のパラメータ、及び前記第3のパラメータによって表される前記画像の3次元表現を導出することと
    によって得られる、請求項1又は2に記載の方法。
  4. 前記3次元表現を使用して前記画像の表現を導出することは、
    前記3次元表現における複数の線に沿って汎関数を適用して前記画像の表現を導出することを含み、
    前記3次元表現は、第1のパラメータ、第2のパラメータ、及び第3のパラメータによって定義される、請求項1、2、又は3に記載の方法。
  5. 前記第1のパラメータが所定値のときの前記3次元表現における複数の値を抽出することと、
    該3次元表現における該複数の抽出値における1つ又は複数の線に沿って前記汎関数を適用することと
    をさらに含み、
    それぞれの線は、前記第3のパラメータが固定値のときの前記第2のパラメータの値に沿って延在する、請求項3又は4に記載の方法。
  6. 前記第1のパラメータが所定値のときの前記3次元表現における複数の値を抽出することと、
    該複数の抽出値における1つ又は複数の線分に沿って前記汎関数を適用することと
    をさらに含み、
    該線分は、前記第3のパラメータによる所定位置の間の区間によって定義され、それぞれの線は、前記第2のパラメータが固定値のときの前記第3のパラメータの値に沿って延在する、請求項3又は4に記載の方法。
  7. 複数の隣接する線分に沿って前記汎関数を適用することを含む、請求項6に記載の方法。
  8. 前記第1のパラメータが0に等しいときの前記3次元表現における複数の値を抽出することを含む、請求項5、6、又は7に記載の方法。
  9. 前記第1のパラメータが正の所定値のときの前記3次元表現における複数の値を抽出して、第1の抽出値の集合を導出することと、
    前記3次元表現における複数の値を抽出して、第2の抽出値の集合を導出することと
    を含む、請求項5、6、又は7に記載の方法。
  10. 前記第1の抽出値の集合及び前記第2の抽出値の集合におけるそれぞれの線に沿って汎関数を適用して、第1の関数及び第2の関数をそれぞれ導出することと、
    該第1の関数と該第2の関数とを組み合わせることと
    をさらに含む、請求項9に記載の方法。
  11. 1次元関数を導出することを含む、請求項1〜10のいずれか一項に記載の方法。
  12. 前記1次元関数を使用して前記画像のバイナリ表現を導出することをさらに含む、請求項11に記載の方法。
  13. 周波数成分の振幅を使用して前記画像の表現を導出することを含む、請求項1〜12のいずれか一項に記載の方法。
  14. 前記周波数成分は、フーリエ変換又はハール変換を使用して求められる、請求項13に記載の方法。
  15. 前記周波数成分の振幅を使用して前記画像の表現を導出することは、
    複数の周波数係数の振幅を計算することと、
    各係数の振幅とその次の係数の振幅との間の差分を求めることと
    を含む、請求項13又は14に記載の方法。
  16. 前記周波数成分の振幅を使用して前記画像の表現を導出することは、
    複数の周波数係数の振幅の対数を計算することと、
    各係数の振幅の対数とその次の係数の振幅の対数との間の差分を求めることと
    を含む、請求項13又は14に記載の方法。
  17. バイナリ関数を導出することをさらに含み、
    該バイナリ関数は、前記求められた差分のそれぞれに閾値を適用して一連のバイナリ値を導くことによって導出され、
    前記閾値を適用することは、前記差分が該閾値未満である場合にバイナリ値0を与え、前記差分が該閾値以上である場合にバイナリ値1を与える、請求項15又は16に記載の方法。
  18. n個の数字又はビットを有する表現を導出することを含み、m個の数字又はビットの部分集合を選択することをさらに含む、請求項1〜17のいずれか一項に記載の方法。
  19. 前記3次元表現における複数の線に沿って異なる複数の汎関数を適用することによって前記画像の複数の表現を導出することと、
    該複数の表現のうちの2つ以上を組み合わせることと
    を含む、請求項1〜18のいずれか一項に記載の方法。
  20. 前記組み合わせることは、前記2つ以上の表現を連結することを含む、請求項18に記載の方法。
  21. 画像に対応する信号を処理することによって該画像の表現を導出する方法であって、
    前記画像を処理して該画像の非線形領域に関する情報を得ることと、
    前記情報を使用して前記画像の表現を導出することと
    を含む、画像の表現を導出する方法。
  22. 前記情報は円形情報である、請求項21に記載の方法。
  23. 請求項1〜22のいずれか一項に記載の方法を使用することによって、画像を識別又は比較する方法。
  24. 画像を識別する方法であって、
    請求項1〜23のいずれか一項に記載の方法を使用することによって、該画像の表現を導出することと、
    該表現を該画像と関連付けることとを含む、画像を識別する方法。
  25. 画像を比較する方法であって、請求項1〜24のいずれか一項に記載の方法を使用することによって導出される各画像の表現を比較することを含む、画像を比較する方法。
  26. 前記比較は、式:
    Figure 2011501257
    を使用してハミング距離を求めることを含み、ここで、
    Figure 2011501257
    は排他的OR(XOR)演算子であり、Nは識別子B1及びB2の長さである、請求項25に記載の方法。
  27. 表現の前記比較に基づいて画像を選択することを含む、請求項25又は26に記載の方法。
  28. 請求項1〜27のいずれか一項に記載の方法を使用することによって導出される表現の、例えば送信又は受信を含む使用。
  29. 請求項1〜27のいずれか一項に記載の方法を実行する装置。
  30. 前記装置の動作を制御して請求項1〜27のいずれか一項に記載の方法を実行させる制御装置を備える、請求項29に記載の装置。
  31. 画像及び/又は画像の表現を記憶する記憶手段、例えば画像データベース及び/又は記述子データベース、表示手段、並びに画像選択手段のうちの1つ又は複数をさらに備える、請求項29又は30に記載の装置。
  32. 請求項1〜27のいずれか一項に記載の方法を実行するコンピュータプログラム、システム、又はコンピュータ読み取り可能な記憶媒体。
JP2010528467A 2007-10-10 2008-06-30 拡張画像識別 Active JP5261493B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0719833.6 2007-10-10
GBGB0719833.6A GB0719833D0 (en) 2007-10-10 2007-10-10 Enhanced image identification
PCT/GB2008/002251 WO2009047471A1 (en) 2007-10-10 2008-06-30 Enhanced image identification

Publications (2)

Publication Number Publication Date
JP2011501257A true JP2011501257A (ja) 2011-01-06
JP5261493B2 JP5261493B2 (ja) 2013-08-14

Family

ID=38787959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010528467A Active JP5261493B2 (ja) 2007-10-10 2008-06-30 拡張画像識別

Country Status (7)

Country Link
US (1) US8515158B2 (ja)
EP (1) EP2195765B1 (ja)
JP (1) JP5261493B2 (ja)
KR (1) KR101191516B1 (ja)
CN (1) CN101821753B (ja)
GB (1) GB0719833D0 (ja)
WO (1) WO2009047471A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1912160B1 (en) * 2006-10-11 2012-05-16 Mitsubishi Electric R&D Centre Europe B.V. Image descriptor for image recognition
GB0800364D0 (en) 2008-01-09 2008-02-20 Mitsubishi Electric Inf Tech Feature-based signatures for image identification
GB0807411D0 (en) 2008-04-23 2008-05-28 Mitsubishi Electric Inf Tech Scale robust feature-based indentfiers for image identification
EP2884427B1 (en) * 2013-12-12 2021-10-20 Fundacion Centro de Tecnologias de Interaccion Visual y comunicaciones Vicomtech Method and system for describing an image
TWI503760B (zh) * 2014-03-18 2015-10-11 Univ Yuan Ze Image description and image recognition method
US9830532B1 (en) 2014-08-22 2017-11-28 Matrox Electronic Systems Ltd. Object detection in images using distance maps
US10031925B2 (en) * 2014-10-15 2018-07-24 Thinkcx Technologies, Inc. Method and system of using image recognition and geolocation signal analysis in the construction of a social media user identity graph
CN105224919B (zh) * 2015-09-11 2019-02-26 深圳Tcl新技术有限公司 纹理特征提取方法及装置
CN107358239B (zh) * 2017-06-07 2018-05-18 南京航空航天大学 基于圆迹变换的图像不变特征提取方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001067462A (ja) * 1999-07-09 2001-03-16 Korea Electronics Telecommun 周波数空間上における質感表現方法及び質感ベースの検索方法
JP2003271177A (ja) * 2002-03-15 2003-09-25 Sharp Corp 特徴量抽出方法、音声および音響に関する識別装置、画像および画像状態に関する識別装置ならびに特徴量抽出プログラム
JP2005208979A (ja) * 2004-01-23 2005-08-04 Fuji Xerox Co Ltd 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030036855A1 (en) * 1998-03-16 2003-02-20 Praelux Incorporated, A Corporation Of New Jersey Method and apparatus for screening chemical compounds
US6421463B1 (en) * 1998-04-01 2002-07-16 Massachusetts Institute Of Technology Trainable system to search for objects in images
EP1912160B1 (en) 2006-10-11 2012-05-16 Mitsubishi Electric R&D Centre Europe B.V. Image descriptor for image recognition
GB0700468D0 (en) 2007-01-10 2007-02-21 Mitsubishi Electric Inf Tech Improved image identification
GB0712388D0 (en) 2007-06-26 2007-08-01 Mitsubishi Electric Inf Tech High Performance Image Identification

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001067462A (ja) * 1999-07-09 2001-03-16 Korea Electronics Telecommun 周波数空間上における質感表現方法及び質感ベースの検索方法
JP2003271177A (ja) * 2002-03-15 2003-09-25 Sharp Corp 特徴量抽出方法、音声および音響に関する識別装置、画像および画像状態に関する識別装置ならびに特徴量抽出プログラム
JP2005208979A (ja) * 2004-01-23 2005-08-04 Fuji Xerox Co Ltd 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSNB199700019001; 鳥脇純一郎: '画像理解のためのディジタル画像処理(1)' 画像理解のためのディジタル画像処理(1) , 19961020, pp.89-94, 株式会社昭晃堂 *
CSNG200100692012; 真庭久和 外2名: 'SAR画像振幅値の総和と2乗総和を用いた航跡検出法' 電子情報通信学会論文誌 (J83-B) 第1号 第J83-B巻 第1号, 20000125, pp.96-105, 社団法人電子情報通信学会 *
CSNG200700763006; 中河秀仁 外2名: '全方位動画像からの自己位置識別' 情報処理学会研究報告 Vol.2007 No.42 第2007巻 第42号, 20070514, pp.65-72, 社団法人情報処理学会 *
JPN6012043498; 真庭久和 外2名: 'SAR画像振幅値の総和と2乗総和を用いた航跡検出法' 電子情報通信学会論文誌 (J83-B) 第1号 第J83-B巻 第1号, 20000125, pp.96-105, 社団法人電子情報通信学会 *
JPN6012043500; 中河秀仁 外2名: '全方位動画像からの自己位置識別' 情報処理学会研究報告 Vol.2007 No.42 第2007巻 第42号, 20070514, pp.65-72, 社団法人情報処理学会 *
JPN6012043503; 鳥脇純一郎: '画像理解のためのディジタル画像処理(1)' 画像理解のためのディジタル画像処理(1) , 19961020, pp.89-94, 株式会社昭晃堂 *

Also Published As

Publication number Publication date
EP2195765A1 (en) 2010-06-16
US8515158B2 (en) 2013-08-20
KR101191516B1 (ko) 2012-10-15
CN101821753B (zh) 2013-09-04
WO2009047471A1 (en) 2009-04-16
KR20100076015A (ko) 2010-07-05
US20100310153A1 (en) 2010-12-09
JP5261493B2 (ja) 2013-08-14
CN101821753A (zh) 2010-09-01
EP2195765B1 (en) 2012-09-12
GB0719833D0 (en) 2007-11-21

Similar Documents

Publication Publication Date Title
JP5054122B2 (ja) 改良された画像識別
JP5261493B2 (ja) 拡張画像識別
JP5175854B2 (ja) 画像認識のための画像記述子
Walia et al. Digital image forgery detection: a systematic scrutiny
Asghar et al. Copy-move and splicing image forgery detection and localization techniques: a review
WO2018157746A1 (zh) 一种视频数据的推荐方法和装置
Kwon et al. Learning jpeg compression artifacts for image manipulation detection and localization
Al-Qershi et al. Enhanced block-based copy-move forgery detection using k-means clustering
JP5199349B2 (ja) 高性能画像識別
Fatima et al. FAST, BRIEF and SIFT based image copy-move forgery detection technique
Himeur et al. Robust video copy detection based on ring decomposition based binarized statistical image features and invariant color descriptor (RBSIF-ICD)
Kumar et al. Salient keypoint-based copy–move image forgery detection
Yu et al. Robust image hashing with saliency map and sparse model
Nawaz et al. Image authenticity detection using DWT and circular block-based LTrP features
WO2024027347A9 (zh) 内容识别方法、装置、设备、存储介质及计算机程序产品
Dixit et al. Copy–move forgery detection utilizing Fourier–Mellin transform log-polar features
Rajkumar et al. A robust and forensic transform for copy move digital image forgery detection based on dense depth block matching
Sudir et al. An effective edge and texture based approach towards curved videotext detection and extraction
Hossain Identification of manipulation in digital images through hybrid block-based and key points algorithm
US20180032843A1 (en) Identifying classes associated with data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130426

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160502

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5261493

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250