JP6070568B2 - 特徴量符号化装置、特徴量符号化方法、及びプログラム - Google Patents

特徴量符号化装置、特徴量符号化方法、及びプログラム Download PDF

Info

Publication number
JP6070568B2
JP6070568B2 JP2013544321A JP2013544321A JP6070568B2 JP 6070568 B2 JP6070568 B2 JP 6070568B2 JP 2013544321 A JP2013544321 A JP 2013544321A JP 2013544321 A JP2013544321 A JP 2013544321A JP 6070568 B2 JP6070568 B2 JP 6070568B2
Authority
JP
Japan
Prior art keywords
value
encoding
feature
difference
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013544321A
Other languages
English (en)
Other versions
JPWO2013073624A1 (ja
Inventor
岩元 浩太
浩太 岩元
亮太 間瀬
亮太 間瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2013073624A1 publication Critical patent/JPWO2013073624A1/ja
Application granted granted Critical
Publication of JP6070568B2 publication Critical patent/JP6070568B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)

Description

本発明は、特徴量符号化装置、特徴量符号化方法、及びプログラムに関する。
画像内の被写体を、撮影サイズや角度の変化、オクルージョンに対して頑健に識別可能とするために、画像内の特徴的な点(特徴点)を多数検出し、各特徴点周辺の局所領域の特徴量(局所特徴量)を抽出する方式が提案されている。その代表的な方式として、特許文献1や非特許文献1には、SIFT(Scale Invariant Feature Transform)特徴量を用いる局所特徴量抽出装置が開示されている。また、他の方式として、非特許文献2には、SURF(Speeded Up Robust Features)特徴量を用いる局所特徴量抽出装置が開示されている。
これらの局所特徴量抽出装置では、画像から検出された複数の特徴点のそれぞれに対して、特徴点の座標値と抽出された局所特徴量が出力される。すなわち、座標値と局所特徴量の集合を、画像全体を表す特徴量としている。画像間を照合は、複数の特徴点の座標値と局所特徴量の両方が用いられる。
これらの局所特徴量を保存したり伝送したりする場合は、符号化を行うのが一般的である。図7は、局所特徴量の符号化する特徴量符号化装置の一般的な構成の一例を示す図である。図7に示すように、特徴量符号化装置は、特徴点検出部200、局所特徴量抽出部210、局所特徴量符号化部220、及び座標値固定長符号化部230を備えている。
特徴点検出部200は、画像から特徴的な点(特徴点)を多数検出し、各特徴点の座標値を出力する。座標値は具体的にはX座標値とY座標値の2つが出力される。局所特徴量抽出部210は、検出された各特徴点の座標値を用いて、それぞれの座標値を中心とする局所領域から特徴量を抽出し、局所特徴量として出力する。例えば上述のSIFT特徴量を用いる場合、局所特徴量抽出部210は、局所領域を4×4=16ブロックに分割し、各ブロックに対して8方向に量子化された勾配方向ヒストグラムを生成し、16ブロック×8勾配方向=128次元の勾配方向ヒストグラムを局所特徴量とすることができる。局所特徴量符号化部220は、抽出された局所特徴量を符号化する。例えば上述のSIFT特徴量を用いる場合、局所特徴量符号化部220は、1つの特徴点に対する128次元の特徴量を、例えば1次元を1バイトで符号化し、計128バイトで符号化することができる。座標値固定長符号化部230は、各特徴点の座標値を固定ビット長で符号化する。座標値はX座標値とY座標値を含む。一般的に座標値は浮動小数点数として抽出されるため、例えば4バイトや8バイトの情報として表現される。そのため、座標値固定長符号化部230は、1つの特徴点に対するX座標値とY座標値を8バイト(4バイト×2)や16バイト(8バイト×2)で符号化する。局所特徴量符号化部220が出力する符号化された局所特徴量と、座標値固定長符号化部230が出力する符号化された座標値と、を合わせて符号化特徴量とする。
米国特許第6711293号明細書
David G. Lowe著、「Distinctive image features from scale-invariant keypoints」、(米国)、International Journal of Computer Vision、60(2)、2004年、p. 91-110 Herbert Bay、Andreas Ess、Tinne Tuytelaars、Luc Van Gool著、「SURF:Speeded Up Robust Features」、(米国)、Computer Vision and Image Understanding (CVIU)、Vol. 110、No. 3、2008年、p. 346-359
上述した特徴量符号化装置は、座標値を固定ビット長で符号化するため、そのサイズが大きくなってしまうという問題点がある。上述したように、1つの特徴点に対する座標値は8バイトや16バイトなどで符号化される。SIFT特徴量の場合は、一般的に画像から検出される特徴点の数が数百から数千にもなるので、特徴点の座標値だけで数Kバイトから数十Kバイトのデータ量となる。このように符号化特徴量のサイズが大きくなってしまうと、画像の照合(マッチング)のために符号化特徴量を用いる場合に問題が生じることがある。例えば、ユーザ端末(例えばカメラ付きの携帯端末など)が、画像から特徴量を抽出して符号化し、当該画像に類似する画像を検索するために符号化特徴量をサーバに送信する場合、符号化特徴量のサイズが大きいと通信時間が長くなってしまう。そのため、画像の検索結果が得られるまでの時間が長くなってしまう。また、符号化特徴量を用いた画像検索の場合、画像の符号化特徴量をメモリ上に格納することとなるが、符号化特徴量のサイズが大きいとメモリ上に符号化特徴量を格納可能な画像数が少なくなってしまう。そのため、大量の画像を対象とする大規模検索には適さないこととなる。
そこで、本発明は、符号化された特徴量サイズを小さくすることを目的とする。
本発明の一側面に係る特徴量符号化装置は、画像から特徴点を検出して座標値を出力する特徴点検出部と、特徴点の座標値を中心とする局所領域から局所特徴量を抽出する局所特徴量抽出部と、特定の走査方法に従って座標値をインデックス値に変換する座標値走査部と、インデックス値をソートするソート部と、ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力する差分算出部と、差分値の系列を系列順に符号化する差分符号化部と、ソートされたインデックス値と同じ順列で、対応する特徴点の局所特徴量を符号化する局所特徴量符号化部と、を備える。
また、本発明の一側面に係る局所特徴量抽出方法では、コンピュータが、画像から特徴点を検出して座標値を出力し、特徴点の座標値を中心とする局所領域から局所特徴量を抽出し、特定の走査方法に従って座標値をインデックス値に変換し、インデックス値をソートし、ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力し、差分値の系列を系列順に符号化し、ソートされたインデックス値と同じ順列で、対応する特徴点の局所特徴量を符号化する。
また、本発明の一側面に係るプログラムは、コンピュータに、画像から特徴点を検出して座標値を出力する機能と、特徴点の座標値を中心とする局所領域から局所特徴量を抽出する機能と、特定の走査方法に従って座標値をインデックス値に変換する機能と、インデックス値をソートする機能と、ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力する機能と、差分値の系列を系列順に符号化する機能と、ソートされたインデックス値と同じ順列で、対応する特徴点の局所特徴量を符号化する機能と、を実現させるためのものである。
なお、本発明において、「部」とは、単に物理的手段を意味するものではなく、その「部」が有する機能をソフトウェアによって実現する場合も含む。また、1つの「部」や装置が有する機能が2つ以上の物理的手段や装置により実現されても、2つ以上の「部」や装置の機能が1つの物理的手段や装置により実現されてもよい。
本発明によれば、符号化された特徴量サイズを小さくすることが可能となる。
本発明の第1の実施形態である特徴量符号化装置の構成を示す図である。 座標値の走査方法の例を示す図である。 特徴量符号化装置における処理の一例を示すフローチャートである。 本発明の第2の実施形態である特徴量符号化装置の差分符号化部の構成を示す図である。 第2の実施形態の特徴量符号化装置における差分符号化部の処理の一例を示すフローチャートである。 本発明の第3の実施形態である特徴量符号化装置の差分符号化部の構成を示す図である。 特徴量符号化装置の一般的な構成の一例を示す図である。
以下、図面を参照して本発明の実施形態について説明する。
==第1の実施形態==
図1は、本発明の第1の実施形態である特徴量符号化装置の構成を示す図である。特徴量符号化装置1Aは、特徴点検出部10、局所特徴量抽出部12、局所特徴量符号化部14、座標値走査部16、ソート部18、差分算出部20、及び差分符号化部22を含んで構成される。特徴量符号化装置1Aは、例えば、パーソナルコンピュータや携帯情報端末等の情報処理装置を用いて構成することができる。そして、特徴量符号化装置1Aを構成する各部は、例えば、メモリ等の記憶領域を用いたり、記憶領域に格納されているプログラムをプロセッサが実行したりすることにより実現することができる。なお、後述する他の実施形態における構成要素についても同様に実現することができる。
特徴点検出部10は、画像から特徴的な点(特徴点)を多数検出し、各特徴点の座標値を出力する。座標値は具体的にはX座標値とY座標値の2つ(2次元の情報)が出力される。なお出力される座標値の表現精度は任意である。出力される座標値は、ピクセル精度(画素精度)でもよいし、サブピクセル精度(画素精度よりも細かい精度)でもよいし、ピクセル精度よりも粗い精度でもよい。
局所特徴量抽出部12は、検出された各特徴点の座標値を用いて、それぞれの座標値を中心とする局所領域から特徴量を抽出し、局所特徴量として出力する。例えば、局所特徴量抽出部12は、上述のSIFT特徴量を用いて局所特徴量を出力することができる。具体的には、局所特徴量抽出部12は、例えば、局所領域を4×4=16ブロックに分割し、各ブロックに対して8方向に量子化された勾配方向ヒストグラムを生成し、16ブロック×8勾配方向=128次元の勾配方向ヒストグラムを局所特徴量として出力してもよい。なお、抽出される局所特徴量はSIFT特徴量に限られず、どのような特徴量であってもよい。
座標値走査部16は、画像をある特定の走査方法に従って走査し、特徴点の2次元座標値(X座標値とY座標値)を1次元のインデックス値に変換する。このインデックス値は、走査に従った原点からの走査距離である。
走査方法の例を図2に示す。走査方法は例えば図2の走査方法Aのように、画像の左上を原点にして、1行ずつ左から右へと横方向にスキャンしていくラスタスキャンでもよい。また図2の走査方法Bのように、縦方向にスキャンするラスタスキャンでもよい。また図2の走査方法Cや走査方法Dのように、走査する方向を1行ごとに逆方向にしてもよい。なお走査方法は、図2に示した例に限られない。
次に、2次元座標値を1次元のインデックス値に変換する方法の例を示す。例えば2次元座標値がピクセル精度(画素精度)で、画像の横方向のピクセル数をwidth、縦方向のピクセル数をheight、画像の左上を原点としてX座標値をx(x = 0〜width−1)、Y座標値をy(y = 0〜height−1)、と表現する。この場合、図2の走査方法Aに従うと、座標値走査部16は、2次元座標値(x, y)を、次式(1)で1次元のインデックス値(0〜width×height−1)に変換することができる。
y×width+x ・・・(1)
この例では、座標値走査部16は、ピクセル精度(画素精度)の2次元座標値を同じ表現精度で1次元のインデックス値に変換している。なお、座標値走査部16は、インデックス値への変換を行うときに、表現精度を変換してもよい。例えば、座標値走査部16は、インデックス値への変換を行うときに、2画素精度(2×2画素を1画素に縮退)や4画素精度(4×4画素を1画素に縮退)などに表現精度を変換してもよい。また2次元座標値が浮動小数点数で表現される場合、座標値走査部16は、2次元座標値の表現精度を任意の表現精度(固定小数点数)に変換してから、1次元のインデックス値に変換してもよい。例えば、座標値走査部16は、2次元座標値の表現精度をピクセル精度(画素精度)に変換してから、1次元のインデックス値に変換してもよい。
ソート部18は、特徴点のインデックス値をソートし、ソート後の順列の情報を出力する。ここでソート部18は、例えば昇順にソートする。また降順にソートしてもよい。
差分算出部20は、ソートされたインデックス値における、隣接する2つのインデックス値の差分値を算出し、差分値の系列を出力する。ソートされたインデックス値の系列をVi(i=0, 1, 2, …)とした場合、差分算出部20は、差分値の系列Di(i=0, 1, 2, …)を、次式(2)により計算することができる。ただし、D0=V0とする。
i=Vi−Vi-1 ・・・(2)
差分符号化部22は、差分値の系列を系列順に符号化する。差分値の系列の符号化は、例えば固定ビット長の符号化でもよい。固定ビット長で符号化する場合、そのビット長はあらかじめ規定されていてもよいが、これでは考えられうる差分値の最大値を表現するのに必要なビット数を要するため、符号化サイズは小さくならない。そこで、差分符号化部22は、固定ビット長で符号化する場合、入力された差分値の系列に基づいてビット長を決定することができる。具体的には、例えば、差分符号化部22は、入力された差分値の系列から差分値の最大値を求め、その最大値を表現するのに必要なビット数(表現ビット数)を求め、求められた表現ビット数で差分値の系列を符号化することができる。
例えば差分値の系列の最大値をDMAXとした場合、差分符号化部22は、差分値の系列を符号化するための表現ビット数Nを、次式(3)により計算することができる。ただし、差分値の最小値を0とする。
Figure 0006070568
この場合、符号化された差分値の系列の復号ができるように、差分符号化部22は、表現ビット数の値の情報、すなわちN、も符号化する。具体的には、例えば、差分符号化部22は、符号化された差分値の系列の先頭に、符号化された表現ビット数の値の情報を付加することができる。通常、2次元座標値よりも、ソートされたインデックス値の差分値は、表現に必要なビット数が小さくなる。そのため、より小さい符号化サイズで座標値を表現することができる。
また、差分符号化部22は、差分値の系列を、一意に復号可能な可変長符号で符号化してもよい。例えば、差分符号化部22は、ハフマン符号や算術符号を用いてもよい。また、差分符号化部22は、ゴロム符号やゴロム・ライス符号を用いてもよい。
また、差分符号化部22は、差分値の系列の要素数(すなわち特徴点数)の情報、または符号化された差分値の系列の符号化サイズの情報も符号化してもよい。これにより、符号化された差分値の系列の復号が行われるときに、差分値の系列の終端を判断することができる。
また、差分符号化部22は、差分値の系列の符号化に加えて、元の2次元座標値を復元するのに必要なその他の情報も符号化してもよい。例えば、差分符号化部22は、座標値走査部16における、1行分の走査幅(図2の走査方法A・走査方法Cにおける横幅、走査方法B・走査方法Dにおける縦幅)などの情報を符号化してもよい。また例えば、座標値走査部16において表現精度が変換される場合、差分符号化部22は、表現精度を特定する情報や、元の2次元座標系の値域に復元するための変換係数などの情報を符号化してもよい。また例えば、座標値走査部16において、使用される走査方法があらかじめ1つに限定されておらず、複数の走査方法の中から選択可能である場合、差分符号化部22は、座標値走査部16で使用された走査方法を特定する情報を符号化してもよい。
局所特徴量符号化部14は、ソートされた特徴点のインデックス値と同じ順列で、対応する特徴点の局所特徴量を符号化する。ソートされたインデックス値と同じ順列で符号化することで、差分符号化部22で符号化された座標値と、それに対応する局所特徴量とを1対1で対応付けることが可能となる。局所特徴量符号化部14は、例えば上述のSIFT特徴量を用いることにより、1つの特徴点に対する128次元の特徴量を、例えば1次元を1バイトで符号化し、計128バイトで符号化することができる。
局所特徴量符号化部14が出力する符号化された局所特徴量と、差分符号化部22が出力する符号化された座標値と、を合わせたものを符号化特徴量とする。
図3は、特徴量符号化装置1Aにおける処理の一例を示すフローチャートである。まず、特徴量検出部10は、画像から特徴点を検出して座標値を出力する(S301)。特徴点が検出されると、局所特徴量抽出部12は、検出された特徴点の座標値を中心とする局所領域から局所特徴量を抽出する(S302)。そして、座標値走査部16は、特定の走査方法に従って検出された座標値をインデックス値に変換する(S303)。次に、ソート部18は、インデックス値をソートする(S304)。差分算出部20は、ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力する(S305)。そして差分符号化部22は、差分値の系列を系列順に符号化する(S306)。最後に、局所特徴量符号化部14は、ソートされたインデックス値と同じ順列で、対応する特徴点の局所特徴量を符号化する(S307)。なお、ここに述べた例は特徴量符号化装置1Aにおける処理の一例であり、この順序に限られない。例えば、局所特徴量の抽出(S302)は、特徴量の検出(S301)の後であれば、どの時点で実行してもよい。また、局所特徴量の符号化(S307)は、インデックス値のソート(S304)の後であれば、どの時点で実行してもよい。
次に、特徴量符号化装置1Aで符号化した符号化特徴量の復号方法について述べる。符号化された座標値は、まず差分値が復号され、差分値の系列Di(i=0, 1, 2, …)が復元される。次に、差分値の系列の先頭から、差分値を加算していくことで、インデックス値の系列Vi(i=0, 1, 2, …)が復元される。具体的には、V0=D0として、次式(4)により復元される。
i=Vi-1+Di ・・・(4)
そして、1次元のインデックス値が2次元の座標値に変換され、座標値が復号される。符号化された局所特徴量を復号して得られる局所特徴量の系列は、復元された座標値の系列と同じ順列である。したがって、復号された局所特徴量と、復号された座標値とは、1対1で対応付けられている。こうして、局所特徴量及び対応する座標値を復号することができる。この方法により、特徴量符号化装置1Aで符号化した符号化特徴量を復号する特徴量復号装置を構成することができる。
第1の実施形態の効果を述べる。第1の実施形態の特徴量符号化装置1Aでは、差分符号化部22が、ソートされたインデックス値の差分値を符号化する。ソートされたインデックス値の差分値は小さい値に集中するため、通常、元の2次元座標値よりも、表現に必要なビット数が小さくなるため、より小さい符号量で座標値を表現することができる。したがって、符号化された特徴量サイズを小さくすることが可能となる。
==第2の実施形態==
次に第2の実施形態について説明する。図4は、本発明の第2の実施形態における特徴量符号化装置の差分符号化部22の構成を示す図である。第2の実施形態の特徴量符号化装置は、第1の実施形態の特徴量符号化装置1Aの差分符号化部22を、図4に示す差分符号化部22Bに変更したものである。第2の実施形態の特徴量符号化装置におけるその他の構成は、図1に示した第1の実施形態の特徴量符号化装置1Aと同じであるため説明を省略する。
図4に示すように、差分符号化部22Bは、第1の符号化部24と第2の符号化部26を含んで構成される。差分符号化部22Bにおいては、第1の符号化部24と第2の符号化部26による2段構成の符号化によって差分値の系列が符号化される。第1の符号化部24と第2の符号化部26は、それぞれ異なる符号化方法で符号化をする。なお、異なる符号化方法とは、例えば、符号化方式(ここでの符号化方式とは、固定長符号、ハフマン符号、ゴロム符号などのアルゴリズム方式のことをいう)が異なるものであってもよいし、同じ符号化方式においてパラメータが異なるもの(例えば固定長符号であっても、異なるビット長で符号化する、など)であってもよい。
第1の符号化部24は、差分値が、符号化可能な値域内であれば差分値を符号化し、差分値が符号化可能な値域外であれば、そのことを示すエスケープコードを符号化する。エスケープコードには、第1の符号化部24が符号化できる符号のうちの1つを割り当てておく。例えば、第1の符号化部24が符号化できる最大値をエスケープコードに割り当てることができる。なお、「符号化可能な値域」とは、エスケープコードを除くものとする。
第2の符号化部26は、第1の符号化部24がエスケープコードを符号化した場合に、第1の符号化部24とは異なる符号化方法で、差分値を符号化する。なお、このときに符号化する差分値には、第1の符号化部24で符号化可能な値域は含まれない。そのため、第2の符号化部26は、第1の符号化部24で符号化可能な値域を除外したうえで、差分値を符号化するのに必要な最小のビット長で符号化してもよい。
具体的な例で第1の符号化部24と第2の符号化部26の動作を説明する。この例では、第1の符号化部24も第2の符号化部26も固定長符号化を行うものとし、第1の符号化部24はMビットの固定ビット長符号化、第2の符号化部26はNビットの固定ビット長符号化を行う。ただしM<Nである。第1の符号化部24はMビットの符号化を行うので、0〜2M−1の値を符号化できる。このうち、最大値である2M−1をエスケープコードに割り当てる。そうすると、第1の符号化部24が差分値を符号化可能な値域は0〜2M−2となる。
入力された差分値が0〜2M−2の値域内であれば、第1の符号化部24は差分値をMビットで固定長符号化し、符号を出力する。この場合、第2の符号化部26は何も行わないため、第1の符号化部24は、差分値の系列における次の差分値の符号化を行う。
入力された差分値が0〜2M−2の値域外(すなわち2M−2より大きい場合)であれば、第1の符号化部24はエスケープコードである2M−1をMビットで固定長符号化して、符号を出力する。第2の符号化部26は、第1の符号化部24がエスケープコードを符号化した場合に、差分値をNビットで固定ビット長符号化する。ここでNは、例えば、考えられうる差分値の最大値を符号化できる最小ビット長があらかじめ規定されていてもよい。また例えば、第2の符号化部26は、入力された差分値の系列から差分値の最大値を求め、その最大値を符号化できる最小ビット長によりNを決定してもよい。例えば、差分値の系列の最大値をDMAXとした場合、第2の符号化部26は、それを符号化できる最小のビット長Nを、次式(5)により計算することができる。ただし、差分値の最小値を0とする。
Figure 0006070568
ここで、ceil()は小数点以下を切り上げる関数である。また、第1の符号化部24が符号化可能な値域である0〜2M−2の2M−1個の数値は除外できるので、第2の符号化部26は、これらを除外したうえで、差分値を符号化してもよい。この場合、第2の符号化部26は、差分値を符号化する最小のビット長Nを、次式(6)により計算することができる。
Figure 0006070568
これらのように、差分値の系列の最大値からNを決定する場合、符号化された差分値の系列の復号ができるように、第2の符号化部26は、このビット長Nの情報も符号化する。例えば、第2の符号化部26は、符号化された差分値の系列の先頭に、符号化されたビット長Nの情報を付加することができる。
なお、第1の符号化部24が行う固定符号化のビット長Mも、例えば予め規定されていてもよいし、第1の符号化部24が適応的に求めてもよい。ビット長Mを適応的に求める場合、符号化された差分値の系列の復号ができるように、第1の符号化部25は、このビット長Mの情報も符号化する。
ここでは、第1の符号化部24と第2の符号化部26が固定長符号化で符号化する例で説明したが、これらの符号化方法に限られない。例えば、ハフマン符号、算術符号、ゴロム符号、ゴロム符号、ゴロム・ライス符号、などを用いてもよい。例えば、第1の符号化部24がゴロム符号を用いて符号化し、第2の符号化部26が固定長符号化で符号化してもよい。この場合、例えば、第1の符号化部24はゴロム符号で符号化する最大ビット長をあらかじめ規定しておく。そしてその設定で、ゴロム符号化できる最大値をエスケープコードとして割り当て、それ未満の数値を符号化可能な値域とする。そして第1の符号化部24は、差分値がその値域内であれば、差分値をゴロム符号化し、符号を出力する。一方、差分値が値域外であれば、第1の符号化部24は、エスケープコードをゴロム符号化して出力する。この場合、第2の符号化部26が、差分値を固定長符号化する。
図5は、第2の実施形態の特徴量符号化装置における差分符号化部22Bの処理の一例を示すフローチャートである。差分符号化部22Bは、差分値の系列における各差分値を順に処理していく。まず、第1の符号化部24は、差分値が符号化可能な値域内であるか否かを判定する(S401)。符号化可能な値域内であれば、第1の符号化部24は、差分値を符号化する(S402)。そしてステップS405へ移行する。符号化可能な値域内でない場合(値域外)は、第1の符号化部24は、エスケープコードを符号化する(S403)。そして次に、第2の符号化部26は、第1の符号化部24とは異なる符号化方法で差分値を符号化する(S404)。そしてステップS405へ移行する。ステップ405では、第1の符号化部24は、処理された差分値が、差分値の系列の最後の要素であるかを判定する(S405)。最後である場合は、処理が終了する。最後でない場合は、再度ステップS401へ移行し、差分値の系列の次の差分値に対する処理が実行される。
次に、第2の実施形態の特徴量符号化装置における差分符号化部22Bが符号化した差分値の系列の復号方法について述べる。差分値の系列の先頭から各差分値が順に復元されていく。まず符号化された差分値の系列の最初の要素の値が復号される。この値は第1の符号化部24が符号化した値であるため、第1の符号化部24の符号化パラメータに従って復号される。例えば上述のMビットの固定ビット長符号化の場合は、Mビット分が復号される。復号された値がエスケープコードでない場合は、この値が差分値として復元され、次の差分値の復元へ移行する(再び第1の符号化部24が符号化した値の復号を行う)。復号された値がエスケープコードである場合は、次の要素の値が復号される。この値は第2の符号化部26が符号化した値なので、第2の符号化部26の符号化パラメータに従って復号される。例えば上述のNビットの固定ビット長符号化の場合は、Nビット分が復号される。そしてこの値を差分値として復元され、次の差分値の復元へ移行する(再び第1の符号化部24が符号化した値の復号を行う)。こうして、差分値の系列を復号することができる。この方法で符号化された差分値の系列を復号する差分復号部を備えた特徴量復号装置を構成することができる。
第2の実施形態の効果を述べる。第2の実施形態の特徴量符号化装置では、差分符号化部22Bが第1の符号化部24と第2の符号化部26とによる、2段構成の符号化を行う。ソートされたインデックス値の差分値は、通常小さい値に集中するが、大きい値も含まれる(すなわち、小さい値の出現頻度が高く、大きい値の出現頻度が低い)。2段構成にすることで、第1の符号化部24が出現頻度の高い小さい値を短い符号長で符号化し、第2の符号化部26が出現頻度の低い大きい値を符号化することができるため、1段構成の符号化と比較して平均の符号長をより小さくすることができる。したがって、符号化された特徴量サイズを小さくすることが可能となる。
==第3の実施形態==
次に第3の実施形態について説明する。図6は、本発明の第3の実施形態における特徴量符号化装置の差分符号化部22Cの構成を示す図である。第3の実施形態の特徴量符号化装置は、第1の実施形態の特徴量符号化装置1Aの差分符号化部22を、図6に示す差分符号化部22Cに変更したものである。その他の構成は、図1に示した第1の実施形態における特徴量符号化装置1Aと同じであるため説明を省略する。
図6に示すように、差分符号化部22Cは、第1の符号化部24、第2の符号化部26、及び最適符号化パラメータ決定部28を含んで構成される。このように、差分符号化部22Cは、図4に示した第2の実施形態の差分符号化部22Bに、最適符号化パラメータ決定部28が追加された構成である。なお、第1の符号化部24と第2の符号化部26は、第2の実施形態の差分符号化部22Bに含まれる構成と同じであるため、同一の符号を付して説明を省略する。
最適符号化パラメータ決定部28は、差分値の系列から、符号化した差分値の系列の符号長が最短になるように、第1の符号化部24と第2の符号化部26が行う符号化のパラメータを決定する。
第1の符号化部24と第2の符号化部26は、決定された符号化パラメータを用いて、第2の実施形態の場合と同様に符号化を行う。
具体的な例で、最適符号化パラメータ決定部28の動作を説明する。ここでは、第2の実施形態で述べた、第1の符号化部24がMビットの固定ビット長符号化、第2の符号化部26がNビットの固定ビット長符号化を行う(ただしM<N)場合について、最適符号化パラメータ決定部28の動作を説明する。
この場合、最適符号化パラメータ決定部28は、符号化した差分値の系列の符号長が最短になるように、MとNを決定する。また、最適符号化パラメータ決定部28は、符号化した差分値の系列の復号ができるように、決定したMとNの情報も差分値の系列と共に符号化する。例えば、最適符号化パラメータ決定部28は、符号化された差分値の先頭の先頭に、符号化されたMとNの情報を付加することができる。
例えば、最適符号化パラメータ決定部28は、MとNを変化させたときの、符号化した差分値の系列の全体の符号長を算出し、その符号長が最短となるMとNと決定することができる。具体的には、例えば、第2の実施形態で述べたように、最適符号化パラメータ決定部28は、差分値の系列の最大値から式(5)を用いて、最適なNを決定することができる。そして、Mが決定されれば、最適符号化パラメータ決定部28は、式(6)を用いて、より短いビット長となるNを決定することができる。
また、最適符号化パラメータ決定部28は、Mを変化させたときの、符号化した差分値の系列の全体の符号長を算出し、その符号長が最短となるようにMを決定することとしてもよい。
また、最適符号化パラメータ決定部28は、第1の符号化部24が符号化できる値域内にある差分値の数(または値域外にある差分値の数(第2の符号化部26が符号化する数))を集計することにより、符号化した差分値の系列の符号長を効率的に算出することができる。すなわち、値域内にある差分値の数をA、差分値の系列における差分値の個数をZとすると、全体の符号長はM×A+(M+N)×(Z−A)となる。最適符号化パラメータ決定部28は、この式から、全体の符号長が最短となるMを算出することができる。
第3の実施形態の効果を述べる。第3の実施形態の特徴量符号化装置では、差分符号化部22の最適符号化パラメータ決定部28が、符号化した差分値の系列の符号長が最短になるように符号化のパラメータを決定するので、最短の符号長で符号化することができる。したがって、符号化された特徴量サイズを小さくすることが可能となる。
なお、本実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更/改良され得るととともに、本発明にはその等価物も含まれる。
この出願は、2011年11月18日に出願された日本出願特願2011−253225を基礎とする優先権を主張し、その開示の全てをここに取り込む。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
本実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)画像から特徴点を検出して座標値を出力する特徴点検出部と、前記特徴点の座標値を中心とする局所領域から局所特徴量を抽出する局所特徴量抽出部と、特定の走査方法に従って前記座標値をインデックス値に変換する座標値走査部と、前記インデックス値をソートするソート部と、前記ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力する差分算出部と、前記差分値の系列を系列順に符号化する差分符号化部と、前記ソートされたインデックス値と同じ順列で、対応する特徴点の前記局所特徴量を符号化する局所特徴量符号化部と、を備える特徴量符号化装置。
(付記2)付記1に記載の特徴量符号化装置であって、前記差分符号化部は、前記差分値が符号化可能な値域内であれば差分値を符号化し、差分値が符号化可能な値域外であれば、差分値が符号化可能な値域外であることを示すエスケープコードを符号化する第1の符号化部と、前記第1の符号化部がエスケープコードを符号化した場合に、前記第1の符号化部とは異なる符号化方法で前記差分値を符号化する第2の符号化部と、を備える特徴量符号化装置。
(付記3)付記2に記載の特徴量符号化装置であって、前記差分符号化部は、前記差分値の系列から、符号化した差分値の系列の符号長が最短になるように、前記第1の符号化部及び前記第2の符号化部が行う符号化のパラメータを決定する最適符号化パラメータ決定部をさらに備える、特徴量符号化装置。
(付記4)付記2または3に記載の特徴量符号化装置であって、前記第1の符号化部はMビットの固定ビット長符号化を行い、前記第2の符号化部はMよりも大きいNビットの固定ビット長符号化を行う、特徴量符号化装置。
(付記5)コンピュータが、画像から特徴点を検出して座標値を出力し、前記特徴点の座標値を中心とする局所領域から局所特徴量を抽出し、特定の走査方法に従って前記座標値をインデックス値に変換し、前記インデックス値をソートし、前記ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力し、前記差分値の系列を系列順に符号化し、前記ソートされたインデックス値と同じ順列で、対応する特徴点の前記局所特徴量を符号化する、特徴量符号化方法。
(付記6)コンピュータに、画像から特徴点を検出して座標値を出力する機能と、前記特徴点の座標値を中心とする局所領域から局所特徴量を抽出する機能と、特定の走査方法に従って前記座標値をインデックス値に変換する機能と、前記インデックス値をソートする機能と、前記ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力する機能と、前記差分値の系列を系列順に符号化する機能と、前記ソートされたインデックス値と同じ順列で、対応する特徴点の前記局所特徴量を符号化する機能と、を実現させるためのプログラム。
1A 特徴量符号化装置
10 特徴点検出部
12 局所特徴量抽出部
14 局所特徴量符号化部
16 座標値走査部
18 ソート部
20 差分算出部
22 差分符号化部
24 第1の符号化部
26 第2の符号化部
28 最適符号化パラメータ決定部

Claims (6)

  1. 画像から特徴点を検出して座標値を出力する特徴点検出部と、
    前記特徴点の座標値を中心とする局所領域から局所特徴量を抽出する局所特徴量抽出部と、
    特定の走査方法に従って前記座標値をインデックス値に変換する座標値走査部と、
    前記インデックス値をソートするソート部と、
    前記ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力する差分算出部と、
    前記差分値の系列を系列順に符号化する差分符号化部と、
    前記ソートされたインデックス値と同じ順列で、対応する特徴点の前記局所特徴量を符号化する局所特徴量符号化部と、
    を備える特徴量符号化装置。
  2. 請求項1に記載の特徴量符号化装置であって、
    前記差分符号化部は、
    前記差分値が符号化可能な値域内であれば差分値を符号化し、差分値が符号化可能な値域外であれば、差分値が符号化可能な値域外であることを示すエスケープコードを符号化する第1の符号化部と、
    前記第1の符号化部がエスケープコードを符号化した場合に、前記第1の符号化部とは異なる符号化方法で前記差分値を符号化する第2の符号化部と、
    を備える特徴量符号化装置。
  3. 請求項2に記載の特徴量符号化装置であって、
    前記差分符号化部は、
    前記差分値の系列から、符号化した差分値の系列の符号長が最短になるように、前記第1の符号化部及び前記第2の符号化部が行う符号化のパラメータを決定する最適符号化パラメータ決定部をさらに備える、
    特徴量符号化装置。
  4. 請求項2または3に記載の特徴量符号化装置であって、
    前記第1の符号化部はMビットの固定ビット長符号化を行い、
    前記第2の符号化部はMよりも大きいNビットの固定ビット長符号化を行う、
    特徴量符号化装置。
  5. コンピュータが、
    画像から特徴点を検出して座標値を出力し、
    前記特徴点の座標値を中心とする局所領域から局所特徴量を抽出し、
    特定の走査方法に従って前記座標値をインデックス値に変換し、
    前記インデックス値をソートし、
    前記ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力し、
    前記差分値の系列を系列順に符号化し、
    前記ソートされたインデックス値と同じ順列で、対応する特徴点の前記局所特徴量を符号化する、
    特徴量符号化方法。
  6. コンピュータに、
    画像から特徴点を検出して座標値を出力する機能と、
    前記特徴点の座標値を中心とする局所領域から局所特徴量を抽出する機能と、
    特定の走査方法に従って前記座標値をインデックス値に変換する機能と、
    前記インデックス値をソートする機能と、
    前記ソートされたインデックス値の隣接する2つのインデックス値の差分値を算出して差分値の系列を出力する機能と、
    前記差分値の系列を系列順に符号化する機能と、
    前記ソートされたインデックス値と同じ順列で、対応する特徴点の前記局所特徴量を符号化する機能と、
    を実現させるためのプログラム。
JP2013544321A 2011-11-18 2012-11-15 特徴量符号化装置、特徴量符号化方法、及びプログラム Active JP6070568B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011253225 2011-11-18
JP2011253225 2011-11-18
PCT/JP2012/079676 WO2013073624A1 (ja) 2011-11-18 2012-11-15 特徴量符号化装置、特徴量符号化方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2013073624A1 JPWO2013073624A1 (ja) 2015-04-02
JP6070568B2 true JP6070568B2 (ja) 2017-02-01

Family

ID=48429678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013544321A Active JP6070568B2 (ja) 2011-11-18 2012-11-15 特徴量符号化装置、特徴量符号化方法、及びプログラム

Country Status (3)

Country Link
US (1) US9239850B2 (ja)
JP (1) JP6070568B2 (ja)
WO (1) WO2013073624A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9792528B2 (en) * 2012-01-30 2017-10-17 Nec Corporation Information processing system, information processing method, information processing apparatus and control method and control program thereof, and communication terminal and control method and control program thereof
US9349072B2 (en) * 2013-03-11 2016-05-24 Microsoft Technology Licensing, Llc Local feature based image compression
KR101581131B1 (ko) * 2014-09-11 2015-12-30 이화여자대학교 산학협력단 영상 정보를 전달하는 방법, 영상 부호기 및 영상 복호기
JP6815741B2 (ja) * 2016-03-30 2021-01-20 キヤノン株式会社 画像処理装置および画像処理方法
US11610334B2 (en) * 2017-12-01 2023-03-21 Nec Corporation Image recognition apparatus using an object image data, image recognition method using an object image data, and program
US11818191B1 (en) * 2021-11-11 2023-11-14 Two Six Labs, LLC Stateless lossless compression

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4606069A (en) * 1983-06-10 1986-08-12 At&T Bell Laboratories Apparatus and method for compression of facsimile information by pattern matching
US4974078A (en) * 1989-11-13 1990-11-27 Eastman Kodak Company Digital compression method and system with improved coding efficiency
JP2959916B2 (ja) * 1992-10-28 1999-10-06 松下電器産業株式会社 デジタル・ビデオ・コーダ用のバーサタイルなエスケープ・ラン・レベル・コーダ
US6704494B1 (en) * 1995-03-15 2004-03-09 Kabushiki Kaisha Toshiba Moving picture coding and/or decoding systems, and variable-length coding and/or decoding system
US6104754A (en) * 1995-03-15 2000-08-15 Kabushiki Kaisha Toshiba Moving picture coding and/or decoding systems, and variable-length coding and/or decoding system
US6754268B1 (en) * 1995-09-29 2004-06-22 Kabushiki Kaisha Toshiba Video coding and video decoding apparatus
CN100338630C (zh) * 1997-12-18 2007-09-19 富士胶片株式会社 图像合成系统、装置和方法、分离方法及客户机
JP3615399B2 (ja) * 1998-09-22 2005-02-02 株式会社リコー 画像処理装置および画像処理方法
US6321232B1 (en) * 1998-12-18 2001-11-20 Xerox Corporation Method for creating a geometric hash tree in a document processing system
US6621941B1 (en) * 1998-12-18 2003-09-16 Xerox Corporation System of indexing a two dimensional pattern in a document drawing
US6711293B1 (en) 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
JP2001231037A (ja) * 2000-02-17 2001-08-24 Casio Comput Co Ltd 画像処理システム、画像処理装置、及び記憶媒体
JP2009169884A (ja) 2008-01-21 2009-07-30 Fujifilm Corp 撮影装置および撮影装置の制御方法、画像再生装置および方法並びにプログラム
US8818103B2 (en) 2009-03-04 2014-08-26 Osaka Prefecture University Public Corporation Image retrieval method, image retrieval program, and image registration method
JP5302769B2 (ja) * 2009-05-14 2013-10-02 キヤノン株式会社 スキャン変換装置及び画像符号化装置及びそれらの制御方法
US9094691B2 (en) * 2010-03-15 2015-07-28 Mediatek Singapore Pte. Ltd. Methods of utilizing tables adaptively updated for coding/decoding and related processing circuits thereof
TWI415397B (zh) * 2010-05-19 2013-11-11 Mstar Semiconductor Inc 媒體編碼系統、量化係數編碼裝置及量化係數編碼方法

Also Published As

Publication number Publication date
JPWO2013073624A1 (ja) 2015-04-02
US20140321765A1 (en) 2014-10-30
US9239850B2 (en) 2016-01-19
WO2013073624A1 (ja) 2013-05-23

Similar Documents

Publication Publication Date Title
JP6070568B2 (ja) 特徴量符号化装置、特徴量符号化方法、及びプログラム
CN103400174B (zh) 一种二维码的编码方法、解码方法及系统
KR101611778B1 (ko) 국소 특징 기술자 추출 장치, 국소 특징 기술자 추출 방법, 및 프로그램을 기록한 컴퓨터 판독가능 기록 매체
TWI694712B (zh) 編解碼符號之熵編解碼方法與裝置
JPH11338976A (ja) 文書画像認識装置、その方法、及び記録媒体
CN110021369B (zh) 基因测序数据压缩解压方法、系统及计算机可读介质
KR20150092585A (ko) 이진 영상에 기반한 유전체 데이터 압축 방법 및 장치
TWI567654B (zh) 圖像條碼編碼方法、圖像條碼解碼方法、圖像條碼編碼裝置及圖像條碼解碼裝置
CN114567331A (zh) 一种基于lz77的压缩方法、装置及其介质
JP2006351001A (ja) コンテンツ特徴量抽出方法及び装置及びコンテンツ同一性判定方法及び装置
CN110021368B (zh) 比对型基因测序数据压缩方法、系统及计算机可读介质
JP4093200B2 (ja) データ圧縮方法及びプログラムならびにデータ復元方法及び装置
US20160006455A1 (en) Decoding method, decoding apparatus, and computer-readable recording medium
CN115514967B (zh) 基于二进制块双向编码的图像压缩方法及图像解压方法
JP6821184B2 (ja) 画像復号化装置
KR101006059B1 (ko) 정보 압축방법
JP6160968B2 (ja) ロバスト・インデックス・コード
US10447295B2 (en) Coding method, coding device, decoding method, and decoding device
JP2003189108A (ja) 画像圧縮方法
JP6887232B2 (ja) 符号化装置、符号化方法、復号装置および復号方法
CN117118455A (zh) 数据压缩方法及相关装置
RU165557U1 (ru) Устройство передачи информации на основе qr - кодов
CN111259177A (zh) 一种黑白二值签名图片存储方法和系统
Kountchev et al. New method for adaptive lossless compression of still images based on the histogram statistics
WO2015180139A1 (zh) 图像编码方法、装置以及图像处理设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161219

R150 Certificate of patent or registration of utility model

Ref document number: 6070568

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150