JP3684148B2 - 画像処理方法及びその装置、記憶媒体 - Google Patents

画像処理方法及びその装置、記憶媒体 Download PDF

Info

Publication number
JP3684148B2
JP3684148B2 JP2000321492A JP2000321492A JP3684148B2 JP 3684148 B2 JP3684148 B2 JP 3684148B2 JP 2000321492 A JP2000321492 A JP 2000321492A JP 2000321492 A JP2000321492 A JP 2000321492A JP 3684148 B2 JP3684148 B2 JP 3684148B2
Authority
JP
Japan
Prior art keywords
image
coefficients
feature amount
dct
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000321492A
Other languages
English (en)
Other versions
JP2002133414A (ja
Inventor
康男 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000321492A priority Critical patent/JP3684148B2/ja
Priority to US09/977,318 priority patent/US7149363B2/en
Priority to AU81453/01A priority patent/AU785095B2/en
Priority to EP20010308920 priority patent/EP1199650A3/en
Priority to KR10-2001-0064591A priority patent/KR100464224B1/ko
Publication of JP2002133414A publication Critical patent/JP2002133414A/ja
Application granted granted Critical
Publication of JP3684148B2 publication Critical patent/JP3684148B2/ja
Priority to US11/491,265 priority patent/US7394928B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は画像を処理可能な画像処理方法及びその装置に関する。
【0002】
【従来の技術】
画像を変倍し、生成された変倍画像に対して公知の離散コサイン変換(DCT)処理と量子化処理を行い、その結果得られた係数のうち低周波成分側から幾つかの係数を取り出し、取り出した係数を原画像の特徴量とし、例えば画像検索に用いるデータとする方式が知られている(ISO/IEC JTC1/SC29/WG11/N3522”MPEG−7 Visua1 Working Draft 4.O”(〔VWD4.0〕)、あるいは、IS0/IEC JTC1/SC29/WG11/N3522”MPEG−7 Visua1 part of eXperimentationMode1 Version 7.0”(〔VXM7.O〕))。
【0003】
図1は〔VWD4.0〕もしくは〔VXM7.01〕に記載されている、Co1or Layout descriptorにおける、特徴データ取り出し処理を表す図である。また、図8はその処理の流れを示す流れ図である。
【0004】
原画像10001を8ラ8画素に変倍し(S10401)、生成した8x8画素画像(10011,10012,10013)の各画素をYCbCr色空間データ(10021,10022,10023)に変換する(S10402)。次に、Y,Cb,Crの各成分データ10021,10022,10023に対してDCTを行って(S10403)DCT係数10031,10032,10033を得、さらにDCT係数10031,10032,10033に対して量子化(S10404)を行う。
【0005】
画像変倍処理、色変換処理、DCT変換処理は公知のものでよい。
【0006】
量子化処理は、例えば〔VWD4.0〕によれば、以下のプログラムコード100〜103の示すような処理で実現することができる。プログラムコード10000〜10003は公知のC言語を用いて記述されている。同文書によれば量子化処理は、Y成分とCb/Cr成分それぞれについて、DC成分とAC成分で異なる処理を施すので、同文書には量子化処理としてプログラムコード10000〜10003の4通りが提示されている。
【0007】
【外1】
Figure 0003684148
【0008】
【外2】
Figure 0003684148
【0009】
【外3】
Figure 0003684148
【0010】
【外4】
Figure 0003684148
【0011】
プログラムコード10000,10001による量子化処理の結果、YもしくはCb/Cr成分の量子化されたDCT係数(以下、量子化DCT係数)は0〜64の値になる。またプログラムコード10002,10003による量子化処理の結果YもしくはCb/Cr成分の量子化DCT係数は0〜32の値となる。したがって、量子化DCT係数のDC成分は符号無し6bit,AC成分は符号無し5bitで表現することができる。
【0012】
さらに量子化処理の結果得られた、量子化DCT係数10041,10042,10043のうち低周波数成分側から幾つかの係数を選択する(S10405)。図4の場合は例として、Y成分の係数に関しては6個、Cb/Cr成分の係数に関しては3個ずつ選択している例である。係数選択は、実際は図101に示すジグザグスキャンによって8ラ8と二次元に配置された係数を一次元に並び替え、その先頭から幾つかを選択することによって実現される。図5の10101は、ジグザグスキャンを表す図である。10101各ブロックに書かれている1から64の数字は、一次元に並びかえられた後にその係数が先頭から何番目に配置されるかを示す数字である。
【0013】
最後に、得られた係数の低周波成分側から幾つかの係数を取り出す。〔VWD4.0〕によれば、ここで取り出す係数の数は1,3,6,10,15,21,28,64のいずれかである。また、係数の数は、Cb成分係数とCr成分係数に関しては同数であるが、Y成分係数の数とCb/Cr成分係数の数には別々の数を設定可能である。〔VWD4.0〕によれば、デフォルトではY成分係数に関して6個、Cb/Cr成分係数に関しては3個を選択する。図5では、例としてこのデフォルト時の係数選択である、Y成分係数に関して6個(10051)、Cb/Cr成分係数に関しては3個(10052,10053)を選択している。
【0014】
選択された係数10051,10052,10053をもって原画像10001の特徴データ、すなわちCo1or Layout descriptorデータとする。
【0015】
また、〔VWD4.0〕によれば、このCo1or Layout descriptorは図6や図7に示すようなバイナリ構造で格納される。図6の10201や図7の10301において、正方形は1bitを表現している。また、10201や10301では、説明の便利のためフィールド毎に区切って書いているが、実際は同図に破線の矢印で示しているような順序で連続して格納されている。
【0016】
図6はCo1or Layout descriptorがデフォルトの場合、すなわち、Yの量子化DCT係数6個、Cb/Crの量子化DCT係数が各3個の場合のバイナリ構造を表す図である。この場合、先頭の拡張フラグには“0”が格納されている。さらにそれに後続して、Yの量子化DCT係数が6個、Cbの量子化DCT係数が3個、Crの量子化DCT係数が3個の順に格納されている。量子化DCT係数は前述したように量子化の結果DC成分については符号無し6bit,AC成分については符号無し5bitで表現できるので、DC成分については6bit,AC成分については5bitの領域に格納される。
【0017】
一方、図7はCo1or Layout descriptorがデフォルトでないの場合のバイナリ構造を表す図である。この場合、先頭の拡張フラグには“1”が格納されている。それに後続して、3bitのフィールドが2つ後続する。この3bitのフィールドはそれぞれYの量子化DCT係数の数、Cb/Crの量子化DCT係数の数を表すのに用いられる。
【0018】
【外5】
Figure 0003684148
【0019】
さらに、この2つの3bitの係数指定フィールドに後続してY,Cb,Crの順に量子化DCT係数が格納される。Y,Cb,Crの係数の数は、前述の係数指定フィールドで指定した係数の数である。図7の10301では例としてYの量子化DCT係数が6個、Cb/Crの量子化DCT係数がそれぞれ6個の場合を示している。
【0020】
また、この特徴データ間の類似度については、〔VXM7.0〕によれば以下の式により算出される。例えば、2つのCo1orLayou descriptor,CLD1(YCoeff,CbCoeff,CrCoeff)とCLD2(YCoeff',CbCoeff',CrCoeff')の間の類似度Dは式10001で算出される。
【0021】
【外6】
Figure 0003684148
【0022】
式10001Co1orLayout descriptorの類似度算出式
式10001において、λは各係数に関する重み付けであり、〔VXM7.0〕には次の表10002のような重み付け値が示されている。ここで示されていないものについては、重み付け値は1である。
【0023】
【外7】
Figure 0003684148
【0024】
また、2つのdescriptorの持つ係数の数が異なる場合には、少ない係数に合わせて式10001を適用するか、あるいは不足している係数は16をその値として補い、多い係数に合わせて式10001を適用するということが示されている。
【0025】
【発明が解決しようとする課題】
Co1or Layout descriptorの持つ量子化DCT係数の数の選択は、デフォルトとしてはYについては6個、Cb/Crについては3個となっている。通常、この係数の選択の方式はシステムによって予め定めるなどして、システム内で一様に決定されているか、あるいは1件1件に対してユーザが指定するなどの方法をとる必要があった。
【0026】
しかしながら、デフォルトの係数選択方式は必ずしも万能ではなく、全ての画像についてその特徴を表現するために十分であるとはいえない。不十分な場合には、検索システム全体の検索精度にも悪影響を与えることになる。
【0027】
一方これを回避するために、係数データを多めにとるように係数選択を行ったり、あるいは全ての係数データを保持するといった方法も考えられるが、必然的に特徴量データサイズが大きくなる。これは対象となる画像の数が極端に多かったり、あるいは記憶領域や通信路によってデータ容量が厳しく制限されたりするなど、必ずしも好ましくない場合も存在する。
【0028】
したがって、検索精度に悪影響を与えず、また効率よくCo1orLayout descriptorを使うためには、各画像に対して保持する量子化DCT係数の数を好適に決定する必要がある。
【0029】
【課題を解決するための手段】
上記課題を解決するために、本発明は、画像から第1の画像特徴量を抽出する第1の抽出手段と、該画像から、前記第1の画像特徴量よりデータ量の多い第2の画像特徴量を抽出する第2の抽出手段と、前記第1の抽出手段より抽出された第1の画像特徴量と前記第2の抽出手段により抽出された第2の画像特徴量との類似度を判定する判定手段と、前記判定手段により類似していると判定された場合、前記第1の画像特徴量を、類似していないと判定された場合、前記第2の画像特徴量を前記画像の特徴量として選択する選択手段とを有することを特徴とする画像処理装置を提供する。
【0030】
上記課題を解決するために、本発明は、画像をDCT処理するDCT処理手段と、前記DCT処理手段によりDCT処理されたデータを量子化する量子化手段と、前記量子化手段により量子化された量子化DCT係数の中から抽出する量子化DCT係数の数を原画像が動画像であるか静止画像であるかに応じて選択する係数選択手段と、前記係数選択手段により選択された数の量子化係数を画像特徴量として設定する設定手段とを有することを特徴とする画像処理装置を提供する。
【0031】
上記課題を解決するために、本発明は、画像から第1の画像特徴量を抽出する第1の抽出工程と、該画像から、前記第1の画像特徴量よりデータ量の多い第2の画像特徴量を抽出する第2の抽出工程と、前記第1の抽出工程より抽出された第1の画像特徴量と前記第2の抽出工程により抽出された第2の画像特徴量との類似度を判定する判定工程と、前記判定工程により類似していると判定された場合、前記第1の画像特徴量を、類似していないと判定された場合、前記第2の画像特徴量を前記画像の特徴量として選択する選択工程とを有することを特徴とする画像処理方法を提供する。
【0032】
上記課題を解決するために、本発明は、画像をDCT処理するDCT処理工程と、前記DCT処理工程によりDCT処理されたデータを量子化する量子化工程と、前記量子化工程により量子化された量子化DCT係数の中から抽出する量子化DCT係数の数を原画像が動画像であるか静止画像であるかに応じて選択する係数選択工程と、前記係数選択工程により選択された数の量子化係数を画像特徴量として設定する設定工程とを有することを特徴とする画像処理方法を提供する。
【0033】
上記課題を解決するために、本発明は、画像から第1の画像特徴量を抽出する第1の抽出工程のプログラムコードと、該画像から、前記第1の画像特徴量よりデータ量の多い第2の画像特徴量を抽出する第2の抽出工程のプログラムコードと、前記第1の抽出工程より抽出された第1の画像特徴量と前記第2の抽出工程により抽出された第2の画像特徴量との類似度を判定する判定工程のプログラムコードと、前記判定工程により類似していると判定された場合、前記第1の画像特徴量を、類似していないと判定された場合、前記第2の画像特徴量を前記画像の特徴量として選択する選択工程のプログラムコードとを有することを特徴とする記憶媒体を提供する。
【0034】
上記課題を解決するために、本発明は、画像をDCT処理するDCT処理工程のプログラムコードと、前記DCT処理工程によりDCT処理されたデータを量子化する量子化工程のプログラムコードと、前記量子化工程により量子化された量子化DCT係数の中から抽出する量子化DCT係数の数を原画像が動画像であるか静止画像であるかに応じて選択する係数選択工程のプログラムコードと、前記係数選択工程により選択された数の量子化係数を画像特徴量として設定する設定工程のプログラムコードとを有することを特徴とする記憶媒体を提供する。
【0037】
【発明の実施の形態】
以下、添付の図面を参照して本発明の好適な一実施形態を説明する。
【0038】
<第1の実施形態>
図9は、第1の実施形態における画像特徴量抽出処理が可能な画像処理装置の構成を示すブロック図である。
【0039】
図9において、データ入出力部900は、静止画像データと動画像データの両方を入力可能な画像入力装置である。具体的には、スチル撮影可能なデジタルビデオ装置がある。また、メモリーカード、PCカード等から、USBなどを通して、デジタルカメラなどで撮影した画像等のデータを読み込むことも可能である。また、逆に、画像等のデータをメモリーカードヘ書き込むことも行う。
【0040】
入力部901は、ユーザーからの指示や、データを入力する装置で、キーボードやポインティング装置を含む。なお、ポインティング装置としては、マウス、トラックボール、タブレット等が挙げられる。入力部901の具体的な例としては、画像の入カモードや撮影モードを設定するモード設定手段があげられる。
【0041】
蓄積部902は、画像データや画像特徴量データを蓄積する装置で、通常は、ハードディスクなどが用いられる。表示部903は、GUI等の画像を表示する装置で、一般的に、CRTや、液晶ディスプレイなどが用いられる。
【0042】
904は、CPUであり、上述した各構成の処理の全てに関わる。ROM905と、RAM906は、その処理に必要なプログラム、データ、作業領域などをCPU904に提供する。また、図3、図8のフローチャートで示される処理に必要な制御プログラムは、蓄積部902に格納されているか、ROM905に格納されているものとする。なお、制御プログラムが蓄積部902に格納されている場合は、一旦RAM906に読み込まれてから実行される。なお、システム構成については、上記以外にも、様々な構成要素が存在するが、本発明の主眼ではないので、その説明は省略する。
【0043】
以下に、上記画像処理装置を用いた画像特徴量抽出方式について、図を参照して説明する。
【0044】
まず、Co1or Layout descriptorの画像特徴量抽出のおおまかな流れは、従来技術および図4、図5、図6に示した通りであるので、ここでは割愛する。
【0045】
従来技術においては原画像を縮小した後に色変換をほどこしYCbCrデータを得ているが、本発明による方式においてはDCT処理に対する入力として8x8画素分のYCbCrの画像データがあればよく、例えば原画像全体に対して色変換をほどこし、その後に公知の画像変倍方式によって8x8画素分のYCbCr画像データを得るのであっても、本発明による方式の意図するところである。さらには、原画像が元々YCbCr方式の画像データであるような場合には、色変換処理は冗長であって、省略しても本発明の意図するところと変わらない。
【0046】
以下説明の簡便のため、Y成分の量子化DCTをx個、Cb成分の量子化DCTをy個、Cr成分の量子化DCTをz個保持するCo1or Layout descriptorを、x/y/z descriptorと略記することとする。
【0047】
今、ある画像のCo1or Layout descriptorを作成する場合を考える。例えば、図1に示すように、6/3/3と6/6/6の2つの係数選択方式を候補とし、それらのうち一つを選択するとする。
【0048】
図1は、ある画像に対する画像特徴量データのための係数選択を示す図である。図1において、101はY成分の量子化DCT係数(の一部)、102はCb成分の量子化DCT係数(の一部)、103はCr成分の量子化DCT係数(の一部)を表している。原画像から、101〜103の量子化DCT係数を得る方法は、図4に示してある。
【0049】
これらの係数は、図5にあるようなジグザグスキャン処理により、図1の111〜113に示すように一次元に配置される。
【0050】
次に、一次元に配置された量子化DCT係数から係数選択を行う。ここで、例えば6/3/3で選択を行うと、図1の121で示すような係数の組が抽出される。またあるいは6/6/6で選択を行うと、図1の122で示すような係数の組が選択される。
【0051】
もし、量子化係数の組121と量子化係数の組122の表す原画像の特徴が、十分に近いならば、量子化係数の組121の方が、データ量が小さいという利点がある。しかし逆に、これらがあまり近くないならば、量子化係数の組121は原画像の特徴を一部損なっている可能性がある。したがって、なんらかの基準によって、これを選択することとなる。
【0052】
この選択をするために、本実施例では、量子化係数の組121と量子化係数の組122の間の距離を考える。〔VXM7.0〕によれば、descriptorの距離計算において、比較する2つのdescriptorの係数の数が異なる場合には、係数の数の少ないdescriptorに合わせて係数の数が多いdescriptorの一部係数を無視するか、あるいは係数の数の多いdescriptorに合わせて、係数の数の少ないdescriptorが持っていない係数部分には16を補う、という方法が示されている。
【0053】
前者の場合、121と122の一部係数を取り除いて係数の数が同じになるようにしたものは、常に同一であるが、後者の場合、122のCb4〜Cb6,Cr4〜Cr6の値によっては、121と122は一致しない。図2の121′は、121に対して、その不足している係数成分に16を補ったものを表している。
【0054】
本実形態では、この121'と122の間の距離を考える。両者の距離が非常に近いならば、両者が表す原画像の特徴は近く、すなわち121と122の特徴が近いと考えられる。その場合には、データ量的に有利な121(6/3/3)を選択し、そうでないならば、122を選択する。
【0055】
121′と122の間の距離には様々な方法が考えられるが、本実施例では121′と122の対応する係数の絶対差の合計を考える。すなわち、次式で与えられるdを考える。
【0056】
【外8】
Figure 0003684148
【0057】
式1:本発明による、2つのdescriptorの距離を測る式の例(1)
ここで、121′と122の場合、
・Yi=Yi′(1≦i≦6)
・Cbj=Cb′j (1≦j≦3)
・Crk=Cr′k (1≦k≦3)
・Cb′j=Cr′k=16 (4≦k≦6)
が成立する。ここで、Y'i,Cb'j,Cr'kは122の係数を、Y'i,Cb'j,Cr'kは121'の係数を表しているものとする。これを、代入すると、式1は次のようになる。
【0058】
【外9】
Figure 0003684148
【0059】
式2:本発明による、2つのdescriptorの距離を測る式の例(2)
次に、このdの値を、予め定めておいたしきい値Thと比較する。もし、dがThより小さいならば、121'と122は十分に近いと判断し、121、すなわち6/3/3の量子化DCT係数を選択する。そうでない場合には、122、すなわち6/6/6の量子化DCT係数を選択する。ここで、しきい値Thの値は任意の正の値で良い。また、何らかの条件によって動的に決定するのでも良いし、あるいは経験的な方法などで予め定めておいた値であっても良い。
【0060】
本実施形態では、2つのdescriptorの距離を判定するのに、対応する係数の絶対差の合計を用いたが、この他の距離定義であっても構わない。例えば〔VXM7.0〕の式10001によるような距離定義であっても構わない。また、単一の式で判定を行ったが、例えばY,Cb,Cr色成分各々について判定処理を行い、そのand条件、or条件によって判定するのでも良い。
【0061】
本実施形態では、量子化DCT係数の数の候補として、6/6/6と6/3/3を候補とする場合のみを説明したが、他のパターンであっても良い。
【0062】
図3は上記係数選択判断処理の処理の流れを示す図である。
【0063】
まず、S301で、第一の画像特徴量データを取り出す。これは本実施例の場合例えば121を取り出す処理に相当する。次にS302で、第二の画像特徴量データを取り出す。これは本実施例の場合例えば122を取り出す処理に相当する。
【0064】
次に、S303では、2つの画像特徴量データの間の距離を算出する。すなわち本実施例においては、量子化DCT係数121より121'を作成し、121'と122の間の距離dを、例えば式1もしくは式2によるような式によって算出する。
【0065】
さらに、算出された距離dはS304においてしきい値と比較される。このしきい値より距離dが小さかった場合は、データ量的に小さくて有利なほうの、より係数の数の少ない画像特徴量データを選択し(S305)、そうでなかった場合は、処理はS306に流れ、より係数の数が多い特徴量データを選択する。
【0066】
このようにして選択された係数の数による量子化DCT係数を用いてCo1or Layout descriptorを作成する。
【0067】
<第2の実施形態>
第一の実施形態では、descriptorデータの値に応じて量子化DCT係数の数を決定したが、この他にも、例えばその画像の撮影条件などで変更するのであっても良い。
【0068】
例えば、経験的に動画像データはダイナミックレンジが比較的小さく、6/3/3で十分に表現可能である場合があることがわかっている。一方静止画像は高精細な画像も多く、6/6/6でないと十分に表現されない場合が多いことがわかっている。
【0069】
そこで、本実施例では6/3/3と6/6/6の選択の場合に、原画像の撮影条件によって変更する。すなわち、
・原画像が動画像ならば、6/3/3
・原画像が静止画像ならば、6/6/6
の量子化DCT係数を保持するようにする。原画像が動画像か静止画像かというのは、例えば原画像データのMIME−Typeやファイル名の拡張子等から判断するのでもよいし、例えば本発明を動画像と静止画像の両方を撮影可能な例えば公知のデジタルビデオ撮影装置に適用したような場合には、その撮影モード(例えばダイヤルなどによってユーザが指定する)から判定するのでも良い。
【0070】
なお、本発明は、複数の機器(例えばホストコンピュータ,インタフェイス機器,リーダ,プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用してもよい。
【0071】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0072】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0073】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0074】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0075】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0076】
以上、説明したように、8画素×8画素の画像に対して、公知の離散コサイン変換と、さらに量子化処理を施して得られる、量子化されたDCT係数のうち、低周波数成分側から幾つかの係数を選択して取り出し、取り出された係数を原画像の特徴量とする画像特徴量抽出方式において、原画像に応じて抽出する係数の数を変更させることによって、好適な係数の数を選択可能となる。
【0077】
【発明の効果】
検索精度に悪影響を与えず、また効率よく画像を検索するための画像特徴量を決定することが可能になった。
【図面の簡単な説明】
【図1】特徴データ取り出し処理を表す図である。
【図2】係数の数が異なるdescriptor比較の時の処理を示す図である。
【図3】係数選択判断処理の処理の流れを示す図である。
【図4】Co1or Layout descriptorの特徴抽出処理を示す図である。
【図5】ジグザグスキャン処理を示す図である。
【図6】Co1or Layout descriptorのバイナリ格納方式(デフォルト)を示す図である。
【図7】Co1or Layout descriptorのバイナリ格納方式を示す図である。
【図8】Co1or Layout descriptorの特徴抽出処理の流れを示す流れ図である。
【図9】本発明の画像処理装置の構成を示すブロック図である。

Claims (16)

  1. 画像から第1の画像特徴量を抽出する第1の抽出手段と、
    該画像から、前記第1の画像特徴量よりデータ量の多い第2の画像特徴量を抽出する第2の抽出手段と、
    前記第1の抽出手段より抽出された第1の画像特徴量と前記第2の抽出手段により抽出された第2の画像特徴量との類似度を判定する判定手段と、
    前記判定手段により類似していると判定された場合、前記第1の画像特徴量を、類似していないと判定された場合、前記第2の画像特徴量を前記画像の特徴量として選択する選択手段と、
    を有することを特徴とする画像処理装置。
  2. 前記画像特徴量は、前記画像を変倍し、生成された変倍画像に対してDCT処理と量子化処理を行い、その結果を得られた係数のうち低周波成分側から幾つかの係数を取り出したものであることを特徴とする請求項1に記載の画像処理装置。
  3. 前記第1の抽出手段と前記第2の抽出手段は、前記係数の取り出す数が異なることを特徴とする請求項に記載の画像処理装置。
  4. 画像をDCT処理するDCT処理手段と、
    前記DCT処理手段によりDCT処理されたデータを量子化する量子化手段と、
    前記量子化手段により量子化された量子化DCT係数の中から抽出する量子化DCT係数の数を原画像が動画像であるか静止画像であるかに応じて選択する係数選択手段と、
    前記係数選択手段により選択された数の量子化係数を画像特徴量として設定する設定手段と、
    を有することを特徴とする画像処理装置。
  5. 前記係数選択手段により選択された量子化DCT係数の数に基づいて、低周波数成分側から量子化DCT係数を取り出す取り出し手段とを有することを特徴とする請求項に記載の画像処理装置。
  6. 前記設定手段は、Y/Cb/Cr成分の量子化された量子化DCT係数をジグザグスキャンによって並び替え、原画像が静止画像である場合はY/Cb/Cr成分の量子化DCT係数の低周波数成分側から各々先頭6個ずつを選択し、原画像が動画像である場合は、Y成分の量子化DCT係数を低周波数成分側から先頭6個、Cb/Cr成分の量子化DCT係数を低周波数成分側から各々先頭3個ずつを選択することを特徴とする請求項に記載の画像処理装置。
  7. 静止画像データと動画像データの両方を入力可能な画像入力手段
    画像入力モードに応じて入力された画像が静止画像であるか動画像のあるフレーム画像であるかを判定する判定手段を有することを特徴とする請求項に記載の画像処理装置。
  8. 画像から第1の画像特徴量を抽出する第1の抽出工程と、
    該画像から、前記第1の画像特徴量よりデータ量の多い第2の画像特徴量を抽出する第2の抽出工程と、
    前記第1の抽出工程より抽出された第1の画像特徴量と前記第2の抽出工程により抽出された第2の画像特徴量との類似度を判定する判定工程と、
    前記判定工程により類似していると判定された場合、前記第1の画像特徴量を、類似していないと判定された場合、前記第2の画像特徴量を前記画像の特徴量として選択する選択工程と、
    を有することを特徴とする画像処理方法。
  9. 前記画像特徴量は、前記画像を変倍し、生成された変倍画像に対してDCT処理と量子化処理を行い、その結果を得られた係数のうち低周波成分側から幾つかの係数を取り出したものであることを特徴とする請求項に記載の画像処理方法。
  10. 前記第1の抽出工程と前記第2の抽出工程は、前記係数の取り出す数が異なることを特徴とする請求項に記載の画像処理方法。
  11. 画像をDCT処理するDCT処理工程と、
    前記DCT処理工程によりDCT処理されたデータを量子化する量子化工程と、
    前記量子化工程により量子化された量子化DCT係数の中から抽出する量子化DCT係数の数を原画像が動画像であるか静止画像であるかに応じて選択する係数選択工程と、
    前記係数選択工程により選択された数の量子化係数を画像特徴量として設定する設定工程と、
    を有することを特徴とする画像処理方法。
  12. 前記係数選択工程により選択された量子化DCT係数の数に基づいて、低周波数成分側から量子化DCT係数を取り出す取り出し工程とを有することを特徴とする請求項11に記載の画像処理方法。
  13. 前記設定工程は、Y/Cb/Cr成分の量子化された量子化DCT係数をジグザグスキャンによって並び替え、原画像が静止画像である場合はY/Cb/Cr成分の量子化DCT係数の低周波数成分側から各々先頭6個ずつを選択し、原画像が動画像である場合は、Y成分の量子化DCT係数を低周波数成分側から先頭6個、Cb/Cr成分の量子化DCT係数を低周波数成分側から各々先頭3個ずつを選択することを特徴とする請求項11に記載の画像処理方法。
  14. 静止画像データと動画像データの両方を入力可能な画像入力工程
    画像入力モードに応じて入力された画像が静止画像であるか動画像のあるフレーム画像であるかを判定する判定工程を有することを特徴とする請求項に記載の画像処理装置。
  15. 画像から第1の画像特徴量を抽出する第1の抽出工程のプログラムコードと、
    該画像から、前記第1の画像特徴量よりデータ量の多い第2の画像特徴量を抽出する第2の抽出工程のプログラムコードと、
    前記第1の抽出工程より抽出された第1の画像特徴量と前記第2の抽出工程により抽出された第2の画像特徴量との類似度を判定する判定工程のプログラムコードと、
    前記判定工程により類似していると判定された場合、前記第1の画像特徴量を、類似していないと判定された場合、前記第2の画像特徴量を前記画像の特徴量として選択する選択工程のプログラムコードと、
    を有することを特徴とする記憶媒体。
  16. 画像をDCT処理するDCT処理工程のプログラムコードと、
    前記DCT処理工程によりDCT処理されたデータを量子化する量子化工程のプログラムコードと、
    前記量子化工程により量子化された量子化DCT係数の中から抽出する量子化DCT係数の数を原画像が動画像であるか静止画像であるかに応じて選択する係数選択工程のプログラムコードと、
    前記係数選択工程により選択された数の量子化係数を画像特徴量として設定する設定工程のプログラムコードと、
    を有することを特徴とする記憶媒体。
JP2000321492A 2000-10-20 2000-10-20 画像処理方法及びその装置、記憶媒体 Expired - Fee Related JP3684148B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2000321492A JP3684148B2 (ja) 2000-10-20 2000-10-20 画像処理方法及びその装置、記憶媒体
US09/977,318 US7149363B2 (en) 2000-10-20 2001-10-16 Image processing method, apparatus therefor and storing medium
AU81453/01A AU785095B2 (en) 2000-10-20 2001-10-18 Image processing method, apparatus therefor and storing medium
EP20010308920 EP1199650A3 (en) 2000-10-20 2001-10-19 Image indexing method
KR10-2001-0064591A KR100464224B1 (ko) 2000-10-20 2001-10-19 화상처리방법 및 그 장치, 기억매체
US11/491,265 US7394928B2 (en) 2000-10-20 2006-07-24 Selection of coefficients for quantization processing based on whether an original image is a still image or a moving image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000321492A JP3684148B2 (ja) 2000-10-20 2000-10-20 画像処理方法及びその装置、記憶媒体

Publications (2)

Publication Number Publication Date
JP2002133414A JP2002133414A (ja) 2002-05-10
JP3684148B2 true JP3684148B2 (ja) 2005-08-17

Family

ID=18799608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000321492A Expired - Fee Related JP3684148B2 (ja) 2000-10-20 2000-10-20 画像処理方法及びその装置、記憶媒体

Country Status (5)

Country Link
US (2) US7149363B2 (ja)
EP (1) EP1199650A3 (ja)
JP (1) JP3684148B2 (ja)
KR (1) KR100464224B1 (ja)
AU (1) AU785095B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3684148B2 (ja) 2000-10-20 2005-08-17 キヤノン株式会社 画像処理方法及びその装置、記憶媒体
JP5239367B2 (ja) * 2007-03-19 2013-07-17 富士通株式会社 情報提供システム、情報提供プログラムおよび情報提供方法
JP5096776B2 (ja) 2007-04-04 2012-12-12 キヤノン株式会社 画像処理装置及び画像検索方法
CN102349091B (zh) * 2009-03-13 2014-08-06 日本电气株式会社 图像签名匹配设备
TWI561060B (en) * 2015-01-15 2016-12-01 Mstar Semiconductor Inc Signal processing apparatus and signal processing method including quantization or inverse-quantization process

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0214672A (ja) * 1988-06-30 1990-01-18 Dainippon Screen Mfg Co Ltd 画像データ圧縮方法
US5063608A (en) * 1989-11-03 1991-11-05 Datacube Inc. Adaptive zonal coder
JPH06333046A (ja) 1993-05-18 1994-12-02 Nippon Avionics Co Ltd 画像の特徴量抽出装置
JPH0778256A (ja) * 1993-06-17 1995-03-20 Omron Corp 特徴量選択方法及び装置
JP2531106B2 (ja) * 1993-08-17 1996-09-04 日本電気株式会社 動画像符号化制御方式
US5712809A (en) * 1994-10-31 1998-01-27 Vivo Software, Inc. Method and apparatus for performing fast reduced coefficient discrete cosine transforms
WO1998009436A1 (en) * 1996-08-30 1998-03-05 Sony Corporation Device, method, and medium for recording still picture and animation
JPH10108121A (ja) * 1996-09-25 1998-04-24 Nikon Corp 電子カメラ
JPH10254993A (ja) * 1997-03-12 1998-09-25 Canon Inc 文字抽出装置及び文字抽出方法
JP3209171B2 (ja) * 1998-01-08 2001-09-17 日本電気株式会社 動画像符号化装置
JPH11212993A (ja) 1998-01-27 1999-08-06 Minolta Co Ltd 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体
US6720971B1 (en) * 1998-05-29 2004-04-13 Canon Kabushiki Kaisha Image processing method and apparatus, and storage medium
US6633685B1 (en) * 1998-08-05 2003-10-14 Canon Kabushiki Kaisha Method, apparatus, and storage media for image processing
JP3496559B2 (ja) * 1999-01-06 2004-02-16 日本電気株式会社 画像特徴量生成装置、並びに画像特徴量生成方法
US6665090B1 (en) * 2000-03-13 2003-12-16 Hewlett-Packard Development Company, L.P. System and method for creating and printing a creative expression
JP3684148B2 (ja) 2000-10-20 2005-08-17 キヤノン株式会社 画像処理方法及びその装置、記憶媒体

Also Published As

Publication number Publication date
KR100464224B1 (ko) 2005-01-03
US7149363B2 (en) 2006-12-12
US20020071609A1 (en) 2002-06-13
AU785095B2 (en) 2006-09-14
KR20020031069A (ko) 2002-04-26
US7394928B2 (en) 2008-07-01
EP1199650A2 (en) 2002-04-24
JP2002133414A (ja) 2002-05-10
US20060257035A1 (en) 2006-11-16
EP1199650A3 (en) 2011-07-20
AU8145301A (en) 2002-05-02

Similar Documents

Publication Publication Date Title
US8159550B2 (en) Presenting images as mosaics
US8134578B2 (en) Hybrid importance maps for content aware digital image resizing
JP4738943B2 (ja) 画像処理装置およびその方法
JP2005235175A (ja) コンテンツエンジンのためのexifに基づく画像の特徴セット
JP2002535751A (ja) 領域に基づいた画像の保管及び検索システム
US20060274081A1 (en) Image retrieving apparatus, image retrieving method, program, and storage medium
US20080219563A1 (en) Configuration of a plurality of images for multi-dimensional display
JP4078085B2 (ja) 変倍画像生成装置、方法、及びそのコンピュータプログラムとコンピュータ読み取り可能な記憶媒体
US6718075B1 (en) Image search method and apparatus
US6928186B2 (en) Semantic downscaling and cropping (SEDOC) of digital images
EP1574991A1 (en) Similar image extraction device, similar image extraction method, and similar image extraction program
JP2003006643A (ja) 画像処理装置及びその方法、プログラム
JP3684148B2 (ja) 画像処理方法及びその装置、記憶媒体
JP2010102502A (ja) 画像処理装置、画像処理方法およびプログラム
JP2004334341A (ja) 文書検索装置、文書検索方法及び記録媒体
JP4001446B2 (ja) 画像背景色特定のための方法、装置及びコンピュータ読み取り可能な記録媒体
JP2001134765A (ja) 画像検索方法及び装置
JP3774498B2 (ja) 画像処理方法とその装置
JP4290080B2 (ja) 画像処理装置および画像処理方法およびコンピュータプログラム
JP3814499B2 (ja) 画像処理装置及びその方法、プログラム
US8395819B2 (en) Image processing device, image processing method and computer readable medium
US7515306B2 (en) Document display method and apparatus
JPH11187231A (ja) 画像検索装置及び画像検索方法
JPH0774966A (ja) 画像処理装置
JP2004236170A (ja) 画像データ処理方法、画像データ処理装置ならびにプログラム、記憶媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050113

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050304

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050527

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100603

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130603

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees