JP4078136B2 - 画像認識方法、画像認識装置及びコンピュータプログラム - Google Patents

画像認識方法、画像認識装置及びコンピュータプログラム Download PDF

Info

Publication number
JP4078136B2
JP4078136B2 JP2002193622A JP2002193622A JP4078136B2 JP 4078136 B2 JP4078136 B2 JP 4078136B2 JP 2002193622 A JP2002193622 A JP 2002193622A JP 2002193622 A JP2002193622 A JP 2002193622A JP 4078136 B2 JP4078136 B2 JP 4078136B2
Authority
JP
Japan
Prior art keywords
image
partial
extracted
target
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002193622A
Other languages
English (en)
Other versions
JP2004038482A5 (ja
JP2004038482A (ja
Inventor
茂 溝口
尚久 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002193622A priority Critical patent/JP4078136B2/ja
Priority to US10/608,001 priority patent/US7356190B2/en
Publication of JP2004038482A publication Critical patent/JP2004038482A/ja
Publication of JP2004038482A5 publication Critical patent/JP2004038482A5/ja
Priority to US11/970,359 priority patent/US7542615B2/en
Application granted granted Critical
Publication of JP4078136B2 publication Critical patent/JP4078136B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は画像認識方法、画像認識装置及びコンピュータプログラムに係わり、特に、圧縮された画像データ形式であるJpegファイル画像を認識するために用いて好適なものである。
【0002】
【従来の技術】
デジタルカメラなどで撮影したJpegファイル画像を、PCプリンタもしくはダイレクトプリンタなどから印刷を行う場合や、DPEでプリントを行う場合がある。この時に、撮影画像データが良質な場合は忠実にプリントすればよいので問題は生じない。
【0003】
しかしながら、撮影画像データによっては色被り、コントラスト不足、露出の不適切などがあり、良質な印刷結果を得るためには画像補正を施す必要がある。特に、人物を撮影した画像の場合には、一般に、人の顔の色が適正になるようにプリントすると写真を見た人に与える感じが良くなり、写真の質を高めることになる。
【0004】
銀塩写真の場合、質の良い写真を得るためには原画像ごとに焼き付け時の露光量を変更することが好ましく、この焼付け時の露光量を決めるのに、人物が入った写真の場合には、人の顔の色に着目するのが便利である。何故ならば、人の顔は肌色であることが分かっているために、焼き付けられた写真における人の顔の色が肌色になるように露光量を決めることが可能であるからである。
【0005】
また、デジタルデータの画像ファイルから画像認識する方法としては、例えば“特開平8-161497号”、“特開2000-48036”、“特開平11-238067号”などが知られている。
【0006】
これらの方法は、指定画像との類似度や一致度を検出するもので、“特開平8-161497号”の場合は、直流成分によるブロック単位での粗一致を求め、その後、候補画像領域に対して復元処理を行い、非圧縮データとして微一致を求める方式である。
【0007】
また、“特開2000-48036”の場合は、検索データを入力作成し、このデータと複数の画像データの類似度を判定する画像処理装置である。さらに、“特開平11-238067号”の場合は、検索対象画像をウェーブレット変換して圧縮画像を作成する。また、指定された画像にもウェーブレット変換を施し、各々の特徴データを比較することで、類似度を判定するようにしている。
【0008】
また、デジタルカメラで撮影した画像をプリントする際に、アプリケーションやプリンタドライバのアプリケーションにより、撮影データをヒストグラムなどで解析し、コントラスト、ホワイトバランス、露出補正、シャープネスなど画像補正を一様に施すものが知られている。
【0010】
【発明が解決しようとする課題】
デジタルカメラなどで撮影したJpegファイル画像をプリントする場合に、銀塩写真のプリントのように、人物など注目画像が、より良くプリント出来るように必要に応じて補正を行えるように、上記Jpegファイル画像の中に注目画像を見つけ出す方法を決める必要がある。
【0011】
また、デジタルカメラからプリンタへ直接プリントを行うダイレクトプリントなどデータ処理能力の低い機器でも使用出来るように、検出処理は出来うるだけ軽く済む方法が求められていた。
【0012】
また、先願に対しては、JPEGによる圧縮画像の圧縮比率に関わる量子化テーブルの値が、撮影時やアプリケーションによる編集後の再保存により一様ではなく、高圧縮の量子化テーブルを使用すると、画像中の空間周波数が極端に変化してしまい、注目画像における周波数特徴量も影響を受け、検出精度が落ちてしまう可能性があった。
【0013】
本発明は上述の問題点にかんがみ、画像ファイルの中の注目画像を検出する際に量子化テーブルの特性を利用した判定を行うようにして、処理負荷の少ない方法で注目画像を検出できるようにすることを目的とする。
【0014】
【課題を解決するための手段】
本発明の画像認識方法は、複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用する画像認識方法であって、上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータ及び量子化テーブルを抽出する抽出工程と、上記抽出工程によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、上記抽出工程で抽出された量子化テーブル内の各値の加算値が所定値以下の場合、前記検出されたブロックの交流周波数成分の各値が、注目画像の空間周波数特性適正範囲内に収まっているか否かを判断し、その判断結果に基づいて上記部分領域が注目画像対象部分に入っているか否かを判定する判定工程とを有することを特徴とする。
【0015】
本発明の画像認識装置は、複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用する画像認識装置であって、上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータ及び量子化テーブルを抽出する抽出手段と、上記抽出手段によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、上記抽出工程で抽出された量子化テーブル内の各値の加算値が所定値以下の場合、前記検出されたブロックの交流周波数成分の各値が、注目画像の空間周波数特性適正範囲内に収まっているか否かを判断し、その判断結果に基づいて上記部分領域が注目画像対象部分に入っているか否かを判定する判定手段とを有することを特徴とする。
【0016】
本発明のコンピュータプログラムは、複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用する工程をコンピュータに実行させるコンピュータプログラムであって、上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータ及び量子化テーブルを抽出する抽出工程と、上記抽出工程によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、上記抽出工程で抽出された量子化テーブル内の各値の加算値が所定値以下の場合、前記検出されたブロックの交流周波数成分の各値が、注目画像の空間周波数特性適正範囲内に収まっているか否かを判断し、その判断結果に基づいて上記部分領域が注目画像対象部分に入っているか否かを判定する判定工程とをコンピュータに実行させることを特徴とする。
【0018】
【発明の実施の形態】
次に、添付図面を参照しながら本発明の画像認識方法、画像認識装置及びコンピュータプログラムの実施の形態を説明する。最初に、一般的なデジタルカメラのデータ圧縮記録形式であるJpegファイル形式の画像データを印刷する際に、非圧縮データへ復元する前に、ブロック(8*8画素)ごとに輝度、色度ベースのDCT(離散コサイン変換)されたデータも取得し、注目画像検索のために利用する。
【0019】
この時、画像圧縮に利用している量子化テーブルの特性が適応範囲に入っているものは、画像データブロックごとの周波数(交流)成分情報等を取得することにより、入力画像ごとに用意された部分領域の特徴量との比較を通じて利用可能となり、高度な計算をする必要をなくすことが可能となる。また、出力サイズとの関係で効果に対する処理効率を高めることが可能となる。
【0020】
「第1の実施の形態」
最初に、現在、最も一般的な画像圧縮ファイルの“Jpegファイル”の情報省略と符号化・復号化について説明する。
【0021】
まず、符号化であるが、通常、デジタルカメラやデジタルビデオなどでは、静止画をJpeg ファイルにて保存することが一般的になっている。この場合、入力機器の受光素子であるCCDなどの入った信号をA/D変換した後、フレームメモリーに取り込み、RGBもしくはCMYフィルタの情報を輝度と色度情報とに変換する。その後、8*8(64個)正方画素ブロックに分割する。
【0022】
図3の▲1▼は、輝度データのビットマップを8*8ブロックに分割したうちの1ブロックのデータ例を示している。また、図3の▲2▼においては、0〜255の画素値をレベルシフトして−128〜127の信号に変換する例を示している。さらに、図3の▲3▼においては、DCT(離散コサイン変換)によりDCT係数を求める例を示している。
【0023】
また、図3の▲4▼は、視覚特性を考慮した高周波成分の省略を大きくした量子化テーブルであり、このテーブルを用いて、上記図3の▲3▼の結果であるDCT係数に対して量子化する例を示している。
【0024】
図3の▲5▼は、量子化を行った結果である。この値をエントロピー符号化してハフマン符号で表すことにより符号化信号である圧縮データを生成する。
【0025】
次に、復号化においては、上述した符号化の逆の工程を行う。つまり、符号化信号を復号して、量子化DCT係数の値を復号する。次に、逆量子化を行うために量子化テーブルを乗ずることでDCT係数を得る。その後、逆DCTを行うことでレベルシフトした画像が復元され、更に逆レベルシフトの値128を加算することで1ブロックの画像が復号される。
【0026】
上記の説明では、輝度情報と色度情報とに分割したデータを合成してRGB画像に変換することを省略したが、符号化における流れとしては、図2に示すように、カラー画像を輝度成分(Y)と2つの色度成分(Cb、Cr)とに変換し、その各々を符号化して合成することで、圧縮画像データを生成している。
【0027】
以上のような、圧縮された画像データファイルであるJpeg画像をプリントする方法としては、入力機器からの圧縮画像データをUSBや記憶メディアによって、パーソナルコンピュータ(以下、PCとする)に取り込んで画像を展開し、必要に応じて画像補正を加えた後プリンタへデータを送る場合や、入力機器からの画像データを直接プリンタへ入力し、プリンタの中で、画像を解凍し、必要に応じて画像補正を加えた後で印刷を行うなど、幾種類かの選択肢がある。
【0028】
いずれにしても、良好な画像をプリントするためには、撮影画像データが良質な撮影画像であるか、あるいは補正が必要な画像であるのかを判断して、忠実に印刷すべき良質な画像と、補正を行うことにより良質な画像に近付けた後に印刷を行うもとをより分ける必要がある。
【0029】
良好な画像とは、下記のようなことが考えられる。
1)ホワイトバランスが良好である。
2)コントラストが適切である。
3)必要な部分の階調が割り当てられている。つまり、露出設定が良好である。
4)彩度が適正である。
5)銀塩写真のような仕上がりである。
6)人物など注目される画像が中心に補正されている。
【0030】
現在市販のPCプリンタやPCを経由しないダイレクトプリンタなどにおいても上記1)〜5)の項目においては、程度の差も有るが行われている。また、上記6)の注目画像に対する補正が行われていないのは、その検出に多大な処理が必要であることと、その方法が確立されていないことによる。
【0031】
特に、処理能力のひ弱なダイレクトプリンタなどにおいては実施が難しいとされているが、本発明はこれを解決するものである。その手段としては、Jpeg画像ファイルに注目画像の存在の検出と、その検出した画像に対する補正の必要等の確認を経て、全体画像補正へ受け渡す方法となる。
【0032】
図1は、Jpeg ファイルを解凍する過程とその際に取得する情報について表したブロック図である。
Jpeg ファイルをRGBのビットマップデータへ変換する過程においては、まず、符号テーブル2を用いてエントロピー復号化手段1にてエントロピー復号を行う。次に、逆量子化手段3において、逆量子化に使用する量子化テーブル4を、逆量子化を行う他にデータとして記憶する。
【0033】
この逆量子化されたデータは、ブロック単位のデータとして周波数変換されたものであり、このデータを、画像周波数特性を得るためのデータとして取得する。その後、逆DCT手段5において、逆DCT処理と逆レベルシフトとを行いYcc−RGB変換することで、通常のRGBビットマップデータに展開する。
【0034】
次に、この画像において、最も重要と思われる注目画像検出である人物検出のフローチャートを図6に示す。
最初のステップS601において、8*8画素のブロック単位のDCTデータと量子化テーブルとを取得すると同時に、画像ファイルはRGBビットマップデータに展開する。
次に、ステップS602に進んで、RGBビットマップデータにおいて、8*8画素のブロック単位に本実施の形態における注目画像である人の肌色の色度に対応するか検索を行う。
【0035】
この場合、入力画像サイズにより8*8画素ブロックの画像が全画像に対して占める割合が違うので、入力画像サイズに比例した端部の設定を行う。例えばVGA(640*480)では8ブロック分で、UXGA(1600*1200)画像においては20ブロック分とする。
【0036】
色度の検索方法としては、複数の方法がある。知られているものとしては、
1)B(青)/G(緑)の比率が0.7〜0.8の範囲に収まり、R(赤)/G(緑)の比率が1.4〜1.8の範囲に収まる色度を持つもの。
2)図5の概念図に示すように、肌色を確率楕円にて表すことができる。求める式としては下記の式(1)〜式(3)になる。
【0037】
【数1】
Figure 0004078136
【0038】
本実施の形態においては、処理の簡便さを考慮に入れた下記式(4)である色度分布範囲を肌色の色度範囲とした。この範囲を表したのが図20である。
【0039】
【数2】
Figure 0004078136
【0040】
本実施の形態においては、画像における周波数成分の特徴を検出する単位として8*8画素単位のブロックで行っている関係で、構造的論理的な簡単さより色度判定においても8*8画素単位にて実行する。
【0041】
図7は、本実施の形態で用いている色度検出ポイントを図示したものである。これによると「8*8画素」単位のブロックの四隅の色度の全てが色度範囲に入っているか否かを確認し、全てが範囲に入っている時は、そのブロックを適合色度と判定している。
【0042】
図7においては、上段の左から2番目と下段の左から1,2,3ブロックが該当する。上段の一番左のブロックは4ポイントのうち左上の式度は非肌色ピクセルと判定されるので、これを含むブロックは肌色の範囲外と判定される。同じように上段の右側1,2ブロックと下段の一番右のブロックが範囲外となる。
【0043】
図8は、「8*8画素」単位のブロック全体の平均色度による判定である。このブロック内の平均色度の求め方としては、8*8ブロック全ての画素値の平均値を取る方法の他に、解凍中の逆DCTを行う前の色度データ(Cb,Cr)の中のDC成分から求めることも可能である。この方式の利点としては、ブロック全体の色調にて判定できるので、検出点の少ないものに比べて精度が高い期待ができる。ここで、自然画における色度のみの検出についての内容を見ることにする。
【0044】
図9は、図7と同じ考えの中ではあるが、全体画像における検出間隔を等分化するためのものである。
【0045】
図10は、一般的なポートレート写真であり、図14は人物の肌色色度と同様な色度範囲を有する枯木の林の写真である。図10と図14に対して、それぞれの画素に色度の適合だけで検出を行った結果を図11と図15に示す。
【0046】
図11のポートレートでの検出結果としては人物の肌色部分をよく検出しているが、その他に柵や背景の中で、ごみのような細かい部分においても適合色度を満たすものが検出されていることがわかる。このため、色度のみでは注目画像を特定できないことがわかる。
【0047】
図14においては、人物の肌色を検出する目的にもかかわらず同じ色度を持つ枯れ木の林が全面検出されている。このように、画素レベルでの色度判定を行った場合、注目画像を特定することは不可能である。
【0048】
検出をブロックレベルにすることにより、特定のまとまりを持った状態が対象になるので、外来ノイズの影響は受けずらくなる。しかしながら、8*8画素のブロックが適正なまとまりの大きさとは言えず、色度によるブロック検出においても縦方向及び横方向に隣接したブロックの連続検出という、制約を付けた検出を行うことで更に精度を上げることになる。
【0049】
ここにおいて、人の肌色であってもプリントにおいて顔を認識できるデータ量を満たさないものにおいても適応外としてはじいてもよいと言う概念でノイズと判定する連続範囲を設定する。
【0050】
この部分を表したのが、図6のステップS603以降の処理である。すなわち、ステップS603においては、画像に対して長手方向にブロックごとに色度検出を行い、連続検出ブロック数の多い順に候補を策定する。
【0051】
次に、ステップS604において、その連続量が、注目画像としての適応する連続量に入っているか否かを比較する。この比較の結果、該当する連続ブロックがある場合はステップS605に進み、短い方向のブロック連続検出設定を満たすデータが画像に存在するか否かを検索を行う。
【0052】
次に、ステップS606において、検出データが有るか否かを判断し、検出データが有る場合にはステップS608に進んで、この過程で残ったものの中から長手方向の連続ブロック量が大きいデータから順に候補番号を付ける。
【0053】
また、ステップS606の判断の結果、検出データが無い場合にはステップS607に進み、「目的領域無し」をセットして処理を終了する。
【0054】
ここで、話は少し戻るが、連続ブロックにて色度判定を施した場合の効果については、図12と図16で示す。
図12においては、図10のポートレート画像に対して検出を行った結果である。図12において、検出候補の優先順位が高い方から(検出ブロック長が長い方から)カラーコード(1=茶、2=赤、3=橙、4=黄、5=緑、6=青、7=紫、8=灰)順に配置され、それ以外で検出されているのは色度のみ適性範囲に入っているものである。連続ブロック検出により画素レベルの色度検出と比べるとかなりの背景などの非該当候補を削除できていることが判る。
【0055】
図16においては、図14の枯木の林に対して検出を行った結果で、連続ブロック検出においても注目画像以外を検出してしまうことがわかる。
【0056】
次に、VGA(video graphics array)サイズ(640*480画素)の複数の画像サンプルを用いて人物肌と枯れ木の林の部分において、検出された適合色度連続ブロックにおける周波数特性を算出した。
【0057】
図18は、画像内に撮影されている人物肌の連続ブロック検出されたブロックのDCTデータを周波数の低い順に並べたものを、周波数の低い方から10個単位で加算し、連続ブロック数で除したもので、連続検出されたブロックの1個あたりの平均周波数成分をまとめたものである。
【0058】
したがって、図面において横軸は、AC成分63個の周波数成分をまとめたもので、10個単位のまとまりが6グループと最も周波数の高いデータは3個分のデータとなる。縦軸は、各周波数成分の要素を加算した値である。
【0059】
これにより、値が大きいほどそのブロックにおいて、該当周波数成分が高いことがわかる。また、検出した連続ブロック数ごとに色分けしたデータ線で表されている。例えば“B2"は連続ブロックが2個検出されているデータの平均した値を表し、“B15"は連続ブロックが15個検出されているデータの平均した値を表している。以下同じで、“B2〜B15”までの複数画像からの平均的な人物肌色部分の連続検出値ごとの空間周波数特性を表している。
【0060】
検出結果を見ると、
1)低い周波数成分の値が大きく低い周波数成分の下から3グループ以降は、連続ブロック数に係わり無く50以下となっている。
2)連続ブロックの連続値が大きいほど周波数特性が低くなっている。
【0061】
これらの結果から言えることは、人物の肌色部分の周波数特性は比較的低い周波数で構成されていることと、検出された連続ブロックの値が大きいことは、被写体の撮影された大きさが大きいことを示していて、この連続ブロックとしての平均値を出すことによって周波数成分が下がっていることがわかる。
【0062】
連続ブロックの連続値により、同じ注目画像の色度を持っているものでも、その連続ブロックを1つの代表値にすること(例えば、B6のブロックの時は検出した6個のブロックの値を、各々周波数の低い順に10個単位のグループとして加算したものをグループごとに加算した後、その連続値である6で除して平均を出している。)により、空間周波数特性の値が変わるので、連続検出値により適当な該当周波数特性が違うことが判る。
【0063】
図19は、人物の肌色色度と同様な色度範囲を有する枯木の林の写真を複数用意して、検出を行った結果を図18と同じように表したものである。
【0064】
検出結果を見ると、
1)人物の肌の空間周波数特性と比べると高い周波数成分にデータ多くあることが確認できる。
2)一番低い周波数成分のグループは人物の肌の結果と大きくは違わない。
【0065】
これらのことから、連続ブロックにおける周波数成分を検出することで、同じ色度を持った検出物体を周波数特性により区別することが可能であることがわかる。
【0066】
図4は、本実施の形態において使用したもので、注目画像である人物肌の空間周波数特性を表したものである。上の段がVGA(640*480)画像における周波数特性の適正範囲である。
【0067】
連続ブロック値を2〜8個のグループ(〜L8)と9〜20個のグループ(L9~20)と21個以上のグループ(L21~)の3グループにまとめて、グループごとに周波数の適正範囲を設定したものである。周波数の適正範囲も先に示した10個単位の7グループによる周波数特性を用いた。これは、処理の簡略化と検出精度のバランスで行ったもので、これに縛られる必要は無い。
【0068】
次に、画像サイズがデジタルカメラで普及している200万画素相当のUXGA(1600*1200)画像について同じ撮影条件でVGA画像と比較してみる。
図25は、図18で使用したデータと同じシーンを対象にUXGAサイズにて撮影したものを検出した結果を、図18と同じように周波数特性量と各レンジにおけるデータ量の平均を用いて表したものである。
【0069】
VGA画像との検出特性の差を見ると、
1)連続検出ブロックの検出範囲が大きくなっている。具体的にはVGA画像検出での連続値は2から15ブロックの連続検出である。それに対して、UXGA画像検出では検出値が4から40の連続ブロックを検出している。
2)UXGAの方がブロック内の周波数特性が低い。例えば、1〜10のブロック平均を見ると、VGA画像では300〜100のデータ量に分布しているのに対し、UXGA画像では200〜30の範囲にデータが分布している。一枚の画像に収まる中で、注目画像になりうるものは、全画像に対する大きさとしては、特定の比率の範囲に入っているのが一般的な考え方である。
【0070】
例えば、画像全体の中で注目画像が長手方向で100分の1しか占めない場合はどうであろうか、一般のプリントを考えた場合、その注目画像に対して最適な補正を掛けても、出力後の補正を行われた注目画像は、ほとんど紙面を占めておらず、特定の注目画像を補正するよりは画像全体を補正する方がその画像においては効果的と考えられ、注目の定義から外れると考えられる。
【0071】
本実施の形態においても、各画像サイズに適したそれぞれの注目画像の適正範囲を持っている、この範囲以下でも以上でも補正対象とする注目画像の検出候補から外れる。
【0072】
したがって、この例においては、UXGA画像における長手方向の100分の1は1600割る100なので、16pixelで2ブロック(8*8)分になり、色度と周波数成分が合致してもレングスの意味合いから候補の対象から外している。ちなみに、UXGA画像においては、検出連続範囲としては4〜62ブロックと設定している。
【0073】
VGA画像においては、同じ考えで100分の1は6.4pixel となり、1ブロック分にも満たない。VGA画像においては、検出連続範囲としては2〜25ブロックと設定している。この違いは、画像サイズによる1ブロック(8*8)分の全画像に対する占有比率の差によるものが発生している。
【0074】
画像全体中の一定の比率範囲に注目画像が入っていると考えると、画像サイズにより8*8画素のブロックの空間周波数における意味合いは変わる。このため、同じ撮影画像でも画像サイズにより検出ロック数も違えば周波数特性も違ってくる。
【0075】
本実施の形態では画像ごとに検出連続範囲を上記のように設定しているが、数式に置き換えることも可能である。 例えば、下記式(5)の様に最低連続数を設定することができる。
【0076】
【数3】
Figure 0004078136
【0077】
次に、図26を示す。図26は、人物の肌色色度と同様な色度範囲を有する枯木の林の写真であり、図19においてはVGA画像としてのデータをしましたが、UXGAの画像としてデータをまとめたものである。
【0078】
図19との比較においては、先述の図18と図25の比較と同じ傾向がある。AC成分の20以上のグループではかなり高周波成分が低減していることがわかる。しかしながら、人物肌とのデータとは分布が極端に違うので、周波数帯域ごとに適応範囲を設定することで、分離することが可能である。
【0079】
このために設定したものが図27のUXGA画像用判定テーブルである。構成は図4のVGA画像用判定テーブルと同じであり、画像サイズの違いによる平均ブロックの空間周波数特性の違いのみである。
【0080】
次に、量子化テーブルによる画像への特性を説明する。
図28〜図30は、代表的画像アプリケーションがJpegファイルを作成する時の画像圧縮比率を決定する為の13種類の量子化テーブルである。図28〜図30において、テーブル“00”は最も画像圧縮率を高めたものであり、テーブル“12”は保存画質を高め、画像圧縮率を低めたものである。
【0081】
テーブルについて説明すると、図3の▲3▼〜▲4▼で説明した8*8画像のDCT後のデータをさらに圧縮するために使用するもので、画像における64個の各空間周波数に対応した値に対して、同じ位置の位の値で量子化を行う。
【0082】
テーブル“00”の場合で、図3の▲3▼を量子化する時は、例えば8*8ブロックの左上の“224”の値をテーブル“00”の同じ位置の左上の値“32”で量子化し“7”となす。また、最も周波数成分の高い8*8ブロックの右下では“−1”を“12”で量子化し“0”となる。
【0083】
図31に、図28,29,30のテーブル“00”〜“12”の特性及び市販のデジタルスチルカメラの記憶部で使用している量子化テーブルを示す。
横軸は、量子化テーブルAC分64個を10個単位でまとめたものであり、縦軸は、その10個単位の値の平均値である。したがって、どの空間周波数成分を多く量子化しているかを確認することができる。
【0084】
テーブル“00”〜“04”においては、低周波成分の量子化比率が大きくなっている。市販のデジタルスチルカメラでは、低周波成分での量子化量は少なく、高周波成分域においても“15”未満である。これに対応する量子化比率は、アプリケーションにおけるテーブル“10”以上であり、画像の量子化としては低圧縮率の分類になる。
【0085】
ポートレートである図10と、人物肌色度に一致する枯れ林である図14の画像に対して、上記テーブルを1個飛びに用いて量子化を行った後の画像に対して、それぞれ注目画像検出を行った結果を、図32及び図33に示す。
【0086】
図32の場合、テーブル“00”を使用した時は低周波成分の量子化の大きさにより判定テーブル(図4)による人物特性から外れてしまっている。テーブル“02”では、人物を検出したが、検出ポイントは低い。テーブル“06”以上で安定した検出ができている。
【0087】
図33の場合、テーブル“00”を使用した時は、本来人物肌判定テーブル(図4)より高周波域で、外れてしまう検出値が量子化による誤差で、“検出判定”となり、誤判定になってしまっている。こちらの場合でも、テーブル“08”以上で安定した検出ができている。
【0088】
したがって、量子化テーブルの値により、判定の精度が変わるので、このための量子化テーブル判定を行う。本実施の形態においては、判定を簡単化するために量子化テーブルの各項目を加算し、その合計が“630”以下の場合のみ判定への使用を可能とする、対応画像と判断することとした。
【0089】
量子化テーブルの判定方法は、この他に、低周波成分での値などに注目する方法、低域30までの総和を“150”とする方法など、検出する注目画像の空間周波数特性により幾つも考えることができるが、量子化テーブルの特性を使用するようにしてもよい。
【0090】
図6の説明に戻る。上述したように、色度により検出された長手方向の連続量が大きいデータから順に注目画像の候補番号1〜n(本実施の形態においてはn=8)を付ける(ステップS608)。n以降の検出したものについては候補番号を付けられない。
【0091】
次に、取得した量子化テーブルから図34のフローチャートに示した処理を行い、AC成分特性判定テーブルを設定する。
処理としては、まず量子化テーブル内のすべての値を加算する。この値が、量子化の程度をあらわすことになる。この値が、630以上である場合は、注目画像の空間周波数特性が変わってしまっていると考えられるので、注目画像検出は中断する。630未満の場合は、注目画像の空間周波数特性に影響は無いと判断され、入力画像サイズによるAC成分特性判定用テーブルの選択を行う。
【0092】
次に、ステップS609に進み、上記候補1〜nに対して、図4で示した連続ブロック数に対する空間周波数特性適正範囲判定表の範囲に適合するか逐次比較する。この結果、適合する候補が存在しない場合は注目画像が存在しないと判断する。
【0093】
この候補1〜nに対して、画像サイズがVGA(640*480)である時は、図4で示した連続ブロック数に対する空間周波数特性適正範囲判定表の範囲に適合するか逐次比較する。最初の連続検出ブロックから周波数特性の特徴量について、適合範囲内であるか比較を行う。この時、上述したように入力画像サイズが違う画像、例えばUXGA(1600*1200)画像においては適合判定に図27のUXGAテーブルを使用して比較判定を行う。
【0094】
本実施の形態においては、画像サイズごと、もしくは、画像サイズ範囲(例えばVGA~XGAとSXGA~QXGAまでなど特定の画像範囲において共通のテーブル)ごとに設定した適応周波数特性判別テーブルにて周波数特性の比較判定を行ったが、数式を用いた判定基準を代わりに用意してもよい。
【0095】
例えば、下記数式の作成方法としては、既に適正化テーブルがあるVGAとUXGAのテーブルを元にこの2点間の画像のサイズと周波数成分の値による変化量を対応付け、1次式にて近似して使用することができる。
【0096】
この結果、適合する候補が存在しない場合は注目画像が存在しないと判断する。また、適合する候補が存在する場合においては以下に説明を行う。
図22に、そのフローチャートを示す。
最初のステップS2201において、候補の数を確認する(1〜m)。
次に、ステップS2202に進み、候補グループを形成する。この場合、候補に隣接する色度適合ブロックを候補グループとする。
【0097】
次に、ステップS2203に進み、候補グループが複数であるか否かをを判断する。この判断の結果、候補グループの中に複数の候補が含まれた場合は、ステップS2204に進み、候補番号の若い方の番号を用いたグループとする。
【0098】
そして、検出された各グループに対して、どちらのグループが補正対象となる注目画像としての重みが大きいかを判断するために、グループ内の確からしさをポイント換算で、比較を行い、よりポイントが高いグループが最終注目画像と設定される。
【0099】
ポイントの方法としては、候補が“m”個存在する場合、候補1のポイントは“m”。候補2のポイントは“m−1”以下同様に候補mのポイントは“1”となる。
【0100】
このようにして、候補グループ間の優位性を判断した結果の実例を図23に示す。検出した候補グループは2グループあり、そのうち右のグループのポイントが左の候補グループのポイントを上回ったので、最終候補となっている。
【0101】
また、ポイント数の絶対値は、対象となる候補グループの注目画像としての信頼度を表しているので、このポイントにより注目画像に対する補正強度を決定する。補正強度決定方法としては、ポイントによる閾値を設け、閾値の上下関係で強度の指定を行う。
【0102】
但し、このようなポイントによる注目画像の検出ではなく、より軽い処理として、一番長い検出値の候補が入るグループもしくは、検出値そのものを注目画像としてもよい。この場合、本実施の形態より検出確率に多少の差は発生するが、処理能力の低い機器ではこの方式のほうが適合する場合もある。
【0103】
先の、図10と図14に対する結果を図13と図17に示す。
図13においては、注目画像である人物の顔の肌を検出している。また、図17においては、各候補が周波数特性に適合せず候補部分が黒塗りの状態で表している。これは、注目画像が検出されなかった状態を表し、注目画像に重みを置いた画像補正の対象にならないことを示し意している。
【0104】
こうして注目画像を検出することができる。通常の画像補正は、画像全体のバランスに亘って補正が行われるので、逆光などで本来注目したい画像の画質を落としてしまう場合が存在しているが、本実施の形態による注目画像検出により、補正項目として輝度の最適化のための露出、及び好ましい肌色のための色バランスや彩度補正を注目画像のデータを基に補正を行うことで、より高品質な画像を得ることができる。
【0105】
図24に、一般画像補正を行った結果と、本実施の形態の注目画像検出を利用して画像補正を行った結果の一例を示す。図24に示したように、本実施の形態の注目画像検出を利用して画像補正を行った場合は、人物などの注目画像をより良くプリントすることができる。
【0106】
本実施の形態においては、プリントのための最適画像処理用に注目画像を検出する方法を示しているが、表示用などにも使用できることは言うまでも無い。
【0107】
また、本実施の形態においては、検出画像の周波数成分特性を見るために周波数情報を10個単位で加算して周波数成分の63個を7グループとして、画像の特性を判断したが、グループ化という発想をなくし、63個全ての周波数をそのまま利用してもよいことは言うまでも無い。
【0108】
更に、画像の長手方向からの連続量の検出後短い方向の検出を行ったが、この順序も逆になっても可能であり、この他、検出ブロックを一列のグループとして検出する方法以外にも色度で検出したグループにおける全ての方向に隣接したブロックグループという、とらえ方で空間周波数特性を確認する方法など、色度と周波数特性を組み合わせた検出方法はいくらでもあり、これら一連の検出方法は本発明に含まれることは言うまでも無い。
【0109】
本実施の形態においては、図4や図27のように、連続検出値を3グループに分け周波数特性の適正範囲との比較を行い周波数特性の合否を判定したが、連続検出を3グループ化したのは、実施形態を簡単化するためで、連続値ごとに適正範囲を設定してもよいし、連続値には相関関係が有るので、テーブル方式ではなく理論式による方法を用いてもよい。また、周波数特性も7グループ値を使用したが、63個の周波数のすべてにて行ってもよいし、更には特定の周波数に注目して判定してもよい。
【0110】
本実施の形態においては、検出の目的になっている注目画像は人物の肌の領域に設定して説明しているが、周波数成分、もしくは周波数成分と色度により検出可能なものは、人物の肌色に限らず、空、海、木々の緑なども存在する。
【0111】
本実施の形態においては、8*8ブロック単位データの周波数成分を周波数の低い順から10個単位でまとめた値を用いて、その10個の和によるグループ(最も高い周波数グループは3個の和)の特性から周波数特性を代表させているが、Jpeg ファイルの場合、DC成分1個に対し、AC成分63個の構成で、周波数特性を表しているので、10個の集合体として特性を見なくてもよい。
【0112】
また、63個の個々の特性より判断してもよいし、もっとグループ化してもよい。また、特定の周波数成分のみの利用により特性を導き出してもよい。このように、周波数特性を利用した特性を導くのにAC成分の利用方法はいくらでもある。
【0113】
更に、本実施の形態では8*8ブロックの連結と言う概念で縦方向と横方向について注目画像を検出するために色度該当ブロックの連続性において、候補を抽出しているが、この時のブロック集合体の判定方法も、この方法に限られてものではないことは言うまでも無い。
【0114】
本実施の形態では連続検出した色度ブロックに対して検出した連続値により、端のブロックを削除した値を特性利用しているが、周波数成分による適合から色度ブロックの境界を設定したり(図21)、予め特定以上の周波数特性のあるブロックを、色度検索を行う前に除外してから行うようにしたりなど、ブロックの集合体を決定するための色度と周波数成分による分離の仕方は、複数の方法と組み合わせがあるが、本願特許の範囲に包含される。
【0115】
上記図21について説明する。図21の左側は元画像であり、このJpeg ファイル画像の圧縮単位である8*8画素ブロックの周波成分における高周波成分の総データ値が閾値を超えるか超えないかで判定したのが右側の画像になる。明るい部分が高周波成分を持つ領域で、暗い部分が高周波成分の少ない領域である。この領域を境に設けた色度判定による注目画像検出も可能である。
【0116】
また、本実施の形態は、画像圧縮ファイルとして、“Jpegファイル”を利用した方法を開示したが、“Jpeg2000 ファイル“など、周波数成分への変換を利用した他のファイルに対しても同様な考え方で、注目画像の検出を簡単な処理で実現できることは、言うまでもない。
【0117】
上記実施の形態においては、周波数成分と色度を中心に配置情報などを入れて注目画像検出を行ったが、このねらいは、注目画像を中心とした画像補正を行う為である。したがって、検出された注目画像領域の輝度を含むデータが補正を行うことが有効でない状態として検出された時、例えば暗過ぎる値でつぶれている時などは、補正として無理に諧調性を持たそうとすると、ノイズだらけになってしまう場合がある。
【0118】
この不都合を回避するために、図6の検出結果に対して、検出された部分領域の各ブロック直流成分データを利用して輝度平均を出し、補正に適した輝度範囲に入っているかを比較することで、更に精度の良い注目画像における画像補正を行うことができる。
【0119】
(本発明の他の実施の形態)
なお、以上に説明した本実施形態の画像認識装置は、コンピュータのCPUあるいはMPU、RAM、ROMなどで構成されるものであり、RAMやROMに記憶されたプログラムが動作することによって実現できる。
【0120】
したがって、コンピュータが上記機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって実現できるものである。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
【0121】
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全てあるいは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。
【0122】
また、本発明をネットワーク環境で利用するべく、全部あるいは一部のプログラムが他のコンピュータで実行されるようになっていてもよい。例えば、画面入力処理は、遠隔端末コンピュータで行われ、各種判断、ログ記録等は他のセンターコンピュータ等で行われるようにしてもよい。
【0123】
【発明の効果】
上述したように、本発明によれば、複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータ及び量子化テーブルを抽出し、上記抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、上記抽出工程で抽出された量子化テーブル内の各値の加算値が所定値以下の場合、前記検出されたブロックの交流周波数成分の各値が、注目画像の空間周波数特性適正範囲内に収まっているか否かを判断し、その判断結果に基づいて上記部分領域が注目画像対象部分に入っているか否かを判定するようにしたので、高度な計算をすることなく画像データブロックごとの交流周波数成分情報を含む情報を取得して、画像ファイルの中の注目画像を検索することができる。
【0124】
また、本発明の他の特徴によれば、デジタルカメラから直接プリントする場合などのように、パーソナルコンピュータと比べて処理能力が低い組み込み式の機器においても、製品として使用可能な範囲の処理で、印刷する圧縮画像ファイルに補正の対象となる注目画像の有無、及びその値の適正度を検出することができ、必要に応じて注目画像を重視した画像補正を施すようにすることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係わるJpeg画像解凍時に必要なデータを取得する流れを示す概念図である。
【図2】実施の形態の画像データをJpeg形式へ変換する処理過程の流れを示す概念図である。
【図3】実施の形態のJpegの画像圧縮単位である8*8ブロックを例にしたJpeg形式へ変換する処理過程を示す図である。
【図4】実施の形態のJpegファイル画像圧縮単位である8*8ブロックのAC成分特性を利用した判別テーブルを示す図である。
【図5】実施の形態の他にある肌色のRG色度分布例を示す図である。
【図6】実施の形態のJpeg画像解凍からの注目画像検出フローチャートである。
【図7】実施の形態のJpegファイル画像圧縮単位である8*8ブロックにおける、色度検出方法を示す図である。
【図8】実施の形態のJpegファイル画像圧縮単位である8*8ブロックでのDC成分を利用した色度検出方法を示す図である。
【図9】実施の形態の色度検出において、3ビット間引きを利用して検出をした場合の8*8ブロックにおける検出状況を示す図である。
【図10】実施の形態の検出用Jpeg画像サンプルの第1の例を示す図である。
【図11】第1の画像サンプルを色度のみによる検出を行った結果のBMP ファイルの一例を示す図である。
【図12】第1の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロック検出を行った結果のBMP ファイルの一例を示す図である。
【図13】実施の形態の注目画像検出により、第1の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロックとAC成分による検出を行った結果のBMPファイルの一例を示す図である。
【図14】実施の形態の検出用Jpeg画像サンプルの第2の例を示す図である。
【図15】第2の画像サンプルを色度のみによる検出を行った結果のBMPファイルの一例を示す図である。
【図16】第2の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロック検出を行った結果のBMP ファイルの一例を示す図である。
【図17】実施の形態の注目画像検出により、第2の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロックとAC成分による検出を行った結果のBMP ファイルの一例を示す図である。
【図18】実施の形態の人物肌検出において、人物肌検出データの連続色度検出値におけるAC成分の周波数特性を示す図である。
【図19】実施の形態の人物肌検出において、枯れ林の検出データの連続色度検出値におけるAC成分の周波数特性の表を示す図である。
【図20】実施の形態の肌色のRG色度分布を示す図である。
【図21】周波数特性による境界作成のための検出方法の一例を示す図である。
【図22】実施の形態の候補グループの判定手順を示すフローチャートである。
【図23】実施の形態の候補グループ判定の検出結果画像の一例を示す図である。
【図24】実施の形態の注目画像検出を利用した画像補正の比較結果の一例を示す図である。
【図25】本発明の人物肌検出において、UXGA(1600*1200)画像における人物肌検出データの連続色度検出値におけるAC成分の周波数特性を示す特性図である。
【図26】本発明の人物肌検出において、UXGA(1600*1200)画像における枯れ林の検出データの連続色度検出値におけるAC成分の周波数特性の表を示す図である。
【図27】本発明のJpegファイル画像圧縮単位である8*8ブロックのAC成分特性を利用したUXGA(1600*1200)画像に対する判別テーブルの一例を示す図である。
【図28】既存のアプリケーションで使用している量子化テーブルの一例を示す図である。
【図29】既存のアプリケーションで使用している量子化テーブルの一例を示す図である。
【図30】既存のアプリケーションで使用している量子化テーブルの一例を示す図である。
【図31】量子化テーブルにおける圧縮比率と周波数特性との関係を示す図である。
【図32】注目画像検出を行った結果の一例を示す図である。
【図33】注目画像検出を行った結果の一例を示す図である。
【図34】取得した量子化テーブルからAC成分特性判定テーブルを設定する手順の一例を示すフローチャートである。
【符号の説明】
1 エントロピー復号化手段
2 符号テーブル
3 逆量子化手段
4 量子化テーブル
5 逆DCT手段

Claims (14)

  1. 複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用する画像認識方法であって、
    上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータ及び量子化テーブルを抽出する抽出工程と、
    上記抽出工程によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、上記抽出工程で抽出された量子化テーブル内の各値の加算値が所定値以下の場合、前記検出されたブロックの交流周波数成分の各値が、注目画像の空間周波数特性適正範囲内に収まっているか否かを判断し、その判断結果に基づいて上記部分領域が注目画像対象部分に入っているか否かを判定する判定工程とを有することを特徴とする画像認識方法。
  2. 上記抽出された部分領域の周波数成分の特徴量特性を上記量子化テーブルの特性により変更してから、注目画像の空間周波数特性適正範囲内に収まっているか否かを判断し、その判断結果に基づいて、判定対象の部分領域が注目画像対象部分に入っているか否かを判定するようにしたことを特徴とする請求項1に記載の画像認識方法。
  3. 上記圧縮データはJpegファイルデータであることを特徴とする請求項1または2に記載の画像認識方法。
  4. 上記判定対象の部分領域が注目画像対象部分に入っているか否かの判定は、画像全体における抽出された部分領域の配置情報を加えて行われ、前記配置情報が画像の端部近傍を示す場合、前記画像の端部近傍に対しては判定を行わないことを特徴とする請求項1乃至3の何れか1項に記載の画像認識方法。
  5. 上記判定対象の部分領域が注目画像対象部分に入っているか否かの判定は、抽出された部分領域の隣接した連続性情報が縦と横方向に加えて行われ、前記連続性情報が、所定の連続量に入っている場合、注目画像候補領域とすることを特徴とする請求項1乃至3の何れか1項に記載の画像認識方法。
  6. 上記判定対象の部分領域が注目画像対象部分に入っているか否かの判定は、抽出された部分領域の直流成分を加えて行うことを特徴とする請求項1乃至5の何れか1項に画像認識方法。
  7. 上記注目画像の候補が所定の設定範囲の中で複数個検出された場合には、検出された部分領域の隣接した連続が一番多いものを注目画像に該当すると判定することを特徴とする請求項4乃至6の何れか1項に記載の画像認識方法。
  8. 上記検出した部分領域の隣接した連続が一番多いものを含む部分領域において、色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が適正範囲に入っているものを含めて注目画像とするようにしたことを特徴とする請求項7に記載の画像認識方法。
  9. 上記検出した部分領域内において、部分領域連続が2番目以降に長いものの含有率で上記検出した注目画像の検出の確からしさを求めるようにしたことを特徴とする請求項8に記載の画像認識方法。
  10. 上記検出した確からしさを用いて画像補正強度決定するようにしたことを特徴とする請求項9に記載の画像認識方法。
  11. 上記検出した注目画像領域内の輝度情報を作成し、上記輝度情報を元にして画像全体への露出補正を行うようにしたことを特徴とする請求項9または10に記載の画像認識方法。
  12. 上記注目画像の検出長と出力プリントサイズとの関係により、注目画像サイズが出力プリントサイズ上一定の長さの許容に入らない場合は画像補正を行なわないことを特徴とする請求項1乃至11の何れか1項に画像認識方法。
  13. 複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用する画像認識装置であって、
    上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータ及び量子化テーブルを抽出する抽出手段と、
    上記抽出手段によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、上記抽出工程で抽出された量子化テーブル内の各値の加算値が所定値以下の場合、前記検出されたブロックの交流周波数成分の各値が、注目画像の空間周波数特性適正範囲内に収まっているか否かを判断し、その判断結果に基づいて上記部分領域が注目画像対象部分に入っているか否かを判定する判定手段とを有することを特徴とする画像認識装置。
  14. 複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用する工程をコンピュータに実行させるコンピュータプログラムであって、
    上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータ及び量子化テーブルを抽出する抽出工程と、
    上記抽出工程によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、上記抽出工程で抽出された量子化テーブル内の各値の加算値が所定値以下の場合、前記検出されたブロックの交流周波数成分の各値が、注目画像の空間周波数特性適正範囲内に収まっているか否かを判断し、その判断結果に基づいて上記部分領域が注目画像対象部分に入っているか否かを判定する判定工程とをコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2002193622A 2002-07-02 2002-07-02 画像認識方法、画像認識装置及びコンピュータプログラム Expired - Fee Related JP4078136B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002193622A JP4078136B2 (ja) 2002-07-02 2002-07-02 画像認識方法、画像認識装置及びコンピュータプログラム
US10/608,001 US7356190B2 (en) 2002-07-02 2003-06-30 Image area extraction method, image reconstruction method using the extraction result and apparatus thereof
US11/970,359 US7542615B2 (en) 2002-07-02 2008-01-07 Image area extraction method, image reconstruction method using the extraction result and apparatus thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002193622A JP4078136B2 (ja) 2002-07-02 2002-07-02 画像認識方法、画像認識装置及びコンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2004038482A JP2004038482A (ja) 2004-02-05
JP2004038482A5 JP2004038482A5 (ja) 2006-08-10
JP4078136B2 true JP4078136B2 (ja) 2008-04-23

Family

ID=31702546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002193622A Expired - Fee Related JP4078136B2 (ja) 2002-07-02 2002-07-02 画像認識方法、画像認識装置及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP4078136B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4301193B2 (ja) 2005-03-31 2009-07-22 ソニー株式会社 画像比較装置及び方法、画像検索装置及び方法、並びにプログラム及び記録媒体

Also Published As

Publication number Publication date
JP2004038482A (ja) 2004-02-05

Similar Documents

Publication Publication Date Title
US7542615B2 (en) Image area extraction method, image reconstruction method using the extraction result and apparatus thereof
Kee et al. Digital image authentication from JPEG headers
TWI426774B (zh) 用於針對jpeg壓縮歷史紀錄分類為壓縮影像的方法、及用於針對影像是否已經過jpeg壓縮而分類影像的設備及影像分類方法
US6389162B2 (en) Image processing apparatus and method and medium
KR101369915B1 (ko) 영상 식별자 추출 장치
US7903888B2 (en) Image encoding apparatus and image decoding apparatus
US8452112B2 (en) Image encoding apparatus and method of controlling the same
EP2645697B1 (en) Image processing apparatus and method
JP2019092027A (ja) 画像処理装置、画像処理方法および画像処理プログラム
WO2003010716A2 (en) Image block classification based on entropy of pixel differences
US7027646B2 (en) Scaled image generating apparatus and method, image feature calculating apparatus and method, computer programs therefor, and image data structure
US7315652B2 (en) Image processing apparatus
US7106908B2 (en) Method and apparatus for selecting a format in which to re-encode a quantized image
US8275198B2 (en) Image processing apparatus, image processing method and computer readable medium with compression processing for each color
US20060165305A1 (en) Image compression method and image compression device
CN106717006B (zh) 用于根据图像类型选择压缩算法的方法
JP3977291B2 (ja) 画像再生方法及び画像処理装置
JP4078136B2 (ja) 画像認識方法、画像認識装置及びコンピュータプログラム
JP4006276B2 (ja) 画像認識方法、画像認識装置及びコンピュータプログラム
US7146055B2 (en) Image processing decompression apparatus and method of using same different scaling algorithms simultaneously
JP4078135B2 (ja) 画像認識方法、画像認識装置及びコンピュータプログラム
US8213713B2 (en) Image processing apparatus and computer readable medium
JPH08307666A (ja) 文書・写真混在多階調画像のデータ処理装置
JP2024064449A (ja) 画像処理方法、画像処理装置、及びプログラム
JP2005062964A (ja) 画像処理装置、画像検出処理方法、プログラム及び記録媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041215

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060623

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080204

R150 Certificate of patent or registration of utility model

Ref document number: 4078136

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140208

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees