JP2003230012A - ヘッダ情報に基づく画像処理方法 - Google Patents

ヘッダ情報に基づく画像処理方法

Info

Publication number
JP2003230012A
JP2003230012A JP2002336772A JP2002336772A JP2003230012A JP 2003230012 A JP2003230012 A JP 2003230012A JP 2002336772 A JP2002336772 A JP 2002336772A JP 2002336772 A JP2002336772 A JP 2002336772A JP 2003230012 A JP2003230012 A JP 2003230012A
Authority
JP
Japan
Prior art keywords
scale
image
block
entropy
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002336772A
Other languages
English (en)
Other versions
JP3989362B2 (ja
Inventor
Barkner Catherine
バークナー キャサリン
Ramesh Neelamani
ニーラマニ ラメシュ
Edward L Schwartz
エル.シュワルツ エドワード
Martin P Boliek
ピー ボーリック マーティン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2003230012A publication Critical patent/JP2003230012A/ja
Application granted granted Critical
Publication of JP3989362B2 publication Critical patent/JP3989362B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20064Wavelet transform [DWT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 本発明は、符号ストリームヘッダデータに基
づく画像のセグメンテーション、画像の適応的スケーリ
ング、画像の自動スケーリング及びクロッピングの方法
及び装置の提供を目的とする。 【解決手段】 本発明によれば、画像のブロックに関す
るマルチスケールエントロピー分布情報を収容するヘッ
ダを含むファイルが取得され、ブロック毎に、ブロック
の尤度の積である総尤度と、事前確率との積であるコス
ト関数を最大化するスケールが割当てられる。画像は等
価的なスケールが割当てられたブロックを集めることに
よってセグメント化される。ファイルはJPEG200
0フォーマットの画像を表現する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般的に画像処理
の分野に係り、特に、マルチスケール変換を使用する画
像処理に関する。
【0002】本願発明は、本願の優先権主張日と同日の
2002年1月10日に出願され、本願と同一出願人に
譲渡された米国特許出願第02−044603号に関連
している。
【0003】
【従来の技術】デジタル画像は、多様なフォーマットで
表現され蓄積される。デジタル画像表現フォーマットに
おける一般的な特徴は、画像ファイルを構成するビット
が画像記述ビットとヘッダビットとに分けられることで
ある。画像記述ビットは実際の基礎画像を記述する。屡
々、画像記述ビットは便宜上より小さい細分ユニットに
分割される。ヘッダビットは、多数の細分画像記述ユニ
ットに対する画素単位の画像サイズ、ファイルサイズ、
ビット単位の長さなどのような画像に関する構造的情報
を与える。
【0004】圧縮画像ファイルは、主として、便利なフ
ァイル管理及び解釈を実現し易くするため、種々様々な
構造的情報をヘッダに収容する。例えば、幅、高さ、色
成分情報、及び、その他の詳細のような従来からの情報
に加えて、JPEG 2000(非特許文献1を参照)
の画像ヘッダは、画像の圧縮データを構成するウェーブ
レット係数のグループ(符号ブロックと称される)のよ
うな細分ユニットに含まれるビット数と、これらの係数
の細分ユニットのウェーブレット領域(ドメイン)での
位置と、に関する情報を与える。他の画像ファイルフォ
ーマットは細分情報を収容する。
【0005】非特許文献2には、通常のJPEG圧縮文
書を画像内の8×8形ブロックのエントロピーを使用す
る通常のJPEG圧縮文書のセグメンテーションが記載
されている。エントロピー値は従来のJPEG画像ヘッ
ダで利用できないので、非特許文献2に記載された技術
はヘッダ情報に基づく処理を使用しない。また、個の技
術は、局部的な8×8形ブロックだけに作用する従来の
JPEGによって使用される離散コサイン変換(DC
T)を利用する。したがって、この技術はマルチスケー
ル変換を使用しない。更に、この技術は、画像領域内の
8×8形ブロック上で利用可能なエントロピー分布だけ
を使用し、マルチスケールビット分布を利用しない。
【0006】画像解析には、画像の記述、解釈及び理解
が含まれる。画像解析は、画像から測定量、データ若し
くは情報を抽出する。画像解析技術は、特徴抽出、セグ
メンテーション(区分け)及びクラシフィケーション
(分類)が含まれる。画像解析は、コンピュータビジョ
ン、画像データ抽出、情景解析、画像記述、自動写真理
解、領域選択、又は、画像理解のように呼ばれる場合が
ある。非特許文献3及び非特許文献4を参照せよ。
【0007】画像処理は、入力画像から修正された出力
画像を生成する。画像処理技術には、クロッピング、ス
ケーリング、ポイント演算、フィルタリング、ノイズ除
去、修復、強調が含まれる(非特許文献4の第7及び8
章、非特許文献3の第4部)。
【0008】一部のアプリケーションでは、最初に画像
に対して画像解析を実行し、次に、画像上の画像処理を
制御するため解析結果を使用することが望ましい。例え
ば、非特許文献5に掲載されたプログラム"pnmcrop"
は、最初に、四方全てについて、背景色(単一の色値、
例えば、白又は黒)の縞を見つけるため画像を解析す
る。次に、このプログラムは、縞を取り除くため、画像
処理演算のクロッピングを画像に対して実行する。
【0009】
【非特許文献1】ITU−T勧告T.800(ISO/
IEC 15444−1:2000)、[online]、<U
RL:www.iso.ch>
【非特許文献2】アール・デ・ケイロース(R. De Queir
oz)及びアール・エッシュバッハ(R. Eschbach)著、「J
PEG圧縮文書の高速セグメンテーション(Fast segmen
tation ofJPEG compressed documents)」、エレクトロ
ニック・イメージング(ElectronicImaging)、第7巻、
1998年4月、p.367−377
【非特許文献3】ダブリュー・プラット(W. Pratt)著、
「デジタル画像処理(Digital Image Processing)」、第
2版、ジョンワイリー社(John Wiley & Sons, Inc.)発
行、米国ニューヨーク州ニューヨーク市、1995年
【非特許文献4】エー・ジェイン(A. Jain)著、「デジ
タル画像処理の基礎(Fundamentals of Digital Image P
rocessing)」、プレンティス・ホール(PrenticeHall)、
米国ニュージャージー州エングルウッド、1995年
【非特許文献5】インターネット<URL:http://www.ac
me.com/software/pbmplus/)
【0010】
【発明が解決しようとする課題】本発明は、マルチスケ
ール変換を使用する画像処理方法の提供を目的とする。
【0011】
【課題を解決するための手段】本発明は、画像セグメン
テーション、適応的スケール選択、自動領域選択のよう
な演算を実行し、画像ファイルヘッダ情報だけを使用し
て基礎画像をスケーリングする方法及び装置を提供す
る。画像ファイルは、マルチスケール画像圧縮技術を使
用する。処理のため使用されるマルチスケールビット割
り付けはファイルヘッダから推定される。処理アルゴリ
ズムは、基礎特徴の視覚的重要性に対する定量的指標と
して、画像符号器によって割り付けられた(又は、別の
実施例では、割り付けるべきであると推定された)ビッ
ト数を使用する。
【0012】
【発明の実施の形態】本発明は、以下の詳細な記述と、
種々の実施例についての添付図面とによって、完全に理
解されるであろう。但し、本発明は特定の実施例に限定
して理解されるべきではなく、実施例は説明と理解のた
めだけに用いられる。
【0013】基礎デジタル画像を処理するためファイル
ヘッダ情報を使用する方法及び装置を説明する。ファイ
ルヘッダ情報は、基礎デジタル画像に対応した圧縮デー
タを含むビットストリームの一部分でもよい。ここで説
明される処理は、ヘッダの情報を使用し、圧縮データの
中で復号すべき部分を決定するためヘッダの情報を特定
の方式で処理する。基本的に、ヘッダの情報は、更なる
処理が現れる領域を識別することが可能である。
【0014】一実施例において、圧縮データは、マルチ
スケール変換に基づく圧縮によって得られた画像表現フ
ォーマットを含む。圧縮データは、ヘッダ及び画像記述
ビットにより構成される。すなわち、マルチスケール変
換に基づく圧縮は、画像記述ビットを生成する処理の一
部として画像データに適用される。ヘッダ情報から、マ
ルチスケール領域における画像符号器の画像符号器のエ
ントロピー分布、又は、ビット割当が推定され、基礎画
像特徴の視覚的重要性に対する定量的指標として使用さ
れる。例えば、JPEG 2000ファイル情報のヘッ
ダから、符号ブロックの長さ、零ビットプレーンの数、
符号化パスの数のようなファイル情報がエントロピー分
布を判定するため使用される。このようにして、マルチ
スケール変換に基づく表現におけるビット分布は、非限
定的な例として、画像セグメンテーションと、画像に対
する適応スケール/解像度選択と、自動スケーリング及
び検出と、重要な画像領域の選択、スケーリング及びク
ロッピングと、を含む一つ以上の演算を実行するため使
用される。
【0015】一実施例において、ヘッダ中の情報は、圧
縮画像データの中で後続の処理のため望ましいデータを
収容する部分を示すエントロピー分布マップを作成する
ため使用される。このようなマップの一例が図1に与え
られる。その他のマップも考えられ、望ましいビットレ
ートを獲得するため(特に、レイヤ割当が歪みに関連す
る場合)、JPEG 2000の記述とともに後述され
るレイヤ数を示すか、又は、多数のビットレート毎にエ
ントロピー分布を示す。エントロピー分布を示す場合、
マップ上の各四角形エリアにはベクトルが関連付けられ
る。このベクトルは、多数のレイヤの値を示す。
【0016】画像記述ビットを圧縮するためマルチスケ
ール変換を利用する画像表現フォーマットは、典型的
に、多数の構造的細部をヘッダに組み込むので、デジタ
ル画像に関する記述は、画素の観点では、正確かつ都合
よく復号化される。JPEG2000は、ファイルヘッ
ダにマルチスケールビット分布を与える画像圧縮標準の
一例である。屡々、画像記述ビットは細分ユニットに分
割され、符号器(エンコーダ)がこれらの細分ユニット
へ割り付けるビット数は、部分的な画像アクセス、ネッ
トワーク化された環境への適応などのような機能を実現
し易くするため、画像ヘッダに格納される。情報理論の
慣例に従って、割り付けられたビット数は、各細分ユニ
ットのエントロピーと呼ばれる。画像符号器によって使
用されるエントロピー分布は、圧縮画像の視覚的重要性
についての優れた定量的指標を与える。損失のない圧縮
の場合、画像符号器は、動きが活発な(ディテールが多
い)領域を記述するため多くのビットを使用し、ディテ
ール情報が少ない領域を搬送するため使用するビット数
は少ない。損失の多い圧縮の場合、画像符号器は、典型
的に、割り付けられたビットの範囲内で実現可能な最良
の画像の記述を搬送するために努力する。したがって、
符号器は、画像内で視覚的に重要な特徴を記述する有効
な少数のビットを費やすように巧みに設計される。
【0017】マルチスケール画像符号器は、画像の画素
を符号化するのではなく、画像情報を多数の周波数帯域
に分離する変換がなされた変換画像の係数を符号化す
る。マルチスケール画像符号器(例えば、JPEG 2
000符号器)は、基礎画像に対するエントロピーのマ
ルチスケール分布を画像ヘッダに収容する。このような
変換に基づく機能は空間域と周波数域の両方で同時に定
位を行うので、変換係数は画像内の特定の位置における
周波数内容に関する情報を含む。
【0018】画像を画像のヘッダ情報だけに基づいて処
理する能力は好ましい。なぜならば、ヘッダ情報は少な
い回数の計算を使用して容易にアクセスできるだけでは
なく、利用可能な画像情報が凝縮された性質は後続の処
理の効率を高めるからである。重要な点は、簡単にアク
セスすることができるヘッダ情報が、係数を復号化する
ことなく画像に関する情報を示すことである。したがっ
て、処理時の決定は、係数を復号化する膨大な時間を費
やすことなく行われる。
【0019】ここで説明している技術は、例えば、表示
に適応した画像表現、デジタル映像監視、画像データベ
ース管理、画像分類、画像検索、並びに、ポターン解
析、画像フィルタリング及び画像サイジングの前処理の
ような分野に適用されるが、これらの例に限定されるも
のではない。
【0020】以下の記述では、多数の細部について説明
される。しかし、本発明は、これらの特定の細部を用い
ることなく実施されることが当業者に明らかであろう。
それ以外の場合に、周知の構造及び装置は、本発明を分
かり難くすることを避けるため、詳細ではなく、ブロッ
ク図形式で示される。
【0021】以下の詳細な説明の一部分は、コンピュー
タメモリ内でのデータビットに対する演算のアルゴリズ
ム及び記号表現の観点で記述されている。これらのアル
ゴリズム的な記述及び表現は、データ処理技術の当業者
が自分の業績の要旨を他の当業者へ最も効率的に伝える
ために使用する手段である。ここで説明するアルゴリズ
ムは、一般的なアルゴリズムがそうであるように、所望
の結果を導く首尾一貫した手順の系列である。手順(ス
テップ)は、物理量の物理的操作を必要とする手順であ
る。必然的ではないが通常は、これらの量は、記憶、転
送、合成、比較、及び、その他の操作を行うことができ
る電気信号又は磁気信号の形式をとる。主として、一般
的な用法であるとの理由から、これらの信号は、ビッ
ト、値、要素、シンボル、文字、項、数などによって指
定することが時に好都合であることがわかる。
【0022】しかし、これらの用語及び類義語は、適切
な物理量と関連付けられ、物理量に与えられた便宜的な
ラベルに過ぎない。特に断らない限り、以下の説明から
明らかであるように、「処理」、「コンピューティン
グ」、「計算」、「決定」、或いは、「表示」のような
用語を利用する記述は、コンピュータシステム若しくは
類似した電子コンピューティング装置の動作及び処理を
示すものであり、コンピュータシステムのレジスタ及び
メモリ内で物理(電子)量として表現されたデータを操
作し、同じように、コンピュータシステムのメモリ若し
くはレジスタ、又は、他の情報記憶装置、情報伝送装
置、若しくは、情報表示装置内で物理量として表現され
た他のデータへ変換する。
【0023】本発明は、以下で説明する動作を実行する
装置に関する。この装置は、特に、要求された用途に応
じて構成されるか、或いは、選択的に作動され、若しく
は、コンピュータに記憶されたコンピュータプログラム
を用いて再構成される汎用コンピュータを含む。このよ
うなコンピュータプログラムは、たとえば、フレキシブ
ルディスク、光ディスク、CD−ROM、光磁気ディス
クなどを含む任意のタイプのディスクや、読み出し専用
メモリ(ROM)や、ランダム・アクセス・メモリ(R
AM)や、EPROMや、EEPROMや、磁気若しく
は光カードや、電子命令を記憶するため適した任意のタ
イプの媒体のような、コンピュータシステムバスに接続
された、コンピュータ読み取り可能な記憶媒体に記憶さ
れるが、これらの例示的な記憶媒体に制限されるもので
はない。
【0024】ここで説明するアルゴリズム及びディスプ
レイは、本来的に特定のコンピュータ若しくはその他の
装置に関連付けられたものではない。種々の汎用システ
ムが、ここで教示された事項に応じたプログラムと共に
使用される。或いは、要求された方法の手順を実行する
ため、より専用化された装置を構成した方が便利な場合
もある。多様なこれらのシステムに対し要求される構成
は、以下の記載から明らかになる。さらに、本発明は、
特定のプログラミング言語に基づいて説明されていな
い。以下で説明するような本発明の教示事項を実現する
ために、多様なプログラミング言語を使用できることが
認められるであろう。
【0025】機械読み取り可能な媒体は、機械(たとえ
ば、コンピュータ)によって読み取り可能な形式で情報
を記憶若しくは伝送する任意のメカニズムを含む。たと
えば、機械読み取り可能な媒体は、読み出し専用メモリ
(ROM)と、ランダム・アクセス・メモリ(RAM)
と、磁気ディスク記憶媒体と、光記憶媒体と、フラッシ
ュメモリ装置と、電気的、光学的、音響的若しくはその
他の形式の伝搬信号(たとえば、搬送波、赤外線信号、
デジタル信号など)と、を含む。
【0026】図1は、画像に対する一つのマルチスケー
ルエントロピー分布を示す図である。最初、画像にJP
EG 2000符号化が施される。下にあるパターン
は、画像のウェーブレット係数である。太線は、JPE
G 2000によるウェーブレットドメイン係数の符号
ブロックへの分割を示し、細線は異なるウェーブレット
サブバンドを分離する。JPEG 2000の場合、エ
ンコーディング処理を実行する符号器は、ウェーブレッ
トドメイン係数を符号ブロックと呼ばれる細分ユニット
へ割り付け、分割する。各正方形に表された数字は、3
レベルの分解を使用して1画素あたりに0.5ビットで
動作するJPEG 2000符号器によって、夫々の符
号ブロックへ割当てられたビット又はエントロピーであ
る。これらの数字は、マルチスケールエントロピー分布
を表現する。
【0027】JPEG 2000ファイルヘッダだけを
使用して入手できるエントロピー割当は、種々のスケー
ルでの異なる特徴の視覚的重要性に関する優れた指標と
なり、異なるマルチスケール特性によって特徴付けられ
た様々なタイプの重要な画像特徴の間の識別に役立つ。
例えば、画像内でフェザー領域を記述するため、マルチ
スケール画像符号器は、細かいスケール係数を符号化す
る多数のビットを使用し、粗いスケール係数に使用する
ビット数は、例えば、フェザー領域に対応した細かいス
ケール係数に使用するビット数よりも少ない。これに対
して、フェース領域を符号化するため、マルチスケール
画像符号器は、中間スケール係数を符号化するためより
多くのビットを費やす。滑らかな背景に使用されるビッ
ト数は少ない。かくして、マルチスケールエントロピー
分布は、下にある画像特徴に関する重要な情報を提供す
る。マルチスケールエントロピー分布の知識がヘッダか
ら取得できる場合を考えると、一つ以上の演算が実行さ
れる。これらの演算は、例えば、画像セグメンテーショ
ン、自動アクティブ領域識別及びスケーリング、及び/
又は、適応画像スケーリングを含む。
【0028】JPEG 2000は、コヒーレントな符
号ストリーム内のデジタル画像とファイルフォーマット
を表す規格である(例えば、ウェブサイトwww.iso.chの
ITU−T勧告T.800|ISO/IEC 1544
4−1:2000、"JPEG 2000 image coding standar
d"を参照せよ。)。JPEG 2000は、以下の手順
を使用して、画像のウェーブレット係数を効率的に符号
化することにより、デジタル画像を効率的に表現する。
典型的な画像は、一つ以上の成分(例えば、赤、緑、
青)により構成される。成分は、サンプルの矩形状配列
である。これらの配列は、更に矩形状タイルに分割して
もよい。タイル単位に基づいて、成分は、随意的に、色
空間変換と逆相関される。各タイル成分は別々に圧縮さ
れる。タイル内の各カラー成分のウェーブレット係数が
獲得される。ウェーブレット係数はウェーブレットドメ
インの局部的グループに分離される。この局部グループ
は符号ブロックと呼ばれる。符号ブロックは周囲を使用
して順序付けされる場合もある。これらの多様なウェー
ブレット係数グループを独立に符号化するため算術符号
化が使用される。符号化された係数(符号化係数)は、
随意的にレイヤに構造化され、進行を促進させる。一つ
のタイルの一つの成分の一つの周囲のある解像度の一つ
のレイヤからの符号化データは、パケットと呼ばれるユ
ニットに保持される。符号化データの他に、各パケット
はパケットヘッダを有する。符号化後、タイル成分は、
随意的に、タイル部に分割され、さもなければ、タイル
成分は単一のタイル部により構成される。タイル部は、
構文に対応した符号ストリームにおける最小ユニットで
ある。JPEG 2000符号ストリームは、構文(主
ヘッダ及びタイル部ヘッダと、EOC)と、一つ以上の
ビットストリームとにより構成される。ビットストリー
ムは、パケット(符号ブロックに対する符号化データ
と、印ストリームパケットヘッダを含む任意のインスト
リームマーカー)により構成される。符号化データを解
析するための構造的情報であるパケットヘッダは、メイ
ンヘッダ、タイルヘッダ、若しくは、インストリームに
保持される。
【0029】JPEG 2000は、マーカーセグメン
トを含む主ヘッダ及びタイルヘッダを規定する。また、
JPEG 2000は、マーカーセグメントに収容され
るか、若しくは、ビットストリーム中のインストリーム
であるパケットヘッダを規定する。ヘッダは、読み出さ
れ、マルチスケールエントロピー分布を獲得する処理へ
の入力として使用される。以下の表1は、種々のJPE
G 2000ヘッダに収容された情報の中でヘッダ情報
に基づく処理に関連したヘッダを要約したものである。
【0030】
【表1】 パケットヘッダ(PPM、PPT、in−strea
m)の場合、パケットヘッダは、主ヘッダ、タイルヘッ
ダ、若しくは、インストリームにあるが、同時にこれら
のうちの二つ以上の組合せになることはない。これに対
して、パケット長及びタイル長さ部は、主ヘッダ若しく
はタイルヘッダ、又は、同時に両方に存在する。
【0031】〔高ビットレート画像からの低ビットレー
ト画像の推定〕低い方のビットレートでのマルチスケー
ルエントロピー分布は、視覚的重要性の頑強な指標を与
える。高い方のビットレートでは、センサ若しくは撮影
装置からのデジタル画像に現れる画像ノイズが存在する
と、全体的なエントロピー分布が悪化する。アプリケー
ションに基づいて、画像は、損失のある符号化又は損失
の無い符号化が施される。JPEG 2000標準にお
ける階層(レイヤ状)体系は、損失の無い、若しくは、
高ビットレートの符号化画像の符号ストリームを、視覚
的な重要性又は平均自乗誤差(MSE)に基づく重要性
のレイヤに並べるため使用される。この場合、低ビット
レート型の画像は、一部のレイヤのパケットだけから情
報を抽出し、他のレイヤのパケットを無視することによ
り獲得される。このような階層化が符号器によって利用
されない場合、ヘッダからのパケット長さ情報は、符号
器によって選択されたビットレート、例えば、損失の無
いビットレート、高ビットレート、若しくは、低ビット
レートだけでマルチスケールエントロピー分布を生成す
ることが可能である。
【0032】符号器が損失無し、若しくは、高ビットレ
ートを選択した場合、低ビットレート型の画像の推定
は、後述のいずれかの画像処理アルゴリズムを適用する
前に行われる。このような推定を実施する一実施例につ
いて次に説明する。ビットが割当てられる順序を決定す
るため、符号ブロック中の係数の絶対値の最大値及び符
号化パスの個数に関するヘッダからの情報と、種々の解
像度レベルでのサブバンドの視覚的重要性若しくは最小
自乗誤差に基づく重要性の発見的情報及び統計的情報が
使用される。
【0033】この推定は、画像に対する所定のビットレ
ートが達成されるまで、1符号ブロックあたりのビット
総数からビットを連続的に減じる。控除する順序は、ビ
ット割当アルゴリズムと逆の順序である。割当アルゴリ
ズムは、符号器が使用するアルゴリズムと同じでもよい
が、同じで無ければならないわけではない。
【0034】JPEG 2000ファイルのパケットヘ
ッダから、符号ブロックの長さ、すなわち、ビット”
B”の個数と、零ビットプレーン”NZ”の個数と、符
号化中に使用される符号化パス”CP”の個数とが得ら
れる。符号ブロック内の係数の絶対値の最大値の推定値
maxBは、次式(1)に従って、最大非零ビットプ
レーンを計算することによって、零ビットプレーンの個
数から取得される。 MaxB=MSB(codeblock subband) − NZ (1) 式中、MSBは、符号ブロックが属する特定のサブバン
ドのビットプレーンの最大数である。MSBは、JPE
G 2000の適切なQCCヘッダエントリー若しくは
QCDヘッダエントリーの情報によって定義される。画
像の視覚的若しくはMSEに基づく重み付け又は統計的
特性に基づいて、所与のサブバンド内のビットプレーン
の重要性を反映したサブバンド及びビットプレーンの順
序が取得される。例えば、MSEに基づく重要性に基づ
いて、5レベル分割のサブバンド内のビットプレーンの
重要性の順序付けは、表2に示された順序によって与え
られる。
【0035】
【表2】 推定アルゴリズムは、その順序を使用し、順序数iのコ
ードブロック毎に、サブバンドs(i)内の特定のビッ
トプレーンb(i)と、対応したレベルl(i)とを含
む符号化パスの数CP(b(i))、すなわち、 CP(b(i))=CP-((MaxB(s(i),l(i))-b(i))*3+1) (2) を計算する。この数が正である場合、特定のビット数が
符号ブロックビットから控除される。一実施例におい
て、この特定のビット数は、特定のサブバンド、又は、
特定の解像度における符号化パスあたりの平均ビット数
として計算される。次の手順の順序数(i+1)におい
て、導出されたビット数は、同様の方式で、レベルl
(i+1)でのサブバンド(i+1)のビットプレーン
b(i+1)から控除される。
【0036】擬似コードでは、0.5ビット/画素を目
標レートとする例示的な推定アルゴリズムは、 Max_I = largest_order_number target_rate = 0.5 new_B = B; new_CP = CP i=1 while ((i=<max_i) && (new_rate>target_rate)){ for each codeblock m in subband s(i) elim_CP[m](b(i)) = new_CP[m]-((MaxB(s(i),l(i))-b(i))*3+1); if(elim_CP[m](b(i)) > 0) av_bits = new_B[m](s(i))/new_CP[m](s(i)); new_B[m] -= av_bits*elim_CP[m](b(i)); if(new_B[m]<0) new_B[m] = 0; new_CP[m] -= elim_CP[m](b(i)); end end new_rate = sum(new_B*8)/ImaeSize; i++; end のように表現される。new_B及びnew_CPは、
符号ブロックの個数をサイズとする配列である。
【0037】目標レートに到達した場合、新しい推定ビ
ット値new_Bがエントロピー処理アルゴリズムで使
用される。
【0038】高ビットレート画像から低ビットレート画
像を推定する代替案は多数存在する。代替的な一実施例
では、低ビットレート画像を推定する別のアプローチが
使用される。このアプローチは、画像のウェーブレット
係数の分布に関するモデルを使用する。
【0039】ウェーブレット係数の分布は、ガウシアン
分布又はラプラシアン分布によって記述することができ
る。多数の自然画像の分布は近似的に指数分布に従うこ
とが検証されているので、ラプラシアン分布は、屡々、
文献でモデリングのため使用されている。ラプラシアン
分布は、次の式、
【0040】
【数2】 で表される密度を有する。
【0041】エントロピーの理論的な定義は、 H=−Σplog(p) (4) であり、式中、pは、イベントAの確率であり、す
なわち、 p=P(A) である。損失のある圧縮画像の場合、イベントとは、係
数が特定の量子化ビンに分類される状況である。量子化
器Qによるスカラー量子化の場合、イベントAは、係
数が、区間、 〔i*2,(i+1)*2) に収まるイベント、すなわち、 p=P(A)=P(ウェーブレット係数d∈〔i*2,(i+1)*2 )) ・・・・・(5) として記述される。ラプラシアン分布の場合、
【0042】
【数3】 が得られる。
【0043】パラメータλが符号化ユニットのヘッダデ
ータから推定できる場合、この符号化ユニットにおける
係数のpdf(確率密度関数)を推定することができ、
任意の量子化器Qに対するエントロピーが決定される。
【0044】JPEG 2000ファイルのパケットヘ
ッダは、符号ブロックにおける零ビットプレーンの数に
関する情報を含む。この情報から、その符号ブロック内
の係数の最大絶対値についての推定値が、式(1)の変
数MaxBによって得られる。この変数を使用して、パ
ラメータλは、 λ*=log(1符号ブロックあたりの係数の個数)/(2MaxB) (7 ) のように推定される。
【0045】この推定値を式(6)及び(4)に挿入す
ることにより、特定の量子化を受けたエントロピーの推
定値が獲得される。値Hは、画素あたりのビットを与え
る。符号ブロック長さはバイト単位で測定されるので、
推定値Hは、8*(1符号ブロックあたりの係数の個
数)倍する必要がある。最終アルゴリズムは、異なる解
像度レベルで異なるサブバンドのビット数を連続的に削
減するため、上述の方法と同じ順序を使用する。ビット
の削減は、量子化器を表2からのビットプレーンパラメ
ータb(i)に設定することによって得られる。
【0046】〔画像解析処理アルゴリズム〕ヘッダから
入手可能であるマルチスケールエントロピー分布を利用
することにより、画像解析又はコンピュータビジョン、
及び、例えば、セグメンテーション、自動スケーリン
グ、解像度選択、下にある画像についての自動領域選択
及びクロッピングのような類似した演算を実行するため
使用されるが、これらの例には限定されない。一般的な
従来技術は、 文献:ダブリュー・プラット(W. Pratt)著、「デジタル
画像処理(Digital ImageProcessing)」、第2版、ジョ
ンワイリー社(John Wiley & Sons, Inc.)発行、米国ニ
ューヨーク州ニューヨーク市、1995年と、 文献:エー・ジェイン(A. Jain)著、「デジタル画像処
理の基礎(Fundamentals of Digital Image Processin
g)」、プレンティス・ホール(PrenticeHall)、米国ニュ
ージャージー州エングルウッド、1995年に記載され
ている。一実施例では、厳密なサンプルに関するマルチ
スケールエントロピー分布の代わりに、(例えば、JP
EG 2000における符号ブロックのような)マルチ
スケール係数の局所ブロックに広がるエントロピー分
布、すなわち、粒状エントロピー分布が利用可能であ
る。一実施例において、粒状エントロピー分布は、基礎
画像を処理するため使用される。
【0047】以下で説明するように、JPEG 200
0ヘッダで利用可能な画像からのマルチスケール情報の
用法は、幾つかの画像解析アルゴリズム(又はコンピュ
ータビジョン)のフレームワークで実証される。一実施
例において、使用されるヘッダパラメータは、PPM、
PPT、SIZ、COD、COC、QCC及びQCDで
ある。これらのパラメータから、ウェーブレットドメイ
ンでの符号ブロックの位置、及び、対応した係数を符号
化するため符号器によって使用されるビット数を導出す
ることができる。これらのビット数は、画像のマルチス
ケール表現のビット分布を導出するため使用され得る。
符号ブロックのスケール及び空間位置、並びに、ヘッダ
から推測されるマルチスケールビット分布は、マルチス
ケールセグメンテーション、自動スケーリング、自動ス
ケーリング及びクロッピング、並びに、マルチスケール
コラージュの生成のような種々の画像処理アプリケーシ
ョンにつながる。
【0048】〔セグメンテーション〕クラシフィケーシ
ョン技術は、クラスラベルを画像の各小エリアに割当て
る。このようなエリアは、個々の画素でもよく、或い
は、例えば、正方形ブロックに含まれる画素のような画
素のグループでもよい。多様な画像解析技術は、異なる
方法でクラス割当を使用し、例えば、セグメンテーショ
ン技術は、画像を一様な特性、例えば、同じクラスラベ
ルをもつ領域に分離する。
【0049】マルチスケールエントロピー分布を使用す
ることにより、スケールはクラスラベルとして各画像領
域へ割当てられるので、より細かいスケールからの係数
が無視されるとしても、基礎領域に関する視覚的関連情
報は割当てられたスケールで維持される。このようなラ
ベリングは基礎画像特徴の周波数帯域を識別する。セグ
メンテーションは、最適化問題をもたらし、この最適化
問題を解決するため統計的アプローチが求められる。
【0050】ウェーブレットドメインにおける符号ブロ
ックの位置は、2次元(2D)空間位置(i,k)とス
ケールjとによって与えられる。例えば、サイズが51
2×512で、32×32のサイズの符号ブロックを有
する画像を処理する場合、レベル1の各帯域には、サイ
ズが32×32の符号ブロックが8×8個存在し、レベ
ル2では1帯域あたりに4×4個の符号ブロックが存在
し、レベル3では1帯域あたり2×2個の符号ブロック
が存在する。レベルjの3種類の帯域LH、HL及びH
Hに対するレベルjの符号ブロック位置(i,k)毎の
ビット数B(i,k)は、ウェーブレットドメイン位
置(i,k)での全係数を符号化するため必要なビット
数を得るため加算される。実際上、種々のエントロピー
の線形結合又は非線形結合は、垂直特徴と水平特徴の区
別を促進するため使用され得る。スケールj∈
{1...J}は各ブロックに割当てられるので、コス
ト関数Λは、次式:
【0051】
【数4】 のように最大化される。式中、Soptは画像全体に対
する最適セグメンテーションマップであり、Sは、
{1...J}のうちのスケールが一つずつ割当てられ
たサイズM×Nのブロックの考えられるラベリングJ
MNのうちの一つであり、Λ(S,B)は、セグメンテ
ーションSとエントロピー分布Bが与えられた場合のコ
ストを生じる。
【0052】一実施例において、統計学における従来技
術の最大事後確率(MAP)アプローチは、セグメンテ
ーション問題を解決するため使用される。なぜならば、
このようなアプローチは最終的なアプリケーションに合
うように調整できるからである。コスト関数Λを設定す
るためMAPによって使用される基本構成要素は、セグ
メンテーションマップSと、セグメンテーションマップ
Sの確率である事前確率P(S)とが与えられた場合
に、画像のエントロピー分布Bの確率を表す尤度(尤も
らしさ)P(B|S)である。MAPコスト関数は、 Λ(B,S)=P(B,S)=P(B|S)P(S) (ベイズの法則) (9) によって与えられる。MAPセグメンテーション解法
は、式(9)を用いて式(8)を最適化することに相当
する。
【0053】レベル1の符号ブロックに含まれる係数
は、画素ドメインにおいて約2倍のサイズのブロックに
関する情報を収容する。画素ドメインが特定サイズのブ
ロックに分割された場合、画素ドメインにはウェーブレ
ット分解のレベル1の符号ブロックよりも4倍多いブロ
ックが存在し、ウェーブレット分解のレベル2符号ブロ
ックよりも16倍多いブロックが存在し、以下同様に続
く。したがって、サイズn×nの符号ブロックB
(i,k)のビットは、位置(i2n,k2n)
におけるサイズ2n×2nの画素ドメインにおける
ブロックの情報に寄与する。逆に、位置(x,y)にお
けるサイズn×nの画素ブロックは、
【0054】
【数5】 における符号ブロックB(i,k)から、1/4
して推定された、ビットの一部分を受け取る。一実施例
において、画素ドメインに関連したレベルjのビット数
は、
【0055】
【数6】 のように定義される。この計算は、エントロピー値の断
片に関する補間と等価的である。例えば、多角形補間若
しくはその他の非線形補間のような別の補間アルゴリズ
ムを、レベルjのビットを計算するため使用してもよ
い。
【0056】位置(x,y)におけるサイズ2n×2n
の画素ブロックの解像度jのエントロピーの累積加重
は、次式、
【0057】
【数7】 によって与えられる。但し、式(10)における
【0058】
【数8】 の位置i及びkに対して、
【0059】
【数9】 であり、重みはγj、lである。一例として、重みの組
は、 l<jの場合に、γj、l=0 l≧jの場合に、γj、l=w (12) であり、w=1、w=3.5、w=5.5、w
=13、w=20である。パラメータwと重みγ
j,lは、アプリケーションに応じて変更され得る。値
【0060】
【数10】 の組は、解像度jにおける画像の累積加重エントロピー
と呼ばれる。
【0061】位置(x,y)における画素ドメインブロ
ックのエントロピー
【0062】
【数11】 に対する尤度は、画素ドメイン位置(x,y)と関連し
た全てのレベルの総加重ビットに対する
【0063】
【数12】 の値になるように設定される。すなわち、
【0064】
【数13】 である。画素ドメインブロックは独立であることを仮定
すると、総尤度は、
【0065】
【数14】 によって与えられる。
【0066】
【数15】 は、原画像に対するマルチスケールエントロピー分布を
表す。
【0067】次に、事前確率P(s)を決定する必要が
ある。以下の議論は、典型的なセグメンテーションマッ
プに関する既存知識を反映している。事前確率を選択す
るため多数の方法が考えられる。例えば、事前確率を選
択する別の方法は、 文献:R. Neelamani, J.K. Romberg, H. Choi, R.Ried
i, and R.G. Baraniuk, "Multiscale image segmentati
on using joint texture and shape analysis", in Pro
ceedings of Wavelet Applications in Signal and Ima
ge Processing VIII, part of SPIE's interntional Sy
mposium on Optical Science and Technology, San Die
go, CA, July 2000 文献:H. Cheng and C.A. Bouman, "Trainable context
model for multiscalesegmentation," in Proc. IEEE
Int. Conf. on Image Proc. ?ICIP'98, Chicago, IL, O
ct.4-7, 1998 文献:H. Choi and R. Barauik, "Multiscale texture
segmentation using wavelet-domain hidden Markov mo
dels," in Proc. 32nd Asilomar Conf. on Signals, Sy
stems and Computers, Pacific Grove, CA, Nov. 1-4,
1998に記載されている。
【0068】セグメンテーションマップは連続領域をも
つと考えられるので、各位置(x,y)に関する事前確
率は、その直近の、(境界での反射を使用して)9ブロ
ックにより構成された近傍N(x,y)に基づいて設定
される。個別の事前確率は、
【0069】
【数16】 である。式中、#(N(x,y)=S(x,y))はS
(x,y)と同じ近傍の個数を表し、αは連続領域を優
遇するため増加されるパラメータであり、α=0は、セ
グメンテーションマップのブロックが相互に独立である
ことを意味する。一実施例において、全体的な事前確率
は、
【0070】
【数17】 のように選択される。
【0071】一実施例において、αは、0.02乃至
0.08に一致する。希望セグメンテーションマップ
は、コスト関数Λ(S,B)を最適化することによって
獲得できる。多数の従来技術による反復技術が局所極大
を探索するため使用される。ある反復技術は、最初に、
式(12)にα=0を代入してコスト関数を最適化する
初期セグメンテーションマップを計算する。ベクトル最
適化問題はスカラー最適化問題に分離されるので、最終
的なコスト関数を最適化するセグメンテーションマップ
が獲得される。セグメンテーションマップは、
【0072】
【数18】 によって与えられる。全ての(x,y)に対して、
(x,y)でのセグメンテーションマップは、式、
【0073】
【数19】 を使用して更新される。ここで、N(x,y)はS
m−1から取得される。反復毎に、mは、m=m+1に
インクリメントされる。反復ループは、S=Sm−
になるまで繰り返される。反復アルゴリズムは常に収束
する。その理由は、コスト関数Λ(B,S)が、反復
mに関して非減少関数であり、コスト関数は有界である
ことにある。収束後に得られるSはセグメンテーショ
ン推定値である。
【0074】領域のラベリングに関する実際のセグメン
テーション出力は、上述の式(3)に表されるように、
MAPコスト関数 Λ(B,S)=P(B|S)・P(S) (20) を最大化することによって得られる。
【0075】図2は、画像を区分(セグメント化)する
処理の一実施例のフローチャートである。図2を参照す
るに、処理ステップ201において、画像のブロックに
関するマルチスケールエントロピー分布情報を収容する
ヘッダを含むファイルが受け取られる。一実施例におい
て、ファイルはJPEG 2000フォーマットの画像
を表現する。処理ステップ202において、ブロック毎
に、スケールの組の中のスケールがコスト関数を最大化
するブロックに割当てられる。コスト関数は、総尤度と
事前確率の積である。総尤度は、ブロックの尤度の積で
ある。一実施例において、ブロックの各尤度は、スケー
ルの組の各スケールに対して、スケールの重みと、その
スケールでブロックを符号化するために費やされたビッ
ト数との積和に比例する。一実施例において、そのスケ
ールでブロックを符号化するため費やされたビット数
は、分子:そのスケールでのブロックのマルチスケール
係数のエントロピー分布を、分母:スケールの4乗で割
算して得られた数である。処理ステップ203におい
て、画像は、等しいスケールが割当てられたブロックを
一つにグループ化することによって区分される。
【0076】図3は、女性の画像例の上に重ね合わされ
たセグメンテーションマップの説明図である。一実施例
において、上述のセグメンテーション処理は、画像の基
礎特徴を反映させるため、精細なスケールを使用して画
像301の顔領域にラベルを付け、粗いスケールを用い
て背景領域にラベルを付ける。種々のシェードは、様々
なタイプの特徴を備えた領域が個別に識別されたことを
表す。一実施例において、セグメンテーション処理は、
基礎特徴に基づいて様々な領域にスケールを割当てる。
右側の色バー302は、様々な領域に割当てられたスケ
ールをあらわす。多数のエッジを含む顔のような領域
は、精細なスケール301を用いてラベル付けされる。
これに対して、背景領域は粗いスケール304が割当て
られる。
【0077】図4は、日本語テキストの画像例の上に重
ね合わされたセグメンテーションマップの説明図であ
る。セグメンテーションマップ402は一様であるた
め、重ね合わせは、原画像401の見え方を変えない。
一実施例において、雪面テーション処理は、基礎特徴に
基づいて様々な領域にスケールを割当てようとする。右
側の色バー403は、様々な領域に割当てられたスケー
ルを表す。画像401は一様な特徴を備えているので、
アルゴリズムは、画像401の全ての領域にスケール3
を一様に割当てた。一実施例において、本例における画
像符号器は、JPEG 2000 パートIの可逆ウェ
ーブレットフィルタと、5レベルの分解と、符号ブロッ
クのサイズ32×32と、階調画像上で1画素あたり
0.2ビットのビットレートと、を使用した。
【0078】この結果は、カラー画像にも拡張できる。
セグメンテーションのため、異なるカラー成分の間でマ
ルチスケールエントロピー割当を線形結合、又は、非線
形結合を使用する。セグメンテーションは、輝度若しく
は緑色のような一成分だけに基づいて実行される。セグ
メンテーションアルゴリズムは、成分毎に別々に実行す
ることが可能であり、投票を使用して合成され、又は、
MAP方法によって合成される。
【0079】一実施例では、最終結果の解像度は、マル
チスケールエントロピー分布の粒度(粗さ)によって制
限される。典型的に、基礎画像に関する最終結果の解像
度は、符号ブロックサイズの倍数に制限される。一実施
例において、プリーシンクトが利用される場合、プリー
シンクト境界が符号ブロックを分離させるならば、解像
度がよくなる。
【0080】〔自動解像度選択〕屡々、望ましくは、精
細なスケール係数が完全に棄てられた場合でも、維持さ
れる係数が画像を識別するために十分な情報を含むよう
に、最良スケールが分かっている。これは、例えば、デ
ジタルカメラと共に使用される。エントロピーは視覚的
情報の良好な指標であるため、エントロピーは、画像が
スケールjで表現されたときに失われた視覚的情報の量
に対する指標として使用される。さらに、マルチスケー
ル表現は、画像スケーリング中に視覚的情報が失われた
画像内の近似エリアを識別するため役立つ。最良スケー
ルは以下の如く推定される。各スケールjに対して、画
像の夫々の部分を再構成するためにマルチスケール係数
,jの所与のグループの重要性が解析される。係数
の相対的な重要性は、エントロピーを、直前の粗いレベ
ルj+1からの平均エントロピーのスケール倍、又は、
より粗い全てのレベルj+1,...,Jの組合せから
の平均エントロピーのスケール倍と比較することによっ
て推定される。Si,jは、B<βμj+1である場合
に重要であり、B≧βμi+1である場合に重要ではな
い。ここで、μ j+1は、粗いスケールj+1における
1ブロックあたりのビット数の平均であり、βは重要性
を決定する閾値パラメータである。一実施例において、
βは0.3である。
【0081】各スケールjに対し、レベルjで有意な係
数が対象とする画像エリアのパーセンテージP(j)を
測定する。P(j)は、レベルjで有意な係数が棄てら
れた場合に、情報の有意な量を失うエリアを測定する
(画像が2の倍率でスケール縮小された場合、レベル
1...jの全ての係数はスケール縮小された画像内で
失われる。)。起こり得る最も粗いスケールJ
optは、少なくとも領域のPパーセントが有意であ
り続けるように、すなわち、 P(Jopt)>P (21) であるように選択される。ここで、Pは、認識できる
必要のあるエリアの最低限のパーセンテージを設定する
閾値パラメータである。一実施例において、Pは35
%と一致する。画像に関する十分な情報を維持する最良
スケールはJop である。したがって、画像が至ると
ころで、
【0082】
【数20】 の倍率でスケール縮小された場合でも、画像は、画像の
認識を実現し易くするため、残りの係数に十分な情報を
含むであろう。あらゆる粗いスケール係数に基づいて、
或いは、粗いスケール係数の一部だけに基づいて、重要
性の閾値を設定することが可能である。
【0083】図5は、画像を適応的にスケーリングする
処理の一実施例のフローチャートである。処理ステップ
501において、画像のブロックに関するマルチスケー
ルエントロピー分布情報を収容するヘッダを含むファイ
ルが受け取られる。一実施例において、ファイルはJP
EG 2000フォーマットで画像を表現する。処理ス
テップ502において、ブロック毎に、ブロックがスケ
ールで重要性を維持するかどうかが判定される。重要性
を維持する旨を判定するのは、そのスケールにおけるブ
ロックのマルチスケール係数のエントロピーが少なくと
も一つの粗いスケールにおけるブロックのマルチスケー
ル係数の平均エントロピーよりも大きいと判定されたと
きである。一実施例において、平均エントロピーは、閾
値パラメータが乗算された平均ビット分布である。処理
ステップ503において、画像は、ブロックの閾値パー
センテージが重要性を維持する最も粗いスケールへスケ
ーリングされる。
【0084】図6は、女性の画像例の適応スケーリング
の説明図である。原画像601のサイズは、512×5
12画素である。スケール処理後画像602のサイズは
64×64画素である。四角い枠603、604及び6
05は、スケール処理後画像サイズに対する種々の選択
肢を表す。一実施例において、スケーリングは、35%
の認識可能なエリアと、重要性閾値係数0.3と、を使
用して判定される。図7は、日本語テキストの画像例の
適応的なスケーリングの説明図である。原画像701の
サイズは、512×512画素である。スケール処理後
画像702のサイズは128×128画素である。四角
い枠703及び704は、スケール処理後画像サイズに
対する種々の選択肢を表す。一実施例において、スケー
リングは、35%の認識可能なエリアと、重要性閾値係
数0.3と、を使用して判定される。上述のスケール選
択アルゴリズムは、異なる画像に対しては異なるスケー
ルを選択する。女性の画像601は、一実施例によれ
ば、2の倍率でダウンサンプリングされ、日本語テキ
ストの画像701は、一実施例によれば、2の倍率で
ダウンサンプリングされる。スケールの違いが生じる理
由は、日本語テキスト画像701の方が女性の画像60
1よりも高周波数帯域に(より高いエントロピーとして
反映した)重要な成分を含むからである。
【0085】重要性閾値βが与えられた場合、符号ブロ
ックを重要又は重要でないとしてラベル付けすること
は、一つの解像度レベルにおける全ての符号ブロックの
エントロピーを、例えば、異なる平均値μ及びμ
と、異なる標準偏差σ及びσをもつ二つのガウシ
アン分布のような二つの確率分布の混合としてモデル化
することによって実行される。重要性閾値よりも低いエ
ントロピー値から、パラメータμ及びσが推定され
る。これらの二つの確率密度関数f及びfが与えら
れた場合、fに属するエントロピー値xの確率が推定
される。この方法は、例えば、文献:Duda, Hart, Stor
k, "Pattern Classification (2nd ed.)", Wiley, New
York, NY, 2000に記載されているように標準的な手続で
ある。各解像度での符号ブロックの確率分布は、上述の
マルチスケールセグメンテーションアルゴリズムに取り
入れられる。
【0086】重要性閾値βが与えられた場合、最適スケ
ールJoptは、
【0087】
【数21】 のように選択される。
【0088】固定サイズウィンドウの自動クロッピング
及びスケーリング 屡々、画像は、固定サイズの画素で表現される。このよ
うな制約下では、所与のサイズ制約を充たす画像の最良
の表現を選択することが望ましい。エントロピーは視覚
的情報の優れた指標であるため、サイズ制約を依然とし
て充たしつつ最大エントロピーを包含する画像表現が実
現される。
【0089】式(6)から得られる累積加重エントロピ
【0090】
【数22】 は、局所インジケータ関数と畳み込まれた画像の最良ス
ケール(又は解像度レベル)を決定するための最大化ア
ルゴリズムへの入力として使用される。重みは、セグメ
ンテーション部と同様に、 l<jの場合に、γj、l=0 l≧jの場合に、γj、l=1 として選択される。
【0091】2次元インジケータ関数Iは、アプリケー
ションの形状制約及びサイズ制約によって定められたサ
ポートを用いて構成される。例えば、希望形状制約が矩
形であり、サイズ制約が画素次元m×nである場合、位
置(x,y)にあるサイズm×nの矩形に対するイ
ンジケータ関数は、
【0092】
【数23】 によって与えられる。「最良」レベルjに置かれた矩
形の「最良」位置(a,b)は、
【0093】
【数24】 として計算される。式中、κ(a,b)は、エントロ
ピーの相対的な空間及びスケール重要性を制御するマト
リックスである。κ(a,b)のサイズは、スケール
と全く同じである。換言すると、中心に置かれた画像を
取り扱い、かつ、自然な人の傾向、すなわち、殆どの画
像符号器には取り入れられていない発見的手法を組み込
むため、κ(a,b)は、典型的に、画像の中心部分が
画像のエッジのエントロピーよりも重く加重されるよう
に選択される。一例として、符号ブロックサイズが32
×32の512×512形の画像を想定する。j=1,
2,3,4の場合に、空間重要性加重マトリックスの組
に対する一例は、 κ=κ=mask1*64/||mask1|| マスク1 mask1=[(1.0 1.1 1.2
1.3 1.3 1.21.1 1.0)×(1.0
1.1 1.2 1.3 1.3 1.2 1.1
1.0)] κ,κ==mask2*64/||mask2|| mask2=[11111111]×[1111111
1] であり、||mask1||は、マスク用マトリックスのL
−ノルムを表す。
【0094】解像度jでの累積加重エントロピーとをマ
スク1と乗算することは、解像度jで画像の中心からエ
ッジへ向かって1から0.77まで線形に減少するエン
トロピー値に重み付けすることを意味する。
【0095】画像の最良表現は、解像度jで画像を理
論的に計算し、この低解像度画像から、位置
【0096】
【数25】 の左下隅に置かれたサイズm×nの矩形をクロッピング
することにより得られる。この手続は、j低減解像度
画像のクロッピングされた部分に寄与するJPEG 2
000符号ストリームの符号ブロックだけを復号化し、
実際にクロッピングされた画像を作成するためこれらの
データに逆変換を施すことにより実際に行われる。
【0097】図8は、画像の自動スケーリング及びクロ
ッピング処理の一実施例のフローチャートである。この
処理は、ハードウェア(例えば、回路、専用ロジックな
ど)、ソフトウェア(汎用コンピュータシステム若しく
は専用機械上で動くようなもの)、又は、ハードウェア
とソフトウェアの組合せを含むロジックを処理すること
により実行される。
【0098】図8を参照するに、処理ステップ801
で、画像のブロックに関するマルチスケールエントロピ
ー分布情報を収容するヘッダを含むファイルと、表示幅
及び表示高さのような形状制約とが受け取られる。一実
施例において、このファイルは、JPEG 2000フ
ォーマットで画像を表現する。
【0099】処理ステップ802で、ブロック毎にスケ
ールの組の中の各スケールに対して、そのスケールにお
けるブロックの累積エントロピー分布は、最初のスケー
ルと最大スケールの間に収まるスケールのブロックを符
号化するため消費される加重和に一致するように設定さ
れる。
【0100】処理ステップ803で、ブロック毎にスケ
ールの組から選択された各スケールに対して、かつ、所
与の画像幅及び高さの範囲内で選択された幅と高さの各
オフセットに対して、選択されたスケールと、選択され
た幅及び高さオフセットとにけるブロックのインジケー
タ関数が1に設定されるのは、ブロックの幅位置が、選
択された幅オフセットと、選択された幅オフセットに選
択されたスケールで拡大縮小された表示幅を加えたもの
と、により構成される組の第1の最小値よりも大きくな
い、と判定され、かつ、ブロックの高さ位置が、選択さ
れた高さオフセットと、選択された高さオフセットに選
択されたスケールで拡大縮小された表示高さを加えたも
のと、により構成される組の第2の最小値よりも大きく
ない、と判定されたときである。それ以外の場合、イン
ジケータ関数は零に設定される。第1の最小値は、画像
の幅と、ブロックの幅プラス1に第1のスケールで拡大
縮小された希望高さを加えたものとにより構成される組
の最小値である。第2の最小値は、画像の高さと、ブロ
ックの高さプラス1に第2のスケールで拡大縮小された
希望高さを加えたものとにより構成される組の最小値で
ある。
【0101】処理ステップ804で、ブロックに対する
累積エントロピー分布にブロックのインジケータ関数
(スケール、幅及び高さのオフセットにより特徴付けら
れる)及びパラメータを乗算したものの和を最大にする
ときの最適位置(幅及び高さのオフセット)及び最適ス
ケールが計算される。処理ステップ805において、画
像は最適位置へクロッピングされ、得られるクロッピン
グされた画像は最適スケールへダウンサンプリングされ
る。
【0102】一実施例において、上記の処理は、画像の
領域とそのスケーリング倍率を同時に選択する。図9
は、女性の画像例の自動スケーリング及びクロッピング
の説明図である。原画像901のサイズは512×51
2画素である。描画902の最大サイズは、192×1
92画素になるように制約される。最終表現902を1
92×192画素の範囲に収容するため、この処理は、
女性の重要な顔領域を選択し、つぎに、重要な顔領域を
倍率2でスケールダウンする。固定サイズ表現902
は、重要でない背景領域を含まない。四角い枠903
は、表現されていると考えられる原画像に関する領域を
表示する。
【0103】図10は、日本語テキストの画像例の自動
スケーリング及びクロッピングの説明図である。原画像
1001のサイズは512×512画素である。描画1
002の最大サイズは、192×192画素になるよう
に制約される。日本語テキスト画像1001に対するこ
のアルゴリズムによる最良の192×192表現100
2は、全体画像1001を適切に縮小した画像である。
四角い枠1003は、表現されていると考えられる原画
像に関する領域を表示する。日本語テキスト画像100
1の全体が表現1002を得るため縮小される。
【0104】〔表示制約〕表示空間は、屡々、装置に制
約される。このような環境下では、装置に依存した、重
要な、凝縮された画像の表現を獲得することが望まし
い。ヘッダ情報に基づく処理を表示適合技術と組み合わ
せることにより、多種多様な重要かつ凝縮された画像表
現が得られる。表示装置特性は、表現される画像のサイ
ズに上限と下限を設定する。上述の自動スケーリング処
理は、殆どの画像情報がスケールダウンされた画像に維
持されることを保証するスケールを提案するので、スケ
ールは、表示装置によって指定された限界の間で、提案
されたスケールに最も近くなるように選択することがで
きる。
【0105】屡々、画像を表現するため利用できるサイ
ズ(例えば、画素単位)は固定されている。このような
場合、利用可能な画素の範囲内に収容できるように画像
の最良表現を見つけることが望ましい。上述の自動領域
選択及びスケーリング技術は、マルチスケールエントロ
ピー分布を利用することにより、画像の最良の固定サイ
ズ表現を与えることができる。この処理におけるパラメ
ータは、表現を特定の表示装置に合わせるように選択さ
れる。
【0106】〔アプリケーション〕デジタルビデオシー
ケンスを圧縮する一つのアプローチは、多重解像度画像
符号器を用いて各ビデオフレームを独立に圧縮すること
である。例えば、動画JPEG 2000標準規格は、
各ビデオフレームに関して独立にマルチスケール変換に
基づく圧縮を使用する。ここで提案するアルゴリズムは
これらのフレームを効率的に処理することができるの
で、上述の処理は、動画JPEG 2000にも同様に
適用される。例えば、α及びγj,kのようなセグメン
テーション処理パラメータを適切に設定することによ
り、人物のような「アクティブ」領域が一つのビデオフ
レームの背景から識別される。このことは、より多数の
ビットを次のフレームのアクティブ領域に割当てるため
利用され得るので、必要に応じて人物をより良く識別で
きるようになる。フレーム間におけるエントロピー割当
の重要な時間的変化は、ビデオ中の動きを検出するため
にも利用できる。これは、監視カメラの特殊用途に適用
される。
【0107】画像クラシフィケーションの目的は、画像
データベースの全体を自動的にソートし、自然画像、ポ
ートレート、文書、一様なテクスチャーなどのような類
似タイプの画像をグループ分けすることである。マルチ
スケールエントロピー分布を処理することにより獲得さ
れるセグメンテーションマップは、広範囲のクラシフィ
ケーションを実行するために特徴として利用される。ク
ラシフィケーションは、後で、より集中的かつ専門化さ
れた処理を使用して微調整される。
【0108】画像検索の目的は、ある種のテンプレート
画像に類似した画像を識別することである。優れた画像
検索アルゴリズムは、集中的であり、解析を行うため実
際の画像を必要とするので、ヘッダ情報に基づくセグメ
ンテーションマップは、復号化され、専門画像検索アル
ゴリズムへ供給されるべき画像の数を減少させるため利
用できる。
【0109】上述のセグメンテーションは、画像を、粗
いスケール特徴を含む領域と、細かいスケール特徴を含
む領域とに分離する近似セグメンテーションを行うため
使用される。例えば、文書画像の場合、セグメンテーシ
ョンアルゴリズムは、テキスト領域を画像から適切に区
別する。近似セグメンテーションは、更なる解析のため
光学式文字認識(OCR)のような、より集中的なパタ
ーン解析アルゴリズムへ入力される。
【0110】上述のセグメンテーション技術は、画像の
種々の領域が、その領域に含まれる特徴が粗い特徴か、
又は、細かい特徴であるかに応じて、スケールを増減さ
れる、画像の抽象コラージュ表現を作成するため使用さ
れ得る。このような画像の抽象表現は、ウェブ・ブラウ
ザのような多数のグラフィカル・ユーザ・インタフェー
ス(GUI)画像通信アプリケーションで使用すること
が可能である。
【0111】〔マルチスケールコラージュ〕第1ステッ
プとして、画像のマルチスケールコラージュを計算する
ため、上記のセグメンテーション部で説明したようなセ
グメンテーションが実行される。続いて、矩形が、以下
の方法でセグメント化された画像に合わされる。
【0112】式(6)によるMAPコスト関数
【0113】
【数26】 のようなマルチスケール確率分布、又は、
【0114】
【数27】 のような単調な変換の結果は、矩形を適合させる技術へ
の入力として使用される。目標は、各レベルjで、より
大きいレベルjでの確率に最も類似した確率を有する
矩形を見つけることである。すなわち、矩形内部の内容
は、 j≦m≦j を充たすあらゆるmに関して最も重要である可能性の高
い内容である。したがって、この矩形に対応した画像部
分は、解像度jで巧く表現されていると考えられる。矩
形が見つけられると、この矩形によって覆われたエント
リーの場所が、「カウント済み」としてマークされ、対
応した確率値は、より大きい値(例えば、10)を加算
することによってペナルティーを科される。この手続が
すべてのレベルに対して実行された後、矩形及びレベル
は、レベルjにおける矩形に対する確率の差が最小に
なるように選択される。矩形の位置及びサイズと、関連
したレベルは、リストに保存される。次の反復ステップ
において、この手続は、ペナルティーを科された確率分
布関数(pdf)ユニットに再度適用され、画像の全て
の符号ブロック位置は「カウント済み」としてラベル付
けされる。最終リスト内の情報は、画像の矩形状マルチ
スケール区画を表現する。
【0115】図11Aは、画像をセグメント化し、画像
を適応的にスケーリングし、或いは、画像を自動的にス
ケーリング及びクロッピングする装置の略構成図であ
る。図11Aを参照するに、装置1101は、画像のブ
ロックに関するマルチスケールエントロピー分布情報を
収容するヘッダを含むファイルを受け取る受信ユニット
1102を具備する。一実施例において、ファイルは、
JPEG 2000フォーマットで画像を表現する。装
置1101は、受信ユニット1102と接続された処理
ユニット1103を更に具備する。一実施例において、
処理ユニット1103は、ブロック毎に、スケールの組
の中からコスト関数を最大化するスケールをブロックに
割当てる。コスト関数は、総尤度と事前確率の積であ
る。総尤度は、ブロックの尤度の積である。一実施例に
おいて、ブロックの各尤度は、スケールの組の各スケー
ルに対して、スケールの重みと、そのスケールでブロッ
クを符号化するために費やされるビット数との積の和に
比例する。一実施例において、そのスケールでブロック
を符号化するために費やされるビット数は、そのスケー
ルでのブロックのマルチスケール係数のエントロピー分
布を、スケールの4乗で割算したものである。
【0116】一実施例において、処理ユニット1103
は、画像をセグメント化するため等価的なスケールが割
当てられたブロックを一まとめに集める。一実施例にお
いて、処理ユニット1103は、ブロック毎に、あるス
ケールでのブロックのマルチスケール係数のエントロピ
ーが少なくとも一つのより粗いスケールにおけるブロッ
クのマルチスケール係数の平均エントロピーよりも高い
ということが判定されたとき、ブロックがそのスケール
で重要性を維持している、と判定する。一実施例におい
て、平均エントロピーは、平均ビット分布に閾値パラメ
ータを乗算したものである。
【0117】一実施例において、処理ユニット1103
は、上述の如くブロックの閾値パラメータPのような
閾値パーセント(例えば、35%)が重要性を維持する
最も粗いスケールに画像をスケーリングする。
【0118】処理ユニット1103は、各ブロックに対
して、スケールの組の中の第1のスケール毎に、その第
1のスケールにおけるブロックの累積エントロピー分布
を、その第1のスケールと最大スケールとの間に収まる
スケールに対するブロックを符号化するために費やされ
るビット数の和と一致するように設定する。
【0119】処理ユニット1103は、各ブロックに対
して、スケールの組の中の第1のスケール毎に、ブロッ
クの幅が第1の最小値よりも大きくなく、かつ、ブロッ
クの高さが第2の最小値よりも大きくない、と判定され
た場合、ブロックのインジケータ関数及び第1のスケー
ルに1を設定し、それ以外の場合、0を設定する。第1
の最小値と第2の最小値は、図8に示されるように同じ
である。
【0120】一実施例において、処理ユニット1103
は、最適スケールの最適位置におけるブロック毎に、最
適スケールのブロックに対する累積エントロピー分布
に、ブロックのインジケータ関数と最適スケールとを乗
算し、パラメータ(例えば、上述のκ)倍されたものの
和を最大化するような最適位置及び最適スケールを更に
計算する。
【0121】次に、処理ユニット1103は、画像を最
適位置にクロッピングし、得られたクロップ画像を最適
スケールにダウンサンプリングする。
【0122】図11Bは、画像処理システムで使用する
符号ストリームプロセッサの一実施例のブロック図であ
る。図11Bを参照するに、符号ストリーム1121
は、ヘッダ抽出器1122によって受信され、ヘッダ抽
出器1122はヘッダ情報を抽出する。セグメンテーシ
ョンユニット1123は、ヘッダ抽出器1122から抽
出されたヘッダ情報を使用して符号ストリームに関して
セグメンテーションを実行する。一実施例において、セ
グメンテーションユニット1123は、符号ストリーム
1121の中で復号化すべき符号ブロックを判定し、復
号器1124へ通知する。復号器1124は、セグメン
ト化された画像部分(例えば、指定解像度での領域)に
必要な符号ブロックを復号化する。
【0123】〔定量的な例〕ヘッダ情報に基づく処理の
意義を、1024×1024形の画像から良好な128
×128形サムネイル表現を作成する例を用いて説明す
る。ここで説明する画像解析処理は、上述の自動クロッ
ピング及びスケーリングのためのものである。JPEG
2000画像を本例の画像解析処理で処理した画像の
複雑さと、従来の画像処理で処理した画像の複雑さと、
ラスタ画像の複雑さの比較結果を表3に列挙する。JP
EG 2000形式の画像に対する優位性は、データの
1/1000だけがセグメンテーションアルゴリズムで
使用され、データの1/2未満しか復号化されない点に
ある。
【0124】
【表3】 〔コンピュータシステムの例〕図12は、上記の演算う
ちの一つ以上の演算を実行するコンピュータシステムの
ブロック図である。図12を参照するに、コンピュータ
システム1200は、典型的なクライアント1250若
しくはサーバー1200のコンピュータシステムを含む
場合もある。コンピュータシステム1200は、情報を
通信するための通信機構若しくはバス1211と、バス
1211に接続され情報を処理するプロセッサ1212
と、を含む。プロセッサ1212は、例えば、Pentium
(登録商標)、PowerPC(登録商標)などのマイクロプ
ロセッサを具備するが、これらのマイクロプロセッサに
限定されるものではない。
【0125】システム1200は、バス1211に接続
され、情報と、プロセッサ1212によって実行される
命令とを保持するランダム・アクセス・メモリ(RA
M)、或いは、その他のダイナミック記憶装置1204
(メインメモリと呼ばれる)を更に具備する。メインメ
モリ1204は、プロセッサ1212による命令の実行
中に、一時的な値、或いは、その他の中間情報を保持す
るためにも使用される。
【0126】コンピュータシステム1200は、バス1
211に接続され、プロセッサ1212用のスタティッ
ク情報及び命令を保持するリード・オンリ・メモリ(R
OM)及び/又はその他のスタティック記憶装置120
6と、磁気ディスク若しくは光ディスクと対応したディ
スクドライブのようなデータ記憶装置1207と、を更
に具備する。データ記憶装置1207は、バス1211
に接続され、情報及び命令を保持する。
【0127】コンピュータシステム1200は、バス1
211に接続され情報をコンピュータユーザへ表示す
る、陰極線管(CRT)若しくは液晶ディスプレイ(L
CD)のような表示装置1221にも接続される。英数
字及びその他のキーを含む英数字入力装置1222は、
バス1211に接続され、情報及びコマンド選択をプロ
セッサ1212へ通信する。補助ユーザ入力装置は、マ
ウス、トラックボール、スタイラスペン、若しくは、カ
ーソル方向キーのようなカーソル制御器1223であ
り、方向情報及びコマンド選択をプロセッサ1221へ
通信し、表示装置1221上のカーソル移動を制御す
る。
【0128】バス1211に接続された別の装置は、ハ
ードコピー装置1224であり、命令、データ、若しく
は、その他の情報を、用紙のような媒体、若しくは、同
じようなタイプの媒体に印刷するため使用される。更
に、スピーカー及び/又はマイクロホンのようなサウン
ド録音及び再生装置がバス1211へ随意的に接続さ
れ、コンピュータシステム1200とのオーディオイン
タフェースを実現する。バスに接続されるその他の装置
には、電話機又はハンドヘルド・パーム型装置と通信す
るための有線/無縁通信機器1225が含まれる。
【0129】尚、コンピュータシステム1200及び関
連したハードウェアのコンポーネントの一部若しくは全
部が本発明で使用できる。しかし、これらのコンポーネ
ントの一部若しくは全部を含む他のコンピュータシステ
ムの構成もあり得ることが認められる。
【0130】以上の説明から、本発明の多数の代替及び
変更が当業者に明らかになるであろう。しかし、例示の
ために解説され、図示された具体的な実施例は、本発明
を制限することを意図していないことに注意する必要が
ある。したがって、多数の実施例の詳細の説明は、本発
明に不可欠であると考えられる事項だけが記載された請
求項に挙げられた事項の範囲を制限することを意図した
ものではない。
【図面の簡単な説明】
【図1】画像のマルチスケールエントロピー分布の説明
図である。
【図2】画像セグメンテーション処理の一実施例を説明
するフローチャートである。
【図3】女性の画像例の上に重ね合わされたセグメンテ
ーションマップの説明図である。
【図4】日本語テキストの画像例の上に重ね合わされた
セグメンテーションマップの説明図である。
【図5】画像の適応スケーリング処理の一実施例のフロ
ーチャートである。
【図6】女性の画像例の適応スケーリングの説明図であ
る。
【図7】日本語テキストの画像例の適応スケーリングの
説明図である。
【図8】画像の自動スケーリング及びクロッピングのフ
ローチャートである。
【図9】女性の画像例の自動スケーリング及びクロッピ
ングの説明図である。
【図10】日本語テキストの画像例の自動スケーリング
及びクロッピングの説明図である。
【図11A】本発明による処理を実行する装置の一実施
例のブロック図である。
【図11B】本発明による処理を実行する装置の他の一
実施例のブロック図である。
【図12】コンピュータシステムのブロック図である。
【符号の説明】
1101 処理装置 1102 受信ユニット 1103 処理ユニット 1121 符号ストリーム 1122 ヘッダ抽出器 1123 セグメンテーションユニット 1124 復号器 1125 出力画像
フロントページの続き (72)発明者 ラメシュ ニーラマニ アメリカ合衆国,カリフォルニア 94025, メンロ・パーク,サンド・ヒル・ロード 2882番,スイート 115 リコーイノベー ション内 (72)発明者 エドワード エル.シュワルツ アメリカ合衆国,カリフォルニア 94025, メンロ・パーク,サンド・ヒル・ロード 2882番,スイート 115 リコーイノベー ション内 (72)発明者 マーティン ピー ボーリック アメリカ合衆国,カリフォルニア 94025, メンロ・パーク,サンド・ヒル・ロード 2882番,スイート 115 リコーイノベー ション内 Fターム(参考) 5C059 KK02 KK40 MA00 MA24 MA32 ME01 PP01 RB02 RB09 SS06 SS20 UA02 UA06 UA15 UA38 UA39 5C078 BA53 CA01 DA01 DA11 DA21

Claims (96)

    【特許請求の範囲】
  1. 【請求項1】 圧縮ビットストリームのヘッダから取得
    した情報を使用して粒状エントロピー分布を作成する手
    順と、 粒状エントロピー分布に基づいて一つ以上の画像処理演
    算を適用する手順と、を有する方法。
  2. 【請求項2】 一つ以上の画像処理演算を適用する部分
    として、圧縮ビットストリームの中で符号化データの一
    部分だけを復号化する手順を更に有する請求項1記載の
    方法。
  3. 【請求項3】 ヘッダに基づいてクラスラベルを割当て
    る手順を更に有する請求項1記載の方法。
  4. 【請求項4】 圧縮ビットストリームのヘッダから取得
    した情報を使用して粒状エントロピー分布を作成する機
    能と、 粒状エントロピー分布に基づいて一つ以上の画像処理演
    算を適用する機能と、をコンピュータに実現させるため
    のプログラム。
  5. 【請求項5】 一つ以上の画像処理演算を適用する部分
    として、圧縮ビットストリームの中で符号化データの一
    部分だけを復号化する機能を更にコンピュータに実現さ
    せるための請求項4記載のプログラム。
  6. 【請求項6】 ヘッダに基づいてクラスラベルを割当て
    る機能を更にコンピュータに実現させるための請求項4
    記載のプログラム。
  7. 【請求項7】 圧縮ビットストリームのヘッダから取得
    した情報を使用して粒状エントロピー分布を作成する手
    段と、 粒状エントロピー分布に基づいて一つ以上の画像処理演
    算を適用する手段と、を有する装置。
  8. 【請求項8】 一つ以上の画像処理演算を適用する部分
    として、圧縮ビットストリームの中で符号化データの一
    部分だけを復号化する手段を更に有する請求項7記載の
    装置。
  9. 【請求項9】 ヘッダに基づいてクラスラベルを割当て
    る手段を更に有する請求項7記載の装置。
  10. 【請求項10】 符号ストリームのヘッダ情報に基づい
    て符号ストリームの画像解析を実行する手順と、 画像解析の出力によって指定された一つ以上の画像部分
    の符号化データだけを復号化する手順と、を有する方
    法。
  11. 【請求項11】 画像解析を実行する手順はセグメンテ
    ーションを実行する手順を含む、請求項10記載の方
    法。
  12. 【請求項12】 セグメンテーションを実行する手順は
    最大事後確率アプローチを使用する、請求項11記載の
    方法。
  13. 【請求項13】 画像解析を実行する手順はクラシフィ
    ケーションを実行する手順を含む、請求項10記載の方
    法。
  14. 【請求項14】 画像解析を実行する手順は粒状エント
    ロピー分布を抽出する手順を含む、請求項10記載の方
    法。
  15. 【請求項15】 符号ストリームのヘッダ情報に基づい
    て符号ストリームの画像解析を実行する手段と、 画像解析の出力によって指定された一つ以上の画像部分
    の符号化データだけを復号化する手段と、を有する装
    置。
  16. 【請求項16】 画像解析を実行する手段はセグメンテ
    ーションを実行する手段を含む、請求項15記載の装
    置。
  17. 【請求項17】 セグメンテーションを実行する手段は
    最大事後確率アプローチを使用する、請求項16記載の
    装置。
  18. 【請求項18】 画像解析を実行する手段はクラシフィ
    ケーションを実行する手段を含む、請求項15記載の装
    置。
  19. 【請求項19】 画像解析を実行する手段は粒状エント
    ロピー分布を抽出する手段を含む、請求項15記載の装
    置。
  20. 【請求項20】 符号ストリームのヘッダ情報に基づい
    て符号ストリームの画像解析を実行する機能と、 画像解析の出力によって指定された一つ以上の画像部分
    の符号化データだけを復号化する機能と、をコンピュー
    タに実現させるためのプログラム。
  21. 【請求項21】 セグメンテーションを実行する機能を
    更にコンピュータに実現させるための請求項20記載の
    プログラム。
  22. 【請求項22】 クラシフィケーションを実行する機能
    を更にコンピュータに実現させるための請求項20記載
    のプログラム。
  23. 【請求項23】 最大事後確率アプローチを使用してセ
    グメンテーションを実行する機能を更にコンピュータに
    実現させるための請求項21記載のプログラム。
  24. 【請求項24】 粒状エントロピー分布を抽出する機能
    を更にコンピュータに実現させるための請求項20記載
    のプログラム。
  25. 【請求項25】 符号化画像データを含む符号ストリー
    ムからヘッダ情報を抽出する手順と、 符号化画像データの復号化とは独立してヘッダ情報に基
    づいて符号ストリームのセグメンテーションを実行する
    手順と、 セグメント化された画像部分を表現するため必要な符号
    化画像データを復号化する手順と、を有する方法。
  26. 【請求項26】 粒状エントロピー分布を抽出する手順
    を更に有する請求項25記載の方法。
  27. 【請求項27】 セグメンテーションを実行する手順は
    符号化画像データを復号化する手順よりも前に行われ
    る、請求項25記載の方法。
  28. 【請求項28】 セグメント化された画像部分は特定解
    像度の画像の領域を含む、請求項27記載の方法。
  29. 【請求項29】 符号化画像データを含む符号ストリー
    ムからヘッダ情報を抽出する手段と、 符号化画像データの復号化とは独立してヘッダ情報に基
    づいて符号ストリームのセグメンテーションを実行する
    手段と、 セグメント化された画像部分を表現するため必要な符号
    化画像データを復号化する手段と、を有する装置。
  30. 【請求項30】 粒状エントロピー分布を抽出する手段
    を更に有する請求項29記載の装置。
  31. 【請求項31】 セグメンテーションを実行する手段は
    符号化画像データを復号化する前にセグメンテーション
    を実行する、請求項29記載の装置。
  32. 【請求項32】 セグメント化された画像部分は特定解
    像度の画像の領域を含む、請求項31記載の装置。
  33. 【請求項33】 符号化画像データを含む符号ストリー
    ムからヘッダ情報を抽出する機能と、 符号化画像データの復号化とは独立してヘッダ情報に基
    づいて符号ストリームのセグメンテーションを実行する
    機能と、 セグメント化された画像部分を表現するため必要な符号
    化画像データを復号化する機能と、をコンピュータに実
    現させるためのプログラム。
  34. 【請求項34】 粒状エントロピー分布を抽出する機能
    を更にコンピュータに実現させるための請求項33記載
    のプログラム。
  35. 【請求項35】 符号化画像データを復号化する前にセ
    グメンテーションを実行する機能を更に実現させるため
    の請求項33記載のプログラム。
  36. 【請求項36】 画像部分は特定解像度の画像の領域を
    含む、請求項35記載のプログラム。
  37. 【請求項37】 画像データを表現するマルチスケール
    変換に基づく圧縮データのビットストリームに対応した
    ヘッダ情報を取得する手順と、 ヘッダ情報からビットストリームの画像記述ビットに対
    応する特徴ベクトルを作成する手順と、 特徴ベクトルに基づいてビットストリームの少なくとも
    一部分に一つ以上の演算を実行する手順と、を有する方
    法。
  38. 【請求項38】 ヘッダ情報から獲得された零ビットプ
    レーンの数の分布を圧縮データの一つ以上の部分に作成
    する手順を更に有する請求項37記載の方法。
  39. 【請求項39】 ヘッダ情報に基づいてエントロピー分
    布を作成する手順を更に有する請求項37記載の方法。
  40. 【請求項40】 エントロピー分布は粒状である、請求
    項39記載の方法。
  41. 【請求項41】 エントロピー分布は画像データに対す
    るビット分布のマップを含む、請求項39記載の方法。
  42. 【請求項42】 エントロピー分布は符号ブロックに対
    する符号化データの長さである、請求項39記載の方
    法。
  43. 【請求項43】 ヘッダ情報はJPEG 2000ファ
    イルの一部である、請求項37記載の方法。
  44. 【請求項44】 一つ以上の演算のうちの一つの演算は
    クラシフィケーションである、請求項37記載の方法。
  45. 【請求項45】 画像データを表現するマルチスケール
    変換に基づく圧縮データのビットストリームに対応した
    ヘッダ情報を取得する手段と、 ヘッダ情報からビットストリームの画像記述ビットに対
    応する特徴ベクトルを作成する手段と、 特徴ベクトルに基づいてビットストリームの少なくとも
    一部分に一つ以上の演算を実行する手段と、を有する装
    置。
  46. 【請求項46】 ヘッダ情報から獲得された零ビットプ
    レーンの数の分布を圧縮データの一つ以上の部分に作成
    する手段を更に有する請求項45記載の装置。
  47. 【請求項47】 ヘッダ情報に基づいてエントロピー分
    布を作成する手段を更に有する請求項45記載の装置。
  48. 【請求項48】 エントロピー分布は粒状である、請求
    項47記載の装置。
  49. 【請求項49】 エントロピー分布は画像データに対す
    るビット分布のマップを含む、請求項47記載の装置。
  50. 【請求項50】 エントロピー分布は符号ブロックに対
    する符号化データの長さである、請求項47記載の装
    置。
  51. 【請求項51】 ヘッダ情報はJPEG 2000ファ
    イルの一部である、請求項45記載の装置。
  52. 【請求項52】 一つ以上の演算のうちの一つの演算は
    クラシフィケーションである、請求項45記載の装置。
  53. 【請求項53】 画像データを表現するマルチスケール
    変換に基づく圧縮データのビットストリームに対応した
    ヘッダ情報を取得する機能と、 ヘッダ情報からビットストリームの画像記述ビットに対
    応する特徴ベクトルを作成する機能と、 特徴ベクトルに基づいてビットストリームの少なくとも
    一部分に一つ以上の演算を実行する機能と、をコンピュ
    ータに実現させるためのプログラム。
  54. 【請求項54】 画像のブロックに関するマルチスケー
    ルエントロピー分布情報を収容するヘッダを取得する手
    順と、 各ブロックに対し、スケールの組の中で、ブロックのヘ
    ッダを使用して計算された尤度の積を表す総尤度と事前
    確率との積であるコスト関数を最大化するスケールをブ
    ロックに割当てる手順と、 等価的なスケールが割当てられたブロックを一つに集め
    ることにより画像をセグメント化する手順と、を有す
    る、画像をセグメント化する方法。
  55. 【請求項55】 ファイルはJPEG 2000フォー
    マットで画像を表現する、請求項54記載の方法。
  56. 【請求項56】 ブロックの各尤度は、スケールの組の
    中の各スケールに対するスケールの重みと当該スケール
    でブロックを符号化するため費やされるビット数との積
    の総和に比例する、請求項54記載の方法。
  57. 【請求項57】 あるスケールでブロックを符号化する
    ため費やされたビット数は、当該スケールにおけるブロ
    ックのマルチスケール係数のエントロピー分布を、当該
    スケールの4乗で割算することにより得られる、請求項
    56記載の方法。
  58. 【請求項58】 画像のブロックに関するマルチスケー
    ルエントロピー分布情報を収容するヘッダを取得する手
    順と、 各ブロックに対し、あるスケールにおけるブロックのマ
    ルチスケール係数のエントロピーが少なくとも一つのよ
    り粗いスケールにおけるブロックのマルチスケール係数
    の平均エントロピーよりも大きいと判定されたときに、
    ブロックがそのスケールで重要性を維持することを判定
    する手順と、 画像を、ブロックの閾値パーセントが重要性を維持する
    スケールの中の最も粗いスケールにスケーリングする手
    順と、を有する、画像を適応的にスケーリングする方
    法。
  59. 【請求項59】 ファイルはJPEG 2000フォー
    マットで画像を表現する、請求項58記載の方法。
  60. 【請求項60】 平均エントロピーは閾値パラメータが
    乗算された平均ビット分布である、請求項58記載の方
    法。
  61. 【請求項61】 スケールは、以下の式、 【数1】 に基づいて選択される、請求項59記載の方法。
  62. 【請求項62】 画像を自動的にスケーリングしクロッ
    ピングする方法であって、 画像のブロックに関するマルチスケールエントロピー分
    布情報を収容するヘッダを含むファイルを取得する手順
    と、 各ブロックとスケールの組の中の各スケールに対して、 あるスケールのブロックの累積エントロピー分布を、第
    1のスケールと最大スケールの範囲に含まれるスケール
    に対するブロックを符号化するために要するビット数の
    加重和に一致するように設定する手順と、 第1の最小値が、選択された幅オフセットと、選択され
    た幅オフセットと第1のスケールでスケーリングされた
    表示幅の和と、からなる組のうちの最小値であり、第2
    の最小値が、選択された高さオフセットと、選択された
    高さオフセットと第1のスケールでスケーリングされた
    表示高さの和と、からなる組のうちの最小値であるとし
    て、所定の画像の幅及び高さの範囲内で幅オフセット及
    び高さオフセットの各オフセットに関して、ブロックの
    幅位置が第1の最小値よりも大きくなく、かつ、ブロッ
    クの高さ位置が第2の最小値よりも大きくない、と判定
    された場合に、選択されたスケール並びに選択された幅
    オフセット及び高さオフセットでのブロックのインジケ
    ータ関数に1を設定する手順と、 ブロックのインジケータ関数とパラメータが乗算された
    最適スケールでのブロックに対する累積エントロピー分
    布の総和を最大化する位置及びスケールを計算する手順
    と、 画像を最適位置にクロッピングし、クロッピングされた
    画像を最適スケールにダウンサンプリングする手順と、
    を有する方法。
  63. 【請求項63】 ブロックは、スケール、幅オフセット
    及び高さオフセットにより特徴付けられる、請求項62
    記載の方法。
  64. 【請求項64】 ファイルはJPEG 2000フォー
    マットで画像を表現する、請求項62記載の方法。
  65. 【請求項65】 マルチスケール確率分布に基づいて画
    像の矩形マルチスケール部分を生成する画像をセグメン
    ト化する手順と、 マルチスケール確率分布に基づいて画像の矩形マルチス
    ケール部分を作成する手順と、を有する方法。
  66. 【請求項66】 画像の矩形マルチスケール部分を作成
    する手順は、矩形を、マルチスケール確率分布に基づい
    てセグメント化された画像に合わせる手順を含み、 矩形をセグメント化された画像に合わせる手順は、各ス
    ケールにおいて、矩形内の画像の内容が当該スケールと
    関連付けられた解像度で表現されるように、当該スケー
    ルより大きいスケールでの確率に類似した確率をもつス
    ケール毎に矩形を見つける手順を含む、請求項65記載
    の方法。
  67. 【請求項67】 矩形を記憶する手順と、 少なくとも一つの別の矩形に対してフィリング演算を繰
    り返す手順と、を更に有する請求項65記載の方法。
  68. 【請求項68】 より大きいスケールにおける矩形との
    確率の差が最低限に抑えられる矩形及びスケールを選択
    する手順を更に有する請求項65記載の方法。
  69. 【請求項69】 マルチスケール確率分布に基づいて画
    像の矩形マルチスケール部分を生成する画像をセグメン
    ト化する手段と、 マルチスケール確率分布に基づいて画像の矩形マルチス
    ケール部分を作成する手段と、を有する装置。
  70. 【請求項70】 画像の矩形マルチスケール部分を作成
    する手段は、矩形を、マルチスケール確率分布に基づい
    てセグメント化された画像に合わせる手段を含み、 矩形をセグメント化された画像に合わせる手段は、各ス
    ケールにおいて、矩形内の画像の内容が当該スケールと
    関連付けられた解像度で表現されるように、当該スケー
    ルより大きいスケールでの確率に類似した確率をもつス
    ケール毎に矩形を見つける手段を含む、請求項69記載
    の装置。
  71. 【請求項71】 矩形を記憶する手段と、 少なくとも一つの別の矩形に対してフィリング演算を繰
    り返す手段と、を更に有する請求項69記載の装置。
  72. 【請求項72】 より大きいスケールにおける矩形との
    確率の差が最低限に抑えられる矩形及びスケールを選択
    する手段を更に有する請求項69記載の装置。
  73. 【請求項73】 マルチスケール確率分布に基づいて画
    像の矩形マルチスケール部分を生成する画像をセグメン
    ト化する機能と、 マルチスケール確率分布に基づいて画像の矩形マルチス
    ケール部分を作成する機能と、をコンピュータに実現さ
    せるためのプログラム。
  74. 【請求項74】 画像のブロックに関するマルチスケー
    ルエントロピー分布情報を収容するヘッダを取得する機
    能と、 各ブロックに対し、スケールの組の中で、ブロックのヘ
    ッダを使用して計算された尤度の積を表す総尤度と事前
    確率との積であるコスト関数を最大化するスケールをブ
    ロックに割当てる機能と、 等価的なスケールが割当てられたブロックを一つに集め
    ることにより画像をセグメント化する機能と、をコンピ
    ュータに実現させるためのプログラム。
  75. 【請求項75】 ファイルはJPEG 2000フォー
    マットで画像を表現する、請求項74記載のプログラ
    ム。
  76. 【請求項76】 ブロックの各尤度は、スケールの組の
    中の各スケールに対するスケールの重みと当該スケール
    でブロックを符号化するため費やされるビット数との積
    の総和に比例する、請求項74記載のプログラム。
  77. 【請求項77】 あるスケールでブロックを符号化する
    ため費やされたビット数は、当該スケールにおけるブロ
    ックのマルチスケール係数のエントロピー分布を、当該
    スケールの4乗で割算することにより得られる、請求項
    76記載のプログラム。
  78. 【請求項78】 画像のブロックに関するマルチスケー
    ルエントロピー分布情報を収容するヘッダを取得する機
    能と、 各ブロックに対し、あるスケールにおけるブロックのマ
    ルチスケール係数のエントロピーが少なくとも一つのよ
    り粗いスケールにおけるブロックのマルチスケール係数
    の平均エントロピーよりも大きいと判定されたときに、
    ブロックがそのスケールで重要性を維持することを判定
    する機能と、 画像を、ブロックの閾値パーセントが重要性を維持する
    スケールの中の最も粗いスケールにスケーリングする機
    能と、をコンピュータに実現させるためのプログラム。
  79. 【請求項79】 ファイルはJPEG 2000フォー
    マットで画像を表現する、請求項78記載のプログラ
    ム。
  80. 【請求項80】 平均エントロピーは閾値パラメータが
    乗算された平均ビット分布である、請求項78記載のプ
    ログラム。
  81. 【請求項81】 画像のブロックに関するマルチスケー
    ルエントロピー分布情報を収容するヘッダを含むファイ
    ルを取得する機能と、 各ブロックとスケールの組の中の各スケールに対して、 第1のスケールのブロックの累積エントロピー分布を、
    第1のスケールと最大スケールの範囲に含まれるスケー
    ルに対するブロックを符号化するために要するビット数
    の和に一致するように設定する機能と、 ブロックの幅が第1の最小値よりも大きくなく、かつ、
    ブロックの高さが第2の最小値よりも大きくないと判定
    された場合に、ブロックのインジケータ関数及び第1の
    スケールに1を設定し、それ以外の場合に、0を設定す
    る機能と、を有し、 第1の最小値は、画像の幅と、ブロックの幅に1及び第
    1のスケールでスケーリングされた希望高さを加えたも
    のと、により構成される組の中の最小値であり、第2の
    最小値は、画像の高さと、ブロックの高さに1及び第1
    のスケールでスケーリングされた希望幅を加えたもの
    と、により構成される組の中の最小値であり、 最適位置及び最適スケールの各ブロックに対して、最適
    スケールでのブロックに対する累積エントロピー分布
    に、ブロックのインジケータ関数とパラメータ倍された
    最適スケールとが乗算されたものの総和を最大化する最
    適位置及び最適スケールを計算する機能と、 画像を最適位置にクロッピングし、クロッピングされた
    画像を最適スケールにダウンサンプリングする機能と、
    をコンピュータに実現させるためのプログラム。
  82. 【請求項82】 ファイルはJPEG 2000フォー
    マットで画像を表現する、請求項81記載のプログラ
    ム。
  83. 【請求項83】 画像のブロックに関するマルチスケー
    ルエントロピー分布情報を収容するヘッダを取得する受
    信ユニットと、 受信ユニットに接続された処理ユニットと、を有し、 処理ユニットは、 各ブロックに対し、スケールの組の中で、ブロックのヘ
    ッダを使用して計算された尤度の積を表す総尤度と事前
    確率との積であるコスト関数を最大化するスケールをブ
    ロックに割当て、 等価的なスケールが割当てられたブロックを一つに集め
    ることにより画像をセグメント化する、装置。
  84. 【請求項84】 ファイルはJPEG 2000フォー
    マットで画像を表現する、請求項83記載の装置。
  85. 【請求項85】 ブロックの各尤度は、スケールの組の
    中の各スケールに対するスケールの重みと当該スケール
    でブロックを符号化するため費やされるビット数との積
    の総和に比例する、請求項83記載の装置。
  86. 【請求項86】 あるスケールでブロックを符号化する
    ため費やされたビット数は、当該スケールにおけるブロ
    ックのマルチスケール係数のエントロピー分布を、当該
    スケールの4乗で割算することにより得られる、請求項
    85記載の装置。
  87. 【請求項87】 画像のブロックに関するマルチスケー
    ルエントロピー分布情報を収容するヘッダを取得する受
    信ユニットと、 受信ユニットに接続された処理ユニットと、を有し、 処理ユニットは、 各ブロックに対し、あるスケールにおけるブロックのマ
    ルチスケール係数のエントロピーが少なくとも一つのよ
    り粗いスケールにおけるブロックのマルチスケール係数
    の平均エントロピーよりも大きいと判定されたときに、
    ブロックがそのスケールで重要性を維持することを判定
    し、 画像を、ブロックの閾値パーセントが重要性を維持する
    スケールの中の最も粗いスケールにスケーリングする、
    画像を適応的にスケーリングする装置。
  88. 【請求項88】 ファイルはJPEG 2000フォー
    マットで画像を表現する、請求項87記載の方法。
  89. 【請求項89】 平均エントロピーは閾値パラメータが
    乗算された平均ビット分布である、請求項87記載の方
    法。
  90. 【請求項90】 画像のブロックに関するマルチスケー
    ルエントロピー分布情報を収容するヘッダを含むファイ
    ルを取得する受信ユニットと、 受信ユニットに接続された処理ユニットと、を有し、 処理ユニットは、 各ブロックとスケールの組の中の各スケールに対して、 第1のスケールのブロックの累積エントロピー分布を、
    第1のスケールと最大スケールの範囲に含まれるスケー
    ルに対するブロックを符号化するために要するビット数
    の和に一致するように設定し、 ブロックの幅が第1の最小値よりも大きくなく、かつ、
    ブロックの高さが第2の最小値よりも大きくないと判定
    された場合に、ブロックのインジケータ関数及び第1の
    スケールに1を設定し、それ以外の場合に、0を設定
    し、 第1の最小値は、画像の幅と、ブロックの幅に1及び第
    1のスケールでスケーリングされた希望高さを加えたも
    のと、により構成される組の中の最小値であり、第2の
    最小値は、画像の高さと、ブロックの高さに1及び第1
    のスケールでスケーリングされた希望幅を加えたもの
    と、により構成される組の中の最小値であり、 処理ユニットは、 最適位置及び最適スケールの各ブロックに対して、最適
    スケールでのブロックに対する累積エントロピー分布
    に、ブロックのインジケータ関数とパラメータ倍された
    最適スケールとが乗算されたものの総和を最大化する最
    適位置及び最適スケールを計算し、 画像を最適位置にクロッピングし、クロッピングされた
    画像を最適スケールにダウンサンプリングする、画像を
    自動的にスケーリングしクロッピングする装置。
  91. 【請求項91】 ファイルはJPEG 2000フォー
    マットで画像を表現する、請求項90記載の装置。
  92. 【請求項92】 圧縮ビットストリームのヘッダから得
    られた情報を用いて高ビットレート粒状エントロピー分
    布から低ビットレートエントロピー分布の推定値を獲得
    する手順と、 一つ以上の画像処理演算を適用する手順と、を有する方
    法。
  93. 【請求項93】 推定値を獲得する手順は、第1の複数
    のレイヤから情報を抽出し、第1の複数のレイヤ以外の
    レイヤのパケットを無視する手順を含む、請求項92記
    載の方法。
  94. 【請求項94】 ビットが割当てられる順序を決定する
    手順を更に有する請求項92記載の方法。
  95. 【請求項95】 高ビットレートエントロピー分布は損
    失の多い分布ではない、請求項92記載の方法。
  96. 【請求項96】 高ビットレートエントロピー分布は損
    失の無い分布である、請求項92記載の方法。
JP2002336772A 2002-01-10 2002-11-20 ヘッダ情報に基づく画像処理方法 Expired - Fee Related JP3989362B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US044420 2002-01-10
US10/044,420 US7428338B2 (en) 2002-01-10 2002-01-10 Header-based processing of images compressed using multi-scale transforms

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007032742A Division JP4317230B2 (ja) 2002-01-10 2007-02-13 ヘッダ情報に基づく画像処理方法

Publications (2)

Publication Number Publication Date
JP2003230012A true JP2003230012A (ja) 2003-08-15
JP3989362B2 JP3989362B2 (ja) 2007-10-10

Family

ID=21932291

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002336772A Expired - Fee Related JP3989362B2 (ja) 2002-01-10 2002-11-20 ヘッダ情報に基づく画像処理方法
JP2007032742A Expired - Fee Related JP4317230B2 (ja) 2002-01-10 2007-02-13 ヘッダ情報に基づく画像処理方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2007032742A Expired - Fee Related JP4317230B2 (ja) 2002-01-10 2007-02-13 ヘッダ情報に基づく画像処理方法

Country Status (4)

Country Link
US (4) US7428338B2 (ja)
EP (2) EP1814077B1 (ja)
JP (2) JP3989362B2 (ja)
DE (2) DE60314305T2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005141758A (ja) * 2003-11-10 2005-06-02 Ricoh Co Ltd Jpeg2000圧縮領域からの文書の検索及び類似度マッチングのための特徴を生成する方法、装置及び製造物品
CN1305008C (zh) * 2003-12-22 2007-03-14 中国科学院自动化研究所 弥散张量核磁成像脑缺血病灶区的自动分割方法
US7508988B2 (en) 2004-03-09 2009-03-24 Ricoh Company, Ltd. Method, program and apparatus for image processing capable of effectively performing image transmission, and a medium storing the program
JP2009540371A (ja) * 2006-06-08 2009-11-19 クゥアルコム・インコーポレイテッド 複数の表示層の調合
JP2014011807A (ja) * 2012-06-29 2014-01-20 Thomson Licensing ビデオシーケンスのイメージをリフレーミングする方法及び装置
WO2020050192A1 (ja) * 2018-09-04 2020-03-12 日本電気株式会社 流体漏洩診断装置、流体漏洩診断システム、流体漏洩診断方法、及び、流体漏洩診断プログラムが格納された記録媒体

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030233619A1 (en) * 2002-05-30 2003-12-18 Fast Bruce Brian Process for locating data fields on electronic images of complex-structured forms or documents
KR100453517B1 (ko) * 2002-05-31 2004-10-20 주식회사 이노티브 인터넷을 통한 대용량 고품질 디지털 이미지의 실시간서비스 방법
FR2848765B1 (fr) * 2002-12-11 2005-04-29 Canon Kk Procede et dispositif de determination d'une configuration de donnees d'un signal numerique d'image
JP2005123856A (ja) * 2003-10-16 2005-05-12 Ricoh Co Ltd 画像処理システム、画像処理方法、プログラム及び情報記録媒体
US20090142039A1 (en) * 2003-12-26 2009-06-04 Humax Co., Ltd. Method and apparatus for recording video data
JP4594688B2 (ja) * 2004-06-29 2010-12-08 オリンパス株式会社 画像符号化処理方法、画像復号化処理方法、動画圧縮処理方法、動画伸張処理方法、画像符号化処理プログラム、画像符号化装置、画像復号化装置、画像符号化/復号化システム、拡張画像圧縮伸張処理システム
US9509991B2 (en) 2004-08-12 2016-11-29 Gurulogic Microsystems Oy Processing and reproduction of frames
US9232228B2 (en) 2004-08-12 2016-01-05 Gurulogic Microsystems Oy Processing of image
FI117845B (fi) 2004-08-12 2007-03-15 Gurulogic Microsystems Oy Videokuvan prosessointi
CN101848389A (zh) * 2004-08-31 2010-09-29 松下电器产业株式会社 运动图像编码、解码方法及装置、记录介质的记录方法
US7650031B2 (en) * 2004-11-23 2010-01-19 Microsoft Corporation Method and system for detecting black frames in a sequence of frames
JP4301193B2 (ja) * 2005-03-31 2009-07-22 ソニー株式会社 画像比較装置及び方法、画像検索装置及び方法、並びにプログラム及び記録媒体
US8169547B2 (en) * 2005-08-09 2012-05-01 Gurulogic Microsystems Oy Processing of video image
US8665284B2 (en) * 2005-11-17 2014-03-04 Xerox Corporation Fragmenting image files systems and methods
EP1977391A2 (en) * 2006-01-03 2008-10-08 ATI Technologies Inc. Image analyser and adaptive image scaling circuit and methods
US7761789B2 (en) 2006-01-13 2010-07-20 Ricoh Company, Ltd. Methods for computing a navigation path
US7912468B2 (en) * 2006-02-24 2011-03-22 Broadcom Corporation Multi-communication pathway addressing in a mobile communication device
US8081827B2 (en) * 2006-02-28 2011-12-20 Ricoh Co., Ltd. Compressed data image object feature extraction, ordering, and delivery
US8583637B2 (en) * 2007-03-21 2013-11-12 Ricoh Co., Ltd. Coarse-to-fine navigation through paginated documents retrieved by a text search engine
US8584042B2 (en) 2007-03-21 2013-11-12 Ricoh Co., Ltd. Methods for scanning, printing, and copying multimedia thumbnails
US8812969B2 (en) * 2007-03-21 2014-08-19 Ricoh Co., Ltd. Methods for authoring and interacting with multimedia representations of documents
JP4441558B2 (ja) * 2007-09-19 2010-03-31 キヤノン株式会社 画像処理装置及び画像処理方法ならびにプログラム
US20100128181A1 (en) * 2008-11-25 2010-05-27 Advanced Micro Devices, Inc. Seam Based Scaling of Video Content
US9705888B2 (en) 2009-03-31 2017-07-11 Amazon Technologies, Inc. Managing security groups for data instances
DE102009017436B4 (de) * 2009-04-15 2011-12-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erkennung einer Änderung zwischen Bildern oder in einer Sequenz von Bildern
JP5686611B2 (ja) * 2011-01-14 2015-03-18 株式会社ソニー・コンピュータエンタテインメント 情報処理装置
JP5927829B2 (ja) * 2011-02-15 2016-06-01 株式会社リコー 印刷用データ作成装置、印刷用データ作成方法、プログラム及び記録媒体
RU2595626C2 (ru) * 2011-08-11 2016-08-27 Сан Пэтент Траст Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений, устройство декодирования изображений и устройство кодирования и декодирования изображений
US9538239B2 (en) 2012-08-13 2017-01-03 Gurulogic Microsystems Oy Decoder and method for decoding encoded input data containing a plurality of blocks or packets
US10412414B2 (en) 2012-08-13 2019-09-10 Gurulogic Microsystems Oy Decoder and method for decoding encoded input data containing a plurality of blocks or packets
CN103279957B (zh) * 2013-05-31 2015-11-25 北京师范大学 一种基于多尺度特征融合的遥感图像感兴趣区域提取方法
WO2015152503A1 (ko) * 2014-03-31 2015-10-08 인텔렉추얼디스커버리 주식회사 영상 복호화 장치 및 그 방법
CN105427307B (zh) * 2015-11-20 2018-10-30 信阳师范学院 一种立方体粒计算的图像分割方法
US9930354B2 (en) 2015-12-11 2018-03-27 Google Llc Skip scanlines on JPEG image decodes
US11829703B2 (en) * 2018-01-09 2023-11-28 Adobe Inc. Parallel object analysis for efficiently generating layouts in digital design documents
CN109670576B (zh) * 2018-11-29 2022-09-13 中山大学 一种多尺度视觉关注图像描述方法
CA3113347A1 (en) * 2020-03-26 2021-09-26 Mappedin Inc. Systems and methods for geometry simplification and filtering
CN111597981B (zh) * 2020-05-14 2022-05-27 中南大学 基于改进多尺度散布熵的大地电磁信号去噪方法及系统
CN117036832B (zh) * 2023-10-09 2024-01-05 之江实验室 一种基于随机多尺度分块的图像分类方法、装置及介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5563960A (en) * 1993-01-22 1996-10-08 David Sarnoff Research Center, Inc. Apparatus and method for emphasizing a selected region in the compressed representation of an image
JP3732867B2 (ja) 1995-03-09 2006-01-11 株式会社ルネサステクノロジ 画像伸張装置
US5854857A (en) 1996-09-26 1998-12-29 Xerox Corporation Using encoding cost data for segmentation and background suppression in JPEG-compressed images
US5999639A (en) * 1997-09-04 1999-12-07 Qualia Computing, Inc. Method and system for automated detection of clustered microcalcifications from digital mammograms
SE521021C2 (sv) 1998-06-18 2003-09-23 Ericsson Telefon Ab L M Förfarande och anordning vid överförande av bilder
WO2000010131A1 (en) 1998-08-10 2000-02-24 Digital Accelerator Corporation Embedded quadtree wavelets in image compression
US6775325B1 (en) * 1998-10-07 2004-08-10 Sarnoff Corporation Method and apparatus for converting the bitrate of an encoded bitstream without full re-encoding
US6813384B1 (en) * 1999-11-10 2004-11-02 Intel Corporation Indexing wavelet compressed video for efficient data handling
US6795577B2 (en) * 1999-12-03 2004-09-21 Canon Research Centre France S.A. Digital signal analysis, with hierarchical segmentation
US6553150B1 (en) * 2000-04-25 2003-04-22 Hewlett-Packard Development Co., Lp Image sequence compression featuring independently coded regions
JP2002064709A (ja) 2000-06-06 2002-02-28 Canon Inc 画像処理装置及びその方法とそのコンピュータプログラム及び記憶媒体
JP2002044663A (ja) * 2000-07-24 2002-02-08 Canon Inc 画像符号化装置及び方法、画像表示装置及び方法、画像処理システム並びに撮像装置
US6925126B2 (en) * 2001-04-18 2005-08-02 Koninklijke Philips Electronics N.V. Dynamic complexity prediction and regulation of MPEG2 decoding in a media processor

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005141758A (ja) * 2003-11-10 2005-06-02 Ricoh Co Ltd Jpeg2000圧縮領域からの文書の検索及び類似度マッチングのための特徴を生成する方法、装置及び製造物品
CN1305008C (zh) * 2003-12-22 2007-03-14 中国科学院自动化研究所 弥散张量核磁成像脑缺血病灶区的自动分割方法
US7508988B2 (en) 2004-03-09 2009-03-24 Ricoh Company, Ltd. Method, program and apparatus for image processing capable of effectively performing image transmission, and a medium storing the program
JP2009540371A (ja) * 2006-06-08 2009-11-19 クゥアルコム・インコーポレイテッド 複数の表示層の調合
JP2014011807A (ja) * 2012-06-29 2014-01-20 Thomson Licensing ビデオシーケンスのイメージをリフレーミングする方法及び装置
WO2020050192A1 (ja) * 2018-09-04 2020-03-12 日本電気株式会社 流体漏洩診断装置、流体漏洩診断システム、流体漏洩診断方法、及び、流体漏洩診断プログラムが格納された記録媒体
US11703189B2 (en) 2018-09-04 2023-07-18 Nec Corporation Fluid leakage diagnosing device, fluid leakage diagnosing system, fluid leakage diagnosing method, and recording medium storing fluid leakage diagnosing program

Also Published As

Publication number Publication date
JP3989362B2 (ja) 2007-10-10
US7428338B2 (en) 2008-09-23
US20080095452A1 (en) 2008-04-24
US7536056B2 (en) 2009-05-19
JP4317230B2 (ja) 2009-08-19
EP1814077A3 (en) 2007-08-08
DE60330409D1 (de) 2010-01-14
EP1814077A2 (en) 2007-08-01
US20090103818A1 (en) 2009-04-23
US20030165273A1 (en) 2003-09-04
EP1329847A1 (en) 2003-07-23
DE60314305D1 (de) 2007-07-26
DE60314305T2 (de) 2008-02-21
US7548654B2 (en) 2009-06-16
US8184918B2 (en) 2012-05-22
JP2007181232A (ja) 2007-07-12
US20080044091A1 (en) 2008-02-21
EP1329847B1 (en) 2007-06-13
EP1814077B1 (en) 2009-12-02

Similar Documents

Publication Publication Date Title
JP3989362B2 (ja) ヘッダ情報に基づく画像処理方法
EP1548616B1 (en) Features for retrieval and similarity matching of documents from the compressed domain
Walker et al. Wavelet-based image compression
EP0933920B1 (en) Data processing apparatus and method and storage medium
Sadek et al. Robust video steganography algorithm using adaptive skin-tone detection
US20040252903A1 (en) Method of automatically determining the region of interest from an image
EP1274250A2 (en) A method for utilizing subject content analysis for producing a compressed bit stream from a digital image
Dost et al. Reduced reference image and video quality assessments: review of methods
Juliet et al. Efficient block prediction-based coding of computer screen images with precise block classification
Xia et al. Visual sensitivity-based low-bit-rate image compression algorithm
Tabesh et al. JPEG2000 and motion JPEG2000 content analysis using codestream length information
Rani et al. Comparative analysis of image compression using dct and dwt transforms
TWI226189B (en) Method for automatically detecting region of interest in the image
Thayammal et al. A Review On Segmentation Based Image Compression Techniques.
Villegas et al. Feature preserving image compression: A survey
Barsakar et al. A novel approach for medical video compression using kernel based meanshift ROI coding techniques
EP3151565A1 (en) A low complexity perceptual visual quality evaluation method for jpeg2000 compressed streams
Mohammed et al. New approaches for DCT-Based image compression using region of interest scheme
JP2004120497A (ja) シーンチェンジ検出装置、シーンチェンジ検出方法、画像処理装置、プログラム及び記録媒体
Thayammal et al. A review on transform based image compression techniques
Kountchev et al. New approaches in intelligent image processing
Galan-Hernandez et al. Region-of-Interest Coding based on Fovea and Hierarchical Trees
SATTAR The medical image compression with embedded zerotree wavelet
Bao et al. Image restoration based on generalized finite automata encoded edge preserving regularization
Mohammed et al. Non-embedded image coding techniques based on pixels classification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070717

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110727

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130727

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees