JP2008533787A - 圧縮済領域における静止画像を処理するための方法、コンピュータプログラムプロダクト、および装置 - Google Patents
圧縮済領域における静止画像を処理するための方法、コンピュータプログラムプロダクト、および装置 Download PDFInfo
- Publication number
- JP2008533787A JP2008533787A JP2008500281A JP2008500281A JP2008533787A JP 2008533787 A JP2008533787 A JP 2008533787A JP 2008500281 A JP2008500281 A JP 2008500281A JP 2008500281 A JP2008500281 A JP 2008500281A JP 2008533787 A JP2008533787 A JP 2008533787A
- Authority
- JP
- Japan
- Prior art keywords
- linear
- function
- image
- image data
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 104
- 238000012545 processing Methods 0.000 title claims description 107
- 238000004590 computer program Methods 0.000 title claims description 17
- 238000001914 filtration Methods 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims description 55
- 238000012886 linear function Methods 0.000 claims description 53
- 238000012937 correction Methods 0.000 claims description 23
- 238000009499 grossing Methods 0.000 claims description 11
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 230000008571 general function Effects 0.000 claims 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000009466 transformation Effects 0.000 abstract description 9
- 238000004422 calculation algorithm Methods 0.000 abstract description 6
- 238000003860 storage Methods 0.000 abstract description 6
- 230000008901 benefit Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 45
- 238000007906 compression Methods 0.000 description 18
- 230000006835 compression Effects 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 17
- 238000010295 mobile communication Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 230000006872 improvement Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 239000003990 capacitor Substances 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000001444 catalytic combustion detection Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 238000003707 image sharpening Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/10—Image enhancement or restoration using non-spatial domain filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20064—Wavelet transform [DWT]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
本発明は、圧縮済領域中の画像データの操作、および特にフィルタリングに関係する。ウェーブレットに基づく変換アルゴリズムによって、空間領域中の画像データから変換された圧縮済領域中の画像データを操作することができる方法および装置が提供される。本発明の概念の利点は、フィルタリングを時間において高速化することによって、装置の計算能力、記憶装置、メモリ、および電力消費において内在する制約条件を、画像操作/画像フィルタリングに適用することができるようにすることである。
Description
本発明は、画像処理の分野に関する。特に、本発明は、圧縮済領域における静止画像の処理に関する。
音声やビデオを使って動作するマルチメディアアプリケーションを特徴とする携帯装置の数は、増え続けている。このようなマルチメディアアプリケーションは、ますます顧客達を惹きつけ、顧客達は、新しいマルチメディア機能を熱心に享受している。特に、携帯電話、すなわち、移動電話の市場には、マルチメディア機能を搭載した装置が急速に受け入れられている。画像処理電話、すなわち、画像取得機能を有する携帯電話は、携帯電話の1つのクラスを代表するが、この製品クラスを導入してから非常に短期間のうちに、標準規格を代表するものになりつつある。画像処理電話の発展は、デジタルカメラの同等の成功とともに大成功を遂げた。
これまで、マルチメディアアプリケーション、特に画像取得アプリケーションの分野における開発では、記録/撮影の品質、メモリ要求量、ストリーミング性能(ビット伝送速度要件)、および再生/表示性能に対処してきた。これに呼応して、マルチメディアアプリケーションに関する研究の大部分では、圧縮標準規格、同期の問題、記憶表現、およびセンサ設計に着目してきた。例えば、(明るさ調整、コントラスト補正、およびシャープニング(鮮鋭化)などの)編集、フィルタリング、合成、および特殊効果の実現を含む画像操作などのデジタル画像処理の技術分野は、あまり注目されなかった。
画像処理の分野があまり注目されなかったのは、画像処理で要求される複雑さ、すなわち、計算の複雑さおよびデータ量が原因である。一般に、携帯装置は、圧縮モードでデジタル画像を処理することによって、特に計算能力および記憶容量などの携帯装置の制約だけでなく、画像の(無線による)受信/送信、ストリーミング性能などを含む画像処理から生じる要件も満たす。画像処理は、その複雑さ故、最新のワークステーションおよびパーソナルコンピュータ上で実現される代表的なタスクである。これらの高性能処理装置によって、圧縮モードのデジタル画像を非圧縮してから、非圧縮領域において画像を処理、すなわち、操作し、操作された画像を圧縮して、最後に再び圧縮モードのデジタル画像を取得する処理を含む力任せのアルゴリズムを処理することができる。前に述べたように、画像圧縮に使用される現代の圧縮技術は、主として、圧縮モードにした結果のデジタル画像のサイズを考慮して最適化を行う。こうして、非常に複雑な計算を取り入れることによって、デジタル画像の品質を落とさずに、またはデジタル画像の品質低下を許容限度内に抑えて圧縮を行う。
それにもかかわらず、さらに多くのマルチメディアアプリケーションが取り入れられるに従って、ユーザ/顧客は、今日の高性能ホームコンピュータ上で使用することができる画像操作を要求するようになるだろう。
したがって、制約されたコンピュータ性能および制約された記憶容量を含む制約された処理能力しか持たない処理装置上で、デジタル画像の操作、編集、および処理を効率的に行う効果的な技術および方法を提供する必要がある。特に、提示される技術および方法は、画像上の明るさ調整、コントラスト補正、フィルタリング、およびシャープニングなどの画像の操作、編集、および処理を行うとき、ユーザが所望する効果を適用する。
本発明の目的は、圧縮済領域におけるデジタル画像の操作および編集という意味において、デジタル画像処理に関する技術および方法論を提供することによって解決される。こうして、デジタル画像を処理する前の非圧縮とデジタル画像を処理した後の再圧縮とを含む従来の要件を克服する。主な利点は、計算の複雑さが著しく減少することである。
本発明の第1実施形態によれば、圧縮済領域中の画像データを補正するための方法が提供される。圧縮済画像データ、すなわち、圧縮済領域中の画像データは、ウェーブレット変換および特に離散ウェーブレット変換(DWT)などのサブバンドに基づく変換を使用するエンコーダによって、(例えば、画像取得センサによって提供される)空間領域中の画像データから取得される。代表的なエンコーダは、将来の標準規格になると想定されるJPEG2000エンコーダである。線形フィルタ関数として適用することができる(オリジナル)線形関数f(k)が提供される。この線形関数f(k)は、加数とファクタの任意の1次結合によって構成される。すなわち、線形関数f(k)は、0個、1個、または複数の線形オフセットKJと、0個、1個、または複数の線形スケールファクタλとを備えることを意味する。空間領域中の前記画像データに適用可能な線形関数f(k)が提供されることによって、画像データの画像表現上に、例えば、関数固有のフィルタリング効果を得ることができる。線形関数f(k)は、圧縮済領域へ変換される。その後、変換済線形関数f(k)は、例えば、前記圧縮済画像データのベースバンド(LL)、またはベースバンドの任意の定義済個数のサブバンド上の変換済画像データの特定のサブバンドに適用される。
変換済線形関数f(k)を適用することによって、近似が得られる。適用するため選択した変換済画像のサブバンドの個数によって、結果として得られる近似の品質が決まる。選択したサブバンドの個数が多いほど、変換済線形関数f(k)を適用することによって得られる結果が、空間領域中の画像データに線形関数f(k)を適用することによって得られる画像表現に対応する最終的画像表現に近くなる。結果として得られる(すなわち、圧縮済領域において変換済線形関数を適用し、空間領域においてオリジナル関数を適用することによって得られる)両方の画像表現の相違点は、通常、小さな効果にすぎない。したがって、変換済線形関数f(k)を単に特定のサブバンド、および、特に前記圧縮済画像データのベースバンド(LL)に適用することによって、高速計算という利点を持ちながら正確な近似を示すことができる。当業者であれば、ベースバンド(LLサブバンド)によって、(空間領域中の画像データに対応する)解像度の低い非圧縮画像データを表現し、その結果コンピュータの処理時間が短くなるようサポートすることを評価するだろう。
本発明の第2実施形態によれば、圧縮済領域中の画像データを補正するためのコンピュータプログラムプロダクトが提供される。このコンピュータプログラムプロダクトは、処理装置によって実行される命令を備えるコード部を含むコンピュータ読み取り可能媒体に記録されたプログラム論理を有するコンピュータ読み取り可能媒体を備える。(オリジナル)線形関数f(k)が提供される。この線形関数f(k)は、加数とファクタの任意の1次結合で構成される。すなわち、線形関数f(k)は、0個、1個、または複数の線形オフセットKJと、0個、1個、または複数の線形スケールファクタλとを備えることを意味する。空間領域中の前記画像データに適用可能な線形関数f(k)が提供されることによって、画像データの画像表現上に関数固有のフィルタリング効果を得ることができる。コード部によって、線形関数f(k)を圧縮済領域へ変換し、結果として変換済線形関数f(k)を得ることができる。他のコード部は、特に、圧縮済画像データのベースバンド(LL)における圧縮済画像データの特定の予め定義された個数のサブバンドに、前記変換済線形関数f(k)を適用するよう適応している。
本発明の第3実施形態によれば、画像取得機能を有するCE(Consumer Electronics)装置が提供される。この装置は、画像データ処理のため、ウェーブレット変換、特に、離散ウェーブレット変換(DWT)、およびより詳細にはJPEG2000コーデックなどのサブバンドに基づく変換を使用するエンコーダを備える。このエンコーダは、空間領域中の画像データを圧縮済領域中の画像データへ変換することによって、未処理画像データの保存とは対照的に、記憶容量を節約することができる。画像処理装置は、線形関数f(k)を備える。この線形関数f(k)は、加数とファクタの任意の1次結合で構成される。すなわち、線形関数f(k)は、0個、1個、または複数の線形オフセットKJと、0個、1個、または複数の線形スケールファクタλとを備えることを意味する。空間領域中の前記画像データに適用可能な線形関数f(k)が提供されることによって、画像データの画像表現上に、例えば、関数固有のフィルタリング効果を得ることができる。画像操作モジュールは、線形関数f(k)を圧縮済領域へ変換し、結果として変換済線形関数f(k)を得るよう適応している。さらに、画像操作モジュールによって、例えば、圧縮済画像データのベースバンド(LL)上の圧縮済画像データの特定のサブバンドに、前記変換済線形関数f(k)を適用することができる。
本発明の他の実施形態は、以下の説明の過程で、および添付図面を参照することによって、明白になるであろう。
以下の様々な実施例の説明において、実施例の一部を構成する添付図面を参照する。これらの添付図面には、本発明を実施することができる様々な実施例が例示されている。本発明の範囲を逸脱しない限り、他の実施例を使用することができ、構造および機能の変更を行うことができることを理解されたい。図面および説明において可能な限り、同様または類似の部分を参照するのに同じ参照番号が使用されている。
図1aのブロック図に、携帯家庭用電子(CE)装置100の主要な構造構成要素を示す。これは、本発明を使って利用することができる任意の種類の携帯家庭用電子(CE)装置の例を代表するものである。本発明は、例示したCE装置100に限定されず、また、他の特定の種類の携帯CE装置にも限定されないことを理解されたい。
例示した携帯CE装置100は、例えば、一般に画像取得センサによって画像を取得することができる携帯電話を代表するカメラ付き携帯電話として実現される。特に、装置100は、プロセッサまたはマイクロコントローラに基づく装置として実現され、中央処理装置(CPU)110と、データ記憶装置120と、アプリケーション記憶装置130と、無線周波数アンテナ(図示省略)を有する移動無線周波数インターフェイス(I/F)180および加入者識別モジュール(SIM)170を含む移動通信手段と、音声入力/出力(I/O)手段140(一般にマイクおよびスピーカ)、キー入力制御装置(Ctrl)150を有するキー、キーパッド、および/またはキーボード、ならびにディスプレイ制御装置(Ctrl)160を有するディスプレイを含むユーザインターフェイス入力/出力手段と、一般に画像射影のための光学部品(図示省略)を有するCCD(電荷結合素子)センサ(図示省略)を含む画像取得センサ10と、画像処理のため必要とされるいくつかの従属モジュールおよび独立モジュール、ならびに構成要素の実現方法の例を代表する画像処理モジュール20と、を備える。
一般に、CE装置100の処理は、中央処理装置(CPU)110によって、オペレーティングシステムまたは基本制御アプリケーションに基づいて制御される。こうして、CE装置の仕様および機能が制御されるので、CE装置のユーザがCE装置の仕様および機能を利用することができる。ディスプレイおよびディスプレイ制御装置(Ctrl)160は、中央処理装置(CPU)110によって制御され、ユーザに情報を提供する。キーパッドおよびキーパッド制御装置(Ctrl)150が提供されることによって、ユーザは、情報を入力することができる。キーパッドを介して入力された情報は、キーパッド制御装置(Ctrl)によって中央処理装置(CPU)110に供給される。この入力情報に従って、中央処理装置の指示および/または制御を行うことができる。音声入力/出力(I/O)手段140には、少なくとも音声信号を再生するためのスピーカと音声信号を記録するためのマイクとが含まれる。中央処理装置(CPU)110は、音声データの音声出力信号への変換と、音声入力信号の音声データへの変換とを制御することができる。この場合、例えば、音声データは、伝送および保存に適したフォーマットを有する。デジタル音声の音声信号への音声信号変換、およびその逆の音声信号変換は、従来、デジタル−アナログ回路およびアナログ−デジタル回路によってサポートされている。
さらに、図1aに例示した詳細な実施例による携帯CE装置100は、無線周波数アンテナに結合された移動通信インターフェイス(I/F)180をオプションとして含み、加入者識別モジュール(SIM)170を使って操作することができる。移動通信インターフェイス(I/F)180は、移動トランシーバとして配置され、移動通信アンテナから信号を受信し、これらの信号を復号し、復調し、ベースバンド周波数に低減する。移動通信インターフェイス180は、オーバーザエアーインターフェイスのため提供される。そして、公衆移動通信網(PLMN)の無線アクセスネットワーク(RAN)における対応する基地局(BS)との移動通信のため、加入者識別モジュール(SIM)170と共に使用される。こうして、移動通信インターフェイス(I/F)180の出力は、データストリームで構成されるが、中央処理装置(CPU)110によってさらに処理をしなければならない場合もある。また、移動トランシーバとして配置される移動通信インターフェイス(I/F)180は、中央処理装置(CPU)110からデータを受信するよう適応している。これらのデータは、オーバーザエアーインターフェイスを介して、無線アクセスネットワーク(RAN)の基地局(BS)に送信される。したがって、移動通信インターフェイス(I/F)180によって、信号を具現するデータを符号化し、変調し、アップコンバートして、使用のための無線周波数にする。その後、移動通信アンテナによって、これらの結果として得られる無線周波数信号を公衆移動通信網(PLMN)の無線アクセスネットワーク(RAN)において対応する基地局(BS)に送信する。
画像取得センサ10は、一般にCCD(電荷結合素子)および光学部品によって実現される。ピクセルのグリッドを含む電荷結合素子は、デジタルカメラ、デジタル光学スキャナ、およびデジタルビデオカメラにおいて、デジタル画像を取得するため、光検知装置として使用される。コンデンサ列(CCD)上の光学部品(1枚のレンズまたは複数のレンズを配置したもの)によって画像を射影することによって、その位置の光度に比例する電荷が各コンデンサに蓄積される。デジタルビデオおよびデジタルスチールカメラにおいて使用される2次元配列によって、画像全体または画像の一部の長方形が取得される。一旦、この配列が画像に対して露光すると、制御回路によって、各コンデンサが隣のコンデンサに内容を伝達するよう作動する。配列中の最後のコンデンサが、電荷を電圧に変換する増幅器に電荷を放出する。この処理を繰り返すことによって、制御回路によって、配列のすべての内容を異なる電圧に変換し、この電圧を抽出し、デジタル化し、画像処理モジュール20によってさらに処理するための未処理画像データを提供する。画像処理モジュール20によって、CE装置100のユーザは、デジタル静止画像および最終的には一連の動画も撮影することができる。従来、未処理画像データは、画像処理モジュール20によって圧縮され、データ記憶装置に保存される。画像処理モジュール20は、特に、デジタル静止画像処理(および動画処理)のため必要とされるコーデックモジュール、すなわち、符号化および復号化モジュールを実現する。画像処理モジュール20の実現される各構成要素は、ソフトウェアアプリケーションの構成要素であることが好ましい。これらのアプリケーション構成要素の処理は、画像処理モジュール20の処理能力および機能を改善するのに有利な特定のハードウェアの実現によってサポートされる。
最近、画像取得に関して、CMOSイメージセンサが普及し、一般に、CCDに取って代わろうとしている。すべてのチップ製造において支配的技術であるCMOS製造工程によって、CMOS画像センサを製造することができる。また、CMOS画像センサは、安価に製造することができ、信号処理回路機構を同一の装置に組み込むことができる。本発明が特定の画像取得センサタイプに限定されないことを理解されたい。
代表的な代替の携帯CE装置には、携帯情報端末(PDA)、ハンドヘルドコンピュータなどが含まれることがある。これらは、また、画像取得センサを装備したり、画像処理機能を有したりしてもよい。代表的マイクロプロセッサに基づくCE装置の実現方法は当分野で周知であるため、実現方法の詳細は、本発明の範囲外とする。
図1bのブロック図に、携帯家庭用電子(CE)装置101の主要な構造構成要素を例示する。このブロック図によって、本発明と共に使用することができる任意の種類の携帯家庭用電子(CE)装置を例示する。
ここに例示された携帯CE装置101は、例えば、ユーザがデジタル画像を取得することができるデジタルカメラとして実現される。特に、装置101は、マイクロコントローラ(μC)111と、画像データ記憶装置121と、キー入力制御装置(Ctrl)151を介してマイクロコントローラ(μC)111に結合されるキー、およびディスプレイ制御装置(Ctrl)161を有するディスプレイを含むユーザインターフェイス入力/出力手段と、画像射影のための光学部品(図示省略)を有するCCD(電荷結合素子)またはCMOS画像センサ(図示省略)を一般に含む画像取得センサ10と、例として画像処理に必要ないくつかの従属モジュールおよび独立モジュール、ならびに構成要素の実現方法を表す画像処理モジュール20と、を備えるマイクロコントローラ(μC)に基づく装置として実施される。CE装置101の処理操作は、実現される各構成要素の動作を制御するマイクロコントローラ(μC)111によって制御される。ユーザは、キー入力によってCE装置101と対話することができ、こうして、CE装置101の機能に影響を及ぼす。従来、このようなCE装置101は、処理に基づくCE装置とは対照的に、処理操作において規定されている。デジタルカメラの実現方法は、当分野において周知であるため、実現方法の詳細に関しては、本発明の範囲外とする。
それにもかかわらず、配線またはソフトウェアアプリケーションのいずれかに基づいて画像取得センサ10を実現することによって、ユーザに同様の機能を提供することができる。
以下の説明は、本発明の概念を中心に論じる。この概念とは、一般に、CE装置100および101(図1aおよび1bを参照、画像処理モジュール20において実現される)において実現される画像処理に関する。特に、本発明の概念は、ユーザインストラクションに従って、あるいは、自律的および/または独自に操作することができる画像の操作、編集、フィルタリングなどに関する。
図2を参照すると、画像の操作、編集、フィルタリングなどの代表的な処理が例示されている。1つの画像が提供され、この画像を、ユーザがコントラスト補正に関して調整するところであると想定する。明るさ調整、コントラスト補正またはカラーフィルタリングなどの代表的で簡単な画像補正および/または処理では、CE装置100で圧縮済画像表現を完全に復号化し、空間領域においてこれらの処理を適用し、それから編集/補正済画像を圧縮済画像表現に完全に再圧縮する必要がある。計算能力およびメモリが制約されている携帯CE装置に関して、特に画像が高解像度である場合、これらの画像処理によって計算コストが高くなることがある。また、計算能力およびメモリの規定条件によって、携帯CE装置の重量およびサイズと、計算時間、計算負荷、および(モジュールを選択して活性化/非活性化する場合の)モジュールエンパワーメントによる電力消費とを観点とする携帯CE装置の総合的デザインが決まる。同様に、本発明が関係する代表的な種類の携帯CD装置を製造するデジタルカメラ製造業者およびカメラ付き携帯電話製造業者は、撮影する画像の解像度を上げるため競争していることに留意されたい。
現在、電話には2メガピクセルものセンサ、代表的なデジタルカメラには5メガピクセルものセンサが搭載されている。これらの数字は、さらに増大すると仮定される。画像を編集/処理する場合、ユーザは、通常、明るさを調整したり、コントラストを補正したり、他のフィルタリング処理を適用したりすることによって、視覚的画質を補正する。前述のように、これらの処理は、調整するデジタル画像を非圧縮したり再圧縮したりすることによって実現されるので、かなりの時間および能力を費やす。小さいサイズに分けられたカラーデジタル画像を圧縮するのに、(使用する圧縮アルゴリズムの計算の複雑さと携帯CE装置が提供する計算能力とによって決まる)1単位時間を要すると想定する。例えばVGA(640×480ピクセル)にカラー画像サイズを拡大するのに、結果として、対応する圧縮時間は約4倍になる。これらの測定から単純に線形的に拡張すると、1メガピクセルのカラーデジタル画像を符号化するための時間は、(小さいサイズに分けられたカラーデジタル画像と比較して)13倍より長くなる。実際、画像解像度において1メガピクセル増加するごとに、結果として、符号化のための時間は、入出力解像度の倍数に従ってさらに増加するであろう。
以下に、JPEGにおける優れた画像圧縮と、解像度および品質における拡張性などの画像アプリケーションのための新しい重要な特性とによって、将来、標準の圧縮アルゴリズムになると予想されているJPEG2000圧縮アルゴリズムについて説明する。図3に、JPEG2000の圧縮(符号化ともいう)およびJPEG2000の非圧縮(復号化ともいう)を概略的に例示する。
図3によって、代表的なJPEG2000のエンコーダ200の処理フローを推測することができる。圧縮手順において先行するエンコーダ200の第1モジュール(図示省略)は、分割モジュールであって、従来、巨大なデジタル画像に関して必要とされる画像を処理可能な断片に切り分ける機能を有する。巨大なデジタル画像は、空間的に重複しない均一サイズのタイルに分割される。その後、各コンポーネントを別々に処理する。続いて、デジタルカラー画像の色成分を非相関化する機能を有する非相関化ステージモジュール210が提供される。複数成分の画像に関しては、特定のカラー画像において、成分の非相関化を行うため成分変換が実行される。例えば、RGB(赤、緑、青)成分を有するカラー画像を、YCrCb(輝度、赤色差、および青色差)成分空間またはRCT(可逆成分変換)成分空間へ変換することができる。(デジタル画像およびデジタル画像成分のそれぞれの)画像データは、画像データをウェーブレット領域へ変換するよう適応している変換モジュール220に供給される。変換後、ウェーブレット領域中の画像データは、量子化モジュール230によって量子化される。その後、エントロピ符号化モジュール240によって、量子化処理の結果得られた量子化係数を再グループ化し、局所的空間および解像度アクセスを容易にする。
量子化係数の各サブバンドは、重複しない長方形ブロックに分割される。空間的に同じ場所に配置される3つの長方形(所定の解像度レベルにおける各サブバンドから1つずつ)によって、1つのパケット区分を形成する。各パケット区分は、さらにコードブロックに分割され、コードブロックの各々は、記録済レート歪曲線を使って埋込みビットストリームに圧縮される。このコードブロックの埋込みビットストリームは、ビットストリーム組立モジュール250によって、パケットに組み立てられる。パケットの各々は、1つの空間位置における解像度レベル1の品質向上を表す。最後に、すべてのタイルおよびすべてのコンポーネントのすべての解像度レベルのすべてのパケット区分からパケットを収集することによって1つのレイヤを形成する。こうして、画像全体の品質向上を表すレイヤがフル解像度になる。最終的なJPEG2000ビットストリームが複数のレイヤから構成されることがあることに留意されたい。
また、図3から、類推によって、代表的なJPEG2000のデコーダ300の処理フローを推測することができる。JPEG200による圧縮済画像表現の復号化および非圧縮において、JPEG2000のエンコーダ200を参照して上記で説明したそれぞれのモジュール関数に関して逆関数を実行するモジュールが提供される。圧縮済画像表現は、ビットストリーム分析モジュール310に供給され、必要なコンポーネントおよびタイル、ならびに、最終的にその中に組み込まれたパケットに含まれるコードブロックを分離および/または抽出する。エントロピ復号化モジュール320は、エントロピ符号化モジュール310によって行われた再グループ化を逆に行うよう適応している。
逆量子化モジュール330によって、量子化係数からウェーブレット領域中の画像データを再構成する。そして、ウェーブレット領域中の画像データは、逆変換モジュール340に供給される。逆変換モジュール340は、空間領域中の画像データを結果として求める逆ウェーブレット変換を実行するよう適応している。次に、逆非相関化ステージモジュール350によって、非相関化された成分を再変換する。すなわち、例えば、YCrCb(輝度、赤色差、および青色差)成分空間またはRCT(可逆成分変換)成分空間のカラー画像を、RGB(赤、緑、青)成分を有するカラー画像に変換することを意味する。画像サイズのために、空間的に重複しない均一サイズのタイルに分割する場合、非相関化ステージモジュール350の後続のデコーダ300の最終モジュール(図示省略)によって、復号化処理中別々に処理されたコンポーネントをマージする。
JPEG2000は、JPEG(Joint Photographic Experts Group)によって開発され、国際標準化機構(ISO)によってISO/IEC15444−1:2000として発行された標準画像圧縮アルゴリズムであることに留意されたい。技術背景として参照するためこれを本明細書に組み入れることとする。
JPEG2000標準規格による符号化/圧縮は、復号化/非圧縮の約1.2倍かかる。以下の数は、符号化に関する各処理にかかる時間のおおよそのパーセンテージである(このリストによってすべてを網羅しているとはいえない。すなわち、時間のかかる主な処理のみ示しているにすぎない)。
−画像データの読取: 〜5%
−カラー非相関化(必要な場合): 〜5%
−ウェーブレット変換: 〜10%
分解する数によって多少異なる場合がある。
−エントロピ符号化: 70%
対象のピクセルごとのビット数によって異なる場合がある。
JPEG2000標準規格は、ビット平面に基づくエンコーダである。
符号化するビット平面の数を増やすと、画像品質が向上し、かつ計算が複雑になる。
−レート割当およびビットストリーム組立: 〜10%
−画像データの読取: 〜5%
−カラー非相関化(必要な場合): 〜5%
−ウェーブレット変換: 〜10%
分解する数によって多少異なる場合がある。
−エントロピ符号化: 70%
対象のピクセルごとのビット数によって異なる場合がある。
JPEG2000標準規格は、ビット平面に基づくエンコーダである。
符号化するビット平面の数を増やすと、画像品質が向上し、かつ計算が複雑になる。
−レート割当およびビットストリーム組立: 〜10%
非圧縮に関する各処理は、実質的に対称的な計算能力を必要とする(このリストによってすべてを網羅しているとはいえない。すなわち、時間のかかる主な処理のみ示しているにすぎない)。
−ビットストリーム分析: 〜5%
−逆カラー非相関化(必要な場合): 〜5%
−逆ウェーブレット変換: 〜10%
分解する数によって多少異なる場合がある。
−逆エントロピ復号化: 〜70%
対象のピクセルごとのビット数によって異なる場合がある。
JPEG2000標準規格は、ビット平面に基づくコーダである。
符号化および復号化するビット平面の数をそれぞれ増やすと、画像品質が向上し、かつ計算が複雑になる。
−画像データの書込: 〜10%
−ビットストリーム分析: 〜5%
−逆カラー非相関化(必要な場合): 〜5%
−逆ウェーブレット変換: 〜10%
分解する数によって多少異なる場合がある。
−逆エントロピ復号化: 〜70%
対象のピクセルごとのビット数によって異なる場合がある。
JPEG2000標準規格は、ビット平面に基づくコーダである。
符号化および復号化するビット平面の数をそれぞれ増やすと、画像品質が向上し、かつ計算が複雑になる。
−画像データの書込: 〜10%
処理性能を向上させるため、画像内容を補正した後、画像を再符号化するのを回避する必要がある。これは、基本的に、符号化処理、すなわち、エントロピ符号化処理および復号化処理において時間のかかる主要な処理を回避することを意味する。上記のリストおよび図2から分かるように、計算時間においてかなりの改善を図ると同時にオリジナル画像を補正して補正済画像を作成する処理を実行するには、エントロピ符号化/エントロピ復号化の部分をできるだけ回避する必要がある。計算の複雑さという観点において、エントロピ符号化/エントロピ復号化は、ボトルネックとなる。これらを回避することによって、計算コストにおいてかなりの改善が得られる。
アプリケーションにおいて既存の高性能画像エンコーダのほとんどは、変換に基づくコーダである。変換によって、ピクセルを非相関化し、これらのエネルギを少数の係数に集約し、結果として、変換係数を効率良く符号化する。エネルギの大部分は、少数の大きな変換係数に集約されるので、エントロピ符号化方式を使用して効率良く符号化することができる。
ウェーブレット変換は、全画像(または、大容量のカラー画像の場合、画像の一部、コンポーネントのタイル)上を処理する。ウェーブレット変換では、例えば離散コサイン変換より効果的にエネルギを集約し、符号化後のブロッキングアーティファクトがない。また、図4に示すように、ウェーブレット変換によって、画像は、L−レベルのダイアディックウェーブレットピラミッドに分解される。結果として得られるウェーブレット係数は、最も精密なMレベルのウェーブレット係数を使用しないで解像度におけるスケーリングを容易に行うことができ、オリジナル画像より2M倍も小さい画像を再構成することができる。ウェーブレット変換は、多重解像度で実行可能であるため、理論的にはスケーラブル画像符号化に適している。
ウェーブレットとは、ローパス係数によって、ゆっくり変化する長いデータセグメントを表し、ハイパス係数によって、短いデータセグメントにおける局所的変化を表す信号表現である。図5aおよび図5bに1次元ウェーブレット変換のフレームワークを示す。入力列は、ローパスおよびハイパス解析FIR(有限インパルス応答)フィルタを介して分解することができ、フィルタリング結果にファクタ2でサブサンプリングを行うことができる。オリジナルの入力列を再構成するには、ローパス係数およびハイパス係数にファクタ2でアップサンプリングを行い、別の1組のローパスおよびハイパス合成FIRフィルタに通す。
以下のセクションでは、デジタル画像上で行われる操作演算の数学的意味について紹介する。表記として、オリジナル画像はI(n、m)と示し、結果として得られる操作(処理、編集など)済画像は、I'(n、m)と示す。
明るさ調整−スカラ加算/スカラ減算
画像操作演算において、I(n、m)とI'(n、m)との間の関係は、次のように与えられる。
画像操作演算において、I(n、m)とI'(n、m)との間の関係は、次のように与えられる。
条件K>0は、明るさを増すことと同等であり、その結果、画像をより明るくする。一方、K<0は、明るさを減少させることと同等であり、その結果、画像をより暗くする。明るさ処理の前後に、画像ヒストグラムを見ることによって、明るさ調整のデジタル画像への効果が分かる。(図6を参照)。以下のセクションでは、圧縮済領域中のデジタル画像に明るさの処理を適用する方法を検討する。
JPEG2000標準規格では、空間における画像の画像データをよりエネルギを集約している他の領域へ変換するのにウェーブレット変換を利用している。標準規格のベースラインにおいて許可されるフィルタリングは、5−3ウェーブレットフィルタまたは9−7ウェーブレットフィルタのどちらかであり、分解タイプは、ダイアディック(Mallatとしても知られる)である。
明るさ処理およびコントラスト処理(後で説明)を空間領域からウェーブレット領域(すなわち、変換先圧縮済領域と同等)に変換するのに必要とされる処理を決定するため、まず、下記で簡潔に定義される離散ウェーブレット変換(DWT)として知られる変換処理を理解する必要がある。
任意の連続関数I(t)は、スケーリング関数およびそれから導かれるウェーブレット関数の項で定義される以下の展開式で表される。
スケールjにおけるスケーリング係数およびウェーブレット係数は、以下の2つの関係によってスケールj+1におけるスケーリング係数と関係している。
上記の数式によると、より高いスケールのスケーリング係数は、スケーリングフィルタおよびウェーブレットフィルタ、それぞれ、h(k)およびh'(k)と共に使用することによって、より低いスケールのウェーブレット係数およびスケーリング係数、すなわち、離散ウェーブレット変換係数を算出することができることが示されている。
実際、オリジナル解像度における離散信号は、対応するスケーリング係数であると想定される。したがって、j=Jがオリジナル解像度におけるスケールである場合、
次の1組の数式を使用することによって、より低いスケールの離散ウェーブレット変換係数を得る。
信号のDWTを数式にすることによって、ウェーブレット領域において明るさ調整を適用することができる。上記のように、空間領域における明るさの処理は、以下と対応する。
スケールj=Jの場合、
数式(5)および(8)を使って、
数式(5)および(8)を使って、
スケールj=J-1の場合、
スケールj=J-2の場合、
この方法を続けることによって、一般のスケールj=J-lに関するスケーリング係数は、次のように与えられる。
すなわち、スケーリング係数cj(k)にKJ-l(k)の項を加えることによって、ウェーブレット領域における明るさの処理を実行することができる。h(k)の項は、スケーリングフィルタを意味する。
同様の解析を行うことによって、ウェーブレット係数dj(k)を評価することができる。説明を簡潔にするためおよび反復を避けるため(この解析は非常に類似しているので)、解析のステップをすべて列記せず、最終的結果を提供するだけにする。一般のスケールj=J-lに関して、ウェーブレット係数は、次によって与えられる。
すなわち、ウェーブレット係数dj(k)にKJ-l(k)の項を加えることによって、ウェーブレット領域における明るさの処理を行うことができる。h'(k)の項は、ウェーブレットフィルタを意味する。
KJ-l(k)の項は、ウェーブレット領域における画像のDCシフトを表す。ウェーブレット変換済係数は、すべてのサブバンドにおいてオリジナルのウェーブレット変換済画像から変更される。しかしながら、エネルギの大部分が変換済画像のLLサブバンドに集中するため、単にLLサブバンドにのみ変更を適用するだけで、空間領域における明るさの処理に関して一番正確な近似を得ることができる。このように、空間領域におけるDCファクタの加算(/減算)は、ウェーブレット領域のベースバンド(LLサブバンド)における対応するDCファクタの加算(/減算)とほぼ同等である。
したがって、最初のステップとして、明るさ調整を空間領域に適用する代わりに、ウェーブレット領域に適用することができる。尚、性能における改善は、(離散ウェーブレット変換による計算コストが上記で示されるほど高くないという事実によって)約10〜15%である。他のバンドの復号化を実行しない場合、改善は、下記のように10倍より大きくなる。ここで、大体の変化は、LLサブバンドだけで生じる。したがって、他のサブバンドを再符号化する必要はない。サブバンドの符号化および特にウェーブレット変換(例えば、離散ウェーブレット変換)に基づくJPEG2000標準規格および他のエンコーダは、バンド間の相関関係を全く使用しないため、他のバンドに関して同じコードストリームを保持することができる。
したがって、圧縮済領域中の画像データにおいてLLサブバンドだけを補正することによって、性能をかなり向上させることができる。
量子化の後、(離散ウェーブレット変換の結果得られる)各サブバンドは、長方形のブロック、すなわち、重複しない長方形に分割されることに留意されたい。空間的に一致する3つの長方形(各解像度レベルにおける各サブバンドから1つずつ)は、パケット区分位置、すなわち、プレシンクトを備える(図7を参照)。各パケット区分位置は、さらに、「コードブロック」と呼ばれる重複しない長方形に分割され、上記で図2を参照して説明したエントロピコーダへの入力となる。各コードブロックのコードデータは、コードストリームにおいて1つまたは複数のレイヤに跨がって分散される。レイヤごとに、画像品質が連続的かつ単調に改良されるので、デコーダによって、各レイヤ中に順に含まれるコードブロックの寄与度を復号化することができる。特定のタイル、レイヤ、コンポーネント、解像度、およびプレシンクトを表すデータは、パケットと呼ばれる連続するセグメントにおけるコードストリーム中に出現する。パケットデータは、8ビット(1バイト)境界で整列している。パケット中のデータは、LL、HL、LH、およびHHサブバンドからの寄与度が、この順で出現するよう並べられる。各サブバンド内では、コードブロックの寄与度が、関連するプレシンクトによって設定される境界の範囲内でラスタ順に出現する。関連するサブバンドからのサンプルを含むコードブロックのみが、プレシンクトの範囲内でパケット中に表れる。
1280×960ピクセル、すなわち、1.2メガピクセルと同等の解像度を有するデジタル画像を想定する。この画像を5つのレベルに分解すると、640×480、320×240、160×120、80×60、および40×30ピクセルサイズのサブバンドになる。画像を圧縮するのに使用されるコードブロックが32×32ピクセル(最も一般的に使用されるブロックサイズ)である場合、この画像におけるコードブロックの数は、1200ブロックになる。LLサブバンド中のブロック数は4にすぎない。これらの4ブロックのみ補正し、他のブロックは補正しないでおく場合、エントロピ符号化済ブロックデータのうちの0.33%(=4/1200)のみ変更すればよい。画像読込み処理、カラー変換処理、ウェーブレット変換処理を省略し、エントロピ符号化処理の0.33%およびビットストリーム形成処理の一部を実行する場合、全所要時間は、画像全体を再符号化する場合の10%未満まで減少する。
画像の解像度がより高い場合にも、同様の解析法が適用される。実際、LLサブバンドが画像全体に対してより小さな割合になる場合が多いため、処理時間においてかなりの改善が得られる。また、ビットストリーム形成処理には、より少ない計算能力しか必要としない。以下で、図8、すなわち、本発明の一実施例によるLLサブバンド補正のための処理手順の概略図を参照しながら、この処理の結果、ビットストリーム生成処理において必要とされる変更について説明する。
図8を参照すると、処理S90において、補正するデジタル画像のLLサブバンドが提供される。
第1のサブ処理S100において、LLサブバンド中のコードブロックをすべて再符号化しなければならない。LLサブバンドを再符号化するのに実行可能な方法は、2通りある。第1の実行可能な方法は、例示された処理手順において、処理S101、S102、およびS103を含む第1分岐によって示されている。一方、第2の実行可能な方法は、例示された処理手順において、処理S104、S105、およびS106を含む第2分岐によって例示されている。
第1分岐の処理を参照すると、LLサブバンドすべてを再符号化する。LLサブバンドでは、逆ウェーブレット変換を必要としない。非圧縮済データは、数式(12)〜(15)に従ってスカラ加算(または、スカラ減算)を適用した後、復号化し、サブバンドに配置することができる。DCシフト値を表すKJ-l(k)は、正または負の値であってもよいことに留意されたい。
第2分岐の処理を参照すると、LLサブバンドは、ブロックの一部を復号化および再符号化することによって、部分的に再符号化される。図9に示すように、加算または減算するDCシフト値を表すKJ-l(k)は、ビット平面kから始まってもよい。明るさを調整するとき、加算または減算するDCシフト値は、通常、オリジナルサンプル値の小数部である。したがって、下位のk+lビット平面のみ数式(12)〜(15)に基づいて補正する。上位のmsb-k(msbは最も有意なビットであることを示す)ビットは、すべて、同じ値のままである。その結果、補正のため考慮されるビット平面、すなわち、下位のk+lビット平面のみを復号化したり、操作したり、および再符号化したりすることができる。これを部分的復号化ともいう。そうでない場合、すなわち、DCシフトファクタがオリジナルサンプル値の小数部でない場合、上記で説明した第1分岐で例示されるように、数式(12)〜(15)に従って計算を実行する。JPEG2000標準規格または任意の他のサブバンドに基づくエンコーダの符号化速度をさらに速くするため、オプションの算術演算による符号化を省略してもよい。代わりに、圧縮性能における多少の機能低下を犠牲にして、kビット平面を未処理ビットで送信する。
第2のサブ処理S110において、補正済ブロックを備えるパケットは、すべて変更する必要がある。これらのブロックに属する圧縮済データを包含し、パケットヘッダを変更する(処理S111およびS112を参照)。
処理S124において、データを包含するためヘッダ情報を更新しなければならない。以下の処理は、必要とされるパケットヘッダの補正の詳細に関する。
パケットヘッダにおける「包含する/包含しない」ビットは、補正済ブロックがLLサブバンド中のパケット中に存在し、オリジナルのビットストリームにおいて上位(下位)ではなかったが、一定のビット平面において上位(または下位)になる場合、包含ビットを補正しなければならない。
(タグツリーでコード化された)コードブロック包含情報を補正しなければならない。
補正済コードブロックにおける空のビット平面の数を更新する必要がある。
明るさ調整によって圧縮済データが補正されるので、コードブロック長を変更する。
パケットヘッダにおける変更は、あまり複雑でない。JPEG2000標準規格では、これらの効果を取り入れるアプリケーションが、ビットストリーム中の補正が必要なパケットだけアクセスすることができるようにするランダムアクセス機能が提供されている。それにもかかわらず、アプリケーションがさらに新たなレート歪最適化を実行しようとする場合、簡単な処理によって実行することができる。これらの変化が最悪の場合における符号化時間の約5%と同等であると推定することができる。したがって、約20倍の高速化を達成することができる。
グレイスケール画像に関して、明るさ調整は、単一成分画像自体に適用される。カラー画像に関して、明るさ調整は、画像の輝度成分に適用されるのみである。色差コンポーネントを変更する必要はない。
数式(12)〜(15)において定義されるように、DCシフト値を表すKJ-l(k)を他のサブバンドに適用するよう拡張することによって、近似をより正確にすることができることに留意されたい。
コントラスト補正−スカラ乗法/スカラ除算
対照的な操作において、処理は、画像のヒストグラムの伸張/収縮に基づく。図10に、コントラスト操作の例を示す。画像のヒストグラムは、画像におけるグレイレベルの出現頻度を表す。一定のプロパティについてヒストグラムをモデル化することによって、所望の効果を実現することができる。
対照的な操作において、処理は、画像のヒストグラムの伸張/収縮に基づく。図10に、コントラスト操作の例を示す。画像のヒストグラムは、画像におけるグレイレベルの出現頻度を表す。一定のプロパティについてヒストグラムをモデル化することによって、所望の効果を実現することができる。
p(I)によって、画像I(n、m)のヒストグラムを表すこととする。すると、p(I)は、I(n、m)において輝度i∈[0,255]を有するピクセルの個数を表す。ヒストグラム補正という観点では、所望のヒストグラムPd(Ip)を有する画像Ip(n、m)を生成することになる。これは、画像I(n、m)から画像Ip(n、m)を得るため、p(I)をPd(Ip)に写像する関数/変換を見つけることによって実現される。
コントラスト調整を適用する一般的な線形手法は、画像の輝度に次の変換を適用することである(図11を参照)。
コントラスト調整のより簡単な方法では、画像全体に対して単一のコントラスト調整ファクタλを使用する。ηが画像ピクセルの輝度の平均である場合、
解析は、明るさ処理に関して上記で行った解析に似ている。空間領域におけるコントラスト調整の数式は、次によって与えられる。
スケールj=Jの場合、
数式(5)および(18)を使って、
数式(5)および(18)を使って、
スケールj=J-1の場合、
スケールj=J-2の場合、
この方法を続けることによって、一般のスケールj=J-lに関するスケーリング係数は、次によって与えられる。
すなわち、コントラストスケールファクタλによってスケーリング係数Cj(k)を変倍し、それにKJ-l(k)の項を加えることによって、ウェーブレット領域におけるコントラスト処理を実行することができる。h(k)の項は、スケーリングフィルタを意味する。
同様の解析を行うことによって、ウェーブレット係数dj(k)を評価することができる。説明を簡潔にするためおよび反復を避けるため(この解析は非常に類似しているので)、解析のステップをすべて列記せず、最終的結果を提供するだけにする。一般のスケールj=J-lに関して、ウェーブレット係数は、次によって与えられる。
すなわち、コントラストスケールファクタλによってウェーブレット係数dj(k)を変倍し、それにKJ-l(k)の項を加えることによって、ウェーブレット領域におけるコントラスト処理を実行することができる。h'(k)の項は、ウェーブレットフィルタを意味する。
上記の数式から分かるように、ウェーブレット変換済係数は、すべてのサブバンドにおいてオリジナルのウェーブレット変換済画像から変更される。しかしながら、エネルギの大部分が変換済画像のLLサブバンドに集中するため、単にLLサブバンドにのみ変更を適用するだけで、空間領域におけるコントラスト処理に関して一番正確な近似を得ることができる。このように、空間領域におけるコントラストファクタλの乗算は、実際に、ウェーブレット領域のベースバンド(LLサブバンド)における補正とほぼ同等である。したがって、コントラスト調整を空間領域に適用する代わりに、ウェーブレット領域に適用することができる。尚、前に説明したように、性能における改善は、約10〜15%である。
ここで、大体の変化は、LLサブバンドだけで生じる。したがって、他のサブバンドを再符号化する必要はない。JPEG2000標準規格および場合によっては他のコーダ、特にウェーブレット変換エンコーダは、バンド間の相関関係を全く使用しないため、他のバンドに関して同じコードストリームを保持することができる。したがって、単にLLサブバンドの圧縮済データを補正することによって、処理の性能をかなり向上することができる。実現方法と複雑さの問題に関する限り、明るさ調整の方法と同様の議論を再度当てはめることができる。したがって、コントラスト調整処理の性能は、LLサブバンドの圧縮済データだけを補正することによってかなり向上させることができる。
コントラスト調整の複雑さの解析および実現方法の形態は、明るさ調整の方法と非常に類似した方法であるので、説明を簡潔にするため、ここで詳細について繰り返さないこととする。図12は、本発明の一実施例によるLLサブバンド補正のための処理手順を例示する概略図である。
図12を参照すると、処理S90において、補正するデジタル画像のLLサブバンドが提供される。
第1のサブ処理S100'において、LLサブバンド中のコードブロックをすべて再符号化しなければならない。LLサブバンドを再符号化するのに実行可能な方法は、2通りある。第1の実行可能な方法は、例示された処理手順において、処理S101、S102'、およびS103を含む第1分岐によって例示されている。一方、第2の実行可能な方法は、例示された処理手順において、処理S104、S105'、およびS106を含む第2分岐によって例示されている。
第1分岐の処理を参照すると、LLサブバンド全体を再符号化する。LLサブバンドでは、逆ウェーブレット変換を必要としない。非圧縮済データは、数式(22)〜(25)に従って、スカラ乗算(またはスカラ除算)、および、スカラ加算(またはスカラ減算)を適用した後、復号化し、サブバンドに配置することができる。ファクタλは、1より大きいか、または、小さい(それぞれ乗法演算および除法演算と同等になる)場合があることに留意されたい。シフト値を表すKJ-l(k)は、正または負の値でもよいことに留意されたい。
第2分岐の処理を参照すると、LLサブバンドは、ブロックの一部を復号化および再符号化することによって、部分的に再符号化される。一定の状況において、すなわちファクタλと加数KJ-l(k)に従って、補正は、上記の処理S105に関する説明と同等のビット平面kから開始することができる。したがって、下位のk+lビット平面のみ数式(22)〜(25)に基づいて補正する。上位のmsb-k(msbは最上位ビットを示す)ビットは、すべて、同じ値のままである。その結果、補正のため考慮されるビット平面、すなわち、下位のk+lビット平面のみを復号化したり、操作したり、および再符号化したりすることができる。これを部分的復号化ともいう。そうでない場合、上記で説明した第1分岐で例示されるように、数式(22)〜(25)に従って計算を実行する。JPEG2000標準規格および任意のウェーブレット変換に基づくエンコーダの符号化速度をさらに速くするため、オプションの算術演算による符号化を省略してもよい。代わりに、圧縮性能における多少の機能低下を犠牲にして、kビット平面を未処理ビットで送信する。
第2のサブ処理S110において、補正済ブロックを備えるパケットは、すべて変更する必要がある。これらのブロックに属する圧縮済データを包含し、パケットヘッダを変更する(処理S111およびS112を参照)。
他の処理において、データを包含するためヘッダ情報を更新しなければならない。以下の処理は、必要とされるパケットヘッダの補正の詳細に関する。
パケットヘッダにおける「包含する/包含しない」ビットは、補正済ブロックがLLサブバンド中のパケット中に存在し、オリジナルのビットストリームにおいて上位(下位)ではなかったが、一定のビット平面において上位(または下位)になる場合、包含ビットを補正しなければならない。
(タグツリーでコード化された)コードブロック包含情報を補正しなければならない。
補正済コードブロックにおける空のビット平面の数を更新する必要がある。
明るさ調整によって圧縮済データが補正されるので、コードブロック長を変更する。
数式(22)〜(25)において定義されるように、線形ファクタを表すKJ-l(k)を他のサブバンドに適用するよう拡張することによって、近似をより正確にすることができることに留意されたい。
汎用線形フィルタリング
入力画像I(n,m)上に汎用N-タップ線形フィルタリングを行ったフィルタ済画像I'(n,m)は、次のように記述することができる。
入力画像I(n,m)上に汎用N-タップ線形フィルタリングを行ったフィルタ済画像I'(n,m)は、次のように記述することができる。
N個のスケーリングパラメータf(k)は、N-タップフィルタのフィルタ係数である。数式(26)は、静止画像の線形フィルタリングの汎用化形式であり、多種多様な線形画像フィルタリング処理について記述するのに使用することができる。これらのうちの最も一般的なもののいくつかは、平滑化(ローパスフィルタリング)、鮮鋭化(ハイパスフィルタリング)、平均化(算術平均フィルタ)などである。
明るさ調整およびコントラスト調整に関する説明から、圧縮済領域において、JPEG2000で符号化された静止画像のピクセル係数の加算(または減算)ならびに乗算(または変倍)の両方を実行することができることが分かる。数式(26)から、汎用線形フィルタリングは、これらの2つの基本演算を単純に拡張したものであることが分かる。すなわち、有限の加法演算および乗法演算に線形分解することによって所望の結果を達成することができる。したがって、明るさ調整およびコントラスト調整の結果と、線形処理の重ね合せの原理とによって、本発明の概念を使用して圧縮済領域において任意の線形画像処理操作を実行することができる。特に、2つの重要なフィルタリング処理について、以下で検討する。
鮮鋭化処理
鮮鋭化とは、画像におけるエッジを増強することによって、画像が以前より鮮明に見えるようにする画像処理操作である。画像の鮮鋭化は、画像に関する(エッジなどの)高周波情報の増強と類似している。ウェーブレット変換済画像の高周波サブバンドにおけるウェーブレット係数には、エッジに関する情報が含まれる。したがって、高周波サブバンドにおける係数を増強しなければならない。3レベルのウェーブレット分解を行った画像を想定する(図4を参照)。変換済画像のレベル1の係数によって、画像における最も強い高周波成分が示される。一方、次のレベル(レベル2)の係数によって、次に強い高周波成分が示される、などである。したがって、高周波情報を増強するには、必然的に、レベル1の係数を最も増強しなければならない。係数は、定数ファクタλ>1で掛けることによって、増強することができる。
鮮鋭化とは、画像におけるエッジを増強することによって、画像が以前より鮮明に見えるようにする画像処理操作である。画像の鮮鋭化は、画像に関する(エッジなどの)高周波情報の増強と類似している。ウェーブレット変換済画像の高周波サブバンドにおけるウェーブレット係数には、エッジに関する情報が含まれる。したがって、高周波サブバンドにおける係数を増強しなければならない。3レベルのウェーブレット分解を行った画像を想定する(図4を参照)。変換済画像のレベル1の係数によって、画像における最も強い高周波成分が示される。一方、次のレベル(レベル2)の係数によって、次に強い高周波成分が示される、などである。したがって、高周波情報を増強するには、必然的に、レベル1の係数を最も増強しなければならない。係数は、定数ファクタλ>1で掛けることによって、増強することができる。
また、どの程度の強さの鮮鋭化処理を行うかに従って、次のレベルのサブバンドにおける係数の増強も行う場合がある。弱い鮮鋭化処理しか必要としない場合、レベル1のサブバンドの係数のみ増強すればよい。より強い鮮鋭化を必要とする場合、次のレベル(レベル2)のサブバンドの係数も増強する、などである。こうして、ウェーブレットピラミッドにおける各レベルの高周波サブバンドを増強することができ、ピラミッドの最高レベルに達するまで増強が行われる。しかしながら、変換済画像のLLサブバンドには、低周波成分しか含まれないため、変更されない。
前のセクションで説明したように、係数を変更したサブバンドは、エントロピ符号化を行う必要がある。したがって、高速化の改善は、変更しなければならないサブバンドの個数に依存する。サブバンドの個数は、今度は、どの程度の強さの鮮鋭化処理を所望するかに依存する。
平滑化処理
画像の平滑化は、画像の高周波成分を抑制するのに類似している。ウェーブレット変換済画像の高周波サブバンドにおけるウェーブレット係数には、エッジに関する情報および同様の高周波情報が含まれる。この高周波情報を抑制することによって、エッジを平滑化することができる。したがって、高周波サブバンドにおける係数を抑制することによって、JPEG2000標準規格における平滑化処理を実現することができる。3レベルのウェーブレット分解を行った画像を想定する(図4を参照)。変換済画像のレベル1の係数によって、画像における最も強い高周波成分が示される。一方、次のレベル(レベル2)の係数によって、次に強い高周波成分が示される、などである。したがって、高周波情報を増強するには、必然的に、レベル1の係数を最も抑制しなければならない。そこで、最初のステップでは、レベル1の係数をゼロと等しくなるよう抑制する。
画像の平滑化は、画像の高周波成分を抑制するのに類似している。ウェーブレット変換済画像の高周波サブバンドにおけるウェーブレット係数には、エッジに関する情報および同様の高周波情報が含まれる。この高周波情報を抑制することによって、エッジを平滑化することができる。したがって、高周波サブバンドにおける係数を抑制することによって、JPEG2000標準規格における平滑化処理を実現することができる。3レベルのウェーブレット分解を行った画像を想定する(図4を参照)。変換済画像のレベル1の係数によって、画像における最も強い高周波成分が示される。一方、次のレベル(レベル2)の係数によって、次に強い高周波成分が示される、などである。したがって、高周波情報を増強するには、必然的に、レベル1の係数を最も抑制しなければならない。そこで、最初のステップでは、レベル1の係数をゼロと等しくなるよう抑制する。
また、どの程度の強さの平滑化処理を行うかに従って、次のレベルのサブバンドにおける係数の抑制も行う場合がある。弱い平滑化処理しか必要としない場合、レベル1のサブバンドの係数のみ抑制すればよい。より強い平滑化を必要とする場合、次のレベル(レベル2)のサブバンドの係数も抑制する、などである。こうして、ウェーブレットピラミッドにおける各レベルの高周波サブバンドを抑制することができ、ピラミッドの最高レベルに達するまで抑制が行われる。しかしながら、変換済画像のLLサブバンドには、低周波成分しか含まれないため、変更されない。
前のセクションで説明したように、係数を変更したサブバンドは、エントロピ符号化を行う必要がある。したがって、高速化の改善は、変更するサブバンドの個数に依存する。サブバンドの個数は、今度は、どの程度の強さの平滑化処理を所望するかに依存する。
実施例の実現方法
図13を参照すると、上記で詳細に説明した方法の実現例が示されている。図3に詳細に示すJPEG2000エンコーダ/デコーダの実現方法の一部として、上記で参照しながら詳細に説明したように実現してもよい。本発明の概念によると、圧縮済領域(すなわち、符号化済領域または圧縮済画像表現)における画像データは、ビットストリーム分析モジュール310'に提供される。このモジュールは、図8および図12の処理S90を参照して定義される特定の必要機能を有する図3のビットストリーム分析モジュール310でもよく、圧縮済領域中の画像データのLLサブバンドを提供することができる。こうして、LLサブバンド画像データは、エントロピデコーダ320'に送られる。このエントロピデコーダは、図8および図12の処理S100およびS100'を参照して定義される特定の必要機能を有する図3のエントロピデコーダ320でもよい。画像操作は、数式(12)〜(15)、および/または、数式(22)〜(25)を適用するよう作用する(図8の処理102および105と図12の102'および105'とをそれぞれ参照)。
図13を参照すると、上記で詳細に説明した方法の実現例が示されている。図3に詳細に示すJPEG2000エンコーダ/デコーダの実現方法の一部として、上記で参照しながら詳細に説明したように実現してもよい。本発明の概念によると、圧縮済領域(すなわち、符号化済領域または圧縮済画像表現)における画像データは、ビットストリーム分析モジュール310'に提供される。このモジュールは、図8および図12の処理S90を参照して定義される特定の必要機能を有する図3のビットストリーム分析モジュール310でもよく、圧縮済領域中の画像データのLLサブバンドを提供することができる。こうして、LLサブバンド画像データは、エントロピデコーダ320'に送られる。このエントロピデコーダは、図8および図12の処理S100およびS100'を参照して定義される特定の必要機能を有する図3のエントロピデコーダ320でもよい。画像操作は、数式(12)〜(15)、および/または、数式(22)〜(25)を適用するよう作用する(図8の処理102および105と図12の102'および105'とをそれぞれ参照)。
操作500の後、圧縮済領域中の補正済画像データは、エントロピエンコーダ240'に送られる。このエントロピエンコーダは、図8および図12の処理S100およびS100'を参照して定義される特定の必要機能を有する図3のビットストリーム分析モジュール240でもよい。最後に、補正済画像データは、補正済画像の圧縮済画像表現を形成する画像データの中に再度包含される。ビットストリーム組立モジュール250'は、再組立を行うよう作用する。この場合、ビットストリーム組立モジュール250'は、図8および図12の処理S110を参照して定義される特定の必要機能を有する図3のビットストリーム組立モジュール250でもよい。
図13に例示したモジュールは、図1aまたは図1bを参照して説明した画像処理モジュールのうちの1つなどの画像処理モジュールにおいて実現されるのが好ましい。
本発明は、離散ウェーブレット変換(DWT)に基づいて動作するJPEG2000標準規格を参照して詳細に説明したが、当業者であれば、本発明の概念が、任意のサブバンドに基づく符号化方法を使って適用することができ、特にウェーブレット変換符号化方法を使って処理することができることを評価するであろう。したがって、本発明は、JPEG2000標準規格および離散ウェーブレット変換のそれぞれのエンコーダ/デコーダに限定されると理解すべきでない。
本発明の本実施例に関連して説明したモジュール、構成要素、および、機能は、本発明の実施例による画像取得機能を有するCE装置に含まれるものであり、携帯CE装置に備えられることもあるマイクロプロセッサまたはマイクロコントローラなどのデータ処理装置によって構成されてもよいことに留意されたい。さらに、これらのモジュール、構成要素、および機能は、1つまたは複数のデータ処理装置(マイクロプロセッサ、マイクロコントローラまたは専用集積回路(ASIC))上で実行し、機能および処理を実行するのに必要な処理演算を実行するための命令を含むコード部によって構成することができる。代替または追加の方法として、専用集積回路(ASIC)などの1つまたは複数のハードウェアモジュールに基づいて、モジュール、構成要素、および機能または機能の一部を実現してもよい。本発明の概念を実現する方法は、ソフトウェアおよび/またはハードウェアによる実現方法を含む特定の実現方法のいずれにも限定されない。
本発明のいくつかの特徴と実施形態について、特定の実施例を参照しながら例示し詳細に説明してきたが、これらは例にすぎず、限定を意図するものではない。当業者であれば、開示された実施例に対する代替の実現方法および様々な変更が、本発明の範囲および考慮の中にあることを評価するであろう。したがって、本発明は、添付の請求の範囲によってのみ限定されるとみなされることとする。
Claims (33)
- 圧縮済領域中の画像データを補正するための方法であって、
圧縮済画像データは、特にウェーブレット変換に基づくサブバンドエンコーダによって、空間領域中の画像データから取得され、
前記方法は、
少なくとも1つの線形オフセットKおよび少なくとも1つの線形スケールファクタλを備えるグループからの少なくとも1つで構成される線形関数f(k)であって、前記空間領域中の画像データに適用可能な該線形関数f(k)を提供するステップと、
前記線形関数f(k)を前記圧縮済領域へ変換するステップと、
前記変換済線形関数f(k)を前記圧縮済画像データの定義済個数のサブバンドに適用し、結果として補正済サブバンドを得ることによって、前記空間領域中の画像データに前記線形関数f(k)を適用した場合の近似を取得するステップと、を備える方法。 - 前記線形関数f(k)を圧縮済領域へ変換するステップは、
少なくとも1つの線形オフセットKを前記圧縮済領域へ変換することによって、結果として少なくとも1つの変換済オフセット値KJ-l(k)を得るステップを備える請求項1に記載の方法。 - 前記Kは、定義済空間解像度レベルJにおける前記空間領域中の画像データに適用される一定の線形オフセットを表す請求項2に記載の方法。
- 前記補正済サブバンドのコードブロックは、
前記定義済個数のサブバンドをエントロピ復号化するステップと、
前記定義済個数のサブバンドの前記コードブロックに前記変換済線形関数f(k)を適用することによって、すなわち、前記少なくとも1つの変換済オフセット値KJ-l(k)を前記コードブロックの各値に加算すること、および、前記少なくとも1つの線形スケールファクタλを前記コードブロックの各値に乗算することによって、結果として補正済サブバンドを得るステップと、
前記コードブロックを含む前記補正済サブバンドをエントロピ再符号化するステップと、によってすべて再符号化される請求項2に記載の方法。 - 前記補正済サブバンドのコードブロックは、
前記コードブロックの定義済個数(msb-k)のビット平面をエントロピ復号化するステップと、
前記ビット平面にオリジナルサンプル値の小数部を表す前記変換済オフセット値KJ-l(k)を適用するステップと、によって部分的に再符号化される請求項2に記載の方法。 - 前記関数f(k)は、前記画像データに適用する線形フィルタ関数を定義することができ、該線形フィルタ関数は、特に、明るさ補正、コントラスト補正、または両方を含む請求項1に記載の方法。
- 前記方法は、
前記空間領域中の画像データに適用可能な汎用関数を提供するステップと、
前記汎用関数を、前記少なくとも1つの線形オフセットKおよび前記少なくとも1つの線形スケールファクタλを備えるグループからの少なくとも1つにおける前記線形関数f(k)に線形分解するステップと、を備える請求項1に記載の方法。 - 前記線形分解するステップは、前記汎用関数に基づいて線形的に近似した関数を生成するステップを備える請求項7に記載の方法。
- 前記方法は、
前記変換済線形関数f(k)を適用するコードブロックを含むパケットのパケットヘッダを適応させるステップを備える請求項1に記載の方法。 - 前記変換済線形関数f(k)は、前記画像データの高周波情報を表すサブバンド(LL)を備える少なくとも第1レベルのベースバンドに適用される請求項1に記載の方法。
- 前記汎用関数は、少なくとも鮮鋭化フィルタリングおよび平滑化フィルタリングに対処する請求項7に記載の方法。
- 特にウェーブレット変換に基づくサブバンドエンコーダによって、空間領域中の画像データから取得される圧縮済領域中の画像データの補正を可能にするコンピュータ読み取り可能媒体上に記録されたプログラムコードを有する該コンピュータ読み取り可能媒体を備えるコンピュータプログラムプロダクトであって、該プログラムコードは、
少なくとも1つの線形オフセットKおよび少なくとも1つの線形スケールファクタλを備えるグループからの少なくとも1つで構成される線形関数f(k)であって、前記空間領域中の画像データに適用可能な該線形関数f(k)を提供するためのコード部と、
前記線形関数f(k)を前記圧縮済領域へ変換するためのコード部と、
前記変換済線形関数f(k)を前記圧縮済画像データの定義済個数のサブバンドに適用し、結果として補正済サブバンドを得ることによって、前記空間領域中の画像データに前記線形関数f(k)を適用した場合の近似を取得するためのコードセクションと、を備えるコンピュータプログラムプロダクト。 - 前記線形関数f(k)を圧縮済領域へ変換するためのコード部は、
少なくとも1つの線形オフセットKを前記圧縮済領域へ変換することによって、結果として少なくとも1つの変換済オフセット値KJ-l(k)を得るためのコード部を備える請求項12に記載のコンピュータプログラムプロダクト。 - 前記Kは、定義済空間解像度レベルJにおける前記空間領域中の画像データに適用される一定の線形オフセットを表す請求項13に記載のコンピュータプログラムプロダクト。
- 前記補正済サブバンドのコードブロックは、
前記定義済個数のサブバンドをエントロピ復号化するためのコード部と、
前記定義済個数のサブバンドの前記コードブロックに前記変換済線形関数f(k)を適用することによって、すなわち、前記少なくとも1つの変換済オフセット値KJ-l(k)を前記コードブロックの各値に加算すること、および、前記少なくとも1つの線形スケールファクタλを前記コードブロックの各値に乗算することによって、結果として前記補正済サブバンドを得るためのコード部と、
前記コードブロックを含む前記補正済サブバンドをエントロピ再符号化するためのコード部と、によってすべて再符号化される請求項13に記載のコンピュータプログラムプロダクト。 - 前記補正済サブバンドのコードブロックは、
前記コードブロックの定義済個数(msb-k)のビット平面をエントロピ復号化するためのコード部と、
前記ビット平面にオリジナルサンプル値の小数部を表す前記変換済オフセット値KJ-l(k)を適用するためのコード部と、によって部分的に再符号化される請求項13に記載のコンピュータプログラムプロダクト。 - 前記コンピュータプログラムプロダクトは、
前記変換済線形関数f(k)を適用するコードブロックを含むパケットのパケットヘッダを適応させるためのコード部を備える請求項12に記載のコンピュータプログラムプロダクト。 - 前記関数f(k)は、前記画像データに適用する線形フィルタ関数を定義することができ、該線形フィルタ関数は、特に、明るさ補正、コントラスト補正、または両方を含む請求項12に記載のコンピュータプログラムプロダクト。
- 前記コンピュータプログラムプロダクトは、
前記空間領域中の画像データに適用可能な汎用関数を提供するためのコード部と、
前記汎用関数を、前記少なくとも1つの線形オフセットKおよび前記少なくとも1つの線形スケールファクタλを備えるグループからの少なくとも1つにおける前記線形関数f(k)に線形分解するためのコード部と、を備える請求項12に記載のコンピュータプログラムプロダクト。 - 前記線形分解するのは、前記汎用関数に基づいて線形的に近似した関数を生成するのを備える請求項19に記載のコンピュータプログラムプロダクト。
- 前記変換済線形関数f(k)は、前記画像データの高周波情報を表すサブバンド(LL)を備える少なくとも第1レベルのベースバンドに適用される請求項12に記載のコンピュータプログラムプロダクト。
- 前記汎用関数は、少なくとも鮮鋭化フィルタリングおよび平滑化フィルタリングに対処する請求項19に記載のコンピュータプログラムプロダクト。
- 画像取得可能な電子装置であって、該画像処理装置は、空間領域中の画像データを圧縮済領域中の画像データへ変換するための特にウェーブレット変換に基づくサブバンドエンコーダを備え、該画像処理装置は、
少なくとも1つの線形オフセットKおよび少なくとも1つの線形スケールファクタλを備えるグループからの少なくとも1つで構成される線形関数f(k)であって、前記空間領域中の画像データに適用可能な該線形関数f(k)と、
前記線形関数f(k)を前記圧縮済領域へ変換するため、および、前記変換済線形関数f(k)を前記圧縮済画像データの定義済個数のサブバンドに適用し、結果として補正済サブバンドを得ることによって、前記空間領域中の画像データに前記線形関数f(k)を適用した場合の近似を取得するための画像操作モジュールと、を備える装置。 - 前記装置は、
少なくとも1つの線形オフセットKを前記圧縮済領域へ変換することによって、結果として少なくとも1つの変換済オフセット値KJ-l(k)を得るよう適応する前記画像操作モジュールを備える請求項23に記載の装置。 - 前記Kは、定義済空間解像度レベルJにおける前記空間領域中の画像データに適用される一定の線形オフセットを表す請求項24に記載の装置。
- 前記画像操作モジュールは、前記補正済サブバンドのコードブロック上で動作し、前記コードブロックをすべて再符号化するよう適応し、
エントロピデコーダは、前記定義済個数のサブバンドを復号化するよう適応し、
前記画像操作モジュールは、前記定義済個数のサブバンドの前記コードブロックに前記変換済線形フィルタ関数f(k)を適用することによって、
すなわち、前記少なくとも1つの変換済オフセット値KJ-l(k)を前記コードブロックの各値に加算すること、および、
前記少なくとも1つの線形スケールファクタλを前記コードブロックの各値に乗算することによって、結果として前記補正済サブバンドを得るよう適応し、
エントロピエンコーダは、前記コードブロックを含む前記補正済サブバンドを再符号化するよう適応する請求項24に記載の装置。 - 前記画像操作モジュールは、前記補正済サブバンドのコードブロック上で動作し、前記コードブロックを部分的に再符号化するよう適応し、
エントロピデコーダは、前記コードブロックの定義済個数(msb-k)のビット平面を復号化するよう適応し、
前記画像操作モジュールは、前記ビット平面にオリジナルサンプル値の小数部を表す前記変換済オフセット値KJ-l(k)を適用するよう適応する請求項24に記載の装置。 - 前記画像操作モジュールは、前記変換済線形関数f(k)を適用するコードブロックを含むパケットのパケットヘッダを更新するよう適応する請求項24に記載の装置。
- 前記関数f(k)は、前記画像データに適用する線形フィルタ関数を定義することができ、該線形フィルタ関数は、特に、明るさ補正、コントラスト補正、または両方を含む請求項24に記載の装置。
- 前記装置は、
前記空間領域中の画像データに適用可能な汎用関数と、
前記汎用関数を、前記少なくとも1つの線形オフセットKおよび前記少なくとも1つの線形スケールファクタλを備えるグループからの少なくとも1つにおける前記線形関数f(k)に線形分解するよう適応する画像操作モジュールと、を備える請求項24に記載の装置。 - 前記線形分解するのは、
前記汎用関数に基づいて線形的に近似した関数を生成するのを備える請求項24に記載の装置。 - 前記変換済線形関数f(k)は、前記画像データの高周波情報を表すサブバンド(LL)を備える少なくとも第1レベルのベースバンドに適用される請求項24に記載の装置。
- 前記汎用関数は、少なくとも鮮鋭化フィルタリングおよび平滑化フィルタリングに対処する請求項32に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/077,989 US7583844B2 (en) | 2005-03-11 | 2005-03-11 | Method, device, and system for processing of still images in the compressed domain |
PCT/IB2005/003520 WO2006095218A1 (en) | 2005-03-11 | 2005-11-23 | Method, computer program product and device for processing of still images in the compressed domain |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008533787A true JP2008533787A (ja) | 2008-08-21 |
Family
ID=36952977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008500281A Pending JP2008533787A (ja) | 2005-03-11 | 2005-11-23 | 圧縮済領域における静止画像を処理するための方法、コンピュータプログラムプロダクト、および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7583844B2 (ja) |
EP (1) | EP1856666A1 (ja) |
JP (1) | JP2008533787A (ja) |
KR (1) | KR100937378B1 (ja) |
CN (1) | CN101116105B (ja) |
WO (1) | WO2006095218A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016023537A (ja) * | 2014-07-24 | 2016-02-08 | 国立研究開発法人土木研究所 | たわみ計測方法およびたわみ計測装置 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4129694B2 (ja) * | 2006-07-19 | 2008-08-06 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
US8295624B2 (en) * | 2007-12-03 | 2012-10-23 | Ecole De Technologie Superieure | Method and system for generating a quality prediction table for quality-aware transcoding of digital images |
WO2009055896A1 (en) | 2007-11-02 | 2009-05-07 | Vantrix Corporation | System and method for predicting the file size of images subject to transformation by scaling and a change of quality-controlling parameters |
WO2009066677A1 (ja) * | 2007-11-22 | 2009-05-28 | Nec Corporation | 画像処理装置 |
JP5181816B2 (ja) * | 2008-05-12 | 2013-04-10 | 株式会社リコー | 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体 |
US8805110B2 (en) | 2008-08-19 | 2014-08-12 | Digimarc Corporation | Methods and systems for content processing |
US8385971B2 (en) * | 2008-08-19 | 2013-02-26 | Digimarc Corporation | Methods and systems for content processing |
US8300961B2 (en) * | 2008-12-12 | 2012-10-30 | Ecole De Technologie Superieure | Method and system for low complexity transcoding of images with near optimal quality |
KR20130050149A (ko) * | 2011-11-07 | 2013-05-15 | 오수미 | 인터 모드에서의 예측 블록 생성 방법 |
US10609405B2 (en) | 2013-03-18 | 2020-03-31 | Ecole De Technologie Superieure | Optimal signal encoding based on experimental data |
US9661331B2 (en) | 2013-03-18 | 2017-05-23 | Vantrix Corporation | Method and apparatus for signal encoding realizing optimal fidelity |
US9338450B2 (en) | 2013-03-18 | 2016-05-10 | Ecole De Technologie Superieure | Method and apparatus for signal encoding producing encoded signals of high fidelity at minimal sizes |
CN103530854A (zh) * | 2013-10-15 | 2014-01-22 | 南通市牧井微电科技发展有限公司 | 基于空域滤波的cbct全景图锐化增强方法 |
GB2530311B (en) * | 2014-09-19 | 2017-01-11 | Imagination Tech Ltd | Data compression |
US10825213B2 (en) * | 2017-10-05 | 2020-11-03 | Adobe Inc. | Component-based digital image synchronization |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08204957A (ja) * | 1995-01-26 | 1996-08-09 | Dainippon Screen Mfg Co Ltd | 画像処理方法 |
JPH11272861A (ja) * | 1998-03-20 | 1999-10-08 | Ricoh Co Ltd | 画像処理装置 |
JPH11331847A (ja) * | 1998-03-30 | 1999-11-30 | Seiko Epson Corp | 画像変換方法、ディジタルカメラおよびコンピュ―タシステム |
JP2001223899A (ja) * | 2000-02-09 | 2001-08-17 | Fuji Photo Film Co Ltd | 画像処理符号復号化方法および画像処理符号復号化システム、画像処理符号化装置および画像処理復号化装置、並びに記録媒体 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000511363A (ja) * | 1994-07-14 | 2000-08-29 | ジョンソン、グレイス、カンパニー | 画像を圧縮するための方法及び装置 |
US6535666B1 (en) * | 1995-06-02 | 2003-03-18 | Trw Inc. | Method and apparatus for separating signals transmitted over a waveguide |
US7003168B1 (en) * | 1997-03-11 | 2006-02-21 | Vianet Technologies, Inc. | Image compression and decompression based on an integer wavelet transform using a lifting scheme and a correction method |
US6584111B1 (en) * | 1998-11-04 | 2003-06-24 | Northern Telecom Limited | ABR flow control using single bit congestion indication and wavelet transform filtering |
US6643406B1 (en) * | 1999-07-28 | 2003-11-04 | Polaroid Corporation | Method and apparatus for performing linear filtering in wavelet based domain |
US6725282B1 (en) * | 1999-09-07 | 2004-04-20 | Bath Iron Works | Method and apparatus for a wearable computer |
US6985632B2 (en) | 2000-04-17 | 2006-01-10 | Canon Kabushiki Kaisha | Image processing system, image processing apparatus, and image processing method |
US6757429B2 (en) * | 2001-02-21 | 2004-06-29 | Boly Media Communications Inc. | Method of compressing digital images |
US6697521B2 (en) * | 2001-06-15 | 2004-02-24 | Nokia Mobile Phones Ltd. | Method and system for achieving coding gains in wavelet-based image codecs |
US7206459B2 (en) | 2001-07-31 | 2007-04-17 | Ricoh Co., Ltd. | Enhancement of compressed images |
US7085436B2 (en) | 2001-08-28 | 2006-08-01 | Visioprime | Image enhancement and data loss recovery using wavelet transforms |
US6504494B1 (en) * | 2001-11-06 | 2003-01-07 | Motorola, Inc. | Software, method and apparatus for rate controlled image compression |
US20040105590A1 (en) * | 2002-07-16 | 2004-06-03 | Hiroshi Akimoto | Method for still image compressing using filter bank based on non-separable wavelet basis |
JP4111268B2 (ja) * | 2002-12-13 | 2008-07-02 | 株式会社リコー | サムネイル画像の表示方法、サーバコンピュータ、クライアントコンピュータ及びプログラム |
US7548656B2 (en) | 2003-01-16 | 2009-06-16 | Konica Minolta Holdings, Inc. | Method and apparatus for processing image signals by applying a multi-resolution conversion processing for reducing the image size and applying a dyadic wavelet transform |
US7672523B2 (en) * | 2003-03-03 | 2010-03-02 | The Hong Kong University Of Science And Technology | Efficient rate allocation for multi-resolution coding of data |
CN1259640C (zh) * | 2003-04-10 | 2006-06-14 | 中国科学院计算技术研究所 | 一种图像压缩和加密融合的方法 |
US7200277B2 (en) * | 2003-07-01 | 2007-04-03 | Eastman Kodak Company | Method for transcoding a JPEG2000 compressed image |
EP1730846A4 (en) * | 2004-03-10 | 2010-02-24 | Sindhara Supermedia Inc | METHODS AND DEVICES FOR COMPRESSING DIGITAL IMAGE DATA WITH MOTION PREDICTION |
US7760808B2 (en) * | 2005-06-21 | 2010-07-20 | Nokia Corporation | Image processing of DCT-based video sequences in compressed domain |
-
2005
- 2005-03-11 US US11/077,989 patent/US7583844B2/en not_active Expired - Fee Related
- 2005-11-23 WO PCT/IB2005/003520 patent/WO2006095218A1/en not_active Application Discontinuation
- 2005-11-23 JP JP2008500281A patent/JP2008533787A/ja active Pending
- 2005-11-23 CN CN2005800479655A patent/CN101116105B/zh not_active Expired - Fee Related
- 2005-11-23 EP EP05807168A patent/EP1856666A1/en not_active Withdrawn
- 2005-11-23 KR KR1020077016575A patent/KR100937378B1/ko not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08204957A (ja) * | 1995-01-26 | 1996-08-09 | Dainippon Screen Mfg Co Ltd | 画像処理方法 |
JPH11272861A (ja) * | 1998-03-20 | 1999-10-08 | Ricoh Co Ltd | 画像処理装置 |
JPH11331847A (ja) * | 1998-03-30 | 1999-11-30 | Seiko Epson Corp | 画像変換方法、ディジタルカメラおよびコンピュ―タシステム |
JP2001223899A (ja) * | 2000-02-09 | 2001-08-17 | Fuji Photo Film Co Ltd | 画像処理符号復号化方法および画像処理符号復号化システム、画像処理符号化装置および画像処理復号化装置、並びに記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016023537A (ja) * | 2014-07-24 | 2016-02-08 | 国立研究開発法人土木研究所 | たわみ計測方法およびたわみ計測装置 |
Also Published As
Publication number | Publication date |
---|---|
US7583844B2 (en) | 2009-09-01 |
US20060204118A1 (en) | 2006-09-14 |
CN101116105A (zh) | 2008-01-30 |
WO2006095218A1 (en) | 2006-09-14 |
EP1856666A1 (en) | 2007-11-21 |
KR100937378B1 (ko) | 2010-01-20 |
CN101116105B (zh) | 2010-12-15 |
KR20070090253A (ko) | 2007-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008533787A (ja) | 圧縮済領域における静止画像を処理するための方法、コンピュータプログラムプロダクト、および装置 | |
Zhang et al. | Lossless compression of color mosaic images | |
JP4148462B2 (ja) | 画像処理装置、電子カメラ装置及び画像処理方法 | |
US7369161B2 (en) | Digital camera device providing improved methodology for rapidly taking successive pictures | |
US8265402B2 (en) | 2 dimensional signal encoding/decoding method and device | |
US20080239093A1 (en) | Digital Camera Device Providing Improved Methodology for Rapidly Taking Successive Pictures | |
US8422804B2 (en) | Compressed domain system and method for compression gains in encoded data | |
WO1999017257A2 (en) | System and method for compressing images using multi-threshold wavelet coding | |
US20130223540A1 (en) | Compressed domain system and method for compression gains in encoded data | |
Lee et al. | Lossless compression of HDR color filter array image for the digital camera pipeline | |
US7397957B2 (en) | Discrete wavelet transform unit and method for adaptively encoding still image based on energy of each block | |
US20040006582A1 (en) | Digital image coding device and method | |
WO2003090028A2 (en) | Wavelet transform system, method and computer program product | |
Singh et al. | JPEG2000: A review and its performance comparison with JPEG | |
Li et al. | Lossy compression of Bayer image with SPIHT | |
JP4055994B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記録媒体 | |
JP2010004279A (ja) | 画像処理装置及びそれを備えた画像形成装置 | |
JP3897253B2 (ja) | 画像処理方法、画像処理装置、撮像装置、プログラム及び記録媒体 | |
JP2007295319A (ja) | 画像処理装置及びそれを備えた画像形成装置 | |
Chebil et al. | Pre-compression rate allocation for JPEG2000 encoders in power constrained devices | |
Bazhyna | Image compression in digital cameras | |
Chebil et al. | Compressed domain editing of JPEG2000 images | |
CN117939157A (zh) | 图像处理方法、装置及设备 | |
EP1503594A2 (en) | Discrete wavelet transform unit and method for adaptively encoding a still image based on energy of each block | |
Sevcenco et al. | Combined adaptive and averaging strategies for JPEG-based low bit-rate image coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100624 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101214 |