JP5107495B2 - 品質ベースのイメージ圧縮 - Google Patents

品質ベースのイメージ圧縮 Download PDF

Info

Publication number
JP5107495B2
JP5107495B2 JP2001554626A JP2001554626A JP5107495B2 JP 5107495 B2 JP5107495 B2 JP 5107495B2 JP 2001554626 A JP2001554626 A JP 2001554626A JP 2001554626 A JP2001554626 A JP 2001554626A JP 5107495 B2 JP5107495 B2 JP 5107495B2
Authority
JP
Japan
Prior art keywords
block
sub
blocks
pixel data
variance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001554626A
Other languages
English (en)
Other versions
JP2003521178A (ja
Inventor
スヤガラジャン、カダヤム・エス
モーリー、スティーブン・エー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2003521178A publication Critical patent/JP2003521178A/ja
Application granted granted Critical
Publication of JP5107495B2 publication Critical patent/JP5107495B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はイメージ処理に関し、特にコード化されたディスクリートな余弦変換係数データの適応した寸法にされたブロックおよびサブブロックを使用するイメージ信号の品質ベースの圧縮方式に関する。
【0002】
【従来の技術】
“フィルム”または“映画”の投影に使用されるようなビデオ信号の送信および受信の分野では、イメージ圧縮技術に対して種々の改良が行われている。多数の現在の提案されたビデオシステムはデジタルコード化技術を使用する。デジタルコード化は、それぞれ深刻にイメージ品質を劣化するマルチパスフェーディングおよびジャミングまたは信号干渉等の欠陥に対抗する通信リンクの堅牢性を与える。さらに、デジタル技術は、信号暗号化技術の使用を容易にし、それらは政府および多数の新たに開発された市場の放送応用で有効であることが発見され、またはそこで必要とされている。
【0003】
高解像度ビデオは改良されたイメージ圧縮技術から利点を得ている分野である。最初に提案されたとき、高解像度ビデオの無線伝送(または有線または光ファイバ送信)は過大な帯域幅が必要であるために実用的ではないと思われた。設計されている典型的な無線または他の伝送システムは容易に十分な帯域幅を提供しなかった。しかしながら、デジタルビデオ信号の圧縮は、合理的な帯域幅を使用する伝送を可能にするレベルまで実現されることが認識されている。信号のデジタル伝送に結合されたこのような信号圧縮レベルにより、ビデオシステムはさらに望ましい有効な帯域幅を占有しながら、低いパワーと、チャンネル欠陥に対する大きな免疫性で伝送することが可能である。
【0004】
利用可能な多数の圧縮技術は大きなレベルの圧縮を提供するが、ビデオ信号の品質の劣化を招く。典型的に、圧縮された情報を転送する技術は圧縮された情報が一定のビットレートで転送されることを必要とする。
【0005】
大きな圧縮レベルを与えることができる1つの圧縮技術は、ビデオ信号の所望レベルの品質を維持しながら、コード化されたディスクリートな余弦変換(DCT)係数データの適応した寸法にされたブロックおよびサブブロックを使用する。この技術を以下、適応ブロックサイズディスクリート余弦変換(ABSDCT)方法と呼ぶ。この技術は米国特許第5,021,891 号明細書(発明の名称“Adaptive Block Size Image Compression Method And System ”)に記載され、本出願人に譲渡されここで参考文献とされる。DCT技術はまた米国特許第5,107,345 号明細書(発明の名称“Adaptive Block Size Image Compression Method And System ”)に記載され、本出願人に譲渡されここで参考文献とされる。さらに、微分カッドツリー(differential quadtree )変換技術と組合わせたABSDCT技術の使用は米国特許第5,452,104 号明細書(発明の名称“Adaptive Block Size Image Compression Method And System ”)に記載され、これも本出願人に譲渡され、ここで参考文献とされる。これらの米国特許明細書に記載されたシステムは“フレーム内”コード化と呼ばれる技術を使用し、ここではイメージデータの各フレームは任意の他のフレームの内容と関係なくコード化される。ABSDCT技術を使用して、実現可能なデータレートは識別できるイメージ品質の劣化なしに毎秒約15億ビットから毎秒約5000万ビットまで減少される。
【0006】
ABSDCT技術は黒色および白色またはカラーイメージまたはイメージを表す信号を圧縮するために使用されることができる。カラー入力信号はYIQフォーマットであり、Yは輝度または明度、サンプルであり、IおよびQは画素の各4×4ブロックのクロミナンスまたはカラー、サンプルである。YUV、YCb y またはRGBフォーマットのような他の既知のフォーマットも使用されてよい。目からカラーへの低い空間感度のために、水平および垂直方向の4つの要素によるカラー成分のサブサンプルが合理的であることをほとんどの研究は示している。したがって、ビデオ信号は4つの輝度成分と2つのクロミナンス成分により表されることができる。
【0007】
ABSDCTを使用して、ビデオ信号は処理のための画素ブロックに通常区分される。各ブロックでは、輝度およびクロミナンス成分はブロックインターリーバに送られる。例えば、16×16(画素)ブロックがブロックインターリーバへ与えられてもよく、このブロックインターリーバはディスクリートな余弦変換(DCT)解析用のデータのブロックおよび複合サブブロックを生成するために各16×16ブロック内でイメージサンプルを順序付けまたは組織化する。DCTオペレータは時間および空間的にサンプルされた信号を同一の信号の周波数表示に変換する1方法である。周波数表示への変換によって、量子化装置がイメージの周波数分散特性を使用するように設計されることができるので、DCT技術は非常に高レベルの圧縮を可能にすることが示されている。好ましい実施形態では、1つの16×16DCTは第1の順序に適用され、4つの8×8DCTは第2の順序に適用され、16の4×4DCTは第3の順序に適用され、64の2×2DCTは第4の順序に適用される。
【0008】
【発明が解決しようとする課題】
DCT動作はビデオソースに固有の空間的冗長度を減少する。DCTが行われた後、ビデオ信号エネルギの大部分は幾つかのDCT係数に集中される傾向がある。付加的な変換である微分カッド(quad)ツリー変換(DQT)はDCT係数間の冗長度を減少するために使用されてもよい。
【0009】
16×16ブロックおよび各サブブロックでは、DCT係数値と(DQTが使用されるならば)DQT値はブロックまたはサブブロックをコード化するのに必要なビット数を決定するために解析される。その後、最少数のコード化のためのビットを必要とするブロックまたはサブブロックの組合わせがイメージセグメントを表すために選択される。例えば2つの8×8サブブロックと、6つの4×4サブブロックと、8つの2×2サブブロックはイメージセグメントを表すために選択されることができる。
【0010】
選択されたブロックまたはサブブロックの組合わせは16×16ブロック中に適切な順序で整列される。DCT/DQT係数値はその後、送信の準備のために周波数加重、量子化、(可変長コード化等の)コード化の処理を受ける。前述のABSDCT技術は非常に良好に実行するが、計算上面倒である。したがって技術のコンパクトなハードウェア実行は困難である。
【0011】
ハードウェア実行をより効率的にする別の技術はある利点を与える。幾つかのシステムはディスクリートな余弦変換(DCT)係数データの適応した寸法にされたブロックおよびサブブロックを使用する。DCTベースのシステムの部分は圧縮パラメータとしての品質を使用するが、データの他の部分は品質ベースの計量値の使用とは反対にコード化レートに基づいている。このようなコード化レートベースのパラメータの1例はコントラストベースの適応ブロックサイズイメージ圧縮アルゴリズムの量子化ステップ選択である。
【0012】
【課題を解決するための手段】
本発明は、ディスクリートな余弦変換係数データの適応した寸法にされたブロックおよびサブブロックと品質ベースの量子化スケール係数を使用する品質ベースのイメージ圧縮システムおよび方法である。画素データのブロックはエンコーダへ入力される。エンコーダは処理するため画素の入力ブロックを区分するブロックサイズ割当(BSA)素子を具備する。ブロックサイズ割当は入力ブロックおよびさらに細分割されたブロックの分散に基づいている。通常、ブロックとサブブロック平均値が異なる予め定められた範囲に入るならば、大きい分散のある区域はさらに小さいブロックに細分割され、小さい分散のある区域は細分割されない。したがって、最初にブロックの分散しきい値はその平均値に基づいてその公称値から修正され、その後、ブロックの分散はしきい値と比較され、分散がしきい値よりも大きいならば、ブロックは細分割される。
【0013】
ブロックサイズ割当は変換素子に与えられ、変換素子は画素データを周波数ドメインデータに変換する。この変換はブロックサイズ割当により選択されたブロックとサブブロックでのみ実行される。その後、変換データは量子化および直列化によってスケーリング処理をされる。変換データの量子化は、コントラスト、係数カウント、レート歪み、ブロックサイズ割当の密度および/または過去のスケール係数に関して調節するスケール係数のようなイメージ品質計量値に基づいて量子化される。ジグザグ走査もまたデータ流を生成するためにデータを直列化するために使用されてもよい。データ流は送信を行うために可変長のコーダによりコード化されることができる。コード化されたデータは伝送チャンネルによってデコーダへ送信され、ここで画素データが表示を行うために再構成される。
【0014】
本発明の特徴および利点は、品質ベースのイメージ圧縮システムを提供することである。
【0015】
本発明の別の特徴および利点は、フレーム毎のベースでビットレートを管理することによりフレキシブルなイメージ品質制御を可能にすることである。
【0016】
本発明の別の特徴および利点は、ブロック毎のベースでビットレートを管理することによりフレキシブルなイメージ品質制御を可能にすることである。
【0017】
本発明の別の特徴および利点は、品質イメージ圧縮と、モーションのバーストのようなアクティビティが付随するデータのビットレート制御を維持することである。
【0018】
本発明の別の特徴および利点は、イメージ品質を測定するために信号対雑音比パラメータを使用することである。
【0019】
本発明の別の特徴および利点は、イメージのコントラストに関して調節する量子化スケール係数を使用することである。
【0020】
本発明の別の特徴および利点は、イメージを有するDCTブロックのAC係数カウントに関して調節する量子化スケール係数を使用することである。
【0021】
本発明の別の特徴および利点は、歪みおよびフレーム間のビットレートに関して調節する量子化スケール係数を使用することである。
【0022】
本発明の別の特徴および利点は、過去の量子化スケール係数に関して調節する量子化スケール係数を使用することである。
【0023】
【発明の実施の形態】
本発明の特徴および利点は、図面を伴った以下の詳細な説明からさらに明白になるであろう。同じ参照符号は全体を通して対応している。
デジタル信号のデジタル伝送を容易にし、対応する利点を得るために、通常、幾つかの形態の信号圧縮を使用する必要がある。結果的なイメージで高い圧縮を実現するために、高品質イメージが維持されることも重要である。さらに、コンピュータ処理効率はコンパクトなハードウェア構造に対して所望され、これは多くの応用で重要である。
【0024】
本発明はイメージ品質と、イメージ圧縮の実行におけるコンピュータ処理の効率との両者を考慮するイメージ圧縮の品質ベースシステムまたは装置および方法を提供する。ターゲットビットレートを維持する目標に基づいた本当に価値のあるレートシステムのビットレートを制御することは品質イメージを維持する目的を妨害する。その代わりに、本発明は品質に基づいたレート制御方法を開発する。品質ベースのイメージ圧縮システムはブロックレベルまたはフレームレベルである。ブロックレベルのシステムは通常、ブロックレベルのシステムが特定のブロックを識別するためにさらに多くのオーバーヘッドビットを使用するので、フレームレベル制御よりも多数のフレーム当りのコード化されたビットを使用する。
【0025】
本発明の1実施形態を詳細に説明する前に、本発明は以下の説明あるいは図面で説明されているコンポーネントの構造および配置の詳細についてその応用で限定されないことを理解すべきである。本発明は他の実施形態で可能であり、種々の方法で実行される。またここで使用されている専門語および用語は説明のためのものであり、本発明を限定するものではない。
【0026】
本発明のイメージ圧縮は、本出願人の出願であり、ここで参考文献とされている米国特許第09/436,085号明細書(発明の名称“Contrast Sensitive Variance Based Adaptive Block Size DCT Image Compression ”、1999年11月8 日)に記載されているように、ディスクリートな余弦変換(DCT)技術に基づいている。通常、デジタルドメインで処理されるイメージは大きさがN×Nのオーバーラップしないブロックのアレイに分割される画素データからなる。二次元のDCTは各ブロックで実行されてもよい。二次元のDCTは以下の関係式により規定される。
【数1】
Figure 0005107495
【0027】
x(m,n)はN×Mブロック内の位置(m,n)の画素であり、
X(k,l)は対応するDCT係数である。
【0028】
画素値は負ではないので、DCT成分X(0,0)は常に正であり、通常最高のエネルギを有する。実際に、典型的なイメージでは、ほとんどの変換エネルギはほぼ成分X(0,0)に集中する。このエネルギの圧縮特性はDCT技術をこのように魅力的な圧縮方法にするものである。
【0029】
イメージ圧縮技術はさらにビットレートの減少を実現するためにコントラスト適合コード化を使用する。ほとんどの自然イメージは比較的ゆっくり変化する平坦な領域と、オブジェクト境界等のビジー領域と高コントラストテクスチャからなることが観察されている。コントラスト適合コード化方式は多くのビットをビジー領域へ割当て、少数のビットをビジー程度の少ない領域に割当てることによりこのファクタの利点を使用する。
【0030】
前述の米国特許第09/436,085号明細書で説明されているように、コントラスト適合コード化はまたブロック効果を減少するのにも有効である。ブロック効果はイメージのビジー領域で知覚可能性が高い。しかしながら、さらに小さいサイズのDCTが使用されるとき、ブロック効果が減少されることが知られている。ブロック効果は画素当りのビット性能を受けるが2×2DCTが使用されるとき可視的に見えなくなる。
【0031】
さらに、コントラスト適合方法はフレーム間コード化(時空的処理)の代わりにフレーム内コード化(空間的処理)を使用する。フレーム間コード化は本来、さらに複雑な処理回路に加えて多数のフレームバッファを必要とする。多くの応用では、複雑さの減少が実際の構造で必要とされる。フレーム内コード化はまた時空的コード化方式が崩壊し、良好に機能しない状態で便利である。例えば機械的シャッタによる積分時間は比較的短いから毎秒24フレームの映画がこのカテゴリに入る。短い積分時間がさらに高い程度の時間的なエイリアスを可能にする。フレーム対フレームの相関についての仮定は、迅速な動きでは急な動作になるので崩壊する。フレーム内コード化は50Hzと60Hzの両者の電力線周波数が含まれるとき標準化が容易でもある。現在テレビジョンは50Hzまたは60Hzで信号を送信する。デジタル方法であるフレーム内方式の使用は、フレームレート対空間解像度を妥協することによって、50Hzと60Hzの両者の動作または毎秒24フレームの映画に適用することができる。
【0032】
イメージ処理の目的では、DCT動作はオーバーラップしないブロックのアレイに分割される画素データについて実行される。ブロックサイズはここでは大きさがN×Mとして説明されているが、種々のブロックサイズが使用されてもよいことが想定されていることに注意する。例えばN×MブロックサイズはNとMの両者が整数であり、MはNよりも大きいか小さいかいずれかが使用されることができる。別の重要な特徴は、N/ixN/i、N/ixN/j、N/ixM/jのように少なくとも1つのサブブロックのレベルに分割可能であり、ここでiとjは整数である。さらに例示的なブロックサイズはここで説明するように、DCT係数の対応するブロックとサブブロックを有する16×16画素ブロックである。例えば9×9のように偶数または奇数の両者の整数等の種々の他の整数が使用されてもよいことがさらに想定される。
【0033】
図1および図2は本発明の品質ベースの圧縮システムを含むイメージ処理システム100 を示している。イメージ処理システム100 は受信されたビデオ信号を圧縮するエンコーダ104 を具備している。圧縮された信号は伝送チャンネル108 を使用して送信され、デコーダ112 によって受信される。デコーダ112 は受信された信号をイメージサンプルに復号し、これはその後、表示される。
【0034】
通常、イメージは処理のために画素のブロックに分割される。カラー信号はRGBからYC1 2 への変換器116 を使用して、RGBスペースからYC1 2 スペースへ変換され、ここでYは輝度または明度の成分であり、C1 とC2 はクロミナンスまたはカラー成分である。カラーに対する眼の空間的感度が低いために、多数のシステムは水平および垂直方向で4のファクタだけC1 とC2 成分をサブサンプルする。しかしながらサブサンプルは必要ではない。4:4:4フォーマットとして知られている十分な解像度イメージは“デジタルシネマ”のカバーリングで呼ばれている幾つかの応用で非常に便利であり、あるいは必要とされている。2つの可能なYC1 2 表示はYIQ表示とYUV表示であり、その両者は共に技術でよく知られている。YCbCrとして知られているYUV表示のバリエーションを使用することも可能である。
【0035】
好ましい実施形態では、各Y、Cb、Cr成分はサブサンプルせずに処理される。したがって、画素の16×16ブロックの各成分の入力はエンコーダ104 へ与えられる。例示の目的で、Y成分のエンコーダ104 が示されている。類似のエンコーダはCbとCr成分に対して使用される。エンコーダ104 はビデオ圧縮を行うためブロックサイズ割当を実行するブロックサイズ割当素子120 を具備する。ブロックサイズ割当素子120 はブロックの知覚的なイメージ特性に基づいて16×16ブロックのブロック分解を決定する。ブロックサイズ割当は各16×16ブロックを16×16ブロック内のアクティビティに基づいてカッドツリー方法でさらに小さいブロックに細分割する。ブロックサイズ割当素子120 はPQRデータと呼ばれるカッドツリーデータを生成し、その長さは1と21ビットの間である。したがってブロックサイズ割当によって、16×16ブロックが分割されるべきであることが決定されたならば、PQRデータのRビットが設定され、それに4つの分割された8×8ブロックに対応するQデータの4つの付加的なビットが後続する。ブロックサイズ割当が任意の8×8ブロックが細分割されることを決定したならば、細分割された各8×8ブロックのPデータの4つの付加的なビットが付加される。
【0036】
図3を参照すると、ブロックサイズ割当素子120 の動作の詳細を示したフロー図が与えられている。ブロックの分散はブロックを細分割する決定における計量値として使用される。ステップ202 で開始して、画素の16×16ブロックが読み取られる。ステップ204 で、16×16ブロックの分散V16が計算される。分散は以下のように計算される。
【数2】
Figure 0005107495
【0037】
ここでN=16であり、xijはN×Nブロック内のi番目の行のj番目の列の画素である。ステップ206 で、ブロックの平均値が2つの予め定められた値の間であるならば、最初に分散しきい値T16は新しいしきい値T' 16を与えるように変更され、その後ブロック分散はこの新しいしきい値T' 16に対して比較される。
【0038】
分散V16がしきい値T16より大きくない場合には、ステップ208 で16×16ブロックの開始アドレスは一時的な記憶装置へ書き込まれ、PQRデータのRビットは16×16ブロックが細分割されないことを示すために0に設定される。その後、アルゴリズムは画素の次の16×16ブロックを読取る。分散V16がしきい値T16よりも大きいならば、ステップ210 でPQRデータのRビットは16×16ブロックが4つの8×8ブロックに細分割されることを示すために1に設定される。
【0039】
4つの8×8ブロック、i=1:4はステップ212 で示されているようにさらに細分割されるように逐次的に考慮される。各8×8ブロックでは、分散V8i がステップ214 で計算される。ステップ216 で、ブロックの平均値が2つの予め定められた値の間であるならば、最初に分散しきい値T8は新しいしきい値T' 8を与えるように変更され、その後ブロック分散は新しいしきい値T' 8に対して比較される。
【0040】
分散V8i がしきい値T8より大きくないならば、ステップ218 で8×8ブロックの開始アドレスは一時的な記憶装置へ書き込まれ、対応するQビット、Qi は0に設定される。その後、次の8×8ブロックが処理される。分散V8i がしきい値T8よりも大きいならば、ステップ220 で対応するQビット、Qi は8×8ブロックが4つの4×4ブロックに細分割されることを示すために1に設定される。
【0041】
4つの4×4ブロック、ji =1:4はステップ222 で示されているようにさらに細分割されるように逐次的に考慮される。各4×4ブロックでは、分散V4ijがステップ224 で計算される。ステップ226 で、ブロックの平均値が2つの予め定められた値の間であるならば、最初に分散しきい値T4は新しいしきい値T' 4を与えるように変更され、その後ブロック分散はこの新しいしきい値に比較される。
【0042】
分散V4ijがしきい値T4より大きくないならば、ステップ228 で4×4ブロックのアドレスが書き込まれ、対応するPビット、Pijは0に設定される。次の4×4ブロックがその後、処理される。分散V4ijがしきい値T4よりも大きいならば、ステップ230 で対応するPビット、Pijは4×4ブロックが4つの2×2ブロックに細分割されることを示すために1に設定される。さらに、4つの2×2ブロックのアドレスは一時的な記憶装置に書き込まれる。
【0043】
しきい値T16、T8、T4は予め定められた定数である。これはハード決定として知られている。その代わりに、適合またはソフト決定が実行されてもよい。例えばソフト決定は2N×2Nブロックの平均画素値に基づいて分散のしきい値を変化し、ここでNは8、4または2である。平均画素値の関数はしきい値として使用されてもよい。
【0044】
例示の目的で、以下の例を考慮する。16×16、8×8、4×4ブロックに対するY成分の予め定められた分散しきい値をそれぞれ50、1100、880とする。換言すると、T16=50、T8=1100、T4=880である。平均値の範囲を80および100とする。16×16ブロックの計算された分散が60であると仮定する。60はT16よりも大きいので、平均値90は80と100の間であり、16×16ブロックは4つの8×8のサブブロックに細分割される。8×8ブロックの計算された分散が1180、935、980、1210であると仮定する。8×8ブロックの2つはT8を超える分散を有するので、これらの2つのブロックは全部で8つの4×4サブブロックを生成するためにさらに細分割される。最後に、8つの4×4ブロックの分散が620、630、670、590、525、930、690であり、対応する平均値が90、120、110、115であると仮定する。第1の4×4ブロックの平均値が範囲(80,100)に入るので、そのしきい値は880よりも小さいT' 4=200まで下げられる。そこでこの4×4ブロックは7つの4×4ブロックと同様に細分割される。結果的なブロックサイズ割当が図4のAに示されている。対応するカッドツリー分解は図4のBに示されている。さらにこのブロックサイズ割当により生成されたPQRデータは図4のCに示されている。
【0045】
類似の処理手順はカラー成分C1 、C2 に対してブロックサイズを割り当てるために使用されることに注意する。カラー成分は水平、垂直またはその両者でデシメートされてもよい。
【0046】
さらに、ブロックサイズ割当は最大のブロック(本発明の例では16×16)が最初に評価されるトップダウン方法として説明されているが、ボトムアップ方法が代わりに使用されてもよいことに注意する。ボトムアップ方法は最小のブロック(本発明の例では2×2)を最初に評価する。
【0047】
図1に戻ると、PQRデータは選択されたブロックのアドレスと共にDCT素子124 へ与えられる。DCT素子124 は選択されたブロックで適切なサイズのディスクリートな余弦変換を実行するためにPQRデータを使用する。選択されたブロックだけがDCT処理を受ける必要がある。
【0048】
イメージ処理システム100 はDCTのDC係数中の冗長を減少するためにDQT素子128 を随意的に含んでいる。DC係数は各DCTブロックの左上のコーナーで遭遇する。DC係数は通常主としてAC係数と比較される。サイズの差異は効率的な可変長コーダの設計を困難にする。したがって、DC係数中の冗長を減少することは有効である。
【0049】
DQT素子128 は時間において2×2で取ったDC係数で2−D DCTを実行する。4×4ブロック内の2×2ブロックで開始すると、2−D DCTは4つのDC係数について実行される。この2×2 DCTは4つのDC係数の微分カッドツリー変換またはDQTと呼ばれる。次にDQTのDC係数は、8×8ブロック内の3つの近傍DC係数と共に次のレベルのDQTを計算するために使用される。最後に、16×16ブロック内の4つの8×8ブロックのDC係数はDQTを計算するために使用される。したがって、16×16ブロックでは、1つの真のDC係数が存在し、残りはDCTとDQTに対応するAC係数である。
【0050】
変換係数(DCTとDQTの両者)は量子化するため量子化装置に与えられる。好ましい実施形態ではDCT係数は周波数加重されたマスク(FWM)と量子化スケール係数を使用して量子化される。FWMは入力DCT係数のブロックと同一ディメンションの周波数加重の表である。周波数加重は異なる加重を異なるDCT係数へ提供する。加重は人間の視覚系または光学系がさらに敏感である周波数内容を有する入力サンプルを強調し、視覚系または光学系の感度が低い周波数内容を有するサンプルをデエンファシスするように設計されている。加重は観察距離等の要因に基づいて設計されてもよい。
【0051】
加重は実験的データに基づいて選択される。8×8 DCT係数に対する加重マスクを設計する方法は、ここで参考文献とされるISO/IEC JTC1 CD 10918(“名称“Digital compression and encoding of continuous-tone still images−part 1 :Requirements and guidelines ”、International Standards Organization、1994年)に記載されている。通常、2つのFWMが設計され、一方は輝度成分に対するものであり、一方はクロミナンス成分に対するものである。ブロックサイズ2×2と4×4に対するFWM表はデシメーションにより得られ、16×16は8×8ブロックの表の補間により得られる。スケール係数は品質と量子化された係数のビットレートを制御する。
【0052】
したがって、各DCT係数は以下の関係式にしたがって量子化される。
【数3】
Figure 0005107495
【0053】
ここでDCT(i,j)は入力されたDCT係数であり、fwm(i,j)は周波数加重マスクであり、qはスケール係数であり、DCTq(i,j)は量子化された係数である。DCT係数の符号に基づいて、中括弧内の第1の項は端数を切上げられるか切り捨てられることに注意する必要がある。DQT係数も適切な加重マスクを使用して量子化される。しかしながら、多数の表またはマスクが使用され、各Y、Cb、Cr成分に適用されることができる。
【0054】
画素データのブロックと周波数加重マスクはその後、量子化スケール係数エレメントによりスケールされる。好ましい実施形態では平均ビットレートに対応して32のスケール係数が存在する。MPEG2のような他の圧縮方法と異なって、平均ビットレートはターゲットビットレートおよびバッファ状態の代わりに、処理されたイメージ品質に基づいて制御される。好ましい実施形態では特定の量子化スケールエレメントはセレクタ130 により予め選択される。本発明は量子化スケールエレメントが予め選択されることを必要としないことに注意すべきである。
【0055】
1ブロックベースの実施形態では、量子化スケール係数はコントラスト(132 )に基づいている。人間の視覚系は低いコントラスト領域よりも高いコントラスト領域に対して感度があることが認められている。コントラストに基づいた量子化スケール係数はビットレートと量子化スケール係数との予め定められた関係を使用する。1実施形態では、BSA関数はコントラストに基づいてM×Nブロックをサブブロックに分割し、それによって細分割が高コントラストのブロックで多く行われ、低コントラストのブロックで行われる細分割は少ない。本発明は分散の平方根と平均強度の比率としてコントラストを定量化する。特に量子化スケール係数は以下の関係式により与えられるようにBSAにしたがって選択される。
【数4】
Figure 0005107495
【0056】
ここで、Ri はブロックのi番目のタイプのビット数であり、σ2 i はブロックのi番目のタイプの分散であり、pi はブロックサイズ割当関数から得られたブロックのi番目のタイプの割合である。量子化スケール係数はビットレートと量子化スケール係数との予め定められた関係を使用して決定される。
【0057】
ビットレートと量子化スケール係数との関係は図5に示されている。ビットレートと量子化スケール係数との関係は、1画素を記述するのに必要な平均ビット数を決定するためにイメージのグループを評価することにより予め決定される。示されているように、量子化スケール係数は画素当りの平均ビット数が減少すると増加する。したがって、特別なスケール係数Qは対応する値Ri で選択されてもよい。
【0058】
別のブロックベースの実施形態では、量子化装置のスケール係数はDCT(136 )の係数カウントに基づいて選択される。典型的に、係数カウントシステムおよび方法はオーバーヘッドのブロック当り1ビットを必要とする。量子化スケール係数方法300 は図6に示されている。ブロックサイズ割当後、データのN×Nブロックを構成するデータのスライスはステップ304 で選択される。好ましい実施形態では、データのスライスは画素データの16行×16列のブロックを有する。図3を参照して説明されているように、DCTは308 でデータのブロックについて行われ、さらにサブブロックが指定される。各データブロックのしきい値は312 で決定される。しきい値はプロセスの任意の段階で決定されてもよい。好ましい実施形態では、しきい値は実験的に予め決定される。その後、大きさにおいて予め定められたしきい値を超えるAC係数の数は316 により以下の関係式により決定される。
【数5】
Figure 0005107495
【0059】
ここでTはしきい値であり、X(k,l)はN×Nブロック内の位置(k,l)におけるDCT係数を表しており、Mはしきい値を超えるDCTのN×Nブロック内のAC係数の数である。スケール係数はその後、しきい値Tを超えるAC係数の数にしたがって320 で割当てられる。
【0060】
スライス内の第1のデータブロックが評価されてスケール係数を割当てられた後、スライス内の次のN×Nデータのブロックがステップ324 で選択される。スケール係数はステップ328 でインクリメントとされ、別のDCTがステップ332 で実行される。平均二乗誤差(MSE)はステップ336 で古いDCTと新しいDCTとの間で決定される。スケール係数はその後ステップ340 でデクリメントされ、別のDCTがステップ344 で実行される。平均二乗誤差(MSE)は348 で再度古いDCTと新しいDCTとの間で決定される。2つの平均二乗誤差は比較され、低い平均二乗誤差に関連する量子化ファクタはステップ352 でデータのブロックに割り当てられる。その後、サイクルはステップ356 でスライス内の各データブロックで反復される。量子化装置がスライス内の各データブロックに対して割り当てられた後、次のデータのスライスが選択され、ステップ360 でサイクルが継続する。
【0061】
量子化スケール係数を決定する別のブロックベースの実施形態はレート歪み134 に基づいた量子化スケーラであり、図7、8で400 で示されている。一般的に、レート歪み量子化装置は係数カウント量子化装置と類似の方法で動作するが、スケール係数がいくつ吟味されるかに基づいてさらに多くのオーバーヘッドビットを必要とする。ブロックサイズ割当後、N×Nのデータブロックを有するデータスライスはステップ404 で選択される。好ましい実施形態では、データのスライスは16行×16列の画素データのブロックを有する。図3を参照にして説明されたように、DCTはステップ408 でデータブロックについて実行され、さらにサブブロックが指示される。各データブロックに対するしきい値はステップ412 で任意のプロセス段で再度決定される。平均歪みDおよび画素レート当りの平均ビットRもステップ416 で決定される。その後、係数カウント方法に関して説明するような関係を使用して、大きさにおいて予め定められたしきい値(M)を超えるAC係数の数がステップ420 で決定される。その後、しきい値Tを超えるAC係数にしたがってスケール係数が424 で割当てられる。
【0062】
スライス内の第1のデータブロックが評価され、スケール係数を割当てられた後、スライス内の次のN×Nデータブロックがステップ428 で選択される。スケール係数はステップ432 で先のブロックのスケール係数からインクリメントされ、別のDCTがステップ436 で実行される。MSEは440 で古いDCTと新しいDCTの間で決定される(ステップ440 )。ステップ440 のMSEレートに関連する量子化スケール係数に対応する平均歪みDと画素当りの平均ビットレートRがステップ444 で決定される。
【0063】
スケール係数はその後、ステップ448 で先のブロックのスケール係数からデクリメントされる。平均二乗誤差(MSE)はステップ456 で古いDCTと新しいDCTとの間で決定される。ステップ456 のMSEレートに関連する量子化スケール係数に対応する平均歪みDと画素当たりの平均ビットレートRがその後ステップ460 で決定される。2つの平均歪みレートDの差と、画素当たりの2つのビットレートRの差が464 で決定される。その後、2つのスケール係数は画素レートの変化と、平均歪みレートの変化の比を次式によって取ることによりステップ468 で決定される。
スケール係数=|ΔRi /ΔDi
最大の絶対値で生じるスケール係数は現在のブロックに対してステップ472 で選択される。その後、サイクルはステップ476 でスライス内の各データブロックに対して反復する。量子化装置がスライス内の各データブロックに対して割当てられた後、次のデータのスライスが選択され、サイクルはステップ480 のように継続する。
【0064】
量子化装置のスケール係数もフレーム毎を基礎として選択される。しかしながらフレームベースのレート制御は通常前述のブロックベースのレート制御よりも低い平均ビットレートで行われる。さらに、フレームベースのレート制御はビット転送がブロック対ブロックベースとは反対にフレーム対フレームベースで生じるので、さらにバッファの使用を必要とする。
【0065】
フレーム毎の量子化装置の実施形態では、量子化スケール係数は種々のブロックサイズの割当(BSA)の密度に基づいてもよい(図1、ブロック144 )。イメージのフレーム全体に対する量子化スケール係数はイメージの視覚的品質に関連する計量に基づいて決定される。視覚的品質は所定のフレームに対する16×16ブロックの数と8×8ブロックの数を決定することによって推論される。即ち、所定のフレームが16×16ブロックよりも多くの8×8ブロックを有するならば、イメージはさらに複雑であるように見える。したがって、より複雑なイメージは品質を維持するためにさらに微細な量子化を通常必要とする。反対に、所定のフレームが8×8ブロックよりも多くの16×16ブロックを有するならば、イメージは複雑でないように見える。したがって、低い量子スケール係数が使用されても、視覚的品質を維持する。したがって、各フレームでは、BSAアルゴリズムが実行され、スケール係数は次式に基づいている。
【数6】
Figure 0005107495
【0066】
ここでn16は1フレーム中の16×16ブロックの数を表し、n8 は1フレーム中の8×8ブロックの数を表し、Lはしきい値を超える比を表している。好ましい実施形態では、しきい値は実験的に予め定められる。スケール係数はその後、値Lと所定のフレームに対する8×8ブロックの数に基づいて選択される。
【0067】
その代わりに、フレームベースの量子化スケール係数は先のフレームの量子化フレームファクタに基づいてもよい(148 )。この実施形態では、現在のフレームは先のフレームのスケール係数、即ち先のフレーム+1のスケール係数インデックスに対応するスケール係数と、先のフレーム−1のスケール係数インデックスに対応するスケール係数を使用して圧縮される。現在のフレームの圧縮中、実際のスケール係数は前述のフレーム毎の視覚的品質方法に関して説明したようにBSA情報から決定される。現在のフレームの実際のスケール係数に最も近いスケール係数に対応する圧縮された出力が決定され、その対応するスケール係数と共に使用される。即ち、
q(sn-1 −1)=qn ならば、q(sn-1 −1)
q(sn )=
そうでなければ、q(sn-1 +1)
ここで、q(sn-1 )は先のフレームのスケール係数のインデックスを表し、q(sn-1 +1)は先のフレームを1だけ超える候補インデックスのスケール係数を表し、q(sn-1 −1)は先のフレームより1だけ下の候補インデックスのスケール係数を表し、qn は現在のフレームの実際のスケール係数を表している。
【0068】
図1および2に戻ると、量子化係数はジグザグ走査シリアライザ152 に与えられている。シリアライザ152 は量子化された係数の直列化流を発生するためにジグザグ方法で量子化係数のブロックを走査する。多数の異なるジグザグ走査パターンおよび、ジグザグ以外のパターンも選択されてもよい。好ましい技術はジグザグ走査で8×8ブロックサイズを使用するが他のサイズが使用されてもよい。
【0069】
ジグザグ走査シリアライザ152 は量子化装置132 、136 、140 、144 または148 の前または後のいずれに置かれてもよいことに注意する。実質上の結果は通常同一である。
【0070】
いずれにせよ、量子化係数流は可変長コーダ156 へ与えられる。可変長コーダ156 はゼロのランレングスコード化を使用し、それにハフマンコード化が後続する。この技術は前述の米国特許第5,021,891 号、第5,107,345 号、第5,452,104 号明細書に詳細に説明され、要約されている。ランレングスコーダは量子化係数を取り、ゼロをゼロではない係数から分離する。ゼロ値はランレングス値と呼ばれ、ハフマンコード化される。ゼロではない値は別々にハフマンコード化される。
【0071】
量子化係数の修正されたハフマンコード化も可能であり、好ましい実施形態で使用される。ここでジグザグ走査後、ランレングスコーダは各8×8ブロック内のランレングス/サイズペアを決定する。これらのランレングス/サイズペアはハフマンコード化される。
【0072】
ハフマンコードはイメージの測定されたまたは論理的統計から設計される。最も自然のイメージはフラットまたは比較的ゆっくりと変化する領域と、オブジェクト境界および高コントラストテクスチャのようなビジー領域からなることが観察されている。DCT等の周波数ドメイン変換を有するハフマンコーダはビジー領域に割当てるビットを多くし、フラット領域に割当てるビットを少なくすることによりこれらの特性を使用する。通常、ハフマンコーダはランレングスおよびゼロではない値をコード化するために検索表を使用する。多数の表が一般に使用され、3つの表が本発明では好ましいが、1または2の表も所望ならば使用されることができる。
【0073】
エンコーダ104 により発生される圧縮されたイメージ信号はバッファ160 を使用して一時的に記憶され、その後、伝送チャンネル108 を使用してデコーダ112 へ送信される。ブロックサイズ割当情報を含んでいるPQRデータもまたデコーダ112 へ与えられる。デコーダ112 はバッファ164 と、ランレングス値およびゼロではない値をデコードする可変長デコーダ168 を具備している。
【0074】
可変長デコーダ168 の出力は、使用される走査方式にしたがって係数を順序付けする逆ジグザグ走査シリアライザ172 に与えられる。この逆ジグザグ走査シリアライザ172 は係数を複雑な係数ブロックに適切に順序付けすることを容易にするためにPQRデータを受信する。
【0075】
複雑なブロックは、量子化スケール係数と周波数加重マスクを使用するので、処理を戻すためにエンコーダ104 で使用される量子化装置に対応してセクレタ174 を使用して逆量子化装置176 、178 、180 、182 または184 に与えられる。
【0076】
係数ブロックはその後、微分カッドツリー変換が適用されたならば、IDQT素子186 に与えられ、それにIDCT素子190 が後続する。そうでなければ、係数ブロックは直接IDCT素子190 へ与えられる。IDQT素子186 とIDCT素子190 は画素データのブロックを生成するために係数を逆変換する。画素データは補間され、RGB形態に変換され、その後、将来表示するために記憶されなければならない。
【0077】
したがって、画素分散に基づいてブロックサイズ割当を実行するイメージ圧縮のためのシステムおよび方法が提供される。分散ベースのブロックサイズ割当は幾つかの利点を提供する。ディスクリートな余弦変換はブロックサイズの決定後に実行されるので、効率のよい計算が実現される。計算上厄介な変換は選択されたブロックだけで実行される必要がある。さらに、ブロック選択プロセスは画素値の分散が数学的に計算が簡単であるので効率的である。さらに分散ベースのブロックサイズ割当の別の利点は知覚的ベースで行われることである。画素分散はブロックのアクティビティの尺度であり、エッジ、テキスチャ等の存在の指示を与える。これは画素値の平均等の尺度よりも非常に良好なブロックの詳細を捕捉する傾向がある。したがって、本発明の分散ベースの方式はより小さいブロックをより多くのエッジを有する領域に割当て、大きいブロックをよりフラットな領域に割当てる。結果として、すぐれた品質が再構成されたイメージで実現される。
【0078】
別の重要な利点は、ブロックサイズ割当がビットレートにかかわりなく幾つかの量子化スケール係数に関して行われ、イメージ品質の制御において正確さと明瞭さを可能にする。品質ベースの量子化スケール係数を可能にすることにより、イメージ圧縮は非常に価値のあるビットレートである。これはイメージ圧縮システムが丁度顕著な可視度のしきい値を超える全ての領域の詳細を維持することを可能にする。さらに分散ベースのイメージ圧縮はムービングピクチャエキスパートグループ(MPEG)圧縮技術のような方法とは異なりイメージ品質の顕著な劣化を与えない。これは特にデジタル映画の領域のような応用で重要である。
【0079】
高い需要のデジタルビデオにより、著作権侵害は深刻な脅威である。デジタル電子透かしは著作権の侵害と、収入の損失を防止するための重要な要求である。電子透かしが知覚的に重要であるイメージの区域で行われるとき、分散ベースのブロックサイズ割当は電子透かしで使用するのに自然な候補である。
【0080】
好ましい実施形態の前述の説明は当業者が本発明を実行または使用することを可能にするために行われた。これらの実施形態に対する種々の変形は当業者に容易に明白であり、ここで限定されている一般原理は発明力を使用せずに他の実施形態に応用されてもよい。したがって、本発明はここで示されている実施形態に限定されず、ここで説明された原理および優秀な特徴と一貫した最も広い技術的範囲に従うことを意図する。
【0081】
本発明の他の特徴および利点は特許請求の範囲で記載されている。
以下に本件出願当初の特許請求の範囲に記載された発明を付記する。
[1]画素データを含むデジタルイメージの圧縮方法において、
画素データのブロックを読取り、
画素のブロックを画素データのサブブロックに分割するためにブロックサイズ割当を生成し、
画素データのサブブロックを対応する周波数ドメイン表示に変換し、
周波数ドメイン表示をデータ流にスケールする動作を含み、スケール動作はイメージの品質に相関する品質計量値に基づいている圧縮方法。
[2]スケール動作は、周波数加重されたマスクを画素データの前記サブブロックに与える動作をさらに含み、それによって周波数加重されたマスクは人間の視覚系の感度が高いほうのイメージ部分へエンファシスを与え、人間の視覚系の感度が低いほうのイメージ部分へは少ないエンファシスを与える、[1]記載の方法。
[3]スケール動作は、イメージの品質に基づいて画素データのサブブロックを量子化する動作をさらに含んでいる、[1]記載の方法。
[4]品質計量は信号対雑音比である、[1]記載の方法。
[5]変換動作はディスクリートな余弦変換を行う、[1]記載の方法。
[6]変換動作はディスクリートな余弦変換とそれに後続する微分カッドツリー変換を行う、[1]記載の方法。
[7]スケール動作は、ブロック単位をベースとして、[5]記載の方法。
[8]スケール動作は、画素データのサブブロックのコントラストに基づいている、[7]記載の方法。
[9]スケール動作は、大きさにおいて予め定められたしきい値を超えるサブブロック内のAC係数の数に基づいている、[7]記載の方法。
[10]スケール動作は、サブブロックの平均二乗誤差に基づいている、[7]記載の方法。
[11]スケール動作は、フレーム単位をベースとしている、[5]記載の方法。
[12]スケール動作は、フレーム当りのブロックサイズ割当の数およびサイズに基づいている、[11]記載の方法。
[13]スケール動作は、先のフレームのスケール係数に基づいている、[11]記載の方法。
[14]生成する動作は、
画素データの前記ブロックの画素値の分散を決定し、
前記分散をしきい値と比較し、
比較動作の結果に基づいて前記ブロックを細分割する決定を行い、
前記決定が前記ブロックを細分割することであるならば、予め定められた基準が満たされるまで、決定、比較、および各サブブロックを生成する動作を反復し、
ブロックサイズ割当として、さらに細分割されない各ブロックまたはサブブロックを指示する動作をさらに含んでいる、[1]記載の方法。
[15]決定を行うステップは、分散がしきい値よりも大きい場合には、ブロックの細分割を要求する、[14]記載の方法。
[16]しきい値は予め決定されている、[15]記載の方法。
[17]しきい値は評価されるブロックまたはサブブロックの画素値の平均の関数である、[15]記載の方法。
[18]しきい値は細分割の各レベルに対して変化する、[15]記載の方法。
[19]決定、比較、および生成のステップがもはや反復されないように予め定められた基準が画素データの予め選択された最小ブロックサイズに基づいている、[14]記載の方法。
[20]係数データをデータ流にスケールする動作はさらに係数データのジグザグ走査を含んでいる、[1]記載の方法。
[21]ジグザグ走査の動作は8×8画素ブロックサイズを使用して行われる、[20]記載の方法。
[22]スケール動作は、送信を行うためにデータ流を直列化されたデータ流にコード化する動作をさらに含んでいる、[1]記載の方法。
[23]コード化動作は、ハフマンコード化を含んでいる、[22]記載の方法。
[24]ハフマンコード化はランレングスおよびゼロではない値をコード化するために多数の検索表を使用する、[23]記載の方法。
[25]3つの検索表が存在する、[24]記載の方法。
[26]生成動作はイメージの知覚特性に基づいている、[1]記載のシステム。
[27]画素データを圧縮する品質ベースのイメージ圧縮システムにおいて、
画素のブロックを画素データのサブブロックに分割するブロックサイズ割当手段と、
画素データのサブブロックを対応する周波数ドメイン表示に変換する変換手段と、
周波数ドメイン表示をデータ流にスケールするスケール手段とを具備し、スケール手段はイメージの品質に相関する品質計量に基づいているシステム。
[28]スケール手段は、画素データの前記サブブロックへの周波数加重されたマスク手段をさらに具備し、それによって周波数加重されたマスクは人間の視覚系の感度がより高いイメージ部分に対してはエンファシスを与え、人間の視覚系の感度がより低いイメージ部分へは少ないエンファシスを与える、[27]記載のシステム。
[29]スケール手段は、イメージの品質に基づいて画素データのサブブロックを量子化する量子化装置をさらに具備している、[27]記載のシステム。
[30]品質計量は、信号対雑音比である、[27]記載のシステム。
[31]変換手段は、ディスクリートな余弦変換を行う、[27]記載のシステム。
[32]変換手段はディスクリートな余弦変換とそれに後続する微分カッドツリー変換を行う、[27]記載のシステム。
[33]スケール手段は、ブロック単位をベースとしてデータをスケールする、[31]記載のシステム。
[34]スケール手段は、画素データのサブブロックのコントラストに基づいている、[33]記載のシステム。
[35]スケール手段は、大きさにおいて予め定められたしきい値を超えるサブブロック内のAC係数の数に基づいている、[33]記載のシステム。
[36]スケール手段は、サブブロックの平均二乗誤差に基づいている、[33]記載のシステム。
[37]スケール手段は、フレーム単位をベースとしている、[31]記載のシステム。
[38]スケール手段は、フレーム当りのブロックサイズ割当の数およびサイズに基づいている、[37]記載のシステム。
[39]スケール手段は、先のフレームのスケール係数に基づいている、[37]記載のシステム。
[40]ブロックサイズ割当手段は、画素データのブロックに対する画素値の分散を決定し、分散をしきい値と比較し、比較の結果に基づいてブロックを細分割するか否かの決定を行い、前記決定が前記ブロックを細分割することであるならば、予め定められた基準が満たされるまで、分散の決定、しきい値との比較、細分割されたブロックのそれぞれに対する細分割を行うか否かの決定を反復し、ブロックサイズ割当として、さらに細分割されない各ブロックまたはサブブロックを指示する、[27]記載のシステム。
[41]細分割の決定は分散がしきい値よりも大きい場合には、ブロックが細分割されることを要求する、[40]記載のシステム。
[42]しきい値は、予め定められている、[41]記載のシステム。
[43]しきい値は評価されるブロックまたはサブブロックの画素値の平均の関数である、[41]記載のシステム。
[44]しきい値は細分割の各レベルに対して変化する、[41]記載のシステム。
[45]もはや細分割しないように予め定められた基準は、画素データの予め選択された最小ブロックサイズに基づいている、[40]記載のシステム。
[46]スケールは、さらに係数データのジグザグスキャナを含んでいる、[27]記載のシステム。
[47]ジグザグスキャナはジグザグスキャナのための8×8画素ブロックサイズを使用する、[46]記載のシステム。
[48]スケール手段は、送信を行うためにデータ流を直列化されたデータ流にコード化するコーダをさらに具備している、[47]記載のシステム。
[49]コーダは、ハフマンコーダである、[48]記載のシステム。
[50]ハフマンコーダは、ランレングスおよびゼロではない値をコード化するために多数の検索表を使用する、[49]記載のシステム。
[51]3つの検索表が存在する、[50]記載のシステム。
[52]生成手段はイメージの知覚特性に基づいている、[27]記載のシステム。
[53]画素データを含むデジタルイメージの圧縮方法において、
画素データのブロックを読取り、
画素のブロックを画素データのサブブロックに分割するためにブロックサイズ割当を生成し、
画素データのサブブロックを対応する周波数ドメイン表示に変換し、
周波数ドメイン表示をデータ流にスケールする動作を含み、スケール動作はイメージの品質に相関する品質計量値に基づいており、スケール動作はさらに、周波数加重されたマスクを画素データの前記サブブロックに与える動作を含み、それによって周波数加重されたマスクは人間の視覚系の感度がより高いイメージ部分に対してエンファシスを与え、人間の視覚系の感度がより低いイメージ部分へは少ないエンファシスを与え、スケール動作はイメージの品質に基づいて画素データのサブブロックを量子化する動作をさらに含んでいる方法。
[54]品質計量値は信号対雑音比である、[53]記載の方法。
[55]変換動作は、ディスクリートな余弦変換を行う、[53]記載の方法。
[56]変換動作は、ディスクリートな余弦変換とそれに後続する差カッドツリー変換を行う、[53]記載の方法。
[57]スケール動作は、ブロック単位をベースとしている、[53]記載の方法。
[58]スケール動作は、画素データのサブブロックのコントラストに基づいている、[57]記載の方法。
[59]スケール動作は、大きさにおいて予め定められたしきい値を超えるサブブロック内のAC係数の数に基づいている、[57]記載の方法。
[60]スケール動作は、サブブロックの平均二乗誤差に基づいている、[57]記載の方法。
[61]スケール動作は、フレーム単位をベースとしている、[55]記載の方法。
[62]スケール動作は、フレーム当りのブロックサイズ割当の数およびサイズに基づいている、[61]記載の方法。
[63]スケール動作は、先のフレームのスケール係数に基づいている、[61]記載の方法。
[64]画素データを圧縮する品質ベースのイメージ圧縮システムにおいて、
画素のブロックを画素データのサブブロックに分割するブロックサイズ割当手段と、
画素データのサブブロックを対応する周波数ドメイン表示に変換する変換手段と、
周波数ドメイン表示をデータ流にスケールするスケール手段とを具備し、スケール手段はイメージの品質に相関する品質計量値に基づいており、スケール手段は、画素データの前記サブブロックへの周波数加重されたマスク手段をさらに具備し、それによって周波数加重されたマスクは人間の視覚系の感度がより高いイメージ部分へエンファシスを与え、人間の視覚系の感度がより低いイメージ部分へは少ないエンファシスを与え、スケール手段はイメージの品質に基づいて画素データのサブブロックを量子化する量子化装置をさらに具備しているシステム。
[65]品質計量値は、信号対雑音比である、[64]記載のシステム。
[66]変換手段は、ディスクリートな余弦変換を行う、[64]記載のシステム。
[67]変換手段は、ディスクリートな余弦変換とそれに後続する差カッドツリー変換を行う、[64]記載のシステム。
[68]スケール手段は、ブロック単位をベースとしてデータをスケールする、[67]記載のシステム。
[69]スケール手段は、画素データのサブブロックのコントラストに基づいている、[67]記載のシステム。
[70]スケール手段は、大きさにおいて予め定められたしきい値を超えるサブブロック内のAC係数の数に基づいている、[67]記載のシステム。
[71]スケール手段は、サブブロックの平均二乗誤差に基づいている、[67]記載のシステム。
[72]スケール手段は、フレーム単位をベースとしている、[67]記載のシステム。
[73]スケール手段は、フレーム当りのブロックサイズ割当の数およびサイズに基づいている、[70]記載のシステム。
【図面の簡単な説明】
【図1】 本発明の分散ベースのブロックサイズ割当システムおよび方法を実行する品質ベースのイメージ処理システムのエンコーダ部分のブロック図。
【図2】 本発明の分散ベースのブロックサイズ割当システムおよび方法を実行する品質ベースのイメージ処理システムのデコーダ部分のブロック図。
【図3】 分散ベースのブロックサイズ割当に含まれる処理ステップを示したフロー図。
【図4】 例示的なブロックサイズ割当、対応するカッドツリー分解、対応するPQRデータを示した図。
【図5】 量子化装置のスケール係数対画素レート当りの平均ビットの関係を示したグラフ。
【図6】 DCTブロックのAC係数カウントに基づいた量子化装置のスケール係数のフローチャート。
【図7】 レート歪みに基づいた量子化装置のスケール係数のフローチャート。
【図8】 図7のレート歪みに基づいた量子化装置のスケール係数に続くフローチャート。

Claims (21)

  1. 画素データを含むデジタルイメージの圧縮方法において、
    画素データのブロックを読取り、
    画素のブロックを画素データのサブブロックに分割するためにブロックサイズ割当を生成し、
    画素データのサブブロックを対応する周波数ドメイン表示に変換し、
    フレーム当りのブロックサイズ割当の数およびサイズに基づいてフレーム単位に周波数ドメイン表示をデータ流にスケールする動作を含み、スケール動作はデジタルイメージの視覚的品質に相関する品質計量値に基づいており
    前記変換の動作はディスクリートな余弦変換を行う、圧縮方法。
  2. スケール動作は、周波数加重されたマスクを画素データの前記サブブロックに与える動作をさらに含み、それによって周波数加重されたマスクは人間の視覚系の感度が高いほうのデジタルイメージ部分へエンファシスを与え、人間の視覚系の感度が低いほうのデジタルイメージ部分へは少ないエンファシスを与える請求項1記載の方法。
  3. スケール動作は、デジタルイメージの品質に基づいて画素データのサブブロックを量子化する動作をさらに含んでいる請求項1または2記載の方法。
  4. デジタルイメージの質は信号対雑音比を使用して測定される請求項1乃至3のいずれか1項記載の方法。
  5. 変換動作はディスクリートな余弦変換とそれに後続する微分カッドツリー変換を行う請求項1乃至のいずれか1項記載の方法。
  6. 生成する動作は、
    画素データの前記ブロックの画素値の分散を決定し、
    前記分散をしきい値と比較し、
    比較動作の結果に基づいて前記ブロックを細分割する決定を行い、
    前記決定が前記ブロックを細分割することであるならば、予め定められた基準が満たされるまで、分散の決定、比較、および各サブブロックに対して細分割する決定の動作を反復し、
    ブロックサイズ割当として、さらに細分割されない各ブロックまたはサブブロックを指示する動作をさらに含んでいる請求項1乃至のいずれか1項記載の方法。
  7. 細分割する決定を行うステップは、分散がしきい値よりも大きい場合には、ブロックの細分割を要求する請求項記載の方法。
  8. しきい値は、予め決定されているか、評価されるブロックまたはサブブロックの画素値の平均の関数であるか、および細分割の各レベルに対して変化するかのうちの少なくとも一つである請求項記載の方法。
  9. 分散の決定、比較、および細分割する決定のステップがもはや反復されないように予め定められた基準が画素データの予め選択された最小ブロックサイズに基づいている請求項または乃至のいずれか1項記載の方法。
  10. スケール動作は、送信を行うためにデータ流を直列化されたデータ流にコード化する動作をさらに含んでいる請求項1乃至のいずれか1項記載の方法。
  11. 生成動作はデジタルイメージの知覚特性に基づいている請求項1乃至10のいずれか1項記載の方法。
  12. 画素データを圧縮する品質ベースのイメージ圧縮システムにおいて、
    画素のブロックを画素データのサブブロックに分割するブロックサイズ割当手段と、
    画素データのサブブロックを対応する周波数ドメイン表示に変換する変換手段と、
    フレーム当りのブロックサイズ割当の数およびサイズに基づいてフレーム単位に周波数ドメイン表示をデータ流にスケールするスケール手段とを具備し、スケール手段はイメージの視覚的品質に相関する品質計量に基づいており、
    前記変換手段は、ディスクリートな余弦変換を行う、システム。
  13. スケール手段は、画素データの前記サブブロックへの周波数加重されたマスク手段をさらに具備し、それによって周波数加重されたマスクは人間の視覚系の感度がより高いイメージ部分に対してはエンファシスを与え、人間の視覚系の感度がより低いイメージ部分へは少ないエンファシスを与える請求項12記載のシステム。
  14. イメージの質は、信号対雑音比を使用して測定される請求項12または13記載のシステム。
  15. 変換手段はディスクリートな余弦変換およびそれに後続する微分カッドツリー変換を行う請求項12乃至14のいずれか1項記載のシステム。
  16. ブロックサイズ割当手段は、画素データのブロックに対する画素値の分散を決定し、分散をしきい値と比較し、比較の結果に基づいてブロックを細分割するか否かの決定を行うように構成され、前記決定が前記ブロックを細分割することであるならば、予め定められた基準が満たされるまで、分散の決定、しきい値との比較、細分割されたブロックのそれぞれに対する細分割を行うか否かの決定を反復し、ブロックサイズ割当として、さらに細分割されない各ブロックまたはサブブロックを指示する請求項12乃至15のいずれか1項記載のシステム。
  17. 細分割の決定は分散がしきい値よりも大きい場合には、ブロックが細分割されることを要求する請求項16記載のシステム。
  18. しきい値は、予め定められているか、評価されるブロックまたはサブブロックの画素値の平均の関数であるか、および細分割の各レベルに対して変化するかのうちの少なくとも一つである請求項17記載のシステム。
  19. もはや細分割しないように予め定められた基準は、画素データの予め選択された最小ブロックサイズに基づいている請求項16乃至18のいずれか1項記載のシステム。
  20. スケール手段は、送信を行うためにデータ流を直列化されたデータ流にコード化するコーダをさらに具備している請求項12乃至19のいずれか1項記載のシステム。
  21. スケール手段はイメージの知覚特性に基づいている請求項12乃至20のいずれか1項記載のシステム。
JP2001554626A 2000-01-28 2001-01-26 品質ベースのイメージ圧縮 Expired - Lifetime JP5107495B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/494,192 2000-01-28
US09/494,192 US6600836B1 (en) 2000-01-28 2000-01-28 Quality based image compression
PCT/US2001/002751 WO2001056298A1 (en) 2000-01-28 2001-01-26 Quality based image compression

Publications (2)

Publication Number Publication Date
JP2003521178A JP2003521178A (ja) 2003-07-08
JP5107495B2 true JP5107495B2 (ja) 2012-12-26

Family

ID=23963428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001554626A Expired - Lifetime JP5107495B2 (ja) 2000-01-28 2001-01-26 品質ベースのイメージ圧縮

Country Status (15)

Country Link
US (3) US6600836B1 (ja)
EP (1) EP1252773A1 (ja)
JP (1) JP5107495B2 (ja)
KR (1) KR100788220B1 (ja)
CN (2) CN101018336B (ja)
AR (2) AR029032A1 (ja)
AU (1) AU784084B2 (ja)
CA (1) CA2398386C (ja)
HK (1) HK1053213A1 (ja)
MX (1) MXPA02007274A (ja)
MY (2) MY141154A (ja)
NZ (1) NZ520291A (ja)
TW (1) TW517501B (ja)
WO (1) WO2001056298A1 (ja)
ZA (1) ZA200205897B (ja)

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60043778D1 (de) 1999-07-20 2010-03-18 Qualcomm Inc Verfahren zur bestimmung einer funksignalveränderung und benützung dieser information zur verbesserutionierungssignalen
DE10022331A1 (de) * 2000-05-10 2001-11-15 Bosch Gmbh Robert Verfahren zur Transformationscodierung von Bewegtbildsequenzen
US7168074B1 (en) * 2000-09-29 2007-01-23 Intel Corporation Runtime prediction framework for CPU intensive applications
US6870963B2 (en) * 2001-06-15 2005-03-22 Qualcomm, Inc. Configurable pattern optimizer
US6735254B2 (en) * 2001-06-29 2004-05-11 Qualcomm, Inc. DCT compression using Golomb-Rice coding
US7483581B2 (en) 2001-07-02 2009-01-27 Qualcomm Incorporated Apparatus and method for encoding digital image data in a lossless manner
US7058677B1 (en) * 2001-07-17 2006-06-06 Vixs, Inc. Method and apparatus for selectible quantization in an encoder
US7630563B2 (en) * 2001-07-19 2009-12-08 Qualcomm Incorporated System and method for decoding digital image and audio data in a lossless manner
US20030053637A1 (en) * 2001-09-14 2003-03-20 Michael Rodemer Audio distributor
AU2002343135A1 (en) * 2001-11-21 2003-06-10 Koninklijke Philips Electronics N.V. Improved bit plane compression method
US7280700B2 (en) * 2002-07-05 2007-10-09 Microsoft Corporation Optimization techniques for data compression
US7856149B2 (en) * 2002-07-29 2010-12-21 Qualcomm Incorporated Digital image encoding
US6975773B1 (en) * 2002-07-30 2005-12-13 Qualcomm, Incorporated Parameter selection in data compression and decompression
FR2846835B1 (fr) * 2002-11-05 2005-04-15 Canon Kk Codage de donnees numeriques combinant plusieurs modes de codage
US7177441B2 (en) * 2002-12-09 2007-02-13 International Business Machines Corporation System and method for secret communication
CN1757237A (zh) * 2003-03-03 2006-04-05 皇家飞利浦电子股份有限公司 视频编码
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
US7697608B2 (en) * 2004-02-03 2010-04-13 Sony Corporation Scalable MPEG video/macro block rate control
US8116374B2 (en) 2004-05-07 2012-02-14 Broadcom Corporation Method and system for generating a transform size syntax element for video decoding
US7801383B2 (en) * 2004-05-15 2010-09-21 Microsoft Corporation Embedded scalar quantizers with arbitrary dead-zone ratios
US20060008167A1 (en) * 2004-07-06 2006-01-12 Qing Yu Digital camera having picture quality setting
JP5074924B2 (ja) * 2004-09-16 2012-11-14 トムソン ライセンシング インタフレームのための高速モード決定方法及び装置
US8780957B2 (en) * 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
US7995656B2 (en) * 2005-03-10 2011-08-09 Qualcomm Incorporated Scalable video coding with two layer encoding and single layer decoding
AR052601A1 (es) * 2005-03-10 2007-03-21 Qualcomm Inc Clasificacion de contenido para procesamiento de multimedia
US7567722B2 (en) * 2005-03-22 2009-07-28 Qualcomm Incorporated Dynamically scaled file encoding
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
EP2720467B1 (en) 2005-09-26 2017-03-29 Mitsubishi Electric Corporation Moving image decoding apparatus
US8879856B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US20070206117A1 (en) * 2005-10-17 2007-09-06 Qualcomm Incorporated Motion and apparatus for spatio-temporal deinterlacing aided by motion compensation for field-based video
US8948260B2 (en) * 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US8654848B2 (en) 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US20070171280A1 (en) * 2005-10-24 2007-07-26 Qualcomm Incorporated Inverse telecine algorithm based on state machine
US7912123B2 (en) 2006-03-01 2011-03-22 Streaming Networks (Pvt.) Ltd Method and system for providing low cost robust operational control of video encoders
US9131164B2 (en) * 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
US8130828B2 (en) * 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US7974340B2 (en) 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US20070237237A1 (en) * 2006-04-07 2007-10-11 Microsoft Corporation Gradient slope detection for video compression
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
KR101345294B1 (ko) * 2006-08-09 2013-12-27 삼성전자주식회사 영상의 양자화 장치 및 방법
US8374295B2 (en) * 2006-09-18 2013-02-12 Mediatek Inc. Method of scaling input data and mobile device utilizing the same
JP4274234B2 (ja) * 2006-12-04 2009-06-03 ソニー株式会社 圧縮データ量制御方法及び画像データ圧縮装置
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) * 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
DE102008030212A1 (de) * 2007-10-18 2009-04-23 Stego-Holding Gmbh Heizvorrichtung und Wärmetauscher
US8189933B2 (en) 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US8325796B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video coding using adaptive segmentation
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) * 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
CN101510950B (zh) * 2008-10-10 2011-05-18 慧帝科技(深圳)有限公司 一种影像处理装置和方法
JP5208043B2 (ja) * 2009-04-16 2013-06-12 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US9083986B2 (en) * 2009-05-01 2015-07-14 Broadcom Corporation Method and system for adaptive rate video compression and transmission
KR101624649B1 (ko) * 2009-08-14 2016-05-26 삼성전자주식회사 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
SG10202001623RA (en) 2010-04-09 2020-04-29 Mitsubishi Electric Corp Moving image encoding device and moving image decoding device
US20110289128A1 (en) * 2010-05-24 2011-11-24 Chih-Ta Star Sung Method of performing discrete cosine transform
JP5479225B2 (ja) * 2010-05-27 2014-04-23 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US8488890B1 (en) * 2010-06-11 2013-07-16 Nvidia Corporation Partial coverage layers for color compression
US9172960B1 (en) * 2010-09-23 2015-10-27 Qualcomm Technologies, Inc. Quantization based on statistics and threshold of luminanceand chrominance
KR101483179B1 (ko) * 2010-10-06 2015-01-19 에스케이 텔레콤주식회사 주파수 마스크 테이블을 이용한 주파수변환 블록 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
HUE059647T2 (hu) 2011-01-13 2022-12-28 Canon Kk Képkódoló berendezés, képkódoló eljárás, képdekódoló berendezés, képdekódoló eljárás, és program
US9154799B2 (en) 2011-04-07 2015-10-06 Google Inc. Encoding and decoding motion via image segmentation
CN103548350B (zh) * 2011-06-28 2017-03-01 日本电气株式会社 图像编码设备和图像解码设备
US10091513B2 (en) 2011-09-29 2018-10-02 Texas Instruments Incorporated Perceptual three-dimensional (3D) video coding based on depth information
US9262670B2 (en) 2012-02-10 2016-02-16 Google Inc. Adaptive region of interest
US8848261B1 (en) * 2012-02-15 2014-09-30 Marvell International Ltd. Method and apparatus for using data compression techniques to increase a speed at which documents are scanned through a scanning device
CN103313046B (zh) * 2012-03-06 2019-06-14 中兴通讯股份有限公司 一种残差的表示方法和熵编码输入装置
CN102724381B (zh) * 2012-06-15 2014-04-02 杭州电子科技大学 基于jpeg压缩原理的票据类图像压缩方法
TW201419865A (zh) * 2012-11-13 2014-05-16 Hon Hai Prec Ind Co Ltd 影像切割系統及方法
JP2014116733A (ja) * 2012-12-07 2014-06-26 Canon Inc 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
IN2013MU01146A (ja) * 2013-03-26 2015-04-24 Tektronix Inc
KR102064889B1 (ko) 2013-10-22 2020-01-10 삼성전자 주식회사 데이터 압축 레벨을 최적화하는 harq 신호 처리 장치 및 그 처리 방법
JP6221704B2 (ja) * 2013-12-05 2017-11-01 Nttエレクトロニクス株式会社 符号化装置及びブロックサイズ選択方法
CN103745443B (zh) * 2014-01-10 2017-06-13 北京优纳科技有限公司 提高图像质量的方法和设备
US9392272B1 (en) 2014-06-02 2016-07-12 Google Inc. Video coding using adaptive source variance based partitioning
US9578324B1 (en) 2014-06-27 2017-02-21 Google Inc. Video coding using statistical-based spatially differentiated partitioning
US9311342B1 (en) * 2015-02-09 2016-04-12 Sony Corporation Tree based image storage system
WO2016187529A1 (en) * 2015-05-20 2016-11-24 Paul Rad Systems and methods for secure file transmission and cloud storage
CN106297610B (zh) 2015-06-05 2020-03-17 北京智谷睿拓技术服务有限公司 显示控制方法和装置
CN106291953B (zh) 2015-06-05 2019-01-08 北京智谷睿拓技术服务有限公司 显示控制方法和装置
CN106297611B (zh) 2015-06-05 2021-08-10 北京智谷睿拓技术服务有限公司 显示控制方法和装置
WO2018008678A1 (ja) * 2016-07-08 2018-01-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 復号装置、符号化装置、復号方法及び符号化方法
CN107645662B (zh) * 2017-10-19 2020-06-12 电子科技大学 一种彩色图像压缩方法
EP3732881A1 (en) * 2018-02-17 2020-11-04 Google LLC Image compression and decompression using controlled quality loss
CN110659379B (zh) * 2019-09-24 2023-05-23 中南林业科技大学 一种基于深度卷积网络特征的可搜索加密图像检索方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5038389A (en) * 1987-06-25 1991-08-06 Nec Corporation Encoding of a picture signal in consideration of contrast in each picture and decoding corresponding to the encoding
JP2507104B2 (ja) * 1989-12-21 1996-06-12 松下電器産業株式会社 画像デ―タ圧縮装置
US5107345A (en) 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
US5113256A (en) 1991-02-08 1992-05-12 Zenith Electronics Corporation Method of perceptually modeling a video image signal
ATE159396T1 (de) * 1991-06-04 1997-11-15 Qualcomm Inc System zur adaptiven kompression der blockgrössen eines bildes
US5452101A (en) * 1991-10-24 1995-09-19 Intel Corporation Apparatus and method for decoding fixed and variable length encoded data
US5231484A (en) 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
JP3360844B2 (ja) * 1992-02-04 2003-01-07 ソニー株式会社 ディジタル画像信号の伝送装置およびフレーム化方法
EP0630544B1 (de) 1992-03-09 1997-05-21 Siemens Aktiengesellschaft Verfahren zur bildadaptiven regelung der länge eines quantisierungsintervalls bei der bilddatenreduktion
JP3093458B2 (ja) * 1992-07-23 2000-10-03 株式会社東芝 可変レート符・復号化装置
JPH06188742A (ja) * 1992-12-22 1994-07-08 Mitsubishi Electric Corp 変換符号化/復号化装置
JP2882287B2 (ja) * 1994-08-22 1999-04-12 日本電気株式会社 動画像符号化装置
US5629780A (en) 1994-12-19 1997-05-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error
JPH08205140A (ja) * 1995-01-31 1996-08-09 Canon Inc 画像圧縮装置
CN1157080A (zh) * 1995-04-25 1997-08-13 菲利浦电子有限公司 用于编码视频图像的装置和方法
JP3651706B2 (ja) * 1995-10-27 2005-05-25 株式会社東芝 動画像符号化装置

Also Published As

Publication number Publication date
EP1252773A1 (en) 2002-10-30
CN1419787A (zh) 2003-05-21
CN101018336B (zh) 2012-04-04
AR058948A2 (es) 2008-03-05
CA2398386A1 (en) 2001-08-02
ZA200205897B (en) 2003-11-05
US20070071335A1 (en) 2007-03-29
NZ520291A (en) 2004-06-25
MXPA02007274A (es) 2003-02-12
KR20030005171A (ko) 2003-01-17
CN1303820C (zh) 2007-03-07
AU3460701A (en) 2001-08-07
WO2001056298A1 (en) 2001-08-02
HK1053213A1 (en) 2003-10-10
JP2003521178A (ja) 2003-07-08
US6600836B1 (en) 2003-07-29
US7460723B2 (en) 2008-12-02
TW517501B (en) 2003-01-11
CA2398386C (en) 2012-02-28
CN101018336A (zh) 2007-08-15
MY127241A (en) 2006-11-30
AU784084B2 (en) 2006-02-02
AR029032A1 (es) 2003-06-04
US7136534B2 (en) 2006-11-14
KR100788220B1 (ko) 2007-12-26
US20030202707A1 (en) 2003-10-30
MY141154A (en) 2010-03-15

Similar Documents

Publication Publication Date Title
JP5107495B2 (ja) 品質ベースのイメージ圧縮
JP5384696B2 (ja) 分散に基づいた適応性ブロックサイズdct画像圧縮
KR100932412B1 (ko) 구성가능한 패턴 옵티마이저
JP4870743B2 (ja) デジタルイメージに対する選択的なクロミナンスデシメーション
AU2002315160A1 (en) Configurable pattern optimizer
JP2004528791A (ja) インターフレーム符号化方法および装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100803

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110222

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110315

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110715

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110725

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20111007

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121004

R150 Certificate of patent or registration of utility model

Ref document number: 5107495

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151012

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term