JP2014521273A - 画像を符号化する方法および装置 - Google Patents

画像を符号化する方法および装置 Download PDF

Info

Publication number
JP2014521273A
JP2014521273A JP2014520740A JP2014520740A JP2014521273A JP 2014521273 A JP2014521273 A JP 2014521273A JP 2014520740 A JP2014520740 A JP 2014520740A JP 2014520740 A JP2014520740 A JP 2014520740A JP 2014521273 A JP2014521273 A JP 2014521273A
Authority
JP
Japan
Prior art keywords
mantissa
component
exponent
image
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014520740A
Other languages
English (en)
Inventor
ビア−ギンゴールド、シュローモ
ニーマン、オファー
ザルビンスキー、マイケル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NXP USA Inc
Original Assignee
NXP USA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NXP USA Inc filed Critical NXP USA Inc
Publication of JP2014521273A publication Critical patent/JP2014521273A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

画像を処理する方法であって、前記方法は、画像を取り出すこと(200)と、画像を一連の構成要素として符号化すること(202)と、各構成要素ごとに指数を導出することと、仮数を導出することであって、各構成要素の少なくとも近似は指数および仮数から導出されることができ、かつ各指数はその付随する仮数におけるビット数を示す、導出することと、少なくとも指数を圧縮すること(308、206)と、指数および仮数をメモリに記憶すること(316)と、を備える方法を提供する。さらに、画像を処理するための装置も提供される。

Description

本発明は、画像を符号化する方法および装置に関する。
近年、テレビ、コンピュータ、および映像を提供し得る他のデバイスにおいて高解像度映像の要求が高まっており、この要求は携帯デバイス市場にも及んでいる。比較的高精細のスクリーンが、タブレット、パーソナルコンピュータ、およびスマートフォンなどの最新の携帯マルチメディアデバイスにおいてより普及しているため、高解像度の映像品質が重要な競合差別化要因になっている。
映像品質の向上に伴い、より滑らかな映像、改良された色、サイズ変更、圧縮、または他の画像処理から生じる不自然さが少なくなる、および様々な他の利点がもたらされる。これらの利点は、視認され得る細部における単なる向上を超える方法でユーザ体験を向上させる。
運動補正フレームレート変換または立体映像処理などの最新映像処理アルゴリズムは、各映像フレームデータの外部システムメモリからの多重読み込み/外部システムメモリへの多重書き込みを必要とする。携帯マルチメディアデバイスの高解像度映像、特に高品質高解像度映像に対するメモリアクセス総負荷は、容易に受け入れ難いほど高くなり得る。
メモリシステムの負荷を削減するために、ウェーブレット多重解像度処理などの無損失(または、ほぼ無損失)フレームバッファ圧縮が頻繁に使用される。しかしながら、この手法にはいくつかの欠点がある。
とりわけ、h.264などの復号および符号化のスキームで使用される圧縮方法は、ウェーブレット多重解像度処理に対して最適化されているとは限らない。
一方、多重解像度処理での使用に適した圧縮方法は、許容できないほど高いメモリ使用量を必要とすることが多く、符号化されるフレームを通じていくつかの読み込みパスを使用するため、フレーム全体をメモリに記憶する必要がある。さらに、複数のパスにより高いレイテンシが生じるため、リアルタイムでの用途において望ましくない。さらに、これらの方法は多くの映像ストリームセンサでの使用に適しておらず、これはオンザフライでデータを取り込み、より小さいバッファに記憶するため、バッファは1ラインまたは1ブロックの画素のみを含むことができる。さらに、これらの方法は複雑なシステムおよび多くの作動電力を必要とする。
一方法は、群指数および個々の仮数を導出することによって群におけるウェーブレット多重解像度処理の構成要素を符号化することであり、各構成要素の近似は構成要素の仮数と結合される群指数から導出され得る。しかしながら、これは映像品質の低下を招くため、望ましくない解決法である。
本発明のさらなる詳細、態様、および実施形態を、例としてのみ、図面を参照して記載する。図面において、同様の参照符号は同様のまたは機能的に類似の要素を特定するために使用される。図面内の要素は簡潔かつ明瞭にするために示されており、必ずしも原寸に比例するようには描かれていない。
概略的なマルチメディアデバイスの一例。 例示的な画像圧縮方法のフロー図。 例示的な画像圧縮方法のフロー図。 ウェーブレット符号化の一例。 ゼロ化の一例。 指数および仮数を導出する処理の一例。 異なる圧縮程度に応じて圧縮された画像。 例示的な構成要素、指数、および仮数を示す表。 逆離散波形変換の処理を示す図。
本発明は、添付の特許請求の範囲に記載されるように、画像を符号化する方法および装置を提供する。
本発明の具体的な実施形態は従属請求項に記載されている。
本発明のこれらの態様および他の態様は、以下に記載される実施形態から明らかとなり、それらを参照することによって明瞭になるであろう。
本発明の例示されている実施形態は、大部分について、当業者に既知の電子構成要素および回路を使用して実装され得るため、本発明の基礎となる概念の理解および評価のために、ならびに本発明の教示を分かりにくくせず当該教示から注意を逸らさせないために、詳細は必要と考えられる範囲を超えては説明されない。
図1は、メモリインタフェースユニット102、離散波形変換(DWT)ユニット104、逆離散波形変換(IDWT)ユニット106、エントロピー符号器108、およびエントロピー復号器110を備える画像処理デバイス100などのマルチメディアデバイスの一例を概略的に示す。使用中、DWTユニット104およびエントロピー符号器108は共に動作し、圧縮画像を符号化するためにメモリインタフェースユニット102を通じてメモリがアクセスされる。同様に、IDWTユニット106およびエントロピー復号器110は共に動作し、圧縮画像を復号するようにメモリインタフェースユニット102を通じてメモリがアクセスされる。
図2は、画像処理デバイス100での画像を圧縮する方法の概略を示すフロー図である。図2に応じた方法において、画像処理デバイスには、メモリインタフェースユニット102を通じて、原画像200または入力フレームが提供されてもよい。原画像200はシステムメモリから、他の記憶デバイスから、またはカメラなどのセンサからもたらされてもよい。原画像200は、完成画像あるいはその一部、またはより大きい画像から取り出された符号化ブロックであってもよい。画像の一部または符号化ブロックを符号化することにより、符号化処理に必要なメモリ量が削減される。
メモリインタフェースユニット102は原画像200をDWTユニット104へ渡し、DWTユニットにおいてウェーブレット変換202がなされる。変換済み画像の統計値は、符号化処理の後段において使用されるために統計値収集ユニット208によって算出されてもよい。その後、変換済み画像は量子化204およびエントロピー符号化206を経て、出力符号化フレーム210が生成される。
図3は、図2の方法をさらに詳細に示す。図3の第1の部分において、原画像200は取り出されてDWTユニット104へ渡され、図2に示されるようにウェーブレット変換202を使用して符号化されてもよい。
図4は、図3に示されるようなウェーブレット変換を示す。原画像200は、Y部分、Cb部分、およびCr部分に分類されてもよく、各部分はハイパスフィルタを施され、ここでは3つの変換済み画像400、402、404として表される一連の構成要素を生成してもよい。
構成要素は次の式により導出されてもよい。
LL(p,q),=LL(p,q)+LL(p+1,q)+LL(p,q+1)+LL(p+1,q+1)
LH(p,q),=LL(p,q)+LL(p+1,q)−LL(p,q+1)−LL(p+1,q+1)
HL(p,q),=LL(p,q)−LL(p+1,q)+LL(p,q+1)−LL(p+1,q+1)
HH(p,q),=LL(p,q)−LL(p+1,q)−LL(p,q+1)+LL(p+1,q+1)
ここで、
=0,2,4,・・・,p−1,p
=0,2,4,・・・,q−1,q
p=原画像の幅
q=原画像の高さ
=p/2;q=q/2
LL(p,q)=原画像における(p,q)の画素値
LL,LH,HL,HH−第1の分類段階の出力構成要素
画素構成要素の入力解像度が8ビットである場合、LL,LH,HL,HHは構成要素ごとに10ビットの解像度を有してもよい。
図4において、第1の変換済み画像400は、横方向(x軸に沿う方向)の高周波輝度変化を示す。第2の変換済み画像402は、縦方向(y軸に沿う方向)の高周波輝度変化を示す。第3の変換済み画像404は、斜め方向(式x=yにより規定される線に沿う方向)の高周波輝度変化を示す。3つの変換済み画像を、それぞれHL(高−低)画像、LH(低−高)画像、およびHH(高−高)画像と称す。その後、原画像は、ローパスフィルタを施されおよび縮小され、原画像のより小さい近似、LL(つまり、低−低)画像、または第1の近似済み画像406を生成してもよい。ウェーブレット変換は繰り返し適用されてもよいため、第1の近似済み画像406はウェーブレット変換され、第1の近似済み画像406よりさらに小さい第2の近似済み画像414とともに、第4の変換済み画像、第5の変換済み画像、および第6の変換済み画像408、410、412を生成してもよく、これらの画像は第1の近似済み画像406から導出される追加的な一連のHL画像、LH画像、およびHH画像である。
さらに、第2の近似済み画像414はウェーブレット変換され、第2の近似済み画像414より小さい第3の近似済み画像422とともに、第7の変換済み画像、第8の変換済み画像、および第9の変換済み画像416、418、420を生成してもよく、これらの画像は追加的な一連のHL画像、LH画像、およびHH画像である。
このようにして、第1段階、すなわち最下位段階に第1の変換済み画像、第2の変換済み画像、および第3の変換済み画像400、402、404、第2段階に第4の画像、第5の画像、第6の画像408、410、412、第3段階に第7の変換済み画像、第8の変換済み画像、第9の変換済み画像416、418、420などを伴う、画像のピラミッド構造が形成されてもよい。
ウェーブレット係数の算出は、元のビット値と比較して結果のビット数を増加させる。各ウェーブレット段階において、増分ビット数が追加される。例えば、2ビットはハールフィルタに適していてもよい。圧縮が無損失である場合、追加ビットはすべて維持されなければならず、ピラミッド構造の段階は12ビットから14ビット、16ビットなどへ増大してもよい。以下に記載されるように、非可逆圧縮では、追加ビットは後の構成要素の量子化中に切り捨てられてもよい。
図4は3度行われて最終的な近似済み画像422を生成するウェーブレット変換を示すのみであるが、ウェーブレット変換の処理は所望の回数だけ繰り返されてもよい。一般的に、変換の繰り返しが多いほど画像の圧縮が高まるため、記憶に必要なメモリは減少するが、画像の符号化および復号に必要な時間およびハードウェアの複雑性が増す。一部の用途では、1つまたは2つの段階のみにおける圧縮を適用するのが適当であろう。しかしながら、技術的には、例えば6つあるいは7つの段階、またはそれ以上であってもよい。
したがって、変換は多数の中間構成要素426を通じて記憶可能構成要素424を提供する。
所望の段階の変換に到達すると、最終的な近似済み画像422が記憶されてもよい。その後、変換済み画像(400、402、404、408、410、412、416、418、および420)は、記憶されるために処理され、およびエントロピー符号化されてもよい。
図3に戻ると、次にLH画像、HL画像、およびHH画像(例えば、第1の画像、第2の画像、および第3の画像400、402、404)の構成要素が量子化204される。ユーザの必要性に応じて、量子化は様々な方法で行われてもよい。最初に、構成要素が可変ビットレート符号化されてもよい(300)。可変ビットレート符号化が使用される場合に、より高いビットレートが、第7の変換済み画像、第8の変換済み画像、および第9の変換済み画像416、418、420など、変換済み画像ピラミッド構造のより高い段階に対して使用されてもよい。符号化処理および復号処理中、構成要素のピラミッド構造の最高段階からの変化は復号処理の全段階に影響を及ぼし、各変換に伴ってこの影響が大きくなるため、結果としてピラミッド構造の最下位段階の構成要素の変化よりも多大な影響を復号済み画像の最終的な外観に与える。
構成要素は、各構成要素を記憶するために使用されるビット数を削減することによって、さらに切捨て(クリップ)されてもよい(301)。例えば、各構成要素は最も近い8ビット近似数に削減されてもよい。ビット数は異なっていてもよく、さらにより高いビットレートが変換済み画像ピラミッド構造のより高い段階で使用されてもよい。
さらに、構成要素はゼロ化されてもよい(302)。図5は構成要素500のゼロ化の処理を示しており、これによって値の低い構成要素は0に削減されて、量子化構成要素502を生成してもよい。換言すれば、量子化は、xより小さく−xより大きい値を有する任意の構成要素をゼロ値を有する構成要素に置き換えることを備えてもよく、ここでxは正の実数である。可変ビットレート符号化は無損失またはほぼ無損失でもよい一方で、ゼロ化は必然的に情報の損失をもたらす。
図3に戻ると、構成要素は量子化された後、ランレングス符号化(RLE)されてもよく(303)、これによって一連の構成要素は、値xがn個のストリングをx|nの形式で記憶することによって符号化されてもよく、つまり、ストリング
1,1,1,0,0,3,4,5,6,0,0,0,0,0,0,0,0,0,3,7,0,1,1,0,0,0,0,1,1,1
は、次のようになる。
1|3,0|2,3|1,4|1,5|1,6|1,0|9,3|1,7|1,0|1,1|2,0|4,1|3
この例はランレングス符号化の修正された形式、すなわちゼロランレングス符号化を使用してもよく、これによって数字0の連続のみが符号化されてもよく、つまり、ストリング
1,1,1,0,0,3,4,5,6,0,0,0,0,0,0,0,0,0,3,7,0,1,1,0,0,0,0,1,1,1
は、次のようになる。
1,1,1,0|2,3,4,5,6,0|9,3,7,0|1,1,1,0|4,1,1,1
ゼロ化は構成要素におけるゼロの数を増加させるため、ゼロ化された量子化構成要素についてゼロランレングス符号化を使用すると特に有用である。
前フレームまたは符号化ブロックの統計値は、より高い段階のゼロ化または非線形量子化を提供するために使用されてもよい。
量子化およびゼロランレングス符号化が完了すると、量子化構成要素はさらに符号化されて各構成要素ごとに指数および仮数を生成してもよい(304)。
各構成要素の指数は次式により決定されてもよい。
E=ceil(log((abs(C))+1)) (1)
ここで、Eは指数であり、Cは構成要素であり、abs()は入力の絶対値をとる関数であり、ceil()は入力を次に最も大きな整数にマッピングを行う関数である。
各構成要素の仮数は次式により決定されてもよい。
C>0の場合、M=C (2)
C<0の場合、M=C−1+2 (3)
ここで、Mは仮数の値である。C=0の場合、Mは定義されず、仮数は生成されない。
仮数は2進数mとして記憶されてもよい。mにおける桁数は、本質的に指数の値と同一である。
図6は4つの構成要素600、およびそれらの要素から導かれる指数602および仮数604を示す。確認できるように、C=14の場合、10進法でE=4(式1による)およびM=14(式2による)である。2進法で、仮数m=1110であり、Eの値と同一の桁数を有する。
C=−7の場合、10進法でE=3(式1による)およびM=0(式2による)である。2進法で、mはゼロ値を有するが、E=3であるため、mはm=000のように同一の数値3桁によって表される。
対照的な例を提供すると、C=−6の場合、10進法でE=3およびM=1である。したがって、2進法で仮数はm=001である。
図5に示すように、C=1の場合、E=1およびm=1である。
C=0の場合、E=0であり、上述したように仮数は存在しない。
図3に戻ると、指数および仮数の値が算出されると、値はそれぞれ指数および仮数に分離されて(306)、さらに個別に符号化されてもよい。
記憶される情報の大きさをさらに削減するために、仮数はさらに切捨てされてもよい(310)。切捨て中、所定のビット数より大きい任意の仮数は、復号中に最も近い結果をもたらすmの値に削減されてもよい。仮数mは、所定の5ビット長もしくは4ビット長、または任意の他の好ましい長さに切捨てられてもよい。仮数mが切捨てられる場合において、指数Eも結果として変化し、mの長さの変化を反映してもよい。
切捨て処理は仮数の全体の大きさを削減し、かつさまざまなEの値を削減するため、Eの値のその後の群符号化によって達成される圧縮率を一般的に向上させる。
切捨ての程度は、映像品質と圧縮率との間の妥協点に達するように制御されてもよい。図7は、4ビット切捨て700(これによって、4ビットより長い値のmすべてが4ビットに切捨てられる)によって符号化され、その後復号される場合の画像の品質と、5ビット切捨て702によって符号化および復号される場合との同一画像の品質の違いを示す。
このように、図3の方法によりレート歪み制御が可能となり、その歪み程度は切捨ての程度を調整することによって制御されてもよい。
図3に戻ると、指数はゼロランレングス符号化されてもよい(308)。さらに、この例において、ランレングス符号化の修正された形式が使用されてもよく、それにより数字0の連続のみが符号化される。指数がゼロランレングス符号化されると、指数はさらにエントロピー符号化されてもよい。
指数のエントロピー符号化には、例えばハフマン符号化206を備えてもよい。これは2つの方法によって行われてもよい。第1の方法は、図2に示されるように、リアルタイム辞書統計値312を使用して収集する方法であり、これによって指数は分析208されてもよく、符号化されるときに使用するための効率的な辞書が導出される。統計値算出は以前に符号化された画像からリアルタイムで行われてもよく、それにより以前の画像の統計値が現在の画像を符号化するために使用される。結果として生じる関数は、現在のフレーム指数に対するハフマン辞書の算出に使用されてもよい。この手法は一般的に高い圧縮率をもたらすが、時間がかかりハードウェアリソースを使用する一方で、導出された辞書が後の復号における使用のために記憶される必要がある。代替的に、ハフマン符号化は所定の辞書314でなされてもよい。所定の辞書は、例えば画像ライブラリの統計値分析から導出されてもよい。導出された辞書よりも所定の辞書を使用するほうが早いが、低い程度の圧縮をもたらし得る。
所定の辞書が使用される場合、画像の統計値は一般的に、部分的に符号化されるピラミッド構造の段階に応じる所定の関数によって見積もられる。
図8は異なる構成要素値ごとに例示的な指数および仮数を示す表であり、上述した方法に応じて算出される。
指数および仮数が適切に符号化および圧縮されると、パッキングが行われ(316)、メモリインタフェースユニット102へ送られ記憶されてもよい。原画像200に関連するすべての構成要素は、単一のデータパケットに記憶されてもよい。代替的に、ルマデータパケットおよびクロマデータパケットが個別に記憶されてもよい。
上述された方法の変形も可能である。例えば、指数および仮数が導出される前に、構成要素は量子化またはゼロランレングス符号化される必要はない。
必要な場合、記憶データは取り出されてもよく、原画像の近似が少なくともエントロピー復号器110およびIDWTユニット106によって復号されてもよい。図9は、IDWTユニット106によって行われるような、逆離散波形変換の処理を示す。この処理中、LH構成要素、HL構成要素、およびHH構成要素は繰り返しLL構成要素と結合されて段階的に原画像200を再現してもよい。
標準テスト画像を使用する実際の用途において、上述された圧縮技術は使用する処理の選択に応じて1.5〜7.7のいずれかの圧縮率を提供しており、画像が復号される場合、すべて良好な結果をもたらしている。
上述された方法およびデバイスは、映像フレームバッファのウェーブレット多重解像度圧縮に適しており、アダマールウェーブレット変換に最適化されてもよい。本方法がどのように使用されるかに応じて、ほぼ無損失の圧縮が高い圧縮率を伴って達成されてもよい。本方法は、特にリアルタイムで処理されなければならないライブフィードに基づく映像処理などのリアルタイム用途に適しており、高品質の映像を提供する一方で、他の解決法と比較して必要なメモリ所要量を削減する。本処理は、単純な静的画像処理にも適用可能である。
本発明は、少なくとも、コンピュータシステムなどのプログラム可能装置において実行されるときに本発明による方法の工程を実行するか、または、プログラム可能装置が本発明に応じたデバイスもしくはシステムの機能を実行することを可能にするためのコード部分を含む、コンピュータシステムにおいて実行されるためのコンピュータプログラムに実装され得る。
コンピュータプログラムは、特定のアプリケーションプログラムおよび/またはオペレーティングシステムなどの、一連の命令である。コンピュータプログラムは例えば、サブルーチン、関数、プロシージャ、オブジェクトメソッド、オブジェクトインプリメンテーション、実行可能アプリケーション、アプレット、サーブレット、ソースコード、オブジェクトコード、共有ライブラリ/動的ロードライブラリ、および/または、コンピュータシステムにおいて実行されるために設計される他の一連の命令のうちの1つ以上を含んでもよい。
コンピュータプログラムはコンピュータ可読記憶媒体において内部的に記憶されるか、またはコンピュータ可読伝送媒体を通じてコンピュータシステムに送信され得る。コンピュータプログラムのすべてまたはいくつかは、情報処理システムに永続的に、取り外し可能に、または遠隔的に結合されるコンピュータ可読媒体において提供されてもよい。コンピュータ可読媒体は例えば、限定されることなく、いくつか例を挙げると、任意の数のディスクおよびテープ記憶媒体を含む磁気記憶媒体、コンパクトディスク媒体(例えば、CD−ROM、CD−Rなど)およびデジタルビデオディスク記憶媒体を含む光記憶媒体、FLASHメモリ、EEPROM、EPROM、ROMなどの半導体ベースのメモリユニットを含む不揮発性メモリ記憶媒体、強磁性デジタルメモリ、MRAM、レジスタ、バッファまたはキャッシュ、メインメモリ、RAMなどを含む揮発性記憶媒体、ならびにコンピュータネットワーク、ポイントツーポイント遠隔通信機器、および搬送波伝送媒体を含むデータ伝送媒体を含んでもよい。
コンピュータ処理は通常、実行している(作動している)プログラムまたはプログラムの一部、現在のプログラム値および状態情報、ならびに処理の実行を管理するためにオペレーティングシステムによって使用されるリソースを含む。オペレーティングシステム(OS)は、コンピュータのリソースの共有を管理するとともにプログラマにこれらのリソースにアクセスするために使用されるインタフェースを提供するソフトウェアである。オペレーティングシステムは、システムデータおよびユーザ入力を処理して、タスクおよび内部システムリソースをシステムのユーザおよびプログラムに対するサービスとして配分および管理することによって応答する。
コンピュータシステムは例えば、少なくとも1つの処理装置、関連付けられるメモリ、および多数の入出力(I/O)デバイスを含んでもよい。コンピュータプログラムを実行するとき、コンピュータシステムはコンピュータプログラムに応じて情報を処理して、結果としての出力情報をI/Oデバイスを通じて生成する。
上記の明細書において、本発明が本発明の実施形態の具体例を参照して説明された。しかしながら、添付の特許請求の範囲に記載されている本発明のより広い精神および範囲から逸脱することなく、そこにさまざまな修正および変更を行うことができることは明らかであろう。
本明細書において説明されているような接続は、例えば介在するデバイスを通じてそれぞれのノード、ユニットまたデバイスから、またはそれらへと信号を転送するのに適切な任意のタイプの接続であってもよい。したがって、別途暗示または提示されない限り、接続は例えば直接接続であってもよいし、間接接続であってもよい。接続は、単一の接続、複数の接続、一方向性接続、または双方向性接続であることに関連して例示または記載され得る。しかしながら、実施形態が異なれば、接続の実施態様は変化してもよい。例えば、双方向性接続ではなく個別の一方向性接続が使用されてもよく、その逆であってもよい。さらに、複数の接続が、連続してまたは時分割多重方式で複数の信号を伝送する単一の接続と置き換わってもよい。同様に、複数の信号を搬送する単一の接続が、これらの信号のサブセットを搬送するさまざまな異なる接続に分離されてもよい。それゆえ、信号の伝送には多くの選択肢が存在する。
さらに、本発明は、プログラム不能ハードウェアにおいて実装される物理デバイスまたはユニットに限定されるものではなく、本出願においては一般的に「コンピュータシステム」として示されている、メインフレーム、ミニコンピュータ、サーバ、ワークステーション、パーソナルコンピュータ、ノートパッド、携帯情報端末、電子ゲーム、自動車および他の組込みシステム、携帯電話、ならびに、さまざまな他の無線デバイスなどの、適切なプログラムコードに応じて操作することによって所望のデバイス機能を実行することが可能なプログラム可能デバイスまたはユニット内に適用されてもよい。
しかしながら、他の修正形態、変更形態および代替形態も可能である。したがって、明細書および図面は限定的な意味においてではなく例示的に考慮されるべきである。
特許請求の範囲において、括弧間に置かれる任意の参照符号は特許請求の範囲を限定するものとして解釈されるべきではない。「備える(comprising)」という文言は、特許請求項に挙げられているもの以外の要素またはステップの存在を除外するものではない。さらに、本明細書において使用される場合、「1つ(“a”or“an”)」という用語は、1つまたは2つ以上として定義される。さらに、特許請求の範囲における「少なくとも1つの」および「1つ以上」などの前置きの語句の使用は、不定冠詞「1つの(“a”or“an”)」による別の請求項要素の導入が、このように導入された請求項要素を含む任意の特定の請求項を、たとえ同一請求項が前置きの語句「1つ以上」または「少なくとも1つの」および「1つの(“a”or“an”)」などの不定冠詞を含む場合であっても、1つだけのこのような要素を含む発明に限定することを暗示するように解釈されるべきではない。同じことが、定冠詞の使用についても当てはまる。別途記載されない限り、「第1の」および「第2の」などの用語は、これらのような用語が説明する要素間で適宜区別するように使用される。したがって、これらの用語は必ずしも、このような要素の時間的なまたは他の優先順位付けを示すようには意図されていない特定の手段が相互に異なる特許請求項において記載されているというだけの事実をもって、これらの手段の組み合わせを有利に使用することができないことを示すものではない。

Claims (25)

  1. 画像を処理する方法であって、
    処理ユニットにおいて画像を受信するステップと、
    前記画像を複数の構成要素として符号化するステップと、
    各構成要素Cに対して指数Eを導出するステップと、
    仮数を導出するステップであって、少なくとも各構成要素Cの近似は前記指数および仮数から導出されることができ、各指数Eは該指数Eに伴う仮数Mにおけるビット数を示す、導出するステップと、
    少なくとも前記指数を圧縮するステップと、
    前記指数および前記仮数をメモリに記憶するステップと、
    を備える、方法。
  2. 前記構成要素がゼロのとき、指数Eをゼロとして導出して、ゼロの該構成要素に対して仮数Mを提供しないステップをさらに備える、請求項1に記載の方法。
  3. 前記導出するステップは、対応する前記構成要素Cおよび前記仮数Eから、式、
    C>0の場合、M=C、および、
    C<0の場合、M=C−1+2
    を使用して仮数Mを導出することを備える、請求項1または2に記載の方法。
  4. 前記指数および仮数が量子化された構成要素から導出されるように、前記構成要素を量子化することをさらに備える、請求項1〜3の何れか一項に記載の方法。
  5. 前記構成要素を量子化するステップは、xより小さくかつ−xより大きい値を有する構成要素Cを、ゼロの値を有する構成要素Cに置き換えることを備え、xは正の実数である、請求項4に記載の方法。
  6. 前記指数および仮数がランレングス符号化された構成要素から導出されるように、前記構成要素をランレングス符号化することをさらに備える、請求項1〜5の何れか一項に記載の方法。
  7. 前記指数をハフマン符号化することをさらに備える、請求項1〜6の何れか一項に記載の方法。
  8. 前記指数をランレングス符号化することをさらに備える、請求項1〜7の何れか一項に記載の方法。
  9. 前記仮数を記憶する前に前記仮数を圧縮することをさらに備える、請求項1〜8の何れか一項に記載の方法。
  10. 所定の数より多いビット数を備える仮数Mを、より少ないビット数を備える仮数Mに置き換えることをさらに備える、請求項9に記載の方法。
  11. 前記ランレングス符号化はゼロランレングス符号化である、請求項6または8に記載の方法。
  12. 前記画像はウェーブレット変換を使用して符号化される、請求項1〜11の何れか一項に記載の方法。
  13. 画像を処理する装置であって、前記装置は処理ユニットおよびメモリを備え、前記処理ユニットは、
    前記メモリから画像を取り出し、
    前記画像を一連の構成要素として符号化し、
    各構成要素Cに対して指数Eを導出し、
    仮数を導出し、少なくとも各構成要素Cの近似は前記指数および仮数から導出されることができ、かつ各指数Eは該指数Eに伴う仮数Mにおけるビット数を示し、
    少なくとも前記指数を圧縮し、
    前記指数および前記仮数を前記メモリに記憶するよう構成される、装置。
  14. 前記処理ユニットは、前記構成要素がゼロのとき、ゼロの指数Eを導出し、かつ該構成要素に対して仮数Mを提供しないよう構成される、請求項13に記載の装置。
  15. 前記処理ユニットは、対応する前記構成要素Cおよび前記指数Eから、式、
    C>0の場合、M=C、
    C<0の場合、M=C−1+2
    を使用して前記仮数Mを導出することによって、各構成要素Cに対する仮数Mを導出するよう構成される、請求項13または14に記載の装置。
  16. 前記処理ユニットは、前記指数および仮数が量子化された構成要素から導出されるように、前記構成要素を量子化するよう構成される、請求項13〜15の何れか一項に記載の装置。
  17. 前記構成要素を量子化することは、xより小さくかつ−xより大きい値を有する構成要素Cを、ゼロの値を有する構成要素Cに置き換えることを備え、xは正の実数である、請求項16に記載の装置。
  18. 前記処理ユニットは、前記指数および仮数がランレングス符号化された構成要素から導出されるように、前記構成要素をランレングス符号化するよう構成される、請求項13〜17の何れか一項に記載の装置。
  19. 前記処理ユニットは前記指数をハフマンコード化するよう構成される、請求項13〜18の何れか一項に記載の装置。
  20. 前記処理ユニットは前記指数をランレングス符号化するよう構成される、請求項13〜18の何れか一項に記載の装置。
  21. 前記処理ユニットは前記仮数を記憶する前に前記仮数を圧縮するよう構成される、請求項13〜20の何れか一項に記載の装置。
  22. 前記処理ユニットは所定の数より多いビット数を備える仮数Mを、より少ないビット数を備える仮数Mに置き換えるよう構成される、請求項21に記載の装置。
  23. 前記ランレングス符号化はゼロランレングス符号化である、請求項18または20に記載の装置。
  24. 前記処理ユニットはウェーブレット変換を使用して前記画像を符号化するよう構成される、請求項13〜23の何れか一項に記載の装置。
  25. コンピュータプラットフォームによって実行されるとき、請求項1〜12の何れか一項に記載の方法を実行するように動作する、記憶された命令を有するコンピュータ可読記憶媒体を備える物品。
JP2014520740A 2011-07-20 2011-07-20 画像を符号化する方法および装置 Pending JP2014521273A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/IB2011/053237 WO2013011355A1 (en) 2011-07-20 2011-07-20 Method and apparatus for encoding an image

Publications (1)

Publication Number Publication Date
JP2014521273A true JP2014521273A (ja) 2014-08-25

Family

ID=47557716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014520740A Pending JP2014521273A (ja) 2011-07-20 2011-07-20 画像を符号化する方法および装置

Country Status (4)

Country Link
US (1) US9948928B2 (ja)
JP (1) JP2014521273A (ja)
CN (1) CN103703783B (ja)
WO (1) WO2013011355A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019208203A (ja) * 2018-05-11 2019-12-05 インテル・コーポレーション 浮動小数点データを圧縮するためのシステム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3350993A1 (en) * 2015-09-18 2018-07-25 Koninklijke Philips N.V. Method and apparatus for fast and efficient image compression and decompression
US11588499B2 (en) * 2018-11-05 2023-02-21 Samsung Electronics Co., Ltd. Lossless compression of neural network weights
CN111713109B (zh) * 2019-06-25 2023-04-14 深圳市大疆创新科技有限公司 视频处理方法、装置和设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748786A (en) 1994-09-21 1998-05-05 Ricoh Company, Ltd. Apparatus for compression using reversible embedded wavelets
US5881176A (en) 1994-09-21 1999-03-09 Ricoh Corporation Compression and decompression with wavelet style and binary style including quantization by device-dependent parser
US6873734B1 (en) 1994-09-21 2005-03-29 Ricoh Company Ltd Method and apparatus for compression using reversible wavelet transforms and an embedded codestream
US5960401A (en) * 1997-11-14 1999-09-28 Crystal Semiconductor Corporation Method for exponent processing in an audio decoding system
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
WO2006111179A1 (en) * 2005-04-19 2006-10-26 Telecom Italia S.P.A. Method and apparatus for digital image coding
WO2009053780A2 (en) 2007-10-26 2009-04-30 Zoran (France) Frame buffer compression for video processing devices
TWI362888B (en) * 2008-12-24 2012-04-21 Acer Inc Encoding and decoding method for video screen layout, encoding device, decoding device, and data structure

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
CSNG200001242008; 前田利之: '「ワンポイント講座 JPEGコーデック」' 日本ファジィ学会誌 Vol.11, No.2, 19990415, 第259〜262頁, 日本ファジィ学会 *
CSNG200500155004; 長沢清人(外6名): '「マルチファンクション・プリンタ(MFP)と画像・信号処理」' 画像電子学会誌 Vol.33, No.1, 20040125, 第53〜62頁, 画像電子学会 *
CSNG200701268002; 田中正行(外1名): '「単板カラーイメージセンサのデータに適した符号化方法の提案」' 画像電子学会誌 Vol.36, No.5, 20070925, 第631〜640頁, 画像電子学会 *
JPN6014048647; アズウィ,橋本晋之介: 「JPEG 概念からC++での実装まで 第2版」 第2版, 20050105, 第27〜29頁, ソフトバンクパブリッシング株式会社 *
JPN6014048650; 長沢清人(外6名): '「マルチファンクション・プリンタ(MFP)と画像・信号処理」' 画像電子学会誌 Vol.33, No.1, 20040125, 第53〜62頁, 画像電子学会 *
JPN6014048651; 前田利之: '「ワンポイント講座 JPEGコーデック」' 日本ファジィ学会誌 Vol.11, No.2, 19990415, 第259〜262頁, 日本ファジィ学会 *
JPN6014048652; 田中正行(外1名): '「単板カラーイメージセンサのデータに適した符号化方法の提案」' 画像電子学会誌 Vol.36, No.5, 20070925, 第631〜640頁, 画像電子学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019208203A (ja) * 2018-05-11 2019-12-05 インテル・コーポレーション 浮動小数点データを圧縮するためのシステム
JP7351060B2 (ja) 2018-05-11 2023-09-27 インテル・コーポレーション 浮動小数点データを圧縮するためのシステム

Also Published As

Publication number Publication date
CN103703783A (zh) 2014-04-02
WO2013011355A1 (en) 2013-01-24
US20140133552A1 (en) 2014-05-15
US9948928B2 (en) 2018-04-17
CN103703783B (zh) 2017-11-24

Similar Documents

Publication Publication Date Title
KR101176691B1 (ko) 변환 블록들의 효율적 코딩 및 디코딩
RU2433479C2 (ru) Адаптивное кодирование и декодирование коэффициентов с широким диапазоном
JP6245888B2 (ja) エンコーダおよび符号化方法
WO2020237646A1 (zh) 图像处理方法、设备及计算机可读存储介质
JP2016226001A (ja) デコーダおよび復号方法
JP2010016841A (ja) データを送信する方法及び圧縮する方法
JP2003319185A (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
EP1946246A2 (en) Extended amplitude coding for clustered transform coefficients
US8682091B2 (en) Real-time image compression
TWI479456B (zh) 使用誤差平面編碼的數據壓縮方法及裝置
JP2014027658A (ja) 圧縮エンコーディング及びデコーディング方法並びに装置
CN111669588B (zh) 一种超低时延的超高清视频压缩编解码方法
JP2014521273A (ja) 画像を符号化する方法および装置
JP6792360B2 (ja) 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム
Sharma Modified golomb-rice algorithm for color image compression
KR20200107745A (ko) 임베디드 이미지 코덱을 위한 서브-블록 기반 엔트로피 코딩
Kumar et al. Comparative analysis of wavelet based compression methods
Naveen et al. Comparative analysis of video compression mechanisms based on EZW coded 3D-DWT and AVI
WO2022120829A1 (zh) 图像编码及解码方法和装置、图像处理装置、可移动平台
JP4114144B2 (ja) 画像符号化装置、画像符号化プログラム、及び画像復号化プログラム
US10666985B1 (en) Sub-block based entropy coding for image coding
WO2023051223A1 (zh) 滤波及编解码方法、装置、计算机可读介质及电子设备
WO2020168520A1 (zh) 编码器、编码系统和编码方法
CN117201782A (zh) 滤波方法、滤波模型训练方法及相关装置
Ghorbanian et al. Wavelet-Based Sequence Codec Implementation on TMS320DM642

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150421