JP5094960B2 - 空間的に強化される変換符号化 - Google Patents
空間的に強化される変換符号化 Download PDFInfo
- Publication number
- JP5094960B2 JP5094960B2 JP2010502623A JP2010502623A JP5094960B2 JP 5094960 B2 JP5094960 B2 JP 5094960B2 JP 2010502623 A JP2010502623 A JP 2010502623A JP 2010502623 A JP2010502623 A JP 2010502623A JP 5094960 B2 JP5094960 B2 JP 5094960B2
- Authority
- JP
- Japan
- Prior art keywords
- spatial
- decoding
- transform
- outlier
- prediction error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 63
- 238000013139 quantization Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims 2
- 230000006870 function Effects 0.000 description 27
- 230000033001 locomotion Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 11
- 230000009466 transformation Effects 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/55—Motion estimation with spatial constraints, e.g. at image or region borders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
C=D+λR (1)
これらの4つの基底関数の加重和(weighted sum)は、任意の4つのサンプルの表現に使用可能である。図2(a)は、原画像と予測画像との間の予測誤差信号を表現する、符号化または復号されるべき4つのスカラー値の例である。図2(b)では、図1における4つの重み付け基底関数は、予測誤差信号へと積算されている(第1の基底関数の1.5倍、第2の基底関数の0.5倍、第3の基底関数の−0.5倍、および第4の基底関数の−0.5倍)。図2(c)では、第1の基底関数および矢印により表現される単一の空間サンプルのみを積算することによって、同一の予測誤差信号を再構成可能にする方法を実証する。この例では、4つのアダマール基底関数(図2(b)に示す)を重み付けする4つの変換係数の代わりに僅か1個の変換係数および1個の空間サンプルによって信号が表現されるため、圧縮効率の改善を期待することができる。
画像ブロック312の予測誤差および予測表現を記述するデータ(例えば、動きベクトル、モード情報、量子化されたDCT+空間サンプル)は、エントロピー符号化処理330に送られる。予測誤差復号処理304は、予測誤差符号化処理303の実質的に逆であり、予測誤差復号処理は、逆空間量子化部332、逆変換部334、および逆量子化部336を含む。予測誤差復号部304の結果は、再構成された予測誤差信号338であり、これは、仮再構成画像314を生成するために、画像ブロック312の予測された表現と組み合わせて使用される。
Claims (32)
- データブロックのための予測誤差信号(prediction error signal)を符号化する方法であって、
予測されたデータブロックのサンプル値と、オリジナルの入力ブロックの値との間の差分を表現する差分信号(difference signal)を計算することと、
前記差分信号における外れ値(outlier value)を非外れ値(non-outlier value)と置換することによって、修正した予測誤差信号を生成することと、
変換符号化(transform coding)を生成された前記修正された予測誤差信号に適用することによって、前記差分信号の第1の成分の第1の表現を生成することと、
空間符号化(spatial coding)を前記外れ値と変換復号された前記非外れ値との間の差分に適用することによって、前記差分信号の第1の成分の第2の表現を生成することと、
前記第1の表現と第2の表現とを結合すること(joining)と、
を含む、方法。 - 変換符号化のために、少なくとも1つの変換係数がゼロに設定される、請求項1に記載の方法。
- 空間符号化のために、少なくとも1つの空間サンプルがゼロに設定される、請求項1または2に記載の方法。
- 前記外れ値の置換に使用される前記非外れ値は、複数の近傍予測誤差値(neighboring prediction error value)の平均を含む、請求項1から3のいずれかに記載の方法。
- 前記データブロックにおいて変換係数が存在しないという表示子を提供することをさらに含む、請求項1から4のいずれかに記載の方法。
- 前記データブロックにおいて空間サンプルが存在しないという表示子を提供することをさらに含む、請求項1から5のいずれかに記載の方法。
- 前記変換符号化において、離散変換基底ベクトルの重み付け係数を含む変換係数が形成される、請求項1から6のいずれかに記載の方法。
- 前記離散変換は離散直交変換を含む、請求項7に記載の方法。
- 請求項1から8のいずれか1項に記載の方法をコンピュータに実行させるように構成される、コンピュータプログラム。
- プロセッサと、前記プロセッサに通信可能に接続されるメモリユニットとを備える装置であって、前記メモリユニットはコンピュータコードを備え、前記コンピュータコードが前記プロセッサによって実行されると、前記装置に動作を実行させ、前記動作が、
予測されたデータブロックのサンプル値と、オリジナルの入力ブロックの値との間の差分を表現する差分信号(difference signal)を計算することと、
前記差分信号における外れ値を非外れ値と置換することによって、修正した予測誤差信号を生成することと、
変換符号化を生成された前記修正された予測誤差信号に適用することによって、前記差分信号の第1の成分の第1の表現を生成することと、
空間符号化を前記外れ値と変換復号された前記非外れ値との間の差分に適用することによって、前記差分信号の第1の成分の第2の表現を生成することと、
前記第1の表現と第2の表現とを結合することと、
を含む、装置。 - 変換符号化のために、少なくとも1つの変換係数をゼロに設定する、請求項10に記載の装置。
- 空間符号化のために、少なくとも1つの空間サンプルをゼロに設定する、請求項10または11に記載の装置。
- 前記外れ値の置換に使用される前記非外れ値は、複数の近傍予測誤差値(neighboring prediction error value)の平均を含む、請求項10から12のいずれかに記載の装置。
- 前記動作は、前記データブロックにおいて変換係数が存在しないという表示子を提供することをさらに含む、請求項10から13のいずれかに記載の装置。
- 前記動作は、前記データブロックに空間サンプルが存在しないという表示子を提供することをさらに含む、請求項10から14のいずれかに記載の装置。
- データブロックのための予測誤差信号(prediction error signal)を復号する方法であって、
複数の変換された係数および複数の空間サンプルを含む、符号化された予測誤差信号を受信することであって、前記変換された係数は変換された差分信号を表現し、前記差分信号における外れ値は非外れ値に置換されており、前記空間サンプルは前記外れ値と変換復号された前記非外れ値との間の差分を表現する、前記受信することと、
前記複数の変換された係数を、変換情報へと復号することと、
前記複数の空間サンプルを、空間情報へと復号することと、
前記復号された変換情報、前記復号された空間情報、および前記データブロックの再構成された予測を積算することによって、前記データブロックの復号表現を形成することと、
を含む、方法。 - 前記データブロックにおいて変換係数が存在しないという表示子が提供される、請求項16に記載の方法。
- 前記データブロックに空間サンプルが存在しないという表示子が提供される、請求項16または17に記載の方法。
- 前記複数の変換された係数および空間サンプルの前記復号は、各々の逆量子化を含み、変換された係数および空間サンプルの前記逆量子化は、相互に関連する、請求項16から18のいずれかに記載の方法。
- 前記複数の変換された係数および空間サンプルの前記復号は、各々の逆量子化を含み、変換された係数および空間サンプルの前記逆量子化は、相互に異なる、請求項16から18のいずれかに記載の方法。
- 前記空間サンプルの前記復号は、前記変換された係数の前記復号に依存する、請求項16から18のいずれかに記載の方法。
- 前記変換された係数の前記復号は、前記空間サンプルの前記復号に依存する、請求項16から18のいずれかに記載の方法。
- 前記複数の空間サンプルのうちの少なくともいくつかは、単一のユニットとして復号される、請求項16から22のいずれかに記載の方法。
- 請求項16から23のいずれか1項に記載の方法をコンピュータに実行させるように構成される、コンピュータプログラム。
- プロセッサと、前記プロセッサに通信可能に接続されるメモリユニットとを備える装置であって、前記メモリユニットはコンピュータコードを備え、前記コンピュータコードが前記プロセッサによって実行されると、前記装置に、データブロックのための予測誤差信号(prediction error signal)を復号するための処理を実行させ、ただし前記処理は、
複数の変換された係数および複数の空間サンプルを含む、符号化された予測誤差信号を受信することであって、前記変換された係数は変換された差分信号を表現し、前記差分信号における外れ値は非外れ値に置換されており、前記空間サンプルは前記外れ値と変換復号された前記非外れ値との間の差分を表現する、前記受信することと、
前記複数の変換された係数を、変換情報へと復号することと、
前記複数の空間サンプルを、空間情報へと復号することと、
前記復号された変換情報、前記復号された空間情報、および前記データブロックの再構成された予測を積算することによって、前記データブロックの復号表現を形成することと、
を含む、装置。 - 前記データブロックにおいて変換係数が存在しないという表示子が提供される、請求項25に記載の装置。
- 前記データブロックに空間サンプルが存在しないという表示子が提供される、請求項25または26に記載の装置。
- 前記複数の変換された係数および空間サンプルの前記復号は、各々の逆量子化を含み、変換された係数および空間サンプルの前記逆量子化は、相互に関連する、請求項25から27のいずれかに記載の装置。
- 前記複数の変換された係数および空間サンプルの前記復号は、各々の逆量子化を含み、変換された係数および空間サンプルの前記逆量子化は、相互に異なる、請求項25から27のいずれかに記載の装置。
- 前記空間サンプルの前記復号は、前記変換された係数の前記復号に依存する、請求項25から27のいずれかに記載の装置。
- 前記変換された係数の前記復号は、前記空間サンプルの前記復号に依存する、請求項25から27のいずれかに記載の装置。
- 前記複数の空間サンプルのうちの少なくともいくつかは、単一のユニットとして復号される、請求項25から31のいずれかに記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US91148007P | 2007-04-12 | 2007-04-12 | |
US60/911,480 | 2007-04-12 | ||
PCT/IB2008/051351 WO2008126019A2 (en) | 2007-04-12 | 2008-04-09 | Spatially enhanced transform coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010524380A JP2010524380A (ja) | 2010-07-15 |
JP5094960B2 true JP5094960B2 (ja) | 2012-12-12 |
Family
ID=39767013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010502623A Expired - Fee Related JP5094960B2 (ja) | 2007-04-12 | 2008-04-09 | 空間的に強化される変換符号化 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8077991B2 (ja) |
EP (1) | EP2156675A2 (ja) |
JP (1) | JP5094960B2 (ja) |
KR (1) | KR101182634B1 (ja) |
CN (1) | CN101682787A (ja) |
CA (1) | CA2684110A1 (ja) |
MX (1) | MX2009010921A (ja) |
RU (1) | RU2427099C2 (ja) |
TW (1) | TW200901775A (ja) |
WO (1) | WO2008126019A2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100939917B1 (ko) | 2008-03-07 | 2010-02-03 | 에스케이 텔레콤주식회사 | 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법 |
EP2448124A4 (en) * | 2009-06-22 | 2012-08-29 | Univ Barcelona | METHOD FOR COMPLETELY ADAPTIVE CALIBRATION OF A PREDICTION ERROR ENCODER |
CN101931817A (zh) * | 2010-04-12 | 2010-12-29 | 中山大学 | 一种变换基自适应的变换编码方法 |
US9106916B1 (en) | 2010-10-29 | 2015-08-11 | Qualcomm Technologies, Inc. | Saturation insensitive H.264 weighted prediction coefficients estimation |
JP5698644B2 (ja) * | 2011-10-18 | 2015-04-08 | 株式会社Nttドコモ | 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム、動画像予測復号方法、動画像予測復号装置及び動画像予測復号プログラム |
JP5485969B2 (ja) * | 2011-11-07 | 2014-05-07 | 株式会社Nttドコモ | 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム |
CA2825767C (en) * | 2011-12-21 | 2018-11-27 | Panasonic Corporation | Image coding method, image decoding method, image coding apparatus and image decoding apparatus |
US9106888B2 (en) * | 2013-09-25 | 2015-08-11 | Apple Inc. | Reducing quantization artifacts using neighbor-based weighted dithering |
EP3345396A4 (en) | 2015-09-01 | 2019-03-27 | Telefonaktiebolaget LM Ericsson (publ) | SPATIAL IMPROVEMENT OF TRANSFORMER BLOCKS |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4125861A (en) * | 1977-08-18 | 1978-11-14 | Bell Telephone Laboratories, Incorporated | Video signal encoding |
JPH07118808B2 (ja) * | 1985-03-20 | 1995-12-18 | 日本電気株式会社 | 動画像信号の符号化・復号化装置 |
JPH0832040B2 (ja) * | 1985-09-26 | 1996-03-27 | 日本電気株式会社 | 動画像信号の符号化装置 |
JP3590996B2 (ja) * | 1993-09-30 | 2004-11-17 | ソニー株式会社 | ディジタル画像信号の階層符号化および復号装置 |
EP0998824A1 (en) * | 1997-07-28 | 2000-05-10 | IDT INTERNATIONAL DIGITAL TECHNOLOGIES DEUTSCHLAND GmbH | Method and apparatus for compression of video images and image residuals |
KR100249223B1 (ko) * | 1997-09-12 | 2000-03-15 | 구자홍 | 엠팩(mpeg)-4의움직임벡터코딩방법 |
GB2366679A (en) * | 2000-09-05 | 2002-03-13 | Sony Uk Ltd | Processing data having multiple components |
US7620108B2 (en) * | 2005-09-16 | 2009-11-17 | Sony Corporation | Integrated spatial-temporal prediction |
-
2008
- 2008-04-09 MX MX2009010921A patent/MX2009010921A/es active IP Right Grant
- 2008-04-09 KR KR1020097023527A patent/KR101182634B1/ko not_active IP Right Cessation
- 2008-04-09 JP JP2010502623A patent/JP5094960B2/ja not_active Expired - Fee Related
- 2008-04-09 CN CN200880017526A patent/CN101682787A/zh active Pending
- 2008-04-09 EP EP08737779A patent/EP2156675A2/en not_active Withdrawn
- 2008-04-09 WO PCT/IB2008/051351 patent/WO2008126019A2/en active Application Filing
- 2008-04-09 RU RU2009141606/09A patent/RU2427099C2/ru not_active IP Right Cessation
- 2008-04-09 CA CA002684110A patent/CA2684110A1/en not_active Abandoned
- 2008-04-10 US US12/101,019 patent/US8077991B2/en active Active
- 2008-04-11 TW TW097113224A patent/TW200901775A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
TW200901775A (en) | 2009-01-01 |
KR101182634B1 (ko) | 2012-09-14 |
CN101682787A (zh) | 2010-03-24 |
RU2009141606A (ru) | 2011-05-20 |
MX2009010921A (es) | 2009-11-19 |
US8077991B2 (en) | 2011-12-13 |
RU2427099C2 (ru) | 2011-08-20 |
WO2008126019A2 (en) | 2008-10-23 |
US20080260270A1 (en) | 2008-10-23 |
EP2156675A2 (en) | 2010-02-24 |
WO2008126019A3 (en) | 2008-12-04 |
KR20090127953A (ko) | 2009-12-14 |
JP2010524380A (ja) | 2010-07-15 |
CA2684110A1 (en) | 2008-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210409756A1 (en) | Method for video coding and an apparatus | |
JP5094960B2 (ja) | 空間的に強化される変換符号化 | |
US11375204B2 (en) | Feature-domain residual for video coding for machines | |
KR101464423B1 (ko) | 비디오 프로세싱을 위한 장치, 방법 및 컴퓨터 프로그램 | |
US20080240242A1 (en) | Method and system for motion vector predictions | |
US20090016626A1 (en) | Joint coding of multiple transform blocks with reduced number of coefficients | |
US20230217028A1 (en) | Guided probability model for compressed representation of neural networks | |
KR20160056901A (ko) | 비디오 코딩 방법, 장치 및 컴퓨터 프로그램 | |
WO2010116268A1 (en) | Method and apparatus for encoding and decoding of image and video signals | |
KR20140131352A (ko) | 코딩을 위한 방법 및 장치 | |
WO2022195409A1 (en) | Method, apparatus and computer program product for end-to-end learned predictive coding of media frames | |
WO2022269441A1 (en) | Learned adaptive motion estimation for neural video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120816 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120911 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120918 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |