JP2007503784A - ハイブリッドビデオ圧縮法 - Google Patents
ハイブリッドビデオ圧縮法 Download PDFInfo
- Publication number
- JP2007503784A JP2007503784A JP2006530613A JP2006530613A JP2007503784A JP 2007503784 A JP2007503784 A JP 2007503784A JP 2006530613 A JP2006530613 A JP 2006530613A JP 2006530613 A JP2006530613 A JP 2006530613A JP 2007503784 A JP2007503784 A JP 2007503784A
- Authority
- JP
- Japan
- Prior art keywords
- block
- blocks
- encoded
- frame
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 323
- 238000007906 compression Methods 0.000 title claims description 56
- 230000006835 compression Effects 0.000 title claims description 55
- 238000013528 artificial neural network Methods 0.000 claims abstract description 56
- 230000009466 transformation Effects 0.000 claims abstract description 29
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 238000013139 quantization Methods 0.000 claims description 77
- 230000006870 function Effects 0.000 claims description 52
- 230000008569 process Effects 0.000 claims description 52
- 239000011159 matrix material Substances 0.000 claims description 41
- 210000002569 neuron Anatomy 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 35
- 238000005192 partition Methods 0.000 claims description 23
- 238000003860 storage Methods 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 14
- 238000000540 analysis of variance Methods 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 2
- 108091026890 Coding region Proteins 0.000 claims 1
- 210000002364 input neuron Anatomy 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000000638 solvent extraction Methods 0.000 abstract description 13
- 238000000844 transformation Methods 0.000 abstract description 7
- 239000000523 sample Substances 0.000 description 36
- 230000033001 locomotion Effects 0.000 description 32
- 230000002829 reductive effect Effects 0.000 description 28
- 238000012549 training Methods 0.000 description 25
- 239000013598 vector Substances 0.000 description 24
- 238000012546 transfer Methods 0.000 description 20
- 230000001537 neural effect Effects 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 239000006185 dispersion Substances 0.000 description 9
- 230000009467 reduction Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 238000012935 Averaging Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 238000006073 displacement reaction Methods 0.000 description 5
- 239000004065 semiconductor Substances 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 238000013144 data compression Methods 0.000 description 4
- FEPMHVLSLDOMQC-UHFFFAOYSA-N virginiamycin-S1 Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC=CC=2)N(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O FEPMHVLSLDOMQC-UHFFFAOYSA-N 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 230000003767 neural control Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 2
- 101100490563 Caenorhabditis elegans adr-1 gene Proteins 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 101100388220 Caenorhabditis elegans adr-2 gene Proteins 0.000 description 1
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011438 discrete method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
ビデオフレームシーケンスを圧縮するために、既にいくつかの異なる方法が考案されている。
最も広範に使用されている周知のビデオデータ圧縮法の1つが、MPEGである。これは、空間的冗長性に基づいた圧縮と時間的冗長性に基づいた圧縮とを統合しているため、ハイブリッド符号化法と見なすことができる。空間的冗長性に基づいた方法においては、フレーム内の細部を低減することによって、あるいは、フレーム内において繰り返し発生する特徴を識別し活用することによって、フレームの情報量を低減する。一方、時間的冗長性に基づいた圧縮法においては、先行および後続するフレームを使用することにより、これらの変化のみを符号化する。また、静止画像圧縮用の既知の方法の1つが、JPEGである。この方法も空間的冗長性の活用に基づいたものである。圧縮対象の画像は、ブロックに分割され、分割されたブロックの情報量は離散コサイン変換を使用して低減される。
時間的冗長性に基づいた圧縮システムは、連続したフレームの変化した部分のみを符号化する。これは、実際には、フレームをブロックに分割し、個々のブロックを先行または後続のフレームの探索範囲内に配置されているピクセルとピクセルごとに比較することによって実行される。この手順が、図2に示されており、これは、先行のフレーム16内に配置されている探索範囲21、または後続のフレーム18の探索範囲19内において、フレーム17の対象とするブロック20に対して最も一致する参照ブロックを探索している状況を示している。参照ブロックは、どこにでも配置可能であり、これが、参照フレーム16または18内に示されている(グレーで示されている)探索範囲と一致する必要はない。当然のことながら、このような場合には、1つまたは複数の対象とする参照フレーム内において参照探索が成功しないということになる。また、明らかなように、参照フレーム17、18は、参照探索のためにブロックに分割されることはなく、図2に示されているブロックは、わかりやすくするためのものである。
誤差補償のためには、通常、双1次フィルタ処理が提案されている。双1次フィルタ処理は、3つの補間された参照フレーム(フィルタ処理済)を生成する段階を含んでいる。3つとは、すなわち垂直補間、水平補間、および垂直と水平の両方による補間を言う。参照フレームは、符号化済みのイントラ(または、インター)フレームの復号化(再構築)された変形であるということを思い起こして頂きたい。これは、対象とする参照フレームに基づいた更なるフレームが、復号化された参照フレーム内に存在している量子化誤差によって更に劣化することを防止するために実行されるものである。
S=(y&1)*2+x&1(ここで、&は、論理AND演算を意味する)。次に、−1/+1、−1/+1の限度において新しい探索範囲を設定する。すなわち、(x+(−1/+1),y+(−1/+1))で設定する。範囲の中心として設定された第1の探索段階(フィルタ処理がされていない参照フレーム内での探索)において見出された最良のブロックの位置により、探索は行なわれる。そして、この新しい範囲を使用して探索を反復する。セレクタは、最良のブロックの位置に従って必要とする補間済みの参照フレームと、上記位置によって決定されるフレーム内の特定のブロックとを選択し、対象とするブロックに関連する二乗誤差を算出する。探索の終了時点においては、誤差が最小であった位置が保持されている。従って、誤差が最小であった際にセレクタが指し示していたブロックのピクセルから、対象とするブロックのピクセルを減算することになる。これが図3に示されている。符号化対象のフレーム22のブロック24と類似するまたは同一のブロックを、参照フレーム23内において求めている。最良に一致したブロック25が検出された際に、このブロックの情報はSad/Sub(比較)モジュール29にデータライン28を通じて供給され、下記の比較が実行される。セレクタが、位置の値に基づいて、式S=(y&1)*2+x&1によって選択される内容に従って、フィルタ未処理、水平補間(フィルタ処理)済、垂直補間(フィルタ処理)済、または、両方向での補間(フィルタ処理)済のいずれかの参照ブロックを使用して、当該ブロックとの比較を実行する。この手順は、局部的なフィルタ処理(補間)がされるようなフィルタ未処理の参照フレームのみを含むことになる。この手順は、事前にフィルタ処理(水平、垂直、および両方向への補間)がされた3つの参照フレームが利用可能な場合と同一である。この場合には、セレクタは、前述の選択肢(フィルタ処理がされていないフレームと3つの異なる方式でフィルタ処理されたもの)から適切な参照フレームを選択し、位置x,yに配置されているブロックを更なる比較および処理のために転送することになる。
次いで、探索に成功した場合には、結果的に生成された差分が、あるいは、探索に成功しなかった場合には、現在のブロック自体が、DCT変換によって空間表現から周波数表現に変換される。次いで、データの不必要な精度を、いわゆる量子化処理によって低減する。これは、基本的に、DCTによって生成される高次の係数を破棄する段階を伴っており、この理由は、通常、これらの係数が小さいことにある。残りのDCT係数も、小さい値であるか、あるいは、ゼロであり、これらは、先程設定された位置の値と同時に、エントロピー符号化によって効率的に符号化可能である。この手順が図4〜図5に示されている。
ブロックが、イントラではなく、インター符号化されたブロックである場合に、一致して補間がされたPタイプブロックの符号化が図5に示されている。符号化対象のブロック42用の参照ブロック43を見出すことが求められている。ブロック42は、符号化対象の現在のフレームの各ブロック38の中において、そのオリジナルの位置40に配置されている。参照ブロック43は、参照番号41によって示されている位置に配置可能である。探索は、参照フレームの探索範囲39内において、符号化対象のブロック42を段階的に移動させることによって実行される。最良の一致が見出された場合に、符号化対象のブロック42を参照ブロック43から減算し(または、この逆で)、符号化対象のブロック42と、一致した参照ブロック43との間の誤差を生成する。この結果、誤差の輝度成分44およびクロミナンス成分45が得られる。これらの成分に対して、段階46において、DCT変換、量子化、およびランレングス符号化を適用し、次いで、このランレングス符号化済みのデータに対して、最後に、段階47において、更にエントロピー符号化を施す。
参照探索に成功した場合には、設定された参照位置をベクトルに変換し、ベクトルを符号化する。これらのベクトルは、参照に対する符号化対象のブロックの変位の大きさと方向を規定している。
量子化の目的は、不必要な細部を破棄することによるフレームデータの精度(詳細レベル)の低減である。対象とするブロックを綿密に調査すれば、ブロックが、視覚的に知覚されない多くの細部を含んでいることに気付く。この理由は、人間の眼の感度が、空間周波数成分が減少する方向に増大しているという点にある。従って、フレームの高周波数成分が低周波数成分よりも大きく減衰した場合にも、ある程度のレベルまでは、データの圧縮率が増大しても、復号化されたフレーム内において変化を視覚的に認識することはできない。この種の量子化は、MPEG1〜2規格によって適用されている。別の既知の方法によれば、係数の周波数分布を無視しており、この結果、それぞれの係数を同一の定数によって除算している(MPEG4規格のH26X)。量子化の最も重要な機能は、DCT係数を表しているビット数の低減である。換言すれば、DCT変換された係数は、可能な限り少ない数のビットによって表すことが要求される。係数を表すビット数が少ないほど、圧縮率も良好となる。但し、除数の値が増大すると、整数除算によって発生する誤差も増大することになる。
本発明の全般的な目的は、前述の既知の方法の圧縮効率を改善することにあり、更に詳しくは、相対的に小さな演算負荷を有する効率的な圧縮を提供することにある。この目的は、本明細書に添付されている独立請求項に記述されている本発明による方法によって実現されている。
本発明によるハイブリッド符号化システムの論理構造(概略機能図)が図8に示されている。このシステムの主要機能ユニットは、図1に示されている既知のMPEG符号化システムに、多くの点において類似している。入力ビデオデータ60(換言すれば、符号化対象のフレーム)が、フレームスケーリングモジュール61に供給され、このモジュールが、いくつかの異なる基準(後程詳述する)に従って、入力フレームのサイズを低減するかまたは、変更することなしに、そのままの状態で処理する。本システム全体は、符号化制御ユニット62によって制御されており、この正確な機能については、本明細書において、後程、明らかにする。供給されたフレームまたはブロックは、イントラ/インタースイッチ63に従って、イントラまたはインター符号化によって符号化される。ブロックは、DCT変換モジュール64、量子化モジュール65、およびエントロピー符号化モジュール72を通過することにより、変換、量子化、および符号化された状態で、出力73に送出される。インターフレームを符号化するのに必要な参照フレームは、逆量子化モジュール66および逆DCTモジュール67によって生成され、これによって再構築された参照フレームが、ブロック解除フィルタ69を通じて、フレームストア70に供給される。動き補償、すなわち、フィルタ処理された参照フレームと補償された動き情報74(動きベクトルおよび減算されたブロック)の生成は、参照番号68によって示されているモジュールによって実行される(生成時の分解能は1/2、1/4、および1/8ピクセルの間で調節可能)。フレームストア70は、最新の参照フレームを保存し、当該ブロックは、自動的に更新(実行)される。モジュール71は、変化を識別し、フレーム内の変化を追跡するのに最も適したブロック分割を見出し、且つ、モジュール71は、四分木構造(後程詳述する)を使用して最良のブロック分割を表す。エントロピー符号化モジュール72は、いわゆるニューラル算術圧縮器である(以下を参照)。
(1)イントラフレームの符号化に適用されるいわゆる「イントラ予測」
(2)ニューラルエントロピー符号化において使用される予測
これらは、該当する当該箇所において説明することになる。
(IV.1)
イントラ予測は、対象フレーム内で隣接するブロックが、しばしば、類似した特性を有しており、従って、隣接するブロック間における空間的な相関をデータ圧縮に使用することが可能であるという観察に基づいたものである。従って、このイントラ予測手順を使用することにより、選択されたブロック(符号化対象のブロック)の情報量を、その選択されたブロックに隣接している1つまたは複数のブロックの既定となるピクセルの情報量に基づいて変更することが可能である。可能な態様においては、図9に概略的に描かれているように、符号化対象ブロックの前に配置されているブロックの垂直ライン76、またはこの対象ブロックの上部に配置されているブロックの水平ライン77、あるいは、これらの両方(すなわち、その場所でのピクセル値)を使用して、イントラ予測は実現される。垂直ライン76をBと呼び、水平ラインをAと呼ぶことにしよう。具体的な例を考えてみよう。符号化対象のブロックの上に配置されているブロックの最後の水平ライン77の要素が、221、224、230、232であるとしよう。
219、223、226、232
219、224、224,231
217、220、221、229
214、220、221、228
2、1、4、0
2、0、6、1
4、4、9、3
7、4、9、4
次に、このプロセスについて更に詳細に説明する。図12から分かるように、本発明の図示の実施例においては、可能なブロックサイズは、16x16、8x8、および4x4のピクセルである。異なるサイズを有するブロックの(イントラ)予測は、複数の方法で実行可能である。これらを以下に記載する。
6つの予測タイプが規定される。
予測ベクトルS0は、以下で求められる。
AおよびBが存在する場合、
S0=Σ(Aj+Bj+4)/8
Aのみが存在する場合、
S0=Σ(Aj+2)/4
Bのみが存在する場合、
S0=Σ(Bj+2)/4
その他の場合は、S0=128
DCP(j,i)=IB(j,i)−S0 ここで、j=0‥3、i=0‥3
なお、IBは、符号化対象のブロックで、DCPは、予測ブロックである。
DCP(j,i)=IB(j,i)-A(i) ここで、j=0‥3、i=0‥3
DCP(j,i)=IB(j,i)-B(i) ここで、j=0‥3、i=0‥3
T(0,0)=(B(3)+2*B(2)+B(1)+2)/4
T(1,0)=(B(2)+2*B(1)+ B(0)+2)/4
T(2,0)=(B(1)+2*B(0)+A(-1)+2)/4
T(3,0)=(B(0)+2*A(-1)+A(0)+2)/4
T(4,0)=(A(-1)+2*A(0)+A(1)+2)/4
T(5,0)=(A(0)+2*A(1)+A(2)+2)/4
T(6,0)=(A(1)+2*A(2)+A(3)+2)/4
DCP(j,i)=IB(j,i)-T(j-i+3) ここで、j=0‥3、i=0‥3
T(j,i)=A(3) ここで、j=0‥3、i=0‥3
T(0,0)=(A(0)+A(1))/2
T(1,0)=A(1)
T(0,1)=T(2,0)=(A(1)+A(2))/2
T(1,1)=T(3,0)=A(2)
T(0,2)=T(2,1)=(A(2)+A(3))/2
DCP(j,i)=IB(j,i)-T(j,i) ここで、j=0‥3、i=0‥3
T(j,i)=B(3) ここで、j=0‥3、i=0‥3
T(0,0)=(B(0)+B(1))/2
T(0,1)=B(1)
T(1,0)=T(0,2)=(B(1)+B(2))/2
T(1,1)=T(0,3)=B(2)
T(2,0)=T(1,2)=(B(2)+B(3))/2
DCP(j,i)=IB(j,i)-T(j,i) ここで、j=0‥3、i=0‥3
8x8ピクセルのサイズを有するブロックの予測を同様の原理によって実行可能である。この場合には、4つの可能なタイプが定義される。
AおよびBが存在する場合、
S0=Σ(Aj+Bj+8)/16
Aのみが存在する場合、
S0=Σ(Aj+4)/8
Bのみが存在する場合、
S0=Σ(Bj+4)/8
その他の場合は、S0=128
DCP(j,i)=IB(j,i)-A(i) ここで、j=0‥8、i=0‥8
DCP(j,i)=IB(j,i)-B(i) ここで、j=0‥8、i=0‥8
DCP(j,i)=IB(j,i)-(A(i)+B(i))/2 ここで、j=0‥8、i=0‥8
最後に、16x16ピクセルブロックの予測も同様である。この場合には、4つの予測タイプが規定される。
AおよびBが存在する場合、
S0=Σ(Aj+Bj+16)/32
Aのみが存在する場合、
S0=Σ(Aj+8)/16
Bのみが存在する場合、
S0=Σ(Bj+8)/16
その他の場合は、S0=128
DCP(j,i)=IB(j,i)-S0 ここで、j=0‥15、i=0‥15
(IBは、現在のブロックであり、DCPは、予測ブロックである。)
DCP(i,j)=IB(j,i)-A(i) ここで、j=0‥15、i=0‥15
DCP(j,i)=IB(j,i)-B(i) ここで、j=0‥15、i=0‥15
v=5*((ΣA(j+7)-A(j-7)*j))/4)/4
h=5*((ΣB(j+7)-B(j-7)*j))/4)/4
k=A(15)+B(15)
T(j,i)=(k+(i-7)*h+(j-7)*v+16)/32
DCP(j,i)=IB(j,i)-T(i) ここで、j=0‥15、i=0‥15
従って、この態様においては、提案する方法は、3つの異なるブロックサイズと、14個にも及ぶ予測タイプを使用している。既知の方法を適用した場合には、すべての予測と後続の計算を、16x16モードにおいて、4回(すなわち、許容されているブロックサイズが、16x16である場合)、8x8モードにおいて、4回、そして、4x4モードにおいて、16回実行する必要があるため、高い演算能力を必要とすることが容易にわかる。実際には、これは、16x16のサイズのブロックがサブブロックに分割されていない場合には、P→DCT→Q→IQ→IDCT→IP変換の順序処理と、後続する係数のエントロピー符号化と、オリジナルのブロックと逆変換されたブロックとのMSE値の判定を4回実行しなければならないことを意味している。サブブロックへのブロックの分割が許容されている場合には、前述の方法によれば、上記変換の合計数は、16回(4*4)、あるいは、場合によっては、96回(6*16)にも増大する(但し、ブロックサイズは小さくなる)。
・3つの異なる動的に変化するブロックサイズ(16x16、8x8、4x4)を使用する符号化
・2つの動的に変化するブロックサイズ(16x16、8x8)を使用する符号化
・2つの動的に変化するブロックサイズ(16x16、4x4)を使用する符号化
・2つの動的に変化するブロックサイズ(8x8、4x4)を使用する符号化
1.3つの異なる動的に変化するブロックサイズを使用する符号化
2.2つの動的に変化するブロックサイズを使用する符号化
3.上記選択肢の中から、いずれか1つを自動的に選択
Yブロックのサイズは、16x16であるか、あるいは、この代わりに、4つの8x8ピクセルサブブロック、または16個の4x4ピクセルサブブロックが使用される。UVのサイズは、8x8であるか、あるいは、Yブロックの分割に対応して、4つの4x4ピクセルサブブロック、または16個の2x2ピクセルサブブロックが適用される(図13参照)。UV色表面上における2x2ピクセルのブロックサイズは、「インター」モードにおいてのみ許容されていることに留意しなければならない。
TH8は、8x8ブロックに許容される分散の閾値であり、
TH16は、16x16ブロックに許容される分散の閾値であり、
TH8およびTH16は、経験的な定数である。この式が示しているように、「分散」の値は、ブロック内の視覚的な詳細の量を定量化している。
TH(i)=THbasevalue(i)*errorfactor(qp) ここで、i=0..1、qp=1..MAXQP
errorfactor(qp)の値は、量子化係数QPに基づいて決定されるqpによって割り出しテーブルから取得する。上記量子化係数QPは、この場合は、後述する本発明のニューラル制御システムによって決定されるが、この代わりに、QPは定数であるか、あるいは、別の既知の方法を利用して決定することも可能である。
0 ---- ブロックは、分割されていない。
1 0000 ブロックは、4つの8x8サブブロックに分割されている。
1 0001 ブロックの四半分の第1が、4x4ピクセルのサブブロックに分割されており、
その他のブロックは、8x8である。
1 0010 ブロックの四半分の第2が、4x4ピクセルのサブブロックに分割されており、
その他のものは、8x8のサイズである。
ブロックが分割されている場合(L=1)には、16個の可能な組み合わせが存在しており、従って、この場合には、ブロックの分割を符号化するデータは、Lを含んで5ビット長であり、ブロックが分割されていない場合には、分割データは、1ビットの長さ(Lのみ)のみである。
2つのブロックサイズを使用する選択肢のほうが有利であると分析によって判定された場合には、2つの支配的なブロックサイズが既に決定した状態にある(可能なサブブロックの構成方法を図14に示す)。2つのブロックサイズによる符号化は、基本的に既に説明しているものと同一の方法によって実行されるが、わずかないくつかの微細な調節が伴う。
(1)圧縮性分析によって最良であると見なされたブロック分割によるブロックのサブブロックへの分割と、
(2)それぞれのサブブロックごとの最良の予測サブブロックの判定と予測ブロックの符号化という順序で進行する。
(IV.5.1)
離散コサイン変換(DCT)は、それ自体、新規なものではない。基本的な原理は、すべてのブロックサイズについて同一である。
ブロックまたはサブブロックのDCT変換とエントロピー符号化の間において実行される段階が、いわゆる量子化であり、この量子化段階においては、エントロピー符号化モジュールにより、符号化処理を容易に行えるように、特定のガイドラインに従って、DCT変換済みのブロックのマトリックス要素を修正する。
data(j)は、量子化前のDCT変換済みのブロックに対応したマトリックスのj番目の要素であり、
matrix(j)は、量子化マトリックスのj番目の要素であり、
QPは、量子化係数(スカラー値)である。
本発明の圧縮システムの具体的な実施例においては、係数の符号化のために、3つの異なる方法が実行されている。これらの方法の基本的な原理は既知であるが、わかりやすくするために、以下、これらについて簡単に説明する。
名前からわかるように、この方法は、連続したブロックのDC値を相互に減算し、結果的に得られる差分を算術符号化法によって符号化する段階を有している(算術符号化の原理は周知されている内容であり、本明細書において後程詳述する)。
Xdpcm=X(i)−X(i-1)
AC係数は、いわゆる「ジグザグ」テーブル(図4の参照番号37、参照)によって取得され、既知のランレングス法によって圧縮される。ランレングス法は、順序付けられたペア(係数:発生カウント)を生成し、ここで、後者の値は、データシーケンス内における対象係数の発生数を規定している。対象とするブロック内のペアの合計数は予見不可能であるため、ペアの数を規定するか、または、ブロック末尾コードを最後のペアの後に挿入する必要がある。
この方法においては、AC係数は、中間的なランレングス符号化を伴うことなしに、算術法によって直接符号化される。本発明による符号化器において実行される方法の中の1つにおいては、現在の係数を符号化するレベルを、モジュロ関数を通じて以前に符号化された係数の値によって判定するように、算術符号化を実行している(これは、多くの点において、ニューラルネットワークを伴わない従来の算術符号化に類似している)。このモジュロ関数が保証しているのは、通常、複数の同一のAC係数が互いに隣り合っている場合に、これらの係数が同一レベルにおいて符号化されるということのみである。ニューラル算術符号化モジュールの動作原理については、本明細書において、後程詳細に説明する。ここでは、本発明のニューラル算術符号化器においては、AC値に依存することになるパラメータ(インターバル限度、インターバルサブ分割)が存在していないと言っておくだけで十分であろう。EOB符号を使用せず、その代わりに、実際の位置+1を生成することにより、変換および量子化済みのブロック内の最後の非ゼロのAC係数の位置を記録している。これを必要とする理由は、すべてのAC係数がブロック内においてゼロ化された場合に、ゼロを書き出すことにより、この対象とするブロックに関連する更なるデータが出力データストリーム(換言すれば、ブロックがゼロのみを含んでいる)内において符号化されないことを通知可能とするためである。
位置 0 1 2 3 4 5 6 7
係数: 63 12 21 32 0 0 0 0
出力: 3 63 11 21 32
ここで、上記出力の先頭にある数字3は、最後のアクティブな位置(非ゼロの値、係数32を示す)を示している。しかしながら、この調整方法では、すべてのデータがゼロであるという状況を示すことができない。上記出力の先頭にある数字が0の場合、位置0において1が検出された場合、依然として最後のアクティブな(非ゼロの)位置について0を符号化する必要がでてくる。従って、すべてのデータがゼロである場合を除いて、位置の値に1だけ加算する。
従って、出力データのシーケンスは、4 63 11 21 32となり、あるいは、すべてがゼロである場合には、0のみとなる。
例えば、次のとおりである。
レベル0: 0 0 0 1 ここで、「1」は、最後の非ゼロのデータを示す。
レベル1: 63 11 21 32)
エントロピー符号化の際には、方法2(IV.6.2参照)と方法3(IV.6.3参照)の両方を試験モードにおいて実行し、最終的に、短いデータシーケンスを結果的にもたらした方法を適用する。当然のことながら、符号化済みのデータストリーム内において、選択した方法をなんらかの方法で識別しておかなければならない。
2.|0|PRED|DPCM|AC|EOB、または、すべてがゼロの場合には、|0|PRED|DPCM|EOB
3.|1|PRED|DPCM|POS|AC、または、すべてがゼロの場合には、|1|PRED|DPCM|EOB
ここで、開始ビットは、符号化モードを識別しており、
PREDは、予測タイプ、
DPCMは、デルタ符号化によって符号化されたDC係数、
ACは、1つまたは複数のAC係数、
POSは、AC係数の位置、
EOBは、ブロック末尾(End OF Block)文字である。
|QT=0000|[0|PRED|DPCM|AC|EOB],[0|PRED|DPCM|AC|EOB]
[0|PRED|DPCM|AC|EOB],[|0|PRED|DPCM|AC|EOB]
ここで、QT(四分木)は、ブロックが4つのサブブロックに分割された場合のブロック分割を表すデータであり、それぞれのサブブロックは、タイプ2の符号化を適用する。
または、
|QT=0001|
[0|PRED|DPCM|AC|EOB],|[0|PRED|DPCM|AC|EOB] (2 x 4x4)
[0|PRED|DPCM|AC|EOB],|[0|PRED|DPCM|AC|EOB] (2 x 4x4)
[0|PRED|DPCM|AC|EOB] (1 x 8x8)
[0|PRED|DPCM|AC|EOB],[0|PRED|DPCM|AC|EOB] (2 x 8x8)
これは、16x16ブロックが、サブ分割されていない3つの8x8サブブロックを含んでおり、第4の8x8ブロック(これは、実際には、最初に到来する)が、4つの4x4サブブロックに分割されていることを意味している。
MPEG符号化の既知の方法においては、対象とするフレームのピクセルデータをRGBから、いわゆるYUV2フォーマットに変換している。ここで、Yは、明度(輝度)信号を意味しており、UVは、色差(色度)信号である。
|0|M|DPCM|AC|EOB、または、すべてがゼロの場合には、|0|M|DPCM|EOB
|1|M|DPCM|POS|AC、または、すべてがゼロの場合には、|1|M|DPCM|EOB
ここで、Mは、ブロック分割を示すビットである。例えば、ブロックが分割されていない場合には、M=0であり、分割されている場合には、M=1である。
(V.1)
既に指摘したように、インターフレームの符号化は、時間的な冗長性に基づいている。これは、現在のフレームを先行または後続のフレームと比較し、2つのフレーム間の差分のみを符号化することを意味している。この方法の参照探索モードが、図15に示されている。3つの先行するPタイプフレーム内のみにおける探索(図15a)、2つの先行するBタイプフレーム内のみにおける探索(図15b)、および先行および後続する動き補償済みの参照フレーム内における探索(図15c:この場合には、通常、Bタイプのフレームを参照用として使用することはできない)という選択肢が可能である。
本発明によって実行される探索法は、いわゆる「スパイラル探索」に基づいており、これは、実際には、次のように実行される。
探索範囲を参照フレーム内において規定する。探索範囲の中心の座標は、探索サンプル(符号化対象のブロック)の中心の座標と同一である。
試験を次式に従って実行する。
次いで、符号化済みのブロックから演算したSAD16値(Sum Absolute Diference:ブロックサイズを示すインデックス)と新しく設定された参照ブロックを、経験的な定数MAXSAD16と比較する。SADは、次式を使用して演算する。
16x16ブロックの場合に、参照探索が現在のフレーム内において不成功であり(基準ブロックが検出されない)、現在のフレームがPタイプである場合には、3フレームの最大深度により、先行するPタイプの参照フレーム内において、探索を反復する。探索に成功した場合には、参照フレームの数を記録し、探索を終了する。そうでない場合には、本方法は、最小誤差を有するフレームを選択し、ブロックを4つの8x8サブブロックに分割し、誤差が限度を超過しているサブブロックによって探索を継続する。現在のフレームがBタイプである場合には、探索は、まず、後続するPフレームにおいて実行した後に、3つの先行するPフレーム内において実行する。Bタイプフレームの場合に、探索がすべての参照フレーム内において不成功であった場合には、MPEG法において適用される単純な式を使用し、後続フレームと、先行するフレームの中の1つのものの中において検出される最良の基準ブロック候補の位置を補間することにより、後続するフレームと、先行するフレームの中の1つのものから、平均化された基準ブロックを生成する。生成された補間済みのブロックとオリジナルのブロックの間の二乗誤差が依然として過大である場合には、誤差が最小であった参照フレームを選択し、ブロックを4つの8x8サブブロックに分割する。
8x8ブロックの処理は、16x16ブロックの処理とほとんど同一であるが、処理の終了時点において、探索が依然として不成功であった場合に、ブロックを4x4ピクセルのサブブロックにサブ分割するという相違点を有している。
4x4ブロックの処理は、8x8ブロックの処理とほとんど同一であり、唯一の相違点は、探索が依然として不成功であった場合に、その誤ったブロックに対してイントラブロックとマーキングする点にある。
ブロックの処理がフルピクセル分解能によって終了した後に、1/2、1/4、および1/8ピクセル分解能によって、探索を実行する(フィルタリング/補間された参照用内における探索)。唯一の例外は、1/2、1/4、および1/8ピクセル分解能の探索を、補間の前に実行することを要するBタイプフレームの補間モードである。1/2、1/4、および1/8ピクセル分解能による探索は、基本的に、本明細書において前述した既知の方法と同一であるため、ここでは、そのプロセスに関する説明を省略する。
参照フレームのサイズ1:4→1:8
└→1:1
適用されたフィルタ:Wiener→双一次
└→双一次
16x16ブロック全体用の参照ブロックの検出および参照ブロックの分割のプロセスが正常に完了した後に、符号化対象のブロックも等しいサイズのサブブロックに分割し、これらのサブブロックを参照ブロックのサブブロックから減算する。次いで、差分に対して離散コサイン変換および量子化を適用し、結果的に得られたブロック内に含まれている係数に対してAC/DC予測を適用する。イントラブロックの予測プロセスと同様に、この予測法は、変換済みのブロックのDC値間の差分を生成し、AC係数の第1水平/垂直ラインに対して水平/垂直予測を適用する。この方法と以前のものとの相違点は、前述のイントラ予測が、符号化対象のブロックのピクセル値から隣接するピクセルの実際のピクセル値を減算しているのに対して、この場合には、隣接するDCT変換済みのブロックの要素をDCT変換済みのブロックの要素から減算している点にある。この方法によれば、エントロピー符号化における変換済みのブロックの符号化効率が更に改善される。
CB
AX
ここで、Xは、処理対象の変換済みのブロックを意味しており、A、B、およびCは、取り囲んでいるブロックである。
pred=abs(A-C)<abs(C-B)
ここで、A、B、およびCは、処理対象のブロックを取り囲んでいるブロックのDC係数である。
本節においては、ブロック分割を表すデータ用の可能なデータフォーマットと符号化法を提示する。
RFIDXは、適用された参照フレームのフレーム数である。
MVは、動きベクトルである。
DCは、離散コサイン変換の第1係数である。
ACは、その他のDCT係数を示している。
IPは、Bフレーム用の補間モードを示している。
Iは、イントラモードを意味している。
Pは、イントラモード予測の数である。
モード0: |L|RFIDX|MV|DC|AC
モード1‥15: |L|QT|RFIDX|I|MV|DC|AC…I|MV|DC|AC
モード0: |L|RFIDX|IP|MV|DC|AC
モード1‥15: |L|QT|RFIDX|I|IP|MV|DC|AC…I|IP|MV|DC|AC
I=1の場合には、この対象ブロックの記述は、|I|P|DC|ACに変化する。
1|0001|2| 1|0001|0|
0 MV4 DC4 AC4 1 P DC4 AC4
0 MV4 DC4 AC4 0 MV4 DC4 AC4
0 MV4 DC4 AC4 0 MV4 DC4 AC4
0 MV4 DC4 AC4 0 MV4 DC4 AC4
0 MV8 DC8 AC8 0 MV8 DC8 AC8
0 MV8 DC8 AC8 0 MV8 DC8 AC8
0 MV8 DC8 AC8 0 MV8 DC8 AC8
4つの4x4ブロックと 4つの4x4ブロックと、3つの8x8ブロック、
3つの8x8ブロック 第1のブロックは、イントラブロック。
(また、この場合には、変数「AC」は、通常、複数のデータ要素を表している。)
動きベクトル(すなわち、参照ブロックに対する動きを示すベクトル)の最適な符号化のために、動きベクトルは、可能な最短の形態で表すことが好ましい。これは、現在の動きベクトルから、現在のブロックの隣、上部、または対角的に上部に配置されているブロックに属する動きベクトルを減算することによって提供可能である。3つの可能な隣接する動きベクトルの中から平均値に最も近いもの、換言すれば、最小値よりも大きく、最大値よりも小さいものを選択する。
最終的に、エントロピー符号化モジュールを使用してデータを符号化する。次に、本発明のバイナリマルチレベル算術符号化モジュールについて説明することにしよう。
本発明によるエントロピー符号化モジュールは、バイナリ適応技法を利用している。これは、入力データを、発生頻度と既に受信済みのビットパターンの関数によって、ビットごとに処理することを意味している。
本方法の主な設計目的は、相対的に単純な計算によって可能な最良の圧縮を達成することであった。本発明の方法は、除算を使用することなしに、2つの乗算と2〜3の加算および論理演算を実行することによって実行可能である。その他の処理は、すべて整数に基づいて行われる。
area[inverz(bit)]=area[0]+((area[1]-area[0])*prob)/216+bit
if((area[1]-area[0]<256)
{
outdata=area[1]/224
area[0]=area[0]*28
area[1]=area[1]*28
}
prob=calc_next_probe(bit)
符号化の効率向上のためのキーファクタは、変数「prob」(以下、プローブ値またはプローブと呼ぶ)の値を判定する方法である。プローブ値は、上記の例においては、「calc_next_probe(bit)」関数によって返される。
area[1]=area[1]*256
area[0]=area[0]*256
本発明では、頻度テーブルの概念を導入し、到来データシーケンス内の0と1の発生率を表す2つの関数f(0)およびf(1)を規定した。受信ビットは、mビットの長さを有するバッファ内に供給する(ここで、2m=Nであり、従って、2を底とするNの対数が、時間窓の幅を提供している)。バッファ内にシーケンシャルに到着するビットが、(必要に応じて、バッファの情報を左にシフトする)変数「window」を構成する。この変数「window」は、mビットの長さに切り捨てることにより、頻度テーブル内の行の1つをポイントする(変数「index」内に保存される)インデックスを形成する。ここで提示している例においては、頻度テーブルは、512の行を有している。頻度テーブルの要素は、変数FreqTbl[index]f0および変数FreqTbl[index]f1によって規定されている。これらの変数は、ビットの組み合わせが、バッファ内に現在保存されているビットの組み合わせと同一であった場合に、受信ビットが、何回、0または1であったかを示している(換言すれば、現在のビットの組み合わせを、テーブルの対象行をポイントするインデックスとして見なしている)。
If(count>=log2(N+1)){
count=0
window=0
}
window=window*2+bit
FreqTbl[index].f0=FreqTbl[index].f0+(2*bit)
FreqTbl[index].f1=FreqTbl[index].f1+(2-(2*bit))
index=window mod N
sum=FreqTbl[index].f0+FreqTbl[index].f1
prob=(FreqTbl[index].f0*FracTbl[sum])/210
if(sum>256){
FreqTbl[index].f0=(FreqTbl[index].f0)/2
FreqTbl[index].f1=(FreqTbl[index].f1)/2+1
}
prob=(FreqTbl[index].f0)/sum
しかしながら、結果が端数となるため、この式は、直接適用されない。この計算(除算)は、本発明の目的には、実際に低速に過ぎる計算を必要とすることになろう。
前述のように、本方法は、異なるレベルにおいて符号化を実行する。実際には、これは、プローブ変数に対してのみ影響を与える。換言すれば、同一の符号化モジュールをすべてのデータタイプに使用可能であり、調節を要するのは、パラメータ(N、窓サイズ、符号化範囲の限度)のみである。それぞれのレベルを、対象データタイプの要件に応じて、複数のサブレベルに分割し、異なるレベルをそれぞれのデータタイプに割り当てる。例えば、4x4離散コサイン変換処理の結果を符号化するには、特定タイプのレベルを定義し、異なるサブレベルをACおよびDC係数の符号化に割り当てる。
(VI.4.1.)
算術符号化の重要な欠点は、最適な効率の符号化のためには、符号化対象のデータ内に出現する個々のシンボルの発生確率が判明している必要があるという点にある。原則的には、既に発生した複数のシンボルを考慮することができよう。個別のシンボルのみならず、異なるシンボルグループの発生頻度にも注意を払えば、更に効率的であろう。しかしながら、これには、非常に多数の頻度値を保存することが必要となろう。この保存数をある程度軽減するには、既に発生している(状況)すべてを組み合わせ可能にするようなシンボルを保存する代わりに、実際に発生したシンボルの組み合わせのみを保存することにより軽減可能となる。この方法は、新しく発生したシンボルの組み合わせを表すときは、特別なシンボル(拡張用)を導入しなければならないことを意味している。
以下の頁においては、この方法について詳細に説明する。前述の算術法に比べた唯一の違いは、プローブ値の計算(変数「prob」の値を返す機能)が、ニューラルプローブによって置換されているという点にある。
adr1=register mod H0
adr2=H0-(H0*k)+((register/64)mod H1)
adr3=(H0+H1)-(H1*k)+((register/16384)mod H2)
adr4=(H0+H1+H2)-(H2*k)+((register/4194304)modH3)
Wi=Wi+(error*gain*eta*((f(0)i+f(1)i)/(f(0)i*f(1)i))
ここで、iは、テーブルのアドレス指定された行のインデックスであり、「error」は、予測されたビットと実際に受信されたビットの差分であり、「gain」は、利得係数であり、「eta」は、学習係数であり、f(0)、f(1)は、先程定義されたビット頻度である。実際には、本方法において適用されるN入力ニューラルネットワークの知識ベースは、重み関数とテーブル155内に保存されている頻度値から構成されている。
次に、レジスタ150のパーティションを反復的に試験し、最良のパーティションを選択する。ニューラルネットワークは、次に受信したビットの値に基づいて、最近にアドレス指定されたテーブル行の頻度データf(0)、f(1)を更新し、これらの行内に保存されているニューロン重み関数に対して、kの最新の値と、予測されたおよび受信されたビット値間の差(誤差)に関連して頻度f(0)、f(1)から導出されたプローブ係数を「教授」する。
(VII.1.)
帯域幅(転送レート)制御は、ビデオ符号化において最も重要な課題の1つである。ビデオフレームシーケンス内のフレームの情報量は、大きく変化しており、従って、実質的に均等な画像品質の維持を目的としている場合には、これらの変化に追随するべく、圧縮比を大きなスケールで調節しなければならない。
本発明によれば、帯域幅(転送レート)制御のために、2つの解決方法が提供されている。いずれの方法も、ニューラルネットワークのアプリケーションに基づいている。
第1の解決方法によれば、ニューラルネットワークは、バックプロパゲーション構造を有しており、これは、それ自体、既知である。このネットワークが図18cに示されている。ネットワークは、N個の入力1801〜180n、2N個のニューロンを含む隠れ層185、および少なくとも1つの出力を有している。量子化係数QおよびスケーリングファクタS(この役割は、VIIIにおいて後程詳述する)が出力188および189に現れる。
ELi-1/CLi-1、ELi/CLi、ELi+1/CLi+1、他、
ここで、ELは予想される長さ(Expeted Length)であり、CLは符号化済みの長さ(Coded Length)であり、iはi番目(例えば、符号化済みのフレーム)のデータに対応したインデックスである。
前述のように、ネットワークは、吟味されたトレーニングによって動作する。ニューラルネットワークは、以前に予測されたおよび符号化済みのフレーム長値によって要求されるマッピングを推定し、この後者は、データシーケンスと見なされる。この方法は、一定帯域幅(CBR)の場合には、うまく適用可能であるが、可変帯域幅(VBR)システムの場合には、それ自体、常に適しているわけではない。この理由は、VBRシステムの場合には、画像品質をも考慮しているからである。画像品質が平均品質値を上回っている場合には、圧縮比を増大させ、品質が平均値を下回っている場合には、圧縮比を減少させる。ニューラルネットワーク制御システムは、この点をも考慮しなければならない。従って、制御システムが超過してはならない最小および最大量子化係数を制御ネットワークに対して指定する。これらの値は、図18cの参照番号186および187によって示されているニューロンを通じて有効になる。
VBRモードに適用されるニューラルネットワークは、CBRモードに使用されるネットワークよりも2倍多い入力を有している。なぜならば、予測される長さ/符号化済みの長さの比率に加えて、また、画像品質を表すデータも符号化済みの品質に対する予測される品質の比率の形(下記の式)で、ネットワークの入力に供給されるためである。
EQi-1/CQi-1、EQi/CQi、EQi+1/CQi+1、他
ここで、EQは、予測品質であり、CQは、符号化済みの品質であり、iは、データのインデックスを示す。
本節においては、ニューラルネットワークによって実行される改善された動的な量子化の更なる変形(いわゆるアドレス分解法)について説明する。
このネットワークモデルは、算術符号化を取り扱った節において提示したものの一種である。これが前述のネットワークと異なる点は、ネットワークの特定の選択されたニューロンのアドレッシングが、時間窓/時間スロット全体によって決定されないという点のみである。これが図19に概略的に示されており、時間窓内においてチェックされた入力データが、アドレス生成器をバイパスすることが示されている。この場合には、入力データシーケンスの要素は、0と1ではなく、従って、前述のアドレス生成手順を直接適用することは不可能である。その代わり、ニューラルネットワークの入力層が2つの部分から構成されている。到来データが、予測された/符号化済みの長さデータまたは予測された/符号化済みの品質データであるかどうかに応じて、時間窓内において検出可能なそれぞれのデータ値に対して、(先程提示した例に類似した)ハッシュ関数が、2048や256などの適切な数のニューロンから選択された1つのニューロンを割り当てる。実際には、これは、予測された/符号化済みの長さデータによって機能するニューロン(更に正確には、その重み関数)用のテーブルと、予測された/符号化済みの品質データによって機能するニューロンの重み関数用の別のテーブルという2つのニューロン重みテーブルを意味している。時間窓のサイズがN=32であり、2つのデータタイプについて、それぞれ、11および8ビットを使用してアドレス生成を実行する場合には、ニューロンの入力データを保存するのに必要なメモリのサイズは、Mem=2048*16+256*16となる(予測された/符号化済みの長さから生成されたアドレスの16x11ビット長の正規化データと、予測された/符号化済みの品質データから生成されたアドレスの16x8ビット長の正規化データとから成る)。
Cvk=VKn*211
Cm=Mn*28 式III
ここで、VKnは、正規化された予測された/符号化済みの長さの比率であり、Cvkは、生成されたアドレスであり、Mnは、正規化された品質であり、Cmは、生成されたアドレスである。
(VIII.1.)
前述のように、要求される長さに保存するために符号化されたビデオが、要求されるビデオ品質で保存できないという状況が、しばしば、発生する。これは、例えば、事前設定された圧縮比が、特性のシーケンスにとって極めて大きく、従って、現在設定されている圧縮の最小/最大限度を使用することによっては、要求される画像品質で保存できないという状況において発生しよう。このような状況は、通常、非常に詳細且つアクションの多い画面において発生する。一例として、長編映画「The Mummy Returns」の最初の5分間を挙げることができる。この特定のシーケンスの場合には、良好な品質のMPEG圧縮のために、少なくとも2.5Mビット/秒の帯域幅が必要とされるであろう。しかしながら、利用可能な帯域幅を1.5Mビット/秒に低下させると、エラーを除去するために、圧縮時および復元時の両方において、かなり複雑な事前または事後のフィルタリング処理が必要となろう。この結果、符号化したビデオの品質がほとんど「許容可能」なレベルに到達し得ない程度にまで、画像のシャープネスが大幅に低下することになろう。
前述の問題を除去するために、本発明においては、動的なスケーリングの概念を導入している。この概念は、限定された外部境界条件のために制御システムが要求される画像品質を維持できない場合に、縮小(サイズ変更)を行うことを基本的に意味している。満足できる結果が得られるサイズにフレームを縮小(サイズ変更)するのである。本システムは、この縮小されたサイズのフレームを圧縮し、復元において、これをそのオリジナルのサイズに回復する。当然のことながら、この場合には、画像品質も低下し、これは、主にシャープネスの低下となって現れる。少なくとも、圧縮比を極端に大きく設定しない限り、圧縮によって発生するブロッキングアーチファクトやその他の一般的なエラーは発生しない。
従って、本発明による動的なスケーリング法においては、スケーリングされた画像が必要である。補間に基づいたいくつかのフレームスケーリング法を試験した。Lancos法が、最良の結果をもたらした(Lancos法は、それ自体既知のリサンプリング手順であり、画像の空間周波数成分に基づいて、フィルタによって消失したピクセルを補間する)。スケーリングを伴う圧縮と伴わない圧縮を比較すると、スケーリングを伴わない場合には、ストリームを0.5Mビット/秒の転送レートで圧縮した場合に、厳しい条件のシーケンスにおいて品質低下を容易に感知可能であることが判明した。画像の多くの領域が完全に「フラット」になり、ブロックアーチファクトとストライプが出現し、画像に消しゴムを使用したかのように、いくつかの領域内において、画像のシャープネスが大幅に低下する。一方、本発明によるフレームスケーリングによって圧縮を実行した場合には、これらのエラーは、いずれも発生しない。感知可能な唯一のエラーは、シャープネスの低下である。但し、シーケンスを分析した結果、通常、高速な動きがビデオ画面において発生するポイントにおいてスケーリングが必要であることが判明した。高速な移動が発生する画面は、通常、オリジナルが既にわずかにぼやけているため、リスケーリングによって引き起こされる情報損失は、ほとんど感知不可能である。
本発明は、本発明の制御システムに伴う潜在的なアプリケーション用のいくつかの異なるネットワークタイプを試験した。これらの演算負荷と適切な制御動作を考慮した結果、意外にも、最良の結果は、最も単純な構造を有するネットワークによって生成された。いわゆるカウンタープロパゲーションタイプのネットワークも優れた結果を提供可能であり、多くの場合に、前述のバックプロパゲーションタイプのネットワークよりも良好な近似を提供するが、これは、アドレス分解法(前述の内容を参照されたい)を適用した場合のみである。要約すれば、第2の方法は、そのカウンターパートよりも格段に多くのニューロンを使用しており、これらが相対的に大きな知識ベースを提供するという事実に起因して、第1の方法よりも良好に稼働した。バックプロパゲーションまたはカウンタープロパゲーションに変換されることにより、優れた制御が提供される。
システム全体の構造が図8および図22〜図24に描かれている。圧縮の際には、フレームは、まず、スケーリングシステム(リサンプラモジュール)61を通過する(図8)。本システムは、符号化を継続するべき方法を判定し、相応して、符号化モード(I、P、B)を選択する。Iフレームの場合には、それぞれのブロックごとに、予測を実行し、本システムは、分散分析の結果に基づいて、最良の圧縮性を約束する予測を選択する。次いで、ブロックをDCTによって変換し、適切なレベルにおいて量子化および圧縮を行う。
図22を参照し、本発明によるシステムによって圧縮されたデータの復号化に適用される本発明のハイブリッドビデオ複合化器の動作について説明する。フレームの再構築は、符号化されたデータを入力バッファ121に供給し、ストリーム情報ブロック133を復号化することによって始まる。ストリーム情報ブロック133は、フレームのオリジナルのサイズと、復号化においては変化しないその他のデータを含んでいる。従って、ストリーム情報ブロック133は、復号化プロセスの開始時点において、一度復号化されるのみである。次いで、フレームヘッダ情報を復号化(段階122)する。フレームヘッダ情報ブロックは、現在のフレームサイズ、フレームタイプ(I、P、B)、量子化タイプ、および対象フレームにのみ属するその他のデータを含んでいる。
周知のように、算術符号化においては、符号化器の動作は、復号化器の動作と同一であるため、ニューラル算術復号化器は、ニューラル算術符号化モジュールと実質的に同一の方法で動作する。この方法は、適応型であるため、開始時点において、単一のビットを復号化し、復号化されたビットを使用して、新しい予測子を演算する。予測子を演算するには、符号化に使用するニューラルネットワークを変更することなしに使用可能である。符号化器と復号化器の相違点は、周知の数学的計算における違いのみであり、その他の機能的な要素は完全に同一である。
(a)デジタル変換の後に、アナログビデオ入力93およびアナログオーディオ入力105から到来する信号を符号化するモードと、
(b)デジタルビデオ信号94とオーディオ信号とを変換するモードがあり、オーディオ信号は、合成されたデジタルビデオ/オーディオ信号パケットからデマルチプレクサ109によって分離されるようなモードからなる2つのモードにおいて動作可能である。
保存されているビデオおよびオーディオデータの復号化が図24に示されている。デマルチプレクサ110が、半導体メモリ104またはハードディスク103上に保存されているデータパケットを、符号化済みのデジタルビデオデータ111と符号化済みのデジタルオーディオデータ112に分離する。デジタルビデオデータ111は、図22を参照して前述した復号化システム113によって復号化される。復号化されたビデオデータ114は、任意選択により、フィルタリングおよびスケーリングモジュール115に供給され、次いで、D/A変換器116によってアナログビデオ信号117に変換される。デマルチプレクサ110によって分離されたデジタルオーディオデータ112は、復号化器118によって復号化され、最終的に、D/Aコンバータ119によってアナログオーディオ信号112に変換される。本発明は、前述の実施例に限定されるものではなく、その他の変形および実施も考えられる。
Claims (60)
- デジタル的に符号化されたビデオフレームシーケンスを圧縮する方法であって、
a、所定のフレームをブロックに分割する段階と、
b、任意の選択により、個々のブロックを更に小さなブロックに更に分割する段階と、
c、隣接する1つまたは複数のブロック(予測用)に含まれている情報に基づいて、選択されたブロックの情報量を変更する段階と、
d、空間表現を周波数表現に変換する変換(DCT)を前記選択されたブロックに対して実行することによって変換されたブロックを生成する段階と、
e、最後に、前記変換されたブロックの前記情報量を、エントロピー符号化によって符号化する段階とを具備する方法において、
i、前記段階dに規定されている前記変換を実行する前に、前記選択されたブロックに関して圧縮性分析を実行し、前記分析の結果に応じて、
ii、前記段階c(予測)および前記段階d(DCT)を前記ブロックに対して実行するか、または、
iii、任意の選択により、前記ブロックをサブブロックに更に分割し、前記段階iに規定されている前記圧縮性分析を、個々の分割の結果として得られた前記ブロックに対して再度実行し、
iv、前記段階iおよび前記段階iiiから得られた結果に基づいて、最良の結果をもたらす可能性があるブロック分割を選択し、
v、最後に、前記最良の潜在的な結果をもたらす前記ブロック分割を使用して、前記段階cに規定されている前記予測に基づいて、前記段階dに規定されている前記変換を実行することを特徴とする方法。 - 個々のブロック分割に属するブロックの前記圧縮性分析は、前記ブロックの情報および/または個々のブロックタイプの発生頻度を考慮して実行されることを特徴とする請求項1に記載の方法。
- 前記圧縮性分析において、前記ブロックの情報に対して、直接的に、またはアダマールフィルタを介して、分散分析を適用することを特徴とする請求項1に記載の方法。
- 所定のフレーム内の最大許容ブロックサイズを有するブロックに割り当てられている特定のデータをエントロピー符号化によって更に符号化し、前記特定のデータは、それらが割り当てられている前記ブロックの前記ブロック分割を表していること(四分木)を特徴とする請求項1から4のいずれか一項に記載の方法。
- 前記空間ドメインにおける表現を前記周波数ドメインにおける表現に変換する前記変換として、離散コサイン変換(DCT)を適用することを特徴とする請求項1から5のいずれか一項に記載の方法。
- 16x16ピクセルよりも小さいブロックに対してDCTを適用し、16x16ピクセルのサイズを有するブロックに対しては、アダマール変換を適用することを特徴とする請求項6に記載の方法。
- 前記個別ブロックの前記予測の際に、複数の予測モードを使用して予測を実行し、最小の「sum」値をもたらす予測モードが前記所定のブロックに対して適用されることを特徴とする請求項8に記載の方法。
- 2つの最も頻繁に発生するブロックサイズの発生頻度が特定の値を上回っていることが個々のブロックサイズの発生カウントによって確認された場合に、すべてのブロックを前記2つの最も頻繁に発生するブロックサイズのブロックによって置換することを特徴とする請求項1から9のいずれか一項に記載の方法。
- ブロックの前記圧縮性分析の際に、誤差を演算し、閾値を上回る前記誤差に寄与する前記ブロックを、前記演算された誤差を考慮して、更なるサブブロックに分割することを特徴とする請求項1から10のいずれか一項に記載の方法。
- 所定のサブブロックのケースにおいて前記誤差が既定値を上回っている場合に、前記サブブロックを更に小さなサブブロックに分割し、前記更に小さなサブブロックを含む前記結果的に得られたブロック分割に対して前記圧縮性分析を実行することを特徴とする請求項11に記載の方法。
- 16x16、8x8、4x4、または2x2のサイズの前記ブロックおよび前記サブブロックを使用することを特徴とする請求項1から12のいずれか一項に記載の方法。
- デジタル的に符号化されたビデオフレームシーケンスを圧縮する方法であって、
a、所定のフレームを2次元のブロックに分割する段階と、
b、特定のケースにおいては、個別のブロックを更なるサブブロックに分割することにより、前記フレームのブロック分割を確立する段階と、
c、空間表現を周波数表現に変換する変換(DCT)を前記ブロックの情報量に対して実行し、これにより、変換済みの多数要素の2次元ブロック(DCT係数のマトリックス)を生成する段階と、
d、外部境界条件に従って前記変換済みのブロックの前記要素を変更する段階(量子化)と、
e、最後に、エントロピー符号化により、前記変換済みのブロック内に含まれている前記情報を符号化する段階とを有する方法において、
前記段階dにおいて、前記変換済みの多数要素の2次元ブロック内におけるデータの前記変更は、前記ブロックのサイズおよび符号化されたデータを伝送するのに利用可能な帯域幅に応じて実行されることを特徴とする方法。 - 前記変換済みのブロックの前記変更は、量子化であることを特徴とする請求項14に記載の方法。
- 前記matrix(j)の値は、経験値が設定されたマトリックステーブルから取得され、前記テーブルの個々の要素は、matrix(j)マトリックス全体であり、前記テーブルからの選択は、前記段階dに規定されている前記外部境界条件に応じて実行されることを特徴とする請求項16に記載の方法。
- 前記テーブルからの前記選択は、前記QP量子化係数の値に関連して実行されることを特徴とする請求項16または17に記載の方法。
- 前記QPドメイン全体が、個々のサブドメインに割り当てられたマトリックステーブルを有するN個のサブドメインに分割され、この場合に、前記マトリックステーブルのサイズは、前記ブロックサイズに対応しており、それぞれのサブドメインは、事前に規定されている帯域幅の範囲に割り当てられることを特徴とする請求項16から18のいずれか一項に記載の方法。
- 前記段階dの前記外部境界条件は、利用可能なストレージ容量および/または利用可能な帯域幅によって課されることを特徴とする請求項16から19のいずれか一項に記載の方法。
- 特定のケースにおいて、前記選択されたブロックの前記情報量は、前記段階cにおいて実行される前記変換に先立って、隣接する1つまたは複数のブロックの以前に選択された画像要素内に含まれている情報(予測)、または参照フレーム内に含まれている参照ブロックの情報量に基づいて、変更されることを特徴とする請求項14から20のいずれか一項に記載の方法。
- イントラフレームを符号化するように、請求項1から13のいずれか一項に記載の方法の段階が実行されることを特徴とする請求項14から21のいずれか一項に記載の方法。
- デジタル的に符号化されたビデオフレームシーケンスを圧縮する方法であって、特定フレームの情報量は、先行するまたは後続するフレーム(参照フレーム)の情報から符号化され、
a、前記符号化対象のフレームをブロックに分割する段階と、
b、前記符号化対象のブロックを含む前記フレームより先行するまたは後続する前記参照画像内において、前記符号化対象のブロックと一致する参照ブロックを探索する段階と、
c、一致した参照ブロックと前記符号化対象のブロックとを比較することによって圧縮性分析を実行する段階と、
d、前記圧縮性分析の結果に基づいて、前記最良の参照ブロックを選択する段階と、
e、前記選択された最良の参照ブロックを使用して前記ブロックを符号化する段階と、を有する方法において、
参照ブロックの前記探索の際に、前記段階bにおいて、
i、前記符号化対象のブロックをサブブロックに分割し、
ii、前記サブブロックの情報を分析し、
iii、事前に規定されている基準に従って、事前に定められた数のサブブロックを、好ましくは少なくとも2つは選択し、
iv、前記選択したサブブロックを使用して、参照ブロック探索を実行し、前記探索は、前記選択したサブブロックからの違いが最も少ないサブブロックを含む前記参照ブロックについて、選択された参照フレーム内において、特定の探索範囲内において実行され、前記選択されたブロックの相対的な位置は、前記探索において一定に維持され、
v、前記選択されたサブブロックを使用した探索の結果として、前記最良の参照ブロックが選択されることを特徴とする方法。 - 前記段階vにおいて、探索によって現在の参照ブロックよりも良好なブロックが検出されるたびに、新しく検出されたブロックの位置データを多数要素を格納する循環バッファ内に書き込み、前記バッファの最後の要素が前記最良のサブブロックの位置を格納する方式によって、前記最良の参照ブロックが選択されることを特徴とする請求項23に記載の方法。
- 参照探索は、前記符号化対象のブロック全体を使用して実行され、前記探索は、前記最良の参照ブロックと考えられる参照ブロックの近傍において実行され、前記最終的な参照ブロックは、前記符号化対象のブロック全体を使用して実行された前記探索の結果に応じて選択されることを特徴とする請求項23または24に記載の方法。
- 前記符号化対象のブロックと前記参照ブロックとの絶対二乗差を評価し、前記評価された絶対二乗差に基づいて、前記参照ブロックの許容可能性に関する判定を行うことを特徴とする請求項23から25のいずれか一項に記載の方法。
- 前記参照ブロック探索は、フィルタ処理された参照フレーム内において実行されることを特徴とする請求項23から26のいずれか一項に記載の方法。
- 前記探索結果が依然として不満足である場合に、更なる参照フレーム内に配置されている探索範囲内において、参照ブロック探索を実行することを特徴とする請求項23から27のいずれか一項に記載の方法。
- 前記探索がすべての参照フレーム内において不成功であった場合に、前記符号化対象のブロックをサブブロックに分割し、それぞれのサブブロックごとに、一致する参照サブブロックを探索し、前記探索は、それまで最良の結果をもたらしていた参照フレーム内において最良と考えられる参照フレーム位置の近傍において実行されることを特徴とする請求項23から28のいずれか一項に記載の方法。
- 前記符号化対象のブロックをサブブロックに分割することにより、満足できる結果が生成されなかった場合には、他の参照フレームの最良の位置の近傍において前記参照サブブロックの探索を実行することを特徴とする請求項29に記載の方法。
- サブブロックが誤った状態に留まった場合には、前記誤りを有するサブブロックを更に小さなサブブロックに更に分割し、前記探索を反復することを特徴とする請求項29または30に記載の方法。
- 前記符号化対象のブロックを前記参照ブロックから減算し、前記差分ブロックを前記段階eにおいて符号化することを特徴とする請求項23から31のいずれか一項に記載の方法。
- 空間表現を周波数表現に変換する変換(DCTまたはアダマール変換)を前記差分ブロックの情報量に対して実行し、これにより、変換済みの多数要素の2次元ブロック(DCTまたはアダマール係数のマトリックス)を生成し、エントロピー符号化により、前記変換済みのブロックの情報量を符号化することを特徴とする請求項23から32のいずれか一項に記載の方法。
- 前記符号化プロセスにおいて、請求項1から13の中のいずれか一項に記載の方法の段階が実行されることを特徴とする請求項23から32のいずれか一項に記載の方法。
- デジタル的に符号化されたビデオフレームシーケンスを圧縮する方法であって、
a、それぞれのフレームを、別個に符号化する対象であるブロックに分割する段階と、
b、空間表現を周波数表現に変換する変換(DCT)を前記ブロックの情報量に対して実行し、これにより、変換済みのブロックを生成する段階と、
e、最後に、エントロピー符号化により、前記変換済みのブロック内に含まれている情報を符号化し、エントロピー符号化として算術符号化を適用し、この際に、
・前記ビットシーケンスの連続したビットの値の関数としてインターバルの下限と上限を変更することによって、ビットシーケンスを符号化し、
・前記インターバルの前記限度を変更する前記関数において、前記シーケンスの既に到着しているビットの分布を考慮するような段階とを有する方法において、
・前記ビットシーケンスの既に到着しているビット値からアドレスを生成し、
・複数の処理要素を有するニューラルネットワークの個々の処理要素をアドレス指定するように前記アレドレスを適用し
・個々のアドレス指定処理の頻度と前記ビットシーケンスの現在到着しているビットの値を入力として使用するように、前記処理要素のパラメータを変更し、且つ、前記インターバルの前記下限および上限を変更するパラメータを判定するべく、前記ニューラルネットワークの出力を適用し、
・複数ビットの処理を伴う初期学習フェーズの後に、到来ビットの符号化の際に、前記インターバルの前記上限または下限を前記ニューラルネットワークの前記出力の関数として判定することを特徴とする方法。 - 前記符号化対象の到来ビットシーケンスをバッファに供給し、多数の更に短いビットシーケンスに分割することを特徴とする請求項35に記載の方法。
- 前記更に短いビットシーケンスのビットによって表されたバイナリ値をアドレスと見なすことを特徴とする請求項36に記載の方法。
- 前記アドレスをテーブルの行を選択するために使用し、前記テーブルは、前記符号化対象の現在のビットの可能な値の発生頻度を表す関数値と、少なくとも1つの重み関数を含んでいることを特徴とする請求項35から37のいずれか一項に記載の方法。
- 個々のニューロンの前記重み関数を前記符号化対象のビットの可能な値の発生頻度を表す関数値の関数として変更することを特徴とする請求項38に記載の方法。
- 前記アドレスの可能なアドレス範囲が、互いに結合を形成している(少なくとも部分的にオーバーラップしている)ことを特徴とする請求項35に記載の方法。
- 前記ニューラルネットワークの利得および学習係数を前記境界条件に応じて動的に調節することを特徴とする請求項35から40のいずれか一項に記載の方法。
- 符号器は、各レベルのパラメータが個別に調整可能となる異なるレベルで使用され、各レベルに割り当てられた専用パラメータによって動作するニューラルネットワークと一緒に使用されることを特徴とする請求項35から41のいずれか一項に記載の方法。
- 前記符号化プロセスにおいて、請求項1から34の中のいずれか一項に記載の方法の段階を実行することを特徴とする請求項35から42のいずれか一項に記載の方法。
- デジタル的に符号化されたビデオフレームシーケンスを圧縮する方法であって、
a、所定のフレームを2次元ブロックに分割する段階と、
b、空間表現を周波数表現に変換する変換(DCT)をブロックの情報量に対して実行し、これにより、変換済みの多数要素の2次元ブロック(DCT係数のマトリックス)を生成する段階と、
c、外部境界条件に従って前記変換済みのブロックの要素を変更する段階(量子化)と、
d、最後に、エントロピー符号化によって、変換済みのブロック内に含まれている情報を符号化する段階とを有する方法において、
前記変換済みの多数要素の2次元ブロックのデータの変更を、前記段階cにおいて、ニューラルネットワークの出力の関数として実行することを特徴とする方法。 - 前記ニューラルネットワークは、バックプロパゲーションまたはカウンタープロパゲーションの構造を有しているか、または多数のニューロンから構成された単純なネットワークであり、
・予想された/符号化済みの長さおよび予想された/符号化済みの品質の正規化された値を入力データとして使用し、
・事前に受信された入力データと現在の入力データとの特定な数を時間窓(時間的スロット)内において保存し、前記時間窓(時間的スロット)内に含まれている前記データを前記ニューラルネットワークの入力ニューロンに割り当てることを特徴とする請求項44に記載の方法。 - 前記ニューラルネットワークの入力層内のニューロンの数は、前記時間窓内に保存されているデータ要素の数と等しいことを特徴とする請求項45に記載の方法。
- 前記ネットワークは、隠れ層を有することを特徴とする請求項46に記載の方法。
- 前記隠れ層内のニューロンの数は、前記入力層内のニューロンの数よりも大きいことを特徴とする請求項47に記載の方法。
- 正規化された予測された/符号化済みの長さ値と予想された/符号化済みの品質値を入力データとして適用し、
・既定数(N)(好ましくは、N=31またはN=63)の以前に受信された入力データ要素を前記現在の入力データと共に時間窓内に保存し、前記時間スロット内に含まれている前記データに基づいてアドレスを生成し、
・入力データを前記アドレス生成プロセス用の所定ビット長に丸め、
・ハッシュ関数によって前記時間窓のそれぞれの要素からアドレスを生成し、前記アドレスは、前記ニューラルネットワークの処理要素の中の1つに対応するテーブルの要素を指し示していることを特徴とする請求項44に記載の方法。 - 予測された/符号化済みの長さおよび品質データをアドレス生成のために丸める前に、そのオリジナルの形態における前記予測された/符号化済みの長さおよび品質データを利用して、前記ニューラルネットワークを事前学習されることを特徴とする請求項49に記載の方法。
- 前記時間窓内に含まれている前記データから、ハッシュ関数によってアドレスを生成することを特徴とする請求項49または50に記載の方法。
- 前記ニューラルネットワークの残りの部分から独立した2つの処理要素の入力データとして、最小および最大の許容帯域幅値を適用することを特徴とする請求項44から51のいずれか一項に記載の方法。
- 前記ニューラルネットワークの処理要素と2つの独立した処理要素によって生成される結果が2つの出力として出現する請求項52に記載の方法。
- 前記ニューラルネットワークの出力は、フレームサイズのスケーリングファクタおよび/または量子化係数であることを特徴とする請求項52に記載の方法。
- 前記ニューラルネットワークの出力は、フレームサイズのスケーリングファクタおよび/または量子化係数であることを特徴とする請求項52に記載の方法。
- 前記符号化プロセスにおいて、請求項1から43のいずれか一項に記載の方法の段階を実行する請求項44から55のいずれか一項に記載の方法。
- デジタルビデオデータを符号化する装置であって、請求項1から55のいずれか一項に記載の方法の段階を実行するように適合された手段を有することを特徴とする装置。
- 請求項1から55のいずれか一項に記載の方法の段階を実行する命令を含むソフトウェア。
- 請求項1から55のいずれか一項に記載の圧縮方法によって生成される符号化のシーケンス。
- 請求項1から55のいずれか一項に記載の圧縮方法によって生成される符号化シーケンスにより符号化されたビデオデータを復号化する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
HU0301368A HUP0301368A3 (en) | 2003-05-20 | 2003-05-20 | Method and equipment for compressing motion picture data |
PCT/HU2004/000055 WO2004104930A2 (en) | 2003-05-20 | 2004-05-20 | Hybrid video compression method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007503784A true JP2007503784A (ja) | 2007-02-22 |
JP2007503784A5 JP2007503784A5 (ja) | 2007-07-12 |
Family
ID=89981373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006530613A Pending JP2007503784A (ja) | 2003-05-20 | 2004-05-20 | ハイブリッドビデオ圧縮法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US8086052B2 (ja) |
EP (1) | EP1629437A2 (ja) |
JP (1) | JP2007503784A (ja) |
KR (1) | KR20060027795A (ja) |
CN (1) | CN1857001B (ja) |
CA (1) | CA2526450A1 (ja) |
HU (1) | HUP0301368A3 (ja) |
NO (1) | NO20055660L (ja) |
WO (1) | WO2004104930A2 (ja) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006014342A (ja) * | 2004-06-27 | 2006-01-12 | Apple Computer Inc | ビデオ・データを符号化するための符号化タイプおよび予測モードの選択 |
US8228998B2 (en) | 2006-10-10 | 2012-07-24 | Nippon Telegraph And Telephone Corporation | Intra prediction encoding control method and apparatus, program therefor, and storage medium which stores the program |
US8254459B2 (en) | 2002-07-14 | 2012-08-28 | Apple Inc. | Adaptive motion estimation |
WO2012115486A2 (ko) * | 2011-02-25 | 2012-08-30 | 삼성전자 주식회사 | 영상의 변환 방법 및 장치, 및 영상의 역변환 방법 및 장치 |
JP2013502144A (ja) * | 2009-08-14 | 2013-01-17 | サムスン エレクトロニクス カンパニー リミテッド | ビデオ符号化方法及び装置、ビデオ復号化方法及び装置 |
JP2013502808A (ja) * | 2009-08-17 | 2013-01-24 | サムスン エレクトロニクス カンパニー リミテッド | 映像の符号化方法及びその装置、並びに映像の復号化方法及びその装置 |
WO2013014693A1 (ja) | 2011-07-22 | 2013-01-31 | 株式会社日立製作所 | 動画像復号化方法及び画像符号化方法 |
US8737479B2 (en) | 2004-06-27 | 2014-05-27 | Apple Inc. | Encoding mode pruning during video encoding |
JP2015136156A (ja) * | 2009-10-23 | 2015-07-27 | サムスン エレクトロニクス カンパニー リミテッド | ビデオデータを復号化する方法及び装置 |
JP2015149737A (ja) * | 2010-04-13 | 2015-08-20 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 細分割を使用した2次元情報信号の空間的なサンプリングの符号化 |
KR20150095479A (ko) * | 2014-02-13 | 2015-08-21 | 삼성전자주식회사 | 영상 부호화, 복호화 방법 및 장치 |
JP2015180083A (ja) * | 2009-08-14 | 2015-10-08 | サムスン エレクトロニクス カンパニー リミテッド | 映像復号化方法及び装置 |
US9247252B2 (en) | 2011-01-26 | 2016-01-26 | Hitachi, Ltd. | Image decoding device |
JP2016178645A (ja) * | 2009-07-01 | 2016-10-06 | トムソン ライセンシングThomson Licensing | ビデオエンコーダおよびデコーダについての大きなブロックにつきイントラ予測を信号伝達する方法および装置 |
JP2016197906A (ja) * | 2016-07-25 | 2016-11-24 | ソニー株式会社 | 画像処理装置および方法、記録媒体、並びにプログラム |
JP2017184273A (ja) * | 2009-02-23 | 2017-10-05 | コリア アドバンスド インスティテュート オブ サイエンス アンド テクノロジー | ビデオ符号化での分割ブロック符号化方法、ビデオ復号化での分割ブロック復号化方法及びこれを実現する記録媒体 |
US9807427B2 (en) | 2010-04-13 | 2017-10-31 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
JP2017212751A (ja) * | 2009-07-24 | 2017-11-30 | サムスン エレクトロニクス カンパニー リミテッド | 映像の符号化方法及び装置 |
US20190089962A1 (en) | 2010-04-13 | 2019-03-21 | Ge Video Compression, Llc | Inter-plane prediction |
US10248966B2 (en) | 2010-04-13 | 2019-04-02 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
JP2019140680A (ja) * | 2018-02-09 | 2019-08-22 | 株式会社Preferred Networks | オートエンコーダ装置、データ処理システム、データ処理方法及びプログラム |
JP2020522153A (ja) * | 2017-05-26 | 2020-07-27 | グーグル エルエルシー | ニューラルネットワークを使用するタイル型画像圧縮 |
JP2021520087A (ja) * | 2018-04-27 | 2021-08-12 | インターデジタル ヴイシー ホールディングス, インコーポレイテッド | Cabacのニューラルネットワーク実装に基づくビデオの符号化及び復号のための方法及び機器 |
JP2022541215A (ja) * | 2019-07-15 | 2022-09-22 | 華為技術有限公司 | ウェーブレット変換に基づく画像符号化/復号方法および装置 |
WO2022225025A1 (ja) * | 2021-04-23 | 2022-10-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 画像復号方法、画像符号化方法、画像復号装置、及び画像符号化装置 |
Families Citing this family (246)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4263140B2 (ja) * | 2003-08-04 | 2009-05-13 | Necエレクトロニクス株式会社 | データ記録装置、データ記録方法及び記録制御プログラム |
EP1605706A2 (en) * | 2004-06-09 | 2005-12-14 | Broadcom Corporation | Advanced video coding (AVC) intra prediction scheme |
US20050286777A1 (en) * | 2004-06-27 | 2005-12-29 | Roger Kumar | Encoding and decoding images |
WO2006067731A1 (en) * | 2004-12-22 | 2006-06-29 | Koninklijke Philips Electronics N.V. | Video stream modifier |
JP2006333436A (ja) | 2005-01-07 | 2006-12-07 | Ntt Docomo Inc | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、及び、動画像復号プログラム |
US7587401B2 (en) * | 2005-03-10 | 2009-09-08 | Intel Corporation | Methods and apparatus to compress datasets using proxies |
US7830921B2 (en) * | 2005-07-11 | 2010-11-09 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signal |
JP4839035B2 (ja) * | 2005-07-22 | 2011-12-14 | オリンパス株式会社 | 内視鏡用処置具および内視鏡システム |
KR100750137B1 (ko) | 2005-11-02 | 2007-08-21 | 삼성전자주식회사 | 영상의 부호화,복호화 방법 및 장치 |
US8780997B2 (en) * | 2005-11-18 | 2014-07-15 | Apple Inc. | Regulation of decode-side processing based on perceptual masking |
US20070147510A1 (en) * | 2005-12-27 | 2007-06-28 | Islam Asad | Method and module for altering color space parameters of video data stream in compressed domain |
US20070160134A1 (en) * | 2006-01-10 | 2007-07-12 | Segall Christopher A | Methods and Systems for Filter Characterization |
US8014445B2 (en) * | 2006-02-24 | 2011-09-06 | Sharp Laboratories Of America, Inc. | Methods and systems for high dynamic range video coding |
US8194997B2 (en) * | 2006-03-24 | 2012-06-05 | Sharp Laboratories Of America, Inc. | Methods and systems for tone mapping messaging |
US8532176B2 (en) * | 2006-07-10 | 2013-09-10 | Sharp Laboratories Of America, Inc. | Methods and systems for combining layers in a multi-layer bitstream |
US8422548B2 (en) * | 2006-07-10 | 2013-04-16 | Sharp Laboratories Of America, Inc. | Methods and systems for transform selection and management |
US8059714B2 (en) * | 2006-07-10 | 2011-11-15 | Sharp Laboratories Of America, Inc. | Methods and systems for residual layer scaling |
US7840078B2 (en) * | 2006-07-10 | 2010-11-23 | Sharp Laboratories Of America, Inc. | Methods and systems for image processing control based on adjacent block characteristics |
US7885471B2 (en) * | 2006-07-10 | 2011-02-08 | Sharp Laboratories Of America, Inc. | Methods and systems for maintenance and use of coded block pattern information |
US8130822B2 (en) * | 2006-07-10 | 2012-03-06 | Sharp Laboratories Of America, Inc. | Methods and systems for conditional transform-domain residual accumulation |
WO2008084817A1 (ja) * | 2007-01-09 | 2008-07-17 | Kabushiki Kaisha Toshiba | 画像符号化と復号化の方法及び装置 |
CN101222641B (zh) * | 2007-01-11 | 2011-08-24 | 华为技术有限公司 | 帧内预测编解码方法及其装置 |
US8503524B2 (en) * | 2007-01-23 | 2013-08-06 | Sharp Laboratories Of America, Inc. | Methods and systems for inter-layer image prediction |
US7826673B2 (en) * | 2007-01-23 | 2010-11-02 | Sharp Laboratories Of America, Inc. | Methods and systems for inter-layer image prediction with color-conversion |
US8233536B2 (en) * | 2007-01-23 | 2012-07-31 | Sharp Laboratories Of America, Inc. | Methods and systems for multiplication-free inter-layer image prediction |
US8665942B2 (en) * | 2007-01-23 | 2014-03-04 | Sharp Laboratories Of America, Inc. | Methods and systems for inter-layer image prediction signaling |
US7760949B2 (en) | 2007-02-08 | 2010-07-20 | Sharp Laboratories Of America, Inc. | Methods and systems for coding multiple dynamic range images |
US8767834B2 (en) | 2007-03-09 | 2014-07-01 | Sharp Laboratories Of America, Inc. | Methods and systems for scalable-to-non-scalable bit-stream rewriting |
KR101403338B1 (ko) * | 2007-03-23 | 2014-06-09 | 삼성전자주식회사 | 영상의 부호화, 복호화 방법 및 장치 |
KR100793285B1 (ko) * | 2007-05-11 | 2008-01-10 | 주식회사 코아로직 | 필터 매트릭스에 의한 영상 노이즈 제거 시스템, 방법 및그 기록매체 |
JP5008484B2 (ja) * | 2007-07-11 | 2012-08-22 | 株式会社日立国際電気 | 映像処理方法 |
US7925101B2 (en) * | 2007-09-05 | 2011-04-12 | Himax Technologies Limited | Apparatus for controlling image compression |
KR20100111660A (ko) * | 2007-09-11 | 2010-10-15 | 알지비 라이트 리미티드 | 개선된 영상 압축을 위한 바이트 표현 |
US8228983B2 (en) * | 2007-12-04 | 2012-07-24 | Hong Kong Applied Science And Technology Research | Method and device for order-16 integer transform from order-8 integer cosine transform |
US20090154567A1 (en) * | 2007-12-13 | 2009-06-18 | Shaw-Min Lei | In-loop fidelity enhancement for video compression |
US8401071B2 (en) * | 2007-12-19 | 2013-03-19 | Sony Corporation | Virtually lossless video data compression |
US8175158B2 (en) * | 2008-01-04 | 2012-05-08 | Sharp Laboratories Of America, Inc. | Methods and systems for inter-layer image prediction parameter determination |
KR20090097013A (ko) * | 2008-03-10 | 2009-09-15 | 삼성전자주식회사 | 영상 부호화장치 및 영상 복호화장치 |
US8160141B2 (en) * | 2008-03-17 | 2012-04-17 | Sony Corporation | Advanced video coded pictures—reduced cost computation of an intra mode decision in the frequency domain |
US8108401B2 (en) * | 2008-03-28 | 2012-01-31 | International Business Machines Corporation | Applying various hash methods used in conjunction with a query with a group by clause |
US7827187B2 (en) * | 2008-04-04 | 2010-11-02 | International Business Machines Corporation | Frequency partitioning: entropy compression with fixed size fields |
US8199823B2 (en) * | 2008-04-15 | 2012-06-12 | Sony Corporation | Estimation of B frame average rate quantization parameter (QP) in a group of pictures (GOP) |
US8199814B2 (en) * | 2008-04-15 | 2012-06-12 | Sony Corporation | Estimation of I frame average rate quantization parameter (QP) in a group of pictures (GOP) |
US8189677B2 (en) * | 2008-04-15 | 2012-05-29 | Sony Corporation | Estimation of P frame average rate quantization parameter (QP) in a group of pictures (GOP) |
KR101596829B1 (ko) * | 2008-05-07 | 2016-02-23 | 엘지전자 주식회사 | 비디오 신호의 디코딩 방법 및 장치 |
US8761253B2 (en) * | 2008-05-28 | 2014-06-24 | Nvidia Corporation | Intra prediction mode search scheme |
US8099440B2 (en) | 2008-08-15 | 2012-01-17 | International Business Machines Corporation | Method for laying out fields in a database in a hybrid of row-wise and column-wise ordering |
US8325801B2 (en) | 2008-08-15 | 2012-12-04 | Mediatek Inc. | Adaptive restoration for video coding |
KR101619972B1 (ko) * | 2008-10-02 | 2016-05-11 | 한국전자통신연구원 | 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법 |
US8503527B2 (en) | 2008-10-03 | 2013-08-06 | Qualcomm Incorporated | Video coding with large macroblocks |
KR101590633B1 (ko) | 2008-11-11 | 2016-02-02 | 삼성전자주식회사 | 슬라이스 단위로 분할된 동영상을 처리하는 동영상 부호화/복호화장치 및 동영상 부호화/복호화방법 |
US8831099B2 (en) | 2008-12-17 | 2014-09-09 | Nvidia Corporation | Selecting a macroblock encoding mode by using raw data to compute intra cost |
US20100158105A1 (en) * | 2008-12-19 | 2010-06-24 | Nvidia Corporation | Post-processing encoding system and method |
JP5151999B2 (ja) * | 2009-01-09 | 2013-02-27 | セイコーエプソン株式会社 | 画像処理装置及び画像処理方法 |
US9432674B2 (en) * | 2009-02-02 | 2016-08-30 | Nvidia Corporation | Dual stage intra-prediction video encoding system and method |
US8370326B2 (en) | 2009-03-24 | 2013-02-05 | International Business Machines Corporation | System and method for parallel computation of frequency histograms on joined tables |
KR101527085B1 (ko) * | 2009-06-30 | 2015-06-10 | 한국전자통신연구원 | 인트라 부호화/복호화 방법 및 장치 |
JP5359657B2 (ja) * | 2009-07-31 | 2013-12-04 | ソニー株式会社 | 画像符号化装置および方法、記録媒体、並びにプログラム |
KR101474756B1 (ko) | 2009-08-13 | 2014-12-19 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
KR101452859B1 (ko) | 2009-08-13 | 2014-10-23 | 삼성전자주식회사 | 움직임 벡터를 부호화 및 복호화하는 방법 및 장치 |
KR101624649B1 (ko) * | 2009-08-14 | 2016-05-26 | 삼성전자주식회사 | 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
KR101452860B1 (ko) * | 2009-08-17 | 2014-10-23 | 삼성전자주식회사 | 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치 |
KR101712097B1 (ko) * | 2009-08-19 | 2017-03-03 | 삼성전자 주식회사 | 유연한 직교 변환에 기초한 영상 부호화, 복호화 방법 및 장치 |
KR101698499B1 (ko) * | 2009-10-01 | 2017-01-23 | 에스케이텔레콤 주식회사 | 분할 레이어를 이용한 영상 부호화/복호화 방법 및 장치 |
KR101694399B1 (ko) * | 2009-10-07 | 2017-01-09 | 에스케이 텔레콤주식회사 | 적응적 부호화 패턴 정보를 생성/이용하는 동영상 부호화/복호화 방법, 장치 및 기록 매체 |
US9565439B2 (en) * | 2009-10-15 | 2017-02-07 | Nbcuniversal Media, Llc | System and method for enhancing data compression using dynamic learning and control |
KR101504887B1 (ko) * | 2009-10-23 | 2015-03-24 | 삼성전자 주식회사 | 데이터 단위 레벨의 독립적 파싱 또는 복호화에 따른 비디오 복호화 방법 및 그 장치, 그리고 데이터 단위 레벨의 독립적 파싱 또는 복호화를 위한 비디오 부호화 방법 및 그 장치 |
KR101452713B1 (ko) | 2009-10-30 | 2014-10-21 | 삼성전자주식회사 | 픽처 경계의 부호화 단위를 부호화, 복호화 하는 방법 및 장치 |
KR101710883B1 (ko) * | 2009-11-04 | 2017-02-28 | 삼성전자주식회사 | 필터 정보를 이용한 영상 압축 장치 및 방법과 영상 복원 장치 및 방법 |
JP5684823B2 (ja) * | 2009-11-06 | 2015-03-18 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ハイブリッド映像符号化 |
KR101491864B1 (ko) | 2009-11-30 | 2015-02-11 | 한국전자통신연구원 | 엔트로피 부호화를 위한 하이브리드 예측 장치 및 그 방법 |
KR101484280B1 (ko) | 2009-12-08 | 2015-01-20 | 삼성전자주식회사 | 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치 |
KR101674078B1 (ko) * | 2009-12-16 | 2016-11-08 | 삼성전자 주식회사 | 블록 기반의 영상 잡음 제거 방법 및 장치 |
US9516335B2 (en) | 2009-12-24 | 2016-12-06 | Intel Corporation | Wireless display encoder architecture |
US8559519B2 (en) * | 2010-01-08 | 2013-10-15 | Blackberry Limited | Method and device for video encoding using predicted residuals |
US20110170608A1 (en) * | 2010-01-08 | 2011-07-14 | Xun Shi | Method and device for video transcoding using quad-tree based mode selection |
US8358698B2 (en) * | 2010-01-08 | 2013-01-22 | Research In Motion Limited | Method and device for motion vector estimation in video transcoding using full-resolution residuals |
US8315310B2 (en) * | 2010-01-08 | 2012-11-20 | Research In Motion Limited | Method and device for motion vector prediction in video transcoding using full resolution residuals |
US8340188B2 (en) * | 2010-01-08 | 2012-12-25 | Research In Motion Limited | Method and device for motion vector estimation in video transcoding using union of search areas |
CN102792691B (zh) * | 2010-01-12 | 2016-07-06 | Lg电子株式会社 | 视频信号的处理方法和设备 |
KR101675118B1 (ko) * | 2010-01-14 | 2016-11-10 | 삼성전자 주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101487687B1 (ko) * | 2010-01-14 | 2015-01-29 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
KR101457396B1 (ko) * | 2010-01-14 | 2014-11-03 | 삼성전자주식회사 | 디블로킹 필터링을 이용한 비디오 부호화 방법과 그 장치, 및 디블로킹 필터링을 이용한 비디오 복호화 방법 및 그 장치 |
KR101703327B1 (ko) * | 2010-01-14 | 2017-02-06 | 삼성전자 주식회사 | 계층적 데이터 단위의 패턴 정보를 이용하는 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
CN105472394B (zh) | 2010-01-15 | 2018-11-30 | 三星电子株式会社 | 用于预测编码的使用可变分区的视频编码的方法和设备以及用于预测编码的使用可变分区的视频解码的方法和设备 |
CN106454380B (zh) * | 2010-01-15 | 2019-04-05 | 三星电子株式会社 | 对视频进行解码的方法 |
US9100649B2 (en) | 2010-02-10 | 2015-08-04 | Lg Electronics Inc. | Method and apparatus for processing a video signal |
KR101750046B1 (ko) * | 2010-04-05 | 2017-06-22 | 삼성전자주식회사 | 트리 구조에 따른 부호화 단위에 기반한 인루프 필터링을 수반하는 비디오 부호화 방법과 그 장치 및 복호화 방법과 그 장치 |
WO2011126283A2 (en) * | 2010-04-05 | 2011-10-13 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video based on internal bit depth increment, and method and apparatus for decoding video based on internal bit depth increment |
KR101682147B1 (ko) | 2010-04-05 | 2016-12-05 | 삼성전자주식회사 | 변환 및 역변환에 기초한 보간 방법 및 장치 |
WO2011126282A2 (en) | 2010-04-05 | 2011-10-13 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index |
WO2011126277A2 (en) | 2010-04-05 | 2011-10-13 | Samsung Electronics Co., Ltd. | Low complexity entropy-encoding/decoding method and apparatus |
CN106162178B (zh) * | 2010-04-13 | 2019-08-13 | 三星电子株式会社 | 执行去块滤波的对视频进行解码的设备 |
AU2015202094B2 (en) * | 2010-04-13 | 2016-11-17 | Samsung Electronics Co., Ltd. | Video-encoding method and video-encoding apparatus based on encoding units determined in accordance with a tree structure, and video-decoding method and video-decoding apparatus based on encoding units determined in accordance with a tree structure |
US8837592B2 (en) * | 2010-04-14 | 2014-09-16 | Mediatek Inc. | Method for performing local motion vector derivation during video coding of a coding unit, and associated apparatus |
US8638863B1 (en) | 2010-05-18 | 2014-01-28 | Google Inc. | Apparatus and method for filtering video using extended edge-detection |
JP2012019490A (ja) * | 2010-07-09 | 2012-01-26 | Sony Corp | 画像処理装置及び画像処理方法 |
RU2607254C2 (ru) * | 2010-08-17 | 2017-01-10 | Самсунг Электроникс Ко., Лтд. | Способ и устройство кодирования видео, использующие блок преобразования переменной древовидной структуры, и способ и устройство декодирования видео |
WO2012034231A1 (en) * | 2010-09-14 | 2012-03-22 | Research In Motion Limited | Methods and devices for data compression with adaptive filtering in the transform domain |
US9159112B2 (en) * | 2010-09-16 | 2015-10-13 | Hewlett-Packard Development Company, L.P. | Digital watermarking using saturation patterns |
KR101719448B1 (ko) | 2010-09-27 | 2017-03-23 | 엘지전자 주식회사 | 블록 분할 방법 및 복호화 장치 |
EP3404918A1 (en) | 2010-09-30 | 2018-11-21 | Samsung Electronics Co., Ltd. | Video decoding method for decoding hierarchical-structure symbols |
US9532059B2 (en) | 2010-10-05 | 2016-12-27 | Google Technology Holdings LLC | Method and apparatus for spatial scalability for video coding |
US8442988B2 (en) | 2010-11-04 | 2013-05-14 | International Business Machines Corporation | Adaptive cell-specific dictionaries for frequency-partitioned multi-dimensional data |
EP2654301A4 (en) * | 2010-12-14 | 2016-02-17 | M&K Holdings Inc | METHOD FOR INTER-PREDICTIVE DECODING OF ENCODED FILMS |
KR101506446B1 (ko) | 2010-12-15 | 2015-04-08 | 에스케이 텔레콤주식회사 | 움직임정보 병합을 이용한 부호움직임정보생성/움직임정보복원 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
CN102547268B (zh) * | 2010-12-30 | 2014-12-10 | 深圳华强数码电影有限公司 | 一种流媒体播放方法及播放设备 |
EP2663075B1 (en) | 2011-01-06 | 2020-05-06 | Samsung Electronics Co., Ltd | Encoding method and device of video using data unit of hierarchical structure, and decoding method and device thereof |
US20120176536A1 (en) * | 2011-01-12 | 2012-07-12 | Avi Levy | Adaptive Frame Rate Conversion |
US9210442B2 (en) | 2011-01-12 | 2015-12-08 | Google Technology Holdings LLC | Efficient transform unit representation |
BR122015017257B1 (pt) | 2011-01-13 | 2022-08-02 | Nec Corporation | Dispositivo de codificação de vídeo, dispositivo de decodificação de vídeo, método de codificação de vídeo e método de decodificação de vídeo |
US9380319B2 (en) * | 2011-02-04 | 2016-06-28 | Google Technology Holdings LLC | Implicit transform unit representation |
US9848197B2 (en) | 2011-03-10 | 2017-12-19 | Qualcomm Incorporated | Transforms in video coding |
US8754929B1 (en) * | 2011-05-23 | 2014-06-17 | John Prince | Real time vergence control for 3D video capture and display |
US8989256B2 (en) | 2011-05-25 | 2015-03-24 | Google Inc. | Method and apparatus for using segmentation-based coding of prediction information |
EP2721816A4 (en) * | 2011-06-16 | 2015-03-18 | Freescale Semiconductor Inc | METHOD AND DEVICE FOR ENCODING AND DECODING AN IMAGE |
US8837582B2 (en) | 2011-06-22 | 2014-09-16 | Blackberry Limited | Compressing image data |
US8768082B2 (en) | 2011-06-22 | 2014-07-01 | Blackberry Limited | Compressing image data |
US9800870B2 (en) * | 2011-09-16 | 2017-10-24 | Qualcomm Incorporated | Line buffer reduction for short distance intra-prediction |
US9398300B2 (en) | 2011-10-07 | 2016-07-19 | Texas Instruments Incorporated | Method, system and apparatus for intra-prediction in video signal processing using combinable blocks |
CN103108177B (zh) * | 2011-11-09 | 2016-11-23 | 华为技术有限公司 | 图像编码方法及图像编码装置 |
US9247257B1 (en) | 2011-11-30 | 2016-01-26 | Google Inc. | Segmentation based entropy encoding and decoding |
CN103139558B (zh) * | 2011-11-30 | 2016-08-03 | 联芯科技有限公司 | 视频解码器的dc/ac系数预测方法及视频解码器 |
US9762904B2 (en) | 2011-12-22 | 2017-09-12 | Qualcomm Incorporated | Performing motion vector prediction for video coding |
US9094681B1 (en) | 2012-02-28 | 2015-07-28 | Google Inc. | Adaptive segmentation |
US9300984B1 (en) | 2012-04-18 | 2016-03-29 | Matrox Graphics Inc. | Independent processing of data streams in codec |
US10003802B1 (en) | 2012-04-18 | 2018-06-19 | Matrox Graphics Inc. | Motion-based adaptive quantization |
US10003803B1 (en) | 2012-04-18 | 2018-06-19 | Matrox Graphics Inc. | Motion-based adaptive quantization |
US8396127B1 (en) * | 2012-06-27 | 2013-03-12 | Google Inc. | Segmentation for video coding using predictive benefit |
EP2873236B1 (en) * | 2012-07-10 | 2020-10-07 | Cisco Technology, Inc. | Decoded picture buffer size management |
US9332276B1 (en) | 2012-08-09 | 2016-05-03 | Google Inc. | Variable-sized super block based direct prediction mode |
US9380298B1 (en) | 2012-08-10 | 2016-06-28 | Google Inc. | Object-based intra-prediction |
US10333547B2 (en) | 2012-08-13 | 2019-06-25 | Gurologic Microsystems Oy | Encoder and method for encoding input data using a plurality of different transformations or combinations of transformations |
US8675731B2 (en) * | 2012-08-13 | 2014-03-18 | Gurulogic Microsystems Oy | Encoder and method |
JP2014082541A (ja) * | 2012-10-12 | 2014-05-08 | National Institute Of Information & Communication Technology | 互いに類似した情報を含む複数画像のデータサイズを低減する方法、プログラムおよび装置 |
WO2014078068A1 (en) | 2012-11-13 | 2014-05-22 | Intel Corporation | Content adaptive transform coding for next generation video |
TW201419862A (zh) * | 2012-11-13 | 2014-05-16 | Hon Hai Prec Ind Co Ltd | 影像切割系統及方法 |
US9219915B1 (en) | 2013-01-17 | 2015-12-22 | Google Inc. | Selection of transform size in video coding |
EP2952003B1 (en) | 2013-01-30 | 2019-07-17 | Intel Corporation | Content adaptive partitioning for prediction and coding for next generation video |
US9544597B1 (en) | 2013-02-11 | 2017-01-10 | Google Inc. | Hybrid transform in video encoding and decoding |
US9967559B1 (en) | 2013-02-11 | 2018-05-08 | Google Llc | Motion vector dependent spatial transformation in video coding |
US9794375B2 (en) * | 2013-03-14 | 2017-10-17 | Openwave Mobility, Inc. | Method, apparatus, and non-transitory computer medium for obtaining a required frame size for a compressed data frame |
KR101454642B1 (ko) * | 2013-04-02 | 2014-10-27 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
KR101464980B1 (ko) * | 2013-04-02 | 2014-11-25 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
KR101452862B1 (ko) * | 2013-04-02 | 2014-10-23 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
KR101464979B1 (ko) * | 2013-04-02 | 2014-11-25 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
AU2014202288B2 (en) * | 2013-04-29 | 2017-10-05 | Everi Technology Pty Ltd | Gaming machine and method employing video compression |
KR101454664B1 (ko) * | 2013-04-30 | 2014-10-28 | 삼성전자주식회사 | 움직임 벡터를 복호화하는 방법 |
US9674530B1 (en) | 2013-04-30 | 2017-06-06 | Google Inc. | Hybrid transforms in video coding |
CN105684409B (zh) | 2013-10-25 | 2019-08-13 | 微软技术许可有限责任公司 | 在视频和图像编码和解码中使用散列值来表示各块 |
KR20160075705A (ko) | 2013-10-25 | 2016-06-29 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 비디오 및 이미지 코딩에서의 해시 기반 블록 매칭 |
US9973780B2 (en) | 2013-10-31 | 2018-05-15 | Microsoft Technology Licensing, Llc | Scaled video for pseudo-analog transmission in spatial domain |
KR101789954B1 (ko) * | 2013-12-27 | 2017-10-25 | 인텔 코포레이션 | 차세대 비디오 코딩을 위한 콘텐츠 적응적 이득 보상된 예측 |
CN105393537B (zh) | 2014-03-04 | 2019-08-27 | 微软技术许可有限责任公司 | 用于基于散列的块匹配的散列表构建和可用性检查 |
EP3114841B1 (en) | 2014-03-04 | 2020-06-10 | Microsoft Technology Licensing, LLC | Encoder-side decisions for block flipping and skip mode in intra block copy prediction |
KR102201027B1 (ko) * | 2014-03-24 | 2021-01-11 | 돌비 인터네셔널 에이비 | 고차 앰비소닉스 신호에 동적 범위 압축을 적용하는 방법 및 디바이스 |
KR101540684B1 (ko) * | 2014-05-07 | 2015-07-31 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
KR101601008B1 (ko) * | 2014-05-07 | 2016-03-08 | 삼성전자주식회사 | 데이터 단위 레벨의 독립적 파싱 또는 복호화에 따른 비디오 복호화 방법 및 그 장치, 그리고 데이터 단위 레벨의 독립적 파싱 또는 복호화를 위한 비디오 부호화 방법 및 그 장치 |
KR101636459B1 (ko) * | 2014-05-07 | 2016-07-06 | 삼성전자주식회사 | 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치 |
KR101538920B1 (ko) * | 2014-05-07 | 2015-07-24 | 삼성전자주식회사 | 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
US10681372B2 (en) * | 2014-06-23 | 2020-06-09 | Microsoft Technology Licensing, Llc | Encoder decisions based on results of hash-based block matching |
CN105338352B (zh) * | 2014-07-24 | 2019-04-19 | 华为技术有限公司 | 一种视频编码中自适应反量化方法及装置 |
CN104123375B (zh) * | 2014-07-28 | 2018-01-23 | 清华大学 | 数据搜索方法及系统 |
KR101643621B1 (ko) * | 2014-08-05 | 2016-08-10 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
MX2017004210A (es) * | 2014-09-30 | 2017-11-15 | Microsoft Technology Licensing Llc | Decisiones de codificador basadas en hash para codificar video. |
KR101538921B1 (ko) * | 2014-10-29 | 2015-07-24 | 삼성전자주식회사 | 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101564944B1 (ko) * | 2014-10-29 | 2015-11-02 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
KR101677275B1 (ko) * | 2014-10-29 | 2016-11-17 | 삼성전자주식회사 | 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치 |
KR101607310B1 (ko) | 2014-10-29 | 2016-03-29 | 삼성전자주식회사 | 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
KR101644092B1 (ko) * | 2014-10-29 | 2016-07-29 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
KR101601014B1 (ko) * | 2014-10-29 | 2016-03-08 | 삼성전자주식회사 | 데이터 단위 레벨의 독립적 파싱 또는 복호화에 따른 비디오 복호화 방법 및 그 장치, 그리고 데이터 단위 레벨의 독립적 파싱 또는 복호화를 위한 비디오 부호화 방법 및 그 장치 |
US9565451B1 (en) | 2014-10-31 | 2017-02-07 | Google Inc. | Prediction dependent transform coding |
KR101677276B1 (ko) * | 2015-01-19 | 2016-11-17 | 삼성전자주식회사 | 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치 |
CN104780379B (zh) * | 2015-01-21 | 2018-03-09 | 北京工业大学 | 一种屏幕图像集合的压缩方法 |
US10516882B2 (en) | 2015-01-29 | 2019-12-24 | Vid Scale, Inc. | Intra-block copy searching |
KR101687283B1 (ko) * | 2015-04-13 | 2016-12-28 | 삼성전자주식회사 | 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101662743B1 (ko) * | 2015-04-13 | 2016-10-14 | 삼성전자주식회사 | 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101634253B1 (ko) * | 2015-04-13 | 2016-06-28 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
KR101662742B1 (ko) * | 2015-04-13 | 2016-10-05 | 삼성전자주식회사 | 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101601017B1 (ko) * | 2015-04-21 | 2016-03-08 | 삼성전자주식회사 | 데이터 단위 레벨의 독립적 파싱 또는 복호화에 따른 비디오 복호화 방법 및 그 장치, 그리고 데이터 단위 레벨의 독립적 파싱 또는 복호화를 위한 비디오 부호화 방법 및 그 장치 |
KR101601016B1 (ko) * | 2015-04-21 | 2016-03-08 | 삼성전자주식회사 | 데이터 단위 레벨의 독립적 파싱 또는 복호화에 따른 비디오 복호화 방법 및 그 장치, 그리고 데이터 단위 레벨의 독립적 파싱 또는 복호화를 위한 비디오 부호화 방법 및 그 장치 |
WO2016199330A1 (ja) * | 2015-06-12 | 2016-12-15 | パナソニックIpマネジメント株式会社 | 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置 |
US9769499B2 (en) | 2015-08-11 | 2017-09-19 | Google Inc. | Super-transform video coding |
US10277905B2 (en) | 2015-09-14 | 2019-04-30 | Google Llc | Transform selection for non-baseband signal coding |
WO2017088093A1 (en) * | 2015-11-23 | 2017-06-01 | Mediatek Singapore Pte. Ltd. | On the smallest allowed block size in video coding |
US9807423B1 (en) | 2015-11-24 | 2017-10-31 | Google Inc. | Hybrid transform scheme for video coding |
JP6721977B2 (ja) * | 2015-12-15 | 2020-07-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
CN105916022A (zh) * | 2015-12-28 | 2016-08-31 | 乐视致新电子科技(天津)有限公司 | 一种基于虚拟现实技术的视频图像处理方法及装置 |
US10499056B2 (en) * | 2016-03-09 | 2019-12-03 | Sony Corporation | System and method for video processing based on quantization parameter |
US9946956B2 (en) * | 2016-06-15 | 2018-04-17 | Qualcomm Incorporated | Differential image processing |
KR101720195B1 (ko) * | 2016-06-22 | 2017-03-27 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
JP6261020B2 (ja) | 2016-06-28 | 2018-01-17 | 株式会社Nexpoint | 画面画像転送方法及び画面画像復元方法 |
US10390039B2 (en) | 2016-08-31 | 2019-08-20 | Microsoft Technology Licensing, Llc | Motion estimation for screen remoting scenarios |
RU2642402C1 (ru) * | 2016-10-07 | 2018-01-24 | Общество с ограниченной ответственностью "СТРИМ Лабс" (ООО "СТРИМ Лабс") | Способ выявления повторяющихся кадров видео |
CN110168650A (zh) * | 2016-10-12 | 2019-08-23 | 汉诺威戈特弗里德威廉莱布尼茨大学 | 用于编码和解码数据结构的质量值的方法 |
US11095877B2 (en) | 2016-11-30 | 2021-08-17 | Microsoft Technology Licensing, Llc | Local hash-based motion estimation for screen remoting scenarios |
CN107046646B (zh) * | 2016-12-30 | 2020-05-22 | 上海寒武纪信息科技有限公司 | 基于深度自动编码器的视频编解码装置及方法 |
US10694181B2 (en) * | 2017-01-27 | 2020-06-23 | Qualcomm Incorporated | Bilateral filters in video coding with reduced complexity |
CN106713929B (zh) * | 2017-02-16 | 2019-06-28 | 清华大学深圳研究生院 | 一种基于深度神经网络的视频帧间预测增强方法 |
WO2018152760A1 (en) * | 2017-02-24 | 2018-08-30 | Realnetworks, Inc. | Motion vector selection and prediction in video coding systems and methods |
US10360695B1 (en) | 2017-06-01 | 2019-07-23 | Matrox Graphics Inc. | Method and an apparatus for enabling ultra-low latency compression of a stream of pictures |
TWI675335B (zh) | 2017-06-09 | 2019-10-21 | 宏達國際電子股份有限公司 | 訓練任務優化系統、訓練任務優化方法及其非暫態電腦可讀媒體 |
KR102401851B1 (ko) * | 2017-06-14 | 2022-05-26 | 삼성디스플레이 주식회사 | 영상 압축 방법 및 이를 수행하는 표시 장치 |
TWI761552B (zh) * | 2017-07-13 | 2022-04-21 | 美商松下電器(美國)知識產權公司 | 編碼裝置、編碼方法、解碼裝置及解碼方法 |
TWI777907B (zh) * | 2017-07-13 | 2022-09-11 | 美商松下電器(美國)知識產權公司 | 編碼裝置、編碼方法、解碼裝置、解碼方法及電腦可讀取之非暫時性媒體 |
KR101886259B1 (ko) * | 2017-07-19 | 2018-08-08 | 삼성전자주식회사 | 영상 부호화 방법 및 장치, 및 부호화된 비트스트림을 포함하는 기록 매체 |
US10614613B2 (en) * | 2017-07-28 | 2020-04-07 | Nvidia Corporation | Reducing noise during rendering by performing parallel path space filtering utilizing hashing |
KR101867597B1 (ko) * | 2017-09-22 | 2018-06-14 | 삼성전자주식회사 | 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치 |
EP3685577A4 (en) * | 2017-10-12 | 2021-07-28 | MediaTek Inc. | METHOD AND DEVICE OF A NEURAL NETWORK FOR VIDEO ENCODING |
US11195096B2 (en) * | 2017-10-24 | 2021-12-07 | International Business Machines Corporation | Facilitating neural network efficiency |
KR102589303B1 (ko) | 2017-11-02 | 2023-10-24 | 삼성전자주식회사 | 고정 소수점 타입의 뉴럴 네트워크를 생성하는 방법 및 장치 |
US11907835B2 (en) * | 2017-11-26 | 2024-02-20 | Yeda Research And Development Co. Ltd. | Signal enhancement and manipulation using a signal-specific deep network |
CN108289224B (zh) * | 2017-12-12 | 2019-10-29 | 北京大学 | 一种视频帧预测方法、装置及自动补偿神经网络 |
CN108174225B (zh) * | 2018-01-11 | 2021-03-26 | 上海交通大学 | 基于对抗生成网络的视频编解码环路内滤波实现方法及系统 |
US10559093B2 (en) * | 2018-01-13 | 2020-02-11 | Arm Limited | Selecting encoding options |
CN110062246B (zh) * | 2018-01-19 | 2021-01-05 | 杭州海康威视数字技术股份有限公司 | 对视频帧数据进行处理的方法和装置 |
CN108174218B (zh) * | 2018-01-23 | 2020-02-07 | 中国科学技术大学 | 基于学习的视频编解码系统 |
KR101943991B1 (ko) * | 2018-03-05 | 2019-01-30 | 삼성전자주식회사 | 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
US10972738B2 (en) * | 2018-03-29 | 2021-04-06 | Mediatek Inc. | Video encoding apparatus having reconstruction buffer with fixed size and/or bandwidth limitation and associated video encoding method |
KR102688439B1 (ko) * | 2018-05-09 | 2024-07-26 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
KR102006804B1 (ko) * | 2018-06-07 | 2019-08-02 | 삼성전자주식회사 | 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치 |
KR101989160B1 (ko) * | 2018-08-01 | 2019-06-13 | 삼성전자주식회사 | 영상 부호화 방법 및 장치 |
CN109033439B (zh) * | 2018-08-15 | 2019-11-19 | 中科驭数(北京)科技有限公司 | 流式数据的处理方法和装置 |
US12050461B2 (en) * | 2018-09-07 | 2024-07-30 | DoorDash, Inc. | Video system with frame synthesis |
CN109495750A (zh) * | 2018-10-26 | 2019-03-19 | 西安科锐盛创新科技有限公司 | 基于四叉树的带宽压缩预测方法 |
US11562046B2 (en) | 2018-11-26 | 2023-01-24 | Samsung Electronics Co., Ltd. | Neural network processor using dyadic weight matrix and operation method thereof |
KR20200082227A (ko) * | 2018-12-28 | 2020-07-08 | 한국전자통신연구원 | 오디오 신호를 위한 손실 함수 결정 방법 및 손실 함수 결정 장치 |
WO2020165493A1 (en) * | 2019-02-15 | 2020-08-20 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
WO2020175938A1 (ko) * | 2019-02-28 | 2020-09-03 | 주식회사 엑스리스 | 영상 신호 부호화/복호화 방법 및 이를 위한 장치 |
US11122297B2 (en) | 2019-05-03 | 2021-09-14 | Google Llc | Using border-aligned block functions for image compression |
KR20200129957A (ko) | 2019-05-10 | 2020-11-18 | 삼성전자주식회사 | 피처맵 데이터에 대한 압축을 수행하는 뉴럴 네트워크 프로세서 및 이를 포함하는 컴퓨팅 시스템 |
KR20200139909A (ko) | 2019-06-05 | 2020-12-15 | 삼성전자주식회사 | 전자 장치 및 그의 연산 수행 방법 |
CN113038134B (zh) * | 2019-12-25 | 2023-08-01 | 武汉Tcl集团工业研究院有限公司 | 一种图片处理方法、智能终端及存储介质 |
US11403782B2 (en) * | 2019-12-31 | 2022-08-02 | Alibaba Group Holding Limited | Static channel filtering in frequency domain |
US11470327B2 (en) | 2020-03-30 | 2022-10-11 | Alibaba Group Holding Limited | Scene aware video content encoding |
US11792408B2 (en) | 2020-03-30 | 2023-10-17 | Alibaba Group Holding Limited | Transcoder target bitrate prediction techniques |
US11386873B2 (en) | 2020-04-01 | 2022-07-12 | Alibaba Group Holding Limited | Method and apparatus for efficient application screen compression |
US11323732B2 (en) | 2020-04-13 | 2022-05-03 | Tencent America LLC | Method and apparatus for video coding |
KR20210136476A (ko) | 2020-05-07 | 2021-11-17 | 삼성전자주식회사 | 쿼드 트리 방법의 파라미터들을 이용하여 압축하는 장치 및 방법 |
US11205077B1 (en) * | 2020-05-29 | 2021-12-21 | Arm Limited | Operating on a video frame to generate a feature map of a neural network |
US11202085B1 (en) | 2020-06-12 | 2021-12-14 | Microsoft Technology Licensing, Llc | Low-cost hash table construction and hash-based block matching for variable-size blocks |
CN112351252B (zh) * | 2020-10-27 | 2023-10-20 | 重庆中星微人工智能芯片技术有限公司 | 监控视频编解码装置 |
US12047575B2 (en) * | 2020-12-03 | 2024-07-23 | Intel Corporation | Methods, apparatus, and articles of manufacture for multi-symbol equiprobable mode entropy coding |
CN113781588A (zh) * | 2021-07-01 | 2021-12-10 | 杭州未名信科科技有限公司 | 一种基于神经网络的帧内编码单元尺寸划分方法 |
GB2609218B (en) * | 2021-07-22 | 2023-08-30 | Imagination Tech Ltd | Coding blocks of pixels |
CN114786011B (zh) * | 2022-06-22 | 2022-11-15 | 苏州浪潮智能科技有限公司 | 一种jpeg图像压缩的方法、系统、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07177391A (ja) * | 1993-12-20 | 1995-07-14 | Matsushita Electric Ind Co Ltd | 雑音除去装置 |
JPH08294001A (ja) * | 1995-04-20 | 1996-11-05 | Seiko Epson Corp | 画像処理方法および画像処理装置 |
JP2001054119A (ja) * | 1996-05-28 | 2001-02-23 | Matsushita Electric Ind Co Ltd | 画像予測符号化方法 |
WO2001056298A1 (en) * | 2000-01-28 | 2001-08-02 | Qualcomm Incorporated | Quality based image compression |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6529634B1 (en) * | 1999-11-08 | 2003-03-04 | Qualcomm, Inc. | Contrast sensitive variance based adaptive block size DCT image compression |
EP1246469A3 (fr) * | 2001-03-27 | 2005-04-13 | Koninklijke Philips Electronics N.V. | Procédé de réduction de format et de décodage similtanés de signaux vidéo codés |
JP4193406B2 (ja) * | 2002-04-16 | 2008-12-10 | 三菱電機株式会社 | 映像データ変換装置および映像データ変換方法 |
US7330509B2 (en) * | 2003-09-12 | 2008-02-12 | International Business Machines Corporation | Method for video transcoding with adaptive frame rate control |
-
2003
- 2003-05-20 HU HU0301368A patent/HUP0301368A3/hu unknown
-
2004
- 2004-05-20 CA CA002526450A patent/CA2526450A1/en not_active Abandoned
- 2004-05-20 JP JP2006530613A patent/JP2007503784A/ja active Pending
- 2004-05-20 US US10/557,440 patent/US8086052B2/en not_active Expired - Fee Related
- 2004-05-20 EP EP04734055A patent/EP1629437A2/en not_active Withdrawn
- 2004-05-20 CN CN2004800209079A patent/CN1857001B/zh not_active Expired - Fee Related
- 2004-05-20 WO PCT/HU2004/000055 patent/WO2004104930A2/en active Application Filing
- 2004-05-20 KR KR1020057022258A patent/KR20060027795A/ko not_active Application Discontinuation
-
2005
- 2005-11-30 NO NO20055660A patent/NO20055660L/no not_active Application Discontinuation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07177391A (ja) * | 1993-12-20 | 1995-07-14 | Matsushita Electric Ind Co Ltd | 雑音除去装置 |
JPH08294001A (ja) * | 1995-04-20 | 1996-11-05 | Seiko Epson Corp | 画像処理方法および画像処理装置 |
JP2001054119A (ja) * | 1996-05-28 | 2001-02-23 | Matsushita Electric Ind Co Ltd | 画像予測符号化方法 |
WO2001056298A1 (en) * | 2000-01-28 | 2001-08-02 | Qualcomm Incorporated | Quality based image compression |
Cited By (127)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8254459B2 (en) | 2002-07-14 | 2012-08-28 | Apple Inc. | Adaptive motion estimation |
US8472516B2 (en) | 2004-06-27 | 2013-06-25 | Apple Inc. | Selecting encoding types and predictive modes for encoding video data |
JP2006014342A (ja) * | 2004-06-27 | 2006-01-12 | Apple Computer Inc | ビデオ・データを符号化するための符号化タイプおよび予測モードの選択 |
JP2014161094A (ja) * | 2004-06-27 | 2014-09-04 | Apple Inc | ビデオ・データを符号化するための符号化タイプおよび予測モードの選択 |
US8737479B2 (en) | 2004-06-27 | 2014-05-27 | Apple Inc. | Encoding mode pruning during video encoding |
US8228998B2 (en) | 2006-10-10 | 2012-07-24 | Nippon Telegraph And Telephone Corporation | Intra prediction encoding control method and apparatus, program therefor, and storage medium which stores the program |
JP2017201792A (ja) * | 2009-02-23 | 2017-11-09 | コリア アドバンスド インスティテュート オブ サイエンス アンド テクノロジー | ビデオ符号化での分割ブロック符号化方法、ビデオ復号化での分割ブロック復号化方法及びこれを実現する記録媒体 |
JP2017184274A (ja) * | 2009-02-23 | 2017-10-05 | コリア アドバンスド インスティテュート オブ サイエンス アンド テクノロジー | ビデオ符号化での分割ブロック符号化方法、ビデオ復号化での分割ブロック復号化方法及びこれを実現する記録媒体 |
JP2017184273A (ja) * | 2009-02-23 | 2017-10-05 | コリア アドバンスド インスティテュート オブ サイエンス アンド テクノロジー | ビデオ符号化での分割ブロック符号化方法、ビデオ復号化での分割ブロック復号化方法及びこれを実現する記録媒体 |
US11082697B2 (en) | 2009-07-01 | 2021-08-03 | Interdigital Vc Holdings, Inc. | Methods and apparatus for signaling intra prediction for large blocks for video encoders and decoders |
US11936876B2 (en) | 2009-07-01 | 2024-03-19 | Interdigital Vc Holdings, Inc. | Methods and apparatus for signaling intra prediction for large blocks for video encoders and decoders |
US12120307B2 (en) | 2009-07-01 | 2024-10-15 | Interdigital Vc Holdings, Inc. | Methods and apparatus for signaling intra prediction for large blocks for video encoders and decoders |
JP2016178645A (ja) * | 2009-07-01 | 2016-10-06 | トムソン ライセンシングThomson Licensing | ビデオエンコーダおよびデコーダについての大きなブロックにつきイントラ予測を信号伝達する方法および装置 |
JP2017212751A (ja) * | 2009-07-24 | 2017-11-30 | サムスン エレクトロニクス カンパニー リミテッド | 映像の符号化方法及び装置 |
US8842734B2 (en) | 2009-08-14 | 2014-09-23 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9374579B2 (en) | 2009-08-14 | 2016-06-21 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9313490B2 (en) | 2009-08-14 | 2016-04-12 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9313489B2 (en) | 2009-08-14 | 2016-04-12 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9307238B2 (en) | 2009-08-14 | 2016-04-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US8953682B2 (en) | 2009-08-14 | 2015-02-10 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
JP2015180084A (ja) * | 2009-08-14 | 2015-10-08 | サムスン エレクトロニクス カンパニー リミテッド | 映像復号化方法及び装置 |
JP2015180083A (ja) * | 2009-08-14 | 2015-10-08 | サムスン エレクトロニクス カンパニー リミテッド | 映像復号化方法及び装置 |
JP2015164358A (ja) * | 2009-08-14 | 2015-09-10 | サムスン エレクトロニクス カンパニー リミテッド | ビデオ復号化方法及び装置 |
JP2013502144A (ja) * | 2009-08-14 | 2013-01-17 | サムスン エレクトロニクス カンパニー リミテッド | ビデオ符号化方法及び装置、ビデオ復号化方法及び装置 |
US9036703B2 (en) | 2009-08-17 | 2015-05-19 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9071839B2 (en) | 2009-08-17 | 2015-06-30 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9374591B2 (en) | 2009-08-17 | 2016-06-21 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US9049458B2 (en) | 2009-08-17 | 2015-06-02 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
US8989266B2 (en) | 2009-08-17 | 2015-03-24 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video, and method and apparatus for decoding video |
JP2013502808A (ja) * | 2009-08-17 | 2013-01-24 | サムスン エレクトロニクス カンパニー リミテッド | 映像の符号化方法及びその装置、並びに映像の復号化方法及びその装置 |
JP2015144471A (ja) * | 2009-10-23 | 2015-08-06 | サムスン エレクトロニクス カンパニー リミテッド | ビデオデータを復号化する方法及び装置 |
JP2015144469A (ja) * | 2009-10-23 | 2015-08-06 | サムスン エレクトロニクス カンパニー リミテッド | ビデオデータを復号化する方法及び装置 |
JP2015144470A (ja) * | 2009-10-23 | 2015-08-06 | サムスン エレクトロニクス カンパニー リミテッド | ビデオデータを復号化する方法及び装置 |
JP2015144472A (ja) * | 2009-10-23 | 2015-08-06 | サムスン エレクトロニクス カンパニー リミテッド | 映像復号化方法及び映像復号化装置 |
JP2015136156A (ja) * | 2009-10-23 | 2015-07-27 | サムスン エレクトロニクス カンパニー リミテッド | ビデオデータを復号化する方法及び装置 |
US9414055B2 (en) | 2009-10-23 | 2016-08-09 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video and method and apparatus for decoding video, based on hierarchical structure of coding unit |
US10672028B2 (en) | 2010-04-13 | 2020-06-02 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US10855995B2 (en) | 2010-04-13 | 2020-12-01 | Ge Video Compression, Llc | Inter-plane prediction |
US20170134761A1 (en) | 2010-04-13 | 2017-05-11 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US9591335B2 (en) | 2010-04-13 | 2017-03-07 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US12120316B2 (en) | 2010-04-13 | 2024-10-15 | Ge Video Compression, Llc | Inter-plane prediction |
US9807427B2 (en) | 2010-04-13 | 2017-10-31 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US12010353B2 (en) | 2010-04-13 | 2024-06-11 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US11983737B2 (en) | 2010-04-13 | 2024-05-14 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US10003828B2 (en) | 2010-04-13 | 2018-06-19 | Ge Video Compression, Llc | Inheritance in sample array multitree division |
US10038920B2 (en) | 2010-04-13 | 2018-07-31 | Ge Video Compression, Llc | Multitree subdivision and inheritance of coding parameters in a coding block |
US10051291B2 (en) | 2010-04-13 | 2018-08-14 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US20180324466A1 (en) | 2010-04-13 | 2018-11-08 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US20190089962A1 (en) | 2010-04-13 | 2019-03-21 | Ge Video Compression, Llc | Inter-plane prediction |
US10250913B2 (en) | 2010-04-13 | 2019-04-02 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US10248966B2 (en) | 2010-04-13 | 2019-04-02 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US20190164188A1 (en) | 2010-04-13 | 2019-05-30 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US20190174148A1 (en) | 2010-04-13 | 2019-06-06 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US20190197579A1 (en) | 2010-04-13 | 2019-06-27 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US11910030B2 (en) | 2010-04-13 | 2024-02-20 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10432978B2 (en) | 2010-04-13 | 2019-10-01 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10432979B2 (en) | 2010-04-13 | 2019-10-01 | Ge Video Compression Llc | Inheritance in sample array multitree subdivision |
US10432980B2 (en) | 2010-04-13 | 2019-10-01 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10440400B2 (en) | 2010-04-13 | 2019-10-08 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10448060B2 (en) | 2010-04-13 | 2019-10-15 | Ge Video Compression, Llc | Multitree subdivision and inheritance of coding parameters in a coding block |
US10460344B2 (en) | 2010-04-13 | 2019-10-29 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US10621614B2 (en) | 2010-04-13 | 2020-04-14 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
JP2015149737A (ja) * | 2010-04-13 | 2015-08-20 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 細分割を使用した2次元情報信号の空間的なサンプリングの符号化 |
US10681390B2 (en) | 2010-04-13 | 2020-06-09 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US10687085B2 (en) | 2010-04-13 | 2020-06-16 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10687086B2 (en) | 2010-04-13 | 2020-06-16 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US10694218B2 (en) | 2010-04-13 | 2020-06-23 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10708629B2 (en) | 2010-04-13 | 2020-07-07 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10708628B2 (en) | 2010-04-13 | 2020-07-07 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US10721495B2 (en) | 2010-04-13 | 2020-07-21 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US10721496B2 (en) | 2010-04-13 | 2020-07-21 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10719850B2 (en) | 2010-04-13 | 2020-07-21 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US11910029B2 (en) | 2010-04-13 | 2024-02-20 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division preliminary class |
US10748183B2 (en) | 2010-04-13 | 2020-08-18 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US10764608B2 (en) | 2010-04-13 | 2020-09-01 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US10771822B2 (en) | 2010-04-13 | 2020-09-08 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US10803485B2 (en) | 2010-04-13 | 2020-10-13 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US10803483B2 (en) | 2010-04-13 | 2020-10-13 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US10805645B2 (en) | 2010-04-13 | 2020-10-13 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US10848767B2 (en) | 2010-04-13 | 2020-11-24 | Ge Video Compression, Llc | Inter-plane prediction |
US10856013B2 (en) | 2010-04-13 | 2020-12-01 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US9596488B2 (en) | 2010-04-13 | 2017-03-14 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US10855990B2 (en) | 2010-04-13 | 2020-12-01 | Ge Video Compression, Llc | Inter-plane prediction |
US10855991B2 (en) | 2010-04-13 | 2020-12-01 | Ge Video Compression, Llc | Inter-plane prediction |
US11900415B2 (en) | 2010-04-13 | 2024-02-13 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US10863208B2 (en) | 2010-04-13 | 2020-12-08 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10873749B2 (en) | 2010-04-13 | 2020-12-22 | Ge Video Compression, Llc | Inter-plane reuse of coding parameters |
US10880580B2 (en) | 2010-04-13 | 2020-12-29 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10880581B2 (en) | 2010-04-13 | 2020-12-29 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US10893301B2 (en) | 2010-04-13 | 2021-01-12 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US11037194B2 (en) | 2010-04-13 | 2021-06-15 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US11051047B2 (en) | 2010-04-13 | 2021-06-29 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US20210211743A1 (en) | 2010-04-13 | 2021-07-08 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US11856240B1 (en) | 2010-04-13 | 2023-12-26 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US11087355B2 (en) | 2010-04-13 | 2021-08-10 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US11810019B2 (en) | 2010-04-13 | 2023-11-07 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US11102518B2 (en) | 2010-04-13 | 2021-08-24 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US11785264B2 (en) | 2010-04-13 | 2023-10-10 | Ge Video Compression, Llc | Multitree subdivision and inheritance of coding parameters in a coding block |
US11778241B2 (en) | 2010-04-13 | 2023-10-03 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US11765362B2 (en) | 2010-04-13 | 2023-09-19 | Ge Video Compression, Llc | Inter-plane prediction |
US11765363B2 (en) | 2010-04-13 | 2023-09-19 | Ge Video Compression, Llc | Inter-plane reuse of coding parameters |
US11546642B2 (en) | 2010-04-13 | 2023-01-03 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using sub-division |
US11546641B2 (en) | 2010-04-13 | 2023-01-03 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US11553212B2 (en) | 2010-04-13 | 2023-01-10 | Ge Video Compression, Llc | Inheritance in sample array multitree subdivision |
US11736738B2 (en) | 2010-04-13 | 2023-08-22 | Ge Video Compression, Llc | Coding of a spatial sampling of a two-dimensional information signal using subdivision |
US11734714B2 (en) | 2010-04-13 | 2023-08-22 | Ge Video Compression, Llc | Region merging and coding parameter reuse via merging |
US11611761B2 (en) | 2010-04-13 | 2023-03-21 | Ge Video Compression, Llc | Inter-plane reuse of coding parameters |
US9247252B2 (en) | 2011-01-26 | 2016-01-26 | Hitachi, Ltd. | Image decoding device |
WO2012115486A2 (ko) * | 2011-02-25 | 2012-08-30 | 삼성전자 주식회사 | 영상의 변환 방법 및 장치, 및 영상의 역변환 방법 및 장치 |
WO2012115486A3 (ko) * | 2011-02-25 | 2012-11-15 | 삼성전자 주식회사 | 영상의 변환 방법 및 장치, 및 영상의 역변환 방법 및 장치 |
WO2013014693A1 (ja) | 2011-07-22 | 2013-01-31 | 株式会社日立製作所 | 動画像復号化方法及び画像符号化方法 |
KR20150095479A (ko) * | 2014-02-13 | 2015-08-21 | 삼성전자주식회사 | 영상 부호화, 복호화 방법 및 장치 |
KR102185857B1 (ko) * | 2014-02-13 | 2020-12-02 | 삼성전자주식회사 | 영상 부호화, 복호화 방법 및 장치 |
JP2016197906A (ja) * | 2016-07-25 | 2016-11-24 | ソニー株式会社 | 画像処理装置および方法、記録媒体、並びにプログラム |
JP7225333B2 (ja) | 2017-05-26 | 2023-02-20 | グーグル エルエルシー | ニューラルネットワークを使用するタイル型画像圧縮 |
JP2021192525A (ja) * | 2017-05-26 | 2021-12-16 | グーグル エルエルシーGoogle LLC | ニューラルネットワークを使用するタイル型画像圧縮 |
US11250595B2 (en) | 2017-05-26 | 2022-02-15 | Google Llc | Tiled image compression using neural networks |
JP2020522153A (ja) * | 2017-05-26 | 2020-07-27 | グーグル エルエルシー | ニューラルネットワークを使用するタイル型画像圧縮 |
US11902369B2 (en) | 2018-02-09 | 2024-02-13 | Preferred Networks, Inc. | Autoencoder, data processing system, data processing method and non-transitory computer readable medium |
JP2019140680A (ja) * | 2018-02-09 | 2019-08-22 | 株式会社Preferred Networks | オートエンコーダ装置、データ処理システム、データ処理方法及びプログラム |
JP7236873B2 (ja) | 2018-02-09 | 2023-03-10 | 株式会社Preferred Networks | オートエンコーダ装置、データ処理システム、データ処理方法及びプログラム |
JP2021520087A (ja) * | 2018-04-27 | 2021-08-12 | インターデジタル ヴイシー ホールディングス, インコーポレイテッド | Cabacのニューラルネットワーク実装に基づくビデオの符号化及び復号のための方法及び機器 |
JP7421492B2 (ja) | 2018-04-27 | 2024-01-24 | インターデジタル ヴイシー ホールディングス, インコーポレイテッド | Cabacのニューラルネットワーク実装に基づくビデオの符号化及び復号のための方法及び機器 |
JP7355916B2 (ja) | 2019-07-15 | 2023-10-03 | 華為技術有限公司 | ウェーブレット変換に基づく画像符号化/復号方法および装置 |
JP2022541215A (ja) * | 2019-07-15 | 2022-09-22 | 華為技術有限公司 | ウェーブレット変換に基づく画像符号化/復号方法および装置 |
WO2022225025A1 (ja) * | 2021-04-23 | 2022-10-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 画像復号方法、画像符号化方法、画像復号装置、及び画像符号化装置 |
JP7568835B2 (ja) | 2021-04-23 | 2024-10-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 画像復号方法、画像符号化方法、画像復号装置、及び画像符号化装置 |
Also Published As
Publication number | Publication date |
---|---|
CN1857001B (zh) | 2011-12-21 |
NO20055660L (no) | 2005-12-16 |
US20060251330A1 (en) | 2006-11-09 |
EP1629437A2 (en) | 2006-03-01 |
US8086052B2 (en) | 2011-12-27 |
HU0301368D0 (en) | 2003-07-28 |
WO2004104930A2 (en) | 2004-12-02 |
WO2004104930A3 (en) | 2006-05-18 |
CN1857001A (zh) | 2006-11-01 |
NO20055660D0 (no) | 2005-11-30 |
HUP0301368A2 (hu) | 2005-02-28 |
HUP0301368A3 (en) | 2005-09-28 |
KR20060027795A (ko) | 2006-03-28 |
CA2526450A1 (en) | 2004-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007503784A (ja) | ハイブリッドビデオ圧縮法 | |
US11240498B2 (en) | Independently coding frame areas | |
JP5873536B2 (ja) | 動き予測検索範囲及び拡張動きベクトルの範囲の動的選択 | |
JP4082525B2 (ja) | Dct領域で効率性を改善した動き予測を実行するシステムと方法 | |
US6876703B2 (en) | Method and apparatus for video coding | |
JP4102841B2 (ja) | ビデオ画像を処理するコンピュータ実行方法 | |
US5786856A (en) | Method for adaptive quantization by multiplication of luminance pixel blocks by a modified, frequency ordered hadamard matrix | |
JP4425563B2 (ja) | フェーディング補償のためのパラメータ化 | |
KR101354151B1 (ko) | 영상 변환 방법 및 장치, 역변환 방법 및 장치 | |
US6252905B1 (en) | Real-time evaluation of compressed picture quality within a digital video encoder | |
CN1695381A (zh) | 在数字视频信号的后处理中使用编码信息和局部空间特征的清晰度增强 | |
JPH09505698A (ja) | 反復誤差データコーディング方法を使用するビデオ圧縮 | |
CN101107862A (zh) | 编码装置及具备编码装置的动态图像记录系统 | |
JP2010534015A (ja) | 画像処理方法及び対応する電子装置 | |
JP4494803B2 (ja) | 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置 | |
JP2005530423A (ja) | 画像鮮鋭度を符号化中に最適化する方法及びシステム | |
US10771820B2 (en) | Image encoding method and apparatus using artifact reduction filter, and image decoding method and apparatus using artifact reduction filter | |
EP1720356A1 (en) | A frequency selective video compression | |
JP4028900B2 (ja) | 動画像符号化装置及び動画像復号化装置 | |
KR100987581B1 (ko) | 고속 움직임 추정을 위한 부분 블록정합 방법 | |
KR100203695B1 (ko) | 물체 기반 부호화에 있어서의 텍스쳐 분류를 위한 전처리 장치 | |
KR0166728B1 (ko) | 에지특성을 고려한 영상신호부호화장치 및 양자화레벨결정방법 | |
JP4153774B2 (ja) | 動画像符号化方法とその復号化方法、およびそれらの装置 | |
Young | Software CODEC algorithms for desktop videoconferencing | |
JP2004266720A (ja) | 画像圧縮装置、画像圧縮方法及び画像圧縮プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070521 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100709 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100716 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110125 |