JP2013021690A - レート−又は歪み−量子化モデル関数のためのモデルパラメータ推定 - Google Patents
レート−又は歪み−量子化モデル関数のためのモデルパラメータ推定 Download PDFInfo
- Publication number
- JP2013021690A JP2013021690A JP2012149192A JP2012149192A JP2013021690A JP 2013021690 A JP2013021690 A JP 2013021690A JP 2012149192 A JP2012149192 A JP 2012149192A JP 2012149192 A JP2012149192 A JP 2012149192A JP 2013021690 A JP2013021690 A JP 2013021690A
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- rate
- model
- frame
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013139 quantization Methods 0.000 title claims abstract description 228
- 238000012937 correction Methods 0.000 claims abstract description 81
- 238000005259 measurement Methods 0.000 claims abstract description 76
- 238000012887 quadratic function Methods 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 58
- 238000012986 modification Methods 0.000 claims description 26
- 230000004048 modification Effects 0.000 claims description 26
- 230000002123 temporal effect Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 10
- 230000007704 transition Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 105
- 238000004422 calculation algorithm Methods 0.000 description 21
- 239000013598 vector Substances 0.000 description 20
- 230000008859 change Effects 0.000 description 16
- 230000000875 corresponding effect Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 8
- 230000004069 differentiation Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000002596 correlated effect Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 235000015842 Hesperis Nutrition 0.000 description 1
- 235000012633 Iberis amara Nutrition 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
- H04N19/198—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【解決手段】フレームシーケンスの連続するフレームの間でモデルパラメータを推定するために時間離散カルマンフィルタを使用し、1回目のフィルタ修正ステップとして現フレームの複雑度の値に依存する測定値を用いて修正し、2回目として、現フレームを所定の量子化を使用して符号化するときのビデオ符号器の実際の符号化レート又は歪みに依存する測定値を用いて修正を行う。レート−量子化モデル関数はビデオ符号器の量子化とそのビデオ符号器の符号化レートとを関係付けるものであり、更に、細かい量子化区間においては二次関数を示し、粗い量子化区間においては指数関数を示すようなピース毎に定義されるレート−量子化モデル関数が供給される。
【選択図】図1
Description
ここで、βはモデルのパラメータを含むべクトルである。
ここで、量子化パラメータと量子化ステップサイズ(QStep)との間の関係はH.264/AVC標準において定義されている(非特許文献14を参照)。異なる複雑度に関係する更なる提案として、線形モデル(非特許文献12を参照)、指数モデル(非特許文献24を参照)、非ゼロ係数の個数に基づくρ−ドメインモデル(非特許文献8を参照)、又は非特許文献7が示すピース毎に定義されるモデル等が挙げられる。
であり、ここでXはレート−量子化モデル関数fのモデルパラメータを表している。好適には、全単射関数(bijective function)がモデルパラメータXを可能性のある/有効なレート−量子化モデル関数の具体化のセットへとマップし、その逆も可能である。これを図示する目的で、図1は、現フレームkの実際のレート−量子化関数20を近似するためのあるモデルパラメータのレート−量子化モデル関数26を示す。装置10が対応するモデルパラメータを決定又は推定する方法は、後段で説明する。
から、フレームシーケンス14の現フレームkのための時間離散カルマンフィルタの予測状態
を取得するための、モデルパラメータのパラメータ推定を定義する。つまり、更新手段28は、現フレームkについての時間離散カルマンフィルタの反復ステップにおける第1ステップを実行するのであり、その目的で、先行フレームk−1に関する先行する反復の終端における最終状態、即ち
を受け取る。
は、先行フレームk−1の最終状態
により定義されたパラメータ推定を採用する。同時に、更新手段28は、前記最終状態と比較して予測状態の不確実性(uncertainty)を増大させる。その不確実性の値として、共分散行列を使用しても良い。具体的には、更新手段28は、現フレームkと先行フレームk−1との間の類似度を決定し、予測状態
の不確実性をこの類似度に依存する量によって増大させる。例えば連続するフレームk−1とフレームkとの間に突然の場面変化がある場合には、これらのフレームは類似性を殆ど持たないことになり、先行状態
から現在のカルマン状態
を予測することによる不確実性の増大量は最大限に高まる。反対に、静的な場面では、更新手段28の予測に基づく不確実性の増大量は、ゼロに近くなる可能性が高い。更新手段28は、連続的なフレーム間の類似度を測定するために、任意の記述統計学的方法を用いても良い。類似度は、現フレームkと先行フレームk−1との間において、これらのフレーム間の動きがその類似度を増大させ、及び/又はこれらフレーム間のその動きの除去/無視が伴われる方法で、決定されても良い。例えば、更新手段28は、先行フレームk−1から予測された予測フレームを、現フレームkとその予測フレームとの間の類似度を決定するために使用することもできる。予測フレームは、図1において破線矢印36で示すように、符号器12からもたらされても良い。符号器12は、動き補償予測を使用してその予測フレームを決定していても良いが、しかし、現フレームを符号化するために最終的に使用された動き解像度よりも低い動き解像度において決定されていても良い。つまり、この予測フレームの基底にある動きベクトルは、現フレームkを符号化するために最終的に使用された動きべクトルよりも低い解像度において、符号器12により決定されていても良く、量子化された予測残余と共に、データストリームの中にサイド情報として導入されても良い。代替的に、シーケンス14の中のフレームk−1以外のフレームが、参照フレームとして使用されても良く、このとき、現在の時刻tにあるフレームkに近いフレームが好ましい。追加的に、フレームkとフレームk−1との間の類似度であってその間に動き補償がないものが、この類似度の値を得るために使用されても良い。
から第1次の修正済み状態
を取得する。第1修正手段30は、前記複雑度の値を決定する際に、動き補償予測により決定された暫定的予測フレームと現フレームとの間の偏差を示す値、及び/又は現フレームのその中心傾向(central tendency)の周りにおけるサンプル値の分布を示す分散値を決定するよう構成されても良い。従って、破線矢印38で示すように、第1修正手段30はビデオ符号器12から暫定的な予測フレームを受け取っても良い。実際、この暫定的な予測フレームは、破線矢印36通じて更新手段28が任意に受け取るものと同じであっても良い。上述したそれぞれの値についての例を以下に詳細に説明する。原則的に、偏差の値とは、範囲、平均偏差、分散、又はそられに類似する値でも良い。現フレームについての分散値についても、同じことが言える。これら統計学的な値の全てはブロック毎のベースのように局所的に決定されても良く、このとき対象となる複雑度のための最終ヒントとして、中心傾向の平均又は他の値を取っても良い。
からも独立している。勿論、この予測は非常に粗いが、第1修正手段30は時間離散カルマンフィルタの修正ステップを、このように粗く予測されたモデルパラメータと、そのモデルパラメータの予測の結果と、の間の差に等しいある測定値を使用して実行しても良い。その予測の結果とは、先行フレームk−1について決定され、ある相関行列に適用された複雑度に基づいて、その先行フレームk−1について第1修正手段30によって得られたものである。換言すれば、第1修正手段30は、先行フレームk−1についてのレート−量子化モデル関数のモデルパラメータの粗い予測を、この先行フレームk−1のために決定されたそれぞれの複雑度に基づいて、以前の反復ステップの中で既に実行していたのである。修正ステップのためのそのような測定値を得るために、第1修正手段30は、先行フレームk−1のこれらの粗く予測されたモデルパラメータをある相関行列へと適用し、この適用の結果と現フレームkの粗く予測されたモデルパラメータとの間の差を決定しても良い。このように、第1修正手段30は粗い予測のノイズのシーケンシャルな相関関係を考慮し、その結果、より良好な測定値を得ることができる。このとき、第1修正手段30は、使用された相関行列を恒等行列から差し引いたものに等しいある測定行列を使用しても良い。この相関行列は、あるスカラψkを掛けた恒等行列であっても良く、第1修正手段30は、現フレームkと先行フレームk−1との間の類似性に依存して、そのスカラをセットするよう構成されても良い。第1修正手段30は、その類似度を、矢印36に関して上述したように、更新手段28と同調して決定しても良い。
に対して追加の修正を実行することになる。ビデオ符号器12が、その出力40で出力するデータストリームの中へ現フレームkを符号化する際に必要とする実際の符号化レートを得るためには、第2修正手段32は、データストリーム自身を精査するか、又は代替的に、図1に矢印42で示すようにビデオ符号器12から別に符号化レートを受け取っても良い。ビデオ符号器12が実際の符号化レート42で現フレームkを符号化するために使用した所定の量子化は、第1次の修正済み状態
のモデルパラメータによって定義されるレート−量子化モデル関数を使用して決定されたものであっても良い。ビデオ符号器12は、所定の量子化の決定を符号器自身で実行しても良い。代替的に、任意のレート制御手段18が所定の量子化を決定し、更に、このように決定された所定の量子化44を使用してビデオ符号器12を外部的に制御しても良い。例えば、レート制御手段18は幾つかの符号化レートの制約に従う必要があることも有るが、第1次の修正済み状態
のモデルパラメータによって決定されたレート−量子化モデル関数に基づいて、最適な所定の量子化44を探求する。最適な量子化とは、符号化レート又は何らかのコスト関数を、符号化レート及び符号化品質の両方に依存して最小化することにより定義されても良い。第2修正手段32は時間離散カルマンフィルタの修正ステップを実行するが、このとき第2修正手段32は、実際の符号化レート42に依存する測定値を使用し、更に、モデルパラメータXと、所定の量子化44のためのレート−量子化モデル関数に従うビデオ符号器12の符号化レートと、の間の関係の線形化されたバージョンであって、第1次の修正済み状態
において線形化された関係に依存する測定行列を使用する。さらに換言すれば、現フレームを実際の符号化レート42で
のモデルパラメータを用いて符号化する際に、第2修正手段32は、符号器12により使用された所定の量子化でf(q,x)を線形化し、この線形化された関係は、第2修正手段32により、時間離散カルマンフィルタの修正ステップの中で測定行列として使用される。第2修正手段32により実行される第2修正ステップの結果は、2回の修正を受けた時間離散カルマンフィルタの状態を表し、従って、現フレームの実際のレート−量子化関数20のより良好な近似のためのより良好なモデルパラメータの推定を表す。また、第2修正手段32はこの2回の修正を受けた状態を、更新手段28が次のフレームk+1に関して実行する予測ステップのための参照状態として伝送する。
通常は、実際のR−Q関数を得るために、可能性のある全ての量子化パラメータを用いて1つのフレームを符号化することは不可能である。その代わり、量子化パラメータとレート制御に対するビットレートとの間の関係についての近似知識を提供する、モデルが使用される。
ここで、ビット深度オフセット(BDO)は、
BDO=6・(bit_depth_luma-8)
として定義される。
H.264/AVC符号化されたビデオフレームのレート−量子化曲線R(QP)は、異なるフレームについてはかなり異なる様子を示すことがある。これは、高いビット深度及び高い量子化ステップサイズにおいて特に当てはまる。これらの曲線の全てを十分に近似できるようにするためには、頻繁に使用される二次関数(数式(2))は満足できるものではない。そのため、非特許文献7に記載されたようなより複雑なモデルが提案された。
これに従えば、a1=exp(a2)及びb1=b2・a1である。つまり、数式(4)により与えられた関数をフレームの実際のレート−量子化曲線へとフィットさせるために使用できる、自由に選択可能なパラメータは現実には5個しかないことになる。
数式(4)により与えられたモデルは、実際のR(QP)関係を適切に近似するであろう。QP領域の全体のための適切なモデルを得るために、本発明の発明者らは、小さな絶対近似誤差よりも、小さな相対近似誤差を持つことの方が重要であることを発見した。まず対数変換を行い、次に最小二乗法を使用することで、許容可能な相対誤差を達成することができた。従って、最適なパラメータべクトル
は次式により定義される。
ここでは、数式(9)に従って有効べクトルだけが考慮されると想定される。相対誤差の方がより重要であることを考慮に入れるため、ある対数変換が適用される。
により与えられるモデルは、実際のR−Q関数R(QP)の非常に正確な近似であることが発見された。この点は、モデルパラメータが前述した方法に従って決定された、図6に示す例によっても証明される。この図6は、相対誤差が全てのQPについて同様に保たれる、即ち、近似品質は全てのドメインにおいて良好であることを示している。
数式(10)に従い、各フレームkについて適切なパラメータべクトル
を見つけることができる。この
を使用して、モデル
は対応するフレームのレート−量子化特性Rk(QP)を近似的に記述する。ここで、
がべクトルxkにより表現できると仮定すると、このべクトルxkはフレームkのR−Qモデルの状態として解釈することができる。ここで、以下に示すxkの定義を選択する。
を選択することも可能である。しかし、このように選択した理由は、使用されたモデル関数が独立パラメータを5個しか持っていないために、xkのサイズが5×1に過ぎないからである。更に、この選択が粗い結果をもたらし、パラメータa1,b1,c1及びa2,b2,c2の相対的に容易な計算を可能にする。
の対数をとることで、モデル関数が正の領域f(q,x)≧0を持つことが保証される。
自明であるが、レート−量子化モデルは量子化パラメータの全ての領域において正でなければならない。更に、QPが増加するにつれて、単調に減少しなければならない。最後に、現実的には完璧に正しいとは言えないが、レート−歪み関数は凸状でなければならない。この制約は、ビデオ符号化の幾つかのアルゴリズムのために必要であり(非特許文献15を参照)、更に、レート−歪み理論(非特許文献1)に従うものである。従って、xは次式を満たす必要がある。
ここで、最初の2つの不等式によりf'(q,x)≦0が保証され、後の2つの不等式によりf''(q,x)≧0が保証される。
後段でも説明するように、R−Qモデルのための最適なパラメータを発見するという問題は、ダイナミック・システムの状態を決定するという問題として考えることができる。線形ダイナミック・システムの最適な状態は、カルマンフィルタを使用して発見することができる。従って、カルマンフィルタは第IV章において提示するモデルパラメータ推定アルゴリズムの基礎でもある。そのため、この章の残りの段落においてカルマンフィルタの基礎について説明する。
測定式は
であり、ここで、wkは処理ノイズ(process noise)であり、vkは測定ノイズ(measument noise)であり、これらの両方が白色、ゼロ平均、無相関であり、共分散
をそれぞれ持つ。べクトルxkはシステムの状態を表し、Φk-1は状態遷移行列であり、Hkは状態を測定ykへと関連付ける。そのようなシステムのために、最適な状態
が離散時間カルマンフィルタ・アルゴリズムを適用することで見つけられる。
上述した形式の線形離散時間システムを解くために、離散時間カルマンフィルタ(導出方法については非特許文献17を参照)を使用することができる。それは各時間ステップ又は反復kについて以下の演算を含む。
1)予測(状態及び共分散伝播(Covariance Propagation))
2)修正(状態及び共分散更新)
カルマンフィルタは、時間kにおいてr個の別々の測定が存在すると仮定している。つまり、r×1測定べクトルykが存在し、これが数式(25)における修正に使用される。しかし、全ての測定を一度に処理する必要はない。代わりに、一つずつ処理することも可能である。これが図1に示すシーケンシャルなカルマンフィルタの考え方である。つまり、最初にy0kが処理され、次にy1kが処理されるというような調子で、全てのr個の測定が考慮される。この方法はカルマンフィルタ修正式をr回演算することを必要とするが、しかし、この方法は非常に有用であると言える。なぜなら、数式(24)における逆が単に割り算となるからである。即ち、行列反転(matrix inversion)が必要でないからである。
となり、ここで、δkjは次式で定義されるクロネッカー・デルタ関数(Kronecker-Delta)である。
及び
ここで、R−Qモデルのパラメータを決定するために次の章で使用される測定について説明する。1番目は、あるフレームを符号化することがどの程度複雑かを示すいわゆる複雑度の値である。これらは、修正手段30によって決定され、使用される。2番目は、符号化後に得られるビットレートであって、現時点のモデルの推定誤差を示すものである。これらは修正手段32によって決定され、使用される。
フレームを符号化する前に修正手段30によって計算できる、様々な統計上の値が存在する。その中には、平均値、分散(σ2)、及び予測と実際のフレームとの間の平均二乗差(mean squared difference)(Δ)が含まれる。後者は、符号器12などの中で少なくとも粗い動き検出が行われた場合にだけ有効となる。代替的に、複数のレート−歪みモデル推定の手法において使用されている、一般的なMAD(平均絶対差)を差の値として使用することも可能である。
を使用して、フレームkについての以下のような測定式を公式化できる。
ここで、5×1のべクトルvkは予測誤差又はノイズとして考慮することができる。数式(44)に記載した経験的な導出に従えば、
が想定可能となる。
は状態の推定であるから、行列Hkは丁度恒等行列となる。即ち、
となる。
がそのフレームkの複雑度を過小評価している場合、フレームk+1について予測された状態
もまたその複雑度を過小評価していることを意味する。従って、vkは実際に有色ノイズであり(第II−C章と比較されたい)、即ち
であり、ここでζkは時間的に無相関であり、ゼロ平均及び分散Zkで正規分布している。つまり、
であり、Zkは経験的に決定されたものである。簡素化するために、5×5の相関行列Ykを次式で定義した。
ここで、スカラは0≦ψk≦1である。つまり、全てのパラメータ
について同じ相関関係ψkが想定される。この点は合理的である。なぜなら、相関関係は最後及び現フレームとの間のR−Q特性の変化の量(全てのパラメータについて同じである)に依存するからである。場面変換の場合には、例えばψk=0となる。
は常に実際値を過大評価している。そのため、誤差
はシーケンシャルな相関関係を持つ。数式(47)を使用すれば、その相関関係を除去して残りの白色ノイズを抽出することが可能になる。
1つのビデオシーケンスの連続するフレームは、一般的に非常に似通ったものである。従って、近接するフレームのR−Q特性には高い相関関係がある。つまり、フレームkにおけるモデルがより正確であればあるほど、フレームk+1についてのモデルもより正確に推定できることになる。従って、たとえフレームkが既に符号化されていた場合でも、図1における第2修正手段がフレームkのモデルを更新することには意味がある。
は以下のように定義される。
ここで、関数γkの目標は、実際に測定されたレートBkからRk(QPk)をできるだけ良好に推定すること、即ち、γk(Bk,QPk)≒Rk(QPk)である。単純な選択としては、γk(Bk,QPk)=Bkである。即ち、時間的な依存性を無視し、且つ測定されたレートだけを使用することである。しかし、主な参照フレームの統計上の値と量子化パラメータに基づいて、
を計算することも可能であり、これはRk(QPk)により近いものである。このレート
は次にモデルを修正するために使用可能である。数式(11)に従えば、以下のような関係がビットレートと状態の間に存在する。
の中へと組み込んでしまい、それをゼロ平均及び分散
を持つランダム白色ノイズと考えることが適切である。即ち次式となる。
多くの文献の中では、二次のR−Qモデルのパラメータは線形最小二乗によって決定されるようである。しかしカルマンフィルタは、ある程度(再帰的)線形最小二乗に類似しているが(非特許文献19を参照)、この特別な問題については幾つかの決定的な長所を有している。これらは、主に変形に対する固有の適応能力と、不確実性(ノイズ)の考慮と、複数の測定を合体させる可能性とである。
図8に示す現フレームkに関する一巡のアルゴリズムの第1のステップは、例えば更新手段28によって実行される予測ステップ50である。
上述したように、図8の修正カルマンフィルタ・アルゴリズムの修正は2つの修正ステップ52と54とに分かれ、それぞれ第1修正手段30と第2修正手段32とにより実行される。
の誤差との間において、何も修正が想定されていないからである。即ち、
を決定するステップ56を含む。上述したように、最適な決定には、符号器12がフル・ペル動き推定(full pel motion estimation)を実行するなどして粗い時間的予測58を実行し、先行フレームk−1から現フレームkを予測することが含まれていても良い。符号器12は必ずしも直前に符号化されたフレームを参照フレームとして使用する必要はないことに注意すべきである。参照フレームは、現在の時間シーケンスにおける直前のものに限られてはいない。符号器12は参照インデックスを選択する自由を有している。即ち、先行するいずれの符号化済フレームを参照フレームとして指標化しても良い。次に、第1ステップ52において、複雑度の値
から数式(44)に定義されるように予測された状態が、現フレームに関するR−Qモデルの推定品質を向上させるために使用される。予測誤差のシーケンシャルな相関関係に対処するため、第II−C章で説明した測定差別化の手法が使用されても良い。数式(29)に従い、補助的な測定y'kが以下のように定義される。
を得ることができる。
であり、上述したように、このモデルパラメータの推定は、例えばレート制御手段18又は符号器12自身の何らかの内部的な要素(この代替案については図1内に図示していない)によって、符号器の符号化レートを制御するために使用されても良い。このレート制御ステップは図8内では参照符号60で示される。特に、ステップ60は、
によって決定されたレート−量子化モデル関数に基づいて現フレームkを符号化するための所定の量子化QPkを選択することを含む。実際の符号化は、この所定の量子化を使用して、ステップ62において符号器12によって実行される。その結果、選択された所定の量子化QPkを使用することで得られた実際の符号化レートBkが既知となり、第2の修正ステップ54において使用することができる。このステップ54では、符号化の後で得られたビットレートが、R−Qモデル26のためのフィードバックとして使用される。つまり、その状態は関係(50b)に従って修正されるという意味になる。この関係は(log(f(q,x))のために)非線形であることから、拡張カルマンフィルタ(第II−D章を参照)が使用され、それに従えば、現時点の状態
の周囲の測定の方程式は次式のように線形化される。
とを線形化して測定行列を取得し、更に、数式(67)を計算してカルマン状態を更新し、数式(69)を計算して対応する不確実性を数式(64),(66)及び(68)に従って更新する。
を追加的に選択する必要があるという点について、説明を省略して来た。次章Cでは、その可能性のある選択と、更に相関行列Ψkについての可能性のある選択について説明する。
異なる有効な情報の適切な融合は、Qk、Zk、
及びΨkによって制御される。これらの行列は、測定の中の不確実性と状態とをモデル化する。それらを適切に選択することで、状態の合理的な推定と、レート−量子化モデルの合理的な推定とを得ることができる。都合良いことに、ビデオフレームのR−Q特性の可変性によって、それらは全てのフレームに対して適合できる。
もまたフレームkについての良好な推定であるという不確実性を表す。この不確実性は1つのフレームから他のフレームへの符号化特性の変化に起因する。つまり、もし2つの連続するフレーム(及びそれらに対応する関数)が非常に異なっている場合、不確実性の増加が高くなる。反対にもし2つのフレームが略同一であれば、最終フレームの状態は現フレームに対しても適切である可能性が高い。同様に、パラメータ推定
との間の相関関係、及びΨkとZkとの適切な選択もまた、1つのフレームから次のフレームへのR−Q関係における変化量に依存すると考えることができる。
が可能性な限りの最適な状態となる。
は一定に保持することができるであろう。しかし、それはまた、Rk(QPk)からの
の可能性のある偏差をもモデル化しなければならないため、参照フレームが他のQPを用いて符号化された場合には、この
の値も都合良く増大することができる。
図8に示すように、レート制御60は、第1修正ステップ52の後で得られた状態推定に基づくレート−量子化モデルを使用する。つまり、レート制御は、
が量子化パラメータとフレームkのレートとの間の関係を表すと想定している。
と対応する誤差共分散行列Pとを含む。当然ながら、この場合のインデックスk−1は同じタイプの先行して符号化されたフレームを指している。換言すれば、図1の装置10は、それが操作しているフレームシーケンスが、特定の予測タイプのフレームだけを含み、ビデオシーケンス14の異なる予測タイプのフレームを含まないという点で、ビデオシーケンス14の適切なサブセットであるよう構成されている。複数の装置10が並列に設けられ、それぞれが異なる予測タイプに対応していても良く、又は、1つの装置が異なるカルマン状態及び関連する不確実性を処理してもよい。即ち、各予測タイプについて1つのペア(カルマン状態及び不確実性)を処理しても良い。
提案モデルの潜在的な正確性を示す目的で、種々のシーケンスのフレームについて実際のレート−量子化曲線R(QP)を計算した。その後、二次モデル及び提案モデルを測定されたR−Q関数に対してフィットさせた。比較できる値を得る目的で、このフィッティングは数式(10)に従って両方のモデルについて行った。平均近似誤差は次式のように計算した。
ここで、Mは考慮されたフレームの個数を示す。二次モデル(二次モデルは通常は8ビットの場合のみについて定義されている。12ビットの場合については単純な拡張であると考えられるものを使用した)(数式(1))と、提案モデル(数式(4))に関する種々のシーケンスについての結果をまとめると、表1になる。
が現実のレート−量子化特性を依然として過小評価していることを示している。従って、修正ステップ2では、モデル関数を更に高めに導く。修正済みのR−Q曲線が修正に使用されたサンプルを正確に通過している訳ではないことに注目されたい。その理由は、(ビットレートはフレーム毎に振れることが多いため)モデルの振動を防ぐ
を使用しているからである。
が最小化される量子化パラメータが使用される。これらの計算では、選択された最適なQPをR−Qモデルに従って選択されたQPと比較する。更に、複雑度の値から予測された状態だけを考慮する場合(第1修正のみ)に選択されるQPと、符号化の後で測定されるレートだけをモデルの修正に使用する場合(第2修正のみ)に選択されるQPとに対しても比較する。
以上のように、上述したモデルは可能性のある種々のレート−量子化曲線を近似することができ、その結果、H.264/AVCを用いた符号化によって非常に高い正確性をもたらす。この正確性は量子化領域全体に及ぶ。一般的に使用されている二次モデルと比較しても、上述のモデルは顕著な高品質を示す。このモデル及び他のモデルのパラメータを推定するという問題は、カルマンフィルタの修正バージョンを使用することで解決できる。これにより、時間的相関関係と有効な複雑度の値とが考慮可能となる。その結果、ノイズ共分散行列と相関関係パラメータとを介して完璧に制御可能な、洗練され且つ簡素なアルゴリズムが得られた。このモデルの優れた品質とその推定は、様々なシミュレーション及び実験によって証明することができる。
がそのフレームkの複雑度を過小評価している場合、フレームk+1について予測された状態
もまたその複雑度を過小評価していることを意味する。従って、vkは実際に有色ノイズであり(第II−C章と比較されたい)、即ち
であり、ここでζkは時間的に無相関であり、ゼロ平均及び分散Zkで正規分布している。つまり、
であり、Zkは経験的に決定されたものである。簡素化するために、5×5の相関行列Ψ kを次式で定義した。
ここで、スカラは0≦ψk≦1である。つまり、全てのパラメータ
について同じ相関関係ψkが想定される。この点は合理的である。なぜなら、相関関係は最後及び現フレームとの間のR−Q特性の変化の量(全てのパラメータについて同じである)に依存するからである。場面変換の場合には、例えばψk=0となる。
Claims (22)
- フレームシーケンス(14)のためのビデオ符号器(12)の実際のレート−又は歪み−量子化関数(20)を近似するために、レート−又は歪み−量子化モデル関数(26)のモデルパラメータを推定する装置であって、
時間離散カルマンフィルタの予測ステップ(50)を実行するよう構成された更新手段(28)であって、前記時間離散カルマンフィルタの状態が前記モデルパラメータのパラメータ推定を表しており、前記フレームシーケンス(14)の先行フレーム(k−1)についての時間離散カルマンフィルタの状態から、前記フレームシーケンス(14)の現フレーム(k)についての時間離散カルマンフィルタの予測状態
を得る、更新手段(28)と、
前記現フレームkの複雑度の値を決定し、かつ決定されたその複雑度の値に依存する測定値を使用して前記時間離散カルマンフィルタの修正ステップ(52)を実行するよう構成された第1修正手段(30)であって、前記予測状態
から前記時間離散カルマンフィルタの第1次の修正済み状態
を得る、第1修正手段(30)と、
所定の量子化を使用して前記現フレーム(k)を符号化する際の前記ビデオ符号器(12)の実際の符号化レート又は歪み(42)に依存する測定値を使用して、前記時間離散カルマンフィルタの修正ステップ(54)を実行する、第2修正手段(32)と、
を備える装置。 - 前記時間離散カルマンフィルタの前記予測ステップを実行する際に、前記更新手段(28)は恒等行列を状態遷移行列として使用し、その結果、前記予測状態は前記先行フレームについての前記時間離散カルマンフィルタの状態によって定義される前記パラメータ推定を採用し、更に前記更新手段(28)は、前記先行フレームについての前記時間離散カルマンフィルタの状態と比較して前記予測状態の不確実性を増大させることを特徴とする、請求項1に記載の装置。
- 前記更新手段(28)は、前記現フレーム(k)と前記先行フレーム(k−1)との間の類似度を決定し、更に、その類似度に依存する量によって前記予測状態の不確実性を増大させることを特徴とする、請求項2に記載の装置。
- 前記第1修正手段(30)は、前記複雑度の値を決定する際に、動き補償予測により決定された暫定的予測フレームと現フレームとの間の偏差を示す値、及び/又は現フレームの分布の中心傾向の周りにおけるサンプル値の分布を示す分散値、を決定することを特徴とする、請求項1乃至3のいずれか1項に記載の装置。
- 前記第1修正手段(30)は、決定された前記複雑度の値に基づいて前記現フレーム(k)についてのレート−又は歪み−量子化モデル関数のモデルパラメータを予測し、更に、前記予測されたモデルパラメータと、前記先行フレームに関して決定され、ある相関行列に適用された複雑度の値に基づく前記先行フレームについてのモデルパラメータの予測の結果と、の間の差に依存する測定値を使用し、かつ前記恒等行列から前記相関行列を減算したもの等しい測定行列を使用して、前記修正ステップを実行することを特徴とする、請求項1乃至4のいずれか1項に記載の装置。
- 前記第1修正手段(30)は、前記現フレームと前記先行フレームとの間の類似度に依存して、前記相関行列を設定することを特徴とする、請求項5に記載の装置。
- 前記レート−又は歪み−量子化モデル関数はレート−量子化モデル関数であり、
前記第1修正手段は、前記現フレームkについてのレート−量子化モデル関数のモデルパラメータを前記決定された複雑度の値に基づいて予測し、かつその予測されたモデルパラメータに依存して前記修正ステップにおける前記測定値を決定し、
前記第2修正手段は、前記モデルパラメータと前記レート−量子化モデル関数に従う符号化レートとの間の関係の線形化されたバージョンに依存する測定行列を決定し、
ビデオ符号器による量子化qをビデオ符号器の符号化レートへと関係付けるレート−量子化モデル関数fがピース毎の関数であり、細かい量子化区間内においては二次関数ピースを含み、粗い量子化区間内においては指数関数を含むことを特徴とする、請求項8に記載の装置。 - 前記第1修正手段は、前記現フレームkについてのレート−量子化モデル関数のモデルパラメータを前記決定された複雑度の値に基づいて予測し、かつその予測されたモデルパラメータに依存して前記修正ステップにおける前記測定値を決定し、
前記第2修正手段は、前記モデルパラメータと前記レート−量子化モデル関数に従う符号化レートとの間の関係の線形化されたバージョンに依存する測定行列を決定し、
ビデオ符号器による量子化qをビデオ符号器の符号化レートへと関係付けるレート−量子化モデル関数fが次式であり、
ここで、β=[a1,b1,c1,m,a2,b2,c2]であり、Nは量子化qの領域を0≦q≦Nとなるよう定義し、次式
はモデルパラメータx1,x2,x3,x4及びx5を定義することを特徴とする、請求項8又は9に記載の装置。 - 前記予測ステップを実行する際に前記更新手段が次式を計算し、
ここで、
は前記先行フレームk−1についての前記時間離散カルマンフィルタの状態であり、
は前記現フレームについての前記時間離散カルマンフィルタの予測状態であり、
Pk-1 +は前記先行フレームk−1についての前記時間離散カルマンフィルタの状態の前記不確実性を測定する共分散行列であり、
Pk -は前記現フレームについての前記時間離散カルマンフィルタの予測状態の前記不確実性を測定する共分散行列であり、
Qk-1は妨害ノイズ共分散行列であり、
前記第1修正手段は前記現フレームと前記先行フレームとの間の類似度に依存してQk-1を設定し、
更に前記第1修正手段は次式を計算し、
ここで、
であり、
は前記現フレームについての前記時間離散カルマンフィルタの第1次の修正済み状態であり、
Pk 0は前記第1次の修正済み状態の不確実性を測定する共分散行列であり、
は前記現フレームkの前記決定された複雑度の値から予測されるモデルパラメータを定義するものであり、
は前記先行フレームk−1の前記決定された複雑度の値から予測されるモデルパラメータを定義するものであり、
Ψkは前記現フレームと前記先行フレームとの間の類似度に依存して設定される相関関係行列であり、
Iは恒等行列であり、
Zkは測定ノイズ共分散行列であり、
前記第2修正手段は次式を計算し、
ここで、
であり、
fは前記モデルパラメータxによってパラメータ化可能であり且つ符号化レート−又は歪み−量子化関数を表現しているレート−又は歪み−量子化モデル関数であり、
は前記現フレームについての前記時間離散カルマンフィルタの2回の修正済みの状態であり、
Pk +は前記2回の修正済みの状態の前記不確実性を測定する共分散行列であり、
qkは前記所定の量子化であり、
は他の測定ノイズ共分散行列であり、
は前記所定の量子化を使用して前記現フレームを符号化する際の前記ビデオ符号器の実際の符号化レート又は歪みを示す値であることを特徴とする、請求項1乃至10のいずれか1項に記載の装置。 - 前記第2修正手段は、前記測定値が前記ビデオ符号器(12)の実際の符号化レート又は歪み(42)に依存しており、その依存方法は、前記現フレーム(k)を符号化するときに使用された前記所定の量子化と、先行して符号化された参照フレームを符号化するときに前記ビデオ符号器により使用された別の量子化との間の関係に依存する方法であり、その先行して符号化された参照フレームとは、そのフレームの再構成されたバージョンから、前記ビデオ符号器が前記現フレームを符号化するときに動き補償済の予測内で前記現フレームを予測したものであることを特徴とする、請求項1乃至11のいずれか1項に記載の装置。
- 前記フレームシーケンスが特定の予測タイプのフレームだけを含み、異なる予測タイプのフレームを含まないという点で、前記フレームシーケンスがビデオシーケンスの適切なサブセットであるように構成されていることを特徴とする、請求項1乃至12のいずれか1項に記載の装置。
- ビデオ符号器(12)と、
フレームシーケンス(14)のためのビデオ符号器(12)の実際のレート−又は歪み−量子化関数(20)を近似するために、レート−又は歪み−量子化モデル関数(26)のモデルパラメータを推定する、請求項1乃至13のいずれか1項に記載の装置と、
を備えるシステム。 - 前記第1次の修正済み状態によって決定されたレート−又は歪み−量子化モデル関数を使用して前記所定の量子化を決定するレート制御手段(18)を更に備え、
前記ビデオ符号器は前記所定の量子化を使用して前記現フレームをデータストリーム内へと符号化することを特徴とする、請求項14に記載のシステム。 - 前記ビデオ符号器は動き補償予測を用いて第1の動き解像度における前記現フレームを予測して前記暫定的予測フレームを取得し、
前記第1修正手段は前記暫定的予測フレームを使用して前記複雑度の値を決定し、
前記ビデオ符号器は前記第1の動き解像度よりも高い第2の動き解像度における前記現フレームを予測することで最終的に予測されたフレームを取得し、かつ前記最終的に予測されたフレームを使用して前記現フレームを符号化することを特徴とする、請求項15に記載のシステム。 - フレームシーケンス(14)のためのビデオ符号器(12)の実際のレート−量子化関数(20)を近似するために、レート−量子化モデル関数(26)のモデルパラメータを推定する装置であって、
前記レート−量子化モデル関数はピース毎の関数であり、細かい量子化区間内では二次関数のピースを含み、粗い量子化区間内では指数関数のピースを含むことを特徴とする装置。 - 量子化軸に沿った前記二次関数のピースと前記指数関数のピースとの間の遷移点の位置が、前記モデルパラメータを用いて調整可能であることを特徴とする、請求項17に記載の装置。
- 前記モデルパラメータは拡張カルマンフィルタを使用して推定され、前記拡張カルマンフィルタの状態が前記モデルパラメータのパラメータ推定を定義することを特徴とする、請求項17又は18に記載の装置。
- フレームシーケンス(14)のためのビデオ符号器(12)の実際のレート−又は歪み−量子化関数(20)を近似するために、レート−又は歪み−量子化モデル関数(26)のモデルパラメータを推定する方法であって、
時間離散カルマンフィルタの予測ステップ(50)を実行するステップであって、前記時間離散カルマンフィルタの状態が前記モデルパラメータのパラメータ推定を定義するものであり、前記フレームシーケンス(14)の先行フレーム(k−1)についての時間離散カルマンフィルタの状態から、前記フレームシーケンス(14)の現フレーム(k)についての時間離散カルマンフィルタの予測状態
を得るステップと、
前記現フレームkの複雑度の値を決定し、かつ決定されたその複雑度の値に依存する測定値を使用して前記時間離散カルマンフィルタの修正ステップ(52)を実行するステップであって、前記予測状態
から前記時間離散カルマンフィルタの第1次の修正済み状態
を得るステップと、
所定の量子化を使用して前記現フレーム(k)を符号化する際の前記ビデオ符号器(12)の実際の符号化レート又は歪み(42)に依存する測定値を使用し、かつ前記モデルパラメータと、前記所定の量子化に関するレート−又は歪み−量子化モデル関数(26)に従う符号化レート又は歪みと、の間の関係の前記第1次の修正済み状態
において線形化されたバージョンに依存する測定行列を使用して、前記時間離散カルマンフィルタの修正ステップ(54)を実行するステップと、を含む方法。 - フレームシーケンス(14)のためのビデオ符号器(12)の実際のレート−量子化関数(20)を近似するために、レート−量子化モデル関数(26)のモデルパラメータを推定する方法であって、
前記レート−量子化モデル関数はピース毎の関数であり、細かい量子化区間内では二次関数のピースを含み、粗い量子化区間内では指数関数のピースを含むことを特徴とする方法。 - コンピュータに請求項20又は21に記載の方法を実行させるプログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP11173076.8 | 2011-07-07 | ||
EP11173076.8A EP2544450B1 (en) | 2011-07-07 | 2011-07-07 | Model parameter estimation for a rate- or distortion-quantization model function |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013021690A true JP2013021690A (ja) | 2013-01-31 |
JP5416812B2 JP5416812B2 (ja) | 2014-02-12 |
Family
ID=44533843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012149192A Active JP5416812B2 (ja) | 2011-07-07 | 2012-07-03 | レート−又は歪み−量子化モデル関数のためのモデルパラメータ推定 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9445102B2 (ja) |
EP (1) | EP2544450B1 (ja) |
JP (1) | JP5416812B2 (ja) |
CN (1) | CN102868884B (ja) |
HK (1) | HK1180159A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9002678B1 (en) | 2014-01-10 | 2015-04-07 | King Fahd University Of Petroleum And Minerals | Unified approach to detection and isolation of parametric faults using a kalman filter residual-based approach |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017509268A (ja) | 2013-12-22 | 2017-03-30 | エルジー エレクトロニクス インコーポレイティド | 量子化エラーの追加的な制御を利用したビデオ信号のエンコード、デコード方法及び装置 |
CN106331704B (zh) * | 2015-07-07 | 2019-10-22 | 杭州海康威视数字技术股份有限公司 | 一种视频码率控制方法及视频编码装置 |
CN105223906B (zh) * | 2015-09-15 | 2017-10-03 | 华中科技大学 | 一种数控系统伺服驱动信号谐波频率的自动校正方法 |
US10397515B2 (en) * | 2017-01-05 | 2019-08-27 | Nokia Of America Corporation | Protecting personal privacy in a video monitoring system |
CN107078852B (zh) * | 2017-01-18 | 2019-03-08 | 深圳市大疆创新科技有限公司 | 传输编码数据的方法、装置、计算机系统和移动设备 |
EP3769576A1 (en) * | 2018-03-23 | 2021-01-27 | Nokia Technologies OY | Allocating radio access network resources based on predicted video encoding rates |
CN110460853B (zh) * | 2018-05-07 | 2021-04-30 | 上海富瀚微电子股份有限公司 | 一种高效视频编码码率估计装置及方法 |
WO2019242852A1 (en) * | 2018-06-20 | 2019-12-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for massive mu-mimo |
CA3070812A1 (en) * | 2019-03-13 | 2020-09-13 | Alexander GILADI | Method and apparatus for content-adaptive frame duration extension |
CN110401451B (zh) * | 2019-06-12 | 2020-12-04 | 中国科学院信息工程研究所 | 基于字符集变换的自动机空间压缩方法及系统 |
CN110418134B (zh) * | 2019-08-01 | 2021-10-26 | 字节跳动(香港)有限公司 | 基于视频质量的视频编码方法、装置及电子设备 |
CN112697215B (zh) * | 2020-11-19 | 2022-10-18 | 浙江工业大学 | 一种用于超声波水表数据滤波的卡尔曼滤波参数调试方法 |
JP2024511636A (ja) * | 2021-03-31 | 2024-03-14 | ヒョンダイ モーター カンパニー | インター予測にディープラーニングベースのインループフィルタを用いるビデオコーディング方法及び装置 |
CN114578811B (zh) * | 2022-02-17 | 2023-06-20 | 中国矿业大学 | 一种带式输送机巡检机器人系统高精度定位方法 |
CN115760850B (zh) * | 2023-01-05 | 2023-05-26 | 长江勘测规划设计研究有限责任公司 | 一种利用机器视觉的无标尺识别水位的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001526850A (ja) * | 1997-02-11 | 2001-12-18 | シャープ株式会社 | 画像符号化器における量子化値の最適化方法及び装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6111991A (en) * | 1998-01-16 | 2000-08-29 | Sharp Laboratories Of America | Method and apparatus for optimizing quantizer values in an image encoder |
US20050262276A1 (en) * | 2004-05-13 | 2005-11-24 | Ittiam Systamc (P) Ltd. | Design method for implementing high memory algorithm on low internal memory processor using a direct memory access (DMA) engine |
CN100505874C (zh) | 2005-02-01 | 2009-06-24 | 华为技术有限公司 | 一种视频编码速率控制的方法 |
US8379721B2 (en) | 2005-09-22 | 2013-02-19 | Qualcomm Incorported | Two pass rate control techniques for video coding using a min-max approach |
CN101523915B (zh) | 2005-09-22 | 2011-06-08 | 高通股份有限公司 | 使用min-max方法的用于视频编码的两遍速率控制技术 |
WO2008027250A2 (en) | 2006-08-30 | 2008-03-06 | Thomson Licensing | Method and apparatus for analytical and empirical hybrid encoding distortion modeling |
JP5427785B2 (ja) * | 2007-09-28 | 2014-02-26 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ビデオ圧縮技法及びビデオ伝達技法 |
-
2011
- 2011-07-07 EP EP11173076.8A patent/EP2544450B1/en active Active
-
2012
- 2012-07-03 JP JP2012149192A patent/JP5416812B2/ja active Active
- 2012-07-05 US US13/541,974 patent/US9445102B2/en active Active
- 2012-07-09 CN CN201210237959.8A patent/CN102868884B/zh active Active
-
2013
- 2013-06-21 HK HK13107229.3A patent/HK1180159A1/zh unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001526850A (ja) * | 1997-02-11 | 2001-12-18 | シャープ株式会社 | 画像符号化器における量子化値の最適化方法及び装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9002678B1 (en) | 2014-01-10 | 2015-04-07 | King Fahd University Of Petroleum And Minerals | Unified approach to detection and isolation of parametric faults using a kalman filter residual-based approach |
Also Published As
Publication number | Publication date |
---|---|
CN102868884B (zh) | 2015-09-16 |
US9445102B2 (en) | 2016-09-13 |
HK1180159A1 (zh) | 2013-10-11 |
EP2544450B1 (en) | 2016-04-13 |
US20130010859A1 (en) | 2013-01-10 |
CN102868884A (zh) | 2013-01-09 |
JP5416812B2 (ja) | 2014-02-12 |
EP2544450A1 (en) | 2013-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5416812B2 (ja) | レート−又は歪み−量子化モデル関数のためのモデルパラメータ推定 | |
US8244048B2 (en) | Method and apparatus for image encoding and image decoding | |
KR101023262B1 (ko) | 화상 부호화 방법 및 복호 방법, 이들의 장치 및 이들의 프로그램과 프로그램을 기록한 기억매체 | |
US8130838B2 (en) | Encoding device and dynamic image recording system using the encoding device | |
KR101374812B1 (ko) | 다시점 영상 부호화 방법, 다시점 영상 복호 방법, 다시점 영상 부호화 장치, 다시점 영상 복호 장치 및 프로그램 | |
KR101449435B1 (ko) | 움직임 벡터 정규화에 기초한 영상의 부호화 방법 및 장치, 영상의 복호화 방법 및 장치 | |
Dar et al. | Motion-compensated coding and frame rate up-conversion: Models and analysis | |
Hyun et al. | A frame-level constant bit-rate control using recursive Bayesian estimation for versatile video coding | |
US9635362B2 (en) | System and method for the dynamic reduction of the entropy of a signal upstream to a data compression device | |
US10171807B2 (en) | Picture-level QP rate control for HEVC encoding | |
KR101253917B1 (ko) | 움직임 추정 장치 및 그 방법 | |
JP4784618B2 (ja) | 動画像符号化装置、動画像復号化装置、動画像符号化プログラム、及び動画像復号化プログラム | |
JP4490353B2 (ja) | 量子化歪み推定方法,量子化歪み推定装置,量子化歪み推定プログラムおよびその記録媒体 | |
US20120106641A1 (en) | Method for predicting a block of image data, decoding and coding devices implementing said method | |
Pang et al. | Frame-level dependent bit allocation via geometric programming | |
JP4824712B2 (ja) | 動き推定精度推定方法、動き推定精度推定装置、動き推定精度推定プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US10075691B2 (en) | Multiview video coding method using non-referenced view video group | |
JP4785890B2 (ja) | 動き推定精度推定方法、動き推定精度推定装置、動き推定精度推定プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR102245740B1 (ko) | 깊이 영상에서 신축을 이용한 움직임 추정 방법 및 장치 | |
JP6700877B2 (ja) | 画像復号装置、画像復号プログラム及びチップ | |
JP4160513B2 (ja) | 動画像の輝度変化パラメータ推定方法,動画像の輝度変化パラメータ推定プログラムおよびその記録媒体,並びに,動画像符号化装置,動画像符号化方法,動画像符号化プログラムおよびその記録媒体 | |
An | Optimization and learning based video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130618 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130913 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130919 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5416812 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |