JP2011510601A - 適応性動き情報コスト推定 - Google Patents
適応性動き情報コスト推定 Download PDFInfo
- Publication number
- JP2011510601A JP2011510601A JP2010544390A JP2010544390A JP2011510601A JP 2011510601 A JP2011510601 A JP 2011510601A JP 2010544390 A JP2010544390 A JP 2010544390A JP 2010544390 A JP2010544390 A JP 2010544390A JP 2011510601 A JP2011510601 A JP 2011510601A
- Authority
- JP
- Japan
- Prior art keywords
- motion
- motion vector
- cost
- encoding
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/19—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/567—Motion estimation based on rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【選択図】図1
Description
本出願は、発明の名称が「適応性動き情報コスト推定」で、チエン・リーおよびアレクサンドラ・トゥラピスによって、2008年1月22日に申請された、同時係属のアメリカ合衆国の仮特許出願No.61/022787と関連があり、これについて優先権主張すると共に十分な地位の利益を請求し、これが譲受人に譲渡される(ドルビー研究所のIP法的参照文献No.D08001 US0l)。この仮特許出願は、ここで完全に説明するように、すべての目的のために参照によってここに組込まれる。本出願は特許協力条約(PCT)に準拠して申請される。
A. ビデオ符号化装置プラットホームの例
ここに記述された実施例は、適応性動き情報コスト推定に関係がある。ある近来のビデオ符号化装置は、映像シーケンスおよび効率的な符号化ビデオ情報コンテンツ内に存在する時間的相関を活用するためにMCP(動き補償予測)を使用する。ビデオ符号化はエンコーダシステムとデコーダシステムで行なわれる。
ここに記述された実施例は、適応性動き情報コスト推定(MCP)に関係がある。実施例は、例えばビデオ符号化装置によるイメージ処理とビデオ処理に役立つ。MCPはビデオコンテンツ中の動きを推定する。動き検出は、本質的にラグランジュのコスト関数として処理される。ここで、ラグランジュのコスト関数は(1)達成される動き予測の精度と(2)動き関連情報を伝達するために必要とされるデータ速度とを均衡させる。例えば、動き検出は、ラグランジュのコスト関数(これは式1に従って定義される)の最小化問題として以下で計算される。
式1では、
は原始データ、
は予測される動きベクトル、
は動き補償済みの基準、
は予測された差(ここでSADは絶対差の総和)、
はすべての候補動きベクトルの一組、
は動きベクトルの予測値、および
はラグランジュ乗数を表す。式1内の術語
は、予測された動きベクトル差(mvd)
の速度を表わし、動き情報を伝達するコストをこのように表わす。
はルックアップ表(LUT)を使用して推定される。LUTはユニバーサル可変長符号(UVLC)を含んでいる。
式2では、
は床動作(floor operation)を表わす。式2はこのように閉形式の近似を提示する。閉形式の近似は、CABACで符号化されるmvd速度に対する計算の複雑さを著しく低減できる。
は、CAVLCで使用されるエントロピー符号化には正確である。CABACを使用すると、推定速度
は実際のmvd速度と異なる。推定速度
が実際のmvd速度と異なる場合に、CABACが使用されると、式1に従って計算された動き検出結果は影響を受ける。ここでは、推定速度
と実際のmvd速度の間の差は、動きベクトル速度推定不一致(MV−REM)と呼ばれる。
MV−REMを特徴づける特性は、標準共通中間フォーマット(CIF)試験シーケンスを参照して、ここに記述される。図3Aは、「フォアマン」としてビデオ処理とイメージ処理に関係のある分野に熟練している技術者に周知のCIF試験シーケンスによって計算された動きベクトル差(mvd)速度の具体例を示す。図3Bは、「フットボール」としてビデオ処理とイメージ処理に関係のある分野に熟練している技術者に周知のCIF試験シーケンスによって計算されたmvd速度の具体例を描写する。図3Aと図3Bでは、動きベクトル速度「UVLC」および動きベクトル速度「CABAC」は、それぞれUVLCとCABACで計算される動きベクトル差の関数としてプロットされる。
が2のべき乗として表現される場合には、MV−REMはより重要であり、恐らく本質的である。これは、H.264/AVCのようなコーデック中のUVLCとCABACの符号長が、異なるmvd値で増加するという事実に起因する。上記の式2に示されるように、UVLC速度は、
で増加する。したがって、特性
を備えたmvdは、同じ推定UVLC符号長を共有する。同じ推定UVLC符号長は、
の符号長より2ビット短い。
に使用される。各符号のない整数値記号x≧0に対する単項コード語は、数「x」の「1」(1)ビットと、付加した終結の「ゼロ」(0)ビットを有する。ここで
であり、
ビットの後置部(suffix)を生成するために、後置部が
に対して第k番目指数ゴロムコード名として構成される。複雑さおよび符号化する効率を均衡させるために、S=9及びk=3が選択されており、コーデック標準に定められている。
でのCABACを用いて取り入れられる。それらの実際のCABAC速度が統計的に接近している場合に、UVLC近似は、
での動きベクトルよりも高価なものとして、
での動きベクトルを考慮する。
での動きベクトルを選択しそうもない。同様に、次の最初(the first)の実際の速度は統計的により下位で、そこで式1のラグランジュの原価比較で好ましいものであるが、UVLC近似は
での動きベクトルを考慮して、
での動きベクトルと実質的に等しいコストを負担するようにさせる。したがって、
での動きベクトル候補は、ある意味で「不公平に」不利になり、選択されそうではない。
本発明の実施例では、下位の複雑さの適応性速度推定方法でMV−REMを低減させるように機能する。この適応性速度推定方法は、CABACベースのエンコーダがすべてのmvdを符号化し、その上に関連する実際のビットを計数することを可能にする。本発明の実施例は、処理されているビデオのコンテンツとコンテンツ特性に基づいて適応して更新されるルックアップ表を使用する。
A.平均コストでルックアップ表を適応的に更新すること
実施例は、平均コストに従ってルックアップ表を適応的に更新する。ルックアップ表が初期化される。実施例では、上記の式2に記述されるように、ルックアップ表はUVLCを使用した推定コストで初期化される。動き検出は上記の式1により各ブロックについて計算される。動き検出はルックアップ表から読まれた動きベクトルコストで行なわれてもよい。動きベクトルを選択する際、選択された動きベクトルは予測的に符号化される。また、mvdはCABACを使用してエントロピー符号化される。符号化されたmvdは、デコーダにビットストリームの一部として送られる。
が収集される。ここで、
は、カレントブロックまでのmvd=nの発生の合計数である。ここで、
は、テーブル初期設定で得られたmvd=nのためのルックアップ表中の初期値を表わすもので、mvd=nのための対応するコストである。
は最新のルックアップ表入力を提供する。これらは、以下の式4Aと4Bに記述される。
実施例は、加重平均コストに従ってルックアップ表を適応的に更新する。各符号化されたmvd=nのために、実際の符号化速度Ri n,i=1、2、…、Mはすべての符号化されたmvd=nのために収集される。実施例は、以下の式5A及び式5Bで示されるような加重平均コストでルックアップ表を更新する。
式5Bでは、wiは重み付け係数を表わす。実施例では、重み付け係数wiは式5Cに従って選択される。
式5Cで、kは0以上の整数値である。
実施例では、mvd=nの実際の符号化速度は、すべての第N番目の発生のために収集される。対応するルックアップ表入力は、例えば、上記のセクションII.A.とII.B.に記述された平均コストあるいは加重平均コストで適応的に更新される。現在の実施例は、N回までコンテンツを更新することで複雑さを低減し、例えばN回超えは別のアプローチによる。
実施例では、ルックアップ表の一部はmvdのコンテンツ特性に従って更新される。2のべき乗の速度不一致は、別の値の不一致より重要である。実施例では、2のべき乗と等しいmvd値の実際の符号化速度は、選択的に収集される。そのとき、対応するルックアップ表入力は、例えば、上記のセクションII.A.、II.B.並びにII.C.に記述された平均コスト、加重平均コストと共に、あるいは定期的に更新される。2のべき乗と等しいmvd値の選択的に収集する実際の符号化速度と、平均コスト、加重平均コストと共に、あるいは定期的にルックアップ表を適応して更新することは、コンテンツ更新の複雑さを低減し、効率を増加させる。
実施例では、ルックアップ表の一部はビデオコンテンツの特性に従って更新される。上述されるように、2つの動きベクトル候補のためのMV−REMの差は、上位の動きコンテンツより下位の動きコンテンツにとってより重要な意義を有する。一実施例では、事前分析はビデオコンテンツ上で行なわれる。ここで、事前分析により、コンテンツあるいはビデオコンテンツ中の特定の領域またはセグメントが、上位の動きに関連する特性を有することを示唆される場合、ルックアップ表中の現在の入力が使用される。しかしながら、事前分析が下位の動きコンテンツを見せる場合、実際の符号化速度が収集される。そのとき、ルックアップ表の対応する入力は、例えば、上記のセクションII.A.、II.B.、II.C.並びにII.D.に記述された平均コスト、加重平均コストと共に、又は定期的、あるいは選択的に更新される。実施例では、選択的なルックアップ表の更新は、動きの面から粒度を検知するために事前分析を使用してもよい。したがって、異なる領域あるいはフレームでの個々の事前分析された動き特性を考慮して、全く異なった更新処理手順を適用してもよい。例えば、Nに対する全く異なった値を使用する定期的なルックアップ表の更新が行われる。
実施例では、動き情報コストはmvdのパラメータ化された関数としてモデル化される。動き情報コストのモデル化がmvdのパラメータ化された関数によってモデル化されると、ルックアップ表入力の直接の更新が不要となる。例えば、式6に記述されるように、動き情報コストはmvdの二次関数としてモデル化される。
[数7]
R(mvd)=m1・mvd2+m2・mvd+m3 (式6)
式6では、m1、m2およびm3はモデルパラメータを表わす。mvd=nのすべての収集された実際の符号化速度で、モデルパラメータは統計適合法を使用して更新される。モデルパラメータは、mvdの発生の全て又は一部に対して更新される。そのとき、ルックアップ表は、最新のモデルパラメータで適応して更新される。
図6と図7は、本発明の実施例による符号化効率の実施例の比較を示す。速度コスト推定には、例えば、上記のセクションII.A.に記述されたように、平均コストでルックアップ表を適応的に更新することを含む。コンテンツは8x8イントラ予測モードおよび下位の複雑さ速度歪み最適化を使用して、コード化される。ビデオとイメージ処理の分野に熟練している技術者に周知の「母親および娘試験シーケンス」のために、適応推定は、クォータ共通中間形式(QCIF)コンテンツで有意な利得(例えば<1.5dB)を達成する。利得はCIFコンテンツでより高い(例えば<3dB)。さらに、利得は、上位のビットレートよりも、低ビットレートでより重要である。本発明の実施例はこのようにビデオ符号化効率を改善する。この有益性は、下位の複雑さと低ビットレートアプリケーションで特に重要である。
本発明の実施例は、以下の段落中で列挙される記述の1つ以上に関係がある。図8Aは、本発明の実施例に従って、処理手順800の例についてのフローチャートを示す。
動きベクトル間の差の符号化に関係している送信コストを推定するステップ(801)であって、前記動きベクトル間の差は前記ビデオ情報の動き特性の記述であるステップと、
前記動きベクトルに関連した速度推定不一致を最小限にする原理(basis)で前記動きベクトル差を符号化するステップ(802)と、
を有し、ここで、前記符号化ステップ(802)は、コンテンツ適応性の二進法符号化を使用して、前記動きベクトル差に関連したビットカウントを計算するステップ(812)を有することを特徴とする方法。
2. 列挙された記述1に挙げられるような方法(800)であって、前記推定ステップ(801)が次のステップ
ルックアップ表にアクセスするステップ(821)、
前記ルックアップ表中の1つ以上の入力からのコストに相当する値にインデックスを付けるステップ(822)であって、ここで、前記コストは、前記ビデオ情報に関連した文脈情報かコンテンツ特性の少なくとも1つに関係があるステップ、及び
前記文脈情報か前記コンテンツ特性の変化に少なくとも一部分基づいて、前記ルックアップ表を適応的に更新するステップ(823)であって、ここで、前記変化に基づいて、前記値はダイナミックに調整可能であるステップ、
を有することを特徴とする方法。
4. 列挙された記述3に挙げられるような方法(800)であって、前記更新ステップ(823)が次のステップ
ブロックの発生回数の合計にわたって符号化された前記動きベクトル差の各々の符号化速度を収集するステップ(841)、
前記収集された符号化速度と前記発生回数の合計に基づいた平均コストを処理するステップ(842)、及び
前記処理ステップに基づいた前記ルックアップ表への前記動きベクトル差の符号化に対応するコストに対する値を入力するステップ(843)、
を有することを特徴とする方法。
6. 列挙された記述5に挙げられるような方法(800)であって、前記更新ステップ(823)が次のステップ、
ブロックの発生回数の合計にわたって前記符号化された動きベクトル差の各々について、符号化速度を収集するステップ(861)、及び
前記収集した符号化速度、前記発生回数の合計、並びに前記重み付け係数に少なくとも一部分基づいて平均コストを処理するステップ(862)であって、ここで、前記重み付け係数は、前記ブロックにわたる符号化速度の前記発生回数の合計に基づいて処理され、
そして前記処理ステップに基づいた前記ルックアップ表への前記動きベクトル差の符号化に対応するコストに対する値を登録するステップ(863)を有することを特徴とする方法。
8. 列挙された記述3、5、7の何れか一項に挙げられるような方法(800)であって、前記更新するステップ(823)は前記動きベクトル差に関連した文脈特性に基づいて選択的に行なわれることを特徴とする方法。
9. 列挙された記述8に挙げられるような方法(800)であって、前記収集するステップ(861)は、2のべき乗と等しい値を有する動きベクトル差の前記符号化速度を選択的に収集するステップ(891)を有し、
ここで、前記処理ステップ(842と862)は、前記選択的に収集するステップ(891)に少なくとも一部分基づくことを特徴とする方法。
11. 列挙された記述10に挙げられるような方法(800)であって、前記コンテンツ特性は前記ビデオ情報コンテンツに関連した動き特性を含むことを特徴とする方法。
12. 列挙された記述11に挙げられるような方法(800)であって、さらに
前記動き特性に基づいて前記ビデオ情報を分析するステップ(831)、
前記動き特性の粒状を検出するステップ(832)、
上位の動きコンテンツを検知すると、前記ルックアップ表中の既存の入力に少なくとも一部分に基づいて、前記インデックスを付けるステップ(821)、及び
下位の動きコンテンツを検知すると、前記更新するステップを行なうステップ(823)であって、ここで前記更新するステップ(823)の少なくとも一部分に基づいて、前記インデックスを付けるステップ(821)を行なうことを特徴とする方法。
前記動きベクトル差のための符号化コストをモデル化するステップ(833)、
前記動きベクトル差の実際の符号化速度に関連した前記符号化コストを収集するステップ(834)、及び
前記モデル化ステップ(833)に関連した統計適合に少なくとも一部分基づいて、前記モデル化された符号化コストを更新するステップ(835)を有し、
ここで、前記適応的に更新するステップ(823)は、前記モデル化された符号化コストを更新するステップ(835)を有することを特徴とする方法。
15. 列挙された記述1に挙げられるような方法(800)であって、前記推定するステップ(801)と前記符号化ステップ(802)の少なくとも1つが普遍的な可変長符号と無関係に行なわれることを特徴とすることを特徴とする方法。
17. ビデオコンテンツ用のデコーダ(200)であって、列挙された記述16に挙げられたエンコーダによって符号化されたビデオコンテンツをデコードするための手段から構成されることを特徴とするデコーダ。
18. ビデオコンテンツ用のデコーダ(200)であって、列挙された記述1−15に挙げられたステップと関係する符号化機能を行なうための手段から構成されることを特徴とするデコーダ。
20. 1つ以上のプロセッサで実行された時、計算機装置にビデオ情報を処理するためのステップを行なわせる(100と200)命令を含むコンピュータ可読記憶媒体であって、ここで前記ステップは、列挙された記述1−15に挙げられたステップの1つ以上を含んでいることを特徴とするコンピュータ可読記憶媒体。
適応性動き情報コスト推定のための実施例は以上のように記述される。上述の明細書では、本発明の実施例が態様毎に多数の特定の詳細を参照して記述された。したがって、何が発明であるかの唯一かつ排他的な標識であって発明であるとして出願人によって意図されるのは、本出願に基づいて許可される一組の請求項であって、いかなる後の補正も含まれる。そのような請求項に含まれる術語について明らかにここに明記されるいかなる定義も、請求項で使用される術語の意味を決定する。従って、請求項で明らかに列挙されていないような、制限、要素、特性(property)、機能、利点あるいは属性は、形はどうあれ請求項の適用範囲を制限しない。従って、明細書と図面は、制限的な趣旨ではなく本発明を説明するものに過ぎない。
Claims (11)
- ビデオ情報を処理するための方法(800)であって、
動きベクトル間の差の符号化に関係している送信コストを推定するステップ(801)であって、前記動きベクトル間の差は前記ビデオ情報の動き特性の記述であるステップ、及び
前記動きベクトルに関連した速度推定不一致を最小限にする原理で前記動きベクトル差を符号化するステップ(802)、
を有し、前記符号化ステップ(802)は、コンテンツ適応性の二進法符号化を使用して、前記動きベクトル差に関連したビットカウントを計算するステップ(812)を含むことを特徴とする方法。 - 請求項1に記載された方法(800)であって、前記推定ステップ(801)が、
ルックアップ表にアクセスするステップ(821)、及び
前記ルックアップ表中の1つ以上の入力からのコストに相当する値にインデックスを付けるステップ(822)であって、前記コストは、前記ビデオ情報に関連した文脈情報(contextual information)かコンテンツ特性の少なくとも1つに関係があり、
前記文脈情報か前記コンテンツ特性の変化に少なくとも一部分基づいて、前記ルックアップ表を適応的に更新するステップ(823)であって、ここで、前記変化に基づいて、前記値はダイナミックに調整可能であるステップ
を有することを特徴とする方法。 - 請求項1に記載された方法(800)であって、ここで前記送信コストが平均コストを含み、そして前記更新ステップ(823)が、
ブロックの発生回数の合計にわたって符号化された動きベクトル差の各々の符号化速度を収集するステップ(841)、
前記収集された符号化速度と前記発生回数の合計に基づいた平均コストを処理するステップ(842)、及び
前記処理ステップに基づいて前記ルックアップ表への前記動きベクトル差の符号化に対応するコストに対する値を入力するステップ(843)、
を有することを特徴とする方法。 - 請求項3に記載された方法(800)であって、ここで前記平均コストが加重平均コストで構成され、そしてここで、前記加重平均コストは重み付け係数で重み付けられた前記平均コストに関連することを特徴とする方法。
- 請求項3に記載された方法(800)であって、ここで前記更新するステップ(823)は、前記動きベクトル差に関連したコンテキスト特性(context characteristic)、又は、前記ビデオ情報に関連したコンテンツ特性の一つ以上に少なくとも一部分が基づいて、選択的に行なわれ、
前記コンテンツ特性は前記ビデオ情報コンテンツに関連した動き特性を含むことを特徴とする方法。 - 請求項4に記載された方法(800)であって、さらに
前記動き特性に基づいて前記ビデオ情報を分析するステップ(831)、及び
前記動き特性の粒状を検出するステップ(832)を有し、
上位の動きコンテンツを検知すると、前記ルックアップ表中の既存の入力に少なくとも一部分基づいて、前記インデックスを付けるステップ(821)を行ない、
下位の動きコンテンツを検知すると、前記更新するステップを行なうステップ(823)であって、ここで前記更新するステップ(823)の少なくとも一部分に基づいて、前記インデックスを付けるステップ(821)を行なうことを特徴とする方法。 - 請求項4に記載された方法(800)であって、さらに
前記動きベクトル差の前記符号化コストをモデル化するステップ(833)、
前記動きベクトル差の実際の符号化速度に関連した前記符号化コストを収集するステップ(834)、及び
前記モデル化ステップ(833)に関連した統計適合に少なくとも一部分基づいて、前記モデル化された符号化コストを更新するステップ(835)
を有し、ここで、前記適応的に更新するステップ(823)は、前記モデル化された符号化コストを更新するステップ(835)を含むことを特徴とする方法。 - 請求項6に記載された方法(800)であって、前記モデル化された符号化コストを更新するステップ(833)が前記動きベクトル差のすべて又は少なくとも一部分にわたって行なわれることを特徴とする方法。
- ビデオコンテンツ用のエンコーダ(100)であって、
動きベクトル間の差の符号化に関係している送信コストを推定する1つ以上のプロセッサ要素であって、前記動きベクトル間の差は前記ビデオ情報の動き特性の記述であり、
少なくとも一部分は、前記動きベクトルに関連した速度推定不一致を最小限にする原理で、前記動きベクトル差を符号化する1つ以上のプロセッサ要素を有し、
ここで、前記符号化プロセッサ要素は、コンテンツ適応性の二進法符号化を使用して、前記動きベクトル差に関連したビットカウントを計算する要素を有することを特徴とするシステム。 - ビデオ情報を処理するシステム(100)であって、
動きベクトル間の差の符号化に関係している送信コストを推定する手段であって、前記動きベクトル間の差は前記ビデオ情報の動き特性の記述であり、
前記動きベクトルに関連した速度推定不一致を最小限にする原理で、前記動きベクトル差を符号化する手段を有し、
ここで、前記符号化手段は、コンテンツ適応性の二進法符号化を使用して、前記動きベクトル差に関連したビットカウントを計算する手段を有することを特徴とするシステム。 - 1つ以上のプロセッサで実行された時、計算機装置(100)にビデオ情報を処理する方法のステップを行なわせる命令を含むコンピュータ可読記憶媒体であって、当該方法は
動きベクトル間の差の符号化に関係している送信コストを推定するステップ(801)であって、前記動きベクトル間の差は前記ビデオ情報の動き特性の記述であるステップ、及び
前記動きベクトルに関連した速度推定不一致を最小限にする原理で、前記動きベクトル差を符号化するステップ(802)
を有し、ここで、前記符号化ステップ(802)は、コンテンツ適応性の二進法符号化を使用して、前記動きベクトル差に関連したビットカウントを計算するステップ(812)を有することを特徴とするコンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US2278708P | 2008-01-22 | 2008-01-22 | |
US61/022,787 | 2008-01-22 | ||
PCT/US2009/031493 WO2009094349A1 (en) | 2008-01-22 | 2009-01-21 | Adaptive motion information cost estimation with dynamic look-up table updating |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011510601A true JP2011510601A (ja) | 2011-03-31 |
JP5189172B2 JP5189172B2 (ja) | 2013-04-24 |
Family
ID=40677544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010544390A Expired - Fee Related JP5189172B2 (ja) | 2008-01-22 | 2009-01-21 | 適応性動き情報コスト推定 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8855196B2 (ja) |
EP (1) | EP2245857B1 (ja) |
JP (1) | JP5189172B2 (ja) |
CN (1) | CN101933328B (ja) |
WO (1) | WO2009094349A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2959376A1 (fr) * | 2010-04-22 | 2011-10-28 | France Telecom | Procede de traitement d'une information de mouvement, procedes de codage et de decodage, dispositifs, signal et programme d'ordinateur correspondants |
US20110293004A1 (en) * | 2010-05-26 | 2011-12-01 | Jicheng An | Method for processing motion partitions in tree-based motion compensation and related binarization processing circuit thereof |
US8913662B2 (en) * | 2011-01-06 | 2014-12-16 | Qualcomm Incorporated | Indicating intra-prediction mode selection for video coding using CABAC |
AP2016009618A0 (en) * | 2011-06-16 | 2016-12-31 | Ge Video Compression Llc | Entropy coding of motion vector differences |
UA114674C2 (uk) | 2011-07-15 | 2017-07-10 | ДЖ.І. ВІДІЕУ КЕМПРЕШН, ЛЛСі | Ініціалізація контексту в ентропійному кодуванні |
PT2805419T (pt) | 2012-01-20 | 2017-09-01 | Ge Video Compression Llc | Codificação e descodificação de coeficiente de transformada |
US9491475B2 (en) * | 2012-03-29 | 2016-11-08 | Magnum Semiconductor, Inc. | Apparatuses and methods for providing quantized coefficients for video encoding |
US10021409B2 (en) * | 2012-05-09 | 2018-07-10 | Integrated Device Technology, Inc. | Apparatuses and methods for estimating bitstream bit counts |
US9392286B2 (en) | 2013-03-15 | 2016-07-12 | Magnum Semiconductor, Inc. | Apparatuses and methods for providing quantized coefficients for video encoding |
US9794575B2 (en) | 2013-12-18 | 2017-10-17 | Magnum Semiconductor, Inc. | Apparatuses and methods for optimizing rate-distortion costs in video encoding |
PL411574A1 (pl) * | 2015-03-16 | 2016-09-26 | Politechnika Poznańska | System i sposób określania kosztu zastosowania określonego typu kodowania w koderze wizyjnym |
US20210006824A1 (en) * | 2018-01-08 | 2021-01-07 | Samsung Electronics Co., Ltd. | Encoding and decoding method for motion information, and encoding and decoding device for motion information |
WO2020003274A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Checking order of motion candidates in lut |
TWI752331B (zh) | 2018-06-29 | 2022-01-11 | 大陸商北京字節跳動網絡技術有限公司 | 當向Merge/AMVP添加HMVP候選時的部分/完全修剪 |
MX2020013828A (es) | 2018-06-29 | 2021-03-25 | Beijing Bytedance Network Tech Co Ltd | Interaccion entre lut y amvp. |
BR112020024202A2 (pt) | 2018-06-29 | 2021-02-17 | Beijing Bytedance Network Technology Co., Ltd. | método de processamento de dados de vídeo, aparelho de processamento de vídeo e meios de armazenamento e gravação legíveis por computador não transitório |
EP3791589A1 (en) * | 2018-06-29 | 2021-03-17 | Beijing Bytedance Network Technology Co. Ltd. | Which lut to be updated or no updating |
CN110662057B (zh) | 2018-06-29 | 2022-06-21 | 北京字节跳动网络技术有限公司 | 视频处理方法、装置、设备以及存储比特流的方法 |
TWI723444B (zh) | 2018-06-29 | 2021-04-01 | 大陸商北京字節跳動網絡技術有限公司 | 使用一個或多個查找表來按順序存儲先前編碼的運動信息並使用它們來編碼後面的塊的概念 |
CN115134599A (zh) | 2018-06-29 | 2022-09-30 | 抖音视界有限公司 | 更新查找表(lut)的条件 |
JP7181395B2 (ja) | 2018-07-02 | 2022-11-30 | 北京字節跳動網絡技術有限公司 | イントラ予測モードを有するルックアップテーブルおよび非隣接ブロックからのイントラモード予測 |
TW202021358A (zh) * | 2018-07-14 | 2020-06-01 | 大陸商北京字節跳動網絡技術有限公司 | 用時間信息擴展基於查找表的運動向量預測 |
TWI820211B (zh) | 2018-09-12 | 2023-11-01 | 大陸商北京字節跳動網絡技術有限公司 | 取決於總數減去k的開始檢查hmvp候選的條件 |
KR20240010576A (ko) | 2019-01-10 | 2024-01-23 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Lut 업데이트의 호출 |
CN113383554B (zh) | 2019-01-13 | 2022-12-16 | 北京字节跳动网络技术有限公司 | LUT和共享Merge列表之间的交互 |
WO2020147772A1 (en) | 2019-01-16 | 2020-07-23 | Beijing Bytedance Network Technology Co., Ltd. | Motion candidates derivation |
CN113615193A (zh) | 2019-03-22 | 2021-11-05 | 北京字节跳动网络技术有限公司 | Merge列表构建和其他工具之间的交互 |
JP7098847B2 (ja) | 2019-06-17 | 2022-07-11 | ベイジン・ダジア・インターネット・インフォメーション・テクノロジー・カンパニー,リミテッド | ビデオ符号化におけるデコーダ側動きベクトル補正のための方法および装置 |
WO2021007133A1 (en) * | 2019-07-06 | 2021-01-14 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and apparatuses for decoder-side motion vector refinement in video coding |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006004305A1 (en) * | 2004-04-08 | 2006-01-12 | Samsung Electronics Co., Ltd. | Method and apparatus for implementing motion scalability |
JP2007158430A (ja) * | 2005-11-30 | 2007-06-21 | Matsushita Electric Ind Co Ltd | 画像情報符号化装置 |
JP2007166039A (ja) * | 2005-12-09 | 2007-06-28 | Matsushita Electric Ind Co Ltd | 画像符号化装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100604702B1 (ko) * | 1997-02-12 | 2006-07-28 | 미디어텍 인크. | 이미지 시퀀스를 인코딩하는 장치 및 이미지 신호를 양자화하기 위해서 양자화 스케일을 생성하는 방법 |
US20040258147A1 (en) * | 2003-06-23 | 2004-12-23 | Tsu-Chang Lee | Memory and array processor structure for multiple-dimensional signal processing |
US6900748B2 (en) | 2003-07-17 | 2005-05-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for binarization and arithmetic coding of a data value |
US7233622B2 (en) | 2003-08-12 | 2007-06-19 | Lsi Corporation | Reduced complexity efficient binarization method and/or circuit for motion vector residuals |
US7379608B2 (en) * | 2003-12-04 | 2008-05-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Arithmetic coding for transforming video and picture data units |
US8116374B2 (en) * | 2004-05-07 | 2012-02-14 | Broadcom Corporation | Method and system for generating a transform size syntax element for video decoding |
US7693219B2 (en) * | 2006-01-04 | 2010-04-06 | Freescale Semiconductor, Inc. | System and method for fast motion estimation |
US7653130B2 (en) * | 2006-12-27 | 2010-01-26 | General Instrument Corporation | Method and apparatus for bit rate reduction in video telephony |
-
2009
- 2009-01-21 WO PCT/US2009/031493 patent/WO2009094349A1/en active Application Filing
- 2009-01-21 EP EP09704731.0A patent/EP2245857B1/en not_active Not-in-force
- 2009-01-21 JP JP2010544390A patent/JP5189172B2/ja not_active Expired - Fee Related
- 2009-01-21 US US12/863,923 patent/US8855196B2/en not_active Expired - Fee Related
- 2009-01-21 CN CN200980102854.8A patent/CN101933328B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006004305A1 (en) * | 2004-04-08 | 2006-01-12 | Samsung Electronics Co., Ltd. | Method and apparatus for implementing motion scalability |
JP2007158430A (ja) * | 2005-11-30 | 2007-06-21 | Matsushita Electric Ind Co Ltd | 画像情報符号化装置 |
JP2007166039A (ja) * | 2005-12-09 | 2007-06-28 | Matsushita Electric Ind Co Ltd | 画像符号化装置 |
Non-Patent Citations (1)
Title |
---|
JPN5011003568; Siwei Ma et al.: 'Rate-Distortion Analysis for H.264/AVC Video Coding and its Application to Rate Control' IEEE Transaction on Circuits and Systems for Video Technology Vol.15, No.12, 200512, p.1533-1544, IEEE * |
Also Published As
Publication number | Publication date |
---|---|
US20100316118A1 (en) | 2010-12-16 |
CN101933328A (zh) | 2010-12-29 |
EP2245857B1 (en) | 2015-06-03 |
CN101933328B (zh) | 2014-11-19 |
JP5189172B2 (ja) | 2013-04-24 |
WO2009094349A1 (en) | 2009-07-30 |
US8855196B2 (en) | 2014-10-07 |
EP2245857A1 (en) | 2010-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5189172B2 (ja) | 適応性動き情報コスト推定 | |
KR101437719B1 (ko) | 보간 필터들 및 오프셋들을 이용한 디지털 비디오 코딩 | |
JP6284954B2 (ja) | イントラ予測のためのモード決定の簡略化 | |
CN101946515B (zh) | Cabac译码器的二回合量化 | |
US9282329B2 (en) | Methods and devices for data compression using offset-based adaptive reconstruction levels | |
JP2006140758A (ja) | 動画像符号化方法、動画像符号化装置および動画像符号化プログラム | |
JP4545388B2 (ja) | フェーディング推定/補償によりビデオフレームを処理するシステムおよび方法 | |
CN102413323B (zh) | 一种基于h.264的视频压缩方法 | |
US9571851B2 (en) | Inter prediction method and apparatus using adjacent pixels, and image encoding/decoding method and apparatus using same | |
KR20110017302A (ko) | 움직임 벡터의 정확도 조절을 이용한 영상 부호화, 복호화 방법 및 장치 | |
JP2011515940A (ja) | 映像の符号化、復号化の方法及び装置 | |
WO2008149327A2 (en) | Method and apparatus for motion-compensated video signal prediction | |
JP2019110530A (ja) | ビデオデータを符号化するための方法及び装置 | |
He et al. | High-speed implementation of rate-distortion optimized quantization for H. 264/AVC | |
WO2006074043A2 (en) | Method and apparatus for providing motion estimation with weight prediction | |
JP2015515812A (ja) | ビデオ符号化のための量子化係数を提供するための機器および方法 | |
KR20130046377A (ko) | 화소 블록 코딩 및 재구성 방법 및 대응 장치 | |
JP2008011431A (ja) | 画像符号化装置 | |
Han et al. | Estimation-theoretic delayed decoding of predictively encoded video sequences | |
CN115334306A (zh) | 一种率失真优化量化方法、装置、设备及存储介质 | |
KR20100136907A (ko) | 비디오 부호화 및 복호화를 위한 부호화 모드 보상 적응적 인루프 필터링 방법과 그 장치 | |
KR100762591B1 (ko) | 비디오 코덱의 양자화 파라미터 결정방법 | |
KR101796876B1 (ko) | 움직임 추정을 이용한 영상 부호화 방법 및 장치 | |
KR100900316B1 (ko) | 실시간 비디오 신호 압축을 위한 인트라 모드 예측 검색방법 및 장치 | |
Chen et al. | A new adaptive coefficient scanning based on local and global prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111011 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130123 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160201 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |