JP2007515097A - ビデオ符号化方法及び装置 - Google Patents
ビデオ符号化方法及び装置 Download PDFInfo
- Publication number
- JP2007515097A JP2007515097A JP2006537481A JP2006537481A JP2007515097A JP 2007515097 A JP2007515097 A JP 2007515097A JP 2006537481 A JP2006537481 A JP 2006537481A JP 2006537481 A JP2006537481 A JP 2006537481A JP 2007515097 A JP2007515097 A JP 2007515097A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- quantization
- css
- coefficients
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/004—Predictors, e.g. intraframe, interframe coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
Abstract
本発明は、それぞれのフレームがブロックに分割される連続するフレームのグループからなる入力画像系列を符号化するために提供されるビデオ符号化方法、oyobi対応するビデオ符号化装置に関する。本方法及び装置は、それぞれのフレームについて計算された、コンテンツ変化強度(CSS)に基づいて前記系列を前処理し、それぞれのブロックについて予測された動きベクトルを使用して予測されたフレームを生成し、現在のフレームと最後に予測されたフレームとの間の差信号に、複数の係数を生成する変換サブステップ、続いて前記係数の量子化サブステップを適用し、前記量子化された係数を符号化する。本発明によれば、CSSは、このサブステップで使用された量子化ファクタを変更するために前記量子化サブステップで使用され、CSS及び量子化ファクタは、同時に増加又は減少する。
Description
本発明は、それ自身がブロックに分割される連続するフレームのグループからなる入力画像系列を符号化するために供給されるビデオ符号化方法に関し、当該方法は、ある予め決定されたルールを適用することでそれぞれのフレームについて計算された、いわゆるCCS(Content-Change Strength)に基づいて前記系列を前処理するステップ、現在のフレームのそれぞれのブロックについて動きベクトルを予測するステップ、現在のフレームのブロックにそれぞれ関連する動きベクトルを使用して予測されたフレームを生成するステップ、前記現在のフレームと最後に予測されたフレームとの間の差信号に、複数の係数を生成する変換サブステップ、続いて前記係数の量子化サブステップを適用するステップ、及び前記量子化された係数を符号化するステップを含んでいる。
本発明は、たとえば、たとえば(動き予測及び補償装置のような)時間的な冗長度を低減するための基準フレームを必要とするビデオ符号化装置に適用することができる。かかる動作は、現在のビデオ符号化規格の一部であり、将来的な符号化規格の類似の部分としても期待される。ビデオ符号化技術は、たとえば、デジタルカメラ、モバイルフォン又はデジタルビデオ記録装置のような装置で使用される。さらに、ビデオを符号化又はコード変換するための用途は、本発明に係る技術を使用して拡張される。
ビデオ圧縮では、符号化されたビデオ系列の送信のための低いビットレートは、(とりわけ)連続するピクチャの間の時間的な冗長度の低減により得られる場合がある。かかる低減は、動き予測(ME)及び動き補償(MC)技術に基づいている。しかし、ビデオ系列の現在のフレームについてME及びMCを実行することは、基準フレーム(いわゆるアンカーフレーム)を必要とする。MPEG−2を例としてとると、異なるフレームタイプ、すなわちI、P及びBフレームが定義されており、このためにME及びMCは異なって実行される。Iフレーム(イントラフレーム)は、過去又は将来のフレームを参照することなしに(すなわちME及びMCなしに)、それ自身により独立に符号化され、Pフレーム(又は前方予測ピクチャ)は、過去のフレームにそれぞれ1つが相対的に符号化され(すなわち前の基準フレームからの動き補償により)、さらに、Bフレーム(又は双方向予測フレーム)は、2つの参照フレーム(過去のフレーム及び将来のフレーム)と相対的に符号化される。Iフレーム及びPフレームは、参照フレームとしての役割を果たす。
良好なフレーム予測を得るため、これらの基準フレームは、高い品質である必要があり、すなわち多くのビットがそれらを符号化するための費やされる必要があり、基準フレーム以外のフレームは、低品質である(この理由のため、多くの数の基準フレーム以外のフレーム、MPEG−2のケースではBフレームが一般に低いビットレートとなる)。どの入力フレームがIフレーム、Pフレーム又はBフレームとして処理されるかを示すため、グループ・オブ・ピクチャ(GOP)に基づいた構造は、MPEG−2で定義される。より正確には、GOPは、2つのパラメータN、Mを使用し、ここでNは2つのIフレーム間の時間的な距離であり、Mは基準フレーム間の時間的な距離である。たとえば、(N,M)−GOP(N=12及びM=4)が一般に使用され、“IBBBPBBBPBBB”構造を定義する。
連続するフレームは、フレーム間のより大きな時間的な距離を有するフレームよりも高い時間的な相関を一般に有する。それゆえ、一方で基準フレームと現在予測されるフレームとの間の短い時間距離は、高い予測品質につながるが、他方で、基準フレーム以外のフレームが使用されなくなることを意味する。高い予測品質及び多くの数の基準フレーム以外のフレームの両者により。低いビットレートとなるが、フレーム予測品質が短い時間的な距離のみから生じるので互いに機能する。
しかし、かかる品質は、基準として実際に役割を果たすために基準フレームの有効性に依存する。たとえば、シーン変化のちょうど前に位置される基準フレームにより、シーン変化の直後に位置されるフレームの予測は、たった1つのフレーム距離を有する場合があるが、前記基準フレームに関して可能ではないことが明らかである。他方で、(ビデオ会議又はニュースのような)定常状態又はほぼ定常状態のシーンでは、100を超えるフレーム距離でさえも、高い品質予測となる。
先に記載された例から、一般に使用される(12,4)−GOPのような固定されたGOP構造は、ビデオ系列を符号化するために効率的ではない。これは、シーン変化のちょうど前に位置される場合に、定常状態のコンテンツのケースで、又は不適切な位置で、基準フレームが余りに頻繁に導入されるためである。シーン変化の検出は、公知の技術であり、(この位置でIフレームが位置されない場合)良好なフレーム予測がシーン変化のために可能ではない位置でIフレームを導入するために利用することができる。しかし、シーン変化を全くなしで(たとえば、テニスプレーヤが1つのシーンに連続して続くシーケンスでは)、フレームコンテンツが高い動きを有するフレームの後に完全に異なる場合には、系列はかかる技術から利益を得ない。前の欧州特許出願は、出願番号03300155.3(PHFR030124)により2003年10月14日に出願人により既に提出されており、良好な基準フレームを発見するための新たな方法を記載している。この方法は、以下に再び引用される。
したがって、本発明の目的は、基準フレームとしての役割を果たすことができる良好なフレームを発見し、符号化コストを著しく低減することができる、先の方法に基づいたビデオ符号化方法を提案することにある。
上記目的を達成するため、本発明は、明細書の導入節で定義されたようなビデオ符号化方法に関するものであって、前記CCSは、前記量子化サブステップで使用される量子化ファクタを変更するために前記量子化サブステップで使用され、前記CCS及び前記量子化ファクタは、同時に増加又は減少する。
また、本発明は、かかる方法を実現するための装置に関する。
また、本発明は、かかる方法を実現するための装置に関する。
本発明は、添付図面を参照して、例示を介して記載される。
先に引用された文献は、符号化コストを低減するため、入力系列におけるどのフレームが基準フレームとしての役割を果たすかを発見するための方法を記載する。この方法の原理は、以下に示され図1に例示されるように、幾つかのシンプルなルールに基づいてコンテンツ変化の強度を測定することであり、図1では、水平軸は、関与するフレームの数に対応し、垂直軸は、コンテンツ変化の強度のレベルに対応し、測定されたコンテンツ変化の強度は、複数のレベルの量子化され(たとえば5レベル、かかる数は制約ではない)、Iフレームはレベル0のコンテンツ変化の強度(CCS)を有するフレーム系列の開始で挿入され、Pフレームは、CCSのレベル増加が生じる前、又はCCSのレベル減少が生じる後に挿入される。測定は、たとえば、水平及び垂直エッジ、ルミナンス、動きベクトル等に基づいた他のタイプの速度を検出するシンプルなブロック分類である場合がある。
先に引用された文献は、符号化コストを低減するため、入力系列におけるどのフレームが基準フレームとしての役割を果たすかを発見するための方法を記載する。この方法の原理は、以下に示され図1に例示されるように、幾つかのシンプルなルールに基づいてコンテンツ変化の強度を測定することであり、図1では、水平軸は、関与するフレームの数に対応し、垂直軸は、コンテンツ変化の強度のレベルに対応し、測定されたコンテンツ変化の強度は、複数のレベルの量子化され(たとえば5レベル、かかる数は制約ではない)、Iフレームはレベル0のコンテンツ変化の強度(CCS)を有するフレーム系列の開始で挿入され、Pフレームは、CCSのレベル増加が生じる前、又はCCSのレベル減少が生じる後に挿入される。測定は、たとえば、水平及び垂直エッジ、ルミナンス、動きベクトル等に基づいた他のタイプの速度を検出するシンプルなブロック分類である場合がある。
MPEG符号化ケースにおけるこの前の方法の実現は、図2に示される。エンコーダは、符号化ブランチ101及び予測ブランチ102を有する。ブランチ101により受信され、符号化されるべき信号は、係数に変換され、DCT及び量子化モジュール11で量子化され、量子化された係数は、動きベクトルMVと共に符号化モジュール13で符号化される。予測ブランチ102は、DCT及び量子化モジュール11の出力で利用可能な信号を入力信号として受け、直列で、逆量子化及び逆DCTモジュール21、加算器23、フレームメモリ24、動き補償(MC)回路25及び減算器26を有している。MC回路25は、記録されたフレーム(以下に説明されるように定義される)の入力、及びフレームメモリ24の出力からの動き予測(ME)回路27により生成された動きベクトルMV(多くのタイプの動き予測器が使用される場合がある)を受信し、これらの動きベクトルは、符号化モジュール13に向けて送出され、その出力“MPEG出力”は、多重化されたビットストリームの形式で送信される。
エンコーダのビデオ入力(連続するフレームXn)は、前処理ブランチ103で前処理される。はじめに、回路31を定義するGOP構造は、GOPの構造を連続するフレームから定義するために設けられる。フレームメモリ32a,32b,...は、回路31の出力で利用可能なI,P,Bフレームの系列を再び順序付けするために設けられる(基準フレームは、基準フレーム以外のフレーム基準フレームに依存する前に符号化及び送信される必要がある)。これら再び順序付けされたフレームは、減算器26の正の入力で送出される(その負の入力は、先に記載されたように、MC回路25の出力で利用可能な出力予測フレームを受け、これら出力予測フレームは、加算器23の第二の入力に送出される)。減算器26の出力は、符号化ブランチ101により処理される、符号化されるべき信号であるフレームの差を伝達する。GOP構造の定義について、CCS計算回路33が定義される。
動きから生じるCCSが高くなると、視聴者が提供されるビデオに追従できないことが観察される。本発明によれば、CCSの機能としてモジュール11で使用される量子化ファクタを増加又は減少することが結果的に提案され、前記CCS及び量子化ファクタは、同時に増加又は減少し、これは、符号化ブランチのDCT及び量子化モジュール11に向けてCCS計算回路の出力情報を送出することで得られる。図3の従来の部分で記載されるように(図3は本発明の説明に関して次のパラグラフで導入される)、確かに、符号化モジュール13は、バッファメモリと直列に配置される可変長符号化(VLC)回路から構成され、前記メモリの出力は、量子化ファクタを変更するためにレート制御回路133に向かって送出される。
本発明によれば、図3に示されるように、類似の回路は図2におけるのと同じ参照符号により示され、量子化ファクタの提案される変更を実現するのを可能とすることが意図される更なるコネクション200は、CCS計算回路33とレート制御回路133との間、前記回路33と符号化ブランチのDCT及び量子化モジュール11との間に設けられる。このコネクション200は、符号化システムの2つの符号化モードである、いわゆる(ビットレート制御をもたない)開ループ符号化モードと、(ビットレート制御をもつ)閉ループ符号化モードを拡張する。
たとえな、開ループ符号化モードでは、量子化器の設定が通常は固定される。符号化されたストリームの結果的に得られるビットレートは、(符号化されるべき残りの必要が高い)複雑なシーンについてよりも(符号化されるべき残りの必要な低い)シンプルなシーンについて自動的に低い。系列が高い動きを含む先に記載された符号化領域は、高いビットレートで符号化される複雑なシーンが得られる。高い動きのシーンのビットレートは、高い量子化により低減することができ、観察者が動きのために追従することができないこれらのシーンの空間的な詳細を除く。量子化は、量子化ファクタq_ccsを定義することで制御することができ、このファクタは、CSSと、オリジナルの固定された量子化器ファクタ、いわゆるq_fixedとからなる関数である
q_ccs=q_fixed+f(CSS)
ここで、f()は、q_fixedから許容される最大値q_maxにまでq_ccsを増加するため、正の整数0,...(q_max−q_fixed)となる関数である。f()の例は、CCS=0〜CCS_maxについて、f1(CCS)=round(CCS*(q_max−q_fixed)/(CCS_max))、又はf2(CCS)=round((q_max−q_fixed+1))^(CCS/CCS_max)−1)である。
q_ccs=q_fixed+f(CSS)
ここで、f()は、q_fixedから許容される最大値q_maxにまでq_ccsを増加するため、正の整数0,...(q_max−q_fixed)となる関数である。f()の例は、CCS=0〜CCS_maxについて、f1(CCS)=round(CCS*(q_max−q_fixed)/(CCS_max))、又はf2(CCS)=round((q_max−q_fixed+1))^(CCS/CCS_max)−1)である。
閉ループ符号化では、量子化ファクタq_adaptは、所望の予め定義されたビットレートを達成するために調整される。閉ループ符号化について必要とされるビットレートコントローラは、ビットバジェット(予算)で基本的に機能し、利用可能なバジェットバジェットに基づいてq_adaptを選択する。これは、開ループ符号化について記載されたような量子化ファクタq_cssを使用することができ、q_fixedのみがq_adaptと置き換えられる必要があることを意味する。次いで、変更されないレートコントローラに比較して、ビットバジェットは高いCCSと共に増加し、これら更なるビットは、q_adapt値は増加されたビットバジェットのために減少するため、より低いCCSをもつフレームで自動的に費やされる。
Claims (2)
- それ自身がブロックに分割される連続するフレームのグループからなる入力画像系列を符号化するために提供されるビデオ符号化方法であって、
当該方法は、
予め決定されたルールを適用することでそれぞれのフレームについて計算された、コンテンツ変化強度(CSS:Content-Change Strength)に基づいて前記系列を前処理するステップと、
フレームのそれぞれのブロックについて動きベクトルを予測するステップと、
現在のフレームのブロックにそれぞれ関連する前記動きベクトルを使用して予測されたフレームを生成するステップと、
前記現在のフレームと最後に予測されたフレームとの間の差信号に、複数の係数を生成する変換サブステップ、続いて前記係数の量子化サブステップを適用するステップと、
前記量子化された係数を符号化するステップとを含み、
前記CSSは、前記量子化サブステップで使用された量子化ファクタを変更するために前記量子化サブステップで使用され、
前記CSS及び量子化ファクタは、同時に増加又は減少する、
ことを特徴とするビデオ符号化方法。 - それ自身がブロックに分割される連続するフレームのグループからなる入力画像系列を符号化するために提供されるビデオ符号化装置であって、
当該装置は、
予め決定されたルールを適用することでそれぞれのフレームについて計算された、コンテンツ変化強度(CSS:Content-Change Strength)に基づいて前記系列を前処理するために設けられる前処理手段と、
フレームのそれぞれのブロックについて動きベクトルを予測するために設けられる予測手段と、
現在のフレームのブロックにそれぞれ関連する前記動きベクトルに基づいて予測されたフレームを生成するために設けられる生成手段と、
前記現在のフレームと最後に予測されたフレームとの間の差信号に、複数の係数を生成する変換を適用し、続いて前記係数の量子化を適用するために設けられる変換及び量子化手段と、
前記量子化された係数を符号化するために設けられている符号化手段とを有し、
前記処理手段の出力は、前記量子化で使用された量子化ファクタを前記CSSに基づいて変更するために前記変換及び量子化手段の入力で受信され、
前記CSS及び量子化ファクタは、同時に増加又は減少する、
ことを特徴とするビデオ符号化装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03300205 | 2003-11-07 | ||
PCT/IB2004/003618 WO2005045764A1 (en) | 2003-11-07 | 2004-11-01 | Video encoding method and device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007515097A true JP2007515097A (ja) | 2007-06-07 |
Family
ID=34560247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006537481A Pending JP2007515097A (ja) | 2003-11-07 | 2004-11-01 | ビデオ符号化方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20070025440A1 (ja) |
EP (1) | EP1683110A1 (ja) |
JP (1) | JP2007515097A (ja) |
KR (1) | KR20060118459A (ja) |
CN (1) | CN1894725A (ja) |
WO (1) | WO2005045764A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102014111435A1 (de) * | 2014-08-11 | 2016-02-11 | Infineon Technologies Ag | Metallisierungsstapel und Chip-Anordnung |
CN108737838A (zh) * | 2017-04-19 | 2018-11-02 | 北京金山云网络技术有限公司 | 一种视频编码方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7031388B2 (en) * | 2002-05-06 | 2006-04-18 | Koninklijke Philips Electronics N.V. | System for and method of sharpness enhancement for coded digital video |
-
2004
- 2004-11-01 WO PCT/IB2004/003618 patent/WO2005045764A1/en not_active Application Discontinuation
- 2004-11-01 KR KR1020067008803A patent/KR20060118459A/ko not_active Application Discontinuation
- 2004-11-01 CN CNA2004800326123A patent/CN1894725A/zh active Pending
- 2004-11-01 EP EP04798778A patent/EP1683110A1/en not_active Withdrawn
- 2004-11-01 US US10/578,072 patent/US20070025440A1/en not_active Abandoned
- 2004-11-01 JP JP2006537481A patent/JP2007515097A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN1894725A (zh) | 2007-01-10 |
EP1683110A1 (en) | 2006-07-26 |
WO2005045764A1 (en) | 2005-05-19 |
KR20060118459A (ko) | 2006-11-23 |
US20070025440A1 (en) | 2007-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9258567B2 (en) | Method and system for using motion prediction to equalize video quality across intra-coded frames | |
EP2847993B1 (en) | Motion sensor assisted rate control for video encoding | |
EP2250813B1 (en) | Method and apparatus for predictive frame selection supporting enhanced efficiency and subjective quality | |
US6141380A (en) | Frame-level rate control for video compression | |
JP4764136B2 (ja) | 動画像符号化装置、及びフェードシーン検出装置 | |
JP2871316B2 (ja) | 動画像符号化装置 | |
JPWO2006082690A1 (ja) | 画像符号化方法および画像符号化装置 | |
WO1999059344A1 (en) | Conditional masking for video encoder | |
US7428339B2 (en) | Pseudo-frames for MPEG-2 encoding | |
US20090060039A1 (en) | Method and apparatus for compression-encoding moving image | |
JP3487205B2 (ja) | 画像データ編集装置 | |
JPH09284770A (ja) | 画像符号化装置および方法 | |
JPH08307860A (ja) | シーン再エンコード装置 | |
JP4073541B2 (ja) | 動画像再符号化装置 | |
JPH05183872A (ja) | 動画像符号化装置および方法 | |
JP3428332B2 (ja) | 画像符号化方法及び装置、並びに画像伝送方法 | |
JP2007515097A (ja) | ビデオ符号化方法及び装置 | |
JP2005045736A (ja) | 画像信号符号化方法及び装置、符号化制御装置並びにプログラム | |
WO1996033573A1 (en) | Device and method for coding moving image | |
JP4700992B2 (ja) | 画像処理装置 | |
JP2004180345A (ja) | 撮影画像記録装置 | |
EP0927954B1 (en) | Image signal compression coding method and apparatus | |
KR100778473B1 (ko) | 비트율 제어 방법 | |
JP2008099175A (ja) | 動画符号化装置および動画符号化方法 | |
JP2000013802A (ja) | フレーム間予測を用いた映像信号符号化装置 |