JP2007074634A - 動画像圧縮装置 - Google Patents

動画像圧縮装置 Download PDF

Info

Publication number
JP2007074634A
JP2007074634A JP2005262002A JP2005262002A JP2007074634A JP 2007074634 A JP2007074634 A JP 2007074634A JP 2005262002 A JP2005262002 A JP 2005262002A JP 2005262002 A JP2005262002 A JP 2005262002A JP 2007074634 A JP2007074634 A JP 2007074634A
Authority
JP
Japan
Prior art keywords
screen
code amount
video information
compression
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005262002A
Other languages
English (en)
Other versions
JP4648805B2 (ja
JP2007074634A5 (ja
Inventor
Shozo Fujii
省造 藤井
Hidemi Oka
秀美 岡
Shinjiro Mizuno
慎二郎 水野
Shinya Seto
慎哉 瀬戸
Koji Arimura
耕治 有村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005262002A priority Critical patent/JP4648805B2/ja
Publication of JP2007074634A publication Critical patent/JP2007074634A/ja
Publication of JP2007074634A5 publication Critical patent/JP2007074634A5/ja
Application granted granted Critical
Publication of JP4648805B2 publication Critical patent/JP4648805B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】VBR方式の動画像圧縮装置で入力映像の状態が変化したときにも対応が遅れず、画質劣化を発生させない。
【解決手段】符号化画面メモリ1からの符号化画面と参照画面メモリ2からの参照画面の比較により映像情報を求める映像情報検出手段3と、過去の映像情報と符号化画面の映像情報の変化度合いから圧縮予測情報αを算出する圧縮状態予測手段5と、過去の符号化による符号量と量子化指標の実績値と圧縮予測情報αを用いて符号化画面の割り当て符号量を求める符号量制御手段6とを備える。これにより、映像情報の変化度合いから圧縮動作の難易度合いを相対的に求め、それを圧縮予測情報として符号量と量子化指標の実績値に演算することで、正確な符号量割り当てが求められ、結果として、符号量制御が映像変化に遅れることなく、常に高い画質を実現することができる。
【選択図】図1

Description

本発明は可変ビットレート(VBR)方式を用いて動画像圧縮を行う動画像圧縮装置に関するものである。
近年、動画像符号化方式として、MPEG2(ITU−T H.262)など、フレーム間相関を用いた符号化方式が用いられるようになってきた。これらの方式では符号化する画面を小さな矩形領域である符号化ブロックに分割し、各符号化ブロック毎に参照画面から検出した動きベクトルにより予測ブロックを求め、符号化ブロックと予測ブロックとの差分を圧縮符号化することで高効率圧縮符号化を実現している。
図7はMPEG2の映像フレームと参照の関係を示すものである。映像フレームはI(Intra)ピクチャー、P(Predictive)ピクチャー、B(Bidirectionallypredictive)ピクチャーの3種類に分類される。Iピクチャーはイントラと呼ばれるフレーム内圧縮がなされる。Pピクチャーは、過去のIピクチャーまたは過去のPピクチャーを参照画面として動きベクトルを求めるものである。Bピクチャーは、過去のIピクチャーまたはPピクチャーを順方向参照画面として、未来のIピクチャーまたはPピクチャーを逆方向参照画面として動きベクトルを求めるものである。
図8はMPEG2のグループオブピクチャー構造(以下GOP構造と略す)を示すものである。GOPとは符号化順、復号化順でIピクチャーを先頭とし、次のIピクチャーまでを区切りとする構造であり、符号化、復号化の動作の大きな区切りとなるものである。図8では、1つのGOPが12枚のピクチャーより構成される場合の例を示している。
MPEG2の場合、圧縮後の符号は、主にベクトルの符号とAC係数の符号とから構成されている。ベクトルの符号とは求めた動きベクトルを符号化したものであり、AC係数の符号とは動きベクトルから求めた予測ブロックと符号化ブロックの差分を直交変換し、量子化指標Qで指示される量子化ステップで量子化した後、可変長符号で符号化したものである。
圧縮後の符号量を所望の符号量とするため符号量制御が必要となるが、その代表的方式として固定ビットレート(以下CBRと略す)方式と、可変ビットレート方式(以下VBRと略す)とが用いられている。CBR方式は常に目標とする所望のビットレートとなるように符号量を制御する方式であり、VBR方式は短時間でみた場合には映像の圧縮困難度合いに応じて符号量を増減させるが、数秒あるいは数分単位でみたときの平均ビットレートは所望の値となるように制御する方式である。いずれの方式においても、これから符号化する符号化画面で使用する割り当て符号量を設定してから圧縮動作を開始し、その符号化画面の圧縮処理中は量子化指標Qを随時制御して与えられた割り当て符号量になるように動作させるものである。従って、割り当て符号量の的確さが画質に及ぼす影響が大きく、適正な割り当て符号量の決定方法が数多く検討されている。過去の符号化の符号量と量子化指標Qの実績値に基づいて割り当て符号量を算出する方法が基本であるが、それに加えて入力画像の映像としての特徴を検出して制御に利用する方法が一般的になってきた。
CBRの場合の例として特許文献1がある。特許文献1の符号量制御装置では符号化画面の映像的特徴として平均輝度(以下DC値と略す)の変化を監視し、大きな変化があった場合にそのGOP全体あるいは個別のピクチャーに対する割り当て符号量を制限するものである。大きな映像変化の場合には、割り当て符号量よりも圧縮処理後の実際の符号量が大幅に超過することがあるが、予め割り当て符号量を絞り込むことにより大幅な符号量超過を防止して、CBRでありながら適正な符号量制御ができることになる。
一方、VBR方式でも入力画像の特徴検出が利用されるようになってきている。その代表的な従来例について以下に説明する。図9は一般的なVBR方式の動画像圧縮装置の構成を示すものである。図9で、入力映像は符号化画面メモリ1と前処理手段3aに供給され、符号化画面メモリ1と参照画面メモリ2は映像データを圧縮手段7に供給し、前処理手段3aの出力である入力映像情報は入力映像情報記憶手段4aで一時記憶され、前処理手段3aと入力映像情報記憶手段4aの出力はともにイントラ判定手段5aに接続される。イントラ判定手段5aの出力であるイントラ通報は符号量制御手段6aに通知され、符号量制御手段6aは圧縮手段7から実績符号量と量子化指標Qを受け、割り当て符号量を供給する。
以下、従来例の動作について説明する。符号量制御手段6aの内部動作では、符号量Sと量子化指標Qを用いて(数1)で定義される複雑度Xが用いられる。
(数1)
X=S*Q
符号量制御手段6aは符号量割り当てのための基準の複雑度であるXi0とXp0とXb0と、基準の量子化指標である量子化指標Q0 を記憶している。Xi0,Xp0,Xb0はそれぞれIピクチャー、Pピクチャー、Bピクチャーの制御に使用する基準値としての複雑度である。
あるPピクチャーの符号化を行う場合の動作について説明する。符号量制御手段6aはまず(数2)に従って基準の量子化指標Q0 からPピクチャー用の基準の量子化指標Qp0を算出し、基準の複雑度Xp0と量子化指標Qp0を用いて(数1)に従い割り当て符号量Sp0を求め、バッファシミュレーションによる制約を加えた後、圧縮手段7に供給する。
(数2)
p0=Kp *Q0
圧縮手段7は符号化画面メモリ1と参照画面メモリ2から映像データを読み込み、割り当て符号量Sp0となるように量子化指標Qp0を制御しながら符号化ピクチャーの圧縮処理を行い、動作終了後に実際の符号量Sp1と実際の量子化指標Qp1とを実績値として符号量制御手段6aに報告する。符号量制御手段6aは符号量実績値Sp1と量子化指標Qp1とから該当ピクチャーの複雑度実績値Xp1を求め、それを基準の複雑度Xp0と比較する。その差異があらかじめ設定した許容誤差の範囲内であれば映像の状態が変化していないと判断して基準の複雑度Xp0をそのまま保持する。また、符号量実績値Sp1を用いて過去の平均的符号量を更新演算し、平均符号量から求まる平均ビットレートが目標とするビットレートに近づくように大きな時定数で少しずつ基準の量子化指標Q0 を更新する。一方、複雑度実績値Xp1が許容誤差の範囲外であれば映像の状態が変化したと判断してその複雑度実績値Xp1を新たな基準の複雑度Xp0として記憶し、併せてIピクチャーの基準の複雑度Xi0、Bピクチャーの基準の複雑度Xb0も更新する。Xi0,Xb0の更新は過去数フレームの実績値Xi1,Xp1,Xb1の平均値の比率から求める。同時に今後の割り当て符号量が適度な値の範囲になるように基準の量子化指標Q0 の値を変更する。
以上、Pピクチャーの場合の符号量制御手段6aと圧縮手段7の基本動作を説明したが、Iピクチャー、Bピクチャーの場合も同様である。
一方、前処理手段3aは入力映像を取り込み、その映像的特徴を検出して入力映像情報として出力する。入力映像情報としては数々のものが考えられるが、代表的な例としてDC値と高域成分絶対値総和がある。DC値とは入力画面の輝度成分の画面全体としての平均値のことである。高域成分絶対値総和とは入力画面の水平方向にハイパスフィルタを掛け、その出力の絶対値の総和を求めたものである。前処理手段3aがDC値と高域成分絶対値総和を入力映像情報として出力すると、イントラ判定手段5aは入力映像情報記憶手段4aが記憶していた1フレーム過去の入力映像情報と、前処理手段3aの現在の入力映像情報とを比較して、DC値あるいは高域成分絶対値総和のいずれかが予め設定された基準値以上に変化していたとき入力映像に大きな変化が発生したと判断して、イントラ通報を符号量制御手段6aに発行する。
図10はイントラ通報とGOP再起動を説明するものである。図中に示すPピクチャーとBピクチャーの比較でイントラ判定手段5aが大きな映像変化を検出して、そのBピクチャーについてイントラ通報を発行し、符号量制御手段6aはイントラ通報を受けると、イントラ通報を発行させたピクチャー以降最初のPピクチャーをIピクチャーに変更して新たなGOPを作成する。その結果、直前のGOPは短縮化されることとなり、図10の例では6枚のピクチャーに短縮されている。
一般に映像が大きく変化するところで、参照画像を用いた圧縮では画質劣化が激しくなる。しかし、以上のように入力映像の映像としての特徴を検出して利用することにより、映像変化に対してIピクチャーを設けることができるから画質劣化を防止することができるものである。
特開2003−348590号公報(第6−7頁、第1図)
上述したように特許文献1の構成では、入力画像の映像としての特徴を検出して割り当て符号量の制御に利用しているが、CBRとしてのビットレートの安定を目的として割り当て符号量を制限するのみであり、VBRへの適用、すなわち画質確保のための割り当て符号量の積極的な増減の制御への適用は困難である。また、映像がより圧縮に容易な方向に変化したとき、逆に映像が劣化するという課題を有している。
また、図9に示した一般的なVBRの構成では、符号量制御手段6aと圧縮手段7の作用だけでは、入力映像の状態が変化した場合に割り当て符号量の適正値への切り換えが遅れるため、短時間の画質劣化が避けられないという課題を有している。その対策として図10に示すように入力映像の状態変化を検出して、新たなGOPを開始するGOP再起動の方法がある。しかしこの方法では、Iピクチャーの直後に変化が検出された場合、2つのIピクチャーが近接して存在してしまうという状態が容易に発生する。Iピクチャーは割り当て符号量が大きいから、バッファシミュレーションにより割り当て符号量が削減されてしまい、画質改善効果を得ることができない。特に変化が頻繁に発生する場合など逆に画質劣化を招くという課題を有する。
本発明は上記の問題点に鑑み、頻繁に発生する映像の状態変化に対してはその状態変化に同期して遅滞なく割り当て符号量を的確に増減制御するVBR方式の動画像圧縮装置を提供するものである。
本発明による動画像圧縮装置は、
符号化画面と参照画面の比較により映像情報を求める映像情報検出手段と、
過去の前記映像情報と前記符号化画面の前記映像情報の変化度合いから圧縮予測情報を算出する圧縮状態予測手段と、
過去の符号化による符号量と量子化指標の実績値と前記圧縮予測情報を用いて前記符号化画面の割り当て符号量を求める符号量制御手段とを具備している。
これにより、圧縮動作の難易度合いと対応する符号化画面と参照画面の相関性を映像情報として定量的に求めることとなり、映像情報の変化度合いから圧縮動作の難易度合いを相対的に求めることとなるから、それを圧縮予測情報として符号量と量子化指標の実績値に演算することで、正確な符号量割り当てが求められるという作用を有する。その結果として、符号量制御が映像変化に遅れることなく、常に高い画質を実現することができる。さらに、GOP再起動処理も必要最小限に抑える、あるいは廃止することができるから、変化が高い頻度で発生する映像に対しても安定して高い画質を実現することができる。
上記において、前記映像情報検出手段は、前記符号化画面またはその縮小画面と前記参照画面またはその縮小画面とを互いにずらせ、重なった領域が最もよく一致するずらし量を全体ベクトルとして特定する全体ベクトル検索機能と、その状態での重なり領域の統計的類似性を指標として算出する類似性演算機能とを備え、前記全体ベクトルと前記類似性指標を前記映像情報として出力するという態様がある。
これにより、圧縮動作におけるイントラマクロブロックのAC係数符号量の程度にほぼ対応する全体ベクトルと、AC係数符号量とランダムな動きのベクトル符号量の程度にほぼ対応する類似性指標とを求めることで圧縮動作の難易度合いが定量的に求められる作用を有する。
また、上記において、前記映像情報検出手段の前記類似性演算機能は、前記符号化画面と前記参照画面の重なり領域での共分散に基づく演算であるという態様もある。これにより、精度の高い類似性指標が得られる作用を有する。
また、上記において、前記圧縮状態予測手段は、前記映像情報検出手段が前記映像情報として出力する類似性指標と全体ベクトルについて、前記符号化画面と同一種類の過去の画面での該当情報から変化を求め、その変化の程度に応じた前記圧縮予測情報を算出するという態様がある。これにより、ベクトル符号量とAC係数符号量の増減が過去の実績に対する相対的な比率として予測され、符号量と量子化指標の実績値に乗ずることで圧縮状態をより正確に推定する作用を有する。
本発明によれば、映像情報検出手段が符号化画面と参照画面の関係を全体ベクトルと類似性指標として求め、圧縮状態予測手段が過去の全体ベクトルと類似性指標の比較を行うから、ベクトル符号量とAC係数符号量の増減を相対的に予測することができ、これを圧縮予測情報として、符号量や量子化指標の実績値を利用することで、これから圧縮する符号化画面の圧縮状態を高い精度で予測することができ、適正な符号量割り当てを求めることができる。そのため符号量制御が映像変化に遅れることなく、常に高い画質を実現することができる。さらに、GOP再起動処理も必要最小限に抑える、あるいは廃止することができるから、変化が高い頻度で発生する映像に対しても安定して高い画質を実現することができる。
以下、本発明にかかわる動画像圧縮装置の実施の形態を図面に基づいて詳細に説明する。
図1は本発明の実施の形態における動画像圧縮装置の構成を示すブロック図である。図1において、1は符号化画面メモリ、2は参照画面メモリ、3は符号化画面メモリ1からの符号化画面と参照画面メモリ2からの参照画面の比較により映像情報を求める映像情報検出手段、4は過去の映像情報を記憶する映像情報記憶手段、5は映像情報記憶手段4からの過去の映像情報に対する映像情報検出手段3からの現在の符号化画面の映像情報の変化度合いから圧縮予測情報αを算出する圧縮状態予測手段、6は過去の符号化による符号量と量子化指標の実績値と圧縮予測情報αを用いて符号化画面の割り当て符号量を求める符号量制御手段、7は符号化画面メモリ1と参照画面メモリ2から映像データを読み込み、所定の割り当て符号量となるように量子化指標Qを制御しながら符号化ピクチャーの圧縮処理を行う圧縮手段である。圧縮手段7は、動作終了後に実際の符号量と実際の量子化指標とを実績値として符号量制御手段6に報告する。符号量制御手段6は圧縮手段7から実績符号量と量子化指標Qを受け、割り当て符号量を供給する。
以上のように構成された実施の形態の動作について以下に説明する。
まず、Pピクチャーを符号化する場合の動作、すなわち順方向参照を用いたMPEG2規格の動画像圧縮動作を行う場合について説明する。符号化画面メモリ1には符号化Pピクチャーが、参照画面メモリ2には符号化Pピクチャーの3フレーム過去に相当するIピクチャーまたはPピクチャーが既に記憶されているものとする。
最初に、映像情報検出手段3が符号化画面と参照画面の画面全体としての移動状態を検出し、全体ベクトルを求める。この全体ベクトルの検出方法としては、画面のいくつかの部分の移動状態を検索してその総合として求める方法、符号化画面と参照画面それぞれの縮小画面を生成して、縮小画面のずれ状態を検索する方法などがある。本実施の形態では映像情報検出手段3が縮小画面を生成し、互いにずらしながら、重なり部分の差分絶対値平均が最小となるずらし量を全体ベクトルとして求めるものであるとする。これが全体ベクトル検索機能に該当する。
図2は本実施の形態での全体ベクトルの定義を示す説明図である。符号化画面の全体ベクトルの定義は図2の符号化画面上に図示したものであり、カメラの移動ベクトルに相当するものである。以下の説明ではPピクチャーの全体ベクトルをVp と記す。
図3は全体ベクトルVp の状態での符号化画面と参照画面の重なり合いの関係を示すものである。映像情報検出手段3は図3の重なり領域に対して統計的類似性指標を算出する。類似性指標として(数3)に示す相関係数rを用いる。
Figure 2007074634
(数3)でxは符号化画面の縮小画面の画素、yは参照画面の縮小画面の画素、総和は図3に示す重なり領域の範囲内として演算する。(数3)の分子は符号化画面と参照画面の重なり部分の共分散であり、それを分母の標準偏差で正規化したものである。すなわち、共分散を用いた演算である。相関係数は1から−1の値をとり、極めて強い相関関係があるとき1、無関係であるとき0、極めて強い逆相関があるとき−1となる特徴がある。Pピクチャーの相関係数をrp と記すことにする。映像情報検出手段3は全体ベクトルVp と相関係数rp の組を映像情報として出力する。
映像情報記憶手段4はIピクチャー、Pピクチャー、Bピクチャーの3種類について、常に最新の映像情報を保持しており、必要な映像情報を圧縮状態予測手段5に出力する。いま映像情報検出手段3から符号化画面であるPピクチャーの映像情報を受け取ると、それを新たに記憶するとともに、現在の符号化画面の直前の同じ種類のピクチャーすなわち3フレーム前のPピクチャーの映像情報を圧縮状態予測手段5に転送する。
圧縮状態予測手段5は映像情報検出手段3から転送された符号化画面Pピクチャーの映像情報と、映像情報記憶手段4から転送された直前のPピクチャーの映像情報とから圧縮状態の予測を開始する。これは符号化画面の符号量予測、直前のPピクチャーの符号量予測、圧縮状態予測の3ステップからなっている。まず、符号化画面Pピクチャーの符号量予測について説明する。圧縮状態予測手段5は全体ベクトルVp を用いて、図3のAに示す重なり部分とBに示す余白部分の画面全体に対する面積比率を求める。
(数4)
a =A/(A+B)
b =B/(A+B)
(数4)で、Ka が重なり部分Aの比率、Kb が余白部分Bの比率である。また、相関係数rp を図4の変換則に従って指標Rに変換する。以上のKa ,Kb ,Rを用いて(数5)〜(数7)で符号量推定指標sを算出する。
(数5)
1 =Kb *K1
(数6)
2 =Ka *K2 *R
(数7)
s=s1 +s2 +K3
(数5)でs1 は余白部分BのイントラマクロブロックのAC係数符号量の程度を推定するものである。K1 はその余白面積とイントラマクロブロックのAC符号量の比例常数を意味するが、ここではK1 =1とする。(数6)のs2 は重なり部分AでのAC符号量と動きベクトル符号量の総合の程度を推定する指標である。これは、相関係数rが1に近いほど、つまり指標Rが0に近いほど重なり部分Aは符号化画面と参照画面がよく一致し、AC係数も少なく、動きベクトルもほとんど全て同じものとなるからベクトル符号量も少なくなるという事実と、相関係数rが0に近づくあるいはマイナスになるなどの指標Rが1に近い状態では、符号化画面は参照画面と全く異なったものであり、イントラマクロブロックの比率も増え、AC係数符号量が増大し、また動きベクトルもまちまちな値をとって動きベクトル符号量も増大する、という事実とを根拠としている。K2 は指標Rと符号量の比例常数を意味するが、この実施の形態ではK2=0.8とする。s1 ,s2 とも影響度合いをKa ,Kb で面積比率で重み付けている。(数7)で符号量推定指標sを算出する。K3 はヘッダ等の固定的な符号量の影響を示す項であり、この例ではK3=0.2とする。符号量推定指標sは符号量を直接示すものではなく、符号量の増減に比例すると推定できる指標である。K1 ,K2 ,K3 は動作の目標符号量の程度や圧縮手段7の性能等により最適値が異なる。以上の説明中に示した値は一例である。またK1 ,K2 ,K3 は互いの比率のみに意味があるのでK1 =1として説明を進めた。
上述した符号化画面の符号量予測の結果である指標sをs(n)と記すこととする。同様に直前のPピクチャーの符号量予測を行い、その結果である指標sをs(n-1)と記す。圧縮状態予測手段5は最終的な圧縮状態予測として(数8)に従い予測情報αを算出する。
(数8)
α=s(n)/s(n-1)
予測情報αは直前のPピクチャーの圧縮状態を基準として、圧縮難易度合いを比率として予測した指標である。
符号量制御手段6は上記予測情報αを受けて、符号化画面Pピクチャーの符号量割り当てを決定する。以下に符号量制御手段6の動作を説明するが、既に説明した図9の従来例の符号量制御手段6aと圧縮手段7の基本動作とほぼ同じであるから、異なる点のみを説明することとする。
いま、Pピクチャーの圧縮動作であるから、符号量制御手段6は基準の複雑度指標Xp0を用いるのであるが、(数9)に従って予測情報αを乗じたXp0′を求め、Xp0かXp0′かいずれを今後の基準として採用するか判断を行う点が従来例と大きく異なる。
(数9)
p0′=Xp0*α
p0′がXp0に対して予め設定された許容誤差の範囲内である場合、Xp0をそのまま基準の複雑度指標として使用し、許容誤差範囲外であれば、映像の状態が変化すると予測して前記のXp0′を新たな基準の複雑度指標Xp0として記憶し、併せてIピクチャーの基準の複雑度指標Xi0、Bピクチャーの基準の複雑度指標Xb0も更新する。Xi0,Xb0の更新は過去数フレームの実績値Xi1,Xp1,Xb1の平均値の比率から求める。同時に今後の平均符号量が目標符号量にワンステップ近づくように基準の量子化指標Q0の値を変更する。このように圧縮の難易度合いを過去に対する比率で予測した予測情報αをこれまでの符号量制御に用いていたXp0に乗ずることにより、予測結果を的確に符号量制御に反映させることができる。例えば、符号化画面が変化し、参照画面との関係からより圧縮が困難な状態に変化したのであれば予測情報αが1より大きくなり、その程度に応じた符号量が割り当てられる。より参照画面と一致して圧縮が容易な方向に変化したのであれば予測情報αが1より小さくなり、その程度に応じて符号量が割り当てられることとなるのである。
以上が従来例と異なる動作であるが、基準値が確定すれば、そこから割り当て符号量を決定し、圧縮手段7に符号化Pピクチャーを圧縮実行させ、結果の符号量Sp1と量子化指標Qp0を用いて複雑度指標Xp1を算出し、Xp1とXp0の比較から基準値の更新処理を実行することは上述した従来例の場合と同じである。以上、Pピクチャーの場合の動作について説明した。
以下、Bピクチャーを符号化する場合の動作、すなわち順方向参照と逆方向参照の双方向参照を用いたMPEG2規格の動画像圧縮動作を行う場合について簡単に説明する。符号化画面メモリ1には符号化Bピクチャーが、参照画面メモリ2には順方向の参照画面として符号化Bピクチャーの過去のPピクチャーと逆方向の参照画面として未来のPピクチャーがそれぞれ既に記憶されているものとする。
まず、映像情報検出手段3が符号化画面と参照画面の画面全体としての移動状態を検出し、全体ベクトルを求める。図5は順方向と逆方向の全体ベクトルの説明図である。図5で順方向参照画面と符号化画面および順方向全体ベクトルの関係は、既に説明した図2の参照画面と符号化画面および全体ベクトルの関係と全く同じである。逆方向について図5では符号化画面の左上の矩形領域と逆方向参照画面の右下の矩形領域がよく一致している状態を図示している。この場合、符号化画面から逆方向参照画面に向かって映像全体は時間的に画面内を右下に移動しており、カメラが撮影時左上に移動したと推定できる。逆方向全体ベクトルの定義は図5の符号化画面上に示したように、カメラの移動ベクトルの逆方向に相当するものである。以下の説明ではBピクチャーの順方向全体ベクトルをVbf、逆方向全体ベクトルをVbbと記す。
図6は順方向全体ベクトルVbfの状態での符号化画面と順方向参照画面の重なり合いの関係と、逆方向全体ベクトルVbbの状態での符号化画面と逆方向参照画面の重なり合いの関係とを示すものである。映像情報検出手段3は順方向類似性指標として、図6の符号化画面と順方向参照画面の重なり領域に対して相関係数rbfを、逆方向類似性指標として符号化画面と逆方向参照画面の重なり領域に対して相関係数rbbをそれぞれ算出する。映像情報検出手段3は全体ベクトルVbfとVbb、相関係数rbfとrbbの4つの情報の組を映像情報として出力する。
圧縮状態予測手段5は映像情報検出手段3から転送された符号化画面Bピクチャーの映像情報と、映像情報記憶手段4から転送された直前のBピクチャーの映像情報とから圧縮状態の予測を開始する。まず、符号化画面の符号量予測として順方向の情報であるVbfとrbfを用いて、(数4)〜(数7)で順方向に関する符号量推定指標sを求め、また同様に逆方向の情報であるVbbとrbbを用いて逆方向の符号量推定指標sを求め、そのいずれか値が小さい方を符号化画面の符号量推定指標s(n)として採用する。同様に直前のBピクチャーの符号量予測を行い、その結果小さい方の符号量推定指標sをs(n-1)とする。圧縮状態予測手段5は最終的な圧縮状態予測として(数8)に従い予測情報αを算出する。予測情報αは直前のBピクチャーの圧縮状態を基準として、符号化画面の圧縮難易度合いを比率として予測する指標となっている。
符号量制御手段6が予測情報αを用いて基準のXb0を更新処理することは上述したPピクチャーの動作の場合と全く同じであり、予測値を的確に符号量割り当てに反映させることができるのも全く同じである。
以上のように本実施の形態では、符号化画面と参照画面のずれ量である全体ベクトルVと重なり領域の相関係数rを類似性指標として求めるが、それら映像情報は圧縮状態の難易度合いと関連深いものであるから、映像情報から符号量推定指標sを求めることができる。符号量推定指標sは符号量の数値を正確に示すものではないが、符号化画面と同一種類で最も新しく符号化された画面の符号量推定指標sとの比率s(n)/s(n-1) を求めることにより、圧縮状態の難易度合いを精度良く予測情報αとして数値化することとなる。そしてその予測情報αを用いてVBRの符号量割り当てに使用している複雑度指標Xを補正するので、これから圧縮する符号化画面の符号量割り当てをその圧縮難易度合いに適正に対応させた値とすることができ、映像変化に対しても1フレームも画質劣化を発生させることなく、常に高い画質を実現することができるものである。
なお、本実施の形態ではGOP再起動処理は特に必要としないものであるが、予測情報αが極めて大きな値である場合にのみGOP再起動処理を実行する構成としても良い。この場合、Iピクチャーの平均的符号量とPピクチャーの平均的符号量の比率をしきい値として採用することで、予測情報αによって割り当て符号量を増加させたほうがIピクチャーとするよりも符号量が大きくなるような場合にのみGOP再起動処理が選択されることとなる。
また、映像情報から予測情報を求める演算では(数4)〜(数8)の演算式を用いたが、これは実験的に求められるデータから別の関数、あるいはテーブルとして構成することもできる。さらに、映像情報として全体ベクトルと相関係数を用いたが、これにDC値を含めてもよく、また類似性指標としては相関係数以外に差分絶対値平均や差分自乗平均などの統計的指標を用いて構成することもできる。
本発明の動画像圧縮装置は、映像変化があった場合にその映像の圧縮動作を開始する前に圧縮動作の難易度合いの変化を予測して適正な割り当て符号量を決定するものであるから、的確なVBR性能を発揮することができ、変化の頻繁に発生する映像に対しても1フレームたりとも画質劣化を生じさせず、高画質で安定性の高い性能が要求される動画像圧縮に適応できるものである。
本発明の実施の形態における動画像圧縮装置の構成を示すブロック図 本発明の実施の形態におけるPピクチャーの映像情報説明図 本発明の実施の形態におけるPピクチャーの重複領域の説明図 本実施の形態における相関係数の変換の説明図 本発明の実施の形態におけるBピクチャーの映像情報説明図 本発明の実施の形態におけるBピクチャーの重複領域の説明図 MPEG2の参照関係の説明図 MPEG2のGOP構造の説明図 従来の技術における動画像圧縮装置の構成を示すブロック図 従来の技術におけるイントラ通報とGOP再起動の説明図
符号の説明
1 符号化画面メモリ
2 参照画面メモリ
3 映像情報検出手段
4 映像情報記憶手段
5 圧縮状態予測手段
6 符号量制御手段
7 圧縮手段

Claims (4)

  1. 符号化画面と参照画面の比較により映像情報を求める映像情報検出手段と、
    過去の前記映像情報と前記符号化画面の前記映像情報の変化度合いから圧縮予測情報を算出する圧縮状態予測手段と、
    過去の符号化による符号量と量子化指標の実績値と前記圧縮予測情報を用いて前記符号化画面の割り当て符号量を求める符号量制御手段とを具備する動画像圧縮装置。
  2. 前記映像情報検出手段は、前記符号化画面またはその縮小画面と前記参照画面またはその縮小画面とを互いにずらせ、重なった領域が最もよく一致するずらし量を全体ベクトルとして特定する全体ベクトル検索機能と、その状態での重なり領域の統計的類似性を指標として算出する類似性演算機能とを備え、前記全体ベクトルと前記類似性指標を前記映像情報として出力する請求項1に記載の動画像圧縮装置。
  3. 前記映像情報検出手段の前記類似性演算機能は、前記符号化画面と前記参照画面の重なり領域での共分散に基づく演算である請求項2に記載の動画像圧縮装置。
  4. 前記圧縮状態予測手段は、前記映像情報検出手段が前記映像情報として出力する類似性指標と全体ベクトルについて、前記符号化画面と同一種類の過去の画面での該当情報から変化を求め、その変化の程度に応じた前記圧縮予測情報を算出する請求項1から請求項3までのいずれかに記載の動画像圧縮装置。


JP2005262002A 2005-09-09 2005-09-09 動画像圧縮装置 Expired - Fee Related JP4648805B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005262002A JP4648805B2 (ja) 2005-09-09 2005-09-09 動画像圧縮装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005262002A JP4648805B2 (ja) 2005-09-09 2005-09-09 動画像圧縮装置

Publications (3)

Publication Number Publication Date
JP2007074634A true JP2007074634A (ja) 2007-03-22
JP2007074634A5 JP2007074634A5 (ja) 2008-09-25
JP4648805B2 JP4648805B2 (ja) 2011-03-09

Family

ID=37935649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005262002A Expired - Fee Related JP4648805B2 (ja) 2005-09-09 2005-09-09 動画像圧縮装置

Country Status (1)

Country Link
JP (1) JP4648805B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014050015A1 (ja) * 2012-09-26 2014-04-03 パナソニック株式会社 画像符号化装置、撮影画像記録システム、撮像装置、画像符号化方法、および画像符号化プログラム
CN113938685A (zh) * 2021-09-26 2022-01-14 中国科学院计算技术研究所 面向大规模图像存储的认知型软件可调整图像编码装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001028753A (ja) * 1999-07-13 2001-01-30 Victor Co Of Japan Ltd 動画像符号化装置及びその方法
JP2002247584A (ja) * 2001-02-15 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法および装置、並びに、画像符号化処理用プログラム及びそのプログラムの記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001028753A (ja) * 1999-07-13 2001-01-30 Victor Co Of Japan Ltd 動画像符号化装置及びその方法
JP2002247584A (ja) * 2001-02-15 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法および装置、並びに、画像符号化処理用プログラム及びそのプログラムの記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014050015A1 (ja) * 2012-09-26 2014-04-03 パナソニック株式会社 画像符号化装置、撮影画像記録システム、撮像装置、画像符号化方法、および画像符号化プログラム
JP2014068182A (ja) * 2012-09-26 2014-04-17 Panasonic Corp 画像符号化装置、撮影画像記録システム、撮像装置、画像符号化方法、および画像符号化プログラム
US10091521B2 (en) 2012-09-26 2018-10-02 Panasonic Intellectual Property Management Co., Ltd. Image encoding device, captured image recording system, imaging device, method of encoding image, and image encoding program
CN113938685A (zh) * 2021-09-26 2022-01-14 中国科学院计算技术研究所 面向大规模图像存储的认知型软件可调整图像编码装置

Also Published As

Publication number Publication date
JP4648805B2 (ja) 2011-03-09

Similar Documents

Publication Publication Date Title
JP5008718B2 (ja) 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
JP2002010259A (ja) 画像符号化装置及び画像符号化方法及び画像符号化プログラムを記録した記録媒体
US20080112486A1 (en) Encoding apparatus and encoding method
JPH10108187A (ja) ビデオ符号化のための量子化方法
JP4764136B2 (ja) 動画像符号化装置、及びフェードシーン検出装置
JP2006313950A (ja) 画像符号化装置、及び画像符号化方法
JP4677932B2 (ja) 動画像符号化方法及び動画像符号化装置とプログラムならびに媒体
JP2000201354A (ja) 動画像符号化装置
JPH08102938A (ja) 画像符号化装置
KR100561398B1 (ko) 동화상 내 구획별로 휘도 변화를 검출하고 보상하는 장치 및 방법
JP2004274236A (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
JP2006295535A (ja) 動画像符号化装置および方法
JP4257655B2 (ja) 動画像符号化装置
US6763138B1 (en) Method and apparatus for coding moving picture at variable bit rate
JP2007318617A (ja) 画像符号化装置、及び画像符号化プログラム
JP4648805B2 (ja) 動画像圧縮装置
JP5649296B2 (ja) 画像符号化装置
KR101391397B1 (ko) 부호량 제어 방법 및 장치
JP2001028753A (ja) 動画像符号化装置及びその方法
JP2008252562A (ja) 動画像符号化制御方法および動画像符号化装置
JP2001238215A (ja) 動画像符号化装置及びその方法
JP2002247584A (ja) 画像符号化方法および装置、並びに、画像符号化処理用プログラム及びそのプログラムの記録媒体
JP2008252225A (ja) 動画像符号化装置及び方法
JP2004266640A (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
JP2005045736A (ja) 画像信号符号化方法及び装置、符号化制御装置並びにプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080807

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100921

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4648805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees