JP2010034801A - 動画像符号化装置およびその制御方法 - Google Patents

動画像符号化装置およびその制御方法 Download PDF

Info

Publication number
JP2010034801A
JP2010034801A JP2008194074A JP2008194074A JP2010034801A JP 2010034801 A JP2010034801 A JP 2010034801A JP 2008194074 A JP2008194074 A JP 2008194074A JP 2008194074 A JP2008194074 A JP 2008194074A JP 2010034801 A JP2010034801 A JP 2010034801A
Authority
JP
Japan
Prior art keywords
encoding
distortion
code amount
picture
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008194074A
Other languages
English (en)
Inventor
Reiko Fujino
玲子 藤野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008194074A priority Critical patent/JP2010034801A/ja
Publication of JP2010034801A publication Critical patent/JP2010034801A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】動画像の入力ピクチャを符号量と符号化歪みの関係に基づいて符号化する際に、符号化歪みの調整範囲を示す指標値は固定であるため、視覚感度に応じた適応的な符号量制御を行うことは困難であった。
【解決手段】符号化歪み指標値算出部201において、例えば入力ピクチャの統計的な色相情報Hによって視覚感度を推定し、該視覚感度に基づいて符号化歪みの調整範囲の指標となる符号化歪み指標値を決定する。このように視覚感度に応じて決定された符号化歪み指標値に基づいて仮の符号化歪み予測値D'を修正することにより、符号化歪み予測値Dを算出して符号化を行う。
【選択図】 図1

Description

本発明は動画符号化装置およびその制御方法に関する。
近年のデジタル信号処理技術の飛躍的な進歩により、従来ならば困難であった動画像の蓄積メディアへの記録や伝送路を介した動画像の伝送が行われている。この場合に、動画像を構成する各々のピクチャに圧縮符号化処理を施した符号化ストリームは大幅に削減される。この圧縮符号化処理として代表的な手法の一つが、例えばMPEG(Moving Picture Experts Group)方式である。
MPEG方式に準拠して一連のピクチャをビットレート一定という条件下で圧縮符号化する場合は、シーン、ピクチャの空間周波数特性、及び、量子化スケール値に応じて符号量が大きく異なる。この様な符号化特性をもつ動画像符号化装置を実現する上で、復号時の画質劣化となる符号化歪みを最小限に抑える技術が符号量制御である。
符号量制御を実現するためのアルゴリズムについては数多く提案されている。例えば、R−D(R:符号量、D:符号化歪み)関係式と主観(視覚感度)に基づき、動画符号化におけるピクチャ単位及びマクロブロック単位の符号量を制御する方法が知られている(例えば、特許文献1参照)。該方法においては、R−D関係式から求められる符号化歪みDを用いて、画質が一定になるように符号化パラメータ(Qスケール)を制御している。
以下、上述したような、R−D関係式に基づく符号量制御を行う従来の動画像符号化装置について詳細に説明する。
図9は、従来の動画像符号化装置の構成例を示すブロック図である。同図において、入力ピクチャPiは、まず符号化部101と統計情報算出部111に入力される。符号化部101では、入力ピクチャPiをその対応する符号化パラメータを用いて符号化し、符号化ストリームPoを出力する。統計情報算出部111では、入力ピクチャPiからアクティビティSfを求め、R−D関係式算出部112に送る。R−D関係式算出部112では、一般的なR−D関係式とアクティビティSfから、R−D関係式を特定する。
R−D関係式算出部112で算出されたR−D関係式は、符号化歪み予測部113に送られる。符号化歪み予測部113では図10に示すように、R−D関係式算出部112から入力されたR−D関係式に従い、フレームレートと動作周波数から決定される仮の目標符号量R'に対応する、仮の符号化歪み予測値D'を求める。
符号化歪み算出部114では、符号化歪み予測部113から入力された仮の符号化歪み予測値D'を修正する。以下、この符号化歪みの修正方法について説明する。
まず図11に示すようにR−D関係式を、予め定められた2つの符号化歪み指標値Dmin、Dmax(Dmin≦Dmax)を用いて、3つの画質に分割する。3つの画質とはすなわち、D'≦Dminである高画質(図11の画質1)、Dmin≦D'≦Dmaxである標準画質(同、画質2)、Dmax≦D'である低画質(同、画質3)である。
仮の符号化歪み予測値D'が低画質(画質3)であると判断された場合は、符号化歪み予測値DをDmaxに修正することによって、目標符号量を増加して画質を標準画質にまで引き上げ、主観画質の破綻を防ぐことができる。
一方、仮の符号化歪み予測値D'が高画質(画質1)であると判断された場合は、符号化歪み予測値DをDminに修正することによって、視覚的な劣化がない程度にまで画質を落とし、過剰なビット配分を防ぐことができる。
また、仮の符号化歪み予測値D'が標準画質(画質2)であると判断された場合は、符号化歪み予測値D=D'とする。
次に符号化パラメータ算出部103では、符号化歪み算出部114から入力された符号化歪み予測値Dと主観(視覚感度)を用いて、符号化パラメータ(量子化スケール)をマクロブロック毎に割り当て、符号化部101に出力する。
以上説明した構成からなる従来の動画像符号化装置によれば、動画符号化におけるピクチャ単位のビット配分をR−D特性により規定することができ、また量子化スケールをマクロブロック単位のビット配分と視覚感度により厳密に規定することができる。
特開2003−174648号公報
一般に動画像符号化装置に対しては、撮影システムから以下のような要求がある。例えば、フレーム内に人物の全身が撮影されている状態に対し、フレーム内に人物の顔がズーム撮影された状態では、視覚感度(注視度)が高まっているため、符号量を多く割り当てて符号化による画質の劣化を防ぐことが求められる。
また、撮影中のAF(自動焦点)やAE(自動露出)モード時においては、撮影装置の焦点や露光があっていないときに、前後のピクチャの発生符号量に応じて符号量を多く割り当てることは無駄である。したがってこのような場合には、割り当てる符号量を削減して、撮影データを記録するメモリの記憶容量をセーブすることが好ましい。また、撮影装置において望遠など光学ズームによる撮影設定がなされている場合は、やはり視覚感度が高まっているため、十分に符号量を割り当て、符号化による画質の劣化を防ぐことが要求される。
その他にも、画像内における絵柄の平坦さや複雑さの偏りに依存して、SNR(Signal to Noise Ratio)の偏りを防ぎ、符号量を多く割り当て、部分的な画質の劣化を防ぐことが求められる。
以上のような要求を実現するためには、撮影データを記録するための有限なメモリ容量に対し、該メモリの破綻を防ぎながらも高画質での記録を行うために、常にメモリの占有状況を確認しながら目標符号量を割り当てることが求められる。
しかしながら、上記図9に示した構成からなる従来の動画像符号化装置においては、予め定められた2つの符号化歪みの指標値(Dmin,Dmax)は調整不可能であり、目標符号量の適用領域は符号化開始時点で既に決定されている。したがって、上述したような状況において適応的に符号量が制御されているものではない。
本発明は上述した問題を解決するためになされたものであり、動画像を入力ピクチャ毎に符号化する際に、以下のような機能を有する動画像符号化装置およびその制御方法を提供することを目的とする。すなわち、入力ピクチャを符号量と符号化歪みの関係に基づいて符号化する際に、符号化歪みの調整範囲を示す指標値を、撮影対象によって変化する視覚感度に応じて算出することにより、適応的な符号量制御を可能とする。
上記目的を達成するための一手段として、本発明の動画像符号化装置は以下の構成を備える。
すなわち、動画像を入力ピクチャ毎に符号化し、符号化ストリームを出力する動画像符号化装置であって、入力ピクチャに対する統計情報を算出する統計情報算出手段と、該統計情報に基づいて、符号量と符号化歪みの関係を表すR−D関係式を算出するR−D関係式算出手段と、前記入力ピクチャに対する仮の目標符号量R'と前記R−D関係式に基づいて、仮の符号化歪み予測値D'を出力する符号化歪み予測手段と、前記入力ピクチャに対する視覚感度に基づいて、符号化歪みの調整範囲の指標となる符号化歪み指標値を算出する符号化歪み指標値算出手段と、前記符号化歪み指標値に基づいて前記仮の符号化歪み予測値D'を修正し、符号化歪み予測値Dとして出力する符号化歪み予測修正手段と、前記符号化歪み予測値Dと前記R−D関係式に基づいて、前記入力ピクチャに対する目標符号量Rを出力する目標符号量算出手段と、前記目標符号量Rに基づいて符号化パラメータを算出する符号化パラメータ算出手段と、前記入力ピクチャを前記符号化パラメータに基づいて符号化し、符号化ストリームとして出力する符号化手段と、を有することを特徴とする。
上記構成からなる本発明によれば、符号化歪みの調整範囲を示す指標値を、撮影対象によって変化する視覚感度に応じて算出することにより、適応的な符号量制御が可能となる。
以下、添付の図面を参照して、本発明をその好適な実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
<第1実施形態>
本実施形態の動画像符号化装置においては、R−D(R:符号量、D:符号化歪み)関係式と主観(視覚感度)に基づき、動画符号化におけるピクチャ単位及びマクロブロック単位の符号量を制御する。このとき、R−D関係式から求められる符号化歪みDを用いて、画質が一定になるように符号化パラメータ(Qスケール)を制御している。
図1は、本実施形態の動画像符号化装置の構成例を示すブロック図である。同図において、従来のブロック構成を示す図9と同様の構成には同一符号が付されている。
入力ピクチャPiは、まず符号化部101と統計情報算出部111に入力される。符号化部101では、入力ピクチャPiをその対応する符号化パラメータを用いて符号化し、符号化ストリームPoを出力する。この符号化パラメータは符号化パラメータ算出部103にて算出されるが、その詳細については後述する。
統計情報算出部111では、入力ピクチャPiから統計情報としてアクティビティSfを求め、R−D関係式算出部112に送る。統計情報算出部111はまた、入力ピクチャPiの色相(肌色量)情報Hを求め、符号化歪み指標値算出部201に送る。
R−D関係式算出部112では、以下の式(1)に示すように、一般的なR−D関係式とアクティビティSfから、R−D関係式を特定する。
R(Sf,D)=Θlog{(Sf/D)・I} ・・・(1)
ここで、R(Sf,D)はピクチャ単位の目標符号量、Dは符号化歪み値、Θ及びIは符号化方式に依存する係数である。式(1)によれば、アクティビティSfを一定とした場合に、符号量Rは符号化歪みDを変数とする関数として表現されることが分かる。アクティビティSfは入力ピクチャ毎に変化するため、図2に示すようにR−D関係式は入力ピクチャ毎に変更される。
上記のように特定されたR−D関係式は、符号化歪み予測部113と目標符号量修正部203に送られる。
符号化歪み予測部113には、R−D関係式算出部112からのR−D関係式と、仮の目標符号量R'が入力される。ここで仮の目標符号量R'は、フレームレートと動作周波数から予め与えられた目標符号量である。符号化歪み予測部113では、R−D関係式に従って、仮の目標符号量を用いて仮の符号化歪み予測値D'が求められる。
次に、符号化歪み予測部113で予測された仮の符号化歪み予測値D'は、符号化歪み予測修正部202において修正され、符号化歪み予測値Dとして出力される。なお、ここでの仮の符号化歪み予測値D'の修正方法については後述する。
次に目標符号量修正部203では、符号化歪み予測修正部202から入力された修正済みの符号化歪み予測値D、及び、R−D関係式算出部112から入力されたR−D関係式に従って、目標符号量Rを算出し、符号化パラメータ算出部103に送る。
符号化パラメータ算出部103においては、目標符号量修正部203から入力された目標符号量Rに基づいて、マクロブロック単位での符号量を算出し、マクロブロック単位に符号化パラメータ(Qスケール)を算出して、符号化部101に送る。
以下、本実施形態の符号化歪み予測修正部202における符号化歪みの修正方法について、詳細に説明する。
まず図2に示すように、R−D関係式を1つ以上の符号化歪み指標値Dth1,Dth2,Dth3,・・・,DthN-1(Dth1≦Dh2≦Dth3≦・・・≦DthN-1)を用いて、複数の画質領域(画質1,・・・,画質N)に分割する。すなわち本実施形態における符号化歪み指標値とは、符号化歪みに応じて画質を分割した際の境界値である。
本実施形態においては要求された画質要件を満たすために、対応する画質領域外に分類された符号化歪み予測値を、有効な画質領域の境界を示す符号化歪み指標値に近似する。この近似例を、図3を用いて説明する。図3において、画質要件を満たす画質領域がDth1≦D≦Dth2(画質2)であるとする。このとき、符号化歪み予測値D'がDth1より小さければ(図3のD1')、符号化歪み予測値Dを符号化歪み指標値Dth1に修正する(同、D1)。これにより、目標符号量R'もRに減じられるため、過剰な符号量の発生を防ぐことができる。また、符号化歪み予測値D'がDth2より大きければ(同、D2')、符号化歪み予測値Dを符号化歪み指標値Dth2に修正する(同、D2)。これにより、目標符号量R'をRに増加して主観画質の破綻を防ぐことができる。また、仮の符号化歪み予測値D'がDth1≦D'≦Dth2である場合には、符号化歪み予測値D=D'として、画質を維持する。
次に、本実施形態の符号化歪み指標値算出部201における、視覚感度に基づく符号化歪み指標値の算出方法について説明する。
まず、許容される符号化歪みの領域を、予め定められた符号化歪み指標値Da,Db(Da≦Db)によるDa≦D≦Dbであるとする。
符号化歪み指標値算出部201ではまず、統計情報算出部111から入力された色相情報Hに基づいて、撮影対象となる人物の顔がズームされているのか、または人物の全身がフレームの中に入っているのか等、撮影対象の状況を判断する。この判断はすなわち、色相情報Hに基づき、肌色がが強いか否かを判断することによって行われる。
肌色が弱いと判断された場合には、人物の一部または全身がフレーム内に小さく撮影されているものとみなし、許容される符号化歪み領域を、予め定められた符号化歪み領域Da≦D≦Dbのままとする。
一方、肌色が強いと判断された場合には、人物の顔をクローズアップして撮影しているものとみなし、視覚感度が高まっているため、許容される符号化歪みの領域を、(Da−α)≦D≦Dbに変更する。これによりすなわち、符号化歪みの領域がα分だけ高画質側に拡大されることになる。なお、この符号化歪み指標値のシフト量を示すαの値は、予め定められているものとする。
このように、符号化歪み指標値算出部201からは、算出された符号化歪み領域を示す値(この場合Da,Db、またはDa−α,Db)が、符号化歪み指標値として出力される。この符号化歪み指標値は、上述したように、符号化歪み予測修正部202において、符号化歪みの調整範囲を示す情報として利用される。
以上説明したように本実施形態によれば、動画像をピクチャ毎に符号化し符号化ストリームを出力する動画像符号化装置において、R−D関係式に基づいて符号量を制御する際に、符号化歪みの指標値を入力ピクチャの統計情報から決定することを特徴とする。これにより、撮影対象によって変化する視覚感度に対して、適応的に符号量を割り当てることができる。
<第2実施形態>
以下、本発明に係る第2実施形態について説明する。
図4は、第2実施形態の動画像符号化装置の構成例を示すブロック図である。同図において、上述した第1実施形態における図1と同様の構成には同一符号を付し、説明を省略する。
第2実施形態において第1実施形態と異なる構成は、図4に示す撮影部302、撮影制御情報算出部303、撮影制御部304、及び符号化歪み指標値算出部301、である。
撮影制御情報算出部303は、撮影部302から取り込まれたピクチャPiの輝度情報から画像のエッジ情報量を毎ピクチャ解析し、AEやAFを算出する。算出されたAEやAFは、撮影制御部304及び符号化歪み指標値算出部301へ送られる。一方、ユーザ操作に基づくズーム情報が、撮影制御部304及び符号化歪み指標値算出部301へ送られる。
撮影制御部304では、以上のように入力されたAE/AFの撮影情報とズーム情報に基づいてズーム位置情報を算出し、撮影部302に対する撮影制御情報として、ズーム位置更新を要求する。
符号化歪み指標値算出部301では、以上のように入力されたAE/AFの撮影制御情報とズーム情報に基づいて符号化歪み指標値を算出する。以下、図5に示すフローチャートを用いて、第2実施形態における符号化歪み指標値の算出処理について、詳細に説明する。なお、第2実施形態では符号化指標値として、所定の4つの値Dc、Dd、De、Df(Dc≦Dd≦De≦Df)を使用するものとする。
まずステップS201において、AE/AF情報、及びズーム情報を取得する。
そしてステップS202において、取得したAE/AF情報に基づき、エッジ情報が多いか否か、すなわち、焦点または露光が合っているか否かを判断する。エッジ情報が少ない(焦点または露光が合っていない)と判断した場合はステップS208へ進み、符号化歪みの指標値として最大のDfを設定する。
一方、ステップS202においてエッジ情報が多い(焦点または露光が合っている)と判断した場合はステップS203へ進み、ユーザがズーム操作中であるか否かを判断する。ズーム操作中であると判断した場合はステップS208へ進み、符号化歪みの指標値として最大のDfを設定する。
一方、ステップS203においてズームが固定されていると判断した場合はステップS204へ進み、ズーム位置情報(望遠/電子ズーム/標準)を判断する。ズーム位置情報が「望遠」である場合は視覚感度が非常に高い状態であるため、符号化歪みによる情報損失を最小限に抑えるために、ステップS205へ進んで符号化歪みの領域をDc≦D≦Deに設定する。また、ズーム位置情報が「電子ズーム」である場合は画質劣化が生じているため、ステップS206で符号化歪みの領域をDd≦D≦Deに設定する。また、ズーム位置情報が「標準」である場合は、ステップS207で符号化歪みの領域をDd≦D≦Deに設定する。
第2実施形態におけるAE/AF情報およびズーム情報は、ピクチャ単位で更新可能であるため、AE/AF情報およびズーム情報が更新された場合は、図5に示したフローチャートに従って、符号化歪み指標値が再度設定される。
以上説明したように第2実施形態によれば、R−D関係式に基づいて符号量を制御する際に、符号化歪みの指標値を、撮影状況を示す撮影制御モードから決定することを特徴とする。これにより、撮影制御モードに応じて変化する視覚感度に対して、適応的に符号量を割り当てることができる。
<第3実施形態>
以下、本発明に係る第3実施形態について説明する。
図6は、第3実施形態の動画像符号化装置の構成例を示すブロック図である。同図において、上述した第1実施形態における図1と同様の構成には同一符号を付し、説明を省略する。
第3実施形態において第1実施形態と異なる構成は、図6に示す局所復号部403、符号化歪み検出部402、及び符号化歪み指標値算出部401、である。
局所復号部403は、符号化部101より出力された符号化ストリームPoを復号して再構成ピクチャを生成し、符号化歪み検出部402に送る。
符号化歪み検出部402には、入力ピクチャと局所復号部403からの再構成ピクチャが入力されており、該入力ピクチャの近傍に位置する、既に符号化が終了したピクチャ(以下、符号化済ピクチャ)の符号化前の値が保持されている。符号化歪み検出部402では、入力ピクチャの近傍に位置する符号化済みピクチャと、それに対応する再構成ピクチャとに基づいて、該符号化済みピクチャにおいて実際に発生した符号化歪み値Doldを検出し、符号化歪み指標値算出部401に送る。
符号化歪み指標値算出部401では、符号化歪み検出部402において検出された符号化歪みDoldが小さいと判断された場合、許容される符号化歪みの領域をDg≦D≦Dh(Dg≦Dh)に設定する。一方、該符号化歪みが大きいと判断された場合、画像内における絵柄の平坦さや複雑さの偏りがあるため、下式(2)に従って符号化歪み領域(Dmin≦D≦max)を基準値よりも低画質側に設定し、画質を安定させる。
Dmin=Dg−α×δ ・・・(2)
Dmax=Dh−α×δ
なお、式(2)において、Dg及びDhは所定の符号化歪み指標値であり、δは符号化歪み検出部402から検出された符号化歪み、αは所定の係数である。
以上説明したように第3実施形態によれば、R−D関係式に基づいて符号量を制御する際に、符号化歪みの指標値を符号化済みである近傍のピクチャの画質から決定することを特徴とする。これにより、各画像内の画質を考慮し、画像内における絵柄の平坦さ、複雑さの偏りに依存したSNR(Signal to Noise Ratio)の偏りを防ぐことができる。
<第4実施形態>
以下、本発明に係る第4実施形態について説明する。
図7は、第4実施形態の動画像符号化装置の構成例を示すブロック図である。同図において、上述した第1実施形態における図1と同様の構成には同一符号を付し、説明を省略する。
第4実施形態において第1実施形態と異なる構成は、図7に示す目標符号量算出部503、発生符号量算出部502、及び符号化歪み指標値算出部501、である。
ここで図8に、一般的な符号化ストリームの総発生量の遷移例を示す。同図において、点線TCBRは、所定のピクチャ単位での固定符号量における累積であり、理想的な符号量の累積を表している。また実線Tiは、実際に符号化装置によって発生した累積符号量の一例である。
第4実施形態では、符号化装置による総発生符号量(図8の実線Ti)が、固定レートによる理想的な総発生符号量(同、直線TCBR)に近づくように、ピクチャ毎に目標符号量を定め、更に、R−D特性を用いて画質と符号量を考慮した符号量制御を行う。
以下、第4実施形態における発生符号量算出部502と目標符号量算出部503の動作について説明する。
発生符号量算出部502では、符号化部101から入力された符号化ストリームPoから、現在の入力ピクチャの近傍に位置する符号化済みピクチャの符号長(発生符号量)を算出する。そして目標符号量算出部503では、発生符号量算出部502から入力された発生符号量に基づき、以下の式(3)に従って、入力ピクチャに対する仮の目標符号量R'を算出する。
R'=α×(RCBR−Ri-1)×Ri-1 ・・・(3)
なお、式(3)において、RCBRは予め定められたピクチャ単位の固定符号量、Ri-1は入力ピクチャの近傍の符号化済みであるピクチャの符号量、αは所定の係数である。
そして符号化歪み指標値算出部501においては、例えば上述した第1乃至第3実施形態のいずれかと同様に、すなわちR−D特性を用いて符号化歪み指標を調整する。なお、第4実施形態における符号化歪み指標は固定値として出力されても良い。
以上説明したように第4実施形態によれば、R−D関係式に基づいて符号量を制御する際に、符号化歪みの指標値を符号化済みである近傍のピクチャの発生符号量から仮の目標符号量を算出することを特徴とする。そして、上述した第1乃至第3実施形態のいずれかに記載した方法によって符号化歪み指標値を決定する。これにより、メモリの破綻を防ぎながら高画質な記録を行うことが可能となる。
<他の実施形態>
本発明は例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮影装置、webアプリケーション等)から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される。なお、この場合のプログラムとは、実施形態において図に示したフローチャートに対応したコンピュータ可読のプログラムである。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、以下に示す媒体がある。例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD-ROM、CD-R、CD-RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD-ROM,DVD-R)などである。
プログラムの供給方法としては、以下に示す方法も可能である。すなわち、クライアントコンピュータのブラウザからインターネットのホームページに接続し、そこから本発明のコンピュータプログラムそのもの(又は圧縮され自動インストール機能を含むファイル)をハードディスク等の記録媒体にダウンロードする。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD-ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせることも可能である。すなわち該ユーザは、その鍵情報を使用することによって暗号化されたプログラムを実行し、コンピュータにインストールさせることができる。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。さらに、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、実行されることによっても、前述した実施形態の機能が実現される。すなわち、該プログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことが可能である。
本発明に係る第1実施形態における符号化装置の構成を示すブロック図である。 R−D曲線に対する画質分類例を示す図である。 R−D曲線における符号化歪み予測値の近似例を示す図である。 第2実施形態における動画像符号化装置の構成を示すブロック図である。 第2実施形態における符号化歪み指標値の算出処理を示すフローチャートである。 第3実施形態における動画像符号化装置の構成を示すブロック図である。 第4実施形態における動画像動画像符号化装置の構成を示すブロック図である。 第4実施形態における総発生符号量の制御を説明する図である。 従来の動画像符号化装置の構成例を示すブロック図である。 符号化歪み予測値の算出方法を示す図である。 R−D曲線に対する画質分類例を示す図である。

Claims (12)

  1. 動画像を入力ピクチャ毎に符号化し、符号化ストリームを出力する動画像符号化装置であって、
    入力ピクチャに対する統計情報を算出する統計情報算出手段と、
    該統計情報に基づいて、符号量と符号化歪みの関係を表すR−D関係式を算出するR−D関係式算出手段と、
    前記入力ピクチャに対する仮の目標符号量R'と前記R−D関係式に基づいて、仮の符号化歪み予測値D'を出力する符号化歪み予測手段と、
    前記入力ピクチャに対する視覚感度に基づいて、符号化歪みの調整範囲の指標となる符号化歪み指標値を算出する符号化歪み指標値算出手段と、
    前記符号化歪み指標値に基づいて前記仮の符号化歪み予測値D'を修正し、符号化歪み予測値Dとして出力する符号化歪み予測修正手段と、
    前記符号化歪み予測値Dと前記R−D関係式に基づいて、前記入力ピクチャに対する目標符号量Rを出力する目標符号量算出手段と、
    前記目標符号量Rに基づいて符号化パラメータを算出する符号化パラメータ算出手段と、
    前記入力ピクチャを前記符号化パラメータに基づいて符号化し、符号化ストリームとして出力する符号化手段と、
    を有することを特徴とする動画像符号化装置。
  2. 前記統計情報は色相情報を含み、
    前記符号化歪み指標値算出手段は、前記入力ピクチャに対する前記色相情報に基づいて、前記符号化歪み指標値を算出することを特徴とする請求項1に記載の動画像符号化装置。
  3. さらに、動画像の撮影状況の情報を取得する撮影制御情報算出手段を有し、
    前記符号化歪み指標値算出手段は、前記撮影状況の情報に基づいて前記符号化歪み指標値を算出することを特徴とする請求項1に記載の動画像符号化装置。
  4. さらに、前記符号化ストリームを復号し、再構成ピクチャとして出力する局所復号手段と、
    前記入力ピクチャの近傍に位置する符号化済みピクチャと、該符号化済みピクチャに対応する再構成ピクチャから、該符号化済みピクチャにおいて実際に発生した符号化歪み値を検出する符号化歪み検出手段と、を有し、
    前記符号化歪み指標値算出手段は、前記符号化歪み値に基づいて前記符号化歪み指標値を算出することを特徴とする請求項1に記載の動画像符号化装置。
  5. 前記符号化歪み指標値算出手段は、複数の前記符号化歪み指標値を算出することを特徴とする請求項1乃至4のいずれか1項に記載の動画像符号化装置。
  6. 前記符号化歪み指標値は、符号化歪みに応じて画質を分割した際の境界値であることを特徴とする請求項5に記載の動画像符号化装置。
  7. 前記統計情報算出手段は、前記統計情報として前記入力ピクチャのアクティビティを算出することを特徴とする請求項1乃至6のいずれか1項に記載の動画像符号化装置。
  8. 前記仮の目標符号量R'は、フレームレートと動作周波数に基づいて予め設定された値であることを特徴とする請求項1乃至7のいずれか1項に記載の動画像符号化装置。
  9. さらに、前記符号化ストリームから、前記入力ピクチャの近傍に位置する符号化済みピクチャに対する発生符号量を算出する発生符号量算出手段と、
    前記発生符号量に基づいて前記入力ピクチャに対する前記仮の目標符号量R'を算出する目標符号量算出手段と、
    を有することを特徴とする請求項1乃至7のいずれか1項に記載の動画像符号化装置。
  10. 動画像を入力ピクチャ毎に符号化し、符号化ストリームを出力する動画像符号化装置の制御方法であって、
    入力ピクチャから統計情報を算出する統計情報算出ステップと、
    該統計情報に基づいて、符号量と符号化歪みの関係を表すR−D関係式を算出するR−D関係式算出ステップと、
    前記入力ピクチャに対する仮の目標符号量R'と前記R−D関係式に基づいて、仮の符号化歪み予測値D'を出力する符号化歪み予測ステップと、
    前記入力ピクチャに対する視覚感度に基づいて、符号化歪みの調整範囲の指標となる符号化歪み指標値を算出する符号化歪み指標値算出ステップと、
    前記符号化歪み指標値に基づいて前記仮の符号化歪み予測値D'を修正し、符号化歪み予測値Dとして出力する符号化歪み予測修正ステップと、
    前記符号化歪み予測値Dと前記R−D関係式に基づいて、前記入力ピクチャに対する目標符号量Rを出力する目標符号量算出ステップと、
    前記目標符号量Rに基づいて符号化パラメータを算出する符号化パラメータ算出ステップと、
    前記入力ピクチャを前記符号化パラメータに基づいて符号化し、符号化ストリームとして出力する符号化ステップと、
    を有することを特徴とする動画像符号化装置の制御方法。
  11. コンピュータを請求項1乃至9のいずれか1項に記載の動画像符号化装置として機能させるためのプログラム。
  12. 請求項11に記載のプログラムを記録したコンピュータ可読な記録媒体。
JP2008194074A 2008-07-28 2008-07-28 動画像符号化装置およびその制御方法 Withdrawn JP2010034801A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008194074A JP2010034801A (ja) 2008-07-28 2008-07-28 動画像符号化装置およびその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008194074A JP2010034801A (ja) 2008-07-28 2008-07-28 動画像符号化装置およびその制御方法

Publications (1)

Publication Number Publication Date
JP2010034801A true JP2010034801A (ja) 2010-02-12

Family

ID=41738796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008194074A Withdrawn JP2010034801A (ja) 2008-07-28 2008-07-28 動画像符号化装置およびその制御方法

Country Status (1)

Country Link
JP (1) JP2010034801A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015065517A (ja) * 2013-09-24 2015-04-09 日本電信電話株式会社 映像符号化パラメータ算出装置、映像符号化パラメータ算出方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015065517A (ja) * 2013-09-24 2015-04-09 日本電信電話株式会社 映像符号化パラメータ算出装置、映像符号化パラメータ算出方法及びプログラム

Similar Documents

Publication Publication Date Title
US7805016B2 (en) Decoding apparatus and decoding method
JP5470405B2 (ja) 画像符号化装置および方法
US9241159B2 (en) Encoding apparatus, method of controlling thereof, and computer program
US7983160B2 (en) Method and apparatus for transmitting a coded video signal
US7023914B2 (en) Video encoding apparatus and method
JP5318134B2 (ja) マルチパスのビデオ符号化
US8229004B2 (en) Image signal processing apparatus with code amount control for inter-frame and intra-frame encoding
JPH08251591A (ja) ブロック化現象除去のための後処理装置及びその方法
JP2000102008A (ja) ビットレ―ト制御方法
JP2006197557A (ja) 画像符号化装置、画像符号化方法及びそのプログラム
JP4908943B2 (ja) 画像符号化装置及び画像符号化方法
JP2007336468A (ja) 再符号化装置、再符号化方法およびプログラム
JP2000350211A (ja) 動画像符号化方法及び動画像符号化装置
JP2007028598A (ja) 圧縮符号化装置及び圧縮符号化方法
JP2010034801A (ja) 動画像符号化装置およびその制御方法
KR100390167B1 (ko) 화상 부호화방법 및 화상 부호화장치
JP3889552B2 (ja) 符号量割り当て装置および方法
JP2007081744A (ja) 動画像符号化装置及び動画像符号化方法
JP4510696B2 (ja) 画像処理装置及び画像処理方法
JP2007020216A (ja) 符号化装置、符号化方法、フィルタ処理装置およびフィルタ処理方法
JP4747109B2 (ja) 演算量調整装置
JP3934772B2 (ja) 可変転送レート符号化方法および装置
JP2007300557A (ja) 画像符号化装置及び画像符号化方法
JP3922581B2 (ja) 可変転送レート符号化方法および装置
JP2005039321A (ja) フリッカ低減量子化器、フリッカ低減量子化方法、及びそのプログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20111004