JP5206382B2 - 画像処理装置、画像処理方法およびプログラム - Google Patents

画像処理装置、画像処理方法およびプログラム Download PDF

Info

Publication number
JP5206382B2
JP5206382B2 JP2008314254A JP2008314254A JP5206382B2 JP 5206382 B2 JP5206382 B2 JP 5206382B2 JP 2008314254 A JP2008314254 A JP 2008314254A JP 2008314254 A JP2008314254 A JP 2008314254A JP 5206382 B2 JP5206382 B2 JP 5206382B2
Authority
JP
Japan
Prior art keywords
encoding
information
bit rate
output
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008314254A
Other languages
English (en)
Other versions
JP2010141479A (ja
Inventor
章敬 深田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008314254A priority Critical patent/JP5206382B2/ja
Publication of JP2010141479A publication Critical patent/JP2010141479A/ja
Application granted granted Critical
Publication of JP5206382B2 publication Critical patent/JP5206382B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、例えば、動画像データをエンコード可能な画像処理装置、画像処理方法およびプログラムに関するものである。
動画像データをエンコード(符号化)する画像処理装置が周知である(例えば、特許文献1〜3参照)。このような画像処理装置では、エンコードデータにヘッダ情報などの付加データが付加されて、最終的なエレメンタリストリーム(Elementary Stream)が生成される。以下、一般的な画像処理装置の概略について説明する。
図8および図9は、一般的な画像処理装置の構成例を示すブロック図である。
図8に図示する画像処理装置3のエンコーダIP装置31は、付加情報S31のサイズ(データ容量)を示すサイズ情報S32をフレームごとに取得する。そして、レートコントロール部312は、これを基に、VBVバッファが破綻しないように、ビットレートを制御する。このとき、出力バッファ固定情報S34によって、VBVバッファのバッファサイズ(VBAバッファサイズ)が最大となるように制御される。
その後、エンコーダ部311は、エンコード処理に使用される初期情報S35やレートコントロール部312の制御に基づいて、入力信号S33をエンコードする。付加情報追加装置313は、このエンコードデータに付加情報S31を付加する。これによって、エンコード処理が完了し、エレメンタリストリームS36が生成される。
図8に図示する画像処理装置3では、エンコーダIP装置31の内部にて、エンコードデータに付加情報S31が付加される。即ち、エンコーダIP装置は、付加情報S31を付加したエンコードデータを出力する。
これに対し、図9に図示する画像処理装置3aでは、付加情報S31の付加を行う付加情報追加装置313がエンコーダIP装置31の外部に配置されている。この装置では、エンコーダIP装置31の出力したエンコードデータS37には付加情報S31が付加されない。このため、エンコーダIP装置31によるエンコード処理後に、付加情報追加装置313がエンコードデータS37に付加情報S31を付加する。
WO2004/071085 特開2003−299091号公報 特開平11−205266号公報
図10は、図8および図9に図示する一般的な画像処理装置によるVBVバッファサイズと、出力バッファサイズとの関係を示す図である。
なお、破線aは、VBVバッファサイズを示す。破線bは、付加情報S31が付加されていないエンコードデータS37を示す。破線cは、付加情報S31が付加されたエレメンタリストリームS36を示す。
バッファモデルでは、VBVバッファが破綻しないように、出力バッファ(不図示)に入力されるビット量を制御する必要がある。図10に図示するように、1フレーム画像に対するエンコード処理は、期間Δtに行われる。このような装置3,3aでは、図10の破線b、cで示されるように、付加情報S31を含むエンコードデータと付加情報S31を含まないエンコードデータのビット量が等しくなる。
一般的な画像処理装置3、3aでは、出力バッファのサイズをエンコード処理ごとに把握することができない。このため、例えば、出力バッファ固定情報S34によって、出力バッファサイズがVBVバッファサイズを超えない最大のサイズを予め与える必要があり、出力バッファの使用効率が悪い。
本発明は、バッファモデルに準拠し、バッファの使用効率の向上を図ることができる画像処理装置、画像処理方法、およびプログラムを提供することにある。
本発明によれば、動画像データをエンコードするエンコード処理部と、前記エンコード処理部におけるエンコード処理データに、エンコードしない付加データを付加する付加部と、制御部とを有し、
前記エンコード処理部は、
動画像データをエンコードするエンコーダ部と
符号化レートコントロール部と
前記エンコーダ部でエンコードした結果を記憶する出力バッファと
を有し、
前記エンコーダ部は、前記符号化レートコントロール部から入力された、1フレームのエンコード時の量子化係数、ビットレートに関する情報を含むレート情報に基づいて、前記動画像データをフレーム単位でエンコードして前記出力バッファに格納し前記エンコードの結果を示す出力結果情報を前記符号化レートコントロール部および前記制御部に出力し、
前記符号化レートコントロール部は、前記エンコードの結果を示す出力結果情報と、前記制御部から出力される出力バッファ情報およびビットレート情報とに基づいて、1フレームのエンコード時の量子化係数、ビットレートに関する情報を含む前記レート情報を生成して前記エンコーダ部に出力し、
前記制御部は、
入力されたサイズ情報と、前記エンコード処理部から出力された前記エンコードの結果を示す出力結果情報とに基づいて、前記出力バッファを監視し、前記付加データが付加された前記エンコード処理部の出力データが仮想バッファサイズを越えないように、前記出力バッファ情報と、前記ビットレート情報とを生成して、前記エンコード処理部に出力する、
画像処理装置が提供される。
また本発明によれば、上記処理を行う画像処理方法が提供される。
さらに本発明によれば、上記処理をコンピュータに徐行させるプログラムが提供される。
好ましくは、前記制御部は、前記エンコード処理部が出力した前記出力バッファの状態に関するバッファ情報と、前記付加データの容量とに基づいて、前記出力バッファの容量が規定値以下となるように前記出力バッファへのエンコード結果の格納および出力を制御する。
また好ましくは、前記バッファ情報は、前記規定値を規定する仮想バッファの容量に関する情報を含み、前記制御部は、前記バッファ情報が含む前記仮想バッファの容量と、前記付加データの容量との差分に基づいて、前記エンコード処理部が前記動画像データをエンコードする際のビットレートを設定する。
また好ましくは、前記制御部は、前記エンコード処理部が初めのフレームに対してエンコードを行う場合には、エンコードフォーマットを含む初期設定情報を参照して前記設定すべきビットレートを設定し、前記エンコード処理部が以後のフレームに対してエンコードを行う場合には、前記出力バッファの容量とフレームレートとの積を算出し、当該算出結果に基づいて前記設定すべきビットレートを設定する。
好ましくは、前記制御部は、前記エンコード処理部が設定しているビットレートと、前記算出結果としての算出ビットレートとの大きさを比較し、前記ビットレートが前記算出ビットレート以下の場合には、設定すべきビットレートを当該ビットレートに設定し、前記ビットレートが前記算出ビットレート以上の場合には、設定すべきビットレートを当該算出ビットレートに設定する。
また好ましくは、前記エンコード処理部は、前記出力バッファの容量が上記規定値を超えた場合には、エンコード対象のフレームに対するエンコードを停止し、前記制御部は、前記エンコード処理部のエンコードが停止した旨の停止信号を取得した場合には、前記設定すべきビットレートを設定されているビットレートよりも下げる。
また好ましくは、前記制御部は、前記エンコード処理部による前記出力バッファから前記エンコード出力データの出力後、前記付加データの容量の変更を検知した場合には、当該付加データの容量の増減量を算出し、前記エンコード処理部が次のフレームに対するエンコードを行うときに、当該増減量に基づいて前記設定すべきビットレートを設定する。
本発明によれば、エンコード処理部は、動画像データをエンコードする。
このとき、制御部は、エンコード処理部が出力すべき出力データの容量を監視している。そして、制御部は、付加部が出力データに付加データを付加したときに、付加データを含む出力データの容量が規定値以下となるように、エンコード処理部の出力を制御する。
その後、付加部は、エンコード処理部の出力データに付加データを付加する。
本発明によれば、バッファモデルに準拠し、バッファの使用効率の向上を図ることができる。
以下、本発明の実施形態を図面に関連付けて説明する。なお、説明は以下の順序で行う。
1.実施形態
1.1.画像処理装置1の構成例
1.2.画像処理装置1の動作例
1.3.出力バッファサイズとVBVバッファサイズとの関係
1.4.画像処理装置1の例外処理
〈1.実施形態〉
[1.1.画像処理装置1の構成例]
図1は、本発明の実施形態に係る画像処理装置の構成例を示すブロック図である。
図1に図示する画像処理装置1は、エンコーダIP装置11、コントロール装置12、付加情報追加装置13および初期設定記憶装置14を有する。
エンコーダIP装置11は、エンコーダ部111、レートコントロール部112、VBVバッファ113および出力バッファ114を有する。
コントロール装置12は、ビットレート部121およびバッファ部122を有する。
なお、エンコーダIP装置11は、本発明のエンコード制御部に対応する。コントロール装置12は、本発明の制御部に対応する。付加情報追加装置13は、本発明の付加部に対応する。初期設定記憶装置14は、本発明の記憶部に対応する。
VBVバッファ113は、本発明の仮想バッファに対応する。出力バッファ114は、本発明のバッファに対応する。
画像処理装置1は、入力信号S0をエンコード(符号化または圧縮符号化)し、エレメンタリストリームS2をIP(Internet Protocol)ネットワーク上に出力可能なエンコード機能を有する。この入力信号S0は、エンコードの対象となる動画像データである。これは、複数のフレームで構成され、フレーム単位でエンコードされる。
具体的には、画像処理装置1は、ビットレートを制御することで、バッファモデルに準拠するように、出力バッファ114のバッファサイズ(バッファ容量)を制御する。以後、出力バッファ114のバッファサイズを単に「出力バッファサイズ」と表記する。
そして、画像処理装置1は、エンコーダIP装置11の出力データS1に付加情報(付加データ)S8を付加し、所望するエンコードフォーマットの規格に準拠したエレメンタリストリームS2を生成する。この付加情報S8は、例えば、ヘッダ情報やユーザデータに関する情報である。
画像処理装置1は、例えば、MPEG−2(Moving Picture Experts Group 2)や、MPEG−4等、種々の形式のエンコードフォーマットに対応している。エンコードフォーマットは、エンコード処理後のデータ容量や画質などの条件に合わせて好適に選択可能である。なお、前述のMPEG−2およびMPEG−4は、ITU−T(International Telecommunication Union Telecommunication Standardization Sector;国際電気通信連合電気通信標準化部門)等の機関によって、標準化されている。
エンコーダIP装置11は、入力信号S0を所望するエンコードフォーマットでエンコードし、これを出力データS1として出力する。
詳細には、エンコーダIP装置11は、初期設定記憶装置14から入力された初期情報S3と、コントロール装置12から入力された出力バッファ情報S4と、同装置12から入力されたビットレート情報S5とに基づいて、入力信号S0をフレーム単位でエンコードする。エンコーダIP装置11が行う処理をエンコード処理という。
この初期情報S3は、例えば、エンコードフォーマット、プロファイル、レベル、ビットレート、フレームレート、遅延量に関する情報によって構成されている。
プロファイルは、エレメンタリストリームS2をデコーダ(不図示)にて復号化するために必要なツール(要素技術)の集合を指す。これは、エンコードフォーマットの規格によって定められている。
レベルは、エンコードフォーマットの規格ごとに異なるが、画像の解像度に応じて、例えば、レベル1〜レベル5に分類されている。
エンコード処理の終了後、エンコーダIP装置11は、1フレームのエンコード処理済のデータを出力データS1として付加情報追加装置13に出力する。このとき、エンコーダIP装置11は、出力結果情報S6をコントロール装置12に出力する。
この出力結果情報S6は、エンコーダIP装置11から付加情報追加装置13への出力データS1の出力が成功したか否かを表す情報と、エンコーダIP装置11の出力バッファサイズに関する情報とによって構成される。
エンコーダ部111は、レートコントロール部112から入力されたレート情報S10と、初期情報S3とに基づいて、入力信号S0をエンコードする。エンコードの際には、所望するエンコードフォーマットに応じたエンコード処理が施される。エンコード処理後、エンコーダ部111は、エンコード処理の結果を出力結果情報S9としてレートコントロール部112に出力する。この出力結果情報S9は、出力結果情報S6と同様のものである。
レートコントロール部112は、ビットレートを制御することによって出力バッファサイズを制御する。このとき、レートコントロール部112は、出力結果情報S9と、出力バッファ情報S4と、ビットレート情報S5とに基づいて、レート情報S10を生成し、これをエンコーダ部111に出力する。
このレート情報S10は、1フレームのエンコード時の量子化係数、ビットレートに関する情報である。
VBVバッファ113は、デコーダ側(不図示)がエレメンタリストリームS2を受信する時に、デコーダ側のバッファ状態を制御するために設けられている仮想的なバッファである。そのバッファサイズは、バッファモデルで定められ、プロファイルとレベルとによって設定される。以後、VBVバッファ113のバッファサイズを単に「VBVバッファサイズ」と表記する。
このVBVバッファ113が破綻した場合には、デコーダ側でのデコード(復号化)処理が正常に行われない場合がある。したがって、VBVバッファサイズを、オーバーフローやアンダーフローといった、破綻が生じないように制御する必要がある。
そこで、付加情報S8が付加された出力データS1がVBVバッファサイズを超えないように、このバッファに入力されるビット量、即ちビットレートがレートコントロール部112によって制御される。
出力バッファ114は、エンコード処理後の出力データS1を付加情報追加装置13に出力する前に、格納するためのバッファである。
コントロール装置12は、サイズ情報S7と、初期設定記憶装置14から読み出した初期情報S3と、エンコーダIP装置11から入力された出力結果情報S6とに基づいて、エンコーダIP装置11を制御する。
エンコーダIP装置11の出力データS1には、付加情報S8が付加情報追加装置13によって付加される。コントロール装置12は、出力バッファ114を監視し、この付加情報S8を含む出力データS1がVBVバッファサイズを超えないように、出力バッファサイズを算出し、ビットレートを制御することで、VBVバッファサイズを制御する。このとき、コントロール装置12は、出力バッファ情報S4と、ビットレート情報S5とを生成し、これらをエンコーダIP装置11に出力する。
出力バッファ情報S4は、1フレームのエンコード時の出力バッファサイズに関する情報である。ビットレート情報S5は、1フレームのエンコード時のビットレートに関する情報である。
コントロール装置12の詳細について説明する。
ビットレート部121は、バッファ部122から入力された出力バッファ情報S11に基づいて、エンコーダIP装置11によるエンコード処理時のビットレートを制御する。なお、出力バッファ情報S11は、出力バッファ情報S4と同様のものである。
バッファ部122は、出力結果情報S6に基づいて、出力バッファサイズを算出し、この算出結果を出力バッファ情報S11としてビットレート部121に出力する。
付加情報追加装置13は、予め、サイズ情報S7を取得し、付加すべき付加情報S8のサイズ(データ容量)を取得しておく。サイズ情報S7は、付加情報S8のサイズを示すものである。
その後、付加情報追加装置13は、エンコーダIP装置11が出力した1フレームのエンコード結果としての出力データS1に、付加情報S8を付加する。そして、付加情報追加装置13は、付加情報S8が付加された出力データS1をエレメンタリストリームS2として出力する。
初期設定記憶装置14は、初期情報S3を記憶する。この初期情報S3は、エンコーダIP装置11と、コントロール装置12とによって、適宜読み出される。
[1.2.画像処理装置1の動作例]
上記画像処理装置1の動作例について説明する。
図2は、本発明の実施形態に係る画像処理装置の動作例を示すシーケンス図である。
図3は、本発明の実施形態に係るコントロール装置の詳細な動作例を示すフローチャートである。
画像処理装置1は、(1)初めてエレメンタリストリームS2を生成する場合と(N=0枚目のフレーム)、(2)N=K枚目のフレームに対してエレメンタリストリームS2を生成する場合とで、その処理が異なる。初めに、(1)N=0枚目のフレームの場合について説明し、次に、(2)N=K枚目のフレームの場合について説明する。
[(1)N=0枚目のフレームに対するエレメンタリストリームS2の生成]
図2に図示するように、付加情報追加装置13は、入力信号S0、即ち、N=0枚目のフレームがエンコーダIP装置11に入力されたタイミングで、このフレームのサイズ情報S7と、付加情報S8とを取得する(ステップST1)。
その後、コントロール装置12は、以下に述べる情報生成処理を行う(ステップST2)。
詳細には、図3に図示するように、コントロール装置12は、N=0枚目のフレームに対するサイズ情報S7が入力されると、初期設定記憶装置14から初期情報S3を読み出す。そして、コントロール装置12のバッファ部122は、次式を用いて、このフレームに対する出力バッファサイズを算出する(ステップST21)。
(数1)
BUF=VBV−HS …(式1)
(式1)において、BUFは出力バッファサイズを示し、VBVはVBVバッファサイズを示し、HSは付加情報サイズを示す。
コントロール装置12のバッファ部122は、(式1)に示すように、VBVバッファサイズVBVからサイズ情報S7に示される付加情報サイズHSを減算することで、現段階での出力バッファサイズBUFを算出する。そして、バッファ部122は、この算出結果を出力バッファ情報S11としてビットレート部121に出力する。
その後、ビットレート部121は、バッファ部122から出力バッファ情報S11を受けて、出力バッファサイズを取得する。そして、ビットレート部121は、次式に基づいて、設定すべきビットレートを設定する(ステップST22)。
(数2)
BR=TBR …(式2)
(式2)において、BRはビットレートを示し、TBRはターゲットビットレートを示す。(式2)の右辺に示すターゲットビットレートTBRは、レートコントロール部112が設定している前のフレームに対するエンコード処理時のビットレートである。
初めてエレメンタリストリームS2を生成する場合には、ビットレート部121は、設定すべきビットレートをターゲットビットレートTBRに設定する。ただし、N=0枚目のフレームに対するエンコード処理においては、前のフレームに対するビットレートが設定されていないため、レートコントロール部112は、初期情報S3に基づいてビットレートを設定している。
その後、コントロール装置12は、出力バッファ情報S11を出力バッファ情報S4とし、ビットレート部121によって算出されたビットレートをビットレート情報S5として、これらをエンコーダIP装置11に出力する(ステップST23)。
その後、エンコーダIP装置11は、初期設定記憶装置14から初期情報S3を読み出す。図2に図示するように、エンコーダIP装置11は、コントロール装置12から出力バッファ情報S4と、ビットレート情報S5とが入力されると、入力信号S0、即ち、N=0枚目のフレームに対してエンコード処理を行う(ステップST3)。
詳細には、レートコントロール部112は、ビットレートを制御するため、出力結果情報S9と、出力バッファ情報S4と、ビットレート情報S5とに基づいて、レート情報S10を生成し、これをエンコーダ部111に出力する。
そして、エンコーダ部111は、レートコントロール部112から入力されたレート情報S10と、初期情報S3とに基づいて、1フレームの入力信号S0をエンコードする。エンコード処理後、エンコーダ部111は、1フレームのエンコードデータを出力データS1として付加情報追加装置13に出力する。
これと同時に、エンコーダ部111は、エンコード結果としての出力結果情報S6をコントロール装置12に出力し、かつ、これと同様の出力結果情報S9をレートコントロール部112に出力する。
その後、付加情報追加装置13は、エンコーダIP装置11から入力された1フレームのエンコード結果としての出力データS1に、付加情報S8を付加する。そして、付加情報追加装置13は、付加情報S8が付加された出力データS1をエレメンタリストリームS2として出力する。
[(2)k枚目のフレームに対するエレメンタリストリームS2の生成]
以後、画像処理装置1は、N=1,2,…枚目のフレームに対しても順次エンコード処理を行って、エレメンタリストリームS2を生成する。
ただし、N=k枚目のフレームでは、N=(K−1)枚目までのデータが出力バッファ114に保存されているので、出力バッファサイズとビットレートの算出方法とが、前述のものと異なる。以下、(1)N=0枚目のフレームの場合と異なる点について説明する。
具体的には、ステップST21において、コントロール装置12のバッファ部122は、次式を用いて、N=k枚目のフレームに対する出力バッファサイズを算出する。
(数3)
BUR=VBV−SB−HS …(式3)
(式3)において、SBは、前回(k−1)の情報生成処理までの出力バッファ114の保存量を示し、これは次式によって算出される。
Figure 0005206382
なお、(式4)において、Dylayは、エンコード処理の遅延量を示し、FRはフレームレートを示す。B(n)は、n枚目のフレームに対するビットレートを示す。S(n)は、n枚目のフレームに対するエレメンタリストリームS2の出力サイズを示す。
コントロール装置12のバッファ部122は、(式3)に示すように、VBVバッファサイズVBVから、前回(k−1)の情報生成処理までの出力バッファ114の保存量SBと、付加情報サイズHSとを減算する。これにより、現段階での出力バッファサイズBURが算出される。
次のステップST22において、ビットレート部121は、次式に基づいて、設定すべきビットレートを算出する。
(数5)
BR=BUR×FR …(式5)
N=k枚目のフレームでは、ビットレート部121は、出力バッファサイズBURとフレームレートFRとの積により、(式5)に示すビットレートBRを算出する。このビットレートを算出ビットレートBRと呼ぶ。更に、現在レートコントロール部112が設定しているビットレートを現在のビットレートBRαと呼ぶ。
ビットレート部121は、現在のビットレートBRαと、算出ビットレートBRとを比較する。
現在のビットレートBRαが算出ビットレートBRよりも小さい場合には(BRα≦BR)、ビットレート部121は、設定すべきビットレートを現在のビットレートBRαに設定する。
逆に、現在のビットレートBRαが算出ビットレートBRよりも大きい場合には(BRα>BR)、ビットレート部121は、設定すべきビットレートを算出ビットレートBRに設定する。
[1.3.出力バッファサイズとVBVバッファサイズとの関係]
以上説明した画像処理装置1によれば、出力バッファサイズとVBVバッファサイズとの関係は、以下のように示される。
図4は、本発明の実施形態に係る出力バッファサイズとVBVバッファサイズとの関係を示す図である。
なお、図4の縦軸は出力バッファサイズを示し、横軸は時間を示す。破線aは、VBVバッファサイズを示す。実線bは、エンコーダIP装置11による出力データS1を示す。破線cは、付加情報追加装置13によるエレメンタリストリームS2を示す。
図4の破線aに図示するように、VBVバッファサイズは、バッファモデルにより一定に定められている。1フレームのエンコード処理は、図4に示すΔtの期間に行われる。1フレームに対するエンコード処理が開始すると、出力バッファ114に格納されるビット量の増加に伴い、出力バッファサイズが線形に増加する。
エンコーダIP装置11は、図4の実線bに図示するように、エンコードデータとしての出力データS1を付加情報追加装置13に出力する。そして、付加情報追加装置13は、この出力データS1に付加情報S8を付加する。その結果、エレメンタリストリームS2は、図4の破線cに図示するものとなる。
エンコード処理の際に、コントロール装置12は、出力データS1に付加情報S8が付加されたとき、エレメンタリストリームS2がVBVバッファサイズを超えないように、実線bおよび破線cの傾きで示されるビットレートを制御する。
このため、VBVバッファ113が破綻することなく、エンコードフォーマットの規格に準拠した付加情報を含むエレメンタリストリームを生成することができる。
[1.4.画像処理装置1の例外処理]
ところで、エンコーダIP装置11は、N=K枚目のフレームに対するエンコード処理に失敗する場合がある。以下、このような場合における画像処理装置1の例外処理について説明する。
図5は、本発明の実施形態に係るエンコード処理が失敗した場合のコントロール装置の動作例について説明するための図である。図5の破線dは、エンコーダIP装置11によるエンコード処理が失敗した場合の出力データS1を示す。図5に図示する他の符号やパラメータは、図4と同様のものである。
期間Δtにおいて、エンコーダIP装置11がエンコード処理に失敗し、図5の破線dに図示するように、出力データS1の容量が他の期間のものよりも大きくなる場合がある。この場合、出力データS1に付加情報S8が付加されると、出力バッファサイズがVBVバッファサイズを超える恐れがある。
この場合には、エンコーダIP装置11は、このフレームに対するエンコード処理を停止(スキップ)する。そして、エンコーダIP装置11は、エンコードに失敗した旨の出力結果情報(停止信号)S6をコントロール装置12に出力する。
コントロール装置12が、出力結果情報S6を受けると、ビットレート部121は、図5cに図示するように、(式2)または(式5)に基づいて算出したビットレートよりも低いビットレートを設定する。期間Δt以後、N=(K+1)枚目のフレームに対するエンコード処理が再開される。
このように、コントロール装置12がエンコーダIP装置11を制御するため、図5の破線cに図示するように、最終的なエンコードデータがVBVバッファサイズを超えることなく、バッファモデルに準拠したエンコード処理を行うことができる。
N=K枚目のフレームに対するエンコード処理の際に、エンコーダIP装置11が出力データS1を付加情報追加装置13に出力した後、サイズ情報S7および付加情報S8が変更される場合がある。
この場合には、コントロール装置12は、サイズ情報S7に基づいて付加情報S8の増減量を算出する。この増減量は、次式によって算出される。
(数6)
HS(K+1)=HS(K)+ΔHS(K) …(式6)
(式6)において、HS(K+1)は、(K+1)枚目のフレームにおける付加情報サイズを示す。HS(K)は、K枚目のフレームにおける付加情報サイズを示す。ΔHS(K)は、K枚目のフレームにおける付加情報の増減分を示す。
(式6)に示すように、コントロール装置12は、付加情報サイズHS(K)に付加情報の増減分ΔHSを加算することによって、(K+1)枚目のフレームにおける付加情報サイズをHS(K+1)を算出する。
その後、コントロール装置12のビットレート部121は、(K+1)枚目のフレームのエンコード処理時に、(式6)によって算出された増減量分を考慮して、(式3)および(式5)からビットレートを算出する。具体的には、(式6)に示すHS(K+1)を(式3)に示す付加情報サイズHSに代入すればよい。コントロール装置12は、この算出結果を基にエンコーダIP装置11を制御する。
以下、本発明の実施形態に係る画像処理装置1と一般的な画像処理装置とを対比させることにより、本発明の実施形態に係る画像処理装置1の効果について説明する。
図6は、一般的な画像処理装置の構成例を示すブロック図である。
図7は、図6の画像処理装置における出力バッファサイズとVBVバッファサイズとの関係を示す図である。
図6に示す一般的な画像処理装置2は、エンコーダIP装置11、付加情報追加装置13および初期設定記憶装置14を有する。符号が図1に図示するものと同一の装置は、画像処理装置1の装置と同様の機能を有する。
ただし、図6に図示するように、画像処理装置2には、本発明の実施形態の特徴であるコントロール装置12が搭載されていない。
このため、画像処理装置2では、出力バッファサイズを監視することができず、あらかじめ出力バッファサイズを固定しておく必要がある。出力バッファサイズは、例えば、エンコーダIP装置11に入力される出力バッファ固定情報S12によって、最大のサイズに固定される。
その結果、1フレームのエンコード処理ごとに、ビットレートを制御することができず、図7の破線cに図示するように、最終的なエンコードデータが、破線aで示されるVBVバッファサイズを超える場合がある。この場合には、VBVバッファ113が破綻し、バッファモデルに準拠したエレメンタリストリームを生成することができない。
これに加え、エンコード処理が失敗した場合や、エンコード処理後にサイズ情報S7および付加情報S8が変更されるという事態が発生した場合には、状況に応じて出力バッファサイズを制御することができず、このような事態に対応することができない。
これに対し、コントロール装置12を搭載した画像処理装置1では、コントロール装置12が出力バッファサイズを監視し、ビットレートを制御するため、バッファモデルに準拠したエレメンタリストリームを生成することができる。
これに加え、コントロール装置12がビットレートを制御するため、出力バッファサイズを固定する必要がなく、そのサイズを最小限にすることができる。
上述した事態に対しては、例外処理を行うことにより、VBVバッファ113を破綻させることなく、エレメンタリストリームを生成することができる。
以上、実施形態によれば、付加情報追加装置13によって、エンコードフォーマットの規格に準拠した付加情報を含むエレメンタリストリームを生成することができる。
付加情報は、エンコード処理後に付加されるため、エンコーダIP装置11を好適に構成することが可能である。このため、エンコーダIP装置11の構成に左右されず、種々の構成のデコーダにてエレメンタリストリームをデコードすることができる。
以上詳細に説明した方法は、上記手順に応じたプログラムとして形成し、CPU等を有するコンピュータで実行するように構成することも可能である。このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし、上記プログラムを実行するように構成可能である。
実施形態に係る画像処理装置は、エンコード機能に加え、エレメンタリストリームS2をデコードするためのデコード機能を搭載することができる。実施形態に係る画像処理装置が有する機能は、ソフトウェアによって処理されるが、その一部あるいはその全てをハードウェアによって処理することもできる。
本発明に係る画像処理装置および画像処理方法は、例えば、ビデオカメラ、監視カメラ、テレビジョン、パーソナルコンピュータ、種々の映像記録再生機器等、動画像データを扱う種々の電子機器に適用することができる。
図1は、本発明の実施形態に係る画像処理装置の構成例を示すブロック図である。 図2は、本発明の実施形態に係る画像処理装置の動作例を示すシーケンス図である。 図3は、本発明の実施形態に係るコントロール装置の詳細な動作例を示すフローチャートである。 図4は、本発明の実施形態に係る出力バッファサイズとVBVバッファサイズとの関係を示す図である。 図5は、本発明の実施形態に係るエンコード処理が失敗した場合のコントロール装置の動作例について説明するための図である。 図6は、一般的な画像処理装置の構成例を示すブロック図である。 図7は、図6の画像処理装置における出力バッファサイズとVBVバッファサイズとの関係を示す図である。 図8は、一般的な画像処理装置の構成例を示すブロック図である。 図9は、一般的な画像処理装置の構成例を示すブロック図である。 図10は、図8および図9に図示する一般的な画像処理装置によるVBVバッファサイズと、出力バッファサイズとの関係を示す図である。
符号の説明
1…画像処理装置、11…エンコーダIP装置、12…コントロール装置、13…付加情報追加装置、14…初期設定記憶装置、111…エンコーダ部、112…レートコントロール部、113…VBVバッファ、114…出力バッファ、121…ビットレート部、122…バッファ部

Claims (9)

  1. 動画像データをエンコードするエンコード処理部と、
    前記エンコード処理部におけるエンコード処理データに、エンコードしない付加データを付加する付加部と、
    制御部と
    を有し、
    前記エンコード処理部は、
    動画像データをエンコードするエンコーダ部と
    符号化レートコントロール部と
    前記エンコーダ部でエンコードした結果を記憶する出力バッファと
    を有し、
    前記エンコーダ部は、前記符号化レートコントロール部から入力された、1フレームのエンコード時の量子化係数、ビットレートに関する情報を含むレート情報に基づいて、前記動画像データをフレーム単位でエンコードして前記出力バッファに格納し前記エンコードの結果を示す出力結果情報を前記符号化レートコントロール部および前記制御部に出力し、
    前記符号化レートコントロール部は、前記エンコードの結果を示す出力結果情報と、前記制御部から出力される出力バッファ情報およびビットレート情報とに基づいて、1フレームのエンコード時の量子化係数、ビットレートに関する情報を含む前記レート情報を生成して前記エンコーダ部に出力し、
    前記制御部は、
    入力されたサイズ情報と、前記エンコード処理部から出力された前記エンコードの結果を示す出力結果情報とに基づいて、前記出力バッファを監視し、前記付加データが付加された前記エンコード処理部の出力データが仮想バッファサイズを越えないように、前記出力バッファ情報と、前記ビットレート情報とを生成して、前記エンコード処理部に出力する、
    画像処理装置。
  2. 前記制御部は、
    前記エンコード処理部が出力した前記出力バッファの状態に関するバッファ情報と、前記付加データの容量とに基づいて、前記出力バッファの容量が規定値以下となるように前記出力バッファへのエンコード結果の格納および出力を制御する
    請求項1記載の画像処理装置。
  3. 前記バッファ情報は、
    前記規定値を規定する仮想バッファの容量に関する情報を含み、
    前記制御部は、
    前記バッファ情報が含む前記仮想バッファの容量と、前記付加データの容量との差分に基づいて、前記エンコード処理部が前記動画像データをエンコードする際のビットレートを設定する
    請求項2記載の画像処理装置。
  4. 前記制御部は、
    前記エンコード処理部が初めのフレームに対してエンコードを行う場合には、エンコードフォーマットを含む初期設定情報を参照して前記設定すべきビットレートを設定し、 前記エンコード処理部が以後のフレームに対してエンコードを行う場合には、前記出力バッファの容量とフレームレートとの積を算出し、当該算出結果に基づいて前記設定すべきビットレートを設定する、
    請求項3記載の画像処理装置。
  5. 前記制御部は、
    前記エンコード処理部が設定しているビットレートと、前記算出結果としての算出ビットレートとの大きさを比較し、
    前記ビットレートが前記算出ビットレート以下の場合には、設定すべきビットレートを当該ビットレートに設定し、
    前記ビットレートが前記算出ビットレート以上の場合には、設定すべきビットレートを当該算出ビットレートに設定する、
    請求項4記載の画像処理装置。
  6. 前記エンコード処理部は
    前記出力バッファの容量が上記規定値を超えた場合には、エンコード対象のフレームに対するエンコードを停止し、
    前記制御部は、
    前記エンコード処理部のエンコードが停止した旨の停止信号を取得した場合には、前記設定すべきビットレートを設定されているビットレートよりも下げる、
    請求項5記載の画像処理装置。
  7. 前記制御部は、
    前記エンコード処理部による前記出力バッファから前記エンコード出力データの出力後、前記付加データの容量の変更を検知した場合には、当該付加データの容量の増減量を算出し、前記エンコード処理部が次のフレームに対するエンコードを行うときに、当該増減量に基づいて前記設定すべきビットレートを設定する
    請求項6記載の画像処理装置。
  8. 動画像データをエンコードするエンコード処理ステップと、
    前記エンコード処理ステップにおけるエンコード処理データに、エンコードしない付加データを付加する付加ステップと、
    制御ステップと
    を有し、
    前記エンコード処理ステップは、
    エンコーダ・ステップと、符号化レートコントロール・ステップとを有し、
    前記エンコーダ・ステップは、前記符号化レートコントロール・ステップにおいて生成される1フレームのエンコード時の量子化係数、ビットレートに関する情報を含むレート情報に基づいて、前記動画像データをフレーム単位でエンコードして、出力バッファに格納し、前記エンコードの結果を示す出力結果情報を前記符号化レートコントロール・ステップおよび前記制御ステップにおいて活用可能とし、
    前記符号化レートコントロール・ステップは、前記エンコードの結果を示す出力結果情報と、前記制御ステップにおいて生成される出力バッファ情報およびビットレート情報とに基づいて、1フレームのエンコード時の量子化係数、ビットレートに関する情報を含む前記レート情報を生成して前記エンコーダ・ステップにおいて活用可能とし、
    前記制御ステップは、
    入力されたサイズ情報と、前記エンコード・ステップにおいて生成された前記エンコードの結果を示す出力結果情報とに基づいて、前記出力バッファを監視し、前記付加データが付加された前記エンコード処理部の出力データが仮想バッファサイズを越えないように、前記出力バッファ情報と、前記ビットレート情報とを生成して、前記エンコード・ステップにおいて活用可能とする、
    画像処理方法。
  9. コンピュータに下記の処理を実行させるプログラムであって、
    動画像データをエンコードするエンコード処理と、
    前記エンコード処理におけるエンコード処理データに、エンコードしない付加データを付加する付加処理と、
    制御処理と、
    を有し、
    前記エンコード処理は、
    エンコーダ処理と、符号化レートコントロール処理とを有し、
    前記エンコーダ処理は、前記符号化レートコントロール処理において生成される1フレームのエンコード時の量子化係数、ビットレートに関する情報を含むレート情報に基づいて、前記動画像データをフレーム単位でエンコードして、出力バッファに格納し、前記エンコードの結果を示す出力結果情報を前記符号化レートコントロール処理および前記制御処理において活用可能とし、
    前記符号化レートコントロール処理は、前記エンコードの結果を示す出力結果情報と、前記制御処理において生成される出力バッファ情報およびビットレート情報とに基づいて、1フレームのエンコード時の量子化係数、ビットレートに関する情報を含む前記レート情報を生成して前記エンコーダ処理において活用可能とし、
    前記制御処理は、
    入力されたサイズ情報と、前記エンコード処理において生成された前記エンコードの結果を示す出力結果情報とに基づいて、前記出力バッファを監視し、前記付加データが付加された前記エンコード処理の出力データが仮想バッファサイズを越えないように、前記出力バッファ情報と、前記ビットレート情報とを生成して、前記エンコード処理において活用可能とする、
    プログラム。
JP2008314254A 2008-12-10 2008-12-10 画像処理装置、画像処理方法およびプログラム Expired - Fee Related JP5206382B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008314254A JP5206382B2 (ja) 2008-12-10 2008-12-10 画像処理装置、画像処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008314254A JP5206382B2 (ja) 2008-12-10 2008-12-10 画像処理装置、画像処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2010141479A JP2010141479A (ja) 2010-06-24
JP5206382B2 true JP5206382B2 (ja) 2013-06-12

Family

ID=42351232

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008314254A Expired - Fee Related JP5206382B2 (ja) 2008-12-10 2008-12-10 画像処理装置、画像処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5206382B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3078023B1 (en) * 2013-12-02 2019-12-25 Dolby International AB Method for bitrate signaling and bitstream format enabling such method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3322671B2 (ja) * 1994-11-30 2002-09-09 三洋電機株式会社 Mpegビデオデコーダ
JP3934712B2 (ja) * 1996-09-27 2007-06-20 日本ビクター株式会社 映像信号符号化方法及び装置
JPH10190745A (ja) * 1996-11-07 1998-07-21 Sony Corp 符号化信号伝送方法及び装置
GB2356508B (en) * 1999-11-16 2004-03-17 Sony Uk Ltd Data processor and data processing method

Also Published As

Publication number Publication date
JP2010141479A (ja) 2010-06-24

Similar Documents

Publication Publication Date Title
TWI516128B (zh) 量化控制方法及裝置,其程式以及記錄有該程式之記錄媒體
US8675728B2 (en) Transmitting apparatus and method, and receiving apparatus and method
JP4358215B2 (ja) 動画像符号化装置及びその方法
JP2002232882A (ja) 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。
US7903734B2 (en) Moving image decoding apparatus, moving image decoding method, image decoding method, and image decoding apparatus
JP2011082637A (ja) 期限時刻までにデータの送信を完了するデータ送信装置、プログラム及び方法
JP4577357B2 (ja) 符号化装置及び方法、並びにプログラム
JP4795223B2 (ja) 画像処理装置
JP2008252262A (ja) 符号化装置及び動画像の変化点検出方法
JP2004166128A (ja) 画像情報の符号化方法、符号化装置及び符号化プログラム
JP5206382B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP5879555B2 (ja) 動画像符号化装置
JP5050159B2 (ja) エンコーダ
JP2005045736A (ja) 画像信号符号化方法及び装置、符号化制御装置並びにプログラム
US20040131122A1 (en) Encoding device and encoding method
JP5641755B2 (ja) 符号化装置、符号化装置の制御方法、プログラム
JP4793150B2 (ja) ビデオ信号処理装置およびビデオ信号情報処理方法、並びにプログラム
US9794598B2 (en) Image processing apparatus for recognizing that a moving image is not properly coded
JP3307367B2 (ja) 可変転送レート符号化装置
JP4273385B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
JP4747109B2 (ja) 演算量調整装置
JP5355234B2 (ja) 符号化装置及び符号化方法
JPH1155671A (ja) 画像圧縮符号化装置
JP4273386B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
JP2005064773A (ja) 画像圧縮システム及び画像圧縮方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120717

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees