JP5017223B2 - 映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法 - Google Patents

映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法 Download PDF

Info

Publication number
JP5017223B2
JP5017223B2 JP2008241764A JP2008241764A JP5017223B2 JP 5017223 B2 JP5017223 B2 JP 5017223B2 JP 2008241764 A JP2008241764 A JP 2008241764A JP 2008241764 A JP2008241764 A JP 2008241764A JP 5017223 B2 JP5017223 B2 JP 5017223B2
Authority
JP
Japan
Prior art keywords
frame
video
decoding
frames
playback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008241764A
Other languages
English (en)
Other versions
JP2010074677A (ja
Inventor
健二 君山
智昭 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008241764A priority Critical patent/JP5017223B2/ja
Publication of JP2010074677A publication Critical patent/JP2010074677A/ja
Application granted granted Critical
Publication of JP5017223B2 publication Critical patent/JP5017223B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

この発明は、圧縮符号化方式を用いた映像処理装置に係り、特に映像の倍速再生技術に関する。
本来、H.264/AVC(非特許文献1参照)等の圧縮符号化方式による映像記録再生装置では、映像コンテンツを符号化し記録するとき、再生時に順序通りに全てのフレームを復号することを前提としている。そのため、早送り再生で数フレームおきに飛ばしながら表示する場合でも、全フレームの復号が必要である。例えば、3倍速表示の場合には、3倍速で復号して1つのフレームを表示し、残り2フレームは表示しないような動作となる。
表示しないフレームまでも復号しなければならない理由は、符号化アルゴリズムにおいて、フレーム間の差分を用いて情報量削減を行っているためである。すなわち、1つのフレームを正しく復号するためには、差分計算をした参照フレームが必要となり、参照フレームを生成するために全てのフレームを順序通りに復号しなければならない。
そこで、従来の映像記録再生装置では、早送り再生時に、全てのフレームを復号せずに、数フレームおきに存在するIフレームのみを復号表示することで、処理負荷の低減を図ってきた。Iフレームの復号では、参照フレームを必要とせずに単独で復号できるからである。
Iフレームの位置は、ランダムアクセスポイントと呼ばれて、復号の開始点となる。表示はランダムアクセスポイントの数フレーム先であっても、ランダムアクセスポイントから復号を始めて、表示開始位置まで、順序通りに全ての復号を行う必要がある。
以上の理由で、従来の装置では、N倍速再生時には処理負荷がN倍となってしまい、負荷低減のためIフレームのみ再生させるようにするとコマ落ちになってしまう。さらに、再生開始がランダムアクセスポイントから離れている時に、表示までにタイムラグが生じて問題となっている。同様なことが、ランダム再生でも生じている。
尚、従来の倍速再生処理方法として、特許文献1には、倍速再生における倍速度の指定の下にフレーム間予測符号化による圧縮処理を行う場合に、倍速再生する際に再生の対象となるフレーム画像だけを、動き予測するための参照画像として用いることで、圧縮された動画像データを倍速再生する際に、実際には再生されないフレーム画像を参照画像として無駄に伸張しなくても済むようした画像処理装置の構成が開示されている。
その他、特許文献2には、参照フレームに近傍の復号フレームを代替として使う方法が開示されている。また、特許文献3には、符号化時に可変速再生で復号が必要なフレーム情報を作成する方法が開示されている。また、特許文献4には、ランダムアクセスポイントの参照フレームを制限する方法が開示されている。また、特許文献5には、次のアクセスポイントを復号するのに必要なフレームに属性情報を付加する方法が開示されている。
大久保監修:改訂版H.264/AVC教科書、インプレス標準教科書シリーズ2006 特開2007−049651公報 特開2006−333249公報 特開2004−242286公報 特開2007−215217公報 特開2007−116729公報
上記したように既存の技術では、倍速再生時またはランダム再生時において、負荷低減のためIフレームのみ再生させるようにすると、コマ落ちになっていた。さらに、再生開始がランダムアクセスポイントから離れている時には、表示までにタイムラグが生じるという問題もあった。
この発明は上記事情によりなされたもので、その目的は、倍速再生時またはランダム再生時に必要なフレームのみを負荷をかけずに復号することができ、再生開始のレスポンス速度を向上させることのできる映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法を提供することにある。
上記目的を達成するためにこの発明の一態様によれば、映像入力から参照フレームとの残差信号を生成して符号化出力するもので、前記参照フレームとして、基本フレームまたは直前復号フレームからイントラ/インターモードによって選択的に生成される差分フレームが配列されるようにし、復号再生時に倍速再生またはランダム再生を行う場合に、前記圧縮符号化に際して前記倍速再生またはランダム再生の順序から予め表示フレームを決定し、当該表示フレーム復号時の参照フレームの状態から必要な被参照フレームの履歴を求め、前記表示フレームと前記被参照フレームとを合計した復号フレーム数が少なくなるように、前記符号化出力のフレーム構成と被参照フレームの選択を行う。
上記構成では、映像の符号化時に、早送り再生やランダム再生時に全てのフレームをデコードしなくてもよいように、フレーム構成と、参照メモリに格納するフレーム(被参照フレーム)の選択を行う手段を講じて、倍速再生時やランダム再生時に必要なフレームのみ復号するようにし、これによって処理負荷の低減と再生開始のレスポンス速度向上を図るようにしている。
この発明によれば、倍速再生時またはランダム再生時に必要なフレームのみを負荷をかけずに復号することができ、再生開始のレスポンス速度を向上させることのできる映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法を提供することを提供することができる。
以下、図面を参照して本発明の実施の形態について詳細に説明する。
図1は、本発明が適用される映像圧縮符号化装置(エンコーダ)の一実施形態の構成を示すブロック図である。図1において、映像入力は、減算器11によって予測画像生成器12で生成される予測画像が減算される。このようにして生成された残差信号は、DCT変換量子化器13でDCT(Discrete Cosine Transform)変換された後に量子化され、続いてエントロピー符号化器14で可変長符号化されて、H.264データとして出力される。
一方、上記DCT変換量子化器13の出力は逆量子化逆DCT変換器15で映像ストリームに戻された後、加算器16で上記予測画像が加算され、デブロッキング・フィルタ17によってブロック歪が抑圧され、参照フレームとしてメモリ18に格納される。動き予測器19は、メモリ18に格納された参照フレームを映像入力のフレームに同期して読み出し、映像入力とメモリ18からの参照フレームとを比較してインター(フレーム間)動き予測を行うもので、その予測結果はモード選択器20に供給される。
ここで、符号化モード制御部21は、予め与えられる符号化パラメータ27に基づいて次フレームの符号化モードを決定し、所定の指示を動き予測器19、モード選択器20及びイントラ予測器22に出力する。上記モード選択器18は、イントラ予測器22で映像入力から得られたイントラ(フレーム内)動き予測結果が供給され、符号化モード制御部21からのフレーム間予測モード、フレーム内予測モードの選択指示に従っていずれか一方の予測結果を予測画像生成器11に送る。この予測画像生成器11は、映像入力を取り込んで予測結果に基づく重み付けを行って次の予測画像を生成する。
以上のように構成される映像圧縮符号化装置において、本発明では通常のH.264エンコード処理に以下の処理を加える。
まず、テーブル作成部23は、符号化開始時に、符号化パラメータM、N、Rを元に参照フレームメモリ履歴テーブル24を作成する。その後に、早送り再生で指示可能とする全速度について、復号装置側での処理負荷(ここでは1GOPでのデコードフレーム数)が許容範囲内となるように、参照フレームメモリ18へ保存するフレームのエンコードパラメータD,Sを決定する。Dは画質を優先して0〜N−1の範囲で最小値を選択して、Sを0〜D−1の範囲で変化させて、デコードフレーム数が許容範囲内となる値を求める。このようにして、各再生速度でのデコードフレーム数が復号装置(デコーダ)側の許容範囲内となるDとSを決定し、上記テーブル24を更新する。
一方、参照フレームメモリ18の前段には参照フレームセレクタ25を配置し、符号化モード制御部21内にセレクタ制御部26を追加する。セレクタ制御部26は、参照フレーム履歴テーブル24を参照して、決められたフレームのみを参照フレームメモリ18へ保存するように、参照フレームセレクタ25を制御する。
図2は、本発明が適用される映像復号再生装置(デコーダ)の一実施形態の構成を示すブロック図である。図2において、参照フレーム履歴テーブル作成部31は、H.264データを取り込んで、エンコーダ側と同様に、参照フレーム履歴テーブルを作成するもので、再生倍速に応じた復号フレームのリストが作成される。そして、処理負荷に応じて表示フレームの削減が行われる。最終的なリストには、表示するかどうかが示される。データ再構築部32は、前述の復号フレームリストに基づいて、デコーダ33でエラーとならないようにヘッダやデータの整合性を取る処理が行われる。
上記デコーダ33では最大2倍速で復号処理が行われる。デコード性能向上のために複数のデコーダを並列で動作させることも可能である。その場合は、GOP単位でデータの振り分けを行う。フレームバッファ34は、一定期間のフレームを保持できるバッファで、表示フレームを選択して一定フレームレートで出力する。表示フレームが削除された場合は、直前のフレームをリピートして出力する。タイミングコントローラ35は、全体の動作タイミングの整合を取る。スイッチ(SW)36は、再生速度が2倍速以下ならば入力側のデータをデコーダ33に導出し、2倍速より大きい場合は、データ再構築のデータをデコーダ33に導出する。上記参照フレーム履歴テーブル作成部31、データ再構築部32、デコーダ33及びフレームバッファ34は、タイミングコントローラ35により、ユーザの再生速度指示に従って適宜制御されるものである。
すなわち、上記構成による映像復号再生装置において、データ再構築部32では、参照フレーム履歴テーブル生成部1で生成される参照フレーム履歴テーブルとタイミングコントローラ35からの再生速度の情報から、表示フレームとデコードフレームを決定する。デコードフレーム数がデコーダ33の許容処理負荷を超える場合は、表示フレームの削減を行うことで、デコードフレーム数を抑制する。エンコード時に、エンコードパラメータ調整により、処理負荷が許容範囲ないとするようにした場合は、表示フレームの削減は不要であり、コマ落ちのない滑らかな特殊再生映像が得られる。本発明では、エンコード時のパラメータ調整が許容処理負荷以下にできなかったケースや、調整を行わないエンコーダのデータへも対応させるために、表示フレームの削減機能を持たしている。
上記データ再構築部32において、デコーダ33に送るNALユニットの該当フレームの扱いを通知するために、NAL(Network Abstraction Layer:ネットワーク抽象レイヤ)ユニットヘッダのピクチャタイプ(nal_unit_type)の書き換えを行う。H.264において、未定義である24〜31の値とすることで、それを受け取ったデコーダ33がデコードフレームと表示フレームの識別を行い、デコードフレームではないNALユニットを破棄する。表示フレームの場合は、デコード結果をフレームバッファ34へ出力する。デコードフレームであり、表示フレームではないフレームのデコード結果は、フレームバッファ34へ出力しない。
尚、デコード性能向上のために、複数のデコーダを並列で動作させることが可能である。その場合は、GOP単位でデータの振り分けをデータ再構築部32で行う。
上記フレームバッファ34は、一定期間のフレームを保持できるバッファで、表示フレームを選択して一定フレームレートで出力する。表示フレームが削除された場合は、直前のフレームを繰り返し出力する。また、上記タイミングコントローラ35は、全体の動作タイミングの整合を取る。スイッチ(SW)36は、再生速度が2倍速以下ならば入力側のデータをデコーダ33へ与え、2倍速より大きい場合は、データ再構築部32で再構築されたデータをデコーダ33へ与える。
以下、上記構成による映像圧縮符号化装置、映像復号再生装置それぞれの処理について説明する。
図3は、図2に示す映像復号再生装置の参照フレームメモリ履歴テーブル作成部31におけるテーブル作成方法を示すフローチャートである。尚、図3では、説明を簡略化するために、フレーム順序入替が発生するBフレームへの対応を除いている。フレームの表示順入替に対する処理を追加することで、Bフレームへ対応することができる。ここでは復号装置側の処理を示しているが、符号化装置側での処理の違いは後述する。
尚、以下の説明において、各変数の定義を以下のものとする。
RefTable[i][j]:参照フレーム履歴テーブルの配列を示す。iは横方向の添え字、jは縦方向の添え字で、それぞれの最大値はエンコードパラメータNである。i番目のフレームの表示をするためには、RefTable[i][j] = trueのフレームのデコードが必要である。
RefPicList[k]:参照フレーム状態を示す。kは参照フレーム番号で、最大値はエンコードパラメータRである。
Nal_Ref_Idc:H.264のNALユニットヘッダにあるパラメータで、参照フレームのときに「1」となる。
Nal_Unit_Type:H.264のNALユニットヘッダにあるパラメータで、種類を表す。
参照フレームリスト数:エンコードパラメータRである。デコーダ側での処理の場合、シーケンスパラメータセット(SPS)という非スライスのNALユニットに存在するH.264データのパラメータnum_ref_framesの値である。
GOPのフレーム数:エンコードパラメータNである。デコーダ側の処理の場合は、スライスヘッダを解析して分かるPicType = IDRとなるフレームの間隔である。
図3において、まず、ユーザの処理開始指示が与えられると、初期化処理として、参照フレーム履歴テーブル[RefTable]を全てメモリ[false]18に格納し、参照フレームリスト[RefPicList]を全て無効値に設定する(ステップS1)。次に、NALユニットをH.264の入力バッファから取り出して(ステップS2)、NALユニットヘッダを解析し、パラメータ値を内部変数のNal_Ref_IdcとNal_Unit_Typeに代入する(ステップS3)。この時点で、Nal_Unit_TypeからNALユニットのRBSP(Raw Byte Sequence Payload:動画像圧縮された生データ)データが画像を含むスライスのものか、それ以外の非スライスであるかを判断する(ステップS4)。RBSPデータが「非スライス」ならば(No)、次のNALユニットの解析までスキップする。
上記判断ステップS4で、RBSPデータが「スライス」ならば(Yes)、NALユニットのRBSPデータにあるスライスヘッダを解析し、スライスのピクチャタイプを示すパラメータがIDR(Instantaneous Decoding Refresh:デコーダ復号動作の瞬時リフレッシュ),I,Pのいずれかであるかを判別し、内部変数のピクチャタイプ(PicType)を決定する(ステップS5)。尚、ここではフレーム内のスライスのタイプは同一とする。
次に、ステップS5で決定されたピクチャタイプがIDRピクチャか否かを判断し(ステップS6)、IDRピクチャならば(Yes)、全ての参照フレームリストをクリア(初期化:RefPicListを全て無効値に設定)し(ステップS7)、参照フレームリストの1番目を更新(現在のフレーム番号→RefPicList[0])する(ステップS8)。
ステップS6でIDRピクチャでないと判断された場合(No)には、Iピクチャか否かを判断する(ステップS9)。Iピクチャの場合には(Yes)、他の参照フレームを必要とせずに、それ自身のみで再生できるので、参照フレーム履歴テーブルの更新は行わないが、それ以外(ピクチャタイプがPピクチャである)の場合は図4に示すフローチャートに従って参照フレーム履歴テーブルの更新を行う(ステップS10)。
次に、内部変数のNal_Ref_Idcが「1」か否かを判断し(ステップS11)、「1」ならば(Yes)参照フレームリストを更新する(ステップS12)。すなわち、参照フレームリストの更新処理において、Nal_Ref_Idc=1の場合は、参照フレームリストで空きがあれば、最も小さい参照フレーム番号kのパラメータRef_Pic_List [k]に現在のフレーム番号を代入し、空きがなければ最も小さなフレーム番号へ現在のフレーム番号を上書きする。ステップS11の判断で内部変数Nal_Ref_Idcが「0」ならば(No)、参照フレームリストの更新処理は行わない。最終的に、GOPの全フレームが終了したか判断し(ステップS13)、終了でない(No)と判断した場合には、ステップS2に戻って一連の処理を継続し、終了と判断した場合には(Yes)、一連の処理を終了する。
但し、以上述べたテーブルとリストの更新処理はフレーム毎に行い、以前処理したのと同じフレームに属するNALユニットの場合はスキップするものとする。また、エンコーダ側では、参照フレーム履歴テーブルを作成する場合、パラメータN、M、R、D、SよりNal_Ref_Idc、Nal_Unit_Type、PicType(スライスの場合のみ)の内部変数をエンコードするスライスの数だけ生成し、NALユニットヘッダとスライスヘッダの解析は行わないようにする。
続いて、図4に示すフローチャートを参照して、上記参照フレーム履歴テーブルの更新処理(S10)について説明する。
まず、現在のフレーム番号をiにセットし(ステップS21)、参照フレームリストの参照フレーム番号に「k」をセットし(ステップS22)、参照フレームリスト数が「k」か否かを判断する(ステップS23)。「k」ならば(Yes)一連の処理を終了する。参照フレームリスト数が「k」でなかった場合、参照フレームリストをチェックして、RefPicList[k]は有効なフレーム番号か否かを判断する(ステップS24)。有効でなければ(No)、「k+1」を「k」に置き換えて(ステップS25)ステップS23に戻る。有効ならば(Yes)、参照フレーム履歴テーブルを更新する(True→RefTable[i][RefPicList [k]](ステップS26)。
次に、フレーム番号に「j」をセットし(ステップS27)、GOPのフレーム数が「j」か否かを判断する(ステップS28)。「j」ならば(Yes)、ステップS25に移行して「k+1」を「k」に置き換えてステップS23に戻る。「j」でなければ(No)、前の参照フレーム履歴テーブルが正しいか否かをチェックする(RefTable[RefPicList[k]][j]=true?)(ステップS29)。正しい場合には(Yes)、参照フレーム履歴テーブルを更新し(True→RefTable[i][j])(ステップS30)、誤りならば更新処理S30をスキップする。その後、「j+1」を「j」に置き換えて(ステップS31)ステップS28の判断に戻り、一連の処理を続ける。
以下、倍速再生について、従来の場合と比較して具体的に説明する。
図5は従来の映像復号再生装置における3倍速再生の場合の1GOP内の復号フレームと表示フレームとの関係を示している。図5から分かるように、表示は3フレームにつき1フレームのみであるが、単独で再生可能なIフレーム以外は参照フレームもデコードしなければならず、全てを復号している。そのため復号処理の負荷も3倍となる。
図6は従来装置の3倍速再生において、処理負荷を減らすために、Iフレームのみを復号した場合の1GOP内の復号フレームと表示フレームとの関係を示している。図6から分かるように、この方法では、5フレームに渡って同じ画面が表示されるので、コマ落としとなってしまう。
図7は、図1に示した映像圧縮符号化装置で生成された符号化映像を図2に示した映像復号再生装置で3倍速再生する場合の1GOP内の復号フレームと表示フレームとの関係を示している。本発明では、図7から分かるように、エンコーダ側で、予め、符号化時に全てを復号しなくても3倍速の表示フレームが得られるように、フレーム構成と被参照フレームの選択を行っている。このため、復号フレーム数を2/3に削減することができている。
尚、ここでは3倍速の表示フレーム全てを復号しているが、処理負荷が目標以下とならない場合は、フレーム単位で復号を省略し、直前と同じフレームを表示させてコマ落としとする。表示フレームの時間的間隔が変動すると、動きの滑らかさが損なわれる。このような場合、例えば、13→10→7→4の順で省略するよりも、13→4→7→10のほうが視覚的に良い結果が得られることが期待できる。
図8にフレーム構成決定パラメータを示し、図9に被参照フレーム選択に関するパラメータを示す。全てを復号することなく早送り再生を行うには、符号化時にどのようなフレーム構成にして、被参照フレームを選択すればよいかに影響する。図8に示すパラメータのNとMは、MPEG符号化方式で一般的に使われているもので、それぞれIフレームの周期と、IまたはPフレームの現れる周期を示す。図9に示すパラメータのRは参照フレームメモリの数である。MPEG2では、前1、後ろ1の固定数であったが、H.264ではレベルの制約内で幾つでも持つことができる。図9に示すパラメータのDとSは、全てのPフレームを参照メモリに格納せずに一部のみにするためのものである。SはIピクチャから数えて、何番目のPピクチャから参照フレームメモリへ格納するかを示す。DはPピクチャの何枚につき1枚のピクチャを格納するかを示す。
表示倍速より表示フレームが決まると、これらのパラメータの選び方により復号に必要なフレームが決定される。但し、図10に示すように、7.5倍速特殊再生時の表示タイミングは、15フレームに2フレームだけ行う。7フレームと8フレームの中間がジャストなタイミングであるが、中間画像は生成せずにどちらかで代用する。
以上、本発明の処理負荷の低減と再生開始のレスポンス速度向上のポイントをまとめると、以下の点があげられる。
(1) 記録時に早送り倍速数(複数の速度を考える)から表示するフレームを決めて、その表示フレーム復号時の参照メモリ状態から、必要な被参照フレームの履歴を求める。表示フレーム数と被参照フレーム数の合計(以降、復号フレーム数)が少なくなるように、フレーム構成と被参照フレームの選択を行う。
(2) 上記(1)の表示フレーム決定時に、割り切れない位置の表示フレーム(例えば15フレーム中2フレームを表示)ならば、復号フレーム数が少なくなる方を選択する。
(3) 再生時に(1)と同様な方法によって早送り再生時の復号フレーム数を求めて、処理負荷の限界値を超える場合はコマ落としにして処理負荷を下げる。
(4) 再生時に(1)と同様な方法によって早送り再生時のデータ量を求めて、処理負荷の限界を超える場合はコマ落としにして処理負荷を下げる。
(5) 上記(3),(4)のコマ落とし方法は、表示フレームの時間的間隔が可能な限り等しくなるように行う。
(6) 再生時に(1)〜(5)によって復号が必要なフレームを決めて、復号フレームのリストを作成し、それに従って復号し、表示フレームのみ表示する。
(7) ランダムアクセスを行う場合に、表示開始フレーム復号時の参照メモリ状態から、必要な被参照フレーム履歴のリストを求め、表示開始フレームまでリストに従って復号のみを行い、表示開始フレームから表示を行う。
(8) ストリーミングによる早送り再生の場合、送信側でリストに従って必要なフレームの送信を行い、受信側で復号した結果のうち表示フレームのみを表示する。
(9) ストリーミングによるランダムアクセスの場合、送信側で表示開始前の必要なフレームのみを送信を行い、受信側で復号のみを行い表示開始フレームから通常動作を行う。
図11は、上記ポイント(1)の被参照フレームの履歴を求めるために作成する参照フレーム履歴テーブル、図12はH.264データ構造を示している。参照フレーム履歴テーブルは、アルフレームをデコードするのに必要な全てのフレームを記録するテーブルである。項目としては、符号化順序、表示順序、NalRelIdcパラメータ、フレーム番号、参照フレーム状態(最大数num_ref_frames)がある。図中‘o’は、表示順序の番号で参照フレームを作るために必要なフレームを示している。作成するタイミングは、符号化パラメータのN,M,R,S,Dを決定する時と、再生時に処理負荷を計算する時である。
Bフレームがある場合は、符号化順序と表示順序が異なる。符号化順序はデータの順序と等しい。このため、参照フレーム履歴テーブルは、符号化順序でデータを調べながら作成する。参照フレーム数は、符号化時に決定されてnum_ref_framesというH.264シンタックス要素で伝送される。参照フレームであるか否かは、図12に示すH.264データ構造でいうと、NALユニットのNalRefIdcというシンタックス要素で伝送される。NalRefIdcが‘1’である場合は、それは参照フレームであるので参照フレーム状態を更新する。図11では、表示順序0のNalRefIdcが‘1’であるので、次のフレームの参照フレーム状態に‘0’を設定している。参照フレーム数はnum_ref_framesによって有限に決められているため、設定時に他の値が入っている場合は、参照メモリ管理方法に従ってどれを上書きすればよいか決める。一般的には、移動窓管理方法が用いられて、最も古い参照フレームを上書きする(詳細については非特許文献1のpp171参照)。
次にテーブルの更新方法について説明する。表示順序‘4’を例にとると、この時の参照フレームは、‘6’と‘3’なので‘4’を再生するのにはこれら復号されていることが必要であることを示す。したがって、テーブルの‘6’と‘3’を‘x’から‘o’へ変更する。次に‘6’と‘3’を復号する時にどのフレームが必要かを調べる。どちらとも‘0’を参照フレームとして使っているために‘0’を‘x’から‘o’へ変更する。このように、まず、(1)現在の参照フレームをチェックし、(2)参照フレームの過去の履歴をチェックして、(3)NalRefIdc=1 ならば参照フレームを更新する。
‘6’は、‘3’を参照フレームとして使っているが、既に‘o’なので何もしない。こうして完成したテーブルを行方向に見ると、該当フレームを復号するのに必要なフレームが調べられる。例えば、再生3倍速によって表示フレームが0,3,6,9,12,…と決まれば、テーブルの‘o’となっているフレームの合計が復号フレーム数である。符号化パラメータの決定は1回のみ行えばよいが、再生時には再生速度が変わる時に行う必要がある。通常は、1フレームを先頭としてNフレーム毎にまとまっているために、その単位(以降GOP)で行う。
再生時に、通常再生の表示フレームレートが30fpsで、復号可能なフレームレートが60fpsでビットレートが80Mbpsの場合、2倍速で、元のビットレートが40Mbpsの再生までは、特殊な処理を行わなくても再生可能である。3倍速となると全フレームの復号は90fpsとなり、処理負荷が高くなり再生不可能である。よって、3倍速動作開始時に参照フレーム履歴テーブルを作成し、表示フレームから復号フレーム数を求めて60fps以下であるかどうか調べる。
60fpsを超える場合は、ポイント(2),(3),(5)に基づいて表示フレームを減らす。その結果の合計のデータ量を調べて、80Mbpsを超える場合は、ポイント(4)により表示フレームを減らす。ポイント(5)のフレーム時間間隔の均等化は、必須ではなく処理負荷の低減が優先される。符号化時に、符号化パラメータを最大復号フレーム数と最大ビットレートの制約事項の元に選んだ場合は、表示フレームの削除を行わなくてもよい。符号化パラメータを復号フレーム数の考慮をしないで選択した場合は、最悪として図6に示したような1フレームのみ再生となる。符号化時に特殊な処理を行わなくても、最低限の動作は保証されている。
したがって、上記実施形態の構成によれば、映像の符号化時に、早送り再生やランダム再生時に全てのフレームをデコードしなくてもよいように、フレーム構成と、参照メモリに格納するフレーム(被参照フレーム)の選択を行っているので、早送り再生時やランダム再生時には必要なフレームのみ復号すればよく、処理負荷の低減と再生開始のレスポンス速度向上を合わせて実現することができる。
尚、上記実施形態では、映像復号再生装置側で参照フレーム履歴テーブルを作成するようにしたが、ストリーミング対応の装置ならば、ストリーム配信サーバ側で参照フレーム履歴テーブルを作成し、映像データと合わせて伝送するようにしてもよい。
図13は、再生をネットワークストリーミングに対応させた再生系のシステム構成を示すものである。
一般的なH.264データの転送には、RTP(Real-Time Transport Protocol)を用いた方法などがあり、IETF(Intemet Engineering Task Force)によってRFC3984のように規格化されている。再生の開始や停止の制御は、RTSP(RealTime Streaming Protocol)、RFC2326にて規格化されている。この実施例では、送信側にて復号フレームの決定を行うために、映像ストリームだけではなく復号フレームリストを送信する必要がある。送信タイミングとしては、RTSPのセッションコントロールが適当である(非特許文献1、pp227参照)。送信側で不要なフレームデータの削除を行うことにより、ネットワーク帯域の削減にもつながる。
目的をこのようなストリーミングとする場合には、符号化パラメータを選択するポイント(1)の制約条件として、ネットワーク帯域を追加する。受信側から送信側に対して、再生速度などの条件を指定して再生要求が出される。早送り再生や、ランダムアクセスの場合は、図2と同様にして、参照フレーム履歴テーブル作成部41及びデータ再構築部42で、タイミングコントローラ45の制御に従い、参照フレーム履歴テーブルが作成され、データ再構築が行われる。そして、スイッチ(SW)43によって、可変速再生やランダムアクセス開始時に復号フレームリストが、パケット化部44でパケット化されてネットワーク46を通じてデパケット化部47に送られる。デパケット化部47では受信された信号から復号フレームリストが取り出される。リスト内容が確認されると、送信側にOK応答が返される。
その後に、H.264の再構築データがパケット化部44でパケット化されてネットワーク46を通じてデパケット化部47へ送られる。デパケット化部47で受信されたデータは、デコーダ48でデコードされて、フレームバッファ49にいったん格納される。タイミングコントローラ50は、復号フレームリストに従って表示フレームだけを決められたタイミングで出力するようにフレームバッファ49をコントロールする。
上記構成によれば、例えばサーバからストリーム形式でH.264データが再生出力され、ネットワークを通じて再生端末に伝送され再生処理されるシステムにおいて、端末側からサーバ側に倍速再生が要求されたとき、サーバ側で参照フレーム履歴テーブルを作成し、データ再構築を行って復号フレームリストを作成し、端末側に提供することが可能となる。
尚、この発明は上記実施の形態に限定されるものではない。また、本発明は、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。さらに、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
本発明が適用される映像圧縮符号化装置(エンコーダ)の一実施形態の構成を示すブロック図。 本発明が適用される映像復号再生装置(デコーダ)の一実施形態の構成を示すブロック図。 図2に示す映像復号再生装置の参照フレームメモリ履歴テーブル作成部におけるテーブル作成方法を示すフローチャート。 図2に示すフロー中の参照フレーム履歴テーブルの更新処理の流れを示すフローチャート。 従来の映像復号再生装置における3倍速再生の場合の1GOP内の復号フレームと表示フレームとの関係を示す図。 従来装置の3倍速再生において、処理負荷を減らすために、Iフレームのみを復号した場合の1GOP内の復号フレームと表示フレームとの関係を示す図。 上記実施形態において、3倍速再生する場合の1GOP内の復号フレームと表示フレームとの関係を示す図。 図1に示すエンコーダ側のフレーム構成決定パラメータを示す図。 図1に示すエンコーダ側の被参照フレーム選択に関するパラメータを示す図。 上記実施形態において、7.5倍速特殊再生時の表示タイミングを示す図。 上記実施形態において、被参照フレームの履歴を求めるために作成する参照フレーム履歴テーブルを具体的に示す図。 本発明に用いられるH.264データ構造を示す図。 本発明の他の実施形態として、再生をネットワークストリーミングに対応させた再生系のシステム構成を示すブロック図。
符号の説明
11…減算器、12…予測画像生成器、13…DCT変換量子化器、14…エントロピー符号化器、15…逆量子化逆DCT変換器、16…加算器、17…デブロッキング・フィルタ、18…参照フレームとしてメモリ、19…動き予測器、20…モード選択器、21…符号化モード制御部、22…イントラ予測器、23…テーブル作成部、24…参照フレームメモリ履歴テーブル、25…参照フレームセレクタ、26…セレクタ制御部、27…符号化パラメータ、31…参照フレーム履歴テーブル作成部、32…データ再構築部、33…デコーダ、34…フレームバッファ、35…タイミングコントローラ、36…スイッチ(SW)、41…参照フレーム履歴テーブル作成部、42…データ再構築部、43…スイッチ(SW)、44…パケット化部、45…タイミングコントローラ、46…ネットワーク、47…デパケット化部、48…デコーダ、49…フレームバッファ、50…タイミングコントローラ。

Claims (19)

  1. 映像入力から参照フレームとの残差信号を生成して符号化出力するもので、前記参照フレームとして、基本フレームまたは直前復号フレームからイントラ/インターモードによって選択的に生成される差分フレームが配列されるようにし、復号再生時に倍速再生またはランダム再生を行う映像処理装置において、
    前記圧縮符号化に際して前記倍速再生またはランダム再生の順序から予め複数の倍速値それぞれに対応する表示フレームを決定し、当該表示フレーム復号時の参照フレームの状態から必要な被参照フレームの履歴を求め、前記表示フレームと前記被参照フレームとを合計した復号フレーム数が少なくなるように、かつ前記複数の倍速値の全てについて復号時の処理負荷が許容範囲となるように符号化パラメータを決定して前記符号化出力のフレーム構成と被参照フレームの選択を行うことを特徴とする映像処理装置。
  2. 前記表示フレームの決定時に存在しない位置のフレームならば、その前後のフレームのうち前記復号フレーム数が少なくなる方を選択することを特徴とする請求項1記載の映像処理装置。
  3. 前記倍速再生時に前記復号フレーム数を求めて、前記処理負荷の限界値を超える場合には前フレームを表示してコマ落としを実行することを特徴とする請求項1記載の映像処理装置。
  4. 前記倍速再生時に、前記復号フレームのデータ量を求めて、前記処理負荷の限界値を超える場合には前フレームを表示してコマ落としを実行することを特徴とする請求項1記載の映像処理装置。
  5. 前記コマ落としの処理は、前記表示フレームの時間的間隔が均等になるように行うことを特徴とする請求項3または4記載の映像処理装置。
  6. 前記倍速再生を行う場合に、復号が必要なフレームを予め決めて復号フレームのリストを作成し、前記倍速再生時にそのリストに従って復号し、表示フレームのみ表示することを特徴とする請求項1記載の映像処理装置。
  7. 前記ランダム再生を行う場合に、表示開始フレーム復号時の参照フレームのピクチャタイプから必要な被参照フレーム履歴のリストを予め作成しておき、ランダム再生時に表示開始フレームまで前記リストに従って復号のみを行い、表示開始フレームから表示を行うことを特徴とする請求項1記載の映像処理装置。
  8. 前記符号化出力をストリーミングで端末装置に送信する場合に、送信側で前記倍速再生時に復号が必要なフレームを予め決めて復号フレームのリストを作成しておき、前記端末装置から送信側に送られる倍速再生要求に応答して、前記送信側でリストに従って必要なフレームの送信を行い、前記端末装置側で復号した結果のうち表示フレームのみを表示することを特徴とする請求項1記載の映像処理装置。
  9. 前記符号化出力をストリーミングで端末装置に送信する場合に、送信側で表示開始前の必要なフレームのみ送信を行い、受信側で復号のみを行い表示開始フレームから通常動作を行う請求項1記載の映像処理装置。
  10. 映像入力から参照フレームとの残差信号を生成して符号化出力するもので、前記参照フレームとして、基本フレームまたは直前復号フレームからイントラ/インターモードによって選択的に差分フレームを生成し配列する映像圧縮符号化装置において、
    前記圧縮符号化に際して前記符号化出力の復号再生時の倍速再生またはランダム再生の順序から予め複数の倍速値それぞれに対応する表示フレームを決定する決定手段と、
    前記表示フレーム復号時の参照フレームの状態から必要な被参照フレームの履歴を求める履歴作成手段と、
    前記表示フレームと前記被参照フレームとを合計した復号フレーム数が少なくなるように、かつ前記複数の倍速値の全てについて復号時の処理負荷が許容範囲となるように符号化パラメータを決定して前記符号化出力のフレーム構成と被参照フレームの選択を行う選択手段と
    を具備することを特徴とする映像圧縮符号化装置。
  11. 前記決定手段は、前記表示フレームの決定時に存在しない位置のフレームならば、その前後のフレームのうち前記復号フレーム数が少なくなる方を選択することを特徴とする請求項10記載の映像圧縮符号化装置。
  12. 請求項10の映像圧縮符号化装置から出力される映像符号化信号を取り込み、倍速再生の要求時に前記復号フレーム数を求めて、処理負荷の限界値を超える場合には前フレームを表示してコマ落としを実行することを特徴とする映像復号再生装置。
  13. 請求項10の映像圧縮符号化装置から出力される映像符号化信号を取り込み、前記倍速再生の要求時に、前記復号フレームのデータ量を求めて、処理負荷の限界値を超える場合には前フレームを表示してコマ落としを実行することを特徴とする映像復号再生装置。
  14. 前記コマ落としの処理は、前記表示フレームの時間的間隔が均等になるように行うことを特徴とする請求項12または13記載の映像復号再生装置。
  15. 請求項10の映像圧縮符号化装置から出力される映像符号化信号を取り込み、前記倍速再生の要求時に、復号が必要なフレームを予め決めて復号フレームのリストを作成し、前記倍速再生時にそのリストに従って復号し、表示フレームのみ表示することを特徴とする映像復号再生装置。
  16. 請求項10の映像圧縮符号化装置から出力される映像符号化信号を取り込み、前記ランダム再生の要求時に、表示開始フレーム復号時の参照フレームのピクチャタイプから必要な被参照フレーム履歴のリストを予め作成しておき、ランダム再生時に表示開始フレームまで前記リストに従って復号のみを行い、表示開始フレームから表示を行うことを特徴とする映像復号再生装置。
  17. ストリーミングで送信される圧縮符号化された映像信号を受け取って復号再生する映像復号再生装置において、
    前記映像信号の送信側で、倍速再生時に復号が必要なフレームを予め決めて復号フレームのリストが作成され、倍速再生要求に応答して、前記リストに従って必要なフレームの送信が行われるとき、
    前記送信側に倍速再生要求を出力し、前記送信側から送られてくるフレームを復号した結果のうち表示フレームのみを表示することを特徴とする映像復号再生装置。
  18. ストリーミングで送信される圧縮符号化された映像信号を受け取って復号再生する映像復号再生装置において、
    前記映像信号の送信側で、ランダム再生時に表示開始前の必要なフレームのみの送信が行われるとき、
    前記送信側にランダム再生要求を出力し、表示開始フレーム前は前記送信側から送られてくるフレームの復号のみを行い、表示開始フレームから通常の復号再生を行うことを特徴とする映像復号再生装置。
  19. 映像入力から参照フレームとの残差信号を生成して符号化出力する際に、前記参照フレームとして、基本フレームまたは直前復号フレームからイントラ/インターモードによって選択的に生成される差分フレームが配列されるようにし、復号再生時に倍速再生またはランダム再生を行う映像再生方法において、
    前記圧縮符号化に際して前記倍速再生またはランダム再生の順序から予め複数の倍速値それぞれに対応する表示フレームを決定し、当該表示フレーム復号時の参照フレームの状態から必要な被参照フレームの履歴を求め、前記表示フレームと前記被参照フレームとを合計した復号フレーム数が少なくなるように、かつ前記複数の倍速値の全てについて復号時の処理負荷が許容範囲となるように符号化パラメータを決定して前記符号化出力のフレーム構成と被参照フレームの選択を行うことを特徴とする映像再生方法。
JP2008241764A 2008-09-19 2008-09-19 映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法 Expired - Fee Related JP5017223B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008241764A JP5017223B2 (ja) 2008-09-19 2008-09-19 映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008241764A JP5017223B2 (ja) 2008-09-19 2008-09-19 映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012128856A Division JP5509262B2 (ja) 2012-06-06 2012-06-06 映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法

Publications (2)

Publication Number Publication Date
JP2010074677A JP2010074677A (ja) 2010-04-02
JP5017223B2 true JP5017223B2 (ja) 2012-09-05

Family

ID=42206015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008241764A Expired - Fee Related JP5017223B2 (ja) 2008-09-19 2008-09-19 映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法

Country Status (1)

Country Link
JP (1) JP5017223B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2531271A (en) 2014-10-14 2016-04-20 Nokia Technologies Oy An apparatus, a method and a computer program for image sequence coding and decoding
WO2017169722A1 (ja) * 2016-03-28 2017-10-05 ソニー株式会社 画像処理装置および方法
CN116684587A (zh) * 2018-10-05 2023-09-01 Lg电子株式会社 图像解码、编码方法及针对图像的数据的发送方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005184229A (ja) * 2003-10-23 2005-07-07 Seiko Epson Corp 圧電デバイスとその製造方法ならびに圧電デバイス用パッケージおよび圧電デバイスを利用した携帯電話装置および圧電デバイスを利用した電子機器
JP4652364B2 (ja) * 2004-07-01 2011-03-16 三菱電機株式会社 符号化装置及び方法、並びに復号化装置及び方法
JP4991496B2 (ja) * 2007-02-06 2012-08-01 キヤノン株式会社 画像記録装置及び方法

Also Published As

Publication number Publication date
JP2010074677A (ja) 2010-04-02

Similar Documents

Publication Publication Date Title
KR100945548B1 (ko) 비디오 오류 회복
US6980594B2 (en) Generation of MPEG slow motion playout
JP5068947B2 (ja) ピクチャの符号化方法
US7844166B2 (en) Reproduction device, video decoding device, synchronization/reproduction method, program and recording medium
US8837605B2 (en) Method and apparatus for compressed video bitstream conversion with reduced-algorithmic-delay
JP2004507178A (ja) ビデオ信号符号化方法
JP4983917B2 (ja) 動画像配信システム、変換装置および動画像配信方法
JP2009512265A (ja) ネットワーク上の動画データ伝送制御システムとその方法
US7596300B2 (en) System and method for smooth fast playback of video
JP5017223B2 (ja) 映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法
JP5509262B2 (ja) 映像処理装置、映像圧縮符号化装置、映像復号再生装置及び映像再生方法
WO2013071460A1 (en) Reducing amount op data in video encoding
JP6541932B2 (ja) 画像データを表示するためのビデオシステム及び方法及びコンピュータプログラムならびに符号化装置
JPH10322704A (ja) ビットストリームデータ復号装置
JP2003023639A (ja) データ伝送装置及び方法、データ伝送プログラム、並びに記録媒体
WO2009122925A1 (ja) 動画像変換装置、動画像配信システム、動画像変換方法及びプログラム
JP2007158778A (ja) トリック再生用コンテンツ作成方法および装置、トリック再生用圧縮動画データ送出方法および装置、およびトリック再生用コンテンツ作成用プログラム
JP5367687B2 (ja) データ配信システム、データ配信装置、及びデータ配信方法
JP2009049826A (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
JP2004147306A (ja) 低遅延映像符号化および復号化装置
JP4390009B2 (ja) 符号化装置及び方法、画像処理システム
JP2914368B1 (ja) 時報に合わせた動画像信号符号化方法及び装置
JP2010206463A (ja) 動画像符号化方法、動画像符号化装置及び動画像符号化プログラム
JP2009065258A (ja) 受信装置
JP2008227745A (ja) 映像符号化装置及び映像復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120611

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150615

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5017223

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150615

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees