JP2008109637A - 動画像符号化装置及びその方法 - Google Patents

動画像符号化装置及びその方法 Download PDF

Info

Publication number
JP2008109637A
JP2008109637A JP2007215811A JP2007215811A JP2008109637A JP 2008109637 A JP2008109637 A JP 2008109637A JP 2007215811 A JP2007215811 A JP 2007215811A JP 2007215811 A JP2007215811 A JP 2007215811A JP 2008109637 A JP2008109637 A JP 2008109637A
Authority
JP
Japan
Prior art keywords
segment
image
frames
moving image
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007215811A
Other languages
English (en)
Inventor
Shinichiro Koto
晋一郎 古藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007215811A priority Critical patent/JP2008109637A/ja
Priority to US11/856,479 priority patent/US20080075172A1/en
Publication of JP2008109637A publication Critical patent/JP2008109637A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】時間分割並列符号化が実現可能な動画像符号化装置を提供する。
【解決手段】入力動画像信号を複数の連続するフレームで構成されるセグメントに分割し(S102)、分割されたセグメント単位で独立して符号化し(S103)、セグメント単位に符号化された符号化データを結合して、最終的な符号化データを生成する(S105)。各分割セグメントは、複数の連続する複数のフレームで構成される画像群BPに分割され符号化する。各分割セグメント終端の画像群BPを構成するフレーム数及びフィールド位相は、全ての分割セグメントで同一となるように、BP分割制御ステップにより制御する。
【選択図】図1

Description

本発明は、連続する動画像信号を複数のセグメントに時間分割し、分割された複数のセグメントを独立若しくは並列に符号化する動画像符号化装置及びその方法に関する。
MPEG−2、MPEG−4やITU−T Rec.H.264|ISO/IEC14496−10 MPEG−4AVC(以下、「H.264」と呼ぶ)などの動画像符号化国際標準方式に準拠した符号化を、複数のプロセッサやハードウエアを用いて並列処理で高速に実現する複数の方法が知られている。
特許文献1に示されるように、代表的な並列化の方法として、各画像フレームを複数の領域に分割して、分割領域毎に並列に符号化を行う空間分割方法と、複数の時間的に連続するフレームを単位として並列化を行う時間分割方法が知られている。
「空間分割方法」は、遅延量が少ないという利点がある。しかし、原画像に起因する画面内での符号化の困難度の違いにより、分割領域毎の処理量が変動し、かつ通常は1フレーム単位で同期を取った処理を行う必要があるため、負荷分散の均一化が困難となり、並列度に見合う高速化が困難となる。また、画面内の相関を使った符号化が、画面内の分割領域内に制限されるため、符号化効率の低下も発生する。
一方、「時間分割方法」で並列に符号化を行う場合は、分割単位間の依存関係を排除し、分割符号化したデータを接続して連続再生が可能となるように符号化する必要がある。
具体的には、特許文献2や特許文献3に示されるように、分割符号化された符号化データが、分割点において、(1)仮想バッファレベルの接続性、(2)フィールド位相の連続性、(3)フレーム間予測の切断、を満たす必要となる。
(1)の仮想バッファレベルの接続性については、特許文献3に示されるように、分割点において所定の仮想バッファレベルとなるように、時間分割点の始点レベル及び終点付近での発生レートを制御することで、分割符号化された符号化データを連続的に接続することが可能となる。
(2)のフィールド位相の連続性についても、分割点の始点及び終点のフィールド位相を予め所定値となるように制御すれば、分割符号化された符号化データを連続的に接続することが可能となる。
(3)のフレーム間予測の切断を行うために、特許文献3に示されるように、フレーム間予測を分割単位内に限定し、分割単位を跨ぐフレーム間予測を禁止すればよい。但し、フレーム間予測を切断することで、一般に符号化効率が低下する。しかし、分割単位(連続して符号化するフレーム数)を大きくとることで、符号化効率の低下は十分小さくなる。時間分割単位を大きくすると、一般に符号化における遅延量が増大するが、ハードディスクなどのランダムアクセスが可能な蓄積メディアに、予め記録され動画像信号を符号化する場合においては、時間分割符号化時の遅延は発生しない。また、上述した時間分割方法は、特許文献2や特許文献3に示されるように、部分的な再符号化や符号化データの切り貼り編集などにも好適なものとなる。
特開平11−252544公報 特開2001−54118公報 特許第3529599号公報
上記した通り、ランダムアクセスが可能な蓄積メディアに記録され動画像信号を並列符号化する場合や、符号化後の部分的な再符号化や符号化データの切り貼り編集などを行う場合、時間分割符号化は有効である。従来のMPEG−2などの符号化方式での時間分割符号化は、各分割符号化単位の終点で、仮想バッファレベル、フィールド位相、フレーム間予測の切断の制御を行うことで、分割符号化された符号化データを接続して連続再生を行うことが可能となった。
一方、H.264など動画像符号化方式では、各符号化画像の復号化や表示のタイミングに関する情報を、動画像符号化データ中に含めて符号化されるため、上記のような時間分割符号化では、一般に分割符号化された符号化データを接続して連続再生を行うことが困難となる。H.264におけるタイミング情報の符号化は、直前の画像群の最初の符号化画像の復号化時刻から、当該画像群の最初の符号化画像の復号化時刻までの時間に関する情報が符号化される。また、当該画像群における2番目以降の符号化画像の復号化時刻に関する情報は、当該画像群の最初の符号化画像の復号化時刻を基準にした相対的な時間情報として符号化される。また、各符号化画像の表示時刻に関する情報は、当該符号化画像の復号化時刻からの差分として符号化される。つまり、符号化や復号化に関するタイミング情報が、過去のタイミング情報からの差分として符号化されるという因果関係があり、入力される順序に従って、動画像信号を順次符号化することが必要となる。
このような符号化方式を用いた場合は、従来の仮想バッファレベル、フィールド位相、レーム間予測の切断の制御だけでは、動画像信号を時間分割して並列符号化し、符号化後の符号化データを接続して連続再生することや、符号化後に符号化データレベルでの編集などを行うことが困難となる。
そこで本発明は、時間分割並列符号化が実現可能な動画像符号化装置及びその方法を提供することを目的とする。
本発明は、入力動画像を時間方向に複数のセグメントに分割する第1分割部と、前記各セグメント内を、連続する複数のフレームを含む複数の画像群に分割するものであって、前記各セグメントの終端の画像群が予め定められた数のフレームを含むように分割する第2分割部と、前記各セグメントに含まれる前記複数の画像群を、一つ前の画像群の先頭フレームの時間情報に基づいて復号化及び表示に関するタイミング情報を求めながら符号化を行い、前記各セグメントの符号化データを生成する符号化部と、前記複数のセグメントの符号化データを結合する結合部と、を有する動画像符号化装置である。
本発明によれば、時間分割されたセグメント単位の並列符号化を容易に実現することができる。
(第1の実施形態)
以下、本発明に係る第1の実施形態の動画像符号化装置における動画像符号化方法について図1〜図29に基づいて説明する。
[1]動画像符号化方法の処理内容
図1は、本実施形態に係る動画像符号化方法の処理を示すフローチャートである。
符号化が開始されると(ステップS100)、まず初期化処理(ステップS101)でビットレートなどの符号化パラメータの設定等が行われる。
次に、符号化すべき動画像シーケンス全体を連続する複数のフレームで構成されるセグメントに順次分割される(ステップS102)。
次に、分割されたセグメント毎に順次符号化が行われる(ステップS103)。各セグメントの符号化は、1つの符号化手段を用いる場合は逐次的に行い、また同一の符号化手段が複数ある場合は、複数のセグメントを独立かつ並列に符号化する。
次に、符号化すべき動画像シーケンスを分割した全セグメントの符号化が終了すると(ステップS104)、各分割セグメントの符号化データの結合が行われ(ステップS105)、途切れなく連続再生が可能な符号化データが生成及び出力され、符号化を終了する(ステップS106)。
以上により、連続する動画像シーケンスを、複数のセグメントに時間分割し、独立並列符号化することで、並列度に応じて高速な符号化が可能となり、かつ、並列度に依存せずに同一の符号化データを生成することが可能となる。
本実施形態では、セグメント単位で時間分割符号化した符号化データを接続して、途切れのないシームレスな連続再生を可能とするため、特許文献3に示される符号化データの接続点の制約と同様に、下記(1)〜(3)の制御を分割セグメント毎に行う。
(1)セグメント分割点を跨ぐ画像間予測の禁止(クローズドGOP)、
(2)各セグメント分割点終点での仮想受信バッファモデルのバッファ占有量が所定値以上となる、
(3)各セグメント分割の始点及び終点の表示フィールド位相が所定値となる。
さらに、本実施形態では、上記(1)〜(3)の制御に加えて、各分割セグメント終端の画像群の構成が、全てのセグメントで同一となるように、後述する画像群の分割制御を行う。
[2]セグメント境界の制約条件
以下、動画像符号化方式としてH.264を例にとって、セグメント境界の制約条件について詳細に説明する。
図16は、H.264における符号化データ構造の典型例を示した図である。
まず、符号化画像毎に符号化画像の境界を示すAccess unit delimiter(600)が符号化される。
次に、複数の符号化画像毎に符号化パラメータに関する情報Sequence Parameter Set(601)と、復号化側でのバッファリング遅延時間等のタイミング情報であるBuffering Period SEI(602)が符号化される。
次に、各符号化画像の符号化パラメータに関する情報Picture Parameter Set(603)と、各符号化画像の復号化タイミング及び表示タイミングに関する情報を含むPicture Timing SEI(604)が順次符号化され、それに引き続き符号化画像のデータ本体であるCoded Slice Data(605)が符号化される。
さらに引き続き、Access unit delimiter(606)、Picture Parameter Set(607)、Picture Timing SEI(608)、Coded Slice Data(609)で構成される符号化画像データが複数符号化される。
上記のSequence Parameter Set(601)と、復号化側でのバッファリング遅延時間等のタイミング情報であるBuffering Period SEI(602)は、一連の符号化画像シーケンスの中で繰り返し符号化される。上記Buffering Period SEI(602)が符号化され、次にBuffering Period SEI(602)が符号化されるまでの間の一連の符号化画像の集合は、Buffering Periodと呼ばれる(以下、「BP」と呼ぶ)。
[3]データ構造
図17は、Buffering Period SEI(602)のデータ構造を示す図である。
Buffering Period SEI(602)には、復号化時において、各BPの最初の符号化画像データが復号化器の受信バッファに入力されてから、当該画像データの復号化が開始されるまでの遅延時間を示すinitial_cpb_removal_delayなどが符号化されている。
また、図18はPicture Timing SEI(604及び608)のデータ構造を示す図である。Picture Timing SEIでは、各符号化画像の復号化時刻に関するタイミング情報cpb_removal_delayと復号化時刻から表示時刻までの遅延時間を示す情報dpb_output_delayなどが符号化されている。
[4]符号化順の説明
図19は、上記のcpb_removal_delay及びdpb_output_delayについて説明する図である。
図19(A)の700〜711は、それぞれ符号化画像データを符号化順で表示したものでる。
図19において、I2,B0,B1等は、符号化画像タイプと表示順序を示すものであり、Iはフレーム内符号化画像、Pは単方向予測フレーム間符号化画像、Bは双方向予測フレーム間符号化画像を示し、また添え字の数字が表示順序を示している。
図19(A)において、符号化画像700〜705が最初のBP(Buffering Period)を構成し、符号化画像706〜711が2番目のBPを構成するものとする。H.264における各符号化ピクチャのcpb_removal_delayは、各BP先頭の符号化画像の復号化時刻から、当該ピクチャが復号化されるまでの遅延時間の情報が符号化される。
但し、各BPの最初の符号化画像におけるcpb_removal_delayについては、直前のBPの先頭の符号化画像の復号化時刻からの遅延時間が符号化される。なお、唯一の例外として、連続する動画像シーケンスの先頭の符号化画像については、cpb_removal_delayには0が設定される。
このようにすることで、連続する2つのBPが途切れなく連続して復号化することが可能となる。各符号化データは、符号化データの順で復号化された後、表示順に並べ替えられて表示される。
図19(B)は、図19(A)の符号化データを復号化後に、表示順序に並べ替えたものである。図19の例では、B符号化画像は復号化と同時に表示されるようにdpb_output_delayが0として符号化される。また、I及びP符号化画像は、符号化時刻から3フレーム後に表示されるように、dpb_output_delayに3フレーム期間に相当する遅延量の情報が符号化される。
[5]各セグメントの符号化の処理内容
次に、図2を用いて図1で示した本実施形態における各セグメントの符号化(ステップS103)の処理フローチャートについて説明する。本実施形態では、各セグメントの符号化は、フレーム単位で順次符号化を行う。
各セグメントの符号化が開始されると(ステップS110)、まず当該セグメントの符号化パラメータの設定等の初期化処理(ステップS111)を行う。
次に、当該動画像セグメントを、連続する複数の画像で構成される画像群BPに分割するための制御を行う(ステップS112)。
次に、ステップS112のBP分割制御の結果、次に符号化されるフレームがBP先頭の画像となった場合(ステップS113が「Yes」の場合)、BP単位のタイミング情報である上述のBuffering Period SEIの符号化が行われる(ステップS114)。
次に、符号化フレーム単位のタイミング情報であるPicture Timing SEIの符号化を行い(ステップS115)、引き続き当該フレームの符号化を行う(ステップS116)。
次に、1フレームの符号化が完了すると、符号化フレームの復号化及び表示タイミングに関する制御パラメータの更新を行い(ステップS117)、当該セグメント内の全てのフレームの符号化が完了したかどうかの判断を行い(ステップS118)、当該セグメント内の全てのフレームの符号化が完了するまで、ステップS112からステップS118までの処理を繰り返す。
最後に、当該セグメント内の全てのフレームの符号化が完了したら、当該セグメントの符号化を完了する(ステップS119)。
[6]BP長制御の概要と作用
次に、図7〜図9を用いて、本実施形態に係るBP長制御の概要と作用について説明する。
図7は、各分割セグメントの動画像シーケンスを、複数のフレームから構成される画像群であるBPに分割する例を示しており、横軸が時間を示している。各分割セグメントは独立に符号化され、各分割セグメントの符号化データは、符号化後に接続されて、シームレスに連続再生が可能な符号化データとして、最終的に出力される。
図7の例では、通常のBPが固定のBP長(BPを構成するフレーム数)で構成されるが、セグメントiの総フレーム数が固定のBP長の倍数とならない場合を示している。
[6−1]従来の場合
まず、従来の場合について説明する。
図7の場合、セグメントiにはBP長が端数となるBPが必ず存在することになるが、図7の(A)に示すように、符号化終端のBP(図中100)でBP長が調整されると、そのBP長に依存して、後段のセグメントi+1の先頭での最初のcpb_removal_delayの値に、前段のセグメントiの最終BPのフレーム数が反映されるため、前段セグメントの最終BP長が確定するまでは、後段のセグメントの符号化が開始出来なくなる。
従って、各セグメントのBP長が、各セグメントの符号化が終了するまで確定できない場合、連続するセグメントを並列に符号化し、符号化完了後に各セグメントの符号化データの結合を行おうとすると、各セグメント始点でのcpb_removal_delayの値を正確に符号化することが困難となり、正常に連続再生することが保証されない。
また、前段のセグメントの最終BP長が確定する前に、各セグメント始点で仮のcpb_removal_delayの値を符号化することで、各セグメントを並列に符号化し、全ての分割セグメントの符号化が完了してから、各セグメントの最初のcpb_removal_delayの値を再計算して、各セグメントの符号化データを上書き修正することにより、連続再生可能な符号化データを生成することは可能となる。但し、この場合、符号化後に符号化データの修正を行う処理ステップの追加が必要となる。
また、修正する符号化データが可変長符号や算術符号などを用いて符号化されている場合、符号化データの修正範囲が局所化されず、広い範囲の符号化データの修正が必要となる。
また、符号化データの修正により、符号化データ量自体が変動し、仮想バッファモデルなどの制約条件を満たさなくなるなどのリスクも伴う。各セグメントの最後のBP長が事前に確定している場合は、連続する複数のセグメントを同時並列で符号化することも可能である。但し、セグメント長(セグメントを構成するフレーム数)が可変となる場合、各セグメントの終端BP長は一般に一定とはならないため、各セグメント先頭のタイミング情報も固定とはならない。
従って、各セグメントの符号化終了後に、セグメント単位での符号化データの並べ替えにより、符号化データレベルでの編集作業を行う場合、セグメント境界で(1)仮想バッファレベルの接続性、(2)フィールド位相の連続性、(3)フレーム間予測の切断、が保証されていたとしても、タイミング情報の連続性が保証されないため、正常に連続再生が可能な符号化データ生成することが困難となる。
[6−2]本実施形態の場合
次に、本実施形態では、図7(B)及び(C)に示すように、各セグメント内のBP長の補正を、各セグメントの最終BP以外の部分で行い、各分割セグメントの最終BP長が所定の一定値となるように、セグメント内のBP長の制御を行う。
図7(B)では、セグメントの先頭BP(図中101)で、BP長の補正を行う。
また、図7(C)では、セグメント終端BP(図中104)から1つ手前のBP(図中103)で、BP長の補正を行う。
このようにして、各セグメントの最後のBP(図中102及び104)のBP長を固定化することで、後段のセグメントのタイミング情報生成への影響を排除すことが可能となる。
これにより、連続する複数のセグメントを、同時並列に符号化し、符号化後に各セグメントの符号化データを、単純に接続するのみで、符号化データの一部書き換えなど無しに、途切れなく連続再生が可能な符号化データの生成を行うことが可能となる。
また、従来の(1)仮想バッファレベルの接続性、(2)フィールド位相の連続性、(3)フレーム間予測の切断、が保証されていれば、各セグメントの符号化データを任意に入れ替えても、符号化データの一部書き換えなど無しに、途切れなく連続再生が可能な符号化データの生成を行うことが可能となり、符号化データレベルでの編集を容易に行うことが可能となる。
[7]シーンチェンジ点などの検出の場合
図8は、各セグメントの符号化中に入力動画像のシーンチェンジ点の検出を行い、検出されたシーンチェンジ点でBPを分割する場合、また、外部より与えられるチャプタ点(ランダムアクセスの開始点)の情報に応じて、BPを強制的に分割する場合の例を示している。
H.264規格などでは、ランダムアクセス再生を行う場合、BPの境界点から再生を開始することは、再生時のタイミング情報の初期化が容易となるため好ましい。そこで、シーンチェンジ点やチャプタ点を、BP境界と一致する様に符号化しておくことで、再生時のランダムアクセスを容易にすることが可能となる。
図8(A)及び(B)では、シーンチェンジ点やチャプタ点でBPを打ち切り(図中のBP(1))、その点から新たなBPを開始する(図中BP(2))ことで、シーンチェンジ点やチャプタ点を、BP境界と一致させることが可能なる。
このように、セグメント内で、BP長を動的に変更していくと、セグメント終端のBP長は一般に一定値とはならない(図8(A)の201)。
しかし、本実施形態では、セグメント終端から2番目のBP長を調整することで、セグメント終端のBP長が一定値となるように符号化することが可能となる。これにより、図7で説明した通り、セグメント単位の並列符号化や、セグメントの符号化データを単位とした、符号化後の編集などを容易に実現することが可能となる。
[8]シームレス・マルチストーリ符号化の場合
図9は、本実施形態におけるシームレス・マルチストーリ符号化におけるBP長の制御を説明する図である。
「シームレス・マルチストーリ」とは、動画像符号化データの再生において、予め複数の再生パターンを用意しておき、一連の動画像符号化データの再生中に、分岐点において再生する動画像の符号化データに分岐させ、分岐した動画像データの再生が終わると、本編の動画像データの再生に復帰することで、複数のストーリの再生を可能にするというものである。ここで、再生する符号化データの分岐点や本編の動画像データへ復帰する結合点で、途切れなく連続再生が可能となるものをシームレス・マルチストーリと呼ぶ。
図9(A)及び(B)は、本編映像(図中セグメントi−1)から3つのストーリ(図中セグメントi、i+1,i+2)に分岐し、本編(図中セグメントi+3)に戻る場合の符号化データの例を示している。
本実施形態では、少なくとも分岐単位でセグメントを分割して符号化を行う。H.264などでの符号化では、分岐点や結合点で、シームレスな再生を可能とするためには、従来の(1)仮想バッファレベルの接続性、(2)フィールド位相の連続性、(3)フレーム間予測の切断、を保証すると共に、分岐点及び結合点で、タイミング情報の連続性を保証する必要がある。一方、分岐した各ストーリ(図中セグメントi、i+1,i+2)に対応する動画像フレーム数が、一定とはならない場合、分岐した各ストーリに対応する符号化データにおける終端のBP長(図中300,301,302)は一般に一定とはならない。
複数のストーリから単一の本編ストーリに復帰する場合、どのストーリに対応する符号化データからも、シームレスに本編の符号化データに接続可能とする必要があるが、図9(A)のように、最終BP長の異なる複数のセグメントの全てから、それぞれシームレスに接続が可能な単一のセグメントの符号化データを生成することは困難である。
一方、図9(B)に示すように、本実施形態によれば、セグメント内の最終BP以外のBP、例えば各セグメントの後ろから2番目のBP(図中303、305)でBP長(フレーム数)を調整することで、分岐した各ストーリ(図中セグメントi、i+1,i+2)に対応する符号化データにおける終端のBP長(図中300,304,306)が一定値とすることが可能となり、複数の符号化データから本編の符号化データへの結合点で、いずれの符号化データからもシームレスに本編の符号化データに復帰して途切れなく連続再生することが可能となる。
[9]BP長制御の具体的な実施方法
次に、図3〜図6を用いて、本実施形態に係るBP長制御(図2のステップS112)の具体的な実施方法を説明する。
[9−1]第1の方法
図3は、図7(B)で示すように、各セグメントの先頭BPでBP長を補正する場合の制御フローチャートである。
BP分割制御が開始されると(ステップS120)、まず、セグメントの先頭フレームかどうかの判断を行う(ステップS121)。
次に、セグメントの先頭であれば、変数RemNumPicBpに0を設定し、変数RemNumPicSegに当該セグメントの総フレーム数を示すNumPicSegを設定し、変数Nに所定の標準BP長を示すStdNumPicBpを設定する(ステップS122)。ここで、変数RemNumPicBpは、次のBP先頭フレームまでの残りフレーム数を示し、変数RemNumPicSegは、当該セグメント内の残りフレーム数を示している。
次に、変数RemNumPicBpが0かどうかの判断を行い(ステップS123)、RemNumPicBpが0の場合、次に符号化するフレームがBPの先頭フレームとなる。RemNumPicBpが0の場合、RemNumPicBpにNを設定する(ステップS124)。さらに現在のフレームがセグメント先頭フレームで、かつ、変数NumPicSegを変数Nで割った余りがゼロで無い場合、すなわち当該セグメントの総フレーム数が、標準BP長で割り切れない場合(ステップS125が「Yes」の場合)、最初のBP長がNumPicSegをNで割った余りとなるように、RemNumPicBpを上書き修正する(ステップS126)。
次に、変数RemNumPicBpとRemNumPicSegからそれぞれ1を減じる(ステップS127)。
以上の処理により、当該セグメントの総フレーム数が、標準BP長で割り切れない場合に、当該セグメントの最初のBP長を補正することで、当該セグメントの終端のBP長を標準BP長にすることが可能となり、上記したように、独立したセグメントの並列符号化や、セグメント単位での符号化データの編集、また、シームレス・マルチストーリへの対応などを容易に行うことが可能となる。
[9−2]第2の方法
図4は、図7(C)、図8(B)及び図9(B)で示すように、各セグメントの終端から2番目のBPでBP長を補正する場合の制御フローチャートである。
BP分割制御が開始されると(ステップS130)、まず、セグメントの先頭フレームかどうかの判断を行う(ステップS131)。
次に、セグメントの先頭であれば、変数RemNumPicBpに0を設定し、変数RemNumPicSegに当該セグメントの総フレーム数を示すNumPicSegを設定し、変数Nに所定の標準BP長を示すStdNumPicBpを設定する(ステップS132)。ここで、変数RemNumPicBpは、次のBP先頭フレームまでの残りフレーム数を示し、変数RemNumPicSegは、当該セグメント内の残りフレーム数を示している。
次に、変数RemNumPicBpが0かどうかの判断を行い(ステップS133)、RemNumPicBpが0の場合、次に符号化するフレームがBPの先頭フレームとなる。RemNumPicBpが0の場合、RemNumPicBpにNを設定する(ステップS134)。さらに当該セグメントの残りフレームRemNumPicSegが標準BP長であるNより大きく、Nの2倍より小さい場合(ステップS135が「Yes」の場合)、BP長を示すRemNumPicBpを2N−RemNumPicSeg−Nの値で上書き修正する(ステップS136)。
次に、変数RemNumPicBpとRemNumPicSegからそれぞれ1を減じる(ステップS137)。
以上の処理により、当該セグメントの残りフレーム数が、標準BP長で割り切れない場合に、上記の処理により当該セグメントの最後から2番目のBP長を補正し、当該セグメントの終端のBP長を標準BP長にすることが可能となり、上記したように、独立したセグメントの並列符号化や、セグメント単位での符号化データの編集、また、シームレス・マルチストーリへの対応などを容易に行うことが可能となる。
[9−3]第3の方法
図5は、図8(B)で示すように、各セグメントの符号化中に、シーンチェンジ点を検出して、シーンチェンジ点がBP境界となるようにBP長の補正をすると共に、当該セグメントの終端から2番目のBPでBP長を補正する場合の制御フローチャートである。
図5の実施形態は、図4の実施形態に加えて、セグメント先頭以外でのシーンチェンジ検出ステップS140が追加され、また、BP先頭の判断を行う図4におけるステップS133が、BPの残りフレーム数を示すRenNumPicBpが0かどうか、またはシーンチェンジ点が検出されたかどうかで、BP境界を決定するステップS141に置き換わったものであり、その他の処理は図4と同様である。
シーンチェンジ検出ステップS140では、入力動画像のフレーム間差分値を計算し、フレーム間差分値が所定以上の大きさのときに、シーンチェンジ点であると判断する。
以上の処理により、シーンチェンジ点でBPを打ち切って次のBPを開始すると共に、セグメントの終端のBP長を固定とすることが可能となり、シーンチェンジ点からのランダム再生を容易にすると共に、上述したように、独立したセグメントの並列符号化や、セグメント単位での符号化データの編集、また、シームレス・マルチストーリへの対応などを容易に行うことが可能となる。
[9−4]第4の方法
図6は、図8(B)で示すように、各セグメントの符号化中に、外部より設定されるチャプタ点の情報に基づいて、チャプタ点がBP境界となるようにBP長の補正をすると共に、当該セグメントの終端から2番目のBPでBP長を補正する場合の制御フローチャートである。
図6の実施形態は、図5の実施形態におけるシーンチェンジ検出ステップS140がチャプタ点設定ステップS150に置き換わり、また、BP先頭の判断を行うステップS141が、BPの残りフレーム数を示すRenNumPicBpが0かどうか、または次に符号化されるフレームがチャプタ点のフレームかどうかで、BP境界を決定するステップS151に置き換わったものであり、その他の処理は図5と同様である。
チャプタ点設定ステップS150では、外部より動画像フレームのフレーム番号またはタイムコードでチャプタ点が指定され、次に符号化されるフレームのフレーム番号またはタイムコードと、チャプタ点のフレーム番号またはタイムコードとの照合を行い、チャプタ点の判断を行う。
以上の処理により、チャプタ点でBPを打ち切って次のBPを開始すると共に、セグメントの終端のBP長を固定とすることが可能となり、チャプタ点からのランダム再生を容易にすると共に、上述したように、独立したセグメントの並列符号化や、セグメント単位での符号化データの編集、また、シームレス・マルチストーリへの対応などを容易に行うことが可能となる。
[10]フィールド位相の制御
次に、図10〜図12を用いて、本実施形態に係るフィールド位相の制御について説明する。
映画などのフィルム素材などのフレームレートが24fps(Frame Per Second)の素材を符号化して、30fpsのインターレースディスプレイで表示する場合、3:2プルダウンが用いられる。
「3:2プルダウン」は、1フレームの映像信号を復号化後に、偶数ラインだけで構成されるフィールド信号(トップフィールド)と奇数ラインでだけで構成されるフィールド信号(ボトムフィールド)の2つのフィールドに分離し、最初のフィールドを繰り返すことで、3フィールド期間表示するフレームと、2フィールド期間のみ表示するフレームを交互に繰り返すことで、1秒当たり24フレームの信号を、1秒当たり60フィールドの信号に変換して表示するものである。
図10に、3:2プルダウン表示の例を示す。
900〜909はフレームから分離された各フィールドであり、904と902、及び、909と907はそれぞれ同じフィールド信号が繰り返し表示されるものである。
ここで、トップフィールド、ボトムフィールドの順で2フィールド期間表示されるフレームをDとする。
トップフィールド、ボトムフィールド、トップフィールドの順で3フィールド期間表示されるフレームをAとする。
ボトムフィールド、トップフィールドの順で2フィールド期間表示されるフレームをBとする。
ボトムフィールド、トップフィールド、ボトムフィールド、の順で3フィールド期間表示されるフレームをCとする。
3:2プルダウン表示を行う場合は、各符号化画像データに、それぞれ、上記A,B,C,Dのいずれであるかを示す情報が符号化される。
このように、フレーム毎に表示期間が異なる場合、図3〜図6を用いて説明した本実施形態での各セグメントの終端BP長の制御で、終端BPの符号化フレーム数を一定にするだけでは、上述した独立したセグメントの並列符号化や、セグメント単位での符号化データの編集、また、シームレス・マルチストーリへの対応などを容易に行うことが出来ない場合がある。
図11の(A)〜(C)は、それぞれ3:2プルダウンによる表示及び復号期間が2フィールド期間、3フィールド期間と交互の変わる場合の、各セグメント終端部分を表示順で示している。
図11(A)では、1,3,5,7で示したフレームが3フィールド期間表示されるフレームであり、2,4,6,8で示したフレームが2フィールド期間表示されるフレームである。
図11(B)では、2,4,6,8で示したフレームが3フィールド期間表示されるフレームであり、1,3,5,7で示したフレームが2フィールド期間表示されるフレームである。図中、802,804及び806が各セグメントの終端BPを構成する符号化画像であり、この例では、終端BPのフレーム数が5フレームとなるように、調整されたものである。同じ5フレームに調整されていても、図11(A)と(B)のように、3:2プルダウンのフィールド位相が異なっていると、そのBPの表示及び復号期間が一定とならないため、後段に接続される最初のBPにおけるcpb_removal_delayを一定にすることが出来ない。図11(A)では最終BPの表示時間は12フィールドとなるが、図11(B)では最終BPの表示時間は13フィールドとなる。各BPの最初の符号化画像におけるcpb_removal_delayについては、直前のBPの先頭の符号化画像の復号化時刻からの遅延時間が符号化されるため、図11(A)或いは(B)に接続される後続のセグメント先頭のBPにおいて、cpb_removal_delayの値が必ずしも一定とはならない。
一方、本実施形態によれば、各セグメントの最終BPを構成する画像の3:2プルダウンパターンを一致させることで、3:2プルダウンを用いる場合でも、表示及び復号期間が一定となり、最終BPの次に接続されるセグメントの最初のcpb_removal_delayの値を、直前のセグメントの符号化の終了を待たずに、固定的に設定することが可能となる。
各セグメントの最終BPを構成する画像の3:2プルダウンパターンを一致させるには、各セグメントの最後から2番目のBPにおいて、3:2プルダウンパターンを調整すればよく、図11では、(B)の終端BPの3:2プルダウンパターンを(A)のそれと同じするため、(B)の「3」で示した2フィールド期間表示の符号化画像を、図11(C)の「3’」のように3フィールド期間表示に変更することで、「3’」に続く「4」〜「8」の符号化画像の3:2プルダウンパターンは、(A)と同様の「4’」〜「8’」のパターンに自動的に設定される。
3:2プルダウンのフィールド位相は、図10のA〜Dで示す4パターンとなるが、トップフィールド同士、あるいはボトムフィールド同士が連続しないという制約化下でのフィールド位相の調整は可能である。
図12(a)〜(d)は、セグメント終端BPにおいて3:2パターンが異なる4つのセグメント終端例を表示順で示している。図12中のA、B、C、Dは、各符号化フレームの図10に示した表示フィールドパターンを示している。
図11で示したように、セグメント終端BPにおいて3:2パターンを常に一定にするためには、当該BP直前のBPの表示フレームの3:2パターンを調整すればよい。その際に、表示フィールドの連続性を考慮して調整する必要がある。
図20は、図11の3:2パターンを考慮して、連続するフレームをシームレスに再生可能となるように3:2パターンを調整する変換テーブルである。図20において、「OK」と記載されたパターンは表示フィールドの連続性が保障された3:2パターンで、例えば「A→D」と記載されたものは、直前フレームの3:2パターンを「A」から「D」に変更することで、表示フィールドの連続性が保障されることを示している。
図20の制御パターンに従って、図12(a)〜(d)のセグメント終端BPの3:2パターンを一定になるように、その直前BPの最後の表示フレームを調整した例が、図12(a’)〜(d’)である。
また、図12(a’’)〜(d’’)は、セグメント終端BPの3:2パターンを一定になるように、その直前BPの最後の表示フレームの3:2パターンが一定となるように調整した例である。
このように、3:2プルダウンの位相パターンを調整することで、最終BPが所定の位相パターンになるように制御することが出来る。
フィールド位相の制御パターンは、図20のように予めテーブル化しておき、図2に示した各セグメントの符号化フローチャートにおけるBP分割制御(ステップS112)で、BPのフレーム数の制御と合わせてフィールド位相調整処理を行い、各セグメントの符号化を行えばよい。
以上のように、各セグメントの符号化時に、各セグメントの最終BPのフレーム数とフィールド位相が所定値となるように調整を行うことで、3:2プルダウン表示を用いる場合においても、上述したように、独立したセグメントの並列符号化や、セグメント単位での符号化データの編集、また、シームレス・マルチストーリへの対応などを容易に行うことが可能となる。
[11]動画像符号化装置の構成
次に、図13〜図15を用いて、本実施形態に係る動画像符号化装置の構成について説明する。
図13〜図15は、上記説明した符号化方法を実現する動画像符号化装置の構成を示すものであり、各処理手段は専用ハードウエアで構成されてもよく、また専用プロセッサとソフトウエア、或いは汎用CPUとソフトウエアで構成されても良い。また、これが混在する構成としてもよい。
[11−1]第1の構成
図13は、図1で示した符号化処理フローチャートを実現する動画像符号化装置の構成を示すブロック図である。
符号化対象の動画像信号は、ランダム読み出しが可能なハードディスクや大容量メモリなどで構成される蓄積メディア400に保存されている。
セグメント分割部401は、蓄積メディア400の動画像信号を複数のセグメントに分割し、分割されたセグメント毎に順次原画像データを読み出し、1つまたは複数の符号化手段402から403にセグメント毎に振り分けて入力する。
各符号化手段402〜403は、その個数に応じて、入力された原画像データをセグメント単位で順次並列に符号化し、各符号化データは、一時保存用のメモリ或いはハードディスクなどの蓄積メディア404〜405に、セグメント毎に出力される。
各セグメントの符号化が完了すると、符号化データ接続部406が、符号化データの一時保存用の蓄積メディア404乃至405から、各セグメントの符号化データを表示すべき順序で読み出して結合し、最終的な符号化データを蓄積メディア407へ出力する。
[11−2]第2の構成
図14は、図13の構成に加えて、シーンチェンジ検出部409が、原画像が保存されている蓄積メディア400とセグメント分割部401との間に挿入され、また、チャプタ点制御部408が、セグメント分割部401に接続された構成である。
図14で示す第2の構成では、符号化対象の動画像信号のシーンチェンジ点をシーンチェンジ検出部409で検出し、また、再生時にランダムアクセスを行いたいチャプタ点を、フレーム番号またはタイムコードとして、チャプタ点制御部408に予め設定しておき、シーンチェンジ点或いはチャプタ点で、セグメントを分割して符号化するようにセグメント分割部401が制御を行うものである。
セグメント境界は、フレーム間予測が切断されるため、再生時のランダムアクセスが容易となる。
また、第2の構成では、セグメント単位での符号化データの編集が可能となるように符号化されるため、シーンチェンジ点やチャプタ点をセグメント境界と一致させることで、符号化後のシーン単位或いはチャプタ単位の編集が容易な符号化データを生成することが可能となる。
[11−3]第3の構成
図15は、図13の各符号化手段(402〜403)の内部構成を示すブロック図である。
図15で示す符号化手段には、当該セグメントの原画像データ500がフレーム単位で順次入力され、必要に応じてシーンチェンジ検出手段501によりシーンチェンジ点の検出が行われ、また、再生時にランダムアクセスを行いたいチャプタ点を、フレーム番号またはタイムコードとして、チャプタ点制御部502に予め設定しておき、BP分割制御部503が、周期的なBP分割に加えて、シーンチェンジ点或いはチャプタ点で、強制的にBPの分割を行う制御が行われる。
画像符号化部504では、入力される動画像フレームを順次符号化し、符号化データ505が出力される。
シーンチェンジ点やチャプタ点やBP分割点とすることで、再生時のランダムアクセスなどが容易となり、また、シーンチェンジ検出処理を、各符号化手段(402〜403)の内部に持つことで、シーンチェンジ検出が符号化手段の並列度に合わせて並列化されるため、図14に示すように、1つのシーンチェンジ検出手段でシーンチェンジ検出を行う場合と比較して、より高速にシーンチェンジ検出を行うことが可能となる。
[11−4]構成のまとめ
以上の図13〜図15で示した動画像符号化装置を用いて、図1〜図12で説明した、本実施形態に係る動画像符号化方法で動画像信号の符号化を行うことで、上記したように、独立したセグメントの並列符号化や、セグメント単位での符号化データの編集、また、シームレス・マルチストーリへの対応などを容易に行うことが可能となる。
また、3:2プルダウン表示を行う場合においても同様に、独立したセグメントの並列符号化や、セグメント単位での符号化データの編集、また、シームレス・マルチストーリへの対応などを容易に行うことが可能となる。
[12]各BPがGOPと同じ構造を持つ場合
次に、本実施形態における各BPがMPEG2ビデオ規格(ISO/IEC13818-2)で定義されるGOP(Group of Pictures)と同じ構造を持つ場合を考える。
GOPは、符号化順で最初のピクチャは、フレーム内符号化画像であるIピクチャとして符号化され、当該Iピクチャに引き続きGOP内では、片方向フレーム間予測符号化を行うPピクチャと双方向フレーム間予測符号化を行うBピクチャとが組み合わされて符号化される。つまり、各GOPには必ず1つ以上のIピクチャが含まれることになる。フレーム間予測を行わず単一フレームでの復号が可能なIピクチャが必ず入ることで、GOP単位でのランダムアクセスや早送り再生が容易となる。
そして各BPがGOP構造を取る場合を考えると、各BPには必ず1つ以上のIピクチャが含まれることになる。Iピクチャは、フレーム間相関を用いずに符号化されるため、通常PピクチャやBピクチャより圧縮効率が低くなる。また、BP先頭(すなわちGOP先頭)のIピクチャは、BP内のフレーム間予測の起点となるため、BP全体の圧縮画像の画質を高めるため、通常他のPピクチャやBピクチャよりもより高画質に圧縮されるケースが多い。
符号化効率の悪いIピクチャを、より高画質に圧縮するため、Iピクチャでは、非常に多くのデータ量が発生する。そのためIピクチャが頻繁に符号化されると、一定の画質を得るための符号量が増加し、また一定の符号量下では量子化により画質が低下する。つまり、一般的にはBP長が短いほど平均的な符号化効率は低下し、BP長が長いほど平均的な符号化効率は向上する。
しかし、上述したようにBPの先頭がIピクチャとして符号化されることにより、ランダムアクセス性や早送り再生などを容易にしているため、BP長が長くなると、これらの再生時の機能性が低下する。
[12−1]第1のBP長制御方法
図21は、図3〜図6で示した本実施形態に係る第1のBP長制御方法により補正されたBP長の例を示したものである。
図3〜図6で示した実施形態では、各セグメントを構成するフレーム数に、標準BP長に対する端数が生じた場合、端数のフレーム数に相当する短いBPを、セグメントの先頭またはセグメント終端から2番目の位置に配置するというものである。
したがって、図21に示す第1のBP長制御方法によって補正されるBP長は、標準BP長より短いものとなる。この場合、ランダムアクセス性の低下は発生しないが、補正された短いBPでは符号化効率の低下が発生する。
[12−2]第2のBP長制御方法
図22〜図24は、本実施形態に係る第2のBP長制御方法を示す図である。
図22で示すように、第2のBP長制御方法では、端数フレーム数に相当する短いBPを発生させる代わりに、端数フレーム数を標準BP長に加算した長いBPを用いて、端数フレーム数を補償するものである。
図22のBP制御は、図3〜図6で示したBP分割制御方法の代わりに、図23あるいは図24で示したBP分割制御方法を用いることで実現できる。
図23は、セグメント先頭のBPで端数フレーム数を補償するものである。図3における制御フローチャートで、ステップS126の部分を、図23のステップS226に置き換えて、セグメント先頭のBP長を端数フレーム数と標準BP長Nとの和とすることで実現できる。
図24は、セグメント終端から2番目のBPで端数フレーム数を補償するものである。図4における制御フローチャートで、ステップS135の条件判定部分を、図24のステップS235に置き換えて、セグメント内で符号化されていない残りフレーム数が、標準BP長Nの2倍より大きく3倍より小さくなったBP境界で補正BPを設定することで実現できる。
以上により、端数フレーム数をBP長が標準BP長よりも長いBPで補償することにより、短いBPの発生を回避し、端数フレームによる符号化効率の低下を防ぐことが可能となる。
[12−3]第3のBP長制御方法
図25〜図27は、本実施形態に係る第3のBP長制御方法を示す図である。
図25で示すように、第3のBP長制御方法では、図22と同様に符号化効率の低下を抑制するため、端数フレーム数に相当する短いBPを発生させる代わりに、端数フレーム数を標準BP長に加算した長いBPを用いて端数フレーム数の補償を行うが、補正BP長が予め設定されている最大BP長を超える場合のみ、図21と同様の端数フレーム数に相当する短いBPを用いるものである。
図25に示したBP制御は、図3〜図6で示したBP分割制御方法の代わりに、図26あるいは図27で示したBP分割制御方法を用いることで実現できる。
図26は、セグメント先頭のBPで端数フレーム数を補償するものである。図3における制御フローチャートで、ステップS126の前段で、補正BP長が最大BP長Nmaxを超えるかどうかの判断を行う(ステップS229)。
最大BP長を超える場合は、図3と同様に端数フレーム数に相当する短いBPをセグメント先頭に設定する(ステップS126)。
補正BP長が最大BP長Nmaxを超えない場合、図23と同様にセグメント先頭のBP長を端数フレーム数と標準BP長Nとの和とする(ステップS226)。これにより、図25のBP長制御が実現できる。
図27は、セグメント終端から2番目のBPで端数フレーム数を補償するものである。図24と同様にセグメント内で符号化されていない残りフレーム数が、標準BP長Nの2倍より大きく、3倍より小さくなったBP境界で補正BP長を計算する。
補正BP長が、最大BP長Nmaxを超えない場合(ステップS236が「Yes」)は、図24と同様に標準BP長Nよりも長い補正BP長を設定する(ステップS136)。
補正BP長が、最大BP長Nmaxを超える場合(ステップS236が「No」)は、長い補正BP長の配置は行わず標準BP長Nを用いる。さらに、残りフレーム数が、標準BP長Nより大きく、2Nより小さくなったBP境界(ステップS135が「Yes」)で、図4と同様に短い補正BPを用いる。そして、セグメント終端のBP長を固定とし、セグメント終端から2番目のBP長を最大BP長Nmaxを超えない範囲で補正する。これにより、セグメント内のBP長の端数を調整することが実現できる。
以上により、セグメント内の端数フレーム数補償のための補正BPを、最大BP長を超えず、かつ、短い補正BP長の発生を最小限に抑えて設定することが可能となり、ランダムアクセス性や早送り再生の機能性を維持しつつ、符号化効率の低下を抑えることが可能となる。
[12−4]第4のBP長制御方法
図28及び図29は、本実施形態に係る第4のBP長制御方法を示す図である。
図28で示すように、第4のBP長制御方法では、図22と同様に符号化効率の低下を抑制するため、端数フレーム数に相当する短いBPを発生させる代わりに、端数フレーム数を標準BP長に加算した長いBPを用いて端数フレーム数の補償を行う。このときに、補正BP長が予め設定されている最大BP長Nmaxを超える場合は、複数のBPに渡って最大BP長を超えない範囲で、標準BP長Nより長いBPを設定することで、端数フレーム数の補正を行う。
これにより、端数フレーム数の補償を標準BP長Nより短いBPを用いることなく実現できるため、符号化効率の低下が発生しない。
また、最大BP長を超えるBPも発生しないため、ランダムアクセスや早送り再生などの機能性を低下させることもない。
図29は、第4のBP長制御方法を実現するための制御フローチャートである。
第4のBP長制御方法では、各セグメント内で、複数のBPを用いて端数フレーム数の補償を行うため、セグメントの先頭でBPの最適な配置を一括して決定する。
BP分割制御が開始されると(ステップS300)、まずセグメントの先頭フレームかどうかを判断する(ステップS301)。
セグメントの先頭フレームであれば、当該セグメント内のBP構成を一括して決定し、i番目のBPを構成するフレーム数をRemNumPicBp[i]として設定し、また、セグメント内BPのカウンタbpnumに0をセットする。BP構成の一括設定は、まずセグメント内の端数フレーム数を計算し、標準BP長Nと端数フレーム数との和が最大BP長Nmaxを超えなければ、セグメント内の最後のBPを除く他のBPの何れか1つの長さを、標準BP長Nと端数フレーム数との和として設定する。
また、標準BP長Nと端数フレーム数との和が最大BP長Nmaxを超える場合、まず、セグメント内の最後のBPを除く他のBPの何れか1つの長さを最大BP長とし、残りの端数フレーム数を計算する。さらに残りの端数フレーム数と標準BP長Nとの和が最大BP長Nmaxを超える場合は、セグメント内の最後のBPを除く別のBPの何れか1つの長さを最大BP長とする。残りの端数フレーム数と標準BP長Nとの和が最大BP長Nmaxを超えない場合は、残りの端数フレーム数と標準BP長Nとの和となるBPを、セグメント内の最後のBPを除く他のBPの何れか1つに設定する。
このようにして、端数フレームがなくなるまで繰り返し補正BPを追加していく。
以上の処理を、セグメントの先頭で一括して行い(ステップS302)、設定されたBP構成RemNumPicBp[i]に従って、順次符号化を行っていく。bpnum番目のBP符号化中は、1フレーム符号化する毎にRemNumPicBp[bpnum]から1を減じて(ステップS305)、RemNumPicBp[bpnum]が0となった時点(ステップS303が「Yes」)で、bpnumに1を加算し(ステップS304)、次のBPの符号化を開始する。
以上のように制御することで、図28に示したように端数フレームの数によらず、常に標準BP長N以上で最大BP長Nmax以下のBPで符号化することが可能となり、符号化効率の低下なく、かつ、ランダムアクセスや早送り再生などの機能性も維持したまま、端数フレーム数の補償を行うことが可能となる。
(第2の実施形態)
次に、本発明の第2の実施形態を図30〜図34に基づいて説明する。
本実施形態は、仮想受信バッファモデルとの関係においてBP配置を最適化する方法である。
[1]第1の最適化方法
まず、第1の最適化方法について説明する。
図33は、セグメント内のBP配置と仮想受信バッファモデルのバッファ占有量変動を示す図である。
「仮想受信バッファモデル」とは、デコーダ側の受信バッファのモデルであり、本モデルがオーバーフローやアンダーフローしないように符号化することが必要となる。
また、セグメント分割エンコードを行い、分割生成された符号化データを接続してシームレスに再生することを保障するためには、仮想バッファモデルの連続性が保障されなければならない。
本実施形態では、MPEG−2ビデオ規格で規定されるVBV(Video Buffering Verifier)モデルにおける可変ビットレートモデルを用いた場合の例を示す。
また、本実施形態では、上述の通り各BPを従来のGOP構造と対応させ、BPで最初に符号化されるピクチャがIピクチャであるとする。上述の通りIピクチャは発生符号量が多いため、通常VBVバッファモデルではBP先頭でバッファ占有量が急激に低下し、それに引き続くPピクチャ及びBピクチャで徐々にバッファ占有量が回復する。図33(a)はその様子を示すものである。
なお、セグメント間の接続性を保障するためには、例えば、所定の目標バッファレベルを定め、各セグメント始点のVBVバッファ占有量を、所定の目標バッファレベルに合わせ、また各セグメント終端におけるVBVバッファ占有量が目標バッファレベル以上となっていれば、VBVバッファの破綻なく、セグメント毎に符号化された圧縮データを接続することが可能となる。
MPEG−2で規定される可変ビットレートのVBVモデルでは、オーバーフローは発生せず、アンダーフローのみが禁止されるため、各セグメント終端のバッファ占有量が所定値以上となっていることで、セグメント毎に符号化された圧縮データを接続しても、バッファ占有量が下がることがないため、アンダーフローは発生しない。
また、MPEG−2で規定される固定ビットレートのVBVモデルでは、オーバーフロー及びアンダーフローが禁止されるが、各セグメント終端のバッファ占有量が所定値以上となっていれば、セグメント間の接続点においてスタッフィングデータを挿入することで、完全にシームレスな接続が可能となる。
図33(b)は、セグメント中の端数フレーム数を補償するために、セグメント終端から2つめのBP長が短くなるように制御された例を示す。
BP長が短くなると、IピクチャでのVBVバッファ占有量の低下が十分回復する前に次のBPのIピクチャが来るため、VBVバッファ占有量がアンダーフロー方向にずれ込む。セグメント終端付近でVBVバッファレベルの低下が発生すると、セグメント終端までにバッファ占有量を所定値まで回復させることが困難となる場合があり、セグメント終端でバッファ占有量を所定値まで回復できなければ、VBVの破綻なくセグメント毎の符号化データを接続することが保障されない。
また、セグメント終端付近で強制的に発生符号量を抑制することで、短時間でVBVバッファ占有量を回復させることは可能であるが、その場合発生符号量を抑制したことによる画質劣化が発生する。
一方、本実施形態では、図33(c)のように、端数フレーム数の補償のため、短いBPが必要になった場合は、必ずセグメント先頭に配置する構成とすることができる。その場合、短いBPにより低下したVBVバッファ占有量を、セグメント内の残りのBPの符号化で徐々に回復させることが可能となり、大きな画質劣化を伴わずに、セグメント終端のバッファレベルが所定値以上になるように制御することが容易となる。
これにより、セグメント毎の符号化データの接続性の補償を、より安定的に行うことが可能となる。
[2]第2の最適化方法
次に、本実施形態において、仮想受信バッファモデルとの関係においてBP配置を最適化する第2の最適化方法について説明する。
図34は、図33と同様に可変ビットレートのVBVモデルにおける、VBVバッファ占有量変動とBP長制御との関係を示している。
図34(a)には、バッファ占有量と共に符号化困難度の例も合わせて記載している。可変ビットレート符号化では、符号化困難度の低いとこでは符号量を抑えて、また符号化困難度の高いところでは符号量を増やして符号化することで、より低い平均符号量で、安定した画質を得ることができる。MPEG−2のVBVモデルに従えば、符号量を抑えた部分では、VBVバッファ占有量レベルは上昇し、VBVバッファサイズで飽和する。
また、発生符号量を増やした部分では、VBVバッファ占有量は低下し、そのためVBVアンダーフローの危険性が増す。
図34(a)は、BP長の制御がなく安定して符号化できた例であるが、図34(b)のように、同じ映像素材でセグメント終端から2つめのBP長が短く制御されると、図33(b)と同様にセグメント終端でVBVバッファレベルが所定値以上とならず、セグメント間の接続性が満たせなくなるケースがある。
一方、図34(c)で示すように、符号化困難度が低くVBVバッファ占有量が高くなる部分に、端数フレームを補償するための短いBPを配置することで、安定してセグメント終端でのVBVバッファレベルが所定値以上となるように制御することが可能となる。
上述した通り、符号化困難度が低ければ、一般にVBVバッファ占有量は上昇するため、事前に符号化困難度を検出することで、最適なBP配置を設定することが可能となる。また、VBVバッファレベルを事前に推定することでも、同様に最適なBP配置を決定することが可能である。このような、最適なBP配置の決定は、2パス符号化方式を用いることで容易に実現できる。
[3]2パス符号化方法
ここで、まず本実施形態に関わる2パス符号化方法について説明する。
図30は、VTRやハードディスクドライブなどの記録メディアに保存された動画像信号を、仮符号化と本符号化の2回の符号化を行うことで、最適なビット配分を行う2パス可変ビットレート符号化方式の従来例を示す図である。2パス可変ビットレート符号化方式は、例えば特許第3734286号公報などの方法により実現することが可能である。
2パス可変ビットレート符号化方式では、まず動画像シーケンス全体に渡る仮符号化を行い(ステップS311)、その時の発生符号量などの統計量から、フレームあるいはシーン単位の符号化困難度を計算し(ステップS312)、得られた符号化困難度に応じて、動画像シーケンス全体に渡りフレームあるいはシーン単位に符号量配分(ビットアロケーション)を行い(ステップS312)、配分された符号量に基づいて動画像シーケンス全体に渡る本符号化を行う(ステップS314)。
[4]最適BP配置方法
次に、図31及び図32を用いて、図34(c)で示した本実施形態に係る最適BP配置方法について説明する。
図31では、図30の2パス符号化における符号化困難度計算(ステップS312)処理の後に、セグメント内または動画像シーケンス全体に渡るBP配置を決定するBPマッピング処理(ステップS316)が追加され、BPマッピング処理では、端数フレーム数を補償するために短いBPが必要となった場合に、ステップS312で計算された符号化困難度が小さくなる位置に、短いBPをマッピングする。そして、2パス符号化のためのビットアロケーション(ステップS312)及びBPマッピング処理(ステップS316)の結果を用いて、本符号化(ステップS314)を行うことで、最適ビット配分及び最適BP配置での符号化を行うことが可能となる。
図32は、図31の変形例であり、符号化困難度計算(ステップS312)の結果に応じて、VBVバッファ占有量の時間変動を推定し(ステップS317)、端数フレーム数を補償するために短いBPが必要となった場合に、BPマッピング処理(ステップS316)において、ステップS317で計算したVBVバッファ占有量推定値が最も高くなる部分に短いBPを配置する。これにより、図31の実施形態と同様に、最適ビット配分及び最適BP配置での符号化を行うことが可能となる。
(変更例)
本発明は上記各実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
例えば、本実施形態は、H.264に限定されるものではなく、H.264と同様の制約のある他の動画像符号化方式についても、適用可能なものである。
本発明の第1の実施形態に係る動画像符号化方法の処理フローチャートを示すフローチャートである。 動画像符号化方法の処理フローチャートを示すフローチャートである。 動画像符号化方法の処理フローチャートを示すフローチャートである。 動画像符号化方法の処理フローチャートを示すフローチャートである。 動画像符号化方法の処理フローチャートを示すフローチャートである。 動画像符号化方法の処理フローチャートを示すフローチャートである。 BP長制御を説明する図である。 BP長制御を説明する図である。 BP長制御を説明する図である。 3:2プルダウンを説明する図である。 符号化フィールド位相の制御を説明する図である。 符号化フィールド位相の制御を説明する図である。 動画像符号化装置の構成を示すブロック図である。 動画像符号化装置の構成を示すブロック図である。 動画像符号化装置の構成を示すブロック図である。 動画像符号化データのデータ構造を示す図である。 動画像符号化データのデータ構造を示す図である。 動画像符号化データのデータ構造を示す図である。 動画像符号化データのタイミング情報を説明する図である。 3:2プルダウンパターン修正テーブルである。 第1のBP長制御方法のBP長補正を説明する図である。 第2のBP長制御方法のBP長補正を説明する図である。 第2のBP長制御方法のBP長制御を説明するフローチャートである。 第2のBP長制御方法のBP長制御を説明するフローチャートである。 第3のBP長制御方法のBP長補正を説明する図である。 第3のBP長制御方法のBP長制御を説明するフローチャートである。 第3のBP長制御方法のBP長制御を説明するフローチャートである。 第4のBP長制御方法のBP長補正を説明する図である。 第4のBP長制御方法のBP長制御を説明するフローチャートである。 従来の2パス符号化方式を説明する図である。 第2の実施形態に係る2パス符号化方式を説明する図である。 図31の変形例であり、2パス符号化方式を説明する図である。 BP長補正を説明する図である。 BP長補正を説明する図である。
符号の説明
S102・・・セグメント分割ステップ
S112・・・画像群分割制御ステップ
S116・・・画像符号化ステップ
S115・・・タイミング情報符号化ステップ
S105・・・セグメント符号化データ結合ステップ
S140・・・シーンチェンジ検出ステップ
S150・・・チャプタ点設定ステップ
401・・・セグメント分割部
503・・・画像群分割制御部
406・・・符号化データ結合部
504・・・画像符号化部
409,501・・・シーンチェンジ検出部
408,502・・・チャプタ点制御部

Claims (13)

  1. 入力動画像を時間方向に複数のセグメントに分割する第1分割部と、
    前記各セグメント内を、連続する複数のフレームを含む複数の画像群に分割するものであって、前記各セグメントの終端の画像群が予め定められた数のフレームを含むように分割する第2分割部と、
    前記各セグメントに含まれる前記複数の画像群を、一つ前の画像群の先頭フレームの時間情報に基づいて復号化及び表示に関するタイミング情報を求めながら符号化を行い、前記各セグメントの符号化データを生成する符号化部と、
    前記複数のセグメントの符号化データを結合する結合部と、
    を有する動画像符号化装置。
  2. 前記第2分割部は、前記セグメント内のフレームの総数が前記予め定めた数より小さい端数を有する場合には、(1)前記各セグメント内の先頭の画像群から前記終端の一つ前の画像群までの少なくとも一つの画像群のフレームの数に前記端数を加算するか、または、(2)前記各セグメント内の先頭の画像群から前記終端の一つ前の画像群までの少なくとも一つの画像群の前か後ろに前記端数に相当する数のフレームを有する画像群を追加する、
    請求項1記載の動画像符号化装置。
  3. 前記入力動画像信号が、3:2プルダウンで表示される動画像信号であって、
    前記第2分割部は、前記終端の画像群の符号化フレームにおける表示フィールドの位相が予め定められた値になるように分割する、
    請求項1記載の動画像符号化装置。
  4. 前記入力動画像信号のシーンチェンジ点を検出する検出部をさらに有し、
    前記第2分割部は、前記シーンチェンジ点を境に前記セグメントを画像群に分割する、
    請求項1記載の動画像符号化装置。
  5. 前記入力動画像信号にランダムアクセス点を設定する設定部をさらに有し、
    前記第2分割部は、前記ランダムアクセス点を境に前記セグメントを画像群に分割する、
    請求項1記載の動画像符号化装置。
  6. 前記入力動画像信号が、複数のストーリで構成される複数の動画像信号で構成されるものであって、
    前記セグメントの終端の画像群が、前記複数のストーリの動画像信号への分岐点、または、一つのストーリの動画像信号への結合点である、
    請求項1記載の動画像符号化装置。
  7. 前記第2分割部は、
    前記端数のフレーム数と前記予め定めた数のフレーム数との和と、閾値を比較し、
    前記和が前記閾値より大きい場合には、前記(2)における前記端数に相当する数のフレームを有する画像群を追加し、
    前記和が前記閾値より小さい場合には、前記(1)における前記各セグメント内の先頭の画像群から前記終端の一つ前の画像群までの少なくとも一つの画像群のフレームの数に前記端数を加算する、
    請求項2記載の動画像符号化装置。
  8. 前記第2分割部は、
    前記端数のフレーム数と前記予め定めた数のフレーム数との和と、閾値を比較し、
    前記和が閾値より大きい場合には、前記セグメント内の複数の画像群に関して、前記予め定めた数のフレーム数を超えないようにフレーム数を加算する、
    請求項2記載の動画像符号化装置。
  9. 前記第2分割部は、前記(2)における前記端数に相当する数のフレームを有する画像群を、前記セグメントの先頭に追加する、
    請求項2記載の動画像符号化装置。
  10. 前記入力動画像の符号化するときの困難性を示す符号化困難度を算出する困難度算出部をさらに有し、
    前記第2分割部は、前記(2)における前記端数に相当する数のフレームを有する画像群を、当該セグメント中の前記符号化困難度の低い部分に追加する、
    請求項2記載の動画像符号化装置。
  11. 前記入力動画像の仮想受信バッファ占有量の時間変動を示す占有量推定値を推定する推定部をさらに有し、
    前記第2分割部は、前記(2)における前記端数に相当する数のフレームを有する画像群を、前記セグメント中の前記占有量推定値が高い部分に追加する、
    請求項2記載の動画像符号化装置。
  12. 入力動画像を時間方向に複数のセグメントに分割し、
    前記各セグメント内を、連続する複数のフレームを含む複数の画像群に分割するものであって、前記各セグメントの終端の画像群が予め定められた数のフレームを含むように分割し、
    前記各セグメントに含まれる前記複数の画像群を、一つ前の画像群の先頭フレームの時間情報に基づいて復号化及び表示に関するタイミング情報を求めながら符号化を行い、前記各セグメントの符号化データを生成し、
    前記複数のセグメントの符号化データを結合する、
    動画像符号化方法。
  13. 入力動画像を時間方向に複数のセグメントに分割する第1分割機能と、
    前記各セグメント内を、連続する複数のフレームを含む複数の画像群に分割するものであって、前記各セグメントの終端の画像群が予め定められた数のフレームを含むように分割する第2分割機能と、
    前記各セグメントに含まれる前記複数の画像群を、一つ前の画像群の先頭フレームの時間情報に基づいて復号化及び表示に関するタイミング情報を求めながら符号化を行い、前記各セグメントの符号化データを生成する符号化機能と、
    前記複数のセグメントの符号化データを結合する結合機能と、
    をコンピュータによって実現する動画像符号化プログラム。
JP2007215811A 2006-09-25 2007-08-22 動画像符号化装置及びその方法 Pending JP2008109637A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007215811A JP2008109637A (ja) 2006-09-25 2007-08-22 動画像符号化装置及びその方法
US11/856,479 US20080075172A1 (en) 2006-09-25 2007-09-17 Motion picture encoding apparatus and method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006259781 2006-09-25
JP2007215811A JP2008109637A (ja) 2006-09-25 2007-08-22 動画像符号化装置及びその方法

Publications (1)

Publication Number Publication Date
JP2008109637A true JP2008109637A (ja) 2008-05-08

Family

ID=39224917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007215811A Pending JP2008109637A (ja) 2006-09-25 2007-08-22 動画像符号化装置及びその方法

Country Status (2)

Country Link
US (1) US20080075172A1 (ja)
JP (1) JP2008109637A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010166197A (ja) * 2009-01-14 2010-07-29 Nippon Telegr & Teleph Corp <Ntt> セグメント符号化方法,セグメント符号化装置,セグメント符号化プログラムおよびその記録媒体,並びに,並列エンコードシステム,部分的再エンコードシステム
JP2011528513A (ja) * 2008-07-16 2011-11-17 トムソン ライセンシング 映像および音声データの符号化装置とその符号化方法、および、ビデオ編集システム
KR101087194B1 (ko) * 2009-11-10 2011-11-29 주식회사 노매드커넥션 동영상 인코딩 시스템 및 방법
KR101283791B1 (ko) 2011-09-08 2013-07-08 브로드밴드미디어주식회사 동영상 파일의 분할을 통한 고속 인코딩 시스템과 인코딩 방법
JP2014072854A (ja) * 2012-10-01 2014-04-21 Fujitsu Ltd 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法
WO2020085569A1 (ko) * 2018-10-25 2020-04-30 전자부품연구원 실시간 분할 인코딩 장치 및 방법
KR20220125660A (ko) * 2021-03-05 2022-09-14 주식회사 핀텔 딥러닝 영상 분석을 위한 영상 데이터 전달 시스템 및 그 방법

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7068729B2 (en) * 2001-12-21 2006-06-27 Digital Fountain, Inc. Multi-stage code generator and decoder for communication systems
US6307487B1 (en) * 1998-09-23 2001-10-23 Digital Fountain, Inc. Information additive code generator and decoder for communication systems
US7474327B2 (en) 2002-02-12 2009-01-06 Given Imaging Ltd. System and method for displaying an image stream
US9240810B2 (en) 2002-06-11 2016-01-19 Digital Fountain, Inc. Systems and processes for decoding chain reaction codes through inactivation
EP2348640B1 (en) * 2002-10-05 2020-07-15 QUALCOMM Incorporated Systematic encoding of chain reaction codes
KR101170629B1 (ko) * 2003-10-06 2012-08-02 디지털 파운튼, 인크. 단일 송신기 또는 다중 송신기를 갖는 통신 시스템의 에러 정정 다중-스테이지 코드 생성기 및 디코더
EP1743431A4 (en) * 2004-05-07 2007-05-02 Digital Fountain Inc SYSTEM FOR DOWNLOADING AND RECORDING AND CONTINUOUS READING OF FILES
CN101686107B (zh) * 2006-02-13 2014-08-13 数字方敦股份有限公司 使用可变fec开销和保护周期的流送和缓冲
US9270414B2 (en) 2006-02-21 2016-02-23 Digital Fountain, Inc. Multiple-field based code generator and decoder for communications systems
WO2007134196A2 (en) 2006-05-10 2007-11-22 Digital Fountain, Inc. Code generator and decoder using hybrid codes
US9178535B2 (en) * 2006-06-09 2015-11-03 Digital Fountain, Inc. Dynamic stream interleaving and sub-stream based delivery
US9380096B2 (en) * 2006-06-09 2016-06-28 Qualcomm Incorporated Enhanced block-request streaming system for handling low-latency streaming
US9386064B2 (en) 2006-06-09 2016-07-05 Qualcomm Incorporated Enhanced block-request streaming using URL templates and construction rules
US20100211690A1 (en) * 2009-02-13 2010-08-19 Digital Fountain, Inc. Block partitioning for a data stream
US9209934B2 (en) 2006-06-09 2015-12-08 Qualcomm Incorporated Enhanced block-request streaming using cooperative parallel HTTP and forward error correction
US9419749B2 (en) 2009-08-19 2016-08-16 Qualcomm Incorporated Methods and apparatus employing FEC codes with permanent inactivation of symbols for encoding and decoding processes
US9432433B2 (en) 2006-06-09 2016-08-30 Qualcomm Incorporated Enhanced block-request streaming system using signaling or block creation
US9237101B2 (en) * 2007-09-12 2016-01-12 Digital Fountain, Inc. Generating and communicating source identification information to enable reliable communications
US9281847B2 (en) * 2009-02-27 2016-03-08 Qualcomm Incorporated Mobile reception of digital video broadcasting—terrestrial services
US9288010B2 (en) 2009-08-19 2016-03-15 Qualcomm Incorporated Universal file delivery methods for providing unequal error protection and bundled file delivery services
US9917874B2 (en) 2009-09-22 2018-03-13 Qualcomm Incorporated Enhanced block-request streaming using block partitioning or request controls for improved client-side handling
US8682142B1 (en) * 2010-03-18 2014-03-25 Given Imaging Ltd. System and method for editing an image stream captured in-vivo
JP5972865B2 (ja) 2010-04-28 2016-08-17 ギブン イメージング リミテッドGiven Imaging Ltd. 生体内画像の部分を表示するシステム及びその作動方法
US9485546B2 (en) 2010-06-29 2016-11-01 Qualcomm Incorporated Signaling video samples for trick mode video representations
US8918533B2 (en) 2010-07-13 2014-12-23 Qualcomm Incorporated Video switching for streaming video data
US9185439B2 (en) 2010-07-15 2015-11-10 Qualcomm Incorporated Signaling data for multiplexing video components
US9596447B2 (en) 2010-07-21 2017-03-14 Qualcomm Incorporated Providing frame packing type information for video coding
US8806050B2 (en) 2010-08-10 2014-08-12 Qualcomm Incorporated Manifest file updates for network streaming of coded multimedia data
US8958375B2 (en) 2011-02-11 2015-02-17 Qualcomm Incorporated Framing for an improved radio link protocol including FEC
US9270299B2 (en) 2011-02-11 2016-02-23 Qualcomm Incorporated Encoding and decoding using elastic codes with flexible source block mapping
US9253233B2 (en) 2011-08-31 2016-02-02 Qualcomm Incorporated Switch signaling methods providing improved switching between representations for adaptive HTTP streaming
US9843844B2 (en) 2011-10-05 2017-12-12 Qualcomm Incorporated Network streaming of media data
US9294226B2 (en) 2012-03-26 2016-03-22 Qualcomm Incorporated Universal object delivery and template-based file delivery
CN102761745B (zh) * 2012-07-12 2015-07-22 国家计算机网络与信息安全管理中心 解码方法和解码设备
US9648352B2 (en) 2012-09-24 2017-05-09 Qualcomm Incorporated Expanded decoding unit definition
JP5789004B2 (ja) * 2013-08-09 2015-10-07 ソニー株式会社 送信装置、送信方法、受信装置、受信方法、符号化装置および符号化方法
CN105208381A (zh) * 2014-06-25 2015-12-30 中兴通讯股份有限公司 视频编码方法及装置
CN104519360B (zh) * 2014-12-30 2019-03-01 中国科学院重庆绿色智能技术研究院 一种基于hevc的压缩方法
CN109151545B (zh) * 2018-08-24 2021-08-10 Tcl移动通信科技(宁波)有限公司 一种视频播放界面的图片保存方法、移动终端及存储介质
CN112449196B (zh) * 2019-09-05 2022-10-14 曙光网络科技有限公司 一种并发视频会话ip帧图像组的解码方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774593A (en) * 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
JP3529599B2 (ja) * 1997-09-02 2004-05-24 株式会社東芝 符号化装置における編集可能点挿入方法および符号化装置
JP4005691B2 (ja) * 1998-03-19 2007-11-07 株式会社東芝 動画像符号化方法および動画像符号化装置
JP4193406B2 (ja) * 2002-04-16 2008-12-10 三菱電機株式会社 映像データ変換装置および映像データ変換方法
JP4002878B2 (ja) * 2003-01-17 2007-11-07 松下電器産業株式会社 画像符号化方法
US20050207569A1 (en) * 2004-03-16 2005-09-22 Exavio, Inc Methods and apparatus for preparing data for encrypted transmission
CN101253777A (zh) * 2005-07-01 2008-08-27 极速决件公司 用于在多媒体信号编码中使用的方法、装置和系统
US8645991B2 (en) * 2006-03-30 2014-02-04 Tout Industries, Inc. Method and apparatus for annotating media streams
US8059936B2 (en) * 2006-06-28 2011-11-15 Core Wireless Licensing S.A.R.L. Video importance rating based on compressed domain video features

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011528513A (ja) * 2008-07-16 2011-11-17 トムソン ライセンシング 映像および音声データの符号化装置とその符号化方法、および、ビデオ編集システム
JP2010166197A (ja) * 2009-01-14 2010-07-29 Nippon Telegr & Teleph Corp <Ntt> セグメント符号化方法,セグメント符号化装置,セグメント符号化プログラムおよびその記録媒体,並びに,並列エンコードシステム,部分的再エンコードシステム
KR101087194B1 (ko) * 2009-11-10 2011-11-29 주식회사 노매드커넥션 동영상 인코딩 시스템 및 방법
KR101283791B1 (ko) 2011-09-08 2013-07-08 브로드밴드미디어주식회사 동영상 파일의 분할을 통한 고속 인코딩 시스템과 인코딩 방법
JP2014072854A (ja) * 2012-10-01 2014-04-21 Fujitsu Ltd 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法
WO2020085569A1 (ko) * 2018-10-25 2020-04-30 전자부품연구원 실시간 분할 인코딩 장치 및 방법
KR20220125660A (ko) * 2021-03-05 2022-09-14 주식회사 핀텔 딥러닝 영상 분석을 위한 영상 데이터 전달 시스템 및 그 방법

Also Published As

Publication number Publication date
US20080075172A1 (en) 2008-03-27

Similar Documents

Publication Publication Date Title
JP2008109637A (ja) 動画像符号化装置及びその方法
US7139316B2 (en) System method and apparatus for seamlessly splicing data
US6580829B1 (en) Detecting and coding flash frames in video data
JP2008066847A (ja) 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
US8798162B2 (en) Encoding method, decoding method, encoder, and decoder
JP2003018603A (ja) 動画像符号化方法及び装置
JP2001189940A (ja) 映像データフォーマット装置及び映像データストレージ装置
US6314139B1 (en) Method of inserting editable point and encoder apparatus applying the same
US7333711B2 (en) Data distribution apparatus and method, and data distribution system
EP0869679A2 (en) Encoding, decoding and editing
US20050226332A1 (en) Motion vector detector, method of detecting motion vector and image recording equipment
US20050276334A1 (en) Video signal coding method and video signal encoder
KR20040080930A (ko) 정보 처리 장치 및 방법
US8818180B2 (en) Video reproducing apparatus, video reproducing method, and program
JP2000236522A (ja) 画像情報処理装置および方法、並びに提供媒体
JP4650454B2 (ja) 符号化装置及び符号化方法
JP4301237B2 (ja) 符号化装置及びその方法、記録装置及びその方法、および、記録媒体
JP4462643B2 (ja) 画像符号化方法及び画像符号化装置
JPH1198514A (ja) 画像符号化装置および方法
JP2008258858A (ja) 動画像符号化装置
JP2004015351A (ja) 符号化装置及び方法、プログラム、記録媒体
JP2006108785A (ja) 画像符号化装置
JP4651344B2 (ja) Mpeg−2ストリームのワイプ切換方法
JP2008211555A (ja) 映像信号符号化装置および映像信号符号化方法
JP2010206463A (ja) 動画像符号化方法、動画像符号化装置及び動画像符号化プログラム