JP2009272706A - 動画像トランスコード装置およびその方法 - Google Patents

動画像トランスコード装置およびその方法 Download PDF

Info

Publication number
JP2009272706A
JP2009272706A JP2008119067A JP2008119067A JP2009272706A JP 2009272706 A JP2009272706 A JP 2009272706A JP 2008119067 A JP2008119067 A JP 2008119067A JP 2008119067 A JP2008119067 A JP 2008119067A JP 2009272706 A JP2009272706 A JP 2009272706A
Authority
JP
Japan
Prior art keywords
segment
data
moving image
encoded
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008119067A
Other languages
English (en)
Inventor
Tatsuya Mizutani
竜也 水谷
Hiroaki Sugita
弘晃 杉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008119067A priority Critical patent/JP2009272706A/ja
Priority to US12/431,521 priority patent/US20090274212A1/en
Publication of JP2009272706A publication Critical patent/JP2009272706A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】シーンチェンジ検出を行わずに、セグメントの接続点における画質の劣化を少なくすることが可能な動画像トランスコード装置を提供する。
【解決手段】動画像トランスコード装置1は、第1の符号化方式により符号化された第1の符号化動画像データを複数のセグメントSDに時間分割し、時間分割された各セグメントSDと、時系列上で各セグメントの1つ前の各セグメントSDの終端の1GOPのデータとを用いて、各セグメントのデータを復号化し、1つ前の各セグメントの第2の符号化動画像データの終端位置の仮想バッファ情報の予測値を用いて、復号化して得られた各セグメントの動画像データを、第2の符号化方式により符号化する。
【選択図】図7

Description

本発明は、動画像トランスコード装置およびその方法に関し、特に、ある符号化方式で符号化された連続した動画像信号を複数のセグメントに時間分割し、その分割された複数のセグメントを他の符号化方式の動画像信号にトランスコードする動画像トランスコード装置およびその方法に関する。
従来より、MPEG-2、MPEG-4、H.264等の動画像符号化国際標準方式に準拠した符号化を、複数のプロセッサあるいは複数のハードウエア装置を用いて並列処理により高速に実現する複数の方法が知られている。
並列処理の方法の一つとして、時間的に連続する複数のフレームを一つのセグメントとして、かつ、その一つのセグメントを一つの処理単位として並列化を行う時間分割方法が知られている。
時間分割方法により並列に符号化を行う場合、分割単位間の依存関係を排除し、分割符号化したデータを接続して連続再生が可能となるように符号化する必要がある。そのために、分割符号化された符号化データは、分割点において、(A)仮想バッファレベルの接続性、(B)フィールド位相の連続性、(C)フレーム間予測の切断、の各条件を満たす必要がある(例えば、特許文献1参照)。
第1の点(A)の仮想バッファレベルの接続性については、分割点において所定の仮想バッファレベルとなるように、時間分割点の始点レベル及び終点付近での発生レートを制御することにより、分割符号化された符号化データを連続的に接続することが可能となる。
第2の点(B)のフィールド位相の連続性についても、分割点の始点及び終点のフィールド位相を予め所定値となるように制御すれば、分割符号化された符号化データを連続的に接続することが可能となる。
第3の点(C)のフレーム間予測の切断を行うために、フレーム間予測を分割単位内に限定し、分割単位を跨ぐフレーム間予測が禁止される。
但し、フレーム間予測を切断することはフレーム間予測を使用しないことになるので、一般に符号化効率が低下する。しかし、分割単位、すなわち連続して符号化するフレーム数、を大きくすることにより、符号化効率の低下量は十分小さくすることができる。
また、ランダムアクセスが可能な蓄積メディアに記録された動画像信号を並列符号化する場合、時間分割符号化は有効に機能する。例えば、従来のMPEG-2などの符号化方式の画像信号についての時間分割符号化は、各分割符号化単位の終点で、仮想バッファレベル、フィールド位相、フレーム間予測の制御を行うことで、分割符号化された符号化データを接続して連続再生を行うことが可能となる。
一方、H.264など動画像符号化方式で符号化された動画像信号についても、時間分割されたセグメント単位の並列符号化が実現されている。
このような時間分割符号化を、トランスコード処理への時間分割符号化の適用技術が提案されている(例えば、特許文献2参照)。
トランスコード処理とは、ある符号化方式で符号化されたデータから、別の符号化方式あるいは同じ符号化方式の異なるパラメータへと変換する処理である。上述した提案に係る技術は、分割されたセグメントをシーンチェンジの部分において結合することにより、セグメントの接続点付近における画質の劣化を少なくすることを可能にするものである。
しかし、その提案に係る技術の場合、トランスコード結果としては破棄されてしまう、セグメント間の重複した部分に対しても、デコード処理及びシーンチェンジ検出を行わなければならず、そのための処理に時間が必要となってしまうという問題がある。
特開平11−88874号公報 特開2005−176069号公報
本発明は、このようなシーンチェンジ検出を行わずに、セグメントの接続点における画質の劣化を少なくすることが可能な動画像トランスコード装置及びその方法を提供することを目的とする。
本発明の一態様によれば、第1の符号化方式により符号化された第1の符号化動画像データを複数のセグメントに時間分割するセグメント分割部と、時間分割された各セグメントのデータと、時系列上で前記各セグメントの1つ前の各セグメントの終端データを含む一部のデータとを用いて、前記各セグメントのデータを復号化する復号化部と、前記1つ前の各セグメントの第2の符号化動画像データの終端位置の仮想バッファ情報の予測値を用いて、前記復号化部によって復号化して得られた前記各セグメントの動画像データを、前記第2の符号化方式により符号化する符号化部と、を有することを特徴とする動画像トランスコード装置を提供することができる。
本発明によれば、シーンチェンジ検出を行わずに、セグメントの接続点における画質の劣化を少なくすることが可能な動画像トランスコード装置及びその方法を実現することができる。
以下、図面を参照して本発明の実施の形態を説明する。
(装置構成)
まず、図1に基づき、本実施の形態に係わるシステムの構成を説明する。図1は、本実施の形態に係わる動画像トランスコード装置の構成を示す構成図である。
動画像トランスコード装置1は、クライアント装置としての端末装置11と、サーバ装置としての複数の端末装置とを含む。端末装置(以下、単に端末という)11と、複数の端末は、LAN、インターネット等のネットワーク13を介して接続されている。端末11には、動画像のコンテンツデータを記憶する記憶装置14が接続されている。
なお、ここでは、動画像トランスコード装置1は、3台のサーバ装置としての端末12a、12b、12c(以下、端末12a、12b、12cを纏めて、あるいはそれぞれを指すときは端末12という)を有しているが、サーバ装置は、1台あるいは2台でもよいし、あるいは4台以上でもよい。
クライアント装置としての端末11には、ある符号化方式で符号化された動画像コンテンツデータを記憶する記憶領域14aを有する記憶装置14が接続されている。ユーザが端末11に所定の操作をすることにより、記憶装置14から動画像コンテンツデータが読み出され、セグメントデータが複数の端末12に送信される。各端末12では、受信したある符号化方式のセグメントデータを、他の符号化方式のセグメントデータに変換して、すなわちトランスコードして、変換されたデータを端末11へ送信する。端末11では、各端末12から受信したトランスコードされたセグメントデータが結合され、記憶装置14の所定の記憶領域14bに記憶される。
図2は、端末12の構成の例を示すブロック図である。端末12は、制御用プロセッシングユニット(以下、CPEと略す)21と、複数のプロセッシングユニット(以下、PEと略す)22と、外部とのインターフェース部(以下、I/F部と略す)23とを含んで構成される。CPE21と複数のPE22とI/F部23は、互いに内部バス24を介して接続されている。
CPE21は、内部に、制御部である演算部21aと、キャッシュメモリ21bを含む。各PE22は、演算部22aとローカルメモリ22bとを含む。各PE22は、CPE21からの依頼に基づいて、I/F23を介して受信したセグメントデータに対してトランスコード処理を施すプログラムを並列に実行する。CPE21は、トランスコード処理されたセグメントデータを、I/F23を介して、端末11へ送信する。
なお、端末11の構成は、端末12と同様の構成であるので、説明は省略する。
図3は、トランスコード処理の全体の流れを説明するための図である。記憶装置14の所定の記憶領域14aには、上述したように、ある符号化方式により符号化された動画像コンテンツデータ、すなわち符号化動画像データ、が記憶されている。端末11は、その符号化動画像データを、他の符号化方式のデータに変換するために、符号化動画像データを時間分割して複数のセグメントデータに分割し、各セグメントのトランスコード処理を、複数の端末12に依頼する。各端末12では、受信したセグメントデータに対してトランスコード処理を行って、トランスコードされたセグメントデータを、端末11に送信する。
端末11は、各端末12から送信されたトランスコードされたセグメントデータに結合処理を施して、記憶装置14の所定の記憶領域14bに、他の符号化方式により符号化された動画像コンテンツデータ、すなわち符号化動画像データ、として記憶する。
端末11は、分割された各セグメントデータのトランスコード処理を、端末12aから12cに所定の順番に依頼してもよいし、端末12aから12cの中で処理可能な、いわゆる空いている端末に対して依頼するようにしてもよい。
以下、記憶領域14aには、MPEG-2のデータが記憶され、MPEG-2のデータをH.264のデータにトランスコードしたデータが記憶領域14bに記憶される場合を例として説明する。
(端末11における処理)
図4は、端末11における処理の流れの例を示すフローチャートである。
端末11は、まず、トランスコード初期化処理を実行し(ステップS1)、MPEG-2のデータをトランスコードしたときのH.264のデータのビットレートなどの符号化パラメータの設定等を行う。
次に、端末11は、トランスコードすべき符号化動画像データ全体を、それぞれが連続する複数のフレームから構成される複数のセグメントデータ(以下、単にセグメントともいう)に分割するセグメント分割処理を実行する(ステップS2)。ステップS2の処理が、符号化動画像データを複数のセグメントに時間分割するセグメント分割部を構成する。
図5は、セグメント分割処理の内容を説明するための図である。トランスコードすべき符号化動画像データ全体DDは、データの先頭から所定のデータ量の単位で分割される。
セグメントの分割は、ここでは、GOP構造を単位としてその境界において行われる。しかし、オープンGOP構造の場合は参照するフレームと参照されるフレームとを分断するようにセグメント分割されてしまうため、GOPの先頭のBフレームを復号化することはできないので、後述するように、時間的に直前のセグメントの最後の1GOPが付加されたデータが、端末12へ送信される。
具体的には、図5に示すように、符号化動画像データ全体DDは、先頭から第1のセグメントSD1、SD2、SD3、SD4、SD5、・・(以下、セグメントデータ全体、あるいは個々のセグメントデータを指すときは、セグメントSDともいう)というように、時間軸に沿って分割される。例えば、1セグメントは、10GOP(Group Of Pictures)、100GOP等の単位を有する。
端末11は、分割された複数のセグメントSDに対するトランスコード処理を、複数の端末12に対して依頼する依頼処理を行う(ステップS3)。すなわち、端末11は、各端末12にセグメントSDを送信して、トランスコード処理を行うように要求する。
この分割されたセグメントSD毎に各端末12において順次トランスコード処理が行われる。上述したように、端末12には、複数のPE22が含まれるので、各セグメントSDに対するトランスコード処理は、並列に行われる。なお、各端末12にトランスコード処理手段が一つしかない場合は、各セグメントSDのトランスコード処理は、逐次的に行われ、また各端末12に同一のトランスコード手段が複数ある場合は、複数のセグメントについて、独立かつ並列に行われる。
そして、各端末12は、受信したMPEG2の各セグメントSDについてのトランスコード処理が終了すると、トランスコード処理されて生成されたH.264の符号化動画像データを送信する。
図4に戻り、端末11は、全てのセグメントSDについてトランスコードされた符号化動画像データを全て受信したか否かを判定する(ステップS4)。全てのセグメントの符号化動画像データを受信しなければ、ステップS4でNOとなり、処理は何もしない。
全てのセグメントの符号化動画像データを受信すると、ステップS4でYESとなり、端末11は、最初のセグメントから順番に、連続するセグメント間で、セグメント終端のCPB占有量が、そのセグメントに続く次のセグメントのイニシャルCPB占有量との比較を行い、CPBの連続性のチェックを行う。CPB占有量の比較の方法については、後述する。
すなわち、端末11は、全てのセグメントの符号化動画像データについて、CPBの連続性が確保できている、すなわちCPBの連続性がOKであるか否かを判定する(ステップS5)。
端末11は、最初のセグメントSD1と2番目のセグメントSD2の2つのH.264の符号化動画像データとの間で、CPBの連続性のチェックを行い、セグメントSD1とSD2間のCPBの連続性が確保できていれば、次の2つのセグメントSD2とSD3の2つのH.264の符号化動画像データとの間で、CPBの連続性のチェックを行う。セグメントSD2とSD3間のCPBの連続性が確保できていれば、その次の2つのセグメントSD3とSD4の2つのH.264の符号化動画像データとの間で、CPBの連続性のチェックを行う。以下、このようにして、順番に2つのセグメント間のCPBの連続性のチェックを行っていく。
2つのセグメントSD間のCPBの連続性が確保できない場合は、ステップS5でNOとなり、端末11は、そのCPBの連続性が確保できていないセグメントから再トランスコード処理を実行する(ステップS6)。全てのセグメントについて、CPBの連続性が確保されるまで、再トランスコード処理が実行される。再トランスコード処理については、後述する。ステップS6が、連続する2つの符号化動画像データが所定の条件を満たさないときに、再度符号化を行う再符号化部を構成する。
以上のようにして、端末11では、連続する2つのセグメント間のCPBの連続性がチェックされ、かつその連続性が確保できるように必要な再トランスコード処理が行われ、途切れなく連続再生が可能な符号化動画像データが生成および出力され、トランスコード処理が終了する。
以上により、連続する符号化動画像データを、複数のセグメントに時間分割し、独立かつ並列にトランスコードすることにより、並列度に応じて高速なトランスコード処理が可能となり、かつ、並列度に依存せずに同一の符号化動画像データを生成することが可能となる。
そして、トランスコードすべき全セグメントの隣り合う2つのセグメント間におけるCPBの連続性が確保されている場合、ステップS5でYESとなり、端末11は、受信したトランスコードされた全てのセグメントの符号化動画像データを結合する結合処理を行う(ステップS7)。ステップS7が、複数のセグメントにそれぞれ対応する複数の第2の符号化動画像データを結合する結合部を構成する。
その結合処理された複数のセグメントの符号化動画像データは、H.264の符号化方式で符号化された動画像コンテンツデータとして、記憶領域14bに記憶される。
図5に示すように、符号化動画像データ全体DDは、データの先頭から所定のデータ量の単位で分割されるが、端末11から端末12へ送信される送信セグメントデータ(以下、送信セグメントという)SSDは、最初のセグメントSD1を除いて、時間的に先行する、直前の、すなわち一つ前の、セグメントSDの最後の1GOPを付加したデータである。言い換えると、送信セグメントSSDは、時間分割された各セグメントのデータと、時系列上で各セグメントの1つ前の各セグメントの終端データを含む一部のデータとを含むデータである。図5に示すように、各セグメントに対応する送信セグメントSSDにおいて、そのセグメントの時系列上で1つ前のセグメントの終端のデータを含む1GOP分のデータは、1つの前の送信セグメントSSDのデータと一部オーバーラップしている。
これは、セグメントの分割点より前のフレームを参照するフレームが、セグメントSDに含まれる場合に、端末12においてトランスコード処理における復号化処理において、正常に復号化処理がされなくなるのを防ぐためである。正常に復号化されないデータを、トランスコード処理において符号化されると、異常なフレームが含まれたデータが生成されてしまう。
従って、端末12へ送信されるデータは、上述した送信セグメントSSDとしている。送信セグメントSSDは、セグメントSDの先頭に、直前のセグメントSDの最後の1GOPをコピーして付加したデータである。1GOPの量のデータには、必ずIフレームが含まれる。よって、セグメントSDのトランスコード処理における復号化処理において、復号化されたデータが、上述したような異常なフレームを含むことはない。
図5に示すように、最初のセグメントデータSD1については、直前のセグメントSDがないので、セグメントSD1がそのまま送信セグメントSSD1となるが、その後のセグメントSDについては、直前のセグメントの最後の1GOPのデータが付加されたデータが、送信セグメントSSDとなっている。
端末12は、各セグメントSDについてトランスコードされたセグメントデータTSDを、端末11へ送信する。
(端末12における処理)
端末12における処理について説明する。
図6は、端末12におけるトランスコード処理の流れの例を説明するためのフローチャートである。
端末12は、トランスコード処理依頼された送信セグメントSSDを受信すると、図6の処理を実行する。まず、簡単に処理の全体について説明する。
端末12は、受信したセグメントはMPEG2の符号化方式で符号化された符号化動画像データであるので、まず、MPEG2の復号化処理を行う(ステップS11)。ステップS11では、上述したように、直前のセグメントSDの最後の1GOPを用いて、各送信セグメントSSDに対して復号化処理がなされ、セグメントSDの動画像データが生成される。ここでは、直前のセグメントSDの最後の1GOPは、当該セグメントの復号化処理に用いられる。
次に、端末12は、生成された動画像データに対して、H.264の符号化方式により符号化処理を行う(ステップS12)。
そして、端末12は、H.264の符号化方式により符号化処理された各セグメントの符号化動画像データを、端末11に送信するデータ送信処理を行う(ステップS13)。
ところで、H.264の規格では、ビットストリーム中のGOPの先頭に、ビットストリームを受信してから復号化処理を開始するまでの遅延量を表すイニシャルcpbリムーバブルディレイ(initial_cpb_removal_delay)を含むバッファリング期間SEI(Buffering Period SEI)の情報を挿入することが必須となっている。この情報は、H.264の符号化方式により動画像データを符号化するときに必要な情報である。
動画像データを分割しないで符号化する場合、エンコーダ内に存在する符号化ピクチャバッファ(CPB:Coded Picture Buffer、以下、CPBと略す)の占有量からイニシャルcpbリムーバブルディレイを自動的に算出することが可能であり、CPBの連続性も保障される。
しかし、分割された動画像データを符号化する場合、直前のセグメントSDの符号化結果の情報である、直前のセグメントSDのビットストリームの終端位置におけるCPBの占有量、が不明であるため、符号化しようとするビットストリームの先頭におけるイニシャルcpbリムーバブルディレイを自動的に算出することができない。
そのため、分割された動画像データを符号化する場合は、符号化を開始する前に、すべての分割点言い換えると結合位置における、時系列上で後にあるセグメントの最初のイニシャルcpbリムーバブルディレイを決定し、各セグメントの終端位置において制約条件を満たすような制御を行うしかない。その制約条件とは、仮想バッファ情報であるCPBの占有量で考えた場合、分割点において時系列上で先行するセグメントの終端位置のCPB占有量が、その先行するセグメントに続くセグメントのビットストリームの先頭のイニシャルCPB占有量を上回ることである。
各分割点の終端において制約条件を満たすような制御では、各エンコーダは、まず、事前に決められた次の分割点の先頭のイニシャルcpbリムーバブルディレイから目標となる次のイニシャルCPB占有量を算出し、その算出されたイニシャルCPB占有量に基づいて、上記制約条件を満たすように、終端位置におけるCPB占有量をビットレート制御により調整する。
図7は、分割点すなわち結合位置の終端と先頭のCPB占有量を説明するための図である。上記制約条件によって、連続する2つのセグメントのうち先行するセグメントSDのビットストリームBS1のCPB占有量の変化は、一点鎖線G1で示すように、変化するとする。そして、先行するセグメントSDのビットストリームBS1の終端位置におけるCPB占有量P1は、それに続くセグメントSDのビットストリームBS2におけるイニシャルCPB占有量P2以上でなければならない。
各セグメントSDのビットストリームの先頭におけるイニシャルcpbリムーバブルディレイの決め方としては、例えばすべて同じ値とする方法が考えられる。しかし、この方法では、まず、分割されたビットストリーム内の先頭と終端の2つの位置のCPB占有量が同程度に、かつ先頭より終端が大きくなるように制御する必要があるため、柔軟なビットレート制御を行いづらいという問題がある。すなわち、分割されたビットストリーム内のデータが、シーンチェンジ等のために、より多くの符号量が必要な場合であっても、少ない符号量でよいものであっても、同じビットレート制御を行う必要があるために、多くの符号量が必要なデータについて十分な符号量を割り当てられず、画質の劣化を引き起こしてしまう。
そこで、本実施の形態では、連続する2つのセグメントの動画像データにおいて、先行する送信セグメントSSDの先頭にある、その送信セグメントSSDより1つ前の送信セグメントSSDとオーバラップしている1GOPのうち、正常に復号化された1以上のフレームを仮符号化し、その仮符号化されたときの符号量に基づいて、先行するセグメントSDのストリームデータの終端位置のCPB占有量が予測される。
すなわち、端末12は、ステップS12において、符号化処理を行うときに、先行するセグメントSDのストリームデータの終端位置のCPB占有量を、先行するセグメントの終端データを含む一部のデータを仮に符号化することによって、仮想バッファ情報の予測値として得る。そして、端末12は、その予測値を用いて、送信セグメントSSDにおいて、1つ前の送信セグメントとオーバラップしていない部分の動画像データの符号化処理を行うようにしたものである。
(仮符号化処理)
図8は、オーバラップしている1GOPについての仮符号化を説明するための図である。図8に示すように、セグメントSDを復号化した結果、ある分割位置あるいは結合位置DPの時間的に先行する前のセグメントSDとそれに続く後のセグメントSDを仮定した場合、後のセグメントSDのビットストリームデータの先頭のイニシャルcpbリムーバブルディレイは、前の1GOPの画像データの中で、正常に復号化されたフレームを仮符号化することによって決定される。
図8に示すように、例えば、前のセグメントの最後の1GOPが、2つのBフレームから始まるとき、最初の2つのBフレームは、正常に復号化できないが、それ以降のフレームについては、正常に復号化される。よって、前のセグメントの最後の1GOPのうち、正常に復号化されたフレームだけを用いて仮符号化が行われる。
その正常に復号化されたフレームを用いて仮にH.264の符号化方式により仮符号化する場合、その仮符号化を開始するときのCPB占有量は、例えば、CPBサイズの3分の1として、仮符号化が行われる。
仮符号化が、その1GOPの最後のフレームまで行われたときのCPB占有量が、2GOP目以降の符号化処理のイニシャルCPB占有量と設定される。そして、そのイニシャルCPB占有量からイニシャルCPBリムーバブルディレイの値を計算し、その計算の結果得られたイニシャルCPBリムーバブルディレイの値を、次のセグメントのイニシャルCPBリムーバブルディレイの値として、ビットストリーム中に設定される。
セグメントのビットストリームBS2のイニシャルCPB占有量を、上述したように予測することにより、セグメントの終端位置におけるCPB占有量が制約条件を満たすように、より柔軟なビットレート制御を行うことができ、ひいては、トランスコードされた画質の向上を図ることができる。
さらに、仮符号化して予測した先行するセグメントの終端位置のCPB占有量の予測値が、予測誤差によって、実際のCPB占有量よりも下回ってしまうことが考えられる。この場合、複数のセグメントのビットストリームを結合したときに、分割位置DPにおける前のセグメントの終端位置でのCPB占有量が後のセグメントのイニシャルCPB占有量を下回ってしまうことになり、CPBの連続性が確保できていない状態となってしまう。
そこで、このような状態を避けるために、本実施の形態では、図4のステップS5において、すべてのセグメントのトランスコードが終わった後に、CPBの連続性のチェックが行われる。具体的には、2番目のセグメントから順に、各セグメントのイニシャルCPB占有量が前のセグメントのCPB占有量を下回っているかをチェックすなわち検査する。もし、あるセグメントのイニシャルCPB占有量が前のセグメントのCPB占有量を上回っていた場合、そのセグメントのトランスコード処理が再度実行される。具体的には、端末11は、再度、端末12にトランスコード処理を依頼するが、そのとき、イニシャルCPB占有量として、前のセグメントの終端位置でのCPB占有量が設定される。このように、前のセグメントの終端位置におけるCPB占有量をイニシャルCPB占有量として設定して、トランスコード処理の再実行を依頼して、CPBの連続性の確保が実現される。
なお、CPBの連続性のチェックは、最初のセグメントから順番に行われ、あるセグメントのイニシャルCPB占有量が前のセグメントのCPB占有量を上回っていた場合、そのセグメントについて、再トランスコード処理が実行される。従って、その再トランスコード処理したセグメントについては、前のセグメントとの間で、CPBの連続性は保たれるが、その再トランスコードによって、その再トランスコード処理されたセグメントよりも時間的に後のセグメントについて、CPBの連続性が保たれなくなってしまうこともあり得る。
よって、ステップS5ではNOの場合、ステップS6において、そのセグメントについて再トランスコード処理が行われるが、その処理の結果、再トランスコード処理されて得られたビットストリームのセグメントよりも時間的に後の全てのセグメントについて、ステップS5において、CPBの連続性のチェックが行われる。
そして、結果として、ステップS5において、残りのセグメントについてのチェックにおいてCPBの連続性無しと判定され、複数回、再トランスコード処理が行われる場合もあるが、最終的に、全てのセグメント間で、CPBの連続性が確保されたと判定されると、ステップS7において、結合処理が行われる。
(変形例)
次に、上述した実施の形態の変形例について説明する。
上述した実施の形態に係るトランスコード装置において、セグメントの結合時にCPB占有量の連続性が確保されているかのチェックは、すべてのセグメントのトランスコードが終わった後で行われているが、これに限定されるものではない。
例えば、すべてのセグメントについてトランスコード処理が終わってなくても、各セグメントについてのトランスコード処理が終わりしだい、先頭のセグメントに対応するビットストリームから順に、チェックを行っても良い。すなわち、各セグメントについての符号化処理を行いながら、先頭のセグメントに対応するビットストリームから順に、チェックを行うようにしても良い。この場合、トランスコードの再実行を行うセグメントが判明した時点で、再実行を行うこともできる。最終的にすべてのセグメント境界である結合位置においてCPB占有量の連続性が確保されていればよく、セグメントのトランスコードの実行および再実行の順序に特に制限はない。
図9は、その変形例に係わるトランスコード装置における端末11における処理の流れの例を示すフローチャートである。図9の処理は、図4の処理と同じ処理を含むため、同じ処理については、同じ符号を付し、説明は省略する。
端末11は、各端末12からトランスコード処理されて生成された各セグメントに対応するH.264のビットストリームデータを受信するので、そのような各セグメントに対応するビットストリームデータを受信したか否かが判定される(ステップS21)。端末11は、端末12からセグメントSDのビットストリームを受信すると、ステップS21でYESとなり、受信した最初のセグメントから順番に、連続する2つのセグメント間で、セグメント終端位置のCPB占有量と、そのセグメントに続く次のセグメントのイニシャルCPB占有量との比較を行い、CPBの連続性のチェックを行う。そして、端末11は、全てのセグメントについて、CPBの連続性が確保できている、すなわちCPBの連続性がOKであるか否かを判定する(ステップS5)。
まだ全てのセグメントについてトランスコード処理が終了しておらず、全ての連続する2つのセグメントSD間のCPBの連続性が確保できない場合は、ステップS5でNOとなり、端末11は、上述した再トランスコード処理を実行し(ステップS6)、処理は、ステップS21に戻る。
このようにして、端末11は、受信したトランスコードされた符号化動画像データを全て受信するまでCPBの連続性のチェックを行わないのではなく、トランスコードされた号化動画像データを受信すると、できる比較可能な符号化動画像データからCPBの連続性のチェックを行う。その結果、その連続性が確保されていないビットストリームデータがあれば、すぐにそのビットストリームデータに対応するセグメントから再トランスコード処理を行うので、トランスコード処理を迅速に行うことができる。
以上のように、上述した実施の形態及び変形例に係る動画像トランスコード装置は、時間的に連続する、符号化動画像データを、複数のセグメントに時間分割し、各セグメントを独立して並列にトランスコードすることにより、並列度に応じて高速なトランスコードが可能となり、かつ、並列度に依存せずに、元の符号化方式とは異なる他の符号化動画像データを生成することが可能となる。
そして、動画像トランスコード装置1において、トランスコード処理を行うときに、注目するセグメントSDの時系列上で1つ前のセグメントSDとオーバラップしている1GOPのうち、正常に復号化されたフレームを仮符号化する。そして、その仮符号化されたときの符号量に基づいて、1つ前のセグメントSDのビットストリームデータの終端位置のCPB占有量を予測し、その予測値を次のセグメントのビットストリームデータのイニシャルCPB占有量として設定する。
さらに、予測あるいは推定の誤差によってCPBの連続性を確保できない場合、動画像トランスコード装置1は、CPBの連続性を確保できないセグメントのトランスコード処理を再実行する。
よって、上述した動画像トランスコード装置によれば、CPBの連続性を確保しつつ、柔軟なレート制御を行うことができるため、画質劣化の少ないトランスコード結果を得ることができる。
なお、上述した実施の形態に係るトランスコード装置においては、分割されるセグメント間でオーバラップする部分は1GOPとしているが、これに限定されるものではない。例えば、そのオーバラップする部分は2GOP以上でもよい。オーバラップしていないセグメント部分の先頭が復号化できるフレームが生成できるデータを含むデータが、少なくともそのオーバラップする部分に含まれればよい。従って、その観点によれば、そのようなフレームを生成できるデータを含んでいれば、特にそのオーバラップ部分のデータの量に上限あるいは下限はない。
さらになお、上述した実施の形態に係るトランスコード装置においては、仮符号化処理を行うビットストリームのイニシャルCPB占有量を、CPBサイズの3分の1としているが、これに限定されるものではない。そのイニシャルCPB占有量を大きくすると、CPBの連続性が確保できなくなる確率が高くなると考えられるため、トランスコードの再実行の頻度が高くなる。しかし、一方で、レート制御の柔軟性は向上するため、画質が向上する。従って、イニシャルCPB占有量は、トランスコード処理の再実行のデメリットと画質向上のメリットとのバランスを考慮して適切に設定される。
また、上述した実施の形態に係るトランスコード装置は、入力側のデータとして、MPEG-2のデータを例に説明したが、入力側のデータは、MPEG-2と同様の制約のある他の動画像符号化方式の動画像データでもよく、例えば、PCM符号化のような単純な符号化方式のデータでも適用可能である。
また、上述した実施の形態に係るトランスコード装置は、出力側のデータとして、H.264のデータを例に説明したが、出力データもH.264に限定されるものではなく、H.264と同様の制約のあるほかの動画像符号化方式のデータでも適用可能である。
本明細書における各「部」は、実施の形態の各機能に対応する概念的なもので、必ずしも特定のハードウエアやソフトウエア・ルーチンに1対1には対応しない。従って、本明細書では、実施の形態の各機能を有する仮想的回路ブロック(部)を想定して実施の形態を説明した。また、本実施の形態における各手順の各ステップは、その性質に反しない限り、実行順序を変更し、複数同時に実行し、あるいは実行毎に異なった順序で実行してもよい。
また、以上説明した動作を実行するプログラムは、コンピュータプログラム製品として、フレキシブルディスク、CD−ROM等の可搬媒体や、ハードディスク等の記憶媒体に、その全体あるいは一部が記録され、あるいは記憶されている。そのプログラムコードがコンピュータにより読み取られて、動作の全部あるいは一部が実行される。あるいは、そのプログラムコードの全体あるいは一部を通信ネットワークを介して流通または提供することができる。利用者は、通信ネットワークを介してそのプログラムコードをダウンロードしてコンピュータにインストールしたり、あるいは記録媒体からコンピュータにインストールすることで、容易に本発明の動画像トランスコード装置を実現することができる。
本発明は、上述した実施の形態に限定されるものではなく、本発明の要旨を変えない範囲において、種々の変更、改変等が可能である。
本発明の実施の形態に係わる動画像トランスコード装置の構成を示す構成図である。 本発明の実施の形態に係わる端末の構成の例を示すブロック図である。 本発明の実施の形態に係わるトランスコード処理の全体の流れを説明するための図である。 本発明の実施の形態に係わる端末11における処理の流れの例を示すフローチャートである。 本発明の実施の形態に係わるセグメント分割処理の内容を説明するための図である。 本発明の実施の形態に係わる端末12におけるトランスコード処理の流れの例を説明するためのフローチャートである。 本発明の実施の形態に係わる、分割位置の終端と先頭のCPB占有量を説明するための図である。 本発明の実施の形態に係わる、オーバラップしている1GOPについての仮符号化を説明するための図である。 本発明の実施の形態の変形例に係わるトランスコード装置における端末11における処理の流れの例を示すフローチャートである。
符号の説明
1 動画像トランスコード装置、11、12a、12b、12c 端末、13 ネットワーク、14 記憶装置、14a、14b 記憶領域、21 制御用プロセッシングユニット、21a,22a 演算部、21b キャッシュメモリ、22b ローカルメモリ、23 インターフェース、24 内部バス

Claims (5)

  1. 第1の符号化方式により符号化された第1の符号化動画像データを複数のセグメントに時間分割するセグメント分割部と、
    時間分割された各セグメントのデータと、時系列上で前記各セグメントの1つ前の各セグメントの終端データを含む一部のデータとを用いて、前記各セグメントのデータを復号化する復号化部と、
    前記1つ前の各セグメントの第2の符号化動画像データの終端位置の仮想バッファ情報の予測値を用いて、前記復号化部によって復号化して得られた前記各セグメントの動画像データを、前記第2の符号化方式により符号化する符号化部と、
    を有することを特徴とする動画像トランスコード装置。
  2. 前記予測値は、復号化された前記一部のデータの動画像データを符号化することによって得られた値であることを特徴とする請求項1に記載の動画像トランスコード装置。
  3. 前記複数のセグメントの全てについて前記符号化部において前記第2の符号化方式により符号化した後に、連続する2つのセグメントの結合位置における、時系列上で先行するセグメントの終端位置と該先行するセグメントに続くセグメントの先頭位置の2つの仮想バッファ情報が所定の条件を満たすか否かをチェックし、前記所定の条件を満たさないときは、前記先行するセグメントの終端位置の仮想バッファ情報を用いて、前記先行するセグメントに続くセグメントについて再度符号化を行う再符号化部を、
    有することを特徴とする請求項1または2に記載の動画像トランスコード装置。
  4. 前記各セグメントについて前記符号化部において前記第2の符号化方式により符号化しながら、前記符号化部において符号化された、連続する2つのセグメントの結合位置における、時系列上で先行するセグメントの終端位置と該先行するセグメントに続くセグメントの先頭位置の2つの仮想バッファ情報が所定の条件を満たすか否かをチェックし、前記所定の条件を満たさないときは、前記先行するセグメントの終端位置の仮想バッファ情報を用いて、前記先行するセグメントに続くセグメントについて再度符号化を行う再符号化部を、
    有することを特徴とする請求項1または2に記載の動画像トランスコード装置。
  5. 第1の符号化方式により符号化された第1の符号化動画像データを複数のセグメントに時間分割し、
    時間分割された各セグメントのデータと、時系列上で前記各セグメントの1つ前の各セグメントの終端データを含む一部のデータとを用いて、前記各セグメントのデータを復号化し、
    前記1つ前の各セグメントの第2の符号化動画像データの終端位置の仮想バッファ情報の予測値を用いて、前記復号化して得られた前記各セグメントの動画像データを、前記第2の符号化方式により符号化する、
    ことを特徴とする動画像トランスコード方法。
JP2008119067A 2008-04-30 2008-04-30 動画像トランスコード装置およびその方法 Pending JP2009272706A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008119067A JP2009272706A (ja) 2008-04-30 2008-04-30 動画像トランスコード装置およびその方法
US12/431,521 US20090274212A1 (en) 2008-04-30 2009-04-28 Semiconductor Device Having Moving Image Transcoder and Transcoding Method Therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008119067A JP2009272706A (ja) 2008-04-30 2008-04-30 動画像トランスコード装置およびその方法

Publications (1)

Publication Number Publication Date
JP2009272706A true JP2009272706A (ja) 2009-11-19

Family

ID=41257058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008119067A Pending JP2009272706A (ja) 2008-04-30 2008-04-30 動画像トランスコード装置およびその方法

Country Status (2)

Country Link
US (1) US20090274212A1 (ja)
JP (1) JP2009272706A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012023248A1 (ja) * 2010-08-18 2012-02-23 パナソニック株式会社 3d符号化装置
JP2013150099A (ja) * 2012-01-18 2013-08-01 Buffalo Inc 映像データ記憶システム、記憶装置、映像データ記憶方法
JP2013541271A (ja) * 2010-09-07 2013-11-07 中国科学院深▲しん▼先進技術研究院 オーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法およびシステム、記録媒体
JP2016046578A (ja) * 2014-08-20 2016-04-04 日本放送協会 画像分散処理装置
JP2022525895A (ja) * 2019-09-28 2022-05-20 テンセント・アメリカ・エルエルシー セグメント化データストリーム処理のための方法、装置、およびプログラム

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080235746A1 (en) 2007-03-20 2008-09-25 Michael James Peters Methods and apparatus for content delivery and replacement in a network
US9277266B2 (en) * 2009-03-18 2016-03-01 Time Warner Cable Enterprises Llc Apparatus and methods for network video recording
US9866609B2 (en) 2009-06-08 2018-01-09 Time Warner Cable Enterprises Llc Methods and apparatus for premises content distribution
US8635357B2 (en) * 2009-09-08 2014-01-21 Google Inc. Dynamic selection of parameter sets for transcoding media data
US8752112B2 (en) * 2012-04-12 2014-06-10 Google Inc. Live streaming video processing
US9307258B2 (en) * 2012-10-30 2016-04-05 Broadcom Corporation Parallel transcoding
DE102013223304B4 (de) * 2012-11-19 2019-03-07 Avago Technologies International Sales Pte. Ltd. Verwalten von Kodiererparametern für ein paralleles Umkodieren
US9549178B2 (en) * 2012-12-26 2017-01-17 Verizon Patent And Licensing Inc. Segmenting and transcoding of video and/or audio data
US9319753B2 (en) * 2013-05-09 2016-04-19 Broadcom Corporation Seamless trick-mode with decreased latency for live transcode streaming
US10687115B2 (en) 2016-06-01 2020-06-16 Time Warner Cable Enterprises Llc Cloud-based digital content recorder apparatus and methods
CN107872671B (zh) 2016-09-26 2022-01-14 华为技术有限公司 一种图片编码方法及终端
US10129593B2 (en) 2017-03-14 2018-11-13 Charter Communications Operating, Llc Time-based dynamic secondary content placement calls in time-shifted content
US10939142B2 (en) 2018-02-27 2021-03-02 Charter Communications Operating, Llc Apparatus and methods for content storage, distribution and security within a content distribution network
US10798393B2 (en) * 2018-07-09 2020-10-06 Hulu, LLC Two pass chunk parallel transcoding process

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6275536B1 (en) * 1999-06-23 2001-08-14 General Instrument Corporation Implementation architectures of a multi-channel MPEG video transcoder using multiple programmable processors
US8054880B2 (en) * 2004-12-10 2011-11-08 Tut Systems, Inc. Parallel rate control for digital video encoder with multi-processor architecture and picture-based look-ahead window

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012023248A1 (ja) * 2010-08-18 2012-02-23 パナソニック株式会社 3d符号化装置
JP4889836B1 (ja) * 2010-08-18 2012-03-07 パナソニック株式会社 3d符号化装置
CN103081465A (zh) * 2010-08-18 2013-05-01 松下电器产业株式会社 3d编码装置
US9124868B2 (en) 2010-08-18 2015-09-01 Panasonic Intellectual Property Management Co., Ltd. 3D encoding apparatus
JP2013541271A (ja) * 2010-09-07 2013-11-07 中国科学院深▲しん▼先進技術研究院 オーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法およびシステム、記録媒体
JP2013150099A (ja) * 2012-01-18 2013-08-01 Buffalo Inc 映像データ記憶システム、記憶装置、映像データ記憶方法
JP2016046578A (ja) * 2014-08-20 2016-04-04 日本放送協会 画像分散処理装置
JP2022525895A (ja) * 2019-09-28 2022-05-20 テンセント・アメリカ・エルエルシー セグメント化データストリーム処理のための方法、装置、およびプログラム
JP7302001B2 (ja) 2019-09-28 2023-07-03 テンセント・アメリカ・エルエルシー セグメント化データストリーム処理のための方法、装置、およびプログラム

Also Published As

Publication number Publication date
US20090274212A1 (en) 2009-11-05

Similar Documents

Publication Publication Date Title
JP2009272706A (ja) 動画像トランスコード装置およびその方法
JP6087940B2 (ja) 復号化ピクチャ・バッファおよび参照ピクチャ・リストのための状態情報のシグナリング
JP4088800B2 (ja) 編集装置および編集方法
JP5100311B2 (ja) 動画像データ送信方法、通信装置、及びプログラム
US8411739B2 (en) Bitstream conversion method, bitstream conversion apparatus, bitstream connecting apparatus, bitstream splitting program, bitstream conversion program, and bitstream connecting program
JP2015501098A5 (ja)
JP2008066847A (ja) 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
US8406292B2 (en) Moving picture editing apparatus
US8798162B2 (en) Encoding method, decoding method, encoder, and decoder
JP2005176069A (ja) 分散並列トランスコーダシステム及び分散並列トランスコード方法
JP2010028736A (ja) 送信装置及び方法、プログラム
JP2007059996A (ja) 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP2007074450A (ja) 動画像信号の符号化装置、動画像信号の符号化方法およびコンピュータ読み取り可能な記録媒体
JP2015095733A (ja) 画像伝送装置、画像伝送方法、及びプログラム
US20060061497A1 (en) Bit rate conversion apparatus and method
EP2174503B1 (en) Moving image data encoding apparatus and control method for same
JP2022092009A (ja) 映像符号化又は映像復号装置、映像符号化又は映像復号方法、プログラム、及び記録媒体
WO2020090408A1 (ja) 復号装置、符号化装置、復号方法、符号化方法、及びプログラム
JP2017535171A (ja) 先行するデコード化をせずに、いくつかのコード化されたビデオストリームを切断するための装置および方法。
JP2009246489A (ja) 映像信号切替装置
JP4928569B2 (ja) セグメント符号化方法,セグメント符号化装置,セグメント符号化プログラムおよびその記録媒体,並びに,並列エンコードシステム,部分的再エンコードシステム
JP7378035B2 (ja) 変換装置、復号装置、変換方法および復号方法
JP4373283B2 (ja) 映像音声復号方法、映像音声復号装置、映像音声復号プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5359724B2 (ja) ストリーミング配信システム、サーバ装置、ストリーミング配信方法及びプログラム
JP2011004163A (ja) 送信装置