JP4917148B2 - ビットストリーム変換方法、ビットストリーム変換装置、ビットストリーム結合装置、ビットストリーム分割プログラム、ビットストリーム変換プログラム及びビットストリーム結合プログラム - Google Patents

ビットストリーム変換方法、ビットストリーム変換装置、ビットストリーム結合装置、ビットストリーム分割プログラム、ビットストリーム変換プログラム及びビットストリーム結合プログラム Download PDF

Info

Publication number
JP4917148B2
JP4917148B2 JP2009504993A JP2009504993A JP4917148B2 JP 4917148 B2 JP4917148 B2 JP 4917148B2 JP 2009504993 A JP2009504993 A JP 2009504993A JP 2009504993 A JP2009504993 A JP 2009504993A JP 4917148 B2 JP4917148 B2 JP 4917148B2
Authority
JP
Japan
Prior art keywords
format
divided
bit stream
bitstream
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009504993A
Other languages
English (en)
Other versions
JPWO2008114393A1 (ja
Inventor
真喜子 此島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2008114393A1 publication Critical patent/JPWO2008114393A1/ja
Application granted granted Critical
Publication of JP4917148B2 publication Critical patent/JP4917148B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23406Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving management of server-side video buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2389Multiplex stream processing, e.g. multiplex stream encrypting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving MPEG packets from an IP network
    • H04N21/4385Multiplex stream processing, e.g. multiplex stream decrypting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Communication Control (AREA)

Description

本発明は、動画信号が有する時間的相関及び空間的相関や、音声信号が有する時間的相関を利用して、動画信号や音声信号の圧縮を行うメディア信号符号化技術に関わる。特に動画ストリームや音声ストリームを含むビットストリームの形式を変換するストリーム変換技術に関する。
動画ストリームや音声ストリームなどのコンテンツデータを含むビットストリームの配信事業者にとって、ネットワークリソースの使用効率を向上させることができれば事業コストを節約する上で有利である。このため既に圧縮処理されたビットストリームを、より高圧縮率の符号化形式で符号化されたビットストリームに変換して配信するデータのファイルサイズを縮小したいというニーズがある。
またユーザ側においても、既存の狭い伝送帯域幅のネットワークを利用しても大容量の映像ストリームを気軽にプレビューできるように、ファイルサイズの小さな映像ストリームへ変換することに対するニーズがある。
図1A及び図1Bは、所定の形式(方式A)で符号化されたビットストリームを異なる形式(方式B)へ変換する従来の処理を示す図である。図1Aは、方式Aのビットストリームを元データへ逆変換する方式A用のデコーダと、元データから方式Bのビットストリームへ変換する方式B用のエンコーダを組み合わせて使用する処理を示し、図1Bは、方式Aのビットストリームを方式Bへ直接変換する処理を示す。いずれの場合も、変換処理を並列に行わずに、ビットストリームの先頭から終端まで連続的に変換処理を行う。
ここで、ビットストリームの形式は様々な要素を用いて定められる。例えばビットストリームが動画ストリームを含むときは、ビットストリームの形式を定める要素として、この動画ストリームを符号化する際に使用された符号化方式や、ストリームのビットレート及びフレームレート、又は動画の画像サイズなどが例示列挙できる。また例えばビットストリームが音声ストリームを含むときは、ビットストリームの形式を定める要素として、この音声ストリームを符号化する際に使用された符号化方式や、ストリームのビットレート及びフレームレートが例示列挙できる。
なお下記特許文献1には、映像シーンデータの符号化処理において、符号化処理を並列に効率よく行うことが可能な映像符号化方法と装置が開示されている。
下記特許文献2には、画像を複数画面に分けてから符号化した場合に、復元画像において境界部分が目立つことを防止する画像の符号化及び復号方法が開示されている。
下記特許文献3には、動画像信号を複数画面に分けてから符号化しても画質の劣化を防止し、かつ高い効率で符号化する動画像符号化装置が開示されている。
下記特許文献4には、映像の符号化に利用されるスライス構造を利用して映像の一部を重複して符号化および復号化する方法が開示されている。
また下記特許文献5には、マルチメディアデータのうち利用者から指定された指定区間と変換済区間との差部分だけを変換して、変換済メディアデータと結合して配信するマルチメディア変換処理システムが開示されている。
下記特許文献6には、個々に符号化して得られた複数のビデオストリームを連続的にデコードした場合においてもスムーズな再生画像を得ることを可能とする符号化方法が開示されている。
下記特許文献7には、MPEG−2PSストリームのトリミングを行う際に、削除開始位置の直前データに後続するシーケンス終了情報を含むデータを生成し、削除終了位置に後続するデータの直前の位置にシーケンス開始情報を含むデータを生成し、これら生成したデータが連続するようにファイル管理情報を更新する映像音声信号の編集装置が開示されている。
下記特許文献8には、分割された複数の画像データを結合するポイントをシーンチェンジ箇所に限定する分散並列トランスコーダシステムが開示されている。
特開2002−199392号公報 特開平9−284756号公報 特開平5−183891号公報 特開平2004−236337号公報 特開2006−352443号公報 国際公開第97/13367号パンフレット 特開2005−33382号公報 特開2005−176069号公報
上述の通り、既にある形式のビットストリームを他の形式のビットストリームへ変換するニーズは非常に多く、また他の形式のビットストリームへの変換を求められるコンテンツ自体も非常に多い。しかしながら、ビットストリーム(特に動画ストリーム)の変換は処理量が大きく、現在の汎用のコンピュータを用いる以上、ストリーム再生時間に対する変換所要時間の比をまだそれ程大きくすることはできない。したがって並列処理を行わない従来の方式によれば、再生時間が長いビットストリームを変換しようとすると所要時間が長くなることは不可避である。
このような事情に鑑み、本発明は、ビットストリームを分割して並列して変換することによってビットストリームの変換時間を短縮することを目的とする。
本発明では、コンテンツデータを含む第1形式のビットストリームを、第2形式のビットストリームへ変換するにあたり、第1形式のビットストリームを時系列的に分割して複数の第1形式の分割ビットストリームとし、これらを複数の第2形式の分割ビットストリームへそれぞれ並列に変換した後に相互に結合する。
本発明では、最も処理量が大きい変換処理を並列して実行することができるため、ビットストリームを変換する手段を増やすことによって変換時間を低減することが可能となる。
しかしながら、1つのビットストリームを時系列的に分割した複数のビットストリームを並列に変換すると、連続する2つのストリームの後のストリームは、直前のストリームの情報を利用しないで変換されるので、これらを結合した結合位置において大きな画質の差が生じて違和感を生じる。
またビットストリームの符号化処理の多くでは、情報発生量の変動に伴う符号化信号の伝送速度を平滑化するためにバッファと呼ばれる速度平滑化メモリが用いられ、バッファに蓄積することができる情報量であるバッファ使用量の上限を規格で定めている。そして符号化の際にこの上限を超えないようにビットレートを制御しながら符号化を行うオーバーフロー制御を行う。しかし、1つのビットストリームを複数のビットストリームに分割してこれらのストリームを並列に変換すると、あるストリームの符号化に際してオーバーフロー制御を行うときに、それ以前のストリームの符号化の際に発生した情報量を参照することができない。このため結合後のビットストリームにおいて、規格で定められるバッファ使用量の上限を超えてしまうおそれがある。
そこで本発明では、第1形式のビットストリームを分割する際に分割位置に重複部分を持たせることにより、複数の分割位置のうちから選択できるようにした。
また、本発明では、第2形式の分割ビットストリームの重複部分に含まれるキーフレームについて、第2形式の分割ビットストリーム同士の結合位置を選択するために参照される所定の補助情報を生成することにした。そして、結合すべき前後ストリームについて各々生成された補助情報の差が最小となるキーフレーム位置にて、複数の第2形式の分割ビットストリームを相互に結合することとした。
例えば、第1形式のビットストリームが画像ストリームを含む場合には、補助情報として、画像ストリームに含まれるフレームの情報発生量に関する情報や、フレームの画質に関する情報や、フレームの類似度の指標となる情報などを使用してよい。
補助情報として情報発生量や画質に関する情報を用いることとし、結合する前後ストリーム間の重複部分に含まれるキーフレームのうち、これらのキーフレームについてそれぞれ作成された補助情報が最小となる位置でこれらストリームを結合すれば、結合位置における画質の差は目立たなくなる。
また発生情報量として、VBV(Video Buffering Verifier)バッファ使用量などといったバッファ使用量、すなわち符号化開始フレームから現在フレームまでを符号化する際に発生した全情報発生量から、この間の再生時間の間に送信可能な情報量を差し引いた情報量を用いてもよい。
補助情報としてこのようなバッファ使用量を用い、このバッファ使用量の差が最小となる位置にてストリームを結合することにより、結合位置において生じるバッファ使用量の変動を押さえることができ、バッファ使用量に関する規格違反を防止することができる。
また補助情報として、各フレームにおいて生じた動きベクトル情報など、フレーム同士の類似度の指標となる情報を用い、このような情報の差が最小となる位置にてストリームを結合することによっても、結合位置における画質の差を目立たなくさせることができる。
本発明の第1形態によれば、コンテンツデータを含む第1形式のビットストリームを、第2形式のビットストリームへ変換するビットストリーム変換方法が提供される。本方法では、第1形式のビットストリームを時系列的に分割して複数の第1形式の分割ビットストリームとし、複数の第1形式の分割ビットストリームを複数の第2形式の分割ビットストリームへそれぞれ並列に変換し、複数の第2形式の分割ビットストリームを相互に結合する。
本発明の第2形態によれば、コンテンツデータを含む第1形式のビットストリームを、第2形式のビットストリームへ変換するビットストリーム変換装置が提供される。本ビットストリーム変換装置は、第1形式のビットストリームを時系列的に分割して複数の第1形式の分割ビットストリームにする分割部と、複数の第1形式の分割ビットストリームを複数の第2形式の分割ビットストリームへそれぞれ変換する複数の変換部と、複数の第2形式の分割ビットストリームを相互に結合する結合部を備える。
本発明の第3形態によれば、コンテンツデータを含む第1形式のビットストリームを、時分割的にかつ重複部分を持つように分割した複数の第1形式の分割ビットストリームを、それぞれ第2形式の分割ビットストリームへ変換することによって得られた、複数の第2形式の分割ビットストリームを相互に結合するビットストリーム結合装置が提供される。本ビットストリーム結合装置は、結合フレーム位置決定部と、結合フレーム位置にて前後ストリームを結合するデータ結合部を備え、この結合フレーム位置決定部は、複数の第2形式の分割ビットストリームの重複部分に含まれるキーフレームについて生成された、第2形式の分割ビットストリーム同士の結合位置を選択するために参照される所定の補助情報を入力する。そして結合フレーム位置決定部は、結合すべき前後ストリームについて各々生成された補助情報の差が最小となるキーフレーム位置を、これら前後ストリーム同士を結合するための結合フレーム位置として決定する。
本発明の第4形態によれば、コンテンツデータを含む第1形式のビットストリームを、第2形式のビットストリームへ変換するために、第1形式のビットストリームを時系列的に分割して複数の第1形式の分割ビットストリームにする分割部と、複数の第1形式の分割ビットストリームを複数の第2形式の分割ビットストリームへそれぞれ変換する複数の変換部と、複数の第2形式の分割ビットストリームを相互に結合する結合部と、を備えるビットストリーム変換装置における、分割部として設けられた分割処理用コンピュータにて動作するビットストリーム分割プログラムが提供される。本ビットストリーム分割プログラムは、第1形式のビットストリームを時系列的に分割して複数の分割ビットストリームにする分割処理を、分割処理用コンピュータに実行させる。
本発明の第5形態によれば、上記第4形態によるビットストリーム分割プログラムによって、少なくとも動画ストリームを含んだ第1形式のビットストリームを分割することにより得られる第1形式の分割ビットストリームを、第2形式の分割ビットストリームへ変換する変換部として設けられた変換処理用コンピュータにて動作するビットストリーム変換プログラムが提供される。本ビットストリーム変換プログラムは、第2形式の分割ビットストリームの重複部分に含まれるキーフレームについて、第2形式の分割ビットストリーム同士の結合位置を選択するために参照される所定の補助情報を生成する補助情報処理を、変換処理用コンピュータに実行させる。
本発明の第6形態によれば、上記第5形態によるビットストリーム変換プログラムにより変換された第2形式の分割ビットストリームと補助情報とを、複数の変換部からそれぞれ入力し、複数の第2形式の分割ビットストリームを相互に結合する結合部として設けられた結合処理用コンピュータにて動作するビットストリーム結合プログラムが提供される。本ビットストリーム結合プログラムは、結合すべき前後ストリームについて各々生成された補助情報の差が最小となるキーフレーム位置を、これら前後ストリーム間の結合位置として決定する結合位置決定処理と、決定された結合位置にて前後ストリームを結合するデータ結合処理と、を結合処理用コンピュータに行わせる。
所定の形式(方式A)で符号化されたビットストリームを異なる形式(方式B)へ変換する従来の処理を示す図(その1)である。 所定の形式(方式A)で符号化されたビットストリームを異なる形式(方式B)へ変換する従来の処理を示す図(その2)である。 本発明の実施例によるビットストリーム変換装置の全体構成の概略を示す図である。 図2に示す分割部の概略構成を示す図である。 図2に示す変換部の概略構成を示す図である。 図2に示す結合部の概略構成を示す図である。 図2に示す分割部により実現される機能ブロック図を示す図である。 本発明によるビットストリームの分割位置決定方法の第1例を示すフローチャートである。 本発明によるビットストリームの分割位置決定方法の説明図(その1)である。 本発明によるビットストリームの分割位置決定方法の説明図(その2)である。 本発明によるビットストリームの分割位置決定方法の第2例を示すフローチャートである。 図2に示す変換部により実現される機能ブロック図の第1例を示す図である。 図2に示す結合部により実現される機能ブロック図の第1例を示す図である。 本発明によるビットストリームの結合方法の第1例を示すフローチャートである。 図12に示すビットストリームの結合方法の説明図である。 本発明によるビットストリームの結合方法の第2例を示すフローチャートである。 図14に示すビットストリームの結合方法の説明図である。 図2に示す変換部により実現される機能ブロック図の第2例を示す図である。 図2に示す結合部により実現される機能ブロック図の第2例を示す図である。 本発明によるビットストリームの再変換方法の説明図である。
符号の説明
1 ビットストリーム変換装置
h1、h2、hn 補助情報
S 第2形式のビットストリーム
S1、S2、Sn 第2形式の分割ビットストリーム
tx1、tx2、txn 重複部分
V 第1形式のビットストリーム
V1、V2、Vn 第1形式の分割ビットストリーム
以下、添付する図面を参照して本発明の実施例を説明する。図2は、本発明の実施例によるビットストリーム変換装置の全体構成の概略を示す図である。ビットストリーム変換装置1は、コンテンツとして動画ストリームと音声ストリームを含む、所定の第1形式のビットストリームVを、ビットストリームの形式を変換することにより、同じコンテンツの第2形式のビットストリームSに変換する装置である。第1形式のビットストリームVと第2形式のビットストリームとの間の形式の違いは、例えば、ストリームの符号化に使用する符号化方式の相違や、画像サイズ、ストリームのビットレート及びフレームレートの違いなどであってよい。
ビットストリーム変換装置1は、第1形式のビットストリームVを時系列的に分割して複数の第1形式の分割ビットストリームv1〜vnにする分割部10と、複数の第1形式の分割ビットストリームv1〜vnを複数の第2形式の分割ビットストリームs1〜snへそれぞれ変換する複数の変換部20a〜20nと、複数の第2形式の分割ビットストリームs1〜snを相互に結合することにより、第1形式のビットストリームVと同じコンテンツと異なる形式を有する第2形式のビットストリームSを生成する結合部30と、を備えている。なお、以下の説明において複数の変換部20a〜20nを総称して変換部20と示すことがある。
また、図2に表されたビットストリームVの図は、分割部10により分割された複数の第1形式の分割ビットストリームv1〜vnが互いに重複部分を有していることを示し、例えば第1番目の分割ビットストリームv1と第2番目の分割ビットストリームv2はビットストリームの重複部分tx1を有し、第2番目の分割ビットストリームv2と第3番目の分割ビットストリーム(不図示)は重複部分tx2を有し、第(n−1)番目の分割ビットストリーム(不図示)と第n番目の分割ビットストリームvnは重複部分txn−1を有することを示している。
図3は、図2に示す分割部10の概略構成を示す図である。分割部10のハードウエア構成はコンピュータを用いて実現できる。すなわち分割部10は、CPUなどのプロセッサ11と、プロセッサ11により実行されるオペレーティングシステム(OS)13やプログラムが保存されるストレージユニット12と、プロセッサ11が実行するプログラムを読み込み、かつプロセッサ11による処理に必要なデータを一時的に記憶させるメモリ15と、第1形式のビットストリームVを外部から入力し、第1形式の分割ビットストリームv1〜vnを変換部20a〜20nにそれぞれ出力するするインタフェース(I/0)16を備えて構成される。
ストレージユニット12には、プロセッサ11により実行されることにより、入力された第1形式のビットストリームVを分割して、第1形式の分割ビットストリームv1〜vnとする分割処理をプロセッサ11に実行させる分割プログラム14が保存されている。分割プログラム14によるビットストリームの分割処理の内容については後述する。
図4は、図2に示す複数の変換部20のうちのいずれか1つの変換部の概略構成を示す図である。変換部20のハードウエア構成はコンピュータを用いて実現できる。すなわち変換部20は、CPUなどのプロセッサ21と、プロセッサ21により実行されるオペレーティングシステム(OS)23やプログラムが保存されるストレージユニット22と、プロセッサ21が実行するプログラムを読み込み、かつプロセッサ21による処理に必要なデータを一時的に記憶させるメモリ25と、第1形式の分割ビットストリームv1〜vnのいずれかであるvkを分割部10から入力し、このストリームvkから変換された第2形式の分割ビットストリームskを結合部30へ出力する、インタフェース26を備えて構成される。
ストレージユニット22には、プロセッサ21により実行されることにより、入力された第1形式の分割ビットストリームvkを、第2形式の分割ビットストリームskへ変換する変換処理をプロセッサ21に実行させる変換プログラム24が保存されている。変換プログラム24によるビットストリームの変換処理の内容については後述する。
図5は、図2に示す結合部30の概略構成を示す図である。結合部30のハードウエア構成はコンピュータを用いて実現できる。すなわち、結合部30は、CPUなどのプロセッサ31と、プロセッサ31により実行されるオペレーティングシステム(OS)33やプログラムが保存されるストレージユニット32と、プロセッサ31が実行するプログラムを読み込み、かつプロセッサ31による処理に必要なデータを一時的に記憶させるメモリ35と、第2形式の分割ビットストリームs1〜snを変換部20から入力し、第2形式のビットストリームSを外部へ出力する、インタフェース36を備えて構成される。
ストレージユニット32には、プロセッサ31により実行されることにより、複数の第2形式の分割ビットストリームs1〜snを相互に結合することにより、第1形式のビットストリームVと同じコンテンツと異なる形式を有する第2形式のビットストリームSを生成する結合処理をプロセッサ31に実行させる結合プログラム34が保存されている。結合プログラム34によるビットストリームの変換処理の内容については後述する。
図3〜図5に示すハードウエア構成例では、分割部10、変換部20及び結合部30が別個のコンピュータであるものとして構成したが、本発明によるビットストリーム変換装置の構成はこれに限定されるものではない。複数の変換部20a〜20nがそれぞれ並列に行う変換処理を別個のプロセッサによって行いうる構成であれば、他のいかなる構成を採用してもよい。
図6は、図2に示す分割部10により実現される機能ブロック図を示す図である。図3に示すプロセッサ11が分割プログラム14を実行することにより、分割部10は、第1形式のビットストリームVを複数の分割ビットストリームv1〜vnへと分割するための分割位置を定める分割位置決定処理を行う分割位置決定部111と、分割位置決定部111が決定した分割位置において第1形式のビットストリームVを分割する分割処理を行うストリーム分割部112を実現する。以下、分割部10によるビットストリームの分割方法を説明する。
図2を参照して説明したように、分割部10は、第1形式のビットストリームVを複数の分割ビットストリームv1〜vnへと分割する際に、分割ビットストリームv1〜vn同士の分割箇所に重複部分が生じるように、各分割ビットストリームv1〜vnの開始位置と終了位置を決定する。図7は、本発明によるビットストリームの分割位置決定方法の第1例を示すフローチャートである。この例では、各分割ビットストリームv1〜vnに含まれるキーフレームがほぼ同じ数になるようにビットストリームの分割位置を定める。本明細書において用語「キーフレーム」とは、フレーム間予測符号化を用いずに生成したフレームを指し示すために使用される。キーフレームの例としては、例えばMPEG形式の動画ストリームにおけるIピクチャを挙げることができる。
ステップS10において分割位置決定部111は、第1形式のビットストリームVに含まれる全ての画像キーフレームを検索する。ここでzvを画像キーフレームの総数としNをビットストリームの分割数とする。分割位置決定部111は、i番目の分割ビットストリームviの仮先頭位置tdsを、((i−1)×(zv/N)+1)番目の画像キーフレームの位置から((i−1)×(zv/N)+2)番目の画像キーフレームの位置までの間のいずれかの位置に決定する(iは1からNまでの整数)。
また分割位置決定部111は、i番目の分割ビットストリームviの仮終了位置tdeを、(i×(zv/N)+1)番目の画像キーフレームの位置から(i×(zv/N)+2)番目の画像キーフレームの位置までの間のいずれかの位置に決定する。
ステップS11では分割位置決定部111は、各分割ビットストリームviについて、画像ストリームに関する開始位置tsvを決定する。このとき分割位置決定部111は、ステップS10にて決定した仮先頭位置tdsから所定時間tav遡った時間よりも前に現れる画像キーフレームの先頭位置を、開始位置tsvとして決定する。仮先頭位置tds、開始位置tsv及び所定時間tavの関係を図8Aに示す。なお、図8A及び図8Bに示される各升目はそれぞれフレームを示し、Aと記載されたフレームは音声フレームを示しVと記載されたフレームは画像フレームを示す。また梨地模様で示されたフレームはキーフレームを示す。
ステップS12において分割位置決定部111は、各分割ビットストリームviについて、画像ストリームに関する終了位置tevを決定する。このとき分割位置決定部111は、ステップS10にて決定した仮終了位置tdeから所定時間tbv進んだ時間よりも後に現れる画像キーフレームの先頭位置の直前の位置を、終了位置tevとして決定する。仮終了位置tde、終了位置tev及び所定時間tbvの関係を図8Aに示す。
ステップS11及びS12のように画像ストリームに関する開始位置と終了位置を決定することにより、時系列上隣り合う分割ストリームviとvi+1とは、少なくとも所定時間tav+tbv程度の重複部分を有することになる。
ステップS13において分割位置決定部111は、各分割ビットストリームviについて、音声ストリームに関する開始位置tsaを決定する。このとき分割位置決定部111は、ステップS11にて決定した画像ストリームの先頭位置tsvから所定時間taa遡った時間よりも前に現れる音声キーフレームの先頭位置を、音声ストリームの開始位置tsaとして決定する。各開始位置tsa、tsv及び所定時間taaの関係を図8Aに示す。
ステップS14において分割位置決定部111は、各分割ビットストリームviについて、音声ストリームに関する終了位置teaを決定する。このとき分割位置決定部111は、ステップS12にて決定した画像ストリームの終了位置tevから所定時間tba進んだ時間よりも後に現れる音声キーフレームの先頭位置を、音声ストリームの終了位置teaとして決定する。各終了位置tea、tev及び所定時間tbaの関係を図8Aに示す。
ステップS13及びS14のように音声ストリームに関する開始位置と終了位置を決定することにより、各分割ストリームの音声ストリームは、画像ストリームより長い重複部分を有することになる。音声ストリームに関する重複部分を画像ストリーム関する重複部分よりも長く設定する理由は、人間が音声の乱れを画像の乱れよりも敏感に感知することに由来する。すなわち音声ストリームに関する重複部分を長くすることによって、音声ストリーム同士をより自然に結合するための様々な音声処理を容易にすることが可能となる。
ストリーム分割部112は、それぞれの分割ストリームに対して分割位置決定部111が決定した開始位置〜終了位置のビットストリームを、第1形式のビットストリームVからそれぞれ切り出すことによって、第1形式の分割ストリームv1〜vnを抽出する。
図9は、本発明によるビットストリームの分割位置決定方法の第2例を示すフローチャートである。図9に示す方法では、各分割ビットストリームv1〜vnに含まれるデータ長(ビット数)がほぼ同じになるようにビットストリームの分割位置を定める。
ステップS20において、分割位置決定部111は、i番目の分割ビットストリームviの仮先頭位置tdsを、ビットストリーム上の((i−1)×(L/N)+1)番目のビット位置に決定する(iは1からNまでの整数)。ここに、ここでLをビットストリームVの総ビット数、NをビットストリームVの分割数とする。
また分割位置決定部111は、i番目の分割ビットストリームviの仮終了位置tdeをビットストリーム上の(i×(L/N)+1)番目のビット位置に決定する。その後、分割位置決定部111は、図7に示すフローチャートのステップS11〜S14と同様にして各分割ビットストリームの開始位置及び終了位置を決定する。
図10は、図2に示す変換部20により実現される機能ブロック図の第1例を示す図である。図4に示すプロセッサ21が変換プログラム24を実行することにより、変換部20は、第1形式の分割ビットストリームvk(kは1〜nの整数)を第2形式のビットストリームskに変換するエンコーダ121と、エンコーダ121が第2形式のビットストリームskを生成する際の各時刻のビットレートを制御するビットレート制御部122と、メモリ25内の所定の記憶領域に割り当てられ速度平滑化メモリとして利用されるストリームバッファ123の使用量を検出するバッファ使用量検出部124と、後述する所定の補助情報hkを生成する補助情報作成部125と、を実現する。
補助情報hkは第2形式のビットストリームskの画像キーフレーム毎に生成される。ここで変換部20により変換される第1形式の分割ビットストリームv1〜vnは、重複部分tx1〜txnを有しているため、変換後の第2形式の分割ビットストリームsk同士もまた重複部分を有する。補助情報作成部125は、このような第2形式の分割ビットストリームsk同士の重複部分に含まれる画像キーフレームについてのみ補助情報hkを生成してもよい。
補助情報hkは、各画像フレームを生成する際に発生した情報量を示す情報であってよい。このような情報には、例えば、エンコーダ121が各画像フレームを生成する時の情報発生量hkfや、ストリームバッファ123の使用量hkv(以下、「バッファ使用量」と示す)などが含まれる。
また補助情報hkは、各画像フレームの画質を示す画質情報hkqであってもよい。このような情報には、例えば、エンコーダ121による各画像フレームの符号化に使用された量子化サイズ、符号化誤差や、例えばDCT係数などのフレーム内符号化で生じた係数の分布などの情報が含まれる。画質情報hkqは、画像フレームがマクロブロックのような小区画に分割されて符号化されている場合にはマクロブロック毎に値を有する数値の組組合せとして生成してもよく、画像フレーム全体に含まれる全マクロブロックの平均値として生成してもよい。
また補助情報hkは、各画像フレーム間の類似度の指標となる類似指標情報hksであってもよい。このような情報には、各画像フレームの動きベクトル情報が含まれる。
補助情報作成部125は、作成する補助情報hkの内容に応じて、必要な情報をバッファ使用量検出部124やエンコーダ121から入力し補助情報hkを生成する。
図11は、図2に示す結合部30により実現される機能ブロック図の第1例を示す図である。図5に示すプロセッサ31が結合プログラム34を実行することにより、結合部30は、変換部20a〜20nからそれぞれ入力した補助情報h1〜hnに基づいて、変換部20a〜20nからそれぞれ入力した重複部分を有する第2形式の分割ビットストリームs1〜sn同士の接合フレーム位置を決定する結合フレーム位置決定部131と、第2形式の分割ビットストリームs1〜snの重複部分に含まれる不要データを削除する不要データ削除部132と、不要データが削除された分割ビットストリームs1〜sn同士を結合して、第2形式のビットストリームSを作成するデータ結合部133と、を実現する。
結合フレーム位置決定部131は、時系列上隣接する2つの分割ビットストリーム間の重複部分の中からこれら2つの分割ビットストリーム同士を接合するべきキーフレーム位置である接合フレーム位置を決定する。
不要データ削除部132は、第2形式の各分割ビットストリームs1〜snについて、当該分割ビットストリームの端から接合フレーム位置までの部分を削除することにより分割ビットストリームs1〜sn間の重複部分を無くす。
以下、本発明によるビットストリームの結合方法を説明する。ここでは時系列上隣接する2つの分割ビットストリームsk及びsk+1を結合する場合を想定する。図12は、本発明によるビットストリームの結合方法の第1例を示すフローチャートである。
ステップS30において結合フレーム位置決定部131は、ストリームskについて作成された補助情報hskと、ストリームsk+1について作成された補助情報hsk+1との間の差分Δhを算出する。
補助情報hskと補助情報hsk+1は、2つのストリームsk及びsk+1間の重複部分の各キーフレーム毎に作成されている。ここで、以下の説明では分割前の第1形式のビットストリームVの各フレームの時刻t又は位置tを、ビットストリームVを最初から最後まで通して再生した場合のそれのフレームの再生時刻又は再生位置を用いて示すものとする。そして第2形式の分割ストリームsk及びsk+1に含まれる各フレームの時刻や位置を示す場合には、それぞれのフレームの変換元になった第1形式のビットストリームV内のフレームの時刻や位置を用いて示すこととする。そしてある時刻tのキーフレームについて作成された補助情報をhsk(t)及びhsk+1(t)と示す。
上述の通り分割部10は第1形式のビットストリームVをキーフレームの位置で分割している。したがって変換部20が分割ビットストリームの変換処理を行うときに、画像キーフレームの位置を変えずに変換処理を行うか、又は第2形式の分割ビットストリームs1〜snにおける画像キーフレームの出現頻度を第1形式の分割ビットストリームv1〜vnにおける画像キーフレームの出現頻度の整数倍となるように変換処理を行うことによって、図13に示すように、2つの分割ビットストリームsk及びsk+1の間において重複部分における画像キーフレームの位置は一致する。
結合フレーム位置決定部131は、各キーフレーム毎に、補助情報の差分Δh(t)を算出する。例えば、補助情報hsk(t)が、時刻tのキーフレームを生成した時の情報発生量hskf(t)、時刻tにおけるバッファ使用量hskv(t)、時刻tのキーフレームの画質情報hskq(t)及び時刻tのキーフレームの類似指標情報hsks(t)を含み、また補助情報hsk+1(t)が、時刻tのキーフレームを生成した時に情報発生量hsk+1f(t)、時刻tにおけるバッファ使用量hsk+1v(t)、時刻tのキーフレームの画質情報hsk+1q(t)及び時刻tのキーフレームの類似指標情報hsk+1s(t)を含む場合には、差分Δh(t)を下式(1)により算出してよい。
Δh(t)=α×Δhf(t)+β×Δhv(t)+γ×Δhq(t)+η×Δhs(t) …(1)
ここで、α、β、γ及びηは所定の定数であり、
Δhf(t)=|hskf(t)−hsk+1f(t)| …(2)、
Δhv(t)=|hskv(t)−hsk+1v(t)| …(3)、
Δhq(t)=|hskq(t)−hsk+1q(t)| …(4)、
Δhs(t)=|hsks(t)−hsk+1s(t)| …(5)、
とする。
ステップS31において結合フレーム位置決定部131は、ビットストリームsk及びsk+1の重複部分に含まれるキーフレーム位置のうちから、補助情報の差分Δh(t)が最小となる位置を検索し、見つかった位置(時刻)tを結合フレーム位置の候補とする。
ステップS32において結合フレーム位置決定部131は、結合フレーム位置の候補tにおいてビットストリームskとsk+1とを結合した場合に、結合後のビットストリームがオーバーフローを起こす、すなわちビットストリームの各時点における情報量が、速度平滑化メモリであるバッファの使用量について所定の規格で定めた上限値を超えるか否かを判定する。以下の説明において、ビットストリームの各時点における情報量がバッファ使用量について所定の規格で定めた上限値を超えることによってこの規格に違反することを表すために、オーバーフローを起こす又はオーバーフローが発生するという表現を用いることがある。
結合フレーム位置決定部131は、例えば以下のようにしてこの判定処理を行うことができる。いま結合位置をaとすると、結合フレーム位置決定部131は、ビットストリームskを符号化したときの時刻aにおけるバッファ使用量hskv(a)は、ビットストリームsk内の時刻aにおけるキーフレームについて作成された補助情報hsk(a)から知ることができる。
また結合フレーム位置決定部131は、時刻aから時刻aより後の時刻bまでの間に、ビットストリームsk+1を符号化したときの発生した情報発生量を、ビットストリームsk+1を符号化したときの時刻aにおけるバッファ使用量hsk+1v(a)と、時刻bにおけるバッファ使用量hsk+1v(b)の差に基づいて算出することができる。
したがって、結合フレーム位置決定部131は、ビットストリームsk及びsk+1を時刻aにおいて結合したときに、その後の時刻bにおけるバッファ使用量hv(b)を、ビットストリームskを符号化したときの時刻aにおけるバッファ使用量hskv(a)と、ビットストリームsk+1を符号化したときの時刻a及びbにおけるバッファ使用量hsk+1v(a)、hsk+1v(b)とに基づいて算出することができる。
結合フレーム位置決定部131は、このようにして算出したバッファ使用量hv(b)を、時刻aから所定の時間長だけ監視し、この間にバッファ使用量hv(b)が所定の上限値を超えるか否かを判定することによって、オーバーフローを起こすか否かを判定する。
ステップS32にてオーバーフローを起こさないと判定された場合には、結合フレーム位置決定部131は、ステップS32にて判定の対象となった候補の位置を、結合フレーム位置として決定する(ステップS33)。ステップS32にてオーバーフローを起こすと判定された場合には、処理はステップS34に進む。
ステップS34において結合フレーム位置決定部131は、ビットストリームsk及びsk+1の間の重複部分から、すでに結合フレーム位置の候補となったキーフレーム位置以外のキーフレーム位置のうちΔh(t)が最小となる位置を検索して、次の結合フレーム位置の候補を探す。
次の結合フレーム位置の候補が見つかった場合には、その候補についてステップS32による判定処理を行い(ステップS35)、候補が見つからなくなるまでステップS32〜ステップS35を繰り返す。
ビットストリームsk及びsk+1の間の重複部分に含まれる全てのキーフレームについてステップS32による判定処理が行われ、もはやオーバーフローを起こさない結合位置が見つからない場合には、ステップS36において結合フレーム位置決定部131は、ビットストリームskを符号化したときのバッファ使用量hskv(t)と、ビットストリームsk+1を符号化したときのバッファ使用量hsk+1v(t)との差が最も小さいキーフレームの位置を、結合フレーム位置に決定し、オーバーフローによる情報欠落を最小にする。
図14は、本発明によるビットストリームの結合方法の第2例を示すフローチャートである。第2例の方法では、ビットストリームskとsk+1との間の結合フレーム位置の候補としてより多くの候補位置を使用する。このため変換部20は、第1形式の分割ビットストリームvkとvk+1を第2形式の分割ビットストリームskとsk+1へそれぞれ変換するほかにも、分割ビットストリームvkとvk+1の重複部分内に包含される部分ビットストリームvk’1についても、第2形式の部分ビットストリームsk’1へ変換する。図15にビットストリームsk、sk+1及びこれらの重複部分内に包含される部分ビットストリームsk’1の関係を示す。
なお、時系列上連続する2つビットストリームからなる組(sk、sk+1)1個に対して、これらビットストリーム間の重複部分に包含される複数の部分ビットストリームsk’1、sk’2、…を生成してもよい。このような複数の部分ビットストリームsk’1、sk’2は、例えば区間やその長さ、または第2形式への変換に使用するビットレートなどを変えて生成してもよい。
以下の説明において、部分ビットストリームsk’1に含まれる各フレームの位置もまた、それぞれのフレームの変換元になった第1形式のビットストリームVのフレームの再生時刻で示すこととする。
変換部20は、部分ビットストリームsk’1、sk’2、…内の各画像キーフレームについても補助情報hsk’1(t)、hsk’2(t)、…を生成する。
図14に示すステップS40〜S45において結合フレーム位置決定部131は、図12に示した結合方法のステップS30〜S35と同様に、ビットストリームskとsk+1とを直接結合する結合フレーム位置を検索する。
ビットストリームskとsk+1とを直接結合する結合フレーム位置がビットストリーム見つからなかった場合には、結合フレーム位置決定部131はステップS46において、あるキーフレームの位置t1(図15に図示)におけるビットストリームskの補助情報hsk(t1)と、部分ビットストリームsk’1の補助情報hsk’1(t1)との間の差分Δh1(t1)を算出する。
また結合フレーム位置決定部131は、位置t1より後の位置t2(図15に図示)における部分ビットストリームsk’1の補助情報hsk’1(t2)とビットストリームskの補助情報hsk+1(t2)との間の差分Δh2(t2)を算出する。Δh1(t1)とΔh2(t2)の算出は、上式(1)〜(5)により示したビットストリームskとsk+1との間の補助情報の差分Δh(t)の算出と同様に行ってよい。
ステップS47において結合フレーム位置決定部131は、ビットストリームskと部分ビットストリームsk’1とを位置t1で結合し、かつ部分ビットストリームsk’1とビットストリームsk+1とを位置t2で結合してもオーバーフローを起こさず、かつ、Δh1(t1)+Δh2(t2)を検索して、これらの位置t1及びt2を結合フレーム位置に決定する。
複数の部分ビットストリームsk’1、sk’2、…を使用できる場合には、これらの部分ビットストリームそれぞれについてステップS46及びS47を繰り返し、最も補助情報の差が最小となる結合フレーム位置を見付けてもよい。
部分ビットストリームsk’1を使用し、かつ結合フレーム位置として2つのフレーム位置t1及びt2が決定されたとき、データ結合部133は、図15に示すとおりビットストリームskと部分ビットストリームsk’1とを位置t1で結合し、かつ部分ビットストリームsk’1とビットストリームsk+1とを位置t2で結合する。したがって結合後のストリームSには、ビットストリームskのt1までの部分Δs1と、部分ビットストリームsk’1のt1〜t2の部分Δs2と、ビットストリームsk+1のt2から後の部分Δs2が含まれることになる。
図16は、図2に示す変換部20により実現される機能ブロック図の第2例を示す図であり、図17は、図2に示す結合部30により実現される機能ブロック図の第2例を示す図である。本構成では、図12に示すフローチャートのステップS35において、ビットストリームskとsk+1をどこの位置で結合してもオーバーフローを起こす場合に、ビットストリームskとsk+1の間の重複区間のビットストリームについて、第1形式から第2形式への変換処理をやり直す。
このため図17に示す結合フレーム位置決定部131は、ある重複区間について結合位置を決定する際にオーバーフローが起きたことを検出すると、この区間のビットストリームの変換を行った変換部20のいずれかに対して、オーバーフローが起きたことを知らせるエラー情報ekを出力する。
いま結合フレーム位置決定部131が、ビットストリームskとsk+1の間の結合位置を決定しようとした際に、これらのストリーム間の重複部分P内のどのキーフレームで結合使用としてもオーバーフローが発生するとする。
このときエラー情報ekには、重複部分Pの開始位置aにおけるビットストリームskのキーフレームについて作成されたバッファ使用量hskv(a)及びキーフレームの画質情報hskq(a)と、重複部分Pの終了位置bにおけるビットストリームsk+1のキーフレームについて作成されたバッファ使用量hsk+1v(b)及びキーフレームの画質情報hsk+1q(b)とを、少なくとも含める。
図16に示す変換部20は、エラー情報ekを受信すると、既に入力された第1形式の分割ビットストリームのうちの区間a〜bの部分のエンコードを再度実行する。このときビットレート制御部122は、エンコード開始時におけるストリームバッファ123の使用量がエラー情報ekにより与えられたバッファ使用量hskv(a)であるものと仮定して、エンコード終了時のストリームバッファ123の使用量が、エラー情報ekにより与えられたバッファ使用量hsk+1v(b)と等しくなるように、オーバーフロー制御を行う。
また、ビットレート制御部122は、再変換処理を施す際に重複部分Pのビットストリームの開始位置aのキーフレームについて生じる画質情報が、エラー情報ekにより与えられた画質情報hskq(a)と等しくなり、終了位置bのキーフレームについて生じる画質情報が、エラー情報ekにより与えられた画質情報hsk+1q(b)と等しくなるようにビットレート制御する。このように再変換処理により得られる重複部分のビットストリームの開始位置aと終了位置bの画質を、それぞれ第2形式のビットストリームsk及びsk+1の画質と合わせることにより、結合位置a及びbにおいて画質の変動を目立たなくさせる。
このようにビットレート制御部122は、重複部分Pのビットストリームの変換処理を行う際に、重複部分Pの開始位置aと終了位置bとの間におけるストリームバッファ123の使用量の差が(hsk+1v(b)−hskv(a))となり、かつ、重複部分Pの開始位置aにおける画質情報が画質情報hskq(a)と等しく、また終了位置bにおける画質情報が画質情報hsk+1q(b)と等しくなるように、エンコーダ121によりエンコードされるビットストリームのビットレートを制御する。
ビットレート制御部122は、重複部分Pの開始位置a〜終了位置bの間に発生する情報発生量を制御するのと同時に、開始位置a及び終了位置bにおける画質をエラー情報ekにより与えられた画質情報hskq(a)及び画質情報hsk+1q(b)によって指定される画質に合わせる必要がある。このに、図18に示すように、開始位置a〜終了位置bの途中の画質を連続的に変化させることによって(すなわちビットレートを変化させることによって)、区間a〜bの間で生じる情報発生量を増減させてもよい。図示の例では、区間a〜bの途中の画質を一点鎖線L1及び二点鎖線L2のように変化させながらエンコードした2つのビットストリームは、その開始位置aと終了位置bにおける画質情報がそれぞれ画質情報hskq(a)及び画質情報hsk+1q(b)と等しくなるにも関わらず、区間a〜bの間で生じる情報発生量が異なる。
以上、本発明の好適な実施態様について詳述したが、当業者が種々の修正及び変更をなし得ること、並びに、特許請求の範囲は本発明の真の精神および趣旨の範囲内にあるこの様な全ての修正及び変更を包含することは、本発明の範囲に含まれることは当業者に理解されるべきものである。
本発明は、動画信号が有する時間的相関及び空間的相関や、音声信号が有する時間的相関を利用して、動画信号や音声信号の圧縮を行うメディア信号符号化技術に利用可能である。特に動画ストリームや音声ストリームを含むビットストリームの形式を変換するストリーム変換技術に利用可能である。

Claims (7)

  1. 動画ストリーム及び音声ストリームを含んだコンテンツデータを含む第1形式のビットストリームを、第2形式のビットストリームへ変換するビットストリーム変換方法であって、
    前記第1形式のビットストリームを、分割位置に重複部分を持たせながら時系列的に分割して複数の第1形式の分割ビットストリームとし、
    前記複数の第1形式の分割ビットストリームを、複数の第2形式の分割ビットストリームへそれぞれ並列に変換し、
    前記複数の第2形式の分割ビットストリームを相互に結合し、
    前記第1形式のビットストリームを分割するとき、音声ストリームに関する分割箇所の重複部分の時間長を、動画ストリームに関する分割箇所の重複部分の時間長よりも長くすることを特徴とするビットストリーム変換方法。
  2. 前記第1形式のビットストリームは動画ストリームを含み、
    前記第2形式の分割ビットストリームの前記重複部分に含まれるキーフレームについて、前記第2形式の分割ビットストリーム同士の結合位置を選択するために参照される所定の補助情報を生成し、
    前記複数の第2形式の分割ビットストリームを相互に結合する際に、結合すべき前後ストリームについて各々生成された前記補助情報の差が最小となるキーフレーム位置を、結合フレーム位置として決定し、
    前記結合フレーム位置にて前記前後ストリームを結合する、
    ことを特徴とする請求項1に記載のビットストリーム変換方法。
  3. 動画ストリーム及び音声ストリームを含んだコンテンツデータを含む第1形式のビットストリームを、第2形式のビットストリームへ変換するビットストリーム変換装置であって、
    前記第1形式のビットストリームを時系列的に分割して複数の第1形式の分割ビットストリームにする分割部と、
    前記複数の第1形式の分割ビットストリームを、複数の第2形式の分割ビットストリームへそれぞれ変換する複数の変換部と、
    前記複数の第2形式の分割ビットストリームを相互に結合する結合部と、を備え、
    前記分割部は、前記第1形式のビットストリームを分割する際に、音声ストリームに関する分割箇所の重複部分の時間長が、動画ストリームに関する分割箇所の重複部分の時間長よりも長くなるように、分割位置に重複部分を持たせることを特徴とするビットストリーム変換装置。
  4. 前記第1形式のビットストリームは動画ストリームを含み、
    前記変換部は、前記複数の第2形式の分割ビットストリームの前記重複部分に含まれるキーフレームについて、前記第2形式の分割ビットストリーム同士の結合位置を選択するために参照される所定の補助情報を生成する補助情報生成部を備え、
    前記結合部は、結合すべき前後ストリームについて各々生成された前記補助情報の差が最小となるキーフレーム位置を、これら前後ストリーム同士を結合するための結合フレーム位置として決定する結合フレーム位置決定部と、
    前記結合フレーム位置にて前記前後ストリームを結合するデータ結合部と、
    を備えることを特徴とする請求項3に記載のビットストリーム変換装置。
  5. 画像ストリームを含んだコンテンツデータを含む第1形式のビットストリームを、時分割的にかつ重複部分を持つように分割した複数の第1形式の分割ビットストリームを、それぞれ第2形式の分割ビットストリームへ変換することによって得られた、複数の第2形式の分割ビットストリームを相互に結合するビットストリーム結合装置であって、
    前記複数の第2形式の分割ビットストリームの前記重複部分に含まれるキーフレームについて生成された、前記第2形式の分割ビットストリーム同士の結合位置を選択するために参照される、少なくともフレーム間の類似度を示す所定の補助情報を入力して、結合すべき前後ストリームについて各々生成された前記補助情報の差が最小となるキーフレーム位置を、これら前後ストリーム同士を結合するための結合フレーム位置として決定する結合フレーム位置決定部と、
    前記結合フレーム位置にて前記前後ストリームを結合するデータ結合部と、
    を備えることを特徴とするビットストリーム結合装置。
  6. 動画ストリーム及び音声ストリームを含んだコンテンツデータを含む第1形式のビットストリームを、第2形式のビットストリームへ変換するために、前記第1形式のビットストリームを時系列的に分割して複数の第1形式の分割ビットストリームにする分割部と、前記複数の第1形式の分割ビットストリームを複数の第2形式の分割ビットストリームへそれぞれ変換する複数の変換部と、前記複数の第2形式の分割ビットストリームを相互に結合する結合部と、を備えるビットストリーム変換装置における、前記分割部として設けられた分割処理用コンピュータにて動作するビットストリーム分割プログラムであって、
    第1形式のビットストリームを時系列的に分割して複数の分割ビットストリームにする分割処理を、前記分割処理用コンピュータに実行させ、この分割処理において、音声ストリームに関する分割箇所の重複部分の時間長が、動画ストリームに関する分割箇所の重複部分の時間長よりも長くなるように、分割位置に重複部分を持たせることを特徴とするビットストリーム分割プログラム。
  7. 請求項6に記載のビットストリーム分割プログラムによって、少なくとも動画ストリームを含んだ前記第1形式のビットストリームを分割することにより得られる前記第1形式の分割ビットストリームを、前記第2形式の分割ビットストリームへ変換する前記変換部として設けられた変換処理用コンピュータにて動作するビットストリーム変換プログラムであって、
    前記第2形式の分割ビットストリームの前記重複部分に含まれるキーフレームについて、前記第2形式の分割ビットストリーム同士の結合位置を選択するために参照される所定の補助情報を生成する補助情報処理を、前記変換処理用コンピュータに実行させることを特徴とするビットストリーム変換プログラム。
JP2009504993A 2007-03-19 2007-03-19 ビットストリーム変換方法、ビットストリーム変換装置、ビットストリーム結合装置、ビットストリーム分割プログラム、ビットストリーム変換プログラム及びビットストリーム結合プログラム Expired - Fee Related JP4917148B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2007/055556 WO2008114393A1 (ja) 2007-03-19 2007-03-19 ビットストリーム変換方法、ビットストリーム変換装置、ビットストリーム結合装置、ビットストリーム分割プログラム、ビットストリーム変換プログラム及びビットストリーム結合プログラム

Publications (2)

Publication Number Publication Date
JPWO2008114393A1 JPWO2008114393A1 (ja) 2010-07-01
JP4917148B2 true JP4917148B2 (ja) 2012-04-18

Family

ID=39765515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009504993A Expired - Fee Related JP4917148B2 (ja) 2007-03-19 2007-03-19 ビットストリーム変換方法、ビットストリーム変換装置、ビットストリーム結合装置、ビットストリーム分割プログラム、ビットストリーム変換プログラム及びビットストリーム結合プログラム

Country Status (4)

Country Link
US (1) US8411739B2 (ja)
EP (1) EP2124454B1 (ja)
JP (1) JP4917148B2 (ja)
WO (1) WO2008114393A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101590633B1 (ko) * 2008-11-11 2016-02-02 삼성전자주식회사 슬라이스 단위로 분할된 동영상을 처리하는 동영상 부호화/복호화장치 및 동영상 부호화/복호화방법
CN101951504B (zh) * 2010-09-07 2012-07-25 中国科学院深圳先进技术研究院 基于重叠边界的多媒体切片转码方法和系统
JP5967866B2 (ja) * 2011-04-26 2016-08-10 キヤノン株式会社 符号化装置、符号化方法及びプログラム
US9615126B2 (en) * 2011-06-24 2017-04-04 Google Technology Holdings LLC Intelligent buffering of media streams delivered over internet
US8935425B2 (en) 2011-10-05 2015-01-13 Qualcomm Incorporated Switching between representations during network streaming of coded multimedia data
US20130117418A1 (en) * 2011-11-06 2013-05-09 Akamai Technologies Inc. Hybrid platform for content delivery and transcoding
US9485456B2 (en) 2013-12-30 2016-11-01 Akamai Technologies, Inc. Frame-rate conversion in a distributed computing system
CN104679448B (zh) * 2015-02-05 2017-10-03 深圳市硅格半导体有限公司 数据比特流转换的方法和装置
US10025796B2 (en) * 2015-04-29 2018-07-17 Box, Inc. Operation mapping in a virtual file system for cloud-based shared content
CN106488273B (zh) * 2016-10-10 2019-09-10 广州酷狗计算机科技有限公司 一种传输直播视频的方法和装置
US11470131B2 (en) 2017-07-07 2022-10-11 Box, Inc. User device processing of information from a network-accessible collaboration system
JP7131690B2 (ja) * 2019-03-25 2022-09-06 日本電気株式会社 制御装置、制御方法、及びプログラム
US10880585B1 (en) * 2019-06-12 2020-12-29 Amazon Technologies, Inc. Split-and-stitch media content encoding
US11882324B1 (en) * 2021-09-02 2024-01-23 Amazon Technologies, Inc. Reconciliation for parallel transcoding

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5351083A (en) 1991-10-17 1994-09-27 Sony Corporation Picture encoding and/or decoding system
JPH05183891A (ja) 1991-12-27 1993-07-23 Sony Corp 動画像符号化装置
JPH0913367A (ja) 1995-06-28 1997-01-14 Nkk Corp ねじ継手杭の接合方法及びこれに使用する芯合わせ治具
TW303570B (ja) 1995-09-29 1997-04-21 Matsushita Electric Ind Co Ltd
JPH09284756A (ja) 1996-04-16 1997-10-31 Toshiba Corp 画像符号化復号化装置
JP3228874B2 (ja) * 1996-06-05 2001-11-12 松下電器産業株式会社 圧縮ディジタルビデオビットストリーム分割方法及び装置、並びにその復号方法及び装置
JP3341842B2 (ja) * 1997-06-19 2002-11-05 日本ビクター株式会社 バッファ管理方法
JPH1175184A (ja) * 1997-08-28 1999-03-16 Sanyo Electric Co Ltd 画像符号化装置及び画像符号化方法
JP3550651B2 (ja) * 1999-09-14 2004-08-04 日本電気株式会社 トランスコードの高速化方法及び装置
US20020057739A1 (en) 2000-10-19 2002-05-16 Takumi Hasebe Method and apparatus for encoding video
JP2002199392A (ja) 2000-10-19 2002-07-12 Matsushita Electric Ind Co Ltd 映像符号化方法および装置
US7116712B2 (en) * 2001-11-02 2006-10-03 Koninklijke Philips Electronics, N.V. Apparatus and method for parallel multimedia processing
JP3969649B2 (ja) * 2002-11-06 2007-09-05 株式会社エヌ・ティ・ティ・データ 映像データ処理システム
KR100543700B1 (ko) 2003-01-30 2006-01-20 삼성전자주식회사 영상의 중복 부호화 및 복호화 방법 및 장치
JP4329358B2 (ja) * 2003-02-24 2009-09-09 富士通株式会社 ストリーム配信方法、及びストリーム配信システム
JP4286061B2 (ja) * 2003-05-29 2009-06-24 株式会社エヌ・ティ・ティ・データ 映像データフォーマット変換システム及び方法
JP2005033382A (ja) 2003-07-09 2005-02-03 Canon Inc 映像・音声信号編集装置及びその制御方法
JP2005176069A (ja) 2003-12-12 2005-06-30 Ntt Data Corp 分散並列トランスコーダシステム及び分散並列トランスコード方法
WO2005104551A2 (en) * 2004-04-16 2005-11-03 Modulus Video, Inc. High definition scalable array encoding system and method
JP2006352443A (ja) 2005-06-15 2006-12-28 Fujitsu Ltd マルチメディア変換処理システム及びマルチメディア変換処理方法

Also Published As

Publication number Publication date
EP2124454A4 (en) 2011-06-08
US8411739B2 (en) 2013-04-02
EP2124454A1 (en) 2009-11-25
WO2008114393A1 (ja) 2008-09-25
US20090310669A1 (en) 2009-12-17
EP2124454B1 (en) 2014-11-19
JPWO2008114393A1 (ja) 2010-07-01

Similar Documents

Publication Publication Date Title
JP4917148B2 (ja) ビットストリーム変換方法、ビットストリーム変換装置、ビットストリーム結合装置、ビットストリーム分割プログラム、ビットストリーム変換プログラム及びビットストリーム結合プログラム
US6031575A (en) Method and apparatus for encoding an image signal, method and apparatus for decoding an image signal, and recording medium
US6674796B1 (en) Statistical multiplexed video encoding for diverse video formats
KR100440953B1 (ko) 영상 압축 비트 스트림의 트랜스코딩 방법
KR0161551B1 (ko) 압축화상의 편집 또는 합성방법 및 장치
US8804825B2 (en) Bi-pred mode decision in GOP architecture
KR101173335B1 (ko) 영상분할기반 초고해상도 비디오 부호화 및 복호화 장치, 및 그 제어 방법
US9712838B2 (en) Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method
JP5090158B2 (ja) 映像情報記録装置、映像情報記録方法、映像情報記録プログラム、及び映像情報記録プログラムを記録した記録媒体
JP4666255B2 (ja) 符号化データ選定、符号化データ設定、再符号化データ生成及び再符号化の方法及び装置
JPH11225168A (ja) 画像・音声送信装置、画像・音声受信装置、データ処理装置、及びデータ処理方法、並びに、波形データの送信方法、装置、及び波形データの受信方法、装置、並びに、動画像の送信方法、装置、及び動画像の受信方法、装置
KR20060088461A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
US8139877B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium including shot generation
US20160156920A1 (en) Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method
JP4853647B2 (ja) 動画像変換方法、動画像変換装置、動画像変換システムおよびサーバ装置並びにプログラム
KR20060027778A (ko) 베이스 레이어를 이용하는 영상신호의 엔코딩/디코딩 방법및 장치
JP2006340183A (ja) 画像符号化装置及び画像符号化方法
JP2002199392A (ja) 映像符号化方法および装置
US20020080399A1 (en) Data processing apparatus, data processing method, data processing program, and computer-readable memory storing codes of data processing program
KR20060069227A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
JP5472094B2 (ja) 動画像変換装置、動画像配信システム、動画像変換方法及びプログラム
KR101102393B1 (ko) 에러 파급을 방지하는 영상신호의 엔코딩 및 디코딩 방법과장치
JP4133581B2 (ja) テロップ合成装置、テロップ合成方法及びテロップ合成プログラム
KR20060059773A (ko) 베이스 레이어 픽처의 벡터를 이용하는 영상신호의엔코딩/디코딩 방법 및 장치
JP2006270294A (ja) 動画像符号化装置及び動画像復号化装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120125

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4917148

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees