JP4045553B2 - 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法 - Google Patents

編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法 Download PDF

Info

Publication number
JP4045553B2
JP4045553B2 JP2005143129A JP2005143129A JP4045553B2 JP 4045553 B2 JP4045553 B2 JP 4045553B2 JP 2005143129 A JP2005143129 A JP 2005143129A JP 2005143129 A JP2005143129 A JP 2005143129A JP 4045553 B2 JP4045553 B2 JP 4045553B2
Authority
JP
Japan
Prior art keywords
encoding
stream
picture
code amount
encoded stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2005143129A
Other languages
English (en)
Other versions
JP2005253116A (ja
Inventor
博美 吉成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005143129A priority Critical patent/JP4045553B2/ja
Publication of JP2005253116A publication Critical patent/JP2005253116A/ja
Application granted granted Critical
Publication of JP4045553B2 publication Critical patent/JP4045553B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23406Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving management of server-side video buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440254Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering signal-to-noise parameters, e.g. requantization
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • H04N7/52Systems for transmission of a pulse code modulated video signal with one or more other pulse code modulated signals, e.g. an audio signal or a synchronizing signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本発明は、複数の映像素材を編集することによって編集された映像素材を生成する編集装置および方法、複数のビットストリームをスプライシングすることによってシームレスなスプライシングストリームを生成するビットストリームスプライシング装置及び方法、ならびにビデオデータを符号化する符号化装置及び方法に関する。
近年、大容量のディジタルデータを記録可能な光ディスクであるDVD(ディジタル・バーサタイル・ディスクまたはディジタル・ビデオ・ディスク)のような蓄積メディアを用いて、圧縮符号化した画像データの記録や再生を行う記録再生システムや、複数の圧縮符号化された放送素材(プログラム)を多重化して伝送する多重伝送システムが提案されている。これらのシステムでは、MPEG(Moving Picture Experts Group)規格による画像データの圧縮符号化技術が利用されている。
このMPEG規格では、符号化方式として双方向予測符号化方式が採用されている。この双方向予測符号化方式では、フレーム内符号化、フレーム間順方向予測符号化および双方向予測符号化の3つのタイプの符号化が行われ、各符号化タイプによる画像は、それぞれIピクチャ(intra coded picture )、Pピクチャ(predictive coded picture)およびBピクチャ(bidirectionally predictive coded picture)と呼ばれる。また、I,P,Bの各ピクチャを適切に組み合わせて、ランダムアクセスの単位となるGOP(Group of Picture)が構成される。一般的には、各ピクチャの発生符号量は、Iピクチャが最も多く、次にPピクチャが多く、Bピクチャが最も少ない。
MPEG規格のようにピクチャ毎にビット発生量が異なる符号化方法では、得られる符号化ビットストリーム(以下、単にストリームとも言う。)を適切に伝送及び復号して画像を得るためには、画像復号化装置における入力バッファ内のデータ占有量を、画像符号化装置側で把握していなければならない。そこで、MPEG規格では、画像復号化装置における入力バッファに対応する仮想的なバッファであるVBV(Video Buffering Verifier)バッファを想定し、画像符号化装置側では、VBVバッファを破綻、つまりアンダフローやオーバフローさせないように、ストリームを生成しなければならない。
ここで、図1を参照して、MPEG規格に従った伝送システムおよび記録再生システムの概略について説明する。なお、図1は、ISO/IEC13818−1(MPEG1),ISO/IEC13818−2(MPEG2)を実現できるように構成された伝送システムを表している。
この伝送システムは、符号化装置110側の構成として、入力されるビデオデータDV をエンコード(符号化)して、符号化ビットストリームであるビデオエレメンタリストリーム(ビデオES)を出力するビデオエンコーダ111と、このビデオエンコーダ111より出力されるビデオエレメンタリストリームにヘッダ等を付加してパケット化し、ビデオパケッタイズドエレメンタリストリーム(ビデオPES)を出力するパケッタイザ112と、入力されるオーディオデータDA をエンコードして、符号化ビットストリームであるオーディオエレメンタリストリーム(オーディオES)を出力するオーディオエンコーダ113と、このオーディオエンコーダ113より出力されるオーディオエレメンタリストリームにヘッダ等を付加してパケット化し、オーディオパケッタイズドエレメンタリストリーム(オーディオPES)を出力するパケッタイザ114と、パケッタイザ112より出力されるビデオパケッタイズドエレメンタリストリームとパケッタイザ114より出力されるオーディオパケッタイズドエレメンタリストリームとを多重化し、188バイトのトランスポートストリームパケットを作成し、トランスポートストリーム(TS)として出力するトランスポートストリームマルチプレクサ(図では、TSMUXと記す。)115とを備えている。
また、図1に示した伝送システムは、復号化装置120側の構成として、トランスポートストリームマルチプレクサ115より出力され伝送メディア116を介して伝送されるトランスポートストリームを入力し、ビデオパケッタイズドエレメンタリストリーム(ビデオPES)とオーディオパケッタイズドエレメンタリストリーム(オーディオPES)とに分離して出力するトランスポートストリームデマルチプレクサ(図では、TSDEMUXと記す。)121と、このトランスポートストリームデマルチプレクサ121より出力されるビデオパケッタイズドエレメンタリストリームをデパケット化し、ビデオエレメンタリストリーム(ビデオES)を出力するデパケッタイザ122と、このデパケッタイザ122より出力されるビデオエレメンタリストリームをデコード(復号化)してビデオデータDV を出力するビデオデコーダ123と、トランスポートストリームデマルチプレクサ121より出力されるオーディオパケッタイズドエレメンタリストリームをデパケット化し、オーディオエレメンタリストリーム(オーディオES)を出力するデパケッタイザ124と、このデパケッタイザ124より出力されるオーディオエレメンタリストリームをデコードしてオーディオデータDA を出力するオーディオデコーダ125とを備えている。
図1における復号化装置120は、一般に、インテリジェントレシーバデコーダ(IRD)と呼ばれる。
なお、符号化されたデータをストレージメディアに記録する記録再生システムの場合には、図1におけるトランスポートストリームマルチプレクサ115の代わりに、ビデオパケッタイズドエレメンタリストリームとオーディオパケッタイズドエレメンタリストリームとを多重化してプログラムストリーム(PS)を出力するプログラムストリームマルチプレクサが設けられ、伝送メディア116の代わりに、プログラムストリームを記録する蓄積メディアが用いられ、トランスポートストリームデマルチプレクサ121の代わりに、プログラムストリームをビデオパケッタイズドエレメンタリストリームとオーディオパケッタイズドエレメンタリストリームとに分離するプログラムストリームデマルチプレクサが設けられる。
次に、ビデオデータを符号化処理、伝送処理及び復号化処理する場合を例にあげて、図1に示したシステムの動作について説明する。
まず、符号化装置110側では、各ピクチャが同じビット量を持つ入力ビデオデータDV は、ビデオエンコーダ111によってエンコードされ、各ピクチャ毎に、その冗長度に応じて異なるビット量に変換、圧縮され、ビデオエレメンタリストリームとして出力される。パケッタイザ112は、ビデオエレメンタリストリームを入力し、そのビットストリーム時間軸上のビット量の変動を吸収(平均)するためにパケット化し、ビデオパケッタイズドエレメンタリストリーム(PES)として出力する。このパケッタイザ112によってパケット化されるPESパケットは、1アクセスユニット又は複数のアクセスユニットから構成される。一般的には、この1アクセスユニットは、1フレームから構成される。トランスポートストリームマルチプレクサ115は、ビデオパケッタイズドエレメンタリストリームとパケッタイザ114より出力されるオーディオパケッタイズドエレメンタリストリームとを多重化してトランスポートストリームパケットを作成し、トランスポートストリーム(TS)として、伝送メディア116を介して、復号化装置120に送る。
復号化装置120側では、トランスポートストリームデマルチプレクサ121によって、トランスポートストリームが、ビデオパケッタイズドエレメンタリストリームとオーディオパケッタイズドエレメンタリストリームとに分離される。デパケッタイザ122は、ビデオパケッタイズドエレメンタリストリームをデパケット化して、ビデオエレメンタリストリームを出力し、ビデオデコーダ123は、ビデオエレメンタリストリームをデコードしてビデオデータDV を出力する。
復号化装置120は、一定の伝送レートで伝送されたストリームをVBVバッファにバッファリングすると共に、予めピクチャ毎に設定されたデコーデッドタイムスタンプ(DTS)に基いてVBVバッファからピクチャ毎にデータを引き出す。このVBVバッファの容量は、伝送される信号の規格に応じて決められており、メインプロファイル・メインレベル(MP@ML)のスタンダードビデオ信号の場合であれば、1.75Mビットの容量を有している。符号化装置110側では、このVBVバッファをオーバフローやアンダフローさせないように、各ピクチャのビット発生量をコントロールしなければならない。
次に、図2を参照して、VBVバッファについて説明する。図2において、折れ線はVBVバッファに記憶されるデータ占有量の変化を表し、その傾き131は伝送ビットレートを表し、垂直に落ちている部分132は各ピクチャの再生のためにビデオデコーダ123がVBVバッファから引き出すビット量を表している。ビデオデコーダ123が引き出すタイミングは、プレゼンテーションタイムスタンプ(PTS)と呼ばれる情報又デコーデッドタイムスタンプ(DTS)と呼ばれる情報によって指定される。このPTS及びDTSの間隔は、一般的には1フレーム期間である。なお、図2中、I,P,Bは、それぞれIピクチャ,Pピクチャ,Bピクチャを表している。これは、他の図においても同様である。また、図2中、vbv_delay は、VBVバッファの占有量が零の状態から一杯に満たされるまでの時間であり、TP はプレゼンテーションタイム周期を表している。デコーダ側において、図2に示したように、伝送されたストリームによって一定のビットレート131でVBVバッファが満たされ、プレゼンテーションタイムに従ったタイミングで各ピクチャ毎にデータがこのVBVバッファから引き出される。
次に、図3を参照して、MPEG規格の双方向予測符号化方式におけるピクチャの並べ替えについて説明する。図3において、(a)はエンコーダに対して供給される入力ビデオデータのピクチャ順を表し、(b)はエンコーダにおいて並べ替えが行われた後のピクチャの順番を表し、(c)はエンコーダより出力されるビデオストリームのピクチャ順を表している。図3に示したように、エンコーダでは、入力ビデオフレームは、エンコード時にピクチャの種類(I,P,B)に応じて並べ替えが行われて、並べ替え後の順番でエンコードされる。具体的には、Bピクチャは、Iピクチャ又はPピクチャから予測符号化されるので、図3(b)に示されるように、予測符号化に使用されるIピクチャ又はPピクチャの後に位置するように並び替えられる。エンコーダは、並び替えられたピクチャの順に符号化処理を行い、図3(b)及び(c)に示される順で、符号化された各ピクチャをビデオストリームとして出力する。出力された符号化ストリームは、伝送路を介してデコーダ又は蓄積メディアに供給される。なお、図3では、15枚のピクチャでGOPが構成されるものとしている。
図4は、図3において説明した予測符号化方式において、各ピクチャが、どのピクチャを使用して予測符号化処理されるかを示すための図であって、エンコーダにおけるピクチャの並べ替えと予測符号化処理との関係を表している。図4において、(a)はエンコーダに対する入力ビデオデータにおけるピクチャの順番を表し、(b)はエンコーダにおいて並べ替えが行われた後のピクチャの順番を表し、(c),(d)はそれぞれエンコーダ内の2つのフレームメモリFM1,FM2に保持されるピクチャを表し、(e)はエンコーダより出力されるエレメンタリストリーム(ES)を表している。なお、図中、I,P,Bに付随した数字はピクチャの順番を表している。エンコーダでは、図4(a)に示したような入力ビデオデータは、図4(b)に示したようなピクチャの順番に並べ替えられる。また、2つのフレームメモリFM1,FM2には、それぞれ図4(c),(d)に示したようなピクチャが保持される。そして、エンコーダは、入力ビデオデータがIピクチャの場合は入力ビデオデータ(Iピクチャ)のみに基づいて符号化処理を行い、入力ビデオデータがPピクチャの場合は入力ビデオデータとフレームメモリFM1に保持されているIピクチャまたはPピクチャとに基づいて予測符号化処理を行い、入力ビデオデータがBピクチャの場合は入力ビデオデータとフレームメモリFM1,FM2に保持されている2つのピクチャとに基づいて予測符号化処理を行う。図4(e)中の符号は、符号化処理に用いられるピクチャを表している。
次に、図5を参照して、MPEG規格の双方向予測復号化方式におけるピクチャの並べ替えについて説明する。図5において、(a)はエンコーダから伝送路を介してデコーダに供給された符号化ビデオストリームのピクチャの順番を表し、(b)はエンコーダから伝送路を介してデコーダに供給された符号化ビデオストリームを表わし、(c)はデコーダより出力されるビデオデータのピクチャ順を表している。図5に示したように、このデコーダでは、Bピクチャは、エンコード時にIピクチャ又はPピクチャを使用して予測符号化処理されているので、この予測符号化処理に使用されたピクチャと同じピクチャを用いて復号化処理を行なう。その結果、図5(c)に示されるように、このデコーダから出力されるビデオデータのピクチャの順番は、IピクチャやPピクチャよりBピクチャが早く出力される。
図6は、図5において説明した復号化処理をさらに詳しく説明するための図である。図6において、(a)はデコーダに対して供給される符号化されたビデオエレメンタリストリーム(ES)のピクチャの順番を表し、(b),(c)はそれぞれデコーダ内の2つのフレームメモリFM1,FM2に保持されるピクチャを表し、(d)はデコーダより出力される出力ビデオデータを表している。図4と同様に、図中、I,P,Bに付随した数字はピクチャの順番を表している。デコーダでは、図6(a)に示したような入力エレメンタリストリーム(ES)が入力されると、予測符号化処理に使用した2つのピクチャを記憶しければいけないので、2つのフレームメモリFM1,FM2には、それぞれ図6(b),(c)に示したようなピクチャが保持される。そして、デコーダは、入力エレメンタリストリームがIピクチャの場合は入力エレメンタリストリーム(Iピクチャ)のみに基づいて復号化処理を行い、入力エレメンタリストリームがPピクチャの場合は入力エレメンタリストリームとフレームメモリFM1に保持されているIピクチャまたはPピクチャとに基づいて復号化処理を行い、入力エレメンタリストリームがBピクチャの場合は入力エレメンタリストリームとフレームメモリFM1,FM2に保持されている2つのピクチャとに基づいて復号化処理を行って、図6(d)に示したような出力ビデオデータを生成する。
次に、図7を参照して、MPEG規格の双方向予測符号化方式における動き検出および動き補償について説明する。図7は、入力ビデオフレーム順に並んだピクチャ間の予測方向(差分をとる方向)を矢印で示したものである。MPEG規格では、より高圧縮を可能とする動き補償が採用されている。エンコーダでは、動き補償を行うために、エンコード時に、図7に示した予測方向に従って、動き検出を行って動きベクトルを得る。PピクチャおよびBピクチャは、この動きベクトルと、動きベクトルに従って得たサーチ画または予測画との差分値で構成される。デコード時には、この動きベクトルと差分値に基づいて、PピクチャおよびBピクチャが再構成される。
一般的に、図7に示されるように、Iピクチャは、そのIピクチャの情報から符号化されたピクチャで、フレーム間予測を使用せずに生成されたピクチャである。Pピクチャは、過去のIピクチャ又はPピクチャからの予測を行なうことによって生成されたピクチャである。Bピクチャは、過去のI又はPピクチャ及び未来のI又はPピクチャの双方向から予測されたピクチャ、過去のI又はPピクチャの順方向から予測されたピクチャ、又はI又はPの逆方向から予測されたピクチャのいずれかである。
ところで、放送局の編集システムにおいては、取材現場においてカムコーダやデジタルVTRを使用して収録したビデオ素材や、地方局や番組供給会社から伝送されてきたビデオ素材等を編集して、1つのオンエア用のビデオプログラムを生成するようにしている。近年、カムコーダやデジタルVTRを使用して収録されたビデオ素材及び地方局や番組供給会社等から供給されたビデオ素材は、前述したMPEG技術を使用して、圧縮符号化された符号化ストリームとして供給されることがほとんどである。その理由は、圧縮されていないベースバンドのビデオデータをそのまま記録媒体に記録するよりも、MPEG技術を使用して圧縮符号化した方が記録媒体の記録エリアを有効に活用できるという理由や、圧縮されていないベースバンドのビデオデータをそのまま伝送するよりも、MPEG技術を使用して圧縮符号化した方が伝送路を有効に活用できるという理由からである。
この従来の編集システムにおいては、例えば2つの符号化ビデオストリームを編集して1つのオンエア用のビデオプログラムを生成するためには、編集処理の前に、一端符号化ストリームの全データをデコードして、ベースバンドのビデオデータに戻さなければいけない。なぜなら、MPEG規格に準じた符号化ストリームに含まれる各ピクチャの予測方向は、前後のピクチャの予測方向と相互に関連しているので、ストリーム上の任意の位置において符号化ストリームを接続することができないからである。もし強引に2つの符号化ストリームをつなげたとすると、つなぎめが不連続になってしない、正確にデコードできなくなってしまうことが発生する。
従って、従来の編集システムにおいて供給された2つの符号化ストリームを編集しようとすると、2つのソース符号化ストリームを一端デコードして2つのベースバンドのビデオデータを生成するデコード処理と、2つのベースバンドのビデオデータを編集してオンエア用の編集されたビデオデータを生成する編集処理と、編集されたビデオデータを再び符号化して、符号化ビデオストリームを生成するという符号化処理とを行なわなくてはいけない。
しかしながら、MPEG符号化は100%可逆の符号化ではないので、このように編集処理だけのために復号化処理及び符号化処理を行なうと画質が劣化してしまうという問題があった。つまり、従来の編集システムにおいて編集処理するためには、必ず復号化処理と符号化処理とが必要であったので、その分だけ画質が劣化するという問題があった。
その結果、近年では、供給された符号化ストリームの全ての復号化処理せずに、符号化ストリームの状態のまま編集することを可能にする技術が要求されるようになってきた。尚、このように符号化されたビットストリームレベルで、異なる2つの符号化ビットストリームを連結し、連結されたビットストリームを生成することを「スプライシング」と呼んでいる。つまり、スプライシングとは、符号化ストリームの状態のままで複数のストリームを編集することを意味する。
しかしながら、このスプライシングを実現するためには以下のような3つの大きな問題点がある。
第1の問題点は、ピクチャプレゼンテーション順の観点からくる問題点である。このピクチャプレゼンテーション順とは、各ビデオフレームの表示順のことである。この第1の問題点について、図8および図9を参照して説明する。
図8および図9は、いずれも、ストリームの単純なスプライスを行ったときの、スプライス前後のストリームにおけるピクチャの順番とスプライス後のピクチャプレゼンテーションの順番との関係を示したものである。図8はピクチャプレゼンテーションの順番に問題が生じない場合について示し、図9はピクチャプレゼンテーションの順番に問題が生じている場合について示している。また、図8および図9において、(a)はスプライスされる一方のビデオストリームAを示し、(b)はスプライスされる他方のビデオストリームBを示し、(c)はスプライス後のストリームを示し、(d)はプレゼンテーションの順番を示している。また、SPA はストリームAにおけるスプライスポイントを示し、SPB はストリームBにおけるスプライスポイントを示し、STA はストリームAを示し、STB はストリームBを示し、STSPは、スプライシングされたストリームを示している。
エンコーダにおいてピクチャの並べ替えを行うことから、エンコード後の符号化ストリームにおけるピクチャの順番とデコード後のプレゼンテーションの順番とは異なる。しかしながら、図8に示したスプライス処理は、ストリームAのBピクチャの後にスプライスポイントSPAが設定され、ストリームBのPピクチャの前にスプライスポイントSPBが設定された例を示している図である。この図8(d)に示されるように、ストリームAとストリームBの境界SPを境にして、ストリームAのピクチャがストリームBのピクチャより後に表示されたり、ストリームBのピクチャがストリームAのピクチャの前に表示されるというような現象はおきていない。つまり、図8に示したスプライスポイントSPA及びSPBにおいてスプライシングする場合であれば、プレゼンテーションの順番に問題は生じない。
一方、図9に示したスプライス処理は、ストリームAのPピクチャの後にスプライスポイントSPAが設定され、ストリームBのBピクチャの前にスプライスポイントSPBが設定された例を示している図である。この図8(d)に示されるように、ストリームAとストリームBの境界SPを境にして、ストリームAの最後のピクチャがストリームBのピクチャより後に表示されたり、ストリームBの2つのピクチャがストリームAの最後のピクチャより前に表示されるとい現象が起こっいる。つまり、このような順でピクチャが表示されたとすると、スプライスポイントの近傍におて、ストリームAのビデオイメージからストリームBのビデオイメージに切り替わり、その2フレーム後に再びストリームAのビデオイメージが1フレームだけ表示されるという奇妙なイメージになってしまう。つまり、図9に示したスプライスポイントSPA及びSPBにおいてスプライシングする場合であれば、プレゼンテーションの順番に問題が生じる。
よって、任意のピクチャ位置でスプライスを実現するためには、このようなプレゼンテーション順に関する問題が発生することがある。
第2の問題点は、動き補償の観点からくる問題点である。この問題点について、図10ないし図12を参照して説明する。これらの図は、いずれも、ストリームの単純なスプライスを行ったときの、スプライス後のストリームにおけるピクチャの順番とピクチャプレゼンテーションの順番との関係を示したものであ。図10は動き補償に関して問題が生じない場合の例を示し、図11および図12は動き補償に関して問題が生じる場合の例を示している。なお、図11および図12は、それぞれ、図8および図9に示したスプライスを行った場合について示している。また、各図において、(a)はスプライス後のストリームを示し、(b)はプレゼンテーションの順番を示している。
図10に示した例では、ストリームBがクローズドGOP(以前のGOPに予測が依存しない閉じたGOP)であり、且つ、ちょうどGOPの切れ目でスプライスを行っているため、過不足なく動き補償が行われ、問題なくピクチャのデコードが行われる。
これに対し、図11および図12では、デコード時に、異なるストリームにおけるピクチャを参照する動き補償が行われるため、動き補償に問題が生じる。具体的には、ストリームAのPピクチャを参照してストリームBのBピクチャやPピクチャは作れないという理由から、図中、破線で示した予測方向での動きベクトルによる動き補償は無効(図ではNGと記す。)である。従って、図11および図12に示した例では、次のIピクチャまで、ピクチャが破綻したままになる。
任意のピクチャ単位でスプライスを行う場合、単純なストリーム上のスプライスでは、この問題は解決することができない。
第3の問題点は、VBVバッファの観点からくる問題点である。この問題点について、図13ないし図18を参照して説明する。図13は、ピクチャプレゼンテーションの順番、動き補償およびVBVバッファの条件を満たす理想的なストリームスプライスを行った場合の例を示している。なお、図中、STA ,STB ,STC は、それぞれストリームA,ストリームB,ストリームCを示している。図13において、(a)はデコーダ側のVBVバッファの状態を示し、(b)はスプライス後のストリームを示し、(c)はエンコーダにおける並べ替え後の各ピクチャの発生タイミングを示し、(d)はデコード後のピクチャの順番を示している。なお、図13において、SPV はVBVバッファにおけるスプライス点を示し、VOCはスプライス点SPV におけるVBVバッファの占有量を示し、SPS はストリームにおけるスプライス点を示している。図13に示した例では、VBVバッファの観点から見るとき、スプライスによりVBVバッファのオーバフローやアンダフロー等のVBVバッファの破綻が起きていない。
しかし、一般的には、任意のピクチャ単位にスプライスを行うときには、VBVバッファの破綻を起こさないという条件を満たすとは限らない。このことを図14ないし図18を参照して説明する。図14および図15は、それぞれ、VBVバッファの制約を満たす正常なストリームAおよびストリームBを表し、(a)はデコーダ側のVBVバッファの状態を示し、(b)はストリームA,Bを示している。このようなストリームA,Bを任意の位置で単純にスプライスした場合の3通りの例を、図16ないし図18に示す。これらの図において、(a)はデコーダ側のVBVバッファの状態を示し、(b)はスプライス後のストリームを示している。これらの図に示したように、ストリームA,Bをどこでスプライスするかによって、VBVバッファの状態が異なっている。図16に示した例では、スプライス後のストリームもVBVバッファの制約を満たしているが、図17に示した例では、符号141で示したオーバフローが発生しており、VBVバッファの制約を満たしていない。また、図18に示した例では、符号142で示したアンダフローが発生しており、VBVバッファの制約を満たしていない。デコーダ(IRD)側では、VBVバッファのアンダフローまたはオーバフローが発生すると、VBVバッファの破綻によりピクチャデコードに失敗し、シームレスな画像再生を実現することができない。そのときの画像再生の状態は、エンコーダ(IRD)の機能によって画像スキップ、フリーズ、処理ストップ等、様々である。任意のピクチャ単位でスプライスを行う場合、単純なストリーム上のスプライスでは、この問題は解決することができない。
このように、従来は、ストリーム上のシームレスなスプライスを実現する有効な手段がないという問題点があった。
なお、以上の説明に関連するものとして、以下の先行技術文献が挙げられる(特許文献1〜3)。
特開平08−205079号公報 特開平08−37640号公報 特開平06−253331号公報
本発明はかかる問題点に鑑みてなされたもので、その第1の目的は、復号化装置側の入力バッファに対応する仮想的バッファの破綻や仮想的バッファおけるデータ占有量の不連続が発生することがないように、複数の符号化ストリームをシームレスにスプライシングすることを実現するスプライシング装置及び編集装置を提供することにある。
本発明の第2の目的は、上記目的に加え、スプライシングポイント近傍における画質劣化を低減すると共に、再エンコード処理における画質劣化を防止するようにしたスプライシング装置、編集装置、及び符号化装置を提供することにある。
本発明の編集装置は、第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して第1の画像データを生成すると共に、第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して、第2の画像データを生成する復号手段と、第1の画像データ及び第2の画像データを、第1の編集点と第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化手段と、第1の画像データ及び第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手段と、再符号化処理する際の発生符号量とオフセット値とを用いて、目標符号量を補正する目標符号量補正手段と、目標符号量補正手段により補正された目標符号量に基づいて、再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、再符号化手段の再符号化処理を制御する制御手段と、第1の符号化ストリーム及び第2の符号化ストリームと再符号化手段により生成された再符号化ストリームとを、第1の切換点及び第2の切換点で切り換えて出力することによって、編集された編集符号化ストリームを生成する編集手段とを備えたものである。
本発明の編集装置では、第1の切換点及び第1の編集点を含む所定区間が復号処理されることで第1の画像データが生成されると共に、第2の編集点及び第2の切換点を含む所定区間が復号処理されることで第2の画像データが生成される。また、第1の画像データ及び第2の画像データが第1の編集点と第2の編集点とで接続されて再符号化処理され、再符号化ストリームが生成される。また、第1の画像データ及び第2の画像データが再符号化処理される際の目標符号量に対するオフセット値が演算され、再符号化処理する際の発生符号量とこのオフセット値とを用いて、目標符号量が補正される。そして、この補正された目標符号量に基づいて、再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように再符号化処理に対する制御がなされ、第1の符号化ストリーム及び第2の符号化ストリームと再符号化ストリームとが第1の切換点及び第2の切換点で切り換えて出力されることにより、編集された編集符号化ストリームが生成される。
本発明の編集方法は、第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して第1の画像データを生成すると共に、第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して、第2の画像データを生成する復号工程と、第1の画像データ及び第2の画像データを、第1の編集点と第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化工程と、第1の画像データ及び第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算工程と、再符号化処理する際の発生符号量とオフセット値とを用いて、目標符号量を補正する目標符号量補正工程と、目標符号量補正工程により補正された目標符号量に基づいて、再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、再符号化工程の再符号化処理を制御する制御工程と、第1の符号化ストリーム及び第2の符号化ストリームと再符号化工程により生成された再符号化ストリームとを、第1の切換点及び第2の切換点で切り換えて出力することによって、編集された編集符号化ストリームを生成する編集工程とを含むようにしたものである。
本発明の第1の再符号化装置は、第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して第1の画像データを生成すると共に、第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して、第2の画像データを生成する復号手段と、第1の画像データ及び第2の画像データを、第1の編集点と第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化手段と、第1の画像データ及び第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手段と、再符号化処理する際の発生符号量とオフセット値とを用いて、目標符号量を補正する目標符号量補正手段と、目標符号量補正手段により補正された目標符号量に基づいて、再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、再符号化手段の再符号化処理を制御する制御手段とを備えたものである。
本発明の第1の再符号化方法は、第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して第1の画像データを生成すると共に、第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して、第2の画像データを生成する復号工程と、第1の画像データ及び第2の画像データを、第1の編集点と第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化工程と、第1の画像データ及び第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算工程と、再符号化処理する際の発生符号量とオフセット値とを用いて、目標符号量を補正する目標符号量補正工程と、目標符号量補正工程により補正された目標符号量に基づいて、再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、再符号化工程の再符号化処理を制御する制御工程とを含むようにしたものである。
本発明の第2の再符号化装置は、第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して得られる第1の画像データ、ならびに第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して得られる第2の画像データを、第1の編集点と第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化手段と、第1の画像データ及び第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手段と、再符号化処理する際の発生符号量とオフセット値とを用いて、目標符号量を補正する目標符号量補正手段と、目標符号量補正手段により補正された目標符号量に基づいて、再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、再符号化手段の再符号化処理を制御する制御手段とを備えたものである。
本発明の第2の再符号化方法は、第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して得られる第1の画像データ、ならびに第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して得られる第2の画像データを、第1の編集点と第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化工程と、第1の画像データ及び第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算工程と、再符号化処理する際の発生符号量とオフセット値とを用いて、目標符号量を補正する目標符号量補正工程と、目標符号量補正工程により補正された目標符号量に基づいて、再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、再符号化工程の再符号化処理を制御する制御工程とを含むようにしたものである。
本発明のスプライシング装置は、第1の符号化ストリームに設定された第1のスプライシングポイントを含む所定区間を復号処理して得られる第1の画像データ及び第2の符号化ストリームに設定された第2のスプライシングポイントを含む所定区間を復号処理して得られる第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手段と、再符号化処理する際の発生符号量とオフセット値とを用いて、目標符号量を補正する目標符号量補正手段と、目標符号量補正手段により補正された目標符号量に基づいて、再符号化対象ストリームの発生符号量を割り当て、第1の符号化ストリームと第2の符号化ストリームとをスプライシングするスプライシング手段とを備えたものである。
本発明のスプライシング方法は、第1の符号化ストリームに設定された第1のスプライシングポイントを含む所定区間を復号処理して得られる第1の画像データ及び第2の符号化ストリームに設定された第2のスプライシングポイントを含む所定区間を復号処理して得られる第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手工程と、再符号化処理する際の発生符号量とオフセット値とを用いて、目標符号量を補正する目標符号量補正工程と、目標符号量補正工程により補正された目標符号量に基づいて、再符号化対象ストリームの発生符号量を割り当て、第1の符号化ストリームと第2の符号化ストリームとをスプライシングするスプライシング工程とを含むようにしたものである。
本発明の編集装置または編集方法によれば、第1の切換点及び第1の編集点を含む所定区間を復号処理することで第1の画像データを生成すると共に第2の編集点及び第2の切換点を含む所定区間を復号処理することで第2の画像データを生成し、第1の画像データ及び第2の画像データを第1の編集点と第2の編集点とで接続して再符号化処理することで再符号化ストリームを生成し、第1の画像データ及び第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算し、再符号化処理する際の発生符号量とこのオフセット値とを用いて目標符号量を補正し、この補正された目標符号量に基づいて再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように再符号化処理を制御し、第1の符号化ストリーム及び第2の符号化ストリームと再符号化ストリームとを第1の切換点及び第2の切換点で切り換えて出力することにより、編集された編集符号化ストリームを生成するようにしたので、符号化ストリームをシームレスに編集することが可能となるという効果を奏する。
また、本発明の第1の再符号化装置または第1の再符号化方法によれば、第1の切換点及び第1の編集点を含む所定区間を復号処理して第1の画像データを生成すると共に第2の編集点及び第2の切換点を含む所定区間を復号処理して第2の画像データを生成し、第1の画像データ及び第2の画像データを第1の編集点と第2の編集点とで接続して再符号化処理することで再符号化ストリームを生成し、第1の画像データ及び第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算し、再符号化処理する際の発生符号量とこのオフセット値とを用いて目標符号量を補正し、この補正された目標符号量に基づいて再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように再符号化処理を制御するようにしたので、符号化ストリームをシームレスに編集することが可能となるという効果を奏する。
また、本発明の第2の再符号化装置または第2の再符号化方法によれば、第1の切換点及び第1の編集点を含む所定区間を復号処理して得られる第1の画像データ、ならびに第2の編集点及び第2の切換点を含む所定区間を復号処理して得られる第2の画像データを第1の編集点と第2の編集点とで接続して再符号化処理することで再符号化ストリームを生成し、第1の画像データ及び第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算し、再符号化処理する際の発生符号量とこのオフセット値とを用いて目標符号量を補正し、この補正された目標符号量に基づいて再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように再符号化処理を制御するようにしたので、符号化ストリームをシームレスに編集することが可能となるという効果を奏する。
また、本発明のスプライシング装置またはスプライシング方法によれば、第1のスプライシングポイントを含む所定区間を復号処理して得られる第1の画像データ及び第2のスプライシングポイントを含む所定区間を復号処理して得られる第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算し、再符号化処理する際の発生符号量とこのオフセット値とを用いて目標符号量を補正し、この補正された目標符号量に基づいて再符号化対象ストリームの発生符号量を割り当て、第1の符号化ストリームと第2の符号化ストリームとをスプライシングするようにしたので、符号化ストリームをシームレスに編集することが可能となるという効果を奏する。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
図19は、本発明の一実施の形態に係るスプライシング装置及び編集装置の構成を示すブロック図である。このスプライシング装置及び編集装置は、例えば複数の映像素材のビデオデータVDA ,VDB をエンコーダ1A,1BによってMPEG規格による双方向予測符号化方式に従ってエンコードして得られた複数の符号化ビットストリーム(以下、単にストリームと言う。)STA ,STB を入力するようになっている。なお、本実施の形態におけるストリームは、エレメンタリストリーム、パケッタイズドエレメンタリストリーム、トランスポートストリームのいずれでもよい。
本実施の形態に係るスプライシング装置及び編集装置は、ストリームSTA ,STB を入力し、これらを一時的に記憶するためのバッファメモリ10と、ストリームSTA ,STB のビット数をカウントするストリームカウンタ11と、ストリームSTA ,STBのシンタックスを解析するストリーム解析部12と、スプライシング処理を行なうために後述する各ブロックをコントロールするためのスプライスコントローラ13とを備えている。
スプライシング装置及び編集装置は、更に、それぞれ、バッファメモリ10より出力されるストリームSTA ,STB をMPEG規格に従ってデコードして、ベースバンドビデオデータを出力するMPEGデコーダ14A,14Bと、これらのMPEGデコーダ14A,14Bからの出力ビデオデータをスイッチングするスイッチ15と、このスイッチ15から出力された出力ビデオデータを再エンコードするMPEGエンコーダ16と、バッファメモリ10より出力されるストリームSTA ,STB およびMPEGエンコーダ16より出力される再エンコードストリームSTREを切り換えて出力することにより、スプライスされたストリームSTSPを出力するスイッチ17とを備えている。
以下に、上述した各ブロックについて詳細に説明する。
バッファメモリ10は、後述するスプライスコントローラ13からの書込みコマンドに応答して、供給された2つのストリームSTA ,STBを一時的に記憶し、スプライスコントローラ13からの読み出しコマンドに応答して、記憶されたストリームSTA ,STBをそれぞれ読み出す。これによって、ストリームSTA ,STBのそれぞれに対して設定されたスプライシングポイントにおいてスプライスを行なうために、ストリームSTA ,STBのスプライシングポイントの位相及びタイミングの合わせることができる。
ストリームカウンタ11は、ストリームSTA ,STB を受取り、これらのストリームのビット数をそれぞれカウントし、そのカウント値をスプライスコントローラ13にそれぞれ供給する。このように供給されたビットストリームSTA ,STBのビット数をカウントする理由は、ストリームSTA ,STBに対応するVBVバッファのデータ占有量の軌跡を仮想的に把握するためである。
ストリーム解析部12は、ストリームSTA ,STBのシンタックスを解析することによって、シーケンス層、GOP層、ピクチャ層、及びマクロブロック層から適切な情報を抽出する。例えば、ピクチャのタイプ(I、B又はP)を示すピクチャタイプ、動きベクトル、量子化ステップ、及び量子化マトリックス等のエンコード情報を抽出して、それらの情報をスプライスコントローラ13に出力する。
これらのエンコード情報は、エンコーダ1A及び1Bにおける過去のエンコード処理において生成された符号化情報であって、本発明のスプライシング装置においては、これらの過去のエンコード情報を再エンコード処理時において選択的に使用する。
このスプライスコントローラ13は、ストリームカウンタ11から出力されたカウント値、ストリーム解析部12から出力されたエンコード情報、再エンコード区間を設定するためのパラメータn0 ,m0 およびスプライスポイントを指示するためのパラメータp0 を受取り、それらの情報に基いて、スイッチ15、MPEGエンコーダ16及びスイッチ17を制御する。具体的には、スプライスコントローラ13は、入力されたパラメータp0 に応じてスイッチ15のスイッチングタイミングを制御し、パラメータn0 ,m0 ,p0 に応じてスイッチ17のスイッチングタイミングを制御するようになっている。
また、スプライスコントローラ13は、ストリームカウンタ11及びストリーム解析部12から供給されたカウント値とストリーム解析部12から供給されたエンコード情報とに基いて、スプライシングされたストリームによってVBVバッファがオーバーフロー/アンダーフローしないようにすると共に、スプライシングされたストリームによってVBVバッファのデータ占有量の軌跡が不連続にならないように、再エンコード区間内の各ピクチャ対して新たな目標符号量を演算する。
さらに、プライスコントローラ13は、例えば、バッファメモリ10の書き込みアドレスおよび読み出しアドレスを制御することによって、バッファメモリ10における各ストリームSTA ,STB の遅延量を調整して、プレゼンテーションタイムを基準にして、各ストリームSTA ,STB のスプライスポイントの位相を調整するようになっている。
図20は、図19におけるMPEGデコーダ14A,14BとMPEGエンコーダ16の構成を示すブロック図である。なお、この図では、MPEGデコーダ14A,14Bを代表してMPEGデコーダ14として示し、ストリームSTA ,STB を代表してストリームSTとして示している。
MPEGデコーダ14は、ストリームSTを入力し、可変長復号化する可変長復号化回路(図ではVLDと記す。)21と、この可変長復号化回路21の出力データを逆量子化する逆量子化回路(図ではIQと記す。)22と、この逆量子化回路22の出力データに対して逆DCT(逆離散コサイン変換)を行う逆DCT回路(図ではIDCTと記す。)23と、この逆DCT回路23の出力データと予測画像データとを加算する加算回路24と、逆DCT回路23の出力データと加算回路24の出力データの一方を選択的にMPEGデコーダ14の出力データとして出力するスイッチ25と、加算回路24の出力データを保持するための2つのフレームメモリ(図では、FM1,FM2と記す。)26,27と、フレームメモリ26,27に保持されたデータとストリームSTに含まれる動きベクトルの情報とに基づいて、動き補償を行って予測画像データを生成し、この予測画像データを加算回路24に出力する動き補償部(図ではMCと記す。)28とを備えている。
MPEGエンコーダ16は、MPEGデコーダ14から供給された出力ビデオデータに対してエンコードのための前処理等を行うエンコーダ前処理部30を備えている。このエンコーダ前処理部30は、双方向予測符号化方式による符号化のためのピクチャの並べ替えや、16×16画素のマクロブロック化や、各ピクチャの符号化難易度の演算等の処理を行うようになっている。
MPEGエンコーダ16は、更に、エンコーダ前処理部30の出力データと予測画像データとの差分をとる減算回路31と、エンコーダ前処理部30の出力データと減算回路31の出力データの一方を選択的に出力するスイッチ32と、このスイッチ32の出力データに対して、DCT(離散コサイン変換)ブロック単位でDCTを行い、DCT係数を出力するDCT回路(図ではDCTと記す。)33と、このDCT回路33の出力データを量子化する量子化回路(図ではQと記す。)34と、この量子化回路34の出力データを可変長符号化して、再エンコードストリームSTREとして出力する可変長符号化回路(図ではVLCと記す。)35とを備えている。
MPEGエンコーダ16は、更に、量子化回路34の出力データを逆量子化する逆量子化回路(図ではIQと記す。)36と、この逆量子化回路36の出力データに対して逆DCTを行う逆DCT回路(図ではIDCTと記す。)37と、この逆DCT回路37の出力データと予測画像データとを加算して出力する加算回路38と、この加算回路38の出力データを保持するための2つのフレームメモリ(図では、FM1,FM2と記す。)39,40と、フレームメモリ39,40に保持されたデータと動きベクトル情報とに基づいて、動き補償を行って予測画像データを生成し、この予測画像データを減算回路31および加算回路38に出力する動き補償部(図ではMCと記す。)41とを備えている。
MPEGエンコーダ16は、更に、フレームメモリ39,40に保持されたデータとエンコーダ前処理部30の出力データとに基づいて動きベクトルを検出し、動きベクトル情報を出力する動き検出回路(図ではMEと記す。)42と、スプライスコントローラ13から供給されたエンコード情報と目標符号量とを受取り、これらの情報に基いて、量子化回路34,逆量子化回路36およびフレームメモリ39,40を制御するエンコードコントローラ43と、このエンコードコントローラ43によって制御され、エンコードコントローラ43から出力される動きベクトルの情報と動き検出回路42から出力される動きベクトルの情報の一方を選択的に動き補償部41に対して出力するスイッチ44とを備えている。
次に、図20に示したMPEGデコーダ14およびMPEGエンコーダ16の動作の概略について説明する。
まず、MPEGデコーダ14では、ストリームSTは、可変長復号化回路21によって可変長復号化され、逆量子化回路22によって逆量子化され、逆DCT回路23によって逆DCTが行われ、逆DCT回路23の出力データが加算回路24およびスイッチ25に入力される。Iピクチャの場合には、逆DCT回路23の出力データが、スイッチ25を介してMPEGデコーダ14の出力データとして出力される。PピクチャまたはBピクチャの場合には、加算回路24によって逆DCT回路23の出力データと動き補償部28より出力される予測画像データとが加算されてPピクチャまたはBピクチャが再現され、加算回路24の出力データが、スイッチ25を介してMPEGデコーダ14の出力データとして出力される。また、IピクチャまたはPピクチャは、適宜、フレームメモリ26,27に保持され、動き補償部28による予測画像データの生成に利用される。
一方、MPEGエンコーダ16では、MPEGデコーダ14の出力データはエンコーダ前処理部30に入力され、このエンコーダ前処理部30によって、ピクチャの並べ替えやマクロブロック化等が行われる。ここで、エンコーダ前処理部30は、スプライスコントローラ13からのピクチャタイプの情報に基づいてピクチャの並べ替えを行う。
エンコーダ前処理部30の出力データは、減算回路31およびスイッチ32に入力される。Iピクチャの場合には、スイッチ32は、エンコーダ前処理部30の出力データを選択的に出力する。PピクチャまたはBピクチャの場合には、減算回路31によってエンコーダ前処理部30の出力データから動き補償部41より出力される予測画像データが減算され、スイッチ32は、減算回路31の出力データを選択的に出力する。
スイッチ32の出力データは、DCT回路33によってDCTが行われ、DCT回路33の出力データが量子化回路34によって量子化され、可変長符号化回路35によって可変長符号化され、ストリームSTREとして出力される。
また、Iピクチャの場合には、量子化回路34の出力データは、逆量子化回路36によって逆量子化され、逆DCT回路37によって逆DCTが行われ、逆DCT回路37の出力データが、フレームメモリ39またはフレームメモリ40に保持される。Pピクチャの場合には、量子化回路34の出力データは、逆量子化回路36によって逆量子化され、逆DCT回路37によって逆DCTが行われ、加算回路38によって逆DCT回路37の出力データと動き補償部41からの予測画像データとが加算されてフレームメモリ39またはフレームメモリ40に保持される。フレームメモリ39またはフレームメモリ40に保持されたIピクチャまたはPピクチャは、適宜、動き補償部41による予測画像データの生成に利用される。また、動き検出回路42は、フレームメモリ39,40に保持されたデータとエンコーダ前処理部30の出力データとに基づいて動きベクトルを検出し、動きベクトルの情報を出力する。
エンコードコントローラ43は、スプライスコントローラ13から供給されたエンコード情報及び各ピクチャ毎の目標符号量を受取り、それらの情報に基いて、量子化回路34,逆量子化回路36、フレームメモリ39,40およびスイッチ44を制御する。
具体的には、エンコードコントローラ43は、スプライスコントローラ13から供給されたエンコード情報に含まれている動きベクトルを再利用するときには、その動きベクトルの情報をスイッチ44を介して動き補償部41に入力させ、スプライスコントローラ13から供給されたエンコード情報に含まれている動きベクトルを再利用しないときには動き検出回路42において新たに生成された動きベクトルの情報が動き補償部41に入力されるようにスイッチ44を制御する。また、エンコードコントローラ43は、スプライスコントローラ13から供給されたエンコード情報に含まれるピクチャタイプに基づいて、予測画像データの生成に必要なピクチャがフレームメモリ39,40に保持されるようにフレームメモリ39,40を制御する。
更に、エンコードコントローラ43は、可変長符号化回路35の発生符号量を監視すると共に、可変長符号化回路35を制御するようになっている。そして、エンコードコントローラ43は、設定された目標符号量に対して発生符号量が不足してVBVバッファがオーバフローしそうなときには、目標符号量に対する発生符号量の不足分を補うためにダミーデータの付加、すなわちスタッフィングを行うようになっている。また、エンコードコントローラ43は、設定された目標符号量に対して発生符号量が超過してVBVバッファがアンダフローしそうなときには、マクロブロック単位の符号化処理の停止処理であるスキップドマクロブロック処理(ISO/IEC13818−2 7.6.6)を行うようになっている。
次に、図21ないし図26を参照して、本発明の実施の形態におけるピクチャの並べ替え制御と動き補償制御に関して詳しく説明する。
図21はMPEGデコーダ14A,14Bによってデコードして得られたビデオデータ(以下、プレゼンテーションビデオデータと言う。)におけるスプライス点および再エンコード区間の一例を示す説明図である。図21(a)はストリームA(STA )に対応するプレゼンテーションビデオデータ、図21(b)はストリームB(STB )に対応するプレゼンテーションビデオデータを示している。まず、スプライス点を決めるときには、プレゼンテーションビデオデータ上でピクチャを指定する。スプライスポイントの指定は、パラメータ p0 によって行う。また、スプライス点を含むスプライス点前後の所定区間として、再エンコード区間を設定する。再エンコード区間の設定は、パラメータn0 ,m0 によって行う。
以下の説明では、図21に示したように、パラメータp0 を用いて、ストリームSTA に対応するプレゼンテーションビデオデータにおけるスプライス点のピクチャをAn-P0と表わすと、スプライス点のピクチャAn-P0よりも未来のピクチャは、A(n-P0)+1、A(n-P0)+2、A(n-P0)+3、A(n-P0)+4、・・・・・・と表わすことができ、スプライス点のピクチャAn-P0よりも過去のピクチャは、A(n-P0)-1、A(n-P0)-2、A(n-P0)-3、A(n-P0)-4、・・・・・・と表わすことができる。同様に、ストリームSTBに対応するプレゼンテーションビデオデータにおけるスプライス点のピクチャをBm-P0と表わすと、スプライス点のピクチャB0よりも未来のピクチャは、B(m-P0)+1、B(m-P0)+2、B(m-P0)+3、B(m-P0)+4、・・・・・・と表わすことができ、スプライス点のピクチャB0よりも過去のピクチャは、B(m-P0)-1、B(m-P0)-2、B(m-P0)-3、B(m-P0)-4、・・・・・・と表わすことができる。
再エンコード区間は、ストリームSTA に対応するプレゼンテーションビデオデータについては、スプライス点より前にn0 枚、ストリームSTB に対応するプレゼンテーションビデオデータについては、スプライス点より後にm0 枚とする。従って、再エンコード区間は、ピクチャA(n-P0)+n0 〜ピクチャAn-P0 ピクチャBm-P0〜ピクチャB(m-P0)-m0 となる。
本実施の形態では、このように設定された再エンコード区間について、再エンコード処理を行なうようにしている。この再エンコード処理とは、供給されたソース符号化ストリームSTA 及びSTB をデコードすることによってベースバンドビデオデータに戻し、スプライスポイントでこのデコードされた2つのビデオデータをつなげた後、このビデオデータを再エンコードして、新たなストリームSTREを作成するという処理である。
この再エンコード処理によって、ピクチャの並べ替えと動き補償に関する問題はなくなる。このことを、以下で説明する。
図22は、図21に示した例におけるデコード前後のピクチャの並びを示したものである。図22において、(a)は再エンコード区間近傍のストリームSTA を示し、(b)は再エンコード区間近傍のストリームSTA に対応するプレゼンテーションビデオデータを示し、(c)は再エンコード区間近傍のストリームSTB に対応するプレゼンテーションビデオデータを示し、(d)は再エンコード区間近傍のストリームSTBを示している。なお、図中、REPA は、ストリームSTA に対応するプレゼンテーションビデオデータ中の再エンコード対象ピクチャを示し、REPB は、ストリームSTB に対応するプレゼンテーションビデオデータ中の再エンコード対象ピクチャを示している。また、図中、曲線の矢印は、予測方向を表している。
図23は、図21及び図22に示したストリームSTAとストリームSTBとをスプライシング処理した後の状態を示しており、図23(a)は、2つのストリームをスプライシングした後のプレゼンテーションビデオデータを示し、図23(b)は2つのストリームをスプライシングした後のストリームSTSPを示している。図23(b)に示したストリームSTSPは、再エンコード区間について図23(a)に示した画像データを再エンコードして新たなストリームSTREを生成し、更に、再エンコード区間の前におけるオリジナルストリームSTA (以下、OSTA と記す。)と再エンコード区間内の新たなストリームSTREと再エンコード区間の後におけるオリジナルストリームSTB (以下、OSTB と記す。)とを連結して形成される。なお、図中、TREは再エンコード期間を示している。
図21ないし図23に示した例では、スプライス点の近傍において、異なるストリームに属するピクチャを利用した予測符号化処理は行われていないので、ピクチャのプレゼンテーション順に関しては、問題は生じていない。
次に、図21ないし図23に示した例とは、スプライスポイントが異なる他の例を、図24ないし図26に示す。
図24はプレゼンテーションビデオデータにおけるスプライス点および再エンコード区間の他の例を示す説明図である。図24において、(a)はストリームSTA に対応するプレゼンテーションビデオデータ、(b)はストリームSTB に対応するプレゼンテーションビデオデータを示している。
図25は、図24に示した例におけるデコード前後のピクチャの並びを示したものである。図25において、(a)は再エンコード区間近傍のストリームSTA を示し、(b)は再エンコード区間近傍のストリームSTA に対応するプレゼンテーションビデオデータを示し、(c)は再エンコード区間近傍のストリームSTB に対応するプレゼンテーションビデオデータを示し、(d)は再エンコード区間近傍のストリームSTB を示している。
図26は、図24に示した例におけるスプライス後のピクチャの並びを示したものである。図26において、(a)は、図25(b)に示したプレゼンテーションビデオデータと図25(c)に示したプレゼンテーションビデオデータとを連結した後の画像データを示し、(b)はスプライスされたストリームSTSPを示している。(b)に示したストリームSTSPは、再エンコード区間について(a)に示した画像データを再エンコードして新たなストリームSTREを生成し、更に、再エンコード区間の前における元のストリームSTA (OSTA )と再エンコード区間内の新たなストリームSTREと再エンコード区間の後における元のストリームSTB (OSTB )とを連結して形成される。
図23ないし図26に示した例では、スプライス点のピクチャBm-P0がPピクチャであるため、ピクチャタイプの再構成を行わずにそのまま図25(b)に示したプレゼンテーションビデオデータと図25(c)に示したプレゼンテーションビデオデータとを連結すると、ピクチャBm-P0の再エンコード時に、異なるストリームSTA に属するピクチャを利用した予測符号化処理が行われてしまい、画質劣化が生じてしまう。そこで、本実施の形態では、スプライス点近傍において、異なるストリームに属するピクチャを利用した予測符号化処理が行われないようにピクチャタイプの再構成を行う。図26(a)は、このピクチャタイプの再構成の結果、ピクチャBm-P0がPピクチャからIピクチャに変えられた後の状態を示している。
また、図26(a)では、ピクチャAn-P0がBピクチャとなっており、このピクチャAn-P0は、本来、双方向からの予測符号化処理が行われるピクチャであるが、そうすると、ピクチャAn-P0の再エンコード時に、異なるストリームSTB に属するピクチャを利用した予測符号化処理が行われてしまい、画質劣化が生じてしまう。そこで、本実施の形態では、Bピクチャであっても、再エンコード時に、異なるストリームに属するピクチャ側からの予測は用いずに予測符号化処理を行なう。従って、図26(a)に示した例では、ピクチャAn-P0については、その前のPピクチャ( A(n-P0)+1 )のみを用いた予測符号化処理を行う。
以上のようなピクチャタイプの再構成の設定は、スプライスコントローラ13によって行われ、ピクチャタイプの再構成の設定の情報がMPEGエンコーダ16のエンコードコントローラ43に与えられる。エンコードコントローラ43は、ピクチャタイプの再構成の設定に従って、符号化処理を行う。動きベクトル等の過去の符号化処理において生成されたエンコード情報の再利用も、ピクチャタイプの再構成の設定に従って行われる。
なお、本実施の形態によるスプライス処理では、単純なストリーム上のスプライスとは異なるため、図25(d)に示したようにストリームSTB においてピクチャBm-P0の後(過去)に存在していたBピクチャ(B(m-P0)+2及びB(m-P0)+1 )は、図25(c)に示したようにデコード後に捨てられるため、再エンコード後のピクチャ列では存在しない。
次に、図27から図30を参照して、本実施の形態における再エンコード区間内の画像データに対する新たな目標符号量の算出方法について説明する。
2つのストリームを単純にスプライスすると、スプライスポイント後に、スプライスされたストリームのVBVバッファがアンダーフロー又はオーバーフローしてしまったり、又は、スプライスされたストリームのVBVバッファのデータ占有量の軌跡が不連続になることが起こる。これらの問題点を解決するための本発明のスプライシング装置の再エンコード処理について図27から図30を参照して説明する。
まず、図27を参照して、スプライスストリームのVBVバッファがアンダーフロー及びVBVバッファのデータ占有量が不連続になる問題について説明する。
図27は、先に説明した図23に対応する単純なスプライス処理を行なった場合の例であって、図27(a)は、再エンコード対象ストリームSTRE' のVBVバッファのデータ占有量の軌跡を示した図であって、図27(b)は、再エンコード対象ストリームSTRE'を示した図である。図27において、TREは、再エンコードコントロール期間を示し、OSTAは、オリジナルストリームAを示し、STRE' は再エンコードの対象となる再エンコード対象ストリームを示している。尚、この再エンコード対象ストリームSTRE'とは実際に再エンコードされた再エンコードストリームSTREとは異なり、単純なスプライス処理を行った場合にこのようなストリームSTRE'になると想定されるストリームを示している。また、OSTBは、オリジナルストリームBを示し、SPVBVは、VBVバッファにおけるスプライスポイントを示し、SPはストリームにおけるスプライスポイントを示している。
図27(a)に示されるように、スプライス処理の対象となるストリームSTRE'のVBVバッファの軌跡は、スプライスポイントSPの前では、ストリームA(STA )のVBVバッファのデータ占有量の軌跡となり、スプライスポイントSPの後では、ストリームB(STB )のVBVバッファのデータ占有量の軌跡となる。ストリームAとストリームBとを単純にスプライシングすると、ストリームA(STA)のVBVバッファのデータ占有量のスプライスポイントにおけるレベルと、ストリームB(STB)のVBVバッファのデータ占有量のスプライスポイントにおけるレベルとは異なるので、VBVバッファのデータ占有量の軌跡が不連続になる。
ストリームAのスプライスポイントにおけるVBVのデータ占有量の軌跡と、スプライスポイントにおけるストリームBのVBVのデータ占有量の軌跡とが連続しているようなシームレスなスプライシングを実現するためには、図27(a)のように、スプライスポイントにおけるストリームBのVBVのデータ占有量の開始レベルを、ストリームAのスプライスポイントにおけるVBVのデータ占有量の終了レベルに一致させなければいけない。つまり、それらのレベルを一致させるためには、図27(a)に示される例では、再エンコード制御期間TREにおいて、ストリームBのVBVバッファのデータ占有量の軌跡が本来有していたであろう軌跡よりもレベルを低くしなければいけない。尚、このデータ占有量の軌跡が本来有していただであろう軌跡とは、供給されたストリームBがスプライシング処理されなかったと仮定した場合のストリームBに関するVBVバッファのデータ占有量を軌跡であって、図27(a)のVBVOST_Bの延長軌跡によって示される。
その結果、図27(a)に示されるように、VBVバッファからの引き出しビット量が最も多いIピクチャの引き出しタイミングで、このVBVバッファがアンダーフローしてしまう。
本発明の実施の形態では、図2(a)に示したようにVBVバッファのデータ占有量の軌跡がスプライス点において連続し、かつ、スプライス点の後に、アンダーフローが発生しないように再エンコード期間の各ピクチャに対して新たな目標符号量を設定するようにしている。
また、スプライシングされたストリームのVBVバッファのデータ占有量の軌跡が、スプラスポイントにおいて連続になるように、ストリームBのVBVバッファのデータ占有量の軌跡を単純に下げると、アンダーフローが発生するばかりでなく、再エンコード対象ストリームSTRE'とオリジナルストリームOSTBとの切り替わりポイントで、VBVバッファのデータ占有量の軌跡が不連続になってしまう。
本発明の実施の形態では、さらに、図2(a)に示したように再エンコード対象ストリームSTRE'とオリジナルストリームOSTBとの切り替わりポイントで、VBVバッファのデータ占有量の軌跡が連続するように、再エンコード期間の各ピクチャに対して新たな目標符号量を設定するようにしている。尚、オリジナルストリームOSTBに対応する
VBVバッファのデータ占有量の軌跡VBVOST_Bを制御しない理由は、軌跡VBVOST
_Bとは、ストリームBのVBVバッファのデータ占有量の軌跡が本来有していたであろ
う軌跡であって、この軌跡をコントロールすることはできないからである。なぜなら、この軌跡VBVOST_Bは、オリジナルストリームOSTBがオーバーフロー又はアンダーフ
ローしないように決定された最適な軌跡であって、もしこの最適な軌跡のレベルを制御するとオーバーフロー又はアンダーフローが発生する可能性があるからである。
次に、VBVのアンダーフローの問題に関する説明と同じように、図29を参照して、スプライスストリームのVBVバッファがオーバーフローする問題について説明する。
図29は、先に説明した図26に対応するスプライス処理を行った場合の例であって、図29(a)は、スプライシングストリームSTSP のVBVバッファのデータ占有量の軌跡を示した図であって、図29(b)は、スプライシングストリームSTSP を示した図である。図29において、TREは、スプライシング制御されるスプライス期間を示し、OSTAは、オリジナルストリームAを示し、STREは再エンコード対象ストリームを示し、OSTBは、オリジナルストリームBを示し、SPVBVは、VBVバッファにおけるスプライスポイントを示し、SPはストリームにおけるスプライスポイントを示している。
図29(a)に示されるように、スプライスされた再エンコード対象ストリームSTRE'のVBVバッファの軌跡は、スプライスポイントSPの前では、ストリームA(STA )のVBVバッファのデータ占有量の軌跡となり、スプライスポイントSPの後では、ストリームB(STB )のVBVバッファのデータ占有量の軌跡となる。ストリームAとストリームBとを単純にスプライシングすると、ストリームA(STA )のVBVバッファのデータ占有量のスプライスポイントにおけるレベルと、ストリームB(STB )のVBVバッファのデータ占有量のスプライスポイントにおけるレベルとは異なるので、VBVバッファのデータ占有量の軌跡が不連続になる。
ストリームAのスプライスポイントにおけるVBVのデータ占有量の軌跡と、スプライスポイントにおけるストリームBのVBVのデータ占有量の軌跡とが連続しているようなシームレスなスプライシングを実現するためには、図29(a)のように、スプライスポイントにおけるストリームBのVBVのデータ占有量の開始レベルを、ストリームAのスプライスポイントにおけるVBVのデータ占有量の終了レベルに一致させなければいけない。つまり、それらのレベルを一致させるためには、図29(a)に示される例では、再エンコード処理制御期間TREにおいて、ストリームBのVBVバッファのデータ占有量の軌跡が本来有していたであろう軌跡よりもレベルを高くしなければいけない。尚、このデータ占有量の軌跡が本来有していただであろう軌跡とは、供給されたストリームBがスプライシング処理されなかったと仮定した場合のストリームBに関するVBVバッファのデータ占有量を軌跡であって、図29(a)のVBVOST_Bの延長軌跡によって示される。
その結果、図29(a)に示されるように、VBVバッファからの引き出しビット量が少ないBピクチャやPピクチャのいくつかが連続してVBVバッファから引き出された後に、このVBVバッファがオーバーフローしてしまう。
本発明の実施の形態では、図30(a)に示したようにVBVバッファのデータ占有量の軌跡がスプライス点において連続し、かつ、スプライス点の後に、オーバーフローが発生しないように再エンコード期間の各ピクチャに対して新たな目標符号量を設定するようにしている。
また、スプライシングされたストリームのVBVバッファのデータ占有量の軌跡が、スプラスポイントにおいて連続になるように、ストリームBのVBVバッファのデータ占有量の軌跡を単純に上げると、オーバーフローが発生するばかりでなく、再エンコード対象ストリームSTRE'とオリジナルストリームOSTBとの切り替わりポイントで、VBVバッファのデータ占有量の軌跡が不連続になってしまう。
本発明の実施の形態では、さらに、図30(a)に示したように再エンコード対象ストリームSTRE'とオリジナルストリームOSTBとの切り替わりポイントで、VBVバッファのデータ占有量の軌跡が連続するように、再エンコード期間の各ピクチャに対して新たな目標符号量を設定するようにしている。尚、オリジナルストリームOSTBに対応する
VBVバッファのデータ占有量の軌跡VBVOST_Bを制御しない理由は、軌跡VBVOST
_Bとは、ストリームBのVBVバッファのデータ占有量の軌跡が本来有していたであろ
う軌跡であって、この軌跡をコントロールすることはできないからである。なぜなら、この軌跡VBVOST_Bは、オリジナルストリームOSTBがオーバーフロー又はアンダーフ
ローしないように決定された最適な軌跡であって、もしこの最適な軌跡のレベルを制御するとオーバーフロー又はアンダーフローが発生する可能性があるからである。
次に、上述したVBVバッファのアンダーフロー又はオーバーフローを回避する本発明のスプライス制御方法、及びVBVバッファのデータ占有量が不連続にならない本発明のスプライス制御方法について説明する。
図27から図30において、vbv_underは、VBVバッファのアンダーフロー量を示し、vbv_overは、VBVバッファのオーバーフロー量を示し、vbv_gapは、再エンコード対象ストリームSTRE'とオリジナルストリームOSTBとのスイッチングポイントにおけるVBVバッファのギャップ値を示すデータである。
まず、スプライスコントローラ13は、ストリームカウンタ11から供給されたストリームAのビットカウント値及びストリームBのビットカウント値に基いて、オリジナルストリームOSTAのVBVバッファのデータ占有量の軌跡、オリジナルストリームOSTBのVBVバッファのデータ占有量の軌跡、及びストリームAとストリームBとを単純にスプライシングした場合の再エンコード対象ストリームSTRE'のVBVバッファのデータ占有量の軌跡を演算する。各VBVバッファのデータ占有量の軌跡の演算は、プレゼンテーション時間毎に、ストリームカンウンタ11から供給されるビットカウント値のから、プレゼンテーション時間に応じてVBVバッファから出力されるビット量を減算することによって容易に演算することができる。従って、スプライスコントローラ13は、オリジナルストリームOSTAのVBVバッファのデータ占有量の軌跡、オリジナルストリームOSTBのVBVバッファのデータ占有量の軌跡、及びストリームAとストリームBとを単純にスプライシングした場合の再エンコード対象ストリームSTRE'のVBVバッファのデータ占有量の軌跡を仮想的に把握することができる。
次に、スプライスコントローラ13は、仮想的に求められた再エンコード対象ストリームSTRE'のVBVバッファのデータ占有量の軌跡を参照することによって、再エンコード対象ストリームSTRE'のアンダーフロー量(vbv_under)又はオーバーフロー量(vbv_over)を演算する。さらに、スプライスコントローラ13は、仮想的に求められた再エンコード対象ストリームSTRE'のVBVバッファのデータ占有量の軌跡と、オリジナルストリームOSTBのVBVバッファのデータ占有量の軌跡(VBVOST_B)とを参照することによって、 再エンコード対象ストリームSTRE'とオリジナルストリームOSTBとのスイッチングポイントにおけるVBVバッファのギャップ値(vbv_gap)を演算する。
そして、スプライスコントローラ13は、以下の式(1)及び(2)により目標符号量のオフセット量vbv_off を求める。

vbv_off = −( vbv_under - vbv_gap ) ・・・(1)
vbv_off = +( vbv_over - vbv_gap ) ・・・(2)
尚、図27(a)に示した例のようにVBVバッファがアンダーフローする場合には、式(1)を使用してオフセット量vbv_off を演算し、図29(a)に示した例のようにVBVバッファがオーバーフローする場合には、式(2)を使用してオフセット量vbv_off を演算する。
スプライスコントローラ13は、次に、式(1)または式(2)によって求めたオフセット量vbv_offを使用して、以下の式(3)によって、目標符号量(目標ビット量)TBP0を求める。
Figure 0004045553
なお、この目標ビット量TBP0は、再エンコード処理を行なうピクチャに対して割当てられる目標ビット量を示している値である。(3)において、GB_Aは、ストリームAにおけるピクチャAn-P0からピクチャA(n-P0)+n0までのいずれかのピクチャのビット発生量を示す値であって、ΣGB_A(n-P0)+iは、ピクチャAn-P0からピクチャA(n-P0)+n0までの各ピクチャの発生ビット量を合計した値である。同様に、式(3)において、GB_Bは、ストリームBにおけるピクチャBm-P0からピクチャB(m-P0)-m0までのいずれかのピクチャの発生ビット量を示す値であって、ΣGB_B(m-P0)-i は、ピクチャBm-P0からピクチャB(m-P0)-m0までの各ピクチャのビット発生量を合計した値である。
即ち、式(3)によって示される目標符号量TBP0は、ピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0の合計発生ビット量に、VBVのオフセット値vbv_offを加算した値である。このように、オフセット値vbv_offを加算して目標ビット量TBP0を補正することによって、再エンコード対象ストリームSTSPとオリジナルストリームOSTBの切換えポイントにおけるデータ占有量の軌跡のギャップを0にすることができる。よって、つなぎめの無いシームレスなスプライシングを実現することができる。
次に、スプライスコントローラ13は、式(3)に基いて得られた目標ビット量TBP0を、ピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0に対して割り当てる。通常は、目標ビット量TBP0を、単純にIピクチャ:Pピクチャ:Bピクチャが4:2:1の比率になるように分配するように、各ピクチャの量子化特性を決定している。
しかしながら、本発明のスプライシング装置では、単純にIピクチャ:Pピクチャ:Bピクチャに対して4:2:1の固定比率で目標ビット量TBP0を分配するような量子化特性を用いるのではなく、各ピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0の過去の量子化ステップ及び量子化マトリックス等の量子化特性を参照して、新たな量子化特性を決定する。具体的には、エンコードコントローラ43は、ストリームA及びストリームBに含まれている量子化ステップや量子化マトリクスの情報を参照して、エンコーダ1A,1Bにおける過去のエンコード処理時の量子化特性と大きく異なることがないように、再エンコード時の量子化特性を決定する。ただし、ピクチャの再構成によりピクチャタイプが変更されたピクチャに関しては、量子化ステップや量子化マトリクスの情報を参照せずに、再エンコード時に新たに量子化特性を演算する。
図28は、図27において説明したVBVバッファのアンダーフローの問題を解決するために、スプライスコントローラ13において演算された目標ビット量TBP0によって再エンコード処理を行った場合のVBVバッファのデータ占有量を示すための図である。また、図30は、図29において説明したVBVバッファのオーバーフローの問題を解決するために、スプライスコントローラ13において演算された目標ビット量TBP0によって再エンコード処理を行った場合のVBVバッファのデータ占有量を示すための図である
よって、再エンコードされた後の再エンコードストリームSTRE は、図28及び図30に示されるように、図27(a)における再エンコード対象ストリームSTRE'のVBVバッファのデータ占有量の軌跡と、図28(a)における再エンコードストリームSTRE のVBVバッファのデータ占有量の軌跡とは似た軌跡になり、図29(a)における再エンコード対象ストリームSTRE'のVBVバッファのデータ占有量の軌跡と、図30(a)における再エンコードストリームSTRE のVBVバッファのデータ占有量の軌跡とは似た軌跡になる。
次に、本実施の形態に係るスプライシング装置及び編集装置の動作について、図31及び図32を参照して説明する。また、本実施の形態は、ISO13818−2,ISO11172−2のAnnexCの規定とISO13818−1のAnnexLの規定を満たしているものである。
まず、ステップS10において、スプライスコントローラ13は、ストリームSTA ,STB を任意のピクチャ位置でスプライスするためのスプライスポイントp0及びスプライシング処理における再エンコード区間n0 ,m0を受け取る。実際には、オペレータが外部からこれらのパラメータを入力することになるが、再エンコード区間n0 ,m0については、ストリームのGOPの構成等に応じて自動で設定するようにしても良い。なお、以下の説明では、スプライス点において、ストリームSTA からストリームSTB に切り換える場合を例にとって説明するが、もちろん逆でもかまわない。
ステップS11において、スプライスコントローラ13は、ストリームSTA及び ストリームSTBを、それぞれ、バッファメモリ10に一時的に記憶されるようにバッファメモリ10の書込み動作を制御すると共に、プレゼンテーションタイムを基準にしてストリームSTA及び ストリームSTBのスプライシングポイントの位相が同期するように、バッファメモリ10の読み出し動作を制御する。
ステップS12において、スプライスコントローラ13は、ストリームSTAに設定されたスプライスポイントのピクチャAn-P0よりも未来のピクチャを出力しないように、ストリームSTAのピクチャを選択し、ストリームSTBに設定されたスプライスポイントのピクチャBm-P0よりも過去のピクチャを出力しないように、ストリームSTBのピクチャを選択する。例えば、図25(a)及び図25(b)に示された例では、ピクチャA(n-P0)-2であるPピクチャは、ストリームSTA上では、スプライスポイントのピクチャAn-P0よりは過去であるが、プレゼンテーション順では、ピクチャAn-P0よりは未来のピクチャである。よって、このピクチャA(n-P0)-2であるPピクチャは、出力されない。また、図25(c)及び(d)に示された例では、ピクチャB(m-P0)+2及びピクチャB(m-P0)+1であるBピクチャは、ストリームSTB上では、スプライスポイントのピクチャBm-P0よりは未来であるが、プレゼンテーション順では、ピクチャBm-P0よりは過去のピクチャである。よって、この、ピクチャB(m-P0)+2及びピクチャB(m-P0)+1であるBピクチャは、出力されない。なお、スプライスコントローラ13がデコーダ14A、14Bを制御すことによって、このステップにおいて選択されなかったピクチャは、エンコーダ16には供給されない。
このように、プレゼンテーション順を基準として出力すべきピクチャを選択しているので、スプライシング処理を行なったとしても図9において説明したようなプレゼンテーション順に関する問題は発生することは無い。
ステップS13において、スプライスコントローラ13は、再エンコード処理を行なう際の、ピクチャの再構成処理のために必要な符号化パラメータを設定するための処理をスタートする。このピクチャ再構成処理は、以下のステップS14からステップS30まで処理のことを意味し、この処理において設定されるパラメータは、ピクチャタイプ、予測方向及び動きベクトル等である。
ステップS14において、スプライスコントローラ13は、ピクチャ再構成処理の対象となっているピクチャがスプライスポイントのピクチャAn-P0であるか否かを判断する。もし、ピクチャ再構成処理の対象となっているピクチャがスプライスポイントのピクチャAn-P0である場合には、次のステップS15に進む。一方、そうでない場合、つまり、ピクチャ再構成処理の対象となっているピクチャがピクチャA(n-P0)+n0からピクチャA(n-P0)+1である場合には、ステップS20に進む。
ステップS15において、スプライスコントローラ13は、ピクチャ再構成処理の対象となっているピクチャが、Bピクチャであるのか、Pピクチャであるのか、又はIピクチャであるのかを判断する。ピクチャ再構成処理の対象となっているピクチャが、Bピクチャである場合には、ステップS17に進み、ピクチャ再構成処理の対象となっているピクチャが、P又はIピクチャである場合には、ステップS18に進む。
ステップS16では、スプライスコントローラ13は、スプライシングされたスプライスストリームSTSPにおいて、ピクチャAn-P0の前に2つ以上のBピクチャが存在するか否かを判断する。例えば、図26(b)に示されるように、ピクチャAn-P0の前に、2つのBピクチャ(ピクチャA(n-P0)+2とピクチャA(n-P0)+3 )がある場合には、ステップS18に進む。そうで無い場合には、ステップS17に進む。
ステップS17では、スプライスコントローラ13は、ピクチャAn-P0のピクチャタイプの変更の必要は無しと判断し、ピクチャAn-P0の再エンコード処理時におけるピクチャタイプとして、エンコーダ1Aにおける過去のエンコード処理において設定されたピクチャタイプ(Bピクチャ)と同じピクチャタイプを設定する。よって、後述する再エンコード処理時に、ピクチャAn-P0を再びBピクチャとして符号化することになる。
ステップS18において、スプライスコントローラ13は、ピクチャAn-P0のピクチャタイプをBピクチャからPピクチャに変更する。このようにピクチャタイプを変更する理由について説明する。このステップS18のステップに到達するということは、Bピクチャ(ピクチャAn-P0)の前に、2つのBピクチャ(図8におけるピクチャA(n-P0)+2とピクチャA(n-P0)+3 )が存在していることを意味している。即ち、再エンコード対象スト
リームSTRE'において、3つのBピクチャが並んでいるということである。通常のMP
EGデコーダでは、予測されているピクチャを一時的に記憶するために、2つのフレームメモリしか有していないので、3つのBピクチャがストリーム上において連続して配列されている場合には、最後のBピクチャをデコードできないことになってしまう。よって、図26において説明したように、ピクチャAn-P0のピクチャタイプをBピクチャからPピクチャに変更することによって、ピクチャAn-P0を確実にデコードすることができる。
ステップS19では、スプライスコントローラ13は、ピクチャAn-P0のピクチャタイプの変更の必要は無しと判断し、ピクチャAn-P0の再エンコード処理時におけるピクチャタイプとして、エンコーダ1Aにおける過去のエンコード処理において設定されたピクチャタイプ(Iピクチャ又はPピクチャ)と同じピクチャタイプを設定する。
ステップS20では、スプライスコントローラ13は、ピクチャAn-P0のピクチャタイプの変更の必要は無しと判断し、ピクチャAn-P0の再エンコード処理時におけるピクチャタイプとして、エンコーダ1Aにおける過去のエンコード処理において設定されたピクチャタイプ(Iピクチャ、Pピクチャ又はBピクチャ))と同じピクチャタイプを設定する。
ステップS21では、スプライスコントローラ13は、各ピクチャに対して予測方向の設定及び動きベクトルに関するパラメータの設定を行なう。例えば、図25及び図26の例において示されているように、ピクチャ再構成処理の対象となっているピクチャAn-P0がオリジナルストリームOSTAにおいてBピクチャであった場合には、ピクチャ再構成処理の対象となっているピクチャAn-P0は、A(n-P0)+1のPピクチャ及びA(n-P0)-2のPピクチャの両方のピクチャから双方向予測されていたピクチャである。つまり、エンコーダ1Aにおける過去のエンコード処理において、ピクチャAn-P0は、A(n-P0)+1のPピクチャ及びA(n-P0)-2のPピクチャの両方のピクチャから双方向予測さされ生成されたピクチャであるということである。ステップS12において説明したように、A(n-P0)-2のPピクチャはスプライシングストリームとしては出力されないので、ピクチャ再構成処理の対象となっているピクチャAn-P0の逆方向予測ピクチャとして、A(n-P0)-2のPピクチャを指定することはできない。
よって、ステップS17においてピクチャタイプの変更無しと設定されたピクチャAn-P0(Bピクチャ)に対しては、A(n-P0)+1のPピクチャのみを予測するようような順方向片側予測が行われなくてはいけない。従って、この場合には、スプライスコントローラ13は、ピクチャAn-P0に対して、A(n-P0)+1のPピクチャのみを予測するようような順方向の片側予測を設定する。また、ステップS18においてBピクチャからPピクチャに変更されたピクチャAn-P0についても、同様に、A(n-P0)+1のPピクチャのみを予測するような片側予測のパラメータを設定する。
ステップS19においてピクチャタイプの変更無しと設定されたピクチャAn-P0(Pピクチャ)においては、予測方向は変更されない。つまりこの場合には、スプライスコントローラ13は、ピクチャAn-P0に対して、エンコーダ1Aにおける過去のエンコード処理時に予測したピクチャと同じピクチャのみを予測するようような順方向の片側予測を設定する。
ステップS20においてピクチャタイプの変更無しと設定されたピクチャA(n-P0)+n0からピクチャA(n-P0)+1のピクチャについては、予測方向の変更は必要ない。つまりこの場合には、スプライスコントローラ13は、ピクチャA(n-P0)+n0からピクチャA(n-P0)+1に対して、エンコーダ1Aにおける過去のエンコード処理時に予測したピクチャと同じピクチャを予測するようような予測方向を設定する。但し、ピクチャA(n-P0)+1及びピクチャAn-P0の両ピクチャが、順方向のPピクチャ又はIピクチャと、逆方向のIピクチャ又はPピクチャの双方向のピクチャから予測されているBピクチャである場合には、ピクチャAn-P0だけでは無く、ピクチャA(n-P0)+1も順方向のピクチャのみから予測するような片側予測に変更されなければいけない。
さらに、このステップS21において、スプライスコントローラ13は、新しく設定された予測方向に基いて、各ピクチャに対してエンコーダ1Aにおける過去のエンコード処理によって設定された動きベクトルを、再エンコード処理時に再利用するか否かを決定する。
上述したように予測方向の変更の無かったPピクチャやBピクチャについては、再エンコード処理時において、エンコーダ1Aにおける過去のエンコード処理に使用した動きベクトルをそのまま使用する。例えば、図23及び図26に示した例では、ピクチャA(n-P0)+n0からピクチャA(n-P0)+1については、それぞれエンコーダ1Aにおける過去のエンコード処理に使用した動きベクトルを、再エンコード時に再利用する。
また、ピクチャA(n-P0)+1及びピクチャAn-P0が、順方向のPピクチャ又はIピクチャと、逆方向のIピクチャ又はPピクチャの双方向から予測されているBピクチャである場合には、順方向のピクチャのみから予測するような片側予測に変更されているので、それに伴なって、順方向のピクチャに対応する動きベクトルのみを使用する必要がある。つまり、スプライスコントローラ13は、このステップS21において、ピクチャA(n-P0)+1及びピクチャAn-P0がBピクチャである場合には、これらのピクチャに対して、順方向のピクチャに関する動きベクトルを使用し、逆方向のピクチャの動きベクトルを使用しないという設定を行なう。
もし、エンコーダ1Aにおける過去のエンコード処理において、ピクチャAn-P0が未来のピクチャであるA(n-P0)-2からのみ逆方向の片側予測されていたピクチャであったならば、再エンコード処理時において、エンコーダ1Aにおける過去のエンコード処理時に生成した動きベクトルは一切使用せずに、A(n-P0)+1に対応する新たな動きベクトルを生成する。つまり、スプライスコントローラ13は、このステップS21において、過去の動きベクトルを一切使用しないという設定を行なう。
次に、ステップS22において、スプライスコントローラ13は、ピクチャA(n-P0)+n0からピクチャAn-P0の全てのピクチャに対して、ピクチャタイプ、予測方向及び過去の動きベクトルに関するパタメータが設定されたか否かを判断する。
ステップS23において、スプライスコントローラ13は、ピクチャ再構成処理の対象となっているピクチャがスプライスポイントのピクチャBm-P0であるか否かを判断する。もし、ピクチャ再構成処理の対象となっているピクチャがスプライスポイントのピクチャBm-P0である場合には、次のステップS24に進む。一方、そうでない場合、つまり、ピクチャ再構成処理の対象となっているピクチャがピクチャB(m-P0)-1からピクチャB(m-P0)+m0である場合には、ステップS28に進む。
ステップS24において、スプライスコントローラ13は、ピクチャ再構成処理の対象となっているピクチャが、Bピクチャであるのか、Pピクチャであるのか、又はIピクチャであるのかを判断する。ピクチャ再構成処理の対象となっているピクチャが、Bピクチャである場合には、ステップS25に進み、ピクチャ再構成処理の対象となっているピクチャが、Pピクチャである場合には、ステップS26に進み、ピクチャ再構成処理の対象となっているピクチャがIピクチャである場合には、ステップS27に進む。
ステップS25では、スプライスコントローラ13は、図22及び図23に示された例のように、再エンコード処理時におけるピクチャBm-P0のピクチャタイプの変更は必要無しと判断し、ピクチャBm-P0の再エンコード処理時におけるピクチャタイプとして、エンコーダ1Bにおける過去のエンコード処理において設定されたピクチャタイプ(Bピクチャ)と同じピクチャタイプを設定する。
ステップS26において、スプライスコントローラ13は、図25及び図26に示した例のように、ピクチャBm-P0のピクチャタイプをPピクチャからIピクチャに変更する。このようにピクチャタイプを変更する理由について説明する。Pピクチャは、順方向のIピクチャ又はPピクチャから予測される片側予測のピクチャであるので、ストリーム上においてそれらの予測されたピクチャよりは必ず後ろの位置に存在するピクチャである。もし、ストリームSTBけるスプライスポイントの最初のピクチャBm-P0がPピクチャであ
るとすると、このピクチャBm-P0より前に存在するストリームSTAの順方向のピクチャ
から予測しなければいけない。ストリームSTAとストリームSTBとは全くなるので、最初のピクチャBm-P0のピクチャタイプをPピクチャに設定すると、このピクチャをデコードしたとしても画質のかなり劣化した絵になることはあきらかである。
よって、スプライスコントローラ13は、ストリームSTBけるスプライスポイントの最初のピクチャBm-P0のピクチャタイプがPピクチャであった場合には、このピクチャBm-P0のピクチャタイプをIピクチャに変更する。
ステップS27において、スプライスコントローラ13は、ピクチャBm-P0のピクチャタイプの変更の必要は無しと判断し、ピクチャBm-P0の再エンコード処理時におけるピクチャタイプとして、エンコーダ1Bにおける過去のエンコード処理において設定されたピクチャタイプ(Iピクチャ)と同じピクチャタイプを設定する。
ステップS28では、スプライスコントローラ13は、ピクチャB(m-P0)-1からピクチャB(m-P0)-m0のピクチャタイプの変更の必要は無しと判断し、それらのピクチャの再エンコード処理時におけるピクチャタイプとして、エンコーダ1Bにおける過去のエンコード処理において設定されたピクチャタイプ(Iピクチャ、Pピクチャ又はBピクチャ)と同じピクチャタイプを設定する。
ステップS29では、スプライスコントローラ13は、各ピクチャに対して予測方向の設定及び動きベクトル関する設定を行なう。例えば、図22及び図23に示された例のように、ピクチャ再構成処理の対象となっているピクチャBm-P0がオリジナルストリームOSTBにおいてBピクチャであった場合には、ピクチャ再構成処理の対象となっているピクチャBm-P0は、B(m-P0)+1のPピクチャ及びB(m-P0)-2のIピクチャの両方のピクチャから双方向予測されていたピクチャである。つまり、エンコーダ1Bにおける過去のエンコード処理において、ピクチャBm-P0は、B(m-P0)+1のPピクチャ及びB(m-P0)-2のIピクチャの両方のピクチャから双方向予測されて生成されたピクチャであるということである。ステップS12において説明したように、B(m-P0)+1のPピクチャはスプライシングストリームとしては出力されないので、ピクチャ再構成処理の対象となっているピクチャBm-P0の順方向予測ピクチャとして、B(m-P0)+1のPピクチャを指定することはできない。
よって、ステップS25においてピクチャタイプの変更無しと設定されたピクチャBm-P0(Bピクチャ)に対しては、B(m-P0)-2のIピクチャのみを予測するようような逆方向片側予測が行われなくてはいけない。よってこの場合には、スプライスコントローラ13は、ピクチャBm-P0に対して、B(m-P0)-2のIピクチャのみを予測するようような逆方向の片側予測を行なうように予測方向を設定する。
ステップS28においてピクチャタイプの変更無しと設定されたピクチャB(m-P0)+m0からピクチャB(m-P0)+1のピクチャについては、予測方向の変更は必要ない。つまりこの場合には、スプライスコントローラ13は、ピクチャB(m-P0)+m0からピクチャB(m-P0)+1に対して、エンコーダ1Bにおける過去のエンコード処理時に予測したピクチャと同じピクチャを予測するようような予測方向を設定する。但し、B(m-P0)-1がBピクチャである場合には、ピクチャBm-P0の場合と同様に、ピクチャB(m-P0)-1に対して、B(m-P0)-2のIピクチャのみを予測するようような逆方向の片側予測を行なうような予測方向が設定される。
さらに、このステップS29において、スプライスコントローラ13は、新しく設定された予測方向に基いて、各ピクチャに対してエンコーダ1Bにおける過去のエンコード処理によって設定された動きベクトルを、再エンコード処理時に再利用するか否かを決定する。
上述したように予測方向の変更の無かったPピクチャやBピクチャについては、再エンコード処理時において、エンコーダ1Bにおける過去のエンコード処理に使用した動きベクトルをそのまま使用する。例えば、図22及び図23においては、B(m-P0)-2のIピクチャからB(m-P0)-m0までのPピクチャまでの各ピクチャに対しては、過去のエンコード時に使用した動きベクトルをそのまま使用する。
エンコーダ1Bにおける過去のエンコード処理において、B(m-P0)+1のPピクチャ及びB(m-P0)-2のIピクチャの両方のピクチャから双方向予測されていたピクチャBm-P0及びピクチャB(m-P0)-1に対しては、B(m-P0)-2のIピクチャのみを予測するような片側予測に予測方向が変更されているので、ピクチャB(m-P0)+1に対応する動きベクトルを使用せずに、ピクチャBm-P0に対してはピクチャB(m-P0)-2に対応する動きベクトルのみを使用する必要がある。つまり、スプライスコントローラ13は、このステップS29において、ピクチャBm-P0及びピクチャB(m-P0)-1に対しては、一方向のみの過去の動きベクトルを再使用し、他方の過去の動きベクトルを使用しないという設定を行なう。
次に、ステップS30において、スプライスコントローラ13は、ピクチャBm-P0からピクチャB(m-P0)-m0全てのピクチャに対して、ピクチャタイプ、予測方向及び動きベクトルに関するパラメータが設定されたか否かを判断する。
ステップS31において、スプライスコントローラ13は、既に説明した式(3)に基いて、再エンコード期間に発生すべき目標ビット量(TBP0)を演算する。以下に具体的に説明する。まず、スプライスコントローラ13は、ストリームカウンタ11から供給されたストリームAのビットカウント値及びストリームBのビットカウント値に基いて、オリジナルストリームOSTAのVBVバッファのデータ占有量の軌跡、オリジナルストリームOSTBのVBVバッファのデータ占有量の軌跡、及びストリームAとストリームBとを単純にスプライシングした場合の再エンコード対象ストリームSTRE'のVBVバッファのデータ占有量の軌跡を演算する。
次に、スプライスコントローラ13は、仮想的に求められた再エンコード対象ストリームSTRE'のVBVバッファのデータ占有量の軌跡を解析することによって、再エンコード対象ストリームSTRE'のアンダーフロー量(vbv_under)又はオーバーフロー量(vbv_over)を演算する。さらに、スプライスコントローラ13は、仮想的に求められた再エンコード対象ストリームSTRE'のVBVバッファのデータ占有量の軌跡と、オリジナルストリームOSTBのVBVバッファのデータ占有量の軌跡(VBVOST_B)とを比較することによって、再エンコード対象ストリームSTRE'とオリジナルストリームOSTBとのスイッチングポイントにおけるVBVバッファのギャップ値(vbv_gap)を演算する。
続いて、スプライスコントローラ13は、既に説明した式(1)及び(2)により目標符号量のオフセット量vbv_off を求め、さらに、式(1)または式(2)によって求めたオフセット量vbv_offを使用して、既に説明した式(3)によって、目標符号量(目標ビット量)TBP0を求める。
次に、ステップS32において、スプライスコントローラ13は、式(3)に基いて得られた目標ビット量TBP0を、ピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0に対して割り当てに基いて、各ピクチャに対して設定される量子化特性を決定する。本発明のスプライシング装置では、各ピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0のエンコーダ1A,1Bにおける過去の量子化ステップ及び量子化マトリックス等の量子化特性を参照して、新たな量子化特性を決定する。具体的には、スプライシングコントローラ13は、まず、ストリームA及びストリームBに含まれている量子化ステップや量子化マトリクス等のエンコーダ1A,1Bにおける過去の符号化処理において生成された符号化パラメータ情報をストリーム解析部12から受取る。
そして、スプライシングコントローラ13は、式(3)に基いて得られた目標ビット量TBP0を、ピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0に対して割り当てられた符号量のみから量子化特性を決定するのでは無く、この目標ビット量TBP0から割当てられた符号量とこれらの過去の符号化パラメータ情報を参照して、エンコーダ1A,1Bにおけるエンコード時の量子化特性と大きく異なることがないように、再エンコード時の量子化特性を決定する。ただし、ステップS18やステップS26において説明したように、ピクチャの再構成処理によりピクチャタイプが変更されたピクチャに関しては、量子化ステップや量子化マトリクスの情報を参照せずに、再エンコード処理時に新たに量子化特性を演算する。
次に、ステップS33において、スプライスコントローラ13は、再エンコード期間に含まれるピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0をデコードする。
次に、ステップS34において、スプライスコントローラ13、ステップS32において各ピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0に対してそれぞれ設定された量子化特性を使用して、発生ビット量のコントロールを行いながら、ピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0 を再エンコードする。
この再エンコード処理において、スプライスコントローラ13は、エンコーダ1A,1Bにおける過去のエンコード処理において使用した動きベクトルを再利用する場合には、スイッチ44を介して動き補償部41に供給するようにエンコードコントローラに制御信号を与え、エンコーダ1A,1Bにおける過去のエンコード処理において使用した動きベクトルを使用しない場合には、新しく動き検出部42において生成された動きベクトルをスイッチ4を介して動き補償部41に供給するようにエンコードコントローラ43を制御する。その際、エンコードコントローラ43は、スプライスコントローラ13からのピクチャタイプの情報に基づいて、予測画像データの生成に必要なピクチャがフレームメモリ39,40に保持されるようにフレームメモリ39,40を制御する。また、エンコードコントローラ43は、スプライスコントローラ13から供給された再エンコード区間内の各ピクチャに対して設定された量子化特性を、量子化回路34と逆量子化回路36に対して設定する。
ステップS35において、スプライスコントローラ13は、スイッチ17を制御して、バッファメモリ10より出力されるストリームSTA ,STB およびMPEGエンコーダ16より出力される再エンコード区間内の新たなストリームSTREのうちの一つを選択的に出力することによって、再エンコード区間の前におけるストリームSTA と再エンコード区間内の新たなストリームSTREと再エンコード区間の後におけるストリームSTB とを連結して、スプライスされたストリームSTSPとして出力する。
本実施の形態では、このようにMPEGエンコーダ1において目標ビット量TBP0に従ってレートコントロールしながら再エンコードを行って得られた再エンコード区間内の新たなストリームSTREを、スイッチ17によって、元のストリームにおけるピクチャA(n-P0)+n0 〜ピクチャB(m-P0)-m0 の位置にはめ込む。これにより、シームレスなスプライスが実現される。
ストリームSTA にストリームSTB をスプライスするとき、スプライス後のストリームSTB で、VBVバッファのオーバフロー、アンダフローを起こさないためには、ストリームSTB のスプライス後のVBVバッファの状態を、スプライス以前の状態に合わせることが、連続なピクチャプレゼンテーションを保証するためのバッファ制御上の条件となる。本実施の形態では、この条件を、原則として、上述のような新たな目標符号量(目標ビット量)の設定によって満たすようにする。
以上説明したように、本実施の形態によれば、複数のストリームのスプライス点を含む再エンコード区間内における各ストリームを復号化して、得られた再エンコード区間内の画像データを新たな目標符号量に従って再エンコードして、再エンコード区間内の新たなストリームを生成し、再エンコード区間の前後における元のストリームと新たなストリームとを連結して出力するようにしたので、復号化装置(IRD)側のVBVバッファを破綻させず、且つスプライス点前後でピクチャプレゼンテーションが連続で画像を破綻させることもなく、ストリーム上の任意のピクチャ単位で、複数の映像素材をシームレスにスプライスすることができる。
また、本実施の形態では、再エンコード時に、動きベクトル等の復号化の際に使用される情報を再利用するようにしている。すなわち、本実施の形態では、スプライス点近傍において、動き検出が無効になるピクチャ以外のピクチャについては、以前のエンコード時に検出された動きベクトル等の動き検出の情報を再利用しているので、再エンコード処理によって画質が劣化することは無い。
更に、再エンコード時における量子化特性を決定する際には、復号化の際に使用される量子化ステップや量子化マトリクスの情報を参照するようにしている。従って、本実施の形態によれば、デコードと再エンコードの繰り返しによる画質の劣化を極力抑えることができ、画像再構成の精度を保証することができる。
また、本実施の形態によれば、複数の符号化ビットストリームの接続点を含む接続点前後の所定区間内における各符号化ビットストリームを復号化して所定区間内の画像データを出力し、所定区間内の画像データを、新たな目標符号量に従って符号化して、所定区間内の新たな符号化ビットストリームを出力し、所定区間内の元の符号化ビットストリームを、所定区間内の新たな符号化ビットストリームに置き換えて、所定区間の前後における元の符号化ビットストリームと新たな符号化ビットストリームとを連結して出力するようにしたので、復号化装置側の入力バッファに対応する仮想的バッファの破綻や画像の破綻をきたすことなく、符号化ビットストリーム上の任意のピクチャ単位で、複数の映像素材を接続することができるという効果を奏する。
また、元の符号化ビットストリームに含まれ、復号化の際に使用される情報を利用して符号化を行うようにしたので、更に、接続点近傍における画質劣化を低減することができるという効果を奏する。
また、元の符号化ビットストリームが双方向予測符号化方式による符号化のためにピクチャの並べ替えが行われている場合に、所定区間内の画像データの符号化の際に、異なる符号化ビットストリームに属するピクチャを利用した予測符号化処理が行われないようにピクチャタイプの再構成を行って符号化を行うようにしたので、更に、双方向予測符号化方式による符号化を行う場合であっても画像の破綻をきたすことがないという効果を奏する。
また、復号化装置側の入力バッファに対応する仮想的バッファのデータ占有量の軌跡の接続点前後におけるずれを減ずるように、新たな目標符号量を設定するようにしたので、更に、仮想的バッファの破綻をより確実に防止することができるという効果を奏する。
なお、MPEG規格による圧縮符号化過程では、直交変換の演算精度や、ミスマッチ処理(DCT係数の高域に誤差を入れる処理)等の非線形演算から、復号化の際に使用される情報の再利用だけでは抑えることのできない再構成誤差が持ち込まれる。そのため、再エンコード時に、復号化の際に使用される情報を再利用したとしても完全な画像の再構成はできない。従って、画質劣化が存在することを考慮すれば、デコード、再エンコードを行うのは、スプライス点を含むスプライス点近傍の一定区間のピクチャに留めるべきである。そこで、本実施の形態では、ストリームを全てデコード、再エンコードするのではなく、再エンコード区間を設定して、その区間だけ、デコード、再エンコードを行うようにしている。これによっても、画質の劣化を防止することができる。なお、再エンコード区間は、画質の劣化の程度等やGOP長やGOP構造に応じて自動出で設定できるようにしても良い

なお、本発明は上記実施の形態に限定されず、例えば、再エンコード区間に対する新たな目標符号量の算出方法は、式(1)〜(3)に示した方法に限らず、適宜に設定可能である。
MPEG規格に従った伝送システムの概略の構成を示すブロック図である。 VBVバッファについて説明するための説明図である。 MPEG規格の双方向予測符号化方式において必要となるエンコーダにおけるピクチャの並べ替えについて説明するための説明図である。 エンコーダにおけるピクチャの並べ替えと符号化処理との関係を表す説明図である。 デコーダにおけるピクチャの並べ替えについて説明するための説明図である。 デコーダにおけるピクチャの並べ替えと復号化処理との関係を表す説明図である。 MPEG規格の双方向予測符号化方式における動き検出および動き補償について説明するための説明図である。 ストリームの単純なスプライスを行ったときのスプライス前後のストリームにおけるピクチャの順番とスプライス後のピクチャプレゼンテーションの順番との関係の一例を示す説明図である。 ストリームの単純なスプライスを行ったときのスプライス前後のストリームにおけるピクチャの順番とスプライス後のピクチャプレゼンテーションの順番との関係の他の例を示す説明図である。 ストリームの単純なスプライスを行ったときのスプライス後のストリームにおけるピクチャの順番とピクチャプレゼンテーションの順番との関係の一例を示す説明図である。 ストリームの単純なスプライスを行ったときのスプライス後のストリームにおけるピクチャの順番とピクチャプレゼンテーションの順番との関係の他の例を示す説明図である。 ストリームの単純なスプライスを行ったときのスプライス後のストリームにおけるピクチャの順番とピクチャプレゼンテーションの順番との関係の更に他の例を示す説明図である。 ピクチャプレゼンテーションの順番、動き補償およびVBVバッファの条件を満たす理想的なストリームスプライスの例を示す説明図である。 VBVバッファの制約を満たす正常なストリームを示す説明図である。 VBVバッファの制約を満たす正常な他のストリームを示す説明図である。 2つのストリームを任意の位置で単純にスプライスした場合の一例を説明するための説明図である。 2つのストリームを任意の位置で単純にスプライスした場合の他の例を説明するための説明図である。 2つのストリームを任意の位置で単純にスプライスした場合の更に他の例を説明するための説明図である。 本発明の一実施の形態に係るスプライシング装置及びストリーム編集装置の構成を示すブロック図である。 図19におけるMPEGデコーダとMPEGエンコーダの構成を示すブロック図である。 図19におけるMPEGデコーダによってデコードして得られたプレゼンテーションビデオデータにおけるスプライス点および再エンコード区間の一例を示す説明図である。 図21に示した例における2つのストリームのデコード前後のピクチャの並びを示す説明図である。 図21に示した例におけるスプライス後のスプライスストリームのピクチャの並びを示す説明図である。 図19におけるMPEGデコーダによってデコードして得られたプレゼンテーションビデオデータにおけるスプライス点および再エンコード区間の他の例を示す説明図である。 図24に示した例におけるデコード前後の2つのストリームのピクチャの並びを示す説明図である。 図24に示した例におけるスプライス後のスプライスストリームのピクチャの並びを示す説明図である。 VBVバッファのデータ占有量にアンダーフローが生じる例を示す説明図である。 図27において説明したアンダーフローを、本発明のスプライシング装置によって改善した例を示す説明図である。 VBVバッファのデータ占有量にオーバフローが生じる例を示す説明図である。 図29において説明したオーバーフローを、本発明のスプライシング装置によって改善した例を示す説明図である。 本発明のスプライシング装置及びストリーム編集装置の動作を説明するためのフローチャートである。 本発明のスプライシング装置及びストリーム編集装置の動作を説明するためのフローチャートである。
符号の説明
1A,1B…エンコーダ、10…バッファメモリ、11…ストリームカウンタ、12…ストリーム解析部、13…スプライスコントローラ、14A,14B…MPEGデコーダ、15…スイッチ、16…MPEGエンコーダ、17…スイッチ、VDA ,VDB…ビデオデータ、STA,STB…符号化ストリーム、STRE…再エンコードストリーム、STSP…スプライシングされたストリーム、n0,m0,p0…パラメータ。

Claims (15)

  1. 第1の符号化ストリームと第2の符号化ストリームとを接続点で接続する編集装置において、
    上記第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して第1の画像データを生成すると共に、上記第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して、第2の画像データを生成する復号手段と、
    上記第1の画像データ及び上記第2の画像データを、上記第1の編集点と上記第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化手段と、
    上記第1の画像データ及び上記第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手段と、
    再符号化処理する際の発生符号量と上記オフセット値とを用いて、上記目標符号量を補正する目標符号量補正手段と、
    上記目標符号量補正手段により補正された目標符号量に基づいて、上記再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、上記再符号化手段の再符号化処理を制御する制御手段と、
    上記第1の符号化ストリーム及び上記第2の符号化ストリームと上記再符号化手段により生成された上記再符号化ストリームとを、上記第1の切換点及び第2の切換点で切り換えて出力することによって、編集された編集符号化ストリームを生成する編集手段と
    を備えたことを特徴とする編集装置。
  2. 上記編集手段は、上記第1の符号化ストリームに設定された第1の編集点に対して、プレゼンテーション時間軸において過去のピクチャを出力するとともに、上記第2の符号化ストリームに設定された第2の編集点に対して、プレゼンテーション時間軸において未来のピクチャを出力することにより、上記編集符号化ストリームを生成する
    ことを特徴とする請求項1記載の編集装置。
  3. 上記第1の符号化ストリームにおける第1の編集点及び上記第2の符号化ストリームにおける第2の編集点を設定する編集点設定手段を更に備えた
    ことを特徴とする請求項1記載の編集装置。
  4. 上記第1の編集点を含む所定区間及び上記第2の編集点を含む所定区間を設定する設定手段を更に備えた
    ことを特徴とする請求項1記載の編集装置。
  5. 復号手段の入力バッファに対応する仮想バッファにおける、上記第1の符号化ストリーム及び上記第2の符号化ストリームのバッファ占有量及び再符号化処理の対象になる再符号化対象ストリームのバッファ占有量を演算し、演算されたバッファ占有量を参照することにより、上記仮想バッファのアンダーフロー量又は上記オーバーフロー量を演算するバッファ占有量演算手段と、
    上記バッファ占有量演算手段により演算された上記再符号化対象ストリームのバッファ占有量と、上記演算手段により演算された上記アンダーフロー量又は上記オーバーフロー量とを参照することにより、上記仮想バッファのギャップ値を演算するギャップ値演算手段とを更に備えた
    ことを特徴とする請求項1記載の編集装置。
  6. 上記オフセット値演算手段は、アンダーフロー量又はオーバーフロー量と上記ギャップ値とから、上記目標符号量に対するオフセット値を演算する
    ことを特徴とする請求項5記載の編集装置。
  7. 上記バッファ占有量演算手段は、上記第1の符号化ストリーム及び上記第2の符号化ストリームのビットカウント値に基づいて、上記第1の符号化ストリーム及び上記第2の符号化ストリームのバッファ占有量を演算する
    ことを特徴とする請求項5記載の編集装置。
  8. 上記バッファ占有量演算手段は、上記第1の符号化ストリーム及び上記第2の符号化ストリームのビットカウント値に基づいて、上記第1の符号化ストリームと上記第2の符号化ストリームとを接続した場合における上記再符号化対象ストリームのバッファ占有量を演算する
    ことを特徴とする請求項5記載の編集装置。
  9. 第1の符号化ストリームと第2の符号化ストリームとを接続点で接続する編集方法において、
    上記第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して第1の画像データを生成すると共に、上記第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して、第2の画像データを生成する復号工程と、
    上記第1の画像データ及び上記第2の画像データを、上記第1の編集点と上記第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化工程と、
    上記第1の画像データ及び上記第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算工程と、
    再符号化処理する際の発生符号量と上記オフセット値とを用いて、上記目標符号量を補正する目標符号量補正工程と、
    上記目標符号量補正工程により補正された目標符号量に基づいて、上記再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、上記再符号化工程の再符号化処理を制御する制御工程と、
    上記第1の符号化ストリーム及び上記第2の符号化ストリームと上記再符号化工程により生成された上記再符号化ストリームとを、上記第1の切換点及び第2の切換点で切り換えて出力することによって、編集された編集符号化ストリームを生成する編集工程と
    を含むことを特徴とする編集方法。
  10. 第1の符号化ストリームと第2の符号化ストリームとを接続点で接続する再符号化装置において、
    上記第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して第1の画像データを生成すると共に、上記第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して、第2の画像データを生成する復号手段と、
    上記第1の画像データ及び上記第2の画像データを、上記第1の編集点と上記第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化手段と、
    上記第1の画像データ及び上記第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手段と、
    再符号化処理する際の発生符号量と上記オフセット値とを用いて、上記目標符号量を補正する目標符号量補正手段と、
    上記目標符号量補正手段により補正された目標符号量に基づいて、上記再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、上記再符号化手段の再符号化処理を制御する制御手段と
    を備えたことを特徴とする再符号化装置。
  11. 第1の符号化ストリームと第2の符号化ストリームとを接続点で接続する再符号化方法において、
    上記第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して第1の画像データを生成すると共に、上記第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して、第2の画像データを生成する復号工程と、
    上記第1の画像データ及び上記第2の画像データを、上記第1の編集点と上記第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化工程と、
    上記第1の画像データ及び上記第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算工程と、
    再符号化処理する際の発生符号量と上記オフセット値とを用いて、上記目標符号量を補正する目標符号量補正工程と、
    上記目標符号量補正工程により補正された目標符号量に基づいて、上記再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、上記再符号化工程の再符号化処理を制御する制御工程と
    を含むことを特徴とする再符号化方法。
  12. 第1の符号化ストリームと第2の符号化ストリームとを接続点で接続する再符号化装置において、
    上記第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して得られる第1の画像データ、ならびに上記第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して得られる第2の画像データを、上記第1の編集点と上記第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化手段と、
    上記第1の画像データ及び上記第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手段と、
    再符号化処理する際の発生符号量と上記オフセット値とを用いて、上記目標符号量を補正する目標符号量補正手段と、
    上記目標符号量補正手段により補正された目標符号量に基づいて、上記再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、上記再符号化手段の再符号化処理を制御する制御手段と
    を備えたことを特徴とする再符号化装置。
  13. 第1の符号化ストリームと第2の符号化ストリームとを接続点で接続する再符号化方法において、
    上記第1の符号化ストリームに設定された第1の切換点及び第1の編集点を含む所定区間を復号処理して得られる第1の画像データ、ならびに上記第2の符号化ストリームに設定された第2の編集点及び第2の切換点を含む所定区間を復号処理して得られる第2の画像データを、上記第1の編集点と上記第2の編集点とで接続して再符号化処理し、再符号化ストリームを生成する再符号化工程と、
    上記第1の画像データ及び上記第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算工程と、
    再符号化処理する際の発生符号量と上記オフセット値とを用いて、上記目標符号量を補正する目標符号量補正工程と、
    上記目標符号量補正工程により補正された目標符号量に基づいて、上記再符号化対象ストリームの発生符号量を割り当てて再符号化処理するように、上記再符号化工程の再符号化処理を制御する制御工程と
    を含むことを特徴とする再符号化方法。
  14. 第1の符号化ストリームと第2の符号化ストリームとをスプライシングポイントにおいてスプライシングするスプライシング装置において、
    上記第1の符号化ストリームに設定された第1のスプライシングポイントを含む所定区間を復号処理して得られる第1の画像データ及び上記第2の符号化ストリームに設定された第2のスプライシングポイントを含む所定区間を復号処理して得られる第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手段と、
    再符号化処理する際の発生符号量と上記オフセット値とを用いて、上記目標符号量を補正する目標符号量補正手段と、
    上記目標符号量補正手段により補正された目標符号量に基づいて、上記再符号化対象ストリームの発生符号量を割り当て、上記第1の符号化ストリームと上記第2の符号化ストリームとをスプライシングするスプライシング手段と
    を備えたことを特徴とするスプライシング装置。
  15. 第1の符号化ストリームと第2の符号化ストリームとをスプライシングポイントにおいてスプライシングするスプライシング方法において、
    上記第1の符号化ストリームに設定された第1のスプライシングポイントを含む所定区間を復号処理して得られる第1の画像データ及び上記第2の符号化ストリームに設定された第2のスプライシングポイントを含む所定区間を復号処理して得られる第2の画像データを再符号化処理する際の目標符号量に対するオフセット値を演算するオフセット値演算手工程と、
    再符号化処理する際の発生符号量と上記オフセット値とを用いて、上記目標符号量を補正する目標符号量補正工程と、
    上記目標符号量補正工程により補正された目標符号量に基づいて、上記再符号化対象ストリームの発生符号量を割り当て、上記第1の符号化ストリームと上記第2の符号化ストリームとをスプライシングするスプライシング工程と
    を含むことを特徴とするスプライシング方法。
JP2005143129A 1997-07-25 2005-05-16 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法 Expired - Lifetime JP4045553B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005143129A JP4045553B2 (ja) 1997-07-25 2005-05-16 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP19992397 1997-07-25
JP2005143129A JP4045553B2 (ja) 1997-07-25 2005-05-16 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP50967099A Division JP3736808B2 (ja) 1997-07-25 1998-07-27 編集装置、編集方法、再符号化装置及び再符号化方法

Publications (2)

Publication Number Publication Date
JP2005253116A JP2005253116A (ja) 2005-09-15
JP4045553B2 true JP4045553B2 (ja) 2008-02-13

Family

ID=16415853

Family Applications (5)

Application Number Title Priority Date Filing Date
JP50967099A Expired - Lifetime JP3736808B2 (ja) 1997-07-25 1998-07-27 編集装置、編集方法、再符号化装置及び再符号化方法
JP2005143132A Expired - Lifetime JP4088800B2 (ja) 1997-07-25 2005-05-16 編集装置および編集方法
JP2005143130A Pending JP2005295587A (ja) 1997-07-25 2005-05-16 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法
JP2005143129A Expired - Lifetime JP4045553B2 (ja) 1997-07-25 2005-05-16 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法
JP2005143131A Expired - Lifetime JP4088799B2 (ja) 1997-07-25 2005-05-16 編集装置および編集方法

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP50967099A Expired - Lifetime JP3736808B2 (ja) 1997-07-25 1998-07-27 編集装置、編集方法、再符号化装置及び再符号化方法
JP2005143132A Expired - Lifetime JP4088800B2 (ja) 1997-07-25 2005-05-16 編集装置および編集方法
JP2005143130A Pending JP2005295587A (ja) 1997-07-25 2005-05-16 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2005143131A Expired - Lifetime JP4088799B2 (ja) 1997-07-25 2005-05-16 編集装置および編集方法

Country Status (7)

Country Link
US (6) US6567471B1 (ja)
EP (3) EP0923243B1 (ja)
JP (5) JP3736808B2 (ja)
KR (2) KR100604631B1 (ja)
CN (1) CN1161989C (ja)
DE (1) DE69841897D1 (ja)
WO (1) WO1999005864A1 (ja)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0725399U (ja) * 1993-10-19 1995-05-12 廉正 赤澤 ミッションオイルクリーナ
GB2369518B (en) * 1997-07-18 2002-07-17 British Broadcasting Corp Switching compressed video bitstreams
EP0923243B1 (en) * 1997-07-25 2010-09-15 Sony Corporation Editing device, editing method, splicing device, splicing method, encoding device, and encoding method
WO1999036912A1 (fr) * 1998-01-19 1999-07-22 Sony Corporation Systeme d'edition, dispositif de commande d'edition et procede de commande d'edition
JP2000138896A (ja) * 1998-10-30 2000-05-16 Hitachi Ltd 画像音声記録装置
JP2000165802A (ja) 1998-11-25 2000-06-16 Matsushita Electric Ind Co Ltd ストリーム編集装置と編集方法
WO2000062551A1 (en) * 1999-04-14 2000-10-19 Sarnoff Corporation Frame-accurate seamless splicing of information streams
JP2000354249A (ja) * 1999-04-16 2000-12-19 Sony United Kingdom Ltd ビデオ信号処理装置、ビデオ信号処理方法及びコンピュータプログラム製品
GB9908809D0 (en) * 1999-04-16 1999-06-09 Sony Uk Ltd Signal processor
JP4689001B2 (ja) * 1999-04-16 2011-05-25 ソニー ヨーロッパ リミテッド ビデオ信号処理装置、コンピュータプログラム及びビデオ信号処理方法
JP4487374B2 (ja) * 1999-06-01 2010-06-23 ソニー株式会社 符号化装置及び符号化方法並びに多重化装置及び多重化方法
US7254175B2 (en) 1999-07-02 2007-08-07 Crystalmedia Technology, Inc. Frame-accurate seamless splicing of information streams
GB2353653B (en) * 1999-08-26 2003-12-31 Sony Uk Ltd Signal processor
US6985188B1 (en) * 1999-11-30 2006-01-10 Thomson Licensing Video decoding and channel acquisition system
US6988238B1 (en) 2000-01-24 2006-01-17 Ati Technologies, Inc. Method and system for handling errors and a system for receiving packet stream data
US6885680B1 (en) 2000-01-24 2005-04-26 Ati International Srl Method for synchronizing to a data stream
US8284845B1 (en) 2000-01-24 2012-10-09 Ati Technologies Ulc Method and system for handling data
US6763390B1 (en) * 2000-01-24 2004-07-13 Ati Technologies, Inc. Method and system for receiving and framing packetized data
US6778533B1 (en) 2000-01-24 2004-08-17 Ati Technologies, Inc. Method and system for accessing packetized elementary stream data
US6785336B1 (en) 2000-01-24 2004-08-31 Ati Technologies, Inc. Method and system for retrieving adaptation field data associated with a transport packet
JP2001218213A (ja) * 2000-01-31 2001-08-10 Mitsubishi Electric Corp 画像信号変換符号化装置
JP4170555B2 (ja) * 2000-02-28 2008-10-22 株式会社東芝 映像符号化装置及び映像符号化方法
GB0007868D0 (en) 2000-03-31 2000-05-17 Koninkl Philips Electronics Nv Methods and apparatus for editing digital video recordings and recordings made by such methods
JP2002010259A (ja) * 2000-06-21 2002-01-11 Mitsubishi Electric Corp 画像符号化装置及び画像符号化方法及び画像符号化プログラムを記録した記録媒体
US7490344B2 (en) * 2000-09-29 2009-02-10 Visible World, Inc. System and method for seamless switching
US7095945B1 (en) * 2000-11-06 2006-08-22 Ati Technologies, Inc. System for digital time shifting and method thereof
JP2002281433A (ja) * 2001-03-15 2002-09-27 Kddi Corp 動画像検索閲覧編集装置および記録媒体
US20020133486A1 (en) * 2001-03-15 2002-09-19 Kddi Corporation Video retrieval and browsing apparatus, video retrieval, browsing and editing apparatus, and recording medium
FI111590B (fi) * 2001-04-20 2003-08-15 Swelcom Oy Menetelmä ja laite datan lokalisointia varten
US7349691B2 (en) * 2001-07-03 2008-03-25 Microsoft Corporation System and apparatus for performing broadcast and localcast communications
US6965597B1 (en) * 2001-10-05 2005-11-15 Verizon Laboratories Inc. Systems and methods for automatic evaluation of subjective quality of packetized telecommunication signals while varying implementation parameters
KR100454501B1 (ko) * 2001-12-26 2004-10-28 브이케이 주식회사 영상신호를 부호화 또는 복호화하기 위한 예측 장치 및 방법
KR100475412B1 (ko) * 2002-03-11 2005-03-10 주식회사 럭스퍼트 상부 펌핑방식의 광소자
DE10212656A1 (de) * 2002-03-21 2003-10-02 Scm Microsystems Gmbh Selektive Verschlüsselung von Multimediadaten
US7151856B2 (en) * 2002-04-25 2006-12-19 Matsushita Electric Industrial Co., Ltd. Picture coding apparatus and picture coding method
US9948977B2 (en) 2003-01-09 2018-04-17 Avago Technologies General Ip (Singapore) Pte. Ltd. System, method, and apparatus for determining presentation time for picture without presentation time stamp
US7426306B1 (en) * 2002-10-24 2008-09-16 Altera Corporation Efficient use of keyframes in video compression
FR2848766B1 (fr) * 2002-12-13 2005-03-11 Thales Sa Procede de commutation de signaux numeriques avant emission, commutateur et signal resultant
US8175154B2 (en) * 2003-06-03 2012-05-08 General Instrument Corporation Method for restructuring a group of pictures to provide for random access into the group of pictures
US7609762B2 (en) * 2003-09-07 2009-10-27 Microsoft Corporation Signaling for entry point frames with predicted first field
US8213779B2 (en) 2003-09-07 2012-07-03 Microsoft Corporation Trick mode elementary stream and receiver system
US7839930B2 (en) * 2003-11-13 2010-11-23 Microsoft Corporation Signaling valid entry points in a video stream
US7852919B2 (en) * 2003-09-07 2010-12-14 Microsoft Corporation Field start code for entry point frames with predicted first field
US7924921B2 (en) 2003-09-07 2011-04-12 Microsoft Corporation Signaling coding and display options in entry point headers
US20050060420A1 (en) * 2003-09-11 2005-03-17 Kovacevic Branko D. System for decoding multimedia data and method thereof
JP3675464B2 (ja) * 2003-10-29 2005-07-27 ソニー株式会社 動画像符号化装置および動画像符号化制御方法
US9715898B2 (en) * 2003-12-16 2017-07-25 Core Wireless Licensing S.A.R.L. Method and device for compressed-domain video editing
US7391809B2 (en) * 2003-12-30 2008-06-24 Microsoft Corporation Scalable video transcoding
TW200952462A (en) * 2004-06-02 2009-12-16 Panasonic Corp Seamless switching between random access units multiplexed in a multi angle view multimedia stream
CN1713727B (zh) * 2004-06-14 2010-11-10 松下电器产业株式会社 编辑资料流的方法及装置
KR100608061B1 (ko) * 2004-07-12 2006-08-02 삼성전자주식회사 전송 스트림 생성을 위한 다중화 방법 및 그 장치
JP4638874B2 (ja) * 2004-08-11 2011-02-23 株式会社日立製作所 符号化ストリーム記録媒体、及び画像符号化装置
JP4438059B2 (ja) * 2004-08-24 2010-03-24 キヤノン株式会社 画像再生装置及びその制御方法
JP4743119B2 (ja) * 2004-08-25 2011-08-10 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP4221667B2 (ja) * 2004-08-25 2009-02-12 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP4174728B2 (ja) * 2004-08-25 2008-11-05 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
EP1908296A2 (en) * 2005-07-28 2008-04-09 Thomson Licensing Method and apparatus for transmitting multiple video streams over a video channel
JP4528694B2 (ja) * 2005-08-12 2010-08-18 株式会社東芝 動画像符号化装置
JP4492484B2 (ja) 2005-08-22 2010-06-30 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP4791129B2 (ja) * 2005-10-03 2011-10-12 ルネサスエレクトロニクス株式会社 画像符号化装置、画像符号化方法及び画像編集装置
US20070116117A1 (en) * 2005-11-18 2007-05-24 Apple Computer, Inc. Controlling buffer states in video compression coding to enable editing and distributed encoding
JP4828925B2 (ja) * 2005-11-30 2011-11-30 パナソニック株式会社 符号化装置
JP4932242B2 (ja) * 2005-12-13 2012-05-16 三菱電機株式会社 ストリーム切換装置及びストリーム切換方法
JP4207072B2 (ja) 2006-04-07 2009-01-14 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP4207981B2 (ja) * 2006-06-13 2009-01-14 ソニー株式会社 情報処理装置および情報処理方法、プログラム、並びに記録媒体
JP4229149B2 (ja) * 2006-07-13 2009-02-25 ソニー株式会社 ビデオ信号処理装置およびビデオ信号処理方法、ビデオ信号符号化装置およびビデオ信号符号化方法、並びにプログラム
JP4221676B2 (ja) 2006-09-05 2009-02-12 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP2008066851A (ja) * 2006-09-05 2008-03-21 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
JP4369948B2 (ja) * 2006-09-20 2009-11-25 シャープ株式会社 画像表示装置及び方法、画像処理装置及び方法
JP4303743B2 (ja) * 2006-10-04 2009-07-29 シャープ株式会社 画像表示装置及び方法、画像処理装置及び方法
JP4241839B2 (ja) 2007-02-02 2009-03-18 ソニー株式会社 データ及びファイルシステム情報の記録装置及び記録方法
JP2009077105A (ja) * 2007-09-20 2009-04-09 Sony Corp 編集装置および編集方法、プログラム、並びに記録媒体
US20090083811A1 (en) * 2007-09-26 2009-03-26 Verivue, Inc. Unicast Delivery of Multimedia Content
US8457958B2 (en) 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
US8432804B2 (en) * 2007-11-29 2013-04-30 Hewlett-Packard Development Company, L.P. Transmitting video streams
US8543667B2 (en) 2008-01-14 2013-09-24 Akamai Technologies, Inc. Policy-based content insertion
US8335262B2 (en) * 2008-01-16 2012-12-18 Verivue, Inc. Dynamic rate adjustment to splice compressed video streams
CA2721700C (en) * 2008-04-17 2019-07-16 Sony Corporation Dual-type of playback for multimedia content
DE102008002005A1 (de) * 2008-05-27 2009-12-03 Robert Bosch Gmbh Exzenter-Planetenantrieb
JP2010004142A (ja) * 2008-06-18 2010-01-07 Hitachi Kokusai Electric Inc 動画像符号化装置、復号化装置、符号化方法及び復号化方法
US8259177B2 (en) * 2008-06-30 2012-09-04 Cisco Technology, Inc. Video fingerprint systems and methods
US8904426B2 (en) * 2008-06-30 2014-12-02 Rgb Networks, Inc. Preconditioning ad content for digital program insertion
US20090327334A1 (en) * 2008-06-30 2009-12-31 Rodriguez Arturo A Generating Measures of Video Sequences to Detect Unauthorized Use
US8347408B2 (en) * 2008-06-30 2013-01-01 Cisco Technology, Inc. Matching of unknown video content to protected video content
CN102150432A (zh) * 2008-09-17 2011-08-10 夏普株式会社 可分级视频流解码装置以及可分级视频流生成装置
US20100104022A1 (en) * 2008-10-24 2010-04-29 Chanchal Chatterjee Method and apparatus for video processing using macroblock mode refinement
WO2010057027A1 (en) * 2008-11-14 2010-05-20 Transvideo, Inc. Method and apparatus for splicing in a compressed video bitstream
US8743906B2 (en) * 2009-01-23 2014-06-03 Akamai Technologies, Inc. Scalable seamless digital video stream splicing
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US20100201870A1 (en) * 2009-02-11 2010-08-12 Martin Luessi System and method for frame interpolation for a compressed video bitstream
US9565397B2 (en) * 2009-02-26 2017-02-07 Akamai Technologies, Inc. Deterministically skewing transmission of content streams
US9906757B2 (en) * 2009-02-26 2018-02-27 Akamai Technologies, Inc. Deterministically skewing synchronized events for content streams
US8650602B2 (en) * 2009-02-27 2014-02-11 Akamai Technologies, Inc. Input queued content switching using a playlist
KR101280700B1 (ko) * 2009-02-27 2013-07-01 후지쯔 가부시끼가이샤 동화상 부호화 장치, 동화상 부호화 방법 및 동화상 부호화용 컴퓨터 프로그램
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8724710B2 (en) * 2010-02-24 2014-05-13 Thomson Licensing Method and apparatus for video encoding with hypothetical reference decoder compliant bit allocation
JP2011211691A (ja) * 2010-03-11 2011-10-20 Sony Corp 情報処理装置、情報処理方法、およびプログラム
US8718148B2 (en) * 2010-03-11 2014-05-06 Sony Corporation Information processing apparatus, information processing method, and program
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
ES2693648T3 (es) 2010-06-18 2018-12-13 Akamai Technologies, Inc. Extensión de una red de distribución de contenidos (CDN) en una red móvil o alámbrica
JP6056122B2 (ja) * 2011-01-24 2017-01-11 ソニー株式会社 画像符号化装置と画像復号装置およびその方法とプログラム
EP2547062B1 (en) * 2011-07-14 2016-03-16 Nxp B.V. Media streaming with adaptation
US9591318B2 (en) * 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
JP5891975B2 (ja) * 2012-07-02 2016-03-23 富士通株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法
ITMI20131710A1 (it) * 2013-10-15 2015-04-16 Sky Italia S R L "sistema di cloud encoding"
EP3185564A1 (en) * 2015-12-22 2017-06-28 Harmonic Inc. Video stream splicing of groups of pictures (gop)
CN105657547B (zh) * 2015-12-31 2019-05-10 北京奇艺世纪科技有限公司 一种相似视频和盗版视频的检测方法及装置
US11936712B1 (en) * 2023-04-06 2024-03-19 Synamedia Limited Packet-accurate targeted content substitution

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5614952A (en) * 1994-10-11 1997-03-25 Hitachi America, Ltd. Digital video decoder for decoding digital high definition and/or digital standard definition television signals
JPH06253331A (ja) * 1993-03-01 1994-09-09 Toshiba Corp 可変長符号化信号に対応した編集装置
DE69422960T2 (de) * 1993-12-01 2000-06-15 Matsushita Electric Ind Co Ltd Verfahren und Vorrichtung zum Editieren oder zur Mischung von komprimierten Bildern
JPH07212766A (ja) 1994-01-18 1995-08-11 Matsushita Electric Ind Co Ltd 動画像圧縮データ切り換え装置
JP3019912B2 (ja) * 1994-07-22 2000-03-15 日本ビクター株式会社 画像データ編集装置
JPH08149408A (ja) * 1994-11-17 1996-06-07 Matsushita Electric Ind Co Ltd ディジタル動画編集方法及び装置
GB9424437D0 (en) * 1994-12-02 1995-01-18 Philips Electronics Uk Ltd Encoder system level buffer management
US5612900A (en) * 1995-05-08 1997-03-18 Kabushiki Kaisha Toshiba Video encoding method and system which encodes using a rate-quantizer model
GB2307613B (en) 1995-08-31 2000-03-22 British Broadcasting Corp Switching bit-rate reduced signals
JP3493872B2 (ja) * 1996-02-29 2004-02-03 ソニー株式会社 画像データ処理方法およびその装置
US6137834A (en) * 1996-05-29 2000-10-24 Sarnoff Corporation Method and apparatus for splicing compressed information streams
CA2208950A1 (en) * 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
JP3755206B2 (ja) * 1996-10-07 2006-03-15 ソニー株式会社 編集装置と編集方法
US5982436A (en) * 1997-03-28 1999-11-09 Philips Electronics North America Corp. Method for seamless splicing in a video encoder
US6151443A (en) * 1997-05-16 2000-11-21 Indigita Corporation Digital video and data recorder
US6298088B1 (en) * 1997-05-28 2001-10-02 Sarnoff Corporation Method and apparatus for splicing compressed information signals
US6101195A (en) * 1997-05-28 2000-08-08 Sarnoff Corporation Timing correction method and apparatus
GB2369518B (en) * 1997-07-18 2002-07-17 British Broadcasting Corp Switching compressed video bitstreams
EP0923243B1 (en) * 1997-07-25 2010-09-15 Sony Corporation Editing device, editing method, splicing device, splicing method, encoding device, and encoding method
US6611624B1 (en) * 1998-03-13 2003-08-26 Cisco Systems, Inc. System and method for frame accurate splicing of compressed bitstreams
GB9908809D0 (en) * 1999-04-16 1999-06-09 Sony Uk Ltd Signal processor
GB2353655B (en) * 1999-08-26 2003-07-23 Sony Uk Ltd Signal processor
GB2353653B (en) * 1999-08-26 2003-12-31 Sony Uk Ltd Signal processor

Also Published As

Publication number Publication date
EP0923243A4 (en) 2002-12-04
KR20050103248A (ko) 2005-10-27
EP1467563A1 (en) 2004-10-13
WO1999005864A1 (fr) 1999-02-04
EP0923243B1 (en) 2010-09-15
JP3736808B2 (ja) 2006-01-18
US20070165715A1 (en) 2007-07-19
JP4088800B2 (ja) 2008-05-21
JP4088799B2 (ja) 2008-05-21
US8923409B2 (en) 2014-12-30
US7711051B2 (en) 2010-05-04
CN1236522A (zh) 1999-11-24
US8798143B2 (en) 2014-08-05
JP2005253116A (ja) 2005-09-15
US20070047661A1 (en) 2007-03-01
EP1445773A1 (en) 2004-08-11
US20070047662A1 (en) 2007-03-01
EP0923243A1 (en) 1999-06-16
JP2005323386A (ja) 2005-11-17
CN1161989C (zh) 2004-08-11
DE69841897D1 (de) 2010-10-28
US20030067989A1 (en) 2003-04-10
JP2005295587A (ja) 2005-10-20
US20070058729A1 (en) 2007-03-15
US6567471B1 (en) 2003-05-20
KR100555164B1 (ko) 2006-03-03
JP2005328548A (ja) 2005-11-24
KR100604631B1 (ko) 2006-07-28
US7139316B2 (en) 2006-11-21
KR20000068626A (ko) 2000-11-25
US8223847B2 (en) 2012-07-17

Similar Documents

Publication Publication Date Title
JP4045553B2 (ja) 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法
US6642967B1 (en) Video data formatting and storage employing data allocation to control transcoding to intermediate video signal
KR101194967B1 (ko) 정보 처리 장치 및 정보 처리 방법, 및 기록 매체
JP2007104182A (ja) 画像符号化装置、画像符号化方法及び画像編集装置
JPH08251582A (ja) 符号化データ編集装置
WO2004112397A1 (ja) 画像処理装置および画像処理方法、情報処理装置および情報処理方法、情報記録装置および情報記録方法、情報再生装置および情報再生方法、記録媒体、並びに、プログラム
JP3918332B2 (ja) 多重化装置、多重化方法及び記録媒体
JP2008258858A (ja) 動画像符号化装置
JP2005278207A (ja) 編集装置および方法、再符号化装置および方法
JPH10108200A (ja) 画像符号化方法およびその装置
JPH11220695A (ja) 動画像データの復号装置及び復号方法
JP2007325304A (ja) Mpegデータ記録再生方法
JP2008005520A (ja) Mpegデータ記録再生装置
JP2008005522A (ja) Mpegデータ記録再生方法
JP2010252394A (ja) 画像符号化装置、画像符号化方法及び画像編集装置
JP2007336574A (ja) Mpegデータ記録再生装置
JP2008005521A (ja) Mpegデータ記録再生方法
JP2008005519A (ja) Mpegデータ記録再生装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050615

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131130

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term