JP3675464B2 - 動画像符号化装置および動画像符号化制御方法 - Google Patents

動画像符号化装置および動画像符号化制御方法 Download PDF

Info

Publication number
JP3675464B2
JP3675464B2 JP2003369388A JP2003369388A JP3675464B2 JP 3675464 B2 JP3675464 B2 JP 3675464B2 JP 2003369388 A JP2003369388 A JP 2003369388A JP 2003369388 A JP2003369388 A JP 2003369388A JP 3675464 B2 JP3675464 B2 JP 3675464B2
Authority
JP
Japan
Prior art keywords
amount
occupancy
virtual buffer
chapter
code amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003369388A
Other languages
English (en)
Other versions
JP2005136633A (ja
Inventor
憲一郎 有留
裕信 宮崎
幸雄 磯部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2003369388A priority Critical patent/JP3675464B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Priority to EP04793392A priority patent/EP1583365A4/en
Priority to US10/538,086 priority patent/US7835436B2/en
Priority to CN2004800017539A priority patent/CN1723709B/zh
Priority to TW93133072A priority patent/TWI264227B/zh
Priority to KR20057011846A priority patent/KR101091418B1/ko
Priority to PCT/JP2004/016472 priority patent/WO2005041582A1/ja
Publication of JP2005136633A publication Critical patent/JP2005136633A/ja
Application granted granted Critical
Publication of JP3675464B2 publication Critical patent/JP3675464B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23406Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving management of server-side video buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/1062Data buffering arrangements, e.g. recording or playback buffers
    • G11B2020/10675Data buffering arrangements, e.g. recording or playback buffers aspects of buffer control
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/1062Data buffering arrangements, e.g. recording or playback buffers
    • G11B2020/1075Data buffering arrangements, e.g. recording or playback buffers the usage of the buffer being restricted to a specific kind of data
    • G11B2020/10759Data buffering arrangements, e.g. recording or playback buffers the usage of the buffer being restricted to a specific kind of data content data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、動画像信号の符号化を行う動画像符号化装置に関し、特にチャプタ間のシームレス接続を行う際に後続チャプタの発生符号量を制御する動画像符号化装置、動画像符号化制御装置、および、動画像符号化制御方法ならびに当該方法をコンピュータに実行させるプログラムに関する。
近年、動画像(ビデオ)データや音声(オーディオ)データを記録できる記録媒体として光ディスクが注目されている。この光ディスクは、映画などのコンテンツ商品のメディアとしてだけでなく、ユーザ側で記録を行うための書き込み型メディアとしても用いられるようなっている。書き込み型メディアとしては、例えば、同一領域について一度だけの記録を可能としたDVD−R規格や、繰り返し書き換え可能なDVD−RW規格などが知られている。これら光メディアのファイルフォーマットとしては、再生専用ディスクのためのDVD−Video規格が知られているが、書き込み型メディアに対してもこのDVD−Video規格に準拠した書き込みを行うことができるようになっている。
DVD−Video規格では、一つのディスク当たり最大99のタイトルを記録できるようになっており、さらに各タイトルは最大99のチャプタ(PTT:Part of TiTle)を含むことができるようになっている。上述のDVD−RやDVD−RWに対してカムコーダ(camcorder:camera and recorder)により記録を行う場合、記録開始から記録終了までの1回の記録単位がチャプタとして記録され、所定の条件を満たすまで同一のタイトルとして記録される。タイトルを閉じる所定の条件とは、例えば、ディスクがイジェクト(排出)された場合、タイトル内で99チャプタに達した場合、タイトル内で99セルに達した場合、動画記録から静止画記録に移行した場合などである。
このようにチャプタ単位で記録されたデータを再生すると、チャプタ間に微妙な隙間が生じてしまい、一瞬途切れたような表示が行われしまう。カムコーダにおける記録単位は十数秒から数十秒程度が標準的であり、その度に再生が途切れてしまうのは望ましくない。
そのため、従来より、ビデオストリーム間を見た目として途切れないように接続するシームレス接続の技術が提案されている(例えば、特許文献1参照。)。
特開平11−155131号公報(図25)
上述の従来技術では、ビデオオブジェクトの部分区間同士の連結をする際に、その部分区間の終端部に位置するピクチャデータを含むVOBUと、先端部に位置するピクチャデータを含むVOBUとを光ディスクから読み出して、VOBUを複数のオーディオパックと、複数のビデオパックとに分離させ、その後、ビデオパックを再エンコードして、複数のオーディオパックのうち一部を後部区間に多重化している。すなわち、出力ストリームの多重化をやり直す必要が生じる。
一方、DVD−Video規格に準拠した記録を行うために動画像のエンコード(符号化)を行う際にはMPEG−2(Moving Picture Experts Group phase 2)規格が用いられるが、このMPEG−2では、エンコーダとデコーダとの間にVBV(Video Buffering Verifier : ISO13818-2 Annex C参照)バッファと呼ばれる仮想バッファを想定して、このVBVバッファが破綻しないようにエンコードを行う必要がある。別々にエンコードされたビデオストリーム同士をシームレス接続しようとすると、このVBVバッファにおける先行チャプタの占有量が考慮されずに後続チャプタのデータがVBVバッファに入力されるため、このVBVバッファに破綻をきたすおそれがある。
そこで、本発明は、VBVバッファに破綻をきたさずにチャプタ間のシームレス接続を行う動画像符号化装置を提供することを目的とする。
上記課題を解決するために本発明の請求項1記載の動画像符号化装置は、先行チャプタおよび後続チャプタを含む動画像信号を符号化し、その発生符号量と出力先への転送符号量とにより規定される仮想バッファの占有量に応じて上記符号化を制御する動画像符号化装置であって、少なくとも上記後続チャプタがタイトルの先頭チャプタか否かを判別することによって上記先行チャプタと上記後続チャプタとの間でシームレス接続が可能か否を判別し、上記シームレス接続が可能であれば上記後続チャプタの動画像信号が上記仮想バッファに転送される直前の上記仮想バッファの占有量を上記仮想バッファの占有量の初期値とし、上記シームレス接続が不可能であればゼロを上記仮想バッファの占有量の初期値として設定する記録モード判別手段と、上記符号化が行われるたびに上記仮想バッファの占有量を更新する占有量更新手段と、上記更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する最適占有量算出手段と、上記後続チャプタの動画像信号に基づいて所定の目標符号量を算出する目標符号量算出手段と、上記仮想バッファの占有量に上記目標符号量を加えた総量が上記最適占有量を超えないように上記目標符号量を調整するために、上記仮想バッファの占有量に上記目標符号量を加えた総量が上記最適占有量を超える場合には上記最適占有量から上記仮想バッファの占有量を減じた値を上記目標符号量とする目標符号量調整手段と、上記調整された目標符号量に従って上記符号化を行う符号化手段とを具備する。これにより、後続チャプタのための仮想バッファの占有量の初期値を設定するにあたって、先行チャプタによる仮想バッファの占有量の状態を引き継がせて、仮想バッファに破綻をきたさずにチャプタ間のシームレス接続を行うことができるという作用をもたらす。
また、本発明の請求項記載の動画像符号化装置は、請求項記載の動画像符号化装置において、上記占有量更新手段が、上記占有量が上記転送符号量より多い場合には上記占有量から上記転送符号量を減じて上記発生符号量を加えた値であって上記仮想バッファの最大値を超えない値を新たな占有量とし、上記占有量が上記転送符号量以下の場合には上記発生符号量を新たな占有量とするものである。これにより、仮想バッファの占有量に関する情報を最新の状態に更新させるという作用をもたらす。
また、本発明の請求項記載の動画像符号化装置は、請求項記載の動画像符号化装置において、上記最適占有量算出手段が、上記更新された仮想バッファの占有量が大きいほど大きいもしくは等しい値を上記最適占有量として算出するものである。これにより、仮想バッファの占有量をビットレートに反映させて急峻な画像劣化を抑制するという作用をもたらす。
また、本発明の請求項4記載の動画像符号化制御装置は、請求項1記載の動画像符号化装置において、上記更新された仮想バッファの占有量が不揮発性メモリに保持されるものである。
また、本発明の請求項5記載の動画像符号化制御装置は、先行チャプタおよび後続チャプタを含む動画像信号の符号化における発生符号量と出力先への転送符号量とにより規定される仮想バッファの占有量に応じて上記符号化を制御する動画像符号化制御装置であって、少なくとも上記後続チャプタがタイトルの先頭チャプタか否かを判別することによって上記先行チャプタと上記後続チャプタとの間でシームレス接続が可能か否を判別し、上記シームレス接続が可能であれば上記後続チャプタの動画像信号が上記仮想バッファに転送される直前の上記仮想バッファの占有量を上記仮想バッファの占有量の初期値とし、上記シームレス接続が不可能であればゼロを上記仮想バッファの占有量の初期値として設定する記録モード判別手段と、上記符号化が行われるたびに上記仮想バッファの占有量を更新する占有量更新手段と、上記更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する最適占有量算出手段と、上記後続チャプタの動画像信号に基づいて所定の目標符号量を算出する目標符号量算出手段と、上記仮想バッファの占有量に上記目標符号量を加えた総量が上記最適占有量を超えないように上記目標符号量を調整して上記符号化に供するために、上記仮想バッファの占有量に上記目標符号量を加えた総量が上記最適占有量を超える場合には上記最適占有量から上記仮想バッファの占有量を減じた値を上記目標符号量とする目標符号量調整手段とを具備する。これにより、後続チャプタのための仮想バッファの占有量の初期値を設定するにあたって、先行チャプタによる仮想バッファの占有量の状態を引き継がせて、仮想バッファに破綻をきたさずにチャプタ間のシームレス接続を行うことができるという作用をもたらす。
また、本発明の請求項記載の動画像符号化制御方法は、先行チャプタおよび後続チャプタを含む動画像信号の符号化における発生符号量と出力先への転送符号量とにより規定される仮想バッファの占有量に応じて上記符号化を制御する動画像符号化制御方法であって、少なくとも上記後続チャプタがタイトルの先頭チャプタか否かを判別することによって上記先行チャプタと上記後続チャプタとの間でシームレス接続が可能か否を判別する手順と、上記シームレス接続が可能であれば上記後続チャプタの動画像信号が上記仮想バッファに転送される直前の上記仮想バッファの占有量を上記仮想バッファの占有量の初期値とし、上記シームレス接続が不可能であればゼロを上記仮想バッファの占有量の初期値として設定する手順と、上記符号化が行われるたびに上記仮想バッファの占有量を更新する手順と、上記更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する手順と、上記後続チャプタの動画像信号に基づいて所定の目標符号量を算出する手順と、上記仮想バッファの占有量に上記目標符号量を加えた総量が上記最適占有量を超えないように上記目標符号量を調整して上記符号化に供するために、上記仮想バッファの占有量に上記目標符号量を加えた総量が上記最適占有量を超える場合には上記最適占有量から上記仮想バッファの占有量を減じた値を上記目標符号量とする手順とを具備する。これにより、後続チャプタのための仮想バッファの占有量の初期値を設定するにあたって、先行チャプタによる仮想バッファの占有量の状態を引き継がせて、仮想バッファに破綻をきたさずにチャプタ間のシームレス接続を行うことができるという作用をもたらす。
また、本発明の請求項記載のプログラムは、先行チャプタおよび後続チャプタを含む動画像信号の符号化における発生符号量と出力先への転送符号量とにより規定される仮想バッファの占有量に応じて上記符号化を制御するプログラムであって、少なくとも上記後続チャプタがタイトルの先頭チャプタか否かを判別することによって上記先行チャプタと上記後続チャプタとの間でシームレス接続が可能か否を判別する手順と、上記シームレス接続が可能であれば上記後続チャプタの動画像信号が上記仮想バッファに転送される直前の上記仮想バッファの占有量を上記仮想バッファの占有量の初期値とし、上記シームレス接続が不可能であればゼロを上記仮想バッファの占有量の初期値として設定する手順と、上記符号化が行われるたびに上記仮想バッファの占有量を更新する手順と、上記更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する手順と、上記後続チャプタの動画像信号に基づいて所定の目標符号量を算出する手順と、上記仮想バッファの占有量に上記目標符号量を加えた総量が上記最適占有量を超えないように上記目標符号量を調整して上記符号化に供するために、上記仮想バッファの占有量に上記目標符号量を加えた総量が上記最適占有量を超える場合には上記最適占有量から上記仮想バッファの占有量を減じた値を上記目標符号量とする手順とをコンピュータに実行させるものである。これにより、後続チャプタのための仮想バッファの占有量の初期値を設定するにあたって、先行チャプタによる仮想バッファの占有量の状態を引き継がせて、仮想バッファに破綻をきたさずにチャプタ間のシームレス接続を行うことができるという作用をもたらす。
本発明によれば、VBVバッファに破綻をきたさずにチャプタ間のシームレス接続を行うことができるという優れた効果を奏し得る。
次に本発明の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の実施の形態における動画像符号化装置の構成例を示す図である。この動画像符号化装置は、動画像信号を符号化するビデオエンコーダ100と、音声信号を符号化するオーディオエンコーダ200と、ビデオエンコーダ100およびオーディオエンコーダ200の出力を多重化するマルチプレクサ300と、マルチプレクサ300により多重化されたストリームデータを記録媒体490に記録する媒体記録部400と、ビデオエンコーダ100における符号化を制御する符号化制御部500とを備えている。
符号化制御部500は、プロセッサ510と、ROM520と、RAM530と、入出力インターフェース540と、これらを相互に接続するバス550とを備えている。プロセッサ510は、ビデオエンコーダ100において符号化されたデータ量である発生符号量を信号線179によって受け取り、次のピクチャを符号化する際の目標データ量である目標符号量に合致した量子化インデックスを決定して信号線159により出力する。ROM520は、プロセッサ510により実行されるプログラムや各種パラメータ等を保持するメモリであり、例えば、フラッシュメモリ等のEPROMにより実現される。RAM530は、プロセッサ510におけるプログラム実行に必要な作業データ等を保持するメモリであり、例えばSRAMやDRAM等により実現される。入出力インターフェース540は、外部とのデータのやり取りを行うものであり、例えば、ROM520内のプログラムを更新する等のために使用される。
図2は、本発明の実施の形態におけるビデオエンコーダ100の構成例を示す図である。このビデオエンコーダ100は、信号線101を介して入力された動画像信号を符号化して信号線199を介して出力するものであり、並べ替え回路111と、走査変換回路112と、動き検出回路121と、動き補償回路122と、減算器131と、加算器132と、DCT回路141と、逆DCT回路142と、量子化回路151と、逆量子化回路152と、符号化器161と、バッファメモリ171とを備えている。
並べ替え回路111は、信号線101を介して入力された動画像信号の各ピクチャを符号化の順序に従って並べ替えて走査変換回路112に供給する。走査変換回路112は、供給されたピクチャのデータがフレーム構造であるかフィールド構造であるかを判別し、供給されたピクチャのデータに対して判別結果に対応した走査変換の処理を施した後にマクロブロックのデータにマクロブロック化して動き検出回路121および減算器131にそれぞれ出力する。
動き検出回路121は、走査変換回路112の出力データに基づいて、動きベクトルを検出して動き補償回路122に供給する。動き補償回路122は、動き検出回路121から供給された動きベクトルに基づいて、動き補償回路122内に予め記憶されている画像データのうち、減算器131に供給されたマクロブロックのデータに対応する画像データを読み出し、予測画像データとして減算器131および加算器132に供給する。
減算器131は、走査変換回路112から供給されたマクロブロックのデータがIピクチャであればそのままDCT回路141に供給し、PピクチャまたはBピクチャであればそのマクロブロックのデータから動き補償回路122より供給された予測画像データを減算したデータをDCT回路141に供給する。
DCT回路141は、減算器131から供給されたデータに対してDCT(Discrete Consign Transform:離散コサイン変換)処理を施してDCT係数に変換する。量子化回路151は、DCT回路141からのDCT係数を、符号化制御部500から信号線159により供給された量子化インデックスに基づいて量子化して、符号化器161および逆量子化回路152に供給する。符号化器161は、量子化されたデータを可変長符号化してバッファメモリ171に格納する。バッファメモリ171は、格納された可変長符号をピクチャ単位のデータに変換し、ビットストリームデータとして信号線199に出力する。また、ピクチャ全体の可変長符号の発生量を発生符号量として信号線179により符号化制御部500に供給する。
逆量子化回路152は、量子化回路151から供給された量子化されたデータを逆量子化する。逆DCT回路142は、逆量子化回路152により逆量子化されたデータに逆DCT処理を施して加算器132に供給する。加算器132は、逆DCT回路142から供給されたデータと動き補償回路122から供給された予測画像データとを加算して元の画像データに戻し、これを、次以降に符号化されるマクロブロックの画像データに対応する予測画像データを生成するために動き補償回路122に供給する。
図3は、MPEG−2規格におけるVBVバッファのモデルを示す図である。MPEG−2規格では、得られるビットストリームデータを適切に伝送し、復号するために、エンコーダとデコーダとの間にVBVバッファと呼ばれる仮想バッファを想定して、このVBVバッファがオーバフローしないようにエンコードを行う。エンコーダによる発生符号量と出力先への転送符号量との差異が、このVBVバッファ内に存在するデータ量(「占有量」という。)となる。このVBVバッファの最大量は224KBと定義されている。但し、このVBVバッファはあくまでも仮想的なものであり、実際にそのようなバッファが存在するとは限らない。
VBVバッファをエンコーダ側から見ると、図3(a)のようにビデオエンコーダ100の出力側にVBVバッファ701が接続され、ビデオエンコーダ100からVBVバッファ701へのデータの転送は理論上、瞬時に行われるものとする。そして、VBVバッファ701からの出力は、VBVバッファ701にデータが存在する場合には転送速度Rmaxで、VBVバッファ701にデータが存在しない場合には転送速度0で行われるものとする。これにより、VBVバッファ701の占有量を把握し、この占有量がVBVバッファ701の最大量を上回らないように(オーバフローしないように)ビデオエンコーダ100の動作を制御する。
一方、VBVバッファをデコーダ側から見ると、図3(b)のようにビデオデコーダ900の入力側にVBVバッファ709が接続され、VBVバッファ709からビデオデコーダ900へのデータの転送は理論上、瞬時に行われるものとする。そして、VBVバッファ709への入力は、転送速度Rmaxまたは転送速度0で行われるものとする。この場合、VBVバッファ709の最大量を上回らないように転送するとともに、ビデオデコーダ900におけるデコードタイミングに間に合うように転送しなければならない。ビデオデコーダ900におけるデコードタイミングに間に合わないと、VBVバッファ709においてアンダフローを生じることになる。
図4は、エンコーダ側VBVバッファ701の占有量の遷移例を示す図である。縦軸はVBVバッファの占有量、横軸は時間をそれぞれ表している。縦軸の占有量は下向きに表示されており、下方にいく程占有量が多いことを意味する。なお、このVBVバッファ701の最大量は224KBとなっている。
なお、ここで、Tはピクチャの発生周期、すなわち、フレームレートの逆数を示す。また、nは任意のピクチャのピクチャ番号を示す整数である。また、PはX番目のピクチャの実際の符号発生量であり、BはX番目のピクチャの符号化直前のVBVバッファの占有量を表す。
ビデオエンコーダ100は、入力された動画像信号をピクチャ番号の順に従って符号化する。第0番目のピクチャが符号化された直後(時刻0)に、VBVバッファ701に発生符号量Pが瞬時に転送され、VBVバッファの占有量がB+Pとなる。続いて、次の第1番目のピクチャの符号化が終了するまでの間は、VBVバッファ701から転送速度Rmaxで符号の送出が行われて、VBVバッファ701の占有量が時間とともに減少していく。
第1番目のピクチャが符号化される直前(時刻T)になると、VBVバッファ701の占有量がBとなり、そこに発生符号量Pの第1番目のピクチャが瞬時に転送される。この結果、時刻Tでは、VBVバッファ701の占有量がB+Pとなる。
以下、同様にVBVバッファ701からの転送と、符号化されたピクチャの符号のVBVバッファへ701の格納とが続き、第n番目のピクチャが符号化される直前(時刻n×T)となると、VBVバッファの占有量がB(=Bn−1+Pn−1)となり、そこに符号量Pの第n番目のピクチャが瞬時に転送される。この結果、時刻n×Tでは、VBVバッファ701の占有量がB+Pとなる。
ここで、符号の送出量が送入量を上回ると、時刻Tに示されるようにVBVバッファ701の占有量が0になり、VBVバッファ701からのデータの送出が行われなくなる。DVDに記録する場合、このようにエンコーダ側でVBVバッファ701のアンダフローが発生することは許容される。しかしながら、DVDに記録する場合であっても、VBVバッファ701のオーバフローは許容されない。従って、このVBVバッファ701がオーバフローしないように、ビデオエンコーダ100側で制御を行う必要がある。
図5は、デコーダ側VBVバッファ709の占有量の遷移例を示す図である。縦軸はVBVバッファの占有量、横軸は時間をそれぞれ表している。図4と異なり、縦軸の占有量は上向きに表示されており、上方にいく程占有量が多いことを意味する。
このVBVバッファ709には、ビットストリーム中にビデオストリームが存在する様態で転送速度Rmaxで符号の格納が行われ、ビットストリーム中にビデオストリームが存在しないときには格納は行われない。また、VBVバッファ709からビデオデコーダ900への流出は各ピクチャのデコード開始タイミングで瞬時に行われる。
図5(a)に示されるように、チャプタ間をシームレスに接続しない場合には、先行チャプタと後続チャプタとの間には、デコード後の画像に切れ目を生じる。この場合、先行チャプタの発生符号によるVBVバッファ709の占有量がゼロになった後で、後続チャプタの発生符号が流入するため、チャプタ間でVBVバッファ709の干渉を考慮する必要がない。
しかし、図5(b)に示すように、チャプタ間をシームレスに接続する場合には、先行チャプタによるVBVバッファ709の占有量がゼロになる前に、後続チャプタの発生符号が流入するため、VBVバッファ709の初期値としては先行チャプタによるVBVバッファ709の占有量を引き継いで計算する必要がある。先行チャプタによるVBVバッファ709の占有量が多く残存している段階で後続チャプタの発生符号の流入を開始してしまうと、VBVバッファ709がオーバフローを生じるおそれがある。
一方で、VBVバッファ709に十分な量の符号が溜まっていない段階でデコードのための流出を行おうとすると、VBVバッファ709がアンダフローを生じるおそれがある。例えば、図5(b)で後続チャプタにおける先頭ピクチャ(I2)をデコードするために必要な符号量を瞬時に引き抜く際、もしVBVバッファ709に十分な量の符号が溜まっていない場合には、デコードに必要なデータが得られないため、シームレス接続はできなくなる。事前に十分な量の符号を溜めておくには、後続チャプタのビットストリームの転送をなるべく早く開始する必要があるが、先行チャプタの転送が終了してから後続チャプタの転送を開始しなければならないという制約があるため、これにも限界がある。
そこで、本発明の実施の形態では、このようなVBVバッファに関する条件を遵守した上でチャプタ間のシームレス接続を可能にするため、以下のように後続チャプタの発生符号量を制限しながらエンコードを行う。なお、ここで説明したVBVバッファ701および709は表裏一体の関係にあるため、以下の説明ではVBVバッファ701を前提として説明する。
図6は、本発明の実施の形態における符号化制御部500のプロセッサ510の機能構成例を示す図である。この機能構成例は、記録モード判別部511と、占有量更新部512と、最適占有量算出部513と、目標符号量算出部514と、目標符号量調整部515と、量子化インデックス決定部516とを備えている。なお、この例では、ROM520に保持されたプログラムに従ってプロセッサ510が各機能を実現することを想定しているが、これらの機能はハードウェアにより実現してもよい。
記録モード判別部511は、チャプタ間のシームレス接続が可能か否かを判別する。シームレス接続の条件としては、シームレス接続をしようとする後続チャプタがその属するタイトルの先頭チャプタでないこと、先行チャプタの最終VOBの再生時間が1.5秒未満でないこと、メディア上の配置に起因するシーク時間が許容範囲内であること、等がある。記録モード判別部511により判別されたシームレス接続の有無は、DVDのデータ記憶領域におけるVTSI(Video Title Set Information)のPGCI(ProGram Chain Information)におけるC_PBIT(Cell PlayBack Information Table)内のシームレス・プレイバック・フラグ(seamless playback flag)に反映される。すなわち、シームレス接続を行う場合には後続チャプタのシームレス・プレイバック・フラグがオンに設定され、シームレス接続を行わない場合には後続チャプタのシームレス・プレイバック・フラグがオフに設定される。
また、記録モード判別部511は、シームレス接続可能であると判断した場合、RAM530(またはROM520)に保持されたVBVバッファの直前の占有量をVBVバッファの初期値として設定する。一方、シームレス接続可能でないと判断した場合には、VBVバッファの初期値としてゼロを設定する。このVBVバッファの初期値は、図4における占有量「B」に相当する。このようにして設定されたVBVバッファの初期値は、占有量更新部512に供給される。
占有量更新部512は、ビデオエンコーダ100のバッファメモリ171から供給された発生符号量に基づいてVBVバッファの占有量を更新する。例えば、図4における「B+P」を直前のタイミングとすると、「B+P」から「B」に至る転送符号量を減じて、さらに発生符号量「P」を加える。
この場合、転送速度Rmaxを9.3Mbpsと仮定し、画面方式としてNTSC(National Television Standards Committee)方式を仮定すると、NTSCのフレーム周波数は
(1000/1001×30)=29.97Hz
であることから、1周期毎の転送符号量は、
9.3Mbps/29.97Hz=310.31Kビット
となる。
この転送符号量を減じた際、図4のTxにおける事象のように、VBVバッファが空になった場合には、それ以上の転送はできないのでその時点での占有量はゼロとなる。そして、その占有量に発生符号量を加えた値が新たな占有量となる。このようにして更新された占有量はRAM530(またはROM520)に保持されるとともに、最適占有量算出部513に供給される。
最適占有量算出部513は、次のピクチャの符号化を行った際のVBVバッファの最適占有量を算出する。この最適占有量は、次のピクチャの符号化を行った結果としてVBVバッファの占有量がどれ位になるのが理想的であるかを示す指標であり、この値よりもVBVバッファの占有量が大きくなると、VBVバッファがオーバフローする可能性が非常に高くなることを意味する。この最適占有量は、次のような関数B=VBV(B)により求められることが実験データにより実証されている。この関数VBVを利用することにより、早いタイミングでVBVバッファの占有量をビットレートに反映させることができ、この結果、急峻な画像劣化を抑制することができる。ここで、Bは第x番目のピクチャを符号化する前のVBVバッファの使用量を意味し、Bは第x番目のピクチャを符号化した後のVBVバッファの最適占有量を意味する。
特徴1:B=VBV(B)は、Bの区間[0,Bmax]で、Bに対する単調増加関数である。
特徴2:関数{B=B}と関数{B=VBV(B)−(Rmax×T)}とは、Bの区間[0,Bmax]ではB=Bth(ただし、0<Bth<Bmax)で交わる。
特徴3:B≦Bthである場合には{VBV(B)−(Rmax×T)}≧Bであり、B>Bthである場合には{VBV(B)−(Rmax×T)}<Bである。
図7に以上のような3つの特徴を有するVBV関数の一例を示す。このVBV関数は、Bが[0,Bth]の区間ではBが所定の値(Bth以上の値)で一定となっており、Bが[Bth,Bmax]の区間ではBが増加率1未満の割合で徐々に増加している。
図6において、最適占有量算出部513は、このようにして得たVBVバッファの最適占有量を目標符号量調整部515に供給する。
目標符号量算出部514は、シームレス接続を行おうとする後続チャプタの動画像信号に基づいて目標符号量を算出する。この目標符号量を算出するにあたっては、種々のモデルが提案されており、ここでは、一例として公知のTM5方式を想定する。このTM5方式は、MPEG−2の符号量制御のモデルとして提案されているものであり(ISO/IEC JTC1/SC29/WG11, MPEG93/457, "Test Model 5," 1993. 参照)、ピクチャタイプに応じてそれぞれの符号量の配分を決定するものである。
目標符号量調整部515は、目標符号量算出部514により算出された目標符号量と最適占有量算出部513により算出された最適占有量とを参照して、現在の占有量に目標符号量を加えた値が最適占有量を超えていないかどうか判断する。そして、もし超えているようであれば、最適占有量から現在の占有量を引いた値が目標符号量になるように目標符号量を調整する。このようにして調整された目標符号量は、量子化インデックス決定部516に供給される。
量子化インデックス決定部516は、ビデオエンコーダ100における発生符号量が目標符号量調整部515から供給された目標符号量となるように、量子化回路151における量子化特性値に対応する量子化インデックスを決定する。この量子化インデックスは信号線159を介して量子化回路151に供給される。
次に本発明の実施の形態における動画像符号化装置の動作について図面を参照して説明する。
図8は、本発明の実施の形態における動画像符号化装置の処理例を示す流れ図である。後続のチャプタを符号化するに先立って、記録モード判別部511は、記録モードとしてシームレス接続を行うべきか否かを判別する(ステップS901)。そして、シームレス接続を行う場合には(ステップS902)、RAM530(またはROM520)に保持されたVBVバッファの直前の占有量をVBVバッファの初期値として設定する(ステップS903)。一方、シームレス接続を行わない場合には(ステップS902)、VBVバッファの初期値としてゼロを設定する(ステップS904)。
記録モード判別部511による準備が整った後、後続チャプタの動画像信号はビデオエンコーダ100によって1ピクチャ(フレーム)ずつエンコードされる(ステップS905)。そして、1ピクチャ分のエンコードが終了する度にVBVバッファに関する制御が行われる(ステップS906)。後続チャプタの全てのピクチャ(フレーム)のエンコードが完了するまで、このステップS905およびS906が繰り返される(ステップS907)。
図9は、本発明の実施の形態におけるVBVバッファに関する制御(ステップS906)の処理例を示す流れ図である。図8から明らかなように、このVBVバッファに関する制御は1ピクチャ(フレーム)分のエンコードが行われる度に実行される。
1ピクチャ分のエンコードが終了すると、まず占有量更新部512によりVBVバッファの占有量に関する情報が更新される(ステップS911)。これにより、エンコード直後のVBVバッファの占有量が把握される。この処理内容については図10により後述する。
そして、最適占有量算出部513により、次のエンコード後のVBVバッファの最適占有量が算出される(ステップS912)。この最適占有量は、例えば、前述のVBV関数により算出することができる。また、目標符号量算出部514により、次のエンコードにおける目標符号量が算出される(ステップS913)。この目標符号量は、例えば、公知のTM5方式により算出することができる。
そして、目標符号量調整部515は、ステップS911において把握されたVBVバッファの現在の占有量とステップS913において算出された目標符号量とを加算した値がステップS912において算出された最適占有量を超えているか否かを判断し(ステップS914)、超えている場合には最適占有量から現在の占有量を引いた値を目標符号量とすべく調整する(ステップS915)。
このようにして調整された目標符号量に基づいて、量子化インデックス決定部516は量子化インデックスを決定する(ステップS916)。この量子化インデックスは、ビデオエンコーダ100の量子化回路151に供給される。
図10は、本発明の実施の形態におけるVBVバッファの占有量に関する情報の更新(ステップS911)の処理例を示す流れ図である。まず、VBVバッファにおける直前の占有量から一周期分の転送符号量が減算される。このとき、減算前の占有量と一周期分の転送符号量(上述の例では、310.31Kビット)とが比較され(ステップS921)、減算前の占有量の方が大きければそのまま減算した結果が新たな占有量となり(ステップS922)、そうでなければVBVバッファはアンダフローするので新たな占有量はゼロとなる(ステップS923)。
そして、この新たな占有量に対してさらにビデオエンコーダ100における発生符号量が加算される(ステップS924)。この加算後の占有量がVBVバッファの最大量を超えてしまう場合には(ステップS925)、オーバフローするので新たな占有量はVBVバッファの最大量となる(ステップS926)。
このように、本発明の実施の形態によれば、記録モード判別部511によりチャプタ間のシームレス接続を行うか否かを判別し、その判別結果によってVBVバッファの初期値を予め設定しておいて、シームレス接続する後続チャプタの発生符号量を符号化制御部500により制御することによって、VBVバッファに破綻をきたさないシームレス接続を実現することができる。
なお、本発明の実施の形態は本発明を具現化するための一例を示したものであり、以下に示すように特許請求の範囲における発明特定事項とそれぞれ対応関係を有するが、これに限定されるものではなく本発明の要旨を逸脱しない範囲において種々の変形を施すことができる。
すなわち、請求項1において、仮想バッファは例えばVBVバッファ701に対応する。また、記録モード判別手段は例えば記録モード判別部511に対応する。また、占有量更新手段は例えば占有量更新部512に対応する。また、最適占有量算出手段は例えば最適占有量算出部513に対応する。また、目標符号量算出手段は例えば目標符号量算出部514に対応する。また、目標符号量調整手段は例えば目標符号量調整部515に対応する。また、符号化手段は例えばビデオエンコーダ100に対応する。
また、請求項5において、仮想バッファは例えばVBVバッファ701に対応する。また、記録モード判別手段は例えば記録モード判別部511に対応する。また、占有量更新手段は例えば占有量更新部512に対応する。また、最適占有量算出手段は例えば最適占有量算出部513に対応する。また、目標符号量算出手段は例えば目標符号量算出部514に対応する。
また、請求項またはにおいて、仮想バッファは例えばVBVバッファ701に対応する。また、少なくとも後続チャプタがタイトルの先頭チャプタか否かを判別することによって先行チャプタと後続チャプタとの間でシームレス接続が可能か否を判別する手順は例えばステップS901に対応する。また、シームレス接続が可能であれば後続チャプタの動画像信号が仮想バッファに転送される直前の仮想バッファの占有量を仮想バッファの占有量の初期値とし、シームレス接続が不可能であればゼロを仮想バッファの占有量の初期値として設定する手順は例えばステップS902乃至S904に対応する。また、符号化が行われるたびに前記仮想バッファの占有量を更新する手順は例えばステップS911に対応する。また、更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する手順は例えばステップS912に対応する。また、後続チャプタの動画像信号に基づいて所定の目標符号量を算出する手順は例えばステップS913に対応する。また、仮想バッファの占有量に目標符号量を加えた総量が最適占有量を超えないように目標符号量を調整して符号化に供するために、前記仮想バッファの占有量に前記目標符号量を加えた総量が前記最適占有量を超える場合には前記最適占有量から前記仮想バッファの占有量を減じた値を前記目標符号量とする手順は例えばステップS914およびS915に対応する。
なお、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。
本発明の活用例として、例えば動画像信号をMPEG−2形式に符号化してDVDに書込みを行う際に本発明を適用することができる。
本発明の実施の形態における動画像符号化装置の構成例を示す図である。 本発明の実施の形態におけるビデオエンコーダ100の構成例を示す図である。 MPEG−2規格におけるVBVバッファのモデルを示す図である。 エンコーダ側VBVバッファ701の占有量の遷移例を示す図である。 デコーダ側VBVバッファ709の占有量の遷移例を示す図である。 本発明の実施の形態における符号化制御部500のプロセッサ510の機能構成例を示す図である。 本発明における関数VBVの一例を示す図である。 本発明の実施の形態における動画像符号化装置の処理例を示す流れ図である。 本発明の実施の形態におけるVBVバッファに関する制御の処理例を示す流れ図である。 本発明の実施の形態におけるVBVバッファの占有量に関する情報の更新の処理例を示す流れ図である。
符号の説明
100 ビデオエンコーダ
101、159、179、199 信号線
111 並べ替え回路
112 走査変換回路
121 動き検出回路
122 動き補償回路
131 減算器
132 加算器
141 DCT回路
142 逆DCT回路
151 量子化回路
152 逆量子化回路
161 符号化器
171 バッファメモリ
200 オーディオエンコーダ
300 マルチプレクサ
400 媒体記録部
490 記録媒体
500 符号化制御部
510 プロセッサ
511 記録モード判別部
512 占有量更新部
513 最適占有量算出部
514 目標符号量算出部
515 目標符号量調整部
516 量子化インデックス決定部
520 ROM
530 RAM
540 入出力インターフェース
550 バス
701、709 VBVバッファ
900 ビデオデコーダ

Claims (7)

  1. 先行チャプタおよび後続チャプタを含む動画像信号を符号化し、その発生符号量と出力先への転送符号量とにより規定される仮想バッファの占有量に応じて前記符号化を制御する動画像符号化装置であって、
    少なくとも前記後続チャプタがタイトルの先頭チャプタか否かを判別することによって前記先行チャプタと前記後続チャプタとの間でシームレス接続が可能か否を判別し、前記シームレス接続が可能であれば前記後続チャプタの動画像信号が前記仮想バッファに転送される直前の前記仮想バッファの占有量を前記仮想バッファの占有量の初期値とし、前記シームレス接続が不可能であればゼロを前記仮想バッファの占有量の初期値として設定する記録モード判別手段と、
    前記符号化が行われるたびに前記仮想バッファの占有量を更新する占有量更新手段と、
    前記更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する最適占有量算出手段と、
    前記後続チャプタの動画像信号に基づいて所定の目標符号量を算出する目標符号量算出手段と、
    前記仮想バッファの占有量に前記目標符号量を加えた総量が前記最適占有量を超えないように前記目標符号量を調整するために、前記仮想バッファの占有量に前記目標符号量を加えた総量が前記最適占有量を超える場合には前記最適占有量から前記仮想バッファの占有量を減じた値を前記目標符号量とする目標符号量調整手段と、
    前記調整された目標符号量に従って前記符号化を行う符号化手段と
    を具備することを特徴とする動画像符号化装置。
  2. 前記占有量更新手段は、前記占有量が前記転送符号量より多い場合には前記占有量から前記転送符号量を減じて前記発生符号量を加えた値であって前記仮想バッファの最大値を超えない値を新たな占有量とし、前記占有量が前記転送符号量以下の場合には前記発生符号量を新たな占有量とする
    ことを特徴とする請求項記載の動画像符号化装置。
  3. 前記最適占有量算出手段は、前記更新された仮想バッファの占有量が大きいほど大きいもしくは等しい値を前記最適占有量として算出する
    ことを特徴とする請求項記載の動画像符号化装置。
  4. 前記更新された仮想バッファの占有量は、不揮発性メモリに保持されることを特徴とする請求項1記載の動画像符号化装置。
  5. 先行チャプタおよび後続チャプタを含む動画像信号の符号化における発生符号量と出力先への転送符号量とにより規定される仮想バッファの占有量に応じて前記符号化を制御する動画像符号化制御装置であって、
    少なくとも前記後続チャプタがタイトルの先頭チャプタか否かを判別することによって前記先行チャプタと前記後続チャプタとの間でシームレス接続が可能か否を判別し、前記シームレス接続が可能であれば前記後続チャプタの動画像信号が前記仮想バッファに転送される直前の前記仮想バッファの占有量を前記仮想バッファの占有量の初期値とし、前記シームレス接続が不可能であればゼロを前記仮想バッファの占有量の初期値として設定する記録モード判別手段と、
    前記符号化が行われるたびに前記仮想バッファの占有量を更新する占有量更新手段と、
    前記更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する最適占有量算出手段と、
    前記後続チャプタの動画像信号に基づいて所定の目標符号量を算出する目標符号量算出手段と、
    前記仮想バッファの占有量に前記目標符号量を加えた総量が前記最適占有量を超えないように前記目標符号量を調整して前記符号化に供するために、前記仮想バッファの占有量に前記目標符号量を加えた総量が前記最適占有量を超える場合には前記最適占有量から前記仮想バッファの占有量を減じた値を前記目標符号量とする目標符号量調整手段と
    を具備することを特徴とする動画像符号化制御装置。
  6. 先行チャプタおよび後続チャプタを含む動画像信号の符号化における発生符号量と出力先への転送符号量とにより規定される仮想バッファの占有量に応じて前記符号化を制御する動画像符号化制御方法であって、
    少なくとも前記後続チャプタがタイトルの先頭チャプタか否かを判別することによって前記先行チャプタと前記後続チャプタとの間でシームレス接続が可能か否を判別する手順と、
    前記シームレス接続が可能であれば前記後続チャプタの動画像信号が前記仮想バッファに転送される直前の前記仮想バッファの占有量を前記仮想バッファの占有量の初期値とし、前記シームレス接続が不可能であればゼロを前記仮想バッファの占有量の初期値として設定する手順と、
    前記符号化が行われるたびに前記仮想バッファの占有量を更新する手順と、
    前記更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する手順と、
    前記後続チャプタの動画像信号に基づいて所定の目標符号量を算出する手順と、
    前記仮想バッファの占有量に前記目標符号量を加えた総量が前記最適占有量を超えないように前記目標符号量を調整して前記符号化に供するために、前記仮想バッファの占有量に前記目標符号量を加えた総量が前記最適占有量を超える場合には前記最適占有量から前記仮想バッファの占有量を減じた値を前記目標符号量とする手順と
    を具備することを特徴とする動画像符号化制御方法。
  7. 先行チャプタおよび後続チャプタを含む動画像信号の符号化における発生符号量と出力先への転送符号量とにより規定される仮想バッファの占有量に応じて前記符号化を制御するプログラムであって、
    少なくとも前記後続チャプタがタイトルの先頭チャプタか否かを判別することによって前記先行チャプタと前記後続チャプタとの間でシームレス接続が可能か否を判別する手順と、
    前記シームレス接続が可能であれば前記後続チャプタの動画像信号が前記仮想バッファに転送される直前の前記仮想バッファの占有量を前記仮想バッファの占有量の初期値とし、前記シームレス接続が不可能であればゼロを前記仮想バッファの占有量の初期値として設定する手順と、
    前記符号化が行われるたびに前記仮想バッファの占有量を更新する手順と、
    前記更新された仮想バッファの占有量に基づいて所定の最適占有量を算出する手順と、
    前記後続チャプタの動画像信号に基づいて所定の目標符号量を算出する手順と、
    前記仮想バッファの占有量に前記目標符号量を加えた総量が前記最適占有量を超えないように前記目標符号量を調整して前記符号化に供するために、前記仮想バッファの占有量に前記目標符号量を加えた総量が前記最適占有量を超える場合には前記最適占有量から前記仮想バッファの占有量を減じた値を前記目標符号量とする手順と
    をコンピュータに実行させることを特徴とするプログラム。
JP2003369388A 2003-10-29 2003-10-29 動画像符号化装置および動画像符号化制御方法 Expired - Fee Related JP3675464B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2003369388A JP3675464B2 (ja) 2003-10-29 2003-10-29 動画像符号化装置および動画像符号化制御方法
US10/538,086 US7835436B2 (en) 2003-10-29 2004-10-29 Video-encoding device and video-encoding control method
CN2004800017539A CN1723709B (zh) 2003-10-29 2004-10-29 视频编码设备和视频编码控制设备及其方法
TW93133072A TWI264227B (en) 2003-10-29 2004-10-29 Video-encoding and video-encoding control method
EP04793392A EP1583365A4 (en) 2003-10-29 2004-10-29 VIDEO CODIER AND VIDEO PROCESS CONTROL
KR20057011846A KR101091418B1 (ko) 2003-10-29 2004-10-29 동화상 부호화 장치 및 동화상 부호화 제어 방법
PCT/JP2004/016472 WO2005041582A1 (ja) 2003-10-29 2004-10-29 動画像符号化装置および動画像符号化制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003369388A JP3675464B2 (ja) 2003-10-29 2003-10-29 動画像符号化装置および動画像符号化制御方法

Publications (2)

Publication Number Publication Date
JP2005136633A JP2005136633A (ja) 2005-05-26
JP3675464B2 true JP3675464B2 (ja) 2005-07-27

Family

ID=34510387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003369388A Expired - Fee Related JP3675464B2 (ja) 2003-10-29 2003-10-29 動画像符号化装置および動画像符号化制御方法

Country Status (7)

Country Link
US (1) US7835436B2 (ja)
EP (1) EP1583365A4 (ja)
JP (1) JP3675464B2 (ja)
KR (1) KR101091418B1 (ja)
CN (1) CN1723709B (ja)
TW (1) TWI264227B (ja)
WO (1) WO2005041582A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007129684A1 (ja) 2006-05-10 2007-11-15 Sony Corporation 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
WO2007129683A1 (ja) 2006-05-10 2007-11-15 Sony Corporation 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US8873641B2 (en) 2007-06-19 2014-10-28 Panasonic Corporation Moving picture coding apparatus

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1926104B1 (en) * 2006-11-27 2016-06-29 Thomson Licensing Encoding device, decoding device, recording device, audio/video data transmission system
JP4900945B2 (ja) 2007-01-18 2012-03-21 キヤノン株式会社 記録装置、及び記録方法
JP5046907B2 (ja) * 2007-12-17 2012-10-10 キヤノン株式会社 記録装置、その制御方法、プログラム
JP2010103969A (ja) * 2008-09-25 2010-05-06 Renesas Technology Corp 画像復号方法、画像復号装置、画像符号化方法及び画像符号化装置
CN102318345B (zh) * 2009-02-27 2014-07-30 富士通株式会社 动态图像编码装置、动态图像编码方法
JP2011151784A (ja) 2009-12-25 2011-08-04 Panasonic Corp 動画像多重化装置、映像音声記録装置及び動画像多重化方法
JP5685075B2 (ja) * 2010-12-24 2015-03-18 キヤノン株式会社 記録装置、記録方法およびプログラム
WO2012140821A1 (ja) 2011-04-12 2012-10-18 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号化方法、動画像復号化装置、および動画像符号化復号化装置
JP2012244542A (ja) * 2011-05-23 2012-12-10 Sony Corp 符号化装置、符号化方法、及びプログラム
KR102126486B1 (ko) 2011-05-24 2020-06-25 벨로스 미디어 인터내셔널 리미티드 화상 부호화 방법, 화상 부호화 장치, 화상 복호 방법, 화상 복호 장치, 및, 화상 부호화 복호 장치
CA3197949A1 (en) 2011-05-27 2012-12-06 Sun Patent Trust Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and image coding and decoding apparatus
US9485518B2 (en) 2011-05-27 2016-11-01 Sun Patent Trust Decoding method and apparatus with candidate motion vectors
CA2834191C (en) 2011-05-31 2019-04-09 Panasonic Corporation Video encoding method, video encoding device, video decoding method, video decoding device, and video encoding/decoding device
SG194746A1 (en) 2011-05-31 2013-12-30 Kaba Gmbh Image encoding method, image encoding device, image decoding method, image decoding device, and image encoding/decoding device
PL2728878T3 (pl) 2011-06-30 2020-06-15 Sun Patent Trust Sposób dekodowania obrazów, sposób kodowania obrazów, urządzenie do dekodowania obrazów, urządzenie do kodowania obrazów oraz urządzenie do kodowania/dekodowania obrazów
MX347793B (es) 2011-08-03 2017-05-12 Panasonic Ip Corp America Metodo de codificacion de video, aparato de codificacion de video, metodo de decodificacion de video, aparato de decodificacion de video y aparato de codificacion/ decodificacion de video.
BR112014008403B1 (pt) 2011-10-19 2022-05-10 Sun Patent Trust Método de codificação de imagem, aparelho de codificação de imagem, método de decodificação de imagem, e aparelho de decodificação de imagem
TWI513199B (zh) * 2012-06-29 2015-12-11 Sony Corp 編碼設備、編碼方法、解碼設備、及解碼方法
JP2017168878A (ja) * 2016-03-14 2017-09-21 ルネサスエレクトロニクス株式会社 半導体装置、符号化制御方法及びカメラ装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9424436D0 (en) 1994-12-02 1995-01-18 Philips Electronics Video editing buffer management
GB9424437D0 (en) * 1994-12-02 1995-01-18 Philips Electronics Uk Ltd Encoder system level buffer management
TW385431B (en) * 1995-09-29 2000-03-21 Matsushita Electric Industrial Co Ltd A method and an apparatus for encoding a bitstream with plural possible searching reproduction paths information useful in multimedia optical disk
TW303570B (ja) * 1995-09-29 1997-04-21 Matsushita Electric Industrial Co Ltd
WO1998021722A1 (en) * 1996-11-13 1998-05-22 Matsushita Electric Industrial Co., Ltd. Apparatus and method of generating bit stream for information recording disc storage which enables seamless reproduction of a plurality of pieces of image information, and recording medium on which program applied to the generating apparatus is recorded
JPH114445A (ja) 1997-06-11 1999-01-06 Sony Corp 画像符号化装置および方法
KR100604631B1 (ko) * 1997-07-25 2006-07-28 소니 가부시끼 가이샤 편집 장치, 편집 방법, 재부호화 장치, 재부호화 방법,스플라이싱 장치 및 스플라이싱 방법
JPH11155131A (ja) 1997-09-17 1999-06-08 Matsushita Electric Ind Co Ltd ビデオデータ編集装置、ビデオデータ編集装置が編集媒体として用いる光ディスク、編集プログラムを記録したコンピュータ読み取り可能な記録媒体
KR100532738B1 (ko) * 1997-09-17 2005-12-01 마츠시타 덴끼 산교 가부시키가이샤 비디오 데이터 편집장치, 비디오 데이터 편집장치의 기록매체로서 이용하기 위한 광디스크 및 편집 프로그램을 저장한 컴퓨터 판독가능한 기록매체
JP3649266B2 (ja) 1997-10-03 2005-05-18 ソニー株式会社 データ多重化装置および方法、並びに記録媒体
JP3837889B2 (ja) * 1997-12-29 2006-10-25 ソニー株式会社 エンコード方法およびエンコード装置
JP3997367B2 (ja) * 1998-04-30 2007-10-24 ソニー株式会社 記録再生装置および方法、並びに記録媒体
US6567554B1 (en) * 1999-03-12 2003-05-20 Victor Company Of Japan, Limited Data coding method and apparatus therefor
JP4369604B2 (ja) * 1999-09-20 2009-11-25 パナソニック株式会社 シームレス再生に適した光ディスク記録装置、再生装置及び記録方法
EP1085513B1 (en) 1999-09-20 2012-12-05 Panasonic Corporation Optical disc recording apparatus, and optical disc recording method that are all suitable for seamless reproduction
US6493388B1 (en) * 2000-04-19 2002-12-10 General Instrument Corporation Rate control and buffer protection for variable bit rate video programs over a constant rate channel
JP3889552B2 (ja) * 2000-06-09 2007-03-07 パイオニア株式会社 符号量割り当て装置および方法
US7292782B2 (en) * 2000-09-27 2007-11-06 Victor Company Of Japan, Limited MPEG picture data recording apparatus, MPEG picture data recording method, MPEG picture data recording medium, MPEG picture data generating apparatus, MPEG picture data reproducing apparatus, and MPEG picture data reproducing method
US6694060B2 (en) 2000-12-21 2004-02-17 General Instrument Corporation Frame bit-size allocation for seamlessly spliced, variable-encoding-rate, compressed digital video signals
EP1372113B1 (en) * 2002-06-11 2005-10-19 STMicroelectronics S.r.l. Variable bit rate video encoding method and device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007129684A1 (ja) 2006-05-10 2007-11-15 Sony Corporation 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
WO2007129683A1 (ja) 2006-05-10 2007-11-15 Sony Corporation 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US8290340B2 (en) 2006-05-10 2012-10-16 Sony Corporation Information processing apparatus, information processing method, and computer program
US8364016B2 (en) 2006-05-10 2013-01-29 Sony Corporation Information processing apparatus, information processing method, and computer program
US8873641B2 (en) 2007-06-19 2014-10-28 Panasonic Corporation Moving picture coding apparatus

Also Published As

Publication number Publication date
EP1583365A4 (en) 2011-11-30
JP2005136633A (ja) 2005-05-26
US7835436B2 (en) 2010-11-16
CN1723709B (zh) 2012-04-25
CN1723709A (zh) 2006-01-18
TW200531553A (en) 2005-09-16
US20060050778A1 (en) 2006-03-09
KR20060121656A (ko) 2006-11-29
KR101091418B1 (ko) 2011-12-07
EP1583365A1 (en) 2005-10-05
TWI264227B (en) 2006-10-11
WO2005041582A1 (ja) 2005-05-06

Similar Documents

Publication Publication Date Title
JP3675464B2 (ja) 動画像符号化装置および動画像符号化制御方法
JP4769717B2 (ja) 画像復号化方法
US20040202249A1 (en) Real-time MPEG video encoding method of maintaining synchronization between video and audio
JP2001189940A (ja) 映像データフォーマット装置及び映像データストレージ装置
JP4570532B2 (ja) 動き検出装置、動き検出方法、集積回路およびプログラム
JP4577357B2 (ja) 符号化装置及び方法、並びにプログラム
JPH1188874A (ja) 符号化装置における編集可能点挿入方法および符号化装置
JP4668767B2 (ja) 動画像符号化装置及び動画像符号化プログラム
JP3487205B2 (ja) 画像データ編集装置
JP3182329B2 (ja) 符号化データ編集装置とデータ復号装置
JP4710108B2 (ja) 画像信号符号化方法及び装置
JPH0951505A (ja) 記録媒体再生装置、再生方法、記録方法、及び記録装置
JP5046907B2 (ja) 記録装置、その制御方法、プログラム
JP4650454B2 (ja) 符号化装置及び符号化方法
JP3307367B2 (ja) 可変転送レート符号化装置
JP3443391B2 (ja) ディジタル復号化方法
JPH11205791A (ja) 画像符号化方法及び画像符号化装置
JP2001157210A (ja) 符号化装置及び符号化方法
JPWO2008129648A1 (ja) フレームレート変換装置、フレームレート変換方法及び動画像符号化装置
JPH0816610A (ja) 動画検索システムおよび動画検索データ抽出方法
JP2008042660A (ja) 映像信号再符号化装置及び映像信号再符号化方法
JP2008211555A (ja) 映像信号符号化装置および映像信号符号化方法
JPH10308942A (ja) 画像符号化方法及び装置並びに記録媒体並びに画像伝送方法
JP2010206463A (ja) 動画像符号化方法、動画像符号化装置及び動画像符号化プログラム
JP2010279079A (ja) 動画像符号化装置及び動画像符号化プログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050425

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090513

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100513

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100513

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110513

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120513

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130513

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees