JP3756346B2 - ビデオ・フレームの多重ストリームを処理する方法及びシステム - Google Patents
ビデオ・フレームの多重ストリームを処理する方法及びシステム Download PDFInfo
- Publication number
- JP3756346B2 JP3756346B2 JP14634199A JP14634199A JP3756346B2 JP 3756346 B2 JP3756346 B2 JP 3756346B2 JP 14634199 A JP14634199 A JP 14634199A JP 14634199 A JP14634199 A JP 14634199A JP 3756346 B2 JP3756346 B2 JP 3756346B2
- Authority
- JP
- Japan
- Prior art keywords
- stream
- encoding
- bit rate
- gop
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2365—Multiplexing of several video streams
- H04N21/23655—Statistical multiplexing, e.g. by controlling the encoder to alter its bitrate to optimize the bandwidth utilization
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/179—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/436—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/87—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Time-Division Multiplex Systems (AREA)
- Image Processing (AREA)
- Television Systems (AREA)
Description
【発明の属する技術分野】
本発明は一般に、デジタル・ビジュアル・イメージの圧縮に関して、特に、ビデオ・データの多重ストリームを並列に動的に符号化し、一定ビット・レート・チャネル上に多重化する制御技術に関する。この制御技術は、ビデオ・データの多重ストリームの相対複雑度に部分的にもとづき、個々の符号化ビット・レートが各ビデオ・データ・ストリーム内で動的に調整されることを可能にする、単一パス技術を含む。
【0002】
【従来の技術】
放送テレビジョン、通信ネットワーク、家電製品及びマルチメディア・コンピュータなどの業界における、様々なデジタル・ビデオ技術の出現は、急速に増えつつある。デジタル・ビデオ・アプリケーションのこの広範な利用は、デジタル情報の信号処理、編集及びデータ転送が、アナログ表現の処理に比較して、大変容易である事実により促進される。しかしながら、重要な点は、デジタル・ビデオはその普及を、近年デジタル・ビデオ圧縮のための作成された幾つかの規格に負っていることである。
【0003】
デジタル・ビデオ圧縮ソルーションは、恐らく任意のデジタル・ビデオ・プラットフォームの最も重要な要素である。デジタル・ビデオは非圧縮形式では大量の情報を含むことがわかっているので、その操作、記憶及び伝送は、非常に時間を要し、高価となる。その結果、その内容の知覚品質を保存する一方、圧倒的なデータ量を低減するデジタル・ビデオ圧縮技術が考案された。互換のビデオ伸張方式が、データを再生のために圧縮解除するために使用される。
【0004】
Moving Pictures and Expert Groupにより形成され、ISO/IEC13818−2、"Information Technology - Generic Coding of Moving Pictures and Associated Audio Information: Video 1996"で述べられるMPEG−2国際標準規格は、前述の業界のために、圧縮を標準化することを目的とする。ISO MPEG−2規格は、符号化ビットストリームの構文及び復号プロセスのセマンティクス(意味)を指定する。しかしながら、符号化パラメータの選択、及び性能対複雑度のトレードオフが、符号器開発者には残される。
【0005】
MPEG−2符号化システムの効率は、固定通信帯域幅上で伝送される、またはデジタル媒体に記憶される知覚ビデオの精度により評価される。デジタル衛星システムなどの一部のアプリケーションでは、複数の番組が単一の大規模ストリームに多重化されて同報され、MPEG−2符号器のバンクが、全ての番組をモニタ及び符号化するために使用される一方で、受信チャネルの品質を維持しようとする。MPEG−2ストリームは非同期転送モード(ATM)・ネットワークにおいて、固定通信帯域幅または動的帯域幅のいずれかにより送信される。
【0006】
直接放送衛星(DBS)アプリケーションなどの典型的な統計的多重化システムでは、幾つかのビデオ・ビットストリーム(すなわち番組)が、単一一定ビット・レート・チャネル上に多重化される。残念ながら、所定の一定ビット・レートでの各番組の符号化は、時間の経過に伴う番組のシーン内容の変化により、ピクチャ品質の劣化を生じ得る。ビデオ・ソースが異なる符号化を施されたり、異なるピクチャ・オブ・グループ(GOP)構造を有する場合など、符号器の作用が時間的に整列されない場合、問題は一層複雑になる。
【0007】
【発明が解決しようとする課題】
使用可能な帯域幅を番組間で動的に分配することにより、システムの全体的なビデオ品質を最適化する多重番組圧縮技術が待望される。本発明は、符号化プロセスの間に、個々の符号器を動的に制御する結合レート制御技術を使用することにより、こうした技術を提供する。
【0008】
【課題を解決するための手段】
要するに、1態様では、本発明の原理に従い、ビデオ・フレームの多重ストリームを処理する方法が提供される。この方法は、ビデオ・フレームの多重ストリームを並列に符号化するステップと、ビデオ・フレームの多重ストリームを構成するビデオ・フレームの相対複雑度にもとづき、ビデオ・フレームの多重ストリームの少なくとも1つのストリームの符号化を、動的に適応化するステップとを含む。拡張された実施例では、符号化を動的に適応化するステップが、多重ストリームを構成するビデオ・フレームの複雑度にもとづき、制御可能な符号化パラメータを調整するステップを含む。調整するステップは好適には、ビデオ・フレームの少なくとも1つのストリーム内のシーン変化の検出時に、または新たなピクチャ・グループの開始時に発生する。
【0009】
別の態様では、ビデオ・フレームの多重ストリームを処理する方法が、ビデオ・フレームの各ストリームに対して、少なくとも1つの制御可能な符号化パラメータを用いて、ビデオ・フレームの多重ストリームを符号化するステップと、符号化の間に、ビデオ・フレームの各ストリームを分析し、イントラフレーム特性またはインタフレーム特性の少なくとも1つに関する情報を導出するステップと、ビデオ・フレームの多重ストリームの各ストリームから獲得される少なくとも1つの特性に関する相対情報により、ビデオ・フレームの各ストリームの符号化を動的に適応化するステップとを含む。動的に適応化するステップは、ビデオ・フレームの各ストリームに対して、その符号化において使用される少なくとも1つの制御可能な符号化パラメータを調整するステップを含み、ビデオ・フレームの符号化が、ビデオ・フレームの多重ストリームから獲得される少なくとも1つの特性の相対変化に、動的に適応する。
【0010】
更に別の態様では、ビデオ・フレームの多重ストリームを処理するシステムが提供される。このシステムは、ビデオ・フレームの多重ストリームを並列に符号化する複数の符号器を含む。各符号器は、ビデオ・フレームの多重ストリームの1つのストリームを受信するように結合される。結合制御装置が各符号器に接続され、多重ストリームを構成するビデオ・フレームの相対複雑度にもとづき、ビデオ・フレームの多重ストリームの少なくとも1つのストリームの符号化を動的に適応化する。
【0011】
更に別の態様では、本発明はビデオ・フレームの多重ストリームを処理するシステムを含む。このシステムは、ビデオ・フレームの多重ストリームを符号化する複数の符号器を含む。各符号器は、ビデオ・フレームの1つのストリームを符号化するための、少なくとも1つの制御可能な符号化パラメータを使用する。ビデオ・フレームの各ストリームを分析し、その少なくとも1つの特性に関する情報を導出する。この少なくとも1つの特性には、イントラフレーム特性またはインタフレーム特性の少なくとも1つが含まれる。ビデオ・フレームの各ストリームから獲得される少なくとも1つの特性に関する相対情報により、ビデオ・フレームの各ストリームの符号化を動的に適応化する手段が提供される。符号化を動的に適応化する手段は、ビデオ・フレームの各ストリームに対して、その符号化において使用される少なくとも1つの制御可能な符号化パラメータを調整する手段を含む。それによりビデオ・フレームの符号化が、ビデオ・フレームの多重ストリームから獲得される少なくとも1つの特性の相対変化に、動的に適応する。
【0012】
更に別の態様では、ビデオ・フレームの多重ストリームの処理を指示するコンピュータ読出し可能プログラム・コード手段を有する、少なくとも1つのコンピュータ使用可能媒体を含む製造物が提供される。製造物内のコンピュータ読出し可能プログラム・コード手段が、コンピュータに、ビデオ・フレームの多重ストリームを符号化するように指示するコンピュータ読出し可能プログラム・コード手段と、コンピュータに、ビデオ・フレームの相対複雑度にもとづき、ビデオ・フレームの多重ストリームの少なくとも1つのストリームの符号化を動的に適応化するように指示するコンピュータ読出し可能プログラム・コード手段とを含む。
【0013】
更に別の態様では、ビデオ・フレームの多重ストリームの処理を指示するコンピュータ読出し可能プログラム・コード手段を有する、少なくとも1つのコンピュータ使用可能媒体を含む製造物が提供される。製造物内のコンピュータ読出し可能プログラム・コード手段が、コンピュータに、ビデオ・フレームの各ストリームに対して、少なくとも1つの制御可能な符号化パラメータを用い、ビデオ・フレームの多重ストリームを符号化するように指示するコンピュータ読出し可能プログラム・コード手段と、コンピュータにビデオ・フレームの各ストリームを分析し、イントラフレーム特性またはインタフレーム特性の少なくとも1つに関する情報を導出するように指示する、コンピュータ読出し可能プログラム・コード手段と、コンピュータに、ビデオ・フレームの各ストリームから獲得された少なくとも1つの特性に関する相対情報を用い、ビデオ・フレームのストリームの符号化を動的に適応化するように指示する、コンピュータ読出し可能プログラム・コード手段とを含む。符号化の動的適応化は、ビデオ・フレームの各ストリームに対して、符号化において使用される少なくとも1つの制御可能な符号化パラメータを調整する。従って、ビデオ・フレームの各ストリームの符号化が、ビデオ・フレームの多重ストリームから獲得される少なくとも1つの特性の相対変化に、動的に適応する。
【0014】
再度述べると、本発明は、例えばMPEG−2互換ビデオ符号器などを用い、幾つかのビデオ番組を並列に符号化する統計的多重化のためのシステム・ソルーションを提供する。符号器間でビット・レートを動的に割当てる結合レート制御技術が提供される。各符号器のビット・レートは、番組の相対複雑度、及び符号化される番組内で発生するシーン変化にもとづき決定される。この技術は、入力ビデオ信号の外部事前処理を必要としない。更に、ビデオ・ソースの符号化が、各符号器内において、同一のGOP構造及びGOP長を要求するように制限されない。有利な点として、各符号器はそのビット・レートをGOP境界において変更できる一方、GOP内では一定ビット・レートで作用する。全体として、この技術は区分的に一定であるが可変ビット・レートの圧縮をもたらす。符号器が異なるGOP長及び構造で作用でき、異なる時刻に符号化できる。従って、個々のビット・レートの総和が所定チャネル・ビット・レートよりも大きいかまたは小さい場合、時間間隔が存在し得る。更に、この技術は、シーン変化に対して提案され、システムのシーン変化に対する迅速な反応を保証することにより、ピクチャ品質を改善する。
以下に請求項に記載の発明の構成を開示する。
(1) ビデオ・フレームの多重ストリームを処理する方法であって、
前記ビデオ・フレームの多重ストリームを並列に符号化するステップと、及び 前記多重ストリームを含む前記ビデオ・フレームの相対複雑度にもとづき、前記多重ストリームの少なくとも1つのストリームの符号化を動的に適応するステップと、
を含み、
ここで前記符号化を動的に適応するステップが、前記符号化によって使用された符号化ビット・レートを調整して、前記ビデオ・フレームの各ストリームを符号化するステップを含み、
前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始するステップを含み、ここで前記ビデオ・フレームの各ストリームに対し て、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変である、
前記方法。
(2) 前記少なくとも1つのストリーム内のシーン変化の検出に応じて、前記少なくとも1つのストリームの符号化を動的に適応することを実行するステップを更に含む、(1)に記載の方法。
(3) 前記調整は、前記少なくとも1つのストリーム内のシーン変化の検出に応じて生じる、(2)に記載の方法。
(4) 前記少なくとも1つのストリーム内の前記シーン変化を検出するステップを更に含む、(3)に記載の方法。
(5) 前記符号化を動的に適応するステップが、前記多重ストリームを含む前記ビデオ・フレームの相対複雑度にもとづき、前記多重ストリームの各ストリームの符号化を動的に適応するステップを含む、(1)に記載の方法。
(6) 前記各ストリームの符号化ビット・レートを調整する前記ステップが、前記ストリーム内のシーン変化の検出に応じて、または新たなグループ・オブ・ピクチャ(GOP)の開始に応じて発生する、(1)に記載の方法。
(7) 前記符号化が多重圧縮ビデオ・ストリームを生成し、かつここで前記方法が、各圧縮ビデオ・ストリームをバッファ内にバッファリングするステップを更に含み、かつここで前記符号化を動的に適応するステップが、前記各ストリームに対して、前記圧縮ビデオ・ストリームを受信する前記バッファの充填度にもとづき、前記符号化ビット・レートを変更するステップを含む、(1)に記載の方法。
(8) 前記符号化ビット・レートを変更するステップが、前記符号化ビット・レートを
R imod =R i +E・f i /N i
として変更するステップを含み、
ここで、R i はビデオ・フレームのストリームiに対して計算されたビット・レート、Eはバッファ充填度誤差ビット、N i はストリームiのGOP内のピクチャ数、及びf i はストリームiのフレーム・レートである、(7)に記載の方 法。
(9) 前記多重圧縮ビデオ・ストリームを一定ビット・レート・チャネル上に多重化するステップを更に含む、(8)に記載の方法。
(10) 前記多重圧縮ビデオ・ストリームを、前記一定ビット・レート・チャネルに接続されたチャネル・バッファ内にバッファリングするステップを更に含み、及びここで前記符号化を動的に適応するステップが、前記各ストリームに対して、前記チャネル・バッファの充填度にもとづき、前記符号化ビット・レートを変更するステップを含む、(9)に記載の方法。
(11) 前記チャネル・バッファの上限及び下限において、保護帯域を事前に定義して、前記バッファ充填度が前記チャネル・バッファの前記上限及び下限の保護帯域内の一つにあるときにはいつも、前記符号化ビット・レートを変更するステップを更に含む、(10)に記載の方法。
(12) 前記符号化ビット・レートを変更するステップが、前記バッファ充填度が前記上保護帯域内にある場合に、前記変更が前記バッファ充填度を減少させるか、または前記バッファ充填度を同じに維持するときにのみ前記符号化ビット・レートの変更を可能にし、かつ前記バッファ充填度が前記下保護帯域内にある場合に、前記変更がバッファ充填度を増加させるか、または前記チャネル・バッファ充填度を変化させないときにのみ前記符号化ビット・レートの変更だけを可能にするステップを含む、(11)に記載の方法。
(13) 前記符号化を動的に適応するステップが、レート制御アルゴリズムを使用して、前記少なくとも1つのストリームの符号化ビット・レートを制御するステップを含み、及びここで前記符号化するステップが、符号化統計を前記レート制御アルゴリズムに提供するステップを含み、ここで前記符号化統計が前記多重ストリームの前記符号化から導出される、(1)に記載の方法。
(14) 前記符号化するステップが、複数のMPEG符号器を使用して、前記多重ストリームを並列に符号化するステップを含み、ここで各MPEG符号器は、前記多重ストリームのビデオ・フレームの1ストリームを受信する、(1)に記載の方法。
(15) 前記多重ストリームを並列に符号化するステップが、多重圧縮ビデオ ・ストリームを生成し、及びここで前記方法が一定ビット・レート・チャネルを介しての転送のために、前記多重圧縮ビデオ・ストリームを多重化するステップを更に含む、(1)に記載の方法。
(16) 前記符号化を動的に適応するステップが、レート制御アルゴリズムを使用して、前記少なくとも1つのストリームの符号化ビット・レートを制御するステップを含み、及びここで前記レート制御アルゴリズムが、前記符号化の結果からの圧縮ビデオ・ストリームを受信するバッファの充填度に部分的にもとづき、前記少なくとも1つのストリームの前記符号化ビット・レートを制御する、(1)に記載の方法。
(17) ビデオ・フレームの多重ストリームを処理する方法であって、
前記ビデオ・フレームの多重ストリームを並列に符号化するステップと、及び 前記多重ストリームを含む前記ビデオ・フレームの相対複雑度にもとづき、前記多重ストリームの少なくとも1つのストリームの符号化を動的に適応するステップと、
を含み、
ここで前記符号化を動的に適応するステップが、前記符号化によって使用された符号化ビット・レートを調整して、前記ビデオ・フレームの各ストリームを符号化するステップを含み、
前記各ストリームの前記符号化ビット・レートを調整する前記ステップが、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)の開始ステップを含み、
前記ストリーム内のシーン変化の検出無しに、新たなフレーム・グループを開始するときに、前記符号化ビット・レートの調整を、所定の割合調整に制限するステップを更に含む、
前記方法。
(18) シーン変化の検出に応じて、前記符号化を動的に適応するステップが、現グループ・オブ・ピクチャ(GOP)を終了して、新たなGOPを開始するステップを含み、かつここで前記符号化ビット・レートを調整するステップが、前記所定の割合調整を使用することなしに、前記符号化ビット・レートを調整す るステップを含む、(17)に記載の方法。
(19) シーン変化を検出するために、前記多重ストリームのビデオ・フレームのストリームの隣接ビデオ・フレームをモニタするステップを更に含む、(18)に記載の方法。
(20) 前記符号化を動的に適応するステップが、レート制御アルゴリズムを使用して、前記少なくとも1つのストリームの符号化ビット・レートを制御するステップを含み、及びここで前記符号化するステップが、符号化統計を前記レート制御アルゴリズムに提供するステップを含み、ここで前記符号化統計が前記多重ストリームの前記符号化から導出される、(17)に記載の方法。
(21) 前記符号化するステップが、複数のMPEG符号器を使用して、前記多重ストリームを並列に符号化するステップを含み、ここで各MPEG符号器は、前記多重ストリームのビデオ・フレームの1ストリームを受信する、(17)に記載の方法。
(22) 前記多重ストリームを並列に符号化するステップが、多重圧縮ビデオ・ストリームを生成し、及びここで前記方法が一定ビット・レート・チャネルを介しての転送のために、前記多重圧縮ビデオ・ストリームを多重化するステップを更に含む、(17)に記載の方法。
(23) 前記符号化を動的に適応するステップが、レート制御アルゴリズムを使用して、前記少なくとも1つのストリームの符号化ビット・レートを制御するステップを含み、及びここで前記レート制御アルゴリズムが、前記符号化の結果からの圧縮ビデオ・ストリームを受信するバッファの充填度に部分的にもとづき、前記少なくとも1つのストリームの前記符号化ビット・レートを制御する、(17)に記載の方法。
(24) ビデオ・フレームの多重ストリームを処理する方法であって、
前記多重ストリームを並列に符号化するステップと、ここで前記符号化は各ビデオ・フレームのストリームの少なくとも1つの符号化ビット・レートを使用することを含む、
前記符号化の間、前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出するステップと、ここで前記少なくとも一つの特性は、イ ントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、及び
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記各ストリームの前記符号化を動的に適応するステップと、ここで前記符号化を動的に適応するステップが、前記符号化において使用された前記符号化ビット・レートを調整して、前記少なくとも1つのストリームを符号化するステップを含み、ここで前記各ストリームの符号化する前記ステップが、前記多重ストリームから獲得された前記少なくとも1つの特性の相対変化に動的に適応する、
ここで前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始するステップを含み、ここで前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変である、
を含む、前記方法。
(25) 前記分析するステップが、前記ビデオ・フレームの各ストリームを分析して、符号化されるシーンの複雑度に関する情報を導出するステップを含み、ここで前記シーンの前記複雑度は、少なくとも1つの特性を含む、(24)に記載の方法。
(26) 前記符号化が多重圧縮ビデオ・ストリームを生成し、及びここで前記方法が、一定ビット・レート・チャネル上に転送するために、各圧縮ビデオ・ストリームを多重化するステップを更に含む、(25)に記載の方法。
(27) 前記多重化するステップは、前記多重化以前に前記各圧縮ビデオ・ストリームをバッファリングするステップを含み、及びここで前記分析するステップが、前記ビデオ・フレームの各ストリームを分析して、前記それらの少なくとも1つの特性に関する統計を導出するステップを含み、ここで前記統計が、使用されたビット、平均MQUANT、バッファ充填度、またはシーン変化に関する統計の少なくとも1つを含む、(27)に記載の方法。
(28) 前記符号化するステップが、前記ビデオ・フレームの各ストリームをグループ・オブ・ピクチャ(GOP)として符号化するステップを含み、及びこ こで前記動的に適応するステップが、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットするステップを含み、前記動的にセットするステップは、前記各GOPの始めに起こる、(24)に記載の方法。
(29) 前記動的に適応するステップが、前記ビデオ・フレームの各ストリームの前記GOPの各GOPの符号化ビット・レートを決定するステップを含む、(28)に記載の方法。
(30) 前記ビデオ・フレームの各ストリームに対して、前記ストリーム内のシーン変化の検出に応じて、新たな前記GOPを開始するステップを含む、(29)に記載の方法。
(31) 前記少なくとも1つの特性が、前記ビデオ・フレームの前記ストリームに対して、前記前記ストリームを含むビデオ・データの複雑度を含み、及びここで前記分析するステップが、前記新たなシーンの最初のフレームの複雑度にもとづき、前記新たなシーンの複雑度を予測するステップを含む、(30)に記載の方法。
(32) 前記ビデオ・フレームの多重ストリームが、ビデオ・データの異なるソース、または多重ストリームに分割されたビデオ・データの共通ソースを含む、(24)に記載の方法。
(33) ビデオ・フレームの多重ストリームを処理するシステムであって、
前記ビデオ・フレームの多重ストリームを並列に符号化するための複数の符号器と、ここで各符号器は前記多重ストリームの1ストリームを受信する、及び
前記多重ストリームを含む前記ビデオ・フレームの相対複雑度にもとづき、前記多重ストリームの少なくとも1つのストリームの符号化を動的に適応するための、前記複数の符号器の各符号器に接続された結合制御装置と、
ここで前記結合制御装置が、前記複数の符号器の1つにより使用された符号化ビット・レートを調整する手段を含み、
前記結合制御装置が、前記ビデオ・フレームの少なくとも1つのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始する手段を含み、ここで前記符号化ビット・レートが各GOP内で一定であり 、かつ前記ビデオ・フレームの少なくとも1つのストリームのGOP間で可変である、
を含む、前記システム。
(34) 前記結合制御装置が、シーン変化の検出に応じて、前記少なくとも1つのストリームの符号化を動的に適応するための手段を含む、(33)に記載のシステム。
(35) 前記結合制御装置が、前記複数の符号器の1つにより使用された符号化ビット・レートを調整して、前記少なくとも1つのストリームを符号化するための手段を含む、(34)に記載のシステム。
(36) 前記符号化ビット・レートを調整するための前記手段が、前記少なくとも1つのストリーム内のシーン変化の検出に応じて、または前記少なくとも1つのストリーム内の新たなグループ・オブ・ピクチャ(GOP)の開始に応じて、前記符号化ビット・レートするための手段を含む、(35)に記載のシステム。
(37) 前記複数の符号器が多重圧縮ビデオ・ストリームを生成し、及びここで前記システムが複数のバッファを更に含み、各バッファは前記複数の符号器の対応する符号器からの出力を受信するように接続され、及びここで前記結合制御装置が、前記少なくとも1つのストリームを符号化する前記複数の符号器に接続された前記複数の符号器の前記バッファの充填度に部分的にもとづき、前記少なくとも1つのストリームの符号化を動的に適応する手段を含む、(33)に記載のシステム。
(38) 一定ビット・レート・チャネル上に転送するために前記多重圧縮ビデオ・ストリームを多重化するためのマルチプレクサと、及び
前記一定ビット・レートでの多重化圧縮ビデオ・ストリームの転送を保証するための、前記マルチプレクサと前記一定ビット・レート・チャネル間に接続されたチャネル・バッファと、
を更に含む、(37)に記載のシステム。
(39) 前記結合制御装置が、前記チャネル・バッファの充填度にもとづき、前記少なくとも1つのストリームの符号化を適応するための手段を含む、(38 )に記載のシステム。
(40) 前記結合制御装置が、前記少なくとも1つのストリームの符号化ビット・レートを制御するための、レート制御アルゴリズムを含み、及びここで前記複数の符号器が、符号化統計を前記レート制御アルゴリズムに提供し、前記符号化統計は、前記多重ストリームの前記符号化から導出される、(33)に記載のシステム。
(41) 前記複数の符号器が、並列に接続された複数のMPEG符号器を含み、各MPEG符号器は、前記多重ストリームの1ストリームを受信するために接続され、ここで前記多重ストリームが、ビデオ・データの異なるソースまたは多重ストリームに分割されたビデオ・データの共通ソースを含む、(33)に記載のシステム。
(42) ビデオ・フレームの多重ストリームを処理するためのシステムであって、
前記多重ストリームを並列に符号化するための複数の符号器と、ここで各符号器は、1つのストリームを符号化するために、ビデオ・フレームの符号化ビット・レートを使用する、
前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出する手段と、ここで前記少なくとも1つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、及び
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記各ストリームの前記符号化を動的に適応する手段と、ここで前記動的に適応する手段が、前記各ストリームに対して、前記符号化において使用された前記符号化ビット・レートを調整する手段を含み、ここで前記各ストリームの符号化する前記手段が、前記多重ストリームから獲得された前記少なくとも1つの特性の相対変化に動的に適応する、
を含み、
ここで前記符号化を動的に適応するステップが、前記符号化ビット・レートを調整する手段を含み、
前記符号化するための複数の符号器が、前記各ストリームに対して、前記ビデ オ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始するステップを含み、ここで前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変である、
前記システム。
(43) 前記分析手段が、前記ビデオ・フレームの各ストリームを分析して、符号化されるシーンの複雑度に関する情報を導出する手段を含み、ここで前記シーンの前記複雑度は、少なくとも1つの特性を含む、(42)に記載のシステム。
(44) 前記複数の符号器が多重圧縮ビデオ・ストリームを生成し、及びここで前記システムが、一定ビット・レート・チャネル上に転送するために、前記圧縮ビデオ・ストリームを多重化するためのマルチプレクサを更に含む、(43)に記載のシステム。
(45) 複数のバッファを更に含み、ここで前記複数のバッファの各バッファは、前記複数の符号器の1つと前記マルチプレクサとの間に接続される、及び
チャネル・バッファを更に含み、ここで前記チャネル・バッファは、前記マルチプレクサと前記一定ビット・レート・チャネルとの間に接続される、
及びここで前記分析する手段が、前記ビデオ・フレームの各ストリームを分析して、前記それらの少なくとも1つの特性に関する統計を導出する手段を含み、ここで前記統計が使用されたビット、平均MQUANT、バッファ充填度、またはシーン変化に関する統計の少なくとも1つを含む、(44)に記載のシステム。
(46) 前記複数の符号器が、前記ビデオ・フレームの各ストリームをグループ・オブ・ピクチャ(GOP)として符号化する手段を含み、及びここで前記動的に適応する手段が、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットする手段を含み、前記動的にセットする手段は、前記各GOPの始めに起こる、(42)に記載のシステム。
(47) 前記動的に適応する手段が、前記ビデオ・フレームの各ストリームの 前記GOPの各GOPの符号化ビット・レートを決定する手段を含む、(46)に記載のシステム。
(48) 前記ビデオ・フレームの各ストリームに対して、前記ストリーム内のシーン変化の検出に応じて、新たな前記GOPを開始する手段を含む、(47)に記載のシステム。
(49) 前記少なくとも1つの特性が、前記ビデオ・フレームの前記ストリームに対して、前記ストリームを含むビデオ・データの複雑度を含み、及びここで前記分析手段が、前記新たなシーンの最初のフレームの複雑度にもとづき、前記新たなシーンの複雑度を予測する手段を含む、(48)に記載のシステム。
(50) ビデオ・フレームの多重ストリームの処理をコンピュータに指示するコンピュータ読出し可能なプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記コンピュータ読出し可能プログラムが、
前記ビデオ・フレームの多重ストリームを符号化するように、前記コンピュータに指示する段階と、及び
前記多重ストリームを含む前記ビデオ・フレームの相対複雑度にもとづき、前記多重ストリームの少なくとも1つのストリームの符号化を動的に適応するように、前記コンピュータに指示する段階と、
を含み、
ここで前記符号化を動的に適応するように、前記コンピュータに指示する段階が、前記符号化によって使用された符号化ビット・レートを調整する段階を含み、
前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始する段階を含み、ここで前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変である、
ところのプログラムを記録したコンピュータ読み取り可能な記録媒体。
(51) 前記符号化を動的に適応するように前記コンピュータに指示する段階 が、前記少なくとも1つのストリーム内のシーン変化の検出に応じて、または前記少なくとも1つのストリーム内の新たなグループ・オブ・ピクチャ(GOP)の開始に応じて、前記少なくとも1つのストリームの符号化の動的な適応を実行するように、前記コンピュータに指示する段階を含むところのプログラムを記録した(50)に記載のコンピュータ読み取り可能な記録媒体。
(52) 前記符号化を動的に適応するように前記コンピュータに指示する段階が、前記符号化から出力された圧縮ビデオ・ストリームを受信するために接続されたバッファの充填度に関するフィードバックを使用して、前記少なくとも1つのストリームの符号化を動的に適応するように、前記コンピュータに指示する段階を含むところのプログラムを記録した(51)に記載のコンピュータ読み取り可能な記録媒体。
(53) 前記符号化を動的に適応するように前記コンピュータに指示する段階が、レート制御アルゴリズムを使用して、前記少なくとも1つのストリームの符号化ビット・レートを制御する段階を含み、及びここで前記符号化するように前記コンピュータに指示する段階が、前記多重ストリームの前記符号化から導出される符号化統計を、前記レート制御アルゴリズムに提供するように、前記コンピュータに指示する段階を含むところのプログラムを記録した(50)に記載のコンピュータ読み取り可能な記録媒体。
(54) 前記符号化するように前記コンピュータに指示する段階が、前記多重ストリームを並列に符号化して、多重圧縮ビデオ・ストリームを生成するように、前記コンピュータに指示する段階を含み、及びここで前記装置が一定ビット・レート・チャネル上に転送するために、前記多重圧縮ビデオ・ストリームを多重化するように、前記コンピュータに指示する段階を含むところのプログラムを記録した(50)に記載のコンピュータ読み取り可能な記録媒体。
(55) ビデオ・フレームの多重ストリームの処理をコンピュータに指示するコンピュータ読出し可能なプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記コンピュータ読出し可能プログラムが、
前記多重ストリームを符号化するように、前記コンピュータに指示する段階 と、ここで前記符号化が、ビデオ・フレームの各ストリームの符号化ビット・レートを使用する段階を含む、
前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出するように、前記コンピュータに指示する段階と、ここで前記少なくとも一つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、及び
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記各ストリームの前記符号化を動的に適応するように、前記コンピュータに指示する段階と、ここで前記動的に適応する段階が、前記各ストリームに対して、前記符号化において使用された前記符号化ビット・レートを調整する段階を含み、ここで前記各ストリームの前記符号化段階が、前記ビデオ・フレームの多重ストリームから獲得された前記少なくとも1つの特性の相対変化に動的に適応する、
を含み、
ここで前記符号化を動的に適応するように、前記コンピュータに指示する段階が、前記符号化によって使用された符号化ビット・レートを調整する段階を含み、
前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始する段階を含み、ここで前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変である、
ところのプログラムを記録した前記コンピュータ読み取り可能な記録媒体。
(56) 前記符号化を動的に適応するように前記コンピュータに指示する段階が、前記ビデオ・フレームの各ストリームを分析して、符号化されるシーンの複雑度に関する情報を導出するように、前記コンピュータに指示する段階とを含み、ここで前記シーンの前記複雑度は、少なくとも1つの特性を含むところのプログラムを記録した(55)に記載のコンピュータ読み取り可能な記録媒体。
(57) 前記符号化するように前記コンピュータに指示する段階が、前記ビデ オ・フレームの各ストリームをグループ・オブ・ピクチャ(GOP)として符号化するように、前記コンピュータに指示する段階を含み、及びここで前記動的に適応する段階が、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットするように、前記コンピュータに指示する段階を含み、ここで前記動的にセットすることは、前記各GOPの始めに起こるところのプログラムを記録した(55)に記載のコンピュータ読み取り可能な記録媒体。
(58) 前記ビデオ・フレームの各ストリームに対して、前記ストリーム内のシーン変化の検出に応じて、新たなフレーム・グループを開始するように、前記コンピュータに指示する段階を含み、及びここで前記少なくとも1つの特性が、前記各ストリームのビデオ・フレームの複雑度を含み、及びここで前記分析するように前記コンピュータに指示する段階が、前記新たなシーンの最初のフレームの複雑度にもとづき、新たなシーンの複雑度を予測するように、前記コンピュータに指示する段階を含むところのプログラムを記録した(57)に記載のコンピュータ読み取り可能な記録媒体。
(59) ビデオ・フレームの多重ストリームの処理をコンピュータに指示するコンピュータ読出し可能なプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記コンピュータ読出し可能プログラムが、
前記ビデオ・フレームの多重ストリームを符号化するように、前記コンピュータに指示する段階と、ここで前記符号化が、ビデオ・フレームの各ストリームの符号化ビット・レートを使用する段階を含む、
前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出するように、前記コンピュータに指示する段階と、ここで前記少なくとも一つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、及び
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記各ストリームの前記符号化を動的に適応するように、前記コンピュータに指示する段階と、ここで前記動的に適応する段階 が、前記各ストリームに対して、前記符号化において使用された符号化ビット・レートを調整する段階を含み、ここで前記各ストリームの前記符号化段階が、前記多重ストリームから獲得された前記少なくとも1つの特性の相対変化に動的に適応する、
を含み、
前記符号化するように前記コンピュータに指示する段階が、前記各ストリームをグループ・オブ・ピクチャ(GOP)として符号化するように、前記コンピュータに指示する段階を含み、及びここで前記動的に適応する段階が、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットするように、前記コンピュータに指示する段階を含み、ここで前記動的にセットすることは、前記各GOPの始めに起こり、
前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなフレーム・グループを開始するように、前記コンピュータに指示する段階を含み、及びここで前記少なくとも1つの特性が、前記各ストリームのビデオ・フレームの複雑度を含み、及びここで前記分析するように前記コンピュータに指示する段階が、前記新たなシーンの最初のフレームの複雑度にもとづき、新たなシーンの複雑度を予測するように、前記コンピュータに指示する段階を含む、
ところのプログラムを記録したコンピュータ読み取り可能な記録媒体。
(60) (1)〜(32)に記載の方法を実行するところのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0015】
【発明の実施の形態】
簡単に前述したように、本発明は複数のビデオ符号器を用い、ビデオ番組の多重ストリーム(例えばチャンネル)を並列に符号化するための統計的多重化制御技術に関する。符号器(MPEG準拠の符号器、及び前述のMPEG−2国際標準規格で述べられるような符号化プロセスを含み得る)の間で、ビット・レートを動的に割当てる外部結合レート制御技術が使用される。各符号器のビット・レートは、番組の相対複雑度にもとづき決定され、番組内のシーン変化及びGOP境界において調整が行われる。提案される技術は、入力ソースの外部事前処理を要求しない。図1及び図2は、本発明に従う制御技術において使用される単一ビデオ符号器の作用を示す。
【0016】
説明のために、MPEG準拠符号化の一般的なフロー図を図1に示す。フロー図において、i番目のピクチャ及びi+1番目のピクチャのイメージが処理され、動きベクトルを生成する。動きベクトルは、前の及び(または)後のピクチャ内で画素のマクロブロックが存在する場所を予測する。動きベクトルの使用は、MPEG規格における時間圧縮の主要な面である。図1に示されるように、一旦生成されると、動きベクトルは、i番目のピクチャからi+1番目のピクチャへの、画素のマクロブロック(MB)の変換のために使用される。
【0017】
図1の符号化プロセスでは、i番目のピクチャ及びi+1番目のピクチャのイメージが符号器11内で処理され、動きベクトルが生成される。続くピクチャの入力イメージ111が、符号器11の動き推定ユニット43に入力する。動きベクトル113が動き推定ユニット43の出力として形成される。これらのベクトルは動き補償ユニット41により、先行及び(または)将来のピクチャから、"基準"データと呼ばれるマクロブロック・データを、このユニットの出力として取り出すために使用される。動き補償ユニット41の1出力が、動き推定ユニット43からの出力から減算され、離散コサイン変換器(DCT)21に入力される。離散コサイン変換器21の出力は、量子化器23内で量子化される。量子化器23の出力は2つの出力121及び131に分割され、一方の出力121はラン・レングス符号器などの下流の要素25に送られ、圧縮及び処理された後に伝送される。他の出力131は、画素の符号化マクロブロックの復元を通じて、フレーム・メモリ42に記憶される。図示の符号器では、この第2の出力131は逆量子化29及び逆離散コサイン変換31を通じて、差分マクロブロックの有損失バージョンを再構成する。このデータは動き補償ユニット41の出力と加算され、原ピクチャの有損失バージョンをフレーム・メモリ42に返却する。
【0018】
図2に示されるように、3つのタイプのピクチャが存在する。"イントラ・ピクチャ"または"I"ピクチャは、独立に符号化されて伝送され、動きベクトルの定義を必要としない。これらの"I"ピクチャは動き推定のための基準イメージとして作用する。"予測ピクチャ"または"P"ピクチャは、先行ピクチャからの動きベクトルにより形成され、将来のピクチャの動き推定のための基準イメージとして作用する。最後に、"双方向ピクチャ"または"B"ピクチャは、2つの他のピクチャ、すなわち過去と将来のピクチャからの動きベクトルを用いて形成され、動き推定のための基準イメージとしては作用しない。
【0019】
様々なピクチャ・タイプが符号器11により、幾つかのステップにおいて量子化される。第1に、ピクチャ・タイプに固有の量子化マトリックスが、8×8DCTブロックに適用される。低周波数係数が重要視されるように、マトリックスの要素(重み)が選択される。これらの係数はより多くの情報を含み、ピクチャの知覚品質により大きく寄与する。次に、イメージの局所的なアクティビティ、ピクチャ・タイプの複雑度、及びバッファ充填度にもとづき、量子化スケーリング・ファクタが計算される。この指標は、ピクチャに割当てられるビット数及びその知覚品質に直接関連付けられる。実際のビット数は、MPEG−2規格において定義されるプロシージャに従い、最初に各DCTブロックを走査し、次に量子化済み係数を一緒にグループ化することにより獲得される。各グループは、ハフマン・ルックアップ・テーブルを用いることにより、固有の可変長コード(VLC)によりエントロピ符号化される。差分パルス符号変調(DPCM)(動きベクトルの符号化に類似)及び一様量子化を用いて、DC係数が符号化される。
【0020】
エントロピ符号器の出力は、エントロピ復号器に入力される。復号器の出力は、逆走査、逆量子化、及び逆離散コサイン変換を通じて、損失のある差分マクロブロックを再構成する。次に、復号されたピクチャが既知のように、遅延を通じて動き推定及び(または)動き補償に渡される。
【0021】
MPEG−2符号器の動作機能については、Carrらによる1997年4月1日付けの米国特許出願第08/831157号、"Control Scheme For Shared-Use Dual-Port Predicted Error Array"で詳述されている。一定ビット・レート(CBR)符号化方式及び可変ビット・レート(VBR)符号化方式の基本が、N. Mohsenianによる1998年3月19日付けの米国特許出願第09/044642号、"Real-Time Single Pass Variable Bit Rate Control Strategy And Encoder"で、ピクチャ・オブ・グループ(GOP)またはフレームに関連して詳述されている。更に、後述のようなイメージ統計を使用するフレーム・シーケンスの適応符号化が、Boiceらによる1998年3月20日付けの米国特許出願第09/046118号、"Adaptive Encoding Of A Sequence Of Still Frames Or Partially Still Frames Within Motion Video"で詳述されている。
【0022】
前記の情報を背景として、本発明の原理に従う統計的多重化及びレート制御技術について、図3乃至図12を参照しながら説明することにする。
【0023】
典型的な統計的多重化システムでは、幾つかのビデオ・ビットストリームが単一一定ビット・レート・チャネル上に多重化される。あいにく、所定の一定ビット・レートでの各番組の符号化は、時間に伴うシーン内容の変化により、ピクチャ品質の劣化を招き得る。従って、本発明に従う多重番組圧縮の根底の目的は、使用可能な帯域幅を番組間で動的に分配し、システムの全体的なビデオ品質を最大化することである。これは個々の符号器を制御する結合レート制御アルゴリズムを用い、全ての番組のピクチャ品質を等しくすることに対応する。本発明はビデオ・ソースの相対シーン内容に従い、符号器の間でビット・レートを割当てる一方、固定チャネル・ビット・レートの要求を満足するものである。
【0024】
より詳細には、統計的多重化のためのシステム・ソルーションが、MPEG−2互換のビデオ符号器を使用し、幾つかのビデオ番組を並列に符号化するために提供される。符号器間で動的にビット・レートを割当てる外部結合レート制御アルゴリズムが述べられる。各符号器のビット・レートは、番組の相対複雑度及び番組内のシーン変化にもとづき決定される。本発明に従うシステム及び方法は、入力ソースのいかなる外部事前処理も必要としない。更に、ビデオ・ソースの符号化が各符号器内で、同一のGOP構造またはGOP長を有するように制限されない。各符号器は結合レート制御に従い、GOP境界において、そのビット・レートを変更する一方で、GOP内では一定ビット・レートで動作する。全体として、この技術は区分的に一定の可変ビット・レート圧縮をもたらす。実験結果によれば、本発明に従う多重番組ビデオ圧縮システムは、相対的に単純であるにも関わらず、外部事前処理無しに、良好なピクチャ品質をもたらす。更に、市販のMPEG−2符号器チップがこのシステムにおいて、成功裡に使用され得る。
【0025】
基本的に、結合レート制御のために2つの異なるアプローチが可能であり、それらはフィードバック・アプローチと先読みアプローチである。フィードバック・アプローチでは、符号器により符号化プロセスの副産物として、統計が生成される。これらの統計が次に、続くピクチャに対するビット割当てを制御するために使用される。先読みアプローチでは、符号化の前に、統計がプリプロセッサにより計算され、次にこれらの統計がピクチャの符号化の前に、ビット・レートを調整するために使用される。いずれのアプローチでも、番組の複雑度を示す最適な統計を見い出すことが、課題となり得る。フィードバック・アプローチでは、統計は主として、符号化に関係する量に限られる。先読みアプローチはより大きな自由度を有するが、計算が複雑になったり、追加の装置が必要になったりする。
【0026】
両方のアプローチにおいて、結合レート制御アルゴリズムが各ピクチャのビット・レートを計算し、個々の符号器の各々に対する全体レート制御を実行する。これは可変ビット・レート符号化をもたらす。通常、こうしたレート制御アルゴリズムは大抵、各符号器内で同一のGOP構造を要求するが、これは現実とかけ離れている。符号器は異なるGOP長及び構造において動作することができ、また動作する。
【0027】
本発明によれば、フィードバック・アプローチにより符号器のビット・レートを動的に割当てる、統計的多重化のためのソルーションが開示される。レート制御技術が番組の相対複雑度にもとづき、符号器間でチャネル・ビット・レートを分配する。番組の複雑度が、圧縮ビットストリームと共に、符号器により生成される符号化統計を用いて決定される。
【0028】
結合レート制御アルゴリズムにより、各ピクチャのターゲット・ビット・レートを計算する代わりに、GOP境界において、またはシーン変化が発生する場合、ビット・レートが変更される。この技術は、符号器がGOP内において一定ビット・レートで動作することを可能にし、区分的に一定の可変ビット・レート圧縮をもたらす。符号器は同一のGOP構造を有する必要がなく、すなわち、GOP境界が各符号器内で異なる時刻に発生し得る。符号器の異なるGOP構造のため、チャネル・バッファ及び対応するバッファ制御フィードバック・ループが、本発明に従いシステム内に組み込まれる。シーン変化に際して、GOP構造を動的に変更し、十分なビット・レート変化を可能にすることにより、迅速な反応が保証される。本システム及び方法は、例えばIBMの単一チップMPEG−2ビデオ符号器(部品番号:IBM39 MPEGS422 PBA 17C)を用いて実現され得る。
【0029】
下記のセクション1は、本発明に従う多重番組ビデオ圧縮システムについて述べる。セクション2では、本発明の結合レート制御技術について、またセクション3では、シーン変化の場合の結合レート制御技術について述べる。セクション4では、チャネル・バッファの最小サイズの決定、及び対応するチャネル・バッファ制御について述べる。セクション5では、市販の単一チップMPEG−2符号器の、本システムにおける可能な使用について述べる。セクション6では、実験結果について示す。
【0030】
1.多重番組ビデオ圧縮システム:
図3は、本発明のフィードバック・アプローチを使用し、幾つかの番組(ソース1、ソース2、...、ソースn)を並列に符号化する多重番組ビデオ圧縮システム200を示す。システム200は、幾つかのMPEG−2ビデオ符号器210と、符号器210に接続される個々のバッファ220と、結合レート制御装置230と、マルチプレクサ240と、チャネル・バッファ250とを含む。各符号器は、丁度符号化されたばかりのピクチャに関する統計を生成する。これらの統計は、結合レート制御アルゴリズム230への入力パラメータとなり、アルゴリズム230が後述のように、各個々の符号器のビット・レートを動的に計算する。
【0031】
提案されるシステム200では、各符号器210のビット・レートが、番組(ソース1、ソース2、...、ソースn)の相対複雑度と、対応する番組内のシーン変化の発生とにもとづき決定される。符号器は好適には、MPEG−2規格に互換のビットストリームを生成する。通常、符号器210の内部または外部のいずれかにおいて実行されるシーン変化検出以外は、入力ソースの追加の事前処理は要求されない。各符号器はそのビット・レートを結合レート制御装置230に従い、GOP境界またはシーン変化において変更する。このことは符号器がGOP内では、MPEG−2規格に従うCBRビデオ・バッファ検証器モデルを使用し、一定ビット・レート(CBR)で動作することを可能にする。全体として、この技術は区分的に一定の可変ビット・レート圧縮をもたらす。
【0032】
ビデオ・ソースの符号化が各符号器内で、同一のGOP構造またはGOP長を有するように制限されない。GOP境界は各符号器内で異なる時刻に発生し得、ビット・レート変化はGOP境界においてのみ有効となるので、チャネル・バッファ250は、チャネル・レートの可能なオーバーフローまたはアンダーフローを補償するために使用される。チャネル・バッファ制御フィードバック255もまた、結合レート制御アルゴリズム230に組み込まれ、チャネル・バッファ250のオーバーフローまたはアンダーフローを阻止する。
【0033】
本発明の以下の説明では、結合レート制御技術、チャネル・バッファの最小サイズの決定、及び対応するチャネル・バッファ制御について詳述する。
【0034】
2.結合レート制御:
ここで述べる結合レート制御技術はフィードバック概念にもとづき、そこでは符号器により生成された統計が、チャネル・バッファ250の充填度に関する情報と共に、(圧縮ビットストリームと共に)結合レート制御装置230に供給される。符号化される番組のビット・レートは、その番組の複雑度と、並列に符号化される全ての番組の複雑度の合計との比率に比例すると仮定される。すなわち、
【数1】
【0035】
ここでRiは番組iのビット・レート、Rcはチャネル・レート、Xiは番組iの複雑度である。
【0036】
ピクチャ複雑度の決定は、使用されるビット生成モデルにもとづき、これはMPEG−2テスト・モデル5で提案される次のモデルと類似である(ISO/IEC JTCI/SC29/WG11 N0400、"Test Model 5"、April、1993を参照のこと)。
【数2】
bj=cj/Qj 2)
【0037】
ここでモデル・パラメータcjは、ピクチャ内のターゲット・ビット数bjを生成するものであり、特定量子化スケールQjがセットされなければならない。式2)にもとづき、番組iのビット・レートが、GOPを表示する時間間隔に対して次のように計算される。
【数3】
【0038】
ここでcijはピクチャjのビット生成モデル・パラメータであり、Qijはピクチャjの量子化パラメータであり、NiはGOP内のピクチャの数であり、fiは番組iのフレーム・レートである。統計的多重化システムでは、その目標はチャネル帯域幅を番組間で、次のように分配することである。
【数4】
【0039】
全ての番組のピクチャ品質を等しくする目標を達成するために、理想的な量子化パラメータが式3)及び式4)を用いて、次のように導出される。
【数5】
【0040】
この理想的な量子化パラメータは、各番組内の全てのピクチャに対して、等しいピクチャ品質をもたらすことができる。式3)においてQidealを使用することにより、各番組のビット・レートが次のように計算される。
【数6】
【0041】
本発明に従う統計的多重化システムにおいて、cijはbij・Qijに等しく、bijはピクチャを符号化するために使用されるビットであり、Qijは平均量子化パラメータである。更に、番組の複雑度が、GOPサイズのスライド式ウィンドウを用いて、ピクチャ複雑度の平均として推定される。
【0042】
番組複雑度の関係により、たとえシーン変化が番組内において発生しなかった場合にも、ビット・レート変化がその番組内の任意のGOP境界において発生し得る。ビット・レート変化がシーン・カットの無い番組内で余りに突然発生する場合、たとえシステムの総品質が改善されても、ピクチャ品質はGOP間で多大に変化し得る。この状況を阻止するために、ビット・レート変化がGOP境界上で制限されるが、シーン変化では、好適には制限は課せられない。例えば、シーン変化が発生しない場合、GOP境界における先行ビット・レートに対する10%の変化が許容され得る。シーン・カットが発生する場合、ビット・レート変化に対する制限は存在しない。
【0043】
3.シーン変化における結合レート制御:
ビデオ・データのストリーム内で、シーン変化はいつでも発生し得る。それらは任意のピクチャ・タイプにおいて、また任意のGOP位置において発生し得る。前述の議論では、ビット・レート変化がGOP境界においてだけ有効であり、符号器がGOP内で一定ビット・レート(CBR)・モードで作用することを仮定した。このアプローチの欠点は、番組の複雑度の変化に対するシステムの迅速な反応を阻止することである。この問題を克服するため、好適にはシーン変化状況において、特殊な処理が使用される。
【0044】
符号器の内部または外部のいずれかにおいて、各番組の連続ピクチャ間のシーン変化検出分析が実行され、新たなシーン内の第1のピクチャを符号化する前に、シーン変化を知ることができる。シーン変化が発生する場合、現GOPが早まって終了される。1実施例では、新たなシーン内の第1のピクチャが、早まって終了されたGOPの最後のピクチャとして符号化され、その統計が新たなシーンの複雑度を予測するために、従って、式6)を用い、後続のGOPのビット・レートを計算するために使用される。図4は、原GOP構造の例、並びにシーン変化が発生する場合の、新たなGOP構造を示す。シーン変化が発生するピクチャ・タイプに応じて、3つのケースが区別されて示される。
【0045】
新たなシーン複雑度の予測は、異なるピクチャ・タイプの経験的に決定された相対複雑度にもとづく。終りのGOPの最後のピクチャに当たる新たなシーンの第1のピクチャがPピクチャであり、あらゆるマクロブロックがイントラとして符号化される場合、このピクチャの複雑度はI複雑度と見なされる。このI複雑度にもとづき、新たなシーンの平均複雑度Xiが次のように推定される。
【数7】
【0046】
ここでXIはIピクチャの複雑度、nP、nBはGOP内のPピクチャ及びBピクチャの数、rP、rBはIピクチャ複雑度に対するそれぞれPピクチャ複雑度及びBピクチャ複雑度の比率である。rP及びrBの典型値は、それぞれ0.5及び0.25である。複雑度Xiは式6)でビット・レート計算のために使用される。新たなGOP内でより多くのピクチャが符号化されると、ピクチャを符号化するために使用される実際のビット及び平均量子化パラメータを適用することにより、複雑度が好適には連続的に更新される。GOPの符号化が継続すると、新たなシーンの複雑度の予測が、実際の符号化統計を使用することにより変化する。
【0047】
既に、符号器がGOP内ではCBRモードで動作し、各符号器がCBRビデオ・バッファ検証器モデルを使用することについて述べた。バッファ・アンダーフローまたはオーバーフローは許可されない。例えば、CBRレート制御アルゴリズムの目標は、GOPの終りにおけるバッファ充填度が、初期バッファ充填度(例えばバッファ・サイズの80%)と同一であることを保証することである。しかしながら、これはターゲット・ビット・バジェットと1ピクチャにつき使用される実際のビットとの不一致により、常に当てはまる訳ではない。GOP内のビットの過剰生成または過小生成により、バッファ充填度はそれぞれ初期レベルを下回ったり、上回ったりする。かなり大きなバッファ充填度誤差が累積し得る。この誤差は持ち越され、次のGOP内で補償されるように試行される。このレート制御は、GOP境界においてビット・レート変化がほとんど発生しないか、全く発生しない場合、良好に作用する。しかしながら、ビット・レート変化がシーン変化などにおいて突然発生する場合、本発明に従うバッファ充填度誤差(BFE)技術が、ピクチャ品質を改善するために適用される。
【0048】
シーン変化が発生する場合、バッファ充填度誤差がシーン変化後の新たなGOPの開始において、0と見なされる。各符号器に接続されるバッファのアンダーフローまたはオーバーフローを阻止するために、式6)により計算されたビット・レートが次のように変更される。
【数8】
【0049】
ここでRiは式6)に従い、番組iに対して計算されたビット・レート、Eはバッファ充填度誤差ビット、NiはGOP内のピクチャの数、及びfiは番組iのフレーム・レートである。バッファ充填度誤差Eが正の場合(GOPの開始におけるバッファ充填度が初期値よりも小さい)、番組のビット・レートは増加され、Eが負の場合、番組のビット・レートは減少される。GOP内のレート制御のために、初期バッファ充填度は、例えばバッファ・サイズの80%を使用する代わりに、先行GOPの終りにおけるバッファ充填度と見なされる。BFE技術は、シーン変化後のピクチャ品質を改善する。
【0050】
4.チャネル・バッファ・サイズ及びフィードバック制御:
符号器が異なるGOP長及び構造にて動作可能であること、または異なる時刻に符号化を開始し得る事実により、個々のビット・レートの総和が所定チャネル・ビット・レートよりも大きかったり、小さかったりする場合、時間間隔が存在し得る。これを改善するため、チャネル・バッファが要求され、正確にチャネル・ビット・レートでビットストリームを出力する。このバッファに関連して、2つの問題が考慮されなければならない。それらはバッファの最小サイズの決定と、チャネル・バッファ・アンダーフロー及びオーバーフローを阻止するための制御技術である。
【0051】
チャネル・ビット・レートからの最大合計偏差がΔRmaxであり、最悪の場合として、この偏差の最大期間が、符号器間の最長GOP時間と同じであると仮定する。この場合、チャネル・バッファの要求最小サイズは次のように決定される。
【数9】
Bs=2・ΔRmax・tgopmax 9)
【0052】
ここでΔRmaxはΣRi−Rc、tgopmaxは最大GOP時間である。
【0053】
式9)では、係数2が使用されている。なぜなら、チャネル・ビット・レートの過小生成及び過剰生成が仮定され、バッファが最初にこのサイズBsの半分まで充填され、その後、Rcのレートでビットを連続的に出力するからである。この場合、初期遅延は、バッファをそのサイズの半分まで充填するために要求される時間に対応する。例えば、チャネル・バッファ・レートが16Mビット/秒、ΔRmaxが8Mビット/秒、及びtgopmax=0.5秒の場合、30フレーム/秒のフレーム・レートでの最小バッファ・サイズは8Mビットで、対応する初期遅延は0.25秒である。統計的多重化システムにおいて、式9)により決定されるよりも小さなチャネル・バッファが所望される場合、チャネル・ビット・レートからの最大合計偏差は、それに従い制限されなければならない。
【0054】
チャネル・バッファ・アンダーフローまたはオーバーフローを阻止するために、バッファ・モデル(図5参照)が好適には使用される。チャネル・バッファ・モデルは、バッファの頂部及び底部に所定の保護帯域を含む。これらの保護帯域はビット・レートの分配を調整するために使用される。アンダーフロー及びオーバーフローを阻止するために、任意の時刻におけるバッファ充填度Bfが次の条件を満足しなければならない。
【数10】
0<Bf(t)<Bs 10)
【0055】
パラメータ'a'が保護帯域のサイズを決定し、例えば0.25として選択される。
【0056】
実際のバッファ充填度Bfに応じて、区別可能な3つのケースが存在する。これらのケースについて、対応するビット・レートの変更と共に、次に示すことにする。
【0057】
ケース1:
これはバッファ充填度が保護帯域間にある場合である。すなわち、
【数11】
a・Bs≦Bf≦(1−a)・Bs 11)
【0058】
この場合では、番組のために計算されたビット・レートが、極端な状況を除き、一般に変更されない。
【数12】
ΣRi>Rc且つΣRi−Rc>(Bs−Bf)/tgopmaxの場合、
Ri=Ri・[Rc+((1−a)Bs−Bf)/tgopmax]/(ΣRi)
(オーバーフロー無し) 12)
【数13】
ΣRi<Rc且つRc−ΣRi>Bf/tgopmaxの場合、
Ri=Ri・[Rc−(Bf−aBs)/tgopmax]/(ΣRi)
(アンダーフロー無し) 13)
【0059】
前記以外では、何もアクションは実行されない。
【0060】
ケース2:
これはバッファ充填度が上側の保護帯域内にある場合である。すなわち、
【数14】
Bf>(1−a)・Bs 14)
【0061】
この場合では、バッファ充填度を減少させるか、またはBfに留まるビット・レート変化だけが許可される。
【数15】
ΣRi>Rcの場合、
Ri=Ri・(Rc/(ΣRi)) 15)
(スケーリング・ダウン)
【数16】
ΣRi<Rc且つRc−ΣRi>Bf/tgopmaxの場合、
Ri=Ri・[Rc−(Bf−aBs)/tgopmax]/(ΣRi)
(アンダーフロー無し) 16)
【0062】
前記以外では、何もアクションは実行されない。
【0063】
ケース3:
これはバッファ充填度が下側の保護帯域内にある場合である。すなわち、
【数17】
Bf<a・Bs 17)
【0064】
この場合では、バッファ充填度を増加させるか、またはBfに留まるビット・レート変化だけが許可される。
【数18】
ΣRi<Rcの場合、
Ri=Ri・(Rc/(ΣRi)) 18)
(スケーリング・アップ)
【数19】
ΣRi>Rc且つΣRi−Rc>(Bs−Bf)/tgopmaxの場合、
Ri=Ri・[Rc+((1−a)Bs−Bf)/tgopmax]/(ΣRi)
(オーバーフロー無し) 19)
【0065】
前記以外では、何もアクションは実行されない。
【0066】
5.統計的多重化システム内でのMPEG−2符号器の使用:
本発明の原理に従う多重番組ビデオ圧縮システム内で使用される全てのMPEG−2符号器は、少なくとも、前述の結合レート制御アルゴリズムにより要求される必要な統計を提供できなければならない。符号器はまた、GOP境界においてビット・レートを変更する能力を有さねばならない。本発明の利点を更に利用するために、シーン変化に際して、符号器はGOP構造を動的に変更し、バッファ充填度誤差を計算するための量を提供し、シーン変化検出及び反応を内部的または外部的に実行できなければならない。
【0067】
6.実験結果:
本発明に従い構成されるシステムの性能を立証するために、異なるシーン内容のイメージ・シーケンスを使用することにより、幾つかの実験がシミュレーションを通じて実行された。開発された多重番組ビデオ圧縮システムは、4つのMPEG−2符号器(符号器1乃至符号器4)を用いてシミュレートされた。符号器の各々は、要求されるイメージ統計を出力する能力を有した。シーン変化検出は、符号器内で実行された。ビデオ・ソースは、それらの各々が、例えばスポーツ・シーン、自然、頭と肩だけのシーンなどの異なるシーン内容を表し、各々がシーン変化を含むように選択された。
【0068】
第1のビデオ・ソースのセットが、4:2:2クロマ形式の日本IBMコマーシャル、卓球、花園及び移動カレンダ(移動カレンダを伴う花園)、並びにMTVロゴを有する保護(Care)であった。ソースは4:2:2クロマ形式で符号化された。2つのBピクチャがアンカ・ピクチャ間に配置された。閉GOP長は、符号器1及び2では16として、符号器3及び4では13として選択された。フレーム・レートは各符号器において、29.97フレーム/秒であった。チャネル・レートは16Mビット/秒で、チャネル・バッファ・サイズは式9)に従い、8Mビットであった。各符号器は4Mビット/秒のビット・レートで符号化を開始した。この初期ビット・レートは、本発明の結合レート制御技術に従い、動的に変更された。
【0069】
図6は、結合レート制御装置を用い、各符号器に動的に割当てられるビット・レートを示す。日本IBMコマーシャル及びMTVシーケンスが、他の2つのソースに対して低いビット・レートを有することがわかる。
【0070】
第1のビデオ・ソースのセットを用い、4つの符号器により生成された合計ビット・レートが図7に示される。このグラフは、16Mビット/秒におけるチャネル・ビット・レートの過小生成または過剰生成を示し、チャネル・バッファ及びフィードバック制御の必要性を立証している。
【0071】
本提案のシステムの性能が、各符号器がそのソースを固定ビット・レートで符号化する方式と比較された。これらの符号器はシーン変化検出をそれら自身実行する。表1は、第1のビデオ・シーケンスのセットに対して、本発明により達成される平均PSNR値と、CBRモードにおいて、固定ビット・レート(4Mビット/秒)により達成される平均PSNR値とを示す。表1が示すように、簡単なソース(日本IBM、MTV)は、統計的多重化システムにおいては、固定4Mビット/秒レートよりも僅かに低い品質で符号化された。しかしながら、これは本提案のシステムにおいて、より複雑なソース(卓球、花園及び移動カレンダ)を、固定CBRモードの場合よりも高い品質で符号化することを可能にする。従って、本発明に従う統計的多重化システムは、固定ビット・レートの場合よりも優れた全体ピクチャ品質を提供した。
【表1】
【0072】
表2は、同一のビデオ・ソースを使用したときの、チャネル・ビット・レートが32Mビット/秒で、16Mビットのチャネル・バッファを有する場合、及び8Mビット/秒のCBRモードにおける固定ビット・レートの場合の平均PSNR値を示す。
【表2】
【0073】
チャネル・バッファ・モード及びフィードバック制御の有効性を立証するために、図8は、32Mビット/秒のチャネル・ビット・レートにおけるシーケンスの符号化の間の、チャネル・バッファ充填度を示す。図示のように、符号化の間に、バッファ・アンダーフローまたはオーバーフローは発生しなかった。
【0074】
表3は、16Mビット/秒のチャネル・ビット・レートにおいて、本提案のバッファ充填度誤差(BFE)技術を使用する場合の、及び使用しない場合のシーン変化後の第1のピクチャに対するPSNR値を含む。表3が示すように、ここで述べられるBFE技術を使用することにより、それを使用しないアルゴリズムに比較して、約0.64dB乃至約2.17dBのPSNRの改善が達成された。
【表3】
【0075】
第2の実験のセットでは、IBMワールドブック・コマーシャル(符号器1)、Mixd(符号器2)、フットボール(符号器3)、及びMixe(符号器4)が、入力ソースとして使用された。Mixdはバイク、摩天楼及びバスケットボールのシーケンスを含み、Mixeでは、スージ(Susie)・シーケンスに、森の中の小屋のシーンが続く。これらのソースは第1のビデオ・ソースのセットよりも、幾分複雑であるので、チャネル・ビット・レートは24Mビット/秒に選択され、チャネル・バッファは12Mビットであった。符号化パラメータは、閉GOP長が符号器1及び符号器2では13で、符号器3及び符号器4では16であった以外、第1の実験のセットの場合と同一であった。CBRケースでは、ビット・レートが6Mビット/秒に固定された。図9は、本発明の結合レート制御技術に従う、符号器の動的ビット・レート変化を示す。第2のビデオ・ソースのセットを符号化するための合計ビット・レートが図10に示される。これは24Mビット/秒におけるチャネル・ビット・レートの過小生成及び過剰生成を示す。
【0076】
表4は、本提案システムにより、及びCBRモードにおける固定ビット・レート(6Mビット/秒)により達成された、平均PSNR値を含む。この表は、第1の実験のセットに対して達成されたビジュアル品質と、同一の傾向を示す。本発明の統計的多重化システムは、CBRモードと比較して、単純なソース(IBMワールドブック、Mixe)に対しては、僅かに低いピクチャ品質をもたらしたが、より複雑なソース(Mixd、フットボール)の品質を改善した。
【表4】
【0077】
24Mビット/秒のチャネル・ビット・レートにて、この第2のビデオ・ソースのセットを符号化するためのチャネル・バッファ充填度が、図11に示される。バッファ・アンダーフローまたはオーバーフローは存在しない。
【0078】
7.プロセス概要:
図12は、本発明に従う符号化処理の概要を示す。統計が個々の符号器からフィードバックとして、レート制御装置に供給される。これらの統計は使用されるビット、平均MQUANT、及びバッファ充填度を含み得る(ステップ300)。更に、ビデオ・フレームの各ストリームにおいて発生するシーン変化、チャネル・バッファ充填度、及び前述のようにシステム内において発生する最大GOP長に関する情報が提供される。チャネル・バッファ充填度は、チャネル・バッファ自身からフィードバック信号として受信される。ビット・レート制御装置は初期に、シーン変化を示すシーン変化フラグがセットされたか否かを判断する(ステップ310)。セットされた場合、新たなシーンの最初のフレームが、前のシーンの最後のフレームとして、または新たな1ピクチャGOPの最初のピクチャとして符号化される(ステップ320)。新たなシーンのこの最初のピクチャは、次に新たなシーンの複雑度を予測するために使用される(ステップ330)。
【0079】
ビット・レートRiが各符号器に対して計算される(ステップ340)。次に、シーン変化フラグがセットされたか否かを判断し(ステップ350)、セットされた場合、バッファ充填度誤差技術により、符号器のビット・レートRiを変更する(ステップ360)。次に、チャネル・バッファ制御技術が前述のように実行され(ステップ370)、現フレームが、符号器iにて符号化されるビデオ・フレームのストリームのGOP境界にあるか否かを判断する(ステップ380)。否定の場合、処理はステップ300に戻り、入力パラメータの次のセットを収集する。現フレームがGOP境界にある場合、新たなビット・レートRiが符号器iに伝達される(ステップ390)。
【0080】
再度要約すると、本発明によれば、複数の符号器間でビット・レートを動的に割当て、ビデオ・ストリームを並列に符号化し、共通チャネル上に多重化する結合レート制御技術が提供される。番組の相対複雑度及び番組内で発生するシーン変化にもとづき、チャネル・ビット・レートが符号器間で分配される。ここで述べられる方法は、入力ソースの外部事前処理を要求しない。番組の複雑度が符号化統計及びシーン変化検出にもとづき決定され、それらが符号器により圧縮ビットストリームと一緒に生成される。各ピクチャのターゲット・ビット・レートを計算する代わりに、ビット・レートがGOP境界において、またはシーン変化が発生する場合、変更される。これは符号器がGOP内では、一定ビット・レート(CBR)で動作することを可能にする。
【0081】
GOP境界でのみビット・レートを変更することは、番組の複雑度変化に対する結合レート制御装置の反応時間を制限する。この問題を解決するために、シーン変化検出が、ビデオ・フレームのストリーム内の各連続ピクチャ間で実行されると仮定し、またそれが新たなシーン内の最初のフレームの符号化以前に知れていると仮定する。更に、符号器がGOP構造を動的に変更可能であると仮定する。これは市販の符号器において使用可能な機能である。シーン変化が発生する場合、現GOPが早まって終了され、新たなシーンの最初のピクチャが符号化される。新たなシーンのこの最初のピクチャからの統計が、次に新たなシーンの複雑度を予測するために使用され、結果的に、続くGOPのビット・レートを計算する。
【0082】
シーン変化の場合にピクチャ品質を改善するために、更に追加の変更が開発された。特に、GOP内のビットの過剰生成または過小生成に起因するバッファ充填度誤差が、シーン変化後の新たなGOPの開始において、0と見なされる。各符号器に接続されるバッファ内のアンダーフローまたはオーバーフローを阻止するために、結合レート制御装置により計算されるビット・レートが変更される。バッファ充填度誤差が正の場合(GOPの開始におけるバッファ充填度が、初期バッファ充填度(例えばバッファ・サイズの80%)よりも小さい)、番組のビット・レートが増加される。反対に、バッファ充填度誤差が負の場合、番組のビット・レートが減少される。この技術はシーン変化の後、より優れたピクチャ品質をもたらす。この概念は更に、動的GOP構造機能を有さない符号器、及びシーン変化検出が外部的に実行される符号器に対して拡張され得る。
【0083】
符号器は好適には同一のフレーム・レートで動作するが、異なるGOP長及び構造を有し得、異なる時刻に符号化を開始し得る。従って、個々のビット・レートの総和が、所定のチャネル・ビット・レートよりも大きかったり、小さかったりする場合、時間間隔が存在し得る。チャネル・バッファがシステム内に組み込まれ、正確にチャネル・ビット・レートで多重化ビット・ストリームを出力する。また、チャネルの最小サイズを決定する方法も開発された。これはチャネル・ビット・レートからの許容合計偏差、及びシステム内で発生する最大GOP時間にもとづく。チャネル・バッファ・アンダーフローまたはオーバーフローを阻止するために、バッファ・フィードバックが結合レート制御装置内に組み込まれる。
【0084】
本発明は例えば、コンピュータ使用可能媒体を有する製造物(例えば1つ以上のコンピュータ・プログラム製品)内に含まれ得る。この媒体は、例えば本発明の機能を提供し、容易にするコンピュータ読出し可能プログラム・コード手段を実現する。製造物はコンピュータ・システムの一部として含まれるか、或いは別々に販売され得る。
【0085】
更に、本発明の機能を実行するために、マシンにより実行可能な命令の少なくとも1つのプログラムを実現する、マシンにより読出し可能な少なくとも1つのプログラム記憶装置が提供され得る。
【0086】
まとめとして、本発明の構成に関して以下の事項を開示する。
【0087】
(1) ビデオ・フレームの多重ストリームを処理する方法であって、
前記ビデオ・フレームの多重ストリームを並列に符号化するステップと、
前記多重ストリームを含む前記ビデオ・フレームの相対複雑度にもとづき、前記符号化によって使用される符号化ビット・レートを調整して、前記多重ストリームの少なくとも1つのストリームを符号化するステップと、
を含み、
前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始するステップを含み、ここで前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変であり、
前記符号化が多重圧縮ビデオ・ストリームを生成し、かつ前記方法が、各圧縮ビデオ・ストリームをバッファ内にバッファリングするステップを更に含み、かつ前記符号化を動的に適応するステップが、前記各ストリームに対して、前記圧縮ビデオ・ストリームを受信する前記バッファの充填度にもとづき、前記符号化ビット・レートを変更するステップを含み、
前記符号化ビット・レートを変更するステップが、前記符号化ビット・レートを
Rimod=Ri+E・fi/Ni
として変更するステップを含み、
ここで、Riはビデオ・フレームのストリームiに対して計算されたビット・レート、Eはバッファ充填度誤差ビット、NiはストリームiのGOP内のピクチャ数、及びfiはストリームiのフレーム・レートである、前記方法。
(2) 前記少なくとも1つのストリーム内のシーン変化の検出に応じて、前記少なくとも1つのストリームを符号化することを実行するステップを更に含む、(1)に記載の方法。
(3) 前記調整は、前記少なくとも1つのストリーム内のシーン変化の検出に応じて生じる、(2)に記載の方法。
(4) 前記少なくとも1つのストリーム内の前記シーン変化を検出するステップを更に含む、(3)に記載の方法。
(5) 前記調整して符号化するステップが、前記多重ストリームを含む前記ビデオ・フレームの相対複雑度にもとづき、前記多重ストリームの各ストリームを符号化するステップを含む、(1)に記載の方法。
(6) 前記符号化ビット・レートを調整するステップが、前記ストリーム内のシーン変化の検出に応じて、または新たなグループ・オブ・ピクチャ(GOP)の開始に応じて発生するステップを含む、(1)に記載の方法。
(7) 前記多重圧縮ビデオ・ストリームを一定ビット・レート・チャネル上に多重化するステップを更に含む、(1)に記載の方法。
(8) 前記多重圧縮ビデオ・ストリームを、前記一定ビット・レート・チャネルに接続されたチャネル・バッファ内にバッファリングするステップを更に含み、及び前記符号化ビット・レートを調整するステップが、前記各ストリームに対して、前記チャネル・バッファの充填度にもとづき、前記符号化ビット・レートを変更するステップを含む、(7)に記載の方法。
(9) 前記チャネル・バッファの上限及び下限において、保護帯域を事前に定義して、前記バッファ充填度が前記チャネル・バッファの前記上限及び下限の保護帯域内の一つにあるときにはいつも、前記符号化ビット・レートを変更するステップを更に含む、(8)に記載の方法。
(10) 前記符号化ビット・レートを変更するステップが、前記バッファ充填度が前記上保護帯域内にある場合に、前記変更が前記バッファ充填度を減少させるか、または前記バッファ充填度を同じに維持するときにのみ前記符号化ビット・レートの変更を可能にし、かつ前記バッファ充填度が前記下保護帯域内にある場合に、前記変更がバッファ充填度を増加させるか、または前記チャネル・バッファ充填度を変化させないときにのみ前記符号化ビット・レートの変更だけを可能にするステップを含む、(9)に記載の方法。
(11) 前記符号化ビット・レートを調整するステップが、レート制御アルゴリズムを使用して、前記少なくとも1つのストリームの符号化ビット・レートを制御するステップを含み、及び前記調整して符号化するステップが、符号化統計を前記レート制御アルゴリズムに提供するステップを含み、前記符号化統計が前記多重ストリームの前記符号化から導出される、(1)に記載の方法。
(12) 前記符号化するステップが、複数のMPEG符号器を使用して、前記多重ストリームを並列に符号化するステップを含み、各MPEG符号器は、前記多重ストリームのビデオ・フレームの1ストリームを受信する、(1)に記載の方法。
(13) 前記多重ストリームを並列に符号化するステップが、多重圧縮ビデオ・ストリームを生成し、及び前記方法が一定ビット・レート・チャネルを介しての転送のために、前記多重圧縮ビデオ・ストリームを多重化するステップを更に含む、(1)に記載の方法。
(14) 前記符号化ビット・レートを調整するステップが、レート制御アルゴリズムを使用して、前記少なくとも1つのストリームの符号化ビット・レートを制御するステップを含み、及び前記レート制御アルゴリズムが、前記符号化の結果からの圧縮ビデオ・ストリームを受信するバッファの充填度に部分的にもとづき、前記少なくとも1つのストリームの前記符号化ビット・レートを制御する、(1)に記載の方法。
(15) ビデオ・フレームの多重ストリームを処理する方法であって、
前記ビデオ・フレームの多重ストリームを並列に符号化するステップであって、前記符号化は各ビデオ・フレームのストリームの少なくとも1つの符号化ビット・レートを使用することを含む、前記符号化するステップと、
前記符号化の間、前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出するステップであって、前記少なくとも一つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、前記導出するステップと、
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記符号化によって使用される符号化ビット・レートを調整して、前記多重ストリームの少なくとも1つのストリームを符号化するステップと
を含み、
前記少なくとも1つの特性が、前記ビデオ・フレームの前記ストリームに対して、前記前記ストリームを含むビデオ・データの複雑度を含み、前記分析するステップが、前記新たなシーンの最初のフレームの複雑度にもとづき、前記新たなシーンの複雑度を予測するステップを含み、
前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始するステップを含み、前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変である、前記方法。
(16) 前記分析するステップが、前記ビデオ・フレームの各ストリームを分析して、符号化されるシーンの複雑度に関する情報を導出するステップを含み、前記シーンの前記複雑度は、少なくとも1つの特性を含む、(15)に記載の方法。
(17) 前記符号化が多重圧縮ビデオ・ストリームを生成し、及び前記方法が、一定ビット・レート・チャネル上に転送するために、各圧縮ビデオ・ストリームを多重化するステップを更に含む、(16)に記載の方法。
(18) 前記多重化するステップは、前記多重化以前に前記各圧縮ビデオ・ストリームをバッファリングするステップを含み、及び前記分析するステップが、前記ビデオ・フレームの各ストリームを分析して、前記それらの少なくとも1つの特性に関する統計を導出するステップを含み、前記統計が、使用されたビット、平均MQUANT、バッファ充填度、またはシーン変化に関する統計の少なくとも1つを含む、(17)に記載の方法。
(19) 前記符号化するステップが、前記ビデオ・フレームの各ストリームをグループ・オブ・ピクチャ(GOP)として符号化するステップを含み、及び前記動的に適応するステップが、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットするステップを含み、前記動的にセットするステップは、前記各GOPの始めに起こる、(15)に記載の方法。
(20) 前記符号化ビット・レートを調整する前記ステップが、前記ビデオ・フレームの各ストリームの前記GOPの各GOPの符号化ビット・レートを決定するステップを含む、(19)に記載の方法。
(21) 前記ビデオ・フレームの各ストリームに対して、前記ストリーム内のシーン変化の検出に応じて、新たな前記GOPを開始するステップを含む、(20)に記載の方法。
(22) 前記ビデオ・フレームの多重ストリームが、ビデオ・データの異なるソース、または多重ストリームに分割されたビデオ・データの共通ソースを含む、(15)に記載の方法。
(23) ビデオ・フレームの多重ストリームを処理するためのシステムであって、
前記多重ストリームを並列に符号化するための複数の符号器であって、各符号器は、1つのストリームを符号化するために、ビデオ・フレームの符号化ビット・レートを使用する、前記複数の符号器と、
前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出する手段であって、前記少なくとも1つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、前記導出する手段と、
前記多重ストリームの少なくとも1つのストリームを符号化するために、前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記符号化によって使用される符号化ビット・レートを調整する手段と
を含み、
前記少なくとも1つの特性が、前記ビデオ・フレームの前記ストリームに対して、前記ストリームを含むビデオ・データの複雑度を含み、及び前記分析する手段が、前記新たなシーンの最初のフレームの複雑度にもとづき、前記新たなシーンの複雑度を予測する手段を含み、
前記符号化するための複数の符号器が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始するステップを含み、前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変である前記システム。
(24) 前記分析する手段が、前記ビデオ・フレームの各ストリームを分析して、符号化されるシーンの複雑度に関する情報を導出する手段を含み、前記シーンの前記複雑度は、少なくとも1つの特性を含む、(23)に記載のシステム。
(25) 前記複数の符号器が多重圧縮ビデオ・ストリームを生成し、及び前記システムが、一定ビット・レート・チャネル上に転送するために、前記圧縮ビデオ・ストリームを多重化するためのマルチプレクサを更に含む、(24)に記載のシステム。
(26) 複数のバッファを更に含み、ここで前記複数のバッファの各バッファは、前記複数の符号器の1つと前記マルチプレクサとの間に接続され、
チャネル・バッファを更に含み、ここで前記チャネル・バッファは、前記マルチプレクサと前記一定ビット・レート・チャネルとの間に接続され、
及び前記分析する手段が、前記ビデオ・フレームの各ストリームを分析して、前記それらの少なくとも1つの特性に関する統計を導出する手段を含み、前記統計が使用されたビット、平均MQUANT、バッファ充填度、またはシーン変化に関する統計の少なくとも1つを含む、(25)に記載のシステム。
(27) 前記複数の符号器が、前記ビデオ・フレームの各ストリームをグループ・オブ・ピクチャ(GOP)として符号化する手段を含み、及び前記符号化ビット・レートを調整する手段が、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットする手段を含み、前記動的にセットする手段は、前記各GOPの始めに起こる、(23)に記載のシステム。
(28) 前記符号化ビット・レートを調整する手段が、前記ビデオ・フレームの各ストリームの前記GOPの各GOPの符号化ビット・レートを決定する手段を含む、(27)に記載のシステム。
(29) 前記ビデオ・フレームの各ストリームに対して、前記ストリーム内のシーン変化の検出に応じて、新たな前記GOPを開始する手段を含む、(28)に記載のシステム。
(30) ビデオ・フレームの多重ストリームの処理をコンピュータに指示するコンピュータ読出し可能なプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記コンピュータ読出し可能プログラムが、
前記ビデオ・フレームの多重ストリームを符号化するように、前記コンピュータに指示する段階であって、前記符号化が、ビデオ・フレームの各ストリームの符号化ビット・レートを使用する段階を含む、前記コンピュータに指示する段階と、
前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出するように、前記コンピュータに指示する段階であって、前記少なくとも一つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、前記コンピュータに指示する段階と、
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記符号化によって使用される符号化ビット・レートを調整して、前記多重ストリームの少なくとも1つのストリームを符号化するように、前記コンピュータに指示する段階と、
を含み、
前記少なくとも1つの特性が、前記各ストリームのビデオ・フレームの複雑度を含み、及び前記分析するように前記コンピュータに指示する段階が、前記新たなシーンの最初のフレームの複雑度にもとづき、新たなシーンの複雑度を予測するように、前記コンピュータに指示する段階を含み、
前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始する段階を含み、前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変であるところのプログラムを記録した前記コンピュータ読み取り可能な記録媒体。
(31) 前記符号化ビット・レートを調整するように前記コンピュータに指示する段階が、前記ビデオ・フレームの各ストリームを分析して、符号化されるシーンの複雑度に関する情報を導出するように、前記コンピュータに指示する段階とを含み、前記シーンの前記複雑度は、少なくとも1つの特性を含むところのプログラムを記録した(30)に記載のコンピュータ読み取り可能な記録媒体。
(32) 前記調整して符号化するように前記コンピュータに指示する段階が、前記ビデオ・フレームの各ストリームをグループ・オブ・ピクチャ(GOP)として符号化するように、前記コンピュータに指示する段階を含み、及び前記符号化ビット・レートを調整するように前記コンピュータに指示する段階が、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットするように、前記コンピュータに指示する段階を含み、前記動的にセットすることは、前記各GOPの始めに起こるところのプログラムを記録した(30)に記載のコンピュータ読み取り可能な記録媒体。
(33) ビデオ・フレームの多重ストリームの処理をコンピュータに指示するコンピュータ読出し可能なプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記コンピュータ読出し可能プログラムが、
前記ビデオ・フレームの多重ストリームを符号化するように、前記コンピュータに指示する段階であって、前記符号化が、ビデオ・フレームの各ストリームの符号化ビット・レートを使用する段階を含む、前記コンピュータに指示する段階と、
前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出するように、前記コンピュータに指示する段階であって、前記少なくとも一つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、前記コンピュータに指示する段階と、
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記符号化によって使用される符号化ビット・レートを調整して、前記多重ストリームの少なくとも1つのストリームを符号化するように、前記コンピュータに指示する段階と
を含み、
前記少なくとも1つのストリームを符号化するように前記コンピュータに指示する段階が、前記各ストリームをグループ・オブ・ピクチャ(GOP)として符号化するように、前記コンピュータに指示する段階を含み、及び前記符号化ビット・レートを調整するように前記コンピュータに指示する段階が、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットするように、前記コンピュータに指示する段階を含み、前記動的にセットすることは、前記各GOPの始めに起こり、
前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャを開始するように、前記コンピュータに指示する段階を含み、及び前記少なくとも1つの特性が、前記各ストリームのビデオ・フレームの複雑度を含み、及び前記分析するように前記コンピュータに指示する段階が、前記新たなシーンの最初のフレームの複雑度にもとづき、新たなシーンの複雑度を予測するように、前記コンピュータに指示する段階を含む、
ところのプログラムを記録したコンピュータ読み取り可能な記録媒体。
(34) (1)〜(22)のいずれか一項に記載の方法を実行するところのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【図面の簡単な説明】
【図1】本発明の原理に従う統計的多重化システムで使用される一般的なMPEG−2準拠の符号器11のフロー図である。
【図2】Iピクチャ、Pピクチャ及びBピクチャの表示順序及び伝送順序、及び前方動き予測及び後方動き予測の例を示す図である。
【図3】本発明に従い実現される多重ストリーム・ビデオ圧縮統計的多重化システムの例を示す図である。
【図4】本発明に従うシーン変化におけるピクチャ・グループ構造の変化を示す図である。
【図5】本発明に従う統計的多重化システムのチャネル・バッファ充填度対時間の関係を示す図である。
【図6】本発明に従う統計的多重化システムにおいて、ビデオ・ソースの第1のセットを16Mビット/秒のチャネル・ビット・レートで符号化するための、ビット・レートの例を示す図である。
【図7】図6のビデオ・ソースの第1のセット(Rc=16Mビット/秒)を符号化するための合計ビット・レートのグラフである。
【図8】図6のビデオ・ソースの第1のセットを、16Mビット/秒のチャネル・バッファを用い、32Mビット/秒のチャネル・ビット・レートで記録するための、チャネル・バッファ充填度のグラフである。
【図9】本発明に従う統計的多重化システムにおいて、ビデオ・ソースの第2のセットを24Mビット/秒のチャネル・ビット・レートで符号化するための、ビット・レートの例を示す図である。
【図10】図9のビデオ・ソースの第2のセット(Rc=24Mビット/秒)を符号化するための合計ビット・レートを示す図である。
【図11】図9のビデオ・ソースの第2のセットを、12Mビット/秒のチャネル・バッファを用い、24Mビット/秒のチャネル・ビット・レートで符号化するための、チャネル・バッファ充填度のグラフである。
【図12】本発明の原理に従う統計的多重化レート制御処理の1実施例のフロー図である。
【符号の説明】
1乃至4、11 符号器
21 離散コサイン変換器(DCT)
23 量子化器
29 逆量子化
31 逆離散コサイン変換
41 動き補償ユニット
42 フレーム・メモリ
43 動き推定ユニット
113 動きベクトル
200 多重番組ビデオ圧縮システム
210 MPEG−2ビデオ符号器
220 バッファ
230 結合レート制御装置
240 マルチプレクサ
250 チャネル・バッファ
255 チャネル・バッファ制御フィードバック
Claims (34)
- ビデオ・フレームの多重ストリームを処理する方法であって、
前記ビデオ・フレームの多重ストリームを並列に符号化するステップと、
前記多重ストリームを含む前記ビデオ・フレームの相対複雑度にもとづき、前記符号化によって使用される符号化ビット・レートを調整して、前記多重ストリームの少なくとも1つのストリームを符号化するステップと、
を含み、
前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始するステップを含み、ここで前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変であり、
前記符号化が多重圧縮ビデオ・ストリームを生成し、かつ前記方法が、各圧縮ビデオ・ストリームをバッファ内にバッファリングするステップを更に含み、かつ前記符号化を動的に適応するステップが、前記各ストリームに対して、前記圧縮ビデオ・ストリームを受信する前記バッファの充填度にもとづき、前記符号化ビット・レートを変更するステップを含み、
前記符号化ビット・レートを変更するステップが、前記符号化ビット・レートを
Rimod=Ri+E・fi/Ni
として変更するステップを含み、
ここで、Riはビデオ・フレームのストリームiに対して計算されたビット・レート、Eはバッファ充填度誤差ビット、NiはストリームiのGOP内のピクチャ数、及びfiはストリームiのフレーム・レートである、前記方法。 - 前記少なくとも1つのストリーム内のシーン変化の検出に応じて、前記少なくとも1つのストリームを符号化することを実行するステップを更に含む、請求項1に記載の方法。
- 前記調整は、前記少なくとも1つのストリーム内のシーン変化の検出に応じて生じる、請求項2に記載の方法。
- 前記少なくとも1つのストリーム内の前記シーン変化を検出するステップを更に含む、請求項3に記載の方法。
- 前記調整して符号化するステップが、前記多重ストリームを含む前記ビデオ・フレームの相対複雑度にもとづき、前記多重ストリームの各ストリームを符号化するステップを含む、請求項1に記載の方法。
- 前記符号化ビット・レートを調整するステップが、前記ストリーム内のシーン変化の検出に応じて、または新たなグループ・オブ・ピクチャ(GOP)の開始に応じて発生するステップを含む、請求項1に記載の方法。
- 前記多重圧縮ビデオ・ストリームを一定ビット・レート・チャネル上に多重化するステップを更に含む、請求項1に記載の方法。
- 前記多重圧縮ビデオ・ストリームを、前記一定ビット・レート・チャネルに接続されたチャネル・バッファ内にバッファリングするステップを更に含み、及び前記符号化ビット・レートを調整するステップが、前記各ストリームに対して、前記チャネル・バッファの充填度にもとづき、前記符号化ビット・レートを変更するステップを含む、請求項7に記載の方法。
- 前記チャネル・バッファの上限及び下限において、保護帯域を事前に定義して、前記バッファ充填度が前記チャネル・バッファの前記上限及び下限の保護帯域内の一つにあるときにはいつも、前記符号化ビット・レートを変更するステップを更に含む、請求項8に記載の方法。
- 前記符号化ビット・レートを変更するステップが、前記バッファ充填度が前記上保護帯域内にある場合に、前記変更が前記バッファ充填度を減少させるか、または前記バッファ充填度を同じに維持するときにのみ前記符号化ビット・レートの変更を可能にし、かつ前記バッファ充填度が前記下保護帯域内にある場合に、前記変更がバッファ充填度を増加させるか、または前記チャネル・バッファ充填度を変化させないときにのみ前記符号化ビット・レートの変更だけを可能にするステップを含む、請求項9に記載の方法。
- 前記符号化ビット・レートを調整するステップが、レート制御アルゴリズムを使用して、前記少なくとも1つのストリームの符号化ビット・レートを制御するステップを含み、及び前記調整して符号化するステップが、符号化統計を前記レート制御アルゴリズムに提供するステップを含み、前記符号化統計が前記多重ストリームの前記符号化から導出される、請求項1に記載の方法。
- 前記符号化するステップが、複数のMPEG符号器を使用して、前記多重ストリームを並列に符号化するステップを含み、各MPEG符号器は、前記多重ストリームのビデオ・フレームの1ストリームを受信する、請求項1に記載の方法。
- 前記多重ストリームを並列に符号化するステップが、多重圧縮ビデオ・ストリームを生成し、及び前記方法が一定ビット・レート・チャネルを介しての転送のために、前記多重圧縮ビデオ・ストリームを多重化するステップを更に含む、請求項1に記載の方法。
- 前記符号化ビット・レートを調整するステップが、レート制御アルゴリズムを使用して、前記少なくとも1つのストリームの符号化ビット・レートを制御するステップを含み、及び前記レート制御アルゴリズムが、前記符号化の結果からの圧縮ビデオ・ストリームを受信するバッファの充填度に部分的にもとづき、前記少なくとも1つのストリームの前記符号化ビット・レートを制御する、請求項1に記載の方法。
- ビデオ・フレームの多重ストリームを処理する方法であって、
前記ビデオ・フレームの多重ストリームを並列に符号化するステップであって、前記符号化は各ビデオ・フレームのストリームの少なくとも1つの符号化ビット・レートを使用することを含む、前記符号化するステップと、
前記符号化の間、前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出するステップであって、前記少なくとも一つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、前記導出するステップと、
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記符号化によって使用される符号化ビット・レートを調整して、前記多重ストリームの少なくとも1つのストリームを符号化するステップと
を含み、
前記少なくとも1つの特性が、前記ビデオ・フレームの前記ストリームに対して、前記前記ストリームを含むビデオ・データの複雑度を含み、前記分析するステップが、前記新たなシーンの最初のフレームの複雑度にもとづき、前記新たなシーンの複雑度を予測するステップを含み、
前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始するステップを含み、前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変である、前記方法。 - 前記分析するステップが、前記ビデオ・フレームの各ストリームを分析して、符号化されるシーンの複雑度に関する情報を導出するステップを含み、前記シーンの前記複雑度は、少なくとも1つの特性を含む、請求項15に記載の方法。
- 前記符号化が多重圧縮ビデオ・ストリームを生成し、及び前記方法が、一定ビット・レート・チャネル上に転送するために、各圧縮ビデオ・ストリームを多重化するステップを更に含む、請求項16に記載の方法。
- 前記多重化するステップは、前記多重化以前に前記各圧縮ビデオ・ストリームをバッファリングするステップを含み、及び前記分析するステップが、前記ビデオ・フレームの各ストリームを分析して、前記それらの少なくとも1つの特性に関する統計を導出するステップを含み、前記統計が、使用されたビット、平均MQUANT、バッファ充填度、またはシーン変化に関する統計の少なくとも1つを含む、請求項17に記載の方法。
- 前記符号化するステップが、前記ビデオ・フレームの各ストリームをグループ・オブ・ピクチャ(GOP)として符号化するステップを含み、及び前記動的に適応するステップが、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットするステップを含み、前記動的にセットするステップは、前記各GOPの始めに起こる、請求項15に記載の方法。
- 前記符号化ビット・レートを調整する前記ステップが、前記ビデオ・フレームの各ストリームの前記GOPの各GOPの符号化ビット・レートを決定するステップを含む、請求項19に記載の方法。
- 前記ビデオ・フレームの各ストリームに対して、前記ストリーム内のシーン変化の検出に応じて、新たな前記GOPを開始するステップを含む、請求項20に記載の方法。
- 前記ビデオ・フレームの多重ストリームが、ビデオ・データの異なるソース、または多重ストリームに分割されたビデオ・データの共通ソースを含む、請求項15に記載の方法。
- ビデオ・フレームの多重ストリームを処理するためのシステムであって、
前記多重ストリームを並列に符号化するための複数の符号器であって、各符号器は、1つのストリームを符号化するために、ビデオ・フレームの符号化ビット・レートを使用する、前記複数の符号器と、
前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出する手段であって、前記少なくとも1つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、前記導出する手段と、
前記多重ストリームの少なくとも1つのストリームを符号化するために、前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記符号化によって使用される符号化ビット・レートを調整する手段と
を含み、
前記少なくとも1つの特性が、前記ビデオ・フレームの前記ストリームに対して、前記ストリームを含むビデオ・データの複雑度を含み、及び前記分析する手段が、前記新たなシーンの最初のフレームの複雑度にもとづき、前記新たなシーンの複雑度を予測する手段を含み、
前記符号化するための複数の符号器が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始するステップを含み、前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変である前記システム。 - 前記分析する手段が、前記ビデオ・フレームの各ストリームを分析して、符号化されるシーンの複雑度に関する情報を導出する手段を含み、前記シーンの前記複雑度は、少なくとも1つの特性を含む、請求項23に記載のシステム。
- 前記複数の符号器が多重圧縮ビデオ・ストリームを生成し、及び前記システムが、一定ビット・レート・チャネル上に転送するために、前記圧縮ビデオ・ストリームを多重化するためのマルチプレクサを更に含む、請求項24に記載のシステム。
- 複数のバッファを更に含み、ここで前記複数のバッファの各バッファは、前記複数の符号器の1つと前記マルチプレクサとの間に接続され、
チャネル・バッファを更に含み、ここで前記チャネル・バッファは、前記マルチプレクサと前記一定ビット・レート・チャネルとの間に接続され、
及び前記分析する手段が、前記ビデオ・フレームの各ストリームを分析して、前記それらの少なくとも1つの特性に関する統計を導出する手段を含み、前記統計が使用されたビット、平均MQUANT、バッファ充填度、またはシーン変化に関する統計の少なくとも1つを含む、請求項25に記載のシステム。 - 前記複数の符号器が、前記ビデオ・フレームの各ストリームをグループ・オブ・ピクチャ(GOP)として符号化する手段を含み、及び前記符号化ビット・レートを調整する手段が、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットする手段を含み、前記動的にセットする手段は、前記各GOPの始めに起こる、請求項23に記載のシステム。
- 前記符号化ビット・レートを調整する手段が、前記ビデオ・フレームの各ストリームの前記GOPの各GOPの符号化ビット・レートを決定する手段を含む、請求項27に記載のシステム。
- 前記ビデオ・フレームの各ストリームに対して、前記ストリーム内のシーン変化の検出に応じて、新たな前記GOPを開始する手段を含む、請求項28に記載のシステム。
- ビデオ・フレームの多重ストリームの処理をコンピュータに指示するコンピュータ読出し可能なプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記コンピュータ読出し可能プログラムが、
前記ビデオ・フレームの多重ストリームを符号化するように、前記コンピュータに指示する段階であって、前記符号化が、ビデオ・フレームの各ストリームの符号化ビット・レートを使用する段階を含む、前記コンピュータに指示する段階と、
前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出するように、前記コンピュータに指示する段階であって、前記少なくとも一つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、前記コンピュータに指示する段階と、
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記符号化によって使用される符号化ビット・レートを調整して、前記多重ストリームの少なくとも1つのストリームを符号化するように、前記コンピュータに指示する段階と、
を含み、
前記少なくとも1つの特性が、前記各ストリームのビデオ・フレームの複雑度を含み、及び前記分析するように前記コンピュータに指示する段階が、前記新たなシーンの最初のフレームの複雑度にもとづき、新たなシーンの複雑度を予測するように、前記コンピュータに指示する段階を含み、
前記符号化が、前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャ(GOP)を開始する段階を含み、前記ビデオ・フレームの各ストリームに対して、前記符号化ビット・レートが各GOP内で一定であり、かつ前記GOP間で可変であるところのプログラムを記録した前記コンピュータ読み取り可能な記録媒体。 - 前記符号化ビット・レートを調整するように前記コンピュータに指示する段階が、前記ビデオ・フレームの各ストリームを分析して、符号化されるシーンの複雑度に関する情報を導出するように、前記コンピュータに指示する段階とを含み、前記シーンの前記複雑度は、少なくとも1つの特性を含むところのプログラムを記録した請求項30に記載のコンピュータ読み取り可能な記録媒体。
- 前記調整して符号化するように前記コンピュータに指示する段階が、前記ビデオ・フレームの各ストリームをグループ・オブ・ピクチャ(GOP)として符号化するように、前記コンピュータに指示する段階を含み、及び前記符号化ビット・レートを調整するように前記コンピュータに指示する段階が、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットするように、前記コンピュータに指示する段階を含み、前記動的にセットすることは、前記各GOPの始めに起こるところのプログラムを記録した請求項30に記載のコンピュータ読み取り可能な記録媒体。
- ビデオ・フレームの多重ストリームの処理をコンピュータに指示するコンピュータ読出し可能なプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記コンピュータ読出し可能プログラムが、
前記ビデオ・フレームの多重ストリームを符号化するように、前記コンピュータに指示する段階であって、前記符号化が、ビデオ・フレームの各ストリームの符号化ビット・レートを使用する段階を含む、前記コンピュータに指示する段階と、
前記各ストリームを分析して、それらの少なくとも1つの特性に関する情報を導出するように、前記コンピュータに指示する段階であって、前記少なくとも一つの特性は、イントラフレーム特性またはインタフレーム特性の少なくとも一つを含む、前記コンピュータに指示する段階と、
前記多重ストリームの各ストリームから獲得された前記少なくとも1つの特性に関する相対情報を使用して、前記符号化によって使用される符号化ビット・レートを調整して、前記多重ストリームの少なくとも1つのストリームを符号化するように、前記コンピュータに指示する段階と
を含み、
前記少なくとも1つのストリームを符号化するように前記コンピュータに指示する段階が、前記各ストリームをグループ・オブ・ピクチャ(GOP)として符号化するように、前記コンピュータに指示する段階を含み、及び前記符号化ビット・レートを調整するように前記コンピュータに指示する段階が、前記各ストリームの前記GOPの各GOPの符号化において使用された前記符号化ビット・レートを動的にセットするように、前記コンピュータに指示する段階を含み、前記動的にセットすることは、前記各GOPの始めに起こり、
前記各ストリームに対して、前記ビデオ・フレームのストリーム内のシーン変化の検出に応じて、新たなグループ・オブ・ピクチャを開始するように、前記コンピュータに指示する段階を含み、及び前記少なくとも1つの特性が、前記各ストリームのビデオ・フレームの複雑度を含み、及び前記分析するように前記コンピュータに指示する段階が、前記新たなシーンの最初のフレームの複雑度にもとづき、新たなシーンの複雑度を予測するように、前記コンピュータに指示する段階を含む、
ところのプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 請求項1〜請求項22のいずれか一項に記載の方法を実行するところのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US8760398A | 1998-05-29 | 1998-05-29 | |
US09/087603 | 1998-05-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000078577A JP2000078577A (ja) | 2000-03-14 |
JP3756346B2 true JP3756346B2 (ja) | 2006-03-15 |
Family
ID=22206168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14634199A Expired - Fee Related JP3756346B2 (ja) | 1998-05-29 | 1999-05-26 | ビデオ・フレームの多重ストリームを処理する方法及びシステム |
Country Status (3)
Country | Link |
---|---|
US (3) | US6859496B1 (ja) |
JP (1) | JP3756346B2 (ja) |
KR (1) | KR100329892B1 (ja) |
Families Citing this family (193)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6859496B1 (en) | 1998-05-29 | 2005-02-22 | International Business Machines Corporation | Adaptively encoding multiple streams of video data in parallel for multiplexing onto a constant bit rate channel |
JP2000261459A (ja) * | 1999-03-10 | 2000-09-22 | Nec Corp | 統計多重伝送方式 |
US20040161032A1 (en) * | 1999-04-06 | 2004-08-19 | Amir Morad | System and method for video and audio encoding on a single chip |
US7389356B2 (en) * | 1999-12-15 | 2008-06-17 | Microsoft Corporation | Generalized differentiation methods and arrangements for adaptive multimedia communications |
AUPR212600A0 (en) * | 2000-12-18 | 2001-01-25 | Canon Kabushiki Kaisha | Efficient video coding |
WO2002093925A1 (en) * | 2001-05-17 | 2002-11-21 | Optibase | Apparatus and method for multiple rich media formats video broadcasting |
US7072393B2 (en) * | 2001-06-25 | 2006-07-04 | International Business Machines Corporation | Multiple parallel encoders and statistical analysis thereof for encoding a video sequence |
US8204079B2 (en) * | 2002-10-28 | 2012-06-19 | Qualcomm Incorporated | Joint transmission of multiple multimedia streams |
KR100494432B1 (ko) * | 2002-12-26 | 2005-06-10 | (주)씨앤에스 테크놀로지 | 비디오서버와 클라이언트간 패킷데이터 처리방법 |
US7907665B2 (en) * | 2003-03-14 | 2011-03-15 | Lsi Corporation | Multi-channel video compression system |
WO2004114666A1 (en) * | 2003-06-23 | 2004-12-29 | Shanghai Dracom Communication Technology Ltd. | Constant stream compression processing method |
JP2005151096A (ja) * | 2003-11-14 | 2005-06-09 | Pioneer Electronic Corp | 多チャンネル統計多重システム |
US8472792B2 (en) | 2003-12-08 | 2013-06-25 | Divx, Llc | Multimedia distribution system |
US7519274B2 (en) | 2003-12-08 | 2009-04-14 | Divx, Inc. | File format for multiple track digital data |
US8427494B2 (en) * | 2004-01-30 | 2013-04-23 | Nvidia Corporation | Variable-length coding data transfer interface |
JP4414904B2 (ja) * | 2004-04-16 | 2010-02-17 | 株式会社エヌ・ティ・ティ・ドコモ | 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム |
US20050243922A1 (en) * | 2004-04-16 | 2005-11-03 | Modulus Video, Inc. | High definition scalable array encoding system and method |
US7590059B2 (en) * | 2004-05-21 | 2009-09-15 | Broadcom Corp. | Multistandard video decoder |
US7592483B2 (en) * | 2004-07-01 | 2009-09-22 | Basf Aktiengesellschaft | Preparation of acrolein or acrylic acid or a mixture thereof by heterogeneously catalyzed partial gas phase oxidation of propylene |
US7643553B2 (en) * | 2004-10-27 | 2010-01-05 | Arris Group, Inc. | Optimal rate allocation for a group of channels |
US7444030B2 (en) * | 2004-11-12 | 2008-10-28 | Micron Technology, Inc. | Image encoding with dynamic buffer-capacity-level-based compression adjustment |
EP1667466A1 (en) * | 2004-12-06 | 2006-06-07 | Thomson Licensing | Method and apparatus for encoding or decoding two digital video signals arranged in a single-video signal path |
US7602820B2 (en) * | 2005-02-01 | 2009-10-13 | Time Warner Cable Inc. | Apparatus and methods for multi-stage multiplexing in a network |
US7610397B2 (en) * | 2005-02-28 | 2009-10-27 | International Business Machines Corporation | Method and apparatus for adaptive load shedding |
US8194707B2 (en) | 2005-02-28 | 2012-06-05 | Broadcom Corporation | Method and system for dynamically allocating video multiplexing buffer based on queuing theory |
CN101185337B (zh) * | 2005-03-10 | 2010-12-08 | 高通股份有限公司 | 具有预见的准恒定质量速率控制 |
US7720017B2 (en) * | 2005-03-11 | 2010-05-18 | Qualcomm Incorporated | Parallel turbo decoders with multiplexed output |
KR101087109B1 (ko) * | 2005-03-28 | 2011-11-25 | 엘지전자 주식회사 | 비디오 부호화 장치 및 그 방법 |
US8687710B2 (en) * | 2005-05-17 | 2014-04-01 | Broadcom Corporation | Input filtering in a video encoder |
US8107540B2 (en) * | 2005-07-11 | 2012-01-31 | Cheetah Technologies, L.P. | Image complexity computation in packet based video broadcast systems |
WO2007006181A1 (en) | 2005-07-14 | 2007-01-18 | Intel Corporation | A rate control method and apparatus |
US7979885B2 (en) * | 2005-08-11 | 2011-07-12 | Harmonic Inc. | Real time bit rate switching for internet protocol television |
JP4449915B2 (ja) * | 2006-02-08 | 2010-04-14 | ソニー株式会社 | 符号化装置、符号化方法およびプログラム、並びに、記録媒体 |
US7515710B2 (en) | 2006-03-14 | 2009-04-07 | Divx, Inc. | Federated digital rights management scheme including trusted systems |
US7714838B2 (en) * | 2006-04-27 | 2010-05-11 | Research In Motion Limited | Handheld electronic device having hidden sound openings offset from an audio source |
WO2007130695A2 (en) * | 2006-05-05 | 2007-11-15 | Globstream, Inc. | Method and apparatus for streaming media to a plurality of adaptive client devices |
US8000395B2 (en) * | 2006-05-24 | 2011-08-16 | Newport Media, Inc. | System and method for statistical multiplexing of video channels for DVB-H mobile TV applications |
US7756136B2 (en) * | 2006-07-10 | 2010-07-13 | Cheetah Technologies, L.P. | Spatial and temporal loss determination in packet based video broadcast system in an encrypted environment |
US8831089B1 (en) * | 2006-07-31 | 2014-09-09 | Geo Semiconductor Inc. | Method and apparatus for selecting optimal video encoding parameter configurations |
KR101270167B1 (ko) | 2006-08-17 | 2013-05-31 | 삼성전자주식회사 | 저복잡도의 이미지 압축 방법 및 장치, 저복잡도의 이미지복원 방법 및 장치 |
US8184692B2 (en) * | 2006-09-25 | 2012-05-22 | Framecaster, Inc. | Distributed and automated video encoding and delivery system |
US8875199B2 (en) | 2006-11-13 | 2014-10-28 | Cisco Technology, Inc. | Indicating picture usefulness for playback optimization |
US8416859B2 (en) | 2006-11-13 | 2013-04-09 | Cisco Technology, Inc. | Signalling and extraction in compressed video of pictures belonging to interdependency tiers |
US8155207B2 (en) | 2008-01-09 | 2012-04-10 | Cisco Technology, Inc. | Processing and managing pictures at the concatenation of two video streams |
KR100837410B1 (ko) * | 2006-11-30 | 2008-06-12 | 삼성전자주식회사 | 주관적인 무손실 이미지 데이터 압축 방법 및 장치 |
US8411734B2 (en) | 2007-02-06 | 2013-04-02 | Microsoft Corporation | Scalable multi-thread video decoding |
JP4901772B2 (ja) | 2007-02-09 | 2012-03-21 | パナソニック株式会社 | 動画像符号化方法及び動画像符号化装置 |
CN101682775B (zh) * | 2007-03-14 | 2015-04-01 | 日本电信电话株式会社 | 运动矢量搜索方法和装置 |
CN101632308B (zh) * | 2007-03-14 | 2011-08-03 | 日本电信电话株式会社 | 编码比特率控制方法和装置 |
BRPI0808489A2 (pt) * | 2007-03-14 | 2014-07-15 | Nippon Telegraph & Telephone | Método e aparelho de controle de quantização, programa para os mesmos, e meio de armazenamento que armazena o programa |
EP2120461B1 (en) * | 2007-03-14 | 2011-07-06 | Nippon Telegraph and Telephone Corporation | Code quantity estimating method and device, their program, and recording medium |
DE102007013026B4 (de) * | 2007-03-19 | 2010-12-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung einer Mehrzahl von Informationssignalen unter Verwendung einer gemeinsamen Rechenleistung |
US9686044B2 (en) * | 2007-03-27 | 2017-06-20 | Qualcomm Incorporated | Rate matching with multiple code block sizes |
US8726125B1 (en) | 2007-06-06 | 2014-05-13 | Nvidia Corporation | Reducing interpolation error |
US8725504B1 (en) | 2007-06-06 | 2014-05-13 | Nvidia Corporation | Inverse quantization in audio decoding |
US8477852B2 (en) * | 2007-06-20 | 2013-07-02 | Nvidia Corporation | Uniform video decoding and display |
US9648325B2 (en) | 2007-06-30 | 2017-05-09 | Microsoft Technology Licensing, Llc | Video decoding implementations for a graphics processing unit |
US8265144B2 (en) * | 2007-06-30 | 2012-09-11 | Microsoft Corporation | Innovations in video decoder implementations |
US8625607B2 (en) | 2007-07-24 | 2014-01-07 | Time Warner Cable Enterprises Llc | Generation, distribution and use of content metadata in a network |
US8804845B2 (en) | 2007-07-31 | 2014-08-12 | Cisco Technology, Inc. | Non-enhancing media redundancy coding for mitigating transmission impairments |
US8958486B2 (en) * | 2007-07-31 | 2015-02-17 | Cisco Technology, Inc. | Simultaneous processing of media and redundancy streams for mitigating impairments |
US8849051B2 (en) * | 2007-09-17 | 2014-09-30 | Nvidia Corporation | Decoding variable length codes in JPEG applications |
US8502709B2 (en) * | 2007-09-17 | 2013-08-06 | Nvidia Corporation | Decoding variable length codes in media applications |
KR20100106327A (ko) | 2007-11-16 | 2010-10-01 | 디브이엑스, 인크. | 멀티미디어 파일을 위한 계층적 및 감소된 인덱스 구조 |
US8687875B2 (en) * | 2007-12-03 | 2014-04-01 | Nvidia Corporation | Comparator based acceleration for media quantization |
US8704834B2 (en) * | 2007-12-03 | 2014-04-22 | Nvidia Corporation | Synchronization of video input data streams and video output data streams |
US8934539B2 (en) * | 2007-12-03 | 2015-01-13 | Nvidia Corporation | Vector processor acceleration for media quantization |
US8718388B2 (en) | 2007-12-11 | 2014-05-06 | Cisco Technology, Inc. | Video processing with tiered interdependencies of pictures |
KR20090061306A (ko) * | 2007-12-11 | 2009-06-16 | 한국전자통신연구원 | 부호화율 제어 기능을 갖는 분산 비디오 코딩 장치 및 방법 |
US9113194B2 (en) * | 2007-12-19 | 2015-08-18 | Arris Technology, Inc. | Method and system for interleaving video and data for transmission over a network at a selected bit rate |
FR2925996B1 (fr) * | 2007-12-31 | 2011-04-15 | Radiotelephone Sfr | Systeme et procede d'adaptation des flux de contenu video a la variabilite des conditions de transmission d'un reseau radiotelephonique et a la dynamique du contenu de la source video |
US8997161B2 (en) * | 2008-01-02 | 2015-03-31 | Sonic Ip, Inc. | Application enhancement tracks |
US8416858B2 (en) | 2008-02-29 | 2013-04-09 | Cisco Technology, Inc. | Signalling picture encoding schemes and associated picture properties |
GB2459671A (en) * | 2008-04-29 | 2009-11-04 | Imagination Tech Ltd | Scene Change Detection For Use With Bit-Rate Control Of A Video Compression System |
US9167007B2 (en) * | 2008-06-06 | 2015-10-20 | Amazon Technologies, Inc. | Stream complexity mapping |
US9047236B2 (en) * | 2008-06-06 | 2015-06-02 | Amazon Technologies, Inc. | Client side stream switching |
US8886022B2 (en) | 2008-06-12 | 2014-11-11 | Cisco Technology, Inc. | Picture interdependencies signals in context of MMCO to assist stream manipulation |
US8971402B2 (en) | 2008-06-17 | 2015-03-03 | Cisco Technology, Inc. | Processing of impaired and incomplete multi-latticed video streams |
US8705631B2 (en) | 2008-06-17 | 2014-04-22 | Cisco Technology, Inc. | Time-shifted transport of multi-latticed video for resiliency from burst-error effects |
US8699578B2 (en) | 2008-06-17 | 2014-04-15 | Cisco Technology, Inc. | Methods and systems for processing multi-latticed video streams |
US20100091888A1 (en) * | 2008-10-13 | 2010-04-15 | General Instrument Corporation | Multi-Rate Encoder with GOP Alignment |
US8259814B2 (en) | 2008-11-12 | 2012-09-04 | Cisco Technology, Inc. | Processing of a video program having plural processed representations of a single video signal for reconstruction and output |
KR20100061908A (ko) * | 2008-12-01 | 2010-06-10 | 엘지전자 주식회사 | 영상표시장치, 영상전송장치, 영상전송방법 및 기록매체 |
US9307267B2 (en) * | 2008-12-11 | 2016-04-05 | Nvidia Corporation | Techniques for scalable dynamic data encoding and decoding |
US8654849B2 (en) * | 2008-12-22 | 2014-02-18 | Arris Enterprises, Inc. | Integrated transcoding |
EP2384475A4 (en) | 2009-01-07 | 2014-01-22 | Sonic Ip Inc | AUTOMATED SINGLE AND GROUP PRODUCTION OF A MEDIA LEADER FOR ONLINE CONTENT |
US8311115B2 (en) * | 2009-01-29 | 2012-11-13 | Microsoft Corporation | Video encoding using previously calculated motion information |
US8396114B2 (en) * | 2009-01-29 | 2013-03-12 | Microsoft Corporation | Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming |
US8311092B2 (en) * | 2009-02-06 | 2012-11-13 | Broadcom Corporation | Network packet aware data encoding |
WO2010096767A1 (en) | 2009-02-20 | 2010-08-26 | Cisco Technology, Inc. | Signalling of decodable sub-sequences |
US8782261B1 (en) | 2009-04-03 | 2014-07-15 | Cisco Technology, Inc. | System and method for authorization of segment boundary notifications |
US8949883B2 (en) | 2009-05-12 | 2015-02-03 | Cisco Technology, Inc. | Signalling buffer characteristics for splicing operations of video streams |
US8270473B2 (en) * | 2009-06-12 | 2012-09-18 | Microsoft Corporation | Motion based dynamic resolution multiple bit rate video encoding |
US8279926B2 (en) | 2009-06-18 | 2012-10-02 | Cisco Technology, Inc. | Dynamic streaming with latticed representations of video |
US8457155B2 (en) * | 2009-09-11 | 2013-06-04 | Nokia Corporation | Encoding and decoding a multi-view video signal |
WO2011068668A1 (en) | 2009-12-04 | 2011-06-09 | Divx, Llc | Elementary bitstream cryptographic material transport systems and methods |
US9521178B1 (en) | 2009-12-21 | 2016-12-13 | Amazon Technologies, Inc. | Dynamic bandwidth thresholds |
US20110222837A1 (en) * | 2010-03-11 | 2011-09-15 | Cisco Technology, Inc. | Management of picture referencing in video streams for plural playback modes |
RU2534370C2 (ru) | 2010-05-06 | 2014-11-27 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ и устройство управления кодированием видео |
US9179165B2 (en) * | 2010-05-07 | 2015-11-03 | Nippon Telegraph And Telephone Corporation | Video encoding control method, video encoding apparatus and video encoding program |
KR101391661B1 (ko) | 2010-05-12 | 2014-05-07 | 니폰덴신뎅와 가부시키가이샤 | 동화상 부호화 제어 방법, 동화상 부호화 장치 및 동화상 부호화 프로그램 |
US8705616B2 (en) | 2010-06-11 | 2014-04-22 | Microsoft Corporation | Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures |
US8660178B2 (en) | 2010-07-01 | 2014-02-25 | Broadcom Corporation | Method and system for multi-layer rate control for a multi-codec system |
US8885729B2 (en) | 2010-12-13 | 2014-11-11 | Microsoft Corporation | Low-latency video decoding |
US9706214B2 (en) | 2010-12-24 | 2017-07-11 | Microsoft Technology Licensing, Llc | Image and video decoding implementations |
US9247312B2 (en) | 2011-01-05 | 2016-01-26 | Sonic Ip, Inc. | Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol |
US8898718B2 (en) | 2011-01-27 | 2014-11-25 | International Business Machines Corporation | Systems and methods for managed video services at edge-of-the-network |
EP2485441B1 (en) * | 2011-01-31 | 2014-10-08 | Alcatel Lucent | A video packet scheduling method for multimedia streaming |
JPWO2012132624A1 (ja) | 2011-03-29 | 2014-07-24 | ルネサスエレクトロニクス株式会社 | 表示装置及び表示装置制御回路 |
EP2523456A1 (en) * | 2011-05-12 | 2012-11-14 | Alcatel Lucent | Method for operating a statistical multiplexing of distributed video streams. |
US8837600B2 (en) | 2011-06-30 | 2014-09-16 | Microsoft Corporation | Reducing latency in video encoding and decoding |
DE102011080253A1 (de) * | 2011-06-30 | 2013-01-03 | Rohde & Schwarz Gmbh & Co. Kg | Verfahren und Vorrichtung zur Erzeugung eines aus mehreren Video-Datenströmen zusammengesetzten Transportdatenstroms |
US20130044811A1 (en) * | 2011-08-18 | 2013-02-21 | Hyung Joon Kim | Content-Based Adaptive Control of Intra-Prediction Modes in Video Encoding |
US8818171B2 (en) | 2011-08-30 | 2014-08-26 | Kourosh Soroushian | Systems and methods for encoding alternative streams of video for playback on playback devices having predetermined display aspect ratios and network connection maximum data rates |
CN108989847B (zh) | 2011-08-30 | 2021-03-09 | 帝威视有限公司 | 用于编码和流处理视频的系统和方法 |
US9467708B2 (en) | 2011-08-30 | 2016-10-11 | Sonic Ip, Inc. | Selection of resolutions for seamless resolution switching of multimedia content |
US8731067B2 (en) | 2011-08-31 | 2014-05-20 | Microsoft Corporation | Memory management for video decoding |
US8964977B2 (en) | 2011-09-01 | 2015-02-24 | Sonic Ip, Inc. | Systems and methods for saving encoded media streamed using adaptive bitrate streaming |
US8909922B2 (en) | 2011-09-01 | 2014-12-09 | Sonic Ip, Inc. | Systems and methods for playing back alternative streams of protected content protected using common cryptographic information |
US9591318B2 (en) | 2011-09-16 | 2017-03-07 | Microsoft Technology Licensing, Llc | Multi-layer encoding and decoding |
US9338482B2 (en) * | 2011-11-30 | 2016-05-10 | Mobitv, Inc. | Enhanced group of pictures (GOP) alignment in media stream variants |
GB201120894D0 (en) * | 2011-12-06 | 2012-01-18 | Global Invacom Ltd | Configuration data transmission system using coaxial and/or fibre optic distribution network |
US9819949B2 (en) | 2011-12-16 | 2017-11-14 | Microsoft Technology Licensing, Llc | Hardware-accelerated decoding of scalable video bitstreams |
US20130179199A1 (en) | 2012-01-06 | 2013-07-11 | Rovi Corp. | Systems and methods for granting access to digital content using electronic tickets and ticket tokens |
US11089343B2 (en) | 2012-01-11 | 2021-08-10 | Microsoft Technology Licensing, Llc | Capability advertisement, configuration and control for video coding and decoding |
US10003802B1 (en) | 2012-04-18 | 2018-06-19 | Matrox Graphics Inc. | Motion-based adaptive quantization |
US10003803B1 (en) | 2012-04-18 | 2018-06-19 | Matrox Graphics Inc. | Motion-based adaptive quantization |
US8873872B1 (en) | 2012-04-18 | 2014-10-28 | Matrox Graphics Inc. | Division of entropy coding in codecs |
TWI505262B (zh) | 2012-05-15 | 2015-10-21 | Dolby Int Ab | 具多重子流之多通道音頻信號的有效編碼與解碼 |
US9532080B2 (en) | 2012-05-31 | 2016-12-27 | Sonic Ip, Inc. | Systems and methods for the reuse of encoding information in encoding alternative streams of video data |
US9197685B2 (en) | 2012-06-28 | 2015-11-24 | Sonic Ip, Inc. | Systems and methods for fast video startup using trick play streams |
US9143812B2 (en) | 2012-06-29 | 2015-09-22 | Sonic Ip, Inc. | Adaptive streaming of multimedia |
US10452715B2 (en) | 2012-06-30 | 2019-10-22 | Divx, Llc | Systems and methods for compressing geotagged video |
US11284133B2 (en) | 2012-07-10 | 2022-03-22 | Avago Technologies International Sales Pte. Limited | Real-time video coding system of multiple temporally scaled video and of multiple profile and standards based on shared video coding information |
US9426498B2 (en) | 2012-07-10 | 2016-08-23 | Broadcom Corporation | Real-time encoding system of multiple spatially scaled video based on shared video coding information |
WO2014015110A1 (en) | 2012-07-18 | 2014-01-23 | Verimatrix, Inc. | Systems and methods for rapid content switching to provide a linear tv experience using streaming content distribution |
US20140063340A1 (en) * | 2012-09-05 | 2014-03-06 | Vixs Systems, Inc. | Video processing device with buffer feedback and methods for use therewith |
US20140072027A1 (en) | 2012-09-12 | 2014-03-13 | Ati Technologies Ulc | System for video compression |
US9491494B2 (en) * | 2012-09-20 | 2016-11-08 | Google Technology Holdings LLC | Distribution and use of video statistics for cloud-based video encoding |
US8914836B2 (en) | 2012-09-28 | 2014-12-16 | Sonic Ip, Inc. | Systems, methods, and computer program products for load adaptive streaming |
US8997254B2 (en) | 2012-09-28 | 2015-03-31 | Sonic Ip, Inc. | Systems and methods for fast startup streaming of encrypted multimedia content |
US9516078B2 (en) | 2012-10-26 | 2016-12-06 | Cisco Technology, Inc. | System and method for providing intelligent chunk duration |
US9319702B2 (en) * | 2012-12-03 | 2016-04-19 | Intel Corporation | Dynamic slice resizing while encoding video |
US9264475B2 (en) | 2012-12-31 | 2016-02-16 | Sonic Ip, Inc. | Use of objective quality measures of streamed content to reduce streaming bandwidth |
US9191457B2 (en) | 2012-12-31 | 2015-11-17 | Sonic Ip, Inc. | Systems, methods, and media for controlling delivery of content |
US9313510B2 (en) | 2012-12-31 | 2016-04-12 | Sonic Ip, Inc. | Use of objective quality measures of streamed content to reduce streaming bandwidth |
US10045032B2 (en) | 2013-01-24 | 2018-08-07 | Intel Corporation | Efficient region of interest detection |
US20140244798A1 (en) * | 2013-02-27 | 2014-08-28 | Cisco Technology, Inc. | TCP-Based Weighted Fair Video Delivery |
US9350990B2 (en) | 2013-02-28 | 2016-05-24 | Sonic Ip, Inc. | Systems and methods of encoding multiple video streams with adaptive quantization for adaptive bitrate streaming |
US9357210B2 (en) | 2013-02-28 | 2016-05-31 | Sonic Ip, Inc. | Systems and methods of encoding multiple video streams for adaptive bitrate streaming |
US20140281034A1 (en) * | 2013-03-13 | 2014-09-18 | Futurewei Technologies, Inc. | System and Method for Compressing Data Associated with a Buffer |
US9906785B2 (en) | 2013-03-15 | 2018-02-27 | Sonic Ip, Inc. | Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata |
US10397292B2 (en) | 2013-03-15 | 2019-08-27 | Divx, Llc | Systems, methods, and media for delivery of content |
US9344517B2 (en) | 2013-03-28 | 2016-05-17 | Sonic Ip, Inc. | Downloading and adaptive streaming of multimedia content to a device with cache assist |
US10110647B2 (en) * | 2013-03-28 | 2018-10-23 | Qualcomm Incorporated | Method and apparatus for altering bandwidth consumption |
US20140301481A1 (en) * | 2013-04-04 | 2014-10-09 | Magnum Semiconductor, Inc. | Apparatuses and methods for pooling multiple channels into a multi-program transport stream |
US9247317B2 (en) | 2013-05-30 | 2016-01-26 | Sonic Ip, Inc. | Content streaming with client device trick play index |
US9094737B2 (en) | 2013-05-30 | 2015-07-28 | Sonic Ip, Inc. | Network video streaming with trick play based on separate trick play files |
US9210381B2 (en) | 2013-06-24 | 2015-12-08 | Dialogic Corporation | Resource-adaptive video encoder sharing in multipoint control unit |
US9967305B2 (en) | 2013-06-28 | 2018-05-08 | Divx, Llc | Systems, methods, and media for streaming media content |
US9343112B2 (en) | 2013-10-31 | 2016-05-17 | Sonic Ip, Inc. | Systems and methods for supplementing content from a server |
US11861906B2 (en) | 2014-02-28 | 2024-01-02 | Genius Sports Ss, Llc | Data processing systems and methods for enhanced augmentation of interactive video content |
US11120271B2 (en) | 2014-02-28 | 2021-09-14 | Second Spectrum, Inc. | Data processing systems and methods for enhanced augmentation of interactive video content |
US10769446B2 (en) | 2014-02-28 | 2020-09-08 | Second Spectrum, Inc. | Methods and systems of combining video content with one or more augmentations |
US10713494B2 (en) | 2014-02-28 | 2020-07-14 | Second Spectrum, Inc. | Data processing systems and methods for generating and interactive user interfaces and interactive game systems based on spatiotemporal analysis of video content |
US10521671B2 (en) | 2014-02-28 | 2019-12-31 | Second Spectrum, Inc. | Methods and systems of spatiotemporal pattern recognition for video content development |
US9866878B2 (en) | 2014-04-05 | 2018-01-09 | Sonic Ip, Inc. | Systems and methods for encoding and playing back video at different frame rates using enhancement layers |
US20150312601A1 (en) * | 2014-04-28 | 2015-10-29 | Magnum Semiconductor, Inc. | Methods and apparatuses including a statistical multiplexer with multiple channel rate control |
WO2015194395A1 (ja) | 2014-06-20 | 2015-12-23 | ソニー株式会社 | 送信装置および送信方法、並びに受信装置および受信方法 |
US9955168B2 (en) * | 2015-02-11 | 2018-04-24 | Arris Enterprises Llc | Constraining number of bits generated relative to VBV buffer |
US9716735B2 (en) | 2015-02-18 | 2017-07-25 | Viasat, Inc. | In-transport multi-channel media delivery |
GB2540204B (en) * | 2015-07-10 | 2019-10-30 | Canon Kk | Rate control of streaming modules sharing a communication channel |
US10499070B2 (en) | 2015-09-11 | 2019-12-03 | Facebook, Inc. | Key frame placement for distributed video encoding |
US10341561B2 (en) | 2015-09-11 | 2019-07-02 | Facebook, Inc. | Distributed image stabilization |
US10602157B2 (en) | 2015-09-11 | 2020-03-24 | Facebook, Inc. | Variable bitrate control for distributed video encoding |
US10602153B2 (en) | 2015-09-11 | 2020-03-24 | Facebook, Inc. | Ultra-high video compression |
US10063872B2 (en) * | 2015-09-11 | 2018-08-28 | Facebook, Inc. | Segment based encoding of video |
US10506235B2 (en) | 2015-09-11 | 2019-12-10 | Facebook, Inc. | Distributed control of video encoding speeds |
US10375156B2 (en) | 2015-09-11 | 2019-08-06 | Facebook, Inc. | Using worker nodes in a distributed video encoding system |
US10075292B2 (en) | 2016-03-30 | 2018-09-11 | Divx, Llc | Systems and methods for quick start-up of playback |
US10171825B1 (en) | 2016-04-27 | 2019-01-01 | Matrox Graphics Inc. | Parallel compression of image data in a compression device |
US10148989B2 (en) | 2016-06-15 | 2018-12-04 | Divx, Llc | Systems and methods for encoding video content |
US10812550B1 (en) * | 2016-08-03 | 2020-10-20 | Amazon Technologies, Inc. | Bitrate allocation for a multichannel media stream |
EP3513566A4 (en) * | 2016-09-16 | 2019-09-11 | Second Spectrum, Inc. | METHODS AND SYSTEMS FOR SPATIOTEMPOREL PATTERN RECOGNITION FOR VIDEO CONTENT DEVELOPMENT |
US10498795B2 (en) | 2017-02-17 | 2019-12-03 | Divx, Llc | Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming |
US10979728B2 (en) | 2017-04-24 | 2021-04-13 | Intel Corporation | Intelligent video frame grouping based on predicted performance |
WO2018204746A1 (en) | 2017-05-04 | 2018-11-08 | Second Spectrum, Inc. | Method and apparatus for automatic intrinsic camera calibration using images of a planar calibration pattern |
US10360695B1 (en) | 2017-06-01 | 2019-07-23 | Matrox Graphics Inc. | Method and an apparatus for enabling ultra-low latency compression of a stream of pictures |
US10225211B2 (en) | 2017-07-20 | 2019-03-05 | Arris Enterprises Llc | Statistical multiplexer with service priority weighting |
US11113535B2 (en) | 2019-11-08 | 2021-09-07 | Second Spectrum, Inc. | Determining tactical relevance and similarity of video sequences |
CN112788198B (zh) * | 2019-11-11 | 2024-04-23 | 株式会社理光 | 摄影装置、传送系统及方法、记录介质和计算机装置 |
US11284074B2 (en) * | 2019-12-20 | 2022-03-22 | Intel Corporation | Cross-channel look ahead rate control for multi-channel video encoding |
CN117596395B (zh) * | 2024-01-18 | 2024-05-07 | 浙江大华技术股份有限公司 | 一种码率控制方法、装置和计算机可读存储介质 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5115309A (en) * | 1990-09-10 | 1992-05-19 | At&T Bell Laboratories | Method and apparatus for dynamic channel bandwidth allocation among multiple parallel video coders |
JPH0662393A (ja) | 1992-08-04 | 1994-03-04 | G C Technol Kk | 多重化した動画像符号化方法と装置 |
JP2500582B2 (ja) | 1993-03-17 | 1996-05-29 | 日本電気株式会社 | 動画像信号の多重化伝送方法とその装置 |
JP3535548B2 (ja) | 1993-12-22 | 2004-06-07 | 日本放送協会 | 多チャネル画像信号符号化多重装置 |
EP0660619A1 (fr) * | 1993-12-22 | 1995-06-28 | Laboratoires D'electronique Philips S.A.S. | Procédé de codage d'images à longueur variable et dispositif de mise en oeuvre d'un tel procédé |
US5592226A (en) | 1994-01-26 | 1997-01-07 | Btg Usa Inc. | Method and apparatus for video data compression using temporally adaptive motion interpolation |
KR100213014B1 (ko) | 1994-03-15 | 1999-08-02 | 윤종용 | 동화상신호의 고능률 부호화를 위한 레이트 콘트롤 장치 |
US5576765A (en) * | 1994-03-17 | 1996-11-19 | International Business Machines, Corporation | Video decoder |
JPH07264580A (ja) | 1994-03-17 | 1995-10-13 | Toshiba Corp | 映像信号伝送方法並びに映像信号送信装置及び映像信号受信装置 |
KR100213015B1 (ko) | 1994-03-31 | 1999-08-02 | 윤종용 | 양자화 방법 및 회로 |
JP3711571B2 (ja) | 1994-09-29 | 2005-11-02 | ソニー株式会社 | 画像符号化装置及び画像符号化方法 |
JPH08163554A (ja) * | 1994-12-02 | 1996-06-21 | Electron & Telecommun Res Inst | ビデオビット率制御方法 |
US5619337A (en) * | 1995-01-27 | 1997-04-08 | Matsushita Electric Corporation Of America | MPEG transport encoding/decoding system for recording transport streams |
US5533021A (en) | 1995-02-03 | 1996-07-02 | International Business Machines Corporation | Apparatus and method for segmentation and time synchronization of the transmission of multimedia data |
JP4388598B2 (ja) * | 1995-02-22 | 2009-12-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 伝送チャネルを介して複数のビデオプログラムを同時に送信するシステム |
JPH0951538A (ja) | 1995-08-07 | 1997-02-18 | Hitachi Ltd | 画像信号の符号化方法 |
JP3216503B2 (ja) | 1995-10-20 | 2001-10-09 | 三菱電機株式会社 | 多重化装置および多重化方法 |
US5861919A (en) | 1995-12-18 | 1999-01-19 | Divicom | Dynamic rate optimization for an ensemble of video encoders |
US5764293A (en) * | 1995-12-26 | 1998-06-09 | C-Cube Microsystems, Inc. | Method of encoding video using master and slave encoders wherein bit budgets for frames to be encoded are based on encoded frames |
US5650860A (en) | 1995-12-26 | 1997-07-22 | C-Cube Microsystems, Inc. | Adaptive quantization |
US5686963A (en) * | 1995-12-26 | 1997-11-11 | C-Cube Microsystems | Method for performing rate control in a video encoder which provides a bit budget for each frame while employing virtual buffers and virtual buffer verifiers |
JPH09252290A (ja) | 1996-01-11 | 1997-09-22 | Sony Corp | 符号化装置、符号化方法、伝送装置、伝送方法及び記録媒体 |
US5793425A (en) * | 1996-09-13 | 1998-08-11 | Philips Electronics North America Corporation | Method and apparatus for dynamically controlling encoding parameters of multiple encoders in a multiplexed system |
US6038256A (en) * | 1996-12-31 | 2000-03-14 | C-Cube Microsystems Inc. | Statistical multiplexed video encoding using pre-encoding a priori statistics and a priori and a posteriori statistics |
US6084910A (en) * | 1997-01-31 | 2000-07-04 | Hughes Electronics Corporation | Statistical multiplexer for video signals |
US6005620A (en) * | 1997-01-31 | 1999-12-21 | Hughes Electronics Corporation | Statistical multiplexer for live and pre-compressed video |
US6118823A (en) * | 1997-04-01 | 2000-09-12 | International Business Machines Corporation | Control scheme for shared-use dual-port predicted error array |
US6181821B1 (en) * | 1997-04-30 | 2001-01-30 | Massachusetts Institute Of Technology | Predictive source encoding and multiplexing |
CA2264392A1 (en) | 1997-07-01 | 1999-01-14 | Sony Corporation | Device and method for controlling image encoding, encoding system, transmission system and broadcast system |
US6040861A (en) * | 1997-10-10 | 2000-03-21 | International Business Machines Corporation | Adaptive real-time encoding of video sequence employing image statistics |
KR19990042668A (ko) * | 1997-11-27 | 1999-06-15 | 정선종 | 다중 비디오 전송을 위한 비디오 부호화 장치 및 방법 |
US6859496B1 (en) | 1998-05-29 | 2005-02-22 | International Business Machines Corporation | Adaptively encoding multiple streams of video data in parallel for multiplexing onto a constant bit rate channel |
US6167084A (en) * | 1998-08-27 | 2000-12-26 | Motorola, Inc. | Dynamic bit allocation for statistical multiplexing of compressed and uncompressed digital video signals |
EP1005233A1 (en) | 1998-10-12 | 2000-05-31 | STMicroelectronics S.r.l. | Constant bit-rate coding control in a video coder by way of pre-analysis of the slices of the pictures |
WO2000041397A1 (en) | 1999-01-06 | 2000-07-13 | Sarnoff Corporation | Computer system for statistical multiplexing of bitstreams |
-
1999
- 1999-01-05 US US09/225,193 patent/US6859496B1/en not_active Expired - Fee Related
- 1999-05-21 KR KR1019990018430A patent/KR100329892B1/ko not_active IP Right Cessation
- 1999-05-26 JP JP14634199A patent/JP3756346B2/ja not_active Expired - Fee Related
-
2002
- 2002-01-18 US US10/051,004 patent/US7085322B2/en not_active Expired - Fee Related
-
2004
- 2004-04-29 US US10/834,643 patent/US6956901B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR100329892B1 (ko) | 2002-03-22 |
KR19990088475A (ko) | 1999-12-27 |
US20020094031A1 (en) | 2002-07-18 |
US6859496B1 (en) | 2005-02-22 |
US20040202248A1 (en) | 2004-10-14 |
US7085322B2 (en) | 2006-08-01 |
JP2000078577A (ja) | 2000-03-14 |
US6956901B2 (en) | 2005-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3756346B2 (ja) | ビデオ・フレームの多重ストリームを処理する方法及びシステム | |
US6643327B1 (en) | Statistical multiplexer and remultiplexer that accommodates changes in structure of group of pictures | |
CA2396305C (en) | Methods and apparatus for rate control during dual pass encoding | |
EP2123040B1 (en) | An improved video rate control for video coding standards | |
US7170938B1 (en) | Rate control method for video transcoding | |
CA2688249C (en) | A buffer-based rate control exploiting frame complexity, buffer level and position of intra frames in video coding | |
US8374236B2 (en) | Method and apparatus for improving the average image refresh rate in a compressed video bitstream | |
KR20010073001A (ko) | 압축 및 압축되지 않은 디지탈 비디오신호의 통계적다중화를 위한 동적 비트할당방법 및 그 장치 | |
US20100166060A1 (en) | Video transcoder rate control | |
CA2396308C (en) | Methods and apparatus for statistical multiplexing during dual pass encoding | |
US20100150168A1 (en) | Method and apparatus for multiplexing of digital video | |
US7826530B2 (en) | Use of out of order encoding to improve video quality | |
US8948242B2 (en) | Encoding device and method and multimedia apparatus including the encoding device | |
Wang et al. | Bit allocation and constraints for joint coding of multiple video programs | |
JP4346732B2 (ja) | ビデオ・フレームの多重ストリームを処理する方法及びシステム | |
Xin et al. | Bit-allocation for transcoding pre-encoded video streams | |
KR101371507B1 (ko) | 저지연 영상 통신 시스템 및 방법 | |
KR100286108B1 (ko) | 실시간 처리를 위한 비디오 신호에 대한 비트수 추정방법과왜곡추정방법 및 이것들을 이용한 부호화방법과 그 장치 | |
EP1944980A2 (en) | Bit rate control algorithm | |
Böröczky et al. | Statistical multiplexing with look-ahead using MPEG-2 video encoding | |
JP2002058038A (ja) | 画像符号化方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20051028 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20051117 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051117 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20051213 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20051213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051221 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100106 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100106 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110106 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120106 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130106 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140106 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |