JPH07202820A - ビットレート制御システム - Google Patents

ビットレート制御システム

Info

Publication number
JPH07202820A
JPH07202820A JP33697593A JP33697593A JPH07202820A JP H07202820 A JPH07202820 A JP H07202820A JP 33697593 A JP33697593 A JP 33697593A JP 33697593 A JP33697593 A JP 33697593A JP H07202820 A JPH07202820 A JP H07202820A
Authority
JP
Japan
Prior art keywords
image
bit rate
audio
video
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP33697593A
Other languages
English (en)
Inventor
Shii Yun Fuan
ユン ファン・シー
Oo Pen Tan
ペン タン・オー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP33697593A priority Critical patent/JPH07202820A/ja
Priority to US08/361,438 priority patent/US5617145A/en
Priority to KR1019940037203A priority patent/KR950023017A/ko
Priority to EP19940120862 priority patent/EP0665693B1/en
Priority to DE1994623465 priority patent/DE69423465T2/de
Publication of JPH07202820A publication Critical patent/JPH07202820A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/242Synchronization processes, e.g. processing of PCR [Program Clock References]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】 音声符号化により得られるビット節約が、画
像品質を向上するためにヒ゛ット符号器により効率的に使用
されるように、音声とヒ゛テ゛オの符号器間に通信リンクを設け
るシステムを提供すること。 【構成】 動的にヒ゛ットレートを制御するヒ゛ットレート制御システムで
あって、音声信号を符号化し、ヒ゛テ゛オ符号器用に使用し
得る、音声符号器で節約されたヒ゛ット総数を与える可変ヒ゛
ットレート音声符号器2と、毎秒一定数の画像単位で入力ヒ゛テ゛
オシーケンスを符号化する可変ヒ゛ットレートヒ゛テ゛オ符号器10と、可変
ヒ゛ットレート音声符号器の出力を利用して、符号化される現
行画像に利用できるヒ゛ット総数を動的に割り当てるヒ゛ットレー
ト割り当て器5と、符号化された音声とヒ゛テ゛オのヒ゛ットストリーム
をハ゛ッファリンク゛し、組合わせられたヒ゛テ゛オおよび関連する音
声の一定ヒ゛ットレートヒ゛ットストリームを与えるFIFOハ゛ッファ11と、音
声とヒ゛テ゛オの信号を同期化するために加えられる時刻表
示で、音声とヒ゛テ゛オのヒ゛ットストリームを多重化する多重装置14
とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、非常に低いビットレー
トのビデオと関連音声の符号化に関し、特に一定ビット
レートシステムにおける音声信号の瞬時ビットレート消
費に従ってビデオビットレートを動的に割り当てる方法
に関するものである。
【0002】
【従来の技術】ディジタル式のビデオと関連音声の符号
化は、ディジタル信号の記憶、処理、伝送および分配と
いう産業上の用途において重要な役割を果たす。各種の
標準化組織により種々のディジタル符号化規格が制定さ
れ、又は制定中である。動画と関連音声の符号化の場
合、典型的な符号化方法は、3 つの部分、すなわちビデ
オ符号化、音声符号化およびシステム多重化を包含す
る。
【0003】MPEGのフェーズ1とフェーズ2の規格によ
り採用される現行の変換符号化アルゴリズムは、変換、
量子化および可変長符号化などの手法を包含する。符号
化効率を向上するために、画像間予測、および動きの予
測と補正などの予測符号化手法が使用される。まず、画
像は、画像自体内の空間的冗長さを減らすことにより符
号化できる。このようにして符号化された画像は、通常
I 画像と呼ばれる。画像は又、画像間モードでも符号化
できる。画像が先行画像から予測されるならば、それは
P 画像と呼ばれる。画像が先行画像と後続画像との両方
から予測されるならば、それは双方向予測符号化画像を
指し、通常B 画像と呼ばれる。現行のビデオ符号化方法
の主な特徴は、符号化されたビットストリームのビット
レートがFIFOバッファを使用することにより一定に固定
されるということにある。バッファの充足度は、各符号
化された画像のビットレートを制御して、I 画像、B 画
像およびP 画像に利用できるビットと量子化ステップを
調整するのに使用される。
【0004】多くの音声符号化アルゴリズムは、ディジ
タル通信リンク技術、移動体通信技術、娯楽やマルチメ
ディアのサービスの導入技術と共に出現している。特に
種々の非常に低いビットレート音声符号化アルゴリズム
は、伝送ビットレート、または音声記憶システムの記憶
容量を減少するために標準化されている。市外通話品質
音声は、最近標準化されたCCITT G.728 16キロビット/
秒の符号器- 復号器から得ることができる。通信品質
は、USA 連邦規格1016 4.8キロビット/ 秒の音声符号器
を使用して得ることができる。北米と日本のセル方式通
信向けに標準化されたVector Sum Excited Linear Pred
ictive Coder( ベクトル和励起線形予測符号器) は、8.
0 キロビット/ 秒の作動における市外通話品質に近いも
のを提供する。これらのアルゴリズムは一般的に、符号
励起符号器またはベクトル励起線形予測符号器として知
られる音声符号器の部類に一般的に入り、また典型的に
は一定ビットレート伝送を意図している。音声フレーム
当たりのビット数も一定に維持される。
【0005】音声符号化のために非常に限定された可変
ビットレートは、パケット交換網、ディジタル音声補間
システムおよびディジタル通信多重化装置システムにつ
いて考慮されている。システム符号器の主な機能は、ビ
デオと音声情報の復号と表示を同期化するために必要に
して十分な情報を提供することにあり、また同時に復号
器のバッファにおける符号化データがオーバーフローま
たはアンダーフローしないことを保証することにある。
システムレイヤ情報の符号化は、データをパケットにパ
ケット化すること、およびパケットヘッダー用の時刻表
示を作成することを含む。2 つの時刻表示が使用され
る。すなわち、音声フレームまたはビデオ画像の提示ユ
ニットを演奏または放送する必要がある時刻を示す提示
時刻表示(PTS) 、および音声またはビデオ画像を復号化
する時刻を示す復号時刻表示(DTS)である。PTS およびD
TS は、システムクロック基準(SCR) と呼ばれる共通時
刻ベースを有して、測時の計測を統一し、かつ適正な同
期化およびバッファ管理を確実にするようにする。固定
された一定ビットレート環境においては、システムは、
適正なバッファ管理のために固定されたビットレートの
音声とビデオを必要とする。
【0006】
【発明が解決しようとする課題】しかし、上述した従来
の符号化方法は、種々の非常に低いビットレートのビデ
オと関連音声の符号化用途にとり、重要な要因である非
常に高い圧縮比および符号化効率の達成を妨げる下記の
問題点を有する。
【0007】すなわち、現行の符号化方法の非能率は下
記項目から生じる。 1) 一定の音声ビットレート 現行の音声符号化方法は、一定ビットレートで音声信号
を符号化する。我々が音声情報を、信号の強さと周波数
分布に影響する複雑性測度と定義するならば、時間と共
に異なる複雑性を見出す。例えばテレビ電話を考えた場
合、通信の一方の当事者が話していると、他方の当事者
は通常無言で聞いている。すなわち聞き手が音声を入力
しない瞬間がある。第2 に、人の通話の中にも無言の瞬
間が存在する。一定音声符号器は、これらの無言の瞬間
に帯域幅を浪費する。非常に低いビットレート符号化用
途の場合、音声はビデオと同様、またはそれより高い帯
域幅を占めることがある。ここで解決しようとする問題
点は、音声符号化に可変ビットレート符号器を使用し、
かつ音声符号化用のビットを節約することにある。 2) 一定のビデオビットレート 現行のビデオ符号化方法は、符号器の末端部にFIFOバッ
ファを使用することにより一定ビットストリーム出力を
提供する。瞬時ビット使用およびバッファ充足度は、各
画像用のビットと量子化ステップを調整するのに使用さ
れる。後者は、画像内の次に符号化されるマクロブロッ
クのビットレートを制御するのに使用される。このビッ
トレート制御プロセスは、ビデオ符号器自体内で実施さ
れ、それは音声符号器のビット使用とは関係ない。ビデ
オ符号化品質を向上するために音声符号器からのビット
節約をどのようにして利用するかが、解決しようとする
問題点である。 3) ビデオ動的ビットレート制御 現行のビデオ符号化方法は、一定数のビットを各画像に
割り当て、かつ画像のマクロブロック毎に量子化ステッ
プを調整することによりビットレート制御を実施する。
量子化ステップを、その最小値まで調整するに足る以上
の利用できる十分なビットがある場合がある。そのよう
な状態下で、余分のビットは効率的には使用できない。
他の問題点は、最小の量子化ステップが、所定の符号化
モードでの画像、すなわちI 画像、B 画像およびP 画像
を符号化する最良の方法であるかどうかということであ
る。特に現行の画像がB 画像で符号化されるように設定
されているときに、利用できるビット総数がP 画像また
はI 画像で符号化するに十分な量である場合でも、小さ
い量子化ステップをB 画像に与えることが、P 画像より
も、またはI 画像さえよりも良好な符号化画像品質を与
えるであろうか。上述の検討は、I 画像、B 画像および
P 画像符号化モードをどのようにして動的に選定するか
の問題として結論付けられるであろう。
【0008】この項目に基づく第2 の問題点は、符号化
システムの画像レートが実時間ビデオの表示に必要なレ
ートよりも低い、非常に低いビットレートの場合に生じ
る。一例としてテレビ電話用途の場合に画像レートは、
毎秒ほぼ10画像に通常設定される。この減少した画像レ
ートでは、画像中の物体の動きが速過ぎるならば、動き
がギクシャクした現像が現れるであろう。この問題点
は、場面が変わるときと同様に、予測符号化を困難にす
る。画像を所定の画像レート以上に挿入するために利用
できるビットを如何に効率的に利用するかは、画像符号
化品質を向上するために取り上げるべき他の問題であ
る。 4) システム多重器 現行のシステム多重器は、一定ビットレートの音声とビ
デオのビットストリームだけを受入れて、それらを一定
ビットレートシステムビットストリームに多重化する。
2 つの符号器間の動的帯域幅の割り当ての場合に音声と
ビデオの符号器を制御する機構はない点が問題である。
【0009】本発明は、このような従来の課題を考慮
し、音声符号化により得られるビット節約が、画像品質
を向上するためにビット符号器により効率的に使用され
るように、音声とビデオの符号器間に通信リンクを設け
ること、また、可変I 画像、B画像、P 画像のモードお
よび動的画像挿入のため、一層柔軟なビデオビットレー
ト制御機構を提供することを目的とするものである。
【0010】
【課題を解決するための手段】本発明の、動的ビットレ
ートビデオと関連音声符号化システムは、先ず音声の数
フレームを符号化する。この音声フレーム数は、システ
ムの画像レートにより決められる。ついで、そのシステ
ムは、ビット消費をカウントし、また先行画像符号化期
間中に音声符号器からのビット節約を計算する。入力音
声レベルを監視し、かつその周波数とエネルギー成分を
分析することにより、無音期間中に最大のビット数が節
約できる。有音期間の場合、各音声フレームの符号化に
使用されるビット数は、所定の周波数重みつき信号対ノ
イズの値、または所要の音声品質レベルを保証するよう
に選定される。
【0011】音声符号器で節約されるビット数は、ビッ
トレート割り当て器へ送られ、その割り当て器は、符号
化された先行画像のビット消費量および先入れ先出し(F
IFO)バッファの充足度を調べ、これらの値をもとに現行
画像符号化に利用できるビットを計算する。
【0012】現行画像に利用できるビット総数は、ビデ
オ符号器内の符号化モード選定器へ送られる。この符号
化モード選定器は、現行画像をI 画像、B 画像又はP 画
像のいづれに符号化するかを決定する。又、画像レート
が実時間ビデオ用途により必要とされる通常画像レート
よりも低いときに余分の画像を挿入すべきであるか否か
も決定する。この利用できるビット総数は、画像符号化
モードが選定された後、現行符号化方法と同様な方法で
量子化ステップを制御するのにも使用される。
【0013】システム多重器は、該当するビデオと音声
の同期をとる為に時刻表示をシステムパケットに挿入す
ることにより、音声符号化に対するビデオ遅延を埋め合
わせることを可能にする。ついで同期化された音声とビ
デオのビットストリームは多重化されて、一定ビットレ
ートシステムビットストリームを形成する。
【0014】
【作用】本発明では、例えば、ビット節約計数器(BSC 2
5) は、各音声フレームが符号化された後にビット節約
を計算する。BSC 25は、ビットレート割り当て器(BRA)5
から要求信号を一旦受信すると、先行画像符号化期間中
に音声フレームにより節約されたビット数を計算する。
この節約ビット総数はBsとして示される。このビット節
約総数4 は、ビデオ符号化用に音声符号器2 により与え
得るビット総数として、BRA 5 に通知される。
【0015】同時に、先行画像により使用されたビット
総数のB u 7 は、ビデオ符号器10によりBRA 5 に供給さ
れる。同様にFIFOバッファ11の充足度のB f 9 も、FIFO
バッファ11内の充足度検出器により供給される。これら
の3 つのパラメータであるB s 、B u およびB f はつい
で、現行画像符号化に利用できるビットB a 8 の計算の
ために、BRA 5 により使用される。
【0016】BRA 5 により供給されるB a 8 の総数に従
って、ビデオ符号器10は種々の画像符号化モードを選定
して、考えられる最良の画像符号化品質を達成するよう
にする。符号化された画像の出力12は、FIFOバッファ11
へ送られる。現行画像のビット使用量7 は、次の画像符
号化の使用のためにBRA 5 に報告される。
【0017】符号化された音声3 とビデオ12のビットス
トリームはついで、システム多重器14により多重化さ
れ、そこで音声とビデオの同期化が実現される。システ
ム多重器14は、一定ビットレートで音声とビデオを多重
化して、通信チャネルまたはディジタル記憶媒体への一
定システムビットストリームを生成する。
【0018】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。
【0019】本発明における、組合わせた音声とビデオ
符号化の動的ビットレート制御を用いた符号化システム
は、例えば、図 1に図示される。符号化システムは、音
声符号器2 、ビデオ符号器10、先入れ先出し(FIFO)バッ
ファ11、ビットレート割り当て器5 およびシステム多重
器14を備える。本発明は、そのようなシステム構成と作
用を包含するだけではなく、全体の符号化システムの作
用をサポートするために、音声符号器2 、ビデオ符号器
10、ビットレート割り当て器5 およびシステム多重器14
により必要とされる新規の手段を包含する。
【0020】図1 において、音声ビットストリーム3
は、可変ビットレート音声符号器1 により符号化され、
その符号器は、下記の幾つかのタスクを実施する音声検
出と識別(ADI) モジュール( 図 5) を備える。 a) 音声信号における無音の瞬間を検出し、かつスキッ
プされる音声フレームを決定するタスク b) 有音セグメントを、主として有音声セグメントと主
として無音声セグメントに分類するタスク c) 分析された通話セグメントの周波数重みつきエネル
ギーレベルに基づいてビットを割り当てるタスク d) ビット消費情報をビット節約計数器(BSC)25(図 4)
へ転送するタスク 次に、ビットレート動的制御機構について説明する。
【0021】本発明の符号化システムの好ましい実施例
は図1 に示され、そこにおいて符号化システムは、2 つ
の画像符号化モードだけを包含する。第1 の画像符号化
モードは、I 画像を発生する画像内符号化である。第2
の画像符号化モードは、P 画像を発生する予測符号化で
ある。予測は先行画像からだけである。しかしながら本
発明の符号化システムは、I 画像およびP 画像の符号化
モードだけに限定されない。そのシステムは、I 画像、
B 画像およびP 画像の符号化モードにも適用できる。
【0022】動的ビットレート割り当ての制御機構は図
2 に示される。先ず音声符号化用の事前設定される最大
ビットレートがあり、B amaxとして示される。音声信号
1 は、符号化された音声ビットレートはB amaxを越えな
いとする制約で、可変ビットレート符号器2 を使用して
符号化される。音声フレームレートは毎秒F a に設定さ
れ、またビデオ画像レートは毎秒F v に設定されると仮
定する。音声符号器2は、期間T d の間に音声信号1 の
符号化を開始することになる。この時間は、ビデオ符号
器10により必要とされる遅延であり、1 画像期間に設定
される。第1 の画像の符号化を開始する直前に、BRA 5
はビデオ符号器10にB a 8 を送り、現行画像符号化に利
用できるビットを指定することになる。ビデオ符号器10
は、適切な画像符号化モードを適用する為に、B a 8 の
値を分析する。
【0023】上記のレート制御方法を適用する効果は、
図 2にも示される。一定のビットレートビデオビットス
トリーム出力を供給する従来の符号化方法が使用される
ならば、平均ビットレートは、B vaveとして示される値
であろう。最初のI 画像は、後続のP 画像よりもかなり
多くのビットを消費する(I画像ビットレートはP 画像ビ
ットレートよりも2 倍も高いのが通常である) 。本実施
例の符号化方法で、先行画像期間中の音声フレームのビ
ット節約総数B s 4 は現行画像により使用される。これ
により、各画像は、音声符号器2 により節約された分だ
け余計に多くのビット総数で符号化できる。音声信号に
無音期間があるならば、図2 における8番目の画像の場
合のように、音声に予定した全体帯域幅をビデオにより
使用できることが時々ある。これらの付加されるビット
は、ビデオ符号器が符号化画像品質を向上するのに実際
に役立つ。平均ビデオビットレートB'vavgは、当初ビデ
オビットレートB vavgと比べて増加されることは図2 か
ら明らかである。下記の式は、平均ビデオビットレート
と音声ビットレートとの関係を示す。
【0024】B'vavg - Bvavg = B amax - Baavg ただしB aavgは平均音声ビットレートである。
【0025】ビデオ符号器10は、音声符号化の開始時間
に対して遅延期間Tdで符号化プロセスを開始するので、
かつまたビデオビットレートは、先行画像の期間中の音
声ビット節約に従って動的に割り当てられるので、符号
化音声ビットストリーム3 は、期間とビットレートの両
方において対応するビデオビットストリーム12に一致す
るように、同一の期間Tdだけ遅延されるものとする。こ
の演算は図3 に図示され、そこにおいて音声におけるビ
ット節約とビデオにおけるビット消費は時間的に一致し
ている。この整合制御はシステム多重器14により達成さ
れ、FIFOバッファ11から音声とビデオのビットストリー
ムを選択的に取り出し、音声とビデオの同期化のために
適正な時刻表示が付加される。
【0026】図2 と図3 とから分かるように、従来の音
声とビデオの符号化システムと異なる顕著な特徴は、音
声ビットストリーム3 およびビデオビットストリーム12
が可変ビットレートのものであるということである。し
かしながら、音声ビットストリーム3 およびビデオビッ
トストリーム12がシステム多重器14により同期化された
後の、出力システムビットストリーム15は、一定ビット
レートである。
【0027】次に、可変ビットレート音声符号器につい
て説明する。
【0028】ビット節約計数器と可変ビットレート音声
符号器2 との間の関係は、図4 に具体的に示される。ビ
ット節約計数器(BSC)25 が上記に定義されるように、音
声信号20は、毎秒F a フレームにセグメント化される。
i 番目の音声フレームのビット消費量はf a (i) ビット
23であると仮定すると、1 つの画像期間中のビット節約
総数は、下記の(数1)により計算できることになる。
【0029】
【数1】
【0030】ただし、N af 28 は、B s 要求がBAR 5 か
らなされる前に符号化されている音声フレーム数であ
る。B s 29がBAR 5 へ一旦送られると、音声フレーム計
数器27は、ゼロに設定され、次の画像期間中計数を継続
する。
【0031】図5 に図示されるように、音声フレーム毎
にビット消費を求める目的のために、入力通話信号101
は、予測分析モジュール102 および音声の検出と識別の
モジュール103 へ渡される。予測分析モジュール102
は、指定されたM 階自己相関分析を使用する短期線形ス
ペクトル分析を実施する。音声の検出と識別のモジュー
ル103 において、音声周波数帯域を通るエネルギー分布
が計算される。無音がしきい値レベルに基づいて検出さ
れる場合、音声フレームの符号化は実施する必要はな
い。予測分析モジュール102 から結果として生じる予測
係数104 と共に、音声セグメントは、有声または無音声
成分( または一層小さい分類) への分類が実施される。
用途の種類に応じて、各音声フレームの符号化に使用で
きる最大ビットレートは、先ずビットレート決定モジュ
ール106 において事前設定できる。予測係数とエネルギ
ー分布情報から、使用できる最大ビットレートに等しい
か、またはそれ未満の個別ビットレートレベルは、周波
数重みつき信号対ノイズの測度、または音声フレームの
符号化のための他の知覚測度に基づいて、ビットレート
決定モジュール106 において選定される。各音声フレー
ムからのビット消費データ116 は、ビット節約計数器へ
伝送される。周期計数器から発生する音声フレーム番号
115 は、フレーム計数器へ伝送される。最大ビットレー
トよりも低いビットレートでの符号化は、コードブック
108 の適切な部分集合を使用することにより( もしくは
減少されたコードブックにより、またはパラメータ的な
表示方法用に再設計されたものにより) 達成できる。多
重コードブック108 は、パルス状またはノイズ状のシー
ケンスを含む各種のシーケンスを発生できる励起発生器
を構成する。励起シーケンスの合計109 は、種々の予測
器、例えばピッチ予測器やスペクトル予測器などから構
成された予測器110 に渡される。予測された信号111
は、入力音声101 から差し引かれて、差分すなわちエラ
ー信号112 を生じ、ついでこの信号は知覚的に重みがつ
けられる。知覚的に重みつけされたエラー信号114 は、
ついでエラー最小化ベクトル量子化探索手順を駆動する
のに使用される。ラインスペクトル対118 および適切な
パラメータ的な符号117 は、音声ビットストリームの成
分として伝送される。
【0032】上述の可変ビットレート動作は、従来のア
ルゴリズムとは異なるアプローチを有し、そのアルゴリ
ズムは公称レートを有するが、公称レートより高いビッ
トレートおよび低いビットレートで動作できる。
【0033】次に、ビットレート割り当て器(BRA)につ
いて説明する。図1 に図示されるように、BRA 5 は、音
声符号器2 から音声ビット節約総数B s 4 を、ビデオ符
号器10から先行符号化画像により使用されるビデオビッ
ト総数B u 7 を、およびFIFOバッファの充足度B f 9 を
受信する。画像j 用の事前設定目標ビット数をB t (j)
とし、そのB t (j) は、I 画像符号化およびP 画像符号
化それぞれのための、事前設定I 画像符号化ビットレー
トB tIまたは事前設定P 画像符号化ビットレートB tP
等しいと仮定すると、j 番目の画像符号化に利用できる
ビット総数は、下記の制御手段(数2)により計算され
ることになる。
【0034】
【数2】
【0035】ただし、B fmaxはFIFOバッファサイズであ
り、またB AVは一定システムビットストリームビットレ
ートである。j 番目の画像符号化に利用できるビット数
は、(j - 1) 番目の画像用の目標ビット数と(j - 1) 番
目の画像により使用された実際のビット数との差に、(j
- 1) 番目の画像の符号化期間中の音声符号器のビット
節約数を加え、かつあらかじめ与えられたj 番目の画像
用の目標ビット数をさらに加えたものに等しい。利用で
きるビット数B a (j) 、現行 FIFO バッファ充足度B f
(j) および最大音声ビットレートB amaxの合計が、最大
FIFOバッファサイズB fmaxよりも大きいならば、画像j
に利用できるビット数は、FIFOバッファ11のオーバーフ
ローを避けるために、最大FIFOバッファサイズB fmax
ら現行FIFOバッファ充足度Bf(j)を差引き、また最大音声
ビットレートB amaxを差し引いたもの以下として計算さ
れることになる。利用できるビット数B a (j) 、現行 F
IFO バッファ充足度B f (j) および最大音声ビットレー
トB amaxの合計が、組合わせた音声とビデオのビットレ
ートB AVよりも小さいならば、画像j に利用できるビッ
ト数は、FIFOバッファ11のアンダーフローを避けるため
に、B AVから現行 FIFO バッファ充足度B f (j) を差引
き、また最大音声ビットレートB amaxを差し引いたもの
以上として計算されることになる。
【0036】次に、可変ビットレートビデオ符号器につ
いて説明する。
【0037】可変ビットレートビデオ符号器10は、図6
に図示されるように、符号化モード選定器31およびビッ
ト消費計数器35と共に構成される。現行画像に利用でき
るビット数B a 30は、符号化モード選定器(CMS)31 へ送
られる。B a 30の値に応じて、CMS 31はI 符号化、P 符
号化または余分のP 画像符号化を選定するために意思決
定プロセスを実施する。この決定結果は、現行画像37の
符号化を制御するために可変ビットレートビデオ符号器
33へ供給される。符号化されたビデオビットストリーム
は、リンク34を通して出力される。出力34はビット消費
計数器35へにも送られるので、現行画像符号化に使用さ
れるビット数B u 36が計算されて、次の画像符号化に使
用するためにBAR 5 (図1)へ送られる。
【0038】CMS 31の意思決定プロセスは、図7 のフロ
ーチャートで示される。I 画像の符号化に必要な最小ビ
ット総数をB Imin、およびP 画像の符号化に必要な最小
ビット総数をB Pminと仮定する。さらに、先行の符号化
された画像と、および先行の符号化された画像と符号化
される現行画像との中間に位置する画像との間の画像相
違(PD)を検査するために事前設定されるしきい値TH1 が
あると仮定する。
【0039】現行画像に利用できるビット総数B a 50
は、比較器51へ入力される。B a がB Pminの2 倍よりも
大きいならば、それは、利用できるビット総数は2 つの
P 画像を符号化するのに十分であることを意味する。言
い換えれば余分のP 画像を挿入できることになる。この
場合、比較器51の出力はリンク53を通り比較器54へ送ら
れ、その比較器54は、先に定義したPD値に基づいてP 画
像を挿入する必要があるかどうかをさらに検査するのに
使用される。PD値が事前設定しきい値TH1 よりも大きい
ならば、それは、先行の符号化された画像から、先行の
符号化された画像と符号化される現行画像との中間に位
置する画像まで、画像成分に実質的な変化があることを
意味する。したがって決定プロセス62は、比較器54の出
力がリンク58を通り「Yes 」ならば、2 つのP 画像を符
号化するように実施される。
【0040】しかしながら、比較器54がリンク59を通り
「No」ならば、それは、先行の符号化された画像に関し
て実質的な変化が無く、また余分のP 画像を挿入する必
要がないことを意味する。利用できるビット総数B a
は、ついで1 つのI 画像の符号化または1 つのP 画像の
符号化の意思決定のために比較器55により、リンク59を
通して検査される。このプロセスは、比較器51がリンク
52から「No」を出力する場合にも適用される。したがっ
て引き続く意思決定手順は、リンク52とリンク59との場
合に適用される。
【0041】比較器55において、利用できるビット総数
B a は、最小I 画像符号化ビット総数B Iminと比較され
る。B a ≧ B Imin ならば、それは、利用できるビット
総数は1 つのI 画像を符号化するのに十分であり、また
決定プロセス60のI 画像符号化はリンク56から起動でき
ることを意味する。B a < B Imin ならば、決定プロセ
ス61のI 画像符号化は、リンク57からの出力により選定
される。
【0042】60、61および62の決定結果の1 つだけが、
一度に選定されて、63、64および65のリンクの1 つを通
して符号化モード符号器66へ送られ、その符号器は、選
定された決定結果を、出力リンク67に出力する。
【0043】上述した機構は、動的I 画像およびP 画像
符号化モード制御と定義される。
【0044】画像符号化モードが決められると、B a
は、現行画像符号化から発生するビットレートを動的に
制御するように、量子化ステップを調整するのに使用さ
れる。この機構は、動的量子化ステップ制御と定義され
る。
【0045】ついで可変ビットレートビデオ符号器33
は、CMS 31により選定された画像符号化モードに従って
現行画像を符号化するのに使用される。ビデオ符号器33
の1 つの好ましい実施例は、図8 に示される変換符号化
システムである。
【0046】各画像の画素データを含む入力ビデオ信号
は、入力フレーム記憶装置71へ入力されて、格納され
る。ブロックサンプリング回路72は、入力フレーム記憶
装置71に格納されたデータをライン84を通して受信し、
その画像データを、画素データの空間的に非重複ブロッ
クに分割する。妥当なレベルの適応性を得るために、8x
8 画素のブロックサイズを使用する。画像のフレーム
番号は、入力画像記憶装置71へも入力され、またブロッ
クサンプリング回路72を通りスイッチ(S1)73へ渡され
る。フレーム番号に基づいて、スイッチ73は、画像内符
号化モードでの符号化のためにライン86を通して、また
は予測符号化モードでの符号化のためにライン87へ、ブ
ロックサンプリング回路72から画素データの出力ブロッ
クを選択的に送り出す。
【0047】画像内符号化モードの場合、ブロックサン
プリング回路72の出力は、ライン86を通してディスクリ
ート余弦変換(DCT) 回路76へ渡される。DCT 回路76は、
画像データを周波数領域におけるデータへ変換する周知
の数学的変換であるディスクリート余弦変換を実施す
る。変換されたデータ、すなわちDCT 係数は、ついで量
子化マトリックスと、およびレート制御装置79によりラ
イン93を通して与えられる量子化ステップサイズとを使
用する量子化回路77において量子化のプロセスを受け
る。量子化されたデータは、補助情報としての量子化ス
テップと共に、ライン91を通り、ランレングス符号化お
よび可変長符号化回路78へ渡され、その回路は、量子化
されたデータおよびその関連する補助情報のランレング
ス符号化を実施し、ついでランレングス符号化結果の可
変長符号化を実施する。ランレングス符号化および可変
長符号化回路78の出力は、復号器への伝送が可能な符号
化されたビットストリーム100 である。このビットスト
リームは又、ライン92を通してレート制御装置79へ渡さ
れる。ブロックの符号化のときに既に使用されたビット
数に基づいて、レート制御装置79は、出力ビットストリ
ームが符号化システムのビットレート必要条件を満足す
るように量子化ステップを調整する。量子化回路77によ
り量子化された値は又、ライン94を通して、逆量子化回
路80および逆ディスクリート余弦変換( 逆DCT)回路81へ
渡される。逆量子化回路80および逆DCT 回路は、DCT 回
路76および量子化回路77により実施されるものの逆プロ
セスを実施して、再構成されたデータを得る。再構成さ
れたデータは、ライン96を通して局所復号化画像記憶装
置82に格納され、また予測符号化画像である次の入力画
像のために動きの予測回路と補正回路に出力される。I
画像の全体が符号化された後に、レート制御装置は、I
画像の符号化に使用された合計ビットを計算して、次の
P 画像およびI 画像に割り当てられるビット数を決定す
る。予測符号化モードの場合、ブロックサンプリング回
路72の出力は、スイッチS1およびついでライン87を通し
て、動きベクトル(MV)予測回路74へ渡される。MV予測回
路74において、動きベクトル予測は、ライン98を通して
得られる、局所復号化画像記憶装置82からの局所復号化
画像を使用して、隣接画像からMVを決めるように実施さ
れる。MV予測回路74は、例えば、平均平方エラーのよう
な幾つかの所定の規準に基づいて最良に一致したブロッ
クを見出して、1つの画像から次の画像への画素のブロ
ックの移行動き方向を求めることにより、最良の一致を
見出す。
【0048】動きベクトル予測プロセスにおいて得られ
たMVは、符号化されるブロックと共に、ライン88を通り
動き補正回路75へ渡され、その回路は、予測されたブロ
ックを求める為に局所復号化画像記憶装置82に格納され
たブロックを使用して動き補正を実施する。予測ブロッ
クは、MVにより与えられるオフセットを局所復号化記憶
装置から得られるブロックに適用して得られる。符号化
されるブロックの画素の値と、予測ブロックの画素の値
との間の差が計算されて、差分値から成る差分ブロック
が得られる。差分ブロックに基づいて、動き補正回路75
は又、ブロックの標準偏差などの幾つかの先に定義した
規準を使用して差分ブロックと符号化されるブロックの
複雑さ(activity)を比較することにより、変換のため
にDCT 回路76へ渡されるブロックを動き補正する必要が
あるかどうかを判断する。変換されるブロックが動き補
正する必要があると判断されるならば、その差分ブロッ
クはライン89を通してDCT 回路76へ渡される。変換され
るブロックが動き補正する必要ないと判断されるなら
ば、ブロック自体( すなわち、ブロックサンプリング回
路72から出力された当初のブロック) は、ライン89を通
してDCT 回路76へ渡される( それは、画像内符号化画像
のブロックと同一である) 。さらに動き補正回路75は、
ブロックが動き補正で符号化されたかどうかを示す情報
ビットを生成して、情報ビットを動きベクトルと共にDC
T 回路76へ渡す。すなわち、ライン89を通して動き補正
回路75からDCT 回路76へ出力されるデータは、差分ブロ
ック( 動き補正されて符号化された) または当初ブロッ
ク( 動き補正無しで符号化された) であり、情報ビット
は、動き補正されたか、否かの情報と差分ブロックの場
合は動きベクトルの情報とを示す。
【0049】動き補正回路75からのブロックデータは、
DCT 回路76においてDCT 係数へ変換され、DCT 係数は、
量子化回路77において量子化されて、量子化DCT 係数と
なる。ブロックが動き補正またはMVで符号化されたかど
うかを、それぞれ示す情報ビットは、DCT 回路76を通
り、またライン90を通して量子化回路77へ渡される。量
子化されたデータ( 量子化されたDCT 係数) は、量子化
ステップを含む補助情報と、動きベクトルと、および動
き補正をブロックに実施したかどうかを、それぞれ示す
情報ビットと共に、ランレングス符号化および可変長符
号化回路78へ渡され、ランレングス符号化および可変長
符号化されて、出力符号化ビットストリームとなる。そ
のビットストリームは又、ライン92を通してレート制御
装置79へ渡される。量子化回路77からの量子化データは
又、ライン94を通して渡され、逆量子化回路80において
逆量子化され、逆DCT 回路81において逆DCT されて、次
の画像の符号化のために局所符号化画像記憶装置82に格
納される。
【0050】次に、FIFOバッファについて説明する。
【0051】図9 は、音声とビデオの符号化プロセス中
におけるFIFOバッファ状態の一例を示す。第1 の期間T
d の間、符号化音声ビットストリーム3 は、FIFOバッフ
ァ11へ書き込まれる。瞬間T d から開始して、FIFOバッ
ファ11は、音声ビットストリーム3 およびビデオビット
ストリーム12により充足される。FIFOバッファ11が事前
設定充足度B O まで充足されると、システム多重器14
は、FIFOバッファ11からビットを収集することを開始す
る。システム多重器14が一定ビットレートB AVでFIFOバ
ッファ11からビットを取り出すので、バッファ充足度
は、B out として示される、固定された総数に減少させ
られる。この値は常に一定である。音声とビデオのビッ
トレートは可変であるので、それらの組合わせも可変ビ
ットレートである。したがってFIFOバッファ11のレート
は、各期間におけるバッファ充足度カーブの異なる傾斜
により図9 で図示されるように、1 つの期間から他の期
間へ、変化している。B out は、FIFOバッファ11のオー
バーフローまたはアンダーフローを避けるように設定さ
れる。しかしながら、これも、図9 の3T dにより示され
るように、伝送されるビットストリームに時間遅延を生
じる。
【0052】次に、システム多重器について説明する。
【0053】システム多重器は、入力のビデオと音声デ
ータを固定長さのパケットにパケット化することによ
り、かつ適正な同期化を確実にするために、時刻表示を
対応する音声フレームとビデオ画像に挿入することによ
り、FIFOバッファからの入力のビデオと音声データを多
重化する。2 つの時刻表示が使用される。すなわち、音
声フレームまたはビデオ画像の提示ユニットを演奏また
は放送する必要がある時刻を示す提示時刻表示(PTS) 、
および音声またはビデオ画像を復号化する時刻を示す復
号時刻表示(DTS) である。PTS およびDTS は、システム
クロック基準(SCR) と呼ばれる共通時刻ベースを有し
て、測時の計測を統一し、かつ適正な同期化およびバッ
ファ管理を確実にするようにする。
【0054】音声データの場合、システム多重器は、送
られる画像数の追跡を続け、また新しいデータがFIFOバ
ッファから得られると、適切なPTS がパケットヘッダー
へ挿入される。DTS は、表示時刻が復号化時刻と固定関
係を有するので、必要とされない。
【0055】ビデオデータの場合、システム多重器は、
送られる画像数の追跡を続け、また適切なPTS およびDT
S がパケットヘッダーへ挿入される。DTS は、画像の復
号化時刻と表示時刻が異なる場合には必要である。
【0056】
【発明の効果】以上述べたところから明らかなように、
本発明は、画像符号化モードと共に、画像レートを制御
する機構を提供することにより、固定された期間を通し
て利用できるビットを一層効率的に使用できるので、音
声品質について妥協することなく、ビデオ信号の品質を
大幅に向上できる。
【0057】本発明は、非常に低いビットレートのビデ
オと関連音声の符号化に特に効果的である。例えば、本
発明がテレビ電話用途に適用される場合、しゃべってい
ない人の全ての音声ビットレートを利用することにより
その人の、画像が、より多くのビットで符号化されて通
話中の相手へ伝送されるようになり、画像品質を向上で
きる。
【図面の簡単な説明】
【図1】動的にビットレート制御されるビデオと関連音
声の符号化システムのブロック線図を示す。
【図2】音声とビデオの符号化プロセス中の時間とビッ
トレートの関係を図示する。
【図3】多重化プロセス中の時間とビットレートの関係
を図示する。
【図4】ビット節約計数器と可変ビットレート音声符号
器との間の関係を示す。
【図5】可変ビットレート音声符号器のブロック線図を
示す。
【図6】符号化モード選定器およびビット消費計数器と
共に、可変ビットレートビデオ符号器の構成のブロック
線図を示す。
【図7】動的画像符号化モード選定フローチャートの機
構を図示する。
【図8】ビデオ変換符号化方法のブロック線図を示す。
【図9】FIFOバッファ充足度を図示する。
【符号の説明】
1 音声信号 2 音声符号器 3 音声ビットストリーム 5 ビットレート割当器 6 ビデオ信号 10 ビデオ符号器 11 FIFOバッファ 12 ビデオビットストリーム 14 システム多重器 15 システムビットストリーム B u : 先行ビデオフレームにより使用されたビット総数 B s : 現行ビデオフレームの前に音声フレームにより節
約されたビット総数 B f : 現行ビデオフレームの前のFIFOバッファ充足度 B a : 現行フレームに利用できるビット数 B AV: 組合わせられた音声とビデオのビットストリーム
に事前設定される固定ビット速度 B amax: 最大音声ビットレート B aavg: 平均音声ビットレート B vavg: 平均ビデオビットレート B'vavg: 音声符号器により節約されたビットを付加した
後の新しい平均ビデオビットレート T d : 音声符号器の開始点に対してのビデオ遅延時間 □ 音声符号器からのビット数

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 動的にビットレートを制御するビットレ
    ート制御システムであって、 音声信号を符号化し、ビデオ符号器用の節約ビット総数
    (B s)を与える可変ビットレート音声符号器と、 毎秒一定数の画像単位で入力ビデオシーケンス信号を付
    号化する可変ビットレートビデオ符号器と、 前記可変ビットレート音声符号器の出力を利用して、符
    号化される現行画像に利用できるビット総数を動的に割
    り当てるビットレート割り当て器と、 符号化された音声とビデオのビットストリームをバッフ
    ァリングし、組合わせられたビデオおよび関連する音声
    の一定ビットレートビットストリームを与えるFIFOバッ
    ファと、 音声とビデオの信号を同期化するために加えられる時刻
    表示で、音声とビデオのビットストリームを多重化する
    多重装置と、 を備えたことを特徴とするビットレート制御システム。
  2. 【請求項2】 前記可変ビットレート音声符号器は、 音声予測分析と連係して、音声フレームが、音声フレー
    ムの符号化に使用する必要がある適切なビットレートを
    必要とするか、またはスキップされ得るかを事前判断す
    る、音声検出・識別手段(ADI)と、 先行画像符号化期間中に,節約されたビット総数(B s)を
    計算し、ビットレート割り当て器(BRA)へそれを送る、
    合計音声ビットレート計算手段と、 を備えたことを特徴とする請求項1記載のビットレート
    制御システム。
  3. 【請求項3】 前記音声検出・識別手段(ADI)は、 エネルギーレベルとエネルギーの分布を求めるために、
    入力音声信号の周波数およびエネルギー成分を分析する
    手段と、 前記のエネルギーレベルとエネルギーの分布から音声信
    号種類を、無音期間か、主として無声音信号か、または
    主として声音信号に分類する手段と、 音声符号化のために所定のビットレートを生じるよう
    に、許容される符号化不正確さ、および量子化ノイズを
    予測する手段と、 を備えたことを特徴とする請求項2記載のビットレート
    制御システム。
  4. 【請求項4】 前記ビットレート割り当て器(BRA) は、 音声ビット節約ビット総数(B s) 、先行画像使用ビット
    (B u) およびFIFOバッファ充足度(B f)に従って現行画
    像を符号化するために利用できるビット総数を計算する
    手段から構成され、 それらB s およびB f 値は、要求信号が音声符号器およ
    びFIFOバッファへ入力されるときに、前記ビットレート
    割り当て器(BRA)へ送られる、 ことを特徴とする請求項1記載のビットレート制御シス
    テム。
  5. 【請求項5】 前記可変ビットレートビデオ符号器は、 現行画像符号化に利用できるビットに従って画像レート
    を動的に制御する手段と、 画像符号化モードを動的に制御する手段と、 画像の小部分の複雑さ(又は活性度)に従って前記小部
    分にビットを動的に割り当てる手段と、 を備えたことを特徴とする請求項1記載のビットレート
    制御システム。
  6. 【請求項6】 前記の動的な画像符号化モード制御手段
    は、 それ自体の画像成分だけにより画像を符号化する内部画
    像符号化モード(ここに、この方法により符号化される
    画像はI 画像と呼ぶ)と、それ自体の画像からだけでは
    なく、予測符号化方法を使用して先行画像からも画像を
    符号化する画像間符号化モード(ここに、この方法によ
    り符号化される画像はP 画像と呼ぶ)とにおいて、 利用できるビット総数B a 、最小I 画像符号化ビットレ
    ートB Iminおよび最小P 画像符号化ビットレートB Pmin
    に従って、I およびP の画像符号化を動的に制御する決
    定手段を備えたことを特徴とする請求項5記載のビット
    レート制御システム。
  7. 【請求項7】 前記の動的な画像符号化モード制御手段
    は、 それ自体の画像成分だけにより画像を符号化する内部画
    像符号化モード(ここに、この方法により符号化される
    画像はI 画像と呼ぶ)と、それ自体の画像からだけでは
    なく、予測符号化方法を使用して先行画像からも画像を
    符号化する画像間符号化モード(ここに、この方法によ
    り符号化される画像はP 画像と呼ぶ)とにおいて、 利用できるビット総数B a 、P 画像符号化のための事前
    設定最小ビット総数、および先に符号化された画像に関
    して挿入される画像の画像変更成分に従って、先に符号
    化された画像と現行画像との間に余分のP 画像を挿入す
    る決定手段を備えたことを特徴とする請求項5記載のビ
    ットレート制御システム。
  8. 【請求項8】 前記FIFOバッファは、 バッファ充足度B f を計算し、かつ前記BRA からの要求
    信号をFIFOバッファが受信するときに、その計算値をBR
    Aへ報告する手段を備えたことを特徴とする請求項1記
    載のビットレート制御システム。
  9. 【請求項9】 前記多重装置は、 音声とビデオのビットストリームを検索し、かつそれら
    を混合し、同期化されたビットストリームに多重化する
    手段と、 音声とビデオのビットストリームを、それらの時間とビ
    ットレート関係に関して整合させることにより、一定ビ
    ットレートの多重化されたビットストリーム出力を発生
    する手段とを備えたことを特徴とする請求項1記載のビ
    ットレート制御システム。
JP33697593A 1993-12-28 1993-12-28 ビットレート制御システム Pending JPH07202820A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP33697593A JPH07202820A (ja) 1993-12-28 1993-12-28 ビットレート制御システム
US08/361,438 US5617145A (en) 1993-12-28 1994-12-22 Adaptive bit allocation for video and audio coding
KR1019940037203A KR950023017A (ko) 1993-12-28 1994-12-27 비트레이트 제어시스템
EP19940120862 EP0665693B1 (en) 1993-12-28 1994-12-28 Dynamic bit rate control system for very low bit rate video and associated audio coding
DE1994623465 DE69423465T2 (de) 1993-12-28 1994-12-28 Dynamisches Bitratensteuerungssystem für Video und entsprechende Audiokodierung sehr niedriger Datenrate.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33697593A JPH07202820A (ja) 1993-12-28 1993-12-28 ビットレート制御システム

Publications (1)

Publication Number Publication Date
JPH07202820A true JPH07202820A (ja) 1995-08-04

Family

ID=18304332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33697593A Pending JPH07202820A (ja) 1993-12-28 1993-12-28 ビットレート制御システム

Country Status (5)

Country Link
US (1) US5617145A (ja)
EP (1) EP0665693B1 (ja)
JP (1) JPH07202820A (ja)
KR (1) KR950023017A (ja)
DE (1) DE69423465T2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1954057A2 (en) 2007-02-01 2008-08-06 NEC Corporation System and method for controlling bitrate of video signal and audio signal
JP2009522920A (ja) * 2006-01-05 2009-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディアコンテンツ管理
JP2009260436A (ja) * 2008-04-11 2009-11-05 Sony Corp 情報処理装置及び情報処理方法、並びにプログラム
JP2010136041A (ja) * 2008-12-04 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 符号化ストリーム伝送方法,符号化ストリーム伝送装置,符号化ストリーム伝送制御プログラムおよびその記録媒体
JP2010136047A (ja) * 2008-12-04 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体
JP2010136040A (ja) * 2008-12-04 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 映像・音声ストリーム伝送制御方法、映像・音声ストリーム伝送制御装置、映像・音声ストリーム伝送制御プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010136037A (ja) * 2008-12-04 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体
JP2011029796A (ja) * 2009-07-23 2011-02-10 Victor Co Of Japan Ltd デジタル信号多重化方法およびデジタル信号多重化装置
CN114390314A (zh) * 2021-12-30 2022-04-22 咪咕文化科技有限公司 可变帧率音视频处理方法、设备及存储介质

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5933450A (en) * 1994-04-20 1999-08-03 Thomson Consumer Electronics, Inc. Complexity determining apparatus
GB9424436D0 (en) * 1994-12-02 1995-01-18 Philips Electronics Video editing buffer management
WO1996020575A2 (en) * 1994-12-28 1996-07-04 Philips Electronics N.V. Buffer management in variable bit-rate compression systems
JP2809126B2 (ja) * 1995-03-30 1998-10-08 日本電気株式会社 音声信号処理回路および音声信号処理方法
EP1534020A3 (en) * 1995-04-27 2005-06-01 Hitachi, Ltd. Method/apparatus for receiving and/or reproducing digital signal
US9832244B2 (en) * 1995-07-14 2017-11-28 Arris Enterprises Llc Dynamic quality adjustment based on changing streaming constraints
US7512698B1 (en) * 1995-07-14 2009-03-31 Broadband Royalty Corporation Dynamic quality adjustment based on changing streaming constraints
JP4006840B2 (ja) * 1998-08-10 2007-11-14 ソニー株式会社 システムターゲットデコーダのオーディオバッファ、多重化方法および装置、再生方法および装置
US6058141A (en) * 1995-09-28 2000-05-02 Digital Bitcasting Corporation Varied frame rate video
GB2306831B (en) * 1995-10-30 2000-05-24 Sony Uk Ltd Video data compression
US6075768A (en) * 1995-11-09 2000-06-13 At&T Corporation Fair bandwidth sharing for video traffic sources using distributed feedback control
WO1997035393A1 (fr) * 1996-03-15 1997-09-25 Hitachi, Ltd. Dispositif de separation de donnees
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JPH09233231A (ja) * 1996-02-20 1997-09-05 Internatl Business Mach Corp <Ibm> データ伝送方法及び装置
US5949410A (en) * 1996-10-18 1999-09-07 Samsung Electronics Company, Ltd. Apparatus and method for synchronizing audio and video frames in an MPEG presentation system
KR100557103B1 (ko) * 1997-03-17 2006-03-03 마츠시타 덴끼 산교 가부시키가이샤 데이터 처리방법 및 데이터 처리장치
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
JP2000516356A (ja) * 1997-04-07 2000-12-05 コーニンクレッカ、フィリップス、エレクトロニクス、エヌ、ヴィ 可変ビットレート音声送信システム
KR100513907B1 (ko) * 1997-06-13 2005-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 복수의 상호 관련된 오브젝트들의 주기적 전송방법
WO1999000978A1 (en) * 1997-06-30 1999-01-07 Motorola Inc. System and device for, and method of, encoding video information for improved streaming thereof
KR100252108B1 (ko) * 1997-12-20 2000-04-15 윤종용 Mpeg 압축부호화 및 복호화기를 채용한 디지털 기록 재생장치 및 그 방법
JPH11202900A (ja) * 1998-01-13 1999-07-30 Nec Corp 音声データ圧縮方法及びそれを適用した音声データ圧縮システム
US6307886B1 (en) * 1998-01-20 2001-10-23 International Business Machines Corp. Dynamically determining group of picture size during encoding of video sequence
US6208640B1 (en) 1998-02-27 2001-03-27 David Spell Predictive bandwidth allocation method and apparatus
US6373855B1 (en) * 1998-03-05 2002-04-16 Intel Corporation System and method for using audio performance to control video bandwidth
DE69815159T2 (de) * 1998-03-20 2004-04-08 Stmicroelectronics Asia Pacific Pte Ltd. Kodierung von bewegten bildern mit globaler konstanter bitrate
US6952677B1 (en) * 1998-04-15 2005-10-04 Stmicroelectronics Asia Pacific Pte Limited Fast frame optimization in an audio encoder
EP0982950A3 (en) * 1998-08-24 2004-09-29 Sony Corporation Electronic video camera comprising an MPEG encoder
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US6904089B1 (en) * 1998-12-28 2005-06-07 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
JP3327240B2 (ja) * 1999-02-10 2002-09-24 日本電気株式会社 画像・音声符号化装置
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
WO2000074388A1 (en) * 1999-05-26 2000-12-07 Koninklijke Philips Electronics N.V. Digital video signals coding method and corresponding coding or transcoding system
WO2001010136A1 (en) * 1999-07-30 2001-02-08 Indinell Sociedad Anonima Method and apparatus for processing digital images and audio data
JP3519996B2 (ja) * 1999-08-05 2004-04-19 三洋電機株式会社 デジタル記録機器
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
KR100324597B1 (ko) * 1999-12-30 2002-02-16 박종섭 비트 스트림 프로세서
DE10007579A1 (de) * 2000-02-21 2001-09-20 Siemens Ag Verfahren und Vorrichtung zum Codieren eines Videosignals und eines Sprachsignals, computerlesbares Speichermedium sowie Computerprogramm-Element
JP2001274923A (ja) * 2000-03-28 2001-10-05 Nec Eng Ltd 携帯電話伝送システム
US6807183B1 (en) * 2000-05-09 2004-10-19 Advanced Micro Devices, Inc. Arrangement for reading a prescribed location of a FIFO buffer in a network switch port
TW519840B (en) 2000-06-02 2003-02-01 Sony Corp Image coding apparatus and method, image decoding apparatus and method, and recording medium
JP4724919B2 (ja) * 2000-06-02 2011-07-13 ソニー株式会社 記録装置および記録方法、再生装置および再生方法、並びに記録媒体
SE517245C2 (sv) * 2000-09-14 2002-05-14 Ericsson Telefon Ab L M Synkronisering av audio- och videosignaler
US7278069B2 (en) * 2000-10-31 2007-10-02 Igor Anatolievich Abrosimov Data transmission apparatus for high-speed transmission of digital data and method for automatic skew calibration
JP2002152730A (ja) * 2000-11-08 2002-05-24 Nec Corp マルチメディア信号符号化装置、出力符号量制御方法、及びそのプログラムを記録した記録媒体
US20020118746A1 (en) * 2001-01-03 2002-08-29 Kim Hyun Mun Method of performing video encoding rate control using motion estimation
US7590178B2 (en) * 2001-03-12 2009-09-15 Robert Bosch Gmbh Method of multiplexing a number of video signals with a compressor
US7050497B2 (en) * 2001-03-28 2006-05-23 Thomson Licensing Process and device for the video coding of high definition images
US20020180891A1 (en) * 2001-04-11 2002-12-05 Cyber Operations, Llc System and method for preconditioning analog video signals
KR100814431B1 (ko) * 2001-04-25 2008-03-18 삼성전자주식회사 가변 비트레이트를 적용한 디지털 방송 송신장치 및 그방법, 비디오 데이타 부호화장치 및 그 방법 그리고방송신호의 복호화 시스템 및 그 방법
JP4063508B2 (ja) * 2001-07-04 2008-03-19 日本電気株式会社 ビットレート変換装置およびビットレート変換方法
US6975680B2 (en) * 2001-07-12 2005-12-13 Dolby Laboratories, Inc. Macroblock mode decision biasing for video compression systems
US7577333B2 (en) * 2001-08-04 2009-08-18 Samsung Electronics Co., Ltd. Method and apparatus for recording and reproducing video data, and information storage medium in which video data is recorded by the same
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
JP4254297B2 (ja) * 2003-03-26 2009-04-15 日本電気株式会社 画像処理装置及びその方法並びにそれを用いた画像処理システム及びプログラム
US8085844B2 (en) * 2003-09-07 2011-12-27 Microsoft Corporation Signaling reference frame distances
US7577198B2 (en) * 2003-09-07 2009-08-18 Microsoft Corporation Number of reference fields for an interlaced forward-predicted field
US7016409B2 (en) * 2003-11-12 2006-03-21 Sony Corporation Apparatus and method for use in providing dynamic bit rate encoding
WO2005048609A1 (en) * 2003-11-13 2005-05-26 Matsushita Electric Industrial Co., Ltd. Packetization of variable bit rate encoded data based on rate control
US20050207501A1 (en) * 2004-03-18 2005-09-22 Sony Corporation Method of and system for video bit allocation for scene cuts and scene changes
US7624021B2 (en) * 2004-07-02 2009-11-24 Apple Inc. Universal container for audio data
US8634413B2 (en) 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
JP4745865B2 (ja) * 2006-02-28 2011-08-10 富士通セミコンダクター株式会社 符号化装置および方法
US7965650B2 (en) * 2006-05-18 2011-06-21 Cisco Technology, Inc. Method and system for quality monitoring of media over internet protocol (MOIP)
CN101601305B (zh) * 2006-10-20 2013-01-23 诺基亚公司 用于可伸缩多媒体的自适应路径的通用指示
US9355681B2 (en) 2007-01-12 2016-05-31 Activevideo Networks, Inc. MPEG objects and systems and methods for using MPEG objects
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
US7751361B2 (en) * 2007-10-19 2010-07-06 Rebelvox Llc Graceful degradation for voice communication services over wired and wireless networks
US7751362B2 (en) 2007-10-19 2010-07-06 Rebelvox Llc Graceful degradation for voice communication services over wired and wireless networks
US9327193B2 (en) * 2008-06-27 2016-05-03 Microsoft Technology Licensing, Llc Dynamic selection of voice quality over a wireless system
CN101330340B (zh) * 2008-07-31 2010-09-29 中兴通讯股份有限公司 移动多媒体广播终端自适应调整接收速率缓冲播放的方法
US8325662B2 (en) * 2008-09-17 2012-12-04 Voxer Ip Llc Apparatus and method for enabling communication when network connectivity is reduced or lost during a conversation and for resuming the conversation when connectivity improves
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
US8780978B2 (en) * 2009-11-04 2014-07-15 Qualcomm Incorporated Controlling video encoding using audio information
CN101930744B (zh) * 2010-09-07 2012-06-06 北京航空航天大学 一种aac音频编码的握手协议方法
AU2011315950B2 (en) 2010-10-14 2015-09-03 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2472868A1 (en) * 2010-12-29 2012-07-04 British Telecommunications Public Limited Company Video coding
EP2695388B1 (en) 2011-04-07 2017-06-07 ActiveVideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
US10275128B2 (en) 2013-03-15 2019-04-30 Activevideo Networks, Inc. Multiple-mode system and method for providing user selectable video content
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9326047B2 (en) 2013-06-06 2016-04-26 Activevideo Networks, Inc. Overlay rendering of user interface onto source video
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
WO2016138502A1 (en) * 2015-02-27 2016-09-01 Arris Enterprises, Inc. Adaptive joint bitrate allocation
US10762911B2 (en) * 2015-12-01 2020-09-01 Ati Technologies Ulc Audio encoding using video information
EP3376766B1 (en) * 2017-03-14 2019-01-30 Axis AB Method and encoder system for determining gop length for encoding video
CN110800047B (zh) 2017-04-26 2023-07-25 Dts公司 用于对数据进行处理的方法和系统
WO2019117866A1 (en) * 2017-12-12 2019-06-20 Google Llc Bitrate optimizations for immersive multimedia streaming

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0418396B1 (en) * 1989-03-16 1998-06-03 Fujitsu Limited Video/audio multiplex transmission system
TW237589B (ja) * 1991-02-27 1995-01-01 Gen Electric
US5317672A (en) * 1991-03-05 1994-05-31 Picturetel Corporation Variable bit rate speech encoder
US5159447A (en) * 1991-05-23 1992-10-27 At&T Bell Laboratories Buffer control for variable bit-rate channel
JP2766919B2 (ja) * 1991-06-07 1998-06-18 三菱電機株式会社 ディジタル信号記録再生装置、ディジタル信号記録装置、ディジタル信号再生装置
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5367629A (en) * 1992-12-18 1994-11-22 Sharevision Technology, Inc. Digital video compression system utilizing vector adaptive transform
US5467139A (en) * 1993-09-30 1995-11-14 Thomson Consumer Electronics, Inc. Muting apparatus for a compressed audio/video signal receiver
US5452006A (en) * 1993-10-25 1995-09-19 Lsi Logic Corporation Two-part synchronization scheme for digital video decoders

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009522920A (ja) * 2006-01-05 2009-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディアコンテンツ管理
EP1954057A2 (en) 2007-02-01 2008-08-06 NEC Corporation System and method for controlling bitrate of video signal and audio signal
JP2008193202A (ja) * 2007-02-01 2008-08-21 Nec Corp 映像音声帯域制御システム及び映像音声帯域制御方法
US8428148B2 (en) 2007-02-01 2013-04-23 Nec Corporation System and method for controlling bit rate of video signal and audio signal
JP2009260436A (ja) * 2008-04-11 2009-11-05 Sony Corp 情報処理装置及び情報処理方法、並びにプログラム
JP2010136041A (ja) * 2008-12-04 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 符号化ストリーム伝送方法,符号化ストリーム伝送装置,符号化ストリーム伝送制御プログラムおよびその記録媒体
JP2010136047A (ja) * 2008-12-04 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体
JP2010136040A (ja) * 2008-12-04 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 映像・音声ストリーム伝送制御方法、映像・音声ストリーム伝送制御装置、映像・音声ストリーム伝送制御プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010136037A (ja) * 2008-12-04 2010-06-17 Nippon Telegr & Teleph Corp <Ntt> 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体
JP2011029796A (ja) * 2009-07-23 2011-02-10 Victor Co Of Japan Ltd デジタル信号多重化方法およびデジタル信号多重化装置
CN114390314A (zh) * 2021-12-30 2022-04-22 咪咕文化科技有限公司 可变帧率音视频处理方法、设备及存储介质

Also Published As

Publication number Publication date
EP0665693B1 (en) 2000-03-15
DE69423465T2 (de) 2000-07-06
US5617145A (en) 1997-04-01
KR950023017A (ko) 1995-07-28
EP0665693A2 (en) 1995-08-02
EP0665693A3 (en) 1996-03-27
DE69423465D1 (de) 2000-04-20

Similar Documents

Publication Publication Date Title
JPH07202820A (ja) ビットレート制御システム
EP1173028B1 (en) Scalable encoding of media streams
US5677969A (en) Method, rate controller, and system for preventing overflow and underflow of a decoder buffer in a video compression system
US6925120B2 (en) Transcoder for scalable multi-layer constant quality video bitstreams
US8311094B2 (en) Buffer underflow prevention
US7881370B2 (en) Method of selecting among n spatial video CODECs the optimum CODEC for a same input signal
US6704281B1 (en) Bit-rate control in a multimedia device
US8374236B2 (en) Method and apparatus for improving the average image refresh rate in a compressed video bitstream
US20090190666A1 (en) Hypothetical reference decoder with low start-up delays for compressed image and video
JPH09510070A (ja) 可変ビットレート圧縮システムのバッファ管理
US7333515B1 (en) Methods and apparatus to improve statistical remultiplexer performance by use of predictive techniques
JPH09187007A (ja) 誤りを含むデータストリームへの再同期の方法と、符号化器及び復号化器
US7522665B2 (en) Mobile terminal with camera
WO2006067375A1 (en) Rate control with decoding buffer overflow prevention
KR100950525B1 (ko) 트랜스코딩 장치 및 방법, 이에 사용되는 타겟비트할당 및픽처 복잡도 예측 장치 및 방법
KR20080077537A (ko) 저지연 영상 통신 시스템 및 방법
JP2000125292A (ja) ビデオデコーダの圧縮されたビットストリームの計算及び記録に必要な条件を制御する方法及び装置
JP2002014696A (ja) 制御装置及び制御方法
JP2010136037A (ja) 映像符号量制御方法,映像符号化装置,映像符号量制御プログラムおよびその記録媒体
JPH08340540A (ja) 画像フレームの符号化又は復号化の方法及びその装置