JP2003188731A - Variable rate encoding method, encoder and decoder - Google Patents
Variable rate encoding method, encoder and decoderInfo
- Publication number
- JP2003188731A JP2003188731A JP2001384992A JP2001384992A JP2003188731A JP 2003188731 A JP2003188731 A JP 2003188731A JP 2001384992 A JP2001384992 A JP 2001384992A JP 2001384992 A JP2001384992 A JP 2001384992A JP 2003188731 A JP2003188731 A JP 2003188731A
- Authority
- JP
- Japan
- Prior art keywords
- rate
- coding
- codeword
- encoding
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、可変レート符号化
方法、符号化装置および復号装置に関する。The present invention relates to a variable rate coding method, a coding device and a decoding device.
【0002】[0002]
【従来の技術】画像や音声などを符号化する場合に情報
源に応じて符号化速度を変化させる可変レート符号化方
法が知られている。例えば、MPEG2やMPEG4な
どで用いられている従来の符号化方法は、あらかじめ決
められた固定レート、または情報源に応じて符号化速度
が変化する可変レートの符号化を行っている。インター
ネットなどのパケット網におけるベストエフォート通信
は安価に利用できる反面、帯域やパケット廃棄率が保証
されていない。また、ネットワークの輻輳を避けるた
め、パケット送出速度を調整する輻輳制御機能が必要と
なる。2. Description of the Related Art There is known a variable rate coding method in which a coding rate is changed in accordance with an information source when coding an image or a sound. For example, the conventional encoding method used in MPEG2, MPEG4, etc. performs encoding at a predetermined fixed rate or a variable rate in which the encoding rate changes according to the information source. Although best-effort communication in packet networks such as the Internet can be used at low cost, the bandwidth and packet discard rate are not guaranteed. Also, in order to avoid network congestion, a congestion control function that adjusts the packet transmission rate is required.
【0003】[0003]
【発明が解決しようとする課題】インターネットやイー
サーネットなどのパケット網で動画や音声を用いた通信
を行う際、ネットワークの輻輳に応じてパケット送出速
度を制御する必要がある。しかし、MPEG2やMPE
G4などの従来の符号化方法では、パケット網の輻輳に
対応して動的に符号化速度を変更することできない。そ
のため、これらの符号化方法を用いた場合、パケット網
が輻輳し、情報の転送に支障をきたすという問題点があ
った。When performing communication using moving images and voice in a packet network such as the Internet or Ethernet, it is necessary to control the packet transmission rate according to the congestion of the network. However, MPEG2 and MPE
In the conventional coding method such as G4, the coding rate cannot be dynamically changed in response to the congestion of the packet network. Therefore, when these encoding methods are used, there is a problem in that the packet network becomes congested and information transfer is hindered.
【0004】本発明は、上記事情を考慮してなされたも
のであり、インターネットやイーサーネットなどのパケ
ット網で動画や音声を用いた通信を行なう場合に、ネッ
トワークの輻輳に応じてパケット送出速度を制御するこ
とを可能とする可変レート符号化方法および符号化装置
および復号装置を提供することを目的としている。The present invention has been made in consideration of the above circumstances, and when performing communication using moving images or voice in a packet network such as the Internet or Ethernet, the packet transmission speed is adjusted according to the network congestion. An object of the present invention is to provide a variable rate coding method, a coding device, and a decoding device that can be controlled.
【0005】[0005]
【課題を解決するための手段】上記目的を達成するため
に、本発明の可変レート符号化方法は、情報源からの情
報を符号化する符号化ステップと、該符号化ステップに
より符号化された符号語をバッファに一時蓄積し、与え
られたサービス速度で出力する出力ステップと、サービ
ス速度の目標値または前記バッファに蓄積されている符
号語量の少なくともいずれか一つを用いて前記サービス
速度を決定するサービス速度決定ステップと、前記サー
ビス速度の目標値、前記バッファに蓄積されている符号
語量及び前記サービス速度のうちの少なくともいずれか
一つを用いて、前記符号化ステップにおいて情報源から
の情報を符号化する際の符号化速度を決めるために必要
とされる符号化パラメータを決定する符号化パラメータ
決定ステップとを含むものである。また、前記符号化ス
テップは、前記情報源からの情報を異なる複数の符号化
速度で符号化し、最も高い符号化速度で符号化された符
号語である主符号語と、該主符号語より低い符号化速度
で符号化して得られた符号語である補助符号語とを出力
するようになされているものである。さらに、前記情報
源からの情報はオーディオ情報または画像情報の少なく
ともいずれか一つであり、前記符号化パラメータは、入
力画像をダウンサンプリングすることにより得られる画
像の画像サイズ、画像フレームレート、情報の量子化幅
を決める情報量子化ビット数、フレーム間予測符号化を
行うフレーム数とフレーム内符号化を行うフレーム数の
比である差分フレーム率、オーディオ情報の符号化速
度、補助符号語の速度と主符号語の速度の比である補助
符号語率、主符号語と補助符号語の送信時刻の差である
補助符号語送信遅延時間および送信パケット長のうちの
少なくともいずれか一つとされているものである。In order to achieve the above object, a variable rate coding method of the present invention includes a coding step of coding information from an information source, and a coding step performed by the coding step. The service speed is calculated by using at least one of an output step of temporarily storing a codeword in a buffer and outputting the codeword at a given service speed, and a target value of the service speed or the amount of codewords stored in the buffer. In the encoding step, the service rate determining step is performed, and at least one of the target value of the service rate, the codeword amount accumulated in the buffer, and the service rate is used. A coding parameter determining step for determining a coding parameter required to determine a coding speed when coding information. Is Dressings. In the encoding step, information from the information source is encoded at a plurality of different encoding rates, a main codeword that is a codeword encoded at the highest encoding rate, and a main codeword that is lower than the main codeword. The auxiliary codeword, which is a codeword obtained by encoding at the encoding speed, is output. Further, the information from the information source is at least one of audio information and image information, and the encoding parameter is an image size of an image obtained by down-sampling an input image, an image frame rate, or information of The number of information quantization bits that determines the quantization width, the difference frame rate that is the ratio of the number of frames that perform inter-frame predictive coding and the number of frames that perform intra-frame coding, the coding speed of audio information, and the speed of auxiliary codewords. At least one of an auxiliary code word rate, which is the speed ratio of the main code word, an auxiliary code word transmission delay time, which is the difference between the transmission times of the main code word and the auxiliary code word, and a transmission packet length. Is.
【0006】さらにまた、前記符号化パラメータ決定ス
テップは、前記符号化パラメータの一部または全てと、
前記サービス速度の目標値、前記バッファに蓄積されて
いる符号語量および前記サービス速度のうちの少なくと
もいずれか一つとの関係を示すテーブルを参照すること
により、前記符号化パラメータの一部または全てを決定
するものとされている。さらにまた、前記テーブルに記
載された、前記符号化パラメータと、前記サービス速度
の目標値、前記バッファに蓄積されている符号語量およ
び前記サービス速度のうちの少なくともいずれか一つと
の関係を変更するためのテーブル量子化スケール値を更
新することができるようになされているものである。さ
らにまた、前記符号化パラメータのうちの少なくともい
ずれか一つ、あるいは、前記テーブル量子化スケール値
を受信側から変更することができるようになされている
ものである。さらにまた、受信側におけるパケット到着
状況を送信側に伝えるためのACKパケットを返信する
際の遅延時間とパケット到着状況の少なくともいずれか
一つを変更することにより、前記サービス速度決定ステ
ップにおける前記サービス速度の目標値を決定する動作
を調整することができるようになされているものであ
る。Furthermore, the encoding parameter determining step includes a part or all of the encoding parameters,
By referring to a table showing the relationship between the target value of the service rate, the codeword amount accumulated in the buffer, and at least one of the service rates, a part or all of the encoding parameters can be obtained. It is supposed to be decided. Furthermore, the relationship between the encoding parameter and at least one of the target value of the service rate, the codeword amount accumulated in the buffer, and the service rate, which are described in the table, is changed. The table quantization scale value for is designed so that it can be updated. Furthermore, at least one of the encoding parameters or the table quantization scale value can be changed from the receiving side. Furthermore, the service speed in the service speed determining step is changed by changing at least one of a delay time and a packet arrival status at the time of returning an ACK packet for transmitting the packet arrival status at the reception side to the transmission side. The operation of determining the target value of is adjusted.
【0007】さらにまた、本発明の符号化装置は、情報
源からの情報を符号化する符号化手段と、該符号化手段
により符号化された符号語を一時蓄積し与えられたサー
ビス速度で出力するバッファと、サービス速度の目標値
またはバッファに蓄積されている符号語量の少なくとも
いずれか一つを用いて前記サービス速度を決定するサー
ビス速度決定手段と、前記サービス速度の目標値、前記
バッファに蓄積されている符号語量および前記サービス
速度のうちの少なくともいずれか一つを用いて、前記符
号化手段が情報源からの情報を符号化する際の符号化速
度を決めるために必要とされる符号化パラメータを決定
する符号化パラメータ決定手段とを有するものである。
さらにまた、本発明の復号装置は、通信ネットワーク上
に送信された、情報源からの情報を最も高い符号化速度
で符号化された符号語である主符号語と該主符号語より
低い符号化速度で符号化した符号語である補助符号語と
を受信して復号する復号装置であって、前記主符号語を
用いて情報を再生できなかった場合、対応する補助符号
語を用いて当該情報を再生する手段を有するものであ
る。Furthermore, the coding apparatus of the present invention is a coding means for coding information from an information source, and a code word coded by the coding means is temporarily stored and output at a given service speed. Buffer, a service rate determining means for determining the service rate using at least one of the target value of the service rate or the codeword amount accumulated in the buffer, the target value of the service rate, and the buffer Required to determine the coding rate at which the coding means codes the information from the information source using at least one of the accumulated codeword amount and the service rate. And a coding parameter determining means for determining a coding parameter.
Furthermore, the decoding device of the present invention is a main codeword, which is a codeword in which information from an information source transmitted on a communication network is encoded at the highest encoding speed, and an encoding lower than the main codeword. A decoding device that receives and decodes an auxiliary codeword that is a codeword encoded at a speed, and if the information cannot be reproduced using the main codeword, the information is output using the corresponding auxiliary codeword. It has a means for reproducing.
【0008】[0008]
【発明の実施の形態】本発明の可変レート符号化方法、
該符号化方法が適用される符号化装置、および、これに
より符号化されネットワークに送信された符号語を復号
する復号装置は、例えば、ビデオカメラやマイクから入
力された信号を圧縮符号化し、これをインターネットな
どのパケット網のベストエフォート通信を用いて伝送す
る通信システムに適用される。BEST MODE FOR CARRYING OUT THE INVENTION The variable rate coding method of the present invention,
An encoding device to which the encoding method is applied, and a decoding device that decodes a codeword encoded by the encoding device and transmitted to a network, for example, compresses and encodes a signal input from a video camera or a microphone, and It is applied to a communication system that transmits data using the best effort communication of a packet network such as the Internet.
【0009】図1は、本発明の可変レート符号化方法が
適用される符号化装置および復号装置の一実施の形態を
用いて構成された通信システムの全体構成を示すブロッ
ク図である。ここで、送信端末10が本発明の符号化装
置として動作し、受信端末20が本発明の復号装置とし
て動作する。この図において、ビデオカメラ1やマイク
2などの情報源から送信端末10に入力された信号は、
符号化手段11において符号化パラメータvに基づき圧
縮符号化される。符号化手段11の出力である符号語は
バッファ12に一時蓄積され、サービス速度μでバッフ
ァ12から出力される。輻輳制御手段14はネットワー
クの状況を受信側から送信されるACKパケットを受信
することなどにより把握し、符号化速度の目標値(サー
ビス速度の目標値)λを決定する。符号化速度は符号化
パラメータvだけでなく入力画像にも依存するため、符
号化パラメータvのみから一意に定まらない。そこで、
所望の符号化速度が得られるような符号化パラメータv
を符号化速度の目標値λ、キュー長(バッファ12に蓄
積されている符号語量)k、サービス速度μ等から符号
化パラメータ決定手段15により計算する。また、バッ
ファ12から符号語を出力するサービス速度μを符号化
速度の目標値λとキュー長kからサービス速度決定手段
16により決めることにより、バッファ12での符号語
溢れを防止する。バッファ12からサービス速度μで出
力された符号語はパケット化手段13によりパケット化
され、インターネットなどのネットワーク3に送信され
る。FIG. 1 is a block diagram showing the overall configuration of a communication system configured using an embodiment of an encoding device and a decoding device to which the variable rate encoding method of the present invention is applied. Here, the transmitting terminal 10 operates as the encoding device of the present invention, and the receiving terminal 20 operates as the decoding device of the present invention. In this figure, the signal input to the transmission terminal 10 from an information source such as the video camera 1 or the microphone 2 is
The encoding means 11 performs compression encoding based on the encoding parameter v. The code word output from the encoding means 11 is temporarily stored in the buffer 12 and output from the buffer 12 at the service speed μ. The congestion control means 14 determines the target value of the coding rate (target value of the service rate) λ by grasping the state of the network by receiving the ACK packet transmitted from the receiving side or the like. Since the coding speed depends not only on the coding parameter v but also on the input image, it cannot be uniquely determined only from the coding parameter v. Therefore,
Coding parameter v such that a desired coding speed is obtained
Is calculated by the coding parameter determination means 15 from the target value λ of the coding rate, the queue length (the amount of code words accumulated in the buffer 12) k, the service rate μ, and the like. Further, the service rate μ for outputting the codeword from the buffer 12 is determined by the service rate determining means 16 from the target value λ of the encoding rate and the queue length k, so that the codeword overflow in the buffer 12 is prevented. The code word output from the buffer 12 at the service rate μ is packetized by the packetizing means 13 and transmitted to the network 3 such as the Internet.
【0010】受信端末20は、パケット受信手段21で
パケットを受信し、復号化手段22によりパケット内の
符号語を復号する。復号された信号は、遅延ゆらぎ吸収
手段23により遅延時間のゆらぎを吸収した後にディス
プレイ4とスピーカー5に出力される。また、パケット
廃棄がパケット廃棄検出手段24により検出されると、
廃棄されたパケットに対応する信号は、パケット補間手
段25により補間され、ディスプレイ4とスピーカー5
に出力される。In the receiving terminal 20, the packet receiving means 21 receives the packet, and the decoding means 22 decodes the code word in the packet. The decoded signal is output to the display 4 and the speaker 5 after absorbing the fluctuation of the delay time by the delay fluctuation absorbing means 23. Further, when packet discard is detected by the packet discard detection means 24,
The signal corresponding to the discarded packet is interpolated by the packet interpolating means 25, and the display 4 and the speaker 5 are interpolated.
Is output to.
【0011】ここで、前記符号化手段11において、情
報源からの情報を異なる複数の符号化速度で符号化し、
最も高い符号化速度で符号化して得られた符号語(「主
符号語」という。)と、主符号語より低い符号化速度で
符号化して得られた符号語(「補助符号語」という。)
を生成して、前記バッファ12に蓄積し、前記パケット
化手段13から主符号語を先に送信し、所定の遅延時間
をもって前記補助符号語を送信するようにしてもよい。
この場合には、前記受信端末20(復号装置)におい
て、主符号語のパケットが到達しなかったなどの理由に
より主符号語を用いて情報を再生することができなかっ
たときに、対応する補助符号語を用いて当該情報を再生
することが可能となる。Here, in the encoding means 11, the information from the information source is encoded at a plurality of different encoding rates,
A codeword obtained by encoding at the highest encoding speed (referred to as "main codeword") and a codeword obtained by encoding at a lower encoding speed than the main codeword (referred to as "auxiliary codeword"). )
May be generated and stored in the buffer 12, the main codeword is transmitted first from the packetizing means 13, and the auxiliary codeword is transmitted with a predetermined delay time.
In this case, when the receiving terminal 20 (decoding device) cannot reproduce the information using the main codeword due to the reason that the packet of the main codeword has not arrived, the corresponding auxiliary It becomes possible to reproduce the information by using the code word.
【0012】図2は、前記送信端末10において実行さ
れる本発明の可変レート符号化方法の一実施の形態の処
理手順を示す図である。この図に示されるように、本実
施の形態に係わる符号化方法は、ステップS1〜ステッ
プS8を備えている。ステップS1では、サービス速度
μ、サービス速度の目標値(符号化速度の目標値)λ、
及び符号化パラメータvの初期値を設定する。ステップ
S2では情報源(ビデオカメラ1,マイク2)から情報
を入力する。ステップS3は、前記符号化手段11によ
り実行されるステップであり、与えられた符号化パラメ
ータvに従って情報源を符号化し符号語を出力する。ス
テップS4では符号語をバッファ12に蓄積する。ステ
ップS5は、前記サービス速度決定手段16により実行
されるステップであり、サービス速度の目標値λまたは
バッファ12に蓄積されている符号語量kの少なくとも
いずれか一つに基づいてバッファ12から符号語を出力
するサービス速度μを決定する。なお、最初は、前記ス
テップS1で設定された初期値を用いる。ステップS6
は、前記輻輳制御手段14により実行されるステップで
あり、ACKパケットの受信状況などによりネットワー
クの状況に基づいて前記サービス速度の目標値λを決定
する。ステップS7は、前記符号化パラメータ決定手段
15により実行されるステップであり、前記サービス速
度の目標値λ、前記サービス速度μあるいは前記バッフ
ァ12に蓄積されている符号語量kに基づいて符号化パ
ラメータvを決定する。ステップS8ではサービス速度
μに従って符号語をバッファ12から出力する。そし
て、前記ステップS2に戻り、情報の送信が終了するま
で前記ステップS2〜S8を繰返し実行する。FIG. 2 is a diagram showing a processing procedure of an embodiment of the variable rate coding method of the present invention executed in the transmission terminal 10. As shown in this figure, the encoding method according to the present embodiment includes steps S1 to S8. In step S1, the service rate μ, the target value of the service rate (the target value of the encoding rate) λ,
And the initial value of the coding parameter v is set. In step S2, information is input from the information source (video camera 1, microphone 2). Step S3 is a step executed by the encoding means 11, and encodes the information source according to the given encoding parameter v and outputs the code word. In step S4, the code word is stored in the buffer 12. Step S5 is a step executed by the service rate determining means 16, and based on at least one of the target value λ of the service rate and the codeword amount k stored in the buffer 12, the codeword from the buffer 12 is determined. The service speed μ that outputs is determined. At the beginning, the initial value set in step S1 is used. Step S6
Is a step executed by the congestion control means 14 and determines the target value λ of the service speed based on the network condition such as the reception condition of the ACK packet. Step S7 is a step executed by the encoding parameter determining means 15, and the encoding parameter is based on the target value λ of the service rate, the service rate μ, or the code word amount k accumulated in the buffer 12. Determine v. In step S8, the code word is output from the buffer 12 according to the service speed μ. Then, returning to the step S2, the steps S2 to S8 are repeatedly executed until the information transmission is completed.
【0013】以下に上記各ステップの処理を詳細に説明
する。前記ステップS3では、与えられた符号化パラメ
ータvに従って情報源を符号化し符号語を出力する。な
お、ここでは、前記情報源からの情報を異なる複数の符
号化速度で符号化し、最も高い符号化速度で符号化して
得られた符号語(主符号語)と主符号語よりも低い符号
化速度で符号化して得られた符号語(補助符号語)を出
力するものとして説明する。前記符号化パラメータv
は、入力画像をダウンサンプリングすることにより得ら
れる画像の画像サイズw、画像フレームレートf、情報
の量子化幅を決める情報量子化ビット数q、フレーム間
予測符号化を行うフレーム数とフレーム内符号化を行う
フレーム数の比である差分フレーム率r、オーディオ情
報の符号化速度c、補助符号語の速度と主符号語の速度
の比である補助符号語率a、主符号語と補助符号語の送
信時刻の差である補助符号語送信遅延時間τ、送信パケ
ット長νおよびテーブル量子化スケールsの少なくとも
いずれか一つで記述される。なお、前記テーブル量子化
スケールsについては後述する。The processing of the above steps will be described in detail below. In step S3, the information source is encoded according to the given encoding parameter v and a code word is output. Note that here, a code word (main code word) obtained by encoding the information from the information source at a plurality of different encoding rates and encoding at the highest encoding rate and an encoding lower than the main code word. It is assumed that a codeword (auxiliary codeword) obtained by encoding at speed is output. The encoding parameter v
Is the image size w of the image obtained by down-sampling the input image, the image frame rate f, the number of information quantization bits q that determines the quantization width of information, the number of frames for inter-frame predictive coding, and the intra-frame code. The differential frame rate r, which is the ratio of the number of frames to be encoded, the coding rate c of audio information, the auxiliary codeword rate a, which is the ratio of the speed of the auxiliary codeword and the speed of the main codeword, the main codeword and the auxiliary codeword It is described by at least one of the auxiliary codeword transmission delay time τ, which is the difference between the transmission times of, the transmission packet length ν, and the table quantization scale s. The table quantization scale s will be described later.
【0014】まず、情報源が動画像である場合の動画像
符号化について、図4に示す画像符号化手段の機能ブロ
ック図を参照して説明する。動画像符号化の方式は、動
画像の空間的相関関係および時間的相関関係の高さを利
用した符号化方式であり、フレームレートf、差分フレ
ーム率r、画像サイズwおよび情報量子化ビット数qな
どを符号化パラメータvとして変更できる方式とされて
いる。First, moving picture coding when the information source is a moving picture will be described with reference to the functional block diagram of the picture coding means shown in FIG. The moving image encoding method is an encoding method that uses the height of spatial correlation and temporal correlation of moving images, and includes a frame rate f, a differential frame rate r, an image size w, and the number of information quantization bits. This is a method in which q or the like can be changed as the encoding parameter v.
【0015】前記ステップS2で入力した情報に対し、
画像フレームレートf(単位時間当たりに送信するフレ
ームの数)に相当するタイミングのフレームのみに対し
符号化をおこない、それ以外のフレームについては符号
化対象としないことで画像フレームレートfを制御す
る。ここで、画像フレームレートfの適用(変更)はフ
レーム内符号化フレームを符号化する前とし、次のフレ
ーム内符号化フレームまでは一定とする。また、1フレ
ームの符号化およびバッファに入力する時間の長さは、
画像フレームレートfに応じたフレーム間隔の長さとす
る。そして、1フレームのフレーム内符号化フレームと
差分フレーム率rに基づく個数のフレーム間予測符号化
フレームの繰り返しとする。ここで、画像サイズw、補
助符号語率aおよび差分フレーム率rの適用はフレーム
内符号化フレームを符号化する前とし、次のフレーム内
符号化フレームまでは一定とする。For the information input in step S2,
The image frame rate f is controlled by performing encoding only on the frame at the timing corresponding to the image frame rate f (the number of frames transmitted per unit time), and not encoding the other frames. Here, the image frame rate f is applied (changed) before the intra-frame coded frame is coded, and is constant until the next intra-frame coded frame. Also, the length of time for encoding one frame and inputting to the buffer is
The length of the frame interval is set according to the image frame rate f. Then, it is assumed that one intraframe coded frame and the number of interframe predictive coded frames based on the differential frame rate r are repeated. Here, the image size w, the auxiliary code word rate a, and the differential frame rate r are applied before the intra-frame coded frame is coded, and are constant until the next intra-frame coded frame.
【0016】フレーム内符号化フレームについては以下
の処理で主符号語を決定する。まず、符号化対象画像を
画像サイズwにダウンサンプリング(31)し、それを
さらに16×16の画像領域に分割する。各画像領域に
対して離散コサイン変換(33)により離散コサイン変
換係数を決定し、さらに、この係数を情報量子化ビット
数qで量子化(34)する。最後に、量子化結果に対し
て可変長符号化(35)により主符号語を決める。ま
た、補助符号語については、以下のようにして決定す
る。まず、符号化対象画像を画像サイズw’にダウンサ
ンプリング(31)し、16×16の画像領域に分割す
る。各画像領域に対して離散コサイン変換(33)によ
り離散コサイン変換係数を決定し、さらに、この係数を
情報量子化ビット数q’で量子化(34)する。量子化
結果に対し、可変長符号化(35)により補助符号語を
決める。画像サイズw’と情報量子化ビット数q’は補
助符号語率a、画像サイズwおよび情報量子化ビット数
qから決定される。上記主符号語および補助符号語を決
定する際の、情報量子化ビット数qおよびq’は16×
16の画像領域を一定個数符号化する毎に適用する。For the intra-coded frame, the main codeword is determined by the following processing. First, the image to be encoded is down-sampled (31) to the image size w, and is further divided into 16 × 16 image areas. A discrete cosine transform coefficient is determined for each image region by the discrete cosine transform (33), and the coefficient is quantized (34) by the number of information quantization bits q. Finally, the main codeword is determined by variable length coding (35) for the quantization result. The auxiliary codeword is determined as follows. First, the image to be encoded is down-sampled (31) to the image size w ′ and divided into 16 × 16 image areas. The discrete cosine transform (33) is used to determine the discrete cosine transform coefficient for each image region, and the coefficient is quantized (34) with the information quantization bit number q ′. An auxiliary code word is determined for the quantization result by variable length coding (35). The image size w ′ and the information quantization bit number q ′ are determined from the auxiliary codeword rate a, the image size w and the information quantization bit number q. The number of information quantization bits q and q ′ when determining the main codeword and the auxiliary codeword are 16 ×
It is applied every time a fixed number of 16 image areas are encoded.
【0017】フレーム内符号化フレームの符号化後に、
後に続くフレーム間予測符号化フレームで参照するため
の画像を以下の処理で決定し、フレームメモリ40に格
納する。まず、主符号語を決定する時に得られた各画像
領域に対する離散コサイン変換係数の量子化結果に対し
情報量子化ビット数qで逆量子化(36)をおこない、
さらに逆離散コサイン変換(37)をおこなう。全画像
領域にこの処理をおこなった後で、符号化対象画像サイ
ズにアップサンプリング(39)をおこない、フレーム
メモリ40に格納する。Intra-frame coding After coding a frame,
An image to be referred to in a subsequent inter-frame predictive coding frame is determined by the following process and stored in the frame memory 40. First, the quantization result of the discrete cosine transform coefficient for each image region obtained when determining the main codeword is inversely quantized (36) with the information quantization bit number q,
Further, inverse discrete cosine transform (37) is performed. After this processing is performed on the entire image area, up-sampling (39) is performed to the size of the image to be encoded and stored in the frame memory 40.
【0018】フレーム間予測符号化フレームについて
は、以下の処理で主符号語を決定する。まず、符号化対
象画像およびフレームメモリ40に格納されている参照
画像を画像サイズwにダウンサンプリング(41)し、
16×16の画像領域に分割する。各画像領域に対し符
号化対象画像と参照画像の誤差を求め(32)、この誤
差に対して離散コサイン変換(33)により離散コサイ
ン変換係数を決定する。さらに、この係数を情報量子化
ビット数qで量子化(34)した結果に対し、可変長符
号化(35)により主符号語を決める。また、補助符号
語については次のように決定する。まず、符号化対象画
像およびフレームメモリに格納されている参照画像を画
像サイズw’にダウンサンプリング(31,41)し、
16×16の画像領域に分割する。各画像領域に対し符
号化対象画像と参照画像の誤差を求め(32)、この誤
差に対して離散コサイン変換(33)により離散コサイ
ン変換係数を決定する。さらに、この係数を情報量子化
ビット数q’で量子化(34)した結果に対し、可変長
符号化(35)により補助符号語を決める。上記主符号
語および補助符号語を決定する際の、情報量子化ビット
数qおよびq’は16×16の画像領域を一定個数符号
化する毎に適用する。For the inter-frame predictive coded frame, the main codeword is determined by the following processing. First, the encoding target image and the reference image stored in the frame memory 40 are down-sampled (41) to the image size w,
It is divided into 16 × 16 image areas. An error between the encoding target image and the reference image is obtained for each image region (32), and a discrete cosine transform coefficient is determined for this error by the discrete cosine transform (33). Further, the main codeword is determined by variable length coding (35) with respect to the result of quantizing (34) this coefficient with the information quantization bit number q. The supplementary code word is determined as follows. First, the image to be encoded and the reference image stored in the frame memory are down-sampled (31, 41) to an image size w ′,
It is divided into 16 × 16 image areas. An error between the encoding target image and the reference image is obtained for each image region (32), and a discrete cosine transform coefficient is determined for this error by the discrete cosine transform (33). Further, with respect to the result of quantizing (34) this coefficient with the information quantization bit number q ', an auxiliary code word is determined by variable length coding (35). The information quantization bit numbers q and q'when determining the main codeword and the auxiliary codeword are applied every time a fixed number of 16x16 image areas are coded.
【0019】フレーム間予測符号化フレームの符号化後
に、後に続くフレーム間予測符号化フレームで参照する
ための画像を以下の処理で決定しフレームメモリ40に
格納する。まず、符号語を決定する時に得られた各画像
領域に対する離散コサイン変換係数の量子化結果(3
4)に対し情報量子化ビット数qで逆量子化(36)を
おこない、さらに逆離散コサイン変換(37)をおこな
う。全画像領域にこの処理をおこなった後で、符号化対
象画像サイズにアップサンプリング(39)をおこな
い、フレームメモリ(40)に格納されている画像との
和を計算(38)しフレームメモリ40に格納する。After the inter-frame predictive coding frame is encoded, the image to be referred to in the subsequent inter-frame predictive coding frame is determined by the following processing and stored in the frame memory 40. First, the quantization result of the discrete cosine transform coefficient (3
4), inverse quantization (36) is performed with the information quantization bit number q, and further inverse discrete cosine transform (37) is performed. After this processing is performed on the entire image area, upsampling (39) is performed to the size of the image to be encoded, and the sum with the image stored in the frame memory (40) is calculated (38) and stored in the frame memory 40. Store.
【0020】次にオーディオ情報の符号化について、図
4のオーディオ符号化手段の機能ブロック図を参照して
説明する。前記ステップS2で入力されるオーディオ情
報は、例えば、2チャンネル、8kHzサンプリングの1
6bitPCMであるとする。オーディオ符号化では、オ
ーディオ符号化速度cに応じて以下の2種類の符号化方
法を切り替える。また、オーディオ符号化速度cの適用
(変更)は、一定時間毎とする。オーディオ符号化速度
cが特定の値よりも大きい場合には、オーディオ符号化
速度cに対応する量子化(51,52)をおこない、量
子化に応じた固定長の符号で符号語を出力する。このと
きの符号語の量は段階的に制御できる。オーディオ符号
化速度cが特定の値以下の場合には、ITU G.729などの
CELP(Code Exited Linear Prediction)方式によ
り符号化(51,53)をおこなう。このときの符号語
の量は方式に応じたものとなる。以上が、図2における
ステップS3の符号化処理である。Next, the encoding of audio information will be described with reference to the functional block diagram of the audio encoding means shown in FIG. The audio information input in the step S2 is, for example, 1 channel of 2 channels and 8 kHz sampling.
It is assumed to be 6-bit PCM. In audio encoding, the following two types of encoding methods are switched according to the audio encoding rate c. Further, the application (change) of the audio coding rate c is made every fixed time. When the audio coding rate c is larger than a specific value, quantization (51, 52) corresponding to the audio coding rate c is performed, and a code word is output with a fixed-length code corresponding to the quantization. The amount of code words at this time can be controlled in stages. When the audio coding rate c is equal to or lower than a specific value, coding (51, 53) is performed by a CELP (Code Exited Linear Prediction) method such as ITU G.729. The amount of code words at this time depends on the system. The above is the encoding process of step S3 in FIG.
【0021】次に、ステップS4ではこのようにして符
号化された符号語(主符号語および補助符号語)をバッ
ファ12に蓄積する。Next, in step S4, the code words (main code word and auxiliary code word) encoded in this way are accumulated in the buffer 12.
【0022】ステップS5ではバッファのサービス速度
μを決定する。その際、バッファ12での符号語の廃棄
を防止するため、μを逐次更新する必要がある。しか
し、バッファへの符号語の到着レートは変動し、かつ予
測困難であるため、キュー長kとサービス速度μの関係
は一意に定まらない。そこで、本発明では、以下に示す
非線形システム制御方式を適用する。この制御方式は、
imaxとmi;maxを定数、i∈{1,2,…,imax}、m∈
{1,2,…,mi;max}、xi;mをシステムの入力、yi;mを
システムの出力、zi;m=gzi; m(xi;m,yi;m)を状態変
数、及びzi;m *をzi;mの目標値としたとき、xi;m、y
i;m、及びgzi;m(xi;m,yi;m)を、各々dyi;m/dxi;m
≧0、∂gzi;m(xi;m,yi;m)/∂xi;m≧0、及び∂g
zi;m(xi;m,yi;m)/∂yi;m≧0となるように選び、z
i;mとzi;m *の距離ができるだけ小さくなるようにxi;m
を決める。また、ci;mをシステムの特徴を表す変数、
σci;mをci;mの変動を表す変数、ai;mをxi;mの変化
速度を決めるパラメータ、Di;m(x,y)をx=yのとき
Di;m(x,y)=1、x≠yのときDi;m(x,y)>1なる
関数としたとき、xi;m+1=ai;m及びyi;m+1=σci;m
/Di;m(zi;m *,zi;m)とすることにより、システムの
変化速度を決めるパラメータを調整する。In step S5, the service speed of the buffer
Determine μ. At that time, discarding the codeword in the buffer 12
In order to prevent this, it is necessary to successively update μ. Only
However, the arrival rate of code words to the buffer fluctuates and
Since it is difficult to measure, the relationship between queue length k and service speed μ
Is not uniquely determined. Therefore, in the present invention,
Apply a non-linear system control method. This control method is
imaxAnd mi; maxIs a constant, i ∈ {1, 2, ..., imax}, M ∈
{1,2, ..., mi; max}, Xi; mSystem input, yi; mTo
System output, zi; m= Gzi; m(xi; m, yi; m)
Number and zi; m *Zi; mX is the target value ofi; m, Y
i; m, And gzi; m(xi; m, yi; m), Respectively dyi; m/ Dxi; m
≧ 0, ∂gzi; m(xi; m, yi; m) / ∂xi; m≧ 0, and ∂g
zi; m(xi; m, yi; m) / ∂yi; mChoose so that ≧ 0, and z
i; mAnd zi; m *X as small as possiblei; m
Decide. Also, ci; mIs a variable that represents the characteristics of the system,
σci; mCi; m, A variable that represents the fluctuation ofi; mXi; mchange of
Parameter that determines speed, Di; mWhen (x, y) is x = y
Di; mD when (x, y) = 1 and x ≠ yi; m(x, y)> 1
If it is a function, xi; m + 1= Ai; mAnd yi; m + 1= Σci; m
/ Di; m(zi; m *, zi; m), The system
Adjust the parameters that determine the rate of change.
【0023】以下のようにxi;mを計算する。離散時間
システムにおいて、zi;m(t)を次式で定義する。Calculate x i; m as follows : In a discrete time system, z i; m (t) is defined by the following equation.
【数1】 ここで、tは離散時刻、dは遅延時間を表す。これを、[Equation 1] Here, t represents a discrete time and d represents a delay time. this,
【数2】
で近似すると、未知係数ζi;mの推定値ζ^i;mは次式に
より得られる。[Equation 2] In is approximated, the unknown coefficients zeta i; estimate zeta ^ i of m; m is obtained by the following equation.
【数3】
ここで、ω0、ω1は、ω0+ω1=1、ω0、ω1>0なる
実数、W[・]は移動平均、εi;m(t)は平均0の確率変
数である。[Equation 3] Here, ω 0 and ω 1 are real numbers such that ω 0 + ω 1 = 1 and ω 0 and ω 1 > 0, W [·] is a moving average, and ε i; m (t) is a random variable with an average of 0. .
【0024】式(2)に最小分散制御(K. J. Astrom, "In
troduction to stochastic controltheory," Academic
Press, Inc., London, 1970)を適用すると、zi;m(t)
は、次式で得られる。The minimum variance control (KJ Astrom, "In
introduction to stochastic controltheory, "Academic
Press, Inc., London, 1970), z i; m (t)
Is obtained by the following equation.
【数4】
ここで、qi;mが十分大きくxi;m(t)の変化が十分小さ
いと仮定すると、[Equation 4] Here, assuming that q i; m is sufficiently large and the change in x i; m (t) is sufficiently small,
【数5】 が成り立つ。 xi;m+1(t-1)を[Equation 5] Holds. x i; m + 1 (t-1)
【数6】 として、式(6)と式(7)を式(5)に代入すると、[Equation 6] Then, substituting equation (6) and equation (7) into equation (5),
【数7】 が得られる。この式(8)によりxi;m(t)を計算する。[Equation 7] Is obtained. The formula (8) calculates x i; m (t).
【0025】xi;m(t)をシステムの制御入力、yi;m(t)
をシステムの制御出力とすると、式(8)においてxi;m+1
(t)はxi;m(t)の変化速度を決めるパラメータとなる。
例えば、Di;m(x,y)を|x−y|+1とすると、X i; m (t) is the control input of the system, y i; m (t)
Is the control output of the system, x i; m + 1 in equation (8)
(t) is a parameter that determines the rate of change of x i; m (t).
For example, if D i; m (x, y) is | x−y | +1,
【数8】
となる。式(8)のmをm+1に置き換えることにより、
xi;m(t)の変動に関する所望の特性を与えるxi;m+1(t)
(xi;m(t)の変化速度を決めるパラメータ)を決めるこ
とができる。[Equation 8] Becomes By replacing m in equation (8) with m + 1,
x i; m + 1 (t) that gives the desired property for the variation of x i; m (t)
(A parameter that determines the changing speed of x i; m (t)) can be determined.
【0026】本実施の形態では、Rμ=(λ−c)/μ
とする。そして、上記非線形システム制御方法をRμの
制御に適用する。imax=1、mi;max=2として、式
(8)の各変数を、xi;m(t)=Rμ(t),yi;m(t)=k
(t),xi;m+1(t)=pR(定数),RμCをRμの目標
値、z*=zR *=RμC bRkC,zR(t)=Rμ(t-d)bRk
(t)と置き換えることにより、次式が得られる。In the present embodiment, R μ = (λ-c) / μ
And Then, the above-mentioned nonlinear system control method is applied to the control of R μ . Assuming i max = 1 and m i; max = 2,
For each variable in (8), x i; m (t) = R μ (t), y i; m (t) = k
(t), x i; m + 1 (t) = p R ( constant), the target value of the R μC R μ, z * = z R * = R μC bR k C, z R (t) = R μ (td) bR k
By substituting (t), the following equation is obtained.
【数9】 ここで、dは制御遅延である。従って、[Equation 9] Here, d is a control delay. Therefore,
【数10】
より、適切なサービス速度μ(t)を決定することができ
る。上記制御の結果得られるkの平均値kbarとRμの
平均値Rbarμは、図5に示すように、特性曲線と制御
曲線の交点となる。[Equation 10] Therefore, an appropriate service speed μ (t) can be determined. The average value kbar of k and the average value Rbar μ of R μ obtained as a result of the above control are the intersections of the characteristic curve and the control curve, as shown in FIG.
【0027】また、他の方法を採用することもできる。
この場合には、次式によりサービス速度μを決定する。Other methods can also be adopted.
In this case, the service speed μ is determined by the following equation.
【数11】
図6に、上の式(12)によるキュー長kとサービス速度μ
の関係を示す。ここで、Kはバッファ12に蓄積できる
符号語の総量、kはバッファ内の符号語量(キュー
長)、α、β、γは与えられた定数である。上式により
サービス速度μを決めたときに、バッファ12での符号
語の廃棄が起きないような定数αを以下により決定す
る。まず、[Equation 11] Figure 6 shows the queue length k and service speed μ according to the above equation (12).
Shows the relationship. Here, K is the total amount of code words that can be stored in the buffer 12, k is the amount of code words in the buffer (queue length), and α, β, and γ are given constants. When the service speed μ is determined by the above equation, a constant α that does not cause the discard of the codeword in the buffer 12 is determined by the following. First,
【数12】 を式(12)に代入すると、[Equation 12] Substituting into equation (12),
【数13】 が得られる。ここで、0≦γ≦1である。[Equation 13] Is obtained. Here, 0 ≦ γ ≦ 1.
【0028】パラメータα、β、γ、λ、及び符号語量
の目標値kCの関係は、The relationship among the parameters α, β, γ, λ and the target value k C of the code word amount is
【数14】 で得られる。これを変形し、[Equation 14] Can be obtained at. Transform this,
【数15】 とすると、αは次式で得られる。[Equation 15] Then, α is obtained by the following equation.
【数16】 従って、式(14)を式(13)に代入し、[Equation 16] Therefore, substituting equation (14) into equation (13),
【数17】
により、サービス速度μを決定する。以上のいずれの方
法により、サービス速度μを決定してもよい。[Equation 17] Determines the service speed μ. The service speed μ may be determined by any of the above methods.
【0029】ステップS6では、例えばMAQS(H. S
atoh, "TCP flow control for maximum throughput and
QoS guarantee," Internet Workshop '99, Japan, pp.
280-285, Feb. 1999、H. Satoh, M. Ishiba, T. Kobay
ashi, T. Enomoto, H. Morikawa, and K. Shimamura, "
Experimental Evaluation of Maximum Throughput and
QoS guaranteed Flow Control over Japan Gigabit Net
work," IEICE Tech. Rep. IN200-211, pp. 217-223, Ma
y, 2001.)のような輻輳制御方式により決められたパケ
ット送出速度をサービス速度の目標値λとする。例え
ば、前述したシステム制御方法を、imax=1,mi;max
=2として、TCPまたはRTPの輻輳制御に適用す
る。ここで、λ(n)をパケットnの送出速度、r(n)をパ
ケット廃棄が起こる確率(パケット廃棄率)、nACKを
ACKを受け取った最新のパケット番号とする。In step S6, for example, MAQS (H.S.
atoh, "TCP flow control for maximum throughput and
QoS guarantee, "Internet Workshop '99, Japan, pp.
280-285, Feb. 1999, H. Satoh, M. Ishiba, T. Kobay
ashi, T. Enomoto, H. Morikawa, and K. Shimamura, "
Experimental Evaluation of Maximum Throughput and
QoS guaranteed Flow Control over Japan Gigabit Net
work, "IEICE Tech. Rep. IN200-211, pp. 217-223, Ma
y, 2001.) A packet transmission rate determined by a congestion control method such as that shown in FIG. For example, using the system control method described above, i max = 1, m i; max
= 2 and applies to congestion control of TCP or RTP. Here, λ (n) is the transmission rate of the packet n, r (n) is the probability of packet discard (packet discard rate), and n ACK is the latest packet number that received ACK.
【0030】まず、m=1の場合について説明する。λ
(n)をシステム入力x1、r(n)をシステム出力y1、φ1*
を制御の目標値z1 *、φ1(n)を状態変数z1として、φ1
*とφ1(n)を次式で定義する。First, the case of m = 1 will be described. λ
(n) is the system input x 1 , r (n) is the system output y 1 , φ 1 *
Target value of control z 1 *, φ 1 and (n) as a state variable z 1, phi 1
* And φ 1 (n) are defined by the following equations.
【数18】
ここで、νはパケット長、RTTはラウンドトリップ遅
延である。また、[Equation 18] Here, ν is the packet length and RTT is the round trip delay. Also,
【数19】 としてもよい。[Formula 19] May be
【0031】前記(8)式のzi;m *、zi;m(t)、x
i;m(t)、xi;m(t-d)及びxi;m+1(t-1)を、φ1 *、φ1(n
ACK)、λ(n)、λ(nACK)及びa2(n)に置き換えると、Z i; m * , z i; m (t), x in the above equation (8)
i; m (t), x i; m (td) and x i; m + 1 (t-1) are represented by φ 1 * , φ 1 (n
ACK ), λ (n), λ (n ACK ) and a 2 (n),
【数20】 が得られる。[Equation 20] Is obtained.
【0032】次に、m=2として、a2(n)を導く。σλ
(n)をシステムの変動量σc1として、次式で定義する。Next, with m = 2, a 2 (n) is derived. σ λ
(n) is defined as the system variation σ c1 by the following equation.
【数21】 状態変数φ2(n)を次式で定義する。[Equation 21] The state variable φ 2 (n) is defined by the following equation.
【数22】 [Equation 22]
【0033】前記(8)式のzi;m *、zi;m(t)、x
i;m(t)、xi;m(t-d)、及びxi;m+1(t-1)を、φ2 *、φ
2(nACK)、a2(n)、a2(nACK)、及び定数a3に置き換え
ると、Z i; m * , z i; m (t), x in the above equation (8)
i; m (t), x i; m (td), and x i; m + 1 (t-1) are φ 2 * , φ
Substituting 2 (n ACK ), a 2 (n), a 2 (n ACK ), and the constant a 3 ,
【数23】 が得られる。[Equation 23] Is obtained.
【0034】なお、上述のように、輻輳制御手段14に
よるパケット送出速度の算出は受信側から送信されるA
CKパケットの受信状況に基づいているため、受信側か
ら送信側に送信するACKパケットの送出タイミング
(送出遅延時間)や受信状況を変更することにより、前
記輻輳制御手段14によるパケット送出速度(サービス
速度の目標値λ)を算出するアルゴリズムを制御するこ
とが可能となる。例えば、受信端末20におけるACK
パケットの受信状況、あるいは到着パケットに対応する
ACKパケットを送信する時刻を所定時間遅延させるこ
と(ACKパケット遅延)を受信パラメータとし、この
受信パラメータを制御することにより、輻輳制御アルゴ
リズムを制御することができる。これは、受信端末20
が独自に受信パラメータを設定するようにしてもよい
し、あるいは、送信端末10から受信端末20に対し受
信パラメータを送信し、受信端末20の動作を制御する
ようにしてもよい。また、1つのACKパケットに対応
する送信パケット数を逐時変更するようにしてもよい。As described above, the calculation of the packet transmission rate by the congestion control means 14 is transmitted from the receiving side A
Since it is based on the reception status of the CK packet, the packet transmission speed (service speed) by the congestion control means 14 is changed by changing the transmission timing (transmission delay time) and the reception status of the ACK packet transmitted from the reception side to the transmission side. It is possible to control the algorithm for calculating the target value λ) of. For example, ACK at the receiving terminal 20
It is possible to control the congestion control algorithm by controlling the reception status of the packet or delaying the time of transmitting the ACK packet corresponding to the arrival packet by a predetermined time (ACK packet delay), and controlling this reception parameter. it can. This is the receiving terminal 20
May independently set the reception parameter, or the transmission parameter may be transmitted from the transmission terminal 10 to the reception terminal 20 and the operation of the reception terminal 20 may be controlled. Further, the number of transmission packets corresponding to one ACK packet may be changed at any time.
【0035】次に、ステップS7では前記ステップS6
で決定されたサービス速度の目標値λに基づいて符号化
パラメータvを決定する。この例では、v=(w,f,r,
a,q,c)、すなわち、画像サイズw、画像フレームレ
ートf、差分フレーム率r、補助符号語率a、情報量子
化ビット数qおよびオーディオ情報の符号化速度cが変
更できる符号化パラメータvとして選択されているもの
とする。まず、サービス速度の目標値λに応じてオーデ
ィオ情報の符号化速度cを決定する。次に、図7記載の
テーブルによりこの符号化パラメータvのうちw,f,
r,aをサービス速度の目標値λから決定するようにし
ている。ここで、λ0、λ1、…は定数、iはテーブルの
インデックス、sはテーブル量子化スケールである。こ
のテーブル量子化スケールsを変更することにより、図
7に示したテーブルの各行の(λ−c)の値の範囲が変
更され、sが大きいほど符号化レートが高くなる。符号
化速度と情報量子化ビット数qの関係は入力画像により
変動するので、与えられたサービス速度の目標値λに対
する最適な符号化パラメータvは同様に変動する。そこ
で、テーブル量子化スケールsを逐次更新することによ
り、サービス速度の目標値λと最適な符号化パラメータ
vの関係を維持する。Next, in step S7, the step S6 is executed.
The coding parameter v is determined on the basis of the target value λ of the service speed determined in. In this example, v = (w, f, r,
a, q, c), that is, the image size w, the image frame rate f, the difference frame rate r, the auxiliary code word rate a, the information quantization bit number q, and the encoding rate c of the audio information that can be changed. Shall be selected as. First, the coding rate c of audio information is determined according to the target value λ of the service rate. Next, according to the table shown in FIG. 7, w, f,
r and a are determined from the target value λ of the service speed. Here, λ 0 , λ 1 , ... Are constants, i is a table index, and s is a table quantization scale. By changing the table quantization scale s, the range of the value of (λ-c) in each row of the table shown in FIG. 7 is changed, and the larger s, the higher the coding rate. Since the relationship between the coding rate and the number of information quantization bits q varies depending on the input image, the optimum coding parameter v for the given target value λ of the service rate also varies. Therefore, the table quantization scale s is sequentially updated to maintain the relationship between the target value λ of the service speed and the optimum coding parameter v.
【0036】前記テーブル量子化スケールsとキュー長
kはdk/ds>0という関係があるため、図8の特性
曲線が得られるが、この特性曲線は未知の時変非線形関
数である。そこで、上述した非線形システムの制御方法
をテーブル量子化スケールsの制御に適用する。すなわ
ち、imax=1、mi;max=2として、式(8)の各変数
を、xi;m(t)=s(t)、yi;m(t)=k(t)、xi;m+1(t)=
ps(定数)、sCをテーブル量子化スケールsの目標
値、kCをキュー長kの目標値、z*=zs *=sC bskC、
zs(t)=s(t-d)bsk(t)と置き換えることにより次式が
得られる。ここで、dは制御遅延である。Since the table quantization scale s and the queue length k have a relationship of dk / ds> 0, the characteristic curve of FIG. 8 is obtained, but this characteristic curve is an unknown time-varying nonlinear function. Therefore, the above-mentioned control method of the nonlinear system is applied to the control of the table quantization scale s. That is, assuming that i max = 1 and m i; max = 2, the variables of the formula (8) are represented by x i; m (t) = s (t), y i; m (t) = k (t), x i; m + 1 (t) =
p s (constant), s C is the target value of the table quantization scale s, k C is the target value of the queue length k, z * = z s * = s C bs k C ,
By substituting z s (t) = s (td) bs k (t), the following equation is obtained. Here, d is a control delay.
【数24】
これにより、適切なテーブル量子化スケールsを決定す
ることができる。上記制御の結果得られるkの平均値k
barとsの平均値sbarは、図8に示すように、特性曲線
と制御曲線の交点となる。[Equation 24] This makes it possible to determine an appropriate table quantization scale s. Average value k of k obtained as a result of the above control
The average value sbar of bar and s is the intersection of the characteristic curve and the control curve, as shown in FIG.
【0037】また、テーブル量子化スケールsの場合と
同様に、情報量子化ビット数qとキュー長kには図9に
示すような関係がある。しかし、符号化速度と情報量子
化ビット数qの関係は入力画像により変動するため、与
えられたサービス速度の目標値λに対する情報量子化ビ
ット数qは一意に求まらない。そこで、式(24)と同様に
式(8)を適用すると、Further, as in the case of the table quantization scale s, the information quantization bit number q and the queue length k have a relationship as shown in FIG. However, since the relationship between the coding rate and the information quantization bit number q varies depending on the input image, the information quantization bit number q for a given target value λ of the service rate cannot be uniquely obtained. Therefore, applying equation (8) as in equation (24),
【数25】
により情報量子化ビット数qを決定できる。ここで、q
Cを情報量子化ビット数qの目標値、zq(t)=q(t-d)bq
k(t)、zq *=qC bqkC、pqとbqは定数、dは制御遅
延である。上記制御の結果得られるkの平均値kbarと
qの平均値qbarは、図9の特性曲線と制御曲線の交点
となる。これにより、与えられたサービス速度の目標値
λに対応する情報量子化ビット数qを適応的に制御する
ことが可能となる。[Equation 25] Can determine the number q of information quantization bits. Where q
C is a target value of the information quantization bit number q, and z q (t) = q (td) bq
k (t), z q * = q C bq k C, p q and b q are constants, d is a control delay. The average value kbar of k and the average value qbar of q obtained as a result of the above control are the intersections of the characteristic curve and the control curve of FIG. This makes it possible to adaptively control the number q of information quantization bits corresponding to the given target value λ of the service speed.
【0038】なお、上述した実施の形態においては、前
記符号化パラメータvあるいは情報量子化ビット数sを
送信端末10において変更するようにしていたが、受信
端末20から制御情報を送信端末10に送信して、前記
符号化パラメータvあるいは情報量子化ビット数sを調
整するようにすることもできる。この場合には、例え
ば、遠隔監視システムなどにおいて、受信側で必要とす
る情報の特性に応じた符号化方式を選択することが可能
となる。In the above embodiment, the coding parameter v or the information quantization bit number s is changed in the transmitting terminal 10, but the receiving terminal 20 transmits the control information to the transmitting terminal 10. Then, the encoding parameter v or the information quantization bit number s can be adjusted. In this case, for example, in a remote monitoring system or the like, it is possible to select an encoding method according to the characteristics of information required on the receiving side.
【0039】また、上記においては、サービス速度の目
標値λの値を基準としてそれに対応する符号化パラメー
タvを決定するようにしていたが、前記サービス速度μ
あるいは前記バッファに蓄積されている符号語量kの値
を基準としてそれに対応する対応する符号化パラメータ
vを決定するようにしてもよい。あるいは、サービス速
度の目標値λ、前記サービス速度μまたは前記バッファ
に蓄積されている符号語量kのうちの複数を基準として
もよい。さらに、上記テーブルにおいては、符号化パラ
メータvとして、画像サイズw、画像フレームレート
f、差分フレーム率rおよび補助符号語率aが選択され
ている例を示したが、これに限られることはなく、主符
号語と補助符号語の送信時刻の差である補助符号語送信
遅延時間τや送信パケット長νなどを決定するようにし
てもよい。In the above description, the coding parameter v corresponding to the target value λ of the service speed is used as a reference, but the service speed μ is determined.
Alternatively, the value of the code word amount k accumulated in the buffer may be used as a reference to determine the corresponding coding parameter v. Alternatively, a plurality of the target value λ of the service rate, the service rate μ, or the code word amount k accumulated in the buffer may be used as a reference. Further, in the above table, the example in which the image size w, the image frame rate f, the differential frame rate r and the auxiliary code word rate a are selected as the encoding parameter v is shown, but the present invention is not limited to this. The auxiliary codeword transmission delay time τ, the transmission packet length ν, and the like, which are the differences between the transmission times of the main codeword and the auxiliary codeword, may be determined.
【0040】[0040]
【発明の効果】以上説明したように、本発明の可変レー
ト符号化方法、符号化装置および復号装置によれば、イ
ンターネットやイーサーネットなどのパケット網で動画
や音声を用いた通信を行う際、ネットワークの輻輳に応
じてパケット送出速度を制御することが可能となる。ま
た、これにより、従来のMPEG2やMPEG4などの
従来の可変レート符号方法を用いた際に生じるパケット
網の輻輳を回避できるため、他のトラヒックを圧迫する
ことなく音声や画像の通信が可能となる。As described above, according to the variable rate coding method, the coding device, and the decoding device of the present invention, when performing communication using a moving image or voice in a packet network such as the Internet or Ethernet, It is possible to control the packet transmission rate according to the network congestion. Further, this makes it possible to avoid congestion of the packet network that occurs when a conventional variable rate coding method such as the conventional MPEG2 or MPEG4 is used, so that voice or image communication can be performed without putting pressure on other traffic. .
【図1】 本発明の可変レート符号化方法が適用された
符号化装置および復号装置を有する通信システムの構成
を示すブロック図である。FIG. 1 is a block diagram showing a configuration of a communication system having an encoding device and a decoding device to which the variable rate encoding method of the present invention is applied.
【図2】 本発明の可変レート符号化方法の一実施の形
態における処理手順のを示すフローチャートである。FIG. 2 is a flowchart showing a processing procedure in an embodiment of a variable rate coding method of the present invention.
【図3】 画像符号化手段を説明するための機能ブロッ
ク図である。FIG. 3 is a functional block diagram for explaining image encoding means.
【図4】 音声符号化手段を説明するための機能ブロッ
ク図である。FIG. 4 is a functional block diagram for explaining a voice encoding unit.
【図5】 Rμとキュー長kの特性曲線と制御曲線を示
す図である。FIG. 5 is a diagram showing a characteristic curve and a control curve of Rμ and queue length k.
【図6】 サービス速度μを算出する他の方法における
サービス速度μの制御曲線を示す図である。FIG. 6 is a diagram showing a control curve of the service speed μ in another method of calculating the service speed μ.
【図7】 量子化テーブルの一例を示す図である。FIG. 7 is a diagram showing an example of a quantization table.
【図8】 テーブル量子化スケールsとキュー長kの特
性曲線と制御曲線を示す図である。FIG. 8 is a diagram showing a characteristic curve and a control curve of a table quantization scale s and a queue length k.
【図9】 情報量子化ビット数qとキュー長kの特性曲
線と制御曲線を示す図である。FIG. 9 is a diagram showing a characteristic curve and a control curve of an information quantization bit number q and a queue length k.
1 ビデオカメラ 2 マイク 3 ネットワーク 4 ディスプレイ 5 スピーカー 10 送信端末 11 符号化手段 12 バッファ 13 パケット化手段 14 輻輳制御手段 15 符号化パラメータ決定手段 16 サービス速度決定手段 20 受信端末 21 パケット受信手段 22 復号化手段 23 遅延ゆらぎ吸収手段 24 パケット廃棄検出手段 25 パケット廃棄補間手段 1 video camera 2 microphone 3 network 4 display 5 speakers 10 Sending terminal 11 Encoding means 12 buffers 13 Packetization means 14 Congestion control means 15 Encoding parameter determining means 16 Service speed determination means 20 Receiving terminal 21 packet receiving means 22 Decoding means 23 Delayed fluctuation absorbing means 24 Packet discard detection means 25 Packet discard interpolation means
───────────────────────────────────────────────────── フロントページの続き (72)発明者 佐藤 仁樹 神奈川県横須賀市光の丘3番4号 株式会 社ワイ・アール・ピー移動通信基盤技術研 究所内 (72)発明者 笠間 俊夫 東京都千代田区神田錦町二丁目3番地 株 式会社富士総合研究所内 (72)発明者 安川 祥正 東京都千代田区神田錦町二丁目3番地 株 式会社富士総合研究所内 (72)発明者 有馬 太公 東京都千代田区神田錦町二丁目3番地 株 式会社富士総合研究所内 Fターム(参考) 5C059 KK34 LB01 LB05 MA00 MA04 MA05 MA23 MA31 MC14 MC38 ME01 ME17 PP04 RA08 RB03 RB16 RC32 SS08 TA47 TA71 TC20 TC25 TC27 TC37 TC45 TD16 TD17 UA02 UA05 UA32 UA33 5C064 AA06 AB04 AC04 AC06 AC12 AC16 AD02 AD06 AD14 AD16 5D045 DA20 5J064 AA00 BA16 BB03 BB10 BC01 BC15 BC16 BC29 BD02 ─────────────────────────────────────────────────── ─── Continued front page (72) Inventor Hitoki Sato Kanagawa Prefecture Yokosuka City Hikarinooka No. 3-4 Stock Association YRP Mobile Communication Infrastructure Research Institute Inside the laboratory (72) Inventor Toshio Kasama 2-3 Kandanishikicho, Chiyoda-ku, Tokyo Stock Inside the Fuji Research Institute (72) Inventor Yoshimasa Yasukawa 2-3 Kandanishikicho, Chiyoda-ku, Tokyo Stock Inside the Fuji Research Institute (72) Inventor Taiko Arima 2-3 Kandanishikicho, Chiyoda-ku, Tokyo Stock Inside the Fuji Research Institute F term (reference) 5C059 KK34 LB01 LB05 MA00 MA04 MA05 MA23 MA31 MC14 MC38 ME01 ME17 PP04 RA08 RB03 RB16 RC32 SS08 TA47 TA71 TC20 TC25 TC27 TC37 TC45 TD16 TD17 UA02 UA05 UA32 UA33 5C064 AA06 AB04 AC04 AC06 AC12 AC16 AD02 AD06 AD14 AD16 5D045 DA20 5J064 AA00 BA16 BB03 BB10 BC01 BC15 BC16 BC29 BD02
Claims (9)
テップと、 該符号化ステップにより符号化された符号語をバッファ
に一時蓄積し、与えられたサービス速度で出力する出力
ステップと、 サービス速度の目標値または前記バッファに蓄積されて
いる符号語量の少なくともいずれか一つを用いて前記サ
ービス速度を決定するサービス速度決定ステップと、 前記サービス速度の目標値、前記バッファに蓄積されて
いる符号語量及び前記サービス速度のうちの少なくとも
いずれか一つを用いて、前記符号化ステップにおいて情
報源からの情報を符号化する際の符号化速度を決めるた
めに必要とされる符号化パラメータを決定する符号化パ
ラメータ決定ステップとを含むことを特徴とする可変レ
ート符号化方法。1. A coding step of coding information from an information source, an output step of temporarily storing a codeword coded by the coding step in a buffer and outputting the codeword at a given service speed, and a service. A service speed determining step of determining the service speed using at least one of a target speed value and an amount of code words accumulated in the buffer; a target speed speed value, accumulated in the buffer; At least one of the code word amount and the service rate is used to determine the coding parameter required for determining the coding rate at the time of coding the information from the information source in the coding step. A variable rate coding method, comprising: a coding parameter determining step of determining.
の情報を異なる複数の符号化速度で符号化し、最も高い
符号化速度で符号化された符号語である主符号語と、該
主符号語より低い符号化速度で符号化して得られた符号
語である補助符号語とを出力することを特徴とする請求
項1記載の可変レート符号化方法。2. The encoding step encodes information from the information source at a plurality of different encoding rates, a main codeword which is a codeword encoded at the highest encoding rate, and the main code. The variable rate coding method according to claim 1, wherein an auxiliary code word, which is a code word obtained by coding at a coding rate lower than that of the word, is output.
または画像情報の少なくともいずれか一つであり、 前記符号化パラメータは、入力画像をダウンサンプリン
グすることにより得られる画像の画像サイズ、画像フレ
ームレート、情報の量子化幅を決める情報量子化ビット
数、フレーム間予測符号化を行うフレーム数とフレーム
内符号化を行うフレーム数の比である差分フレーム率、
オーディオ情報の符号化速度、補助符号語の速度と主符
号語の速度の比である補助符号語率、主符号語と補助符
号語の送信時刻の差である補助符号語送信遅延時間およ
び送信パケット長のうちの少なくともいずれか一つであ
ることを特徴とする請求項1または請求項2記載の可変
レート符号化方法。3. The information from the information source is at least one of audio information and image information, and the encoding parameter is an image size and an image frame rate of an image obtained by downsampling an input image. , The number of information quantization bits that determines the quantization width of information, the difference frame rate that is the ratio of the number of frames that perform interframe predictive coding and the number of frames that perform intraframe encoding,
Audio information coding rate, auxiliary codeword rate, which is the ratio of auxiliary codeword speed to main codeword speed, auxiliary codeword transmission delay time, which is the difference between the transmission time of the main codeword and auxiliary codeword, and the transmission packet The variable rate coding method according to claim 1 or 2, wherein the variable rate coding is at least one of the lengths.
前記符号化パラメータの一部または全てと、前記サービ
ス速度の目標値、前記バッファに蓄積されている符号語
量および前記サービス速度のうちの少なくともいずれか
一つとの関係を示すテーブルを参照することにより、前
記符号化パラメータの一部または全てを決定するもので
あることを特徴とする請求項3記載の可変レート符号化
方法。4. The encoding parameter determination step comprises:
By referring to a table showing a relationship between some or all of the encoding parameters and at least one of the target value of the service rate, the amount of code words accumulated in the buffer, and the service rate 4. The variable rate coding method according to claim 3, wherein a part or all of the coding parameters are determined.
パラメータと、前記サービス速度の目標値、前記バッフ
ァに蓄積されている符号語量および前記サービス速度の
うちの少なくともいずれか一つとの関係を変更するため
のテーブル量子化スケール値を更新することができるよ
うになされていることを特徴とする請求項4記載の可変
レート符号化方法。5. The relationship between the coding parameter and at least one of the target value of the service rate, the codeword amount accumulated in the buffer, and the service rate, which are listed in the table, 5. The variable rate coding method according to claim 4, wherein the table quantization scale value for changing can be updated.
もいずれか一つ、あるいは、前記テーブル量子化スケー
ル値を受信側から変更することができるようになされて
いることを特徴とする請求項1乃至請求項5のいずれか
に記載の可変レート符号化方法。6. The method according to claim 1, wherein at least one of the encoding parameters or the table quantization scale value can be changed by a receiving side. Item 6. The variable rate coding method according to any one of Items 5.
側に伝えるためのACKパケットを返信する際の遅延時
間とパケット到着状況の少なくともいずれか一つを変更
することにより、前記サービス速度決定ステップにおけ
る前記サービス速度の目標値を決定する動作を調整する
ことができるようになされていることを特徴とする請求
項1乃至請求項6のいずれかに記載の可変レート符号化
方法。7. The service speed determining step according to claim 1, wherein at least one of a delay time when returning an ACK packet for notifying the transmitting side of the packet arrival status at the receiving side and a packet arrival status is changed. 7. The variable rate coding method according to claim 1, wherein the operation for determining the target value of the service rate can be adjusted.
段と、該符号化手段により符号化された符号語を一時蓄
積し与えられたサービス速度で出力するバッファと、 サービス速度の目標値またはバッファに蓄積されている
符号語量の少なくともいずれか一つを用いて前記サービ
ス速度を決定するサービス速度決定手段と、 前記サービス速度の目標値、前記バッファに蓄積されて
いる符号語量および前記サービス速度のうちの少なくと
もいずれか一つを用いて、前記符号化手段が情報源から
の情報を符号化する際の符号化速度を決めるために必要
とされる符号化パラメータを決定する符号化パラメータ
決定手段とを有することを特徴とする符号化装置。8. An encoding means for encoding information from an information source, a buffer for temporarily accumulating codewords encoded by the encoding means and outputting at a given service speed, and a target value of the service speed. Alternatively, a service rate determining means for determining the service rate using at least one of the codeword amounts stored in the buffer, a target value of the service rate, the codeword amount stored in the buffer, and the A coding parameter for determining a coding parameter required to determine a coding rate when the coding means codes information from an information source by using at least one of service rates. An encoding device comprising: determining means.
源からの情報を最も高い符号化速度で符号化された符号
語である主符号語と該主符号語より低い符号化速度で符
号化した符号語である補助符号語とを受信して復号する
復号装置であって、 前記主符号語を用いて情報を再生できなかった場合、対
応する補助符号語を用いて当該情報を再生する手段を有
することを特徴とする復号装置。9. A main codeword, which is a codeword coded at the highest coding rate, and information from an information source transmitted on a communication network is coded at a coding rate lower than the main codeword. A decoding device that receives and decodes an auxiliary codeword that is a codeword, and when the information cannot be reproduced using the main codeword, a unit that reproduces the information using the corresponding auxiliary codeword is provided. A decoding device having.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001384992A JP2003188731A (en) | 2001-12-18 | 2001-12-18 | Variable rate encoding method, encoder and decoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001384992A JP2003188731A (en) | 2001-12-18 | 2001-12-18 | Variable rate encoding method, encoder and decoder |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003188731A true JP2003188731A (en) | 2003-07-04 |
Family
ID=27594579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001384992A Withdrawn JP2003188731A (en) | 2001-12-18 | 2001-12-18 | Variable rate encoding method, encoder and decoder |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003188731A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005006296A (en) * | 2003-05-21 | 2005-01-06 | Sony Corp | Data processing apparatus, encoding apparatus and method, decoding apparatus and method, and program |
JP2008536389A (en) * | 2005-04-11 | 2008-09-04 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Technology for dynamically controlling the transmission of data packets |
JP2010503887A (en) * | 2006-09-18 | 2010-02-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Audio object encoding and decoding |
JP2010263326A (en) * | 2009-04-30 | 2010-11-18 | Sumitomo Electric Ind Ltd | Communication system |
CN103458247A (en) * | 2013-09-04 | 2013-12-18 | 东南大学 | High-speed unfixed-length code splicing hardware implementation device |
-
2001
- 2001-12-18 JP JP2001384992A patent/JP2003188731A/en not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005006296A (en) * | 2003-05-21 | 2005-01-06 | Sony Corp | Data processing apparatus, encoding apparatus and method, decoding apparatus and method, and program |
JP4496467B2 (en) * | 2003-05-21 | 2010-07-07 | ソニー株式会社 | Data processing apparatus, encoding apparatus, encoding method, decoding apparatus, decoding method, and program |
JP2008536389A (en) * | 2005-04-11 | 2008-09-04 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Technology for dynamically controlling the transmission of data packets |
JP4681044B2 (en) * | 2005-04-11 | 2011-05-11 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Technology for dynamically controlling the transmission of data packets |
JP2010503887A (en) * | 2006-09-18 | 2010-02-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Audio object encoding and decoding |
JP2010263326A (en) * | 2009-04-30 | 2010-11-18 | Sumitomo Electric Ind Ltd | Communication system |
CN103458247A (en) * | 2013-09-04 | 2013-12-18 | 东南大学 | High-speed unfixed-length code splicing hardware implementation device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3027492B2 (en) | Dual layer encoding method and apparatus for video signal for ATM network | |
US7801969B2 (en) | Apparatus and method for compression-transmitting and decoding picture information and storage medium stored its control programs | |
US6151636A (en) | Data and media communication through a lossy channel using signal conversion | |
US7496040B2 (en) | Roundtrip delay time measurement apparatus and method for variable bit rate multimedia data | |
US7668170B2 (en) | Adaptive packet transmission with explicit deadline adjustment | |
CN106851281B (en) | Initial bandwidth estimation for real-time video transmission | |
CN104584495B (en) | The device and method of adaptation rate multimedia communication on wireless network | |
EP2096868A2 (en) | Context-adaptive bandwidth adjustment in video rate control | |
US6456967B1 (en) | Method for assembling a voice data frame | |
JP2003102008A (en) | Method of transmitting layered video-coded information | |
JP2002204278A (en) | Device and method for data transmission | |
WO2006054442A1 (en) | Transmitting apparatus, receiving apparatus and communication system | |
KR20050010832A (en) | Transmission method using a virtual reception buffer to absorb fluctuation of the channel transmission rate | |
CN106973294B (en) | Initial bandwidth estimation for real-time video transmission | |
US8843379B2 (en) | Apparatus, electronic apparatus and method for adjusting jitter buffer | |
JP3668110B2 (en) | Image transmission system and image transmission method | |
US20050089092A1 (en) | Moving picture encoding apparatus | |
JP2003316391A (en) | Device and method for decoding voice | |
JP2894137B2 (en) | Prefilter control method and apparatus in video coding | |
JP2003188731A (en) | Variable rate encoding method, encoder and decoder | |
JP2004522325A (en) | System for controlling the rate of data output to a network | |
US9313338B2 (en) | System, device, and method of voice-over-IP communication | |
JP2005045469A (en) | Device and method for receiving multimedia content | |
KR101703133B1 (en) | Method and Apparatus for Real-time Joint Source-Channel Coding | |
JP2003116133A (en) | System and method for controlling transmission quality for moving picture compression coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20050301 |