WO2007126106A1 - 符号化方法および符号化装置 - Google Patents

符号化方法および符号化装置 Download PDF

Info

Publication number
WO2007126106A1
WO2007126106A1 PCT/JP2007/059343 JP2007059343W WO2007126106A1 WO 2007126106 A1 WO2007126106 A1 WO 2007126106A1 JP 2007059343 W JP2007059343 W JP 2007059343W WO 2007126106 A1 WO2007126106 A1 WO 2007126106A1
Authority
WO
WIPO (PCT)
Prior art keywords
scale factor
initial value
common scale
common
subband
Prior art date
Application number
PCT/JP2007/059343
Other languages
English (en)
French (fr)
Inventor
Kaoru Suwabe
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to EP07742778A priority Critical patent/EP2012306A1/en
Priority to US12/226,743 priority patent/US20090083042A1/en
Publication of WO2007126106A1 publication Critical patent/WO2007126106A1/ja

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Definitions

  • the present invention relates to an encoding method and an encoding apparatus for compressing a code amount of a digital information signal such as an audio signal.
  • ISO / IEC 1 3 8 1 8-7 8 MP EG 2-A AC (Advanced Audio Coding), which is standardized by ISO, AAC audio encoding is called as appropriate).
  • AAC audio coding divides a music signal into multiple time blocks and performs orthogonal transform such as extended discrete cosine transform (hereinafter referred to as MDCT (Modified DCT)) for each block to transform coefficients (MDC T coefficients).
  • MDCT Modified DCT
  • MD CT coefficients are scaled with a scale factor
  • the scaled transform coefficients are quantized
  • the quantized values are encoded using the Huffman coding method.
  • AAC audio coding as a code amount control method, when transform coefficients are divided into a plurality of frequency sections (called subbands), a common scale factor common to all subbands and a different subband are used.
  • the bandwidth scale factor is adaptively changed so that the quantization noise distribution takes into account the psychoacoustic model, and the amount of code after variable-length coding is a target code that is separately determined according to standards, product specifications, etc. It approaches the amount (transmission rate).
  • the code amount that can be allocated for each encoded frame is calculated, and the calculated code amount is set as the target code amount of the encoded frame.
  • the scaling factor is updated so that it is less than the standard code amount.
  • An encoded frame is an audio frame having a length obtained by dividing an audio stream having a predetermined transmission rate by a predetermined number of audio samples, for example, 104. In the following description, the encoded frame is simply referred to as a frame.
  • Fig. 5 is a flowchart showing the process flow of conventional quantization loop control.
  • step S1 a common scale factor initial value that is an initial value of the common scale factor is calculated.
  • step S2 scaling is performed by the set initial value.
  • step S 3 it is determined whether or not the quantization noise for each subband is less than or equal to the allowable noise.
  • the quantization noise is calculated by calculating the difference between the inversely quantized M D C T coefficient and the M D C T coefficient before quantization. If the quantization noise is larger than the allowable noise, the subband scale factor is changed in the direction in which the quantization step size is reduced in step S4 so that the quantization noise is less than the allowable noise.
  • step S 6 it is determined whether or not the encoded code amount is equal to or less than the target code amount.
  • the target code amount is a code amount set for each frame. If it is determined that the code amount is larger than the target code amount, in step S7, the common scale factor is changed in the direction in which the quantization step increases, and the process returns to step S2 (quantization). Thereafter, in step S6, the same processing as described above is repeated until it is determined that the code amount is equal to or less than the target code amount.
  • Equation (1) mdctline is the MD CT coefficient before quantization, xquant is the quantized MD CT coefficient, scalefactor is the subband scale factor for each subband, and co ⁇ onscalefac is The common scale factor across all pandas, int (:), means to convert to an integer, abs means absolute value, ⁇ means exponentiation, and * means multiplication. Integerization converts all values from abs to 0.4054 into integers. (Scalefactor—commonsca lefac) is called a quantization step.
  • the quantized MD CT coefficient xquant increases as the subband scale factor scalefactor increases.
  • the quantization step size is reduced and the quantization noise can be reduced.
  • the code amount is increased.
  • the common scale factor increases and the amount of code decreases.
  • the common scale factor and subband scale factor are closely related to the quantization step size, that is, the quantization noise and the generated code amount, and as described above, these scale factors are updated and quantized again. Then, loop control is performed such that encoding is repeated.
  • step S 1 for calculating the initial value of the quantization loop process the initial value of the subpand scale factor is set to 0, and the common scale factor is started from the initial value represented by the following equation (2).
  • Equation (2) MAXQUANT is the maximum quantization coefficient (fixed value) in the AAC audio coding standard, and maxmdcUine is the absolute value within the entire panda.
  • the MDCT coefficient ce il ing (x) that maximizes is a function that finds the smallest integer value greater than or equal to x.
  • the common scale factor initial value is the smallest common scale factor that can be encoded using the Huffman coding table.
  • the common scale factor is adjusted so that the quantization coefficient corresponding to the maximum value of the M D C T coefficient becomes the maximum value M A X — Q U A N T in the standard.
  • the subband scale factor is set to zero. For this reason, from the common scale factor, the quantization step size is set very small. Also, when viewed from the subband scale factor, the frequency characteristics are set flat. In other words, regardless of the characteristics of the input signal, the loop control starts from a state where the code amount is always very large, and the common scale factor is gradually increased (that is, the quantization step size is gradually increased). The code amount is reduced, and the quantization distortion of each subband is adjusted while increasing the subband scale factor according to the input signal characteristics (that is, while reducing the quantization step size).
  • Loop processing is repeated while updating the subband scale factor and common scale factor until the code amount after quantization is less than or equal to the target code amount.
  • Loop processing is a process for searching for a common scale factor that is less than or equal to the target code amount. Yes, since the operation result other than the last loop processing is not required, it is very wasteful processing. Therefore, the processing cost increases as the number of loops increases, so it is desirable to reduce the number of loops.
  • the initial value of the common scale factor is the minimum value that can be encoded as shown in Equation (2), and is a value determined by the input signal regardless of the target code amount.
  • the final value of the common scale factor tends to increase as the target code amount is decreased (the compression rate is increased). Shi Therefore, there is a problem that the smaller the target code amount, the larger the difference between the initial value and the final value of the common scale factor and the number of quantization loops.
  • the first method improves the method of finding the common scale factor final value, and the second method predicts a value close to the common scale factor final value as the initial value.
  • the first method is to reduce the number of loops by using the binary search method for the common scale factor that has been incremented until the code amount is below the target code amount.
  • the second method uses the property that the final value of the common scale factor is close when the signal characteristics of the previous and subsequent frames are similar, and the quantization loop processing is performed from the final value of the common scale factor of the previous frame. It is what is started.
  • Japanese Laid-Open Patent Publication No. 2 00 4-1 7 2 7 7 0 describes that, with regard to A AC audio coding, the amount of loop control in code amount control is reduced, and coding is performed at high speed. Has been.
  • Equation (3) en dcommonscalefac (i-1) is the final value of the common scale factor of the previous frame.
  • x_quant (i) ir iabs (mdctjine (i)) * (2 ⁇ (-1/4 * end— common one scalefac (i- 1))))) ⁇ (3/4) + 0.4054)
  • Figure 6 shows an example of changes in the initial value of the common scale factor (indicated by the solid line) and changes in the final value of the common scale factor (indicated by the dashed line) when using a symphony that includes changes in acoustic characteristics as the sound source. Show. Comparing the final values of the common scale factors of the previous and next frames, the final value varies little, but there may be some significant differences as shown by the arrows. Also, if the absolute value of the difference between the final value of the common scale factor and its initial value is large, the number of loops will increase. In the example shown in Fig. 6, when the absolute value of the difference between the common scale factor final value and its initial value is examined, it becomes a relatively large value. It can also be seen that the absolute value of the difference is almost the same in the front and back frames regardless of changes in the signal characteristics.
  • an object of the present invention is to provide an encoding method and an encoding apparatus capable of reducing the number of quantization loops as compared with the prior art. Disclosure of the invention
  • the present invention is obtained by adding the difference between the initial value of the common scale factor of the previous frame and the final value of the common frame factor of the current frame as the initial value of the common scale factor correction.
  • a quantization loop is started.
  • the initial value of the common scale factor of the current frame is corrected by the increase rate of the common scale factor of the previous frame.
  • a digital information signal is orthogonally transformed for each predetermined block size to obtain a frequency transform coefficient, the frequency transform coefficient is divided into a plurality of subbands, and the frequency transform coefficient is subband scaled for each subband. Scaling based on common scale factors common to all bands In the encoding method for quantizing and quantizing the frequency conversion coefficient by variable length encoding,
  • a sub-pand scale factor control step for changing the sub-band scale factor so that the quantization noise is less than or equal to an allowable value
  • a common scale factor control step for changing the common scale factor up to the final value of the common scale factor where the code amount after variable length coding is less than or equal to the target code amount in frame units;
  • the initial value correcting step is an encoding method that adds the difference between the common scale factor initial value of the previous frame and the common scale factor final value of the previous frame to the initial value of the current frame.
  • the scale factor initial value of the current frame is corrected by the increase rate of the common scale factor of the previous frame. It is an encoding method.
  • a digital information signal is orthogonally transformed for each predetermined block size to obtain a frequency transform coefficient, the frequency transform coefficient is divided into a plurality of subbands, and the frequency transform coefficient is subband scaled for each subband.
  • an encoding device that performs scaling and quantization based on a common scale factor common to all bands and the entire band, and encodes the quantized frequency transform coefficient by variable length coding,
  • An initial value correcting means for correcting the initial value
  • Subband scale factor control means for changing the subband scale factor so that the quantization noise is less than an allowable value
  • Common scale factor control means for changing the common scale factor up to the final value of the common scale factor where the code amount after variable length coding is less than or equal to the target code amount in frame units;
  • It consists of a storage means for storing the common scale factor initial value and the common scale factor final value of the current frame.
  • the initial value correcting means is an encoding device that adds the difference between the common scale factor initial value of the previous frame and the common scale factor final value of the previous frame to the initial value of the current frame.
  • a code for correcting the initial value of the scale factor of the current frame with the increase rate of the common scale factor of the previous frame instead of the difference between the common scale factor initial value of the previous frame and the final value of the common scale factor of the previous frame, a code for correcting the initial value of the scale factor of the current frame with the increase rate of the common scale factor of the previous frame.
  • FIG. 1 is a block diagram of one embodiment of the present invention.
  • FIG. 2 is a flowchart showing the processing flow of one embodiment of the present invention.
  • FIG. 3 is a schematic diagram showing an example of an initial value and a final value of a common scale factor in one embodiment of the present invention.
  • FIG. 4 is a schematic diagram showing an example of the absolute value of the difference between the initial value and the final value of the common scale factor in one embodiment of the present invention.
  • FIG. 5 is a flowchart showing the flow of conventional code amount control processing.
  • Figure 6 shows the initial value of the common scale factor in the conventional code amount control. It is a basic diagram which shows an example of a final value, respectively.
  • a digital audio signal cut out for each block of a predetermined size is input to the input terminal 1.
  • the input audio signal is supplied to the Phil evening bank section 2.
  • a time domain signal is converted into a frequency domain signal by a cross-transform, for example, M D CT.
  • the signal after the orthogonal transformation is divided into subbands, the subpand scale factor of each subband is calculated, and normalization processing is performed to align the dynamic range.
  • the psychoacoustic analysis unit 3 performs appropriate bit allocation for each subband using human psychoacoustic characteristics.
  • the output signal of the filter bank unit 2 is supplied to the quantization unit 4.
  • the quantization unit 4 quantizes the M D C T coefficient from the Phil Yu bank unit 2 based on the analysis result of the psychoacoustic analysis unit 3.
  • the loop control unit 5 calculates a code amount that can be allocated for each encoded frame based on a predetermined encoding rate and information from the psychoacoustic analysis unit 3, and uses the calculated code amount as a target of the encoded frame.
  • the scaling factor for the quantization unit 4 is updated so that the code amount is less than or equal to the target code amount.
  • the encoding unit 6 compresses and encodes the M D C T coefficient quantized by the quantization unit 4 according to a predetermined encoding method. For example, in the case of A A C audio coding, the Huffman coding method is applied as the coding method. At the output terminal 7, the encoded M D C T coefficient is obtained.
  • FIG. 2 is a flowchart showing the flow of loop control processing in one embodiment of the present invention.
  • step S 1 “correction of current common scale factor initial value from previous common scale factor initial value and final value” processing and “current common scale factor initial value in step S 1 2”
  • step S 1 2 This is the “final value storage” process.
  • step S1 a common scale factor initial value is calculated. Equation (4) below shows the formula for calculating the common scale factor for frame number i.
  • step S I 1 the common scale factor initial value is corrected.
  • the initial value of the common scale factor for the current frame plus the difference between the initial value of the common scale factor for the previous frame and the final value is used as the common scale factor correction initial value.
  • the correction calculation formula is shown in the following formula (5).
  • step S 3 it is determined whether or not the quantization noise for each subband is less than or equal to the allowable noise. If the quantization noise is larger than the allowable noise, the subband scale factor is changed in the direction of decreasing the quantization step size in step S4 so as to be less than the allowable noise.
  • step S 6 whether or not the encoded code amount is less than or equal to the target code amount is determined. Determined. If it is determined that the code amount is larger than the target code amount, in step S7, the common scale factor is changed in the direction in which the quantization step increases, and the process returns to step S2 (quantization). Thereafter, in step S6, the same processing as described above is repeated until it is determined that the code amount is equal to or less than the target code amount.
  • the control from step S2 to step S7 is the same as the conventional processing. However, the initial value of common scale factor correction may be larger than the final value as a result of correction.
  • step S7 the common scale factor can be changed (searched) not only in the increasing direction but also in the decreasing direction. If (correction initial value> final value) is satisfied, in step S7, the common scale factor is changed in the monotonically decreasing direction, and the previous quantization step in which (correction initial value ⁇ final value) is obtained. Is the final value.
  • step S6 If it is determined in step S6 that the code amount is equal to or less than the target code amount, T JP2007 / 059343 Steps for correcting the common scale factor initial value of code amount
  • Fig. 3 shows the relationship between the common scale factor correction initial value (shown by a solid line) and the final value (shown by a broken line) when the present invention is applied to the same sound source as in Fig. 6. is there.
  • Figure 3 shows that the initial value of the common scale factor according to the present invention is close to the final value, and the number of loops can be reduced.
  • Fig. 4 shows the absolute value of the difference between the initial value and the final value of the common scale factor when the conventional method is applied to the same sound source as in Fig. 6 (shown by a broken line).
  • the absolute value of the difference when the embodiment is applied is shown.
  • the difference between the initial value and the final value of the common scale factor becomes a considerably large value such as a value of 32, as indicated by the arrow, at the location where the acoustic characteristics have changed.
  • this difference can be as small as a value of 3.
  • the difference between the initial value and the final value of the common scale factor affects the number of quantization loops, the difference can be reduced, so that the number of quantization loops can be reduced and high-speed quantization processing can be performed. In particular, even when the signal characteristics change significantly between the front and rear frames, the speed can be increased to the same level as when the signal characteristics do not change.
  • the initial value correction processing is performed by subtraction for obtaining a difference between the common scale factor initial value of the previous frame and the common scale factor final value of the previous frame, and addition for adding the difference to the common scale factor initial value. Therefore, compared with the conventional apparatus or method, the hardware scale or the software scale can be the same. Another example of the correction process of the common scale factor initial value will be described.
  • correction is performed using an increase rate.
  • the correction process is shown in Equation (7) below.
  • startcommonscalefac i: common scale factor initial value (calculation result of equation (4))
  • the present invention has been specifically described above, but the present invention is not limited to the above-described embodiment, and various modifications based on the technical idea of the present invention are possible. It is.
  • the code amount may be controlled from small to large.
  • the present invention is not limited to AAC audio coding, but is suitable for code amount control in other audio coding such as IS OZ IEC 1 1 1 7 1 8-4 (MP EG-1 Layer 3 and MP 3). Even it can be applied.
  • the present invention is applicable not only to audio data but also to code amount control of video data.
  • the difference between the initial value and the final value of the common scale factor can be reduced, the number of quantization loops can be reduced, and high-speed quantization processing can be performed. I can.
  • in order to correct the common scale factor initial value by the difference it is only necessary to add one addition / subtraction process and comparison process per frame, which is almost the same as the circuit and program of the conventional apparatus. Can be the same scale.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

S1おいて、共通スケールファクタ初期値が算出される。次に、S11において、初期値が補正される。現フレームの初期値に対して、前フレームの初期値と最終値の差を加算したものを共通スケールファクタ補正初期値とする。補正された初期値によってスケーリングがなされる。S3において、サブバンド毎の量子化雑音が許容雑音以下と判定されると、S5において、可変長符号化がなされ、S6において、符号化後の符号量が目標符号量以下が否かが判定される。符号量が目標符号量より大きいと判定されると、S7において、量子化ステップサイズが大きくなる方向に共通スケールファクタが変更され、量子化に処理が戻る。以下、符号量が目標符号量以下と判定されるまで、処理が繰り返される。補正初期値によって処理時間を短縮化できる。

Description

明 細 書
符号化方法および符号化装置 技術分野
この発明は、 オーディオ信号等のディジタル情報信号の符号量の圧縮 を行う符号化方法および符号化装置に関する。 背景技術
オーディオ信号を圧縮するための符号化方法の一つとして、 I S Oに より標準化されている、 I SO/ I E C 1 3 8 1 8 - 7 8 (MP EG 2 - A AC (Advanced Audio Coding), 以下、 AACオーディオ符号化 と適宜称する) が知られている。
A A Cオーディォ符号化は、 音楽信号等を複数の時間ブロックに分割 し、 ブロック毎にオーディオデータを直交変換例えば拡張離散コサイン 変換 (以下、 MDCT(Modified DCT)と称する) して変換係数 (MDC T係数) を得て、 MD CT係数をスケールファクタでスケ一リングし、 スケーリング後の変換係数を量子化し、 量子化値をハフマン符号化方式 により符号化するものである。
AACオーディオ符号化では、 符号量制御の方法として、 変換係数を 複数の周波数区分 (サブバンドと称する) に分割する場合に、 全てのサ ブバンドに共通である共通スケールファクタとサブバンド毎に異なるサ ブバンドスケールファクタを、 心理聴覚モデルを考慮した量子化雑音分 布となるように、 適応的に変化させ、 可変長符号化後の符号量を規格、 商品の仕様等によって別途定められた目標符号量 (伝送レート) に近づ けるものである。 ここで、 符号化フレーム毎に割当可能な符号量を算出 し、 算出した符号量を符号化フレームの目標符号量として、 符号量が目 標符号量以下となるように、 スケーリングファクタが更新される。 符号 化フレームは、 所定の伝送レートのオーディオストリームを所定数例え ば 1 0 2 4個のオーディオサンプルで区切った長さのオーディオフレー ムであり、 以下の説明では、 単にフレームと適宜称する。
第 5図は、 従来の量子化ループ制御の処理の流れを示すフローチヤ一 トである。 処理が開始すると、 まず、 ステップ S 1おいて、 共通スケー ルファクタの初期値である共通スケールファクタ初期値が算出される。 量子化ステップ S 2において、 設定された初期値によってスケーリング がなされる。
ステップ S 3において、 サブバンド毎の量子化雑音が許容雑音以下か 否かが判定される。 量子化雑音は、 逆量子化した M D C T係数と量子化 前の M D C T係数との差分を求めることで計算される。 若し、 許容雑音 より量子化雑音が大きいならば、 許容雑音以下となるように、 ステップ S 4において量子化ステツプサイズが小さくなる方向にサプバンドスケ ールファクタが変更される。
ステップ S 3において、 量子化雑音が許容雑音以下と判定されると、 ステップ S 5において、 可変長符号化がなされる。 そして、 ステップ S 6において、 符号化後の符号量が目標符号量以下が否かが判定される。 目標符号量は、 フレーム単位で設定された符号量である。 符号量が目標 符号量より大きいと判定されると、 ステップ S 7において、 量子化ステ ップが大きくなる方向に共通スケールファクタが変更され、 ステップ S 2 (量子化) に処理が戻る。 以下、 ステップ S 6において、 符号量が目 標符号量以下と判定されるまで、 上述したのと同様の処理が繰り返され る。
A A Cオーディオ符号化における量子化の計算式 ( 1 ) を下記に示す。 x— quant = int ( (abs {mdctjine) * (2A (一 1/4* (scalefactor - common_scalefac) ) ) ) Λ(3/4) +0.4054)
• · · (1) 式 ( 1 ) において、 mdctlineは、 量子化前の MD CT係数、 xquantは、 量子化された MD C T係数、 scalefactorは、 サブバンド毎のサブバン ドスケールファクタ、 co匪 onscalefacは、 全パンドにわたる共通スケー ルファクタ、 int ( :)は、 整数化する処理の意味し、 absが絶対値をとる ことを意味し、 ~がべき乗を意味し、 *が乗算を意味する。 整数化は、 absから 0.4054までの全ての値を整数化する。 (scalefactor— commonsca lefac)が量子化ステップと称される。
式 ( 1 ) から分かるように、 サブバンドスケールファクタ scalefacto rを大きくするほど量子化された MD CT係数 xquantが大きくなる。 つ まり、 サブバンドスケールファクタを大きくするほど量子化ステップサ ィズが小さくなり、 量子化雑音を低減できるが、 量子化係数が大きくな るために符号量が増える。 共通スケールファクタは、 その逆に大きくす るほど量子化ステップサイズが大きくなり、 符号量が減少する。 このよ うに、 共通スケールファクタおよびサブバンドスケールファクタは、 量 子化ステップサイズ、 つまり量子化雑音および発生符号量と密接な関係 にあり、 上述したように、 これらのスケールファクタを更新し再び量子 化および符号化を繰り返すといったループ制御が行われている。
量子化ループ処理の初期値算出のステップ S 1は、 サブパンドスケー ルファクタ初期値を 0とし、 共通スケールファクタを下記の式 (2) で 示す初期値から開始する。
common— scakfac = ceiling (.16/3* (log2 ( {max ndctjine Λ(3/4) )/MAX QUANT) ) )
… (2) 式 (2) において、 MAXQUANTは、 A A Cオーディオ符号化の規格上で の量子化係数最大値 (固定値) 、 maxmdcUineは、 全パンド内の絶対値 が最大となる M D C T係数、 ce i l ing (x)は、 x以上の最小の整数値を求 める関数である。 つまり、 共通スケールファクタ初期値とは、 ハフマン 符号化のテーブルが適用でき、 符号化が行える最小の共通スケールファ クタのことである。
式 (2 ) から分かるように、 M D C T係数の最大値に対応する量子化 係数を規格上の最大値 M A X— Q U A N Tになるように共通スケールフ ァクタが合わせられている。 また、 サブバンドスケールファクタが 0に 合わせられている。 このため、 共通スケ一ルファクタから見ると、 量子 化ステップサイズは非常に小さく設定されていることになる。 また、 サ ブバンドスケールファクタから見ると、 平坦な周波数特性に設定されて いることになる。 つまり、 入力信号の特性に関わらず、 常に符号量が非 常に大きい状態からループ制御が開始され、 共通スケールファクタを 徐々に大きくして (すなわち、 量子化ステップサイズが徐々に大きくさ れて) 発生符号量が下げられ、 且つ入力信号特性に応じてサブバンドス ケールファクタを大きくしながら (すなわち、 量子化ステップサイズを 小さくしながら) 各サブバンドの量子化歪みが調整される。
量子化後の符号量が目標符号量以下になるまで、 サブバンドスケール ファクタおよび共通スケールファクタを更新しながら量子化を繰り返す ループ処理は、 目標符号量以下になる共通スケールファクタを探すため の処理であり、 最後のループ処理の演算結果以外は必要でないため、 非 常に無駄な処理となる。 したがって、 ループ回数が増えるとその分だけ 処理コストがかかるために、 ループ回数を削減することが望まれる。
また、 共通スケールファクタ初期値とは、 式 (2 ) で示されるように、 符号化が行うことができる最小の値で、 目標符号量に関係なく入力信号 によって決まる値である。 一方、 共通スケールファクタ最終値は、 目標 符号量を小さくする (圧縮率を高める) と、 大きくなる傾向がある。 し たがって、 目標符号量を小さくするほど、 共通スケールファクタ初期値 と最終値の差が大きくなり、 量子化ループ回数も増えるという問題があ る。
ループ回数を削減する方法として、 二つのアプローチが考えられる。 第 1の方法は、 共通スケールファクタ最終値を見つける方法を改善する ものであり、 第 2の方法は、 共通スケールファクタ最終値に近い値を予 測して初期値とするものである。 第 1の方法としては、 共通スケールフ ァクタを目標符号量以下になるまでインクリメントしていたものを二分 探索法を使用することがループ回数を削減する方法である。 第 2の方法 は、 前後のフレームの信号特性が似ている場合に、 共通スケールファク 夕最終値も近い値となる性質を利用して、 前フレームの共通スケールフ ァクタ最終値から量子化ループ処理を開始するものである。
特開 2 0 0 4 - 1 7 2 7 7 0号公報には、 A ACオーディオ符号化に 関して符号量の制御におけるループ制御の処理量を低減して、 符号化を 高速で行うことが記載されている。
特開 2 0 0 4— 1 7 2 7 7 0号公報における量子化ループ初回におけ る量子化計算式は、 下記の式 (3) で表される。 式 (3) において、 en dcommonscalefac(i- 1)は、 前フレームの共通スケールファクタ最終値で ある。
x_quant (i) = ir iabs {mdctjine (i) ) * (2Λ (- 1/4 * end— common一 scalefac (i- 1) ))))Λ (3/4) + 0.4054)
· · · (3) 特開 2 0 0 4— 1 7 2 7 7 0号公報における前フレームの共通スケ一 ルファクタ最終値から量子化ループの処理を開始する方法は、 前後のフ レームの信号特性が似ている場合には有効であるが、 変化した場合は、 前フレームの共通スケールファクタ最終値と現フレームの共通スケール ファクタ最終値の差が大きいため、 量子化ループ回数が増える問題があ つた。
第 6図は、 音源として音響特性の変化を含む交響曲を使用した場合の 共通スケールファクタ初期値の変化 (実線で示す) と、 .共通スケールフ ァクタ最終値の変化 (破線で示す) との一例を示す。 前後のフレームの 共通スケールファクタ最終値を比較すると、 概ね最終値の変動が少ない が、 矢印で示す箇所のように、 一部で大きく異なる場合がある。 また、 共通スケールファクタ最終値とその初期値との差の絶対値が大きいと、 ループ回数が増える原因となる。 第 6図に示す例において、 共通スケー ルファクタ最終値とその初期値との差の絶対値を調べると、 比較的大き な値となる。 また、 差の絶対値は、 信号特性の変化に関係なく前後のフ レームでほぼ等しいことが分かる。
したがって、 この発明の目的は、 量子化ループ回数を従来に比してよ り少なくすることが可能な符号化方法および符号化装置を提供すること にある。 発明の開示
上述した課題を解決するために、 この発明は、 現フレームの共通スケ ールファクタ初期値に対して、 前フレームの共通スケールファクタ初期 値と最終値の差分を加算したものを共通スケールファクタ補正初期値と して量子化ループを開始するものである。 また、 前フレームにおける共 通スケールファクタの増加率によって現フレームの共通スケールファク 夕初期値を補正するものである。
この発明は、 ディジタル情報信号を所定のブロックサイズ毎にそれぞ れ直交変換して周波数変換係数を求め、 周波数変換係数を複数のサブバ ンドに分け、 周波数変換係数をサブバンド毎のサブバンドスケールファ クタおよび全帯域共通の共通スケールファクタに基づいてスケーリング して量子化し、 量子化された周波数変換係数を可変長符号化で符号化す る符号化方法において、
共通スケールファクタ初期値を算出するステップと、
初期値を補正する初期値補正ステップと、
量子化雑音が許容値以下になるように、 サブバンドスケールファクタ を変更するサブパンドスケールファクタ制御ステップと、
フレーム単位において、 可変長符号化後の符号量が目標符号量以下と なる共通スケールファクタ最終値まで、 共通スケールファクタを変更す る共通スケールファクタ制御ステップと、
現フレームの共通スケールファクタ初期値と共通スケールファクタ最 終値を保存する保存ステップとからなり、
初期値補正ステップは、 前フレームの共通スケールファクタ初期値と 前フレームの共通スケールファクタ最終値の差分を現フレームの初期値 に加算するものである符号化方法である。
この発明は、 前スレームの共通スケールファクタ初期値と前フレーム の共通スケールファクタ最終値の差分に代えて、 前フレームの共通スケ —ルファクタの増加率でもって現フレームのスケールファクタ初期値を 捕正する符号化方法である。
この発明は、 ディジタル情報信号を所定のブロックサイズ毎にそれぞ れ直交変換して周波数変換係数を求め、 周波数変換係数を複数のサブバ ンドに分け、 周波数変換係数をサブバンド毎のサブバンドスケールファ クタおよび全帯域共通の共通スケールファクタに基づいてスケ一リング して量子化し、 量子化された周波数変換係数を可変長符号化で符号化す る符号化装置において、
共通スケールファクタ初期値を算出する手段と、
初期値を補正する初期値補正手段と、 量子化雑音が許容値以下になるように、 サブバンドスケ一ルファクタ を変更するサブバンドスケールファクタ制御手段と、
フレーム単位において、 可変長符号化後の符号量が目標符号量以下と なる共通スケールファクタ最終値まで、 共通スケールファクタを変更す る共通スケールファクタ制御手段と、
現フレームの共通スケールファクタ初期値と共通スケールファクタ最 終値を保存する保存手段とからなり、
初期値補正手段は、 前フレームの共通スケールファクタ初期値と前フ レームの共通スケールファクタ最終値の差分を現フレームの初期値に加 算するものである符号化装置である。
この発明は、 前フレームの共通スケールファクタ初期値と前フレーム の共通スケールファク夕最終値の差分に代えて、 前フレームの共通スケ ールファクタの増加率でもって現フレームのスケールファクタ初期値を 補正する符号化装置である。 図面の簡単な説明
第 1図は、 この発明の一実施の形態のブロック図である。
第 2図は、 この発明の一実施の形態の処理の流れを示すフローチヤ一 トである。
第 3図は、 この発明の一実施の形態における共通スケールファクタ初 期値および最終値の一例をそれぞれ示す略線図である。
第 4図は、 この発明の一実施の形態における共通スケールファクタ初 期値および最終値の差分の絶対値の一例を示す略線図である。
第 5図は、 従来の符号量制御の処理の流れを示すフロ一チャートであ る。
第 6図は、 従来の符号量制御における共通スケールファクタ初期値お よび最終値の一例をそれぞれ示す略線図である。 発明を実施するための最良の形態
以下、 図面を参照しながらこの発明の一実施の形態について説明する。 この一実施の形態の構成について、 第 1図を参照して説明する。 入力端 子 1には、 所定のサイズのブロック毎に切り出されたディジタルオーデ ィォ信号が入力される。 入力オーディォ信号がフィル夕バンク部 2に供 給される。 フィルタバンク部 2においては、 ¾交変換例えば M D C Tに よって時間領域の信号から周波数領域の信号へ変換される。 さらに、 直 交変換後の信号がサブバンドに分割され、 各サブバンドのサブパンドス ケールファクタが計算され、 ダイナミックレンジをそろえる正規化処理 がなされる。
心理聴覚分析部 3は、 人間の心理聴覚特性を利用して各サブバンド毎 に適切なビット配分を行う。 フィルタバンク部 2の出力信号が量子化部 4に供給される。 量子化部 4は、 フィル夕バンク部 2からの M D C T係 数を心理聴覚分析部 3の分析結果に基づいて量子化を行う。
ループ制御部 5は、 所定の符号化レートと心理聴覚分析部 3からの情 報とに基づいて符号化フレーム毎に割当可能な符号量を算出し、 算出し た符号量を符号化フレームの目標符号量として、 符号量が目標符号量以 下となるように、 量子化部 4に対するスケーリングファクタを更新する。 符号化部 6は、 量子化部 4で量子化後の M D C T係数を所定の符号化方 式に従って圧縮符号化する。 例えば、 A A Cオーディオ符号化の場合で は、 符号化方式としてハフマン符号化方式が適用される。 出力端子 7に は、 符号化後の M D C T係数が得られる。
第 2図は、 この発明の一実施の形態におけるループ制御の処理の流れ を示すフローチャートである。 第 5図に示した従来のループ制御と対応 する処理の部分には、 同一の参照符号を付して示す。 従来の処理と異な る点は、 ステップ S 1 1における、 「前共通スケールファクタ初期値と 最終値から現共通スケールファクタ初期値補正」 処理と、 ステップ S 1 2における 「現共通スケールファクタ初期値と最終値保存」 処理である。 処理が開始すると、 まず、 ステップ S 1おいて、 共通スケールファク 夕初期値が算出される。 フレーム番号 iにおける共通スケールファクタ 算出式を下記の式 (4) に示す。
なされる。 start— common— scakfac (i) = ceiling(l6/3* og2 ( {maxjndctjine (z) Λ(3/4) )/MAX_QUANT) ) )
… (4) 次に、 ステップ S I 1において、 共通スケールファクタ初期値が補正 される。 すなわち、 現フレームの共通スケールファクタ初期値に対して、 前フレームの共通スケールファクタ初期値と最終値の差を加算したもの を共通スケールファクタ補正初期値とする。 補正計算式を下記の式 (5) に示す。
revised start common scalefac ι)
= start common scal^ac (z) + {end common scalqac{i-\)- start common scalefac )
· ' · (5) revisedstartcommonscalefac (i) :補正後の共通スケールファクタ初 期値
s rtcoinmonscalefac(i) :共通スケールファクタ初期値 (式 (4) の 計算結果)
endcommonscalefac(i-l) : 前フレームの共通スケールファクタ最終値 startcommonscalefac(i-l) :前フレームの共通スケールファクタ初期 値
量子化ステップ S 2において、 設定された初期値によってスケ一リン グがなされる。 量子化ループ初回における量子化計算式を下記の式 (6) に示す。
x quant (ζ')
= int ( ( abs mdctjine (i) ) * (2Λ(— 1/4* (revised一 start—common scalefac (i) )))) A(3/4) +0.4054)
• · · (6) 従来の処理における式 (3) と式 (6) とを比較すると、 共通スケー ゾレファクタ初期値を endcommonscalef ac (i— 1)から revisedstartcoimonsc alefac(i)に変更している点が相違
していることが分かる。
ステップ S 3において、 サブバンド毎の量子化雑音が許容雑音以下か 否かが判定される。 若し、 許容雑音より量子化雑音が大きいならば、 許 容雑音以下となるように、 ステップ S 4において量子化ステップサイズ が小さくなる方向にサブバンドスケールファクタが変更される。
ステップ S 3において、 量子化雑音が許容雑音以下と判定されると、 ステップ S 5において、 可変長符号化がなされ、 ステップ S 6において、 符号化後の符号量が目標符号量以下が否かが判定される。 符号量が目標 符号量より大きいと判定されると、 ステップ S 7において、 量子化ステ ップが大きくなる方向に共通スケールファクタが変更され、 ステップ S 2 (量子化) に処理が戻る。 以下、 ステップ S 6において、 符号量が目 標符号量以下と判定されるまで、 上述したのと同様の処理が繰り返され る。 これらのステップ S 2からステップ S 7までの制御は、 従来の処理 と同様である。 但し、 共通スケールファクタ捕正初期値は、 補正の結果、 最終値より大きくなる可能性もあるので、 ステップ S 7では、 共通スケ ールファクタが増加方向のみならず、 減少方向にも変更 (探索) 可能と され、 (補正初期値 >最終値) の場合には、 ステップ S 7において、 単 調減少方向に共通スケールファクタが変更され、 (補正初期値 <最終 値) となる一つ手前の量子化ステップが最終値とされる。
ステップ S 6において、 符号量が目標符号量以下と判定されると、 次 T JP2007/059343 の符号量の共通スケールファクタ初期値の補正処理のために、 ステップ
S 1 2において、 現フレ一厶の共通スケールファクタ初期値(s r t coinm onscal e f ac (i) )と、 最終値 (endco匪 ons ca l e f ac (i)を
保存する。 そして、 フレーム番号 iに関するループ制御が終了する。 第 3図は、 第 6図の場合と同じ音源に対してこの発明を適用した場合 の共通スケールファクタ補正初期値 (実線で示す) と最終値 (破線で示 す) との関係を示すものである。 第 3図からこの発明による共通スケー ルファクタ初期値が最終値に近い値となり、 ループ回数が少なくできる ことが分かる。
第 4図は、 第 6図の場合と同じ音源に対して従来の方法を適用した場 合の共通スケールファクタ初期値と最終値の差分の絶対値 (破線で示 す) と、 この発明の一実施の形態を適用した場合の差分の絶対値 (実線 で示す) とを示している。 従来の方法では、 音響特性が変化した箇所で は、 矢印で示すように、 共通スケールファクタ初期値と最終値の差分が 例えば 3 2の値のようにかなり大きな ¾のとなる。 一方、 この発明の一 実施の形態では、 この差分が 3の値程度に小さいものとできる。
共通スケールファクタ初期値と最終値の差分が量子化ループ回数に影 響するので、 差分を小さくできることによって、 量子化ループ回数を削 減でき、 高速な量子化処理を行うことが可能となる。 特に、 前後のフレ —ム間で信号特性が大きく変化した場合でも、 変化しない場合と同等な 高速化が可能となる。 さらに、 初期値補正処理は、 前フレームの共通ス ケ一ルファクタ初期値と前フレームの共通スケールファクタ最終値の差 分を求める減算と、 差分を共通スケールファクタ初期値に加算する加算 とによってなされるので、 従来の装置または方法と比較し、 ハードゥエ ァの規模またはソフトウエアの規模が同じ程度とすることができる。 共通スケールファクタ初期値の補正処理の他の例について説明する。 他の例では、 前フレームの共通スケールファクタ初期値と最終値の差分 に代えて、 増加率によって補正を行うものである。 すなわち、 補正処理 を下記の式 (7) に示す。 -
Figure imgf000015_0001
÷ start common scaleTac(i~l))
• · · (7) revisedstartcommonscalefac (i) :捕正後の共通スケールファクタ初 期値
startcommonscalefac(i) :共通スケールファクタ初期値 (式 (4) の 計算結果)
endcommonscalefac(i-l) :前フレームの共通スケールファクタ最終値 startcommonscalefac(i-l) :前フレームの共通スケールファクタ初期 値
¾ ( 7 ίこおレ て、 (endcommonscalef ac u-1) ÷s tar tcommonscalefac (i-1))の項が増加率を表している。 差分に代えて増加率を使用した場合 も、 上述したのと同様の効果を得ることができる。
以上、 この発明の一実施の形態について具体的に説明したが、 この発 明は、 上述した一実施の形態に限定されるものではなく、 この発明の技 術的思想に基づく各種の変形が可能である。 例えばこの発明は、 符号量 を目標符号量に制御するために、 符号量を小さいものから大きいものへ 制御するようにしても良い。 また、 この発明は、 AACオーディオ符号 化に限らず、 I S OZ I E C 1 1 1 7 1 8— 4 (MP EG— 1 L a y e r 3、 MP 3) 等の他のオーディオ符号化における符号量制御に対 しても適用することができる。 さらに、 この発明は、 オーディオデータ に限らずビデオデータの符号量制御に対しても適用可能である。
この発明によれば、 共通スケールファクタ初期値と最終値との差を小 さいものとでき、 量子化ループ回数を削減でき、 高速な量子化処理を行 うことができる。 また、 この発明では、 共通スケールファクタ初期値を 差分で捕正するために、 1フレーム当たりで 1回の加減算処理および比 較処理のみを追加すれば良いので、 従来の装置の回路およびプログラム とほぼ同じ規模とすることができる。

Claims

請 求 の 範 囲
1 . ディジ夕ル情報信号を所定のブロックサイズ毎にそれぞれ直交変換 して周波数変換係数を求め、 上記周波数変換係数を複数のサブバンドに 分け、 上記周波数変換係数を上記サブバンド毎のサブバンドスケールフ ァクタおよび全帯域共通の共通スケールファクタに基づいてスケーリン グして量子化し、 量子化された上記周波数変換係数を可変長符号化で符 号化する符号化方法において、
上記共通スケールファクタ初期値を算出するステップと、
上記初期値を補正する初期値補正ステップと、
量子化雑音が許容値以下になるように、 上記サブパンドスケールファ クタを変更するサブバンドスケ一ルファクタ制御ステップと、
フレーム単位において、 上記可変長符号化後の符号量が目標符号量以 下となる共通スケールファクタ最終値まで、 上記共通スケールファクタ を変更する共通スケールファクタ制御ステップと、
現フレームの上記共通スケールファクタ初期値と上記共通スケールフ ァクタ最終値を保存する保存ステップとからなり、
上記初期値補正ステップは、 前フレームの上記共通スケールファクタ 初期値と前フレームの上記共通スケールファクタ最終値の差分を現フレ ームの上記初期値に加算するものである符号化方法。
2 . ディジタル情報信号を所定のプロックサイズ毎にそれぞれ直交変換 して周波数変換係数を求め、 上記周波数変換係数を複数のサブバンドに 分け、 上記周波数変換係数を上記サブバンド毎のサブバンドスケールフ ァクタおよび全帯域共通の共通スケールファクタに基づいてスケ一リン グして量子化し、 量子化された上記周波数変換係数を可変長符号化で符 号化する符号化方法において、 上記共通スケールファクタ初期値を算出するステップと、
上記初期値を補正する初期値補正ステップと、
量子化雑音が許容値以下になるように、 上記サブバンドスケールファ ク夕を変更するサブバンドスケールファクタ制御ステップと、
フレーム単位において、 上記可変長符号化後の符号量が目標符号量以 下となる共通スケールファクタ最終値まで、 上記共通スケールファクタ を変更する共通スケールファクタ制御ステツプと、
現フレームの上記共通スケールファクタ初期値と上記共通スケールフ ァクタ最終値を保存する保存ステップとからなり.、
上記初期値補正ステップは、 前フレームの上記共通スケールファクタ の増加率を上記初期値に乗じるものである符号化方法。
3 . 上記共通スケールファクタ初期値は、 全帯域の中で絶対値が最大と なる周波数変換係数を使用して計算される請求の範囲 1または請求の範 囲 2記載の符号化方法。
4 . 上記サブバンドスケールファクタ初期値は、 0とされる請求の範囲 1または請求の範囲 2記載の符号化方法。
5 . ディジタル情報信号を所定のプロックサイズ毎にそれぞれ直交変換 して周波数変換係数を求め、 上記周波数変換係数を複数のサブバンドに 分け、 上記周波数変換係数を上記サブパンド毎のサブバンドスケールフ ァクタおよび全帯域共通の共通スケールファクタに基づいてスケーリン グして量子化し、 量子化された上記周波数変換係数を可変長符号化で符 号化する符号化装置において、
上記共通スケールファクタ初期値を算出する手段と、
上記初期値を補正する初期値補正手段と、
量子化雑音が許容値以下になるように、 上記サブバンドスケールファ クタを変更するサブバンドスケールファクタ制御手段と、 フレーム単位において、 上記可変長符号化後の符号量が目標符号量以 下となる共通スケールファクタ最終値まで、 上記共通スケールファクタ を変更する共通スケールファクタ制御手段と、
現フレームの上記共通スケールファクタ初期値と上記共通スケールフ ァクタ最終値を保存する保存手段とからなり、
上記初期値補正手段は、 前フレームの上記共通スケールファクタ初期 値と前フレームの上記共通スケールファクタ最終値の差分を現フレーム の上記初期値に加算するものである符号化装置。
6 . ディジタル情報信号を所定のブロックサイズ毎にそれぞれ直交変換 して周波数変換係数を求め、 上記周波数変換係数を複数のサブバンドに 分け、 上記周波数変換係数を上記サブバンド毎のサブバンドスケールフ ァクタおよび全帯域共通の共通スケールファクタに基づいてスケーリン グして量子化し、 量子化された上記周波数変換係数を可変長符号化で符 号化する符号化装置において、
上記共通スケールファクタ初期値を算出する手段と、
上記初期値を補正する初期値補正手段と、
量子化雑音が許容値以下になるように、 上記サブバンドスケ一ルファ クタを変更するサブバンドスケールファクタ制御手段と、
フレーム単位において、 上記可変長符号化後の符号量が目標符号量以 下となる共通スケールファクタ最終値まで、 上記共通スケールファクタ を変更する共通スケールファクタ制御手段と、
現フレームの上記共通スケールファクタ初期値と上記共通スケ一ルフ ァクタ最終値を保存する保存手段とからなり、
上記初期値補正手段は、 前フレームの上記共通スケールファク夕の増 加率を上記初期値に乗じるものである符号化装置。
PCT/JP2007/059343 2006-04-26 2007-04-24 符号化方法および符号化装置 WO2007126106A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP07742778A EP2012306A1 (en) 2006-04-26 2007-04-24 Encoding method and encoding device
US12/226,743 US20090083042A1 (en) 2006-04-26 2007-04-24 Encoding Method and Encoding Apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006122294A JP2007293118A (ja) 2006-04-26 2006-04-26 符号化方法および符号化装置
JP2006-122294 2006-04-26

Publications (1)

Publication Number Publication Date
WO2007126106A1 true WO2007126106A1 (ja) 2007-11-08

Family

ID=38655626

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2007/059343 WO2007126106A1 (ja) 2006-04-26 2007-04-24 符号化方法および符号化装置

Country Status (8)

Country Link
US (1) US20090083042A1 (ja)
EP (1) EP2012306A1 (ja)
JP (1) JP2007293118A (ja)
KR (1) KR20090009784A (ja)
CN (1) CN101432803A (ja)
RU (1) RU2008142391A (ja)
TW (1) TW200746047A (ja)
WO (1) WO2007126106A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012512441A (ja) * 2008-12-29 2012-05-31 モトローラ モビリティ インコーポレイテッド ピーク検出に基づいた選択型スケーリングマスク演算
JP2012514224A (ja) * 2008-12-29 2012-06-21 モトローラ モビリティ インコーポレイテッド ピーク検出に基づく選択的スケーリングマスク計算

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007510938A (ja) * 2003-10-17 2007-04-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号符号化システム
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
US9510044B1 (en) * 2008-06-18 2016-11-29 Gracenote, Inc. TV content segmentation, categorization and identification and time-aligned applications
KR101078378B1 (ko) * 2009-03-04 2011-10-31 주식회사 코아로직 오디오 부호화기의 양자화 방법 및 장치
US8736894B2 (en) * 2011-12-20 2014-05-27 Eastman Kodak Company Producing correction data for printer
JP5942463B2 (ja) 2012-02-17 2016-06-29 株式会社ソシオネクスト オーディオ信号符号化装置およびオーディオ信号符号化方法
CN104488266B (zh) * 2013-06-27 2018-07-06 北京大学深圳研究生院 Avs视频压缩编码方法及编码器
CN110505484A (zh) * 2019-08-12 2019-11-26 深圳市华星光电技术有限公司 数据压缩装置及压缩方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219197A (ja) * 1998-02-02 1999-08-10 Fujitsu Ltd オーディオ信号符号化方法及び装置
JP2001306095A (ja) * 2000-04-18 2001-11-02 Mitsubishi Electric Corp オーディオ符号化装置及びオーディオ符号化方法
JP2004172770A (ja) 2002-11-18 2004-06-17 Tokai Univ 量子化ステップパラメータ決定装置と量子化ステップパラメータ決定方法と量子化ステップパラメータ決定プログラム、ならびに非線形量子化方法と非線形量子化装置と非線形量子化プログラム
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
JP2006080927A (ja) * 2004-09-09 2006-03-23 Toa Corp 符号化方法、符号化装置、復号化方法及び復号化装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1288622C (zh) * 2001-11-02 2006-12-06 松下电器产业株式会社 编码设备和解码设备
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219197A (ja) * 1998-02-02 1999-08-10 Fujitsu Ltd オーディオ信号符号化方法及び装置
JP2001306095A (ja) * 2000-04-18 2001-11-02 Mitsubishi Electric Corp オーディオ符号化装置及びオーディオ符号化方法
JP2004172770A (ja) 2002-11-18 2004-06-17 Tokai Univ 量子化ステップパラメータ決定装置と量子化ステップパラメータ決定方法と量子化ステップパラメータ決定プログラム、ならびに非線形量子化方法と非線形量子化装置と非線形量子化プログラム
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
JP2006080927A (ja) * 2004-09-09 2006-03-23 Toa Corp 符号化方法、符号化装置、復号化方法及び復号化装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012512441A (ja) * 2008-12-29 2012-05-31 モトローラ モビリティ インコーポレイテッド ピーク検出に基づいた選択型スケーリングマスク演算
JP2012514224A (ja) * 2008-12-29 2012-06-21 モトローラ モビリティ インコーポレイテッド ピーク検出に基づく選択的スケーリングマスク計算

Also Published As

Publication number Publication date
US20090083042A1 (en) 2009-03-26
EP2012306A1 (en) 2009-01-07
KR20090009784A (ko) 2009-01-23
TW200746047A (en) 2007-12-16
CN101432803A (zh) 2009-05-13
RU2008142391A (ru) 2010-04-27
JP2007293118A (ja) 2007-11-08

Similar Documents

Publication Publication Date Title
WO2007126106A1 (ja) 符号化方法および符号化装置
US10121480B2 (en) Method and apparatus for encoding audio data
TWI779381B (zh) 用於解碼高階保真立體音響表示之方法、裝置及非暫態電腦可讀取儲存媒體
JP4673882B2 (ja) 推定値を決定するための方法および装置
NO338918B1 (no) Audio-koding
WO2006054583A1 (ja) オーディオ信号符号化装置および方法
JP2006259517A (ja) 音声処理装置及び音声処理方法
TW200805253A (en) Audio coding apparatus, audio decoding apparatus, audio coding mehtod and audio decoding method
AU2010288103B2 (en) Frequency band scale factor determination in audio encoding based upon frequency band signal energy
BRPI0506627B1 (pt) método e dispositivo para quantizar um sinal de informações
US8380524B2 (en) Rate-distortion optimization for advanced audio coding
US20010050959A1 (en) Encoder and communication device
JP2009253706A (ja) 符号化装置、復号装置、符号化方法、復号方法及びプログラム
EP2842126A1 (en) Audio encoding and decoding with conditional quantizers
JP5019437B2 (ja) オーディオビットレート変換方法および装置
JP4024185B2 (ja) デジタルデータ符号化装置
JP2000347679A (ja) オーディオ符号化装置及びオーディオ符号化方法
Yen et al. A low-complexity MP3 algorithm that uses a new rate control and a fast dequantization
EP2346031B1 (en) Rate-distortion optimization for advanced audio coding
JP2004021153A (ja) オーディオ信号符号化装置
JP2010175633A (ja) 符号化装置及び方法、並びにプログラム
JP2002141805A (ja) 符号化器および通信デバイス
JP2002311997A (ja) オーディオ信号符号化装置
CN116189693A (zh) 一种带宽扩展方法、装置、介质及设备
JPH11177435A (ja) 量子化装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 07742778

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 7815/DELNP/2008

Country of ref document: IN

Ref document number: 1020087022684

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 2007742778

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 12226743

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2008142391

Country of ref document: RU

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 200780015062.8

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE