WO2011126340A2 - 오디오 신호 처리 방법 및 장치 - Google Patents

오디오 신호 처리 방법 및 장치 Download PDF

Info

Publication number
WO2011126340A2
WO2011126340A2 PCT/KR2011/002487 KR2011002487W WO2011126340A2 WO 2011126340 A2 WO2011126340 A2 WO 2011126340A2 KR 2011002487 W KR2011002487 W KR 2011002487W WO 2011126340 A2 WO2011126340 A2 WO 2011126340A2
Authority
WO
WIPO (PCT)
Prior art keywords
vector
candidate
target
codevectors
errors
Prior art date
Application number
PCT/KR2011/002487
Other languages
English (en)
French (fr)
Other versions
WO2011126340A3 (ko
Inventor
정규혁
전혜정
이병석
이창헌
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020100086489A external-priority patent/KR20110113124A/ko
Priority claimed from KR1020100086488A external-priority patent/KR20110113123A/ko
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to CN201180026076.6A priority Critical patent/CN102906812B/zh
Priority to EP11766191.8A priority patent/EP2557566B8/en
Priority to US13/640,042 priority patent/US9153238B2/en
Publication of WO2011126340A2 publication Critical patent/WO2011126340A2/ko
Publication of WO2011126340A3 publication Critical patent/WO2011126340A3/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Definitions

  • the present invention relates to an audio signal processing method and apparatus capable of encoding or decoding an audio signal.
  • linear predictive coding In general, linear predictive coding (LPC) is performed on an audio signal when the audio signal has a particularly strong characteristic.
  • LPC linear predictive coding
  • the linear-predictive coefficients generated by linear predictive coding are sent to a decoder, which reconstructs the audio signal through linear predictive synthesis on the coefficients.
  • Vector-quantization is performed to transmit linear-prediction coefficients or linear-prediction transform coefficients to a decoder. In this case, there is a problem in that sound quality is distorted because quantization errors occur.
  • the present invention has been made to solve the above problems, and to provide an audio signal processing method and apparatus capable of minimizing quantization error in vector-quantizing linear-prediction transform coefficients.
  • Another object of the present invention is to provide a method and apparatus for processing an audio signal for varying the number of candidate vectors at each step.
  • Another object of the present invention is to provide an audio signal processing method and apparatus for replacing an optimal best code vector in the case of a large error while reducing the number of candidate vectors to a small number.
  • the present invention provides the following effects and advantages.
  • the number of candidate vectors is adaptively changed in each step, thereby minimizing the increase in complexity according to the number.
  • the number of candidate vectors in each step is determined based on an error, it is possible to reduce the quantization error while minimizing the increase in complexity.
  • the number of candidate vectors increases to a small number such as 1 or 2, while the total number of sets of candidate vectors grows exponentially (M N ). By reducing, complexity can be minimized.
  • quantization errors can be reduced by substituting the optimal best code vector generated by rescanning in case of a large error.
  • FIG. 1 is a block diagram of an encoder in an audio signal processing apparatus according to an embodiment of the present invention.
  • FIG. 2 is a configuration diagram of a first embodiment 121-A of the first stage quantization unit 121 in FIG. 1.
  • FIG. 3 is a configuration diagram of a first embodiment 12N-A of the N-th step quantization unit 12N in FIG.
  • 4 is a diagram for explaining the operation of the N-th step quantization unit 12N.
  • FIG. 5 is a configuration diagram of a second embodiment 121 -B of the first stage quantization unit 121 in FIG. 1.
  • FIG. 6 is a configuration diagram of a second embodiment 12N-B of the Nth-step quantization unit 12N in FIG. 1.
  • FIG. 7 is a block diagram of an audio signal processing apparatus enhancement encoder according to another embodiment of the present invention.
  • FIG. 8 is a view for explaining an example of output data of the initial quantization unit 221 22N of FIG. 7.
  • FIG. 9 is a detailed configuration diagram of an embodiment of the index updater 230 of FIG. 7.
  • FIG. 10 is a detailed configuration diagram of an embodiment of a K-th update unit 23K in FIG. 9.
  • 11 is a schematic structural diagram of a product implemented with an audio signal processing apparatus according to an embodiment of the present invention.
  • FIG. 12 is a relationship diagram of products in which an audio signal processing apparatus according to an embodiment of the present invention is implemented.
  • FIG. 13 is a schematic structural diagram of a mobile terminal implemented with an audio signal processing apparatus according to an embodiment of the present invention.
  • an audio signal processing method includes performing a linear-prediction analysis on an audio signal and a current frame, thereby performing a first prediction based on a plurality of linear-prediction conversion coefficients.
  • the obtaining of the second temporary candidate codevectors may include: obtaining as many random candidate codevectors as there are a (a: arbitrary natural numbers) for each of the first target vectors; And removing the part of the random codevectors increase, thereby obtaining the temporarily determined number of second temporary candidate codevectors.
  • the temporarily determined number may be calculated based on a predetermined table value or a first number.
  • the first number may be determined based on the first temporary candidate errors and the threshold.
  • the first number may be determined to be a small number when the first temporary candidate errors are sorted in ascending order and their increment is gradually decreased.
  • a linear-prediction analysis is performed on a current frame of an audio signal to generate a first target vector, which is a target vector of a first stage, based on a plurality of linear-prediction transform coefficients.
  • Prediction unit By vector quantizing the first target vector, a temporarily determined number of first steps of the first step A temporary candidate vector generator for obtaining temporary candidate codevectors; An error generator which calculates first temporary candidate errors that are errors between the first temporary candidate codevectors and the first target vector; And a current number determiner configured to determine a first number which is the number of first candidate codevectors based on the first temporary candidate errors, and to obtain as many first final candidate codevectors as the first number.
  • a processing device is provided.
  • a linear-prediction analysis is performed on a current frame of an audio signal to generate a first target vector, which is a target vector of a first stage, based on a plurality of linear-prediction transform coefficients.
  • Prediction unit A candidate vector generator for acquiring a temporarily determined number of first 11 final candidate codevectors by temporarily quantizing the first target vector;
  • An error generator for calculating first final candidate errors that are errors between the first final candidate codevectors and the first target vector;
  • a next number determining unit determining a second number which is the number of second candidate codevectors of the second step based on the first final candidate errors.
  • An audio signal processing method is provided, which is a sum of a first initial best code vector and a N th initial best code vector.
  • the selecting step is performed based on the total error for the first initial best code vector and the total error for the first optimal best code vector,
  • the total error is the difference between the sum of the k-th non-signal sum signal and the k-th initial best code vector, and the first target signal, and for the k-k initial best code vector.
  • the total error is provided by an audio signal processing method which is a difference between a vector obtained by adding the Kth sum signal and a Kth initial best code vector and the first target signal.
  • the method comprises: determining a step K + a (a is an integer) to update the index among the first to N steps; And repeating the updating, the determining, and the selecting for the K + a step.
  • the determining of the K + a step and the repeating step may be performed when the Kth best best code vector is determined as the Kth best best code vector.
  • a linear prediction unit for generating a first target signal based on a plurality of linear-prediction transform coefficients;
  • An initial quantization unit performing vector-quantization on a total of N steps based on the first target signal;
  • the initial quantization unit generates first candidate codevectors including a first initial best codevector having the smallest error, based on the first target signal, and performs a first initial best on the first initial best codevector.
  • An audio signal processing apparatus is provided, wherein the sum of the first initial best code vector to the N initial best code vector
  • Coding can be interpreted as encoding or decoding in some cases, and information is a term that encompasses values, parameters, coefficients, elements, and so on. It may be interpreted otherwise, but the present invention is not limited thereto.
  • an audio signal is a concept that is broadly distinguished from a video signal, and refers to a signal that can be visually identified during reproduction.
  • an audio signal is a concept that is distinguished from a speech signal. Means a signal with little or no characteristics.
  • the audio signal in the present invention should be interpreted broadly and can be understood as a narrow audio signal when used separately from a voice signal.
  • Coding may also refer to encoding only, but may be used as a concept including both encoding and decoding.
  • FIG. 1 is a block diagram illustrating an encoder of an audio signal processing apparatus according to an embodiment of the present invention.
  • a multi-step including a first stage quantization unit 121 to an N-th stage quantization unit 12N
  • a quantization unit 120 may be included, and the linear prediction unit 110 may further include a linear determiner 130, an index determiner 130, and a multiplexer 140.
  • the linear prediction unit 110 generates linear-prediction coefficients by performing linear prediction analysis according to linear prediction coding (LPC) on the input audio signal, and converts them to generate linear-prediction transform coefficients.
  • LPC linear prediction coding
  • the basic idea of a model of linear predictive coding is that it can be approximated by a linear combination of p speech signals that have passed at a given point in time n.
  • Equation 1 'S (n) - qiS (nl) + q 2 S (n-2) + - + q p S (np) , where, qi is a linear-prediction coefficient, ⁇ is the sample index, ⁇ Since the linear-predicted coefficients obtained in this way have a large dynamic range, they need to be quantized with fewer bits, and the linear-predicted coefficients are weak to quantization errors, so they are converted to coefficients that are robust to quantization errors. Need to be. Accordingly, the linear prediction analyzer 110 converts the linear-prediction coefficient into a linear-prediction transform coefficient Wi.
  • the linear-predictive transformation coefficient is LSP (Line Spectral Pairs)
  • ISP Impedance Spectral Pairs
  • LSF Line Spectrum Frequency
  • ISF emission spectrum frequency
  • is the linear-prediction prediction coefficient
  • fi is the frequency region of [0,6400Hz] of ISF
  • f s 12800 is the sampling frequency.
  • a target vector which is a target of vector-quantization
  • LPC linear prediction coding
  • the target vector may be generated as a difference value between the plurality of linear-predictive transform coefficients of the current frame and the plurality of linear-predictive transform coefficients of the previous frame. Since the target vector is input to the first stage quantization unit 121 of the multi-stage quantization unit 120, it is referred to as a target vector of the first stage (hereinafter, referred to as a first target vector).
  • the multi-level quantization unit 120 includes the first-step quantization unit 121 to the N-th step quantization unit 12N.
  • the first stage quantization unit 121 to the Nth stage quantization unit 12N generate a number of candidate codevectors determined suitably for each stage, and the candidate codebook index corresponding to the candidate codevectors is determined by the index determination unit 130. To pass).
  • the first step quantization unit 121 performs vector-quantization on the first target vector so that the first final candidate codebook indexes Fl 1 to FlMl of the first number M 1 (Ml is first). Number of candidate codevectors in step 1).
  • the first final candidate codebook indices 1 ⁇ ni are passed to the index determination unit 130 in FIG.
  • the N-th step quantization unit 12N performs vector-quantization on the N-th target vector, so that the N-th final candidate codebook indices (FI ⁇ FIMNXMN) of the N-th number M N are obtained from the candidate codevectors of the N-th step. Number).
  • the first to Nth numbers (M N ) are determined at each step (current step or previous step) based on the temporary candidate errors.
  • the intra stage method is referred to as the first embodiment
  • the inter stage method is referred to as the second embodiment.
  • the first step quantization unit 121 -A and the N step corresponding to the first embodiment (intra stage) are referred to.
  • the quantization unit 12N-A will be described later with reference to FIGS. 2 and 3, and the first stage quantization unit 121 -B and the Nth stage quantization unit 12N-B corresponding to the second embodiment (inter stage) This will be described with reference to FIGS. 5 and 6.
  • the index determiner 130 may include a first number of first final candidate codebook indexes (and first final candidate codevectors), and an Nth number of N final candidate codebook indexes (and Nth final candidate codevectors). ), A candidate set of a plurality of candidate codevectors (combined one codevector at each step from the first to the Nth step) is determined. In the total N stages, this candidate set becomes an N-dimensional vector.
  • the index determination unit 130 determines one set having the least error with the target vector (the first target vector) among the plurality of candidate sets. This The indexes corresponding to the set, that is, the first stage codebook index to the Nth stage codebook index, are transmitted to the multiplexer 140.
  • FIG. 2 is a diagram illustrating a configuration of the first embodiment 121 -A of the first stage quantization unit 121 in FIG. 1
  • FIG. 3 is a diagram of the Nth stage quantization unit 12N of FIG. 1.
  • 1 is a diagram showing a configuration of an embodiment (12N-A).
  • the first embodiment corresponds to an intra stage method of determining the number of candidate code vectors of the current stage in the current stage.
  • the first stage quantization unit 121 -A may include a temporary candidate vector generation unit 121-A.1, an error generation unit 121-A.3, and a current count.
  • the temporary candidate vector generation unit 121-A. 1 quantizes the first target vector by vector using the first stage codebook 121.1, thereby temporarily advancing the first temporary candidate of the first stage of the number M pre .
  • the temporarily determined number may mean a total number or may mean a number per target signal when there are a plurality of target signals.
  • TC transition mode
  • VC voiced coding mode
  • UC unvoiced coding
  • GC general mode
  • each table value may be reduced as shown in the table below at a specific stage.
  • UC unvoiced mode
  • a value less than 4 instead of 4 in the fifth or sixth stage (Stage: 5 or 6), depending on the bandwidth (wideband (WB) or narrowband (NB))
  • WB wideband
  • NB narrowband
  • the error generating unit 121-A.3 generates a first temporary candidate error El! ElMpre, which is an error between the first temporary candidate codevectors T TMM p re and the first target vector.
  • the temporary candidate errors may be generated according to the following equation.
  • w (i) is the weight
  • r (i) is the first target vector
  • C s p (i) is the first temporary candidate codevectors
  • 0 5 is the normalization factor in step s
  • is the temporarily determined number (M pre )
  • the current number determination unit 121-A.5 is a candidate at the current stage based on the first temporary candidate errors E El Mpre generated by the error generation unit 121-A.3.
  • a first number (hereinafter, a first number (M,)), which is the number of first candidate codevectors, is determined, since the current number of vectors (that is, the first stage) is used to determine the current number (first number). Threshold can be a reference.
  • the first temporary candidate errors are sorted in ascending order and a parameter representing the statistical characteristic is generated.
  • the parameter may include one or more of a mean, a variation, a minimum, a maximum, and a gradient.
  • a first number (current number) is determined based on a parameter (and threshold) based on such first temporary candidate errors.
  • the current number when the average value of the errors is larger than the threshold, the current number may be determined as a large number, and when the average value is smaller than the threshold, the current number may be determined as the smaller number. This is to reduce the quantization error even though the complexity is high by having a large number of candidates when the error is high. On the other hand, when the error is low, even if the number of candidates is reduced, the quantization error may not increase, so that the number of candidates is enjoyed to enjoy the complexity.
  • the number (first number in the first step) can be determined as a relatively small number.
  • the current number can be determined as a relatively large number, and when the increase gradually decreases, the current number can be determined as a relatively small number.
  • the incremental decrease gradually means that there is a relatively large number of codebook indices (and corresponding codevectors) with low quantization errors in the current stage, in which case it is more likely that the codebook indexes in the next stage will select the same index.
  • the performance improvement is small compared to the increase in the number of candidates, it is effective to reduce the number of candidates.
  • the incremental increase is a case where the difference between the codebook index having the smallest quantization error and the quantization error of the second smallest index is large at the present stage, and the larger number of candidates is used to increase the number of candidates selected at the next stage. Less redundancy can increase the combination of codebook indices.
  • first final candidate codevectors FVh ⁇ FVIMI) and the first final candidate errors (E to £ 1 ⁇ ) are generated by calculating the error between the first target vector and the error can be generated in almost the same manner as in Equation 3.
  • the current number determination unit 121-A.5 may further transfer the current number of the first stage (the first number to the next stage (second stage) quantization unit, in which case, the current number of the first stage is The quantization part of the step may be used to determine the number.
  • the N-th stage quantization unit 12N-A (where N is a natural number of 2 or more) will be described.
  • the N-th quantization unit 12N-A includes a candidate vector generation unit 12N-A.1, an error generation unit 12N-A.3, and a current number determination unit 12N-A.5.
  • N-level codebook 12N.1 may be included.
  • Each component of the N-level quantization unit 12N performs a function substantially similar to those of the first-level quantization unit 121 of the same name.
  • the temporary candidate vector generation unit 12N-A.1 performs the N-1th step from the N-1th step quantization unit. Receives the N ⁇ 1 final candidate errors ( ⁇ , ⁇ 0) of the one or more natural numbers) as the nth stage target vectors (hereinafter, the Nth target vectors).
  • the temporarily determined number M PRE of the Nth temporary candidate codevectors TO ⁇ Mpre
  • the temporarily determined number M PRE in the Nth step may be a value stored in a table, but unlike the temporarily determined number in the first step, the number in the Nth step (N-1 number) May be based on have.
  • the temporarily determined number 1 ⁇ may be a X number of N-1 numbers (M N-1 ), where a means the total number of candidates per target vector.
  • the temporarily determined number (M PRE ) is! JX Corresponding.
  • the error generators 12N-A.3 determine a temporary number of N-th temporary candidate codevectors (TN! TNMpre) and N-th target vectors (EN-l i EN-lMN).
  • the N th temporary candidate errors EN 1 to EN Mpre are calculated by calculating an error between the current number determination units 12N-A.5 and the N th temporary candidate errors ⁇ to ⁇ 1 ⁇ 2 ⁇ . Based on the current number (N number (M N )) is determined. At this time, the method for determining the current number will be omitted for the same parts as the method in the current number determination unit 121-A.5 of FIG. 2.
  • the current number determination unit 12N-A.5 may further be based on the current number M N 0 in the previous step (step N-1). Specifically, the present time in the first step by now the number (M N) of the number (N -0 appropriately combining the M (average, minimum, maximum, etc.) of the previous stage determined by a method carried out in a number determiner finally determine the current number (N M) If there is a next step, similarly to the current number determination unit of the first step, the Nth number M N may be further transmitted to the N + 1th step quantization unit. The current number determination unit determines the current number M N (N number) in the Nth step as described above, and then the Nth final candidate codevectors FVN!
  • N Nth temporary candidate codevectors are generated.
  • the current number (M N ) is then determined such that, if only some of the temporary candidate vectors are selected as the Nth final candidate codevectors, the unselected temporary candidate codevectors (TN 2 , TN 4 , TN 5 , TN 6).
  • TN Mpre -i and TN Mpre _i) are the result of removal or pruning.
  • the intra stage method described with reference to FIGS. 2 to 4 determines the number of candidate code vectors of the current stage based on the target vectors of the current stage. As described above, in the intra stage method, the number of previous steps may be referred to in determining the current number.
  • FIG. 5 is a diagram illustrating a configuration of the second embodiment 121 -B of the first stage quantization unit 121 in FIG. 1
  • FIG. 6 is a diagram illustrating the configuration of the Nth stage quantization unit 12N in FIG. 1.
  • 2 is a diagram showing the configuration of the second embodiment (12N-B).
  • the first stage quantization unit 121 -B uses the first target codebook 121.1 as a first target. Temporarily determined number (1 ⁇ ) of first final candidate by vector-quantizing the vector Codevectors (FVl ! FVl Mpr e) and the first final candidate codebook indexes (Fl ⁇ Fl Mpre) corresponding thereto are generated.
  • the first stage codebook 121.1 is shown in FIG. The present invention is not limited to this, but may be the same as the first stage codebook 121.1.
  • the first final candidate codebook indexes F to Fl Mpre are transferred to the index determination unit 130 in FIG.
  • the error generator 121-B.3 generates the first final candidate errors ⁇ ⁇ by calculating an error with the first final candidate codevectors FVl ⁇ FVl Mpre and the first target vector.
  • the error calculation may be performed by Equation 3 above.
  • the next number determination unit 121-B.5 determines the number of candidate vectors of the next step (second number) (M 2 ) based on the first final candidate errors. Since the method of determining is almost similar to the method implemented in the method of determining the current number in the current number determiner 121-A.5 of the intra stage method (first embodiment), a description thereof will be omitted.
  • the step codebook 12N.1 may further comprise.
  • the Nth step is the last step, the error generation unit 12N-B.3 and the next number determination unit 12N-B.5 are not included.
  • the candidate vector generation unit 12N-B.1 receives the N-th final candidate errors ⁇ - ⁇ and ⁇ - ⁇ - ⁇ , which are the error signals in the N-th stage, as the N-th target vectors. In addition, it receives the next number ( ⁇ ⁇ ), that is, the number ⁇ ( ⁇ ⁇ ) to N-1 in the step from the previous step (the N-1 step). And performing the vector-quantization on the target vectors using the N-th step codebook 12N.1, and thus the N-th final candidate codevectors (FVN ⁇ FVNMN) corresponding to the N-th number ( ⁇ ⁇ ). Daewoong generates an Nth final candidate codebook index (FNHFNMN).
  • FNHFNMN Nth final candidate codebook index
  • the Nth final candidate codebook index FN ⁇ FNMN generated as described above is transferred to the index determination unit 130 of FIG. 1, and the Nth final candidate codevectors FVN ⁇ FVNMN are the error generator 12N-B. 3) is delivered.
  • the error generating unit 12N-B.3 and the next number determination unit 12N-B.5 do not exist when the Nth stage is the last stage, and therefore, when the N + 1 stage exists. Only the description below makes sense.
  • the error generating unit 12N-B.3 calculates an error between the Nth final candidate codevectors (FVN ⁇ FVNMN) and the target vector ( ⁇ - ⁇ , ⁇ - ⁇ - ⁇ ) for each codevector. And Nth final candidate errors (EN! ENMN) The Nth final candidate errors (EN ⁇ ENMN) are transmitted to the N + 1th step quantization unit when the N + 1th step exists.
  • the next number determiner 12N-B.5 is the same as the next number determiner 121-B.5 in the first step, and the number of candidate vectors in the next step (N + 1 fragment I) ( ⁇ +1 ) is generated and transferred to the N + 1 th quantization unit.
  • the audio signal processing method and apparatus may perform multi-step vector quantization, and may determine the number of candidate code vectors (or candidate codebook indices) at each step of the current target signal or the previous target signal. Depending on the error, it can be changed heroically.
  • an audio signal processing method and apparatus will be described with reference to FIGS. 7 to 13.
  • the encoder 200 may include an initial quantizer 220 and an index updater 230, and may further include a linear predictor 210 and a multiplexer 240. .
  • the linear prediction unit 210 generates the target signal TV1 of the first stage by using the linear-prediction transform coefficient and transmits it to the multi-stage initial quantization unit 220.
  • the initial quantization unit 220 performs multi-step quantization on the target vector input from the linear prediction unit 210, thereby determining the first candidate codevectors (CC CC M ) to the Nth candidate code vectors (CCNJ ⁇ CCNM). It generates and delivers to the index updater 230.
  • the initial quantization unit 220 includes a first stage initial quantizer 221 to an Nth stage initial quantizer 22N. An operation of the first stage initial quantization unit 221 to the Nth stage initial quantization unit 22N will be described with reference to FIG. 8.
  • FIG. 8 is a diagram for describing an example of output data of the initial quantization unit 221 22N of FIG. 7.
  • output data of the first stage initial quantization unit 221 is illustrated on the left side
  • output data of the K stage initial quantization unit 22K is illustrated on the right side.
  • the first stage initial quantization unit 221 vector-quantizes the target signal (or target vector) using the first stage codebook (not shown), and thus, the first stage (hereinafter first) candidate codevectors (cc1 i).
  • first stage codebook not shown
  • the number M of the first candidate codevectors may be one of 1) a fixed value for the entire step, 2) a preset value for each step, and 3) an adaptively changing value.
  • the first stage initial quantization unit 221 may be configured as shown in FIG. 2 (intra stage method) or FIG. 5 (inter stage method). That is, the first final candidate codevectors FVHFV1 M1 of FIG. 2 or FIG. 5 correspond to the first candidate codevectors CC1 ⁇ CC1 M of FIG. 8.
  • This target signal may be the best at the present stage, but may not be the best when the entire stages are combined, so that the index updater 230 performs a compensation operation therefor.
  • the N-th stage initial quantizer 22N performs vector-quantization on the N-th stage 1 target signal using the N-th stage codebook.
  • N-th candidate codevectors CCN ⁇ CCN M are generated, and a codevector having the least error among them is referred to as an N-stage initial best codevector BCN.
  • the Nth candidate codevectors CCN and CCN M are transmitted to the index updater 230.
  • the Nth stage initial quantization unit 22N may be configured with components as shown in FIG. 3 or 6.
  • the Nth candidate codevectors CCN ⁇ CCN M including the Nth initial best codevector CCN ⁇ BCN are also transmitted to the index updater 230, and the Nth initial best error BEN is generated.
  • the Nth step is the last step, it is transmitted only to the index update unit 230.
  • the index updater 230 receives the first candidate codevectors CC CC to N-th initial best codevector CCN ⁇ BCN, and updates the index for a specific K stage. Determine whether or not. Finally, a first final codebook index to an Nth final codebook index is generated and transmitted to the multiplexer 240.
  • a detailed configuration diagram of the index updater 230 is illustrated in FIGS. 9 and 10.
  • the multiplexer 240 generates one or more bitstreams including the first to Nth final codebook indices generated by the index updater 230 and transmits the one or more bitstreams to the decoder.
  • FIG. 9 is a diagram illustrating a detailed configuration of an embodiment of the index updater 230 of FIG. 7, and FIG. 10 is a diagram illustrating a detailed configuration of an embodiment of the K-th stage updater 23K of FIG. 9.
  • the index updater 230 includes an update control unit 230-2, and includes a first stage updater 231 to a K-th stage updater 2 3K to a N-th stage updater ( 23N).
  • the update control unit 230-2 updates the index for the step where the error is the largest (eg, Kth), and then the step where the error is the second largest (eg, K + a (a ), You can choose whether or not to replace the index. If the K-th initial best codevector is replaced or updated with the K-best best in step K, index updating may be performed after step K + a. On the contrary, in the Kth stage, when the Kth initial best codevector is not replaced by the Kth best best best but determined as the Kth final codevector FFC, performing an index update on the stage after the K + a stage Otherwise, the index update may be performed only for the K + a step.
  • the step K-up updating unit 23K includes a step K-target signal correction unit 23K.1, a rescan unit 23K.2, and an update determining unit 23K.3.
  • the first phase target signal correction unit 23K.1 receives the initial best code vector (except BC1 BCN, BCK), and the first phase target signal for the stages excluding the phase Crab, and based on these stages, By modifying the target signal for the step, the modified second target signal is generated.
  • BCI is the first (step) initial best code vector
  • BCK-1 is the first K-1 (step) initial best code vector
  • BCK + 1 is the first K + 1 (step) initial best code vector
  • BCN is the Nth (stage) initial best codevector.
  • the initial best code vector of each step corresponds to a code vector having the smallest error in each step when the candidate code vector is set to one in each step in the initial quantization unit of FIG. 7.
  • the sum K exclusion sum signal SUM EXPK excluding only the K initial best code back is generated and subtracted from the first target vector TV 1 to generate a modified K target signal TVK MOD . .
  • TVK mod TVl-SUMex pK
  • TVK MOD is the modified K target signal
  • TV1 is the crab 1 target signal (or the first target vector)
  • the re-search section 23K.2 is based on the modified low K target signal TVK MOD , which is used to determine the K-th candidate codevectors CCKP ⁇ CCKM previously searched by the K-th initial quantization section 22K. Recalculate the rudder to see the least error
  • the codevector is determined as the Kth best best codevector (OCK).
  • the modified ⁇ target signal TVK MOD includes the initial best code vector after the K + 1 stage. In other words, the signal reflects the error after the step K + 1.
  • the K-th candidate codevectors CCK ⁇ CCKM cannot be changed. Therefore, by recalculating the error based on this, the Kth best best code vector (OCK) having the smallest recalculated error is selected.
  • the update determining unit 23K.3 receives the K-th initial best code vector BCK from the K-th initial quantization 22K and the K-th best best code vector OCK from the rescan unit 23K.2. .
  • the update decision unit 23K.3 determines, among the K-th initial best code vector BCK and the K-best best code vector OCK, a code vector having a smaller total error as the K-th final code vector FCK. .
  • the first stage target signal TV1 from the linear prediction unit 210 and the K th exclusion sum signal SUM EXCK from the K stage target signal correction unit 23K.1 are calculated. I use it.
  • E BCK is the total error for the Kth best best codevector (hereinafter referred to as the first total error).
  • EOCK is the total error for the Kth best best codevector (hereinafter referred to as the second total error).
  • the update decision unit 23 ⁇ .3 is more advantageous because the first initial best code vector BCK is more advantageous, so that the update decision unit 23K.3 is replaced with the optimal best code vector OCK. Instead, it is determined as the Kth final code vector (FCK).
  • the Kth best best codevector (OCK) based on the modified Kth stage target signal (BEK mod ) is updated to the Kth best best codevector (OCK) ( to determine the Kth final codevector (FCK).
  • the codebook index FIK corresponding to the Kth final codevector FFC is transferred to the multiplexer 240 in FIG. 7 as the Kth final codebook index.
  • the K-th final codevector (FCK) is determined by using the K-th initial best code vector (OCK) and the K-th best best code vector (OCK).
  • the Kth final codevector (FCK) is used instead of the Kth initial best code vector (BCK) in the K + ath stage updating unit 23K + a. Is input.
  • the number of candidates is set to a small number (for example, one) to first perform multi-step quantization, thereby significantly reducing the complexity of multi-step quantization. have. Furthermore, for the stage where the error is high (K stage, K + a stage, etc.) Only in case of reduction, by replacing the optimal best code vector, the error of vector-quantization can be significantly reduced.
  • the audio signal processing apparatus can be included and used in various products. These products can be broadly divided into stand alone and portable groups, which can include TVs, monitors, and set-top boxes, and portable groups include PMPs, mobile phones, and navigation. can do.
  • FIG. 11 is a diagram illustrating a relationship between products in which an audio signal processing device according to an embodiment of the present invention is implemented.
  • the wired / wireless communication unit 510 receives a bitstream through a wired / wireless communication scheme.
  • the wired / wireless communication unit 510 may include at least one of a wired communication unit 510A, an infrared communication unit 510B, a Bluetooth unit 510C, a wireless LAN communication unit 510D, and a mobile communication unit 510E.
  • the user authentication unit 520 performs user authentication by inputting user information, and may include one or more of a fingerprint recognition unit, an interest recognition unit, a face recognition unit, and a voice recognition unit.
  • the user may perform face authentication by receiving face outline information and voice information, converting the information into user information, and determining whether the user information matches the existing user data.
  • the input unit 530 is an input device for a user to input various types of commands.
  • the input unit 530 may include one or more of a keypad unit 530A, a touch pad unit 530B, a remote control unit 530C, and a microphone unit 530D. Although it may include, the present invention is not limited thereto.
  • the microphone unit 530D receives a voice or audio signal. It is an input device.
  • the keypad unit 530A, the touch pad unit 530B, and the remote control unit 530C may receive a command for transmitting a call or a command for activating the microphone unit 530D.
  • the control unit 550 may cause the mobile communication unit 510E to request a call from the same communication network.
  • the signal coding unit 540 encodes or decodes the audio signal and / or the video signal received through the microphone unit 530D or the wired / wireless communication unit 510, and outputs an audio signal in the time domain.
  • Audio signal processing apparatus 545 which corresponds to an embodiment of the present invention (ie, encoders 100 and 200 according to the embodiments) described above, and thus the audio processing apparatus 545 and a signal including the same.
  • the coding unit may be implemented by one or more processors.
  • the controller 550 receives input signals from the input devices and controls all processes of the signal decoding unit 540 and the output unit 560.
  • the output unit 560 is a component in which an output signal generated by the signal decoding unit 540 is output, and may include a speaker unit 560A and a display unit 560B. When the output signal is an audio signal, the output signal is output to the speaker, and when the output signal is a video signal, the output signal is output through the display.
  • FIG. 12 is a relationship diagram of products in which an audio signal processing device is implemented according to an embodiment of the present invention.
  • FIG. 12 illustrates a relationship between a terminal and a server corresponding to the product illustrated in FIG. 11.
  • the first terminal 500 the first terminal 500.
  • the second terminal (500.2) it can be seen that each terminal can communicate data to the bitstream in both directions through the wired or wireless communication unit.
  • the server 600 and the first terminal 500.1 may also perform wired / wireless communication with each other.
  • the mobile terminal 700 may include a mobile communication unit 710 for calling and receiving a call, a data communication unit 720 for data communication, an input unit 730 for inputting a command for call transmission or audio input, voice or A microphone unit 740 for inputting an audio signal, a controller 750 for controlling each component, a signal coding unit 760, a speaker 770 for outputting a voice or audio signal, and a screen for outputting May include a display 780 for the display.
  • the signal coding unit 760 encodes or decodes an audio signal and / or a video signal received through the mobile communication unit 710, the data communication unit 720, or the microphone unit 530D, and encodes an audio signal in a time domain.
  • Audio signal processing device 765 which is output through the mobile communication unit 710, the data communication unit 720 or the speaker 770, which is an embodiment of the present invention described above (i.e., the encoder according to the embodiment).
  • 100 and / or decoder 200), the audio processing apparatus 765 and the signal coding unit including the same may be implemented by one or more processors.
  • the audio signal processing method according to the present invention may be stored in a computer readable recording medium which is produced as a program for execution in a computer, and the computer readable recording medium also has multimedia data having a data structure according to the present invention.
  • the computer readable recording medium includes all kinds of storage devices for storing data that can be read by a computer system. Examples of computer-readable recording media include R ( ) M, RAM, CD-ROM, magnetic tape, floppy disks, optical data storage devices, and also in the form of carrier waves (for example, transmission over the Internet). It includes what is implemented.
  • the bitstream generated by the encoding method may be stored in a computer-readable recording medium or transmitted through a wired / wireless communication network.
  • the present invention can be applied to encoding and decoding audio signals.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은, 오디오 신호의 현재 프레임에 대해서 선형-예측 분석을 수행함으로써, 복수의 선형-예측 변환 계수들을 근거로 하여 제 1단계의 타깃 벡터인 제 1 타깃 벡터를 생성하는 단계; 상기 제 1 타깃 벡터를 벡터 양자화함으로써, 임시로 결정된 개수의 제 1 단계의 제 1 임시 후보 코드벡터들을 획득하는 단계; 상기 제 1 임시 후보 코드벡터들 및 상기 제 1 타깃 벡터간의 에러인 제 1 임시 후보 에러들을 산출하는 단계; 및, 상기 제 1 임시 후보 에러들을 근거로 하여 제 1 후보 코드벡터들의 개수인 제 1 개수를 결정하고, 상기 제 1 개수만큼의 제 1 최종 후보 코드벡터들을 획득하는 단계를 포함하는 오디오 신호 처리 방법을 개시한다.

Description

[DESCRIPTION!
[Invention Title】
오디오 신호 처리 방법 및 장치 [Technical Field】
본 발명은 오디오 신호를 인코딩하거나 디코딩할 수 있는 오디오 신호 처리 방법 및 장치에 관한 것이다.
[Background Artl
일반적으로, 오디오 신호 중 특히 음성 신호의 특성이 강한 경우에는, 오디오 신호에 대해서 선형 예측 코딩 (LPC: linear predictive coding)을 수행한다. 선형 예측 코딩에 의해 생성된 선형 -예측 계수를 디코더에 전송하고, 디코더는 이 계수에 대해 선형 예측 합성을 통해서 오디오 신호를 복원한다.
[Disclosure]
[Technical Problem】
선형 -예측 계수 또는 선형 -예측 변환 계수를 디코더에 전송하기 위해 백터-양자화를 수행하는 데, 이때 양자화 에 러가 발생되기 때문에, 음질이 왜곡되는 문제점이 있다.
또한, 다단계 방식으로 백터-양자화를 수행하는 데 있어서, 양자화 에 러를 최소화하기 위 한 목적으로, 많은 개수의 후보 백터들을 획득할 경우, 그 개수에 따라 복잡성 (complexity)이 기하급수적으로 증가되는 문제점이 있다.
[Technical Solution] 본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 선형- 예측 변환 계수를 백터-양자화하는데 있어서, 양자화 에 러를 최소화할 수 있는 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명의 또 다른 목적은, 후보 백터들의 개수를 각 단계마다 적웅적으로 변화시키기 위한 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명의 또 다른 목적은, 후보 백터들의 수를 적은 수로 축소시키면서도, 에 러가 큰 단계의 경우 최적 베스트 코드백터로 대체를 하기 위한 오디오 신호 처리 방법 및 장치를 제공하는 데 있다.
[Advantageous Effects]
본 발명은 다음과 같은 효과와 이점을 제공한다.
첫째, 다단계 (멀티 스테이지) 백터 양자화를 수행하는 데 있어서, 후보 백터들의 개수를 각 단계마다 적응적으로 변화시키기 때문에, 개수에 따른 복잡도 증가를 최소화시킬 수 있다.
둘째, 각 단계의 후보 백터들의 개수가 에 러를 근거로 결정되기 때문에, 복잡도 증가를 최소화하면서도, 양자화 에러를 줄일 수 있는 효과가 있다. 셋째, 총 N 단계이고, 각 단계에서 M 개씩 의 후보백터들이 존재할 경우, 후보백터들이 총 셋트 수는 기하급수적 (MN)으로 커지는 데 비해, 후보 백터들의 수를 1 개 또는 2 개 등 작은 수로 축소시킴으로써, 복잡도를 최소화시킬 수 있다. 넷째, 후보 백터의 수를 줄임으로써 복잡도를 최소화하면서도, 에 러가 큰 단계의 경우, 재탐색을 수행하여 생성된 최적 베스트 코드백터로 대체함으로써 양자화 에러를 줄일 수 있다.
[Description of Drawings】
도 1 은 본 발명의 일 실시 예에 따른 오디오 신호 처리 장치 중 인코더의 구성도.
도 2 는 도 1 에서의 제 1 단계 양자화부 (121)의 제 1 실시 예 (121-A)에 대한 구성도.
도 3 은 도 1 에서의 제 N 단계 양자화부 (12N)의 제 1 실시 예 (12N-A)에 대한 구성도.
도 4 는 제 N 단계 양자화부 (12N)의 동작을 설명하기 위한 도면.
도 5 는 도 1 에서의 제 1 단계 양자화부 (121)의 제 2 실시 예 (121-B)에 대한 구성도.
도 6 은 도 1 에서의 제 N 단계 양자화부 (12N)의 제 2 실시 예 (12N-B)에 대한 구성도.
도 7 은 본 발명의 다른 실시예에 따른 오디오 신호 처리 장치 증 인코더의 구성도.
도 8 은 도 7 의 초기양자화부 (221 22N)의 출력 데이터의 일 예를 설명하기 위 한 도면.
도 9 은 도 7 의 인덱스 갱신부 (230)의 실시 예의 세부 구성도.
도 10 는 도 9 의 제 K 단계 갱신부 (23K)의 실시 예의 세부 구성도. 도 11 은 본 발명의 실시 예에 따른 오디오 신호 처리 장치가 구현된 제품의 개략적인 구성도ᅳ
도 12 는 본 발명의 일 실시 예에 따른 오디오 신호 처리 장치가 구현된 제품들의 관계도.
도 13 은 본 발명의 실시 예에 따른 오디오 신호 처리 장치가 구현된 이동 단말기 의 개략적 인 구성도.
[Best Mode] 상기와 같은 목적을 달성하기 위하여 본 발명에 따른 오디오 신호 처리 방법은, 오디오 신호와 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써 , 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 단계의 타깃 백터인 제 1 타깃 백터를 생성하는 단계; 상기 제 1 타깃 백터를 백터 양자화함으로써 , 임시로 결정된 개수의 제 1 단계의 제 1 임시 후보 코드백터들을 획득하는 단계; 상기 제 1 임시 후보 코드백터들 및 상기 제 1 타깃 백터간의 에 러인 제 1 임시 후보 에 러들을 산출하는 단계; 및, 상기 제 1 임시 후보 에 러들올 근거로 하여 제 1 후보 코드백터들의 개수인 제 1 개수를 결정하고, 상기 제 1 개수만큼의 제 1 최종 후보 코드백터들을 획득하는 단계를 포함한다. 본 발명에 따르면, 상기 제 1 최종 후보 코드백터들을 근거로 제 1 최종 후보 에러들을 제 2 단계의 타깃 백터들로서 생성하는 단계; 상기 계 2 타깃 백터들을 백터 양자화함으로써, 임시로 결정된 개수의 제 2 단계의 제 2 임시 후보 코드백터들을 획득하는 단계; 상기 제 2 임시 후보 코드백터들 및 상기 제 2 단계의 타깃 백터들간의 제 2 임시 후보 에 러들을 산출하는 단계; 및, 상기 제 2 후보 에러들을 근거로 하여 제 2 후보 코드백터들의 개수인 제 2 개수를 결정하고, 상기 제 2 개수만큼의 상기 제 2 최종 후보 코드백터들을 획득하는 단계를 더 포함할 수 있다.
본 발명에 따르면, 상기 제 2 임시 후보 코드백터들을 획득하는 단계는, 상기 제 1 타깃 백터들 각각에 대해 a(a: 임의의 자연수)개수 만큼씩의 임의 후보 코드백터들을 획득하는 단계; 및 상기 임의 코드백터들 증 일부를 제거함으로써, 상기 임시로 결정된 개수의 제 2 임시 후보 코드백터들을 획득하는 단계를 포함할 수 있다.
본 발명에 따르면, 상기 임시로 결정된 개수는, 미리 결정된 테이블 값 또는 제 1 개수를 근거로 산정된 것일 수 있다.
본 발명에 따르면, 제 1 개수는, 상기 제 1 임시 후보 에 러들 및 임계치를 근거로 결정되는 것일 수 있다.
본 발명에 따르면, 상기 제 1 개수는, 상기 제 1 임시 후보 에러들을 오름차순으로 정 렬한 후, 그들의 증가폭이 점차 감소하면, 작은 수로 결정되는 것 일 수 있다.
본 발명의 또 다른 측면에 따르면, 오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써 , 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 단계의 타깃 백터인 제 1 타깃 백터를 생성하는 단계; 상기 제 1 타깃 백터를 백터 양자화함으로써, 임시로 결정된 개수의 제 1 단계의 제 1 최종 후보 코드백터들을 획득하는 단계; 상기 제 1 최종 후보 코드백터들 및 상기 제 1 타깃 백터간의 에 러인 제 1 최종 후보 에러들을 산출하는 단계; 및, 상기 제 1 최종 후보 에러들을 근거로 하여 제 2 단계의 제 2 후보 코드백터들의 개수인 제 2 개수를 결정하는 단계를 결정하는 단계를 포함하는 오디오 신호 처리 방법가 제공된다.
본 발명에 따르면, 상기 제 1 후보 코:드백터들을 근거로 제 1 최종 후보 에 러들을 제 2 단계의 타깃 백터들로서 생성하는 단계; 상기 제 2 타깃 백터들을 백터 양자화함으로써 , 상기 제 2 개수만큼의 제 2 단계의 제 2 임시 후보 코드백터들을 획득하는 단계; 상기 제 2 임시 후보 코드백터들 및 상기 제 2 타깃 백터간의 에러들인 제 2 임시 후보 에 러들을 산출하는 단계; 및, 상기 제 2 임시 후보 에러들을 근거로 하여 제 3 단계의 제 3 후보 코드백터들의 개수인 제 3 개수를 결정하는 단계를 결정하는 단계를 더 포함할 수 있다.
본 발명 의 또 다른 특면에 따르면, 오디오 신호의 현재 프레임에 대해서 선형 -예측 분석올 수행함으로써, 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 단계의 타깃 백터인 제 1 타깃 백터를 생성하는 선형 예측부; 상기 제 1 타깃 백터를 백터 양자화함으로써 , 임시로 결정된 개수의 제 1 단계의 제 1 임시 후보 코드백터들을 획득하는 임시 후보백터 생성부; 상기 제 1 임시 후보 코드백터들 및 상기 제 1 타깃 백터간의 에 러인 제 1 임시 후보 에러들을 산출하는 에 러 생성부; 및, 상기 제 1 임시 후보 에러들을 근거로 하여 계 1 후보 코드백터들의 개수인 제 1 개수를 결정하고, 상기 제 1 개수만큼의 제 1 최종 후보 코드백터들을 획득하는 현재개수 결정부를 포함하는 오디오 신호 처리 장치가 제공된다.
본 발명의 또 다른 측면에 따르면, 오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써, 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 단계의 타깃 백터 인 제 1 타깃 백터를 생성하는 선형 예측부; 상기 제 1 타깃 백터를 백터 양자화함으로써 , 임시로 결정된 개수의 제 1 단계의 겨 1 1 최종 후보 코드백터들을 획득하는 후보백터 생성부; 상기 제 1 최종 후보 코드백터들 및 상기 제 1 타깃 백터간의 에러인 제 1 최종 후보 에 러들을 산출하는 에 러 생성부; 및, 상기 제 1 최종 후보 에 러들을 근거로 하여 제 2 단계의 제 2 후보 코드백터들의 개수인 제 2 개수를 결정하는 단계를 결정하는 다음개수 결정부를 포함하는 오디오 신호 처리 장치가 제공된다.
본 발명의 또 다른 측면에 따르면, 오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써, 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 타깃 신호를 생성하는 단계; 상기 제 1 타깃 신호를 근거로, 제 1 단계에 대한 백터-양자화를 수행하는 단계; 상기 백터 -양자화는, 상기 제 1 타깃 신호를 근거로, 가장 에러가 작은 제 1 초기 베스트 코드백터를 포함하는 제 1 후보 코드백터들을 생성하는 단계; 및 상기 제 1 초기 베스트 코드백터에 대웅하는 제 1 초기 베스트 에러를 제 2 단계 타깃 신호인 제 2 타깃 신호로 출력하는 단계를 포함하고, 상기 백터-양자화를 제 2 단계부터 총 N 단계까지 반복하여 수행하는 단계; 상기 제 1 단계 내지 상기 제 N 단계 중에서 인덱스를 갱신할 Κ (Κ=1, ..., Ν)단계를 결정하는 단계; 상기 제 1 타깃 신호 및, 제 Κ 제외 합신호를 이용하여, 상기 제 Κ 타깃 신호를 수정하는 단계; 상기 수정된 제 Κ 타깃 신호를 근거로 하여, 제 Κ 후보 코드백터들 중에서 제 Κ 최적 베스트 코드백터를 결정하는 단계; 및, 제 Κ 초기 베스트 코드백터 및 상기 제 Κ 최적 베스트 코드백터 중 하나를 제 Κ 최종 베스트 코드백터로 선택하는 단계를 포함하고, 상기 제 Κ 제외 합신호는, 상기 제 Κ 초기 베스트 코드백터를 제외한 제 1 초기 베스트 코드백터 내지 제 Ν 초기 베스트 코드백터의 합인 것을 특징으로 하는 오디오 신호 처리 방법이 제공된다.
본 발명에 따르면, 상기 선택하는 단계는, 상기 제 Κ 초기 베스트 코드백터에 대한 총 에 러 및 상기 제 Κ 최적 베스트 코드백터에 대한 총 에러를 근거로 수행되며, 상기 제 Κ 초기 베스트 코드백터에 대한 총 에러는, 상기 제 Κ 제외 합신호 및 상기 제 Κ 초기 베스트 코드백터를 합한 백터와, 상기 제 1 타깃 신호간의 차이 이고, 상기 제 κ 초기 베스트 코드백터에 대한 총 에러는, 상기 제 K 제외 합신호 및 제 K 초기 베스트 코드백터를 합한 백터와 상기 제 1 타깃 신호간의 차이 인 오디오 신호 처리 방법 이 제공된다. 본 발명에 따르면, 상기 제 1 단계 내지 상기 N 단계 중에서 인덱스를 갱신할 K +a(a 는 정수) 단계를 결정하는 단계; 및, 상기 K+a 단계에 대해서 , 상기 갱신하는 단계, 상기 결정하는 단계, 및 상기 선택하는 단계를 반복하는 단계를 포함한다.
본 발명에 따르면, 상기 K+a 단계를 결정하는 단계 및 상기 반복하는 단계는, 상기 제 K 최 적 베스트 코드백터가 상기 제 K 최종 베스트 코드백터로 결정된 경우, 수행될 수 있다.
본 발명의 또 다른 측면에 따르면, 오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써, 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 타깃 신호를 생성하는 선형 예측부; 상기 제 1 타깃 신호를 근거로, 총 N 단계에 대해 백터-양자화를 수행하는 초기 양자화부; 상기 초기 양자화부는, 상기 제 1 타깃 신호를 근거로, 가장 에러가 작은 제 1 초기 베스트 코드백터를 포함하는 제 1 후보 코드백터들을 생성하고, 상기 제 1 초기 베스트 코드백터에 대웅하는 제 1 초기 베스트 에 러를 제 2 단계 타깃 신호인 제 2 타깃 신호로 출력함으로써, 제 1 단계에 대한 백터-양자화를 수행하는 제 1 초기 양자화부; 및 상기 제 i 타깃 신호 (i=2,..., N)를 근거로, 상기 백터-양자화를 수행하는 상기 제 i 초기 양자화부를 포함하고, 상기 제 1 단계 내지 상기 제 N 단계 중에서 인덱스를 갱신할 K (K=l, Ν)단계를 결정하는 갱신제어부; 상기 제 1 타깃 신호 및, 제 Κ 제외 합신호를 이용하여, 상기 제 Κ 타깃 신호를 수정하는 제 Κ 단계 타깃신호 수정부; 상기 수정된 제 Κ 타깃 신호를 근거로 하여, 제 Κ 후보 코드백터들 중에서 제 κ 최적 베스트 코드백터를 결정하는 재탐색부; 및, 제 Κ 초기 베스트 코드백터 및 상기 제 Κ 최적 베스트 코드백터 중 하나를 제 Κ 최종 베스트 코드백터로 선택하는 갱신결정부를 포함하고, 상기 제 Κ 제외 합신호는, 상기 제 κ 초기 베스트 코드백터를 제외한 제 1 초기 베스트 코드백터 내지 제 Ν 초기 베스트 코드백터의 합인 것을 특징으로 하는 오디오 신호 처리 장치가 제공된다.
[Mode for Invention]
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적 인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시 점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다. 본 발명에서 다음 용어는 다음과 같은 기준으로 해석될 수 있고, 기재되지 않은 용어라도 하기 취지에 따라 해석될 수 있다. 코딩은 경우에 따라 인코딩 또는 디코딩으로 해석될 수 있고, 정보 (information)는 값 (values), 파라미터 (parameter), 계수 (coefficients), 성분 (elements) 등을 모두 아우르는 용어로서, 경우에 따라 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다.
여기서 오디오 신호 (audio signal)란, 광의로는, 비디오 신호와 구분되는 개념으로서, 재생 시 청각으로 식별할 수 있는 신호를 지칭하고, 협의로는, 음성 (speech) 신호와 구분되는 개념으로서, 음성 특성 이 없거나 적은 신호를 의미한다. 본 발명에서의 오디오 신호는 광의로 해석되어야 하며 음성 신호와 구분되어 사용될 때 협의의 오디오 신호로 이해될 수 있다.
또한 코딩 이란, 인코딩만을 지칭할 수도 있지만, 인코딩 및 디코딩을 모두 포함하는 개념으로 사용될 수도 있다.
도 1 은 본 발명의 일 실시예에 따른 오디오 신호 처 리 장치 중 인코더의 구성을 보여주는 도면이다. 도 1 을 참조하면, 제 1 단계 양자화부 (121) 내지 제 N 단계 양자화부 (12N)을 포함하는 다단계 양자화부 (120)를 포함하고, 선형 예측부 (110), 인덱스 결정부 (130), 및 멀티플렉서 (140)를 더 포함할 수 있다. 선형 예측부 (110)은 입 력되는 오디오 신호에 대해서 선형 예측 코딩 (LPC)에 따른 선형 예측 분석을 수행함으로써, 선형 -예측 계수를 생성하고, 이를 변환함으로써, 선형 -예측 변환 계수를 성한다. 선형 예측 코딩의 모델의 기본 아이디어는, 주어진 시점 n 에서 지나간 p 개의 음성신호의 선형 조합으로 근사할 수 있다는 것인데, 식으로 나타내면 다음과 같다.
- [수학식 1] ' S(n) - qiS(n-l) + q2S(n-2) + -- + qpS(n-p) 여기서, qi 는 선형 -예측 계수 , η 은 샘플 인덱스 , ρ 은 선형 예측 차수 이와 같이 획득된 선형 -예측 계수는 큰 다이나믹 레인지를 갖기 때문에, 보다 적은 비트 수로 양자화될 필요가 있고, 선형 -예측 계수는 양자화 에 러에 약하기 때문에, 양자화 에 러에 강인한 계수로 변환될 필요가 있다. 따라서, 선형 예측 분석부 (110)는 선형 -예측 계수를 선형 -예측 변환 계수 (Wi)로 변환한다. 여기서 선형 -예측 변환 계수란, LSP(Line Spectral Pairs),
ISP(Immittance Spectral Pairs) 또는, LSF(Line Spectrum Frequency) 또는
ISF(Immittance Spectral Frequency) 중 하나일 수 있으나, 본 발명은 이에 한정되지 아니한다. 여기서 ISF 는 다음 수학식과 같이 나타낼 수 있다. [수학식 2]
f
= arccos(^)
2ττ , / = 1 ·.,15 =—-aiccos(qi )
4 , = 16
여기서 Φ 는 선형 -예측 예측 계수, fi 는 ISF 의 [0,6400Hz]의 주파수 영 역을 가리키고, fs=12800 는 샘플링 주파수이다.
이와 같이 선형 예측 코딩 (LPC: linear prediction coding)에 의해 생성된 복수의 선형 -예측 변환 계수들을 근거로 하여, 백터-양자화의 대상이 되는 타깃 백터를 생성할 수 있다. 여기서, 타깃 백터는, 현재 프레임의 복수의 선형 -예측 변환 계수들, 및 이전 프레임의 복수의 선형 -예측 변환 계수들간의 차분값으로 생성될 수도 있다. 이 타깃 백터는 다단계 양자화부 (120) 중 제 1 단계 양자화부 (121)에 입 력되므로, 제 1 단계의 타깃 백터 (이하, 제 1 타깃 백터)라 지칭하고자 한다.
한편 다단계 양자화부 (120)는 제 1 단계 양자화부 (121)부터 제 N 단계 양자화부 (12N)를 포함한다. 제 1 단계 양자화부 (121)부터 제 N 단계 양자화부 (12N)는 각 단계마다 적웅적으로 결정된 개수의 후보 코드백터들을 생성하고, 후보 코드백터들에 대응하는 후보 코드북 인덱스를 인덱스 결정부 (130)에 전달한다.
구체적으로, 상기 제 1 단계 양자화부 (121)는 제 1 타깃 백터에 대해 백터-양자화를 수행함으로써 제 1 개수 (M1)의 제 1 최종 후보 코드북 인덱스들 (Fl i~FlMl)(Ml 은 제 1 단계의 후보 코드백터들의 개수)를 생성한다. 제 1 최종 후보 코드북 인덱스들 (1^^니)은 도 1 에서의 인덱스 결정부 (130)에 전달된다. 제 N 단계 양자화부 (12N)는 제 N 타깃 백터에 대해 백터-양자화를 수행함으로써 , 제 N 개수 (MN) 의 제 N 최종 후보 코드북 인덱스들 (FI ^FIMNXMN은 제 N 단계의 후보 코드백터들의 개수)를 생성한다. 여기서, 제 1 개수 내지 제 N 개수 (MN)는 각 단계 (현재 단계 또는 이 전 단계)에서, 임시 후보 에 러들을 근거로 하여 적웅적으로 결정된다. 여기서 현재 단계에서 현재 단계의 후보 백터들의 개수를 결정하는 경우, 인트라 스테이지 방식에 해당하며, 이전 단계에서 현재 단계 (또는 현재 단계에서 다음 단계)의 후보 백터들의 개수를 결정하는 경우 인터 스테이지 방식에 해당한다. 본 명세서에서는 인트라 스테이지 방식은 제 1 실시 예로, 인터 스테이지 방식은 제 2 실시 예로 지칭하는 바, 상기 제 1 실시 예 (인트라 스테이지)에 해당하는 제 1 단계 양자화부 (121-A) 및 제 N 단계 양자화부 (12N-A)는 추후 도 2 및 도 3 과 함께, 제 2 실시 예 (인터 스테이지)에 해당하는 제 1 단계 양자화부 (121-B) 및 제 N 단계 양자화부 (12N-B)는 도 5 및 도 6 과 함께 설명하고자 한다.
인덱스 결정부 (130)는 제 1 개수의 제 1 최종 후보 코드북 인덱스들 (및 제 1 최종 후보 코드백터들), 및 제 N 개수의 제 N 최종 후보 코드북 인텍스들 (및 제 N 최종 후보 코드백터들)들을 조합하여, 복수 개의 후보 코드백터들의 후보 셋 (제 1 단계부터 제 N 단계까지 각 단계에서 한 개씩의 코드백터들을 조합)을 결정한다. 총 N 단계일 때, 이 후보 셋은 N 차원 (N- dimension)의 백터가 된다. 인덱스 결정부 (130)는 이 복수의 후보 셋들 중에서 타깃 백터 (제 1 타깃 백터)과의 에러가 가장 적은 하나의 셋을 결정한다. 이 셋에 해당하는 인덱스들, 즉 제 1 단계 코드북 인덱스 내지 제 N 단계 코드북 인덱스를 멀티플렉서 (140)에 전달한다.
멀티플렉서 (140)는 인덱스 결정부 (130)로부터 수신한 제 1 단계 코드북 인덱스 내지 제 N 단계 코드북 인덱스를 포함하는 데이터를 멀티플렉싱함으로써, 하나 이상의 비트스트림올 생성하여 디코더에 전송한다. 도 2 는 도 1 에서의 제 1 단계 양자화부 (121)의 제 1 실시 예 (121-A)에 대한 구성을 보여주는 도면이고, 도 3 은 도 1 에서의 제 N 단계 양자화부 (12N)의 제 1 실시 예 (12N-A)에 대한 구성을 보여주는 도면이다. 제 1 실시 예는 앞서 언급한 바와 같이, 현재 단계의 후보 코드백터들의 개수를 현재 단계에서 결정하는 인트라 스테이지 방식에 해당한다.
도 2 를 참조하면, 제 1 실시 예에 따른 제 1 단계 양자화부 (121-A)는 임시 후보백터 생성부 (121-A.1), 에 러 생성부 (121-A.3), 현재개수 결정부 (121-A.5)를 포함하고, 제 1 단계 코드북 (121.1)을 더 포힘 1할 수 있다.
임시 후보백터 생성부 (121-A.1)는 제 1 단계의 코드북 (121.1)을 이용하여 제 1 타깃 백터를 백터 양자화함으로써 , 임시로 결정된 개수 (Mpre)의 제 1 단계의 제 1 임시 후보 코드백터들 (T1广! ^ 을 획득한다. 여기서 제 1 단계의 코드북 (121.1)은 다단계 중에서 제 1 단계의 양자화를 위한 코드북에 해당한다. 한편, 제 1 단계에서의 임시로 결정된 개수 (Mpre)란, 미리 결정된 테이블 값일 수 있다. 또한, 임시로 결정된 개수는 총 개수를 의미할 수도 있고, 타깃 신호가 복수 개일 때 한 타깃 신호당 개수를 의미할 수도 있다. 이 테이블 값은 모드 별로 다를 수 있는데, 전이 모드 (TC: transition coding)인 경우, 한 타깃 신호당 7 개, 다른 모드들 (유성음 모드 (VC: voiced coding), 무성음 모드 (UC: unvoiced coding), 일반 모드 (GC: general coding))인 경우, 한 타깃 신호당 4 개일 수 있다. 여기서, 각 테이블 값은 특정 단계 (stage)에서 아래 표와 같이 감소될 수 있다.
[테이블 1]
Figure imgf000018_0001
예를 들어 , 무성음 모드 (UC)일 때, 대역폭 (광대역 (WB) 또는 협대역 (NB))에 따라, 제 5 단계 또는 제 6 단계 (Stage: 5 or 6)에서 4 대신에 4 미만의 값이 될 수 있으나, 본 발명은 이에 한정되지 아니한다.
에 러 생성부 (121-A.3)는 제 1 임시 후보 코드백터들 (T TlMpre) 및 제 1 타깃 백터간의 에러 인 제 1 임시 후보 에 러들 (El ! ElMpre)을 생성한다. 여기서 임시 후보 에 러들은 다음과 같은 수학식에 따라서 생성될 수 있다.
[수학식 3]
Figure imgf000019_0001
여기서, w(i)는 가중치, r(i)는 제 1 타깃 백터, Cs p(i)는 제 1 임시 후보 코드백터들, 05는 s 단계에서의 정규화 팩터 , Ρ 는 임시로 결정된 개수 (Mpre) 현재개수 결정부 (121-A.5)는 에러 생성부 (121-A.3)에 의해 생성된 제 1 임시 후보 에러들 (E ElMpre)를 근거로 하여 현재 단계에서의 후보 백터들의 현재 개수 (즉, 제 1 단계이므로, 제 1 후보 코드백터들의 개수인 제 1 개수 (이하, 제 1 개수 (M,))를 결정한다. 여기서 현재 개수 (제 1 개수)를 결정하는 데 있어서 임계치가 기준이 될 수 있다.
구체적으로, 제 1 임시 후보 에 러들을 오름차순 (ascending order)으로 정렬하고, 통계적 특성을 나타내는 파라미터를 생성한다. 여기서 파라미터는, 평균 (mean), 변화 (variance), 최소 (minimum), 최대 (maximum), 변화율 (gradient) 중 하나 이상을 포함할 수 있다. 이와 같은 제 1 임시 후보 에 러들에 근거한 파라미터 (및 임계치)를 근거로 제 1 개수 (현재 개수)를 결정한다.
제 1 실시예로서, 상기 에 러들의 평균값이 임계치보다 큰 경우, 현재 개수를 큰 수로 결정하고, 평균값이 임 계치보다 작은 경우, 현재 개수를 작은 수로 결정할 수 있다. 이는, 에 러가 높은 경우에는, 많은 수의 후보를 둠으로써 , 복잡도가 높아지지만 양자화 에 러를 줄이고자 하기 위함이다. 반면, 에 러가 낮은 경우에는, 후보의 수가 줄이더라도, 양자화 에러가 커지지 않을 수 있기 때문에, 복잡도를 즐이기 위해 후보의 수를 즐이는 것이다.
제 2 실시 예로서, 제 1 임시 후보 에러들을 오름차순으로 정 렬한 후, 정 렬된 에러들의 증가폭 (즉 차분값: Dk = Elk-Elk 0이 점차 감소하는 경우 현재 개수 (제 1 단계에서는 제 1 개수)는 상대적으로 작은 수로 결정할 수 있다. 반대로 정 렬된 에 러들의 증가폭이 점차 증가하는 경우 현재 개수를 상대적으로 큰 수로 결정하고 증가폭이 점차 감소하는 경우 현재 개수를 상대적으로 작은 수로 결정할 수 있다. 이는, 증가폭이 점차 감소한다는 것은, 현재 단계에서 양자화 오차가 적은 코드북 인덱스 (및 이에 대응하는 코드백터)가 상대적으로 많다는 것인데, 이 런 경우, 다음 단계에서의 코드북 인텍스들이 같은 인덱스를 선택할 가능성이 높아져 후보개수의 증가 대비 성능향상이 적기 때문에, 후보 개수를 줄이는 것이 효율적 이다. 반대로, 증가폭이 점차 증가한다는 것은, 현재 단계에서 양자화 오차가 가장 적은 코드북 인덱스와 두번째 적은 인텍스의 양자화 오차간의 차가 큰 경우이고, 이때 후보개수를 크게 함으로써, 다음 단계에서의 후보개수만큼 선택되는 인덱스간의 증복이 적게 되어 코드북 인덱스들의 조합을 증가시킬 수 있다. 이와 같이 제 1 단계의 현재개수 (M0 (제 1 개수)를 결정한 뒤에, 제 1 개수만큼의 제 1 최종 후보 코드백터들 (FVl! FV1M1)를 생성하고 이에 대웅하는 제 1 최종 후보 인덱스들 (Fl!~ 1^니)를 출력한다. 여기서. 제 1 최종 후보 인덱스들 (Fl ^ F1M1)의 개수 또한 제 1 개수 (1 )에 해당한다. 한편, 제 1 최종 후보 코드백터들 (FVh~ FVIMI) 및 제 1 타깃 백터간의 에 러를 계산함으로써 제 1 최종 후보 에 러들 (E ~ £1^)을 생성한다. 여기서 에 러는 상기 수학식 3 와 거의 동일한 방식으로 생성될 수 있다. 제 1 개수의 제 1 최종 후보 에러들 (El ,~ Ε1Μ1 ^ 제 2 단계의 타깃 백터들 (제 2 타깃 백터들)로서 제 2 단계 양자화부 ( N, N=2)의 임시 후보백터 생성부 (12N-A. l , N=2)로 입 력된다.
한편, 현재개수 결정부 (121-A.5)는 제 1 단계의 현재 개수 (제 1 개수 을 다음 단계 (제 2 단계) 양자화부로 더 전달할 수도 있는데, 이 경우, 제 1 단계의 현재 개수는 다음 단계의 양자화부가 개수를 결정하는데 있어서 이용될 수 있다.
이하, 도 3 을 참조하면서, 제 N 단계 양자화부 (12N-A)(여기서 N 은 2 이상의 자연수)에 대해서 설명하고자 한다. 제 N 단계 양자화부 (12N-A)는 후보백터 생성부 (12N-A.1), 에러생성부 (12N-A.3) 및 현재개수 결정부 (12N-A.5)를 포함하고, 제 N 단계 코드북 (12N.1)을 포함할 수 있다. 제 N 단계 양자화부 (12N)의 각 구성요소들은 동일 명칭의 제 1 단계 양자화부 (121)의 구성요소들과 거의 유사한 기능을 수행하므로, 차이점을 중심으로 설명하고자 한다ᅳ
임시 후보백터 생성부 (12N-A.1)은 제 N-1 단계 양자화부로부터 제 N-1
Figure imgf000021_0001
은 1 이상의 자연수)의 제 N-1 최종 후보 에러들 (ΕΝ-Ι , ΕΝ-ΙΜΝ- 0을 제 Ν 단계 타깃 백터들 (이하, 제 Ν 타깃 백터들)로서 수신한다. 제 Ν 단계 타깃 백터들 (EN- EN-lMNᅳ 1)을 제 N 단계 코드북 (12N.1)을 이용하여 백터- 양자화함으로써, 임시로 결정된 개수 (MPRE)의 제 N 임시 후보 코드백터들 (TO^^Mpre)을 생성한다. 여기서 , 제 N 단계에서의 임시로 결정된 수 (MPRE)는 테이블에 저장된 값일 수도 있지만, 제 1 단계에서의 임시로 결정된 개수와 달리 제 N-1 단계에서 개수 (제 N-1 개수)를 근거로 산정될 값일 수도 있다. 임시로 결정된 개수 (1^^)는 a 개 X 제 N-1 개수 (MN-1)일 수 있는데, 여기서 a 는 타깃 백터당 총 후보 개수를 의미한다.
한편, 도 4 는 제 N 단계 양자화부 (12N)의 동작을 설명하기 위한 도면이다. 도 4 를 참조하면, 총 제 N-1 개수 (MN-1)의 제 N-1 타깃 백터들이 존재하고, 각 타깃 백터들에 대해 각 a(a=3)개의 임시 후보 코드백터들 (ΤΝ, ΤΝΜ^)이 생성되 었음을 알 수 있다. 여기서 임시로 결정된 개수 (MPRE)는 !JX
Figure imgf000022_0001
해당한다.
다시 도 3 을 참조하면, 에 러 생성부 (12N-A.3)은 임시로 결정된 개수의 제 N 임시 후보 코드백터들 (TN! TNMpre) 및 제 N 타깃 백터들 (EN-l i EN-lMN- 간의 에러를 계산함으로써, 제 N 임시 후보 에러들 (EN1~ENMpre)를 산출한다. 현재개수 결정부 (12N-A.5)는 제 N 임시 후보 에 러들 ^^~ ^½^)을 기반으로 하여 현재개수 (제 N 개수 (MN))를 결정한다. 이때, 현재개수를 결정하는 방식에 대해서는 앞서 도 2 의 현재개수 결정부 (121-A.5)에서의 방식과 동일한 부분에 대해서는, 구체적인 설명은 생략하고자 한다. 다만, 현재개수 결정부 (12N-A.5)는 이 전 단계 (제 N-1 단계)에서의 현재 개수 (MN 0를 더 근거로 할 수 있다. 구체적으로, 앞서, 제 1 단계의 현재개수 결정부에서 수행된 방식에 의해 결정된 현재 개수 (MN)와 상기 이전 단계의 개수 (MN-0를 적절히 조합 (평균, 최소값, 최대값 등)함으로써 최종적으로 현재 개수 (MN)을 결정할 수 있다. 만약, 다음 단계가 존재하는 경우, 제 1 단계의 현재개수 결정부와 마찬가지로, 제 N 개수 (MN)를 제 N+1 단계 양자화부에 더 전달할 수 있다. 현재개수 결정부는 위와 같이 제 N 단계에서의 현재 개수 (MN)(제 N 개수)를 결정한 다음, 그 개수만큼의 제 N 최종 후보 코드백터들 (FVN! FVNMN) 및 이에 대웅되는 제 N 최종 후보 코드북 인덱스들 (FN^FNMN) 및 제 N 최종 후보 에러들 (EN^ENMN))을 생성한다. 한편, 다시 4 를 참조하면, 앞서 설명한 바와 같이 a X MN-i(a=3) 개의 제 N 임시 후보 코드백터들이 생성된다. 그 후 현재 개수 (MN)가 결정됨으로써, 그 임시 후보백터들 중 일부만이 제 N 최종 후보 코드백터들로서 선택된 경우, 선택되지 않은 임시 후보 코드백터들 (TN2, TN4, TN5, TN6, TNMpre-i, TN Mpre_i)에 대해서는 제거 또는 가지치기 (pruning)한 결과가 된다.
이와 같이 도 2 내지 도 4 와 함께 설명된 인트라 스테이지 방식은 현재 단계의 후보 코드백터들의 개수를 현재 단계의 타깃 백터들을 근거로 결정한다. 앞서 설명한 바와 같이, 인트라 스테이지 방식에서도 이전 단계의 개수를 현재 개수의 결정에 참고할 수 있다.
이하, 도 5 및 도 6 과 함께, 인터 스테이지 방식 (현재 타깃 백터들을 이용하여 다음 단계의 개수를 결정)에 대해서 설명하고자 한다.
도 5 는 도 1 에서의 제 1 단계 양자화부 (121)의 제 2 실시예 (121-B)에 대한 구성을 보여주는 도면이고, 도 6 은 도 1 에서의 제 N 단계 양자화부 (12N)의 제 2 실시 예 (12N-B)에 대한 구성을 보여주는 도면이다.
도 5 를 참조하면, 제 1 단계 양자화부 (121-B)는, 제 1 실시 예에 따른 제 1 단계 양자화부 (121-A)와 마찬가지로, 제 1 단계 코드북 (121.1)을 이용하여 제 1 타깃 백터를 백터 -양자화함으로써 , 임시로 결정된 개수 (1^^)의 제 1 최종 후보 코드백터들 (FVl ! FVlMpre) 및 이에 대웅되는 제 1 최종 후보 코드북 인덱스들 (Fl l~Fl Mpre)올 생성한다. 인터 스테이지 방식에서 제 1 단계는 이전 단계에서 결정된 개수가 없기 때문에, 임시로 결정된 개수 (Mpre^ 곧 제 1 단계 개수 (] )가 된다. 한편, 제 1 단계 코드북 (121.1)은 도 2 에서의 제 1 단계 코드북 (121.1)과 동일한 것 일 수 있지만, 본 발명은 이에 한정되지 아니한다. 제 1 최종 후보 코드북 인텍스들 (F ~ FlMpre 도 1 에서의 인텍스 결정부 (130)에 전달된다.
에러 생성부 (121-B.3)는 제 1 최종 후보 코드백터들 (FVl^FVlMpre) 및 제 1 타깃 백터와의 에러를 산출함으로써, 제 1 최종 후보 에러들 〜 ^ 을 생성한다. 여기서 에러 산출은 앞서 수학식 3 에 의해 수행될 수 있다. 제 1 최종 후보 에러들 11~£11^6)은 다음 단계의 타깃 백터들 (제 2 타깃 백터들)로서 제 2 단계 양자화부 (12N, N=2)에 전달된다.
다음개수 결정부 (121-B.5)는 제 1 최종 후보 에러들 ( 广 ^ 올 근거로 하여, 다음 단계의 후보 백터들의 개수 (제 2 개수) (M2)를 결정한다. 여기서 다음개수를 결정하는 방식은 앞서, 인트라 스테이지 방식 (제 1 실시 예)의 현재 개수 결정부 (121-A.5)에서 현재 개수를 결정하는 방식에서 구현된 방식과 거의 유사하므로, 이에 대한 설명은 생략하고자 한다. 이와 같이 결정된 다음 단계의 개수 (다음 개수 )(M2)는 제 2 단계 양자화부 (12N-B, N=2)에 전달된다. 도 6 을 참조하면, 제 N 단계 양자화부 (12N-B)는 후보백터 생성부 (12N- B.1)를 포함하고, 에 러 생성부 (12N-B.3), 다음개수 결정부 (12N-B.5) 및 제 N 단계 코드북 (12N.1)올 더 포함할 수 있다. 제 N 단계가 마지막 단계인 경우, 에러 생성부 (12N-B.3), 다음개수 결정부 (12N-B.5)는 포함되지 않는다.
후보백터 생성부 (12N-B.1)는 제 N-1 단계에서의 에러 신호인 제 N-1 최종 후보 에러들 (ΕΝ-Ι , Ε-ΙΜΝ-Ι)을 제 Ν 타깃 백터들로서 수신한다. 또한, 이전 단계 (제 N-1 단계)로부터 게 N-1 단계에서의 다음 개수 (ΜΝ), 즉, 제 Ν 개수 (ΜΝ)를 수신한다. 그리고 제 Ν 단계 코드북 (12N.1)을 이용하여 이 타깃 백터들에 대하여 백터-양자화를 수행함으로써, 제 Ν 개수 (ΜΝ)에 해당하는 제 Ν 최종 후보 코드백터들 (FVN^FVNMN) 및 이에 대웅하는 제 N 최종 후보 코드북 인텍스 (FNHFNMN)을 생성한다.
제 1 단계의 후보백터 생성부는, 이전 단계가 존재하지 않기 때문에, 임시로 결정된 개수 ((MPRE)만큼 생성하는 데 비해, 제 N 단계의 후보백터 생성부는, 이전 단계 (N-1 단계)가 존재하기 때문에, 제 N-1 단계에서의 다음 개수 (MN), 즉, 제 N 개수 (MN)만큼의 후보백터들올 최종적으로 수행할 수 있다. 한편, 인트라 스테이지 방식 (제 1 실시 예)의 후보백터 생성부 (12N- A.1)에서는, 최종적인 개수가 정해지지 않았기 때문에, 임시 후보 코드백터들올 생성했던 것과 달리, 인터 스테이지 방식 (제 2 실시 예)에서는, 이 전 단계에서 현재 단계의 후보백터들의 개수가 정해져서 전달되기 때문에, 최종적인 코드백터들을 생성한다는 데 차이가 있다.
상기 제 N 최종 후보 코드백터들 (FVN^FVNMN)를 제 N 개수 (MN)만큼 생성하는 과정은, 앞서 도 4 에 도시된 바와 같이, 미리 설정된 개수 (예: 각 타깃 백터에 대해 a 개 (a 는 자연수))만큼 임시 후보 코드백터들을 생성한 이후, 임시 후보 에 러들을 기반으로 하여 , 임시 후보 코드백터들 중 최종 개수 (MN)만큼 선택하고 나머지를 가지치기할 수 있다.
이와 같이 생성된 제 N 최종 후보 코드북 인덱스 (FN^FNMN)는 도 1 의 인덱스 결정부 (130)로 전달되고, 제 N 최종 후보 코드백터들 (FVN^FVNMN)은 에러 생성부 (12N-B.3)로 전달된다.
앞서 언급한 바와 같이 에러 생성부 (12N-B.3) 및 다음개수 결정부 (12N- B.5)는 제 N 단계가 마지막 단계인 경우에는 존재하지 않으므로, 제 N+1 단계가 존재하는 경우에만 아래와 설명이 의미가 있다.
에 러 생성부 (12N-B.3)는 제 N 최종 후보 코드백터들 (FVN^FVNMN) 및 각 코드백터들에 대웅하는 타깃 백터 (ΕΝ-Ι , Ε-ΐΜΝ-ύ간의 에 러를 산출함으로써, 제 Ν 최종 후보 에러들 (EN! ENMN)을 생성한다. 제 N 최종 후보 에러들 (EN^ENMN)은 제 N+1 단계가 존재할 경우, 제 N+1 단계 양자화부로 전달된다.
다음개수 결정부 (12N-B.5)는 제 1 단계의 다음개수 결정부 (121-B.5)와 마찬가지의 방식으로 다음 단계 (제 N+1 단겨 I)에서의 후보 백터들의 개수 (^ +1)을 생성해서, 제 N+1 단계 양자화부에 전달한다.
이와 같이 일 실시 예에 따른 오디오 신호 처리 방법 및 장치는 다단계의 백터-양자화를 수행하는 데 있어서, 각 단계에서의 후보 코드백터 (또는 후보 코드북 인덱스)들의 개수를 현재 타깃 신호 또는 이 전 타깃 신호의 에 러에 따라서 적웅적으로 변화시킬 수 있다. 이하에서는, 도 7 내지 도 13 을 참조하면서 다른 실시 예에 따른 오디오 신호 처리 방법 및 장치에 대해서 설명하고자 한다.
도 7 은 본 발명의 다른 실시 예에 따른 오디오 신호 처리 장치 중 인코더의 구성을 보여주는 도면이다. 도 7 을 참조하면, 다른 실시 예에 따른 인코더 (200)는 초기 양자화부 (220) 및 인덱스 갱신부 (230)를 포함하고, 선형 예측부 (210) 및 멀티플렉서 (240)를 더 포함할 수 있다.
우선 선형 예측부 (210)는 앞서 일 실시 예에 따른 인코더 (100)의 선형 예측부 (110)와 동일한 기능을 수행하므로 그 설명은 생략하고자 한다. 선형예측부 (210)는 선형 -예측 변환 계수를 이용하여 제 1 단계의 타깃 신호 (TV1)를 생성하고, 이를 다단계 초기 양자화부 (220)에 전달한다.
초기 양자화부 (220)는 선형 예측부 (210)로부터 입 력된 타깃 백터에 대해서 다단계 양자화를 수행함으로써, 게 1 후보 코드백터들 (CC CClM) 내지 제 N 후보 코드백터들 (CCNJ^CCNM)를 생성하여, 인텍스 갱신부 (230)에 전달한다. 초기 양자화부 (220)는 제 1 단계 초기 양자화부 (221) 내지 제 N 단계 초기 양자화부 (22N)를 포함한다. 제 1 단계 초기양자화부 (221) 내지 제 N 단계 초기 양자화부 (22N)의 동작을 도 8 을 참조하면서 설명하고자 한다.
도 8 은 도 7 의 초기양자화부 (221 22N)의 출력 데이터의 일 예를 설명하기 위한 도면이다. 도 8 을 참조하면, 좌측에는 제 1 단계 초기 양자화부 (221)의 출력 데이터가 도시되어 있고, 우측에는 제 K 단계 초기 양자화부 (22K)의 출력 데이터가 도시되어 있다. 제 1 단계 초기 양자화부 (221)는 제 1 단계 코드북 (미도시)를 이용하여 타깃 신호 (또는 타깃 백터)를 백터 -양자화함으로써, 제 1 단계 (이하, 제 1) 후보 코드백터들 (cc1 i~cc1m)을 생성한다. 여기서 게 1 단계 코드북 (미도시)는 도
2 에서의 제 1 단계 코드북 (121.1)과 동일한 것일 수 있으나, 본 발명은 이에 한정되지 아니한다.
한편, 제 1 후보 코드백터들의 개수 (M)은 1) 단계 전체에 대해서 고정된 값, 2) 각 단계별로 미리 설정된 값, 3) 적응적으로 변화하는 값 중에 하나일 수 있다. 후보코드백터들의 개수가 적웅적으로 변화하는 값인 경우, 제 1 단계 초기 양자화부 (221)는 앞서 도 2(인트라 스테이지 방식) 또는 도 5(인터 스테이지 방식)에 도시된 바와 같이 구성될 수 있다. 즉, 도 2 또는 도 5 의 제 1 최종 후보 코드백터들 (FVHFV1M1)이 도 8 의 제 1 후보 코드백터들 (CC1广 CC1M)에 해당하는 것이다ᅳ
제 1 후보 코드백터들 (CC CCIM) 및 타깃 백터간의 에 러 인 후보 에러들을 계산하여 , 이 에러들을 기준으로 도 8 과 같이 오름차순으로 정 렬하고, 이들 중에서 가장 에러가 작은 코드백터를 제 1 단계 (제 1) 초기베스트 코드백터 (BC1)라 지칭하고, 이에 해당하는 에러를 제 1 단계 (제 1) 초기베스트 에러 (BE1)라 지칭하고자 한다ᅳ 제 1 후보 코드백터들 (CCl r ClM)은 도 7 의 인덱스 갱신부 (230)로 전달되고, 제 1 초기 베스트 에 러 (BE1)는 제 2 단계 초기 양자화부 (22N, N=2)의 타깃 신호 (또는 타깃 백터)로서 전달된다. 즉, 인덱스 갱신부 (230)로 전달되는 것은 복수의 후보 코드백터들이지만, 타깃 신호로서 다음 단계로 넘겨지는 것은 복수 개 증에서도 가장 에러가 낮은 코드백터에 해당하는 에러인 것이다. 이 타깃 신호는 현재 단계에서는 최선일 수 있지만, 전체 단계를 조합하였을 때 최선이 아닐 수도 있기 때문에, 추후 인덱스 갱신부 (230)에서 이를 위한 보상 동작을 수행한다ᅳ
다시 도 7 을 참조하면, 제 N 단계 초기 양자화부 (22N)도 제 1 단계 초기 양자화부 (221)와 마찬가지로, 제 N 단계 코드북을 이용하여 제 N-1 단계 타깃 신호에 대하여 백터-양자화를 수행함으로써 제 N 후보 코드백터들 (CCN广 CCNM)을 생성하고, 이중에서 가장 에러가 작은 코드백터를 제 N 단계 초기베스트 코드백터 (BCN)이라 지칭한다. 제 N 후보 코드백터들 (CCN,~CCNM)는 인덱스 갱신부 (230)로 전달된다. 여기서도 마찬가지로, 제 N 후보 코드백터들의 개수가 적웅적으로 변화하는 값일 경우, 제 N 단계 초기 양자화부 (22N)는 도 3 또는 도 6 에 도시된 바와 같은 구성요소로 구성될 수 있다.
제 1 초기 베스트 코드백터 (CCh=BCl)를 포함하는 제 1 후보 코드백터들 (CCI ^CCIM)가 인덱스 갱신부 (230)로 전달되고, 제 1 초기 베스트 에러 (BE1)은 다음 단계의 초기 양자화부 (22N, N=2) 및 인덱스 갱신부 (230)로 전달된다. 또한, 제 N 초기 베스트 코드백터 (CCN^BCN)를 포함하는 제 N 후보 코드백터들 (CCN广 CCNM) 또한, 인텍스 갱신부 (230)로 전달되고, 제 N 초기 베스트 에 러 (BEN)는 제 N 단계가 마지막 단계일 때, 인텍스 갱신부 (230)로만 전달된다.
인덱스 갱신부 (230)는 제 1 후보 코드백터들 (CC CC 내지 제 N 초기 베스트 코드백터 (CCN^BCN)를 수신하여 , 특정 K 단계에 대해서 인덱스 갱신 여부를 결정한다. 그리고, 최종적으로 제 1 최종 코드북 인덱스 내지 제 N 최종 코드북 인덱스를 생성하여 멀티플렉서 (240)에 전달한다. 인덱스 갱신부 (230)의 세부 구성도는 도 9 및 도 10 에 도시되어 있다.
멀티플렉서 (240)는 인덱스 갱신부 (230)에 의해 생성된 제 1 최종 코드북 인텍스 내지 제 N 최종 코드북 인덱스를 포함하는 하나 이상의 비트스트림을 생성하여 디코더에 전달한다.
이하, 도 9 및 도 10 을 참조하면서, 인텍스 갱신부 (230)의 실시 예에 따른 세부 동작에 대해서 설명하고자 한다. 도 9 은 도 7 의 인덱스 갱신부 (230)의 실시 예의 세부 구성을 보여주는 도면이고, 도 10 는 도 9 의 제 K 단계 갱신부 (23K)의 실시 예의 세부 구성을 보여주는 도면이다.
우선 도 9 를 참조하면, 인덱스 갱신부 (230)는 갱신제어부 (230-2)를 포함하고, 제 1 단계 갱신부 (231) 내지 제 K 단계 갱신부 (23K) 내지 제 Ν 단계 갱신부 (23Ν) 중 하나 이상을 포함한다.
갱신 제어부 (230-2)는 초기 양자화부 (220)로부터 수신한 제 1 초기 베스트 에 러 (BE1) 내지 제 Ν 초기 베스트 에러 (BEN)를 근거로 하여, 전체 단계들 (제 K 단계, Κ=1, ..., Ν) 중에서, 인텍스를 갱신 (replacement)할 단계를 결정한다. 여기서, 가장 에 러가 큰 단계를 우선적으로, 인덱스를 갱신할 단계로 결정한다. 만약 제 1 단계에 대해서 인덱스를 갱신하기로 결정된 경우, 갱신 제어부 (230-2)는 제 1 단계 갱신부 (231)를 활성화시키고, 제 N 단계에 대해서 인덱스를 갱신하기로 결정된 경우, 갱신 제어부 (230-2)는 제 N 단계 갱신부 (231)를 활성화시킨다. 제 K 단계 (K=1,...,N)에 대해서 인덱스를 갱신하기로 결정되어, 제 K 단계 갱신부 (23K)가 활성화된 경우에 대해서, 추후 도 10 올 참조하면서 설명하고자 한다.
갱신 제어부 (230-2)는 상기와 같이, 에러가 가장 큰 단계 (예 : 제 K 단계)에 대해서 인덱스를 갱신한 이후, 에러가 두 번째로 큰 단계 (예: 제 K+a 단계 (a 는 정수))에서 대해서 인덱스를 갱신 (replacement)할지 여부를 선택할 수 있다. 만약, 제 K 단계에서, 제 K 초기베스트 코드백터가 제 K 최적 베스트로 대체 또는 갱신된 경우, 상기 제 K+a 단계 이후에 대해서 인텍스 갱신을 수행할 수 있다. 반대로, 제 K 단계에서, 제 K 초기베스트 코드백터가 제 K 최 적 베스트로 대체되지 않고 제 K 최종 코드백터 (FCK)로 결정된 경우, 상기 제 K+a 단계 이후 단계에 대해서 인텍스 갱신을 수행하기 않거나, 아니면, 상기 제 K+a 단계에 대해서만 인덱스 갱신을 할 수 있다.
이하, 도 10 을 참조하면서 제 K 단계 갱신부 (23K, K=l,..., Ν)에 대해서 설명하고자 한다. 도 10 을 참조하면, 제 Κ 단계 갱신부 (23Κ)는 제 Κ 단계 타깃 신호 수정부 (23K.1), 재탐색부 (23Κ.2) 및 갱신결정부 (23Κ.3)를 포함한다.
제 Κ 단계 타깃 신호 수정부 (23K.1)는 게 Κ 단계가 제외된 단계들에 대해 초기 베스트 코드백터 (BC1 BCN, BCK 제외), 및 제 1 단계 타깃 신호를 수신하고, 이들을 근거로 제 Κ 단계에 대한 타깃 신호를 수정함으로써, 수정된 제 Κ 타깃 신호를 생성한다.
구체적으로, 우선 다음과 같이 각 단계에 대해서 초기 베스트 코드백터를 합하되 제 Κ 단계만을 제외시킴으로써 , 제 Κ 제외 합 신호 (SUMexpK)를 생성한다. [수학식 4]
SUM expK= BC1 + ... + BCK-1 + BCK+1 + ... + BCN
여기서, BCI 은 제 1 (단계) 초기 베스트 코드백터,
BCK-1 은 제 K-1 (단계) 초기 베스트 코드백터,
BCK+1 은 제 K+1 (단계) 초기 베스트 코드백터 ,
BCN 은 제 N (단계) 초기 베스트 코드백터 .
각 단계의 초기 베스트 코드백터는, 앞서 도 7 의 각 단계 초기양자화부에서, 각 단계에서 후보 코드백터를 하나로 설정했을 때, 각 단계에서 가장 에러가 작은 코드백터에 해당한다.
위와 같이 제 K 초기 베스트 코드백트만을 제외시킨 계 K 제외 합신호 (SUM EXPK)를 생성하고, 이를 제 1 타깃 백터 (TV 1)에서 차감함으로써 , 수정된 제 K 타깃 신호 (TVKMOD)를 생성한다.
[수학식 5]
TVKmod= TVl - SUMexpK
TVKMOD 는 수정된 제 K 타깃 신호
SUM EXPK은 제 K 제외 합신호 (SUM EXPK= BC1 + ... + BCK-1 + BCK+1 + ... +
BCN)
TV1 은 게 1 타깃 신호 (또는 제 1 타깃 백터)
재탐색부 (23K.2)는 수정된 저】 K 타깃 신호 (TVKMOD)을 기준으로, 앞서 제 K 초기 양자화부 (22K)에 의해 검색되었던 제 K 후보 코드백터들 (CCKP^CCKM)의 에 러들을 재계산하여, 이들 중 에러가 가장 적은 코드백터를 제 K 최적 베스트 코드백터 (OCK)로서 결정한다. 즉 계 K-1 단계에서 베스트 후보 에러 (BEK-1 )였던 제 Κ 타깃 신호 (TVK)와 달리, 수정된 제 Κ 타깃 신호 (TVKMOD)는 K+1 단계 이후의 초기 베스트 코드백터까지 포함함으로써, K+1 단계 이후의 에 러를 반영한 신호이다. 따라서, 제 타깃 신호 (TVK)가 아닌 수정된 제 K 타깃 신호 (TVKMOD)를 기준으로 하면 제 K 후보 코드백터들 (CCK^CCKM)에 대한 각 에 러의 값은 변경될 수 밖에 없다. 따라서, 이를 기준으로 에 러를 재계산함으로써, 재계산된 에러가 가장 작은 제 K 최적 베스트 코드백터 (OCK)를 선정하는 것이다.
갱신 결정부 (23K.3)은 제 K 초기 양자화 (22K)로부터 제 K 초기 베스트 코드백터 (BCK)를, 재탐색부 (23K.2)로부터 제 K 최 적 베스트 코드백터 (OCK)를 수신한다. 갱신 결정부 (23K.3)는 제 K 초기 베스트 코드백터 (BCK) 및 제 K 최적 베스트 코드백터 (OCK) 중에서, 총 에러가 보다 적은 코드백터를 제 K 단계 최종 코드백터 (FCK)로 결정한다. 여기서 총 에 러를 계산하기 위해서, 선형 예측부 (210)로부터의 제 1 단계 타깃 신호 (TV1), 제 K 단계 타깃 신호 수정부 (23K.1)로부터의 제 K 제외 합신호 (SUMEXCK)를 이용한다.
EBCK = TVl - (BCK + SUMEXCK)
EOCK = TVl - (OCK + SUMEXCK)
EBCK 는 제 K 초기 베스트 코드백터에 대한 총 에 러 (이하, 제 1 총 에 러) EOCK 는 제 K 최적 베스트 코드백터에 대한 총 에 러 (이하, 제 2 총 에러) BCK 는 제 K 초기 베스트 코드백터
OCK 는 제 K 초기 베스트 코드백터 SUMexcK는 제 K 제외 합신호
다시 말해서, 갱신 결정부 (23Κ.3)은 상기 제 1 총 에러가 더 낮다면, 제 Κ 초기 베스트 코드백터 (BCK)가 보다 유리한 것이므로, 제 Κ 최적 베스트 코드백터 (OCK)로 갱신 (replacement)올 하지 않고, 이를 제 K 최종 코드백터 (FCK)로 결정한다. 반대로, 상기 제 2 총 에러가 더 낮다면, 수정된 제 K 단계 타깃 신호 (BEKmod)을 기반으로 한 제 K 최적 베스트 코드백터 (OCK)가 제 K 최 적 베스트 코드백터 (OCK)로 갱신 (replacement)함으로써 , 이를 제 K 최종 코드백터 (FCK)로 결정한다.
그런 다음 제 K 최종 코드백터 (FCK)에 대응하는 코드북 인덱스 (FIK)를 제 K 최종 코드북 인덱스로서 도 7 에서의 멀티폴렉서 (240)로 전달한다.
다시 도 9 를 참조하면, 앞서 제 K 단계에서 인덱스 갱신을 수행함으로써, 제 K 초기 베스트 코드백터 (BCK) 및 제 K 최적 베스트 코드백터 (OCK) 증 하나로 제 K 최종 코드백터 (FCK)를 결정한 이후, 제 K+a 단계에 대해서 인덱스 갱신을 수행하는 경우, 제 K+a 단계 갱신부 (23K+a)에 입 력에는 제 K 초기 베스트 코드백터 (BCK) 대신에 제 K 최종 코드백터 (FCK)가 입 력된다.
이와 같이 다른 실시 예에 따른 오디오 신호 처리 방법 및 장치에 따르면, 우선 후보 개수를 적은 수 (예: 1 개)로 설정하여 1 차적으로 다단계 양자화를 수행함으로써, 다단계 양자화에 따른 복잡도를 현저히 감소시킬 수 있다. 나아가, 에 러가 높은 단계 (제 K 단계, 제 K+a 단계 등)에 대해서는 에 러가 감소되는 경우에 한해, 최 적 베스트 코드백터로 교체함으로써, 백터-양자화의 에러를 현저히 감소시킬 수 있다.
본 발명에 따른 오디오 신호 처리 장치는 다양한 제품에 포함되어 이용될 수 있다. 이러한 제품은 크게 스탠드 얼론 (stand alone) 군과 포터블 (portable) 군으로 나뉠 수 있는데, 스탠드 얼론군은 티비, 모니터 , 셋탑 박스 등을 포함할 수 있고, 포터블군은 PMP, 휴대폰, 네비게이션 등을 포함할 수 있다.
도 11 은 본 발명의 일 실시 예에 따른 오디오 신호 처 리 장치가 구현된 제품들의 관계를 보여주는 도면이다. 우선 도 11 을 참조하면, 유무선 통신부 (510)는 유무선 통신 방식을 통해서 비트스트림을 수신한다. 구체적으로 유무선 통신부 (510)는 유선통신부 (510A), 적외선통신부 (510B), 블루투스부 (510C), 무선랜통신부 (510D), 이동통신부 (510E) 중 하나 이상을 포함할 수 있다.
사용자 인증부는 (520)는 사용자 정보를 입 력 받아서 사용자 인증을 수행하는 것으로서 지문인식부, 흥채인식부, 얼굴인식부, 및 음성 인식부 중 하나 이상을 포함할 수 있는데, 각각 지문, 흥채정보, 얼굴 윤곽 정보, 음성 정보를 입 력받아서, 사용자 정보로 변환하고, 사용자 정보 및 기존 등록되어 있는 사용자 데이터와의 일치 여부를 판단하여 사용자 인증을 수행할 수 있다. 입 력부 (530)는 사용자가 여러 종류의 명령을 입 력하기 위한 입 력장치로서, 키패드부 (530A), 터치패드부 (530B), 리모컨부 (530C), 마이크로폰 부 (530D) 중 하나 이상을 포함할 수 있지만, 본 발명은 이에 한정되지 아니한다. 여기서 , 마이크로폰 부 (530D)는 음성 또는 오디오 신호를 입 력받기 위한 입 력장치이다. 여기서 키패드부 (530A), 터치패드부 (530B), 리모컨부 (530C)은 통화 발신을 위한 명 령 또는 마이크로폰 부 (530D)을 활성화시키기 위한 명령을 입 력받을 수 있다. 제어부 (550)는 키패드부 (530B) 등을 통해 통화 발신을 위한 명 령을 수신한 경우, 이동 통신부 (510E)로 하여금 동통신망에 호를 요청하도록 할 수 있다.
신호 코딩 유닛 (540)는 마이크로폰 부 (530D) 또는 유무선 통신부 (510)를 통해 수신된 오디오 신호 및 /또는 비디오 신호에 대해서 인코딩 또는 디코딩을 수행하고, 시간 도메인의 오디오 신호를 출력한다. 오디오 신호 처리 장치 (545)를 포함하는데, 이는 앞서 설명한 본 발명의 실시 예 (즉, 실시 예들에 따른 인코더 (100, 200))에 해당하는 것으로서, 이와 같이 오디오 처리 장치 (545) 및 이를 포함한 신호 코딩 유닛은 하나 이상의 프로세서에 의해 구현될 수 있다.
제어부 (550)는 입력장치들로부터 입 력 신호를 수신하고, 신호 디코딩부 (540)와 출력부 (560)의 모든 프로세스를 제어한다. 출력부 (560)는 신호 디코딩부 (540)에 의해 생성된 출력 신호 등이 출력되는 구성요소로서, 스피커부 (560A) 및 디스플레이부 (560B)를 포함할 수 있다. 출력 신호가 오디오 신호일 때 출력 신호는 스피커로 출력되고, 비디오 신호일 때 출력 신호는 디스플레이를 통해 출력된다.
도 12 는 본 발명의 일 실시예에 따른 오디오 신호 처 리 장치가 구현된 제품들의 관계도이다. 도 12 는 도 11 에서 도시된 제품에 해당하는 단말 및 서버와의 관계를 도시한 것으로서 , 도 12 의 (A)를 참조하면, 제 1 단말 (500.1) 및 제 2 단말 (500.2)이 각 단말들은 유무선 통신부를 통해서 데이터 내지 비트스트림을 양방향으로 통신할 수 있음을 알 수 있다. 도 12 의 (B)를 참조하면, 서버 (600) 및 제 1 단말 (500.1) 또한 서로 유무선 통신을 수행할 수 있음올 알 수 있다.
도 13 은 본 발명의 실시 예에 따른 오디오 신호 처리 장치가 구현된 이동 단말기의 개략적인 구성을 보여주는 도면이다. 이동단말기 (700)는 통화 발신 및 수신을 위한 이동 통신부 (710), 데이터 통신을 위한 데이터 통신부 (720), 통화 발신 또는 오디오 입 력에 대한 명령을 입 력하기 위한 입 력부 (730), 음성 또는 오디오 신호를 입 력하기 위한 마이크로폰 부 (740), 각 구성요소를 제어하기 위한 제어부 (750), 신호 코딩부 (760), 음성 또는 오디오 신호를 출력하기 위한 스피커 (770), 및 화면을 출력하기 위한 디스플레이 (780)를 포함할 수 있다.
신호 코딩부 (760)는 이동 통신부 (710), 데이터 통신부 (720) 또는 마이크로폰 부 (530D) 를 통해 수신된 오디오 신호 및 /또는 비디오 신호에 대해서 인코딩 또는 디코딩을 수행하고, 시간 도메인의 오디오 신호를 이동 통신부 (710), 데이터 통신부 (720) 또는 스피 커 (770)를 통해 출력 한다ᅳ 오디오 신호 처리 장치 (765)를 포함하는데, 이는 앞서 설명한 본 발명의 실시 예 (즉, 실시 예에 따른 인코더 (100) 및 /또는 디코더 (200))에 해당하는 것으로서, 이와 같이 오디오 처리 장치 (765) 및 이를 포함한 신호 코딩 유닛은 하나 이상의 프로세서에 의해 구현될 수 있다. 본 발명에 따른 오디오 신호 처리 방법은 컴퓨터에서 실행되기 위 한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀 질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 R()M, RAM, CD- ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브 (예를 들어 인터넷을 통한 전송)의 형 태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유 /무선 통신망을 이용해 전송될 수 있다. 이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명 이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기 재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형 이 가능함은 물론이다.
[Industrial Applicability】
본 발명은 오디오 신호를 인코딩하고 디코딩하는 데 적용될 수 있다 .

Claims

【청구의 범위】
[청구항 1]
오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써, 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 단계의 타깃 백터인 제 1 타깃 백터를 생성하는 단계;
상기 제 1 타깃 백터를 백터 양자화함으로써, 임시로 결정된 개수의 제 1 단계의 제 1 임시 후보 코드백터들을 획득하는 단계;
상기 제 1 임시 후보 코드백터들 및 상기 제 1 타깃 백터간의 에러인 제 1 임시 후보 에러들을 산출하는 단계; 및,
상기 제 1 임시 후보 에러들을 근거로 하여 제 1 후보 코드백터들의 개수인 제 1 개수를 결정하고, 상기 제 1 개수만큼의 제 1 최종 후보 코드백터들을 획득하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법 .
[청구항 2]
제 1 항에 있어서,
상기 제 1 최종 후보 코드백터들을 근거로 제 1 최종 후보 에러들을 제 2 단계의 타깃 백터들로서 생성하는 단계;
상기 제 2 타깃 백터들을 백터 양자화함으로써 , 임시로 결정된 개수의 제 2 단계의 제 2 임시 후보 코드백터들을 획득하는 단계;
상기 제 2 임시 후보 코드백터들 및 상기 제 2 단계의 타깃 백터들간의 제 2 임시 후보 에 러들을 산출하는 단계; 및,
상기 제 2 후보 에 러들을 근거로 하여 제 2 후보 코드백터들의 개수인 제 2 개수를 결정하고, 상기 제 2 개수만큼의 상기 제 2 최종 후보 코드백터들을 획득하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 방법 .
[청구항 3]
제 2 항에 있어서,
상기 제 2 임시 후보 코드백터들을 획득하는 단계는,
상기 제 2 타깃 백터들 각각에 대해 a(a: 임의의 자연수)개수 만큼씩의 임의 후보 코드백터들을 획득하는 단계; 및
상기 임의 코드백터들 증 일부를 제거함으로써 , 상기 임시로 결정된 개수의 제 2 임시 후보 코드백터들을 획득하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법 .
[청구항 4] 제 2 항에 있어서,
상기 임시로 결정된 개수는, 미리 결정된 테이블 값 또는 제 1 개수를 근거로 산정되는 것올 오디오 신호 처 리 방법 .
[청구항 5]
제 1 항에 있어서,
겨 1 1 개수는, 상기 제 1 임시 후보 에러들 및 임 계치를 근거로 결정되는 것을 특징으로 하는 오디오 신호 처리 방법.
[청구항 6]
제 5 항에 있어서,
상기 제 1 개수는, 상기 제 1 임시 후보 에 러들을 오름차순으로 정 렬한 후, 그들의 증가폭이 점차 감소하면, 작은 수로 결정되는 것을 특징으로 하는 오디오 신호 처리 방법.
[청구항 7]
오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써, 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 단계의 타깃 백터인 제 1 타깃 백터를 생성하는 단계;
상기 제 1 타깃 백터를 백터 양자화함으로써, 임시로 결정된 개수의 제 1 단계의 제 1 최종 후보 코드백터들을 획득하는 단계;
상기 제 1 최종 후보 코드백터들 및 상기 게 1 타깃 백터간의 에 러 인 제 1 최종 후보 에러들을 산출하는 단계; 및,
상기 제 1 최종 후보 에 러들을 근거로 하여 제 2 단계의 제 2 후보 코드백터들의 개수인 제 2 개수를 결정하는 단계를 결정하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
[청구항 8]
제 7 항에 있어서,
상기 제 1 후보 코드백터들을 근거로 제 1 최종 후보 에 러들을 제 2 단계의 타깃 백터들로서 생성하는 단계;
상기 제 2 타깃 백터들을 백터 양자화함으로써, 상기 제 2 개수만큼의 제 2 단계의 제 2 임시 후보 코드백터들을 획득하는 단계; 상기 제 2 임시 후보 코드백터들 및 상기 제 2 타깃 백터간의 에 러들인 제 2 임시 후보 에러들을 산출하는 단계; 및, 상기 제 2 임시 후보 에러들을 근거로 하여 제 3 단계의 제 3 후보 코드백터들의 개수인 제 3 개수를 결정하는 단계를 결정하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
[청구항 9]
오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써, 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 단계의 타깃 백터 인 제 1 타깃 백터를 생성하는 선형 예측부;
상기 제 1 타깃 백터를 백터 양자화함으로써 , 임시로 결정된 개수의 제 1 단계의 제 1 임시 후보 코드백터들을 획득하는 임시 후보백터 생성부;
상기 제 1 임시 후보 코드백터들 및 상기 제 1 타깃 백터간의 에러인 제 1 임시 후보 에러들을 산출하는 에러 생성부; 및,
상기 제 1 임시 후보 에러들을 근거로 하여 제 1 후보 코드백터들의 개수인 제 1 개수를 결정하고, 상기 제 1 개수만큼의 제 1 최종 후보 코드백터들을 획득하는 현재개수 결정부를 포함하는 것을 특징으로 하는 오디오 신호 처리 장치 .
[청구항 10]
오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써 , 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 단계의 타깃 백터 인 제 1 타깃 백터를 생성하는 선형 예측부;
상기 제 1 타깃 백터를 백터 양자화함으로써, 임시로 결정된 개수의 제 1 단계의 제 1 최종 후보 코드백터들을 획득하는 후보백터 생성부; 상기 제 1 최종 후보 코드백터들 및 상기 제 1 타깃 백터간의 에러인 제 1 최종 후보 에러들을 산출하는 에러생성부; 및,
상기 제 1 최종 후보 에러들올 근거로 하여 제 2 단계의 제 2 후보 코드백터들의 개수인 제 2 개수를 결정하는 단계를 결정하는 다음개수 결정부를 포함하는 것을 특징으로 하는 오디오 신호 처리 장치.
[청구항 11]
오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써 , 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 타깃 신호를 생성하는 단계;
상기 제 1 타깃 신호를 근거로, 제 1 단계에 대한 백터-양자화를 수행하는 단계; 상기 백터 -양자화는, 상기 제 1 타깃 신호를 근거로, 가장 에 러가 작은 제 1 초기 베스트 코드백터를 포함하는 제 1 후보 코드백터들을 생성하는 단계; 및
상기 제 1 초기 베스트 코드백터에 대웅하는 제 1 초기 베스트 에러를 제 2 단계 타깃 신호인 제 2 타깃 신호로 출력하는 단계를 포함하고,
상기 백터ᅳ양자화를 제 2 단계부터 총 N 단계까지 반복하여 수행하는 단계;
상기 제 1 단계 내지 상기 제 N 단계 중에서 인덱스를 갱신할 K (Κ=1, ..., Ν)단계를 결정하는 단계;
상기 제 1 타깃 신호 및, 제 Κ 제외 합신호를 이용하여, 상기 제 Κ 타깃 신호를 수정하는 단계;
상기 수정된 제 Κ 타깃 신호를 근거로 하여, 제 Κ 후보 코드백터들 증에서 제 Κ 최적 베스트 코드백터를 결정하는 단계; 및,
제 Κ 초기 베스트 코드백터 및 상기 제 Κ 최적 베스트 코드백터 중 하나를 제 Κ 최종 베스트 코드백터로 선택하는 단계를 포함하고,
상기 제 Κ 제외 합신호는, 상기 제 Κ 초기 베스트 코드백터를 제외한 제 1 초기 베스트 코드백터 내지 제 Ν 초기 베스트 코드백터의 합인 것을 특징으로 하는 오디오 신호 처리 방법.
[청구항 12]
제 11 항에 있어서,
상기 선택하는 단계는, 상기 제 Κ 초기 베스트 코드백터에 대한 총 에 러 및 상기 제 Κ 최적 베스트 코드백터에 대한 총 에 러를 근거로 수행되며,
상기 제 Κ 초기 베스트 코드백터에 대한 총 에러는, 상기 제 Κ 제외 합신호 및 상기 제 Κ 초기 베스트 코드백터를 합한 백터와, 상기 제 1 타깃 신호간의 차이 이고,
상기 제 Κ 초기 베스트 코드백터에 대한 총 에러는, 상기 제 Κ 제외 합신호 및 제 Κ 초기 베스트 코드백터를 합한 백터와 상기 제 1 타깃 신호간의 차이인 것을 특징으로 하는 오디오 신호 처리 방법 .
[청구항 13]
제 11 항에 있어서,
상기 제 1 단계 내지 상기 Ν 단계 증에서 인덱스를 갱신할 Κ
+a(a 는 정수) 단계를 결정하는 단계; 및, 상기 K+a 단계에 대해서, 상기 갱신하는 단계, 상기 결정하는 단계, 및 상기 선택하는 단계를 반복하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법 .
[청구항 14]
제 13 항에 있어서,
상기 K+a 단계를 결정하는 단계 및 상기 반복하는 단계는, 상기 제 K 최적 베스트 코드백터가 상기 제 K 최종 베스트 코드백터로 결정된 경우, 수행되는 것을 특징으로 하는 오디오 신호 처리 방법 .
[청구항 15]
오디오 신호의 현재 프레임에 대해서 선형 -예측 분석을 수행함으로써 , 복수의 선형 -예측 변환 계수들을 근거로 하여 제 1 타깃 신호를 생성하는 선형 예측부;
상기 제 1 타깃 신호를 근거로, 총 N 단계에 대해 백터-양자화를 수행하는 초기 양자화부; 상기 초기 양자화부는,
상기 제 1 타깃 신호를 근거로, 가장 에 러가 작은 제 1 초기 베스트 코드백터를 포함하는 제 1 후보 코드백터들을 생성하고, 상기 제 1 초기 베스트 코드백터에 대웅하는 제 1 초기 베스트 에 러를 제 2 단계 타깃 신호인 제 2 타깃 신호로 출력함으로싸, 제 1 단계에 대한 백터-양자화를 수행하는 제 1 초기 양자화부; 및
상기 제 i 타깃 신호 (i=2,..., N)를 근거로, 상기 백터- 양자화를 수행하는 상기 제 i 초기 양자화부를 포함하고, 상기 제 1 단계 내지 상기 제 N 단계 중에서 인덱스를 갱신할 K
(K=1, ..., N)단계를 결정하는 갱신제어부;
상기 제 1 타깃 신호 및, 제 K 제외 합신호를 이용하여, 상기 제 K 타깃 신호를 수정하는 제 K 단계 타깃신호 수정부;
상기 수정된 제 K 타깃 신호를 근거로 하여, 제 K 후보 코드백터들 중에서 제 K 최적 베스트 코드백터를 결정하는 재탐색부; 및,
제 K 초기 베스트 코드백터 및 상기 제 K 최적 베스트 코드백터 중 하나를 제 K 최종 베스트 코드백터로 선택하는 갱신결정부를 포함하고, 상기 제 K 제외 합신호는, 상기 제 K 초기 베스트 코드백터를 제외한 제 1 초기 베스트 코드백터 내지 제 N 초기 베스트 코드백터의 합인 것을 특징으로 하는 오디오 신호 처리 장치 .
PCT/KR2011/002487 2010-04-08 2011-04-08 오디오 신호 처리 방법 및 장치 WO2011126340A2 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201180026076.6A CN102906812B (zh) 2010-04-08 2011-04-08 处理音频信号的方法和装置
EP11766191.8A EP2557566B8 (en) 2010-04-08 2011-04-08 Method and apparatus for processing an audio signal
US13/640,042 US9153238B2 (en) 2010-04-08 2011-04-08 Method and apparatus for processing an audio signal

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US32188210P 2010-04-08 2010-04-08
US32188110P 2010-04-08 2010-04-08
US61/321,881 2010-04-08
US61/321,882 2010-04-08
KR10-2010-0086488 2010-09-03
KR10-2010-0086489 2010-09-03
KR1020100086489A KR20110113124A (ko) 2010-04-08 2010-09-03 오디오 신호 처리 방법 및 장치
KR1020100086488A KR20110113123A (ko) 2010-04-08 2010-09-03 오디오 신호 처리 방법 및 장치

Publications (2)

Publication Number Publication Date
WO2011126340A2 true WO2011126340A2 (ko) 2011-10-13
WO2011126340A3 WO2011126340A3 (ko) 2011-12-15

Family

ID=47577493

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2011/002487 WO2011126340A2 (ko) 2010-04-08 2011-04-08 오디오 신호 처리 방법 및 장치

Country Status (4)

Country Link
US (1) US9153238B2 (ko)
EP (1) EP2557566B8 (ko)
CN (1) CN102906812B (ko)
WO (1) WO2011126340A2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107371021A (zh) * 2011-12-28 2017-11-21 Jvc 建伍株式会社 动图像编码装置、动图像编码方法以及存储介质
CN107707912A (zh) * 2011-12-28 2018-02-16 Jvc 建伍株式会社 动图像编码装置以及动图像编码方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2013111526A (ru) 2010-09-17 2014-10-27 Панасоник Корпорэйшн Устройство квантования и способ квантования
US20160133266A1 (en) * 2013-06-17 2016-05-12 Dolby Laboratories Licensing Corporation Multi-Stage Quantization of Parameter Vectors from Disparate Signal Dimensions
US10515646B2 (en) 2014-03-28 2019-12-24 Samsung Electronics Co., Ltd. Method and device for quantization of linear prediction coefficient and method and device for inverse quantization
CN112927703A (zh) * 2014-05-07 2021-06-08 三星电子株式会社 对线性预测系数量化的方法和装置及解量化的方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5271089A (en) * 1990-11-02 1993-12-14 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
JP2624130B2 (ja) * 1993-07-29 1997-06-25 日本電気株式会社 音声符号化方式
US5774839A (en) * 1995-09-29 1998-06-30 Rockwell International Corporation Delayed decision switched prediction multi-stage LSF vector quantization
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JP3707154B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 音声符号化方法及び装置
KR100872538B1 (ko) 2000-11-30 2008-12-08 파나소닉 주식회사 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, lpc 계수의 복호화 장치, 기록 매체,음성 부호화 장치, 음성 복호화 장치, 음성 신호 송신장치, 및 음성 신호 수신 장치
KR100709376B1 (ko) 2001-07-05 2007-04-20 삼성전자주식회사 고속 벡터 양자 부호화를 위한 탐색 장치 및 방법
KR100492965B1 (ko) 2002-09-27 2005-06-07 삼성전자주식회사 벡터 양자화를 위한 고속 탐색방법
US7933770B2 (en) * 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
RU2013111526A (ru) * 2010-09-17 2014-10-27 Панасоник Корпорэйшн Устройство квантования и способ квантования

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
None

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107371021A (zh) * 2011-12-28 2017-11-21 Jvc 建伍株式会社 动图像编码装置、动图像编码方法以及存储介质
CN107707912A (zh) * 2011-12-28 2018-02-16 Jvc 建伍株式会社 动图像编码装置以及动图像编码方法
CN107888913A (zh) * 2011-12-28 2018-04-06 Jvc 建伍株式会社 动图像解码装置以及动图像解码方法
CN107888914A (zh) * 2011-12-28 2018-04-06 Jvc 建伍株式会社 动图像编码装置以及动图像编码方法
CN107371021B (zh) * 2011-12-28 2020-01-24 Jvc 建伍株式会社 动图像编码装置、动图像编码方法以及存储介质
CN107888913B (zh) * 2011-12-28 2020-05-22 Jvc 建伍株式会社 动图像解码装置以及动图像解码方法
CN107888914B (zh) * 2011-12-28 2020-05-22 Jvc 建伍株式会社 动图像编码装置以及动图像编码方法
CN107707912B (zh) * 2011-12-28 2020-05-22 Jvc 建伍株式会社 动图像编码装置以及动图像编码方法

Also Published As

Publication number Publication date
CN102906812B (zh) 2016-08-10
EP2557566B8 (en) 2018-09-19
WO2011126340A3 (ko) 2011-12-15
US9153238B2 (en) 2015-10-06
EP2557566B1 (en) 2018-06-27
EP2557566A2 (en) 2013-02-13
US20130103407A1 (en) 2013-04-25
EP2557566A4 (en) 2013-09-11
CN102906812A (zh) 2013-01-30

Similar Documents

Publication Publication Date Title
AU2006270259B2 (en) Selectively using multiple entropy models in adaptive coding and decoding
CN107359880B (zh) 编码方法、编码装置以及记录介质
WO2011126340A2 (ko) 오디오 신호 처리 방법 및 장치
US11817107B2 (en) Phase reconstruction in a speech decoder
US20110305272A1 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
KR20240022588A (ko) 신경망 및 벡터 양자화기를 사용하여 오디오 파형 압축
WO2009090875A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US8576910B2 (en) Parameter selection method, parameter selection apparatus, program, and recording medium
WO2008067766A1 (fr) Procédé et dispositif de quantification d'un vecteur
CN110491398B (zh) 编码方法、编码装置以及记录介质
US10847172B2 (en) Phase quantization in a speech encoder
CA2803273A1 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
CA2803276A1 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
RU2665287C2 (ru) Кодер звукового сигнала
WO2011087333A2 (ko) 오디오 신호 처리 방법 및 장치
CN105122358A (zh) 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法
RU2769429C2 (ru) Кодер звукового сигнала
JP5734519B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
CN117616498A (zh) 使用神经网络和向量量化器压缩音频波形
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP2013055417A (ja) 量子化装置及び量子化方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180026076.6

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11766191

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2011766191

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13640042

Country of ref document: US