KR101393299B1 - Method and apparatus for encoding an audio data - Google Patents

Method and apparatus for encoding an audio data Download PDF

Info

Publication number
KR101393299B1
KR101393299B1 KR1020070060997A KR20070060997A KR101393299B1 KR 101393299 B1 KR101393299 B1 KR 101393299B1 KR 1020070060997 A KR1020070060997 A KR 1020070060997A KR 20070060997 A KR20070060997 A KR 20070060997A KR 101393299 B1 KR101393299 B1 KR 101393299B1
Authority
KR
South Korea
Prior art keywords
scale factor
audio data
value
band
encoding
Prior art date
Application number
KR1020070060997A
Other languages
Korean (ko)
Other versions
KR20070121568A (en
Inventor
김미영
이시화
김도형
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US11/766,499 priority Critical patent/US7974848B2/en
Publication of KR20070121568A publication Critical patent/KR20070121568A/en
Application granted granted Critical
Publication of KR101393299B1 publication Critical patent/KR101393299B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Abstract

본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 그 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하고, 그 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 대역별 스케일팩터의 최종값을 결정하고, 그 오디오 데이터를 그 주파수 대역들의 그 결정된 최종값들을 고려하여 양자화하고, 양자화된 그 오디오 데이터를 부호화함으로써, 그 오디오 데이터의 부호화를 보다 신속히 완료하는 효과, 보다 구체적으로는, 그 오디오 데이터의 양자화를 보다 신속히 완료하는 효과를 갖는다.The method and apparatus for encoding audio data according to the present invention determine an initial value of a scale factor for each frequency band of audio data in consideration of a quantization error and a maximum allowable distortion degree of each frequency band, For each of the bands, the determined initial value is compared with a preset full-band scale factor value, the final value of the band-specific scale factor is determined in consideration of the compared result, and the audio data is converted into its determined final values And encoding the quantized audio data, thereby achieving the effect of completing the encoding of the audio data more quickly, more specifically, completing the quantization of the audio data more quickly.

Description

오디오 데이터 부호화 방법 및 장치{Method and apparatus for encoding an audio data}[0001] The present invention relates to a method and apparatus for encoding audio data,

도 1은 본 발명에 의한 오디오 데이터 부호화 장치를 설명하기 위한 블록도이다.1 is a block diagram for explaining an audio data encoding apparatus according to the present invention.

도 2는 도 1에 도시된 비트율 결정부(130)에 대한 바람직한 일 실시예의 블록도이다.FIG. 2 is a block diagram of a preferred embodiment of the bit rate determination unit 130 shown in FIG.

도 3은 본 발명에 의한 오디오 데이터 부호화 방법을 설명하기 위한 플로우챠트이다.3 is a flowchart illustrating an audio data encoding method according to the present invention.

본 발명은 오디오 데이터의 압축에 관한 것으로, 특히, 비트율(bit rate)을 조절할 수 있는 오디오 데이터 부호화 방법 및 장치에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to compression of audio data, and more particularly, to a method and apparatus for encoding audio data capable of adjusting a bit rate.

오디오 데이터를 부호화하는 과정은, 시간 영역의 오디오 데이터를 주파수 영역의 오디오 데이터로 변환하는 변환 과정, 사람의 청각 특성을 반영하여 주파수 대역별로 최대허용가능 왜곡도를 계산하는 계산 과정, 주파수 대역별로 계산된 최대허용가능 왜곡도를 고려하여 주파수 영역의 오디오 데이터를 양자화하는 양자화 과정, 양자화된 오디오 데이터에 대해 무손실 부호화를 수행하는 코딩 과정을 포함한다.The process of encoding the audio data includes a conversion process of converting the audio data in the time domain into the audio data in the frequency domain, a calculation process of calculating the maximum allowable distortion degree in each frequency band by reflecting the human auditory characteristics, A quantization step of quantizing the audio data in the frequency domain in consideration of the maximum allowable distortion degree, and a coding step of performing lossless coding on the quantized audio data.

한편, 오디오 데이터를 부호화하는 과정의 세부 과정들 중, 오디오 데이터를 부호화하는데 소요되는 시간의 대부분을 차지하는 과정은, 양자화 과정이다. 이에 따라, 오디오 데이터의 부호화를 보다 신속히 완료하기 위한 방안으로서, 양자화 과정을 보다 신속히 완료하기 위한 방안이 절실히 요구되고 있다.Meanwhile, among the detailed processes of the process of encoding audio data, a process that takes most of the time required for encoding audio data is a quantization process. Accordingly, as a method for completing encoding of audio data more quickly, there is a desperate need for a method for completing a quantization process more quickly.

본 발명이 이루고자 하는 기술적 과제는, 오디오 데이터의 부호화를 보다 신속히 완료하는, 보다 구체적으로는, 그 오디오 데이터의 양자화를 보다 신속히 완료하는 오디오 데이터 부호화 방법을 제공하는 데 있다.An object of the present invention is to provide an audio data encoding method for completing encoding of audio data more quickly, more specifically, for completing quantization of the audio data more quickly.

본 발명이 이루고자 하는 다른 기술적 과제는, 오디오 데이터의 부호화를 보다 신속히 완료하는, 보다 구체적으로는, 그 오디오 데이터의 양자화를 보다 신속히 완료하는 오디오 데이터 부호화 장치를 제공하는 데 있다.It is another object of the present invention to provide an audio data encoding apparatus for completing encoding of audio data more quickly and more specifically completing quantization of the audio data more quickly.

본 발명이 이루고자 하는 또 다른 기술적 과제는, 컴퓨터가 오디오 데이터의 부호화를 보다 신속히 완료하도록 하는, 보다 구체적으로는, 컴퓨터가 그 오디오 데이터의 양자화를 보다 신속히 완료하도록 하는 컴퓨터 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.It is another object of the present invention to provide a computer readable medium storing a computer program for causing a computer to complete the encoding of audio data more quickly and more particularly to allow a computer to complete the quantization of the audio data more quickly. And to provide a recording medium on which the recording medium can be recorded.

상기 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 부호화 방법은, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 단계; 상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최종값을 결정하는 단계; 상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 단계; 및 양자화된 상기 오디오 데이터를 부호화하는 단계를 포함하는 것이 바람직하다.According to another aspect of the present invention, there is provided a method for encoding audio data according to the present invention, comprising the steps of: determining an initial value of a scale factor of each frequency band of audio data by considering a quantization error and a maximum allowable distortion degree of each frequency band; ; For each of the frequency bands, comparing the determined initial value with a value of a predetermined full-scale scale factor and determining a final value of the band-specific scale factor in consideration of the comparison result; Quantizing the audio data in consideration of the determined final values of the frequency bands; And encoding the quantized audio data.

상기 다른 과제를 이루기 위해, 본 발명에 의한 오디오 데이터 부호화 장치는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 제1 스케일팩터 결정부; 상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최종값을 결정하는 제2 스케일팩터 결정부; 상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 양자화부; 및 양자화된 상기 오디오 데이터를 부호화하는 무손실 부호화부를 포함하는 것이 바람직하다.According to another aspect of the present invention, there is provided an apparatus for encoding audio data according to the present invention, wherein an initial value of a scale factor for each band of frequency bands of audio data is calculated by considering a quantization error and a maximum allowable distortion degree of each of the frequency bands A first scale factor determining unit for determining the first scale factor; A second scale factor determining unit for comparing the determined initial value with a preset value of a full-scale scale factor for each of the frequency bands and determining a final value of the band-specific scale factor in consideration of the comparison result; A quantizer for quantizing the audio data in consideration of the determined final values of the frequency bands; And a lossless encoding unit for encoding the quantized audio data.

상기 또 다른 과제를 이루기 위해, 본 발명에 의한 컴퓨터로 읽을 수 있는 기록매체는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 단계; 상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최 종값을 결정하는 단계; 상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 단계; 및 양자화된 상기 오디오 데이터를 부호화하는 단계를 컴퓨터에서 실행시키기 위한 컴퓨터 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.According to another aspect of the present invention, there is provided a computer-readable recording medium for recording an initial value of a scale factor of each frequency band of audio data into a quantization error of each of the frequency bands and a maximum permissible distortion Determining in consideration of the degree; For each of the frequency bands, comparing the determined initial value with a preset full-band scale factor value and determining a final value of the band-specific scale factor in consideration of the compared result; Quantizing the audio data in consideration of the determined final values of the frequency bands; And a computer-readable recording medium storing a computer program for causing a computer to execute the steps of encoding quantized audio data.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 그 첨부 도면을 설명하는 내용을 참조하여야만 한다.For a better understanding of the present invention, operational advantages of the present invention and the objects achieved by the practice of the present invention, reference should be made to the accompanying drawings which illustrate preferred embodiments of the present invention and to the description of the attached drawings.

이하, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치를 첨부한 도면들을 참조하여 다음과 같이 설명한다.Hereinafter, a method and an apparatus for encoding audio data according to the present invention will be described with reference to the accompanying drawings.

도 1은 본 발명에 의한 오디오 데이터 부호화 장치를 설명하기 위한 블록도로서, 도메인(domain) 변환부(110), 심리음향 모델부(120), 비트율 결정부(130), 및 무손실 부호화부(140)를 포함할 수 있다.FIG. 1 is a block diagram for explaining an audio data encoding apparatus according to the present invention. Referring to FIG. 1, a domain conversion unit 110, a psychoacoustic model unit 120, a bit rate determination unit 130, and a lossless encoding unit 140 ).

도메인 변환부(110)는 입력단자 IN 1을 통해 입력된 시간 영역의 오디오 데이터(예를 들어, PCM(Pulse Code Modulation) 데이터)를 주파수 영역의 오디오 데이터로 변환한다. 이를 위해, 도메인 변환부(110)는 입력단자 IN 1을 통해 입력된 시간 영역의 오디오 데이터에 대해 MDCT(Modified Discrete Cosine Transform)을 수행할 수 있다.The domain converter 110 converts audio data (for example, PCM (Pulse Code Modulation) data) in the time domain input through the input terminal IN 1 into audio data in the frequency domain. To this end, the domain converter 110 may perform Modified Discrete Cosine Transform (MDCT) on the audio data in the time domain input through the input terminal IN 1.

한편, 사람의 청력이 오디오 데이터에 민감하게 반응하는 정도는, 그 오디오 데이터의 주파수 대역들 각각마다 상이한 것이 일반적이다. 이에 따라, 오디오 데이터를 양자화함에 있어, 그 오디오 데이터의 주파수 대역들 각각마다 사람의 청력 이 인식하지 못할 정도의 왜곡을 허용하면서 양자화한다면, 그 오디오 데이터의 부호화된 결과의 비트율은 그와 같은 왜곡을 허용하지 않으면서 그 오디오 데이터를 양자화할 때에 비해 낮아지게 된다.On the other hand, the extent to which the hearing ability of a person is sensitive to audio data is generally different for each frequency band of the audio data. Accordingly, in quantizing the audio data, if the quantization is performed while allowing distortion of a degree that human auditory perception can not recognize for each of the frequency bands of the audio data, the bit rate of the encoded result of the audio data becomes equal to the distortion The audio data is lowered than when the audio data is quantized.

심리음향(psychoacoustic) 모델부(120)는 입력단자 IN 1을 통해 입력된 시간 영역의 오디오 데이터를 주파수 영역의 오디오 데이터로 변환하고, 변환된 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를, 사람의 청각 특성을 고려하여 계산한다. 여기서, 최대허용가능 왜곡도란, 사람의 청력이 인식하지 못할 정도의 왜곡 중 최대 왜곡을 의미한다. The psychoacoustic modeling unit 120 converts the audio data in the time domain inputted through the input terminal IN 1 into audio data in the frequency domain and outputs a maximum permissible distortion degree of each of the frequency bands of the converted audio data , And considering the human auditory characteristics. Here, the maximum allowable distortion refers to the maximum distortion among distortions that the human hearing can not recognize.

비트율 결정부(130)는 도메인 변환부(110)로부터 입력된 오디오 데이터를 양자화한다. 한편, 어떠한 데이터를 양자화하기 위해서는, 그 데이터가 양자화될 경우의 그 양자화된 결과들간의 간격(소위, '양자화 스텝(step) 사이즈(size)')이 결정되어야 한다. The bit rate determining unit 130 quantizes the audio data input from the domain converting unit 110. [ On the other hand, in order to quantize any data, an interval (so-called 'quantization step size') between the quantized results when the data is quantized should be determined.

즉, 비트율 결정부(130)는 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 결정한 뒤, 그 오디오 데이터를 양자화한다. 본 명세서에서, 대역별 스케일팩터란 양자화 스텝 사이즈를 의미하며, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값은 서로 상이할 수 있다. That is, the bitrate determining unit 130 determines the scale factor value of each frequency band of the audio data, and quantizes the audio data. In this specification, the band-specific scale factor means a quantization step size, and the values of the scale factor of each frequency band of audio data may be different from each other.

구체적으로, 비트율 결정부(130)는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 그 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 값으로서 결정할 수 있다. 이 때, 최대허용가능 왜곡도는, 전술한 바와 같이, 심리음향 모델부(120)에서 계산된 값이다. 이 후, 비트율 결정부(130)는, 그 오디오 데이터의 주파수 대역들 각각의 그 결정된 값을, 그 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 그 오디오 데이터를 양자화하기 위한 값으로 조정할 수 있다. 여기서, 최대가용 비트량이란, 오디오 데이터를 부호화하는데 사용될 수 있는 최대 비트수를 의미한다. 이 후, 비트율 결정부(130)는, 그 오디오 데이터를 그 오디오 데이터의 주파수 대역들의 대역별 스케일팩터들의 값들을 고려하여 양자화할 수 있다. 이로써, 오디오 데이터의 부호화된 결과의 비트율은 미리 설정된 어떤 비트율을 만족할 수 있다. 즉, 오디오 데이터의 부호화된 결과의 비트율은 미리 설정된 어떤 비트율을 항상 초과하지 않을 수 있다.Specifically, the bit-rate determining unit 130 determines a scale factor of each of the frequency bands of the audio data, while allowing a level of distortion that does not exceed the maximum allowable distortion degree of each of the frequency bands of the audio data It can be determined as a value for quantizing the audio data. At this time, the maximum permissible distortion degree is a value calculated by the psychoacoustic model unit 120 as described above. Thereafter, the bit rate determination unit 130 determines the determined value of each of the frequency bands of the audio data so that the used bit amount, which is the number of bits required for encoding the audio data, does not exceed the maximum usable bit amount, The data can be adjusted to a value for quantization. Here, the maximum available bit amount means the maximum number of bits that can be used for encoding audio data. Thereafter, the bitrate determining unit 130 may quantize the audio data in consideration of the values of the scale factors of the frequency bands of the audio data. As a result, the bit rate of the encoded result of the audio data can satisfy a predetermined bit rate. That is, the bit rate of the encoded result of the audio data may not always exceed a predetermined bit rate.

무손실 부호화부(140)는 비트율 결정부(130)로부터 입력된 '양자화된 오디오 데이터'에 대해 무손실 부호화(lossless coding)를 수행하고, 무손실 부호화된 결과를 출력단자 OUT 1을 통해 출력한다. 예컨대, 무손실 부호화부(140)는 '양자화된 오디오 데이터'에 대해 엔트로피 부호화(entropy coding)를 수행할 수 있다.The lossless coding unit 140 performs lossless coding on the 'quantized audio data' input from the bitrate decision unit 130 and outputs the result of the lossless coding through the output terminal OUT 1. For example, the lossless coding unit 140 may perform entropy coding on 'quantized audio data'.

도 2는 도 1에 도시된 비트율 결정부(130)에 대한 바람직한 일 실시예의 블록도로서, 제1 스케일팩터 결정부(210), 제2 스케일팩터 결정부(220), 양자화부(230), 사용비트량 계산부(240), 비트량 비교부(250), 및 스케일팩터 갱신부(260)를 포함할 수 있다.FIG. 2 is a block diagram of a preferred embodiment of the bit rate determination unit 130 shown in FIG. 1, which includes a first scale factor determination unit 210, a second scale factor determination unit 220, a quantization unit 230, A used bit amount calculating unit 240, a bit amount comparing unit 250, and a scale factor updating unit 260. [

제1 스케일팩터 결정부(210)는 입력단자 IN 2를 통해 입력된 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 그 주파수 대역들 각각의 양자화 에러(quantization error)와 최대허용가능 왜곡도를 고려하여 결정한다. 여기서, 입력단자 IN 2를 통해 입력된 오디오 데이터는, 도메인 변환부(110)로부터 입력된 오디오 데이터이다.The first scale factor determiner 210 multiplies the initial value of the scale factor of each frequency band of the audio data input through the input terminal IN 2 by the quantization error of each of the frequency bands, It is determined in consideration of distortion degree. Here, the audio data input through the input terminal IN 2 is audio data input from the domain conversion unit 110.

구체적으로, 제1 스케일팩터 결정부(210)는, 오디오 데이터의 어떤 주파수 대역의 대역별 스케일팩터의 초기값을, 그 어떤 주파수 대역의 '양자화 에러'와 '최대허용가능 왜곡도'를 고려하여 결정한다. 여기서, 그 어떤 주파수 대역의 '양자화 에러'란, 그 어떤 주파수 대역의 오디오 데이터가 양자화로 인해 왜곡되는 정도를 의미한다. 이러한 '양자화 에러'의 값은, 제1 스케일팩터 결정부(210)가 오디오 데이터가 양자화된 후에 그 양자화된 결과를 이용하여 계산한 값일 수도 있고, 제1 스케일팩터 결정부(210)가 오디오 데이터가 양자화되었다고 가정한 상태에서 예측한 값일 수도 있다. 한편, 그 어떤 주파수 대역의 '최대허용가능 왜곡도'는, 전술한 바와 같이, 심리음향 모델부(120)에서 계산된 값이다. Specifically, the first scale factor determination unit 210 determines an initial value of a band-specific scale factor of a certain frequency band of the audio data by considering a quantization error and a maximum allowable distortion degree of a certain frequency band . Here, a 'quantization error' of a certain frequency band means a degree to which audio data of a certain frequency band is distorted due to quantization. The value of the 'quantization error' may be a value calculated by using the quantized result after the audio data is quantized by the first scale factor determiner 210, and the first scale factor determiner 210 may calculate the audio data May be a value predicted under the assumption that quantization is performed. On the other hand, the 'maximum permissible distortion degree' of a certain frequency band is a value calculated by the psychoacoustic model unit 120, as described above.

보다 구체적으로, 제1 스케일팩터 결정부(210)는, 어떤 주파수 대역의 '양자화 에러'가 그 어떤 주파수 대역의 '최대허용가능 왜곡도'를 초과하지 않도록 하는 그 어떤 주파수 대역의 대역별 스케일팩터의 가능한 값들 중 최대값을, 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값으로서 결정할 수 있다.More specifically, the first scale factor determination unit 210 determines the scale factor of each frequency band in which the 'quantization error' of a certain frequency band does not exceed the 'maximum allowable distortion degree' May be determined as the initial value of the band-specific scale factor of the certain frequency band.

결국, 제1 스케일팩터 결정부(210)가 어떤 주파수 대역의 대역별 스케일팩터의 초기값을 결정하기 위해서는, 제1 스케일팩터 결정부(210)는 대역별 스케일팩터의 가능한 값들 각각마다, 그 가능한 값에 따른 '양자화 에러'가 그 어떤 주파수 대역의 최대허용가능 왜곡도를 초과하는지의 여부를 검사하여, 그 가능한 값들 중, 그 가능한 값에 따른 '양자화 에러'가 그 어떤 주파수 대역의 최대허용가능 왜곡도를 초과하지 않는다고 검사된 값들을 찾아내고, 그 찾아낸 값들 중 최대값을 찾아내야 한다.As a result, in order for the first scale factor determiner 210 to determine the initial value of the scale factor for each band of a certain frequency band, the first scale factor determiner 210 may determine, for each possible value of the band- It is checked whether or not a 'quantization error' according to a value exceeds a maximum allowable distortion of a certain frequency band so that a 'quantization error' according to the possible values of the possible values exceeds a maximum allowable distortion Find the tested values that do not exceed the degree of distortion, and find the maximum of those values.

한편, 제1 스케일팩터 결정부(210)는, 오디오 데이터의 어떤 주파수 대역의 디폴트(default)로 설정된 값을, '그 어떤 주파수 대역의 대역별 스케일팩터의 디폴트로 설정된 값에 따른 양자화 에러'와 '그 어떤 주파수 대역의 최대허용가능 왜곡도'를 고려하여 조정하고, 조정된 결과를 '그 어떤 주파수 대역의 대역별 스케일팩터의 초기값'으로서 결정할 수도 있다. 이 경우, '그 어떤 주파수 대역의 대역별 스케일팩터의 디폴트로 설정된 값에 따른 양자화 에러'와 '그 어떤 주파수 대역의 최대허용가능 왜곡도'간의 차이가 클수록, '그 어떤 주파수 대역의 대역별 스케일팩터의 디폴트로 설정된 값'과 '그 어떤 주파수 대역의 대역별 스케일팩터의 결정될 값'간의 차이도 크다.On the other hand, the first scale factor determining unit 210 determines a value of a certain frequency band of the audio data as a 'quantization error according to a default value of a scale factor of each frequency band of the frequency band' The maximum permissible distortion of the certain frequency band may be considered and the adjusted result may be determined as the initial value of the scale factor of each band of the certain frequency band. In this case, the larger the difference between the quantization error according to the default value of the scale factors of the band of the certain frequency band and the maximum allowable distortion of the certain frequency band, The difference between the value set to the default of the factor 'and the value to be determined of the scale factors of the band of the certain frequency band' is also large.

제2 스케일팩터 결정부(220)는, 입력단자 IN 2를 통해 입력된 오디오 데이터의 주파수 대역들 각각마다, '그 주파수 대역들 각각의 제1 스케일팩터 결정부(210)에서 결정된 초기값'과 '미리 설정된 전대역 스케일팩터(common scalefactor)의 값'을 비교하고, 비교된 결과를 고려하여 그 주파수 대역들 각각의 대역별 스케일팩터의 최종값을 결정한다. 여기서, 전대역 스케일팩터의 값이란, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값으로서, 그 주파수 대역들 각각의 대역별 스케일팩터의 값이 서로 동일하도록 설정된 값을 의미한다. The second scale factor determiner 220 determines the scale factor of each of the frequency bands of the audio data input through the input terminal IN 2 and the initial value determined by the first scale factor determiner 210 A value of a pre-set common scale factor is compared with each other, and a final value of a scale factor for each of the frequency bands is determined in consideration of the compared result. Here, the value of the full-scale scale factor means a value of a scale factor for each frequency band of audio data, and a value set for each of the frequency bands such that the values of the scale factors for each band are equal to each other.

구체적으로, 제2 스케일팩터 결정부(220)는, 오디오 데이터의 '어떤 주파수 대역의 대역별 스케일팩터의 초기값'과 '그 오디오 데이터에 대해 미리 설정된 전대역 스케일팩터의 값' 중 크지 않은 값을, '그 어떤 주파수 대역의 대역별 스케일팩터의 최종값'으로서 결정할 수 있다. Specifically, the second scale factor determination unit 220 determines a value of the 'initial value of the scale factor for each band of a certain frequency band' and 'a value of the full-band scale factor preset for the audio data' , 'The final value of the scale factor for each band of the certain frequency band'.

즉, 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값이 전대역 스케일팩터의 값보다 크면, 제2 스케일팩터 결정부(220)는 전대역 스케일팩터의 값을 그 어떤 주파수 대역의 대역별 스케일팩터의 최종값으로서 결정한다. 또한, 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값이 전대역 스케일팩터의 값보다 작으면, 제2 스케일팩터 결정부(220)는 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값을 그 어떤 주파수 대역의 대역별 스케일팩터의 최종값으로서 결정한다. 다만, 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값이 전대역 스케일팩터의 값과 동일하다면, 제2 스케일팩터 결정부(220)는 그 어떤 주파수 대역의 대역별 스케일팩터의 초기값, 즉, 전대역 스케일팩터의 값을, 그 어떤 주파수 대역의 대역별 스케일팩터의 최종값으로서 결정한다.That is, if the initial value of the scale factor of each frequency band is larger than the value of the full-band scale factor, the second scale factor determiner 220 multiplies the value of the full-band scale factor by the final value of the band- Value. If the initial value of the scale factor for each frequency band is smaller than the value of the full-band scale factor, the second scale factor determiner 220 multiplies the initial value of the scale factor of that frequency band by a certain frequency As a final value of a scale factor for each band of the band. However, if the initial value of the scale factor for each frequency band is the same as the value of the full-band scale factor, the second scale factor determiner 220 determines the initial value of the scale factor for each frequency band, The value of the scale factor is determined as the final value of the band-specific scale factor of the certain frequency band.

이러한 제1 스케일팩터 결정부(210) 및 제2 스케일팩터 결정부(220)의 동작은, 비트율 결정부(130)가, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 그 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 값으로서 결정하는 동작이다. The operation of the first scale factor determiner 210 and the second scale factor determiner 220 may be such that the bit rate determining unit 130 converts the value of the scale factor of each frequency band of the audio data into the audio data As a value for quantizing the audio data while allowing a level of distortion that does not exceed the maximum allowable distortion degree of each of the frequency bands of the audio signal.

앞서 언급한 바와 같이, 제2 스케일팩터 결정부(220)는 어떤 주파수 대역의 대역별 스케일팩터의 초기값과 미리 설정된 전대역 스케일팩터의 값을 단순히 비교 하기만 하면, 그 어떤 주파수 대역의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 어떤 주파수 대역의 오디오 데이터를 양자화하기 위한 대역별 스케일팩터의 값을 결정할 수 있다. 즉, 제2 스케일팩터 결정부(220)는 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 최종값을 신속히 결정할 수 있다.As described above, the second scale factor determiner 220 can simply determine the maximum allowable frequency band of a certain frequency band by simply comparing the initial value of the scale factor of each frequency band with the preset value of the full-band scale factor It is possible to determine the value of the band-specific scale factor for quantizing the audio data of the certain frequency band while allowing distortion at a level not exceeding the degree of distortion. That is, the second scale factor determiner 220 can quickly determine the final value of the scale factor of each frequency band of the audio data.

양자화부(230)는 입력단자 IN 2를 통해 입력된 오디오 데이터를 그 오디오 데이터의 모든 주파수 대역들의 대역별 스케일팩터들의 최종값들을 고려하여 양자화한다.The quantization unit 230 quantizes the audio data inputted through the input terminal IN 2 in consideration of the final values of the band-specific scale factors of all the frequency bands of the audio data.

사용비트량 계산부(240)는 입력단자 IN 2를 통해 입력된 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량을, 양자화부(230)로부터 입력된 '양자화된 오디오 데이터'를 고려하여 계산한다. The used bit amount calculation unit 240 calculates the used bit amount, which is the number of bits required for encoding the audio data input through the input terminal IN 2, in consideration of the 'quantized audio data' input from the quantization unit 230 do.

비트량 비교부(250)는 사용비트량 계산부(240)에서 계산된 사용 비트량과 '미리 설정된 최대가용 비트량'을 비교한다. 구체적으로, 비트량 비교부(250)는 그 계산된 사용 비트량이 최대가용 비트량을 초과하는지 검사한다. The bit amount comparing unit 250 compares the used bit amount calculated by the used bit amount calculating unit 240 with the 'maximum available bit amount' preset. Specifically, the bit amount comparing unit 250 checks whether the calculated used bit amount exceeds the maximum usable bit amount.

만일, 그 계산된 사용 비트량이 최대가용 비트량을 초과한다고 검사되면, 비트량 비교부(250)는 스케일팩터 갱신부(260)의 동작을 지시한다. 이 경우, 스케일팩터 갱신부(260)는 전대역 스케일팩터의 값을 갱신한다. 구체적으로, 스케일팩터 갱신부(260)는 전대역 스케일팩터의 값을 일정 수치만큼 증가시킨다. 이 후, 스케일팩터 갱신부(260)는 제어신호를 생성하고 생성된 제어신호를 제2 스케일팩터 결정부(220)로 출력한다. 이 경우, 제2 스케일팩터 결정부(220)는 제어신호에 응답하 여 동작함으로써, 재동작하게 된다.If it is determined that the calculated used bit amount exceeds the maximum available bit amount, the bit amount comparing unit 250 instructs the operation of the scale factor updating unit 260. [ In this case, the scale factor updating unit 260 updates the value of the full-scale scale factor. More specifically, the scale factor updating unit 260 increases the value of the full-scale scale factor by a predetermined value. After that, the scale factor updating unit 260 generates a control signal and outputs the generated control signal to the second scale factor determiner 220. [ In this case, the second scale factor determination unit 220 operates in response to the control signal, and thereby operates again.

그에 반해, 그 계산된 사용 비트량이 최대가용 비트량을 초과하지 않는다고 검사되면, 양자화부(230)는 가장 최근에 양자화된 결과를 출력단자 OUT 2를 통해 무손실 부호화부(140)로 출력한다.On the other hand, if it is determined that the calculated used bit amount does not exceed the maximum available bit amount, the quantization unit 230 outputs the most recently quantized result to the lossless coding unit 140 through the output terminal OUT 2.

이러한 사용비트량 계산부(240) 내지 스케일팩터 갱신부(260)의 동작은, 비트율 결정부(130)가, 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위해 결정된 '그 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값'을, 그 오디오 데이터의 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 그 오디오 데이터를 양자화하기 위한 값으로 조정하는 동작이다.The operations of the used bit amount calculating unit 240 to the scale factor updating unit 260 are the same as those of the used bit amount calculating unit 240 to the bit rate determining unit 130 except that the bit rate determining unit 130 determines a degree of distortion that does not exceed the maximum allowable distortion degree of each frequency band of audio data Quot; scale factor value of each frequency band of the audio data " decided to quantize the audio data while quantizing the audio data while making the used bit amount of the audio data not exceed the maximum usable bit amount To a value to be set.

도 3은 본 발명에 의한 오디오 데이터 부호화 방법을 설명하기 위한 플로우챠트로서, 오디오 데이터를, 그 오디오 데이터의 주파수 대역들 각각마다 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서도, 그 오디오 데이터의 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 양자화하는 단계(제310~ 제324 단계들) 및 그 양자화된 결과에 대해 무손실 부호화를 수행하는 단계들(제326 단계)을 포함할 수 있다.FIG. 3 is a flowchart for explaining a method of encoding audio data according to the present invention. FIG. 3 is a flowchart illustrating a method of encoding audio data according to an embodiment of the present invention. Referring to FIG. 3, (Steps 310 to 324) quantizing the amount of data to be used so that the used bit amount does not exceed the maximum usable bit amount, and performing lossless coding on the quantized result (step 326) .

제1 스케일팩터 결정부(210)는 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 그 주파수 대역들 각각의 '양자화 에러' 및 '최대허용가능 왜곡도'를 고려하여 결정한다(제310 단계).The first scale factor determiner 210 determines an initial value of a band-specific scale factor of each frequency band of the audio data in consideration of a 'quantization error' and a 'maximum allowable distortion degree' of each of the frequency bands Step 310).

제310 단계 후에, 제2 스케일팩터 결정부(220)는 오디오 데이터의 어떤 주파 수 대역에 대해 제310 단계에서 결정된 초기값이 전대역 스케일팩터의 값보다 작은지 판단한다(제312 단계).After operation 310, the second scale factor determination unit 220 determines whether the initial value determined in operation 310 is smaller than the value of the full-scale scale factor for the frequency band of the audio data in operation 312.

만일, 제312 단계에서 그 어떤 주파수 대역에 대해 제310 단계에서 결정된 초기값이 전대역 스케일팩터의 값보다 작다고 판단되면, 제2 스케일팩터 결정부(220)는 제310 단계에서 결정된 초기값을 그 어떤 주파수 대역에서의 대역별 스케일팩터의 최종값으로서 결정한다(제314 단계).If it is determined in operation 312 that the initial value determined in operation 310 is smaller than the value of the full-scale scale factor, the second scale factor determiner 220 may determine the initial value determined in operation 310 as As a final value of a scale factor for each band in the frequency band (Step 314).

그에 반해, 제312 단계에서 그 어떤 주파수 대역에 대해 제310 단계에서 결정된 초기값이 전대역 스케일팩터의 값보다 작지 않다고 판단되면, 제2 스케일팩터 결정부(220)는 전대역 스케일팩터의 값을 그 어떤 주파수 대역에서의 대역별 스케일팩터의 최종값으로서 결정한다(제316 단계).On the other hand, if it is determined in operation 312 that the initial value determined in operation 310 is not smaller than the value of the full-band scale factor for the certain frequency band, the second scale factor determiner 220 determines the value of the full- Is determined as the final value of the scale factor for each band in the frequency band (operation 316).

제314 단계 또는 제316 단계 후에, 제2 스케일팩터 결정부(220)는 제312 단계가 모든 주파수 대역들에 대해 수행되었는가 판단한다(제318 단계). After step 314 or 316, the second scale factor determiner 220 determines whether step 312 is performed for all frequency bands (step 318).

이 경우, 오디오 데이터의 주파수 대역들 중 제312 단계가 수행되지 않은 주파수 대역이 존재한다고 판단되면(제318 단계), 제312 단계로 진행한다. 이에 따라, 제312 단계가 수행되지 않은 주파수 대역에 대해, 제312 단계와 제314 단계 또는, 제312 단계와 제316 단계가 수행된다.In this case, if it is determined that a frequency band in which audio data is not performed in step 312 is present (step 318), the method proceeds to step 312. Accordingly, steps 312 and 314, 312 and 316 are performed for the frequency band where step 312 is not performed.

반면, 오디오 데이터의 주파수 대역들 중 제312 단계가 수행되지 않은 주파수 대역이 존재하지 않는다고 판단되면(제318 단계), 양자화부(230)는 오디오 데이터를 그 오디오 데이터의 주파수 대역들의 대역별 스케일팩터들의 최종값들을 고려하여 양자화한다(제320 단계).On the other hand, if it is determined that the frequency band in which audio data is not performed in step 312 is not present (step 318), the quantization unit 230 converts the audio data into a band-specific scale factor (Step 320).

제320 단계 후에, 사용비트량 계산부(240)는 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량을, 그 오디오 데이터의 제320 단계에서 가장 최근에 양자화된 결과를 고려하여 계산한다(제322 단계). After operation 320, the used bit amount calculation unit 240 calculates the used bit amount, which is the number of bits required for encoding the audio data, in consideration of the most recently quantized result of the audio data in operation 320 322).

제322 단계 후에, 비트량 비교부(250)는 제322 단계에서 계산된 사용 비트량이 최대가용 비트량보다 큰가 판단한다(제324 단계). After operation 322, the bit rate comparator 250 determines whether the used bit rate calculated in operation 322 is greater than the maximum available bit rate (operation 324).

이 경우, 제322 단계에서 계산된 사용 비트량이 최대가용 비트량보다 크다고 판단되면(제324 단계), 스케일팩터 갱신부(260)는 전대역 스케일팩터의 값을 갱신하고(제326 단계), 제312 단계로 진행한다.In this case, if it is determined that the used bit amount calculated in operation 322 is larger than the maximum usable bit amount (operation 324), the scale factor updating unit 260 updates the value of the full-scale scale factor (operation 326) .

반면, 제322 단계에서 계산된 사용 비트량이 최대가용 비트량보다 크지 않다고 판단되면(제324 단계), 무손실 부호화부(140)는 그 오디오 데이터의 제320 단계에서 가장 최근에 양자화된 결과에 대해 무손실 부호화를 수행한다(제328 단계).On the other hand, if it is determined that the used bit amount calculated in operation 322 is not larger than the maximum available bit size (operation 324), the lossless coding unit 140 performs lossless coding on the most recently quantized result in operation 320 of the audio data Encoding is performed (operation 328).

이상에서 언급된 본 발명에 의한 오디오 데이터 부호화 방법을 컴퓨터에서 실행시키기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록매체에 저장될 수 있다. 여기서, 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬(ROM), 플로피 디스크, 하드 디스크 등), 및 광학적 판독 매체(예를 들면, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc))와 같은 저장매체를 포함한다.The program for causing the computer to execute the audio data encoding method according to the present invention may be stored in a computer-readable recording medium. The computer readable recording medium may be a magnetic storage medium such as a ROM, a floppy disk, a hard disk, and the like, and an optical reading medium such as a CD-ROM, a DVD, (Digital Versatile Disc)).

이제까지 본 발명을 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로, 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점들은 본 발명에 포함된 것으로 해석되어야 할 것이다.The present invention has been described above with reference to preferred embodiments. It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. Therefore, the disclosed embodiments should be considered in an illustrative rather than a restrictive sense. The scope of the present invention is defined by the appended claims rather than by the foregoing description, and all differences within the scope of equivalents thereof should be construed as being included in the present invention.

이상에서 설명한 바와 같이, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 주파수 대역들 각각마다, 대역별 스케일팩터의 초기값과 미리 설정된 전대역 스케일팩터의 값을 단순히 비교하기만 하면, 그 주파수 대역들 각각마다, 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 대역별 스케일팩터의 값을 결정할 수 있으므로, 그 주파수 대역들 각각의 대역별 스케일팩터의 값을 신속히 결정하는 효과를 갖는다. 이에 따라, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 부호화를 보다 신속히 완료하는 효과, 보다 구체적으로는, 그 오디오 데이터의 양자화를 보다 신속히 완료하는 효과를 갖는다.As described above, in the method and apparatus for encoding audio data according to the present invention, simply by comparing the initial value of the scale factor for each frequency band of the audio data with the value of the preset full-band scale factor, It is possible to determine the value of a band-specific scale factor for quantizing the audio data while allowing a distortion not exceeding the maximum allowable distortion degree for each of the frequency bands, It has the effect of quickly determining the value. Accordingly, the method and apparatus for encoding audio data according to the present invention have the effect of completing encoding of audio data more quickly, more specifically, completing the quantization of the audio data more quickly.

한편, 종래의 오디오 데이터 부호화 장치는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값이 서로 동일하다고 가정하고, 그 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 그 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 그 오디오 데이터를 양자화하기 위한 값으로서 결정한다. 이 후, 종래의 오디오 데이터 부호화 장치는, 그 오디오 데이터의 주파수 대역들 각각의 그 결정된 값을, 그 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 값으로 조정한다. 여기서, 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도가 서로 다를 수 있음은 이미 전술한 바이다. 이 후, 종래의 오디오 데이터 부호화 장치는, 그 오디오 데이터를 그 오디오 데이터의 주파수 대역들의 대역별 스케일팩터들의 값들을 고려하여 양자화한다. 결국, 종래의 오디오 데이터 부호화 장치에 의해 오디오 데이터를 부호화하면, 오디오 데이터의 부호화된 결과의 비트율이 미리 설정된 어떤 비트율(예를 들어, 오디오 데이터 부호화 장치의 사용자가 당초 원했던 비트율)을 초과할 수 있다.In the conventional audio data encoding apparatus, assuming that the values of scale factors of respective frequency bands of audio data are equal to each other, the value of a scale factor of each frequency band of the audio data is divided into audio data As a value for quantizing the audio data while making the amount of used bits, which is the number of bits required for encoding, not exceed the maximum usable bit amount. Thereafter, the conventional audio data coding apparatus decodes the determined value of each of the frequency bands of the audio data, while allowing a level of distortion that does not exceed the maximum allowable distortion degree of each of the frequency bands of the audio data. The audio data is adjusted to a value for quantization. Here, it is already described that the maximum allowable distortion degree of each of the frequency bands of the audio data may be different from each other. Thereafter, the conventional audio data encoding apparatus quantizes the audio data in consideration of the values of the scale factors of the frequency bands of the audio data. As a result, when the audio data is encoded by the conventional audio data encoding apparatus, the bit rate of the encoded result of the audio data may exceed a predetermined bit rate (for example, the bit rate originally desired by the user of the audio data encoding apparatus) .

그에 반해, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 값을 그 오디오 데이터의 주파수 대역들 각각의 최대허용가능 왜곡도를 초과하지 않는 수준의 왜곡을 허용하면서 그 오디오 데이터를 양자화하기 위한 값으로서 결정한다. 이 후, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 그 오디오 데이터의 주파수 대역들 각각의 그 결정된 값을, 그 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량이 최대가용 비트량을 초과하지 않도록 하면서 그 오디오 데이터를 양자화하기 위한 값으로 조정한다. 이 후, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 그 오디오 데이터를 그 오디오 데이터의 주파수 대역들의 대역별 스케일팩터들의 값들을 고려하여 양자화한다. 결국, 본 발명에 의한 오디오 데이터 부호화 방법 및 장치는, 오디오 데이터의 부호화된 결과의 비트율이 미리 설정된 어떤 비트율 (예를 들어, 오디오 데이터 부호화 장치의 사용자가 당초 원했던 비트율)을 항상 초과하지 않음을 보장하는 효과를 갖는다.On the other hand, the method and apparatus for encoding audio data according to the present invention is characterized in that the value of a scale factor of each frequency band of audio data is set to a level that does not exceed the maximum allowable distortion degree of each frequency band of the audio data As a value for quantizing the audio data while allowing distortion. Thereafter, the method and apparatus for encoding audio data according to the present invention determine whether the determined value of each of the frequency bands of the audio data exceeds a maximum available bit amount that is the number of bits required for encoding the audio data And adjusts the audio data to a value for quantization. Thereafter, the audio data encoding method and apparatus according to the present invention quantizes the audio data in consideration of the values of the scale factors of the frequency bands of the audio data. As a result, the audio data encoding method and apparatus according to the present invention ensures that the bit rate of the encoded result of the audio data does not always exceed a predetermined bit rate (for example, the bit rate originally desired by the user of the audio data encoding apparatus) .

Claims (13)

(a) 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 단계;(a) determining an initial value of a scale factor for each frequency band of audio data in consideration of a quantization error and a maximum allowable distortion degree of each of the frequency bands; (b) 상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최종값을 결정하는 단계;(b) comparing the determined initial value with a preset full-band scale factor value for each of the frequency bands and determining a final value of the band-specific scale factor in consideration of the compared result; (c) 상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 단계; 및(c) quantizing the audio data in consideration of the determined final values of the frequency bands; And (d) 양자화된 상기 오디오 데이터를 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오 데이터 부호화 방법.and (d) encoding the quantized audio data. 제1 항에 있어서, 상기 (a) 단계는The method of claim 1, wherein step (a) 상기 양자화 에러가 상기 최대허용가능 왜곡도를 초과하지 않도록 하는 상기 대역별 스케일팩터의 값들 중 최대값을 상기 대역별 스케일팩터의 초기값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 방법.The scale factor determining unit determines the maximum value among the values of the band-specific scale factors so that the quantization error does not exceed the maximum allowable distortion degree as an initial value of the band-specific scale factor. 제1 항에 있어서, 상기 (a) 단계는The method of claim 1, wherein step (a) 상기 대역별 스케일팩터의 디폴트로 설정된 값을 상기 대역별 스케일팩터의 디폴트로 설정된 값에 따른 상기 양자화 에러와 상기 최대허용가능 왜곡도를 고려하여 조정하고, 조정된 결과를 상기 대역별 스케일팩터의 초기값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 방법.By-band scale factor in consideration of the quantization error and the maximum permissible degree of distortion according to a value set as a default of the band-specific scale factor, and outputs the adjusted result to an initial value of the band-specific scale factor As a value of the audio data. 제1 항에 있어서, 상기 (b) 단계는2. The method of claim 1, wherein step (b) 상기 결정된 초기값과 상기 전대역 스케일팩터 중 크지 않은 값을 상기 대역별 스케일팩터의 최종값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 방법.And determining a value not greater than the determined initial value and the full-scale scale factor as a final value of the band-specific scale factor. 제1 항에 있어서, 상기 오디오 데이터 부호화 방법은The audio data encoding method according to claim 1, (e) 상기 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량을 계산하는 단계;(e) calculating a used bit amount which is the number of bits necessary for encoding the audio data; (f) 상기 계산된 사용 비트량이 미리 설정된 최대가용 비트량을 초과하는가 판단하는 단계; 및(f) determining whether the calculated used bit amount exceeds a preset maximum usable bit amount; And (g) 상기 계산된 사용 비트량이 상기 최대가용 비트량을 초과한다고 판단되면, 상기 전대역 스케일팩터의 값을 갱신하고 상기 (b) 단계로 진행하는 단계를 더 포함하는 것을 특징으로 하는 오디오 데이터 부호화 방법.(g) updating the value of the full-scale scale factor and proceeding to step (b) if it is determined that the calculated usable bit amount exceeds the maximum usable bit amount . 제5 항에 있어서, 상기 오디오 데이터에 대한 상기 (e) 단계의 수행은, 상기 오디오 데이터에 대한 상기 (b) 단계의 수행이 최초로 완료된 이후에 최초로 개시 되는 것을 특징으로 하는 오디오 데이터 부호화 방법.6. The audio data encoding method of claim 5, wherein the performing of the step (e) for the audio data is first started after the execution of the step (b) for the audio data is completed for the first time. 오디오 데이터의 주파수 대역들 각각의 대역별 스케일팩터의 초기값을 상기 주파수 대역들 각각의 양자화 에러와 최대허용가능 왜곡도를 고려하여 결정하는 제1 스케일팩터 결정부;A first scale factor determiner for determining an initial value of a scale factor of each frequency band of audio data in consideration of a quantization error and a maximum allowable distortion degree of each of the frequency bands; 상기 주파수 대역들 각각마다, 상기 결정된 초기값과 미리 설정된 전대역 스케일팩터의 값을 비교하고 비교된 결과를 고려하여 상기 대역별 스케일팩터의 최종값을 결정하는 제2 스케일팩터 결정부; A second scale factor determining unit for comparing the determined initial value with a preset value of a full-scale scale factor for each of the frequency bands and determining a final value of the band-specific scale factor in consideration of the comparison result; 상기 오디오 데이터를 상기 주파수 대역들의 상기 결정된 최종값들을 고려하여 양자화하는 양자화부; 및A quantizer for quantizing the audio data in consideration of the determined final values of the frequency bands; And 양자화된 상기 오디오 데이터를 부호화하는 무손실 부호화부를 포함하는 것을 특징으로 하는 오디오 데이터 부호화 장치.And a lossless encoding unit for encoding the quantized audio data. 제7 항에 있어서, 상기 제1 스케일팩터 결정부는The apparatus as claimed in claim 7, wherein the first scale factor determiner 상기 양자화 에러가 상기 최대허용가능 왜곡도를 초과하지 않도록 하는 상기 대역별 스케일팩터의 값들 중 최대값을 상기 대역별 스케일팩터의 초기값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 장치.And determines a maximum value among the values of the band-specific scale factors such that the quantization error does not exceed the maximum allowable distortion degree, as an initial value of the band-specific scale factor. 제7 항에 있어서, 상기 제1 스케일팩터 결정부는The apparatus as claimed in claim 7, wherein the first scale factor determiner 상기 대역별 스케일팩터의 디폴트로 설정된 값을 상기 대역별 스케일팩터의 디폴트로 설정된 값에 따른 상기 양자화 에러와 상기 최대허용가능 왜곡도를 고려하여 조정하고, 조정된 결과를 상기 대역별 스케일팩터의 초기값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 장치.By-band scale factor in consideration of the quantization error and the maximum permissible degree of distortion according to a value set as a default of the band-specific scale factor, and outputs the adjusted result to an initial value of the band-specific scale factor Value as a value of the audio data. 제7 항에 있어서, 상기 제2 스케일팩터 결정부는8. The apparatus of claim 7, wherein the second scale factor determination unit 상기 결정된 초기값과 상기 전대역 스케일팩터 중 크지 않은 값을 상기 대역별 스케일팩터의 최종값으로서 결정하는 것을 특징으로 하는 오디오 데이터 부호화 장치.And determines a value not greater than the determined initial value and the full-band scale factor as a final value of the band-specific scale factor. 제7 항에 있어서, 상기 오디오 데이터 부호화 장치는8. The apparatus of claim 7, wherein the audio data encoding apparatus 상기 오디오 데이터의 부호화시 필요한 비트의 개수인 사용 비트량을 계산하는 사용비트량 계산부; A used bit amount calculating unit for calculating a used bit amount which is the number of bits required for encoding the audio data; 상기 계산된 사용 비트량이 미리 설정된 최대가용 비트량을 초과하는지 검사하는 비트량 비교부; 및A bit amount comparing unit for checking whether the calculated used bit amount exceeds a preset maximum usable bit amount; And 상기 검사된 결과를 고려하여, 상기 전대역 스케일팩터의 값을 선택적으로 갱신하며 제어신호를 선택적으로 생성하는 스케일팩터 갱신부를 더 포함하고,Further comprising a scale factor updating unit for selectively updating a value of the full-scale scale factor and selectively generating a control signal in consideration of the checked result, 상기 제2 스케일팩터 결정부는 상기 제어신호에 응답하여 동작하는 것을 특징으로 하는 오디오 데이터 부호화 장치.And the second scale factor determiner operates in response to the control signal. 제11 항에 있어서, 상기 오디오 데이터에 대한 상기 사용비트량 계산부의 동 작은, 상기 오디오 데이터에 대한 상기 제2 스케일팩터 결정부의 동작이 최초로 완료된 이후에 최초로 개시되는 것을 특징으로 하는 오디오 데이터 부호화 장치.12. The audio data encoding apparatus according to claim 11, wherein the operation starts for the first time after the operation of the second scale factor determiner for the audio data is completed for the first time, which is shorter than the used bit amount calculator for the audio data. 제1 항 내지 제6 항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 컴퓨터 프로그램을 저장한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium storing a computer program for causing a computer to execute the method according to any one of claims 1 to 6.
KR1020070060997A 2006-06-21 2007-06-21 Method and apparatus for encoding an audio data KR101393299B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US11/766,499 US7974848B2 (en) 2006-06-21 2007-06-21 Method and apparatus for encoding audio data

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020060056072 2006-06-21
KR20060056072 2006-06-21

Publications (2)

Publication Number Publication Date
KR20070121568A KR20070121568A (en) 2007-12-27
KR101393299B1 true KR101393299B1 (en) 2014-05-09

Family

ID=39138890

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070060997A KR101393299B1 (en) 2006-06-21 2007-06-21 Method and apparatus for encoding an audio data

Country Status (1)

Country Link
KR (1) KR101393299B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102243217B1 (en) * 2013-09-26 2021-04-22 삼성전자주식회사 Method and apparatus fo encoding audio signal

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000114980A (en) 1998-10-06 2000-04-21 Nikon Corp Quantization method and recording medium recorded with quantization program
US20030088423A1 (en) * 2001-11-02 2003-05-08 Kosuke Nishio Encoding device and decoding device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000114980A (en) 1998-10-06 2000-04-21 Nikon Corp Quantization method and recording medium recorded with quantization program
US20030088423A1 (en) * 2001-11-02 2003-05-08 Kosuke Nishio Encoding device and decoding device

Also Published As

Publication number Publication date
KR20070121568A (en) 2007-12-27

Similar Documents

Publication Publication Date Title
US11355129B2 (en) Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus
JP5175028B2 (en) Digital signal encoding method and apparatus, and decoding method and apparatus
RU2494477C2 (en) Apparatus and method of generating bandwidth extension output data
RU2660605C2 (en) Noise filling concept
RU2719008C1 (en) Audio encoder for encoding an audio signal, a method for encoding an audio signal and a computer program which take into account a detectable spectral region of peaks in the upper frequency range
RU2583717C1 (en) Method and system for encoding audio data with adaptive low frequency compensation
KR20010021226A (en) A digital acoustic signal coding apparatus, a method of coding a digital acoustic signal, and a recording medium for recording a program of coding the digital acoustic signal
US7974848B2 (en) Method and apparatus for encoding audio data
CN101467203A (en) Advanced audio coding apparatus
US7596490B2 (en) Low bit-rate audio encoding
RU2368018C2 (en) Coding of audio signal with low speed of bits transmission
JP5587599B2 (en) Quantization method, encoding method, quantization device, encoding device, inverse quantization method, decoding method, inverse quantization device, decoding device, processing device
WO2014096236A2 (en) Signal adaptive fir/iir predictors for minimizing entropy
KR101100280B1 (en) Audio quantization
JP2001102930A (en) Method and device for correcting quantization error, and method and device for decoding audio information
JP2006145782A (en) Encoding device and method for audio signal
KR101393299B1 (en) Method and apparatus for encoding an audio data
KR100682890B1 (en) Audio encoding method and apparatus capable of fast bitrate control
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information
JP4822816B2 (en) Audio signal encoding apparatus and method
JP4116628B2 (en) Audio encoding method and audio encoding apparatus
JP4409733B2 (en) Encoding apparatus, encoding method, and recording medium therefor
JP2010175633A (en) Encoding device and method and program
JP2010175634A (en) Encoding device and method and program
JP2005003835A (en) Audio signal encoding system, audio signal encoding method, and program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee