KR970006827B1 - Audio signal encoding apparatus - Google Patents

Audio signal encoding apparatus Download PDF

Info

Publication number
KR970006827B1
KR970006827B1 KR1019940003286A KR19940003286A KR970006827B1 KR 970006827 B1 KR970006827 B1 KR 970006827B1 KR 1019940003286 A KR1019940003286 A KR 1019940003286A KR 19940003286 A KR19940003286 A KR 19940003286A KR 970006827 B1 KR970006827 B1 KR 970006827B1
Authority
KR
South Korea
Prior art keywords
bit allocation
value
bit
allocation weight
audio signal
Prior art date
Application number
KR1019940003286A
Other languages
Korean (ko)
Other versions
KR950025738A (en
Inventor
권순건
Original Assignee
대우전자 주식회사
배순훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대우전자 주식회사, 배순훈 filed Critical 대우전자 주식회사
Priority to KR1019940003286A priority Critical patent/KR970006827B1/en
Publication of KR950025738A publication Critical patent/KR950025738A/en
Application granted granted Critical
Publication of KR970006827B1 publication Critical patent/KR970006827B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation
    • H04N5/9261Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction
    • H04N5/9264Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10037A/D conversion, D/A conversion, sampling, slicing and digital quantisation or adjusting parameters thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Linguistics (AREA)
  • Discrete Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Algebra (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Audio signal encoding device in order to improve the compression rate of the audio signal using the time masking as well as the frequence masking. The said device consists of a high velocity fourier converter, a masking threshold value calculating means, a bit assignment weighting calculating means, a bit assignment means, and a quantization means.

Description

오디오신호 부호화장치Audio signal encoding device

제1도는 종래의 오디오신호 부호화장치도.1 is a conventional audio signal coding apparatus.

제2도는 본 발명에 따른 오디오신호 부호화장치도.2 is an audio signal coding apparatus according to the present invention.

제3도는 본 발명에 따른 전력밀도와 할당비트간의 관계도.3 is a relationship between power density and allocated bits according to the present invention.

* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings

10 : 고속푸리에변환부(Fast Fourier Transform; FFT)10: Fast Fourier Transform (FFT)

20 : 마스킹임계(Masking Threshold)값 계산부20: masking threshold value calculation unit

30, 30' : 비트할당부30, 30 ': bit allocation

40 : 분할대역분석필터(Sub-band Analysis Filter)40: Sub-band Analysis Filter

50 : 양자화기 60 : 비트할당 가중치계산부50: quantizer 60: bit allocation weight calculator

본 발명은 디지탈신호처리시스템에 있어서 오디오(Audio)신호부호화장치에 관한 것으로, 특히 시간마스킹을 이용하여 오디오신호의 압축율을 향상시키기 위한 오디오신호 부호화장치에 관한 것이다.The present invention relates to an audio signal encoding apparatus in a digital signal processing system, and more particularly, to an audio signal encoding apparatus for improving the compression ratio of an audio signal using time masking.

일반적으로 디지탈신호처리시스템에서는 수신되는 영상과 오디오신호가 디지탈신호처리됨으로 인하여 발생되는 방대한 데이터량을 효율적으로 전송하기 위하여 압축(Coding) 및 신장(Decoding)기술을 이용하고 있다. 특히 MPEG(Motion Picture Expert Group)에서는 오디오신호를 부호화하기 위하여 MUSICAM(Masking Pattern Adapted Universal Subband Integrated Coding and Multiplexing)방식을 채택하고 있다. 이 MUSICAM방식은 청각특성을 이용한 서브밴드(Subband)부호화 방식으로 96∼128Kbit/s에서 주관적으로 원음과 동일한 복원음을 얻을 수 있다.In general, a digital signal processing system uses coding and decoding techniques to efficiently transmit a large amount of data generated due to digital signal processing of received video and audio signals. In particular, the Motion Picture Expert Group (MPEG) employs a Masking Pattern Adapted Universal Subband Integrated Coding and Multiplexing (MUSCAM) scheme to encode an audio signal. This MUSICAM method is a subband encoding method using an auditory characteristic, and subjectively reconstructed sound identical to the original sound can be obtained at 96 to 128 Kbit / s.

이러한 MUSICAM방식에 의한 종래의 오디오신호부호화장치는 제1도와 같이 구성되어 있다.The conventional audio signal encoding apparatus by the MUSICAM method is configured as shown in FIG.

즉, 수신된 아날로그형태의 오디오신호가 디지탈신호로 변환되어 인가되면, 고속푸리에변환부(10) 및 분할대역분석필터(40)로 인가된다.That is, when the received analog type audio signal is converted into a digital signal and applied, it is applied to the fast Fourier transform unit 10 and the split band analysis filter 40.

고속푸리에 변환부(10)는 이산푸리에 변환을 고속으로 계산하기 위한 것으로, 인가되는 오디오신호를 주파수성분으로 변환하여 마스킹임계값 계산부(20)로 출력한다.The fast Fourier transform unit 10 calculates a discrete Fourier transform at high speed, and converts an applied audio signal into a frequency component and outputs it to the masking threshold calculator 20.

마스킹임계값 계산부(20)는 고속푸리에 변환된 결과값에 대하여 마스킹(Masking)현상을 적용한 것이다. 여기서 마스킹현상은 소리지각의 중요한 특성중 하나로서, 하나의 소리가 다른 소리의 지각(Feel)을 억제하는 현상이다. 이러한 마스킹현상에는 크게 두개의 소리가 동시에 존재하는 경우를 처리하는 주파수마스킹(Frequency Masking)과, 두 개의 소리가 시간적으로 얼마간의 거리를 두고 존재하는 경우를 처리하는 시간마스킹의 2방식이 존재한다.The masking threshold calculator 20 applies a masking phenomenon to the fast Fourier transformed result. The masking phenomenon is one of the important characteristics of sound perception, in which one sound suppresses the perception of another sound. There are two types of masking phenomena: frequency masking, which handles the case where two sounds exist at the same time, and time masking, which processes the case where two sounds exist at a certain distance in time.

마스킹임계값 계산부(20)는 상술한 2가지 방식중 주파수 마스킹을 이용한 것으로서, 여시서는MPEG의 심리음향 모델(Psychoacoutic Model)을 적용하였다. 주파수마스킹은 특정 주파수의 순음이 다른 주파수의 소리를 마스킹한다고 할 때 마스킹되는 잔소리는 어느 임계치 이상의 에너지를 가져야만 들리게 하는 것으로, 여기서 사용되는 임계치를 마스킹임계치라 하여 절대가청 임계치(Absolute Threshold)와 구분한다. 여기서 절대가청 임계치는 임의의 소리에 대하여 지각을 할 수 있는 임계값을 말한다.The masking threshold calculator 20 uses frequency masking among the two methods described above. In this case, the psychoacoustic model of MPEG is applied. Frequency masking means that when a pure tone of a certain frequency masks a sound of another frequency, the masked nagging must be heard with energy above a certain threshold. do. In this case, the absolute audible threshold refers to a threshold capable of perceiving an arbitrary sound.

이와 같이 인가되는 주파수성분에 대한 마스킹임계값을 검출하여 비트할당부(30)로 출력한다. 그러나 상술한 마스킹임계값 계산은 인가되느 모든 오디오신호에 대하여 구하는 것이 아나라 서브샘플링(Subsampling)을 행한 후에 마스킹 임계값을 구한다.The masking threshold value for the frequency component applied as described above is detected and output to the bit allocator 30. However, the above-described masking threshold calculation is not obtained for all the applied audio signals, but after the subsampling, the masking threshold value is obtained.

따라서 비트할당부(30)는 서브샘플리에 의해 계산된 마스킹임계값에 따라 소정의 비트를 할당하여 출력한다. 이 때 처리되는 블록은 후술할 분할대역 분석필터(40)에서 36개의 데이터로 구성된 단위를 입출력단위로하므로 그와 동일한 규모의 블록이 된다. 또한 비트할당부(30)는 비트할당시, 신호대 마스크비(SMR; Signal to Mask Ratio)를 이용하여 양자화잡음이 마스킹될 수 있도록 최소한의 비트를 할당한다.Accordingly, the bit allocator 30 allocates and outputs a predetermined bit according to the masking threshold calculated by the subsample. In this case, the block to be processed is a block having the same size as the input / output unit is a unit composed of 36 data in the split band analysis filter 40 to be described later. In addition, the bit allocation unit 30 allocates a minimum bit so that the quantization noise can be masked by using a signal-to-mask ratio (SMR).

한편, 분할대역분석필터(40)는 가중중첩가산(Weighted Overiap Add)방식에 의하여 32개의 필터뱅크로 이루어져, 36개의 데이터단위로 인가되는 오디오신호를 통과시켜 서브밴드 샘플로 바꾸어 놓는다. 즉 32개의 필터뱅크는 입력되는 오디오신호에 대하여 주파수영역과 시간영역에서 원하는 압축율로 변환시켜 주는 역할을 하는 것으로, 필터뱅크는 각각의 주파수대역을 갖게 되는데, 인가되는 오디오신호가 갖는 주파수 성분에 해당되는 필터가 액티브상태가 되어 현재 인가되는 오디오신호의 주파수대역을 검출할 수 있게 된다. 검출된 주파수대역값은 다음단의 양자화기(50)로 출력된다.On the other hand, the split band analysis filter 40 is composed of 32 filter banks by a weighted overiap add method, and passes through audio signals applied in 36 data units to convert them into subband samples. That is, 32 filter banks convert the input audio signal to the desired compression ratio in the frequency domain and the time domain. The filter banks have respective frequency bands, which correspond to the frequency components of the applied audio signal. The filter becomes active and the frequency band of the currently applied audio signal can be detected. The detected frequency band value is output to the next quantizer 50.

양자화기(50)는 비트할당부(30)에서 출력된 할당비트에 의해 분할대역분석필터(40)에서 검출된 서브밴드 샘플 데이터를 양자화하여 비트스트림형태의 오디오신호를 출력한다. 그리고 양자화기(50)에서는 분할대역분석필터(40)에서 출력되는 서브밴드 샘플과 비트할당부(30)에서 출력되는 비트할당정보, 스케일펙터(Scale Factor) 등의 부가정보를 가지고 출력되는 비트열을 만든다. 여기서 서브밴드의 샘플값은 1152로 하고 샘플간의 간격은 24ms로 한 경우이다.The quantizer 50 quantizes the subband sample data detected by the split band analysis filter 40 by using the allocation bits output from the bit allocator 30 and outputs an audio signal in the form of a bit stream. The quantizer 50 outputs a bit string output with subband samples output from the split band analysis filter 40 and additional information such as bit allocation information and scale factor output from the bit allocation unit 30. Make In this case, the sample value of the subband is 1152 and the interval between samples is 24ms.

상술한 바와 같은 종래의 오디오신호부호화방식은 모든 프레임에 일정한 비트를 할당함을 전제로 하므로 부호화 효율이 떨어지는 문제가 있었다.The conventional audio signal encoding method as described above has a problem in that encoding efficiency is lowered because it is assumed that a predetermined bit is allocated to every frame.

따라서 본 발명의 목적은 인가되는 오디오신호에 주파수 마스킹 뿐만 아니라 시간마스킹현상을 적용하여 좀더 효율적으로 부호화를 하기 위한 오디오부호화장치를 제공하는 데 있다.Accordingly, an object of the present invention is to provide an audio encoding apparatus for encoding more efficiently by applying time masking as well as frequency masking to an applied audio signal.

상기 목적을 달성하기 위하여 본 발명은 인가되는 디지탈 오디오신호의 해당 대역을 분석하고, 분석된 값과 할당비트에 의해 양자화하여 소정의 비트스트림 형태의 오디오신호를 출력하기 위한 오디오신호부호화장치에 있어서; 인가되는 디지탈오디오신호를 주파수성분으로 변환하기 의하여 고속 푸리에 변환을 하기 위한 고속푸리에 변환부; 고속푸리에 변환부에서 출력되는 신호에 대히 주파수마스킹에 의한 마스킹임계값을 계산하기 위한 마스킹임계값 계산부; 고속푸리에 변환부에서 출력되는 신호에 의하여 적어도 2개 이상의 프레임단위의 전력값을 검출하여 시간마스킹방식에 적용하여 비트할당 가중치를 계산하기 위한 비트할당 가중치 계산부; 마스킹임계값 계산부에서는 출력되는 마스킹임계값과 비트할당 가중치에 의해 비트를 할당하기 위한 비트할당부; 및 비트할당부에서 출력된 비트에 의해 제어되기 상기 대역분석값을 양자화하기 위한 양자화기를 포함함을 특징으로 한다.In order to achieve the above object, the present invention provides an audio signal encoding apparatus for analyzing a corresponding band of an applied digital audio signal, and quantizing by using the analyzed value and allocated bits to output an audio signal in a predetermined bitstream form; A fast Fourier transform unit for fast Fourier transform by converting an applied digital audio signal into a frequency component; A masking threshold calculator for calculating a masking threshold value by frequency masking with respect to a signal output from the fast Fourier transform unit; A bit allocation weight calculation unit for detecting a power value of at least two frame units according to a signal output from the fast Fourier transform unit and calculating the bit allocation weight by applying to a time masking method; The masking threshold calculator may include: a bit allocator for allocating bits based on the masking threshold value and the bit allocation weights; And a quantizer for quantizing the band analysis value to be controlled by the bit output from the bit allocation unit.

이하, 첨부된 도면을 참조하여 본 발명에 대하여 상세히 설명하기로 한다.Hereinafter, with reference to the accompanying drawings will be described in detail with respect to the present invention.

제2도는 본 발명에 따른 오디오신호부호화장치도로서, 일반적인 디지탈신호처리시스템에 적용이 가능하다. 특히 고품위 텔레비젼이나 레이저디스크 플레이어 등에 이용 가능성이 높다.2 is a diagram of an audio signal encoding apparatus according to the present invention, and is applicable to a general digital signal processing system. In particular, it is highly applicable to high quality TVs and laser disc players.

제2도는 인가되는 디지탈오디오신호를 고속푸리에 변환하기위한 고속푸리에 변환부(10)와, 고속푸리에 변환부(10)에서 출력되는 주파수성분에 대하여 주파수마스킹방식을 적용하여 마스킹임계값을 계산하는 마스킹 임계값 계산부(20)와, 고속푸리에 변환부(10)에서 출력되는 주파수성분에 대하여 시간마스킹방식에 의한 비트 할당 기준치(Weight)를 계산하는 비트할당 가중치계산부(60)와, 마스킹임계값 계산부(20)에서 출력되는 마스킹임계값과 비트할당 가중치 계산부(60)에서 출력되는 비트할당 가중치에 의하여 서브밴드별 비트를 할당하기 위한 비트할당부(30')와, 인가되는 디지탈오디오신호의 해당 대역을 제1도와 같이 분석하여 출력하기 위한 분할대역 분석필터(40)와, 분할대역 분석필터(40)에서 출력된 대역값을 비트할당부(30')에서 할당한 비트에 의해 제어되어 양자화를 하여 비트스트림 형태의 데이터를 출력하기 위한 양자화기(50)로 이루어진다.2 is a masking method for calculating a masking threshold value by applying a frequency masking method to a frequency Fourier transform unit 10 and a frequency component output from the fast Fourier transform unit 10 for fast Fourier transforming an applied digital audio signal. A bit allocation weight calculation unit 60 for calculating a bit allocation reference weight Weight based on a time masking method on the frequency component output from the threshold value calculating unit 20, the fast Fourier transform unit 10, and a masking threshold value. A bit allocator 30 'for allocating bits for each subband based on the masking threshold value output from the calculator 20 and the bit allocation weight output from the bit allocation weight calculator 60, and an applied digital audio signal. The split band analysis filter 40 for analyzing and outputting the corresponding band of the first band as shown in FIG. 1 and the band value output from the split band analysis filter 40 to the bits allocated by the bit allocator 30 '. Is to control it comprises a quantizer 50 for outputting the data of the bit stream to form quantization.

특히 비트할당 가중치 계산부(60)는 프레임단위로 구해전 전력값을 시간마스킹방식에 적용하여 프레임단위의 비트할당가중치를 출력하도록 구성된다.In particular, the bit allocation weight calculation unit 60 is configured to output the bit allocation weight value of the frame unit by applying the power value obtained in the frame unit to the time masking method.

제3도는 비트할당 가중치 계산부(60)에서 시간마스킹방식에 의해 구해진 인접프레임간의 전력차갑(DN,DN-1)과 비트할당 가중치인 α간의 관계를 나타낸 것으로, (a)는 인접프레임간의 전력차값(DN,DN-1)이 모두 0일 때 최대(1)의 비트할당가중치를 갖고 인접 프레임간의 전력차값이 모두 최대일 때 최저(0)의 비트할당가중치를 갖으며 나머지 구간에서는 인접 프레임과 비트할당가중치간에 선형특성을 갖는 경우이다. (b)는 최대의 비트할당가중치와 최소의 비트할당가중치를 갖는 경우는 동일한 조건을 가지나 그외의 구간에서 코사인(COSINE)특성을 갖는 경우이다. 여기서 비트할당가중치는 α이고, 전력차값은 DN, DN-1이다.FIG. 3 shows the relationship between the power difference between adjacent frames (DN, DN-1) obtained by the time-masking method in the bit allocation weight calculation unit 60 and α, which is a bit allocation weight, and (a) shows power between adjacent frames. When the difference (DN, DN-1) is all 0, the bit allocation weight is the maximum (1). When the power difference between adjacent frames is the maximum, the bit allocation weight is the lowest (0). This is the case with linear characteristics between bit allocation weights. (b) shows the case where the maximum bit allocation weight value and the minimum bit allocation weight value have the same conditions but have the cosine characteristic in other sections. Here, the bit allocation weight is α, and the power difference values are DN and DN-1.

그러면 제2도의 동작을 제3도와 결부시켜 설명하기로 한다.Next, the operation of FIG. 2 will be described with reference to FIG.

설명에 앞서, 제1도와 동일한 기능을 하는 고속푸리에 변환부(10) 및 마스킹 임계값 계산부(20), 분할대역분석필터(40), 양자화기(50) 등에 대한 구체적인 설명은 생략하고 시간마스킹방식을 이용한 비트할당 가중치 계산부(60) 및 비트 할당부(30')를 중심으로 설명하기로 한다.Prior to the description, detailed descriptions of the fast Fourier transform unit 10 and the masking threshold calculator 20, the split band analysis filter 40, the quantizer 50, etc., which perform the same functions as those of FIG. 1, are omitted. The bit allocation weight calculation unit 60 and the bit allocation unit 30 'using the method will be described.

비트할당 가중치 계산부(60)는 고속푸리에 변환부(10)에서 주파수성분의 값이 인가되면, 하기 수학식 1과 같이 소정의 블록단위로 전력밀도(Power Density)를 구한다. 본 실시예에서는 매크로 블록단위로 구한다.When the value of the frequency component is applied by the fast Fourier transform unit 10, the bit allocation weight calculator 60 calculates power density in predetermined block units as shown in Equation 1 below. In this embodiment, it is obtained in macroblock units.

여기서, k=0, …, N/2이고, N은 한 프레임의 오디오샘플수이다. 이와 같이 각 매크로 블록단위로 전력밀도가 구해지면, 한 프레임에 대한 평균을 하기 수학식 2와 같이 구한다.Where k = 0,... , N / 2, and N is the number of audio samples of one frame. When the power density is obtained in each macroblock unit as described above, the average of one frame is obtained as in Equation 2 below.

시간마스킹을 위하여 (3)식과 같은 평균을 적어도 2프레임에 대하여 구한다. 그리고 구해진 프레임 전력평균 값간의 차를 검출하여 해당되는 비트할당 가중치를 계산한다.For time masking, an average such as equation (3) is obtained for at least two frames. The bit allocation weight is calculated by detecting the difference between the obtained frame power average values.

본 실시예에서 3프레임을 기준으로 비티할당 가중치를 계산한다. 즉, 상술한 수학식 2와 같이 구해진 현재 프레임의 평균전력을 PN으로 하고, 이전 프레임의 평균전력을 PN-1로 하고, 이전 프레임의 평균전력을 PN-2로 할 경우, 시간마스킹을 이용한 비티할당 가중치 계산은 하기 (3)식과 같은 함수로 이루어진다.In this embodiment, a beat allocation weight is calculated based on three frames. That is, when the average power of the current frame obtained as shown in Equation 2 is set to PN, the average power of the previous frame is set to PN-1, and the average power of the previous frame is set to PN-2, bitty using time masking. The allocation weight calculation is performed by a function such as the following Equation (3).

=F(PN-1, PN-2, PN)= F (PN-1, PN-2, PN)

=F(PN1-PN, N-2-PN) (3)= F (PN1-PN, N-2-PN) (3)

=F(DN, DN-1)= F (DN, DN-1)

여기서 DN은 이전프레임과 현프레임간의 차값이고, DN-1은 이전프레임의 그 이전 프레임과 현프레임간의 차값이다. 단, 여기서는 PN-1값이 α의 비율을 낮추는데 더 큰 영향을 미치도록 한다.Where DN is the difference between the previous frame and the current frame, and DN-1 is the difference between the previous frame and the current frame of the previous frame. In this case, however, the PN-1 value has a greater influence on lowering the ratio of α.

즉, 제3도의 (a)에서 알수 있는 바와 같이 DN이 최대값(PMAX)이고 DN-1이 0일 때 비트할당 가중치는 작은 값(A)을 갖고, DN-1이 최대값(PMAX)이고 DN이 0일 때 비트할당 가중치는 큰값(B)를 갖는다. 여기서 비트 할당 가중치는 큰 값을 가지면 후술할 비트할당부(30')에서 할당되는 비트수가 커지게 되고, 비트할당 가중치가 작은 값을 가지면 후술한 비트할당부(30')에서 할당되는 비트수가 작아지게 된다.That is, as shown in (a) of FIG. 3, when the DN is the maximum value (PMAX) and DN-1 is 0, the bit allocation weight has a small value (A), and DN-1 is the maximum value (PMAX). When the DN is 0, the bit allocation weight has a large value (B). If the bit allocation weight has a large value, the number of bits allocated by the bit allocation unit 30 'to be described later becomes large. If the bit allocation weight has a small value, the number of bits allocated by the bit allocation unit 30' described later is small. You lose.

그러나 상술한 차값(DN, DN-1)이 동시에 최대값을 가질 때에는 비트할당 가중치는 0이 된다.However, when the difference values DN and DN-1 have the maximum values at the same time, the bit allocation weight becomes zero.

이와 같은 비트할당 가중치를 제3도의 (b)와 같이 처리할 경우, 비트할당 가중치가 0과 1의 값을 가질 때를 제외한 나머지 구간에서 제3도 (a)의 경우는 선형적인 특성을 갖는데 비해 제3도 (b)는 하기 4식과 같이 코사인특성을 가지므로 제3도 (a)에 비해 비트율의 감소량을 부드럽게(Smooth)할 수 있다.When the bit allocation weight is processed as shown in (b) of FIG. 3, the third portion (a) has a linear characteristic in the remaining sections except when the bit allocation weight has values of 0 and 1. 3 (b) has a cosine characteristic as shown in Equation 4 below, so that the amount of reduction of the bit rate can be smoothed compared to FIG. 3 (a).

수학식 3에서 사용된 a, b는 임의의 상수로, DN 및 DN-1값을 결정하게 한다. 여기서 a=b인 경우, DN, DN-1은 비트할당의 결정에 똑같은 비율로 반영되게 되며, ab일 때 DN, DN-1을 비트할당 결정에 다른 비율로 반영하게 된다. a, b는 1보다 크거나 같은 수이다.As used in Equation 3, a and b are arbitrary constants that allow the determination of DN and DN-1 values. Where a = b, DN and DN-1 are reflected at the same rate in the bit allocation decision, and a When b, DN and DN-1 are reflected at different ratios in the bit allocation decision. a and b are numbers greater than or equal to one.

이와 같이 비트할당 가중치 계산부(60)로 부터 비트할당 가중치가 출력되면, 비트할당부(30')는 M에 의해 비트를 할당하여 양자화기(50)로 출력한다. 여기서 M은 시간마스킹에 의한 할당비트의 영양이 미치지 않는 경우(즉, 구해진 값이 1을 갖게 될 때), 할당되는 비트수이다. 따라서 M은 주파수마스킹에 의해서만 결정된 종전의 할당비트라고도 할 수 있다.When the bit allocation weight is output from the bit allocation weight calculation unit 60 as described above, the bit allocation unit 30 'allocates bits by M and outputs the bits to the quantizer 50. Where M is the number of bits allocated when the nutrition of the allocation bits by time masking does not fall (that is, when the obtained value has 1). Therefore, M may be referred to as a conventional allocation bit determined only by frequency masking.

비트할당부(30')는 비트할당 가중치 계산부(60)에서 출력되는 비트할당 가중치(α)가 0일 때는 양자화기(50)로 출력되는 할당비트를 0으로 출력하므로 부호화기는 엔코딩되지 않게 된다.When the bit allocation weight α output from the bit allocation weight calculation unit 60 is 0, the bit allocation unit 30 'outputs an allocation bit output to the quantizer 50 as 0, so that the encoder is not encoded. .

여기서 비트 할당시 할당 비트 αM이다.Here, the bit allocation is the allocation bit αM.

이와 같이 할당 비트는 양자화기(50')의 양자화레벨을 제어하여 제1도에서와 같은 비트스트림 형태의 데이터를 출력하게 된다.As such, the allocation bit controls the quantization level of the quantizer 50 'to output data in the form of a bitstream as shown in FIG.

상술한 바에 의하여 본 발명은 인가되는 오디오신호에 대한 부호화시 주파수마스킹 뿐 아니라 시간마스킹방식을 적용하여 비트할당을 함으로써, 부호화율을 효율적으로 향상시킬 수 있다.As described above, the present invention can efficiently improve the coding rate by performing bit allocation by applying not only the frequency masking but also the time masking method for encoding the applied audio signal.

Claims (6)

인가되는 디지탈 오디오신호의 해당 대역을 분석하고, 분석된 값과 할당비트에 의해 양자화하여 소정의 비트스트림 형태의 오디오신호를 출력하기 위한 오디오신호 부호화장치에 있어서; 인가되는 상기 디지탈오디오 신호를 주파수성분으로 변환하기 위하여 고속푸리에 변환을 하기 위한 고속푸리에 변환부; 상기 고속푸리에 변환부에서 출력되는 신호에 의하여 주파수 마스킹을 수행하여 마스킹임계값을 계산하기 위한 마스킹임계값계산부; 상기 고속푸리에 변환부에서 출력되는 신호에 의하여 적어도 2개 이상의 프레임단위의 전력값을 검출하여 시간마스킹방식에 적용하여 비트할당 가중치를 계산하기 위한 비트할당 가중치 계산부; 상기 마스킹임계값 계산부에서 출력되는 마스킹임계값과 상기 비트할당 가중치에 의해 비트를 할당하기 위한 비트할당부; 및 상기 비트 할다웁에서 출력된 비트에 의해 제어되어 상기 대역분석값을 양자화하기 위한 양자화기를 포함함을 특징으로 하는 오디오신호 부호화장치.An audio signal encoding apparatus for analyzing a corresponding band of an applied digital audio signal, quantizing the analyzed digital audio signal and outputting an audio signal having a predetermined bitstream form by quantizing the analyzed band with an assigned bit; A fast Fourier transform unit for fast Fourier transform in order to convert the applied digital audio signal into frequency components; A masking threshold calculator for calculating a masking threshold by performing frequency masking on the signal output from the fast Fourier transform unit; A bit allocation weight calculator for detecting a power value of at least two frame units according to a signal output from the fast Fourier transform unit and calculating a bit allocation weight by applying to a time masking method; A bit allocator for allocating bits based on a masking threshold value output from the masking threshold calculator and the bit allocation weight; And a quantizer for quantizing the band analysis value controlled by the bit output from the bit Hallow. 제1항에 있어서, 상기 비트할당 가중치 계산부와 상기 프레임단위의 전력값은 소정의 처리 블록단위로 각각 검출된 전력값의 평균값임을 특징으로 하는 오디오신호 부호화장치.The audio signal encoding apparatus of claim 1, wherein the bit allocation weight calculation unit and the power value in the frame unit are average values of power values detected in predetermined processing block units, respectively. 제2항에 있어서, 상기 비트할당 가중치 계산부는 상기 평균값을 적어도 2개이상의 프레임에 대하여 검출하고, 검출된 평균값중 현재 프레임의 편균값을 기준으로 이전 프레임에 해당되는 평균값들과 각각 구한 적어도 1개 이상의 차값에 대응되는 비트할당 가중치를 상기 비트할당부로 출력함을 특징으로 하는 오디오신호 부호화장치.The apparatus of claim 2, wherein the bit allocation weight calculator detects the average value for at least two frames, and calculates at least one average value corresponding to a previous frame based on a mean value of a current frame among the detected average values. And a bit allocation weight corresponding to the difference value is output to the bit allocation unit. 제3항에 있어서, 상기 비트할당 가중치 계산부는 상기 차값이 모두 최대값을 가질 때에는 상기 비트할당 가중치가 최소값을 갖고, 상기 차값이 모두 최소값을 가질 때에는 상기 비트할당 가중치가 최대값을 갖고, 그외의 영역에서는 상기 차값과 비샴당 가중치가 선형적인 특성을 갖도록 설정함을 특징으로 하는 오디오신호 부호화장치.The bit allocation weight calculation unit of claim 3, wherein the bit allocation weight calculation unit has the minimum value when the difference values have the maximum value, and the bit allocation weight value has the maximum value when the difference values have the minimum value. The audio signal encoding apparatus of claim 1, wherein the difference value and the non-sham weight are set to have a linear characteristic. 제3항에 있어서, 상기 비트할당 가중치 계산부는 상기 차값이 모두 최대값을 가질 때에는 상기 비트할당 가중치가 최소값을 갖고, 상기 차값이 모두 최소값을 가질 때에는 상기 비트할당 가중치가 최대값을 갖고, 그 외의 영역에서는 상기 차값과 비트할당 가중치가 코사인 특성을 갖도록 설정함을 특징으로 하는 오디오신호 부호화장치.The bit allocation weight calculation unit of claim 3, wherein the bit allocation weight calculation unit has the maximum value when the difference value has the maximum value, and the bit allocation weight value has the maximum value when the difference value has the minimum value. And an area in which a difference value and a bit allocation weight are set to have cosine characteristics. 제4항 또는 제5항에 있어서, 상기 비트할당부는 상기 비트할당 가중치 계산부에서 출력되는 비트할당 가중치(α)를 상기 마스킹임계값 계산부에서 출력되는 마스킹임계값에 의해 할당되는 비트(M)에 승산(αM)하여 비트를 할당함을 특징으로 하는 오디오신호 부호화장치.The bit allocation unit M according to claim 4 or 5, wherein the bit allocation unit allocates the bit allocation weight α output from the bit allocation weight calculation unit by the masking threshold value output from the masking threshold calculation unit. And a bit is multiplied by [alpha] M to allocate a bit.
KR1019940003286A 1994-02-24 1994-02-24 Audio signal encoding apparatus KR970006827B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940003286A KR970006827B1 (en) 1994-02-24 1994-02-24 Audio signal encoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940003286A KR970006827B1 (en) 1994-02-24 1994-02-24 Audio signal encoding apparatus

Publications (2)

Publication Number Publication Date
KR950025738A KR950025738A (en) 1995-09-18
KR970006827B1 true KR970006827B1 (en) 1997-04-30

Family

ID=19377657

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940003286A KR970006827B1 (en) 1994-02-24 1994-02-24 Audio signal encoding apparatus

Country Status (1)

Country Link
KR (1) KR970006827B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100668299B1 (en) * 2004-05-12 2007-01-12 삼성전자주식회사 Digital signal encoding/decoding method and apparatus through linear quantizing in each section

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100668299B1 (en) * 2004-05-12 2007-01-12 삼성전자주식회사 Digital signal encoding/decoding method and apparatus through linear quantizing in each section

Also Published As

Publication number Publication date
KR950025738A (en) 1995-09-18

Similar Documents

Publication Publication Date Title
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
JP5539203B2 (en) Improved transform coding of speech and audio signals
KR100242864B1 (en) Digital signal coder and the method
JP2906646B2 (en) Voice band division coding device
KR100335611B1 (en) Scalable stereo audio encoding/decoding method and apparatus
JP3186292B2 (en) High efficiency coding method and apparatus
EP0884850A2 (en) Scalable audio coding/decoding method and apparatus
JPH09500503A (en) Adaptive bit allocation coding apparatus and method
KR100695125B1 (en) Digital signal encoding/decoding method and apparatus
JP3297240B2 (en) Adaptive coding system
US7003449B1 (en) Method of encoding an audio signal using a quality value for bit allocation
JPH0856163A (en) Adaptive digital audio encoing system
US7613609B2 (en) Apparatus and method for encoding a multi-channel signal and a program pertaining thereto
KR20030068716A (en) Method for compressing audio signal using wavelet packet transform and apparatus thereof
JP2003523662A (en) Data compression method and data compression device
CN1666571A (en) Audio processing
JP2000151413A (en) Method for allocating adaptive dynamic variable bit in audio encoding
KR970006827B1 (en) Audio signal encoding apparatus
JP2558997B2 (en) Digital audio signal encoding method
JPH08179794A (en) Sub-band coding method and device
KR970006825B1 (en) Audio signal encoding apparatus
JP2820096B2 (en) Encoding and decoding methods
JP2575265B2 (en) Digital audio signal encoding method
KR0174911B1 (en) Audio signal encoding device
JPH0750589A (en) Sub-band coding device

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110901

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20120903

Year of fee payment: 16

LAPS Lapse due to unpaid annual fee