KR0161945B1 - Bit rate apparatus using audio coding - Google Patents

Bit rate apparatus using audio coding Download PDF

Info

Publication number
KR0161945B1
KR0161945B1 KR1019950067248A KR19950067248A KR0161945B1 KR 0161945 B1 KR0161945 B1 KR 0161945B1 KR 1019950067248 A KR1019950067248 A KR 1019950067248A KR 19950067248 A KR19950067248 A KR 19950067248A KR 0161945 B1 KR0161945 B1 KR 0161945B1
Authority
KR
South Korea
Prior art keywords
masking
fft
level
band
unit
Prior art date
Application number
KR1019950067248A
Other languages
Korean (ko)
Other versions
KR970055616A (en
Inventor
황성배
Original Assignee
구자홍
엘지전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, 엘지전자주식회사 filed Critical 구자홍
Priority to KR1019950067248A priority Critical patent/KR0161945B1/en
Publication of KR970055616A publication Critical patent/KR970055616A/en
Application granted granted Critical
Publication of KR0161945B1 publication Critical patent/KR0161945B1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 MPEG시스템과 같이 광대역 오디오 압축 코팅시이 비트 할당에 적당하도록 한 MPEG시스템의 오디오 코딩을 위한 비트할당장치에 관한 것이다.The present invention relates to a bit allocation apparatus for audio coding of an MPEG system which is adapted to this bit allocation in a wideband audio compression coating like the MPEG system.

본 발명은 비트할당장치는 톤 버스트 밴드에 대한 고려없이 안정상태(Steady State)에 대한 소리만을 이용하여 비트할당을 하므로 톤 버스트 밴드의 소리에 의해 원래 소우스와는 다른 소리로 들릴 가능성이 있었던 점을 감안하여 전체 프로그램을 9개의 블럭으로 나누어 FFT하고 이로부터 톤 버스트 밴드를 찾아내어 이를 비트 할당에 고려함으로써 인간의 청각특성에 보다 가깝게 모델링할 수 있도록 한 것이다.According to the present invention, since the bit allocation device performs bit allocation using only a sound for a steady state without considering the tone burst band, the sound may be different from the original source by the tone burst band. Considering this, the whole program is divided into nine blocks, FFT, and the tone burst bands are found from them and considered in the bit allocation so that they can be modeled more closely to the human auditory characteristics.

Description

엠펙시스템의 오디오 코딩을 위한 비트할당장치Bit Allocation for Audio Coding of MPEG Systems

제1도는 일반적인 MPEG시스템의 오디오 코딩장치의 구성도.1 is a block diagram of an audio coding apparatus of a general MPEG system.

제2도는 (a)는 가청임계레벨을 나타낸 그래프.2 is a graph showing the audible threshold level.

(b)는 가청임계레벨에 따른 가청가능한 신호예를 나타낸 그래프.(b) is a graph showing an example of an audible signal according to the audible threshold level.

(c)는 마스킹 효과를 설명하기 위한 그래프.(c) is a graph for explaining the masking effect.

제3도는 (a)-(d)는 종래 비트할당방법을 도식적으로 나타낸 도면.3 is a diagram schematically illustrating a conventional bit allocation method.

제4도는 종래의 비트할당장치의 구성도.4 is a block diagram of a conventional bit allocation apparatus.

제5도는 톤 버스트 발생시의 임계레벨의 변화를 나타낸 그래프.5 is a graph showing the change of the threshold level when tone burst occurs.

제6도는 본 발명에 따른 비트할당장치의 구성도.6 is a block diagram of a bit allocation apparatus according to the present invention.

제7도는 제6도에 따라 발생되는 서브 FFT 블럭을 나타낸 도면.FIG. 7 shows a sub FFT block generated in accordance with FIG. 6. FIG.

제8도는 제6도에 따라 발생되는 서브 FFT 블럭을 타임축상으로 배열한 도면FIG. 8 is a diagram of sub-FFT blocks generated according to FIG. 6 arranged on a time axis.

* 도면의 주요부분에 대한 부호의 설명* Explanation of symbols for main parts of the drawings

21 : FFT 및 파워 계산부 22 : 마스커 결정부21: FFT and power calculation unit 22: masker determination unit

23 : 인/아웃 밴드 마스킹 레벨 결정부 24 : 서브 FFT 블럭 발생부23: in / out band masking level determiner 24: sub FFT block generator

25 : 톤 버스트 밴드 결정부 26 : 마스킹 감소 레벨 결정부25: tone burst band determination unit 26: masking reduction level determination unit

27 : 마스킹 레벨 결정부 28 : SMR계산부27: masking level determination unit 28: SMR calculation unit

29 : 비트 할당부29: bit allocation unit

본 발명은 비트할당장치에 관한 것으로, 특히 MPEG시스템과 같이 광대역(Broad Band) 오디오 압축 코딩시의 비트 할당시 톤 버스트(Tone Burst) 밴드를 고려하여 비트할당을 행하도록 한 MPEG시스템의 오디오 코딩을 위한 비트할당장치에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a bit allocation apparatus. In particular, the present invention relates to an audio coding of an MPEG system in which bit allocation is performed in consideration of a tone burst band during bit allocation in wide band audio compression coding such as an MPEG system. It relates to a bit allocation device for.

최근의 오디오 코딩방법은 싸이코어커스틱 모델(Psychoacoustic Model)을 이용한 방법이 많이 사용되고 있으며, 이는 오디오 데이타의 압축시 인간의 청각특성을 이용함으로써 인간이 들을 수 있는 소리의 음질저하없이 코딩하고자 하는 것이다.Recently, the audio coding method uses the Psychoacoustic Model, which is intended to code without degrading the sound that can be heard by using human auditory characteristics when compressing audio data. .

그리고 제1도는 MPEG시스템의 오디오 코딩장치의 구성도를 나타낸 것으로, 입력되는 오디오 데이타는 필터(1)에서 32개의 밴드로 나누어진다.1 shows a block diagram of an audio coding apparatus of the MPEG system, and the input audio data is divided into 32 bands in the filter (1).

그리고 상기 필터(1)에서 나누어진 각 밴드의 오디오 데이타는 할당(Allocation) 계산부(2)에서 할당된 비트로 양자화부(4)에서 양자화된다.The audio data of each band divided by the filter 1 is quantized by the quantization unit 4 with bits allocated by the allocation calculation unit 2.

이때, 상기 필터(1)를 통한 각 밴드의 오디오 데이타는 스케일 인자(Factor) 검출부(5)에서 구한 스케일 인자에 의해 스케일링부(3)에서 스케일링되어 정규화(Normalize)된 후, 양자회부(4)에서 양자화된다.At this time, the audio data of each band through the filter 1 is scaled by the scaling unit 3 by the scale factor obtained by the scale factor detection unit 5 and normalized, and then the quantum retrieval unit 4 Is quantized in.

그리고 상기 양자화부(4)의 출력은 할당 계산부(2)로부터의 할당 정보와 스케일 인자 검출부(5)로 부터의 스케일 인자 인덱스와 외부로 부터의 코딩정보에 의해 MPEG오디오 포맷 발생부(6)에서 MPEG오디오 신호로 출력한다.The output of the quantization unit 4 is an MPEG audio format generation unit 6 based on the allocation information from the allocation calculation unit 2, the scale factor index from the scale factor detection unit 5 and the coding information from the outside. Output as MPEG audio signal from.

여기서, 상기 할당 계산부(2)에 의해 오디오의 음질이 좌우되는데, 이는 각 밴드에 얼마의 비트를 할당하느냐에 따라 각 밴드의 양자화 노이즈가 결정되게 되고, 음질을 결정하게 되기 때문이다.In this case, the sound quality of the audio is determined by the allocation calculating unit 2, because the quantization noise of each band is determined according to how many bits are allocated to each band, and the sound quality is determined.

그런데, 청각특성을 잘 반영하게 되면 양자화 노이즈를 마스킹 임계레벨(Masking Threshold Level) 보다 작게 만들어 들리지 않게 만들 수 있다.However, if the auditory characteristics are well reflected, the quantization noise may be made smaller than the masking threshold level, making it inaudible.

한편, 제2도 (a)는 임계가청레벨(Absolute Hearing Threshold Level)을 나타낸 것으로, 오디오 음이 이 레벨보다 작게 발생되면 인간의 귀에는 들리지 않는다.On the other hand, Figure 2 (a) shows the threshold hearing level (Absolute Hearing Threshold Level), if the audio sound is less than this level is inaudible to the human ear.

그리고 제2도(b)에 나타낸 바와 같이 협대역(Narrow Band) 신호가 이 임계레벨보다 크게 되면 인간의 귀는 이를 감지해 낼 수 있다.As shown in FIG. 2 (b), when the narrow band signal is larger than this threshold level, the human ear can detect it.

그런데, 이 신호 근처에는 보다 큰 레벨의 신호가 제2도(c)와 같이 존재하게 되면 들리지 않게 되는데, 이 효과를 마스킹 효과라 한다.However, in the vicinity of the signal, when a higher level signal is present as shown in FIG. 2 (c), it is inaudible. This effect is called a masking effect.

한편, 제2도(c)에서 점선 부분이 원래의 임계가청레벨일때, a의 마스커(Masker)에 의해 임계값이 실선 부분으로 바뀌게 된다.On the other hand, in FIG. 2C, when the dotted line portion is the original threshold audible level, the threshold value is changed to the solid line portion by the masker of a.

이에 따라 그 실선 아래에 있는 b의 신호는 들리지 않게 된다.Accordingly, the signal of b under the solid line is not heard.

따라서 전 오디오 밴드에 대역에 대해 이러한 마스커의 역할을 하는 신호를 찾아 각 임계레벨을 더하여 새로운 임계값을 계산해낸다.Therefore, a new threshold is calculated by finding the signal that acts as a masker for the entire audio band and adding each threshold level.

이러한 과정을 제3도에 나타내었으며, 이는 먼저 각 밴드의 신호 파워를 계산한다(a).This process is shown in Figure 3, which first calculates the signal power of each band (a).

그리고 임계값을 찾아내기 위해 먼저 임계가청레벨을 결정하고(b), (c)에서 마스킹 레벨을 찾아낸다.In order to find the threshold value, the threshold audible level is first determined (b) and the masking level is found in (c).

여기서, 인 밴드 마스킹(In Band Masking)은 자기 밴드의 신호에 의해 자기 밴드의 신호가 마스킹되는 레벨을 의미하며, 아웃 밴드 마스킹(Out Band Masking)은 주변 밴드의 신호에 의해 현 밴드의 신호가 마스킹되는 것을 의미하며, 제3도(c)에서 a는 인밴드 마스킹 부분을, b는 아웃 밴드 마스킹 부분이다.Here, In Band Masking refers to a level at which a signal of a magnetic band is masked by a signal of a magnetic band, and Out Band Masking refers to a signal of a current band masked by a signal of a neighboring band. In FIG. 3C, a denotes an in-band masking portion, and b denotes an out-band masking portion.

이러한, 인 및 아웃 밴드 마스킹 레벨을 모두 더하여 최종적인 마스킹 임계 레벨을 결정하게 된다.Both in and out band masking levels are added to determine the final masking threshold level.

그리고 비트의 할당은 (d)와 같이 신호 파워와 마스킹 레벨의 차가 큰 밴드에 더 많은 비트를 할당한다.Bit allocation allocates more bits to a band having a large difference in signal power and masking level as shown in (d).

즉, 30, 31번째 밴드와 같이 신호 파워 보다 마스킹 임계 레벨이 큰 밴드는 비트를 할당하여 코딩을 한다고 하더라도 인간의 귀로 들을 수 없는 밴드이므로 비트를 할당하지 않고, 1, 28과 같이 신호와 임계레벨과의 차가 큰 밴드에는 보다 많은 비트를 할당한다.That is, bands with a masking threshold level larger than signal power, such as the 30th and 31st bands, cannot be heard by the human ear even if they are coded by assigning bits. Therefore, signals and threshold levels are not assigned as shown in 1 and 28. Allocate more bits to bands with large differences.

그리고 제4도는 상기와 같은 방식으로 비트를 할당하는 종래의 비트할당장치의 구성도를 나타낸 것으로, FFT(Fast Fourier Transorm) 및 파워 계산부(11)에서 1152(MPEG시스템의 프레임 크기)개의 샘플을 코딩하기 위해 양끝의 64개의 샘플을 제외한 1024개의 샘플로 FFT를 한후, 신호 파워을 계산한다.4 is a block diagram of a conventional bit allocation apparatus for allocating bits in the same manner as described above. The FFT (Fast Fourier Transorm) and the power calculation unit 11 show 1152 (frame size of the MPEG system) samples. The signal power is computed after the FFT with 1024 samples except 64 samples at both ends for coding.

그리고 마스커 결정부(12)에서 상기 FFT 및 파워 계산부(11)의 출력으로 부터 마스커를 결정한다.The masker determiner 12 determines the masker from the output of the FFT and the power calculator 11.

그리고 상기 마스커 결정부(12)에서 결정된 마스커에 의해 인/아웃 밴드 마스킹 레벨 결정부(13)에서 인, 아웃 밴드 마스킹 레벨을 결정하고, SMR계산부(14)에서 각 밴드에 대한 신호 대 마스커의 비(Signal To Mask Ratio)를 구한다.The in / out band masking level determiner 13 determines the in / out band masking level by the masker determined by the masker determiner 12, and the SMR calculator 14 determines the signal band for each band. Obtain the Signal To Mask Ratio.

그리고 상기 SMR계산부(14)에서 계산된 SMR을 바탕으로 비트를 할당한다.A bit is allocated based on the SMR calculated by the SMR calculator 14.

한편, 제5도에서 입력신호 a가 주어졌을 때 임계레벨은 b와 같이 결정된다. 그러나 1싸이클 톤 버스트(Tone Burst)를 들려 주었을 대는 이 임계 레벨이 c와 같이 변하게 된다.Meanwhile, when the input signal a is given in FIG. 5, the threshold level is determined as b. However, when a one-cycle tone burst is heard, this threshold level changes to c.

즉, 실선은 안정상태(Steady State)에서의 임계레벨을 보여줄뿐이며, c와 b사이의 레벨의 신호가 존재할 경우 상기 방식으로 비트를 할당하여 코딩하게 되는 경우 원래 소우스와는 다른 노이즈가 들릴 가능성이 있게 된다.In other words, the solid line shows only the threshold level in the steady state, and if there is a signal of a level between c and b, it is possible to hear noise different from the original source when the bit is allocated and coded in this manner. Will be.

결국, 종래의 비트할당장치는 톤 버스트 밴드에 대한 고려없이 안정상태에 대한 소리만을 이용하여 비트할당을 하므로 톤 버스트 밴드의 소리에 의해 원래 소우스와는 다른 소리로 들릴 가능성이 있었다.As a result, the conventional bit allocation device assigns the bit using only the sound for the stable state without considering the tone burst band, so that the sound of the tone burst band may be different from the original source.

본 발명은 이러한 문제점을 해결하기 위한 것으로, 본 발명의 목적은 전체 프레임을 9개의 블럭으로 나누어 FFT하고 이로부터 톤 버스트 밴드를 찾아내어 이를 비트 할당에 고려함으로써 인간의 청각특성에 보가 가깝게 모델링할 수 있도록 한 MPEG시스템의 오디오 코딩시를 위한 비트할당장치를 제공함에 있다.The present invention solves this problem, and an object of the present invention is to divide the entire frame into nine blocks, FFT, find a tone burst band from it, and consider it in bit allocation, so that it can be modeled closer to human auditory characteristics. The present invention provides a bit allocation apparatus for audio coding of an MPEG system.

이러한 목적을 달성하기 위한 본 발명의 특징은 입력되는 음성 샘플로 FFT를 행하고 이에 대한 파워를 계산하는 FFT 및 파워 계산부와, 상기 FFT 및 파워 계산부의 출력으로 부터 마스커를 결정하는 마스커 결정부와, 상기 마스커 결정부의 마스커에 의한 인/아웃 밴드 마스킹 레벨을 결정하는 인/아웃 밴드 마스킹 레벨 결정부와, 마스킹 레벨애 따라 각 밴드의 대한 SMR을 구하는 SMR계산부와, 상기 SMR계산부의 출력을 바탕으로 비트를 할당하는 비트 할당부로 구성되는 광대역 오디오 코딩을 위한 비트할당장치에 있어서, 입력되는 음성 샘플을 몇개의 단위블럭으로 나누어 각각의 단위블럭에 대해 파워를 계산하는 서브 FFT 블럭 발생부와, 상기 서브 FFT 블럭 발생부의 출력으로 부터 톤 버스트 성분을 검출하는 톤 버스트 밴드 검출부와, 상기 톤 버스트 밴드 검출부의 출력에 의해 톤 버스트가 발생된 해당 주파수 밴드의 마스킹 감소 레벨을 결정하는 마스킹 감소 레벨 결정부와, 상기 인/아웃 밴드 마스킹 레벨 결정부 및 마스킹 감소레벨 결정부의 출력에 따라 최종 마스킹 레벨을 결정하여 상기 SMR로 출력하는 마스킹 레벨 결정부를 더 구비하는 MPEG시스템의 오디오 코딩을 위한 비트할당장치에 있다.A feature of the present invention for achieving this object is an FFT and power calculation unit for performing an FFT with an input voice sample and calculating a power thereof, and a masker determination unit for determining a masker from the output of the FFT and power calculation unit. An in / out band masking level determiner for determining an in / out band masking level by a masker of the masker determiner, an SMR calculator that calculates an SMR of each band according to a masking level, and an SMR calculator; A bit allocation apparatus for wideband audio coding, comprising a bit allocation unit for allocating bits based on an output, comprising: a sub-FFT block generating unit calculating power for each unit block by dividing an input speech sample into several unit blocks And a tone burst band detector for detecting a tone burst component from the output of said sub FFT block generator, and said tone burst band. A final masking level is determined according to a masking reduction level determining unit that determines a masking reduction level of a corresponding frequency band in which a tone burst is generated by the output of the detector, and an output of the in / out band masking level determination unit and the masking reduction level determination unit. And a masking level determiner for outputting the SMR to the SMR.

이하, 본 발명의 일실시예를 첨부도면을 참조로 하여 상세히 설명한다.Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings.

제6도는 본 발명에 따른 MPEG시스템의 오디오 코딩을 위한 비트할당장치의 구성도를 도시한 것으로, 입력되는 1152개의 타임 샘플을 1024개의 샘플로 FFT를 행하며, 신호 파워를 계산하는 FFT 및 파워 계산부(21)와, 상기 FFT 및 파워 계산부(21)의 출력으로 부터 마스커를 결정하는 마스커 결정부(22)와, 상기 마스커 결정부(22)의 마스커에 의한 인/아웃 밴드 마스킹 레벨을 결정하는 인/아웃 밴드 마스킹 레벨 결정부(23)와, 입력되는 1152개의 타임 샘플에 대해 128포인트 FFT를 수행하여 9블럭의 FFT블럭을 만들며, 이에 대해 신호 파워를 계산하는 서브 FFT 블럭 발생부(24)와, 상기 서브 FFT 블럭 발생부(24)의 출력으로 부터 톤 버스트 성분을 찾아내는 톤버스트 밴드 검출부(25)와, 상기 톤 버스트 밴드 검출부(25)의 출력에 의해 톤 버스트가 발생된 해당 주파수 밴드의 마스킹 감소 레벨을 결정하는 마스킹 감소 레벨 결정부(26)와, 상기 인/아웃 밴드 마스킹 레벨 결정부(23) 및 마스킹 감소 레벨 결정부(26)의 출력에 따라 최종 마스킹 레벨을 결정하는 마스킹 레벨 결정부(27)와, 상기 최종 마스킹 레벨 결정부(27)의 출력으로 부터 SMR을 구하는 SMR계산부(28)와, 상기 SMR계산부(28)의 출력을 바탕으로 비트를 할당하는 비트 할당부(29)로 구성된다.6 is a block diagram of a bit allocation apparatus for audio coding of an MPEG system according to the present invention. The FFT and power calculation unit performs an FFT on 1152 time samples input to 1024 samples and calculates signal power. (21), a masker determiner 22 for determining a masker from the outputs of the FFT and power calculator 21, and in / out band masking by the masker of the masker determiner 22 In / out band masking level determination section 23 for determining the level, and 128-point FFT on 1152 time samples input to generate 9 blocks of FFT blocks, and a sub FFT block for calculating signal power is generated. Tone burst is generated by the output of the unit 24, the tone burst band detector 25 for finding the tone burst component from the output of the sub FFT block generator 24, and the tone burst band detector 25. The corresponding frequency band Masking level determination unit 26 for determining a king reduction level, and masking level determination for determining a final masking level according to outputs of the in / out band masking level determination unit 23 and the masking reduction level determination unit 26. A unit 27, an SMR calculator 28 for obtaining SMR from the output of the final masking level determiner 27, and a bit allocator for allocating bits based on the output of the SMR calculator 28 ( 29).

상기와 같이 구성된 본 발명에서 상기 FFT 및 파워 계산부(11)에서 1152개의 샘플을 코딩하기 위해 양끝의 64개의 샘플을 제외한 1024개의 샘플로 FFT를 한후, 신호 파워를 계산한다.In the present invention configured as described above, in order to code 1152 samples in the FFT and power calculation unit 11, the FFT is calculated with 1024 samples except for 64 samples at both ends, and then the signal power is calculated.

그리고 마스커 결정부(12)에서 상기 FFT 및 파워 계산부(11)의 출력으로 부터 마스커를 결정한다.The masker determiner 12 determines the masker from the output of the FFT and the power calculator 11.

그리고 상기 마스커 결정부(12)에서 결정된 마스커에 의해 인/아웃 밴드 마스킹 레벨 결정부(13)에서 인, 아웃 밴드 마스킹 레벨을 결정한다.The in / out band masking level determiner 13 determines the in / out band masking level by the masker determined by the masker determiner 12.

한편, 서브 FFT 블럭 발생부(24)는 1152개의 샘플에 대해 128포인트 FFT를 수행하여 9개의 서브 FFT 블럭을 만들어 이에 대해 신호 파워를 계산한다.On the other hand, the sub FFT block generator 24 performs 128 point FFT on 1152 samples to make 9 sub FFT blocks and calculates signal power thereof.

이때, 제7도는 상기 1152개의 샘플중 양끝 64개의 샘플을 빼고 1024 포인트 FFT를 하는 데이타와 처음부터 128 포인트 FFT를 하는 블럭을 보여주고 있다.FIG. 7 shows a block for performing a 1024 point FFT and a 128 point FFT from the beginning by subtracting 64 samples at both ends of the 1152 samples.

그리고 서브 FFT 블럭 발생부(24)에서 구한 9개의 128 포인트 FFT 파워로 부터 톤 버슨트 성분을 결정한다.The tone vertex component is then determined from the nine 128 point FFT powers obtained by the sub FFT block generator 24.

톤 버스트란 짧은 시간에 신호가 나타났다가 사라지는 성분이므로 제8도에서와 같이 9개이 128포인트 FFT 파워를 배열한 후, 타임축상으로 파워 변화량이 큰 밴드를 찾아내면 된다.The tone burst is a component that appears and disappears in a short time. Therefore, as shown in FIG. 8, nine 128-point FFT powers are arranged, and then a band with a large amount of power change is found on the time axis.

이때, 톤 버스트의 결정은 여러가지 방법이 있으나, 타입 블럭간에 20~20dB이상 레벨차이가 있고 가청임계레벨보다 클 경우 톤 버스트로 결정할 수 있다.At this time, the tone burst can be determined in various ways, but if there is a level difference of 20 to 20 dB or more between the type blocks and is larger than the audible threshold level, the tone burst can be determined.

상기와 같이 하여 톤 버스트가 결정도면 마스킹 감소 레벨 결정부(26)에서 해당 주파수 밴드의 마스킹 감소 레벨을 결정한다.As described above, the tone burst masking reduction level determination unit 26 determines the masking reduction level of the corresponding frequency band.

이때, 감소레벨은 톤 버스트 레벨에 따라 수-수십dB로 결정할 수 있다.In this case, the reduction level may be determined as several tens to several dBs according to the tone burst level.

이 감소레벨에 따라 마스킹 레벨 결정부(27)에서 최종 마스킹 레벨을 결정하고, SMR 계산부(28)에서 SMR을 구한 후, 비트 할당부(29)에서 이에 따라 비트를 할당한다. 이상에서 살펴본 바와 같이 본 발명은 종래의 안정상태의 청각특성뿐만 아니라 톤 버스트 성분가지도 고려하여 비트할당을 함으로서 인간의 청각 특성에 보다 가깝게 모델링할 수 있게 되며, 이에 따라 오디오 음질을 유지하면서 압축효율을 높일 수 있게 된다.The masking level determining unit 27 determines the final masking level according to this reduction level, obtains the SMR from the SMR calculating unit 28, and then allocates bits accordingly in the bit allocating unit 29. As described above, the present invention enables the model to be more closely modeled to the human auditory characteristics by assigning the bit in consideration of the tone burst component as well as the auditory characteristics of the conventional stable state, and thus compressing efficiency while maintaining audio quality. To increase.

Claims (2)

입력되는 음성 샘플로 FFT를 행하고 이에 대한 파워를 계산하는 FFT 및 파워 계산부와, 상기 FFT 및 파워 계산부의 출력으로 부터 마스커를 결정하는 마스커 결정부와, 상기 마스커 결정부의 마스커에 의한 인/아웃 밴드 마스킹 레벨을 결정하는 인/아웃 밴드 마스킹 레벨 결정부와, 마스킹 레벨에 따라 각 밴드에 대한 SMR을 구하는 SMR계산부와, 상기 SMR계산부의 출력을 바탕으로 비트를 할당하는 비트 할당부로 구성되는 광대역 오디오 코딩을 위한 비트할당장치에 있어서, 입력되는 음성 샘플을 몇개의 단위블럭으로 나누어 각각의 단위블럭에 대해 파워를 계싼하는 서브 FFT 블럭 발생부와, 상기 서브 FFT 블럭 발생부의 출력으로 부터 톤 버스트 성분을 검출하는 톤 버스트 밴드 검출부와, 상기 톤 버스트 밴드 검출부의 출력에 의해 톤 버스트가 발생된 해당 주파수 밴드의 마스킹 감소 레벨을 결정하는 마스킹 감소 레벨 결정부와, 상기 인/아웃 밴드 마스킹 레벨 결정부 및 마스킹 감소 레벨 결정부의 출력에 따라 최종 마스킹 레벨을 결정하여 상기 SMR로 출력하는 마스킹 레렐 결정부를 더 구비함을 특징으로 하는 MPEG시스템의 오디오 코딩을 위한 비트할당장치.An FFT and a power calculation unit for performing an FFT on an input voice sample and calculating a power thereof, a masker determining unit which determines a masker from an output of the FFT and power calculator, and a masker of the masker determining unit An in / out band masking level determiner for determining an in / out band masking level, an SMR calculator for obtaining SMR for each band according to the masking level, and a bit allocator for allocating bits based on the output of the SMR calculator A bit allocation apparatus for wideband audio coding, comprising: a sub-FFT block generating unit for dividing an input speech sample into several unit blocks and storing power for each unit block; and from the output of the sub-FFT block generating unit A tone burst band detector for detecting a tone burst component and a corresponding tone burst generated by the output of the tone burst band detector; A masking reduction level determining unit for determining a masking reduction level of a frequency band, and a masking reel determining unit for determining a final masking level according to outputs of the in / out band masking level determining unit and the masking reduction level determining unit and outputting the final masking level to the SMR And a bit allocation apparatus for audio coding of an MPEG system. 제1항에 있어서, 상기 서브 FFT 블럭 발생부는 입력되는 1152개의 샘플에 대해 128포인트 FFT를 수행하여 9블럭의 FFT블럭을 만듬을 특징으로 하는 MPEG시스템의 오디오 코딩을 위한 비트할당장치.2. The bit allocation apparatus of claim 1, wherein the sub FFT block generator generates 9 blocks of FFT blocks by performing a 128-point FFT on 1152 input samples.
KR1019950067248A 1995-12-29 1995-12-29 Bit rate apparatus using audio coding KR0161945B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950067248A KR0161945B1 (en) 1995-12-29 1995-12-29 Bit rate apparatus using audio coding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950067248A KR0161945B1 (en) 1995-12-29 1995-12-29 Bit rate apparatus using audio coding

Publications (2)

Publication Number Publication Date
KR970055616A KR970055616A (en) 1997-07-31
KR0161945B1 true KR0161945B1 (en) 1999-03-20

Family

ID=19447605

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950067248A KR0161945B1 (en) 1995-12-29 1995-12-29 Bit rate apparatus using audio coding

Country Status (1)

Country Link
KR (1) KR0161945B1 (en)

Also Published As

Publication number Publication date
KR970055616A (en) 1997-07-31

Similar Documents

Publication Publication Date Title
KR100269213B1 (en) Method for coding audio signal
JP3141450B2 (en) Audio signal processing method
EP0966108B1 (en) Dynamic bit allocation apparatus and method for audio coding
KR100348368B1 (en) A digital acoustic signal coding apparatus, a method of coding a digital acoustic signal, and a recording medium for recording a program of coding the digital acoustic signal
KR100288460B1 (en) Data compression apparatus and method using signal weighted quantization bit allocation
JP3131542B2 (en) Encoding / decoding device
RU2146394C1 (en) Method and device for alternating rate voice coding using reduced encoding rate
JP2000515266A (en) How to signal noise replacement during audio signal coding
JPH05304479A (en) High efficient encoder of audio signal
JP2005338850A (en) Method and device for encoding and decoding digital signal
US7650278B2 (en) Digital signal encoding method and apparatus using plural lookup tables
US7003449B1 (en) Method of encoding an audio signal using a quality value for bit allocation
JPH066236A (en) High efficiency encoding and/or decoding device
JPH0816195A (en) Method and equipment for digital audio coding
KR100477701B1 (en) An MPEG audio encoding method and an MPEG audio encoding device
US6128593A (en) System and method for implementing a refined psycho-acoustic modeler
JP2776300B2 (en) Audio signal processing circuit
KR0161945B1 (en) Bit rate apparatus using audio coding
JP3465341B2 (en) Audio signal encoding method
JPH06259099A (en) Semiconductor memory audio recording and reproducing device
KR100590340B1 (en) Digital audio encoding method and device thereof
JPH0918348A (en) Acoustic signal encoding device and acoustic signal decoding device
JP2000137497A (en) Device and method for encoding digital audio signal, and medium storing digital audio signal encoding program
JPH08204575A (en) Adaptive encoded system and bit assignment method
JPH0750589A (en) Sub-band coding device

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20060616

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee