KR100713452B1 - Apparatus and method for coding of audio signal - Google Patents

Apparatus and method for coding of audio signal Download PDF

Info

Publication number
KR100713452B1
KR100713452B1 KR1020030088379A KR20030088379A KR100713452B1 KR 100713452 B1 KR100713452 B1 KR 100713452B1 KR 1020030088379 A KR1020030088379 A KR 1020030088379A KR 20030088379 A KR20030088379 A KR 20030088379A KR 100713452 B1 KR100713452 B1 KR 100713452B1
Authority
KR
South Korea
Prior art keywords
subband
gain
masking threshold
signal
reset
Prior art date
Application number
KR1020030088379A
Other languages
Korean (ko)
Other versions
KR20050054745A (en
Inventor
함철배
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020030088379A priority Critical patent/KR100713452B1/en
Publication of KR20050054745A publication Critical patent/KR20050054745A/en
Application granted granted Critical
Publication of KR100713452B1 publication Critical patent/KR100713452B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Optimization (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송함에 있어서, 상기 각 서브밴드에 할당된 오디오 신호들의 이득을 측정하고, 상기 측정된 이득이 중요도에 비례하여 상기 오디오 신호를 재조정하고, 상기 측정된 이득에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하고, 상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화한다.The present invention allocates audio signals to at least two subbands having a specific frequency domain, and encodes and transmits the audio signals when the gain of the audio signals allocated to the respective subbands exceeds a masking threshold. Measure the gain of audio signals, readjust the audio signal in proportion to the importance, reset the masking threshold of each subband in inverse proportion to the measured gain, and exceed the reset masking threshold Encode only the signal.

MPEG-4, AAC, shaping 함수, 심리음향모델, 부호화MPEG-4, AAC, shaping function, psychoacoustic model, coding

Description

오디오 신호를 부호화하는 장치 및 방법{APPARATUS AND METHOD FOR CODING OF AUDIO SIGNAL} Apparatus and method for encoding an audio signal {APPARATUS AND METHOD FOR CODING OF AUDIO SIGNAL}             

도 1은 종래 오디오 신호를 부호화하는 부호화기의 구성을 도시한 도면.1 is a diagram showing the configuration of an encoder for encoding a conventional audio signal.

도 2는 서브밴드에서 마스킹 임계치에 따라 전달된 음성 신호를 부호화하는 과정을 도시한 도면. 2 is a diagram illustrating a process of encoding a speech signal transmitted according to a masking threshold in a subband.

도 3은 하나의 서브밴드에서 마스킹 임계치에 따라 전달된 음성 신호를 부호화하는 과정을 도시한 도면.3 is a diagram illustrating a process of encoding a speech signal transmitted according to a masking threshold in one subband.

도 4는 본 발명에 따른 오디오 신호를 부호화하는 부호화기의 구성을 도시한 도면.4 is a diagram illustrating a configuration of an encoder for encoding an audio signal according to the present invention.

도 5는 본 발명에 따른 생성하는 형성함수를 도시한 도면.5 is a diagram illustrating a forming function generated in accordance with the present invention.

도 6은 본 발명에 따른 생성된 형성함수를 이용하여 음성신호를 재형성하는 과정을 도시한 도면.6 is a diagram illustrating a process of reconstructing a voice signal using the generated function according to the present invention.

도 7은 본 발명에 따른 재설정된 마스킹 임계치에 따라 전달된 음성신호를 부호화하는 과정을 도시한 도면. 7 is a diagram illustrating a process of encoding a speech signal transmitted according to a reset masking threshold according to the present invention.

본 발명은 오디오 부호화에 관한 것으로서, 특히 오디오 부호화의 압축효율을 높이기 위한 장치 및 방법에 관한 것이다.The present invention relates to audio encoding, and more particularly, to an apparatus and a method for increasing the compression efficiency of audio encoding.

상기 오디오 신호는 최근 디지털통신기술의 눈부신 신장과 고집적 반도체(VLSI), 그리고 신호처리(DSP)기술의 접목에 따라 종래에는 이질적이고 독립적으로 생성, 처리되어 오던 비디오 데이터, 오디오 데이터 및 기타 데이터들이 정보소스나 매체 등의 구별 없이 매우 다양한 형태로 처리, 이용될 수 있게 되었다. 이와 같은 환경에서 서로 다른 기기간의 원활한 정보전송 및 공유를 위한 디지털 데이터의 국제적 전송규격 표준화의 필요성이 대두되었고, 이러한 필요성에 따라 정지화상의 전송을 위한 제이펙(Joint Picture Experts Group: JPEG) 및 동화상의 전송을 위한 MPEG 등이 표준화되었다.The audio signal is a video data, audio data, and other data that have been generated and processed heterogeneously and independently in accordance with the recent expansion of digital communication technology, high integration semiconductor (VLSI), and signal processing (DSP) technology. It can be processed and used in a wide variety of forms without distinguishing between sources and media. In this environment, there is a need for standardization of international transmission standards of digital data for smooth information transmission and sharing between different devices, and according to such needs, Joint Picture Experts Group (JPEG) and moving picture MPEG has been standardized for the transmission of.

상기 MPEG 표준화에 따르면 디지털 비디오 데이터와 오디오 데이터를 압축한 후 다중화하여 전송하는 방법 및 압축되어 전송된 비디오 데이터와 오디오 데이터를 디코딩하는 방법 등이 규정되어 있다. 이 규정된 내용에 따르면 디지털 데이터는 이산여현변환(Discrete Cosine Transform), 양자화(Quantization), 스캔(Scan)을 거친 후 최종적으로 가변장부호화(Variable Length Coding)에 의해 더욱 압축된다. 이렇게 압축되어 전송된 데이터는 다시 가변장복호화(Variable Length Decoding), 역양자화, 역이산여현변환 등의 과정을 거친 후 복원된다.According to the MPEG standardization, a method of compressing and multiplexing digital video data and audio data and transmitting the same, and a method of decoding the compressed and transmitted video data and audio data, and the like are prescribed. According to this provision, digital data is further compressed by Discrete Cosine Transform, Quantization, Scan, and finally by Variable Length Coding. The compressed and transmitted data is restored after undergoing a variable length decoding, inverse quantization, and inverse discrete cosine transform.

도 1은 오디오 신호를 부호화하는 부호화기의 구성을 도시하고 있다. 이하 상기 도 1을 이용하여 오디오 신호를 부호화하는 부호화기의 구성에 대해 알아본다. 상기 부호화기는 시간/주파수 매핑(Time/Frequency Mapping)부(102), 심리음향부(100), 시간영역 잡음 형상화부(104), 강도(Intensity) 스테레오 처리부(106), 예측부(108), 미드/사이드(Mid/Side: M/S) 스테레오 처리부(110), 양자화부(112), 비트분할 산술부호화부(114) 및 비트스트림 형성부(116)로 이루어진다.1 shows a configuration of an encoder for encoding an audio signal. Hereinafter, a configuration of an encoder for encoding an audio signal will be described with reference to FIG. 1. The encoder includes a time / frequency mapping unit 102, a psychoacoustic unit 100, a time domain noise shaping unit 104, an intensity stereo processor 106, a predictor 108, A mid / side (M / S) stereo processor 110, a quantization unit 112, a bit division arithmetic coding unit 114, and a bitstream forming unit 116 are provided.

인간의 청각특성 중 디지털 오디오신호의 부호화에 있어서 가장 중요한 현상으로 사용하는 것이 마스킹(masking)효과와 임계대역(critical hand)의 성질이다. 마스킹효과란 어떤 신호(소리)에 의해 다른 신호(소리)가 들리지 않게 되는 현상이다. 예를 들면, 기차역에서 기차가 지나갈 때 낮은 소리로 대화한다면 그 대화는 기차소리에 묻혀 들리지 않게 되는 현상이다. 임계대역은 인간의 가청주파수범위 내에서 어떤 대역별로 신호를 인지하는 현상인데, 여러 가지 특성을 가지고 있다. 이 특성 중 하나가 같은 크기의 잡음(noise)에 대해서 어떤 임계대역 내에 있을 때와 임계대역 범위를 넘어설 때 인간이 인지하는 잡음의 크기가 다르다는 것이다. 이 경우, 임계대역을 벗어날 때의 잡음에 대한 인지가 더 높아진다.Among the auditory characteristics of human, the most important phenomenon in encoding of digital audio signal is the property of masking effect and critical hand. The masking effect is a phenomenon in which a signal (sound) is not heard by another signal (sound). For example, if you talk at a low level when a train passes by at a train station, the conversation is not buried in the sound of the train. The critical band is a phenomenon in which a signal is recognized by a certain band within the human audio frequency range, and has various characteristics. One of these characteristics is that humans perceive different amounts of noise when they are within a certain threshold for the same amount of noise and when they exceed the threshold range. In this case, the perception of noise when leaving the critical band is higher.

청각특성을 이용하여 부호화 한다는 것은 기본적으로 상기 두 가지의 특성을 이용하여 하나의 임계 대역 내에서 잡음을 얼마나 할당할 수 있는가를 계산한 후, 양자화시 양자화 잡음을 그 만큼 발생시킴으로써 부호화에 의한 정보의 손실을 최소로 하는 것이다.The encoding using auditory characteristics basically calculates how much noise can be allocated within one critical band using the two characteristics, and then generates the quantization noise during quantization, thereby losing information due to encoding. To minimize

상기 시간/주파수 맵핑부(102)는 시간영역(time domain)의 입력 오디오 신호를 주파수영역(frequency domain)의 신호로 변환한다. 상기 심리음향부(100)는 상 기 시간/주파수 맵핑부(102)에 의해 시간 영역에서 주파수 영역으로 변환된 오디오 신호들을 적당한 대역(scale factor band)의 신호들로 묶고, 각 신호들의 상호작용으로 인해 발생되는 마스킹현상을 이용하여 각 대역(scale factor band)에서의 마스킹 문턱치(masking threshold)를 계산한다.The time / frequency mapping unit 102 converts an input audio signal in a time domain into a signal in a frequency domain. The psychoacoustic unit 100 bundles the audio signals converted from the time domain into the frequency domain by the time / frequency mapping unit 102 into signals of appropriate scale factor bands, and interacts with each other. Masking thresholds in each scale factor band are calculated using the masking phenomenon generated.

상기 시간영역잡음형상화(TNS, Temporal Noise Shaping)부(104)는 변환의 각 윈도우 내에서 양자화 잡음의 시간적인 모양을 제어하기 위해 사용된다. 주파수 데이터의 필터링 과정을 적용함으로써 시간영역 잡음 형상화가 가능하다. 상기 모듈은 부호화기에서 선택적으로 사용가능한 모듈이다. 상기 Intensity 스테레오 처리부(106)는 스테레오 신호를 좀 더 효율적으로 처리하기 위한 모듈로서, 두 개의 채널 중 하나의 채널에 대한 scalefactor band에 대한 양자화된 정보만을 부호화하고, 나머지 채널은 scalefactor 만을 전송한다. 상기 모듈은 부호화기에서 반드시 사용해야 하는 모듈은 아니고 여러 가지 사항을 고려해서 각 scalefactor band단위로 사용 여부를 판단할 수 있다.The temporal noise shaping (TNS) unit 104 is used to control the temporal shape of the quantization noise in each window of the transform. By applying the filtering process of the frequency data, time domain noise shaping is possible. The module is a module that can be optionally used in the encoder. The intensity stereo processor 106 is a module for more efficiently processing a stereo signal, and encodes only quantized information about a scalefactor band for one of two channels, and transmits only the scalefactor for the remaining channels. The module is not a module that must be used in the encoder, and it is possible to determine whether to use each scalefactor band unit in consideration of various matters.

예측부(108)는 현재 프레임의 주파수 계수의 값들을 예측한다. 이렇게 예측된 값과 실제 주파수 성분의 차를 양자화해서 부호화함으로써 사용되는 비트 발생량을 줄일 수 있다. 하지만 상기 예측부(108)는 프레임 단위로 선택적으로 사용할 수 있다. 즉 예측부(108)를 사용하면 다음 주파수 계수를 예측하는데 복잡도가 높아지기 때문에 사용하지 않을 수 있다. 또한 경우에 따라서는 예측에 의한 차이가 원래 신호보다 더 큰 확률을 가지고 있음으로 인해 예측을 함으로써 실제 발생한 비트 발생량이 예측을 하지 않을 때 보다도 더 커질 수 있는데 이 때는 예측부(108)를 사용하지 않는다.The predictor 108 predicts values of frequency coefficients of the current frame. The amount of bits used can be reduced by quantizing and encoding the difference between the predicted value and the actual frequency component. However, the prediction unit 108 may be selectively used in units of frames. In other words, the prediction unit 108 may not be used because it increases the complexity of predicting the next frequency coefficient. In addition, in some cases, since the prediction difference has a greater probability than the original signal, the prediction may cause the generated bit generation to be larger than when the prediction is not performed. In this case, the prediction unit 108 is not used. .

M/S 스테레오 처리부(110)는 스테레오 신호를 좀 더 효율적으로 처리하기 위한 것으로서, 왼쪽 채널 신호와 오른쪽 채널 신호를 각각 더한 신호와 뺀 신호로 변환한 후 이 신호를 처리한다. 상기 M/S 스테레오 처리부(110)도 부호화기에서 반드시 사용해야 하는 것은 아니고 부호화기에서 여러 가지 사항을 고려해서 각 scalefactor band 단위로 사용 여부를 판단할 수 있다.The M / S stereo processor 110 processes the stereo signal more efficiently. The M / S stereo processor 110 processes the signal after converting the left channel signal and the right channel signal into the added and subtracted signals, respectively. The M / S stereo processor 110 is not necessarily used in the encoder, but may determine whether the encoder is used in each scalefactor band unit in consideration of various matters.

양자화부(112)는 인간이 들어도 느끼지 못하도록 각 대역의 양자화 잡음의 크기가 마스킹 문턱치(Masking threshold value)보다 작도록 각 대역의 주파수 신호들을 스칼라 양자화한다. 음향심리부(100)에서 계산한 마스킹 문턱치와 각 대역에서 발생하는 잡음(noise)의 비율인 NMR(Noise-to-Mask Ratio)을 이용하여 전대역의 NMR 값이 0dB 이하가 되도록 양자화를 행한다. NMR 값이 0dB 이하라는 것은 양자화잡음에 비해 마스킹값이 높다는 것을 나타내는데, 이것은 양자화잡음을 사람이 들을 수 없다는 의미이다.The quantization unit 112 scalar quantizes the frequency signals of each band so that the magnitude of quantization noise of each band is smaller than a masking threshold value so that a human cannot feel it. The quantization is performed such that the NMR value of the entire band is 0 dB or less by using a noise-to-mask ratio (NMR), which is a ratio of a masking threshold calculated by the acoustic psychology unit 100 and noise generated in each band. An NMR value of 0 dB or less indicates a higher masking value than quantization noise, meaning that humans cannot hear the quantization noise.

비트분할 산술 부호화부(114)는 본 발명의 핵심 모듈로서, MPEG-2 AAC와 같은 기존의 오디오 코덱(codec)은 scalability 를 제공할 수 없기 때문에 AAC의 무손실 부호화부에 대한 대안으로 사용될 수 있다. scalable audio codec을 구현할 수 있도록 양자화부(112)에서 양자화된 주파수 데이터값을 각 계층에 해당하는 비트율에 따라 해당 대역의 부가정보와 오디오 데이터에 대한 양자화 정보를 결합하여 부호화한다. 또한, 이런 scalability 기능 이외에 top layer에서는 AAC와 비슷한 성능을 제공할 수 있게 한다. 상기 비트분할 산술 부호화부(114)의 기능을 좀 더 상세하게 설명하면, 비트율 조절이 가능하도록 기반 계층에 상응하는 대역 제한을 하고, 부가정보(side information)를 부호화한다. 그리고 양자화된 값들에 대한 정보를 최상위 비트부터 최하위비트 순서로, 그리고 낮은 주파수 성분부터 높은 주파수성분의 순서대로 부호화한다. 또한 왼쪽 채널과 오른쪽 채널을 소정의 벡터 단위로 번갈아 가면서 부호화하여 기반계층에 대한 부호화를 한다. 상기 기반 계층에 대한 부호화가 끝나면 그 다음계층에 대한 부가정보와 오디오데이터의 양자화값을 부호화하여 비트스트림이 계층적 구조를 갖도록 한다. 비트스트림 형성부(116)는 부호화기의 각 모듈에서 만들어진 정보들을 모아서 scalable codec 에 적합하도록 만들어진 소정의 syntax에 따라서 비트스트림을 구성한다.The bit division arithmetic encoder 114 is a core module of the present invention, and since an existing audio codec such as MPEG-2 AAC cannot provide scalability, the bit split arithmetic encoder 114 may be used as an alternative to the lossless encoder of AAC. In order to implement scalable audio codec, the quantization unit 112 encodes the quantized frequency data value by combining the additional information of the corresponding band and the quantization information of the audio data according to a bit rate corresponding to each layer. In addition to these scalability features, the top layer can provide performance similar to AAC. When the function of the bit division arithmetic encoder 114 is described in more detail, a band restriction corresponding to the base layer is performed to enable bit rate adjustment, and side information is encoded. Information about the quantized values is encoded in order from the most significant bit to the least significant bit, and then in order from the lowest frequency component to the highest frequency component. In addition, the left and right channels are alternately encoded in a predetermined vector unit to encode the base layer. After the encoding of the base layer is finished, the bitstream has a hierarchical structure by encoding quantization values of additional information and audio data of the next layer. The bitstream forming unit 116 collects information generated in each module of the encoder and constructs the bitstream according to a predetermined syntax made to fit the scalable codec.

도 2는 마스킹 문턱치를 이용하여 입력신호를 처리하는 과정을 도시하고 있다. 상기 도 2에 의하면 입력신호는 4개의 대역을 나누어지고 있음을 보이고 있다. 상기 4개의 대역은 서브밴드1 내지 서브밴드4로 구성된다. 부호화기는 서브밴드 1내지 서브밴드 4의 이득을 구한다. 상기 도 2는 일예로 서브밴드2와 서브밴드3에 측정한 이득을 나타내고 있다. 상기 각 서브밴드의 이득은 상기 심리음향부로부터 전달된 마스킹 문턱치와 비교한다. 상기 비교 결과 서브밴드 2에서 이득이 상기 마스킹 문턱치보다 높고, 서브밴드3에서의 이득은 상기 마스킹 문턱치보다 작음을 알 수 있다. 상기 마스킹 문턱치를 계산하는 과정에 대해서는 본원 발명과 무관하므로 생략하기로 한다. 상기한 바와 같이 각 서브밴드에서 측정된 이득이 상기 마스킹 문턱치보다 작은 경우 부호화과정에서 제외하므로 압축효율을 높일 수 있다. 2 illustrates a process of processing an input signal using a masking threshold. According to FIG. 2, the input signal is divided into four bands. The four bands are composed of subband 1 to subband 4. The encoder obtains the gain of subband 1 to subband 4. 2 illustrates gains measured in subbands 2 and 3, for example. The gain of each subband is compared with a masking threshold transmitted from the psychoacoustic unit. As a result of the comparison, it can be seen that the gain in subband 2 is higher than the masking threshold and the gain in subband 3 is smaller than the masking threshold. The process of calculating the masking threshold is irrelevant to the present invention and will be omitted. As described above, if the gain measured in each subband is smaller than the masking threshold, it is excluded from the encoding process, thereby increasing the compression efficiency.

도 3은 종래 기술에 의한 문제점을 도시하고 있는 도면이다. 이하 상기 도 3 을 이용하여 종래 기술의 문제점에 대해 알아본다. 상기 도 3에 의하면 서브밴드 3에는 두 개의신호성분에 대한 이득을 도시하고 있다. 상기 서브밴드 3의 두 개의 신호성분은 상기 마스킹 문턱치보다 높으므로 부호화 과정을 수행하게 된다. 하지만 상기 두 개의 신호성분에 대해 부호화 과정을 수행하기 위해서는 상기 부호화된 신호성분을 전송하기 위한 비트율이 보장되어야 한다. 상기 두 개의 신호성분을 전송하기 위한 비트율이 보장되지 않을 경우 상기 부호화기는 상기 서브밴드3의 신호성분에 대한 부호화 과정을 수행하지 않게 된다. 상기 서브밴드 3 전체의 신호성분에 대한 부호화 과정을 수행하지 않음으로 인해 부호화된 오디오 신호의 밴드폭은 계속해서 변하게 된다. 상기 밴드폭의 변화는 음질의 열화현상을 초래한다. 따라서 상기한 문제점을 해결하기 위한 방안이 논의된다. 3 is a diagram showing a problem according to the prior art. Hereinafter, the problems of the prior art will be described with reference to FIG. 3. Referring to FIG. 3, subband 3 shows gains for two signal components. Since two signal components of the subband 3 are higher than the masking threshold, an encoding process is performed. However, in order to perform the encoding process on the two signal components, a bit rate for transmitting the encoded signal components should be guaranteed. If the bit rate for transmitting the two signal components is not guaranteed, the encoder does not perform an encoding process on the signal components of the subband 3. The bandwidth of the encoded audio signal is continuously changed because the encoding process for the entire signal component of the subband 3 is not performed. The change in bandwidth results in degradation of sound quality. Therefore, a method for solving the above problem is discussed.

따라서 전술한 종래 기술의 문제점을 해결하기 위한 본 발명의 목적은 저비트율 하에서도 효율적인 데이터 전송을 수행하는 장치 및 방법을 제안함에 있다.Accordingly, an object of the present invention for solving the above problems of the prior art is to propose an apparatus and method for performing efficient data transmission even under a low bit rate.

본 발명의 다른 목적은 전송되는 데이터의 밴드폭의 변화를 최소화함으로서 음질의 열화현상을 방지하는 장치 및 방법을 제안함에 있다.Another object of the present invention is to propose an apparatus and method for preventing degradation of sound quality by minimizing a change in bandwidth of transmitted data.

본 발명의 또 다른 목적은 각 밴드의 이득에 따라 부호화하는 마스킹 임계치를 달리 설정함으로서 요율적인 데이터 전송을 수행하는 장치 및 방법을 제안함에 있다.Another object of the present invention is to propose an apparatus and method for performing data rate transmission by differently setting a masking threshold for encoding according to the gain of each band.

상기 본 발명의 목적들을 이루기 위해 오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송하는 방법에 있어서, 상기 각 서브밴드에 할당된 오디오 신호들의 이득을 측정하고, 상기 측정된 이득이 중요도에 비례하여 상기 오디오 신호를 재조정하는 과정과, 상기 측정된 이득에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하고, 상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화하는 과정으로 이루어짐을 특징으로 한다.In order to achieve the above object of the present invention, a method for allocating audio signals to at least two subbands having a specific frequency region and encoding if the gain of the audio signal allocated to each subband exceeds a masking threshold, Measuring a gain of the audio signals allocated to each subband, readjusting the audio signal in proportion to the importance, resetting the masking threshold of each subband in inverse proportion to the measured gain, And encoding only an audio signal exceeding the reset masking threshold.

상기 본 발명의 목적들을 이루기 위해 오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송하는 장치에 있어서, 상기 각 서브밴드에 할당된 오디오 신호들의 이득을 측정하고, 상기 측정된 이득이 중요도에 비례하여 상기 오디오 신호를 재조정하는 심리 음향부, 상기 측정된 이득에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하는 형성함수 생성부와, 상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화하도록 출력하는 형성부를 포함함을 특징으로 한다.
An apparatus for allocating audio signals to at least two subbands having a specific frequency range to achieve the objects of the present invention, and encoding and transmitting the audio signals when the gain of the audio signals allocated to each subband exceeds a masking threshold. A psychoacoustic unit for measuring the gains of the audio signals allocated to the subbands and re-adjusting the audio signal in proportion to the importance, and resetting the masking thresholds of the subbands in inverse proportion to the measured gains And a forming function for outputting only an audio signal exceeding the reset masking threshold.

이하 본 발명이 바람직한 실시예를 첨부한 도면의 참조와 함께 상세히 설명한다. 또한 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings. In describing the present invention, when it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted.

도 4는 본 발명에 따른 오디오 신호를 부호화하는 부호화기의 구성을 도시하고 있다. 이하 상기 도 4를 이용하여 오디오 신호를 부호화하는 부호화기의 구성에 대해 알아본다. 상기 도 4는 상기 도 1과 달리 형성(shaping) 함수 생성부(118)와 형성부(120)가 부가되어 있다. 상기 형성 함수 생성부(118)와 형성부(120)를 제외한 다른 구성에 대해서는 상기 도 1에서 설명한 바와 같다. 이하 상기 형성 함수 생성부(118)와 형성부(120)에 대해 알아본다. 상기 형성 함수 생성부(118)는 전달받은 각 서브밴드의 이득을 고려하여 형성 함수를 생성한다. 상기 형성 함수는 각 서브밴드별로 고정된 하나의 값을 설정하거나, 함수의 형태로 표현할 수 있다. 도 5는 주파수 영역으로 변경된 형성함수의 일예를 도시하고 있다. 상기 도 5에 의하면 상기 서브밴드1은 서브밴드2보다 높은 형성함수를 가지며, 상기 서브밴드2는 서브밴드 3보다 높은 형성함수를 가진다. 상기 서브밴드3은 서브밴드4보다 높은 형성함수 가진다. 상기 생성되는 형성함수는 각 서브밴드의 중요도와 관련된다. 상기 서브밴드에 포함된 신호성분에 대한 중요도에 높을수록 형성 함수의 크기 또한 증가된다. 상기 도 5에 의하면 상기 서브밴드 1에 포함되는 신호성분의 중요도가 가장 크다는 것을 알 수 있다.4 shows a configuration of an encoder for encoding an audio signal according to the present invention. Hereinafter, a configuration of an encoder for encoding an audio signal will be described with reference to FIG. 4. In FIG. 4, unlike in FIG. 1, a shaping function generator 118 and a forming unit 120 are added. Other configurations except for the formation function generator 118 and the formation unit 120 are as described with reference to FIG. 1. Hereinafter, the forming function generator 118 and the forming unit 120 will be described. The shaping function generator 118 generates a shaping function in consideration of the gain of each received subband. The shaping function may set a fixed value for each subband or may be expressed in the form of a function. 5 shows an example of a formation function modified in the frequency domain. Referring to FIG. 5, the subband 1 has a higher formation function than the subband 2, and the subband 2 has a higher formation function than the subband 3. The subband 3 has a higher formation function than the subband 4. The resulting formation function is related to the importance of each subband. The higher the importance of the signal component included in the subband, the larger the magnitude of the formation function. Referring to FIG. 5, it can be seen that the signal component included in the subband 1 has the greatest importance.

하기 〈수학식 1〉은 생성된 형성함수를 이용하여 형성부에서 전달받은 신호를 형성하는 수식을 나타내고 있다.Equation 1 below represents a formula for forming a signal transmitted from the forming unit using the generated forming function.

X_freq'[i]=w(i)*X_freq[i]X_freq '[i] = w (i) * X_freq [i]

상기 X_freq'[i]는 형성함수에 의해 형성된 신호를 의미하며, 상기 w(i)는 형성함수를 의미한다. 상기 X_freq[i]는 시간/주파수매팽부로부터 출력된 신호를 의미한다. 도 6은 상기 형성함수에 의해 시간/주파수매팽부로부터 출력된 신호가 형성되는 예를 도시하고 있다. 상기 형성함수는 상기 도 5의 형성함수를 사용하였다. 상기 형성신호는 신호는 원신호에 비해 작은 값을 가짐을 알 수 있다. 즉, 상기 도 5에서 서브밴드1에서의 형상함수는 1을 가지며, 서브밴드2 내지 서브밴드4에서의 형상함수는 1보다 작은 값을 갖는다. 하지만 경우에 따라 상기 형상함수는 1보다 큰 값을 가질 수 있음은 자명하다.X_freq '[i] means a signal formed by the formation function, and w (i) means a formation function. The X_freq [i] means a signal output from the time / frequency mapping section. Fig. 6 shows an example in which a signal output from the time / frequency trapping portion is formed by the forming function. As the formation function, the formation function of FIG. 5 was used. It can be seen that the formed signal has a smaller value than the original signal. That is, in FIG. 5, the shape function in subband 1 has a value 1, and the shape function in subbands 2 through 4 has a value smaller than 1. FIG. However, it is obvious that the shape function may have a value greater than 1 in some cases.

이하, 심리음향부(100)에서 마스크 임계치를 생성하는 과정에 대해 알아본다. 상기 심리음향부(100)는 상기 시간/주파수 맵핑부(102)에 의해 시간 영역에서 주파수 영역으로 변환된 오디오 신호들을 적당한 대역(scale factor band)의 신호들로 묶고, 각 신호들의 상호작용으로 인해 발생되는 마스킹현상을 이용하여 각 대역(scale factor band)에서의 마스킹 문턱치(masking threshold)를 계산한다. 상기 계산된 마스킹 문턱치와 전달받은 각 서브밴드에서의 이득을 이용하여 마스킹 문턱치를 재설정한다. 하기 〈수학식 2〉는 상기 심리음향부에서 마스킹 문턱치를 재설정하는 수식을 나타낸다.Hereinafter, a process of generating a mask threshold in the psychoacoustic unit 100 will be described. The psychoacoustic unit 100 bundles the audio signals converted from the time domain into the frequency domain by the time / frequency mapping unit 102 into signals of an appropriate scale factor band, and due to the interaction of the respective signals. Masking thresholds in each scale factor band are calculated using the generated masking phenomenon. The masking threshold is reset using the calculated masking threshold and the gain in each received subband. Equation 2 below represents an equation for resetting a masking threshold in the psychoacoustic unit.

mask'[i]= mask[i]*((max_gain)/(gain(i))mask '[i] = mask [i] * ((max_gain) / (gain (i))

상기 mask'[i]는 재설정된 마스킹 문턱치를 나타내며, 상기 mask[i]는 재설정 이전의 마스킹 문턱치를 의미한다. 상기 "i"는 i번째 서브밴드를 의미하며, 상기 (max_gain)는 전달받은 서브밴드의 이득 중 가장 높은 이득 값을 나타낸다. 상 기 gain(i)은 i번째 서브밴드에서의 이득 값을 나타낸다. The mask '[i] represents a reset masking threshold and the mask [i] represents a masking threshold before resetting. "I" denotes the i-th subband, and (max_gain) represents the highest gain value among the gains of the received subband. The gain (i) represents a gain value in the i th subband.

상기한 바와 같이 마스킹 문턱치를 재설정함으로서 상기 재설정된 마스킹 문턱치은 이전 값보다 높은 값을 갖게 된다. 상기 재설정된 마스킹 문턱치를 이용하여 상기 전달받은 신호에 대한 부호화 과정을 수행한다. By resetting the masking threshold as described above, the reset masking threshold has a higher value than the previous value. An encoding process is performed on the received signal using the reset masking threshold.

도 7은 본 발명에 따른 재설정된 마스킹 문턱치를 이용하여 전달받은 신호를 부호화 과정을 나타내고 있다. 상기 도 7은 상기 도 3과 같이 서브밴드 3에 한정하여 부호화할 신호가 전달된 경우를 가정한다. 상기 도 7은 재설정되지 않은 마스킹 문턱치와 재설정된 마스킹 문턱치를 이용하여 부호화 과정을 설명하고 있다. 이하 먼저 일예를 들어 재설정되는 마스킹 문턱치에 대해 설명하기로 한다. 상기 전달받은 신호는 서브밴드 1 내지 서브밴드 4로 구성되는 경우를 가정한다.7 illustrates a process of encoding a received signal using a reset masking threshold according to the present invention. FIG. 7 assumes a case in which a signal to be encoded is limited to subband 3 as shown in FIG. 3. FIG. 7 illustrates an encoding process by using a non-reset masking threshold and a reset masking threshold. Hereinafter, the masking threshold to be reset will be described as an example. It is assumed that the received signal is composed of subbands 1 to 4.

이득benefit 서브밴드1Subband 1 100100 서브밴드2Subband 2 9090 서브밴드3Subband 3 8585 서브밴드4Subband 4 8080

상기 〈표 1〉과 같이 각 서브밴드에 따른 이득을 전달받은 경우 상기 심리음향부는 상기 〈수학식 2〉에 하기 〈표 2〉와 같이 마스킹 임계치를 재설정한다. When the gain according to each subband is received as shown in Table 1, the psychoacoustic unit resets the masking threshold as shown in Table 2 below in Equation 2.

재설정 이전 마스킹 임계치Masking threshold before reset 재설정 이후 마스킹 임계치Masking Threshold After Reset 서브밴드1Subband 1 mask[1]mask [1] mask[1}*(100/100)mask [1} * (100/100) 서브밴드2Subband 2 mask[2]mask [2] mask[2]*(100/90)mask [2] * (100/90) 서브밴드3Subband 3 mask[3]mask [3] mask[3]*(100/85)mask [3] * (100/85) 서브밴드4Subband 4 mask[4]mask [4] mask[4]*(100/80)mask [4] * (100/80)

상기 〈표 2〉와 같이 재설정 이후의 마스킹 임계치가 재설정 이전의 마스킹 임계치보다 크게 설정됨을 알 수 있다. 다만 최대 이득을 갖는 서브밴드1에 대한 마스킹 임계치만 동일하게 재설정된다.As shown in Table 2, it can be seen that the masking threshold value after reset is set to be larger than the masking threshold value before reset. Only the masking threshold for subband 1 having the maximum gain is reset the same.

상기 도 7에서 보이고 있는 바와 같이 서브밴드3에 있는 두 개의 신호성분은 재설정 이전의 마스킹 임계치보다 높은 값을 가짐을 알 수 있다. 따라서 상기 부호호부는 서브밴드3에 위치한 두 개의 신호성분에 대해 부호화 과정을 수행하여야 한다. 하지만 종래기술에서 설명한 바와 같이 두 개의 신호성분 모두를 전송할 정도의 비트율이 보장되지 않는 경우 상기 부호화부는 상기 서브밴드3에 위치하고 있는 두 개의 신호성분 모두에 대해 부호화 과정을 수행하지 않는다.As shown in FIG. 7, it can be seen that the two signal components in subband 3 have a value higher than the masking threshold before resetting. Therefore, the code part must perform an encoding process on two signal components located in subband 3. However, as described in the related art, when a bit rate that is sufficient to transmit both signal components is not guaranteed, the encoder does not perform an encoding process on both signal components located in the subband 3.

하지만 재설정된 마스킹 임계치에 의하면 서브밴드3에 위치하고 있는 두 개의 신호성분 중에서 하나의 신호성분만이 상기 마스킹 임계치보다 큰 값을 가짐을 알 수 있다. 따라서 상기 부호화부는 상기 재설정된 마스킹 임계치보다 큰 값을 갖는 신호성분에 대해서만 부호화 과정을 수행한다. 상기 부호화부는 상기 재설정된 마스킹 임계치보다 작은 값을 갖는 신호성분에 대해서는 부호화 과정을 수행하지 않는다. 상기 재설정된 마스킹 임계치보다 큰 값을 갖는 신호성분에 대해서만 부호화 과정을 수행함으로서 제한된 비트율 하에서도 음성 신호를 전송할 수 있게 된다.However, according to the reset masking threshold, only one signal component among two signal components located in subband 3 has a value greater than the masking threshold. Accordingly, the encoder performs an encoding process only on signal components having a value larger than the reset masking threshold. The encoder does not perform an encoding process on a signal component having a value smaller than the reset masking threshold. By performing the encoding process only on signal components having a value greater than the reset masking threshold, the voice signal can be transmitted even under a limited bit rate.

전술한 바와 같이 본 발명은 서브밴드 이득을 이용하여 오디오 부호화에 적용해 압축효율을 높이고, 부호화된 신호의 밴드폭을 일정하게 유지한다. 또한 부호화된 밴드폭을 일정하게 유지함으로서 음질의 열화현상을 최소화한다. 본 발명은 또한 저비트율이 요구되는 오디오 부호화기에 사용함으로서 효율적으로 오디오 신호를 전송할 수 있다.As described above, the present invention increases the compression efficiency by applying the subband gain to audio encoding and keeps the bandwidth of the encoded signal constant. In addition, the degradation of sound quality is minimized by keeping the encoded bandwidth constant. The present invention can also efficiently transmit an audio signal by using it in an audio encoder requiring a low bit rate.

Claims (10)

오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송하는 방법에 있어서,A method for allocating audio signals to at least two subbands having a specific frequency domain and encoding and transmitting audio signals when a gain of the audio signals allocated to each subband exceeds a masking threshold, 상기 각 서브밴드에 할당된 오디오 신호들의 이득들을 측정하고, 상기 측정된 이득들에 따라 최대 이득을 가지는 서브밴드의 중요도에 대한 각 서브밴드의 중요도를 나타내는 형성함수(Shapping Function)를 이용한 하기 수학식에 의해 상기 오디오 신호를 재조정하는 과정과, The following equations are used to measure the gains of the audio signals assigned to each subband, and a shaping function indicating the importance of each subband relative to the importance of the subband having the maximum gain according to the measured gains. Re-adjusting the audio signal by 상기 측정된 이득들에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하고, 상기 재설정된 마스킹 문턱치를 초과하는 이득을 가지는 재조정된 오디오 신호만을 부호화하는 과정으로 이루어짐을 특징으로 하는 상기 방법.And resetting a masking threshold of each subband in inverse proportion to the measured gains, and encoding only a readjusted audio signal having a gain exceeding the reset masking threshold.  X_freq'[i]=w(i)*X_freq[i] X_freq '[i] = w (i) * X_freq [i] X_freq'[i]: 형성함수에 의해 재조정된 신호 X_freq '[i]: Signal readjusted by the shaping function w(i) : 형성함수 w (i): formation function X_freq[i] : 재조정되기 이전 신호 X_freq [i]: signal before readjustment i: 서브밴드 지시자i: subband indicator 삭제delete 삭제delete 제 1항에 있어서, 상기 각 서브밴드의 마스킹 문턱치를 재설정하는 과정은, 하기 수학식에 의해 결정함을 특징으로 하는 상기 방법.The method as claimed in claim 1, wherein the resetting of the masking thresholds of the subbands is determined by the following equation. mask'[i]= mask[i]*((max_gain)/(gain(i)) mask '[i] = mask [i] * ((max_gain) / (gain (i)) mask'[i] : 재설정된 마스킹 문턱치mask '[i]: reset masking threshold mask[i] : 재설정 이전의 마스킹 문턱치mask [i]: masking threshold before reset max_gain : 최대 이득max_gain: maximum gain gain(i) : i번째 서브밴드의 이득gain (i): gain of the i-th subband 제 1항에 있어서, 상기 각 서브밴드에 포함되는 오디오 신호들 중 하나의 신호만이 재설정된 마스킹 문턱치를 초과함을 특징으로 하는 상기 방법.The method as claimed in claim 1, wherein only one of the audio signals included in each subband exceeds the reset masking threshold. 오디오 신호들을 특정 주파수 영역을 갖는 적어도 두 개의 서브밴드에 할당하고, 상기 각 서브밴드에 할당된 오디오 신호의 이득이 마스킹 문턱치를 초과하면 부호화하여 전송하는 장치에 있어서,10. An apparatus for allocating audio signals to at least two subbands having a specific frequency domain, and encoding and transmitting audio signals when a gain of the audio signal allocated to each subband exceeds a masking threshold. 상기 각 서브밴드에 할당된 오디오 신호들의 이득들을 측정하고, 상기 측정된 이득들에 따라 최대 이득을 가지는 서브밴드의 중요도에 대한 각 서브밴드의 중요도를 나타내는 형성함수(Shapinf Function)를 이용한 하기 수학식에 의해 상기 오디오 신호를 재조정하는 심리 음향부와, The following equations are used to measure the gains of the audio signals allocated to the respective subbands, and use the Shape function to indicate the importance of each subband relative to the importance of the subband having the maximum gain according to the measured gains. A psychoacoustic unit which readjusts the audio signal by 상기 측정된 이득들에 반비례하여 각 서브밴드들의 마스킹 문턱치를 재설정하는 형성함수 생성부와, A shaping function generator that resets masking thresholds of the subbands in inverse proportion to the measured gains; 상기 재설정된 마스킹 문턱치를 초과하는 이득을 가지는 재조정된 오디오 신호만을 부호화하도록 출력하는 형성부를 포함함을 특징으로 하는 상기 장치.And a forming unit for outputting only the readjusted audio signal having a gain exceeding the reset masking threshold. X_freq'[i]=w(i)*X_freq[i] X_freq '[i] = w (i) * X_freq [i] X_freq'[i]: 형성함수에 의해 재조정된 신호 X_freq '[i]: Signal readjusted by the shaping function w(i) : 형성함수 w (i): formation function X_freq[i] : 재조정되기 이전 신호 X_freq [i]: signal before readjustment i: 서브밴드 지시자 i: subband indicator 삭제delete 삭제delete 제 6항에 있어서, 상기 형성부는,The method of claim 6, wherein the forming unit, 하기 수학식에 의해 상기 마스킹 문턱치를 재설정하고, 상기 재설정된 마스킹 문턱치를 초과하는 오디오 신호만을 부호화하도록 출력함을 특징으로 하는 상기 장치.And resetting the masking threshold by the following equation and outputting only the audio signal exceeding the reset masking threshold. mask'[i]= mask[i]*((max_gain)/(gain(i))mask '[i] = mask [i] * ((max_gain) / (gain (i)) mask'[i] : 재설정된 마스킹 문턱치mask '[i]: reset masking threshold mask[i] : 재설정 이전의 마스킹 문턱치mask [i]: masking threshold before reset max_gain : 최대 이득max_gain: maximum gain gain(i) : i번째 서브밴드의 이득gain (i): gain of the i-th subband 제 6항에 있어서, 상기 형성함수 생성부는,The method of claim 6, wherein the formation function generating unit, 각 서브밴드에 포함되는 오디오 신호들 중 하나의 신호만이 재설정된 마스킹 문턱치를 초과하도록 형성함수를 생성함을 특징으로 하는 상기 장치.And wherein only one of the audio signals included in each subband generates a shaping function to exceed the reset masking threshold.
KR1020030088379A 2003-12-06 2003-12-06 Apparatus and method for coding of audio signal KR100713452B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030088379A KR100713452B1 (en) 2003-12-06 2003-12-06 Apparatus and method for coding of audio signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030088379A KR100713452B1 (en) 2003-12-06 2003-12-06 Apparatus and method for coding of audio signal

Publications (2)

Publication Number Publication Date
KR20050054745A KR20050054745A (en) 2005-06-10
KR100713452B1 true KR100713452B1 (en) 2007-05-02

Family

ID=37249986

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030088379A KR100713452B1 (en) 2003-12-06 2003-12-06 Apparatus and method for coding of audio signal

Country Status (1)

Country Link
KR (1) KR100713452B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101764926B1 (en) 2009-12-10 2017-08-03 삼성전자주식회사 Device and method for acoustic communication

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5632003A (en) 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US20020029143A1 (en) 1998-12-28 2002-03-07 Lin Yin System and method for effectively implementing fixed masking thresholds in an audio encoder device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5632003A (en) 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US20020029143A1 (en) 1998-12-28 2002-03-07 Lin Yin System and method for effectively implementing fixed masking thresholds in an audio encoder device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
허영대 등,"웨이브릿 변환 및 M-채널 서브밴드 QMF 필*

Also Published As

Publication number Publication date
KR20050054745A (en) 2005-06-10

Similar Documents

Publication Publication Date Title
US7627480B2 (en) Support of a multichannel audio extension
RU2197776C2 (en) Method and device for scalable coding/decoding of stereo audio signal (alternatives)
US6122618A (en) Scalable audio coding/decoding method and apparatus
EP1673764B1 (en) Method for encoding a digital signal into a scalable bitstream, method for decoding a scalable bitstream
US6098039A (en) Audio encoding apparatus which splits a signal, allocates and transmits bits, and quantitizes the signal based on bits
US8457319B2 (en) Stereo encoding device, stereo decoding device, and stereo encoding method
JP3446216B2 (en) Audio signal processing method
KR100310216B1 (en) Coding device or method for multi-channel audio signal
EP0918401A2 (en) Scalable audio encoding/decoding method and apparatus
KR20070083997A (en) Encoder, decoder, encoding method, and decoding method
JP2000101436A (en) Method and device for coding decoding audio signal
KR100979624B1 (en) Audio encoding device and audio encoding method
KR101033256B1 (en) Scale factor based bit shifting in fine granularity scalability audio coding
JP4063508B2 (en) Bit rate conversion device and bit rate conversion method
KR100923297B1 (en) Method for encoding stereo audio, apparatus thereof, method for decoding audio stream and apparatus thereof
JP4618873B2 (en) Audio signal encoding method, audio signal encoding device, music distribution method, and music distribution system
KR100713452B1 (en) Apparatus and method for coding of audio signal
JP3336619B2 (en) Signal processing device
JP2002268694A (en) Method and device for encoding stereophonic signal
JP3134363B2 (en) Quantization method
KR100827458B1 (en) Method for audio signal coding
JP3528260B2 (en) Encoding device and method, and decoding device and method
KR0144935B1 (en) Coding and decoding apparatus for bit rate
KR970006827B1 (en) Audio signal encoding apparatus
Yang et al. Embedded high-quality multichannel audio coding

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
J201 Request for trial against refusal decision
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20060331

Effective date: 20070227

S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee