KR970005829B1 - 오디오 서브밴드 코더의 비트율 변환방법 - Google Patents

오디오 서브밴드 코더의 비트율 변환방법 Download PDF

Info

Publication number
KR970005829B1
KR970005829B1 KR1019930024998A KR930024998A KR970005829B1 KR 970005829 B1 KR970005829 B1 KR 970005829B1 KR 1019930024998 A KR1019930024998 A KR 1019930024998A KR 930024998 A KR930024998 A KR 930024998A KR 970005829 B1 KR970005829 B1 KR 970005829B1
Authority
KR
South Korea
Prior art keywords
bit rate
subband
bit
snr
converted
Prior art date
Application number
KR1019930024998A
Other languages
English (en)
Other versions
KR950015330A (ko
Inventor
황성배
Original Assignee
엘지전자 주식회사
구자홍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사, 구자홍 filed Critical 엘지전자 주식회사
Priority to KR1019930024998A priority Critical patent/KR970005829B1/ko
Publication of KR950015330A publication Critical patent/KR950015330A/ko
Application granted granted Critical
Publication of KR970005829B1 publication Critical patent/KR970005829B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

내용 없음.

Description

오디오 서브밴드 코더의 비트율 변환방법
제1도는 종래의 서브밴드 엔코더 구성도.
제2도는 제1도에 있어서, 신호대 잡음비(SNR) 도표.
제3도는 서브밴드 디코더의 기본구조도.
제4도는 비트율 변환을 가진 서브밴드 디코더의 기본구조도.
제5도는 본 발명 오디오 서브밴드 코더의 비트율 변환방법에 대한 동작 흐름도.
* 도면의 주요부분에 대한 부호의 설명
1 : 필터뱅크 2,14 : 비트할당기
3 : 싸이코더코스틱 모델부 4,16 : 비트스트림 포맷터
11 : 프레임 언패킹부 12 : 복원부
13 : 인버스 매핑부 15 : 양자화기
본 발명은 싸이코어코스틱 모델(psychoacoustic model)을 이용하여 적당한 비트할당이 되어 포맷팅된 비트스트림을 새로운 비트율(bitrate)로 변환시켜 주도록 한 오디오 서브밴드 코더의 비트율 변환방법에 관한 것으로, 특히 오디오신호의 디코딩, 엔코딩을 거치지 않고 곧바로 비트율을 변환시켜주도록 한 오디오 서브밴드 코더의 비트율 변환방법에 관한 것이다.
종래의 서브밴드 엔코더 구성도는 제1도에 도시한 바와 같이 입력되는 디지탈 오디오(Digital Audio)입력을 N개의 밴드패스필터로 통과시켜 N개의 서브밴드 신호로 만들어 출력시키는 필터뱅트(1)와, 상기 입력되는 디지탈 오디오신호를 인간의 청각특성을 이용하여 각 서브밴드의 마스킹(Masking)레벨 또는 SMR(Signal to Mask Ratio)를 결정하는 싸이코어코스틱 모델부(3)와, 상기 싸이코어코스틱 모델부(3)를 통해 계산된 마스킹레벨을 이용하여 각 서브밴드의 비트를 할당함과 아울러 양자화하여 출력시키는 비트할당기(2)와, 상기 비트할당기(2)를 통해 할당된 비트데이타에 대해 출력에 맞도록 포맷팅하여 출력시키는 비트스트림 포맷터(4)로 구성된다.
이와 같이 구성된 종래의 기술에 대하여 살펴보면 다음과 같다.
디지틀 오디오신호가 입력된 필터뱅크(1)에서는 이 신호를 N개의 밴드패스필터로 필터링하여 각각의 서브밴드로 분할시켜 출력시키고, 싸이코어코스틱 모델부(3)에서는 인간의 청각특성(20Hz-20KHz)을 이용하여 FFT(Fast Furier Transform)변환으로서 각 서브밴드의 마스킹레벨(Masking Level) 또는 SNR(Signal to Mask Ratio)을 구하여 이 값을 비트할당기(2)로 출력시킨다. 즉, 각 서브밴드의 신호에 대해 일반적으로 들을 수 없는 마스크(mask)되는 양의 비를 출력하는 것이다. 따라서 양자화 노이즈를 이 마스크되는 양보다 작게 할 경우 양자화 노이즈가 들리지 않아 깨끗한 오디오를 기대할 수 있다.
비트할당 과정은 다음과 같다.
상기 싸이코어코스틱 모델부(3)에서 구한 각 서브밴드의 SMR에 대해 다음식으로 MNR(Mask-to-Noise Ratio)를 구한다.
여기서 SNR은 제2도에 도시된 표에 나타나 있다.
초기에는 모든 서브밴드에 비트가 하나도 할당되지 않았으므로 SNR은 0이 된다. 다음으로 모든 서브밴드중 최소의 MNR값을 갖는 서브밴드를 찾고 그 서브밴드에 비트를 할당(또는 양자화 스텝수 증가)한다. 그리고 할당된 비트에 따른 SNR값을 찾아 다시 MNR값을 계산하고 상기 과정을 되풀이 한다.
일반적으로 모든 서브밴드의 MNR값이 0보다 클 경우 양자화 노이즈가 마스크되는 양보다 작게되므로 노이즈가 들리지 않게 된다.
이상에서 비트율(bitrate)은 비트할당 과정에 제한을 가하여 어느 수준에서 비트할당을 멈추게 만든다. 이렇게 하여 만들어진 비트할당 정보와 할당된 비트로 각 서브밴드 샘플을 양자화한 값들은 비트스트림 포맷터(4)로 전송하면 이 전송된 값들은 비트스트림 포맷터(4)에 의해 출력에 맞도록 포맷팅하여 출력시킨다. 이와 같이 만들어진 비트스트림에 대해 비트율로 변환시키기 위해서는 다시 그 비트스트림을 디코딩하고, 합성서브밴드필터를 통과시켜 원래의 오디오신호를 복원한 후 다시 엔코딩과정을 거쳐 만들어야 한다.
그러나 이와 같은 종래의 기술에 있어서, 엔코딩(encoding)과 디코딩(decoding)을 다시 수행하여 비트율을 변화시키는 것은 매우 비효율적인 방법으로 엔코더 뿐만 아니라 디코더부분의 계산량도 매우 많기때문에 시스템이 복잡해질 뿐만 아니라 시간도 많이 걸리고 계산로드(load)도 많이 걸리는 문제점이 있었다.
따라서 종래의 문제점을 해결하기 위하여 본 발명은 서브밴드 필터를 통과시켜 비트할당을 한 후 포맷팅된 비트스트림을 저장 또는 전송하기 위해 비트율을 변화시킬 필요가 있을 때 보다 쉽게 비트율을 변환시킬 수 있는 오디오 서브밴드 코더의 비트율 변환방법을 창안한 것으로, 이하 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다.
제4도는 비트율 변환을 가진 서브밴드 디코더의 기본구조도로서 이에 도시한 바와 같이 엔코드된 비트스트림이 입력되면 그 비트스트림을 해석하는 프레임 언패킹(frame unpacking)부(11)와, 상기 프레임 언패킹부(11)에서 해석한 값을 이용하여 각 서브밴드 샘플들의 값을 복원하는 복원부(12)와, 상기 프레임 언패킹부(11)에서 해석한 값을 이용하여 외부에서 원하는 비트율에 따라 비트를 할당하여 출력하는 비트할당기(14)와, 상기 복원부(12)를 통한 각 서브밴드 샘플들을 합성필터뱅크를 통과시켜 오디오신호를 복원하는 인버스매핑(inverse mapping)부(13)와, 상기 복원부(12) 및 비트할당기(14)를 통해 새로 할당된 비트로 양자화하는 양자화부(15)와, 상기 양자화부(15)를 통해 양자화된 값을 출력에 맞도록 포맷팅하여 새로운 비트율로 출력하는 비트스트림 포맷터(16)로 구성한다.
이와 같이 구성된 본 발명의 작용 및 효과에 대하여 상세히 설명하면 다음과 같다.
먼저 하이(high) 비트율을 로우(low) 비트율로 변환할 경우 하이비트율로 엔코드된 신호를 로우 비트율로 변환시키기 위해서는 각 서브밴드에 할당된 비트수를 줄여야 한다. 각 서브밴드에 대한 비트할당은 앞에서 언급한 바와 같이 비트를 증가시킴으로써 최대 이익을 얻을 수 있는, 즉 최소 MNR값을 갖는 서브밴드에 우선적으로 할당한다.
MNR=SNR-SMR[dB]
따라서 로우 비트율로 변화시키기 위해서도 상기 식을 이용할 수 있을 경우 싸이코어코스틱 모델의 장점을 이용할 수 있을 것이다. 그러나 싸이코어코스틱 모델의 출력(SMR)은 이미 엔코드된 비트 스트림을 가지고는 알아낼 수 없다. 따라서 비트스트림을 디코딩하여 원 오디오신호를 뽑아낸 후 다시 엔코딩하는 경우에만 SMR을 다시 구할 수 있으나 이는 매우 번거로운 일이다.
그런데 하이 비트율 코딩의 경우 MNR값은 대개 0보다 크게 된다. 이는 즉, 모든 양자화 노이즈가 마스크 되었음을 의미하는 것이다.
따라서 로우 비트율로 변환시키기 위한 첫번째 가정으로 모든 서브밴드에 대해 MNR=0 즉,
를 사용할 수 있다.
다음에 비트 할당된 모든 서브밴드에 대해 한 단계 낮은 비트할당에 해당하는 SNR을 제2도에 나타낸표를 이용하여 구한 후 새MNR, MNR=SNR-SMR을 구한다.
이중에서 가장 큰 MNR값을 갖는 서브밴드 n을 찾고 n 서브밴드의 할당 비트수를 이 SNR에 맞춘다. n번째 서브밴드에 대해 다시 한 단계 낮은 비트할당에 대한 SNR을 구하고 다시 MNR값을 구한다. 이와 같은 과정을 요구되는 변환 비트율을 충족시켜 줄때까지 반복한다.
이보다 앞서 낮은 비트율에서는 원래 사용하지 않는 서브밴드가 있을경우 이를 먼저 제거해야 함은 당연한 일이다. 이렇게해서 할당과정이 모두 끝나게 되면 원래의 양자화된 서브밴드 샘플들을 디코딩한 후 다시 새로이 할당된 비트로 양자화하여 포맷팅을 하여준다.
상기에서와 같이 비트율을 변환시키기 위한 비트할당 과정을 제5도를 참조하여 살펴보자.
면저 변환될 로우(low) 비트율에서 사용하지 않는 서브밴드를 제거한 후 변환될 로우 비트율을 만족시키는가를 체크한다(제1단계). 상기에서 그 변환될 로우 비트율을 만족하지 않으면 모든 비트할당된 서브밴드에 대해 초기상태를 MNR=0(즉 SMR=SNR)으로 가정하고 만족하면 끝낸다(제2단계). 모든 비트할당된 서브밴드에 대해 한 단계 낮은 비트로 임시할당하여 SNR을 구하여 MNR(=SNR-SMR[dB])을 구한다(제3단계).
상기에서 구한값중 최대 MNR값을 갖는 서브밴드(n)를 찾고 그 서브밴드(n)의 할당비트수를 제3단계에서 구한 일시 할당비트수로 변환시켜 변환될 로우 비트율을 만족시키는가를 체크(제4단계)하여 만족하면 할당과정을 끝내고 만족하지 않으면 상기 서브밴드(n)에 대해 한단계 낮은 비트로 임시 할당하고 제3단계로 되돌아가 SNR을 구한다(제5단계).
그리고 로우 비트율에서 하이 비트율로 변환할 경우 로우 비트율로 이미 코딩된 신호를 하이 비트율로 변환시킨다고 하여 음질이 향상되지 않으므로 하이 비트율로 변환시킬 경우 각 서브밴드에 할당된 비트를 바꿀 필요가 없다. 이때는 로우 비트율과 하이 비트율의 헤더(header)중 다른 부분이 있을경우 이를 바꾸어주고, 첨가되어야 할 비트할당 영역이 있을 경우 이를 0으로 세트시킨다. 그리고 서브밴드 샘플영역은 바꿀 필요가 없다.
로우 비트율을 하이 비트율로 변환시켜 주기위해 서브밴드 샘플 이후의 부가 데이타영역을 넓게 잡아 더미(dummy) 데이타를 넣어 비트율을 맞추어 주면 된다.
이상에서와 같은 비트율 변환장치를 제3도에 도시한 디코더의 기본구조에 삽입할 경우 그 구성은 이미 앞에서 설명한 제4도와 같고 그 작용 및 효과에 대해 설명하면 다음과 같다.
엔코드된 비트스트림이 입력되면 프레임 언패킹부(11)에서 엔코드된 비트스트림을 해석하여 복원부(12)와 비트할당기(14)로 각각 출력한다. 이에 따라 상기 복원부(12)는 상기 프레임 언패킹부(11)에서 해석한 값을 이용하여 각 서브밴드 샘플들의 값을 복원하고, 상기 비트할당기(14)는 라인(L1)을 통해서 변환될 비트율이 입력될 수 있다. 이렇게 입력값이 들어오면 그 값에 대해 비트할당을 하여 출력한다.
필요할 경우 즉, 로우 비트율로 변환시켜서 할당비트수가 줄어든 경우에는 상기 복원부(12)의 출력라인을 통해 역양자화된 값이 입력되어 양자화기(15)에서 새 할당비트로 양자화가 일어나고, 나머지 경우는 비트할당개(14)의 출력라인을 통해 양자화기(15)를 통과한다. 이와 같이 양자화된 출력은 최종적으로 비트스트림포맷터(16)에서 새로운 비트율로 포맷팅되어 새롭게 엔코드된 비트스트림을 출력한다.
이상에서 상세히 설명한 바와 같이 본 발명은 오디오신호의 디코딩이나 엔코딩을 거치지 않고 곧바로 비트율을 변환시켜주도록 함으로써 보다 용이하게 변환이 가능하도록 한 효과가 있다.

Claims (1)

  1. 변환될 로우(low) 비트율에서 사용하지 않는 서브밴드를 제거한 후 변환될 로우 비트율을 만족시키는가를 체크하는 제1단계와, 상기 제1단계에서 변환될 로우 비트율을 만족하지 않으면 초기상태를 MNR=0(즉 SMR=SNR)으로 가정하는 제2단계와, 상기 제2단계에서 모든 비트할당된 서브밴드에 대해 한 단계 낮은 비트로 임시할당하여 SNR을 구하여 MNR(=SNR-SMR[dB])을 구하는 제3단계와, 상기 제3단계에서 구한값중 최대 MNR값을 갖는 서브밴드(n)을 찾고 그 서브밴드(n)의 할당비트수를 제3단계에서 구한 임시 할당비트수로 변환시켜 변환될 로우 비트율을 만족시키는가를 체크하는 제4단계와 상기 제4단계에서 만족하면 할당과정을 끝내고 만족하지 않으면 상기 서브밴드(n)에 대해 한단계 낮은 비트로 임시 할당하고 제3단계로 되돌아가 SNR을 구하는 제5단계로 이루어짐을 특징으로 하는 오디오 서브밴드 코더의 비트율 변환방법.
KR1019930024998A 1993-11-23 1993-11-23 오디오 서브밴드 코더의 비트율 변환방법 KR970005829B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019930024998A KR970005829B1 (ko) 1993-11-23 1993-11-23 오디오 서브밴드 코더의 비트율 변환방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019930024998A KR970005829B1 (ko) 1993-11-23 1993-11-23 오디오 서브밴드 코더의 비트율 변환방법

Publications (2)

Publication Number Publication Date
KR950015330A KR950015330A (ko) 1995-06-16
KR970005829B1 true KR970005829B1 (ko) 1997-04-21

Family

ID=19368726

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019930024998A KR970005829B1 (ko) 1993-11-23 1993-11-23 오디오 서브밴드 코더의 비트율 변환방법

Country Status (1)

Country Link
KR (1) KR970005829B1 (ko)

Also Published As

Publication number Publication date
KR950015330A (ko) 1995-06-16

Similar Documents

Publication Publication Date Title
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
KR100458969B1 (ko) 신호부호화또는복호화장치,및신호부호화또는복호화방법
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
US6295009B1 (en) Audio signal encoding apparatus and method and decoding apparatus and method which eliminate bit allocation information from the encoded data stream to thereby enable reduction of encoding/decoding delay times without increasing the bit rate
JP3277692B2 (ja) 情報符号化方法、情報復号化方法及び情報記録媒体
JP3186292B2 (ja) 高能率符号化方法及び装置
WO2005096274A1 (fr) Dispositif et procede de codage/decodage audio ameliores
KR100695125B1 (ko) 디지털 신호 부호화/복호화 방법 및 장치
RU2099906C1 (ru) Способ сокращения данных при передаче и/или накоплении цифровых сигналов
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
WO1995012920A1 (fr) Codeur de signaux, decodeur de signaux, support d'enregistrement et procede de codage de signaux
JP2776300B2 (ja) 音声信号処理回路
US6161088A (en) Method and system for encoding a digital audio signal
KR970005829B1 (ko) 오디오 서브밴드 코더의 비트율 변환방법
JPH0537395A (ja) 帯域分割符号化方法
JP3465697B2 (ja) 信号記録媒体
KR100287861B1 (ko) 디지탈 오디오 스테레오 모드에서의 각 채널 비균등 비트할당 장치 및 방법
JP3465698B2 (ja) 信号復号化方法及び装置
JPH0750589A (ja) サブバンド符号化装置
KR0121164B1 (ko) 고음질 오디오 데이타의 압축/복원을 위한 실시간 시스템 및 그의 부호화/복호화 방법
KR100204471B1 (ko) 디지탈 오디오 부호화기의 비트 할당 장치
JP3352401B2 (ja) オーディオ信号の符号化及び複号化方法及び装置
KR0144841B1 (ko) 음향신호의 적응적 부호화 및 복호화장치
KR100340368B1 (ko) 고능률부호화장치,복호화장치및디지털데이터도출방법

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee