KR960012476B1 - 디지탈 오디오 부호화 장치의 프레임별 비트 할당장치 - Google Patents

디지탈 오디오 부호화 장치의 프레임별 비트 할당장치 Download PDF

Info

Publication number
KR960012476B1
KR960012476B1 KR1019940000740A KR19940000740A KR960012476B1 KR 960012476 B1 KR960012476 B1 KR 960012476B1 KR 1019940000740 A KR1019940000740 A KR 1019940000740A KR 19940000740 A KR19940000740 A KR 19940000740A KR 960012476 B1 KR960012476 B1 KR 960012476B1
Authority
KR
South Korea
Prior art keywords
frame
value
bits
amount
cognitive information
Prior art date
Application number
KR1019940000740A
Other languages
English (en)
Other versions
KR950024449A (ko
Inventor
김종일
Original Assignee
대우전자 주식회사
배순훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대우전자 주식회사, 배순훈 filed Critical 대우전자 주식회사
Priority to KR1019940000740A priority Critical patent/KR960012476B1/ko
Publication of KR950024449A publication Critical patent/KR950024449A/ko
Application granted granted Critical
Publication of KR960012476B1 publication Critical patent/KR960012476B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Abstract

요약없음

Description

디지탈 오디오 부호화 장치의 프레임별 비트 할당장치
도면 1은 일반적인 디지탈 오디오 부호기를 개략적으로 도시한 블럭도.
도면 2는 본 발명에 따른 디지탈 오디오 부호화 장치의 프레임별 비트 할당장치를 도시한 블럭도.
도면 3은 도면 2에 도시된 1프레임군(1GOF)부를 나타내는 도면.
도면 4는 본 발명의 인지 정보량(PE1)(X축) 대 프레임 비트 할당 상태(index)(Y축)를 도시한 그라프.
* 도면의 주요부분에 대한 부호의 설명
210 : 프레임군부220 : 인지 정보량 계산부
230 : 적응적 프레임 비트 할당부240 : 부호기
250 : MUX
본 발명은 디지털 오디오 부호기(digital audio coder)에 관한 것으로, 특히, 입력되는 오디오 신호를 인지간의 인지 정보량(perceptual entropy ; PE)에 따라 1프레임군내의 각 프레임(frame)마다 적응적으로 비트를 할당하여 부호화하는 디지탈 오디오 부호화 장치의 프레임별 비트 할당 장치에 관한 것이다.
현재 실용화되어 있는 컴팩트 디스크(compact disk : CD) 및 디지탈 오디오 테이프 레코더(digital audio tape recoder : DAT) 등과 같은 음질 수준의 신호 재생을 목표 개발중에 있는 고화질 텔레비젼(HDTV)정보 전송 시템에서는 비교적 좁은 6MHz의 전송선로를 통하여 영상 및 오디오 신호를 전송하여야 하기 때문에 영상 신호에서와 마찬가지로 오디오 신호에 대해서도 효율적인 신호 압축 기법이 요구되어 왔다.
이를 위하여 인간의 청각 특성을 반영하는 적응적 변환 부호화(adaptive transform coding) 기법을 이용하여 낮은 전송률에서 비교적 간단한 수신기로도 디지탈 오디오 기기 수준의 음질을 재생할 수 있는 HDTV용 고음질 디지탈 오디오 신호 처리 기술의 알고리즘 및 하드웨어 구현을 위한 연구가 활발히 진행 되고 있다. 전술한 적응적 변환 부호화 기법으로서, 널리 알려진 디지탈 오디오 부호기의 선행기술이 도면 1에 도시되어 있다.
이러한 전형적인 종래의 디지탈 오디오 부호기는 디지탈 오디오 신호를 입력하고, 입력된 디지탈 오디오 신호를 직교 대칭 필터(quadrature mirror filter : QMF)를 이용하여 1프레임(one frame)에 대해 저주파에서 고주파 영역으로 32개의 동일한 주파수 대역으로 대역 분할하는 대역 분할 필터부(subband filter)(110)와, 역시 전술한 디지탈 오디오 신호를 입력하여 고속 퓨리어 변환(fast fourier transform ; FFT)을 통해 입력 신호의 전력 스펙트럼(power spectrum)으로부터 1프레임 단위(one frame unit)로 인간의 청각 특성에 부합되는 파라메터(즉, 신호 대 마스킹 비율 : SMR)를 검출하는 심리 음향 모델부(psychoacoustic model part)(120)를 포함한다. 또한, 디지탈 오디오 부호기는 전술한 대역 분할 필터부(110)에서 주파수 대역별로 분할한 32개의 동일 주파수 대역에 대해 심리 음향 모델부(120)에서 검출한 특성 파라메터를 이용하여 각각 적응적으로 비트를 할당하고, 이 할당된 비트에 응답하여 각 대역을 압축 부호화하는 비트 할당 및 양자화부(130)와, 전술한 비트 할당 및 양자화부(130)에서 제공되는 양자화 샘플들과 심리 음향 모델부(120)에서 제공되는 SMR을 입력하여 전송선로의 상태, 저장 매체의 특성, 부호기의 복잡도, 사용자의 요구등에 따라 선택적으로 오디오 서비스를 제공받을 수 있도록 계층(layer) 구조로 포맷팅(formatting)하는 비트 스트림 포맷팅부(140)를 포함한다.
전술한 형태로 구성된 전형적인 종래의 디지탈 오디오 부호기는 32개의 동일 분할 대역을 포함하는 한 프레임에서 전술한 바와같이 각 프레임의 청각 특성에 따라 각 대역별로 비트를 가변적으로 할당하여 양자화하여 부호화를 수행하였다. 즉, 오디오 신호의 시간적 변화에 대한 매 프레임들마다 일정한 비트(예를들면, MPEG에서 제안한 HDTV의 오디오 섹션에서는 1프레임을 3072비트로 설정함)를 사전에 설정하여 비트를 할당하여 부호화를 행하였다. 전술한 바와같이, 선행 기술의 디지탈 오디오 부호화 장치에 있어서 부호화 방식은 각 프레임의 중요도에 따라 적응적으로 비트를 할당하여 부호화를 행하지 않고 단지 인간의 청각 특성을 이용하여 각 프레임의 분할 대역에 적응적으로 비트를 할당하며, 또한 각 프레임마다 일률적으로 중요도를 설정하여 부호화하므로써, 즉, 각 프레임마다의 신호 특성을 전혀 고려치 않고 부호화하므로 고음질을 실현하는데 어느정도 한계가 있었다.
따라서, 본 발명의 목적은 한 프레임군내의 각 프레임에 대한 인지 정보량에 응답하여 각 프레임마다 적응적으로 비트를 할당하여 부호화함으로써 부호화 효율을 증대시키고, 음질을 보다 향상시킨 디지탈 오디오 부호화 장치의 프레임별 비트 할당 장치를 제공하는데 있다.
이러한 목적을 달성하기 위해 본 발명은 다수개의 프레임을 가진 프레임군(group of frame ; GOF)으로 이루어진 디지탈 오디오 신호를 각 프레임에 대해 적응적으로 비트를 할당하여 부호화하는 것으로, 다수개의 프레임을 가진 프레임군을 입력하여 전력 밀도 스펙트럼(power density specthm)을 구하고, 이 전력 밀도 스펙트럼을 이용하여 프레임별 인간의 인지 정보량을 산출하는 인지 정보량 계산부와, 인지 정보량 계산부에서 얻은 인지 정보량에 응답하여 프레임군내의 각 프레임에 적응적으로 비트를 할당하는 적응적 프레임 비트 할당(adptive frame bit allocatiom)부와, 다수개의 프레임을 가진 프레임군을 입력하여 상기 각 프레임에 할당된 비트에 따라 부호화하는 부호기를 제공한다.
이하에서는 도면을 참조하여 본 발명의 바람직한 실시예가 상세하게 설명된다.
도면 2는 본 발명에 따른 디지탈 오디오 부호화 장치의 프레임별 비트 할당 장치를 도시한 블록도로서, 프레임군부(210), 인지 정보량 계산부(220), 적응적 프레임 비트 할당부(230), 제1도에 도시된 통상적인 부호기(240) 및 멀티플렉서(MUX)(250)를 포함한다. 이러한 장치들을 포함하는 오디오 부호화 장치에 의해서 입력되는 프레임군의 디지탈 오디오 신호를 인지 정보량에 의해 각 프레임마다 비트를 적응적으로 할당하여 부호화하므로써 음질을 향상시킬 수가 있게 된다.
즉, 프레임군(GOF)(210)부는 입력되는 디지탈 오디오 신호를 GOF내에 인지 정보량을 산출하기 위해 복수개(에를 들면, M개, 여기서, M은 1프레임군내의 프레임 갯수를 나타냄)의 프레임을 가진 프레임군 단위로 데이타를 분류하여 부호기(240)와 인지 정보량 계산부(220)로 각각 제공한다.
도면 3을 참조하면, 도면 3은 전술한 한개의 GOF 구성을 나타낸 것이다. 도시된 바와같이, 한 프레임은 N개(여기서, N은 양의 정수로서, 샘플수를 나타냄)의 샘플(sample)로 이루어지며, 통상 10msec 내지 약 40msec 단위로 이루어진다. 또한, 도시된 바와같이 1개의 GOF는 M개의 프레임으로 이루어지므로 1개의 GOF는 N×M개의 샘플로 구성된다. 여기서, M값은 비디오 카메라(camera)(도시안됨)로부터 입력되는 영상 신호의 부호화 및 복호화 과정에서 필연적으로 발생되는 지연(delay) 시간에 의해 결정된다.
다시 도면 2를 참조하면, 인지 정보량 계산부(220)는 영상 신호의 부호화 및 복호화 과정의 지연 시간 동안 오디오 신호를 분석하여 인간의 청각 특성에 부합되는 인지 정보량을 산출하므로써, 후술하는 적응적 프레임 비트 할당부(230)는 각 프레임마다 비트 할당량을 달리하여 부호화 효율을 증가시킨다.
이러한 인지 정보량 계산부(220)는 N개의 샘플들로 이루어진 한 프레임의 유한 디지탈 오디오 신호원, 즉, x(n)의 전력 밀도 스펙트럼(Sxx(w))에 의해 인간의 청각 특성을 이용하여 마스킹 문턱치(masking threshold)(M(w))를 구하고, 그 다음, 다음과 같은 식에 의해 인지 정보량을 얻을 수가 있다. 예컨데, 먼저, 한 프레임의 유한 디지탈 오디오 신호원 x(n)에 대한 근사적인 전력 밀도 스펙트럼(power density spectrum ; PDS)(Sxx(w))은 다음 [수식 1]에 의해 구한다.
즉,
[수식 1]
또한, 전술한 M(w)는 Sxx(w)의 전력 밀도 스펙트럼을 갖는 신호에 대하여 소정의 주파수 성분에서 인간의 귀로서는 감지할 수 없는 영역의 전력 값에 해당하므로, 소정의 주파수 성분에 대하여 M(w) 이하의 오차값으로 신호를 재생하면 인간의 귀로서는 그 영역을 감지할 수 없게 되므로, 그 영역, 즉 오차 신호의 전력 밀도 스펙트럼(See(w))을 구하기 위해, 부호기의 입력 신호 x(n), 출력 신호를 y(n)이라 하고, 먼저, 오차 신호 e(n)을 다음식(2)에 의해 구한다.
즉,
[수식 2]
e(n)=x(n)-y(n)
그러므로, N개의 유일한 신호원에 대한 See(w)를 M(w)로 대치하여 인간의 귀로서 오차를 감지할 수 없도록 신호 x(n)을 전송하기 위한 인지 정보량(PPE)은 다음 [수식 4]에 의해 구할 수 있다.
[수식 4]
한편, 마스킹 문턱치 M(w)가 매 프레임마다 동일하고 무한개의 주파수 대역을 갖는 대역 분할 부호기를 이용하는 경우, 이론적으로 실현가능한 최소 비트 전송률은 전술한 [수식 4]의 RPE의 값에 해당한다.
그러나 실제의 오디오 데이타에 대하여 부호기를 구성하는 경우, N개의 샘플을 가진 한 프레임 시간 영역 신호마다 각각의 청각 파라메터를 분석한 후 이에 맞도록 대역 분할된 각 주파수 구간마다 양자화 수준을 달리 이용하고, N개의 샘플마다 변화하는 청각 파라메터를 전송해야 하므로, 실질적으로 필요한 비트 전송률은 전술한 [수식 4]에 의해 산출된 인지 정보량 보다 크게 될 것이다.
예컨대, 입력 신호 x(n)을 L개(여기서, L은 양의 정수)의 균일한 대역폭을 갖는 주파수 대역으로 분할하여 부호화하는 경우, i번째 주파수 대역의 전력 밀도 스펙트럼 Sxx(i) 및 마스킹 문턱치 M(i)는 다음과 같은 [수식 5 및 6]에 의해 근사적으로 구할 수 있다.
즉,
[수식 5]
여기서,
이고
(여기서, π는 3.141597의 상수값을 의미한다.)
이며, R1는 i번째 분할 대역에 해당하는 주파수 영역이고, Sxx(Wj)는 N포인트 이산 퓨리어 변환(discrete fourier transform : DFT)에 있어서 j번째 주파수 성분의 전력 밀도 스펙트럼에 해당하는 값이다.
또한,
[수식 6]
여기서, M(i)는 i번째 분할 대역에 속하는 마스킹 문턱치값 M(w)중 최소값을 나타낸다.
예를 들어, 1024포인트 DFT(즉, L=1024)를 이용하여 전력 밀도 스펙트럼을 구한 후, 32개의 주파수 대역(즉, L=32)으로 분할하는 경우, 인지 정보량 RPE는 다음과 같은 [수식 7]에 대해 구할 수 있다.
즉,
[수식 7]
여기서
이고,
이다.
다음으로, 1GOF의 인지 정보량을 계산하기 위한 개념을 설명한다.
N개의 샘플로 구성된 i(여기서, i는 0보다 크고 프레임수 보다는 작은 양의 정수)번째 프레임의 오디오 데이타에 대하여 전력 밀도 스펙트럼 및 마스킹 문턱치를 이용하여 전술한 [수식 7]에 의해 인지 정보량 PE1를 구하고, 그 다음 M개의 프레임을 갖는 1프레임군에 대한 평균 인지 정보량 PEm및 전술한 각 PEm에 대한 PE1의 변화량을 나타내는 표준 편차 PEstd를 다음 [수식 8 및 9]에 의해 구한다.
즉,
[수식 8]
[수식 9]
적응적 프레임 비트 할당부(230)는 인지 정보량 계산부(220)에서 구한 1GOF내의 각 프레임에 대한 인지 정보량을 제공받아 후술하는 기법에 의해 각 프레임마다 적응적으로 비트량을 할당하여 부호기(240)에 제공한다.
한편, 각 프레임에 할당되는 비트량의 평균(FB)값은 초당 정보 전송률을 B, 샘플링 주파수를 fs, 프레임 샘플수를 N이라 할 때 다음 [수식 10]에 의해 계산된다.
즉,
[수식 10]
전술한 [수식 10]을 통하여 구한 비트량을 각 프레임에 일정하게 할당하는 종래의 부호기는 각 프레임에 할당되는 비트가 전술한 [수식 10]에서 알 수 있는 바와같이 일정하게 할당되는 반면에, 본 발명에 의한 부호기에서는 다음 [수식 11]과 같이 각 프레임에 대한 인간의 청각 특성을 반영하는 가중치를 승산하므로서, 각 프레임에 가변적으로 비트를 할당하게 된다.
즉,
[수식 11]
이하에서는 인지 정보량 계산부(220)에서 얻은 각 프레임에 대한 인지 정보량에 의해 가변적으로 비트를 할당하는 방법에 대해 상세하게 설명된다.
도면 4를 참조하면, 도면 4는 전술한 바와같이 M개의 프레임으로 구성된 1GOF내의 i번째 프레임에 대한 인지 정보량을 PE1라 하고, 1GOF의 평균 인지 정보량을 PEm이라 할 때, PE1에 따른 프레임 비트 할당 상태(index)를 나타낸 그라프이다. M=4인 경우 즉, 1GOF의 프레임이 4개인 경우에 적용된 가중치(δ)는 전술한 [수식 8 및 9]을 통해 구한 PEm및 PEstd에 대한 실험 결과에 의하여 다음 [표 1]과 같이 얻을 수 있다.
[표 1]
(여기서 (x,y)의 기호는 0의 값이 x0y인 경우를 의미한다.)
즉, PEm이 0∼0.63이고, PEstd가 0∼0.125인 경우에는 δ는 10이며, 그외 다른 값들에서도 PEm및 PEstd값을 아는 경우, 상기 [표 1]에 의해 동일한 방법으로 δ값을 얻을 수 있을 것이다.
그리고, 전술한 [표 1]에서 근거하여 구한 가중치(δ)를 이용하여 결정 구간(D1)를 다음 [수식 12]에 의해 구한다.
[수식 12]
D1=PEm+[2×{i-sign(i)}+sign(i)]×δ/2
여기서, i는 -q와 q 사이의 정수값이고 D1는 결정 구간(desion level)값이다.
[수식 12]에서 알 수 있듯이 결정 구간(D1)의 값은 인지 정보량의 평균(PEm)과 표준 편차(PEstd)의 함수이며 가중치 값(δ)에 해당한다. 이 가중치 값(δ)이 크게되면 결정 구간(D1)의 값이 커지며, 반대의 경우는 작아진다.
[표 1]에서 인지 정보량의 평균(PEm)이 작고 표준 편차(PEstd)가 큰 경우에는 GOF내에서 인지 정보량의 변화가 큰 경우이므로 가중치 값(δ)이 매우 작음을 알 수 있다. 반대의 경우에는 즉, 인지 정보량의 평균(PEm)이 크고 표준 편차(PEstd)가 작은 경우에는 GOF내에서 인지 정보량의 변화가 작은 경우이므로 가중치 값(δ)이 매우 크게 된다.
또한, sign(i)는 다음과 같은 조건을 가정한다.
sign(i)=1 if(i0)
sign(i)=-1 if(i0)
sign(i)=0 if(i=0)
여기서 δ값은 전술한 가중치(∝)와 다른 개념으로서, 1GOF에서 M개의 PE1값을 전술한 식(8 및 9)에 의해 구한 PEm및 PEstd값에 따라 결정되는 가중치이다.
GOF내의 인지 정보량에 대한 평균값(PEm)과 표준 편차(PEstd)를 이용하여 가중치(δ)의 값을 표 1)를 통하여 결정한 후 [수식 12]를 이용하여 결정 구간(D1)의 값을 계산한다. 결정 구간(D1)의 값은 q의 값에 따라 그 개수가 결정하는데 만일 q의 값이 4인 경우에는 -4에서 4 사이의 정수값(i)에 대하여 9개의 결정 구간(D1)이 [수식 12]에 의하여 개산된다.
예를 들어 인지 정보량의 평균값(PEm)이 1이고 표준 편차(PEstd)가 0.15인 경우 GOF가 2개의 프레임으로 구성되어 인지 정보량의 값이 0.8, 1.3인 경우에는 [표 1]에서 가중치의 값이 2값을 갖는다. 이 경우 q의 값이 2라 가정하면 i값은 -2와 2 사이의 정수값으로 -2, -1, 0, 1, 2의 값을 갖는다. 이 값에 따라 결정 구간(D1)값을 계산하여 다음과 같다.
D-2의 값은 [수식 12]을 이용하면 평균값(PEm)의 값이 1이라 가정하였으므로 1+[2×{-2-(-1)}+(1)]×2/2=-2이고 D-1값은 0값이 된다. 같은 방법으로 모든 i값에 대하여 결정 구간(D1)의 값을 구할 수 있다. 이렇게 구한 결정 구간(D1)의 값을 이용하여 GOF내의 각 프레임에 비트를 할당하는 과정은 다음과 같다.
GOF가 2개의 프레임으로 구성된다면(도면 3에서 M=2인 경우), 상술한 예에서 인지 정보량의 값이 0.8, 1.3인 경우, 평균(PEm)과 표준 편차(PEstd)의 값이 각각 1, 0.15이다. 이와 같은 2개의 프레임에 대하여 표 1)을 이용하여 가중치(δ)를 구하고, 이 가중치(δ)를 이용하여 결정 구간(D1)의 값을 식 12)를 이용하여 구한다. 이 값은 상술한 예에서 설명한 바와 같다.
상술한 예에서는 q의 값이 2인 경우이므로 결정 구간의 값이 D-2에서 D2까지의 값이 각각 -2,0,1,2,4로 [수식 12]를 이용하여 계산된다. 이 결정 구간(D1)은 비트 할당을 위한 인덱스 값을 구하는데 이용된다. 이와 같은 결정 구간(D1)을 이용하여 비트를 할당하는 과정은 다음과 같다.
두 프레임에 대한 인지 정보량이 X1, X2라 하면 X1, X2의 값이 위에서 구한 결정 구간(D1)의 어느 부분에 해당하는지를 조사한다. X1의 값이 0.8이면 이 값은 결정 구간(D1)의 0에서 1 사이에 있으므로 인덱스의 값은 -1이고, X2의 값이 1.3인 프레임은 결정 구간(D1) 1에서 2 사이에 있으므로 인덱스의 값은 1이 된다. 이와 같이 인덱스의 값을 구한 후에는 기설정된 비트 할당 값으로부터 인덱스의 값을 이용하여 해당하는 비트 할당을 수행하는 것이다. 이와 같은 과정을 수식으로 표현하면 다음과 같다.
[수식 13]
if(D1-1=XiDj) 인덱스=j
상기 [수식 13]에서 Dj는 [수식 12]에서 구한 결정 구간의 값이고 Xi는 i번째 프레임의 인지 정보량 값에 해당한다. 또한, j는 -q에서 q 사이의 정수값이고 i는 GOF내의 프레임을 지칭하는 값이다. 즉, 위에서 프레임이 2개로 구성되는 GOF의 경우에는 i 값이 1과 2값을 갖는다. 이와 같이 구한 인덱스의 값을 이용하여 프레임 비트를 할당하는 과정은 [표 2]에서 기술한 바와 같다.
[표 2]에서는 q의 값이 4인 경우를 예로 든 것이며, 이때, GOF내의 각 인지 정보량에 해당하는 인덱스(index)의 값에 따라 할당되는 비트는 [표 2]에서와 같이 프레임 비트가 결정된다. 이 과정은 본 발명을 실시하는 예를 든 것이므로 q의 값이 다른 값이거나 혹은 평균 프레임 비트의 값이 [표 2]와 다른 경우에는 할당되는 비트가 다를 수 있다. 그러나, 본 발명의 요지는 인지 정보량을 프레임 단위로 구한 후 GOF단위로 분석하여 인지 정보량의 평균(PEm)과 표준 편차(PEstd)를 구한 후 이 값으로부터 상술한 바와 같이 인덱스를 결정하는 과정에 해당한다. 이 과정은 인간의 청각 특성을 이용하여 프레임 단위로 비트를 할당하는 과정인 것이다.
[표 2]
(단위, Frame Bit : Bit/Frame, Bit Rate : K Bit/sec)
즉, [표 2]를 참조하면, index가 0인 경우, 프레임 비트수는 3072로서, 통상적인 부호기에서 각 프레임에 일정하게 할당하는 비트수가 할당되고, 인덱스가 4인 경우, 프레임 비트수는 평균치를 훨씬 초과하는 반면에, 인덱스가 -4인 경우의 프레임 비트수는 평균치보다 훨씬 적게 할당됨을 알 수 있을 것이다.
다시 도면 2를 참조하면, 부호기(240)는 도면 1을 참조하여 상세하게 설명된 전술한 부호기와 동일하게 구성되고 동작하는 것으로, 그의 출력은 MUX(250)에 접속된다. MUX(250)는 부호기(240)에서 제공되는 비트 스트림과 적응적 프레임 비트 할당부(240)에서 제공되는 각 프레임에 대해 할당된 비트를 다중화하여 채널(Channel) 특성에 적합하게 변환하여 출력한다.
즉, 본 발명은 상술한 바와 같이 각각의 프레임에 비트가 할당되면 이 값을 이용하여 해당되는 프레임을 부호화한다. 이와 같이 할당된 비트를 이용하면 인간의 청각 특성에 부합되는 적응 프레임 비트 할당 과정이 되는 것이다. 이 할당된 비트를 이용하여 기존의 MPEG-1 오디오 부호화기를 적용하면 이후의 과정은 종래의 기술과 동일한 방법을 이용할 수 있게 된다. 단지, 종래의 기술에서는 각 프레임에 동일한 비트를 할당하므로써 프레임 각각의 청각적인 중요도를 고려하지 않았으므로 부호화 효율이 떨어지게 된다. 그러나, 본 발명에서는 인간의 청각적인 중요도를 이용하여 프레임 비트 할당을 수행하므로써 동일한 정보 비트 전송율로 음질이 나은 부호화기를 구현할 수 있는 것이다.
이상에서 설명한 본 발명에 따른 적응적으로 각 프레임에 비트 할당하여 부호화하는 디지탈 오디오 부호화 장치에 의하면, 다수개의 프레임을 가진 프레임군에 대한 각 프레임에 대한 인지 정보량의 평균 및 분산값(또는 표준 편차)에 응답하여 각 프레임에 적응적으로 비트를 할당하여 부호화하므로써 부호화 효율을 증대시키고, 음질을 향상시키는 장점이 있다.

Claims (1)

  1. 다수개의 프레임으로 되는 프레임군(group of frame : GOF)(210)으로 이루어진 디지탈 오디오 신호에 대한 인간의 인지 정보량에 응답하여 각 프레임에 대해 적응적으로 비트를 할당하여 부호화하는 것으로, 상기 다수개의 프레임을 가진 프레임군을 입력하여 프레임별 인지 정보량(perceptual entropy)을 산출하는 인지 정보량 계산부(220)와; 상기 인지 정보량 계산부(220)에서 얻은 인지 정보량에 응답하여 상기 프레임군(210)내의 각 프레임에 적응적으로 비트를 할당하는 적응적 프레임 비트 할당(adaptive frame bit allocatiom)부(230)와; 상기 입력되는 다수개의 프레임을 상기 각 프레임에 할당된 비트로 부호화하는 부호기(240)를 포함하는 디지탈 오디오 부호화 장치의 프레임별 비트 할당 장치.
KR1019940000740A 1994-01-18 1994-01-18 디지탈 오디오 부호화 장치의 프레임별 비트 할당장치 KR960012476B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940000740A KR960012476B1 (ko) 1994-01-18 1994-01-18 디지탈 오디오 부호화 장치의 프레임별 비트 할당장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940000740A KR960012476B1 (ko) 1994-01-18 1994-01-18 디지탈 오디오 부호화 장치의 프레임별 비트 할당장치

Publications (2)

Publication Number Publication Date
KR950024449A KR950024449A (ko) 1995-08-21
KR960012476B1 true KR960012476B1 (ko) 1996-09-20

Family

ID=19375752

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940000740A KR960012476B1 (ko) 1994-01-18 1994-01-18 디지탈 오디오 부호화 장치의 프레임별 비트 할당장치

Country Status (1)

Country Link
KR (1) KR960012476B1 (ko)

Also Published As

Publication number Publication date
KR950024449A (ko) 1995-08-21

Similar Documents

Publication Publication Date Title
KR960012475B1 (ko) 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
JP2756515B2 (ja) 可聴信号の知覚符号化方法および音声信号伝送方法
KR970007661B1 (ko) 스테레오포닉 오디오 신호의 입력세트 코딩방법
US5537510A (en) Adaptive digital audio encoding apparatus and a bit allocation method thereof
EP0966109B1 (en) Audio coding method and audio coding apparatus
KR100388730B1 (ko) 고능률부호화및복호화장치
US5649052A (en) Adaptive digital audio encoding system
JP3297240B2 (ja) 適応的符号化システム
Iwadare et al. A 128 kb/s hi-fi audio CODEC based on adaptive transform coding with adaptive block size MDCT
KR0134318B1 (ko) 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치
JP3088580B2 (ja) 変換符号化装置のブロックサイズ決定法
KR20030085521A (ko) 디지털 음성 데이터의 부호화 방법 및 복호화 방법
KR960012476B1 (ko) 디지탈 오디오 부호화 장치의 프레임별 비트 할당장치
JPH08328592A (ja) 音声信号処理回路
KR960012473B1 (ko) 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치
KR960003453B1 (ko) 채널 및 각 프레임에 적응적으로 비트 할당하여 부호화하는 스테레오 디지탈 오디오 부호화장치
JPH08179794A (ja) サブバンド符号化方法及び装置
KR960003454B1 (ko) 적응적 스테레오 디지탈 오디오 부호화장치
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
KR0144297B1 (ko) 적응적 디지탈 오디오 부호화 장치
KR100300957B1 (ko) 룩업테이블을이용한디지탈오디오부호화방법및장치
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
KR960012477B1 (ko) 인지 정보량을 이용한 적응적 스테레오 디지탈 오디오 부호화 및 복호화장치
KR960012474B1 (ko) 인간의 청각 특성에 적응적인 스테레오 디지탈 오디오 부호화장치
KR960003455B1 (ko) 적응적으로 각 채널에 비트 할당하여 부호화 및 복호화하는 엠 에스 스테레오 디지탈 오디오 부호화 및 복호화 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 19990831

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee