KR100195708B1 - 디지탈 오디오 부호기 - Google Patents
디지탈 오디오 부호기 Download PDFInfo
- Publication number
- KR100195708B1 KR100195708B1 KR1019950045862A KR19950045862A KR100195708B1 KR 100195708 B1 KR100195708 B1 KR 100195708B1 KR 1019950045862 A KR1019950045862 A KR 1019950045862A KR 19950045862 A KR19950045862 A KR 19950045862A KR 100195708 B1 KR100195708 B1 KR 100195708B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- peak
- audio
- output
- noise ratio
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 97
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000005259 measurement Methods 0.000 claims description 10
- 230000003111 delayed effect Effects 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 description 25
- 230000000873 masking effect Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000007906 compression Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 210000000860 cochlear nerve Anatomy 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
- H04N21/2335—Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명은 디지털 오디오 부호기에 관한 것으로 입력된 PCM오디오 신호를 MPEG 오디오 부호화 방식으로 부호화하여 출력하는 MPEG오디오 부호기(100)와 ; 입력된 PCM 오디오신호를 AC-3오디오 부호화 방식으로 부호화하여 출력하는 AC-3오디오 부호기(200) 및 ; 상기 MPEG 오디오 부호기(100) 및 AC-3오디오 부호기(200)를 통해 부호화되어 출력된 오디오신호의 음질을 비교하여 음질이 좋은 디지털 오디오신호를 전송하는 부호화 방식 선택부(300)를 포함하여 구성되어 PCM 오디오신호의 특성에 따라 MPEG 오디오 부호화 방식 또는 AC-3오디오 부호화 방식을 적응적으로 선하여 PCM 오디오 신호를 효율적으로 부호화할 수 있는 것이다.
Description
제1도는 일반적인 MPEG 오디오 부호기의 블록도.
제2도는 일반적인 MPEG 오디오 복호기의 블록도.
제3도는 일반적인 AC-3 오디오 부호기의 블록도.
제4도는 일반적인 AC-3 오디오 복호기의 블록도.
제5도는 본 발명에 따른 디지털 오디오 부호기의 블록도이다.
* 도면의 주요부분에 대한 부호의 설명
2 : 분석 서브밴드 필터 4 : 심리 음향 모델
6 : 비트 할당 및 양자화기 8 : 비트스트림배열부
10 : 비트할당 디코더 12 : 역양자화기
14 : 스케일팩터 디코더 16 : 합성 서브밴드 필터
20 : 분석 필터 뱅크 22 : 스펙트럼포락선 부호기
24 : 비트 할당부 26 : 양자화기
28 : 프레임 배열부 30 : 프레임 역배열부
32 : 비트 할당부 34 : 역양자화기
36 : 스펙트럼포락선부호기 38 : 합성 필터 뱅크
100 : MPEG 오디오 부호기 200 : AC-3 오디오 부호기
300 : 부호화 방식 선택부 310 : 지연부
320 : MPEG 오디오 복호기 330 : AC-3오디오 복호기
340 : 제1 음질 측정부 342 : 제1 비교부
344 : 제1 PSNR 계산부 350 : 제 2 음질 측정부
352 : 제2 비교부 354 : 제2 PSNR 계산부
360 : 선택부 362 : 제3비교부
364 : 멀티플렉서
본 발명은 디지털 음성 신호를 압축하는 디지털 오디오 부호기에 관한 것으로 특히 PCM 오디오신호의 특성에 따라 MPEG 오디오 부호화방식 또는 AC-3 오디오 부호화 방식을 적응적으로 선택하여 PCM 오디오 신호를 부호화 함으로써 PCM 오디오 신호를 효율적으로 부호화할 수 있는 디지털 오디오 부호기에 관한 것이다.
디지털 오디오는 80년대에 들어서면서 CD나 DAT와 같은 대용량 저장 매체의 개발과 함께 오디오 기기의 표준이 되었다. 그러나 디지털 오디오 데이터는 많은 정보량을 가지므로 공중파 방송 등의 제한된 대역폭을 갖는 매체에서 사용하기 위해서는 오디오 데이터를 압축하는 것이 필수적이다.
따라서 80년대 후반부터 다양한 고음질 오디오 압축 기술이 개발되었으며 이와 같은 기술은 공통적으로 기존의 데이터 압축 기법에 사람의 청각 특성을 고려하여 결합한 형태를 갖는다.
상기 오디오압축 기술의 대표적인 것으로는 MPEG 방식과 돌비연구소에서 제한한 AC-3 방식이 있다.
즉 MPEG 방식은 동영상과 그에 부가되는 오디오 압축 방식의 표준안을 결정하는 MPEG/ISO 에서 규정한 것으로 MPEG-1은 약 1.5Mbit/s에서 동영상과 오디오를 압축할 수 있는 부호화 방식으로서 MUSICAM (Masking-patterm adapted Universal Subband Integrated Coding And Muliplexing)방식을 사용하였으며 MPEG-1은 디지털 방송을 위한 6Mbit/s이상의 전송율을 갖는 다채널 구조의 MPEG-2로 확장되었다.
상기 MUSICAM 방식은 청각 특성을 이용한 서브밴드 부호화 방식으로 96-128Kbit/s에서 주관적으로 원음과 동일한 복원음을 얻을 수 있도록 되어 있다.
한편 AC-3방식은 북미 지역의 HDTV오디오 압축 기술의 표준안으로 AC-3는 MDCT(Modified Discrete Cosine Transform)을 이용한 적응변환 부호화 방법을 사용하였으며 처음 2채널 스테레오 신호만을 대상으로 한 AC-2 로부터 AC-2a를 거쳐 다채널 구조를 갖는 AC-3 로 발전하였다.
상기 MUSICM 방식을 사용한 MPEG 오디오 부호기는 제1도에 도시된 바와 같이 입력신호(PCM data)를 다수개의 서브 밴드 샘플로 변환하여 출력하는 분석 서브밴드 필터(2)와 ; 입력신호를 고속 푸리에 변환(FFT: Fast Fourier Transform)하여 스펙트럼 정보를 구하고 이 스펙트럼 정보로부터 마스킹 임계값을 얻은 다음 이 마스킹 임계값과 상기 스펙트럼 정보로부터 결정된 각 서브 밴드 샘플의 음압 레벨의 차를 구하여 신호대 마스크 비(SMR: Signal to Mask Ratio)를 계산하여 출력하는 심리 음향 모델(4) ; 상기 심리 음향모델(4)에서 출력된 신호 대 마스크 비를 사용하여 상기 각 서부 밴드 샘플에 비트를 할당하고 할당된 비트에 따라 상기 각 서브 밴드 샘플을 양자화시켜 출력하는 비트 할당 및 양자화기(6) ; 상기 비트할당 및 양자화기(6)에서 양자화 되어 출력된 서브 밴드 샘플 및 비트 할당 정보, 크기 정보(scalefactor)등 의 부가 정보를 비트스트림으로 배열(formatting) 하여 출력하는 비트 스트림배열부(8)를 포함하여 구성된다.
상기와 같이 구성된 MPEG 오디오 부호기에 있어서 상기 분석 서브밴드 필터(2)는 입력된 32개의 새로운 오디오 샘플을 차례로 512샘플 크기를 갖는 버퍼에 저장하고, 이 버퍼에 분석 윈도우(analysis window)를 곱한 후 512샘플을 8개의 64샘플 블록으로 나누고 각 블록을 더하여 새로운 백터를 구성한다.
여기에 하기 제1식과 같은 분석 행렬을 곱하여 32개의 서브밴드 샘플을 만든다.
그리고 심리 음향 모델(4)은 각 서브밴드에서 원음에 의해 마스킹되어 들을 수 없는 최대 잡음 레벨을 결정하고 이 잡음 레벨(마스킹 임계값)을 사용해서 각 밴드의 실제 양자화기를 결정하는 비트 할당을 할 수 있다.
이때 MPEG 방식에서는 두 가지의 심리 음향 모델을 제공하는데 심리 음향 모델1은 신호의 스펙트럼으로부터 순음과 잡음 성분을 구분하는 과정과 순음과 잡음의 개별 마스킹 임계값을 계산하는 과정 절대 가청 한계를 고려하여 전체 마스킹 임계값을 계산서는 과정 및 각 서브밴드에서의 시로 대 마스크 비를 계산하는 과정을 거쳐 신호 대 마스크 비를 구한다.
즉 고속 푸리에 변환(FFT)을 통해 스펙트럼을 구하고 이로부터 각 서브밴드에서의 음압 레벨을 결정한다. 여기에서 마스킹 성분이 순음 또는 잡음인가에 따라 마스킹 곡선이 달라지므로 스펙트럼 정보로부터 순음 성분과 잡음성분을 찾아내야 한다.
즉 부분 최대값(local maxima)중에서 주위 신호보다 7dB이상이 크면 순음으로 간주하여 순음 성분을 찾아낸 후 나머지 스펙트럼에서 하나의 임계 대역 내에서 하나의 잡음 성분을 구한다.
여기에서 실험적으로 구해진 마스킹 함수를 적용하여 순음에 의한 바스킹 임계값을 구하고 전체 마스킹 임계값은 개별 마스킹 임계값과 가청 한계의 합으로 구해진다.
그리고 각 서브밴드에서의 음압 레벨과 마스킹 임계값과의 차를 구하여 신호 대 마스크 비(SMR: Signal to Mask Ratio)를 계산한다.
결국 신호 대 마스크 비(SMR)가 작다면 신호의 음압 레벨이 작거나 마스킹이 많이 된 것이므로 적은 비트를 가지고 효과적인 양자화를 할 수 있다.
그리고 심리 음향 모델 2에서는 신호의 임계 대역에 따른 에너지를 계산하는 과정과 스프레딩 함수와 컨벌루션 청신경의 여기 정도를 계산하는 과정 절대 가청 한계를 고려하여 마스킹 임계값을 계산하는 과정 및 각 서브밴드에서의 시로 대 마스크 비를 계산하는 과정을 거쳐 신호대 마스크비를 구하는 것이다.
이와 같은 음향 모델 2는 고속 푸리에 변환 스펙트럼을 청신경의 여기 모델인 스프레딩 함수와 컨벌루션하여 마스킹 임계값을 구하므로 계산량은 많지만 더 정교한 결과를 얻을 수 있는 것이다.
그리고 상기 비트할당 및 양자화기(6)는 상기 심리 음향 모델(4)에서 출력된 신호 대 마스크비를 사용하여 상기 분석 서브밴드 필터(2)에서 출력된 각 서브 밴드 샘플에 대해 비트를 할당하고 이 할당된 비트에 따라 크기 정보(scale factor)에 의해 나누어져 정규화된 각 서부밴드 샘플들을 양자화한다.
이때 각 서브 밴드에 대한 크기정보(scale factor)계산은 양자화하기 이전에 행해지며 상기 크기 정보(scale factor) 계산은 12샘플마다 이루어지고12샘플의 절대값 중 최대값을 찾아서 0에서 2사이로 정규화시킨다.
그리고 비트 스트림 배열부(8)는 상기 비트할당 및 양자화기(8)에서 출력된 양자화된 서브 밴드 샘플 및 비트 항당 정보 크기 정보(scale factor) 등의 부가 정보를 MPEG 프레임으로 배열하여 비트 스트림으로 전송하는 것이다.
한편, 상기와 같이 압축되어 전송된 비트스트림을 복원하는 MPEG 오디오 복호기는 상기 MPEG 오디오 부호기를 역으로 구현하면 된다.
즉, 종래의 MPEG 오디오 복호기는 제2도에 도시된 바와 같이 압축되어 전송된 비트 스트림 중에서 각 서브 밴드 샘플에 대한 비트 할당 정보를 디코딩하여 출력하는 비트 할당 디코더(10)와 ; 상기 비트 할당 디코더(10)에서 출력된 비트 할당 정보에 따라 상기 비트 스트림의 각 서브 밴드 샘플을 역양자화하여 출력하는 역양자화기(12) ; 상기 비트스트임 중에서 스케일 팩터 정보를 검출한 다음 상기 스케일 팩터를 사용하여 상기 역양자화기(12)에서 양자화된 각 서브밴드 샘플을 원래의 서브밴드 샘플로 계산하여 출력하는 스케일팩터 디코더(14) 및 ; 상기 스케일팩터 디코더(14)에서 출력된 각 서브밴드 샘플을 합성하여 오디오 신호를 복원하는 합성 서브밴드 필터(16)으로 이루어져 있다.
상기와 같은 MPEG 오디오 복호기에 있어서, 비트 할당 디코더(10)는 압축되어 전송된 비트 스트림 중에서 각 서브 밴드 샘플에 대한 비트 할당 정보를 디코딩하여출력하고 역양자화기(12)는 상기 비트 할당 디코더(10)에서 출력된 비트 할당 정보에 따라 상기 비트 스트림의 각 서브 밴드 샘플을 역양자화하여 출력한다.
그리고 스케일 펙터 디코더(14)는 상기 비트스트림 중에서 스케일 팩터 정보를 검출한 다음 상기 스케일 팩터를 사용하여 상기 역양자화기(12)에서 양자화된 각 서브밴드 샘플을 서브밴드 샘플로 계산하여 출력하며 합성 서브밴드 필터(16)는 상기 스케일 팩터 디코더(14)에서 출력된 각 서브밴드 샘플을 합성하여 오디오 신호를 복원하여 출력하는 것이다.
이때, 상기 합성 서브 밴드 필터(16)에서 각 서브밴드 샘플을 오디오 신호로 복원하기 위해 사용되는 행렬을 하기 제2식과 같다.
한편, MPEG 변환 부호와 방식을 사용한 AC-3 오디오 부호기는 제3도에 도시된 바와 같이 입력신호(PCM 오디오신호)를 주파수 영역으로 변환하여 주파수 계수를 출력하는 분석 필터 뱅크(20)와 ; 상기 주파수 계수의 지수부를 스펙트럼 포락선으로 부호화하여 출력하는 스펙트럼 포락선 부호기(22) ; 상기 스펙트럼 포락선에 따라 상기 주파수 계수의 가수부를 양자화하기 위한 비트 할당 정보를 출력하는 비트 할당부(24) ; 상기 비트할당 정보에 따라 상기 주파수 계수의 가수부를 양자화하여 출력하는 양자화기(26) 및 ; 상기 스펙트럼 포락선 및 양자화된 가수부를 AC-3 프레임으로 배열(FORMAT)하여 출력하는 프레임 배열부(28)로 이루어져 있다.
상기와 같은 AC-3 오디오 부호기에 있어서 상기 분석 필터 뱅크(20)는 입력신호를 주파수 영역으로 변환하며 이때 각 주파수 계수는 지수부와 가수부로 표현된다.
그리고 상기 스펙트럼 포락선 부호기(22)는 상기 지수부를 스펙트럼 포락선으로 부호화하여 비트 할당부(24) 및 프레임 배열부(30)로 출력하고 상기 비트 할당부(24)는 상기 스펙트럼 포락선에 따라 상기 주파수 계수의 가수부를 양자화하기 위한 비트 할당 정보를 양자화기(26)로 출력한다.
그리고 양자화기(26)는 상기 비트 할당 정보에 따라 상기 주파수 계수의 가수부를 양자화하여 프레임 배열부(28)로 출력하며 프레임 배열부(28)는 상기 스펙트럼 포락선 및 양자화된 가수부를 AC-3프레임으로 배열하여 출력하고 이 AC-3프레임 시퀀스가 AC-3비트 스트림이 되는 것이다.
한편 상기와 같은 AC-3오디오 부호기에 의해 압축된 오디오신호를 복원하기 위한 AC-3오디오 복호기는 상기 AC-3오디오 부호기를 역으로 구현하면 된다.
즉 AC-3 오디오 복호기는 제4도에 도시된 바와 같이 부호화된 AC-3 비트 스트림의 스펙트럼 포락선과 가수부를 분리하는 프레임 역배열부(30) ; 상기 스펙트럼 포락선에 따라 상기 가수부를 역양자화하여 출력하는 역양자화기(34) ; 상기 스펙트럼 포락선을 디코딩하여 지수부를 출력하는 역양자화기(34); 상기 스펙트럼 포락선을 디코딩하여 지수부를 출력하는 스펙트럼 포락선 복호기(36) 및 ; 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오 신호를 출력하는 합성필터뱅크(38)를 포함하여 구성되어 있다.
상기과 같은 AC-3 오디오 복호기에 있어서, 상기 프레임 역배열부(30)는, 부호화된 AC-3 비트 스트림의 스펙트럼 포락선과 가수부를 각각 분리하여 상기 스펙트럼 포락선은 비트 할당부(32) 및 스펙트럼 포락선 디코더(36)로 출력하는 한편, 상기 가수부는 역양자화기(34)로 출력한다.
이때, 상기 프레임 역배열부(30)는 부호화된 AC-3 비트 스트림을 동기시키고, 에러 체크를 해야만 한다.
그리고, 비트 할당부(30)는 상기 스펙트럼 포락선에 따라 비트 할당 정보를 역양자화기(34)로 출력하고, 역양자호기(34)는 상기 비트 할당 정보에 따라 상기 가수부를 역양자화하여 합성 필터 뱅크(30)로 출력한다.
그리고, 스펙트럼 포락선 복호기(36)는 상기 엔코딩된 스펙트럼 포락선을 디코딩하여 지수부를 합성 필터 뱅크(38)로 출력하며, 합성 필터 뱅크(38)는 상기 지수부와 가수부를 타임 영역으로 변환하여 PCM 오디오신호를 출력하는 것이다.
이상에서 살펴본 바와 같이 종래의 MPEG 오디오 부호기와 AC-3 오디오 부호기는 PCM 오디오 신호를 압축하는 방식이 서로 다르다.
따라서, 압축하고자 하는 PCM 오디오 신호의 특성에 따라 MPEG 오디오 부호화 방식이 AC-3 오디오 부호화 방식 보다 좋을 수도 있고, AC-3 오디오 부호화 방식이 MPEG 오디오 부호화 방식 보다 좋을 수도 있다.
그러나, 상기와 같은 종래의 디지털 오디오 부호화기는 MPEG 오디오 부호화 방식이나 AC-3 오디오 부호화 방식 중 하나만을 선택하여 사용함에 따라 PCM 오디오 신호를 효율적으로 부호화할 수 없는 문제점이 있었다.
따라서, 본 발명은 상기와 같은 종래의 문제점을 해소하기 위한 것으로, PCM 오디오신호의 특성에 따라 MPEG 오디오 부호화 방식 또는 AC-3 오디오 부호화 방식을 적응적으로 선택하여 PCM 오디오신호를 부호화하는 디지털 오디오 부호기를 제공하는데 그 목적이 있다.
이러한 목적을 달성하기 위한 본 발명에 따른 디지털 오디오 신호 변환장치는, 입력된 PCM 오디오신호를 MPEG 오디오 부호화 방식으로 부호화하여 출력하는 MPEG 오디오 부호기와 ; 입력된 PCM 오디오신호를 AC-3 오디오 부호화 방식으로 부호화하여 출력하는 AC-3 오디오 부호기 및 ; 상기 MPEG 오디오 부호기 및 AC-3 오디오 부호기를 통해 부호화되어 출력된 오디오신호의 음질을 비교하여 음질이 좋은 오디오신호를 전송하는 부호화 방식 선택부를 포함하여 구성된 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
제5도는 본 발명에 따른 디지털 오디오 부호기의 블록도로서, 본 발명에 따른 디지털 오디오 부호기는, 입력된 PCM 오디오신호를 MPEG 오디오 부호화 방식으로 부호화하여 출력하는 MPEG 오디오 부호기(100)와 ; 입력된 PCM 오디오신호를 AC-3 오디오 부호화 방식으로 부호화하여 출력하는 AC-3 오디오 부호기(200) 및 ; 상기 MPEG 오디오 부호기(100) 및 AC-3 오디오 부호기(200)를 통해 부호화되어 출력된 오디오 신호의 음질을 비교하여 음질이 좋은 디지털 오디오신호를 전송하는 부호화 방식 선택부(300)를 포함하여 구성되어 있다.
상기 부호화 방식 선택부(300)는, 입력된 PCM 오디오신호를 딜레이시켜 출력하는 지연부(310)와 ; 상기 MPEG 오디오 부호기(100)에 의해 부호화된 MPEG 오디오신호를 MPEG 오디오 복호화 방식으로 복호화하여 PCM 오디오신호를 출력하는 MPEG 오디오 복호기(320) ; 상기 AC-3 오디오 부호기(200)에 의해 부호화된 AC-3 오디오신호를 AC-3 복호화 방식으로 복호화하여 PCM 오디오신호를 출력하는 AC-3 오디오 복호기(330) ; 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호를 비교하여 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호의 음질을 측정하여 출력하는 제1음질측정부(340) ; 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 AC-3 오디오 복호기(330)에서 출력된 PCM 오디오신호를 비교하여 상기 AC-3 오디오 복호기(330)에서 출력된 PCM 오디오신호의 음질을 측정하는 제2음질측정부(350) 및 ; 상기 제1음질측정부(340)와 제2음질측정부(350)에서 음질을 비교하여 음질이 좋은 디지털 부호화 방식으로 부호화된 디지털 오디오신호를 선택하여 출력하는 선택부(360)을 포함하여 구성되어 있다.
상기 제1음질측정부(340)는, 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호를 비교하여 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호의 손실값을 출력하는 제1비교부(342) 및, 상기 제1비교부(342)에서 출력된 손실값을 제곱한 다음 512 샘플동안 평균값을 계산하여 피크 투 피트 신호 대 노이즈 비(PSNR : Peak-to-peak to Noise Ratio)를 출력하는 제1피크 투 피크 신호 대 노이즈 비 계산부(344)로 이루어져 있다.
상기 제2음질측정부(350)는, 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 AC-3 오디오 복호기(330)에서 출력된 PCM 오디오신호을 비교하여 손실값을 출력하는 제2비교부(352) 및, 상기 제2비교부(352)에서 출력된 손실값을 제곱한 다음 512 샘플동안 평균값을 계산하여 피크 투 피트 신호 대 노이즈 비(PSNR : Peak-to-peak to Signal to Noise Ratio)를 출력하는 제2피크 투 피크 신호 대 노이즈 비 계산부(354)로 이루어져 있다.
그리고, 상기 선택부(360)는, 상기 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호대 노이즈 비와 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비를 비교하여 선택신호를 출력하는 제3비교부(362) 및, 상기 선택신호에 따라 상기 MPEG 오디오 부호기(100)에 의해 부호화된 MPEG 오디오신호 또는 상기 AC-3 오디오 부호기(200)에 의해 부호화된 AC-3 오디오신호를 선택적으로 출력하는 멀티플렉서(364)로 이루어져 있다.
그리고, 상기 제3비교부(362)는, 상기 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비와 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비를 비교하여, 상기 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비가 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비 보다 작으면, 상기 MPEG 오디오 부호기(100)에 의해 부호화된 MPEG 오디오신호를 출력하도록 선택신호를 출력하고, 상기 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비가 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비 보다 크면, 상기 AC-3 오디오 부호기(200)에 의해 부호화된 AC-3 오디오신호를 출력하도록 선택신호를 출력하도록 되어 있다.
상기와 같이 구성된 본 발명에 따른 디지털 오디오 부호기의 작용 및 효과를 상세히 설명하면 다음과 같다.
MPEG 오디오 부호기(100)는 외부로부터 입력된 PCM 오디오신호를 MPEG 오디오 부호화 방식으로 부호화하여 출력하고, AC-3 오디오 부호기(200)는 상기 PCM 오디오신호를 AC-3 오디오 부호화 방식으로 부호화하여 출력한다.
그리고, 부호화 방식 선택부(300)가 상기 MPEG 오디오 부호기(100) 및 AC-3 오디오 부호기(200)를 통해 부호화되어 출력된 오디오신호의 음질을 비교하여 음질이 좋은 디지털 오디오신호를 전송하는 것이다.
즉, MPEG 오디오 부호기(100)는 외부로부터 입력된 PCM 오디오신호를 MPEG 오디오 부호화 방식으로 부호화하여 MPEG 오디오 복호기(320)으로 출력하고, 상기 MPEG 오디오 복호기(320)는 상기 MPEG 오디오 부호기(100)에 의해 부호화된 MPEG 오디오신호를 MPEG 오디오 복호화 방식으로 복호화하여 PCM 오디오신호를 제1음질측정부(340)의 제1비교부(342)로 출력한다.
그리고, AC-3 오디오 부호기(200)는 외부로부터 입력된 PCM 오디오신호를 AC-3 오디오 부호화 방식으로 부호화하여 AC-3 오디오 복호기(330)로 출력하고, 상기 AC-3 오디오 복호기(330)는 상기 AC-3 오디오 부호기(200)에 의해 부호화된 AC-3 오디오신호를 AC-3 오디오 복호화 방식으로 복호화하여 PCM 오디오신호를 제2음질측정부(350)의 제2비교부(352)로 출력한다.
그리고, 지연부(310)는 외부로부터 입력된 입력된 PCM 오디오신호를 딜레이시켜 상기 제1비교부(342) 및 제2비교부(352)로 각각 출력한다.
그리고, 제1음질측정부(340)의 제1비교부(342)는 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호를 비교하여 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호의 손실값을 출력하고, 제1피크 투 피크 신호 대 노이즈 비 계산부(344)는 상기 제1비교부(342)에서 출력된 손실값을 제곱한 다음 512 샘플동안 평균값을 계산하여 피크 투 피트 신호 대 노이즈 비(PSNR : Peak-to-peak Signal to Noise Ratio)를 선택부(360)의 제3비교부(362)로 출력한다.
그리고, 상기 제2음질측정부(350)의 제2비교부(352)는 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 AC-3 오디오 복호기(330)에서 출력된 PCM 오디오신호를 비교하여 손실값을 출력하고, 제2피크 투 피크 신호 대 노이즈 비 계산부(354)는 상기 제2비교부(352)에서 출력된 손실값을 제곱한 다음 512 샘플동안 평균값을 계산하여 피크 투 피트 신호 대 노이즈 비(PSNR : Peak-to-peak Signal to Noise Ratio)를 선택부(36)의 제3비교부(362)로 출력하는 것이다.
그리고, 상기 선택부(360)의 제3비교부(362)는 상기 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비와 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비를 비교하여 선택신호를 출력하고, 멀티플렉서(364)는 상기 선택신호에 따라 상기 MPEG 오디오 부호기(100)에 의해 부호화된 MPEG 오디오신호 또는 상기 AC-3 오디오 부호기(200)에 의해 부호화된 AC-3 오디오신호를 선택적으로 출력하는 것이다.
이때, 상기 제3비교부(362)는 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비와 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비를 비교하여, 상기 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비가 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피크 신호 대 노이즈 비 보다 작으면, 상기 MPEG 오디오 부호기(100)에 의해 부호화된 MPEG 오디오신호를 출력하도록 선택신호를 출력하고, 상기 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비가 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비 보다 크면, 상기 AC-3 오디오 부호기(200)에 의해 부호화된 AC-3 오디오 신호를 출력하도록 선택신호를 출력하는 것이다.
이상에서 살펴본 바와 같이 본 발명에 따르면, PCM 오디오신호의 특성에 따라 MPEG 오디오 부호화 방식 또는 AC-3 오디오 부호화 방식을 적응적으로 선택하여 PCM 오디오신호를 부호화함으로써 PCM 오디오 신호를 효율적으로 부호화할 수 있는 것이다.
Claims (7)
- 입력된 PCM 오디오신호를 MPEG 오디오 부호화 방식으로 부호화하여 출력하는 MPEG 오디오 부호기(100)와 ; 입력된 PCM 오디오신호를 AC-3 오디오 부호화방식으로 부호화하여 출력하는 AC-3 오디오 부호기(200) 및 ; 상기 MPEG 오디오 부호기(100) 및 AC-3 오디오 부호기(200)를 통해 부호화되어 출력된 오디오신호의 음질을 비교하여 음질이 좋은 디지털 오디오신호를 전송하는 부호화 방식 선택부(300)를 포함하여 구성된 디지털 오디오 부호기.
- 제1항에 있어서, 상기 부호화 방식 선택부(300)는, 입력된 PCM 오디오신호를 딜레이시켜 출력사는 지연부(310)와 ; 상기 MPEG 오디오 부호기(100)에 의해 부호화된 MPEG 오디오신호를 MPEG 오디오 복호화 방식으로 복호화하여 PCM 오디오신호를 출력하는 MPEG 오디오 복호기(320) ; 상기 AC-3 오디오 부호기(200)에 의해 부호화된 AC-3 오디오신호를 AC-3 복호화 방식으로 복호화하여 PCM 오디오신호를 출력하는 AC-3 오디오 복호기(330) ; 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호를 비교하여 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호의 음질을 측정하여 출력하는 제1음질측정부(340) ; 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 AC-3 오디오 복호기(330)에서 출력된 PCM 오디오신호를 비교하여 상기 AC-3 오디오 복호기(330)에서 출력된 PCM 오디오신호의 음질을 측정하는 제2음질측정부(350) 및 ; 상기 제1음질측정부(340)와 제2음질측정부(350)에서 측정된 음질을 비교하여 음질이 좋은 디지털 부호화 방식으로 부호화된 디지털 오디오신호를 선택하여 출력하는 선택부(360)을 포함하여 구성된 것을 특징으로 하는 디지털 오디오 부호기.
- 제2항에 있어서, 상기 제1음질측정부(340)는, 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호를 비교하여 상기 MPEG 오디오 복호기(320)에서 출력된 PCM 오디오신호의 손실값을 출력하는 제1비교부(342) 및 ; 상기 제1비교부(342)에서 출력된 손실값을 제곱한 다음 일정 샘플동안 평균값을 계산하여 피크 투 피트 신호 대 노이즈 비를 출력하는 제1피크 투 피크 신호 대 노이즈 비 계산부(344)를 포함하여 구성된 것을 특징으로 하는 디지털 오디오 부호기.
- 제2항에 있어서, 상기 제2음질측정부(350)는, 상기 지연부(310)에서 출력된 PCM 오디오신호와 상기 AC-3 오디오 복호기(330)에서 출력된 PCM 오디오신호를 비교하여 손실값을 출력하는 제2비교부(352) 및 ; 상기 제2비교부(352)에서 출력된 손실값을 제곱한 다음 일정 샘플동안 평균값을 계산하여 피크 투 피트 신호 대 노이즈 비를 출력하는 제2피크 투 피크 신호 대 노이즈 비 계산부(354)를 포함하여 구성된 것을 특징으로 하는 디지털 오디오 부호기.
- 제2항에 있어서, 상기 선택부(360)는, 상기 제 1 피크 투 피트 신호 대 노이즈 비를 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비와 상기 제 2 피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비를 비교하여 선택신호를 출력하는 제3비교부(362) 및, 상기 선택신호에 따라 상기 MPEG 오디오 부호기(100)에 의해 부호화된 MPEG 오디오신호 또는 상기 AC-3 오디오 부호기(200)에 의해 부호화된 AC-3 오디오 신호를 선택적으로 출력하는 멀티플렉서(364)를 포함하여 구성된 것을 특징으로 하는 디지털 오디오 부호기.
- 제3항 또는 제4항에 있어서, 상기 제1피크 투 피크 신호 대 노이즈 비 계산부(344) 및 제2피크 투 피크 신호 대 노이즈 비 계산부(354)는 상기 제1비교부(342) 및 제 2 비교부(352)에서 각각 출력된 손실값을 제곱한 다음 512 샘플 동안 평균값을 계산하여 피크 투 피크 신호 대 노이즈 비를 각각 출력하도록 된 것을 특징으로 하는 디지털 오디오 부호기.
- 제5항에 있어서, 상기 제3비교부(362)는, 상기 제1피크 트 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비와 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비를 비교하여, 상기 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호대 노이즈 비가 상기 제2피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호대 노이즈 비 보다 작으면, 상기 MPEG 오디오 부호기(100)에 의해 부호화된 MPEG 오디오신호를 출력하도록 선택신호를 출력하고, 상기 제1피크 투 피트 신호 대 노이즈 비 계산부(344)에서 출력된 피크 투 피크 신호 대 노이즈 비가 상기 제 2 피크 투 피크 신호 대 노이즈 비 계산부(354)에서 출력된 피크 투 피트 신호 대 노이즈 비 보다 크면, 상기 AC-3 오디오부호기(200)에 의해 부호화된 AC-3 오디오신호를 출력하도록 선택신호를 출력하도록 된 것을 특징으로 하는 디지털 오디오 부호기.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950045862A KR100195708B1 (ko) | 1995-11-30 | 1995-11-30 | 디지탈 오디오 부호기 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950045862A KR100195708B1 (ko) | 1995-11-30 | 1995-11-30 | 디지탈 오디오 부호기 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970032132A KR970032132A (ko) | 1997-06-26 |
KR100195708B1 true KR100195708B1 (ko) | 1999-06-15 |
Family
ID=19437222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950045862A KR100195708B1 (ko) | 1995-11-30 | 1995-11-30 | 디지탈 오디오 부호기 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100195708B1 (ko) |
-
1995
- 1995-11-30 KR KR1019950045862A patent/KR100195708B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR970032132A (ko) | 1997-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pan | Digital audio compression | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
KR100261253B1 (ko) | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 | |
US6092041A (en) | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder | |
KR100711989B1 (ko) | 효율적으로 개선된 스케일러블 오디오 부호화 | |
EP1914724B1 (en) | Dual-transform coding of audio signals | |
JP3352406B2 (ja) | オーディオ信号の符号化及び復号方法及び装置 | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
US7752041B2 (en) | Method and apparatus for encoding/decoding digital signal | |
EP1914725B1 (en) | Fast lattice vector quantization | |
USRE46082E1 (en) | Method and apparatus for low bit rate encoding and decoding | |
KR19990041072A (ko) | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 | |
US20080140393A1 (en) | Speech coding apparatus and method | |
RU2505921C2 (ru) | Способ и устройство кодирования и декодирования аудиосигналов (варианты) | |
US20040172239A1 (en) | Method and apparatus for audio compression | |
US7613609B2 (en) | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto | |
Ehret et al. | Audio coding technology of exac | |
JP4245288B2 (ja) | 音声符号化装置および音声復号化装置 | |
KR100195708B1 (ko) | 디지탈 오디오 부호기 | |
KR100195711B1 (ko) | 디지탈 오디오 복호기 | |
KR100195709B1 (ko) | 디지탈 오디오신호 변환장치 | |
KR100928966B1 (ko) | 저비트율 부호화/복호화방법 및 장치 | |
KR100195707B1 (ko) | 디지탈 오디오신호 변환장치 | |
KR100204471B1 (ko) | 디지탈 오디오 부호화기의 비트 할당 장치 | |
KR100195712B1 (ko) | 디지탈 오디오 복호화기의 음질 조절 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20110201 Year of fee payment: 13 |
|
LAPS | Lapse due to unpaid annual fee |