KR20000044778A - Ac-3 오디오에서의 인코딩 방법 - Google Patents

Ac-3 오디오에서의 인코딩 방법 Download PDF

Info

Publication number
KR20000044778A
KR20000044778A KR1019980061278A KR19980061278A KR20000044778A KR 20000044778 A KR20000044778 A KR 20000044778A KR 1019980061278 A KR1019980061278 A KR 1019980061278A KR 19980061278 A KR19980061278 A KR 19980061278A KR 20000044778 A KR20000044778 A KR 20000044778A
Authority
KR
South Korea
Prior art keywords
mantissas
exponents
stereo sound
filter bank
audio
Prior art date
Application number
KR1019980061278A
Other languages
English (en)
Inventor
윤정익
Original Assignee
전주범
대우전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전주범, 대우전자 주식회사 filed Critical 전주범
Priority to KR1019980061278A priority Critical patent/KR20000044778A/ko
Publication of KR20000044778A publication Critical patent/KR20000044778A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00036AC-3, i.e. ATSC digital audio compression standard

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 소정의 펄스 부호 변조 데이터를 수신하여 이를 AC-3 데이터화하는 AC-3 오디오에서의 인코더 구현 방법으로서, 펄스 부호 변조된 데이터를 수신하여 이를 이산 시간 변환(discrete time transform)을 수행하여 이에 따른 계수를 출력하는 단계와, 펄스 부호 변조 데이터의 좌우 신호의 합과 차를 구하여 스테레오 음향을 구성하는 단계와, 계수에서 가수(mantissas)와 지수(exponents)를 추출하는 단계와, 추출된 지수를 제공 받아 지수를 인코딩하고, 스테레오 음향을 전송 받아 소정의 프레임 구성부로 제공하는 단계와, 양자화 비트 정보에 따라 추출한 가수를 양자화하고 양자화된 가수를 프레임 구성부로 전송하는 단계와, 인코딩된 지수와 스테레오 음향을 수신하고, 양자화된 지수를 수신하여 이들을 프레임으로 구성하는 단계를 포함한다. 따라서, 본 발명은 AC-3 오디오 인코딩에 있어서 고음질을 필요로 하지 않는 장치에 사용하기 위해 인코딩하는 경우, 또는 많은 용량의 데이터 또는 복잡한 장치를 필요로 하지 않는 장치 및 알고리즘에 적용 가능한 AC-3 인코딩 방법을 제공하는 효과가 있다.

Description

AC-3 오디오에서의 인코딩 방법
본 발명은 AC-3 오디오에서의 인코딩 방법에 관한 것으로써, 더욱 상세하게는, AC-3의 인코딩시에 불필요한 단계를 제거하고 인코딩하는 방법에 관한 것이다.
일반적으로, 음악이나 영화를 재생하는 AV(audio-visual) 기기에 있어서 원음에 충실한 음질과 음장의 추구라고 하는 것은 음향 재생에 있어선 영원한 목적이다. 음질에 대해서는 이미 디지털 신호의 기록 기술과 전송 기술의 진보로 큰 개선을 보이고 있다. 또한 음장의 재생이라는 점에서는 영화관에서 볼 수 있는 멀티 채널에 의한 재생이 이전부터 그 해답으로 지적되어 오고 있다.
일반 가정용으로 1970년 무렵 4 채널 재생 방식이 각 세트 메이커에서 제안되어 발매되었지만, 4 스피커의 배치가 번거롭고 가격이 높다는 문제점으로 인하여 시장에서 사라져갔다.
이에 대해 전방의 2 스피커를 이용하여 청취자의 주변 임의의 방향으로 음상을 만들고자하는 생각은 이전부터 있어 왔으며, 이를 발전시킨 원리가 1963년 벨(bell) 연구소의 슈레이더 박사에 의해 발표되었다. 2개의 스피커를 이용한 원리는 임의의 방향에서 청취자의 양 귀에 대한 전달 특성을 측정하여 상술한 전달 특성을 전방의 두 스피커로 재생하여 실현한다고 하는 것이다.
70년대 중반에 두 개의 스피커를 이용하여 청취자의 주변 임의의 방향으로 음상을 만들고자한 이 원리에 의하여 제품이 출시되었다. 당시의 이 제품은 아날로그 기술에 의해 만들어졌기 때문에 복잡한 반사음을 실현할 수가 없었으므로 현재에 요구되는 충분한 성능을 달성할 수 없었다.
현재의 기술에서는 이와 같은 기능들의 문제점을 극복하기 위하여 많은 기준안들이 제안되었으며, 그중 가장 널리 보급되었으며, 음질의 우수성을 인정 받고 있는 것이 돌비(dolby)사의 AC-3 방식이다.
상술한 AC-3 방식은 원래 영화관에서 재생을 목적으로 만들어진 멀티 채널 방식이다. 영화관은 전방 좌측, 전방 우측, 채널과 대사를 중심으로 한 전방 센터 채널, 후방의 좌우 채널과 후방의 벽면에 여러개의 스피커를 배치하는 서라운드 채널로 구성되는 스피커 배치를 취하고 있다. 이것을 영화 트랙에 수납하고 있는 것이 돌비 AC-3 방식의 영화에 적용된 경우이다.
그리고, AC-3 방식은 디지털 TV, HDTV 및 DVD 등의 가정용 제품에 채용 예정 또는 채용되어 있다. 이러한 돌비 AC-3 방식은 지금까지 개발된 디지털 압축 방식 중에서 효율, 음질, 다양성이 가장 뛰어난 기술로 평가받고 있다. 이 방식은 5.1 채널(5채널은 중앙(Center), 전면우측(FR), 전면좌측(FL), 후면우측(RR) 및 후면좌측(RL), 나머지의 0.1 채널은 서브 우퍼)의 멀티 채널 디지털 서라운드 시스템을 무기로 1992년부터 영화산업에 제공되기 시작하였으며, 최근에는 가정용 LD(laser disk)에 이 방식을 탑재한 홈 THX(Tominson Holman's eXperiment : 루카스 필름의 등록 상표) 시스템을 통해서 전세계에 소개되고 있다.
돌비 AC-3 규격의 오디오 시스템은 오디오의 표준으로 자리잡아 가고 있다. 따라서, 하이 레벨(high level)의 음질을 원하는 시스템 뿐만 아니라, 로우 레벨의 음질로도 충분한 비디오폰(video-phone) 등의 규격, 또는 통신 또는 인터넷 상에서 유통되고 있는 리얼 오디오(real audio) 등의 프로그램에서 동작하는 확장자가 mp3인 파일들도 대체할 수 있는 메모리를 적게 차지하는 AC-3 규격이 필요하다.
따라서, 본 발명은 상술한 요구를 충족시키기 위하여 안출한 것으로서, 그 목적은 로우 레벨의 목적에 사용될 수 있으며, 낮은 메모리를 차지하는 AC-3 인코딩 방법을 제공하는 데에 있다.
이러한 목적을 달성하기 위해 본 발명은 소정의 펄스 부호 변조 데이터를 수신하여 이를 AC-3 데이터화하는 AC-3 오디오에서의 인코더 구현 방법으로서, 펄스 부호 변조된 데이터를 수신하여 이를 이산 시간 변환(discrete time transform)을 수행하여 이에 따른 계수를 출력하는 단계와, 펄스 부호 변조 데이터의 좌우 신호의 합과 차를 구하여 스테레오 음향을 구성하는 단계와, 계수에서 가수(mantissas)와 지수(exponents)를 추출하는 단계와, 추출된 지수를 제공 받아 지수를 인코딩하고, 스테레오 음향을 전송 받아 소정의 프레임 구성부로 제공하는 단계와, 양자화 비트 정보에 따라 추출한 가수를 양자화하고 양자화된 가수를 프레임 구성부로 전송하는 단계와, 인코딩된 지수와 스테레오 음향을 수신하고, 양자화된 지수를 수신하여 이들을 프레임으로 구성하는 단계를 구비하는 것을 특징으로 한다.
도 1은 통상적인 AC-3 오디오에서의 디코딩 장치의 구성을 도시한 블록도,
도 2는 본 발명에 발명에 따른 AC-3 오디오에서의 인코더 구현하는 과정을 도시한 플로우챠드.
<도면의 주요부분에 대한 부호의 설명>
100 : 필터 뱅크 분석부 110 : 가수 양자화부
120 : 인코더 130 : 비트 할당부
140 : 프레임 구성부
이하, 첨부된 도면을 참조하여 본 발명의 구성 및 동작을 상세히 설명하기로 한다.
도 1은 본 발명의 바람직한 실시예에 따라 AC-3 오디오에서의 AC-3 인코딩 장치의 구성을 도시한 블록도를 도시한다. 도 1에 도시된 바와 같이, 도 1의 장치는 필터 뱅크 분석부(100), 가수 양자화부(110), 인코더(120), 비트 할당부(130) 및 프레임 구성부(140)를 포함한다. 이하, 도 1을 참조하여 본 발명의 장치를 상세히 설명하면 다음과 같다.
필터 뱅크 분석부(100)는 소정의 오디오 펄스 부호 변조(pulse code modulation, PCM) 신호를 수신하여 이를 이산 시간 변환(discrete time transform)하고, 음향 신호의 합과 차를 구한다. 이산 시간 변환하고 출력된 계수중의 지수(exponent)는 인코더(120)로 전송하고 가수(mantissa)를 가수 양자화부(110)로 전송한다.
인코더(120)로 전송된 지수는 인코딩되어 프레임 구성부(140)로 제공되며, 가수 양자화부(110)로 전송된 가수는 는 비트 할당부(130)로부터 몇 비트로 양자화할 것인지의 비트 정보를 수신하여 해당 비트수 대로 양자화된다.
일반적으로 AC-3에서는 최고 16비트를 지원하며, 이중 원하는 양자화 비트수 대로 가수를 양자화 한다. 인코더(120)에서 인코딩된 지수와 가수 양자화부(110)에서 양자화된 지수는 프레임 구성부(140)로 전송한다.
프레임 구성부(140)는 수신한 데이터에 동기 신호와 에러 체크 신호 등을 부가하고 일정한 블록 단위로 분할하여 프레임화한다. 프로임 구성부(140)는 프레임화된 AC-3 데이터를 출력한다.
도 2는 본 발명에 따른 AC-3 오디오에서의 인코더 구현하는 과정을 도시한 플로우챠드이며, 동 도면을 참조하여 인코딩 과정을 설명한다.
단계 (202)에서, 필터 뱅크 분석부(100)는 오디오 펄스 부호 변조된 데이터를 수신한다.
필터 뱅크 분석부(100)는 수신한 펄스 부호 변조 데이터를 이산 시간 변환을 수행하여 이에 따른 계수를 출력한다(단계 204).
단계 (206)에서, 필터 뱅크 분석부(100)는 수신한 펄스 부호 변조 데이터의 좌우 신호의 합과 차를 구하여 스테레오 음향을 구현하고 스테레오 음향을 인코더로 전송한다.
필터 뱅크 분석부(120)는 단계 (204)에서 출력된 계수에서 지수를 추출하여 이를 인코더(120)로 제공한다(단계 208).
필터 뱅그 분석부(120)는 단계 (204)에서 출력된 계수에서 가수를 추출하여 이를 가수 양자화부(110)로 제공한다. (단계 210).
단계 (212)에서, 인코더(120)는 필터 뱅크 분석부(100)에서 추출된 지수를 제공 받아 이를 인코딩하여 프레임 구성부(140)로 전송하며, 스테레오 음향을 프레임 구성부로 전송한다.
단계 (214)에서, 비트 할당부(130)는 추출된 가수에 기 설정된 양자화 비트(가령, 16 비트)로 할당할 것임을 알리는 양자화 비트와 이 양자와 비트에 따른 계산식에 따라 가수를 양자화되도록하는 양자화 비트 정보를 가수 양자화부(110)로 전송한다.
상기 비트 할당부(130)로부터 수신한 양자화 비트 정보에 따라 필터 뱅크 수신부(100)에서 추출한 가수를 양자화하고(단계 216), 양자화된 가수를 프레임 구성부(140)로 전송한다(단계 218).
단계 (220)에서, 프레임 구성부(140)는 인코더(120)로부터 인코딩된 지수와 스테레오 음향을 수신하고 가수 양자화부(110)로 부터는 양자화된 지수를 수신하여 이들을 프레임으로 구성한다. 일반적으로 프레임에는 동기 신호와 비트 스트림 정보 및 6 블록의 오디오 음향 블록과 오류 정정 비트가 수록된다.
따라서, 상술한 바와 같이 본 발명은 AC-3 오디오 인코딩에 있어서 고음질을 필요로 하지 않는 장치에 사용하기 위해 인코딩하는 경우, 또는 많은 용량의 데이터 또는 복잡한 장치를 필요로 하지 않는 장치 및 알고리즘에 적용 가능한 AC-3 인코딩 방법을 제공하는 효과가 있다.

Claims (1)

  1. 소정의 펄스 부호 변조 데이터를 수신하여 이를 AC-3 데이터화하는 AC-3 오디오에서의 인코더 구현 방법으로서,
    상기 펄스 부호 변조된 데이터를 수신하여 이를 이산 시간 변환을 수행하여 이에 따른 계수를 출력하는 단계;
    상기 펄스 부호 변조 데이터의 좌우 신호의 합과 차를 구하여 스테레오 음향을 구성하는 단계;
    상기 계수에서 가수와 지수를 추출하는 단계;
    상기 추출된 지수를 제공 받아 상기 지수를 인코딩하고, 상기 스테레오 음향을 전송 받아 소정의 프레임 구성부로 제공하는 단계;
    상기 양자화 비트 정보에 따라 상기 추출한 가수를 양자화하고 상기 양자화된 가수를 상기 프레임 구성부로 전송하는 단계;
    상기 인코딩된 지수와 상기 스테레오 음향을 수신하고, 상기 양자화된 지수를 수신하여 이들을 프레임으로 구성하는 단계를 포함하는 AC-3 오디오에서의 인코딩 방법.
KR1019980061278A 1998-12-30 1998-12-30 Ac-3 오디오에서의 인코딩 방법 KR20000044778A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980061278A KR20000044778A (ko) 1998-12-30 1998-12-30 Ac-3 오디오에서의 인코딩 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980061278A KR20000044778A (ko) 1998-12-30 1998-12-30 Ac-3 오디오에서의 인코딩 방법

Publications (1)

Publication Number Publication Date
KR20000044778A true KR20000044778A (ko) 2000-07-15

Family

ID=19568033

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980061278A KR20000044778A (ko) 1998-12-30 1998-12-30 Ac-3 오디오에서의 인코딩 방법

Country Status (1)

Country Link
KR (1) KR20000044778A (ko)

Similar Documents

Publication Publication Date Title
CN100367826C (zh) 具有向后兼容性混频的分立式多声道音响
CN101356573B (zh) 对双耳音频信号的解码的控制
KR960012475B1 (ko) 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
US5909664A (en) Method and apparatus for encoding and decoding audio information representing three-dimensional sound fields
US5632005A (en) Encoder/decoder for multidimensional sound fields
CN102122509A (zh) 多信道解码器和多信道解码方法
JPH09501286A (ja) 両立性マトリックス復号信号用多重チャンネル送・受信機装置及び方法
JPH07160292A (ja) 多層符号化装置
AU2001259641A1 (en) Discrete multichannel audio with a backward compatible mix
RU2323551C1 (ru) Частотно-ориентированное кодирование каналов в параметрических системах многоканального кодирования
JP3793235B2 (ja) 2チャネル伝送及び1チャネル伝送に適合するnチャネル伝送
KR20050116828A (ko) 다채널 신호를 나타내는 주 및 부 신호의 코딩
CN101292428B (zh) 用于编码/解码的方法和装置
JP3250376B2 (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
US5610985A (en) Digital 3-channel transmission of left and right stereo signals and a center signal
EP0678226B1 (en) Transmission and reception of a first and a second signal component
JP2852862B2 (ja) Pcmオーディオ信号の変換方法と装置
KR101417065B1 (ko) 가상 입체 음향 구현 장치 및 방법
KR20000044778A (ko) Ac-3 오디오에서의 인코딩 방법
WO1995016263A1 (fr) Procede, dispositif et support concernant le traitement de l&#39;information
EP0608930B1 (en) Digital 3-channel transmission of left and right stereo signals and a center signal
JP3528260B2 (ja) 符号化装置及び方法、並びに復号化装置及び方法
KR100598602B1 (ko) 가상 입체 음향 생성 장치 및 그 방법
KR100516733B1 (ko) 돌비 프로로직 오디오 장치
KR960003454B1 (ko) 적응적 스테레오 디지탈 오디오 부호화장치

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination