KR100310216B1 - 다중채널오디오신호를위한코딩장치또는방법 - Google Patents

다중채널오디오신호를위한코딩장치또는방법 Download PDF

Info

Publication number
KR100310216B1
KR100310216B1 KR1019940027333A KR19940027333A KR100310216B1 KR 100310216 B1 KR100310216 B1 KR 100310216B1 KR 1019940027333 A KR1019940027333 A KR 1019940027333A KR 19940027333 A KR19940027333 A KR 19940027333A KR 100310216 B1 KR100310216 B1 KR 100310216B1
Authority
KR
South Korea
Prior art keywords
bit allocation
allocation amount
audio signal
digital audio
channel
Prior art date
Application number
KR1019940027333A
Other languages
English (en)
Other versions
KR950012426A (ko
Inventor
미야모리신지
우에노마사또시
Original Assignee
이데이 노부유끼
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이데이 노부유끼, 소니 가부시끼 가이샤 filed Critical 이데이 노부유끼
Publication of KR950012426A publication Critical patent/KR950012426A/ko
Application granted granted Critical
Publication of KR100310216B1 publication Critical patent/KR100310216B1/ko

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

본 발명의 저 비트율 인코더는 오디오 신호와 인간의 청각 특성 모두를 이용하여 다수 채널의 디지탈 오디오 신호를 압축 인코딩하는데 적용되며, 각 채널의 모든 디지탈 오디오 신호에 대해 디지탈 오디오 신호의 에너지를 검출하기 위한 에너지 검출부와, 검출된 결과를 토대로 각 채널에 대한 비트 할당량을 결정하기 위한 비트 할당량 결정부와, 결정된 비트 할당량에 따라 모든 개개 채널에 할당되는 비트 할당량에 근거하여 디지탈 오디오 신호를 압축 인코딩하기 위한 압축 인코딩부, 및 모든 개개의 채널에 대해 압축 인코딩된 신호를 다중화 하기 위한 다중화부로 구성된다. 또한 비트 할당량 결정부는 디지탈 오디오 신호의 에너지와 비트 할당량 사이의 관계가 디지탈 오디오 신호의 에너지가 증감함에 따라 비트 할당량이 대체로 증가하는 것과 같이 비 선형 특성을 나타내도록 비트 할당량을 결정하기 위해 동작한다. 따라서, 다중 채널 시스템의 압축 인코딩에 있어서의 비트 할당량 용장이 없고, 고품질의 압축 인코딩 및 디코딩이 실현된다.

Description

다중 채널 오디오 신호를 위한 코딩 장치 또는 방법
본 발명은 저 비트율 인코더와 다중 채널 시스템의 오디오 신호를 압축-인코딩하기 위한 저 비트율 인코딩 방법과, 저 비트율 디코더와 압축-코딩된 신호를 디코딩 하기 위한 저 비트율 디코딩 방법 및, 그러한 인코더/인코딩 방법에 의해 인코딩된 신호가 기록되는 기록 매체에 관한 것으로, 이것은 비디오 테이프 레코더 또는 비디오 디스크 플레이어 등과 같은 영화 필름 영사 시스템 또는 스테레오 혹은 다중-음향 시스템 등에 이용된다.
오디오 신호는 음성 신호등에 대한 여러가지 효과적인 인코딩 기술과 장치가 공지되어 있다.
효과적인 인코딩 기술의 예로서, 차단 주파수 대역 분할 시스템이 있는데 이것은 소위 매블럭 마다의 시간축 신호를 주파수 축 신호로 매 단위 시간마다 시간영역으로 예를 들어 오디오 신호등을 블록화(직교변환)하고, 이후 그러한 신호 성분을 매 주파수 대역마다 인코딩하기 위해 다수의 주파수 대역의 신호 성분으로 분리하는 변환 코딩이다.
더욱이, 서브-대역 코딩(SBC)이 있는데 이것은 비-블록 주파수 대역 분할 시스템으로 시간 영역에서의 오디오 신호가 그것을 인코딩하기 위해 매 단위 시간 마다 그것을 블록화하지 않고 다수 주파수 대역이 신호 성분으로 분할하는 것이다.
더욱이, 상기의 서브-대역 코딩과 변환 코딩이 결합되는 효과적인 코딩 기술과 장치가 제기되어 왔다. 이러한 경우에, 예를 들어 입력 신호가 서브-대역 코딩에 의해 다수 주파수 대역에서의 신호 성분으로 분리된 후 매 각각의 주파수 대역신호를 주파수 영역의 신호로 직교 변환하여 주파수 영역이 직교 변환된 신호 성분으로 코딩된다.
여기서, 상기 서브-대역 코딩의 주파수 대역 분할용 필터로서 예를 들어 한가지 필터인 QMF 가 있다. 그러한 필터는 예를 들어 "서브 대역에서의 음성의 디지탈 코딩" 제목의 1976년 R.E. 크로키에르가 저술한 벨 시스템.테크놀, 잡지 Vol 55 No.8 에 기술되어 있다. 이러한 QMF 필터는 주파수 대역을 동일한 대역폭의 대역으로 나눈다. 이러한 필터는 소위 앨리어싱(aliasing)이 상기 분할된 주파수 대역을 나중의 처리 단계에서 합성하지 않는데에 그 특징이 있다.
더욱이, "다상 구적 필터(polyphase quadrature filter)-새로운 서브 대역코딩 기술" 조셉 H. 로스월러 저작, ICASSP 83, 보스턴에 동일한 대역폭의 필터 분할 기술이 포함되 있다. 이러한 다상 구적 필터는 다수 주파수 대역의 동일한 대역폭의 신호 성분으로 신호를 분할할때 한번에 분할이 이루어질 수 있는 데에 그 특징이 있다.
더욱이, 상기 직교 변환 처리로서, 예를 들어 매 각각의 블럭마다 고속 푸리에 변환(FFT), 이산 코사인 변환(DCT) 또는 수정된 DCT 변환(MDCT)등을 실행하기 위해 입력 오디오 신호를 소정의 단위 시간(프레임) 블럭으로 분할하여 시간축의 신호를 주파수 기준의 신호로 변환하는 그러한 직교 변환 시스템이 있다.
이러한 MDCT 는 "시간 영역 앨리어싱 제거에 근거한 필터 뱅크 설계를 이용한 서브 대역/변환 코딩" 제목으로 서레이 로얄 멜보른 공과 대학의 J.P. 프린센과 A.B. 블레들리 저작의 문헌 ICASSP 1987 년에 기술되어 있다.
더욱이, 주파수 대역으로 분할된 각각의 주파수 성분을 인코딩하는 경우에 주파수 분할폭으로서, 인간의 청각 특성이 고려되는 대역 분할(band division)이 존재한다. 즉, 일반적으로 기준 대역으로 불리는, 더 높은 주파수 대역측으로의 주파수 이동에 따라 대역폭이 더 넓게 되는 대역폭에 의해 오디오 신호가 다수(예를 들어 25) 대역의 신호 성분으로 분리되는 경우가 있다.
게다가, 이때에 매 각각의 대역의 데이타를 인코딩 할 때에 각각의 대역으로 소정의 비트 할당 또는 매 각각의 대역의 적응적인 비트 할당에 의한 코딩이 실행된다.
예를 들어, 상기 비트 할당에 의해 MDCT 처리가 이행된 후에 얻어진 계수 데이타를 인코딩할 때에, 각각의 블럭이 MDCT 처리에 의해 얻어진 각각의 대역의 MDCT 계수에 대한 적응적인 할당 비트수에 의해 코딩이 실행된다.
그러므로 비트 할당 기술과 장치로서, 다음 두개 기술과 장치가 공지되어 있다.
예를 들어, 1977 년 8 월 판 책자 ASSP-25 NO4 의 IEEE 음향, 음성 및 신호처리의 상호 작용에 "음성 신호의 적응 변환 코딩"에서 매 각각의 대역에서 신호의 크기에 근거하여 비트 할당이 실행된다.
더욱이, 예를 들어 1980년 ICASSP, MIT 공대, M. A. 크란스너가 저술한 "임계 대역 코더 ---청각 시스템의 디지탈 코딩의 필수 요구조건"에서 고정된 비트 할당을 실행하기 위해 청각 마스킹을 이용하므로서 필요한 신호대 잡음비가 매 주파수 대역마다 얻어지는 장치와 기술을 볼 수 있다. 반면에, 예를 들어 상기 서브 대역 코딩등을 이용한 오디오 신호용의 효과적인 압축 코딩 시스템에서, 인간의 청각 특성을 이용하여 오디오 신호를 압축하고 그것의 데이타량이 약 1/5 과 동일하게 되는 그러한 시스템이 이미 실험되어 왔다.
데이타 양이 약 1/5 과 동일하게 되게끔 오디오 신호를 압축하는 효과적인 인코딩 시스템으로서, 예를 들어 MD(소니 회사의 상표, 미니 디스크)에 사용된 ATRAC(소니 회사의 상표인 적응 변환 청각 코딩)로 불리는 시스템이 있다는 것을 알 수 있다.
그러나, 인간의 청각 특성을 이용한 효과적인 코딩 시스템에서 그러한 현상은 거의 일어나지 않지만, 음성 신호를 압축-코딩하므로써 얻어진 인간의 음성 또는 악기의 음향을 디코딩하여 코딩된 신호가 원래 음성으로부터 변환된다.
특히, 청각 특성을 이용한 이러한 효과적인 코딩 시스템은 원음의 충실한 재생이 요구되는 기록 매체의 기록 포맷을 위해 이용되는 경우에, 더 높은 음질의 구현이 요구된다.
반면에, 신호(데이타)량이 약 1/5 과 동일하게 되도록 오디오 신호를 압축하는, 이러한 효과적인 코딩 시스템(ATRAC 시스템 등)의 형태는 이미 실현되있고, 이러한 형태를 채택한 하드웨어는 대중화되고 있다.
따라서, 포맷의 양립성이 없는 변환 또는 확장의 구현은 포맷을 이용하는 제작자 분 아니라 일반 소비자에게도 불리하다.
이러한 이유로, 그 포맷 자체를 바꾸지 않고서 인코딩 또는 디코딩하는 장치에 근거한 높은 음질을 얻을 수 있다.
위의 기술 내용 이외에 더 높은 음질의 구현 방법으로서, 선형 PCM 음향을 보통의 압축된 데이타로 합성할 수 있다. 그러나, 효과적인 코딩 시스템의 압축된 데이타가 선형 데이타가 프레임 길이와 각 프레임상의 시간 길이가 다르기 때문에, 재생시에 동기화시키는 것이 어렵다.
따라서, 동시에 이러한 두개 포맷의 데이타를 이용하는 것은 곤란하다.
더욱이, 보통의 오디오 장비의 경우 분 아니라 예를 들어 영화 필름 영사 시스템인 경우에, 비디오 테이프 레코더 또는 비디오 디스크 플레이어 등과 같은 고해상도 텔레비젼 또는 스테레오 혹은 다중-음향 시스템, 4 내지 8 채널의 다중 채널 오디오 신호가 취급되고 있는 중이다. 이러한 경우에, 역시, 비트율을 감소시키도록 효과적인 코딩 실행이 예상된다.
특히, 영화 필름에서 예를 들어 좌채널, 좌측 중앙 채널, 중앙 채널, 우측 중앙 채널, 우측 채널, 서라운드 좌측 채널, 서라운드 우측 채널 및 서브-우퍼 채널의 8 개 채널의 디지탈 오디오 신호가 기록된다. 이러한 경우에, 비트율을 감소시키도록 상기의 효과적인 코딩이 필요하다.
즉, 영상 필름에서는, 소위 CD(컴팩트 디스크)에 사용된 16 비트와 44.1kHz의 표본화 주파수의 선형 양자화된 오디오 데이타의 8 채널이 가능한 영역은 곤란하다. 따라서, 오디오 데이타의 압축이 요구된다. 영상 필름에 기록된 8 채널 데이타의 채널은 좌측 스피커, 좌측 중앙 스피커, 중앙 스피커, 우측 중앙 스피커, 우측 스피커, 서라운드 좌측 스피커, 서라운드 우측 스피커 및 서브-우퍼 스피커라는 것을 알아야 하고, 이것은 영상측에 배치되며, 예를 들어 영상 필름의 영상 기록 영역으로부터 재생된 영상이 영사기에 의해 영사된다.
중앙 스피커는 스크린측의 중앙에 배치되어, 중앙 채널의 오디오 데이타에 의해 재생된 음향을 출력한다. 상기 중앙 스피커는 가장 중요한, 재생된 음향, 예를 들어 배우의 음성들을 출력한다.
서브-우퍼 스피커는 서브-우퍼 스피커용 채널의 오디오 데이타에 의해 재생된 음향을 출력한다. 이러한 서브-우퍼 스피커는 저주파 대역에서의 음항보다는 진동, 예를 들어 폭발소리 같은 것을 느끼는 음향을 출력하고, 폭발 장면에 효과적으로 사용된다.
좌측 스피커와 우측 스피커는 스크린의 좌측과 우측에 배치되어 좌측 채널의 오디오 데이타에 의해 재생된 음향과 우측 채널의 오디오 데이타에 의해 재생된 음향을 각각 출력한다. 이러한 좌우 스피커는 스테레오 음향 효과를 낸다.
좌측 중앙 스피커는 좌측 스피커와 중앙 스피커 사이에 배치되고, 우측 중앙스피커는 중앙 스피커와 우측 스피커 사이에 배치된다. 좌측 중앙 스피커는 좌측 채널의 오디오 데이타에 의해 재생된 음향을 출력하고, 우측 중앙 스피커는 우측 중앙 채널의 오디오 데이타에 의해 재생된 음향을 출력한다. 이러한 우측 및 좌측 중앙 스피커는 각각 좌우측 스피커의 보조 기능을 수행한다.
특히, 커다란 스크린과 다수의 사람이 있는 영화관에서, 영상 음향은 좌석위치에 따라 불안정하게 되는 단점이 있다. 그러나, 상기 좌우측 중앙 스피커가 추가되어 영상 음향이 더욱 생생하게 나타나는 효과가 있다.
더욱이, 관객의 좌석 주위에 좌좌측 서라운드 스피커가 배치된다. 이러한 좌우 서라운드 스피커는 우측 서라운드 채널의 오디오 데이타에 의해 재생된 음향과, 좌측 서라운드 채널의 오디오 데이타에 의해 재생된 음향을 출력하고, 박수 소리 또는 웃음 소리를 내는 효과가 있다. 이렇게 3가지 방식으로 영상 음향을 창조하는 것이 가능하다.
게다가, 영화 필름 매체 표면에서 결점등이 발생되기 쉽기 때문에, 디지탈 데이타가 그대로 기록된다면, 데이타 누락이 더욱 많이 일어난다. 그러한 기록용 시스템은 실용적인 관점에서 채택될 수 없다. 이러한 이유로, 에러 정정 코드 능력이 매우 중요하다.
따라서, 데이타 압축에 대해 정정 코드용 비트를 고려하므로써, 기록이 필름상의 기록 영역에서 이루어질 수 있을 정도로 압축 처리를 실행하는 것이 필요하다.
상기의 사실로부터 8 채널의 디지탈 오디오 데이타를 압축하는 압축 방법으로서, 인간의 청각 특성을 고려하여 적당한 비트할당을 실행함으로써, CD 에 버금가는 음질을 얻는 효과적인 코딩 시스템(예를 들어 ATRAC 시스템)이 적용된다.
그러나, 이러한 효과적인 코딩 시스템으로, 일반적인 음향 기기 또는 사람 목소리등이 상기와 유사한 원음으로부터 변화한다.
이러한 이유로 원음에 가까운 충실도를 갖는 재생이 필요한 기록 포맷에 상기와 같은 시스템이 채택되는 경우에, 더 높은 음질을 구현하는 수단이 요구된다.
상기의 효과적인 코딩 시스템을 제외한 시스템이 다중-채널 기록 포맷으로서 영화 필름에 사용되는 한 이러한 문제는 항상 존재하며, 비역전 압축 시스템이 기록 영역의 보장이라는 관점에서 채택된다.
더욱이, 상기 다중-채널 시스템의 오디오 신호에 효과적인 코딩을 구현하는 시스템에서, 각 채널의 데이타는 압축 처리를 독립적으로 실행하도록 한다.
이러한 이유로, 예를 들어 어떤 한개 채널이 울리지 않은 음향 상태에 있을지라도 고정된 비트(바이트) 할당량이 그 채널이 할당된다.
상기의 비음성 음향 상태에서, 채널에 고정된 비트 할당량을 주는 것은 중복이 된다.
더욱이, 비트 할당량이 높은 레벨의 신호 채널과 저 레벨의 신호 채널에 대해 역시 동일하기 때문에, 비트 할당량이 각 채널에 대해 평가될 때 중복 데이타가 존재한다.
비트 할당량이 각각의 채널마다 고정되는 경우에는 특히, 상기의 중복성은 더욱 현저하다는 것이 고려되야 한다.
발명의 개요
본 발명의 목적은 더 높은 품질의 압축 코딩(compression-coding)을 실현하고 다중 채널 시스템의 압축 코딩에 있어서 비트 할당량의 용장을 제거할 수 있는 인코더 및 인코딩 방법과, 이에 상응하는 디코더 및 디코딩 방법과, 압축 코딩된 신호들이 기록되는 기록 매체를 제공하는 것이다.
본 발명에 따라, 전술한 목적을 달성하기 위하여, 오디오 신호의 성질과 인간의 청각 양자를 이용함으로써 복수 채널의 디지탈 오디오 신호들을 압축 인코딩하는 저 비트율 인코더가 제공되는 데, 이 인코더는 각각의 채널들의 디지탈 오디오 신호들 마다 디지탈 오디오 신호들의 에너지를 검출하는 에너지 검출 수단; 이 검출된 결과에 기초하여 각각의 채널들에 대해 비트 할당량을 결정하는 비트 할당량 결정 수단; 이 결정된 비트 할당량에 따라 각각의 채널들 마다 할당된 비트 할당량에 기초하여 디지탈 오디오 신호들을 압축 인코딩하는 압축 인코딩 수단: 및 각각의 채널들마다 상기 압축 인코딩된 신호들을 다중화하는 다중화 수단을 포함한다. 상기 비트 할당량 검출 수단은 각각의 비트 할당량을 결정하도록 동작하므로 디지탈 오디오 신호의 에너지와 비트 할당량 사이의 관계가 비선형 특성을 나타내고, 그래서 디지탈 오디오 신호의 에너지가 증가함에 따라 비트 할당량도 전체적으로 증가한다. 또한, 복수 채널중 오디오 신호들의 시간 영역 샘플에 대한 채널과 주파수 영역 샘플에 대한 채널 사이에는 가변 비트 할당이 수행된다.
본 발명에 따른 저 비트율 인코더에 있어서, 상기 에너지 검출 수단은 압축 인코딩을 행하기 전에 각각의 채널들의 디지탈 오디오 신호들의 진폭 정보를 검출하는 진폭 정보 검출 수단이다. 또한, 상기 비트 할당량 검출 수단은 진폭 정보의 시점 변화에 기초하여 각각의 채널들에 대한 비트 할당량을 결정한다.
이런 경우에, 사익 비트 할당량 결정 수단은 청각 특성에 기초하여 각각의 채널들의 진폭 정보의 피크 값에 대한 비트 할당량을 소정의 변환 공식에 의해 계산(결정)하고 이 변화 결과에 기초하여 각각의 채널들에 대해 할당될 비트량을 결정한다.
또한, 상기 비트 할당량 결정 수단은 상기 소정의 변환 공식으로부터 각각의 채널들에 할당될 비트량의 추정값을 결정하고 이 각각의 추정값에 비례하여 각각의 채널들의 비트 할당량을 할당함으로써 모든 채널들의 총 비트 할당량이 고정되도록 한다.
한편, 본 발명에 따른 제 1 실시예의 저 비트율 디코더는 제 1 실시예의 저비트율 인코더에 의해 인코딩된 각각의 채널들의 신호들을 디코딩하는 디코딩 수단을 포함한다.
또한, 본 발명에 따른 제 2 실시예의 저 비트율 인코더에 있어서, 상기 에너지 검출 수단은 각각의 채널들의 신호들에 대한 소정의 환산 계수(시간 및 주파수의 2 차원 영역의 규준화된 값(블록 구동 단위)의 시간 변화를 검출하는 수단이고, 상기 비트 할당량 결정 수단은 환산 계수들의 변화에 의존하여 채널들 사이의 가변비트 할당을 실행하는 기능은 한다.
또한, 제 2 실시예의 저 비트율 인코더에 있어서, 비트 할당량 결정 수단은 인간의 청각 특성에 기초하여 각각의 채널들의 환산 계수를 총합의 시간 변화에 대한 비트 할당량을 소정의 변환 공식에 의해 계산(결정)하고 이 변환 결과에 기초하여 각각의 채널들에 할당될 비트량을 결정한다.
상기 비트 할당량 결정 수단은 상기 소정의 변환 공식으로부터 각각의 채널들에 할당될 비트량의 추정 값을 계산(결정)하고 각각의 추정값에 비례하여 각각의 채널들의 비트 할당량을 할당함으로써 모든 채널들의 총 비트 할당량이 고정되도록 한다.
더욱이, 본 발명에 따른 제 2 실시예의 저 비트율 디코더는 제 2 실시예의 저 비트율 인코더에 의해 인코딩된 각각의 채널들의 신호들을 디코딩하는 디코딩 수단을 포함한다.
본 발명에 따라 복수의 채널들의 오디오 데이타를 압축 인코딩함에 있어서, 각 채널들의 에너지의 시간 변화에 기초하여 각 채널들에 대한 비트 할당량을 결정하여 압축 인코딩을 실행하는 방법이 채용되므로, 정보량에 일치하는 비트 할당이 각 채널들에 대해 수행될 수 있다.
또한 본 발명에 따라 복수 채널들의 오디오 데이타를 압축 인코딩함에 있어서, 각 채널들에서 에너지와 비트 할당량 사이의 관계는 비선형으로서 비트 할당량에 기초하여 압축 인코딩을 실행하게 된다. 이런 이유에서, 각 채널들에 대한 정보량에 일치하여 비트할당을 실행할 수 있다.
양보한 실시예의 설명
제 1 도와 제 2 도에는 본 발명에 따른 제 1 실시예의 기본구성이 도시되어 있다. 제 1 도에는 제 1 실시예의 저 비트율 인코더의 구성이 도시되고, 제 2 도에는 제 1 실시예의 저 비트율 디코더의 구성이 도시되어 있다. 우선 제 1 도의 인코더의 구성이 설명된다.
복수 채널들(ch1, ch2, ---, chn)의 오디오 신호들은 각 채널들에 상응하는 입력 단자들(201- 20n)과 전송 경로(11∼1n)를 거쳐 각 채널들에 대응하는 표본화 및 양자화 장치들(1001∼100n)에서, 각 채널들의 오디오 신호들이 양자화된 신호들로 변환된다. 이 표본화 및 양자화 장치들(1001∼1OOn)로부터의 양자화된 신호들은 각 전송선(21∼2n)을 거쳐 진폭 정보 검출 회로(200) 및 지연선(3001∼3OOn)에 보내진다.
진폭 정보 검출 회로(200)는 각 채널의 양자화된 신호들로부터 진폭 정보를 검출한다. 즉, 이 진폭 정보 검출 회로(200)는 인코딩 장치들(4001∼4OOn)에 의해 일괄 처리되는 오디오 데이타의 샘플들(이하 시간 블록들이라 한다)의 갯수에 상응하는 주기들마다 진폭 정보의 피크값을 검출하고, 후술하는 이 인코딩 장치들(4001∼400n)은 이 피크값들을 각 채널들에 상응하는 전송선(41∼4n)을 거쳐 비트 할당 결정 회로(500)로 보낸다(전달한다). 이 진폭 정보 검출 회로(200)는 전송선(11∼1n)으로부터의 신호들에 의해 진폭 정보를 검출하는 구조로 할 수 있음에 유의한다.
상기 비트 할당 결정 회로(500)는 후술하는 방식으로 각 채널들마다 피크값으로부터 비트할당량을 변환에 의해 결정하고 전송선(51∼5n)을 거쳐 각 인코딩 장치들(4001∼400n)에 이 비트 할당량을 전달한다.
더욱이, 지연 선들(3001∼300n)은 시간 블록들에 의해 전송선들(21∼2n)을 통해 수신된 신호들을 지연시키고 이 지연된 신호들을 각 전송 선들(31∼3n)을 통해 각 인코딩 장치들(4001∼400n)에 전달한다.
각 인코딩 장치들(4001∼400n)은 시간 블록들마다 압축 동작을 실행한다. 이때에 전송선들(51∼5n)을 통해 수신된 비트 할당량은 전송선들(31∼3n)을 통해 수신된 신호들의 피크 정보를 반영한다. 각 인코딩 장치들(4001∼400n)은 비트 할당량이 전송선들(51∼5n)을 통해 수신된 비트 할당량과 같도록 전송선들(31∼3n)을 통해 수신된 신호들을 압축하고 이 압축된 신호들을 각 전송선들(61∼6n)을 통해 포맷화기(formatter)(600)에 전달한다.
포맷화기(600)는 전송선(61∼6n)을 거쳐 수신된 각 채널의 압축된 신호들을 소정의 포맷에 따라 오류 정정 처리하고, 이 신호들을 기록 매체위에 전송 즉 기록할 비트 스트림으로 합성한다. 이 비트 스트림은 전송선(7)을 거쳐 출력 단자(21)로부터 출력된다.
또한, 이 비트 스트림은 예컨대 레이저 기록 장치(26)에 의해 영화 필름(27) 위의 소정 영역에 기록된다. 도면에서, 참조 부호(29)는 필름 공급용 영사기(도시안됨)의 스프로켓(sprocket)에 맞물리도록 된 구멍들을 나타낸다. 이 기록 영역(28)은 구멍들(29) 사이에 마련된다.
이 실시예의 저 비트율 디코더의 구성이 제 2 도를 참조하여 설명된다.
제 1 도의 저 비트율 인코더에 의해 만들어진 비트 스트림은 기록 매체위에 전송되거나 기록된다. 이 기록된 비트 스트림은 소정의 재생 장치(도시 안됨)를 거쳐 입력 단자(22)에 전달된 다음, 이 입력 단자(22)로부터 전송선(8)을 거쳐 역포맷화기 (deformatter)(700)에 보내진다.
이 역 포맷화기(700)는 전송선(8)을 통해 보내진 비트 스트링을 소정 포맷에 따라 각 채널마다 압축된 신호들로 분해한다. 각 채널마다 분해된 상기 압축 신호들은 각 채널에 대응하는 전송선들(91∼9n)을 거쳐 각 채널마다 대응하여 설치된 디코딩 장치들(8001∼800n)은 각 전송선(91∼9n)을 따라 송신된 상기 압축 신호들을 확장하여 이 신호들은 대응하는 각 전송선들(101∼1On)을 거쳐 D/A 변환기(9001∼900n)에 보낸다.
각 D/A 변환기들(9001∼900n)은 각 전송선(101∼10n)을 거쳐 보내진 상기 확장된 신호들(디지탈 신호)을 아날로그 신호들로 변환한다. 이 아날로그 형태의 신호들은 대응 전송선(111∼11n)과 출력 단자(231∼23n)를 통해 각각 채널(ch1∼chn)의 부호화된 신호들로서 출력된다.
전술한 이 실시예의 저 비트율 인코더에 이용된 압축 인코딩 기술은 비트율을 변화시킬 수 있는 모든 인코더들에 응용될 수 있다. 여기서 신호량이 약 1/5이 되도록 전술한 인간의 청각 특성을 이용함으로써 고정된 비트율로 스테레오 2채널들의 오디오 신호를 압축하는 압축 인코딩 기술(소위 미니 디스크 MD 에 사용되는 ATRAC 시스템)이 실예가 되며, 고정 비트율에서의 압축이 가변 비트율에서의 압축이 될 수 있게 하는 이 실시예의 압축 인코딩 방법이 이하 설명된다.
소위 , ATRAC 시스템이 응용되는 인코더의 구성이 제 3 도에 도시되어 있다.
제 3 도의 주파수 대역 분할 필터(401)로부터 재 양자화기(406), 포맷화기(407)까지의 장치들은 제 1 도의 각 채널의 인코딩 장치(4001내지 400n)에 해당한다.
제 3 도에서, 입력 단자(24)를 통해 전달된 표본화 및 양자화된 오디오 데이타는 0 내지 5.5kHz 의 저 주파수 대역 신호 성분, 5.5kHz 내지 11kHz 의 중간 주파수 대역 신호 성분, 및 11kHz 이상(11kHz 내지 22kHz)의 고 주파수 대역 신호 성분으로된 세가지 주파수 대역의 신호(신호 성분)로 1 차 분할된다.
세가지 주파수 대역의 신호들간에, 대역 분할 필터(401)로부터 저파수 대역에서의 신호는 MDCT 회로(402L)에 전송되어 MDCT(Modified Discrete Cosine Transform : 수정된 이산 코사인 변환) 동작을 실행하며, 중간 주파수 대역의 신호는 MDCT 회로(402M)에 전송되어 MDCT 동작을 유사하게 실행하고, 고 주파수 대역신호는 MDCT 회로(402H)에 전송되어 MDCT 동작을 유사하게 실행한다. 이들 신호들은 상기 MDCT회로(402L 내지 402H)에서 주파수 성분으로 각각 분해된다.
이때, MDCT 처리를 구현할때의 시간 블럭 길이는 각각의 주파수 대역마다 가변적이다. 신호가 갑자기 변하는 부분에서, 시간 블럭 길이가 짧아지며, 이리하여 시간 분해능이 증가한다. 한편, 신호가 정상(stationary) 상태에 있는 부분에서, 시간 블럭 길이는 길어져서 신호 성분 및 양자화 잡음의 전송을 효과적으로 제어한다.
이 시간 블럭의 길이는 블럭 크기 평가 장치(403)에서 미리 결정된다. 즉, 대역 분할 필터(401)로부터의 세가지 주파수 대역 신호들은 블럭 크기 평가 장치(403)로 전송된다. 이 블럭 크기 평가 장치(403)는 MDCT 의 시간 블럭 길이를 결정하여 MDCT 회로(402L 내지 402H)에 상기 결정된 시간 블럭 길이를 나타내는 정보를 전송한다.
MDCT 과정에서 두 종류의 시간 블럭 길이중에 긴 시간 블럭 길이를 이용하는 모드는 11.6ms 의 블럭 길이를 갖는 장 모드(logn mode)로 지칭된다. 한편, 짧은시간 블럭 길이를 이용하는 모드는, 고주파 대역(11kHz 이상)에서는 1.45ms 의 시간 블럭 길이를 가지고 저 주파수 대역(5.5kHz 미만) 및 중간 주파수 대역(5.5kHz 내지 11kHz)에서는 2.9ms 의 시간 블럭 길이를 갖는 단 모드(short mode)로 지칭되어, 시간 분해능을 증가시킨다.
상기 방식으로, 시간 및 주파수의 이차원 영역(블럭 플로팅(floating) 유니트로 불림)에서 신호 성분으로 분해된 오디오 신호는 저 주파수, 중간 주파수, 고 주파수의 대역들에서 총 52 개의 블럭 플로팅 유니트로 분할된다.
비트 할당 장치(405)는 인간의 청각 특성을 이용함으로써 해당 오디오 신호를 구성하는 성분들을 분석한다. 상기 분석 결과는 그 표준화 회로(404L 내지 404H)로부터 모든 각 유니트의 신호가 공급된 재 양자화기(406)에 전송된다.
재 양자화기(406)는 그 분석 결과에 기초하여 각 유니트에 대한 코딩에서의 정확도를 결정한다. 즉, 워드 길이를 결정하여 파라미터를 구하고 재 양자화를 실행한다.
마지막으로, 포맷화기(407)는 소정의 포맷에 따라 모든 유니트에 대해 각 파라미터 정보와 양자화된 스펙트럼 신호를 다중화함으로써, 비트 스트림을 제공한다. 상기 포맷화기(407)의 출력은 출력 단자(25)로부터 출력된다.
상술된 대로 인코딩 과정은 모든 사운드(sound) 프레임 유니트에 대해 실행된다.
사운드 프레임(40)내의 데이타 기록 상태는 제 4 도에 도시되어 있다.
제 4 도에서, 한 사운드 프레임은 212 개 비트로 이루어진다. 이 사운드 프레임에서, 한 채널에 해당하는 512 개 샘플의 오디오 재생 데이타는 44.1kHz 의 표본화 속도로 압축 인코딩된다.
212 비트의 사운드 프레임은 블럭 크기 모드(41), 서브 정보량(42), 워드 길이 데이타(43), 환산계수 데이타(44), 스펙트럼 데이타(45), 용장 환산계수 데이타(46), 용장 워드 길이 데이타(47), 하부 서브 정보량(48), 하부 블럭 크기 모드(49)로 이루어진다.
212 비트 데이타에서, 오류 정정을 위한 이중 기록부가 포함된다. 즉, 이 이중 기록부는 중복 환산계수 데이타(46), 용장 워드 길이 데이타(47), 하부 서브 정보량(48), 및 하부 블럭 크기 모드(49)로 이루어진다.
이 실시예에서, 212 비트중 186 비트는 이중 기록부를 제외한 부분에 해당되며, 실제 비트율 측면에서 l28kbps 와 동일하게 된다.
블럭 크기 모드는 제 3 도의 블럭 크기 평가 장치(403)의 평가 결과를 기록하기 위한 데이타이며 그 내용은 표 1 에 도시되어 있다.
상기 표 1 에 도시된 바와 같이, 블럭 길이 이용 모드가 장 모드일 때 변환 처리에 속한 신호는 MDCT 동작에 의해 저 주파수 대역 및 중간 주파수 대역에서 각각 128 개의 주파수 성분들로 분해되며, 고 주파수 대역에서 256 개의 주파수 성분들로 분해된다.
한편, 블럭 길이 이용 모드가 단 모드일때, 변환 처리에 속한 신호는 저 주파수, 중간 주파수, 고 주파수 대역에서 각각 32 개의 주파수 성분들로 분해된다.
또한, 세가지의 정보량 1, 정보량 2, 및 정보량 3 은 서브 정보량(42)에 기록된다. 정보량 1 은 기록된 환산계수 및 워드 길이의 수를 나타내며, 정보량 2 는 이중으로 기록된 워드 길이의 수를 나타내고, 정보량 3 은 이중 기록된 환산계수의 수를 나타낸다. 그 내용은 표 2 에 도시되어 있다.
워드 길이는 각각의 유니트(신호)가 재 양자화될 때, 워드 길이를 나타낸다.그 내용은 표 3 에 도시되어 있다.
환산계수는 각각의 유니트(신호)가 정규화될 때 그 값들을 나타낸다, 그 내용은 표 4A 내지 4C 에 도시되어 있다.
한편, 상기 언급된 제 3 도의 비트 할당 장치(405)는 인간의 청각 특성을 고려하여 워드 길이 값을 결정함으로써, 한 사운드 프레임의 비트량을 재 양자화에서의 212 비트와 동일하게 된다. 212 비트 값을 가변적으로 하여 가변 길이의 인코더를 구성할 수 있다.
즉, 본 발명에 따른 실시예의 저 비트율 인코더를 구성하는 제 1 도의 비트 할당 결정 회로(500)의 출력이 제 3 도의 비트 할당 장치(405)에 접속되도록 구성되어 있다면, 가변 길이의 인코더를 구성할 수 있게 된다.
상기 방식으로 제 3 도의 비트 할당 장치(405)에 접속된 제 1 도의 비트 할당 결정 회로(500)의 동작은 제 5 도의 그래프 및 제 6 도의 흐름도를 참조하여 설명되어 있다.
먼저, 제 6 도의 단계(S61)에서 처리 동작이 시작될 때, 비트 할당 결정 회로(500)는 단계(S62)에서 각 채널마다 피크 값을 검출한다. 일반적으로, 피크값은 각 채널의 오디오 신호 에너지에 해당한다.
그후, 단계(S63)에서, 상기 결정된 피크값에 해당하는 비트 할당량이 계산된다. 이 계산을 위해, 테이블로서 구성된 피크값/비트 할당량의 해당 그래프가 이용된다.
제 5 도의 그래프는 상기 피크값에 관련한 비트 할당량을 변환시키는 그래프이다. 제 5 도에 도시된 비트 할당량 변환 그래프는 소위 ATRAC 시스템이 인코딩 시스템으로서 사용되는 경우의 그래프이다.
제 5 도에서, 가로축은 입력 신호의 피크값을 나타내며 얻을 수 있는 최대값은 1 로 정규화된다.
또한, 세로측은 비트 할당량을 나타내며 최대 할당량은 186 바이트로 설정된다. 이 값은 소위 MD(미니 디스크) 장치에서 ATRAC 시스템의 한 사운드 프레임의 정보량과 동일하다.
제 5 도에 도시된 변환 그래프는 여러 오디오 신호를 이용한 실험을 통해 결정된다.
제 5 도에서, 비트 할당량의 전반적인 경향은 피크값이 증가함에 따라 비트 할당량도 증가하는 방식이다. 그러나, 상기 피크값이 2-3 이상일 때, 상기 비트 할당량은 감소하는 방향으로 바뀐다.
상기는 신호 레벨이 상당히 큰 경우에 재 양자화에 의해 양자화 잡음이 신호 레벨로 마스크되어, 재 양자화 잡음의 주입량이 증가될때조차도 사운드는 인간이 듣기가 어렵다.
한편, 제 5 도에서, 신호 레벨이 상당히 작은 경우, 예를 들어, 피크값이 2-l2미만일때, 비트 할당량은 고정된다. 상기는 ATRAC 시스템의 각 파라미터 정보(제 4 도에 도시된 워드 길이 데이타 또는 환산계수 데이타)에 필요한 비트량이 사실상 고정되어 있으므로, 어느 정도까지 비트량을 확보해야 하기 때문이다.
또한, 상기 레벨이 낮을때, 랜덤 잡음(백색 잡음)은 가청이며, 신호는 주파수 성분이 전반적인 주파수 대역에 걸쳐 일정하게 분포되는 경향을 가지며, 상기 레벨이 작을때에도 큰 비트량이 요구된다.
상기 언급된대로, 비트 할당량과 피크값의 관계는 비선형(거의 S 형 곡선)이 되도록 만든다. 즉, 청각 특성이 고려되지 않는한, 비트 할당량과 피크값의 관계는 비례적인 관계이다. 그러나, 본 발명에서, 모든 각 채널마다 최소 비트량을 유지하는 동안 상기 레벨이 소정 레벨이상일 경우 비트 할당량은 감소되도록 하고 있다.
스텝(S64)에서, 전체 비트량이 고정되었는지 아닌지의 판단이 이루어진다. 이 스텝(S64)에서 모든 채널의 전체 비트 할당량이 고정될 필요가 있다고 판단되면상기 처리 동작은 스텝(S65)으로 간다. 상기에서 언급된 변환이 완료된 후, 다음의 공식(1)이 계산이 행해져 모든 각각의 채널의 최종 비트 할당량을 계산한다.
즉, n 개 채널의 시스템의 1 사운드 프레임당 전체 비트 할당량이 G 이고 변환에 의한 비트 할당량이 Ci(i=1, 2, ‥‥, n) 라고 가정하면, 각각의 채널에 할당된 최종 비트 할당량(Si)은 다음과 같이 표현된다.
Si=G*Ci/(C1+C2+‥‥+Cn) ‥‥ (1)
스텝(S65)의 처리 후 또는 스텝(S64)에서 전체 비트량이 고정되지 않은 것으로 판단된 후, 상기 처리 동작은 처리를 종료시키기 위해 스텝(S66)으로 간다.
제 1 도의 포맷화기와 제 2 도의 역포맷화기(deformater)(700)는 상술된 ATRAC 시스템과 일치하도록 이루어지며, 아래와 같이 동작한다.
제 1 도의 포맷화기(600)는 매 1 사운드 프레임의 각 채널의 인코딩 장치(4001내지 400n)로부터 제 4 도에 도시된 포맷 형태로 보내진 데이타를 채널의 순서로 정돈하여 비트 스트림으로 전송한다.
즉 이 포맷화기(600)는 다중화기로서의 역할을 한다.
또한 제 2 도의 역포맷화기(700)는 역다중화기로서의 역할을 하여 모든 각 채널의 포맷화기(600)에서 다중화된 데이타를 분할하고 이것을 각 디코딩 장치(4001내지 4OOn)에 보낸다.
상술된 바와 같이, 본 발명에 따른 제 1 실시예의 장치(인코더/디코더)에 일치해서, 다수개의 채널을 갖는 오디오 데이타의 압축에 있어서 각 채널의 비트 할당량은 오디오 데이타를 인코딩할 각 채널의 진폭 정보의 시간 점 변경에 의해 결정된다. 이 이유 때문에, 정보량에 일치하는 비트 할당은 각 채널에 대해 이루어 진다. 따라서 더욱 효율적인 코딩이 달성될 수 있다.
즉, 고화질의 사운드 또는 모든 채널의 저 비트율이 달성될 수 있다. 고정 길이(fixed length)가 기록 매체에 의존하는 순간이 있기 때문에 코딩은 모든 채널의 전체 비트 할당량이 거의 고정되는 방식으로 제 1 실시예의 장치에서 실행될 수 있다는 것을 유의해야 한다.
이제는 본 발명의 제 2 실시예가 기재된다. 제 2 실시예의 저 비트율의 인코더 구성이 제 7 도에서 도시된다.
제 7 도에서, 다수개의 채널(chl, ch2,‥‥, chn)의 오디오 신호는 입력 단자(301내지 3On) 및 각 채널에 해당하는 전송선(1011내지 1O1n)을 거쳐 각 채널에 해당하는 표본화 및 양자화 장치(1201내지 l2On)에 보내진다. 이 표본화 및 양자화 장치(1201내지 l2On)에서, 각 채널의 오디오 신호는 양자화된 신호로 변환된다. 이 각각의 표본화 및 양자화 장치(1201내지 l2On)에서의 양자화된 신호는 전송선(1021내지 1O2n)을 거쳐 각 인코딩 장치(2101내지 21On)에 보내진다.
각 인코딩 장치(2101내지 21On)에서, 각 채널의 오디오 신호는 2 차원의 시간 및 주파수 영역(블럭 플로팅 장치)의 신호로 분할되어 블럭 플로팅 장치에 속하는 신호 성분을 매 블럭 플로팅 장치의 환산계수를 사용하므로써정규화(normalize)시킨다. 따라서 결정된 각 블럭 플로팅 장치의 환산계수는 전송선(1031내지 1O3n)을 거쳐 비트 할당 결정 회로(310)에 보내진다.
상기 비트 할당 결정 회로(310)는 전송선(1031내지 1O3n)을 거쳐 수신된 모든 각 채널의 환산계수의 총계를 결정해서 나중에 기재될 변환 공식(변환 그래프)에 의해 상기 총계로부터 각 채널의 비트 할당량을 계산하고 전송선(1041내지 1O4n)에서 인코딩 장치(2101내지 21On)로 상기 비트 할당량을 전달한다.
따라서, 각 인코딩 장치(2101내지 21On)는 상기 비트 할당량에 의존적으로 전송선(1021내지 1O2n)에서의 신호를 재 양자화해서 상기 재양자화된, 즉 압축된 신호를 전송선(1051내지 1O5n)을 거쳐 포맷화기(410)에 전송한다.
상기 포맷화기(410)는 다수개의 채널의 전송선(1051내지 1O5n)을 거쳐서 수신된 압축 신호를 전송용 비트 스트림으로 합성하거나 또는 소정의 포맷에 일치하게 기록 매체상에 기록한다. 이 비트 스트림은 출력 단자(31)에서 전송선(106)을 거쳐 출력된다.
게다가, 이 비트 스트림은 가령, 레이저 기록 장치(26)에 의해 영상 필름(27)상의 소정의 기록 영역에 기록된다.
제 2 실시예의 저 비트율의 디코더의 기본 구성도가 제 2 도의 것과 유사하기 때문에 상세한 설명이 생략되고 있음을 주목해야 한다.
이 디코더는 제 2 도를 참조해서 간단히 설명된다. 제 2 실시예의 저 비트율디코더의 역포맷화기(700)는 또한 제 2 실시예의 저 비트율 인코더로부터의 비트 스트림을 소정의 포맷에 일치하게 모든 각 채널의 압축 신호로 분해한다.
상기 분해된 모든 각 채널의 압축 신호는 모든 각 채널에 일치하게 제공된 디코딩 장치(8001내지 8OOn)에서 신장되며, 그 다음에 D/A(디지탈/아날로그) 변환기(9001내지 9OOn)에서 아날로그 신호로 변환된다. 이 아날로그 신호는 가 채널(ch1내지 chn)의 디코딩된 신호로서 출력된다.
제 2 실시예의 저 비트율 인코더에서 사용되는 압축-인코딩 기법은 압축-인코딩이 환산계수를 이용하므로써 실행되는 모든 시스템에 적용될 수 있다.
즉, 제 7 도의 비트 할당 결정 회로(310)의 출력이 제 3 도의 비트 할당 장치(405)에 접속되는 구성도가 제 2 실시예에서 사용될 때 가변 길이 인코더가 설치될 수 있다.
제 3 도의 비트 할당 장치(405)에 접속된 제 7 도의 비트 할당 결정 회로의 상세한 동작은 제 8 도의 그래프 및 제 9 도의 흐름도를 참조해서 설명된다.
초기에, 처리 동작이 제 9 도의 스텝(S91)에서 시작될 때, 비트 할당 결정회로(310)는 스텝(S92)에서 인코딩 장치(2101내지 21On)의 환산계수로부터 모든 각 채널의 환산계수의 총합을 계산한다.
다음의 스텝(S93)에서, 모든 각 채널의 비트 할당량이 각 채널 환산계수의 소정의 총계로부터 계산된다.
여기서, 환산계수는 앞에서 기재된 블럭 플로팅 장치(52)내에 포함된 주파수성분을 정규화한 값이다. 통상적으로, 표 4 에 도시된 값에서 그 값의 절대치의 최대값 보다 큰 값들 중에서 최소값을 선택하도록 해당하는 블럭 플로팅 장치내의 주파수 성분의 절대값을 결정하기 위한 근사법이 이용된다.
즉, 환산계수가 블럭 플로팅 장치, 즉 에너지내의 대표적인 데이타 특성을 나타내는 것으로 간주된다. 따라서, 만약 환산 계수의 총계가 결정되면 전체 정보량의 평가가 가능하다고 간주된다.
제 7 도의 비트 할당 결정 회로(310)에서의 환산계수의 총계에 대한 비트 할당량이 제 8 도에 도시된다.
또한 제 8 도에서 ATRAC 시스템은 제 1 실시예와 유사하게 인코딩 시스템용으로 사용된다. 제 8 도에서, 세로축은 제 5 도와 유사하게 비트 할당량(최대 할당량은 186 바이트이다)을 도시하며 가로축은 환산계수의 총계를 도시한다.
제 8 도에 도시된 변환 그래프는 제 1 실시예의 제 5 도와 유사하게 다양한 오디오 신호를 이용한 실험을 실행하는 동안 결정된다.
전체적인 경향으로서, 환산계수의 총계의 값이 증가함에 따라 비트 할당량 또한 증가한다.
그러나, 제 8도에 환산계수의 총계치가 대략 7000을 초과하면 비트 할당량은 감소 방향으로 변화한다. 이것은 실험 결과에 기초한 것으로, 환산계수의 총계치가 현저하게 큰(신호 레벨이 충분히 크다) 비트 할당량에서 신호 레벨에 의해 표시되기 때문에, 비록 재 양자화 잡음의 주입량이 증가된다 할지라도 신호를 듣기에는 어렵다.
한편, 환산계수의 총계치가 1.5 보다 작을때(신호 레벨이 충분히 작은 경우), 비트 할당량이 고정되어야 하는 이유는 상기 ATRAC 시스템의 각 파라미터 정보(제 4도에 도시된 워드 길이 데이터 또는 환산계수 데이터등)용으로 필요한 비트량이 실질적으로 고정되기 때문이며, 이 비트량을 확보하는 것이 필요하다.
또한 상기 예에서, 비트 할당량과 환산계수의 총계치와의 관계는 지의 S형 고선으로 비선형 특성을 나타낸다.
또한 제 2 실시예에서, 전체 비트량이 고정되어 있는지 아닌지의 판단이 스텝(S94)에서 실행된다. 모든 채널의 전체 비트 할당량이 고정될 필요가 있다고 스텝(S94)에서 판단되면, 상기 처리 동작은 스텝(S95)으로 간다. 상기의 변환이 종료된 후, 공식(1)의 계산이 행해져 모든 각 채널의 최종 비트 할당량을 계산한다.
상기 스텝(S95)에서의 처리 후 또는 스텝(S94)에서 전체 비트량이 고정되지 않은 것으로 판단된 후, 상기 처리 동작은 스텝(S96)으로 진행한다.
또한 제 2 실시예에 있어서, 제 7 도의 포맷화기(410)는 매 1 사운드 프레임의 각 채널의 인코딩 장치(2101내지 21On)로부터 제 4도에 도시된 포맷형태로 보내진 데이터를 채널의 순서로 정돈하여 이것을 비트 스트림으로서 전송한다. 즉, 이 포맷화가(410)는 다중화기로서의 역할을 한다.
또한 제 2 실시예의 저 비트율 디코더의 역포맷화기는 역다중화기로서의 역할을 모든 각 채널의 포맷화기(410)에서 다중화된 데이터를 분할하고 이것을 각 디코딩 장치에 전송한다.
상술된 바와 같이, 제 2 실시예의 장치(인코더/디코더)에 따르면, 다수개의 채널을 갖는 오디오 데이터의 압축에 있어서, 근사법이 사용되어 각 채널의 환산계수의 총계치의 시간 점 변경에 의해 각 채널의 비트 할당량을 결정해서 오디오 데이터를 인코딩한다. 이 이유로 인해 정보량에 해당하는 비트 할당이 각 채널에 제공된다.
상기 코딩의 개선에 의해, 고화질의 사운드 또는 저 비트 전송류이 달성될 수 있다. 즉, 제 2 실시예의 제 2 장치에서, 또한 전체 채널상에서의 고화질의 사운드 또는 저 비트율이 달성될 수 있다.
게다가, 제 2 실시예의 경우에서도, 데이터는 기록 매체에 의존하여 고정 길이를 갖는 예이다. 그 경우, 인코딩이 행해져 전체 채널의 전 비트 할당량이 거의 고정된다.
본 발명의 상술된 제 1 및 2 실시예에서 영상 필름은 기록 매체로서 예시되었다. 그러나, 기록 매체로서 영상 필름뿐만 아니라 다양한 매체가 본 발명의 요지에서 벗어나지 않는 범위내에서 사용될 수 있다. 가령, 광디스크 및 자기테이프 등이 사용될 수 있다.
본 발명에서, 각 채널에 대한 비트 할당량이 에너지, 가령 진폭 정보에 의해 결정되거나 또는 각 채널의 환산계수의 총계치의 시점 변경에 의해 결정되기 때문에, 정보량에 해당하는 비트 할당이 각 채널에 제공될 수 있다. 그 결과, 더욱 효과적인 코딩이 이루어진다. 따라서 저 비트율의 고음질이 달성될 수 있다.
게다가, 본 발명의 다중 채널의 오디오 신호는 적어도 2 채널에서 관한 것이며, 본 발명의 효과는 영화의 사운드 트랙과 같이 5 채널 이상의 채널이 필요한 경우에 더욱 두드러진다.
제 1 도는 본 발명의 제 1 실시예의 저 비트율 인코더의 구성을 나타내는 개략적인 블록선도.
제 2 도는 본 발명의 제 1 및 제 2 실시예의 저 비트율 디코더의 구성을 나타내는 개략적인 블록선도.
제 3 도는 본 발명 실시예의 저 비트율 인코더와 ATRAC 시스템의 저 비트율 인코더에서의 비트 할당을 설명하는 블록선도.
제 4도는 음성 프레임내에 데이타를 기록하는 상태를 설명하는 도면.
제 5 도는 제 1 실시예의 비트 할당량을 설명하는 그래프.
제 6 도는 제 1 실시예의 비트 할당량을 결정하는 동작을 설명하는 흐름도.
제 7 도는 본 발명에 따른 제 2 실시예의 저 비트율 인코더의 구성을 나타내는 개략적인 블록선도.
제 8 도는 제 2 실시예의 비트 할당량을 설명하는 그래프.
제 9 도는 제 2 실시예에서 비트 할당량을 결정하는 동작을 설명하는 흐름도.
*도면의 주요부분에 대한 부호의 설명
26 : 레이저 기록 장치 1001∼IOOn : 표본화 및 양자화 장치
200 : 진폭 정보 검출 회로 3001∼3OOn : 지연선
4001∼4OOn : 인코딩 장치 500 : 비트 할당 결정 회로
600 : 포맷화기 700 : 역 포맷화기
8001∼8OOn : 디코딩 장치 9001∼9OOn : D/A 변환기

Claims (16)

  1. 오디오 신호와 인간의 청각 특성을 모두 이용하여 다수 채널의 디지탈 오디오 신호를 압축 인코딩하는데 적합한 저 비트율 인코더에 있어서,
    각 채널의 모든 디지탈 오디오 신호에 디지탈 오디오 신호의 에너지를 검출하기 위한 에너지 검출 수단과;
    상기 검출 결과를 토대로 각 채널들에 대한 비트 할당량을 결정하기 위한 비트 할당량 결정 수단과;
    결정된 비트 할당량에 따라 각 채널들에 할당된 비트 할당량에 근거하여 상기 디지탈 오디오 신호를 압축 인코딩하기 위한 압축 인코딩 수단; 및
    각 채널마다 압축 인코딩된 신호를 다중화하기 위한 다중화 수단을 포함하며;
    상기 비트 할당량 결정 수단은, 디지탈 오디오 신호의 에너지와 비트 할당량 사이의 관계와 디지탈 오디오 신호의 에너지가 증가함에 따라 비트 할당량이 전체적으로 증가하는 것과 비 선형 특성을 나타내도록 비트 할당량을 결정하기 위해 동작하는 것을 특징으로 하는 저 비트율 인코더.
  2. 제 1 항에 있어서,
    상기 비트 할당량 결정 수단의 비선형 특성은 거의 S형 곡선의 특성에 가까운 것을 특징으로 하는 저 비트율 인코더.
  3. 제 1 항에 있어서,
    상기 비트 할당량 결정 수단의 비선형 특성은 상기 디지탈 신호의 에너지가 충분히 작을 때 평탄한 비트 할당 특성을 갖는 것을 특징으로 하는 저 비트율 인코더.
  4. 제 1 항에 있어서,
    상기 비트 할당량 결정 수단의 비선형 특성은 상기 디지탈 오디오 신호의 에너지가 충분히 클 때 비트 할당량이 감소되는 특성을 갖는 것을 특징으로 하는 저 비트율 인코더.
  5. 제 1 항에 있어서,
    상기 비트 할당량 결정 수단은 각 추정량에 비례하여 단위 시간당 모든 채널의 총 비트량을 할당하여 상기 각 채널들의 비트 할당량을 결정하기 위해 각 채널 마다에 필요로 되는 비트량에 대한 추정량을 추정하는 것을 특징으로 하는 저 비트율 인코더.
  6. 제 1 항에 있어서,
    상기 디지탈 오디오 신호의 에너지는 이 디지탈 오디오 신호의 진폭 특성인 것을 특징으로 하는 저 비트율 인코더.
  7. 제 6 항에 있어서,
    상기 진폭 특성은 피크값인 것을 특징으로 하는 저 비트율 인코더.
  8. 제 1 항에 있어서,
    상기 디지탈 오디오 신호의 에너지는 환산 계수인 것을 특징으로 하는 저 비트율 인코더.
  9. 오디오 신호와 인간의 청각 특성을 모두 이용하여 다수 채널의 디지탈 오디오 신호를 압축 인코딩 하기 위한 저 비트율 인코더에 의해 다중화된 압축 인코딩된 신호가 기록되는 기록용 매체에 있어서,
    상기 저 비트율 인코더는 상기 각 채널의 디지탈 오디오 신호마다 디지탈 오디오 신호의 에너지를 검출하기 위한 에너지 검출 수단과;
    검출 결과에 근거하여, 상기 각 채널들에 대한 비트 할당량을 결정하기 위한 비트 할당량 결정 수단과;
    결정된 비트 할당량에 따라 각 채널마다에 할당된 비트 할당량에 근거하여 디지탈 오디오 신호를 압축 인코딩하기 위한 압축 인코딩 수단; 및
    각 채널마다 압축 인코딩된 신호들을 다중화 하기 위한 다중화 수단을 포함하며;
    상기 비트 할당량 결정 수단은 디지탈 오디오 신호의 에너지와 비트 할당량사이의 관계가 디지탈 오디오 신호의 에너지가 증가함에 따라 비트 할당량이 전체적으로 증가하도록 비선형 특성을 나타내도록 비트 할당량을 결정하기 위해 동작하는 것을 특징으로 하는 기록용 매체.
  10. 오디오 신호와 인간의 청각 특성을 모두 이용하여 다수 채널의 디지탈 오디오 신호를 압축 인코딩하는 저 비트율 인코딩 방법에 있어서,
    상기 각 채널의 디지탈 오디오 신호마다 디지탈 오디오 신호의 에너지를 검출하는 단계와;
    상기 검출 결과에 근거하여 상기 각 채널에 대한 비트 할당량을 결정하는 단계와;
    결정된 비트 할당량에 따라 각 채널마다에 할당된 비트 할당량에 근거하여 상기 디지탈 오디오 신호를 압축 인코딩 하는 단계; 및
    상기 각 채널의 압축 인코딩된 신호를 다중화하는 단계를 포함하며;
    상기 비트 할당량 결정 단계에서, 상기 비트 할당량은 상기 디지탈 오디오 신호의 에너지와 비트 할당량사이의 관계가 상기 디지탈 오디오 신호의 에너지가 증가함에 따라 비트 할당량이 전체적으로 증가하는 것과 같이 비선형 특성을 나타내도록 결정되는 것을 특징으로 하는 저 비트율 인코딩 방법.
  11. 제 10 항에 있어서,
    상기 비선형 특성은 거의 S 자형 곡선의 특성에 가까운 것을 특징으로 하는저 비트율 인코딩 방법.
  12. 제 10 항에 있어서,
    상기 비선형 특성은 상기 디지탈 오디오 신호의 에너지가 충분히 작을 때 평탄한 비트 할당 특성을 갖는 것을 특징으로 하는 저 비트율 인코딩 방법.
  13. 제 10 항에 있어서,
    상기 비선형 특성은 상기 디지탈 오디오 신호의 에너지가 충분히 클 때 비트 할당량이 감소하는 것과 같은 특성을 갖는 것을 특징으로 하는 저 비트율 인코딩 방법.
  14. 오디오 신호와 인간의 청각 특성을 모두 이용하여 다수 채널의 디지탈 오디오 신호를 압축 인코딩 하는데 적합한 저 비트율 인코더에 의해 다중화된 압축 인코딩된 신호로부터의 각 채널의 신호를 인코딩하기 위한 디코딩 수단을 포함하는 저 비트율 디코더에 있어서,
    상기 각 채널들의 디지탈 오디오 신호마다 디지탈 오디오 신호의 에너지를 검출하기 위한 에너지 검출 수단과;
    상기 검출 결과에 근거하여 각 채널에 대한 비트 할당량을 결정하기 위한 비트 할당량 결정 수단과;
    결정된 비트 할당량에 따라 개개의 채널마다에 할당된 비트 할당량에 근거하여, 상기 디지탈 오디오 신호를 압축 인코딩하기 위한 압축 인코딩 수단; 및
    각 채널마다 압축 인코딩된 신호를 다중화하기 위한 다중화 수단을 포함하며;
    상기 비트 할당 결정 수단은 상기 디지탈 오디오 신호의 에너지와 비트 할당량 사이의 관계가 신호의 에너지가 증가함에 따라 비트 할당량이 전체적으로 증가하는 것과 같이 비선형 특성을 나타내도록 비트 할당량을 결정하기 위해 동작하는 것을 특징으로 하는 저 비트율 디코더.
  15. 제 1 항 내지 제 5 항 중 어느 한 항에 기재된 저 비트율 인코더와 제 10 항 내지 제 13 항 중 어느 한 항에 기재된 저 비트율 인코딩 방법에 의해 다중화된 압축 인코딩된 신호가 기록되는 기록 매체로부터 각 채널의 신호를 디코딩하기 위한 디코딩 수단을 포함하는 저 비트율 디코더.
  16. 오디오 신호와 인간의 청각 특성 모두를 이용하여 다수 채널의 디지탈 오디오 신호를 압축 인코딩 하는 저 비트율 인코딩 방법에 의해 다중화전 압축 인코딩된 신호가 기록되는 기록 매체로부터 각 채널의 신호를 디코딩하는 단계로 구성된 저 비트율 디코딩 방법에 있어서,
    각 채널의 디지탈 오디오 신호마다 디지탈 오디오 신호의 에너지를 검출하는 단계와;
    검출 결과를 토대로 상기 각 채널에 대한 비트 할당량을 결정하는 단계와;
    결정된 비트 할당량에 따라 각각의 채널마다에 할당된 비트 할당량에 근거하여 상기 디지탈 오디오 신호를 압축 인코딩하는 단계; 및
    상기 각 채널들의 압축 인코딩된 신호를 다중화하는 단계를 포함하며;
    상기 비트 할당량 결정 단계에서, 비트 할당량은, 상기 디지탈 오디오 신호의 에너지와 비트 할당량 사이의 관계가 상기 디지탈 오디오 신호의 에너지가 증가함에 따라 비트 할당량이 전체적으로 증가하는 것과 같이 비선형 특성을 나타내도록 결정되는 것을 특징으로 하는 저 비트율 디코딩 방법.
KR1019940027333A 1993-10-26 1994-10-26 다중채널오디오신호를위한코딩장치또는방법 KR100310216B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP93-267250 1993-10-26
JP26725093 1993-10-26

Publications (2)

Publication Number Publication Date
KR950012426A KR950012426A (ko) 1995-05-16
KR100310216B1 true KR100310216B1 (ko) 2002-06-20

Family

ID=17442224

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940027333A KR100310216B1 (ko) 1993-10-26 1994-10-26 다중채널오디오신호를위한코딩장치또는방법

Country Status (5)

Country Link
US (1) US5737720A (ko)
EP (1) EP0650262B1 (ko)
KR (1) KR100310216B1 (ko)
CN (1) CN1090846C (ko)
DE (1) DE69431230T2 (ko)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
TW295747B (ko) * 1994-06-13 1997-01-11 Sony Co Ltd
EP0688113A2 (en) * 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
JPH09101799A (ja) * 1995-10-04 1997-04-15 Sony Corp 信号符号化方法及び装置
EP0827310A3 (en) * 1996-08-30 2001-01-24 Sony Corporation Infra-red transmission of digital audio signals
US5941936A (en) * 1996-10-31 1999-08-24 Taylor Group Of Companies, Inc. One-bit run-length encoding and playback system
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6636474B1 (en) * 1997-07-16 2003-10-21 Victor Company Of Japan, Ltd. Recording medium and audio-signal processing apparatus
US6055502A (en) * 1997-09-27 2000-04-25 Ati Technologies, Inc. Adaptive audio signal compression computer system and method
GB2353426A (en) * 1999-08-17 2001-02-21 British Broadcasting Corp Mutiple output variable bit rate encoding
WO2001030049A1 (fr) * 1999-10-19 2001-04-26 Fujitsu Limited Unite de traitement et de reproduction de son vocaux reçus
US6934676B2 (en) * 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
AU2003227377A1 (en) * 2002-04-26 2003-11-10 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal
US7277482B2 (en) * 2002-05-29 2007-10-02 General Dynamics C4 Systems, Inc. Method and apparatus for adaptive signal compression
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2006186580A (ja) * 2004-12-27 2006-07-13 Toshiba Corp 再生装置およびデコード制御方法
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US9093120B2 (en) * 2011-02-10 2015-07-28 Yahoo! Inc. Audio fingerprint extraction by scaling in time and resampling
US9697837B2 (en) * 2012-12-17 2017-07-04 Yaron Hefetz Secured audio channel for voice communication
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CA1253255A (en) * 1983-05-16 1989-04-25 Nec Corporation System for simultaneously coding and decoding a plurality of signals
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
JP3134338B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
CA2075156A1 (en) * 1991-08-02 1993-02-03 Kenzo Akagiri Digital encoder with dynamic quantization bit allocation
DE69227570T2 (de) * 1991-09-30 1999-04-22 Sony Corp Verfahren und Anordnung zur Audiodatenkompression
DE4135977C2 (de) * 1991-10-31 1996-07-18 Fraunhofer Ges Forschung Verfahren zur gleichzeitigen Übertragung von Signalen aus N-Signalquellen
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置

Also Published As

Publication number Publication date
CN1106967A (zh) 1995-08-16
US5737720A (en) 1998-04-07
EP0650262A3 (en) 1996-04-10
KR950012426A (ko) 1995-05-16
CN1090846C (zh) 2002-09-11
EP0650262B1 (en) 2002-08-28
EP0650262A2 (en) 1995-04-26
DE69431230T2 (de) 2003-04-30
DE69431230D1 (de) 2002-10-02

Similar Documents

Publication Publication Date Title
KR100310216B1 (ko) 다중채널오디오신호를위한코딩장치또는방법
JP3404837B2 (ja) 多層符号化装置
US5677994A (en) High-efficiency encoding method and apparatus and high-efficiency decoding method and apparatus
KR100277819B1 (ko) 심리음향성 적응 비트 할당을 이용한 다중 채널 예측 분할대역부호화기
Noll MPEG digital audio coding
JP3804968B2 (ja) 適応配分式符号化・復号装置及び方法
KR100261254B1 (ko) 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6061649A (en) Signal encoding method and apparatus, signal decoding method and apparatus and signal transmission apparatus
JP3397001B2 (ja) 符号化方法及び装置、復号化装置、並びに記録媒体
JP2003099099A (ja) 多次元音場用符号器・復号器
JP3250376B2 (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
KR100528325B1 (ko) 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US5758316A (en) Methods and apparatus for information encoding and decoding based upon tonal components of plural channels
JP3227942B2 (ja) 高能率符号化装置
US20010047256A1 (en) Multi-format recording medium
JP2963710B2 (ja) 電気的信号コード化のための方法と装置
JP3528260B2 (ja) 符号化装置及び方法、並びに復号化装置及び方法
WO1995016263A1 (fr) Procede, dispositif et support concernant le traitement de l'information
KR20000056661A (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
JPH09102742A (ja) 符号化方法および装置、復号化方法および装置、並びに記録媒体
JP3594829B2 (ja) Mpegオーディオの復号化方法
JP3362476B2 (ja) 高能率符号化装置及びインタフェース装置
Smyth An Overview of the Coherent Acoustics Coding System
JPH07181996A (ja) 情報処理方法、情報処理装置、及びメディア
JPH07161140A (ja) ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee