KR0171100B1 - 두 개 이상의 신호를 코딩하기 위해 선택될 코딩의 형태를 결정하는 방법 - Google Patents

두 개 이상의 신호를 코딩하기 위해 선택될 코딩의 형태를 결정하는 방법 Download PDF

Info

Publication number
KR0171100B1
KR0171100B1 KR1019950705724A KR19950705724A KR0171100B1 KR 0171100 B1 KR0171100 B1 KR 0171100B1 KR 1019950705724 A KR1019950705724 A KR 1019950705724A KR 19950705724 A KR19950705724 A KR 19950705724A KR 0171100 B1 KR0171100 B1 KR 0171100B1
Authority
KR
South Korea
Prior art keywords
coding
signal
signals
affected
spectral
Prior art date
Application number
KR1019950705724A
Other languages
English (en)
Inventor
헤레 위르겐
그릴 베른하르트
에버르라인 에른스트
브란덴부르크 카를하인쯔
자이처 디터
Original Assignee
헬뮤트 슈베르트
프라운호퍼 게젤샤프트 쭈어 푀르더룽 데르 앙게반텐 포르슝 에.파우.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE4345171A external-priority patent/DE4345171C2/de
Application filed by 헬뮤트 슈베르트, 프라운호퍼 게젤샤프트 쭈어 푀르더룽 데르 앙게반텐 포르슝 에.파우. filed Critical 헬뮤트 슈베르트
Application granted granted Critical
Publication of KR0171100B1 publication Critical patent/KR0171100B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

또다른 신호로부터 독립적이지 않은 다수 개의 신호(k1, k2)를 코딩하는 경우, 적합한 코딩 형태의 선택이 유사치 함수로써 이루어진다.
본 발명의 한 양상에 따르면, 인텐시티-스테레오 방법에 따라 다수 개의 신호( k1, k2) 중 하나가 우선적으로 코딩된 후, 코딩에러에 의해 영향을 받는 하나의 신호(ki1, ki2)를 만들기 위해 디코딩됨으로써 유사치가 결정된다. 코딩에러에 의해 영향을 받는 신호와 이와 연관된 코딩되지 않은 신호가 주파수 영역으로 변환된다. 주파수 영역에서는 청각심리학적 계산에 의해 결정된 청각 임계치를 사용하여, 코딩에러에 의해 영향을 받는 신호(ki1, ki2)와 이와 연관된 영향을 받지 않는 신호(k1, k2)의 실제 가청 스펙트럼 성분이 선택되거나 평가된다. 높은 유사치의 경우, 인텐시티-스테레오 코딩이 수행되고, 반대의 경우, 채널에 대한 분리코딩이 수행된다.

Description

두 개 이상의 신호를 코딩하기 위해 선택될 코딩 형태를 결정하는 방법
제1도(a)는 선택될 코딩 형태를 결정하기 위한 방법의 필수부분을 수행하는 장치의 제1실시예를 보여준다.
제1도(b)는 제1실시예와 비교하여 약간 변경된 제2실시예를 보여준다.
제2도는 선택될 코딩 형태를 결정하기 위한 방법의 필수부분을 수행하는 장치의 제3실시예를 보여준다.
제3도는 제1도에 따른 장치의 출력 신호를 기초로 하여 유사치를 결정하는 장치의 블록도를 보여준다.
제4도는 제2도에 따른 장치의 출력 신호를 기초로 하여 유사치를 결정하는 장치의 블록도를 보여준다.
제5도는 제3도와 비교하여 변경된 블록도를 보여준다.
제6도는 시간/주파수 변환을 수행하고 순간 에너지(short-time energies)를 결정하는 제1도와 제2도에 따른 경우에서 각 신호를 위한 처음 두 블록의 구조를 도시한 블록도이다.
제7도는 비균등 시간/주파수 분해능(resolution)을 가지고, 인간의 청각 특성에 맞는 변형을 수행하기 위한 하이브리드 또는 다상(polyphase) 필터 뱅크의 구조와 동작 모드를 나타내는 표이다.
제1도는 선택될 코딩 형태를 결정하기 위한 본 발명의 제 1 양상에 따른 방법의 필수부분을 수행하는 장치의 블록도이다. 여기서 보여준 실시예는 두 개의 스테레오 채널 k1, k2에 대한 분리 코딩과 인텐시티 스테레오 코딩 방법에 따른 코딩 사이의 절환을 제어하는데 사용될 수 있다. 인텐시티 스테레오 코딩 방법은 서두에 인용된 인쇄출판물을 참고할 수 있다.
그러나, 이 시점에서, 본 발명에 따른 방법은 두 개의 스테레오 채널 k1, k2에 대한 분리 코딩이나 인텐시티 스테레오 방법에 따른 코딩 중 하나를 선택하는데 적합할 뿐만 아니라, 임의의 최소 두 가지 코딩 형태(둘 중 하나는 나머지 선택되지 않은 코딩 형태보다 다른 신호와 유사성을 갖는 신호를 코딩하는데 더 적합하다.) 중 하나를 선택하는데 기여한다는 것이 강조될 수 있다. 본 발명에 따른 방법의 결과로써, 비교적 높은 비트 감축이 얻어진다. 아래에 상세히 설명되어 있는 바와같이, 본 발명에 다른 방법의 적용은 ISO/MPEG layers 1 내지 3에 따른 스테레오 신호 코딩에 한정되지 않고, MPEG2에 따른 다중채널 코딩에도 적합하다.
제1도(a)에 도시된 바와같이, 여기에 나타나 있는 장치는 4개의 신호처리 브랜치 z1, z2, z3, z4를 포함하는데, 각각의 브랜치는 3개의 해당 블록 b1, b2, b3를 갖는다.
블록 b1은 입력측 이산시간신호 k1, k2, ki1, ki2에 대한 시간/주파수 변환을 위해 사용된다. 여기서, 입력측 오디오 데이터를 시간 영역에서 주파수 영역이나 스펙트럼 영역으로 변환하기 위해 임의의 주파수 변환 방법이 고려된다. 예를들면, FFT, DCT, MDCT와 같은 방법과 다상 필터 뱅크나 아이브리드 필터 뱅크의 사용이 고려된다.
그러나, 아래에 더욱 상세히 설명되어 있는 바와같이, 본 발명은 인간의 청각 특성에 적합한 비균등 시간 및 주파수 분해능을 갖는 변환 방법을 사용한다. 청각심리학 분야에서 알려져 있는 이러한 방법의 경우, 하위 주파수군(frequency groups)만이 해당 폭(width)을 갖는다. 한편 주파수군의 폭은 특정 주파수에서 시작하여 증가된다. 이에 대해서는 제7도의 표를 참조하여 더 상세히 설명될 것이다. 주파수군 폭과 시간 분해능의 곱셈값에 대한 하이젠베르그 한계치(Heisenberg limit) 0.5에 따라 주파수군 폭이 증가하면 시간 분해능이 감소한다.
제 2 블록 b2에서는 변환에 의해 얻어진 스펙트럼 값이 각 주파수군 대역(band)의 순간에너지 값으로 변환되는데, 예를들어 해당 배수만큼의 합산 및 제곱승에 의해 변환된다. 따라서 각 주파수군 대역에 대해 구해진 순간에너지 값은 해당 신호의 청각심리학적 계산으로부터 도출되는 청각 임계치를 사용하여, 제 3 블록 b3에서 선택되거나 평가된다. 이는 청각심리학적 마스킹 효과를 고려하기 위해, 실제 에너지(real energies)로부터 가청 성분만을 뽑아내기 위함이다. 이것은 본 발명의 목적을 위한 강제사항은 아니지만, 블록 b3에서 인간의 속귀(inner ear)를 모델링 하기 위한 내부 표현(internal represenation)이나 추가의 이미징(imaging)을 수행하는 것이 가능하다. 여기서 모델링은 인간의 속귀에 대한 비선형성을 설명한다. 이러한 목적을 위해, Xα(0.1α10) 형태의 함수가 사용될 수 있다.
x1, x2 값을 얻기 위하여, 앞서 설명된 계산이 처음 두 브랜치 z1, z2에 있는 스테레오 신호이 두 채널 k1, k2에 대해 수행된다. 또한, 출력값 xi1, xi2를 얻기 위해, 코딩 에러에 의해 영향을 받는 두 개 신호 ki1, ki2에 대해서도 같은 계산 방법이 적용된다. 코딩 에러에 의해 영향을 받는 출력값 xi1, xi2는 두 개의 오리지날 채널 k1, k2로부터 얻어지는데, 먼저, 유사치가 큰 경우에 적용되는 코딩 형태를 사용하여, 두 개의 오리지날 채널을 코딩함으로써 얻어진다. 바람직한 실시예에서 상기 코딩 형태는 인텐시티-스테레오 코딩 형태이다. 코딩 에러에 의해 영향을 받은 신호 ki1, ki2를 얻기 위하여, 일반적인 코딩에 의해 얻어진 코딩 신호가 인텐시티-스테레오 방법을 사용하여, 원래 알려진 방법대로 디코딩된다.
출력신호 x1, x2, xi1, xi2를 기초로 하여 비교적 더 유리한 코딩 형태를 선택하기 위해, 다양한 방법으로 유사치가 결정될 수 있으며, 제3도 내지 5도를 참조하여 다음에서 설명될 것이다. 그러나, 코딩 에러에 의해 영향을 받지 않는 신호 x1 또는 x2를 참조하여, 코딩 에러에 의해 영향을 받는 출력신호 xi1 또는 xi2 중 하나의 유사성만을 평가하는 것이 충분하다. 이러한 출력측 스펙트럼 값(이 스펙트럼 값으로부터 유사치가 도출될 수 있다.) 사이의 에러 측정은 뺄셈에 의해 가장 간단하게 결정될 수 있다.
제1도(b)는 제1실시예를 약간 변경시킨 것으로써, 선택될 코딩 형태를 결정하기 위한 방법 중 실질적인 부분을 수행하는 장치의 제2실시예를 보여준다. 이 실시예에서는 먼저 세 번째와 네 번째 브랜치 z3, z4에 있는 신호 k1, k2가 블록 b1에서 주파수 영역으로 변환되고, 주파수 영역으로의 변환이 끝난다음, 높은 유사치를 결정하는 경우에 사용되는 코딩 형태에 따라 코딩된다. 그런다음, 코딩 에러에 의해 영향을 받는 두 신호 ki1, ki2를 발생시키기 위해 다시 디코딩된다. 다음으로, 청각심리학적 계산에 의해 결정된 청각 임계치가 사용되어, 코딩 에러에 의해 영향을 받는 신호 ki1, ki2의 스펙트럼 값 xi1, xi2와 이 신호와 연관된 신호의 스펙트럼 값에서 시작하여, 각각의 실제 가청 스펙트럼 성분이 선택되거나 평가된다. 연속해서, 코딩에러에 의해 영향을 받는 신호 및 이 신호와 연관된 신호의 가청 스펙트럼 성분 중 선택되거나 평가되는 하나의 가청 스펙트럼 성분을 기초로 하여 유사치가 계산된다. 이 유사치를 기초로 하여 최수 두 가지 형태 중 하나가 선택된다.
본 발명에 따른 방법 중에서 상대적으로 더 적합한 세 번째 코딩 방법을 선택할 경우, 유사치를 결정하기 위한 장치가 제2도에 나타나 있다. 제1도(a), 제1도(b)와 비교해 볼때, 제2도에 따른 처음 두 브랜치 z1, z2가 제1도(a) 및 제1도(b)에 따른 그것과 동일하게 대응한다. 세 번째와 네 번째 브랜치 z3, z4는 생략될 수 있다. 처음 두 브랜치 z1, z2가 동일하기 때문에, 이들 브랜치의 블록에 의해 수행되는 신호처리에 대해서는 다시 설명할 필요가 없다. 제2도에 따른 장치에서는 오리지날 채널 k1, k2의 가청 스펙트럼 성분 x1, x2를 얻기 위해, 두 개의 오리지날 채널 k1, k2를 기초로 하여, 시간/주파수 변환이 수행되고 순간에너지 값이 형성되며 그 값에 대한 선택 또는 평가가 이루어진다. 선택되거나 평가되는 가청 스펙트럼 성분 x1, x2의 유사치는 임계치 k와 비교된다. 만약 유사치가 임계치 k를 초과한다면, 더 높은 데이터 감축을 기초로하여 선택된 그 코딩 형태는 근사하게(approximately) 일치하는 스테레오 신호를 코딩하는데 더 적합한 것이다. 바람직한 실시예에서, 이것은 인텐시티-스테레오 코딩 방법이 될 수 있다. 만약 유사치가 임계치 k 아래에 있으면, 바람직한 실시예대로 채널이 따로따로 코딩된다.
제1도(a) 및 제1도(b)에 나타나 있는 장치의 출력신호를 처리할 수 있는 장치가 제3도에 도시되어 있다. 여기서, 스펙트럼 코딩 에러 x1-xi1 및 x2-xi2 각각은 임계치 k와 비교된다. 만약 두 개의 에러값 x1-xi1와 x2-xi2 각각이 임계치 k보다 낮으면, 더 강력한 데이터 감축 방법이 사용된다. 이것은 바람직한 실시예의 경우, 인텐시티-스테레오 방법이다.
제5도는 제1도(a), 제1도(b)에 나타나 있는 장치의 출력신호를 기초로 하여 유사치를 결정하는 제3도의 장치에 대해 변경된 실시예를 보여주는 것으로서, 선택될 코딩 형태를 결정한다. 상호 대응하는 두 개의 회로부는 각각 하나의 노드로 구성된다. 차이값 xi1-x1와 xi2-x2가 계산되는 이 노드는 코딩 에러신호를 발생시키기 위해 형성되고, 두 개의 블록 b4와 b5는 각각의 경우 하나의 신호 블록을 통해, 에러신호 xi1-x1, xi2-xi2와 유효신호 x1, x2를 각각 합산하기 위해 형성된다. 이들 에러신호 및 유효신호 성분의 절대값이 블록별로 합산된 후, 에러신호의 절대값 합산치는 분자로서, 유효신호의 절대값 합산치는 분모로서 다음 블록 b6에 형성되고 임계치 k와 비교된다. 만약 두 채널 중 하나에서 해당 에러값이 임계치 k를 초과하면, 인텐시티-스테레오 코딩이 사용될 수 없고 분리코딩이 사용되어야 한다.
지금부터는 제6도를 참조하여, 제1도(a), 제1도(b), 제2도에 따른 브랜치 z1, z2의 블록 b1과 b2 및 브랜치 z1 내지 z4의 블록 b1과 b2 각각에 대해 실현가능한 실시예를 설명한다. 그러나, 이 시점에서, 이산 오디오 신호의 시간/주파수 변환과 순간 에너지값의 형성이 코딩 형태를 결정하는 분야가 아니더라도 코딩 분야에서 통상의 지식을 가진 자들에게 이미 알려져 있다는 것을 강조할 수 있다.
제6도에 도시된 바와같이, 이산 입력신호가 다상 필터 뱅크 PF로 입력된다. 다상 필터 뱅크 PF는 32(0에서 31까지)개의 폴리밴드(polyband)에 있는 시간-이산 입력신호에 대해 시간/주파수 변환을 수행한다. 이 폴리밴드에 관해서는 제7도, 오른쪽에 있는 다상 실행(poly implementation)의 왼쪽과 중앙 칼럼을 참조할 수 있다. 당해업자라면 제7도에서 발견할 수 있는 바와같이, 주파수 간격이 좁은 스케일 팩터 밴드의 경우, 각 스케일 팩터 밴드의 대역폭은 일정하며 제한 주파수(limiting frequency)까지 상승하지 않는다. 이는 인간의 청각 특성에 대한 주파수군 폭과 그와 연관된 시간 분해능을 시뮬레이터하기 위해서이다. 32(0-31)개의 폴리밴드의 스펙트럼 값이 다상 필터 뱅크 b1 다음의 블록 b2a에서 제곱승되어 에너지 값을 형성한다. 이 다음 블록에서는 각 스케일 팩터 밴드의 순간 에너지를 형성하기 위하여, 각기 다른 가산 길이(제7도, 오른쪽 칼럼과 비교)를 통해 합산이 수행된다. 상기 가산길이(summation length)는 합산될 연속적인 값의 수를 나타낸다. 다음으로, 적합한 주파수 밴드를 결합함으로써 32개의 폴리밴드가 결합되어 스케일 팩터 밴드의 수를 감소시킨다. ISO layer 3의 경우, 총 21개의 스케일 팩터 밴드가 선택된다. SB 10번부터 시작하여 연속적인 값을 합산함으로써 각 스케일 팩터 밴드에 대한 순간 에너지가 형성된다.
청각심리학적으로 계산된 청각 임계치를 사용하여 가청도(audibility) 범위 내에 있는 각 스펙트럼 값에 가중치를 주는 것은 전문화된 지식이므로, 제6도에서는 제1도 또는 제2도에 따른 블록 b3의 상세한 실시예가 재현되어 있지 않다.
청각 임계치를 계산하기 위해서 다음의 전문 서적을 참고할 수 있다.: 국제 규격 ISO/IEC 11172 1.5 Mbit/s까지의 디지털 저장매체를 위한 동화상 및 그와 연관된 오디오 코딩, 제3장 오디오, 부록 D 청각심리학적 모델.
가청도 및 내부 표현(internal representation)에 의한 스펙트럼 성분에 가중치가 부여되는 한 다음과 같은 표준문헌을 참고할 수 있다.
- John G. Beerends, Jan a, Stemerdink 共箸, 청각심리학적 사운드 표현을 바탕으로한 지각적 오디오 음질 측정, J. Audio Eng. Soc,m Vol. 40, No. 12, Decem ber 1992;
- E. Zwicker, H. Fastl 共箸, 청각심리학, Springer Verlag, Berlin Heidelberg, 1990, chapter 8.7.1 특별한 소란(Specific Loundness).
본 발명은 두 개 이상의 신호를 코딩하기 위해 선택될 코딩 형태를 결정하는 방법에 관한 것이다. 청구항 1과 2의 전제부(preamble)에 따라, 각 신호가 주파수 영역으로 변환되며, 스펙트럼 값에서 시작하여, 두 개 이상의 신호에 대한 유사성을 위한 유사치(similarity measure)가 결정된다.
특히, 최소 두 개의 신호가 다른 하나의 신호에 독립적이지 않고, 적어도 부분적으로 중복되거나 상관없는 정보를 포함하고 있는 두 개 이상의 신호를 코딩하기 위해, 최적의 코딩 형태를 선택하는 것에 관한 것이다.
일반적으로, 디지털 오디오 신호에 대한 데이터감축코딩(data-reduced coding) 방법에 있어서, 우선적으로 신호가 시간 영역에서 주파수 영역으로 변환된다. 만약, 그 신호가 다른 하나의 신호에 독립적이지 않다면, 둘 또는 다수개의 채널 사이에 중복성을 고려하는 데이터감축코딩을 사용하는 것이 보통이다.
이러한 코딩은 중앙/측면 코딩(J.D. Johnston 著, 광대역 스테레오 신호에 대한 지각적 변환 코딩, IC ASSP, IEEE, 1989, 페이지 1993∼1996)으로 알려져 있다. 이 중앙/측면 코딩에서는 오른쪽과 왼쪽 채널을 기준으로 하여, 한편에서는 스테레오 신호의 합(sum)과 중앙(centre)이 코딩되고, 다른 한편에서는 스테레오 신호의 차(difference) 또는 측면이 코딩된다.
보편적으로 사용되는 또다른 코딩은 인텐시티-스테레오 방법으로써 출판물 입체음향 디지털 오디오 신호의 서브밴드 코딩 (Proc. of IC ASSP, 1991, IEEE, Toronto, 페이지 3601∼3604)에 설명되어 있다. 인텐시티-스테레오 방법에서는 두개의 채널을 기준으로 하여, 하나의 모노신호가 신호의 좌/우 분배에 의한 보충 정보 아이템과 함께 형성되고 전송된다.
이러한 방법에서, 신호가 비교적 약간의 유사성을 갖고 있거나 다른 신호에 대해 완전히 독립적이라면, 강한 간섭이 일어날 수 있다는 것이 출원인의 독일 특허 DE 41 36 825 C1에 이미 언급되어 있다. 따라서, 중앙/측면 코딩의 경우, 좌우 채널에 있는 신호의 전혀 다른 구성은 실제 채널에 존재하는 신호에 의해 마스킹될 수 없는 인조잡상(artifacts)을 유도한다. 인텐시티-스테레오 방법을 사용할 때, 좌우 채널이 실질적으로 서로 편향하는 스펙트럼 값을 갖는다면, 공간음향효과(spatial sound impression)가 파괴될 수 있다.
이러한 문제에 대처하기 위해, 본 명세서에서는 주파수 영역으로 변환된 신호의 스펙트럼 값을 사용하여 유사치를 결정하는 것이 제안된다. 이 유사치를 기초로 하여 코딩 형태가 달리 선택된다. 만약 스펙트럼 값이 높은 유사치를 발생시킨다면, 중앙/측면 코딩이 사용되고, 반면 낮은 유사치를 발생시키면, 채널에 대한 분리 코딩이 사용된다. 또한, 코딩될 신호를 사용하여 청각심리학적 모델(psychoacoustic model)에 의한 마스킹 임계치를 계산하는 것이 이 특허에 공지되어 있다. 상기 마스킹 임계치는 하단에 연결되어 마스킹 동안 데이터를 감축시키는 데이터 감축단 즉, 중앙/측면 코딩단을 구동하기 위해 사용된다.
청구항 8을 간접적으로 재언급하고 있는 청구항 15에서, 상기 특허 DE 41 36 825 C1은 0으로 세트될 수 있는 스펙트럼 값을 결정하는데 마스킹 임계치가 사용되는 것을 설명하고 있다.
독일 특허 41 36 825에 설명된 방법을 통해, 변경 전의 중앙/측면 코딩 방법 및 변경 전의 인텐시티-스테레오 방법과 비교하여, 이미 상당한 질적 향상이 이루어진다 하더라도, 더 높은 데이터 감축율의 경우에서는 전송될 데이터의 한층 더 나은 질적 향상을 기대할 수 있다.
따라서, 이러한 종래 기술에서 출발하여, 본 발명의 목적은 최소 두 개의 신호를 코딩하기 위해 선택될 코딩 형태를 결정하는 방법을 제공하는 것이다. 이 방법은 코딩되는 데이터의 품질을 향상시키고 이 데이터를 기초로 하여 디코딩되는 신호의 품질을 향상시키며, 동시에 더 많은 데이터가 감축되는 식으로 행해진다.
이러한 목적은 청구항 1, 2, 3에 따른 방법에 의해 달성된다.
본 발명의 제 1 양상에 따르면, 해당 스펙트럼 값을 구하기 위해, 두 개의 코딩 형태 중 하나에 따라 코딩될 두 신호에 대해 주파수 변환이 수행되고, 동시에 이 두 신호 중 적어도 하나가 높은 유사치를 결정하는데 사용되는 코딩 형태에 따라 코딩된다. 그런다음, 코딩 에러에 의해 영향을 받는 최소 하나의 신호를 발생시키기 위해 다시 디코딩된 후, 주파수 영역으로 변환된다. 다음으로, 청각심리학적 계산에 의해 결정되는 청각 임계치가 사용되어, 코딩 에러에 의해 영향을 받는 신호의 스펙트럼 값 및 이 신호와 연관된 신호의 스펙트럼 값에서 시작하여, 각각의 실제 가청 스펙트럼 성분이 선택되거나 평가된다. 이어서, 코딩 에러에 의해 영향을 받는 신호와 이 신호와 연관된 신호의 가칭 스펙트럼 성분 중 선택되는 적어도 하나의 가청 스펙트럼을 기초로 하여 유사치가 계산된다. 이 유사치를 기초로 하여 적어도 두 개의 코딩 형태 중 하나가 선택된다.
본 발명의 제 2 양상에 따르면, 해당 스펙트럼 값을 구하기 위해, 두 개의 코딩 형태 중 하나에 따라 코딩될 두 신호에 대해 주파수 변환이 수행되고, 동시에 주파수 영역으로의 변환 후, 두 신호 중 적어도 하나가 높은 유사치를 결정하는데 사용되는 코딩 형태에 따라 코딩된다. 그런다음, 코딩 에러에 의해 영향을 받는 최소 하나의 신호를 발생시키기 위해 다시 디코딩된다. 다음으로, 청각심리학적 계산에 의해 결졍되는 청각 임계치가 사용되어, 코딩 에러에 의해 영향을 받는 신호의 스펙트럼 값 및 이 신호와 연관된 신호의 스펙트럼 값에서 시작하여, 각각의 실제 가청 스펙트럼 성분이 선택되거나 평가된다. 이어서, 코딩 에러에 의해 영향을 받는 신호와 이 신호와 연관된 신호의 가청 스펙트럼 성분 중 선택되거나 평가되는 적어도 하나의 가청 스펙트럼을 기초로 하여 유사치가 계산된다. 이 유사치를 기초로 하여 적어도 두 개의 코딩 형태 중 하나가 선택된다.
종래 기술과는 달리, 본 발명에서는 최소 두 개의 코딩 형태 중 하나를 선택하기 위해, 데이터 감축 코딩의 경우 발생하는 코딩 에러에 의해 영향을 받는 신호의 스펙트럼 성분 및 대응 신호의 스펙트럼 성분 모두에 대해 청각심리학적 평가를 실시한다.
본 발명의 제 3 양상에 따르면, 두 개의 서로 다른 채널에 대응하는 두 신호의 스펙트럼 값에서 시작하여, 청각심리학적 계산에 의해 결정되는 가청 임계치를 사용하여 실제 가청 스펙트럼 성분이 선택되거나 평가된다. 이 두 신호의 가청 스펙트럼 중 선택되거나 평가되는 하나의 가청 스펙트럼 성분을 기초로 하여 유사치가 결정되며, 이 유사치를 기초로 하여 최소 두 개의 코딩 형태 중 하나가 선택된다. 또한 종래 기술과는 달리, 이러한 본 발명의 접근은 코딩된 신호의 데이터 감축을 위해서가 아니라, 코딩 형태의 선택 기준이 되는 유사치를 결정하기 위해, 청각심리학적 계산에 의해 결정되는 가청 임계치를 사용한다. 본 발명의 세가지 양상에 공통적으로 적용되는 이러한 개념은 현재의 기술 상태와 명백히 대조되고 청각심리학적 관점에서 코딩 형태를 선택할 수 있게 한다.
본 발명에 따른 방법의 구체적 사항은 종속항에 나타나 있다.
본 발명에 따른 방법의 바람직한 실시예가 첨부된 도면을 참조하여 아래에 상세히 설명된다.

Claims (9)

  1. 주파수 영역으로 신호 변환이 이루어지고, 스펙트럼 값에서 시작하여, 최소 두 개의 코딩 형태 중 선택되는 하나를 기초로 하여 유사치가 결정되는, 두 개 이상의 신호(k1, k2)를 코딩하기 위해 선택될 코딩형태 결정 방법에 있어서, 코딩에러에 의해 영향을 받은 최소 하나의 신호를 발생시키기 위해, 두 신호(k1, k2)중 적어도 하나가 높은 유사치를 결정할 때 사용되는 코딩 형태로 코딩된 후 다시 디코딩되고; 코딩에러에 의해 영향을 받는 신호와 영향을 받지 않는 신호가 주파수 영역으로 변환되고; 코딩에러에 의해 영향을 받는 신호의 스펙트럼 값과 코딩에러에 의해 영향을 받지 않는 신호의 스펙트럼 값에서 시작하여, 청각심리학적 계산에 의해 결정된 청각 임계치를 사용하여, 각각의 실제 가청 스펙트럼 성분이 선택되거나 평가되고; 코딩에러에 의해 영향을 받는 신호의 가청 스펙트럼 성분과 이 신호와 연관된 코딩에러의 영향을 받지 않는 신호의 가청 스펙트럼 성분 중에서 선택되거나 평가되는 적어도 하나의 가청 스펙트럼 성분을 기초로 하여 유사치가 계산되는 것을 특징으로 하는 코딩 형태 결정 방법.
  2. 주파수 영역으로 신호 변환이 이루어지고, 스펙트럼 값에서 시작하여, 최소 두 개의 코딩 형태 중 선택되는 하나를 기초로 하여 유사치가 결정되는, 두 개 이상의 신호(k1, k2)를 코딩하기 위해 선택될 코딩형태 결정 방법에 있어서, 주파수 영역으로의 변환 후, 코딩에러에 의해 영향을 받는 최소 하나의 신호(k1, k2)를 발생시키기 위해, 두 신호(k1, k2) 중 적어도 하나가 높은 유사치를 결정할 때 사용되는 코딩 형태로 코딩된 후 다시 디코딩되고; 코딩에러에 의해 영향을 받는 신호의 스펙트럼 값과 코딩에러에 의해 영향을 받지 않는 신호의 스펙트럼 값에서 시작하여, 청각심리학적 계산에 의해 결정된 청각 임계치를 사용하여, 각각의 실제 가청 스펙트럼 성분이 선택되거나 평가되고; 코딩에러에 의해 영향을 받는 신호의 가청 스펙트럼 성분과 이 신호와 연관된 코딩에러 영향을 받지 않는 신호의 가청 스펙트럼 성분 중에서 선택되거나 평가되는 적어도 하나의 가청 스펙트럼 성분을 기초로 하여 유사치가 계산되는 것을 특징으로 하는 코딩 형태 결정 방법.
  3. 주파수 영역으로 신호 변환이 이루어지고, 스펙트럼 값에서 시작하여, 최소 두 개의 코딩 형태 중 선택되는 하나를 기초로 하여 이들 두 신호의 상호 유사성에 대한 유사치가 결정되는, 두 개 이상의 신호(k1, k2)를 코딩하기 위해 선택될 코딩형태 결정 방법에 있어서, 각 신호(k1, k2)의 스펙트럼 값에서 시작하여, 청각심리학적 계산에 의해 결정된 청각 임계치를 사용하여, 실제 가청 스펙트럼 성분이 선택되거나 평가되고; 코딩 형태를 선택하기 위해, 최소 두 신호(k1, k2)의 가청 스펙트럼 성분 중에서 선택되거나 평가되는 하나의 가청 스펙트럼 성분을 기초로 하여 유사치가 계산되는 것을 특징으로 하는 코딩 형태 결정 방법.
  4. 청구항 1내지 3중 하나의 청구항에 있어서, 각 신호(k1, k2)의 실제 가청 스펙트럼 성분을 선택하거나 평가하기 위해, 주파수군 폭의 함수로서 선택되는 주파수 영역 내의 순간 에너지 값이 우선적으로 결정되고; 계산된 청각 임계치와 비교하여, 가청 에너지 값이 순간 에너지 값으로부터 선택되거나 평가되는 것을 특징으로 하는 코딩 형태 결정 방법.
  5. 청구항 4에 있어서, 순간 에너지 값은, 주파수군 폭이 증가할 경우의 주파수 영역에 대한 사람 귀의 일시적 분해능에 따라 감소하는 주기 내의 각 주파수 영역에 대해, 결정되는 것을 특징으로 하는 코딩 형태 결정 방법.
  6. 청구항 4에 있어서, 실제 가청 스펙트럼 값을 선택하거나 평가하기 위해, 인간의 속귀에 대한 비선형성을 설명하는 함수가 상기 선택되거나 평가되는 스펙트럼 성분에 적용되는 것을 특징으로 하는 코딩 형태 결정 방법.
  7. 청구항 6에 있어서, 인간의 귀에 비선형성을 설명하는 함수가 Xα(0.1α10) 형태를 갖는 것을 특징으로 하는 코딩 형태 결정 방법.
  8. 청구항 1 또는 2에 있어서, 코딩 에러에 의해 영향을 받는 신호(ki1, ki2) 각각의 실제 가청 스펙트럼 성분(ki1, ki2)과 상기 신호와 연관된 신호(k1, k2) 각각의 실제 가청 스펙트럼 성분이 각 채널에 대해 변형되고 선택 또는 평가되며; 코딩에러에 의해 영향을 받는 신호(ki1, ki2) 및 영향을 받지 않는 신호(x1, x2)의 가청 스펙트럼 성분(xi1, xi; xi2, x2)을 기초로 하여 각 채널에 대해 결정되는 에러값을 근거로, 유사치가 결정되는 것을 특징으로 하는 코딩 형태 결정 방법.
  9. 청구항 1내지 3중 어느 한 항에 있어서, 유시치가 임계치(k)와 비교되고; 유사치가 임계치보다 작은 경우, 채널에 대한 분리코딩이 수행되고, 반대의 경우 인텐시티-스테레오 코딩이 수행되는 것을 특징으로 하는 코딩 형태 결정 방법.
KR1019950705724A 1993-09-15 1994-07-08 두 개 이상의 신호를 코딩하기 위해 선택될 코딩의 형태를 결정하는 방법 KR0171100B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DEP4345171.3 1993-09-15
DE4345171A DE4345171C2 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4331376A DE4331376C1 (de) 1993-09-15 1993-09-15 Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DEP4331376.0 1993-09-15
PCT/EP1994/002250 WO1995008227A1 (de) 1993-09-15 1994-07-08 Verfahren zum bestimmen der zu wählenden codierungsart für die codierung von wenigstens zwei signalen

Publications (1)

Publication Number Publication Date
KR0171100B1 true KR0171100B1 (ko) 1999-03-30

Family

ID=25929591

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950705724A KR0171100B1 (ko) 1993-09-15 1994-07-08 두 개 이상의 신호를 코딩하기 위해 선택될 코딩의 형태를 결정하는 방법

Country Status (11)

Country Link
US (1) US5736943A (ko)
EP (1) EP0719483B1 (ko)
JP (1) JP2800068B2 (ko)
KR (1) KR0171100B1 (ko)
AT (1) ATE152871T1 (ko)
AU (1) AU678270B2 (ko)
CA (1) CA2161263C (ko)
DE (1) DE4331376C1 (ko)
DK (1) DK0719483T3 (ko)
RU (1) RU2124272C1 (ko)
WO (1) WO1995008227A1 (ko)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4437287C2 (de) * 1994-10-18 1996-10-24 Fraunhofer Ges Forschung Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
DE19628292B4 (de) 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
DE19706268A1 (de) * 1997-02-18 1998-08-20 Christian Wenz Dateiformatspezifisches Packverfahren
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
US6012025A (en) * 1998-01-28 2000-01-04 Nokia Mobile Phones Limited Audio coding method and apparatus using backward adaptive prediction
JP4835641B2 (ja) * 1998-10-13 2011-12-14 日本ビクター株式会社 音声符号化方法及び音声復号方法
ATE387044T1 (de) * 2000-07-07 2008-03-15 Nokia Siemens Networks Oy Verfahren und vorrichtung für die perzeptuelle tonkodierung von einem mehrkanal tonsignal mit verwendung der kaskadierten diskreten cosinustransformation oder der modifizierten diskreten cosinustransformation
JP4618873B2 (ja) * 2000-11-24 2011-01-26 パナソニック株式会社 オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
US6654827B2 (en) 2000-12-29 2003-11-25 Hewlett-Packard Development Company, L.P. Portable computer system with an operating system-independent digital data player
WO2002054744A1 (en) * 2000-12-29 2002-07-11 Nokia Corporation Audio signal quality enhancement in a digital network
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
WO2004080125A1 (en) * 2003-03-04 2004-09-16 Nokia Corporation Support of a multichannel audio extension
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
WO2006030754A1 (ja) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、復号化装置、方法、及びプログラム
WO2007081713A1 (en) * 2006-01-09 2007-07-19 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multi-view video coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
MX2008012382A (es) * 2006-03-29 2008-11-18 Thomson Licensing Metodos y aparatos para usarse en un sistema de codificacion de video de multiples vistas.
CN101496407B (zh) 2006-07-06 2013-02-06 汤姆逊许可证公司 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置
WO2008005575A2 (en) * 2006-07-06 2008-01-10 Thomson Licensing Method and apparatus for decoupling frame number and/or picture order count (poc) for multi-view video encoding and decoding
RU2459283C2 (ru) * 2007-03-02 2012-08-20 Панасоник Корпорэйшн Кодирующее устройство, декодирующее устройство и способ
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101228165B1 (ko) * 2008-06-13 2013-01-30 노키아 코포레이션 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체
US8620643B1 (en) * 2009-07-31 2013-12-31 Lester F. Ludwig Auditory eigenfunction systems and methods
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
WO2014170530A1 (en) * 2013-04-15 2014-10-23 Nokia Corporation Multiple channel audio signal encoder mode determiner
CN105741835B (zh) * 2016-03-18 2019-04-16 腾讯科技(深圳)有限公司 一种音频信息处理方法及终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
DE4136825C1 (ko) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
DE4217276C1 (ko) * 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5278909A (en) * 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding

Also Published As

Publication number Publication date
CA2161263C (en) 1999-06-15
AU678270B2 (en) 1997-05-22
JP2800068B2 (ja) 1998-09-21
EP0719483A1 (de) 1996-07-03
RU2124272C1 (ru) 1998-12-27
DE4331376C1 (de) 1994-11-10
AU7187994A (en) 1995-04-03
US5736943A (en) 1998-04-07
WO1995008227A1 (de) 1995-03-23
JPH08507424A (ja) 1996-08-06
ATE152871T1 (de) 1997-05-15
DK0719483T3 (da) 1997-08-25
CA2161263A1 (en) 1995-03-23
EP0719483B1 (de) 1997-05-07

Similar Documents

Publication Publication Date Title
KR0171100B1 (ko) 두 개 이상의 신호를 코딩하기 위해 선택될 코딩의 형태를 결정하는 방법
EP1649723B1 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
EP1754222B1 (en) Energy dependent quantization for efficient coding of spatial audio parameters
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
JP4597967B2 (ja) オーディオ信号生成
FI112979B (fi) Digitaalisen datan erittäin tehokas koodauslaite
EP1738356B1 (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
CN101543098B (zh) 产生输出信号的去相关器和方法以及产生多声道输出信号的音频解码器
DE69829242T2 (de) Tonsignalkodierverfahren und -gerät
BRPI0611505A2 (pt) reconfiguração de canal com informação secundária
KR20070102738A (ko) 비상관 신호의 시간적 엔벨로프 정형화
WO2007118533A1 (de) Vorrichtung und verfahren zum erzeugen eines umgebungssignals
US7343281B2 (en) Processing of multi-channel signals
JP3421726B2 (ja) 複数の依存し合うチャネルのデジタル信号を伝達及び/又は記憶する際にデータを減少させる方法
DE102007029381A1 (de) Digitalsignal-Verarbeitungsvorrichtung, Digitalsignal-Verarbeitungsverfahren, Digitalsignal-Verarbeitungsprogramm, Digitalsignal-Wiedergabevorrichtung und Digitalsignal-Wiedergabeverfahren
US6765930B1 (en) Decoding apparatus and method, and providing medium
WO2005083702A1 (de) Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd
Delgado et al. Design Choices in a Binaural Perceptual Model for Improved Objective Spatial Audio Quality Assessment
Annadana et al. A Novel Audio Post-Processing Toolkit for the Enhancement of Audio Signals Coded at Low Bit Rates
Suresh Spatialization Parameter Estimation in MDCT Domain for Stereo Audio
DE202004003000U1 (de) Vorrichtung zum Beschreiben einer Audio-CD und Audio-CD

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121009

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20131011

Year of fee payment: 16

EXPY Expiration of term