KR20090007396A - 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법 및 장치 - Google Patents

손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR20090007396A
KR20090007396A KR1020087027070A KR20087027070A KR20090007396A KR 20090007396 A KR20090007396 A KR 20090007396A KR 1020087027070 A KR1020087027070 A KR 1020087027070A KR 20087027070 A KR20087027070 A KR 20087027070A KR 20090007396 A KR20090007396 A KR 20090007396A
Authority
KR
South Korea
Prior art keywords
data stream
lossless
lossy
signal
encoded data
Prior art date
Application number
KR1020087027070A
Other languages
English (en)
Other versions
KR101473016B1 (ko
Inventor
피터 잭스
플로리안 케일러
올리버 우볼트
스벤 코르돈
요하네스 보흠
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20090007396A publication Critical patent/KR20090007396A/ko
Application granted granted Critical
Publication of KR101473016B1 publication Critical patent/KR101473016B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

손실 기반 무손실 코딩에서 PCM 오디오 신호는 손실 인코더(101)를 통해 손실 디코더(102)에 입력된다. 손실 인코더는 손실 비트 스트림(111)을 제공한다.손실 디코더는 PCM 신호와 손실 디코더 출력 간의 차신호(104)를 상관해제하는 예측 필터(106)의 계수(118)를 제어(105)하는데 이용되는 부수 정보(115)를 제공한다. 상관해제된 차신호는 무손실 인코딩되어(108) 확장 비트 스트림(121)을 제공한다. 시간 영역에서의 상관해제 대신에 또는 이에 부가하여 스펙트럼 백색화를 이용하는 주파수 영역에서의 상관해제가 수행될 수 있다. 무손실 인코딩된 확장 비트 스트림과 함께 손실 인코딩된 비트 스트림은 무손실 인코딩된 비트 스트림을 구성한다. 본 발명은 원 파형의 수학적으로 정확한 재생을 가능하게 하는 확장에 의해 손실 인지 오디오 인코딩/디코딩의 향상을 용이하게 하며, 디코더 측에서 중간 품질 오디오 신호를 재구성하기 위한 부가 데이터를 제공한다. 무손실 확장은 널리 사용되는 mp3 인코딩/디코딩을 무손실 인코딩/디코딩 및 고품질 mp3 인코딩/디코딩으로 확장시키는데 이용될 수 있다.
손실 인코더, 손실 디코더, 무손실 인코딩, 무손실 디코딩, 확장 비트 스트림, 상관해제

Description

손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법 및 장치{METHOD AND APPARATUS FOR LOSSLESS ENCODING OF A SOURCE SIGNAL, USING A LOSSY ENCODED DATA STREAM AND A LOSSLESS EXTENSION DATA STREAM}
본 발명은 소스 신호의 무손실 인코딩된 데이터 스트림을 함께 구성하는 손실 인코딩된 데이터 스트림과 무손실 확장 데이터 스트림을 이용한 소스 신호 무손실 인코딩 방법 및 장치에 관한 것이다.
(mp3, AAC 등과 같은) 손실 오디오 코딩 기법과는 달리 무손실 압축 알고리즘은 원 오디오 신호의 용장성(redundancy)을 이용해야만 데이터 전송률을 줄일 수 있다. 종래의 손실 오디오 코덱의 음향 심리(psycho-acoustical) 모델에서 확인되는 바와 같이 무관성(irrelevancy)에 의존하는 것이 가능하지 않다. 따라서 모든 무손실 오디오 코딩 방식의 공통된 기술적 원리는 상관해제(de-correlation)를 위해 필터 또는 변환(예컨대 예측 필터 또는 주파수 변환)을 적용하고, 그 다음에 변환된 신호를 무손실 방식으로 인코딩하는 것이다. 인코딩된 비트 스트림은 그 변환 또는 필터의 파라미터와 그 변환된 신호의 무손실 표현을 포함한다. 이에 대해서는 예컨대 「J. Makhoul, "Linear prediction: A titorial review", Proceedings of the IEEE, Vol.63, pp.561-580, 1975」, 「T. Painter, A. Spanias, "Perceptual coding of digital audio", Proceedings of the IEEE, Vol.88, No. 4, pp.451-513, 2000」및 「M. Hans, R.W. Schafer, "Lossless compression of digital audio", IEEE Signal Proceeding Magazine, July 2001, pp.21-32」를 참조한다.
손실 기반 무손실 코딩의 기본 원리는 도 8 및 9에 나타나 있다. 도 8의 좌측에 있는 인코딩부에서 PCM 오디오 입력 신호(SPCM)는 손실 인코더(81)를 통해 손실 디코더(82)에 입력됨과 동시에 디코딩부(우측)의 손실 디코더(85)에 손실 비트 스트림으로서 입력된다. 손실 인코딩 및 디코딩은 그 신호의 상관을 해제하는데 이용된다. 디코더(82)의 출력 신호는 감산기(83)에서 이 입력 신호(SPCM)으로부터 감산되고, 감산 결과로서 생성된 차신호는 무손실 인코더(84)를 통해 확장 비트 스트림으로서 무손실 디코더(87)에 입력된다. 디코더(85, 87)의 출력 신호들은 가산기(86)에서 합산되어 원신호(SPCM)로 복원된다.
이 기본 원리는 EP-B-0756386과 US-B-6498811에서 자동 코딩에 대해 개시되어 있으며, 또한 「P. Craven, M. Gerzon, "Lossless Coding for Audio Discs", J. Audio Eng. Soc., Vol.44, No.9, September 1996」와 「J. Koller, Th. Sporer, K.H. Brandenburg, "Robust Coding of High Quality Audio Signals", AES 103rd Convention, Preprint 4621, August 1997」에도 개시되어 있다.
도 9의 손실 인코더에서 PCM 오디오 입력 신호(SPCM)는 분석 필터 뱅크(91)와 부대역 샘플의 양자화부(92)를 통과하여 코딩 및 비트 스트림 패킹부(93)에 입력된다. 양자화부는 이 신호(SPCM)와 분석 필터 뱅크(92)로부터의 해당 정보를 수신하는 인지(perceptual) 모델 산출기(94)에 의해 제어된다. 디코더측에서, 그 인코딩된 손실 비트 스트림은 부대역 샘플 디코딩 수단(96)과 합성 필터 뱅크(97)가 차례로 이어지는 비트 스트림 패킹 해제 수단(95)에 입력되고, 이 합성 필터 뱅크(97)로부터는 디코딩된 손실 PCM 신호(SDec)가 출력된다. 손실 인코딩과 디코딩에 대한 예는 표준 ISO/IEC 11172-3(MPEG-1 Audio)에 자세히 설명되어 있다.
종래 기술에서는 다음의 3가지 기본적인 신호 처리 개념 중 하나에 따라서 무손실 오디오 코딩이 수행된다.
a) 선형 예측 기법을 이용한 시간 영역 상관해제
b) 가역 정수 분석-합성 필터 뱅크를 이용한 주파수 영역 무손실 코딩
c) 손실 기본 계층 코덱의 잔류 신호(에러 신호)의 무손실 코딩
발명의 개요
본 발명이 해결하고자 하는 과제는 내장형(embedded) 손실 오디오 코덱에 더하여 구축되며 종래의 손실 기반 무손실 오디오 코딩 방식에 비해 효율(즉, 압축율)이 더 좋은 계층적 무손실 오디오 코딩 및 디코딩 방식을 제공하는 것이다. 이 과제는 청구항 제1항 내지 제3항 및 제7항 내지 제9항에 기재된 방법에 의해 해결된다. 이들 방법을 이용하는 장치는 청구항 제4항 내지 제6항 및 제10항 내지 제12항에 기재되어 있다.
본 발명은 손실 코딩에 더하여 수학적 무손실 인코딩과 디코딩을 이용한다. 수학적 무손실 오디오 압축은 디코더 출력에서 원래의 PCM 샘플의 비트 완전(bit-exact) 재생이 가능한 자동 코딩을 의미한다. 일부 실시예에서는 손실 인코딩은 예컨대 MDCT나 이와 유사한 필터 뱅크와 같은 주파수 변환을 이용하는 변환 영역에서 작동하는 것으로 가정된다. 예컨대 mp3 표준(ISO/IEC 11172-3 계층 3)은 본 명세서에서 손실 기본 계층에 대해 사용될 것이지만, 본 발명은 마찬가지로 다른 손실 코딩 방식(예컨대 AAC, MPEG-4 Audio)과 함께 적용될 수 있다. 전송된 또는 기록된 인코딩된 비트 스트림은 2 부분, 즉 손실 오디오 코덱의 내장 비트 스트림과, 무손실(즉, 비트 완전) 원 PCM 샘플이나 중간 품질을 얻기 위한 하나 또는 몇 가지 부가 계층을 위한 확장 데이터를 포함한다.
본 발명은 기본적으로 상기 개념들 중 c) 개념을 따른다. 그러나 본 발명의 실시예들은 a) 및 b) 개념의 특성들, 즉 최신의 무손실 오디오 코딩 방식들 중 몇 가지의 상승적 조합도 이용한다.
본 발명은 주파수 영역 상관해제, 시간 영역 상관해제 또는 이들의 조합을 이용하여 효율적인 무손실 인코딩을 위해 기본 계층 손실 오디오 코덱의 잔류 신호(에러 신호)를 생성한다. 본 발명의 상관해제 기법은 손실 디코더로부터 추출되는 부수 정보(side information)를 이용한다. 이에 의해서 비트 스트림 내의 용장 정보의 전송이 방지되어 총 압축률이 개선된다.
개선된 압축률 이외에도, 본 발명의 일부 실시예는 (손실 코덱과 수학적 무손실 품질에 의해 제한된 범위 내에서) 하나 또는 몇 가지 중간 품질의 오디오 신 호를 제공한다. 더욱이 본 발명은 간단한 비트 드롭핑(dropping) 기법을 이용하여 내장 손실 비트 스트림의 스트립핑(stripping)을 고려한다.
본 발명의 3가지 기본적인 실시예는 손실 기본 계층 코덱의 잔류 신호의 상관해제가 일어나는 영역, 즉 시간 영역, 주파수 영역 또는 통합된 양 영역에서 차이가 있다. 종래 기술과는 달리 모든 실시예는 손실 기본 계층 코덱의 디코더로부터 취해진 정보를 이용하여 상관해제 및 무손실 코딩 프로세스를 제어한다. 일부 실시예는 추가적으로 손실 기본 계층 코덱의 인코더로부터의 정보를 이용한다. 손실 기본 계층 코덱으로부터의 부수 정보의 이용은 전체 비트 스트림의 용장도 감소를 고려하여 손실 기반 무손실 코덱의 코딩 효율을 개선한다.
모든 실시예에서 서로 다른 품질 레벨을 가진 오디오 신호의 적어도 두 가지 변형이 비트 스트림으로부터 추출될 수 있다. 이들 변형은 원 PCM 샘플의 내장 손실 코딩 방식과 무손실 디코딩에 의해 표현되는 신호를 포함한다. 일부 실시예에서(하기의 "주파수 영역 상관해제"와 "주파수 및 시간 영역에서의 상관해제" 절을 참조) 중간 품질을 가진 오디오 신호의 하나 또는 몇 가지 다른 변형을 디코딩하는 것이 가능하다.
기본적으로, 본 발명의 인코딩 방법은, 소스 신호의 무손실 인코딩된 데이터 스트림을 함께 구성하는 손실 인코딩된 데이터 스트림과 무손실 확장 데이터 스트림을 이용한 소스 신호 무손실 인코딩에 적합하며,
상기 소스 신호를 손실 인코딩하여 상기 손실 인코딩된 데이터 스트림(111)을 제공하는 단계;
상기 손실 인코딩된 데이터를 손실 디코딩하여 디코딩된 신호를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보를 제공하는 단계;
상기 소스 신호의 대응 지연 형태와 상기 디코딩된 신호 간의 차신호를 형성하는 단계;
시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된 필터 계수를 이용하여 상기 차신호를 예측 필터링하는 단계;
상기 상관해제된 차신호를 무손실 인코딩하여 상기 무손실 확장 데이터 스트림을 제공하는 단계; 및
상기 무손실 확장 데이터 스트림을 상기 손실 인코딩된 데이터 스트림과 결합하여 상기 무손실 인코딩된 데이터 스트림을 형성하는 단계
를 포함하고,
또는,
상기 소스 신호를 손실 인코딩하여 상기 손실 인코딩된 데이터 스트림을 제공하는 단계;
상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터를 산출하는 단계 - 상기 산출은 양자화된 에러의 파워가 본질직으로 모든 주파수에 대해 일정하도록 제어됨 -;
상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터를 손실 디코딩하여 디코딩된 신호를 재구성하는 단계;
상기 소스 신호의 대응 지연 형태와 상기 디코딩된 신호 간의 차신호를 형성하는 단계;
상기 차신호를 무손실 인코딩하여 상기 무손실 확장 데이터 스트림을 제공하는 단계; 및
상기 무손실 확장 데이터 스트림을 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터와 결합하여 상기 무손실 인코딩된 데이터 스트림을 형성하는 단계
를 포함하고,
또는,
상기 소스 신호를 손실 인코딩하여 상기 손실 인코딩된 데이터 스트림을 제공하는 단계;
상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터를 산출하는 단계 - 상기 산출은 양자화된 에러의 파워가 본질직으로 모든 주파수에 대해 일정하도록 제어됨 -;
상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터를 손실 디코딩하여 디코딩된 신호를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보를 제공하는 단계;
상기 소스 신호의 대응 지연 형태와 상기 디코딩된 신호 간의 차신호를 형성하는 단계;
시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된 필터 계수를 이용하여 상기 차신호를 예측 필터링하는 단계;
상기 상관해제된 차신호를 무손실 인코딩하여 상기 무손실 확장 데이터 스트림을 제공하는 단계; 및
상기 무손실 확장 데이터 스트림을 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터와 결합하여 상기 무손실 인코딩된 데이터 스트림을 형성하는 단계
를 포함한다.
기본적으로, 본 발명의 디코딩 방법은, 무손실 인코딩된 소스 신호의 무손실 인코딩된 데이터 스트림(122)을 함께 구성하는 손실 인코딩된 데이터 스트림과 무손실 확장 데이터 스트림으로부터 무손실 인코딩된 소스 신호 데이터 스트림을 디코딩하는데 적합하며,
상기 소스 신호가 손실 인코딩하여 상기 손실 인코딩된 데이터 스트림을 제공하고;
상기 손실 인코딩된 데이터가 대응적으로 손실 디코딩하여 표준 디코딩된 신호를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보를 제공하고;
상기 소스 신호의 대응 지연 형태와 상기 디코딩된 신호 간의 차신호가 형성되고;
시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된 필터 계수를 이용하여 상기 차신호가 예측 필터링되고;
상기 상관해제된 차신호가 무손실 인코딩되어 상기 무손실 확장 데이터 스트림을 제공하고;
상기 무손실 확장 데이터 스트림이 상기 손실 인코딩된 데이터 스트림과 결합되어 상기 무손실 인코딩된 데이터 스트림을 형성하고,
상기 방법은,
상기 무손실 인코딩된 소스 신호 데이터 스트림을 디멀티플렉싱하여 상기 무손실 확장 데이터 스트림과 상기 손실 인코딩된 데이터 스트림을 제공하는 단계;
상기 손실 인코딩된 데이터 스트림을 손실 디코딩하여 손실 디코딩된 신호를 재구성하고 시간 영역 예측 필터를 제어하기 위한 상기 부수 정보를 제공하는 단계;
상기 무손실 확장 데이터 스트림을 디코딩하여 상기 상관해제된 차신호를 제공하는 단계;
상기 부수 정보로부터 도출된 필터 계수를 이용하여 상기 상관해제된 차신호의 연속값을 역 상관해제 필터링하는 단계; 및
상기 상관해제 필터링된 차신호를 상기 손실 디코딩된 신호와 결합하여 상기 소스 신호를 재구성하는 단계
를 포함하고,
또는,
상기 소스 신호가 손실 인코딩되어 상기 손실 인코딩된 데이터 스트림을 제공하고;
상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터가 산출되고, 상기 산출은 양자화된 에러의 파워가 기본적으로 모든 주파수에 대해 일정하도록 제어되고;
상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터가 손실 디코딩되어 디코딩된 신호가 재구성되고;
상기 소스 신호의 대응 지연 형태와 상기 디코딩된 신호 간의 차신호가 형성되고;
상기 차신호가 무손실 인코딩되어 상기 무손실 확장 데이터 스트림을 제공하고;
상기 무손실 확장 데이터 스트림이 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터와 결합되어 상기 무손실 인코딩된 데이터 스트림을 형성하고,
상기 방법은,
상기 무손실 인코딩된 소스 신호 데이터 스트림을 디멀티플렉싱하여 상기 무손실 확장 데이터 스트림과 상기 손실 인코딩된 데이터 스트림을 제공하는 단계;
상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터 스트림을 손실 디코딩하여 손실 디코딩된 신호를 재구성하는 단계;
상기 무손실 확장 데이터 스트림을 디코딩하여 상기 차신호를 제공하는 단계; 및
상기 차신호를 상기 손실 디코딩된 신호와 결합하여 상기 소스 신호를 재구성하는 단계
를 포함하고,
또는,
상기 소스 신호가 손실 인코딩되어 상기 손실 인코딩된 데이터 스트림을 제공하고;
상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터가 산출되고, 상기 산출은 양자화된 에러의 파워가 기본적으로 모든 주파수에 대해 일정하도록 제어되고;
상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터가 손실 디코딩되어 디코딩된 신호를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보를 제공하고;
상기 소스 신호의 대응 지연 형태와 상기 디코딩된 신호 간의 차신호가 형성되고;
시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된 필터 계수를 이용하여 상기 차신호가 예측 필터링되고;
상기 상관해제된 차신호가 무손실 인코딩되어 상기 무손실 확장 데이터 스트림을 제공하고;
상기 무손실 확장 데이터 스트림이 상기 손실 인코딩된 데이터 스트림 및 상 기 스펙트럼 백색화 데이터과 결합되어 상기 무손실 인코딩된 데이터 스트림을 형성하고,
상기 방법은,
상기 무손실 인코딩된 소스 신호 데이터 스트림을 디멀티플렉싱하여 상기 무손실 확장 데이터 스트림과 상기 손실 인코딩된 데이터 스트림을 제공하는 단계;
상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터 스트림을 손실 디코딩함으로써 손실 디코딩된 신호를 재구성하고 시간 영역 예측 필터를 제어하기 위한 상기 부수 정보를 제공하는 단계;
상기 무손실 확장 데이터 스트림을 디코딩하여 상기 상관해제된 차신호를 제공하는 단계;
상기 부수 정보로부터 도출된 필터 계수를 이용하여 상기 상관해제된 차신호의 연속값을 역 상관해제 필터링하는 단계; 및
상기 상관해제된 필터링된 차신호를 상기 손실 디코딩된 신호와 결합하여 상기 소스 신호를 재구성하는 단계
를 포함한다.
본 발명의 장치는 대응하는 본 발명의 방법의 기능들을 수행한다.
본 발명의 추가적인 바람직한 실시예들은 각각의 종속항에 기재되어 있다.
첨부도면을 참조로 본 발명의 예시적인 실시예들에 대해 설명한다.
도 1은 시간 영역 선형 예측을 이용하여 잔류 신호의 상관을 해제하는 손실 기반 무손실 인코더의 블록도 또는 신호 흐름도.
도 2는 시간 영역 선형 예측을 이용하여 잔류 신호의 상관을 해제하는 손실 기반 무손실 디코더의 블록도 또는 신호 흐름도.
도 3은 주파수 영역에서 잔류 신호의 상관을 해제하는 손실 기반 무손실 인코더의 블록도 또는 신호 흐름도.
도 4는 주파수 영역에서 잔류 신호의 상관을 해제하는 손실 기반 무손실 디코더의 블록도 또는 신호 흐름도.
도 5는 공지의 ISO/IEC 11172-3 계층 III에 대한 블록도.
도 6은 주파수 및 시간 영역에서 잔류 신호의 상관을 해제하는 손실 기반 무손실 인코더의 블록도 또는 신호 흐름도.
도 7은 주파수 및 시간 영역에서 잔류 신호의 상관을 해제하는 손실 기반 무손실 디코더의 블록도 또는 신호 흐름도.
도 8은 공지의 손실 기반 무손실 인코더 및 디코더에 대한 기본 블록도.
도 9는 공지의 손실 인코더 및 디코더에 대한 일반 블록도.
시간 영역 상관해제
이 실시예는 공지의 잔류 코딩 원리를 이용한다.
도 1에 도시된 인코딩에서, 인코딩은 MUX 블록(109)으로 보내지는 손실 비트 스트림(111)을 발생시키는 손실 인코더 단계 또는 스테이지(101)에서 시작한다. 대응하는 손실 디코더(102)는 디코딩된 오디오 신호(112)와 시간 영역 선형 예측 필터의 제어에 이용될 부수 정보(115)를 생성한다. 이 부수 정보(115)는 예컨대 손실 코덱(101/102)의 에러(즉, 잔류 신호(114)), 즉 감산기(104)에서 형성된, (손실) 디코딩된 오디오 신호(112)와 적당히 지연된 원 PCM 샘플(113) 간의 차이의 스펙트럼 포락선을 기술하는 파라미터 세트를 포함한다. 지연부(103)는 연결된 손실 인코더(101)와 손실 디코더(102)에 의해 유발되는 연산 지연을 보상한다. 부수 정보는 또한 블록 크기, 윈도우 함수(window function), 차단 주파수 및 비트 할당 중 하나 또는 그 이상을 포함할 수 있다.
손실 디코더(102)로부터 추출된 부수 정보(115)(특히 손실 인코더(101)가 부분적인 오디오 신호 주파수만을 인코딩하는 경우나, 단계/스테이지(105)에서 필터 계수를 더 정확하게 결정하기 의해서는 신호(114)도 포함할 수 있음)는 필터 적응 블록(105)에서 선형 예측 필터(106)에 인가될 최적 필터 계수 세트(118)를 결정하는데 이용된다. 예측 필터링과 감산(107)의 목적은 평탄한(즉, '백색') 스펙트럼을 가진 상관해제된 출력 신호(120)를 생성하는 것이다. 백색 신호는 완전히 상관해제되어 있으며, 이에 대응하는 연속한 시간 영역 샘플 또는 값은 최저 가능 파워 및 엔트로피를 나타낸다. 따라서 신호의 상관해제가 더 좋을수록 무손실 코딩의 평균 데이터 전송률은 더 낮아진다. 공지의 손실 기반 무손실 방식과 비교해서 본 발명은 예측 필터 설정에 대한 다량의 정보를 전송하지 않아도 매우 양호한 상관해제를 달성할 수 있다. 대응하는 정보 스트림(116)은 손실 디코더로부터의 부수 정보(116)를 이용하지 않는 시스템보다 데이터 전송률이 항상 낮다. 궁극적으로 디코딩 측에서 예측 필터 계수의 적응을 위해 전송될 여분의 정보(116)는 제로가 될 수 있다. 즉, 본 발명에 따른 방식의 코딩 효율은 유사한 손실 기반 무손실 오디오 코딩 방식의 코딩 효율보다 항상 더 좋다. 일반적으로 손실 디코더로부터의 유용한 정보(파라미터, 신호 등)는 예측 필터와 무손실 인코더 양쪽의 적응성을 개선하는데 이용될 수 있다.
동작에 있어서, 손실 디코더 블록(102) 내부에 선택적으로 구현될 수 있는 손실 디코더(102), 시간 영역 선형 예측 필터(106), 지연 보상부(103), 감산부(104, 107) 및 기타 보간 기능부는 플랫폼 독립 방식으로 구현되어야 한다. 즉, 목표로 하는 모든 플랫폼에 대해서 비트 완전 재생 가능 결과를 얻기 위해서는 정수 정밀도를 가진 고정점(fixed-point) 구현이 요구된다. 예측 에러 신호(120)는 무손실 인코딩 블록(108)에 공급되고, 여기서 인코딩된 비트 스트림(121)을 생성한다. 바람직하게는, 예측 에러 신호(120)는 상관해제(백색)된 것으로 생각할 수 있으므로 무손실 인코더(108)에는 단순한 메모리리스(memoryless) 엔트로피 코딩(예컨대 라이스(Rice) 코딩)이 이용될 수 있다. 무손실 코딩은 필터 적응 블록(105)의 필터 적응 중에 도출될 부가적인 부수 정보(117)에 의해 선택적으로 지원될 수 있다. 예컨대 잔류 신호(120)의 추정 파워는 종래의 예측 필터 적응 방법의 부산물인 부수 정보(117)로서 제공될 수 있다. 멀티플렉서(109)는 부분적 비트 스트림(111, 116, 121)을 조합하여 출력 비트 스트림 신호(122)를 구성할 수 있으며, 출력 비트 스트림(122)을 위한 여러 가지 파일 포맷 또는 비트 스트림 포맷을 생성할 수 있다.
용어 '손실 디코더'는 손실 인코딩된 비트 스트림의 정확한 디코딩, 즉 손실 인코더의 역동작을 의미한다.
도 2의 디코딩에서 입력되는 전체 비트 스트림(122)은 디멀티플렉서(210)에 의해 서브비트 스트림으로 분할된다, 플랫폼 독립 방식으로 디코더(102)와 정확하게 동일한 출력을 생성하도록 구현된 손실 디코더(202)는 손실 디코딩된 시간 신호(218)와 부수 정보(212)를 생성한다. 이 부수 정보와 (도 1의 신호(116)에 대응하는) 임의의 선택적인 비트 스트림 성분(210)으로부터, 대응하는 인코딩 블록(105)에서와 똑같이 필터 적응 블록(203)에서 필터 적응이 수행될 수 있다. 디멀티플렉서(201)는 또한 손실 디코더(204)에 손실 확장 비트 스트림(211)을 제공하며, 손실 디코더(204)의 출력 신호(215)는, 가산기(205)와, 클록(212)에 의해 제공되는 필터 계수(214)에 의해 제어되는 예측 필터(206)를 포함하는 역 상관해제 필터에 공급되고, 이에 따라 손실 코덱 에러 신호(114)의 비트 완전 복제(217)가 생성된다. 이 에러 신호와 손실 디코더(202)로부터의 디코딩된 신호(218)의 가산(207)은 원래의 PCM 샘플(SPCM)을 산출한다. 필터 계수(214)는 필터 계수(118)와 동일하다. 구성 요소(202, 204, 205, 206, 207)의 동작은 대응 구성 요소(102, 108, 107, 106, 104)의 동작과 동일하다.
선택적인 실시예
이 기본적인 처리는 여러 가지 방식으로 적용될 수 있다. 도 1의 블록(106, 107)을 포함하는 순방향 선형 예측 필터 구조 대신에 시간 영역 선형 예측 필터의 다른 변형이 이용될 수 있다. 예컨대 역방향 예측이나 역방향 예측과 순방향 예측의 조합이 이용될 수 있다. 다른 옵션은 이들 단기 예측 기법이외에 장기 예측 필터를 이용하는 것이다.
필터 적응 블록(105/203)으로부터 추출된 부가적인 부수 정보(117/213)는 무손실 인코딩/디코딩 블록(108/204)을 제어하는데 이용될 수 있다. 예컨대 통상의 필터 적응 기법에 의해 추정된 예측 잔류 신호의 표준 편차는 예컨대 허프만(Huffman) 테이블을 선택하기 위하여 무손실 코딩을 파라미터로 나타내는데 이용될 수 있다. 이 옵션은 도 1 및 2에서 신호(117/213)에 대해 파선으로 나타낸다.
본 발명의 실시예들은 디코더에서 이용될 수 있는 파라미터 세트로부터 에러 신호의 파워 스펙트럼을 결정 또는 추정할 수 있는 모든 종류의 코덱에 더하여 적용될 수 있다. 따라서 이 계층적 코덱 처리는 넓은 범위의 오디오 및 음성 코덱에 적용될 수 있다.
구현예
손실 기본 계층 코덱이 mp3 표준에 잘 맞는다고 가정하면, 스케일 계수(scale factor) 세트로부터 시간 영역 선형 예측 필터에 대한 최적 계수를 결정할 수 있다. mp3 코덱에서는 스케일 계수는 MDCT 계수를 인코딩하는데 적용될 양자화 단계 크기를 기술한다. 즉, 각 신호 프레임(그래뉼(granule))에 대한 스케일 계수 세트로부터 에러 신호의 파워 스펙트럼의 포락선을 도출하는 것이 가능하다.
파워 스펙트럼 영역에서 표현해서 See(i)가 i번째 MDCT 계수에 대한 스케일 계수를 나타낸다고 하면, 자동 상관 계수(
Figure 112008076552715-PCT00001
)는 역이산 푸리에 변환(IDFT)에 의해 결정될 수 있다. 레빈슨-더빈(Levinson-Durbin) 알고리즘(상기 인용된 Makhoul)을 적용하면 p차 선형 예측 필터(106/206)에 적용될 최적 필터 계수(118/214) 세트(ai, i=1,..., p, )를 생성할 것이다. 이 절차는 오디오 신호의 프레임(그래뉼) 마다 반복된다. 필터 계수 세트(ai, i=1,..., p, )외에 레빈슨-더빈 알고리즘은 예측 에러 신호(120/215)의 예상 편차(expected variance)를 생성한다. 이 편차는 예측 잔류 신호의 후속 무손실 코딩(108)을 제어하는데 중요한 정보이다.
mp3 인코더가 특정 주파수 범위를 비트 할당에서 배제한 경우(예컨대 낮은 데이터 전송률의 고주파수를 배제한 경우) 또는 고급 코딩 도구를 이용하는 경우에는 더 복잡한 방식이 적용된다. 더욱이 특정 주파수 범위에서는 에러 신호의 파워 스펙트럼의 추정치(See(i))는 필터 적응에 이용될 원하는 정밀도를 갖지 못할 수 있다. 그러면 에러 신호(114)를 조사하여 추가 정보를 더 얻어야 한다. 이것은 시간 영역과 주파수 영역 모두에서 수행될 수 있다.
주파수 영역 상관해제
이 실시예에서 잔류 신호의 상관해제는 손실 코덱의 변환 영역에서 수행된다. 그러나 실제 무손실 코딩은 여전히 시간 영역에서 수행된다. 그러므로 이 방법은 공지의 손실 기반 무손실 방식과 변환 기반 무손실 코딩 방식과는 다르다. 본 실시예는 변환 영역 상관해제 방식과 시간 영역 기반 무손실 코딩 방식을 결합한 것이다.
도 3에 도시된 인코딩에서 손실 인코더(301)는 적응 또는 고정 비트 할당을 이용하여 변환 계수를 양자화하기 전에 원 신호(SPCM)(또는 그 부대역 신호)의 변환을 이용한다. 다음에서는 손실 인코더는 일반성을 잃지 않고 주파수 변환에 기초하는 것으로 가정한다. 손실 인코더(301)가 결합된 비트 스트림(317)의 내장 역방향 양립 손실 신호 부분(309)을 생성한 후에, 변환 영역에서 손실 디코더(301)의 에러 신호를 결정하고 이들 에러 계수의 추가적인 양자화를 수행하여 인코딩될 확장 데이터 신호의 연속값의 크기에 대해 스펙트럼 평탄(즉, '백색') 에러 플로어(error floor)를 달성하기 위하여 '스펙트럼 백색화' 블록(302)이 적용된다. 일반적으로 손실 오디오 코덱은 복잡한 잡음 성형 기법을 적용하여 인간의 귀의 비백색 마스킹 임계(non-white masking threshold)를 고수하는 에러 스펙트럼을 얻는다. 스펙트럼 백색화 블록은 비트 스트림에 포함된 적어도 원래의 변환 계수(310)와 양자화된 변환 계수(309)를 입력 신호로서 필요로 한다. 그와 같은 백색화는 주파수 영역 내에서 에러를 양자화함으로써 달성될 수 있다. 주파수 영역에서 원래의 변환 계수(310)와 양자화된 변환 계수(309) 간의 차신호는 시간 영역에서의 차신호(314)의 거울상이다.
손실 인코더의 출력 비트 스트림(309)과 스펙트럼 백색화 블록(302)으로부터의 부가 정보(311)는 확장 손실 및 백색화 디코더 블록(303)과 멀티플렉서(307)에 공급된다. 도출된 시간 영역 신호(312)는 원 신호(SPCM)의 적당히 지연된 형태(313)(손실 코덱의 지연을 보상한 것)로부터 감산되어(305) 잔류 신호(314)를 생성한다. 스펙트럼 백색화 처리 때문에 이 잔류 신호는 평탄한 스펙트럼을 갖는다. 즉, 연속한 샘플들 간의 상관은 무시할 수 있다. 잔류 신호는 무손실 확장 스트림(316)을 출력하는 무손실 인코더(306)에 직접 공급될 수 있다. 선택적으로 손실 & 백색화 디코더(303)로부터의 부수 정보(상기 예 참조; 특히 바람직한 것은 에러 신호의 평균 파워)(315)는 무손실 인코더(306)를 제어하는데 이용될 수 있다.
동작에 있어서, 손실 디코더 블록 내부에 선택적으로 구현될 수 있는 손실 & 백색화 디코더(303), 감산기(305) 및 기타 보간 기능부는 플랫폼 독립 방식으로 구현된다. 즉, 목표로 하는 모든 플랫폼에 대해서 비트 완전 재생 가능 결과를 얻기 위해서는 정수 정밀도를 가진 고정점 구현이 요구된다.
멀티플렉서(307)는 부분적 비트 스트림(309, 311, 316)을 조합하여 출력 비트 스트림 신호(317)를 구성하며, 여러 가지 파일 포맷 또는 비트 스트림 포맷을 생성할 수 있다.
도 4에 도시된 디코딩에서, 수신된 비트 스트림(317)은 디멀티플렉싱되어(401) 개별적인 신호 계층(406, 407, 408)으로 분할된다. 내장 손실 비트 스트림(406)과 스펙트럼 백색화 비트 스트림(407) 모두 손실 및 백색화 디코더(402)에 공급된다. 도출된 시간 영역 신호(409)는 인코딩에서 중간 품질 신호(312)의 비트 완전 복제이다. 무손실 디코더(403)는 비트 스트림(408)으로부터, 선택적으로는 손실 및 백색화 디코더(부수 정보(410))로부터의 입력을 수신하여 잔류 신호(411)를 생성한다. 중간 품질 신호(409)를 무손실 인코딩된 잔류 신호(411)에 가산함으로써 최종 출력 신호(SPCM)가 얻어진다.
구성 요소(402, 403, 404)의 동작은 대응 구성 요소(303, 306, 305)의 동작과 동일하다.
선택적인 실시예
스펙트럼 백색화를 위해 다소간의 비트를 할당함으로써 잔류 신호의 파워를 제어하는데는 몇 가지 가능성이 있다. 한 가지 옵션은 스펙트럼 백색화 블록(302)에서 양자화량을 변화시키고 시간 영역 무손실 코딩(306)의 고정 설정을 고려함으로써 잔류 신호의 일정 파워에 목표를 맞추는 것이다. 다른 옵션은 시간 영역 잔류 신호의 파워 레벨을 가변시키는 것이다.
손실 인코더(301)와 스펙트럼 백색화 블록(302)에 의해 생성된 비트 스트림의 일부를 이용함으로써, 맞춤 제작된 디코더는 내장형 손실 코덱의 품질과 원 PCM 샘플의 수학적 무손실 디코딩의 품질 사이의 중간 품질을 가진 출력 신호를 생성할 수 있다. 이 중간 품질은 잔류 신호의 파워에 따라 다르며, 상기 단락들에서 설명된 방식들 중 하나에서 제어된다. 그와 같은 디코더는 무손실 디코더(403)와 가산기(404)를 포함하지 않을 수 있으며, 비트 스트림(316/408)을 처리하지 않을 것이다.
하나 이상의 중간 품질 신호의 발생을 지원하기 위하여 스펙트럼 백색화 정보(311)의 계층화 구성이 가능하다. 이에 의해서 손실 코덱(최하위 품질)과 원 PCM 샘플(최고위 품질)에 의해 정해지는 범위에서 임의 수의 중간 품질 레벨을 가진 코덱이 특정될 수 있다. 이 여러 가지 품질 레벨은 변환가능(scalable) 비트 스트림을 제공하도록 구성될 수 있다.
구현예
본 발명의 예시적인 실시예는 mp3 표준에 기초한다. 도 5에는 mp3 컴플라이언트(compliant) 인코더의 블록도가 도시되어 있다. 도 3에서는 도 5의 mp3 인코더(비트 스트림 또는 파일 포맷에 따라서는 MUX(507)는 제외될 수 있음)는 손실 인코더 블록(301)의 일부이다.
원 입력 신호(SPCM)는 다상 필터 뱅크 & 데시메이터(503), 분할 & MDCT(504) 및 비트 할당 및 양자화기(505)를 통해 멀티플렉서(507)에 입력된다. 입력 신호(SPCM)는 또한 FFT 스테이지 또는 단계(501)를 통해 단계/스테이지(504)와 양자화기(505)에서의 분할(또는 윈도윙(windowing))을 제어하는 심리 음향 분석부(502)에 입력된다. 또한 비트 할당 및 양자화기(505)는 부수 정보 인코더(506)를 통해 멀티플렉서(507)에 입력되는 부수 정보(515)를 제공하며, 멀티플렉서(507)는 신호(517)를 출력한다.
x는 블록(504)의 출력 벡터(513)로부터의, 즉 mp3를 위한 MDCT 영역에서의 개별적인 임의의 원 변환 계수를 나타내고,
Figure 112008076552715-PCT00002
는 출력 신호(517 또는 309)의 일부인 비트 스트림(514)에 의해 표현되고 인코딩되는 이 계수의 양자화 형태를 나타낸다고 하자. 비트 스트림(309/517) 이외도 MDCT 계수(513)의 원 벡터는 스펙트럼 백색화 블록(302)으로 보내진다. 따라서 신호(310)는 신호(513)와 선택적으로는 mp3 디코더로부터의 부가적인 유용한 부수 정보를 포함한다. 스펙트럼 백색화 블록(302)에서는 백색 에러 플로어, 즉 스펙트럼 평탄(백색) 에러 스펙트럼(
Figure 112008076552715-PCT00003
)을 얻기 위하여 mp3 코덱의 에러(
Figure 112008076552715-PCT00004
)는 제2 양자화기에 의해 양자화된다. 따라서 스펙트럼 백색화 블록에 적용될 비트 할당은
Figure 112008076552715-PCT00005
(여기서 E는 기대값)가 일정이라는 조건이 충족되도록 제어되어야 한다.
스펙트럼 백색화 양자화기에 있어서는 공지의 양자화 기법, 예컨대 스칼라 또는 래티스(lattice) 양자화와 이에 이어지는 엔트로피 코딩, 또는 최적화된(학습된) 고정 엔트로피 스칼라 또는 벡터 양자화가 이용될 수 있다. 스펙트럼 계수의 원 mp3 양자화기의 파라미터 값에 따라서 스펙트럼 백색화 양자화기가 선택되면 최적의 결과가 예상된다. 즉, 스펙트럼 백색화 양자화기는 조건적 양자화기이어야 한다.
주파수 및 시간 영역에서의 상관해제
이 실시예는 "시간 영역 상관해제"절과 "주파수 영역 상관해제"절에 설명된 특성들을 조합한 것이다. 상관해제는 주파수 영역과 시간 영역에서 동작하는 2개의 서브 시스템으로 분할된다.
도 6에 도시된 인코딩에서, 손실 인코더(601)는 적응 또는 고정 비트 할당을 가지고 변환 계수를 양자화하기 전에 원 신호(SPCM)(또는 그 부대역 신호)의 변환을 이용한다. 다음에서는 인코더(601)는 일반성을 잃지 않고 주파수 변환을 이용하는 것으로 가정한다. 결합된 비트 스트림(625)의 내장 역방향 양립 손실 신호 부분(612)을 생성한 후에, 변환 영역에서 인코더(601)의 에러 신호를 결정하고 이들 에러 계수의 추가적인 양자화를 수행하여 인코딩될 확장 데이터 신호의 연속값에 대해 손실 디코더의 입력 에러 스펙트럼보다 스펙트럼이 더 평탄 즉 더 백색인 에러 플로어를 달성하기 위하여 스펙트럼 백색화 블록(602)이 적용된다. 스펙트럼 백색화 블록은 적어도 원 변환 계수(613)와 양자화된 변환 계수(612)를 입력 신호로서 필요로 한다.
손실 인코더의 출력 비트 스트림(612)과 스펙트럼 백색화 블록(602)으로부터의 대응 부가 정보(614)는 손실 및 백색화 디코더 블록(603)과 멀티플렉서(610)에 공급된다. 그 도출된 시간 영역 신호(615)는 원 신호(SPCM)의 적당히 지연된 형태(616)로부터 감산되어(605) 잔류 신호(617)를 생성한다.
잔류 신호(617)의 연속한 샘플들 간의 여전히 남아있는 약한 상관은 선형 예측 필터(607)에서 제거된다. 손실 및 백색화 디코더 블록(603)으로부터 추출된 부수 정보(상기 예 참조, 예컨대 에러 스펙트럼의 포락선)(618)는 필터 적응 블록(606)에서 이용되어 필터(607)에 적용될 최적 필터 계수 세트(621)를 결정한다. 예측 필터링 및 감산(608)의 목적은 평탄 또는 백색 스펙트럼을 가진 완전 상관해제 출력 신호(623)를 생성하는 것이다. 이 잔류 신호는 무손실 확장 스트림(624)을 출력하는 무손실 인코더(609)를 통과한다. 선택적으로 필터 적응 블록(606)으로부터의 부수 정보(상기 예 참조, 예컨대 신호 파워)(620)는 인코더(609)를 제어하는데 이용될 수 있다. 예측 필터 설정에 대한 블록(606)으로부터의 정보는 선택적으로 멀티플렉서(610)에 보내진다. 대응하는 정보 스트림(619)은 부수 정보(618)를 이용하지 않는 시스템보다 데이터 전송률이 항상 작다.
멀티플렉서(610)는 부분적 비트 스트림(612, 614, 619, 624)을 조합하여 출력 신호(625)를 구성하며, 여러 가지 파일 포맷 또는 비트 스트림 포맷을 생성할 수 있다.
도 7에 도시된 디코딩에서, 수신된 비트 스트림(625)은 디멀티플렉서(701)에 의해 개별적인 신호 계층(709, 710, 711, 712)으로 분할된다. 내장 손실 비트 스트림(709)과 스펙트럼 백색화 비트 스트림(710) 모두 손실 및 백색화 디코더(702)에 공급된다. 그 손실 또는 중간 품질 시간 영역 출력 신호(719)는 인코딩에서 손실 또는 중간 품질 신호(615)의 비트 완전 복제이다.
또한 디코더(702)는 필터 적응 블록(703)에 부수 정보(713)를 공급한다. 이 부수 정보와 (도 6의 신호(619)에 대응하는) 임의의 선택적 비트 스트림 성분(711)으로부터, 대응하는 인코딩 블록(606)에서와 똑 같이 필터 적응이 실시된다.
무손실 디코더(704)는 무손실 확장 비트 스트림(712)으로부터, 선택적으로는 필터 적응 블록(703)에 의해 출력된 (도 6의 부수 정보(620)에 대응하는) 부수 정보(715)로부터의 입력을 수신하여 (부분적으로) 상관해제된 잔류 신호(717)(도 6의 신호(623)에 대응함)를 생성한다. 이 신호는 가산기(705)와, 블록(703)에 의해 제공된 필터 계수(714)에 의해 제어되는 예측 필터(706)를 포함하는 역 상관해제 필터에 공급되어 잔류 신호(617)의 비트 완전 복제(718)를 생성한다. 손실 디코딩된 신호(719)와 무손실 디코딩된 잔류 신호(718)를 가산기(707)에서 가산함으로써 최종 출력 신호(SPCM)가 얻어진다. 필터 계수(714)는 필터 계수(621)와 동일하다. 구성 요소(702, 704, 705, 706, 707)의 동작은 대응 구성 요소(603, 609, 608, 607, 605)의 동작과 동일하다.
이들 블록의 기능 내지 동작은 기본적으로 도 1 및 3, 또는 2 및 4에서 설명된 동작에 충실하지만, 주파수 영역과 시간 영역에서 적용될 상관해제의 방식과 량의 제어에 관해서 차이가 있다.
주파수 영역 상관해제와 시간 영역 상관해제 간의 균형을 제어하는 한 가지 방법은 비트 스트림의 손실부와 스펙트럼 백색화부의 합산 데이터 전송률을 제한하는 것이다. 비트 스트림의 이들 두 성분의 데이터 전송률에 일정한 상한이 있다면 스펙트럼 백색화는 에러 신호의 상관해제 작업의 일정 부분만을 수행할 수 있다. 즉, 시간 영역 잔류 신호(617)는 여전히 일정량의 상관을 나타낼 것이다. 이 나머지 상관은 "시간 영역 상관해제"절에서 설명된 바와 같이 선형 예측 필터링과, 손실 & 백색화 디코더로부터 얻어진 정보를 이용하는 다운스트림 시간 영역 상관해제에 의해 제거된다.
다른 방법은 주파수 영역 상관해제만을 이용하여 잔류 신호로부터 장기 상관, 즉 주파수 영역이 좁고(즉 '뾰족하고') 잔류 신호의 색조 성분에 대응하는 신호의 상관 특성을 제거하는 것이다. 이어서 선형 예측 필터링에 의한 시간 영역 상관해제는 최적화되어 잔류 신호로부터 나머지 단기 상관을 제거하는데 이용된다. 이에 의해서 바람직하게는 특정의 최적 동작점들에서 상관해제 기법 모두가 이용된다. 그러므로 이러 종류의 처리에 의해서 연산 복잡성이 적으면서 매우 효율적인 인코딩을 달성할 수 있다.
선택적인 실시예
스펙트럼 백색화를 위해 다소간의 비트를 할당함으로써 잔류 신호의 파워를 제어하는 데는 몇 가지 가능성이 있다. 한 가지 옵션은 스펙트럼 백색화 블록(602)에서 양자화량을 변화시키고 시간 영역 무손실 코딩(609)의 고정 설정을 고려함으로써 잔류 신호의 일정 파워에 목표를 맞추는 것이다. 다른 옵션은 시간 영역 잔류 신호의 파워 레벨을 가변시키는 것이다.
손실 인코더(601)와 스펙트럼 백색화 블록(602)에 의해 생성된 비트 스트림의 일부를 이용함으로써, 맞춤 제작된 디코더는 내장형 손실 코덱의 품질과 원 PCM 샘플의 수학적 무손실 디코딩의 품질 사이의 중간 품질을 가진 출력 신호를 생성할 수 있다. 이 중간 품질은 잔류 신호의 파워에 따라 다르며, 상기 단락들에서 설명된 방식들 중 하나에서 제어된다. 그와 같은 디코더는 무손실 디코더(704), 필터 적응 블록(703), 예측 필터(706) 및 가산기(705, 707)를 포함하지 않아도 된다.

Claims (17)

  1. 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(122)을 함께 구성하는 손실 인코딩된 데이터 스트림(lossy encoded data stream : 111)과 무손실 확장 데이터 스트림(lossless extension data stream : 121)을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법으로서,
    상기 소스 신호를 손실 인코딩하는 단계(101) - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(111)을 제공함 -;
    상기 손실 인코딩된 데이터를 손실 디코딩함으로써, 디코딩된 신호(112)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보(115)를 제공하는 단계(102);
    상기 소스 신호의 대응 지연(103) 형태와 상기 디코딩된 신호(112) 간의 차신호(114)를 형성하는 단계(104);
    시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된(105) 필터 계수(118)를 이용하여 상기 차신호를 예측 필터링하는 단계(106, 107);
    상기 상관해제된 차신호(120)를 무손실 인코딩하여 상기 무손실 확장 데이터 스트림(121)을 제공하는 단계(108); 및
    상기 무손실 확장 데이터 스트림을 상기 손실 인코딩된 데이터 스트림과 결 합하여 상기 무손실 인코딩된 데이터 스트림(122)을 형성하는 단계(109)
    를 포함하는 소스 신호 무손실 인코딩 방법.
  2. 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(317)을 함께 구성하는 손실 인코딩된 데이터 스트림(309)과 무손실 확장 데이터 스트림(316)을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법으로서,
    상기 소스 신호를 손실 인코딩하는 단계(301) - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(309)을 제공함 -;
    상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터(311)를 산출하는 단계(302) - 상기 산출은 양자화된 에러의 파워가 본질적으로 모든 주파수에 대해 일정하도록 제어됨 -;
    상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터를 손실 디코딩함으로서 디코딩된 신호(312)를 재구성하는 단계(303);
    상기 소스 신호(SPCM)의 대응 지연(304) 형태와 상기 디코딩된 신호(312) 간의 차신호(314)를 형성하는 단계(305);
    상기 차신호를 무손실 인코딩하여 상기 무손실 확장 데이터 스트림(316)을 제공하는 단계(306); 및
    상기 무손실 확장 데이터 스트림을 상기 손실 인코딩된 데이터 스트림 및 상 기 스펙트럼 백색화 데이터(311)와 결합하여 상기 무손실 인코딩된 데이터 스트림(317)을 형성하는 단계(307)
    를 포함하는 소스 신호 무손실 인코딩 방법.
  3. 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(625)을 함께 구성하는 손실 인코딩된 데이터 스트림(612)과 무손실 확장 데이터 스트림(624)을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법으로서,
    상기 소스 신호를 손실 인코딩하는 단계(601) - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(612)을 제공함 -;
    상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터(614)를 산출하는 단계(602) - 상기 산출은 양자화된 에러의 파워가 본질적으로 모든 주파수에 대해 일정하도록 제어됨 -;
    상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터를 손실 디코딩함으로써, 디코딩된 신호(615)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보(618)를 제공하는 단계(603);
    상기 소스 신호(SPCM)의 대응 지연(604) 형태와 상기 디코딩된 신호(615) 간의 차신호(617)를 형성하는 단계(605);
    시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보 로부터 도출된(606) 필터 계수(621)를 이용하여 상기 차신호를 예측 필터링하는 단계(607, 608);
    상기 상관해제된 차신호(623)를 무손실 인코딩하여 상기 무손실 확장 데이터 스트림(624)을 제공하는 단계(609); 및
    상기 무손실 확장 데이터 스트림을 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터(614)와 결합하여 상기 무손실 인코딩된 데이터 스트림(625)을 형성하는 단계(610)
    를 포함하는 소스 신호 무손실 인코딩 방법.
  4. 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(122)을 함께 구성하는 손실 인코딩된 데이터 스트림(111)과 무손실 확장 데이터 스트림(121)을 이용하여 소스 신호를 무손실 인코딩하기 위한 장치로서,
    상기 소스 신호를 손실 인코딩 - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(111)을 제공함 - 하는 수단(101);
    상기 손실 인코딩된 데이터를 손실 디코딩함으로써, 디코딩된 신호(112)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보(115)를 제공하는 수단(102);
    상기 소스 신호의 대응 지연 형태와 상기 디코딩된 신호(112) 간의 차신호(114)를 형성하는 수단(104, 103);
    시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된 필터 계수(118)를 이용하여 상기 차신호를 예측 필터링하는 수단(105, 106, 107);
    상기 상관해제된 차신호(120)를 무손실 인코딩하여 상기 무손실 확장 데이터 스트림(121)을 제공하는 수단(108); 및
    상기 무손실 확장 데이터 스트림을 상기 손실 인코딩된 데이터 스트림과 결합하여 상기 무손실 인코딩된 데이터 스트림(122)을 형성하는 수단(109)
    을 포함하는 소스 신호 무손실 인코딩 장치.
  5. 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(317)을 함께 구성하는 손실 인코딩된 데이터 스트림(309)과 무손실 확장 데이터 스트림(316)을 이용하여 소스 신호를 무손실 인코딩하기 위한 장치로서,
    상기 소스 신호를 손실 인코딩 - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(309)을 제공함 - 하는 수단(301);
    상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터(311)를 산출하는 수단(302) - 상기 산출은 양자화된 에러의 파워가 본질적으로 모든 주파수에 대해 일정하도록 제어됨 -;
    상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터를 손실 디코딩함으로써 디코딩된 신호(312)를 재구성하는 수단(303);
    상기 소스 신호(SPCM)의 대응 지연 형태와 상기 디코딩된 신호(312) 간의 차신호(314)를 형성하는 수단(305, 304);
    상기 차신호를 무손실 인코딩하여 상기 무손실 확장 데이터 스트림(316)을 제공하는 수단(306); 및
    상기 무손실 확장 데이터 스트림을 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터(311)와 결합하여 상기 무손실 인코딩된 데이터 스트림(317)을 형성하는 수단(307)
    을 포함하는 소스 신호 무손실 인코딩 장치.
  6. 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(625)을 함께 구성하는 손실 인코딩된 데이터 스트림(612)과 무손실 확장 데이터 스트림(624)을 이용하여 소스 신호를 무손실 인코딩하기 위한 장치로서,
    상기 소스 신호를 손실 인코딩 - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(612)을 제공함 - 하는 수단(601);
    상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터(614)를 산출하는 수단(602) - 상기 산출은 양자화된 에러의 파워가 본질적으로 모든 주파수에 대해 일정하도록 제어됨 -;
    상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터를 손실 디코딩함으로써 디코딩된 신호(615)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보(618)를 제공하는 수단(603);
    상기 소스 신호(SPCM)의 대응 지연 형태와 상기 디코딩된 신호(615) 간의 차신호(617)를 형성하는 수단(605, 604);
    시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된 필터 계수(621)를 이용하여 상기 차신호를 예측 필터링하는 수단(606, 607, 608);
    상기 상관해제된 차신호(623)를 무손실 인코딩하여 상기 무손실 확장 데이터 스트림(624)을 제공하는 수단(609); 및
    상기 무손실 확장 데이터 스트림을 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터(614)와 결합하여 상기 무손실 인코딩된 데이터 스트림(625)을 형성하는 수단(610)
    을 포함하는 소스 신호 무손실 인코딩 장치.
  7. 무손실 인코딩된 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(122)을 함께 구성하는 손실 인코딩된 데이터 스트림(111)과 무손실 확장 데이터 스트림(121)으로부터 도출된 무손실 인코딩된 소스 신호 데이터 스트림을 디코딩하기 위한 방법으로서,
    상기 소스 신호가 손실 인코딩 - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(111)을 제공함 - 되고(101);
    상기 손실 인코딩된 데이터가 대응적으로 손실 디코딩됨으로써 표준 디코딩된 신호(SDec)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보(115)가 제공되고(102);
    상기 소스 신호의 대응 지연(103) 형태와 상기 디코딩된 신호(112) 간의 차신호(114)가 형성되고(104);
    시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된(105) 필터 계수(118)를 이용하여 상기 차신호가 예측 필터링되고(106, 107);
    상기 상관해제된 차신호(120)가 무손실 인코딩되어 상기 무손실 확장 데이터 스트림(121)을 제공하고(108);
    상기 무손실 확장 데이터 스트림이 상기 손실 인코딩된 데이터 스트림과 결합되어 상기 무손실 인코딩된 데이터 스트림(122)을 형성하고(109),
    상기 방법은,
    상기 무손실 인코딩된 소스 신호 데이터 스트림(122)을 디멀티플렉싱하여 상기 무손실 확장 데이터 스트림(211)과 상기 손실 인코딩된 데이터 스트림(209)을 제공하는 단계(201);
    상기 손실 인코딩된 데이터 스트림을 손실 디코딩하여 손실 디코딩된 신 호(218)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 상기 부수 정보(212)를 제공하는 단계(202);
    상기 무손실 확장 데이터 스트림을 디코딩하여 상기 상관해제된 차신호(215)를 제공하는 단계(204);
    상기 부수 정보(212)로부터 도출된(203) 필터 계수(214)를 이용하여 상기 상관해제된 차신호의 연속값을 역 상관해제 필터링하는 단계(205, 206); 및
    상기 상관해제 필터링된 차신호(217)를 상기 손실 디코딩된 신호(218)와 결합하여 상기 소스 신호(SPCM)를 재구성하는 단계(207)
    를 포함하는 무손실 인코딩된 소스 신호 데이터 스트림의 디코딩 방법.
  8. 무손실 인코딩된 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(317)을 함께 구성하는 손실 인코딩된 데이터 스트림(309)과 무손실 확장 데이터 스트림(316)으로부터 도출된 무손실 인코딩된 소스 신호 데이터 스트림을 디코딩하기 위한 방법으로서,
    상기 소스 신호가 손실 인코딩 - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(309)을 제공함 - 되고(301);
    상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터(311)가 산출되고(302) - 상기 산출은 양자화된 에러의 파워가 본질적으로 모든 주파수에 대해 일정하도록 제어됨 -;
    상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터가 손실 디코딩됨으로써 디코딩된 신호(312)가 재구성되고(303);
    상기 소스 신호(SPCM)의 대응 지연(304) 형태와 상기 디코딩된 신호(312) 간의 차신호(314)가 형성되고(305);
    상기 차신호가 무손실 인코딩되어 상기 무손실 확장 데이터 스트림(316)을 제공하고(306);
    상기 무손실 확장 데이터 스트림이 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터(311)와 결합되어 상기 무손실 인코딩된 데이터 스트림(317)을 형성하고(307),
    상기 방법은,
    상기 무손실 인코딩된 소스 신호 데이터 스트림(317)을 디멀티플렉싱하여 상기 무손실 확장 데이터 스트림(408)과 상기 손실 인코딩된 데이터 스트림(406)을 제공하는 단계(401);
    상기 스펙트럼 백색화 데이터(407)를 이용하여 상기 손실 인코딩된 데이터 스트림을 손실 디코딩함으로써 손실 디코딩된 신호(409)를 재구성하는 단계(402);
    상기 무손실 확장 데이터 스트림을 디코딩하여 상기 차신호(411)를 제공하는 단계(403);
    상기 차신호(411)를 상기 손실 디코딩된 신호(409)와 결합하여 상기 소스 신 호(SPCM)를 재구성하는 단계(404)
    를 포함하는 무손실 인코딩된 소스 신호 데이터 스트림의 디코딩 방법.
  9. 무손실 인코딩된 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(625)을 함께 구성하는 손실 인코딩된 데이터 스트림(612)과 무손실 확장 데이터 스트림(624)으로부터 도출된 무손실 인코딩된 소스 신호 데이터 스트림을 디코딩하기 위한 방법으로서,
    상기 소스 신호가 손실 인코딩 - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(612)을 제공함 - 되고(601);
    상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터(614)가 산출되고(602) - 상기 산출은 양자화된 에러의 파워가 본질적으로 모든 주파수에 대해 일정하도록 제어됨 -;
    상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터가 손실 디코딩됨으로서 디코딩된 신호(615)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보(618)가 제공되고(603);
    상기 소스 신호(SPCM)의 대응 지연(604) 형태와 상기 디코딩된 신호(615) 간의 차신호(617)가 형성되고(605);
    시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보 로부터 도출된(606) 필터 계수(621)를 이용하여 상기 차신호가 예측 필터링되고(607, 608);
    상기 상관해제된 차신호(623)가 무손실 인코딩되어 상기 무손실 확장 데이터 스트림(624)을 제공하고(609);
    상기 무손실 확장 데이터 스트림이 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터(614)와 결합되어 상기 무손실 인코딩된 데이터 스트림(625)을 형성하고(610),
    상기 방법은,
    상기 무손실 인코딩된 소스 신호 데이터 스트림(625)을 디멀티플렉싱하여 상기 무손실 확장 데이터 스트림(712)과 상기 손실 인코딩된 데이터 스트림(709)을 제공하는 단계(701);
    상기 스펙트럼 백색화 데이터(710)를 이용하여 상기 손실 인코딩된 데이터 스트림을 손실 디코딩함으로써 손실 디코딩된 신호(719)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 상기 부수 정보(713)를 제공하는 단계(702);
    상기 무손실 확장 데이터 스트림을 디코딩하여 상기 상관해제된 차신호(717)를 제공하는 단계(704);
    상기 부수 정보(713)로부터 도출된(703) 필터 계수(714)를 이용하여 상기 상관해제된 차신호의 연속값을 역 상관해제 필터링하는 단계(705, 706); 및
    상기 상관해제 필터링된 차신호(718)를 상기 손실 디코딩된 신호(719)와 결 합하여 상기 소스 신호(SPCM)를 재구성하는 단계(707)
    를 포함하는 무손실 인코딩된 소스 신호 데이터 스트림의 디코딩 방법.
  10. 무손실 인코딩된 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(122)을 함께 구성하는 손실 인코딩된 데이터 스트림(111)과 무손실 확장 데이터 스트림(121)으로부터 도출된 무손실 인코딩된 소스 신호 데이터 스트림을 디코딩하기 위한 장치로서,
    상기 소스 신호가 손실 인코딩 - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(111)을 제공함 - 되고(101);
    상기 손실 인코딩된 데이터가 대응적으로 손실 디코딩됨으로써 표준 디코딩된 신호(SDec)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보(115)가 제공되고(102);
    상기 소스 신호의 대응 지연(103) 형태와 상기 디코딩된 신호(112) 간의 차신호(114)가 형성되고(104);
    시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된(105) 필터 계수(118)를 이용하여 상기 차신호가 예측 필터링되고(106, 107);
    상기 상관해제된 차신호(120)가 무손실 인코딩되어 상기 무손실 확장 데이터 스트림(121)을 제공하고(108);
    상기 무손실 확장 데이터 스트림이 상기 손실 인코딩된 데이터 스트림과 결합되어 상기 무손실 인코딩된 데이터 스트림(122)을 형성하고(109),
    상기 장치는,
    상기 무손실 인코딩된 소스 신호 데이터 스트림(122)을 디멀티플렉싱하여 상기 무손실 확장 데이터 스트림(211)과 상기 손실 인코딩된 데이터 스트림(209)을 제공하는 수단(201);
    상기 손실 인코딩된 데이터 스트림을 손실 디코딩하여 손실 디코딩된 신호(218)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 상기 부수 정보(212)를 제공하는 수단(202);
    상기 무손실 확장 데이터 스트림을 디코딩하여 상기 상관해제된 차신호(215)를 제공하는 수단(204);
    상기 부수 정보(212)로부터 도출된(203) 필터 계수(214)를 이용하여 상기 상관해제된 차신호의 연속값을 역 상관해제 필터링하는 수단(205, 206); 및
    상기 상관해제 필터링된 차신호(217)를 상기 손실 디코딩된 신호(218)와 결합하여 상기 소스 신호(SPCM)를 재구성하는 수단(207)
    을 포함하는 무손실 인코딩된 소스 신호 데이터 스트림의 디코딩 장치.
  11. 무손실 인코딩된 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(317)을 함께 구성하는 손실 인코딩된 데이터 스트림(309)과 무손실 확장 데이터 스트 림(316)으로부터 도출된 무손실 인코딩된 소스 신호 데이터 스트림을 디코딩하기 위한 장치로서,
    상기 소스 신호가 손실 인코딩 - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(309)을 제공함 - 되고(301);
    상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터(311)가 산출되고(302) - 상기 산출은 양자화된 에러의 파워가 본질적으로 모든 주파수에 대해 일정하도록 제어됨 -;
    상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터가 손실 디코딩됨으로써 디코딩된 신호(312)가 재구성되고(303);
    상기 소스 신호(SPCM)의 대응 지연(304) 형태와 상기 디코딩된 신호(312) 간의 차신호(314)가 형성되고(305);
    상기 차신호가 무손실 인코딩되어 상기 무손실 확장 데이터 스트림(316)을 제공하고(306);
    상기 무손실 확장 데이터 스트림이 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터(311)와 결합되어 상기 무손실 인코딩된 데이터 스트림(317)을 형성하고(307),
    상기 장치는,
    상기 무손실 인코딩된 소스 신호 데이터 스트림(317)을 디멀티플렉싱하여 상 기 무손실 확장 데이터 스트림(408)과 상기 손실 인코딩된 데이터 스트림(406)을 제공하는 수단(401);
    상기 스펙트럼 백색화 데이터(407)를 이용하여 상기 손실 인코딩된 데이터 스트림을 손실 디코딩함으로써 손실 디코딩된 신호(409)를 재구성하는 수단(402);
    상기 무손실 확장 데이터 스트림을 디코딩하여 상기 차신호(411)를 제공하는 수단(403); 및
    상기 차신호(411)를 상기 손실 디코딩된 신호(409)와 결합하여 상기 소스 신호(SPCM)를 재구성하는 수단(404)
    을 포함하는 무손실 인코딩된 소스 신호 데이터 스트림의 디코딩 장치.
  12. 무손실 인코딩된 소스 신호(SPCM)의 무손실 인코딩된 데이터 스트림(625)을 함께 구성하는 손실 인코딩된 데이터 스트림(612)과 무손실 확장 데이터 스트림(624)으로부터 도출된 무손실 인코딩된 소스 신호 데이터 스트림을 디코딩하기 위한 장치로서,
    상기 소스 신호가 손실 인코딩 - 상기 손실 인코딩은 상기 손실 인코딩된 데이터 스트림(612)을 제공함 - 되고(601);
    상기 손실 인코딩된 데이터 스트림의 양자화된 계수와 상기 손실 인코딩으로부터 수신된 대응하는 아직 양자화되지 않은 계수로부터, 원 계수의 미세 양자화를 표현하는 스펙트럼 백색화 데이터(614)가 산출되고(602) - 상기 산출은 양자화된 에러의 파워가 본질적으로 모든 주파수에 대해 일정하도록 제어됨 -;
    상기 스펙트럼 백색화 데이터를 이용하여 상기 손실 인코딩된 데이터가 손실 디코딩됨으로써 디코딩된 신호(615)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 부수 정보(618)가 제공되고(603);
    상기 소스 신호(SPCM)의 대응 지연(604) 형태와 상기 디코딩된 신호(615) 간의 차신호(617)가 형성되고(605);
    시간 영역에서 상기 차신호의 연속값을 상관해제하기 위하여 상기 부수 정보로부터 도출된(606) 필터 계수(621)를 이용하여 상기 차신호가 예측 필터링되고(607, 608);
    상기 상관해제된 차신호(623)가 무손실 인코딩되어 상기 무손실 확장 데이터 스트림(624)을 제공하고(609);
    상기 무손실 확장 데이터 스트림이 상기 손실 인코딩된 데이터 스트림 및 상기 스펙트럼 백색화 데이터(614)와 결합되어 상기 무손실 인코딩된 데이터 스트림(625)을 형성하고(610),
    상기 장치는,
    상기 무손실 인코딩된 소스 신호 데이터 스트림(625)을 디멀티플렉싱하여 상기 무손실 확장 데이터 스트림(712)과 상기 손실 인코딩된 데이터 스트림(709)을 제공하는 수단(701);
    상기 스펙트럼 백색화 데이터(710)를 이용하여 상기 손실 인코딩된 데이터 스트림을 손실 디코딩하여 손실 디코딩된 신호(719)를 재구성하고 시간 영역 예측 필터를 제어하기 위한 상기 부수 정보(713)를 제공하는 수단(702);
    상기 무손실 확장 데이터 스트림을 디코딩하여 상기 상관해제된 차신호(717)를 제공하는 수단(704);
    상기 부수 정보(713)로부터 도출된(703) 필터 계수(714)를 이용하여 상기 상관해제된 차신호의 연속값을 역 상관해제 필터링하는 수단(705, 706); 및
    상기 상관해제 필터링된 차신호(718)를 상기 손실 디코딩된 신호(719)와 결합하여 상기 소스 신호(SPCM)를 재구성하는 수단(707)
    을 포함하는 무손실 인코딩된 소스 신호 데이터 스트림의 디코딩 장치.
  13. 제1항, 제3항, 제7항 또는 제9항 중 어느 한 항에 따른 방법 혹은 제4항, 제6항, 제10항 또는 제12항 중 어느 한 항에 따른 장치에 있어서,
    예측 필터 설정 데이터(116, 619)가 상기 부수 정보(115, 618)로부터 도출되어 상기 무손실 인코딩된 데이터 스트림(122, 625)에 포함되거나, 부수 정보 예측 필터 설정 데이터(210, 711)가 상기 무손실 인코딩된 데이터 스트림(122, 625)으로부터 선택되어 상기 예측 필터링 계수(214, 714)를 발생(203, 703)시키는데 이용되는 방법 또는 장치.
  14. 제1항, 제3항, 제7항, 제9항 또는 제13항 중 어느 한 항에 따른 방법 혹은 제4항, 제6항, 제10항, 제12항 또는 제13항 중 어느 한 항에 따른 장치에 있어서,
    예측 잔류 신호의 표준 편차(117, 213; 620, 715)는 각각 상기 무손실 인코딩(108, 609)을 파라미터로 나타내거나 상기 무손실 디코딩(204, 704)을 제어하는데 이용되는 방법 또는 장치.
  15. 제2항 또는 제8항에 따른 방법 혹은 제5항 또는 제11항에 따른 장치에 있어서,
    상기 손실 디코더(303, 402)로부터의 부수 정보(315, 410)는 각각 상기 무손실 인코딩(306) 또는 상기 무손실 디코딩(403)을 제어하는데 이용되는 방법 또는 장치.
  16. 제8항 또는 제9항에 따른 방법 혹은 제11항 또는 제12항에 따른 장치에 있어서,
    상기 무손실 확장 데이터 스트림(408, 712)은 평가되지 않고, 상기 스펙트럼 백색화 데이터(407, 710)는 상기 손실 인코딩된 데이터 스트림(406, 709)과 함께 이용되어 상기 소스 신호의 품질보다 낮은 중간 품질을 가진 출력 신호를 디코딩(402, 702)하는 방법 또는 장치.
  17. 제1항 내지 제3항 또는 제13항 내지 제15항 중 어느 한 항의 방법에 따라 인코딩된 디지털 신호를 포함 또는 저장하거나, 이를 기록하는 예를 들어 광디스크 등의 저장 매체.
KR1020087027070A 2006-05-05 2008-11-04 소스 신호에 대한 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림으로부터 상기 소스 신호에 대한 무손실 인코딩된 데이터 스트림을 생성하기 위해 상기 소스 신호를 무손실 인코딩하기 방법 및 장치 KR101473016B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP06113596A EP1852849A1 (en) 2006-05-05 2006-05-05 Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
EP06113596.8 2006-05-05

Publications (2)

Publication Number Publication Date
KR20090007396A true KR20090007396A (ko) 2009-01-16
KR101473016B1 KR101473016B1 (ko) 2014-12-15

Family

ID=36589352

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087027070A KR101473016B1 (ko) 2006-05-05 2008-11-04 소스 신호에 대한 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림으로부터 상기 소스 신호에 대한 무손실 인코딩된 데이터 스트림을 생성하기 위해 상기 소스 신호를 무손실 인코딩하기 방법 및 장치

Country Status (8)

Country Link
US (1) US8326618B2 (ko)
EP (3) EP1852849A1 (ko)
JP (1) JP5215994B2 (ko)
KR (1) KR101473016B1 (ko)
CN (1) CN101432802B (ko)
BR (1) BRPI0711272A2 (ko)
PT (1) PT2016583E (ko)
WO (1) WO2007128662A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7620673B2 (en) * 2005-09-19 2009-11-17 The United States Of America As Represented By The Secretary Of The Air Force Complimentary discrete fourier transform processor
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
EP1881485A1 (en) * 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
US20090198500A1 (en) * 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
WO2009081315A1 (en) * 2007-12-18 2009-07-02 Koninklijke Philips Electronics N.V. Encoding and decoding audio or speech
BRPI0910511B1 (pt) * 2008-07-11 2021-06-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para decodificar e codificar um sinal de áudio
JP5551694B2 (ja) 2008-07-11 2014-07-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 多くのスペクトルエンベロープを計算するための装置および方法
BR112013012814B1 (pt) * 2010-10-26 2019-10-08 Nec Corporation Dispositivo de decodificação de vídeo e método de decodificação de vídeo
JP6000854B2 (ja) 2010-11-22 2016-10-05 株式会社Nttドコモ 音声符号化装置および方法、並びに、音声復号装置および方法
CN102446509B (zh) * 2011-11-22 2014-04-09 中兴通讯股份有限公司 增强抗丢包的音频编解码方法及系统
GB201210373D0 (en) * 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
CN103544957B (zh) * 2012-07-13 2017-04-12 华为技术有限公司 音频信号的比特分配的方法和装置
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP3046105B1 (en) 2013-09-13 2020-01-15 Samsung Electronics Co., Ltd. Lossless coding method
US9779739B2 (en) 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
CA2945791A1 (en) * 2014-04-17 2015-10-22 Audimax, Llc Systems, methods and devices for electronic communications having decreased information loss
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
GB2624686A (en) * 2022-11-25 2024-05-29 Lenbrook Industries Ltd Improvements to audio coding
CN118522296A (zh) * 2023-02-17 2024-08-20 华为技术有限公司 有损编解码器和无损编解码器之间的切换方法和装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5794179A (en) 1995-07-27 1998-08-11 Victor Company Of Japan, Ltd. Method and apparatus for performing bit-allocation coding for an acoustic signal of frequency region and time region correction for an acoustic signal and method and apparatus for decoding a decoded acoustic signal
US6154484A (en) * 1995-09-06 2000-11-28 Solana Technology Development Corporation Method and apparatus for embedding auxiliary data in a primary data signal using frequency and time domain processing
JPH10105200A (ja) 1996-09-26 1998-04-24 Toshiba Corp 音声符号化/復号化方法
DE19742201C1 (de) * 1997-09-24 1999-02-04 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren von Audiosignalen
WO1999053677A2 (en) * 1998-04-09 1999-10-21 Koninklijke Philips Electronics N.V. Lossless encoding/decoding in a transmission system
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
KR100908114B1 (ko) * 2002-03-09 2009-07-16 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
JP2003280694A (ja) 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
US7275036B2 (en) 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
DE10217297A1 (de) * 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7328150B2 (en) * 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
JP4293005B2 (ja) 2004-02-04 2009-07-08 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
EP2270774B1 (en) 2004-03-25 2016-07-27 DTS, Inc. Lossless multi-channel audio codec
US8086465B2 (en) * 2007-03-20 2011-12-27 Microsoft Corporation Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms

Also Published As

Publication number Publication date
CN101432802A (zh) 2009-05-13
JP2009536364A (ja) 2009-10-08
EP2016583B1 (en) 2012-08-15
EP2453437A2 (en) 2012-05-16
WO2007128662A1 (en) 2007-11-15
CN101432802B (zh) 2015-04-01
US8326618B2 (en) 2012-12-04
US20090177478A1 (en) 2009-07-09
EP2453437A3 (en) 2012-07-18
EP2016583A1 (en) 2009-01-21
PT2016583E (pt) 2012-09-25
BRPI0711272A2 (pt) 2011-11-08
JP5215994B2 (ja) 2013-06-19
EP1852849A1 (en) 2007-11-07
KR101473016B1 (ko) 2014-12-15

Similar Documents

Publication Publication Date Title
KR101473016B1 (ko) 소스 신호에 대한 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림으로부터 상기 소스 신호에 대한 무손실 인코딩된 데이터 스트림을 생성하기 위해 상기 소스 신호를 무손실 인코딩하기 방법 및 장치
KR101397736B1 (ko) 유손실 인코딩 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하는 소스 신호의 무손실 인코딩을 위한 방법및 장치
RU2765565C2 (ru) Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала
TWI466106B (zh) 音訊或視訊編碼器、音訊或視訊解碼器及用以利用可變預測方向來處理多頻道音訊或視訊信號的相關方法
KR100469002B1 (ko) 오디오 코딩 방법 및 장치
JP6321797B2 (ja) 符号化装置、符号化方法およびコンピュータプログラム
EP2981956B1 (en) Audio processing system
US7742912B2 (en) Method and apparatus to encode and decode multi-channel audio signals
JP6289613B2 (ja) オブジェクト特有時間/周波数分解能を使用する混合信号からのオーディオオブジェクト分離
KR20090083069A (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
JP2019506633A (ja) 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法
US7725324B2 (en) Constrained filter encoding of polyphonic signals
EP1639580B1 (en) Coding of multi-channel signals

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee