KR20080107428A - 신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩모듈 - Google Patents

신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩모듈 Download PDF

Info

Publication number
KR20080107428A
KR20080107428A KR1020087023295A KR20087023295A KR20080107428A KR 20080107428 A KR20080107428 A KR 20080107428A KR 1020087023295 A KR1020087023295 A KR 1020087023295A KR 20087023295 A KR20087023295 A KR 20087023295A KR 20080107428 A KR20080107428 A KR 20080107428A
Authority
KR
South Korea
Prior art keywords
coding
mode
module
decoding
envelope
Prior art date
Application number
KR1020087023295A
Other languages
English (en)
Other versions
KR101364979B1 (ko
Inventor
발라즈스 코베시
슈테판 라고트
Original Assignee
프랑스 텔레콤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프랑스 텔레콤 filed Critical 프랑스 텔레콤
Publication of KR20080107428A publication Critical patent/KR20080107428A/ko
Application granted granted Critical
Publication of KR101364979B1 publication Critical patent/KR101364979B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호 엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩 모듈
신호 엔벨로프의 이진 코딩 모듈(402)은 가변 길이 제1 모드를 코딩하기 위한 코딩 모듈(502)을 포함한다. 본 발명에 따르면, 제1 모드를 코딩하기 위한 코딩 모듈은 엔벨로프 포화 검출기를 포함하고, 상기 코딩 모듈(402)은 제1 모드를 코딩하기 위한 모딩 모듈(502)과 병렬로 제2 모드를 코딩하기 위한 제2 코딩 모듈(503), 그리고 코드 길이 기준 및 엔벨로프 포화 검출기로부터의 결과에 따라 두 코딩 모드들 중 하나를 선택하도록 제공된 모드 선택기(504)를 더 포함한다. 가청 주파수 신호들의 변환 코딩에 적용된다.

Description

신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호 엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩 모듈 {METHOD FOR BINARY CODING OF QUANTIZATION INDICES OF A SIGNAL ENVELOPE, METHOD FOR DECODING A SIGNAL ENVELOPE AND CORRESPONDING CODING AND DECODING MODULES}
본 발명은 신호 엔벨로프를 정의하는 양자화 인덱스들의 이진 코딩 방법에 관한 것이다. 또한, 본 발명은 상기 방법을 구현하기 위한 이진 코딩 모듈에 관한 것이다. 또한, 본 발명은 본 발명의 이진 코딩 방법 및 이진 코딩 모듈에 의해 코딩된 엔벨로프를 디코딩하기 위한 방법 및 모듈에 관한 것이다.
본 발명은 가청 주파수 음성, 음악 등의 신호들과 같은 디지털 신호들을 전송 및 저장하는데 특히 유용한 애플리케이션을 제공한다. 본 발명의 코딩 방법 및 코딩 모듈은 가청 주파수 신호들의 코딩을 변환하기에 더욱 세밀하게 적응된다.
가청 주파수 음성, 음악 등의 신호들을 디지털화하고 압축하기 위한 다양한 기법들이 존재한다. 가장 폭넓게 사용되는 방법들은:
ㆍPCM 및 ADPCM 코딩과 같은 "파형 코딩" 방법들;
ㆍ코드 여기 선형 예측(CELP) 코딩과 같은 "파라미터 분석-합성 코딩" 방법들;
ㆍ"하위대역 또는 변환 지각 코딩" 방법들이다.
가청 주파수 신호들을 코딩하기 위한 이러한 전통적인 기법들에 관해서는 "Speech Coding and Synthesis"(편집인 W.B.Kleijn, K.K.Paliwal, 엘스비어, 1995)에 기재되어 있다.
전술된 바와 같이, 본 발명은 변환 코딩 기법들에 본질적으로 관심을 갖는다.
ITU-T 권고안 G.722.1 "Coding at 24 kbit/s and 32 kbit/s for hands-free operation in systems with low frame loss"(1999년 9월)은 광대역으로서 언급되는 50 헤르쯔(Hz) 내지 7000Hz의 통과 대역에서 16 킬로헤르쯔(kHz) 샘플링 주파수 및 초당 24 킬로비트 또는 32 kbit/s의 비트율로 음성 또는 음악 오디오 신호들을 압축하기 위한 변환 코더를 기술한다. 전술된 권고안에서 설정된 바와 같이, 도 1은 연관된 코딩 방식을 나타낸다.
상기 도면이 나타내는 바와 같이, G.722.1 코더는 변조 래핑 변환(MLT:the modulated lapped transform)에 기초한다. 프레임 길이는 20 밀리초(ms)이고, 프레임은 N=320 샘플들을 포함한다.
MLT 변환, 즉 말바 오버랩(Malvar overlap)을 이용한 변조 변환은 MDCT(modified discrete cosine transform)의 변형이다.
도 2는 MDCT의 원리를 개략적으로 나타낸다.
현재 프레임과 후속 프레임의 샘플들을 포함하는 길이 L=2N의 신호 x(n)의 MDCT 변환 X(m)는 하기와 같이 정의되고, 여기서 m=0, ..., N-1이다:
Figure 112008067053957-PCT00001
상기 공식에서, 사인 항은 도 2에 도시된 윈도잉에 대응한다. 그러므로, X(m)의 계산은 사인파 윈도잉을 이용한 로컬 코사인 기반으로 x(n)을 투영하는 것에 대응한다. 고속 MDCT 계산 알고리즘들이 존재한다(예컨대 P.Duhamel, Y.Mahieux, J.P.Petit에 의해 출간된 "a fast algorithm for the implementation of filter banks based on time domain aliasing cancellation"(ICASSP, vol.3, pp.2209-2212, 1991년) 참조).
변환의 스펙트럼 엔벨로프를 계산하기 위하여, MDCT에 의해 도출된 값들 X(0), ..., X(N-1)이 20 계수들의 16 하위대역들로 그룹핑된다. 처음의 14 하위대역들(14×20=280 계수들)만이 주파수 대역 0-7000 Hz에 대응하여 양자화 및 코딩되며, 7000-8000 대역(40 계수들)은 무시된다.
j번째 하위대역에 대한 스펙트럼 엔벨로프 값은 하기와 같이 알고리즘 도메인에서 정의되고, 이때 j=0, ..., 13이고, 항 ε은 log2(0)을 회피하기 위해 제공된다:
Figure 112008067053957-PCT00002
그러므로, 상기 엔벨로프는 하위대역당 제곱 평균 값에 대응한다.
그런 다음에, 스펙트럼 엔벨로프는 하기의 방식으로 양자화된다:
ㆍ값들의 집합
log_rms = {log_rms(0) log_rms(1) ... log_rms(13)}은 먼저 하기에 이르고:
rms_index = {rms_index(0) rms_index(1) ... rms_index(13)}
이때, 인덱스들 rms_index(j)는 log_rms(j)×0.5(j=0, ..., 13)에 가장 가까운 정수에 이른다.
그러므로, 양자화 단계는 20×log10(20.5)=3.0103...dB이다. 획득된 값들은 하기에 의해 경계를 갖는다:
j=0일 경우 3 ≤ rms_index(0) ≤ 33 (동적 범위 31×3.01=93.31dB); 및
j=1, ..., 13일 경우 -6 ≤ rms_index(j) ≤ 33 (동적 범위 40×3.01=120.4dB).
그런 다음에, 하나의 하위대역 및 선행 하위대역의 스펙트럼 엔벨로프의 rms 값들 사이의 차이를 계산함으로써, 최종 13개 대역들에 대한 rms_index 값들은 차동 인덱스들로 변환된다:
diff_rms_index(j) = rms_index(j) - rms_index(j-1) (j=1, ..., 13)
이러한 차동 인덱스들은 또한 하기에 의해 경계를 갖는다:
-12 ≤ diff_rms_index(j) ≤ 11 (j=1, ..., 13)
하기에서, "양자화 인덱스들의 범위"란 표현은 이진 코딩에 의해 표현될 수 있는 인덱스들의 범위를 지칭한다. G.722.1 코더에서, 차동 인덱스들의 범위는 범위 [-11, 12]에 제한된다. 따라서, G.722.1 코더의 범위는 -12 ≤ rms_index(j) - rms_index(j-1) ≤ 11일 경우 rms_index(j) 및 rms_index(j-1) 사이의 차이들을 코 딩하기에 "충분"한 것으로 언급된다.
그렇지 않다면, G.722.1 코더의 범위는 "불충분"한 것으로 언급된다. 따라서, 스펙트럼 엔벨로프 코딩은 두 하위대역들 사이의 rms 차이가 12×3.01=36.12 데시벨(dB)을 초과하자마자 포화에 도달한다.
양자화 인덱스 rms_index(0)은 G.722.1 코더에서 5 비트들로 전송된다. 차동 양자화 인덱스들 diff_rms_index(j)(j=1, ..., 13)은 허프만 코딩에 의해 코딩되는데, 각각의 변수는 자신의 고유 허프만 표를 갖는다. 그러므로, 상기 코딩은 가변 길이의 엔트로픽 코딩이고, 그 원리는 짧은 비트들의 코드를 최고 확률 차동 인덱스 값들에 할당하는 것이고, 여기서 최저 확률 차동 양자화 인덱스 값들은 더 긴 코드를 갖는다. 이러한 타입의 코딩은 평균 비트율에 있어서 매우 효율적이며, G.722.1에서 스펙트럼 엔벨로프를 코딩하기 위해 사용되는 총 비트들 수는 평균적으로 대략 50개 비트들임을 명심해야 한다. 그러나, 하기에서 명확하게 되는 바와 같이, 최악의 경우의 시나리오가 통제 밖에 있다.
도 3의 표는 각각의 하위대역에 대하여 최단 코드(최소)의 길이, 그에 따른 최고 확률 값(최선의 경우)의 길이, 그리고 최장 코드(최대)의 길이, 그에 따른 최저 확률 값(최악의 경우)의 길이를 제공한다. 상기 표에서, 후속 하위대역들과 대조적으로, 제1 하위대역(j=0)은 5 비트의 고정 길이를 갖는다.
이러한 코드 길이 값들에 의해, 최선의 경우, 스펙트럼 엔벨로프를 인코딩하는 것은 39 비트들(1.95 kbit/s)을 요구하고, 이론적으로 최악의 경우, 190개의 비트들(9.5 kbit/s)을 요구한다는 것이 발견된다.
G.722.1 코더에서, 스펙트럼 엔벨로프의 양자화 인덱스들을 코딩한 이후에 남는 비트들은 양자화된 엔벨로프에 의해 정규화되는 MDCT 계수들을 코딩하기 위해 분배된다. 하위대역들에서 비트들 할당은 본 발명과 무관한 카테고리화 프로세스에 의해 실행되며 여기에서는 상세히 기술되지 않는다. G.722.1의 잔여 프로세스는 동일한 이유로 상세히 기술되지 않는다.
G.722.1 코더에서 MDCT 스펙트럼 엔벨로프를 코딩하는 것은 여러 단점들을 갖는다.
전술된 바와 같이, 가변 길이 코딩은 최악의 경우에서 스펙트럼 엔벨로프를 코딩하기 위해 매우 많은 수의 비트들을 사용하도록 유도할 수 있다. 또한, 높은 스펙트럼 불균형의 일부 신호들, 예컨대 고립된 사인파들에 대한 포화 위험에서 차동 코딩은 동작하지 않는데, 그 이유는 범위 ±36.12dB이 rms 값들 사이의 차이들의 동적 범위를 모두 나타낼 수 없기 때문이라는 것이 상기에서 지적되고 있다.
따라서, 본 발명의 내용에 의해 해결될 하나의 기술적 문제점은, 가변 길이 코딩 단계를 포함하고 심지어 최악의 경우에서도 코딩 길이를 제한된 수의 비트들로 최소화하는 신호 엔벨로프를 정의하는 양자화 인덱스들의 이진 코딩 방법을 제안하는 것이다.
또한, 본 발명에 의해 해결될 다른 문제점은 사인파들과 같이 높은 rms 값을 갖는 신호들에 대한 포화 위험을 관리하는 것이다.
본 발명에 따르면, 상기 기술적 문제점에 대한 솔루션은 제1 코딩 모드가 엔벨로프 포화 검출을 포함하는 것을 포함하고, 상기 방법은 또한 제1 코딩 모드와 병렬로 실행되는 제2 코딩 모드와, 코드 길이 기준 및 제1 코딩 모드에서의 엔벨로프 포화 검출 결과에 따른 상기 두 코딩 모드들 중 하나의 선택을 포함한다.
따라서, 본 발명의 방법은 두 코딩 모드들의 병렬성에 기초하며, 상기 두 코딩 모드들 중 하나 또는 각각은, 특히 최악의 경우에, 즉 최저 확률 rms 값들의 경우에 최저 개수의 코딩 비트들을 산출하는 모드를 선택하는 것이 가능하도록 가변 길이를 갖는다.
또한, 코딩 모드들 중 하나가 하위대역의 rms 값의 포화를 유도하는 경우, 비록 더 긴 코딩 길이를 유도하더라도 다른 모드가 "강제"되고 우선순위를 갖는다.
바람직한 구현예에서, 제2 코딩 모드는 하기의 조건들 중 하나 또는 그 이상이 충족되는 경우에 선택된다:
ㆍ제2 코딩 모드의 코드 길이가 제1 코딩 모드의 코드 길이보다 더 짧다;
ㆍ제1 코딩 모드의 엔벨로프 포화의 검출이 포화를 지시한다.
본 발명은 또한 신호 엔벨로프의 이진 코딩을 위한 모듈을 제공하며, 상기 이진 코딩 모듈은 가변 길이 제1 모드를 코딩하기 위한 모듈을 포함하는데, 이때 제1 모드의 상기 코딩 모듈은 엔벨로프 포화 검출기를 포함하고, 상기 코딩 모듈은 또한 상기 제1 모드를 코딩하기 위한 모듈과 병렬로 제2 모드를 코딩하기 위한 제2 모듈을 포함하고, 상기 코딩 모듈은 코드 길이 기준 및 엔벨로프 포화 검출기로부터의 결과에 따라 두 코딩 모드들 중 하나를 유지하기 위한 모드 선택기를 포함하는 것을 특징으로 한다.
최적 코드를 선택하는 것에 부가하여, 모드 선택기는 유지된 코딩 모드 지시자를 생성하여, 다음 차례의 디코더에게 상기 디코더가 어느 디코딩 모드를 적용해야 하는지를 지시할 수 있다.
본 발명은 또한 신호 엔벨로프 디코딩 방법을 제공하며, 상기 엔벨로프는 본 발명의 이진 코딩 방법에 의해 코딩되는데, 이때 상기 디코딩 방법은 상기 선택된 코딩 모드 지시자를 디코딩하는 단계, 및 상기 선택된 코딩 모드에 따른 디코딩 단계를 포함하는 것을 특징으로 한다.
본 발명은 또한 신호 엔벨로프를 디코딩하기 위한 모듈을 제공하며, 상기 엔벨로프는 본 발명의 이진 코딩 모듈에 의해 코딩되고, 상기 디코딩 모듈은 가변 길이 제1 모드를 디코딩하기 위한 디코딩 모듈을 포함하는데, 이때 상기 디코딩 모듈은 또한 상기 가변 길이 제1 모드를 디코딩하기 위한 상기 디코딩 모듈과 병렬로 제2 모드를 디코딩하기 위한 제2 디코딩 모듈과, 상기 코딩 모드 지시자를 검출하고 상기 검출된 지시자에 대응하는 디코딩 모듈을 활성화하도록 제공된 모드 검출기를 포함하는 것을 특징으로 한다.
마지막으로, 본 발명은 본 발명의 방법의 단계들을 실행하기 위한 컴퓨터-판독 가능 매체 상에 저장된 명령어들을 포함하는 프로그램을 제공한다.
첨부된 도면들을 참조하는 하기의 상세한 설명은 비-제한적인 예시로서 제공되며, 본 발명이 무엇으로 구성되고 구현에 있어서 어떻게 변형될 수 있는지를 명백하게 기술한다.
도 1은 G.722.1 권고안에 부합하는 코더의 도면,
도 2는 MDCT 타입 변환을 나타낸 도면,
도 3은 도 1의 코더를 위한 허프만 코딩의 경우 각각의 하위대역 내 코드들의 최소 길이 비트들(최소) 및 최대 길이 비트들(최대)을 나타낸 표,
도 4는 본 발명을 구현하는 MDCT 코더를 포함하는 계층적 오디오 코더의 도면,
도 5는 도 4의 MDCT 코더의 상세도,
도 6은 도 5의 MDCT 코더의 스펙트럼 엔벨로프 코딩 모듈의 도면,
도 7은 MDCT 스펙트럼을 18개의 하위대역들로 분할한 것을 나타낸 표 (a) 및 하위대역들의 사이즈를 제공하는 표 (b)를 포함하는 도면,
도 8은 차동 인덱스들을 나타내기 위한 허프만 코드들의 예시표,
도 9는 본 발명을 구현하는 MDCT 디코더를 포함하는 계층적 오디오 디코더의 도면,
도 10은 도 9의 MDCT 디코더의 상세도, 및
도 11은 도 10의 MDCT 디코더의 스펙트럼 엔벨로프 디코딩 모듈의 도면.
본 발명은 8 kbit/s 내지 32 kbit/s에서 작동하는 특정한 타입의 계층적 오디오 코더를 배경으로 기술된다. 그러나, 스펙트럼 엔벨로프들을 이진 코딩 및 디코딩하기 위한 본 발명에 따른 방법들 및 모듈들이 이러한 타입의 코더에 제한되는 것은 아니며 본 발명에 따른 방법들 및 모듈들은 신호의 하위대역들의 에너지를 정 의하는 임의의 형태의 스펙트럼 엔벨로프 이진 코딩에 적용될 수 있음은 명백하다.
도 4에 도시된 바와 같이, 16 kHz에서 샘플링된 광대역 계층적 코더의 입력 신호가 QMF(a quadrature mirror filter)에 의해 두 개의 하위대역들로 먼저 분할된다. 0 내지 4000 Hz까지의 저대역은 로우-패스 필터링(300) 및 간축(decimation)(301)에 의해 획득되고, 4000 내지 8000 Hz까지의 고대역은 하이-패스 필터링(302) 및 간축(303)에 의해 획득된다. 바람직한 실시예에서, 필터(300)와 필터(302)는 64 길이를 갖고, J.Johnston에 의해 출간된 "A filter family designed for use in quadrature mirror filter banks"(ICASSP, vol. 5, pp.291-294, 1980년)에 기술된 바와 같다.
저대역은 협대역(50 Hz 내지 4000 Hz)의 CELP 코딩(305)에 앞서 50 Hz 미만 성분들을 제거하는 하이-패스 필터(304)에 의해 사전-처리된다. 하이-패스 필터링은 광대역이 50 Hz 내지 7000 Hz 대역으로서 정의된다는 사실을 고려한다. 기술된 실시예에서, 사용된 협대역 CELP 코딩(305)의 형태는 제1 단계로서 사전-처리 필터를 이용하지 않는 수정된 G.729 코딩(ITU-T G.729 권고안, "Coding of Speech at 8 kbit/s using Conjugate Structure Algebraic Code Excited Linear Prediction(CS-ACELP)", 1996년 3월), 및 제2 단계로서 추가 고정 사전을 포함하는 케스케이드 CELP 코딩에 대응한다. CELP 코딩 에러 신호는 감산기(306)에 의해 계산되고, 그런 다음에 신호 xl0을 획득하기 위하여 WNB(z) 필터(307)에 의해 지각적으로 가중치가 주어진다. 상기 신호는 이산 변환 스펙트럼 X10을 획득하기 위하여 수정된 이산 코사인 변환(MDCT)(308)에 의해 분석된다.
고대역에서의 위신호(aliasing)는 H QMF 필터(302)에 의해 야기된 위신호를 보상하기 위하여 먼저 제거되고(309), 그 이후에 고대역은 원래 신호에서 범위 7000 Hz 내지 8000 Hz의 성분들을 제거하는 로우-패스 필터(310)에 의해 사전-처리된다. 결과 신호 xhi는 이산 변환 스펙트럼 Xhi을 획득하기 위하여 MDCT 변환(311)된다. 대역 확장(31)은 xhi 및 Xhi에 기초하여 수행된다.
도 2를 참조하여 이미 설명된 바와 같이, 신호들(xl0 및 xhi)은 N개의 샘플들의 프레임들로 분할되고, 길이 L=2N의 MDCT 변환은 현재 프레임 및 후속 프레임을 분석한다. 바람직한 실시예에서, xl0 및 xhi는 8 kHz에서 샘플링된 협대역 신호들이고, N=160(20ms)이다. 그러므로, MDCT 변환들 Xlo 및 Xhi는 N=160 계수들을 포함하고, 각각의 계수는 4000/160=25 Hz의 주파수 대역을 나타낸다. 바람직한 실시예에서, MDCT 변환은 P.Duhamel, Y.Mahieux, J.P.Petit에 의해 기술된 "A fast algorithm for the implementation of filter banks based on 'time domain aliasing cancellation'"(ICASSP, vol. 3, pp.2209-2212, 1991년)의 알고리즘에 의하여 구현된다.
저대역 및 고대역 MDCT 스펙트럼 Xlo 및 Xhi는 변환 코딩 모듈(313)에서 코딩된다. 본 발명은 더욱 상세하게 상기 코더에 관한 것이다.
코딩 모듈들(305, 312, 313)에 의해 생성된 비트 스트림들은 다중화기(314) 에서 계층적 비트 스트림으로 다중화되고 조직화된다. 코딩은 샘플들(프레임들)의 20 ms 블록들, 즉 320개의 샘플들의 블록들에 의해 수행된다. 코딩 비트율은 2 kbit/s의 단계들로 8 kbit/s, 12 kbit/s, 14 kbit/s 내지 32 kbit/s이다.
MDCT 코더(313)는 도 5를 참조하여 상세하게 기술된다.
저대역 및 고대역 MDCT 변환들은 병합 블록(400)에서 먼저 합성된다. 그러므로 계수들
Figure 112008067053957-PCT00003
Figure 112008067053957-PCT00004
은 전체 대역 이산 변환 스펙트럼을 형성하기 위하여 단일 벡터로 그룹핑된다:
Figure 112008067053957-PCT00005
X의 MDCT 계수들 X(0), ...X(L-1)은 K개의 하위대역들로 그룹핑된다. 하위대역들로의 분할은 하위대역들의 영역들(frontiers)을 한정하는 K+1 엘리먼트들의 표 tabis = {tabis(0), tabis(1) ... tabis(K)}에 의해 기술될 수 있다. 제1 하위대역은 계수들 X(tabis(0)) 내지 X(tabis(1)-1)을 포함하고, 제2 하위대역은 계수들 X(tabis(1)) 내지 X(tabis(2)-1)을 포함하는 등이다.
바람직한 실시예에서, K=18이다; 연관된 분할이 도 7의 표 (a)에 특정된다.
하위대역당 에너지 분포를 나타내는 진폭 log_rms의 스펙트럼 엔벨로프는 스펙트럼 엔벨로프 코더에 의해 인덱스들(rms_index)을 획득하기 위하여 계산되고(401) 그런 다음에 코딩된다(402). 비트들은 각각의 하위대역에 할당되고(403) 구면(spherical) 벡터 양자화(404)가 스펙트럼 X에 적용된다. 바람직한 실시예에서, 비트들 할당은 Y.Mahieux, J.P.Petit에 의해 출간된 "Transform coding of audio signals at 64 kbkt/s"(IEEE GLOBECOM, vol. 1, pp. 518-522, 1990년)에 기술된 방법에 대응하고, 구면 벡터 양자화는 국제 특허 PCT/FR04/00219에 기술된 바와 같이 수행된다.
스펙트럼 엔벨로프의 코딩과 MDCT 계수들의 벡터 양자화로부터 도출된 비트들은 다중화기(314)에 의해 처리된다.
스펙트럼 엔벨로프 계산 및 코딩은 더욱 상세하게 하기에 기술된다.
대수 도메인에서 스펙트럼 엔벨로프 log_rms는 j번째 하위대역에 대하여 하기와 같이 정의된다:
Figure 112008067053957-PCT00006
여기서, j=0, ..., K-1이고 nb_coeff(j) = tabis(j+1) - tabis(j)는 j번째 하위대역에서 계수들의 개수이다. 스펙트럼 엔벨로프는 j번째 하위대역의 rms 값(dB)에 대응한다; 그러므로, 상기 스펙트럼 엔벨로프는 진폭 엔벨로프이다.
바람직한 실시예에서 하위대역들의 사이즈 nb_coeff(j)는 도 7의 표 (b)에 제공된다. 또한, ε=2-24이고, 이는 log_rms(j) ≥ -12를 암시한다.
코더(402)에 의한 스펙트럼 엔벨로프의 코딩은 도 6에서 도시된다.
대수 도메인에서 엔벨로프 log_rms는 선형 양자화(500)에 의해 rms_index = {rms_index(0) rms_index(1) ... rms_index(K-1)}에 먼저 이른다. 상기 양자화는 간단하게 하기에 의해 제공된다:
rms_index(j) < -11이면, rms_index(j) = -11
rms_index(j) > +20이면, rms_index(j) = +20
rms_index(j) = log_rms(j)×0.5의 가장 가까운 정수에 이른다.
그런 다음, 스펙트럼 엔벨로프는 20×log10(20.5)=3.0103, ...dB의 균일한(uniform) 대수 단계들로 코딩된다. 결과 벡터 rms_index는 -11 내지 +20(즉, 32개의 가능한 값들)의 정수 인덱스들을 포함한다. 그러므로, 스펙트럼 엔벨로프는 32×3.01=96.31dB 차수(order)의 동적 범위로 표현된다.
양자화된 엔벨로프 rms_index는 블록(501)에 의해 두 개의 하위벡터들로 분할된다: 한 하위벡터는 저대역 엔벨로프에 대한 rms_index_bb = {rms_index(0) rms_index(1) ... rms_index(K_BB-1)}이고, 다른 하나의 벡터는 고대역 엔벨로프에 대한 rms_index_bh = {rms_index(K_BB) ... rms_index(K-1)}이다. 바람직한 실시예에서, K=18이고 K_BB=10이다; 즉, 첫 번째 10개의 하위대역들은 저대역(0 내지 4000 Hz)이고, 마지막 8개의 하위대역들은 고대역(4000 Hz 내지 7000 Hz)이다.
저대역 엔벨로프 rms_index_bb는 경쟁적으로 작동하는 두 개의 코딩 모듈들(502, 503), 즉 가변 길이 차동 코딩 모듈(502)과 고정 길이("동률(equiprobable)") 코딩 모듈(503)에 의해 이진화된다. 바람직한 실시예에서, 모듈(502)은 차동 허프만 코딩 모듈이고 모듈(503)은 자연 이진 코딩 모듈이다.
차동 허프만 코딩 모듈(502)은 하기에서 상세하게 기술되는 두 코딩 단계들을 포함한다:
ㆍ차동 인덱스들의 계산.
차동 양자화 인덱스들 diff_index(1) diff_index(2) ... diff_index(K_BB-1)은 하기에 의해 제공된다:
satur_bb = 0
diff_index(j) = rms_index(j) - rms_index(j-1)
(diff_index(j) < -12) 또는 (diff_index(j) > +12)이면,
satur_bb = 1
이진 지시자(satur_bb)가 diff_index(j)가 범위 [-12, +12]에 존재하지 않는 상황들을 검출하기 위해 사용된다. satur_bb=0이면, 모든 엘리먼트들은 상기 범위 내에 있고 차동 허프만 코딩 인덱스 범위는 충분하다; 그렇지 않다면, 상기 엘리먼트들 중 하나가 -12 미만이거나 +12 초과하고 상기 범위의 인덱스들은 불충분하다. 그러므로, 지시자(satur_bb)는 저대역에서 차동 허프만 코딩에 의한 스펙트럼 엔벨로프 포화를 검출하기 위해 사용된다. 포화가 검출되면, 코딩 모드가 고정 길이(동률) 코딩 모드로 바뀐다. 설계에 의해, 동률 모드의 인덱스들의 범위는 항상 충분하다.
ㆍ제1 인덱스의 이진 전환 및 차동 인덱스들의 허프만 코딩:
ㆍ양자화 인덱스 rms_index(0)는 -11 내지 +20의 정수 값을 갖는다. 상기 양자화 인덱스는 5비트들의 고정 길이를 갖도록 바로 이진 코딩된다. j=1...K_BB-1의 경우 차동 양자화 인덱스들 diff_index(j)는 허프만 코딩에 의해 이진 형태로 전환된다(가변 길이). 사용된 허프만 표가 도 8 표에 특정된다.
ㆍrms_index(0)의 상기 이진 전환과 양자화 인덱스들 diff_index(j)의 허프만 코딩으로부터 유도된 총 개수 bit_cnt1_bb의 비트들은 가변한다.
ㆍ바람직한 실시예에서, 허프만 코드의 최대 길이는 14비트이고 허프만 코딩은 저대역에서 K_BB-1=9 차동 인덱스들에 적용된다. 따라서, 이론적 최대 값 bit_cnt1_bb은 5+9×14=131비트이다. 이것이 이론적 값일 뿐이지만, 최악의 경우 시나리오에서, 저대역에서 스펙트럼 엔벨로프 코딩에 의해 사용된 비트들의 개수는 매우 높을 수 있다; 최악의 경우 시나리오를 제한하는 것이 정확히 동률 코딩의 역할이다.
동률 코딩 모듈(503)은 자연 이진 형태로 엘리먼트들 rms_index(0) rms_index(1) ... rms_index(K_BB-1)을 바로 전환한다. 상기 엘리먼트들은 -11 내지 +20에 있고, 그러므로 5비트로 각각 코딩된다. 그러므로, 동률 코딩을 위해 필요한 비트들의 개수는 단순하다: bit_cnt2_bb = 5×K_BB 비트들. 바람직한 실시예에서, K_BB=10이고, 따라서 bit_cnt2_bb = 50 비트이다.
모드 선택기(504)는 두 개의 모듈들(502 또는 503)(차동 허프만 코딩 또는 동률 코딩) 중 어느 것이 더 적은 개수의 비트들을 생성하는지를 선택한다. 차동 허프만 모드가 +/-12에서 차동 인덱스들을 포화시키므로, 동률 모드는 포화가 차동 양자화 인덱스들의 계산시에 검출되자마자 선택된다. 상기 방법은 두 개의 인접한 대역들의 rms 값들이 12×3.01=36.12dB를 초과하자마자 스펙트럼 엔벨로프 포화를 방지한다. 모드 선택기는 하기에서 설명된다:
ㆍ(satur_bb=1) 또는 (bit_cnt2_bb < bit_cnt1_bb)인 경우, 동률 모드가 선택된다;
ㆍ그렇지 않다면, 차동 허프만 모드가 선택된다.
모드 선택기(504)는 차동 허프만 모드 또는 동률 모드 중 어느 것이 선택되었는지를 지시하는 비트를 하기의 방식으로 생성한다: 차동 허프만 모드의 경우 0이고, 동률 모드의 경우 1이다. 상기 비트는 스펙트럼 엔벨로프를 코딩함으로써 생성된 다른 비트들과 다중화기(510)에서 다중화된다. 또한, 모드 선택기(504)는 선택된 코딩 모드의 비트들을 다중화기(314)에서 다중화하는 쌍안정(505)을 트리거링한다.
고대역 엔벨로프 rms_index_bh는 rms_index_bb와 정확하게 동일한 방식으로 처리된다: 동률 코딩 모듈(507)에 의한 5비트들의 제1 인덱스 log_rms(0)의 균일한 코딩 그리고 코딩 모듈(506)에 의한 차동 인덱스들의 허프만 코딩. 모듈(506)에서 사용된 허프만 표는 모듈(502)에서 사용된 것과 동일하다. 유사하게, 동률 코딩(507)은 저대역에서의 코딩(503)과 동일하다. 모드 선택기(508)는 어느 모드(차동 허프만 모드 또는 동률 모드)가 선택되었는지를 지시하는 비트를 생성하고, 상기 비트는 다중화기(314)에서 쌍안정(509)으로부터의 비트들과 다중화된다. 고대역에서 동률 코딩을 위해 필요한 비트들의 개수는 bit_cnt2_bh = (K-K_BB)×5이다; 바람직한 실시예에서, K-K_BB = 8이고 따라서 bit_cnt2_bh = 40 비트이다.
바람직한 실시예에서, 고대역의 엔벨로프와 연관된 비트들이 저대역의 엔벨로프와 연관된 비트들에 앞서 다중화되는 것을 아는 것이 중요하다. 이러한 방식으로, 코딩된 스펙트럼 엔벨로프의 일부분만이 디코더에 의해 수신된다면, 고대역의 엔벨로프는 저대역의 엔벨로프에 앞서 디코딩될 수 있다.
앞서 기술된 코더와 연관된 계층적 오디오 디코더가 도 9에 도시된다. 각각 20 ms 프레임을 정의하는 비트들은 역다중화기(600)에서 역다중화된다. 여기서는 8 kbit/s 내지 32 kbit/s에서의 디코딩이 도시된다. 실제로, 비트 스트림은 2 kbit/s의 단계들로 8 kbit/s, 12 kbit/s, 14 kbit/s까지 또는 14 kbit/s 내지 32 kbit/s로 절단될 수 있다.
8 및 12 kbit/s에서 계층들의 비트 스트림은 제1 협대역(0 내지 4000 Hz) 합성을 생성하기 위해 CELP 디코더(601)에 의해 사용된다. 14 kbit/s 계층과 연관된 비트 스트림의 부분은 대역 확장 모듈(602)에 의해 디코딩된다. 고대역(4000 Hz 내지 7000 Hz)에서 획득된 신호는 MDCT 변환(603)을 적용함으로써 변환 신호
Figure 112008067053957-PCT00007
로 변환된다. MDCT 디코딩(604)은 도 10에 도시되며 하기에 논의된다. 14 kbit/s 내지 32 kbit/s의 비트율들과 연관된 비트 스트림으로부터, 재구성된 스펙트럼
Figure 112008067053957-PCT00008
은 저대역에서 생성되고 재구성된 스펙트럼
Figure 112008067053957-PCT00009
은 고대역에서 생성된다. 상기 스펙트럼들은 블록들(605, 606)에서 반전 MDCT 변환에 의해 시간-도메인 신호들
Figure 112008067053957-PCT00010
로 전환된다. 상기 신호
Figure 112008067053957-PCT00011
은 반전 지각적 필터링(607) 이후에 CELP 합성(608)에 부가되고 결과는 그런 다음에 포스트-필터링(609)된다.
16 kbit/s에서 샘플링된 광대역 출력 신호는 오버샘플링(610, 612), 로우-패스 및 하이-패스 필터링(611, 613), 및 합산(614)을 포함하여 합성 QMF 필터 뱅크를 통해 획득된다.
MDCT 디코더(604)는 도 10을 참조하여 하기에서 기술된다.
상기 모듈과 연관된 비트들은 역다중화기(600)에서 역다중화된다. 스펙트럼 엔벨로프는 인덱스들 rms_index과 선형 스케일의 재구성된 스펙트럼 엔벨로프 rms_q를 획득하기 위해 먼저 디코딩된다(701). 디코딩 모듈(701)은 도 11에서 도시되고 하기에서 기술된다. 비트 에러가 없고 스펙트럼 엔벨로프를 정의하는 모든 비트들이 정확하게 수신된 경우, 인덱스들 rms_index은 코더에서 계산된 것에 정확하게 대응한다; 상기 특성은 필수적인데, 그 이유는 비트들 할당(702)이 코더와 디코더가 양립할 수 있도록 코더와 디코더에서 동일한 정보를 요구하기 때문이다. 표준화된 MDCT 계수들이 블록(703)에서 디코딩된다.
수신되지 않았거나 코딩되지 않은 하위대역들은 너무 적은 에너지를 갖기 때문에 치환 모듈(704)에서 스펙트럼
Figure 112008067053957-PCT00012
로부터의 것과 교체된다. 마지막으로, 모듈(705)은 모듈(704)의 출력에서 제공된 계수들에 대하여 하위대역당 진폭 엔벨로프를 적용하고, 재구성된 스펙트럼
Figure 112008067053957-PCT00013
은 저대역(0 내지 4000 Hz)에서 재구성된 스펙트럼
Figure 112008067053957-PCT00014
으로, 고대역(4000 Hz 내지 7000 Hz)에서 재구성된 스펙트림
Figure 112008067053957-PCT00015
으로 분리된다(706).
도 11은 스펙트럼 엔벨로프의 디코딩을 나타낸다. 스펙트럼 엔벨로프와 연관된 비트들은 역다중화기(600)에 의해 역다중화된다.
바람직한 실시예에서, 고대역의 스펙트럼 엔벨로프와 연관된 비트들은 저대역의 스펙트럼 엔벨로프에 앞서 전송된다. 따라서, 디코딩은 모드 선택기(801)에서 코더로부터 수신된 모드 선택 비트(차동 허프만 모드 또는 동률 모드)의 값을 읽는 것으로 시작된다. 선택기(801)는 코딩과 동일한 방식에 부합한다, 즉: 차동 허프만 모드를 위해 1을 사용하고, 동률 모드를 위해 1을 사용한다. 상기 비트의 값은 쌍안정들(802, 805)을 구동한다.
모드 선택 비트가 0에 있다면, 차동 허프만 디코딩이 가변 길이 디코딩 모듈(803)에 의해 수행된다: 5비트들의 -11 내지 +20의 절대 값 rms_index(K_BB)가 먼저 디코딩되고, 이어서 j=K_BB.K-1일 경우 차동 양자화 인덱스들 diff_index(j)와 연관된 허프만 코드들이 디코딩된다. 그런 다음에 정수 인덱스들 rms_index(j)가 j=K_BB.K-1일 경우 하기의 공식에 의해 재구성된다:
Figure 112008067053957-PCT00016
모드 선택 비트가 1에 있다면, j=K_BB.K-1일 경우 5비트들의 -11 내지 +20의 rms_index(j)의 값들이 고정 길이 디코딩 모듈(804)에 의해 연속적으로 디코딩된다.
허프만 코드가 모드 0에 있거나 또는 수신된 비트들의 개수가 고대역을 완전히 디코딩하기에 불충분하다면, 디코딩 프로세스는 MDCT 디코더에게 에러가 발생했음을 지시한다.
저대역과 연관된 비트들은 고대역과 연관된 비트들과 동일한 방식으로 디코딩된다. 그러므로, 상기 디코딩 부분은 모드 선택기(806), 쌍안정들(807, 810), 디코딩 모듈들(808, 809)을 포함한다.
저대역 재구성된 스펙트럼 엔벨로프는 j=K_BB.K-1일 경우 rms_index(j)를 포함한다. 저대역에서 재구성된 스펙트럼 엔벨로프는 j=0...K_BB-1일 경우 정수 인 덱스들 rms_index(j)을 포함한다. 상기 인덱스들은 병합 블록(811)에서 단일 벡터 rms_index = {rms_index(0) rms_index(1) ... rms_index(K-1)}으로 그룹핑된다. 벡터 rms_index는 베이스 2 대수 스케일에서 재구성된 스펙트럼 엔벨로프를 나타낸다; 스펙트럼 엔벨로프는 j=0, ..., K-1일 경우 하기의 동작을 수행하는 전환 모듈(812)에 의해 선형 스케일로 전환된다:
Figure 112008067053957-PCT00017
본 발명이 기술된 실시예들에 제한되지 않음은 명백하다. 특히, 본 발명에 의해 코딩된 바와 같은 엔벨로프가 하위대역당 rms 값을 정의하는 스펙트럼 엔벨로프보다는 신호의 하위대역당 rms 값을 정의하는 시간 엔벨로프에 대응할 수 있다는 것이 주지되어야 한다.
또한, 차동 허프만 코딩과 경쟁하는 고정 길이 코딩 단계는 가변 길이 코딩 단계에 의해 교체될 수 있다, 예컨대 차동 인덱스들의 허프만 코딩 대신에 양자화 인덱스들의 허프만 코딩이 사용될 수 있다. 허프만 코딩은 또한 임의의 다른 무손실 코딩, 예컨대 산술 코딩, 턴스털 코딩 등에 의해 교체될 수도 있다.

Claims (17)

  1. 신호 엔벨로프를 정의하는 양자화 인덱스들을 이진 코딩하기 위한 방법으로서,
    가변 길이 제1 코딩 모드를 포함하고,
    상기 제1 코딩 모드는 엔벨로프 포화 검출을 포함하고,
    상기 방법은,
    상기 제1 코딩 모드와 병렬로 실행되는 제2 코딩 모드를 포함하고,
    코드 길이 기준 및 상기 제1 코딩 모드에서의 엔벨로프 포화 검출 결과에 따라, 상기 두 코딩 모드들 중에서 하나를 선택하는,
    이진 코딩 방법.
  2. 제 1 항에 있어서,
    상기 제2 코딩 모드는,
    ㆍ상기 제1 코딩 모드의 코드 길이보다 상기 제2 코딩 모드의 코드 길이가 더 짧은 조건;
    ㆍ상기 제1 코딩 모드에서의 엔벨로프 포화 검출이 포화를 지시하는 조건
    중 하나 또는 그 이상이 충족되는 경우에 선택되는,
    이진 코딩 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    선택된 코딩 모드 지시자를 생성하는 단계를 포함하는,
    이진 코딩 방법.
  4. 제 3 항에 있어서,
    상기 지시자는 단일 비트인,
    이진 코딩 방법.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 제2 코딩 모드는 고정 길이 자연 이진 코딩인,
    이진 코딩 방법.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 가변 길이 제1 코딩 모드는 가변 길이 차동 코딩인,
    이진 코딩 방법.
  7. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 가변 길이 제1 코딩 모드는 차동 허프만 코딩인,
    이진 코딩 방법.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    상기 양자화 인덱스들은 상기 신호의 하위대역들 내 에너지를 정의하는 주파수 엔벨로프의 스칼라 양자화에 의해 획득되는,
    이진 코딩 방법.
  9. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    상기 양자화 인덱스들은 상기 신호의 하위대역들 내 에너지를 정의하는 시간 엔벨로프의 스칼라 양자화에 의해 획득되는,
    이진 코딩 방법.
  10. 제 8 항 또는 제 9 항에 있어서,
    제1 하위대역 또는 하위프레임은 고정 길이로 코딩되고, 하위대역 또는 하위프레임의 차동 에너지는 선행하는 하위대역 또는 하위프레임에 대해 상대적인 가변 길이로 코딩되는,
    이진 코딩 방법.
  11. 제 2 항 내지 제 10 항 중 어느 한 항에 따른 이진 코딩 방법에 의해 코딩되는 신호 엔벨로프 디코딩 방법으로서,
    상기 디코딩 방법은 상기 선택된 코딩 모드 지시자를 디코딩하는 단계; 및
    상기 선택된 코딩 모드에 따른 디코딩 단계를 포함하는,
    디코딩 방법.
  12. 신호 엔벨로프의 이진 코딩 모듈(402)로서,
    가변 길이 제1 모드를 코딩하기 위한 모듈(502)을 포함하고,
    상기 제1 모드를 코딩하기 위한 상기 코딩 모듈은 엔벨로프 포화 검출기를 포함하고,
    상기 코딩 모듈(402)은,
    상기 제1 모드를 코딩하기 위한 모듈(502)과 병렬로 제2 모드를 코딩하기 위한 제2 모듈(503); 및
    코드 길이 기준 및 엔벨로프 포화 검출기로부터의 결과에 따라, 상기 두 코딩 모드들 중에서 하나를 유지하기 위한 모드 선택기(504)를 포함하는,
    이진 코딩 모듈.
  13. 제 12 항에 있어서,
    상기 모드 선택기(504)는 선택된 코딩 모드 지시자를 생성하도록 제공되는,
    이진 코딩 모듈.
  14. 신호 엔벨로프 디코딩 모듈(701)로서,
    상기 엔벨로프는 제 13 항에 따른 이진 코딩 모듈에 의해 코딩되고,
    상기 디코딩 모듈은 가변 길이 제1 모드를 디코딩하기 위한 디코딩 모 듈(808)을 포함하고,
    상기 디코딩 모듈(701)은,
    상기 제1 모드를 디코딩하기 위한 상기 디코딩 모듈(808)과 병렬로 제2 모드를 디코딩하기 위한 제2 디코딩 모듈(809); 및
    상기 코딩 모드 지시자를 검출하고 상기 검출된 지시자에 대응하는 디코딩 모듈(808, 809)을 활성화하도록 제공된 모드 검출기(806)를 포함하는,
    디코딩 모듈.
  15. 가청-주파수 신호들의 변환 코딩에 대한 제 1 항 내지 제 10 항 중 어느 한 항에 따른 코딩 방법과 제 12 항 내지 제 13항에 따른 코딩 모듈의 제공.
  16. 제 15 항에 있어서,
    상기 변환은 수정된 이산 코사인 변환(MDCT)인,
    제공.
  17. 컴퓨터에서 실행될 때, 제 1 항 내지 제 10 항에 따른 방법의 단계들을 실행하기 위해 컴퓨터-판독 가능 매체에 저장된 명령어들을 포함하는 프로그램.
KR1020087023295A 2006-02-24 2007-02-13 신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩모듈 KR101364979B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0650638 2006-02-24
FR0650638 2006-02-24
PCT/FR2007/050781 WO2007096551A2 (fr) 2006-02-24 2007-02-13 Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants

Publications (2)

Publication Number Publication Date
KR20080107428A true KR20080107428A (ko) 2008-12-10
KR101364979B1 KR101364979B1 (ko) 2014-02-20

Family

ID=37192313

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087023295A KR101364979B1 (ko) 2006-02-24 2007-02-13 신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩모듈

Country Status (9)

Country Link
US (1) US8315880B2 (ko)
EP (1) EP1989707A2 (ko)
JP (1) JP5235684B2 (ko)
KR (1) KR101364979B1 (ko)
CN (1) CN101390158B (ko)
BR (1) BRPI0708267A2 (ko)
MX (1) MX2008010836A (ko)
RU (1) RU2420816C2 (ko)
WO (1) WO2007096551A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10424304B2 (en) 2011-10-21 2019-09-24 Samsung Electronics Co., Ltd. Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100889750B1 (ko) * 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
EP2263388B1 (en) * 2008-04-08 2014-02-12 Med-El Elektromedizinische Geräte GmbH Electrical stimulation of the acoustic nerve with coherent fine structure
JP5519230B2 (ja) * 2009-09-30 2014-06-11 パナソニック株式会社 オーディオエンコーダ及び音信号処理システム
CN102256139B (zh) * 2010-05-19 2013-10-02 晨星软件研发(深圳)有限公司 媒体编码系统、量化系数编码装置及量化系数编码方法
MY164987A (en) * 2011-04-20 2018-02-28 Panasonic Ip Corp America Audio/speech encoding apparatus, audio/speech decoding apparatus, and audio/speech encoding and audio/speech decoding methods
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
US20160038293A1 (en) * 2013-03-15 2016-02-11 Conformis, Inc. Posterior-Stabilized Knee Implant Components and Instruments
UA112833C2 (uk) 2013-05-24 2016-10-25 Долбі Інтернешнл Аб Аудіо кодер і декодер
MY170179A (en) 2013-06-10 2019-07-09 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
PL3008726T3 (pl) * 2013-06-10 2018-01-31 Fraunhofer Ges Forschung Urządzenie i sposób kodowania obwiedni sygnału audio, przetwarzania i dekodowania przez modelowanie reprezentacji sumy skumulowanej z zastosowaniem kwantyzacji i kodowania rozkładu
CN108198564B (zh) * 2013-07-01 2021-02-26 华为技术有限公司 信号编码和解码方法以及设备
US10141004B2 (en) * 2013-08-28 2018-11-27 Dolby Laboratories Licensing Corporation Hybrid waveform-coded and parametric-coded speech enhancement
US10468033B2 (en) * 2013-09-13 2019-11-05 Samsung Electronics Co., Ltd. Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
CN105723454B (zh) * 2013-09-13 2020-01-24 三星电子株式会社 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备
CN110867190B (zh) 2013-09-16 2023-10-13 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
PL3139380T3 (pl) * 2014-05-01 2019-09-30 Nippon Telegraph And Telephone Corporation Koder, dekoder, sposób kodowania, sposób dekodowania, program kodujący, program dekodujący i nośnik rejestrujący
US10639162B2 (en) * 2014-06-24 2020-05-05 National University Corporation Ehime University Artificial knee joint
CN111968655B (zh) 2014-07-28 2023-11-10 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
CA3011915C (en) 2016-01-22 2021-07-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for estimating an inter-channel time difference
CN107342090B (zh) * 2016-04-29 2020-08-25 华为技术有限公司 一种音频信号编码、解码方法及音频信号编码器、解码器
GB2559200A (en) * 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
JP6780108B2 (ja) 2017-06-07 2020-11-04 日本電信電話株式会社 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム
WO2020146868A1 (en) * 2019-01-13 2020-07-16 Huawei Technologies Co., Ltd. High resolution audio coding
GB2587196A (en) * 2019-09-13 2021-03-24 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
WO2021120067A1 (zh) * 2019-12-18 2021-06-24 深圳市大疆创新科技有限公司 数据编码方法、数据解码方法、数据处理方法、编码器、解码器、系统、可移动平台与计算机可读介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4815068A (en) * 1987-08-07 1989-03-21 Dolby Ray Milton Audio encoder for use with more than one decoder each having different characteristics
DE68911287T2 (de) * 1988-06-08 1994-05-05 Fujitsu Ltd Codierer/decodierer.
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
JPH05334038A (ja) * 1992-06-04 1993-12-17 Toshiba Corp データの符号化及び復元処理装置
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
JP2000151413A (ja) * 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
EP1175670B2 (en) * 1999-04-16 2007-09-19 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for audio coding
JP3323175B2 (ja) * 1999-04-20 2002-09-09 松下電器産業株式会社 符号化装置
JP2001075600A (ja) * 1999-09-07 2001-03-23 Mitsubishi Electric Corp 音声符号化装置および音声復号化装置
US6625226B1 (en) * 1999-12-03 2003-09-23 Allen Gersho Variable bit rate coder, and associated method, for a communication station operable in a communication system
DE60135487D1 (de) 2000-12-22 2008-10-02 Sony Corp Codierer
JP3580251B2 (ja) 2000-12-27 2004-10-20 日本電気株式会社 データ圧縮装置及び圧縮方法並びにその制御プログラムを記録した記録媒体
WO2002103683A1 (fr) * 2001-06-15 2002-12-27 Sony Corporation Appareil et procede de codage
EP1446796A1 (en) * 2001-10-26 2004-08-18 Koninklijke Philips Electronics N.V. Tracking of sinusoidal parameters in an audio coder
EP1374230B1 (en) * 2001-11-14 2006-06-21 Matsushita Electric Industrial Co., Ltd. Audio coding and decoding
US6845360B2 (en) * 2002-11-22 2005-01-18 Arbitron Inc. Encoding multiple messages in audio data and detecting same
FI114071B (fi) * 2003-01-13 2004-07-30 Nokia Corp Kuvien käsitteleminen rajoitetulla bittimäärällä
ATE447755T1 (de) * 2003-02-06 2009-11-15 Dolby Lab Licensing Corp Kontinuierliche audiodatensicherung
EP1709743A1 (fr) 2004-01-30 2006-10-11 France Telecom S.A. Quantification vectorielle en dimension et resolution variables
US7739120B2 (en) * 2004-05-17 2010-06-15 Nokia Corporation Selection of coding models for encoding an audio signal
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
BRPI0515343A8 (pt) * 2004-09-17 2016-11-29 Koninklijke Philips Electronics Nv Codificador e decodificador de áudio, métodos de codificar um sinal de áudio e de decodificar um sinal de áudio codificado, sinal de áudio codificado, meio de armazenamento, dispositivo, e, código de programa legível por computador

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10424304B2 (en) 2011-10-21 2019-09-24 Samsung Electronics Co., Ltd. Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus
US10878827B2 (en) 2011-10-21 2020-12-29 Samsung Electronics Co.. Ltd. Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus
US11355129B2 (en) 2011-10-21 2022-06-07 Samsung Electronics Co., Ltd. Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus

Also Published As

Publication number Publication date
EP1989707A2 (fr) 2008-11-12
KR101364979B1 (ko) 2014-02-20
US20090030678A1 (en) 2009-01-29
WO2007096551A2 (fr) 2007-08-30
BRPI0708267A2 (pt) 2011-05-24
JP5235684B2 (ja) 2013-07-10
JP2009527785A (ja) 2009-07-30
CN101390158B (zh) 2012-03-14
RU2420816C2 (ru) 2011-06-10
MX2008010836A (es) 2008-11-26
US8315880B2 (en) 2012-11-20
RU2008137987A (ru) 2010-03-27
CN101390158A (zh) 2009-03-18
WO2007096551A3 (fr) 2007-11-01

Similar Documents

Publication Publication Date Title
KR101364979B1 (ko) 신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩모듈
KR101425944B1 (ko) 디지털 오디오 신호에 대한 향상된 코딩/디코딩
JP5117407B2 (ja) オーディオ符号化/復号化で知覚的に重み付けするための装置
US7876966B2 (en) Switching between coding schemes
Gersho Advances in speech and audio compression
CN1957398B (zh) 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备
EP0932141B1 (en) Method for signal controlled switching between different audio coding schemes
JP5112309B2 (ja) 階層符号化/復号化装置
KR101435893B1 (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
JP4879748B2 (ja) 最適化された複合的符号化方法
CN104123946A (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法
US7260523B2 (en) Sub-band speech coding system
JP2012518194A (ja) 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
KR101373207B1 (ko) 오디오 디코더에서 신호를 사후-프로세싱하는 방법
EP2132732B1 (en) Postfilter for layered codecs
US20090018823A1 (en) Speech coding
Bouzid et al. Switched split vector quantizer applied for encoding the LPC parameters of the 2.4 Kbits/s MELP speech coder
Drygajilo Speech Coding Techniques and Standards
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee