KR20170134475A - 오디오 인코더, 오디오 디코더, 오디오 신호를 인코딩하기 위한 방법 및 인코딩된 오디오 신호를 디코딩하기 위한 방법 - Google Patents

오디오 인코더, 오디오 디코더, 오디오 신호를 인코딩하기 위한 방법 및 인코딩된 오디오 신호를 디코딩하기 위한 방법 Download PDF

Info

Publication number
KR20170134475A
KR20170134475A KR1020177028551A KR20177028551A KR20170134475A KR 20170134475 A KR20170134475 A KR 20170134475A KR 1020177028551 A KR1020177028551 A KR 1020177028551A KR 20177028551 A KR20177028551 A KR 20177028551A KR 20170134475 A KR20170134475 A KR 20170134475A
Authority
KR
South Korea
Prior art keywords
spectral coefficients
audio signal
encoded
groups
interval value
Prior art date
Application number
KR1020177028551A
Other languages
English (en)
Other versions
KR102151728B1 (ko
Inventor
베른트 엘더
크리스티안 헴리치
맥스 노이엔도르프
벤자민 슈베르트
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority claimed from PCT/EP2016/054831 external-priority patent/WO2016142357A1/en
Publication of KR20170134475A publication Critical patent/KR20170134475A/ko
Application granted granted Critical
Publication of KR102151728B1 publication Critical patent/KR102151728B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/547Motion estimation performed in a transform domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details

Abstract

오디오 신호를 인코딩하기 위한 인코더가 제공된다. 인코더는 변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하도록 구성되고, 인코더는 현재 프레임 및 적어도 하나의 이전 프레임에 대해 오디오 신호의 스펙트럼 계수들을 결정하도록 구성되며, 인코더는 적어도 하나의 스펙트럼 계수에 의해 분리되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성된다.

Description

오디오 인코더, 오디오 디코더, 오디오 신호를 인코딩하기 위한 방법 및 인코딩된 오디오 신호를 디코딩하기 위한 방법{omitted}
실시예들은 오디오 코딩에 관한 것으로, 특히 예측 인코딩을 사용하여 오디오 신호를 인코딩하기 위한 방법 및 장치 그리고 인코딩된 오디오 신호를 예측 디코딩을 사용하여 디코딩하기 위한 방법 및 장치에 관한 것이다. 선호되는 실시예들은 피치 적응 스펙트럼 예측을 위한 방법들 및 장치들에 관한 것이다. 추가 선호되는 실시예들은 스펙트럼 도메인 프레임 간 예측 도구들을 이용한 변환 코딩에 의한 음색 오디오 신호들의 지각 코딩에 관한 것이다.
특히 낮은 비트 레이트들에서 코딩된 음색 신호들의 품질을 향상시키기 위해, 최신 오디오 변환 코더들은 매우 긴 변환들 및/또는 장기 예측 또는 전치/후치 필터링을 이용한다. 그러나 긴 변환은 긴 알고리즘 지연을 나타내는데, 이는 저 지연 통신 시나리오들에는 바람직하지 않다. 따라서 순시 기본 피치를 기반으로 하는 매우 적은 지연의 예측기들이 최근 인기를 얻고 있다. IETF(Internet Engineering Task Force) Opus 코덱은 주파수 도메인의 CELT(Constrained-Energy Lapped Transform) 코딩 경로에서 피치 적응 전치/후치 필터링을 이용하고[J. M. Valin, K. Vos, and T. Terriberry, "Definition of the Opus audio codec," 2012, IETF RFC 6716. http://tools.ietf.org/html/rfc67161.], 3GPP(3rd Generation Partnership Project) EVS(Enhanced Voice Services) 코덱은 변환 디코딩된 신호들의 지각 향상을 위해 장기 고조파 후치 필터를 제공한다[3GPP TS 26. 443, "Codec for Enhanced Voice Services (EVS)," Release 12, Dec. 2014.]. 이러한 접근 방식들 모두 완전히 디코딩된 신호 파형에 대해 시간 도메인에서 작동하여, 이러한 방식들을 주파수 선택적으로 적용하는 것이 어렵고 그리고/또는 계산상 비용이 들게 된다(두 방식들 모두 어떤 주파수 선택성에 대해서만 단순한 저역 통과 필터를 제공한다). 따라서 시간 도메인 장기 예측(LTP: long-term prediction) 또는 전치/후치 필터링(PPF: pre-/post-filtering)에 대한 환영할 만한 대안이 MPEG-2 AAC[ISO/IEC 13818-7, "Information technology - Part 7: Advanced Audio Coding (AAC)," 2006.]에서 지원되는 것과 같이 주파수 도메인 예측(FDP: frequency-domain prediction)에 의해 제공된다. 이 방법은 주파수 선택성을 가능하게 하지만, 이후 설명되는 바와 같이 그 자체의 단점들을 갖는다.
위에 소개된 FDP 방법은 다른 도구들에 비해 두 가지 단점들을 갖는다. 첫째, FDP 방법은 높은 계산 복잡성을 요구한다. 상세하게는, 적어도 2차(즉, 마지막 2개의 프레임의 채널 변환 빈들)의 선형 예측 코딩이 모든 스케일 팩터 대역에서 예측의 최악의 경우에 각각의 프레임과 채널에 대한 수백 개의 스펙트럼 빈들에 적용된다[ISO/IEC 13818-7, "Information technology - Part 7: Advanced Audio Coding (AAC)," 2006.]. 둘째, FDP 방법은 제한된 전체 예측 이득을 포함한다. 보다 정확하게는, 예측 가능한 고조파 음색 스펙트럼 부분들 사이의 잡음이 많은 성분들이 예측에 적용되기 때문에 예측의 효율성이 제한적일 뿐만 아니라, 이러한 잡음이 많은 부분들은 일반적으로 예측 가능하지 않으므로 오차들을 끌어들인다.
높은 복잡성은 예측기들의 역방향 적응성에 기인한다. 이것은 각각의 빈에 대한 예측 계수들이 이전에 송신된 빈들을 기반으로 계산되어야 함을 의미한다. 따라서 인코더와 디코더 간의 수치 부정확성들은 발산 예측 계수들로 인한 재구성 오류들로 이어질 수 있다. 이 문제를 극복하기 위해, 비트 정밀 동일 적응이 보장되어야 한다. 게다가, 특정 프레임들에서 예측기들의 그룹들이 디세이블된 경우에도, 예측 계수들을 최신 상태로 유지하기 위해 항상 적응이 수행되어야 한다.
따라서 본 발명의 목적은 앞서 언급한 문제들 중 적어도 하나(예를 들어, 둘 다) 피하고 보다 효율적이고 계산상 저렴한 구현으로 이어지는, 오디오 신호를 인코딩하고 그리고/또는 인코딩된 오디오 신호를 디코딩하기 위한 개념을 제공하는 것이다.
이 목적은 독립항들에 의해 해결된다.
종속 청구항들에 의해 유리한 구현들이 해결된다.
실시예들은 오디오 신호를 인코딩하기 위한 인코더를 제공한다. 인코더는 변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하도록 구성되고, 인코더는 현재 프레임 및 적어도 하나의 이전 프레임에 대해 오디오 신호의 스펙트럼 계수들을 결정하도록 구성되며, 인코더는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성되고, 인코더는 간격 값을 결정하도록 구성되며, 인코더는 인코딩된 오디오 신호와 함께 부가 정보로서 송신될 수 있는 간격 값을 기초로 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들을 선택하도록 구성된다.
추가 실시예들은 (예컨대, 앞서 설명한 인코더로 인코딩된) 인코딩된 오디오 신호를 디코딩하기 위한 디코더를 제공한다. 디코더는 변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하도록 구성되고, 디코더는 현재 프레임 및 적어도 하나의 이전 프레임에 대한 오디오 신호의 인코딩된 스펙트럼 계수들을 얻기 위해 인코딩된 오디오 신호를 파싱하도록 구성되며, 디코더는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 선택적으로 적용하도록 구성되고, 디코더는 송신된 간격 값을 기초로, 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들을 선택하도록 구성될 수 있다.
본 발명의 개념에 따르면, 예측 인코딩은 선택된 스펙트럼 계수들에(만) 적용된다. 예측 인코딩이 적용되는 스펙트럼 계수들은 신호 특성들에 따라 선택될 수 있다. 예를 들어, 잡음이 많은 신호 성분들에는 예측 인코딩을 적용하지 않음으로써, 예측 불가능한 잡음이 많은 신호 성분들을 예측함으로써 유도되는 앞서 언급한 오차들이 회피된다. 동시에, 예측 인코딩은 선택된 스펙트럼 성분들에만 적용되기 때문에 계산 복잡성이 감소될 수 있다.
예를 들어, 유도/적응 스펙트럼 도메인 프레임 간 예측 방법들에 의한 변환 코딩에 의해 음색 오디오 신호들의 지각 코딩이 (예컨대, 인코더에 의해) 수행될 수 있다. 예를 들어, 인코더에서 디코더로 적절한 비트스트림으로, 예컨대 간격 값으로서 시그널링될 수 있는 기본 주파수 또는 피치의 정수배들에 위치한 고조파 신호 성분들 주위의 스펙트럼 계수들에만 예측을 적용함으로써 주파수 도메인 예측(FDP)의 효율이 향상될 수 있고, 계산 복잡성이 감소될 수 있다. 본 발명의 실시예들은 바람직하게는 MPEG-H 3D 오디오 코덱으로 구현 또는 통합될 수 있지만, 예컨대, MPEG-2 AAC와 같은 임의의 오디오 변환 코딩 시스템에 적용될 수 있다.
추가 실시예들은 변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법을 제공하며, 이 방법은,
- 현재 프레임 및 적어도 하나의 이전 프레임에 대해 오디오 신호의 스펙트럼 계수들을 결정하는 단계;
- 간격 값을 결정하는 단계; 및
- 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하는 단계를 포함하며, 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들은 간격 값을 기초로 선택된다.
추가 실시예들은 변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법을 제공하며, 이 방법은,
- 현재 프레임 및 적어도 하나의 이전 프레임에 대한 오디오 신호의 인코딩된 스펙트럼 계수들을 얻기 위해, 인코딩된 오디오 신호를 파싱하는 단계;
- 간격 값을 얻는 단계; 및
- 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 선택적으로 적용하는 단계를 포함하며, 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택된다.
첨부 도면들을 참조로 여기서 본 발명의 실시예들이 설명된다.
도 1은 일 실시예에 따라 오디오 신호를 인코딩하기 위한 인코더의 개략적인 블록도를 보여준다.
도 2는 일 실시예에 따라, 현재 프레임에 대한 주파수에 대해 플롯팅된 오디오 신호의 진폭 및 예측 인코딩이 적용되는 대응하는 선택된 스펙트럼 계수들을 도표로 보여준다.
도 3은 현재 프레임에 대한 주파수에 대해 플롯팅된 오디오 신호의 진폭 및 MPEG-2 AAC에 따라 예측이 이루어지는 대응하는 스펙트럼 계수들을 도표로 보여준다.
도 4는 일 실시예에 따른 인코딩된 오디오 신호를 디코딩하기 위한 디코더의 개략적인 블록도를 보여준다.
도 5는 일 실시예에 따라 오디오 신호를 인코딩하기 위한 방법의 흐름도를 보여준다.
도 6은 일 실시예에 따라 인코딩된 오디오 신호를 디코딩하기 위한 방법의 흐름도를 보여준다.
동일한 또는 대등한 엘리먼트들 또는 동일한 또는 대등한 기능을 갖는 엘리먼트들은 다음 설명에서 동일한 또는 대등한 참조 번호들로 표시된다.
다음 설명에서는, 본 발명의 실시예들의 보다 철저한 설명을 제공하도록 복수의 세부사항들이 제시된다. 그러나 본 발명의 실시예들은 이러한 특정 세부사항들 없이 실시될 수도 있음이 해당 기술분야에서 통상의 지식을 가진 자에게 명백할 것이다. 다른 경우들에는, 본 발명의 실시예들을 모호하게 하는 것을 피하기 위해, 잘 알려진 구조들 및 디바이스들은 상세히보다는 블록도 형태로 도시된다. 추가로, 구체적으로 달리 언급되지 않는 한, 이하 설명되는 서로 다른 실시예들의 특징들이 서로 결합될 수도 있다.
도 1은 일 실시예에 따라 오디오 신호(102)를 인코딩하기 위한 인코더(100)의 개략적인 블록도를 보여준다. 인코더(100)는 변환 도메인 또는 필터 뱅크 도메인(104)(예컨대, 주파수 도메인 또는 스펙트럼 도메인)에서 오디오 신호(102)를 인코딩하도록 구성되고, 인코더(100)는 현재 프레임(108_t0)에 대한 오디오 신호(102)의 스펙트럼 계수들(106_t0_f1 내지 106_t0_f6) 및 적어도 하나의 이전 프레임(108_t-1)에 대한 오디오 신호의 스펙트럼 계수들(106_t-1_f1 내지 106_t-1_f6)을 결정하도록 구성된다. 또한, 인코더(100)는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성되고, 인코더(100)는 간격 값을 결정하도록 구성되며, 인코더(100)는 간격 값을 기초로 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 선택하도록 구성된다.
즉, 인코더(100)는 부가 정보로서 송신된 단일 간격 값을 기초로 선택된 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성된다.
이 간격 값은 주파수(예컨대, (오디오 신호(102)의) 고조파 톤의 기본 주파수)에 대응할 수 있는데, 이는 예측이 적용되는 모든 스펙트럼 계수들의 그룹들의 중심들을 그 정수배들과 함께 정의한다. 첫 번째 그룹은 이 주파수를 중심으로 할 수 있고, 두 번째 그룹은 이 주파수와 2의 곱을 중심으로 할 수 있으며, 세 번째 그룹은 이 주파수와 3의 곱을 중심으로 할 수 있는 식이다. 이러한 중심 주파수들의 정보는 대응하는 사인 곡선 신호 성분들(예컨대, 고조파 신호들의 기본 및 배음들)을 예측하기 위한 예측 계수들의 계산을 가능하게 한다. 따라서 예측 계수들의 복잡하고 오류가 발생하기 쉬운 역방향 적응이 더는 필요하지 않다.
실시예들에서, 인코더(100)는 프레임당 하나의 간격 값을 결정하도록 구성될 수 있다.
실시예들에서, 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들은 적어도 하나의 스펙트럼 계수(106_t0_f3)에 의해 분리될 수 있다.
실시예들에서, 인코더(100)는 적어도 하나의 스펙트럼 계수로 분리되는 복수의 개개의 스펙트럼 계수들에, 이를테면 적어도 하나의 스펙트럼 계수로 분리되는 2개의 개개의 스펙트럼 계수들에 예측 인코딩을 적용하도록 구성될 수 있다. 또한, 인코더(100)는 적어도 하나의 스펙트럼 계수로 분리되는 스펙트럼 계수들의 복수의 그룹들(적어도 2개의 스펙트럼 계수들을 포함하는 그룹들 각각)에, 이를테면 적어도 하나의 스펙트럼 계수로 분리되는 스펙트럼 계수들의 2개의 그룹들에 예측 인코딩을 적용하도록 구성될 수 있다. 또한, 인코더(100)는 적어도 하나의 스펙트럼 계수로 분리되는 복수의 개개의 스펙트럼 계수들 및/또는 스펙트럼 계수들의 그룹들에, 이를테면 적어도 하나의 스펙트럼 계수로 분리되는 적어도 하나의 개개의 스펙트럼 계수 및 스펙트럼 계수들의 적어도 하나의 그룹에 예측 인코딩을 적용하도록 구성될 수 있다.
도 1에 도시된 예에서, 인코더(100)는 현재 프레임(108_t0)에 대한 6개의 스펙트럼 계수들(106_t0_f1 내지 106_t0_f6) 및 이전 프레임(108_t-1)에 대한 6개의 스펙트럼 계수들(106_t-1_f1 내지 106_t-1_f6)을 결정하도록 구성된다. 이로써, 인코더(100)는 현재 프레임의 개개의 제 2 스펙트럼 계수(106_t0_f2)에 그리고 현재 프레임(108_t0)의 제 4 및 제 5 스펙트럼 계수들(106_t0_f4, 106_t0_f5)로 이루어진 스펙트럼 계수들의 그룹에 선택적으로 예측 인코딩을 적용하도록 구성된다. 확인될 수 있는 바와 같이, 개개의 제 2 스펙트럼 계수(106_t0_f2) 그리고 제 4 및 제 5 스펙트럼 계수들(106_t0_f4, 106_t0_f5)로 이루어진 스펙트럼 계수들의 그룹은 제 3 스펙트럼 계수(106_t0_f3)에 의해 서로 분리된다.
본 명세서에서 사용되는 "선택적으로"라는 용어는 선택된 스펙트럼 계수들에(만) 예측 인코딩을 적용하는 것을 의미한다는 점에 주목한다. 즉, 예측 인코딩은 반드시 모든 스펙트럼 계수들에 적용되는 것이 아니라 그보다는 선택된 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에만 적용되며, 선택된 개개의 스펙트럼 계수들 및/또는 스펙트럼 계수들의 그룹들은 적어도 하나의 스펙트럼 계수에 의해 서로 분리될 수 있다. 즉, 예측 인코딩은 선택된 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들이 분리되게 하는 적어도 하나의 스펙트럼 계수에 대해 디세이블될 수 있다.
실시예들에서, 인코더(100)는 이전 프레임(108_t-1)의 적어도 대응하는 복수의 개개의 스펙트럼 계수들(106_t-1_f2) 또는 스펙트럼 계수들(106_t-1_f4, 106_t-1_f5)의 그룹들에 기초하여 현재 프레임(108_t0)의 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성될 수 있다.
예를 들어, 인코더(100)는 현재 프레임(108_t0)의 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들과 현재 프레임(또는 그 양자화된 버전들)의 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들 간의 예측 오차들을 코딩함으로써 현재 프레임(108_t0)의 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 예측 인코딩하도록 구성될 수 있다.
도 1에서, 인코더(100)는 현재 프레임(108_t0)의 예측된 개개의 스펙트럼 계수(110_t0_f2)와 현재 프레임(108_t0)의 개개의 스펙트럼 계수(106_t0_f2) 사이 그리고 현재 프레임의 예측 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹과 현재 프레임의 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹 사이의 예측 오차들을 코딩함으로써 개개의 스펙트럼 계수(106_t0_f2) 및 스펙트럼 계수들(106_t0_f4, 106_t0_f5)로 이루어진 스펙트럼 계수들의 그룹을 인코딩한다.
다시 말해, 제 2 스펙트럼 계수(106_t0_f2)는 예측된 제 2 스펙트럼 계수(110_t0_f2)와 (실제 또는 결정된) 제 2 스펙트럼 계수(106_t0_f2) 사이의 예측 오차(또는 차분)를 코딩함으로써 코딩되고, 제 4 스펙트럼 계수(106_t0_f4)는 예측된 제 4 스펙트럼 계수(110_t0_f4)와 (실제 또는 결정된) 제 4 스펙트럼 계수(106_t0_f4) 사이의 예측 오차(또는 차분)를 코딩함으로써 코딩되며, 제 5 스펙트럼 계수(106_t0_f5)는 예측된 제 5 스펙트럼 계수(110_t0_f5)와 (실제 또는 결정된) 제 5 스펙트럼 계수(106_t0_f5) 사이의 예측 오차(또는 차분)를 코딩함으로써 코딩된다.
일 실시예에서, 인코더(100)는 이전 프레임(108_t-1)의 복수의 개개의 스펙트럼 계수들(106_t-1_f2)의 또는 스펙트럼 계수들(106_t-1_f4, 106_t-1_f5)의 그룹들의 대응하는 실제 버전들에 의해 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들을 결정하도록 구성될 수 있다.
다시 말하면, 인코더(100)는 앞서 설명한 결정 프로세스에서, 이전 프레임(108_t-1)의 복수의 실제 개개의 스펙트럼 계수들(106_t-1_f2) 또는 실제 스펙트럼 계수들(106_t-1_f4, 106_t-1_f5)의 그룹들을 직접 사용할 수 있으며, 여기서 106_t-1_f2, 106_t-1_f4 및 106_t-1_f5는 이들이 인코더(100)에 의해 획득되어, 상기 인코더가 변환 도메인 또는 필터 뱅크 도메인(104)에서 동작할 수 있을 때 원래의, 아직 양자화되지 않은 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들을 각각 나타낸다.
예를 들어, 인코더(100)는 이전 프레임(108_t-1)의 제 2 스펙트럼 계수(106_t-1_f2)의 대응하는 아직 양자화되지 않은 버전에 기초하여 현재 프레임(108_t0)의 제 2 예측 스펙트럼 계수(110_t0_f2)를, 이전 프레임(108_t-1)의 제 4 스펙트럼 계수(106_t-1_f4)의 대응하는 아직 양자화되지 않은 버전에 기초하여 현재 프레임(108_t0)의 예측된 제 4 스펙트럼 계수(110_t0_f4)를, 그리고 이전 프레임의 제 5 스펙트럼 계수(106_t-1_f5)의 대응하는 아직 양자화되지 않은 버전에 기초하여 현재 프레임(108_t0)의 예측된 제 5 스펙트럼 계수(110_t0_f5)를 결정하도록 구성될 수 있다.
이러한 접근 방식에 의해, 예측 인코딩 및 디코딩 방식은 양자화 잡음의 일종의 고조파 형성을 나타낼 수 있는데, 이는 도 4와 관련하여 이후에 실시예가 설명되는 대응하는 디코더가 앞서 언급한 결정 단계에서, 이전 프레임(108_t-1)의 복수의 개개의 스펙트럼 계수들(106_t-1_f2)의 또는 스펙트럼 계수들(106_t-1_f4, 106_t-1_f5)의 복수의 그룹들의 송신된 양자화된 버전들만을 예측 디코딩에 이용할 수 있기 때문이다.
예를 들어, 종래에는 시간 도메인에서 장기 예측(LTP)에 의해 수행되는 바와 같은 그러한 고조파 잡음 형성은 예측 코딩에 주관적으로 유리할 수 있지만, 어떤 경우들에 이는 디코딩된 오디오 신호에 원치 않는 과도한 양의 조성이 도입되게 할 수 있기 때문에 바람직하지 않을 수 있다. 이러한 이유로, 대응하는 디코딩과 완전히 동기화되고, 그에 따라 임의의 가능한 예측 이득들만을 활용하지만, 양자화 잡음 형성을 야기하지 않는 대안적인 예측 인코딩 방식이 이후에 설명된다. 이러한 대안적인 인코딩 실시예에 따르면, 인코더(100)는 이전 프레임(108_t-1)의 복수의 개개의 스펙트럼 계수들(106_t-1_f2) 또는 스펙트럼 계수들(106_t-1_f4, 106_t-1_f5)의 그룹들의 대응하는 양자화된 버전들을 사용하여 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들을 결정하도록 구성될 수 있다.
예를 들어, 인코더(100)는 이전 프레임(108_t-1)의 제 2 스펙트럼 계수(106_t-1_f2)의 대응하는 양자화된 버전에 기초하여 현재 프레임(108_t0)의 제 2 예측 스펙트럼 계수(110_t0_f2)를, 이전 프레임(108_t-1)의 제 4 스펙트럼 계수(106_t-1_f4)의 대응하는 양자화된 버전에 기초하여 현재 프레임(108_t0)의 예측된 제 4 스펙트럼 계수(110_t0_f4)를, 그리고 이전 프레임의 제 5 스펙트럼 계수(106_t-1_f5)의 대응하는 양자화된 버전에 기초하여 현재 프레임(108_t0)의 예측된 제 5 스펙트럼 계수(110_t0_f5)를 결정하도록 구성될 수 있다.
또한, 인코더(100)는 간격 값으로부터 예측 계수들(112_f2, 114_f2, 112_f4, 114_f4, 112_f5, 114_f5)을 도출하고, 적어도 2개의 이전 프레임들(108_t-1, 108_t-2)의 복수의 개개의 스펙트럼 계수들(106_t-1_f2, 106_t-2_f2) 또는 스펙트럼 계수들(106_t-1_f4, 106_t-2_f4, 106_t-1_f5, 106_t-2_f5)의 그룹들의 대응하는 양자화된 버전들을 사용하여 그리고 도출된 예측 계수들(112_f2, 114_f2, 112_f4, 114_f4, 112_f5, 114_f5)을 사용하여 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들을 계산하도록 구성될 수 있다.
예를 들어, 인코더(100)는 간격 값으로부터 제 2 스펙트럼 계수(106_t0_f2)에 대한 예측 계수들(112_f2, 114_f2)을 도출하고, 간격 값으로부터 제 4 스펙트럼 계수(106_t0_f4)에 대한 예측 계수들(112_f4, 114_f4)을 도출하고, 간격 값으로부터 제 5 스펙트럼 계수(106_t0_f5)에 대한 예측 계수들(112_f5, 114_f5)을 도출하도록 구성될 수 있다.
예를 들어, 예측 계수들의 도출은 다음의 방식으로 도출될 수 있다: 간격 값이 주파수(f0) 또는 그 코딩된 버전에 대응한다면, 예측이 가능해지는 스펙트럼 계수들의 K번째 그룹의 중심 주파수는 fc = K*f0이다. 샘플링 주파수가 fs이고 변환 홉 크기(연속적인 프레임들 사이의 이동)가 N이라면, 주파수(fc)를 갖는 사인 곡선 신호를 가정하는 K번째 그룹의 이상적인 예측 계수들은 다음과 같다:
p1 = 2*cos(N*2*pi*fc/fs) 그리고 p2 = -1.
예를 들어, 스펙트럼 계수들(106_t0_f4, 106_t0_f5) 둘 다 이 그룹 내에 있다면, 예측 계수들은 다음과 같다:
112_f4 = 112_f5 = 2*cos(N*2*pi*fc/fs) 그리고 114_f4 = 114_f5 = -1.
안정성 이유들로, 댐핑 팩터(d)가 도입되어, 수정된 예측 계수들을 도출할 수 있다:
112_f4' = 112_f5' = d*2*cos(N*2*pi*fc/fs), 114_f4' = 114_f5' = d2.
간격 값은 코딩된 오디오 신호(120)에서 송신되므로, 디코더는 정확히 동일한 예측 계수들(212_f4 = 212_f5 = 2*cos(N*2*pi*fc/fs) 그리고 114_f4 = 114_f5 = -1)을 도출할 수 있다. 댐핑 팩터가 사용된다면, 계수들은 그에 따라 수정될 수 있다.
도 1에 표시된 바와 같이, 인코더(100)는 인코딩된 오디오 신호(120)를 제공하도록 구성될 수 있다. 이로써, 인코더(100)는 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 대한 예측 오차들의 양자화된 버전들을 인코딩된 오디오 신호(120)에 포함시키도록 구성될 수 있다. 또한, 인코더(100)는 인코딩된 오디오 신호(120)에 예측 계수들(112_f2 내지 114_f5)을 포함하지 않도록 구성될 수 있다.
따라서 인코더(100)는 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들 그리고 이들로부터 예측된 개개의 스펙트럼 계수(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹과 현재 프레임의 개개의 스펙트럼 계수(106_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹 사이의 예측 오차들을 계산하기 위해 예측 계수들(112_f2 내지 114_f5)만을 사용할 수 있지만, 인코딩된 오디오 신호(120)에서 개개의 스펙트럼 계수들(106_t0_f4)(또는 그의 양자화된 버전) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들(또는 그 양자화된 버전들)도 예측 계수들(112_f2 내지 114_f5)도 제공하지 않을 것이다. 그러므로 도 4와 관련하여 뒤에 실시예가 설명되는 디코더는 간격 값으로부터 현재 프레임에 대한 복수의 예측된 개개의 스펙트럼 계수들 또는 예측된 스펙트럼 계수들의 그룹들을 계산하기 위한 예측 계수들(112_f2 내지 114_f5)을 도출할 수 있다.
즉, 인코더(100)는 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 대한 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들의 양자화된 버전들 대신 예측 오차들의 양자화된 버전들을 포함하는 인코딩된 오디오 신호(120)를 제공하도록 구성될 수 있다.
또한, 인코더(100)는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들이 분리되게 하는 스펙트럼 계수들(106_t0_f3)의 양자화된 버전들을 포함하는 인코딩된 오디오 신호(102)를 제공하여, 인코딩된 오디오 신호(120)에 예측 오차들의 양자화된 버전들이 포함되는 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들과 예측 인코딩을 사용하지 않고도 양자화된 버전들이 제공되는 스펙트럼 계수들(106_t0_f3) 또는 스펙트럼 계수들의 그룹들의 교대가 존재하도록 구성될 수 있다.
실시예들에서, 인코더(100)는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들이 분리되게 하는 스펙트럼 계수들(106_t0_f3)의 양자화된 버전들 및 예측 오차들의 양자화된 버전들을 엔트로피 인코딩하고, 엔트로피 인코딩된 버전들을 (이것의 엔트로피 인코딩되지 않은 버전 대신에) 인코딩된 오디오 신호(120)에 포함시키도록 추가로 구성될 수 있다.
도 2는 현재 프레임(108_t0)에 대한 주파수에 대해 플롯팅된 오디오 신호(102)의 진폭을 도표로 도시한다. 또한, 도 2에서, 오디오 신호(102)의 현재 프레임(108_t0)에 대해 인코더(100)에 의해 결정된 변환 도메인 또는 필터 뱅크 도메인에서의 스펙트럼 계수들이 표시된다.
도 2에 도시된 바와 같이, 인코더(100)는 적어도 하나의 스펙트럼 계수에 의해 분리되는 스펙트럼 계수들의 복수의 그룹들(116_1 내지 116_6)에 예측 인코딩을 선택적으로 적용하도록 구성될 수 있다. 상세하게는, 도 2에 도시된 실시예에서, 인코더(100)는 스펙트럼 계수들의 6개의 그룹들(116_1 내지 116_6)에 예측 인코딩을 선택적으로 적용하고, 스펙트럼 계수들의 처음 5개의 그룹들(116_1 내지 116_5) 각각은 3개의 스펙트럼 계수들을 포함하며(예컨대, 두 번째 그룹(116_2)은 스펙트럼 계수들(106_t0_f8, 106_t0_f9, 106_t0_f10)을 포함함), 스펙트럼 계수들의 6번째 그룹(116_6)은 2개의 스펙트럼 계수들을 포함한다. 이로써, 스펙트럼 계수들의 6개의 그룹들(116_1 내지 116_6)은 예측 인코딩이 적용되지 않는 스펙트럼 계수들의 (5개의) 그룹들(118_1 내지 118_5)에 의해 분리된다.
즉, 도 2에 표시된 바와 같이, 인코더(100)는 예측 인코딩이 적용되는 스펙트럼 계수들의 그룹들(116_1 내지 116_6)과 예측 인코딩이 적용되지 않는 스펙트럼 계수들의 그룹들(118_1 내지 118_5)의 교대가 존재하도록, 스펙트럼 계수들의 그룹들(116_1 내지 110_6)에 예측 인코딩을 선택적으로 적용하도록 구성될 수 있다.
실시예들에서, 인코더(100)는 (도 2에 화살표들(122_1, 122_2)로 표시된) 간격 값을 결정하도록 구성될 수 있으며, 인코더(100)는 간격 값을 기초로 예측 인코딩이 적용되는 스펙트럼 계수들의 복수의 그룹들(116_1 내지 116_6)(또는 복수의 개개의 스펙트럼 계수들)을 선택하도록 구성될 수 있다.
간격 값은 예를 들어, 오디오 신호의 피크들(124_1, 124_2)과 같은, 오디오 신호(102)의 2개의 특성 주파수들 사이의 간격(또는 거리)일 수 있다. 또한, 간격 값은 오디오 신호의 2개의 특성 주파수들 사이의 간격을 근사화하는 스펙트럼 계수들의 정수 번호(또는 스펙트럼 계수들의 인덱스들)일 수 있다. 당연히, 간격 값은 오디오 신호의 2개의 특성 주파수들 사이의 간격을 기술하는 스펙트럼 계수들의 실수 번호 또는 정수 번호의 분수 또는 배수일 수 있다.
실시예들에서, 인코더(100)는 오디오 신호(102)의 순시 기본 주파수를 결정하고 순시 기본 주파수 또는 순시 기본 주파수의 분수 또는 배수로부터 간격 값을 도출하도록 구성될 수 있다.
예를 들어, 오디오 신호(102)의 제 1 피크(124_1)는 오디오 신호(102)의 순시 기본 주파수(또는 피치 또는 제 1 고조파)일 수 있다. 따라서 인코더(100)는 오디오 신호(102)의 순시 기본 주파수를 결정하고 순시 기본 주파수 또는 순시 기본 주파수의 분수 또는 배수로부터 간격 값을 도출하도록 구성될 수 있다. 그 경우, 간격 값은 오디오 신호(102)의 순시 기본 주파수(124_1)와 제 2 고조파(124_2) 사이의 간격을 근사화하는 스펙트럼 계수들의 정수 번호(또는 그 배수 또는 분수)일 수 있다.
당연히, 오디오 신호(102)는 2개보다 많은 고조파들을 포함할 수 있다. 예를 들어, 도 2에 도시된 오디오 신호(102)는 오디오 신호(102)가 순시 기본 주파수의 정수배마다 고조파를 포함하도록 스펙트럼 분포된 6개의 고조파들(124_1 내지 124_6)을 포함한다. 당연히, 오디오 신호(102)가 모든 고조파들이 아니라 제 1, 제 3 및 제 5 고조파와 같이 고조파들 중 일부만을 포함하는 것이 또한 가능하다.
실시예들에서, 인코더(100)는 예측 인코딩을 위해 공간 값에 의해 정의된 고조파 그리드에 따라 스펙트럼 배열된 스펙트럼 계수들의 그룹들(116_1 내지 116_6)(또는 개개의 스펙트럼 계수들)을 선택하도록 구성될 수 있다. 이로써, 간격 값에 의해 정의된 고조파 그리드는 오디오 신호(102) 내의 고조파들의 주기적인 스펙트럼 분포(등거리 간격)를 기술한다. 다시 말해서, 간격 값에 의해 정의된 고조파 그리드는 오디오 신호의 고조파들의 등거리 간격을 기술하는 간격 값들의 시퀀스일 수 있다.
또한, 인코더(100)는 예측 인코딩을 위해, 스펙트럼 인덱스들이 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 (예컨대, 미리 결정된 또는 가변) 범위 내에 있는 스펙트럼 계수들(예컨대, 그러한 스펙트럼 계수들만)을 선택하도록 구성될 수 있다.
간격 값으로부터, 오디오 신호(102)의 고조파들을 나타내는 스펙트럼 계수들의 인덱스들(또는 번호들)이 도출될 수 있다. 예를 들어, 제 4 스펙트럼 계수(106_t0_f4)가 오디오 신호(102)의 순시 기본 주파수를 나타낸다고 가정하고, 간격 값이 5라고 가정하면, 간격 값에 기초하여 인덱스 9를 갖는 스펙트럼 계수가 도출될 수 있다. 도 2에서 알 수 있는 바와 같이, 인덱스 9를 갖는 그렇게 도출된 스펙트럼 계수, 즉 제 9 스펙트럼 계수(106_t0_f9)는 제 2 고조파를 나타낸다. 마찬가지로, 제 3 내지 제 6 고조파들(124_3 내지 124_6)을 나타내는 인덱스들(14, 19, 24, 29)을 갖는 스펙트럼 계수들이 도출될 수 있다. 그러나 간격 값에 기초하여 도출된 복수의 스펙트럼 인덱스들과 동일한 인덱스들을 갖는 스펙트럼 계수들뿐만 아니라 간격 값에 기초하여 도출된 복수의 스펙트럼 인덱스들 주위의 주어진 범위 내의 인덱스들을 갖는 스펙트럼 계수들도 예측적으로 인코딩될 수 있다. 예컨대, 도 2에 도시된 바와 같이, 범위는 3일 수 있어, 복수의 개개의 스펙트럼 계수들이 예측 인코딩을 위해 선택되는 것이 아니라, 그보다는 스펙트럼 계수들의 복수의 그룹들이 선택될 수 있다.
또한, 인코더(100)는 예측 인코딩이 적용되는 스펙트럼 계수들의 그룹들(116_1 내지 116_6)(또는 복수의 개개의 스펙트럼 계수들)과 예측 인코딩이 적용되는 스펙트럼 계수들의 그룹들(또는 복수의 개개의 스펙트럼 계수들)이 분리되게 하는 스펙트럼 계수들 간에 +/-1 스펙트럼 계수의 공차로 주기적인, 주기적 교대가 존재하게, 예측 인코딩이 적용되는 스펙트럼 계수들의 그룹들(116_1 내지 116_6)(또는 복수의 개개의 스펙트럼 계수들)을 선택하도록 구성될 수 있다. 오디오 신호(102)의 2개의 고조파들 사이의 거리가 정수 간격 값(스펙트럼 계수들의 인덱스들 또는 번호들에 대한 정수)과 같은 것이 아니라 그보다는 그 분수 또는 배수와 같을 때 +/-1 스펙트럼 계수의 공차가 요구될 수 있다. 이것은 또한, 화살표들(122_1 내지 122_6)이 항상 대응하는 스펙트럼 계수들의 중심 또는 중간을 정확히 지적하는 것은 아니기 때문에 도 2에서 확인될 수 있다.
즉, 오디오 신호(102)는 적어도 2개의 고조파 신호 성분들(124_1 내지 124_6)을 포함할 수 있고, 인코더(100)는 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1 내지 124_6) 또는 적어도 2개의 고조파 신호 성분들(124_1 내지 124_6) 주위의 스펙트럼 환경들을 나타내는 스펙트럼 계수들의 그러한 복수의 그룹들(116_1 내지 116_6)(또는 개개의 스펙트럼 계수들)에 선택적으로 예측 인코딩을 적용하도록 구성될 수 있다. 적어도 2개의 고조파 신호 성분들(124_1 내지 124_6) 주위의 스펙트럼 환경들은 예를 들면, +/-1, 2, 3, 4 또는 5개의 스펙트럼 성분들일 수 있다.
이로써, 인코더(100)는 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1 내지 124_6) 또는 적어도 2개의 고조파 신호 성분들(124_1 내지 124_6)의 스펙트럼 환경들을 나타내지 않는 스펙트럼 계수들의 그러한 그룹들(118_1 내지 118_5)(또는 복수의 개개의 스펙트럼 계수들)에는 예측 인코딩을 적용하지 않도록 구성될 수 있다. 즉, 인코더(100)는 신호 고조파들(124_1 내지 124_6) 사이의 비음색 배경 잡음에 속하는 스펙트럼 계수들의 그러한 복수의 그룹들(118_1 내지 118_5)(또는 개개의 스펙트럼 계수들)에 예측 인코딩을 적용하지 않도록 구성될 수 있다.
또한, 인코더(100)는 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1 내지 124_6) 간의 스펙트럼 간격을 나타내는 고조파 간격 값을 결정하도록 구성될 수 있고, 고조파 간격 값은 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1 내지 124_6)을 나타내는 그러한 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들을 나타낸다.
더욱이, 인코더(100)는 인코딩된 오디오 신호(120)가 간격 값(예를 들어, 프레임당 하나의 간격 값) 또는 (대안으로) 간격 값이 직접 도출될 수 있는 파라미터를 포함하게, 인코딩된 오디오 신호(120)를 제공하도록 구성될 수 있다.
본 발명의 실시예들은, 인코더(송신기)(100)로부터 각각의 디코더(수신기)로 시그널링되는 고조파 간격 값을 FDP 프로세스에 도입하여 둘 다 완전히 동기화된 방식으로 동작할 수 있게 함으로써, FDP 방법의 앞서 언급한 두 가지 문제들을 해결한다. 상기 고조파 간격 값은 스펙트럼 빈들(스펙트럼 계수들)이 예측될 식별자들 및 코딩될 프레임과 연관된 하나 이상의 스펙트럼들의 순시 기본 주파수(또는 피치)의 표시자로서의 역할을 할 수 있다. 보다 구체적으로, (고조파 간격 값에 의해 정의된) 기본 피치의 정수배들에 (인덱스에 관해) 위치하는 고조파 신호 성분들 주위의 그러한 스펙트럼 계수들만이 예측을 거치게 될 것이다. 도 2 및 도 3은 간단한 예로 이 피치 적응 예측 접근 방식을 예시하며, 여기서 도 3은 고조파 그리드 주위에서만 예측하는 것이 아니라 특정 정지 주파수 아래의 모든 스펙트럼 빈을 예측에 적용하는 MPEG-2 AAC에서의 최첨단 예측기의 동작을 도시하고, 도 2는 고조파 간격 그리드에 가까운 그러한 "음색" 빈들에 대해서만 예측을 수행하도록 통합된 일 실시예에 따른 수정을 갖는 동일한 예측기를 도시한다.
도 2와 도 3의 비교는 일 실시예에 따른 수정의 두 가지 이점들을 드러내는데, 즉 (1) 훨씬 더 적은 수의 스펙트럼 빈들이 예측 프로세스에 포함되어 (주어진 예에서는 빈들의 약 3/5만이 예측되기 때문에 대략 40%만큼) 복잡성을 감소시키고, (2) 신호 고조파들 간의 비음색 배경 잡음에 속하는 빈들은 예측의 영향을 받지 않는데, 이는 예측의 효율을 증가시켜야 한다.
고조파 간격 값은 반드시 입력 신호의 실제 순시 피치에 대응할 필요는 없지만, 예측 프로세스의 효율의 전반적인 향상을 야기한다면 실제 피치의 분수 또는 배수를 나타낼 수 있다는 점에 주목한다. 또한, 고조파 간격 값은 빈 인덱싱 또는 대역폭 유닛의 정수배를 반영할 필요가 없지만 상기 유닛들의 분수를 포함할 수 있다는 점이 강조되어야 한다.
이어서, MPEG 스타일 오디오 코더에 대한 바람직한 구현이 설명된다.
피치 적응 예측은 바람직하게 MPEG-2 AAC[ISO/IEC 13818-7, "Information technology - Part 7: Advanced Audio Coding (AAC)," 2006.]에, 또는 AAC에서와 유사한 예측기들을 이용하여, MPEG-H 3D 오디오 코덱[ISO/IEC 23008-3, "Information technology - High efficiency coding, part 3: 3D audio," 2015.]에 통합된다. 특히, 독립적으로 코딩되지 않은 각각의 프레임 및 채널에 대한 각각의 비트스트림에 1 비트 플래그가 기록되고 이로부터 판독될 수 있다(독립적인 프레임 채널들의 경우, 독립성을 보장하도록 예측이 디세이블될 수 있기 때문에 플래그가 송신되지 않을 수 있다). 플래그가 1로 설정된다면, 다른 8 비트가 기록 및 판독될 수 있다. 이러한 8 비트는 주어진 프레임 및 채널에 대한 고조파 간격 값(예컨대, 이에 대한 인덱스)의 양자화된 버전을 나타낸다. 선형 또는 비선형 맵핑 함수를 사용하여 양자화된 버전으로부터 도출된 고조파 간격 값을 이용하면, 예측 프로세스는 도 2에 도시된 실시예에 따른 방식으로 실행될 수 있다. 바람직하게는, 고조파 그리드 주위의 1. 5개의 빈들의 최대 거리 내에 위치하는 빈들만이 예측을 받는다. 예를 들어, 고조파 간격 값이 빈 인덱스 47. 11에서 고조파 라인을 나타낸다면, 인덱스들 46, 47 및 48의 빈들만이 예측된다. 그러나 상기 최대 거리는 모든 채널들 및 프레임들에 대해 선험적으로 고정되거나 또는 고조파 간격 값에 기초하여 각각의 프레임 및 채널에 대해 개별적으로 다르게 지정될 수 있다.
도 4는 인코딩된 신호(120)를 디코딩하기 위한 디코더(200)의 개략적인 블록도를 보여준다. 디코더(200)는 변환 도메인 또는 필터 뱅크 도메인(204)에서 인코딩된 오디오 신호(120)를 디코딩하도록 구성되고, 디코더(200)는 현재 프레임(208_t0)에 대한 오디오 신호의 인코딩된 스펙트럼 계수들(206_t0_f1 내지 206_t0_f6) 및 적어도 하나의 이전 프레임(208_t-1)에 대한 인코딩된 스펙트럼 계수들(206_t-1_f0 내지 206_t-1_f6)을 얻기 위해, 인코딩된 오디오 신호(120)를 파싱하도록 구성되며, 디코더(200)는 적어도 하나의 인코딩된 스펙트럼 계수에 의해 분리되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 선택적으로 적용하도록 구성된다.
실시예들에서, 디코더(200)는 적어도 하나의 인코딩된 스펙트럼 계수로 분리되는 복수의 개개의 인코딩된 스펙트럼 계수들에, 이를테면 적어도 하나의 인코딩된 스펙트럼 계수로 분리되는 2개의 개개의 인코딩된 스펙트럼 계수들에 예측 디코딩을 적용하도록 구성될 수 있다. 또한, 디코더(200)는 적어도 하나의 인코딩된 스펙트럼 계수들로 분리되는 인코딩된 스펙트럼 계수들의 복수의 그룹들(적어도 2개의 인코딩된 스펙트럼 계수들을 포함하는 그룹들 각각)에, 이를테면 적어도 하나의 인코딩된 스펙트럼 계수로 분리되는 인코딩된 스펙트럼 계수들의 2개의 그룹들에 예측 디코딩을 적용하도록 구성될 수 있다. 또한, 디코더(200)는 적어도 하나의 인코딩된 스펙트럼 계수로 분리되는 복수의 개개의 인코딩된 스펙트럼 계수들 및/또는 인코딩된 스펙트럼 계수들의 그룹들에, 이를테면 적어도 하나의 인코딩된 스펙트럼 계수로 분리되는 적어도 하나의 인코딩된 스펙트럼 계수 및 인코딩된 스펙트럼 계수들의 적어도 하나의 그룹에 예측 디코딩을 적용하도록 구성될 수 있다.
도 4에 도시된 예에서, 디코더(200)는 현재 프레임(208_t0)에 대한 6개의 인코딩된 스펙트럼 계수들(206_t0_f1 내지 206_t0_f6) 및 이전 프레임(208_t-1)에 대한 6개의 인코딩된 스펙트럼 계수들(206_t-1_f1 내지 206_t-1_f6)을 결정하도록 구성된다. 이로써, 디코더(200)는 현재 프레임의 개개의 제 2 인코딩된 스펙트럼 계수(206_t0_f2)에 그리고 현재 프레임(208_t0)의 제 4 및 제 5 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)로 이루어진 인코딩된 스펙트럼 계수들의 그룹에 선택적으로 예측 디코딩을 적용하도록 구성된다. 확인될 수 있는 바와 같이, 개개의 제 2 인코딩된 스펙트럼 계수(206_t0_f2) 그리고 제 4 및 제 5 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)로 이루어진 인코딩된 스펙트럼 계수들의 그룹은 제 3 인코딩된 스펙트럼 계수(206_t0_f3)에 의해 서로 분리된다.
본 명세서에서 사용되는 "선택적으로"라는 용어는 선택된 인코딩된 스펙트럼 계수들에(만) 예측 디코딩을 적용하는 것을 의미한다는 점에 주목한다. 즉, 예측 디코딩은 반드시 모든 인코딩된 스펙트럼 계수들에 적용되는 것이 아니라 그보다는 선택된 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에만 적용되며, 선택된 개개의 인코딩된 스펙트럼 계수들 및/또는 인코딩된 스펙트럼 계수들의 그룹들은 적어도 하나의 인코딩된 스펙트럼 계수에 의해 서로 분리된다. 즉, 예측 디코딩은 선택된 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들이 분리되게 하는 적어도 하나의 인코딩된 스펙트럼 계수에 적용되지 않는다.
실시예들에서, 디코더(200)는 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹이 분리되게 하는 적어도 하나의 인코딩된 스펙트럼 계수(206_t0_f3)에는 예측 디코딩을 적용하지 않도록 구성될 수 있다.
디코더(200)는 인코딩된 스펙트럼 계수들을 엔트로피 디코딩하여, 예측 디코딩이 적용될 스펙트럼 계수들(206_t0_f2, 2016_t0_f4, 206_t0_f5)에 대한 양자화된 예측 오차들 및 예측 디코딩이 적용되지 않을 적어도 하나의 스펙트럼 계수에 대한 양자화된 스펙트럼 계수들(206_t0_f3)을 얻도록 구성될 수 있다. 이로써, 디코더(200)는 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(210_t0_f4, 210_t0_f5)의 그룹들에 양자화된 예측 오차들을 적용하여, 현재 프레임(208_t0)에 대해, 예측 디코딩이 적용되는 인코딩된 스펙트럼 계수들(206_t0_f2, 206_t0_f4, 206_t0_f5)과 연관된 디코딩된 스펙트럼 계수들을 얻도록 구성될 수 있다.
예를 들어, 디코더(200)는 제 2 양자화된 스펙트럼 계수(206_t0_f2)에 대한 제 2 양자화된 예측 오차를 얻고 제 2 양자화된 예측 오차를 예측된 제 2 스펙트럼 계수(210_t0_f2)에 적용하여 제 2 인코딩된 스펙트럼 계수(206_t0_f2)와 연관된 제 2 디코딩된 스펙트럼 계수를 얻도록 구성될 수 있고, 디코더(200)는 제 4 양자화된 스펙트럼 계수(206_t0_f4)에 대한 제 4 양자화된 예측 오차를 얻고 제 4 양자화된 예측 오차를 예측된 제 4 스펙트럼 계수(210_t0_f4)에 적용하여 제 4 인코딩된 스펙트럼 계수(206_t0_f4)와 연관된 제 4 디코딩된 스펙트럼 계수를 얻도록 구성될 수 있으며, 디코더(200)는 제 5 양자화된 스펙트럼 계수(206_t0_f5)에 대한 제 5 양자화된 예측 오차를 획득하고 제 5 양자화된 예측 오차를 예측된 제 5 스펙트럼 계수(210_t0_f5)에 적용하여 제 5 인코딩된 스펙트럼 계수(206_t0_f5)와 연관된 제 5 디코딩된 스펙트럼 계수를 얻도록 구성될 수 있다.
또한, 디코더(200)는 이전 프레임(208_t-1)의 대응하는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t-1_f2)(예컨대, 복수의 개개의 인코딩된 스펙트럼 계수들(206_t-1_f2)과 연관된 복수의 이전에 디코딩된 스펙트럼 계수들을 사용하여) 또는 인코딩된 스펙트럼 계수들(206_t-1_f4, 206_t-1_f5)의 그룹들(예컨대, 인코딩된 스펙트럼 계수들(206_t-1_f4, 206_t-1_f5)의 그룹들과 연관된 이전에 디코딩된 스펙트럼 계수들의 그룹들을 사용하여)을 기초로 현재 프레임(208_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(210_t0_f4, 210_t0_f5)의 그룹들을 결정하도록 구성될 수 있다.
예를 들어, 디코더(200)는 이전 프레임(208_t-1)의 제 2 인코딩된 스펙트럼 계수(206_t-1_f2)와 연관된 이전에 디코딩된(양자화된) 제 2 스펙트럼 계수를 사용하여 현재 프레임(208_t0)의 제 2 예측 스펙트럼 계수(210_t0_f2)를, 이전 프레임(208_t-1)의 제 4 인코딩된 스펙트럼 계수(206_t-1_f4)와 연관된 이전에 디코딩된(양자화된) 제 4 스펙트럼 계수를 사용하여 현재 프레임(208_t0)의 제 4 예측 스펙트럼 계수(210_t0_f4)를, 그리고 이전 프레임(208_t-1)의 제 5 인코딩된 스펙트럼 계수(206_t-1_f5)와 연관된 이전에 디코딩된(양자화된) 제 5 스펙트럼 계수를 사용하여 현재 프레임(208_t0)의 제 5 예측 스펙트럼 계수(210_t0_f5)를 결정하도록 구성될 수 있다.
더욱이, 디코더(200)는 간격 값으로부터 예측 계수들을 도출하도록 구성될 수 있고, 디코더(200)는 적어도 2개의 이전 프레임들(208_t-1, 208_t-2)의 대응하는 복수의 이전에 디코딩된 개개의 스펙트럼 계수들 또는 이전에 디코딩된 스펙트럼 계수들의 그룹들을 사용하고 그리고 도출된 예측 계수들을 사용하여 현재 프레임(208_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(210_t0_f4, 210_t0_f5)의 그룹들을 계산하도록 구성될 수 있다.
예를 들어, 디코더(200)는 간격 값으로부터 제 2 인코딩된 스펙트럼 계수(206_t0_f2)에 대한 예측 계수들(212_f2, 214_f2)을 도출하고, 간격 값으로부터 제 4 인코딩된 스펙트럼 계수(206_t0_f4)에 대한 예측 계수들(212_f4, 214_f4)을 도출하고, 간격 값으로부터 제 5 인코딩된 스펙트럼 계수(206_t0_f5)에 대한 예측 계수들(212_f5, 214_f5)을 도출하도록 구성될 수 있다.
디코더(200)는 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 대해 복수의 개개의 양자화된 스펙트럼 계수들 또는 양자화된 스펙트럼 계수들의 그룹들 대신 양자화된 예측 오차들을 얻기 위해, 인코딩된 오디오 신호(120)를 디코딩하도록 구성될 수 있다는 점에 주목한다.
또한, 디코더(200)는 양자화된 예측 오차들이 획득되는 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들과 양자화된 스펙트럼 계수들이 획득되는 인코딩된 스펙트럼 계수들(206_t0_f3) 또는 인코딩된 스펙트럼 계수들의 그룹들의 교대가 존재하도록, 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들이 분리되게 하는 양자화된 스펙트럼 계수들을 얻기 위해 인코딩된 오디오 신호(120)를 디코딩하도록 구성될 수 있다.
디코더(200)는 예측 디코딩이 적용되는 인코딩된 스펙트럼 계수들(206_t0_f2, 206_t0_f4, 206_t0_f5)과 연관된 디코딩된 스펙트럼 계수들을 사용하여, 그리고 예측 디코딩이 적용되지 않는 인코딩된 스펙트럼 계수들(206_t0_f1, 206_t0_f3, 206_t0_f6)과 연관된 엔트로피 디코딩된 스펙트럼 계수들을 사용하여, 디코딩된 오디오 신호(220)를 제공하도록 구성될 수 있다.
실시예들에서, 디코더200)는 간격 값을 얻도록 구성될 수 있으며, 디코더(200)는 간격 값을 기초로 예측 인코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들을 선택하도록 구성될 수 있다.
대응하는 인코더(100)의 설명과 관련하여 이미 위에서 언급한 바와 같이, 간격 값은 예를 들어 오디오 신호의 2개의 특성 주파수들 사이의 간격(또는 거리)일 수 있다. 또한, 간격 값은 오디오 신호의 2개의 특성 주파수들 사이의 간격을 근사화하는 스펙트럼 계수들의 정수 번호(또는 스펙트럼 계수들의 인덱스들)일 수 있다. 당연히, 간격 값은 오디오 신호의 2개의 특성 주파수들 사이의 간격을 기술하는 스펙트럼 계수들의 정수 번호의 분수 또는 배수일 수 있다.
디코더(200)는 예측 디코딩을 위해 간격 값에 의해 정의된 고조파 그리드에 따라 스펙트럼 배열된 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들을 선택하도록 구성될 수 있다. 간격 값에 의해 정의된 고조파 그리드는 오디오 신호(102) 내의 고조파들의 주기적인 스펙트럼 분포(등거리 간격)를 기술할 수 있다. 다시 말해서, 간격 값에 의해 정의된 고조파 그리드는 오디오 신호(102)의 고조파들의 등거리 간격을 기술하는 간격 값들의 시퀀스일 수 있다.
더욱이, 디코더(200)는 예측 디코딩을 위해, 스펙트럼 인덱스들이 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 범위(예컨대, 미리 결정된 또는 가변 범위) 내에 있는 스펙트럼 계수들(예컨대, 그러한 스펙트럼 계수들만)을 선택하도록 구성될 수 있다. 이로써, 디코더(200)는 간격 값에 따라 범위의 폭을 설정하도록 구성될 수 있다.
실시예들에서, 인코딩된 오디오 신호는 간격 값 또는 간격 값의 인코딩된 버전(예를 들어, 간격 값이 직접 도출될 수 있는 파라미터)을 포함할 수 있으며, 디코더(200)는 인코딩된 오디오 신호로부터 간격 값 또는 간격 값의 인코딩된 버전을 추출하여 간격 값을 얻도록 구성될 수 있다.
대안으로, 디코더200)는 간격 값을 이것만으로 결정하도록 구성될 수 있는데, 즉 인코딩된 오디오 신호는 간격 값을 포함하지 않는다. 그 경우, 디코더(200)는 (오디오 신호(102)를 나타내는 인코딩된 오디오 신호(120)의) 순시 기본 주파수를 결정하고 순시 기본 주파수 또는 순시 기본 주파수의 분수 또는 배수로부터 간격 값을 도출하도록 구성될 수 있다.
실시예들에서, 디코더(200)는 예측 디코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들과 예측 디코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들이 분리되게 하는 스펙트럼 계수들 간에 +/-1 스펙트럼 계수의 공차로 주기적인, 주기적 교대가 존재하게, 예측 디코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들을 선택하도록 구성될 수 있다.
실시예들에서, 인코딩된 오디오 신호(120)로 표현된 오디오 신호(102)는 적어도 2개의 고조파 신호 성분들을 포함하며, 디코더(200)는 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들 또는 적어도 2개의 고조파 신호 성분들 주위의 스펙트럼 환경들을 나타내는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 선택적으로 예측 디코딩을 적용하도록 구성된다. 적어도 2개의 고조파 신호 성분들 주위의 스펙트럼 환경들은 예를 들면, +/-1, 2, 3, 4 또는 5개의 스펙트럼 성분들일 수 있다.
이로써, 디코더(200)는 적어도 2개의 고조파 신호 성분들을 식별하고, (예컨대, 식별된 고조파 신호 성분들을 나타내거나 식별된 고조파 신호 성분들을 둘러싸는) 식별된 고조파 신호 성분들과 연관된 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 선택적으로 예측 디코딩을 적용하도록 구성될 수 있다.
대안으로, 인코딩된 오디오 신호(120)는 적어도 2개의 고조파 신호 성분들을 식별하는 정보(예를 들어, 간격 값)를 포함할 수 있다. 그 경우, 디코더(200)는 (예컨대, 식별된 고조파 신호 성분들을 나타내거나 식별된 고조파 신호 성분들을 둘러싸는) 식별된 고조파 신호 성분들과 연관된 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 선택적으로 예측 디코딩을 적용하도록 구성될 수 있다.
앞서 언급한 대안들 둘 다, 디코더(200)는 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들 또는 적어도 2개의 고조파 신호 성분들의 스펙트럼 환경들을 나타내지 않는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f3, 206_t0_f1, 206_t0_f6) 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 적용하지 않도록 구성될 수 있다.
즉, 디코더(200)는 오디오 신호(102)의 신호 고조파들 사이의 비음색 배경 잡음에 속하는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f3, 206_t0_f1, 206_t0_f6) 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 적용하지 않도록 구성될 수 있다.
도 5는 일 실시예에 따라 오디오 신호를 인코딩하기 위한 방법(300)의 흐름도를 보여준다. 이 방법(300)은 현재 프레임 및 적어도 하나의 이전 프레임에 대해 오디오 신호의 스펙트럼 계수들을 결정하는 단계(302), 및 적어도 하나의 스펙트럼 계수에 의해 분리되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하는 단계(304)를 포함한다.
도 6은 일 실시예에 따라 인코딩된 오디오 신호를 디코딩하기 위한 방법(400)의 흐름도를 보여준다. 이 방법(400)은 현재 프레임 및 적어도 하나의 이전 프레임에 대한 오디오 신호의 인코딩된 스펙트럼 계수들을 얻기 위해, 인코딩된 오디오 신호를 파싱하는 단계(402), 및 적어도 하나의 인코딩된 스펙트럼 계수에 의해 분리되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하는 단계(404)를 포함한다.
일부 양상들은 장치와 관련하여 설명되었지만, 이러한 양상들은 또한 대응하는 방법의 설명을 나타내며, 여기서 블록 또는 디바이스는 방법 단계 또는 방법 단계의 특징에 대응한다는 점이 명백하다. 비슷하게, 방법 단계와 관련하여 설명한 양상들은 또한 대응하는 장치의 대응하는 블록 또는 항목 또는 특징의 설명을 나타낸다. 방법 단계들의 일부 또는 전부가 예를 들어, 마이크로프로세서, 프로그래밍 가능한 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해(또는 사용하여) 실행될 수도 있다. 일부 실시예들에서, 가장 중요한 방법 단계들 중 하나 또는 그보다 많은 단계가 이러한 장치에 의해 실행될 수도 있다.
본 발명의 인코딩된 오디오 신호는 디지털 저장 매체 상에 저장될 수 있고 또는 송신 매체, 예컨대 무선 송신 매체 또는 유선 송신 매체, 예컨대 인터넷을 통해 송신될 수 있다.
특정 구현 요건들에 따라, 본 발명의 실시예들은 하드웨어로 또는 소프트웨어로 구현될 수 있다. 구현은 각각의 방법이 수행되도록 프로그래밍 가능 컴퓨터 시스템과 협력하는(또는 협력할 수 있는) 전자적으로 판독 가능 제어 신호들이 저장된 디지털 저장 매체, 예를 들어 플로피 디스크, DVD, 블루레이, CD, ROM, PROM, EPROM, EEPROM 또는 플래시 메모리를 사용하여 수행될 수 있다. 따라서 디지털 저장 매체는 컴퓨터 판독 가능할 수도 있다.
본 발명에 따른 일부 실시예들은 본 명세서에서 설명한 방법들 중 하나가 수행되도록, 프로그래밍 가능 컴퓨터 시스템과 협력할 수 있는 전자적으로 판독 가능 제어 신호들을 갖는 데이터 반송파를 포함한다.
일반적으로, 본 발명의 실시예들은 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때, 방법들 중 하나를 수행하기 위해 작동하는 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로서 구현될 수 있다. 프로그램 코드는 예를 들어, 기계 판독 가능 반송파 상에 저장될 수 있다.
다른 실시예들은 기계 판독 가능 반송파 상에 저장된, 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.
즉, 본 발명의 방법의 한 실시예는 이에 따라, 컴퓨터 상에서 컴퓨터 프로그램이 실행될 때 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
따라서 본 발명의 방법들의 추가 실시예는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함하여 그 위에 기록된 데이터 반송파(또는 디지털 저장 매체, 또는 컴퓨터 판독 가능 매체)이다. 데이터 반송파, 디지털 저장 매체 또는 레코딩된 매체는 통상적으로 유형적이고 그리고/또는 비-일시적이다.
따라서 본 발명의 방법의 추가 실시예는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 신호들의 데이터 스트림 또는 시퀀스이다. 신호들의 데이터 스트림 또는 시퀀스는 예를 들어, 데이터 통신 접속을 통해, 예를 들어 인터넷을 통해 전송되도록 구성될 수 있다.
추가 실시예는 처리 수단, 예를 들어 본 명세서에서 설명한 방법들 중 하나를 수행하도록 구성 또는 적응된 컴퓨터 또는 프로그래밍 가능 로직 디바이스를 포함한다.
추가 실시예는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.
본 발명에 따른 추가 실시예는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 수신기에(예를 들어, 전자적으로 또는 광학적으로) 전송하도록 구성된 장치 또는 시스템을 포함한다. 수신기는 예를 들어, 컴퓨터, 모바일 디바이스, 메모리 디바이스 등일 수도 있다. 장치 또는 시스템은 예를 들어, 컴퓨터 프로그램을 수신기에 전송하기 위한 파일 서버를 포함할 수도 있다.
일부 실시예들에서, 프로그래밍 가능 로직 디바이스(예를 들어, 필드 프로그래밍 가능 게이트 어레이)는 본 명세서에서 설명한 방법들의 기능들 중 일부 또는 전부를 수행하는데 사용될 수 있다. 일부 실시예들에서, 필드 프로그래밍 가능 게이트 어레이는 본 명세서에서 설명한 방법들 중 하나를 수행하기 위해 마이크로프로세서와 협력할 수 있다. 일반적으로, 방법들은 바람직하게 임의의 하드웨어 장치에 의해 수행된다.
본 명세서에서 설명한 장치는 하드웨어 장치를 사용하여, 또는 컴퓨터를 사용하여, 또는 하드웨어 장치와 컴퓨터의 결합을 사용하여 구현될 수도 있다.
본 명세서에서 설명한 방법들은 하드웨어 장치를 사용하여, 또는 컴퓨터를 사용하여, 또는 하드웨어 장치와 컴퓨터의 결합을 사용하여 수행될 수도 있다.
앞서 설명한 실시예들은 단지 본 발명의 원리들에 대한 예시일 뿐이다. 본 명세서에서 설명한 배열들 및 세부사항들의 수정들 및 변형들이 다른 당업자들에게 명백할 것이라고 이해된다. 따라서 이는 본 명세서의 실시예들의 묘사 및 설명에 의해 제시된 특정 세부사항들로가 아닌, 첨부된 특허청구범위로만 한정되는 것을 취지로 한다.

Claims (65)

  1. 오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100)로서,
    상기 인코더(100)는 변환 도메인 또는 필터 뱅크 도메인(104)에서 상기 오디오 신호(102)를 인코딩하도록 구성되고,
    상기 인코더는 현재 프레임(108_t0) 및 적어도 하나의 이전 프레임(108_t-1)에 대해 상기 오디오 신호(102)의 스펙트럼 계수들(106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6)을 결정하도록 구성되며,
    상기 인코더(100)는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성되고,
    상기 인코더(100)는 간격 값을 결정하도록 구성되며,
    상기 인코더(100)는 상기 간격 값을 기초로 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 간격 값은 고조파들 간의 간격을 기술하는 고조파 간격 값인,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  2. 제 1 항에 있어서,
    상기 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들은 적어도 하나의 스펙트럼 계수(106_t0_f3)에 의해 분리되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  3. 제 2 항에 있어서,
    상기 예측 인코딩은 상기 개개의 스펙트럼 계수들(106_t0_f2) 또는 상기 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들이 분리되게 하는 적어도 하나의 스펙트럼 계수(106_t0_f3)에는 적용되지 않는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  4. 제 1 항에 있어서,
    상기 인코더(100)는 상기 현재 프레임의 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들과 상기 현재 프레임(108_t0)의 상기 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들 간의 예측 오차들을 코딩함으로써 상기 현재 프레임(108_t0)의 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 예측 인코딩하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  5. 제 4 항에 있어서,
    상기 인코더(100)는 상기 간격 값으로부터 예측 계수들을 도출하도록 구성되고,
    상기 인코더(100)는 적어도 2개의 이전 프레임들(108_t-2, 108_t-1)의 대응하는 복수의 개개의 스펙트럼 계수들(106_t-2_f2, 106_t-1_f2) 또는 스펙트럼 계수들(106_t-2_f4, 106_t-1_f4; 106_t-2_f5, 106_t-1_f5)의 대응하는 그룹들을 사용하여 그리고 도출된 예측 계수들을 사용하여 상기 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들을 계산하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  6. 제 4 항에 있어서,
    상기 인코더(100)는 상기 이전 프레임(108_t-1)의 복수의 개개의 스펙트럼 계수들(106_t-1_f2) 또는 스펙트럼 계수들(106_t-1_f4, 106_t-1_f5)의 그룹들의 대응하는 양자화된 버전들을 사용하여 상기 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f4)의 그룹들을 결정하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  7. 제 6 항에 있어서,
    상기 인코더(100)는 상기 간격 값으로부터 예측 계수들을 도출하도록 구성되고,
    상기 인코더(100)는 적어도 2개의 이전 프레임들(108_t-2, 108_t-1)의 복수의 개개의 스펙트럼 계수들(106_t-2_f2, 106_t-1_f2) 또는 스펙트럼 계수들(106_t-2_f4, 106_t-1_f4; 106_t-2_f5, 106_t-1_f5)의 그룹들의 대응하는 양자화된 버전들을 사용하여 그리고 도출된 예측 계수들을 사용하여 상기 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들을 계산하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  8. 제 5 항에 있어서,
    상기 인코더(100)는 인코딩된 오디오 신호(120)를 제공하도록 구성되고,
    상기 인코딩된 오디오 신호(120)는 상기 예측 계수들 또는 상기 예측 계수들의 인코딩된 버전들을 포함하지 않는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  9. 제 4 항에 있어서,
    상기 인코더(100)는 인코딩된 오디오 신호(120)를 제공하도록 구성되고,
    상기 인코딩된 오디오 신호(120)는 상기 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 대해 상기 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 상기 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들의 양자화된 버전들 대신 상기 예측 오차들의 양자화된 버전들을 포함하는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  10. 제 9 항에 있어서,
    상기 인코딩된 오디오 신호(120)는 예측 인코딩이 적용되지 않는 스펙트럼 계수들(106_t0_f3)의 양자화된 버전들을 포함하여, 상기 인코딩된 오디오 신호(120)에 상기 예측 오차들의 양자화된 버전들이 포함되는 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들과 예측 인코딩을 사용하지 않고도 양자화된 버전들이 제공되는 스펙트럼 계수들(106_t0_f1, 106_t0_f3, 106_t0_f6) 또는 스펙트럼 계수들의 그룹들의 교대가 존재하는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  11. 제 1 항에 있어서,
    상기 인코더(100)는 상기 오디오 신호(102)의 순시 기본 주파수를 결정하고 상기 순시 기본 주파수 또는 상기 순시 기본 주파수의 분수 또는 배수로부터 상기 간격 값을 도출하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  12. 제 1 항에 있어서,
    상기 인코더(100)는 예측 인코딩을 위해 상기 간격 값에 의해 정의된 고조파 그리드에 따라 스펙트럼 배열된 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(116_1:116_6)을 선택하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  13. 제 1 항에 있어서,
    상기 인코더(100)는 예측 인코딩을 위해, 스펙트럼 인덱스들이 상기 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 범위 내에 있는 스펙트럼 계수들을 선택하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  14. 제 13 항에 있어서,
    상기 인코더(100)는 상기 간격 값에 따라 상기 범위의 폭을 설정하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  15. 제 1 항에 있어서,
    상기 인코더(100)는 상기 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(116_1:116_6)과 예측 인코딩이 적용되지 않는 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(118_1:118_5) 간에 +/-1 스펙트럼 계수의 공차로 주기적인, 주기적 교대가 존재하게, 상기 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(116_1:116_6)을 선택하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  16. 제 16 항에 있어서,
    상기 오디오 신호(102)는 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 포함하고,
    상기 인코더(100)는 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6) 또는 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6) 주위의 스펙트럼 환경들을 나타내는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(116_1:116_6)에 선택적으로 예측 인코딩을 적용하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  17. 제 16 항에 있어서,
    상기 인코더(100)는 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6) 또는 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6)의 스펙트럼 환경들을 나타내지 않는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(118_1:118_5)에 예측 인코딩을 적용하지 않도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  18. 제 16 항에 있어서,
    상기 인코더(100)는 신호 고조파들(124_1:124_6) 사이의 비음색 배경 잡음에 속하는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(118_1:118_5)에 예측 인코딩을 적용하지 않도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  19. 제 16 항에 있어서,
    상기 간격 값은 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6) 간의 스펙트럼 간격을 나타내는 고조파 간격 값이고,
    상기 고조파 간격 값은 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 나타내는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(116_1:116_6)을 나타내는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  20. 제 1 항에 있어서,
    상기 인코더(100)는 인코딩된 오디오 신호(120)를 제공하도록 구성되고,
    상기 인코더(100)는 상기 인코딩된 오디오 신호(120)에 상기 간격 값 또는 상기 간격 값의 인코딩된 버전을 포함하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  21. 제 1 항에 있어서,
    상기 스펙트럼 계수들은 스펙트럼 빈들인,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  22. 인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200)로서,
    상기 디코더(200)는 변환 도메인 또는 필터 뱅크 도메인(204)에서 상기 인코딩된 오디오 신호(120)를 디코딩하도록 구성되고,
    상기 디코더(200)는 현재 프레임(208_t0) 및 적어도 하나의 이전 프레임(208_t-1)에 대한 상기 오디오 신호(120)의 인코딩된 스펙트럼 계수들(206_t0_f1:206_t0_f6; 206_t-1_f1:206_t-1_f6)을 얻기 위해, 상기 인코딩된 오디오 신호(120)를 파싱하도록 구성되며,
    상기 디코더(200)는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 예측 디코딩을 선택적으로 적용하도록 구성되고,
    상기 디코더(200)는 간격 값을 얻도록 구성되며, 상기 디코더(200)는 상기 간격 값을 기초로, 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 간격 값은 고조파들 간의 간격을 기술하는 고조파 간격 값인,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  23. 제 22 항에 있어서,
    상기 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들은 적어도 하나의 인코딩된 스펙트럼 계수(206_t0_f3)에 의해 분리되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  24. 제 23 항에 있어서,
    상기 예측 디코딩은 상기 개개의 스펙트럼 계수들(206_t0_f2) 또는 상기 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹이 분리되게 하는 적어도 하나의 스펙트럼 계수(206_t0_f3)에는 적용되지 않는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  25. 제 22 항에 있어서,
    상기 디코더(200)는 상기 인코딩된 스펙트럼 계수들을 엔트로피 디코딩하여, 예측 디코딩이 적용될 스펙트럼 계수들(206_t0_f2, 206_t0_f4, 206_t0_f5)에 대한 양자화된 예측 오차들 및 예측 디코딩이 적용되지 않을 스펙트럼 계수들(206_t0_f3)에 대한 양자화된 스펙트럼 계수들을 얻도록 구성되고,
    상기 디코더(200)는 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(210_t0_f4, 210_t0_f5)의 그룹들에 상기 양자화된 예측 오차들을 적용하여, 상기 현재 프레임(208_t0)에 대해, 예측 디코딩이 적용되는 인코딩된 스펙트럼 계수들(206_t0_f2, 206_t0_f4, 206_t0_f5)과 연관된 디코딩된 스펙트럼 계수들을 얻도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  26. 제 25 항에 있어서,
    상기 디코더(200)는 상기 이전 프레임(208_t-1)의 대응하는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t-1_f2) 또는 인코딩된 스펙트럼 계수들(206_t-1_f4, 206_t-1_f5)의 그룹들을 기초로 상기 현재 프레임(208_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f4)의 그룹들을 결정하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  27. 제 26 항에 있어서,
    상기 디코더(200)는 상기 간격 값으로부터 예측 계수들을 도출하도록 구성되고,
    상기 디코더(200)는 적어도 2개의 이전 프레임들의 대응하는 복수의 이전에 디코딩된 개개의 스펙트럼 계수들 또는 이전에 디코딩된 스펙트럼 계수들의 그룹들을 사용하고 그리고 도출된 예측 계수들을 사용하여 상기 현재 프레임(208_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(210_t0_f4, 210_t0_f5)의 그룹들을 계산하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  28. 제 22 항에 있어서,
    상기 디코더(200)는 상기 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 대해 복수의 개개의 양자화된 스펙트럼 계수들 또는 양자화된 스펙트럼 계수들의 그룹들 대신 양자화된 예측 오차들을 얻기 위해, 상기 인코딩된 오디오 신호(120)를 디코딩하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  29. 제 28 항에 있어서,
    상기 디코더는 양자화된 예측 오차들이 획득되는 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들과 양자화된 스펙트럼 계수들이 획득되는 인코딩된 스펙트럼 계수들(206_t0_f3) 또는 인코딩된 스펙트럼 계수들의 그룹들의 교대가 존재하도록, 예측 디코딩이 적용되지 않는 인코딩된 스펙트럼 계수들(206_t0_f3)에 대한 양자화된 스펙트럼 계수들을 얻기 위해 상기 인코딩된 오디오 신호(120)를 디코딩하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  30. 제 22 항에 있어서,
    상기 디코더(200)는 예측 디코딩을 위해 상기 간격 값에 의해 정의된 고조파 그리드에 따라 스펙트럼 배열된 개개의 스펙트럼 계수들(206_t0_f2) 또는 스펙트럼 계수들의 그룹들(206_t0_f4, 206_t0_f5)을 선택하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  31. 제 22 항에 있어서,
    상기 디코더(200)는 예측 디코딩을 위해, 스펙트럼 인덱스들이 상기 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 범위 내에 있는 스펙트럼 계수들을 선택하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  32. 제 31 항에 있어서,
    상기 디코더(200)는 상기 간격 값에 따라 상기 범위의 폭을 설정하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  33. 제 22 항에 있어서,
    상기 인코딩된 오디오 신호(120)는 상기 간격 값 또는 상기 간격 값의 인코딩된 버전을 포함하고,
    상기 디코더(200)는 상기 인코딩된 오디오 신호(120)로부터 상기 간격 값 또는 상기 간격 값의 인코딩된 버전을 추출하여 상기 간격 값을 얻도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  34. 제 22 항에 있어서,
    상기 디코더(200)는 상기 간격 값을 결정하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  35. 제 34 항에 있어서,
    상기 디코더(200)는 순시 기본 주파수를 결정하고 상기 순시 기본 주파수 또는 상기 순시 기본 주파수의 분수 또는 배수로부터 상기 간격 값을 도출하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  36. 제 22 항에 있어서,
    상기 인코딩된 오디오 신호(120)로 표현된 오디오 신호(102)는 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 포함하고,
    상기 디코더(200)는 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6) 또는 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6) 주위의 스펙트럼 환경들을 나타내는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 선택적으로 예측 디코딩을 적용하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  37. 제 36 항에 있어서,
    상기 디코더(200)는, 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 식별하고, 그리고 식별된 고조파 신호 성분들(124_1:124_6)과 연관된 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 선택적으로 예측 디코딩을 적용하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  38. 제 36 항에 있어서,
    상기 인코딩된 오디오 신호(120)는 상기 간격 값 또는 상기 간격 값의 인코딩된 버전을 포함하고,
    상기 간격 값은 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 포함하며,
    상기 디코더(200)는 식별된 고조파 신호 성분들(124_1:124_6)과 연관된 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 선택적으로 예측 디코딩을 적용하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  39. 제 36 항에 있어서,
    상기 디코더(200)는 상기 오디오 신호의 적어도 2개의 고조파 신호 성분들(124_1:124_6) 또는 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6)의 스펙트럼 환경들을 나타내지 않는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 적용하지 않도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  40. 제 36 항에 있어서,
    상기 디코더(200)는 상기 오디오 신호의 신호 고조파들(124_1:124_6) 사이의 비음색 배경 잡음에 속하는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 적용하지 않도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  41. 제 22 항에 있어서,
    상기 인코딩된 오디오 신호(120)는 상기 간격 값 또는 상기 간격 값의 인코딩된 버전을 포함하고,
    상기 간격 값은 고조파 간격 값이고,
    상기 고조파 간격 값은 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 나타내는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들을 나타내는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  42. 제 22 항에 있어서,
    상기 스펙트럼 계수들은 스펙트럼 빈들인,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  43. 오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100)로서,
    상기 인코더(100)는 변환 도메인 또는 필터 뱅크 도메인(104)에서 상기 오디오 신호(102)를 인코딩하도록 구성되고,
    상기 인코더는 현재 프레임(108_t0) 및 적어도 하나의 이전 프레임(108_t-1)에 대해 상기 오디오 신호(102)의 스펙트럼 계수들(106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6)을 결정하도록 구성되며,
    상기 인코더(100)는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성되고,
    상기 인코더(100)는 간격 값을 결정하도록 구성되며,
    상기 인코더(100)는 상기 간격 값을 기초로 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 인코더(100)는 상기 현재 프레임의 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들과 상기 현재 프레임(108_t0)의 상기 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들 간의 예측 오차들을 코딩함으로써 상기 현재 프레임(108_t0)의 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 예측 인코딩하도록 구성되며,
    상기 인코더(100)는 상기 간격 값으로부터 예측 계수들을 도출하도록 구성되고,
    상기 인코더(100)는 적어도 2개의 이전 프레임들(108_t-2, 108_t-1)의 대응하는 복수의 개개의 스펙트럼 계수들(106_t-2_f2, 106_t-1_f2) 또는 스펙트럼 계수들(106_t-2_f4, 106_t-1_f4; 106_t-2_f5, 106_t-1_f5)의 대응하는 그룹들을 사용하여 그리고 도출된 예측 계수들을 사용하여 상기 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들을 계산하도록 구성되고,
    상기 인코더(100)는 예측 인코딩을 위해, 스펙트럼 인덱스들이 상기 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 범위 내에 있는 스펙트럼 계수들을 선택하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  44. 오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100)로서,
    상기 인코더(100)는 변환 도메인 또는 필터 뱅크 도메인(104)에서 상기 오디오 신호(102)를 인코딩하도록 구성되고,
    상기 인코더는 현재 프레임(108_t0) 및 적어도 하나의 이전 프레임(108_t-1)에 대해 상기 오디오 신호(102)의 스펙트럼 계수들(106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6)을 결정하도록 구성되며,
    상기 인코더(100)는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성되고, 상기 인코더(100)는 간격 값을 결정하도록 구성되며,
    상기 인코더(100)는 상기 간격 값을 기초로 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 인코더(100)는 상기 현재 프레임의 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들과 상기 현재 프레임(108_t0)의 상기 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들 간의 예측 오차들을 코딩함으로써 상기 현재 프레임(108_t0)의 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 예측 인코딩하도록 구성되며,
    상기 인코더(100)는 상기 이전 프레임(108_t-1)의 복수의 개개의 스펙트럼 계수들(106_t-1_f2) 또는 스펙트럼 계수들(106_t-1_f4, 106_t-1_f5)의 그룹들의 대응하는 양자화된 버전들을 사용하여 상기 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f4)의 그룹들을 결정하도록 구성되고,
    상기 인코더(100)는 상기 간격 값으로부터 예측 계수들을 도출하도록 구성되고,
    상기 인코더(100)는 적어도 2개의 이전 프레임들(108_t-2, 108_t-1)의 복수의 개개의 스펙트럼 계수들(106_t-2_f2, 106_t-1_f2) 또는 스펙트럼 계수들(106_t-2_f4, 106_t-1_f4; 106_t-2_f5, 106_t-1_f5)의 그룹들의 대응하는 양자화된 버전들을 사용하여 그리고 도출된 예측 계수들을 사용하여 상기 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들을 계산하도록 구성되며,
    상기 인코더(100)는 예측 인코딩을 위해, 스펙트럼 인덱스들이 상기 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 범위 내에 있는 스펙트럼 계수들을 선택하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  45. 오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100)로서,
    상기 인코더(100)는 변환 도메인 또는 필터 뱅크 도메인(104)에서 상기 오디오 신호(102)를 인코딩하도록 구성되고,
    상기 인코더는 현재 프레임(108_t0) 및 적어도 하나의 이전 프레임(108_t-1)에 대해 상기 오디오 신호(102)의 스펙트럼 계수들(106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6)을 결정하도록 구성되며,
    상기 인코더(100)는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성되고,
    상기 인코더(100)는 간격 값을 결정하도록 구성되며,
    상기 인코더(100)는 상기 간격 값을 기초로 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 인코더(100)는 상기 오디오 신호(102)의 순시 기본 주파수를 결정하고 상기 순시 기본 주파수 또는 상기 순시 기본 주파수의 분수 또는 배수로부터 상기 간격 값을 도출하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  46. 오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100)로서,
    상기 인코더(100)는 변환 도메인 또는 필터 뱅크 도메인(104)에서 상기 오디오 신호(102)를 인코딩하도록 구성되고,
    상기 인코더는 현재 프레임(108_t0) 및 적어도 하나의 이전 프레임(108_t-1)에 대해 상기 오디오 신호(102)의 스펙트럼 계수들(106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6)을 결정하도록 구성되며,
    상기 인코더(100)는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성되고,
    상기 인코더(100)는 간격 값을 결정하도록 구성되며,
    상기 인코더(100)는 상기 간격 값을 기초로 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 인코더(100)는 예측 인코딩을 위해 상기 간격 값에 의해 정의된 고조파 그리드에 따라 스펙트럼 배열된 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(116_1:116_6)을 선택하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  47. 오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100)로서,
    상기 인코더(100)는 변환 도메인 또는 필터 뱅크 도메인(104)에서 상기 오디오 신호(102)를 인코딩하도록 구성되고,
    상기 인코더는 현재 프레임(108_t0) 및 적어도 하나의 이전 프레임(108_t-1)에 대해 상기 오디오 신호(102)의 스펙트럼 계수들(106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6)을 결정하도록 구성되며,
    상기 인코더(100)는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들에 예측 인코딩을 선택적으로 적용하도록 구성되고,
    상기 인코더(100)는 간격 값을 결정하도록 구성되며,
    상기 인코더(100)는 상기 간격 값을 기초로 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 오디오 신호(102)는 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 포함하고,
    상기 인코더(100)는 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6) 또는 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6) 주위의 스펙트럼 환경들을 나타내는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(116_1:116_6)에만 예측 인코딩을 적용하도록 구성되는,
    오디오 신호(102)를 인코딩하기 위한 오디오 인코더(100).
  48. 인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200)로서,
    상기 디코더(200)는 변환 도메인 또는 필터 뱅크 도메인(204)에서 상기 인코딩된 오디오 신호(120)를 디코딩하도록 구성되고,
    상기 디코더(200)는 현재 프레임(208_t0) 및 적어도 하나의 이전 프레임(208_t-1)에 대한 상기 오디오 신호(120)의 인코딩된 스펙트럼 계수들(206_t0_f1:206_t0_f6; 206_t-1_f1:206_t-1_f6)을 얻기 위해, 상기 인코딩된 오디오 신호(120)를 파싱하도록 구성되며,
    상기 디코더(200)는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 예측 디코딩을 선택적으로 적용하도록 구성되고,
    상기 디코더(200)는 간격 값을 얻도록 구성되며,
    상기 디코더(200)는 상기 간격 값을 기초로, 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 디코더(200)는 상기 인코딩된 스펙트럼 계수들을 엔트로피 디코딩하여, 예측 디코딩이 적용될 스펙트럼 계수들(206_t0_f2, 206_t0_f4, 206_t0_f5)에 대한 양자화된 예측 오차들 및 예측 디코딩이 적용되지 않을 스펙트럼 계수들(206_t0_f3)에 대한 양자화된 스펙트럼 계수들을 얻도록 구성되고,
    상기 디코더(200)는 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(210_t0_f4, 210_t0_f5)의 그룹들에 상기 양자화된 예측 오차들을 적용하여, 상기 현재 프레임(208_t0)에 대해, 예측 디코딩이 적용되는 인코딩된 스펙트럼 계수들(206_t0_f2, 206_t0_f4, 206_t0_f5)과 연관된 디코딩된 스펙트럼 계수들을 얻도록 구성되며,
    상기 디코더(200)는 상기 이전 프레임(208_t-1)의 대응하는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t-1_f2) 또는 인코딩된 스펙트럼 계수들(206_t-1_f4, 206_t-1_f5)의 그룹들을 기초로 상기 현재 프레임(208_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f4)의 그룹들을 결정하도록 구성되고,
    상기 디코더(200)는 상기 간격 값으로부터 예측 계수들을 도출하도록 구성되고,
    상기 디코더(200)는 적어도 2개의 이전 프레임들의 대응하는 복수의 이전에 디코딩된 개개의 스펙트럼 계수들 또는 이전에 디코딩된 스펙트럼 계수들의 그룹들을 사용하고 그리고 도출된 예측 계수들을 사용하여 상기 현재 프레임(208_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(210_t0_f4, 210_t0_f5)의 그룹들을 계산하도록 구성되며,
    상기 디코더(200)는 예측 디코딩을 위해, 스펙트럼 인덱스들이 상기 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 범위 내에 있는 스펙트럼 계수들을 선택하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  49. 인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200)로서,
    상기 디코더(200)는 변환 도메인 또는 필터 뱅크 도메인(204)에서 상기 인코딩된 오디오 신호(120)를 디코딩하도록 구성되고,
    상기 디코더(200)는 현재 프레임(208_t0) 및 적어도 하나의 이전 프레임(208_t-1)에 대한 상기 오디오 신호(120)의 인코딩된 스펙트럼 계수들(206_t0_f1:206_t0_f6; 206_t-1_f1:206_t-1_f6)을 얻기 위해, 상기 인코딩된 오디오 신호(120)를 파싱하도록 구성되며,
    상기 디코더(200)는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 예측 디코딩을 선택적으로 적용하도록 구성되고,
    상기 디코더(200)는 간격 값을 얻도록 구성되며,
    상기 디코더(200)는 상기 간격 값을 기초로, 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 디코더(200)는 예측 디코딩을 위해 상기 간격 값에 의해 정의된 고조파 그리드에 따라 스펙트럼 배열된 개개의 스펙트럼 계수들(206_t0_f2) 또는 스펙트럼 계수들의 그룹들(206_t0_f4, 206_t0_f5)을 선택하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  50. 인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200)로서,
    상기 디코더(200)는 변환 도메인 또는 필터 뱅크 도메인(204)에서 상기 인코딩된 오디오 신호(120)를 디코딩하도록 구성되고,
    상기 디코더(200)는 현재 프레임(208_t0) 및 적어도 하나의 이전 프레임(208_t-1)에 대한 상기 오디오 신호(120)의 인코딩된 스펙트럼 계수들(206_t0_f1:206_t0_f6; 206_t-1_f1:206_t-1_f6)을 얻기 위해, 상기 인코딩된 오디오 신호(120)를 파싱하도록 구성되며,
    상기 디코더(200)는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 예측 디코딩을 선택적으로 적용하도록 구성되고,
    상기 디코더(200)는 간격 값을 얻도록 구성되며,
    상기 디코더(200)는 상기 간격 값을 기초로, 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 디코더(200)는 상기 간격 값을 결정하도록 구성되며,
    상기 디코더(200)는 순시 기본 주파수를 결정하고 상기 순시 기본 주파수 또는 상기 순시 기본 주파수의 분수 또는 배수로부터 상기 간격 값을 도출하도록 구성되는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  51. 인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200)로서,
    상기 디코더(200)는 변환 도메인 또는 필터 뱅크 도메인(204)에서 상기 인코딩된 오디오 신호(120)를 디코딩하도록 구성되고,
    상기 디코더(200)는 현재 프레임(208_t0) 및 적어도 하나의 이전 프레임(208_t-1)에 대한 상기 오디오 신호(120)의 인코딩된 스펙트럼 계수들(206_t0_f1:206_t0_f6; 206_t-1_f1:206_t-1_f6)을 얻기 위해, 상기 인코딩된 오디오 신호(120)를 파싱하도록 구성되며,
    상기 디코더(200)는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 예측 디코딩을 선택적으로 적용하도록 구성되고,
    상기 디코더(200)는 간격 값을 얻도록 구성되며,
    상기 디코더(200)는 상기 간격 값을 기초로, 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 인코딩된 오디오 신호(120)로 표현된 오디오 신호(102)는 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 포함하며,
    상기 디코더(200)는 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6) 또는 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6) 주위의 스펙트럼 환경들을 나타내는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 선택적으로 예측 디코딩을 적용하도록 구성되는,인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  52. 인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200)로서,
    상기 디코더(200)는 변환 도메인 또는 필터 뱅크 도메인(204)에서 상기 인코딩된 오디오 신호(120)를 디코딩하도록 구성되고,
    상기 디코더(200)는 현재 프레임(208_t0) 및 적어도 하나의 이전 프레임(208_t-1)에 대한 상기 오디오 신호(120)의 인코딩된 스펙트럼 계수들(206_t0_f1:206_t0_f6; 206_t-1_f1:206_t-1_f6)을 얻기 위해, 상기 인코딩된 오디오 신호(120)를 파싱하도록 구성되며,
    상기 디코더(200)는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들에 예측 디코딩을 선택적으로 적용하도록 구성되고,
    상기 디코더(200)는 간격 값을 얻도록 구성되며,
    상기 디코더(200)는 상기 간격 값을 기초로, 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t0_f2) 또는 인코딩된 스펙트럼 계수들(206_t0_f4, 206_t0_f5)의 그룹들을 선택하도록 구성되고,
    상기 인코딩된 오디오 신호(120)는 상기 간격 값 또는 상기 간격 값의 인코딩된 버전을 포함하며,
    상기 간격 값은 고조파들 간의 간격을 기술하는 고조파 간격 값이고,
    상기 고조파 간격 값은 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 나타내는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들을 나타내는,
    인코딩된 오디오 신호(120)를 디코딩하기 위한 디코더(200).
  53. 변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대해 상기 오디오 신호의 스펙트럼 계수들을 결정하는 단계(302);
    간격 값을 결정하는 단계; 및
    복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하는 단계(304)를 포함하며,
    예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택되고,
    상기 간격 값은 고조파들 간의 간격을 기술하는 고조파 간격 값인,
    변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300).
  54. 변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대해 상기 오디오 신호의 스펙트럼 계수들을 결정하는 단계(302);
    간격 값을 결정하는 단계;
    복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하는 단계(304) ― 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택되고, 상기 현재 프레임의 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들과 상기 현재 프레임(108_t0)의 상기 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들 간의 예측 오차들을 코딩함으로써 상기 현재 프레임(108_t0)의 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들이 예측 인코딩됨 ―;
    상기 간격 값으로부터 예측 계수들을 도출하는 단계;
    적어도 2개의 이전 프레임들(108_t-2, 108_t-1)의 대응하는 복수의 개개의 스펙트럼 계수들(106_t-2_f2, 106_t-1_f2) 또는 스펙트럼 계수들(106_t-2_f4, 106_t-1_f4; 106_t-2_f5, 106_t-1_f5)의 대응하는 그룹들을 사용하여 그리고 도출된 예측 계수들을 사용하여 상기 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들을 계산하는 단계; 및
    예측 인코딩을 위해, 스펙트럼 인덱스들이 상기 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 범위 내에 있는 스펙트럼 계수들을 선택하는 단계를 포함하는,
    변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300).
  55. 변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대해 상기 오디오 신호의 스펙트럼 계수들을 결정하는 단계(302);
    간격 값을 결정하는 단계;
    복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하는 단계(304) ― 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택됨 ―;
    상기 현재 프레임의 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들과 상기 현재 프레임(108_t0)의 상기 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들 간의 예측 오차들을 코딩함으로써 상기 현재 프레임(108_t0)의 복수의 개개의 스펙트럼 계수들(106_t0_f2) 또는 스펙트럼 계수들(106_t0_f4, 106_t0_f5)의 그룹들을 예측 인코딩하는 단계;
    상기 이전 프레임(108_t-1)의 복수의 개개의 스펙트럼 계수들(106_t-1_f2) 또는 스펙트럼 계수들(106_t-1_f4, 106_t-1_f5)의 그룹들의 대응하는 양자화된 버전들을 사용하여 상기 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f4)의 그룹들을 결정하는 단계;
    상기 간격 값으로부터 예측 계수들을 도출하는 단계;
    적어도 2개의 이전 프레임들(108_t-2, 108_t-1)의 복수의 개개의 스펙트럼 계수들(106_t-2_f2, 106_t-1_f2) 또는 스펙트럼 계수들(106_t-2_f4, 106_t-1_f4; 106_t-2_f5, 106_t-1_f5)의 그룹들의 대응하는 양자화된 버전들을 사용하여 그리고 도출된 예측 계수들을 사용하여 상기 현재 프레임(108_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(110_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f5)의 그룹들을 계산하는 단계;
    예측 인코딩을 위해, 스펙트럼 인덱스들이 상기 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 범위 내에 있는 스펙트럼 계수들을 선택하는 단계를 포함하는,
    변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300).
  56. 변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대해 상기 오디오 신호의 스펙트럼 계수들을 결정하는 단계(302);
    간격 값을 결정하는 단계;
    복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하는 단계(304) ― 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택됨 ―;
    상기 오디오 신호(102)의 순시 기본 주파수를 결정하는 단계;
    상기 순시 기본 주파수 또는 상기 순시 기본 주파수의 분수 또는 배수로부터 상기 간격 값을 도출하는 단계를 포함하는,
    변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300).
  57. 변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대해 상기 오디오 신호의 스펙트럼 계수들을 결정하는 단계(302);
    간격 값을 결정하는 단계;
    복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하는 단계(304) ― 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택됨 ―; 및
    예측 인코딩을 위해 상기 간격 값에 의해 정의된 고조파 그리드에 따라 스펙트럼 배열된 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(116_1:116_6)을 선택하는 단계를 포함하는,
    변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300).
  58. 변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대해 상기 오디오 신호의 스펙트럼 계수들을 결정하는 단계(302);
    간격 값을 결정하는 단계;
    복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들에 예측 인코딩을 선택적으로 적용하는 단계(304) ― 예측 인코딩이 적용되는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택되고, 상기 오디오 신호(102)는 적어도 2개의 고조파 신호 성분들을 포함함 ―;
    상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6) 또는 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6) 주위의 스펙트럼 환경들을 나타내는 복수의 개개의 스펙트럼 계수들 또는 스펙트럼 계수들의 그룹들(116_1:116_6)에만 예측 인코딩을 적용하는 단계를 포함하는,
    변환 도메인 또는 필터 뱅크 도메인에서 오디오 신호를 인코딩하기 위한 방법(300).
  59. 변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대한 상기 오디오 신호의 인코딩된 스펙트럼 계수들을 얻기 위해, 상기 인코딩된 오디오 신호를 파싱하는 단계(402);
    간격 값을 얻는 단계; 및
    복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 선택적으로 적용하는 단계(404)를 포함하며,
    예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택되고,
    상기 간격 값은 고조파들 간의 간격을 기술하는 고조파 간격 값인,변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400).
  60. 변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대한 상기 오디오 신호의 인코딩된 스펙트럼 계수들을 얻기 위해, 상기 인코딩된 오디오 신호를 파싱하는 단계(402);
    간격 값을 얻는 단계;
    복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 선택적으로 적용하는 단계(404) ― 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택됨 ―;
    상기 인코딩된 스펙트럼 계수들을 엔트로피 디코딩하여, 예측 디코딩이 적용될 스펙트럼 계수들(206_t0_f2, 206_t0_f4, 206_t0_f5)에 대한 양자화된 예측 오차들 및 예측 디코딩이 적용되지 않을 스펙트럼 계수들(206_t0_f3)에 대한 양자화된 스펙트럼 계수들을 얻는 단계;
    복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(210_t0_f4, 210_t0_f5)의 그룹들에 상기 양자화된 예측 오차들을 적용하여, 상기 현재 프레임(208_t0)에 대해, 예측 디코딩이 적용되는 인코딩된 스펙트럼 계수들(206_t0_f2, 206_t0_f4, 206_t0_f5)과 연관된 디코딩된 스펙트럼 계수들을 얻는 단계;
    상기 이전 프레임(208_t-1)의 대응하는 복수의 개개의 인코딩된 스펙트럼 계수들(206_t-1_f2) 또는 인코딩된 스펙트럼 계수들(206_t-1_f4, 206_t-1_f5)의 그룹들을 기초로 상기 현재 프레임(208_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(110_t0_f4, 110_t0_f4)의 그룹들을 결정하는 단계;
    상기 간격 값으로부터 예측 계수들을 도출하는 단계;
    적어도 2개의 이전 프레임들의 대응하는 복수의 이전에 디코딩된 개개의 스펙트럼 계수들 또는 이전에 디코딩된 스펙트럼 계수들의 그룹들을 사용하고 그리고 도출된 예측 계수들을 사용하여 상기 현재 프레임(208_t0)에 대한 복수의 예측된 개개의 스펙트럼 계수들(210_t0_f2) 또는 예측된 스펙트럼 계수들(210_t0_f4, 210_t0_f5)의 그룹들을 계산하는 단계; 및
    예측 디코딩을 위해, 스펙트럼 인덱스들이 상기 간격 값을 기초로 도출된 복수의 스펙트럼 인덱스들과 같거나 그 주위의 범위 내에 있는 스펙트럼 계수들을 선택하는 단계를 포함하는,
    변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400).
  61. 변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대한 상기 오디오 신호의 인코딩된 스펙트럼 계수들을 얻기 위해, 상기 인코딩된 오디오 신호를 파싱하는 단계(402);
    간격 값을 얻는 단계;
    복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 선택적으로 적용하는 단계(404) ― 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택됨 ―;
    예측 디코딩을 위해 상기 간격 값에 의해 정의된 고조파 그리드에 따라 스펙트럼 배열된 개개의 스펙트럼 계수들(206_t0_f2) 또는 스펙트럼 계수들의 그룹들(206_t0_f4, 206_t0_f5)을 선택하는 단계를 포함하는,
    변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400).
  62. 변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대한 상기 오디오 신호의 인코딩된 스펙트럼 계수들을 얻기 위해, 상기 인코딩된 오디오 신호를 파싱하는 단계(402);
    간격 값을 얻는 단계;
    복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 선택적으로 적용하는 단계(404) ― 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택됨 ―;
    상기 간격 값을 결정하는 단계;
    순시 기본 주파수를 결정하는 단계; 및
    상기 순시 기본 주파수 또는 상기 순시 기본 주파수의 분수 또는 배수로부터 상기 간격 값을 도출하는 단계를 포함하는,
    변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400).
  63. 변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대한 상기 오디오 신호의 인코딩된 스펙트럼 계수들을 얻기 위해, 상기 인코딩된 오디오 신호를 파싱하는 단계(402);
    간격 값을 얻는 단계;
    복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 선택적으로 적용하는 단계(404) ― 예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택되며, 상기 인코딩된 오디오 신호(120)로 표현된 오디오 신호(102)는 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 포함함 ―; 및
    상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6) 또는 상기 적어도 2개의 고조파 신호 성분들(124_1:124_6) 주위의 스펙트럼 환경들을 나타내는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 선택적으로 예측 디코딩을 적용하는 단계를 포함하는,
    변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400).
  64. 변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400)으로서,
    현재 프레임 및 적어도 하나의 이전 프레임에 대한 상기 오디오 신호의 인코딩된 스펙트럼 계수들을 얻기 위해, 상기 인코딩된 오디오 신호를 파싱하는 단계(402);
    간격 값을 얻는 단계; 및
    복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들에 예측 디코딩을 선택적으로 적용하는 단계(404)를 포함하며,
    예측 디코딩이 적용되는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들은 상기 간격 값을 기초로 선택되고,
    상기 인코딩된 오디오 신호(120)는 상기 간격 값 또는 상기 간격 값의 인코딩된 버전을 포함하며,
    상기 간격 값은 고조파들 간의 간격을 기술하는 고조파 간격 값이고,
    상기 고조파 간격 값은 상기 오디오 신호(102)의 적어도 2개의 고조파 신호 성분들(124_1:124_6)을 나타내는 복수의 개개의 인코딩된 스펙트럼 계수들 또는 인코딩된 스펙트럼 계수들의 그룹들을 나타내는,
    변환 도메인 또는 필터 뱅크 도메인에서 인코딩된 오디오 신호를 디코딩하기 위한 방법(400).
  65. 컴퓨터 프로그램으로서,
    제 53 항 내지 제 64 항 중 어느 한 항에 따른 방법을 수행하기 위한,
    컴퓨터 프로그램.
KR1020177028551A 2015-03-09 2016-03-07 오디오 인코더, 오디오 디코더, 오디오 신호를 인코딩하기 위한 방법 및 인코딩된 오디오 신호를 디코딩하기 위한 방법 KR102151728B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP15158253.3 2015-03-09
EP15158253 2015-03-09
EPPCT/EP2015/063658 2015-06-17
PCT/EP2015/063658 WO2016142002A1 (en) 2015-03-09 2015-06-17 Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
PCT/EP2016/054831 WO2016142357A1 (en) 2015-03-09 2016-03-07 Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Publications (2)

Publication Number Publication Date
KR20170134475A true KR20170134475A (ko) 2017-12-06
KR102151728B1 KR102151728B1 (ko) 2020-09-03

Family

ID=52692424

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177028551A KR102151728B1 (ko) 2015-03-09 2016-03-07 오디오 인코더, 오디오 디코더, 오디오 신호를 인코딩하기 위한 방법 및 인코딩된 오디오 신호를 디코딩하기 위한 방법

Country Status (20)

Country Link
US (2) US10600428B2 (ko)
EP (3) EP3373298B1 (ko)
JP (3) JP6666356B2 (ko)
KR (1) KR102151728B1 (ko)
CN (3) CN114067812A (ko)
AR (6) AR103890A1 (ko)
AU (4) AU2016231220B2 (ko)
BR (1) BR112017019185B1 (ko)
CA (1) CA2978815C (ko)
ES (1) ES2821025T3 (ko)
HK (1) HK1244583A1 (ko)
MX (1) MX365267B (ko)
MY (1) MY181486A (ko)
PL (1) PL3268960T3 (ko)
PT (1) PT3268960T (ko)
RU (1) RU2707151C2 (ko)
SG (1) SG11201707349WA (ko)
TW (1) TWI613644B (ko)
WO (1) WO2016142002A1 (ko)
ZA (6) ZA201706604B (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
CN109473116B (zh) * 2018-12-12 2021-07-20 思必驰科技股份有限公司 语音编码方法、语音解码方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070016415A1 (en) * 2005-07-15 2007-01-18 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US20120029925A1 (en) * 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH572650A5 (ko) * 1972-12-21 1976-02-13 Gretag Ag
JPS6031198A (ja) * 1983-07-29 1985-02-16 松下電器産業株式会社 予測残差信号符号化方法
US5787387A (en) * 1994-07-11 1998-07-28 Voxware, Inc. Harmonic adaptive speech coding method and system
JP3680374B2 (ja) * 1995-09-28 2005-08-10 ソニー株式会社 音声合成方法
US5781888A (en) * 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
US6161089A (en) * 1997-03-14 2000-12-12 Digital Voice Systems, Inc. Multi-subframe quantization of spectral parameters
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
JP2002162998A (ja) * 2000-11-28 2002-06-07 Fujitsu Ltd パケット修復処理を伴なう音声符号化方法
EP1304885A3 (de) * 2001-09-14 2005-04-20 Siemens Aktiengesellschaft Verfahren und Computerprogrammprodukt zur Codierung und Decodierung von Videosignalen
WO2003088314A2 (en) * 2002-04-12 2003-10-23 Arch Specialty Chemicals, Inc. Remote monitoring system for chemical liquid delivery
US7634399B2 (en) * 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
EP1475144A2 (de) * 2003-05-09 2004-11-10 Pfaudler Werke GmbH Stromstörer für einen Rührkessel, aufweisend mindestens ein Stromstörelement
US7688894B2 (en) * 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
CN1839426A (zh) * 2003-09-17 2006-09-27 北京阜国数字技术有限公司 多分辨率矢量量化的音频编解码方法及装置
US7356748B2 (en) * 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs
TWI277013B (en) * 2005-02-01 2007-03-21 Ind Tech Res Inst Method for reducing buffered-frame memory sizes and accesses in a video codec
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
EP1852849A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
KR101365445B1 (ko) * 2007-01-03 2014-02-19 삼성전자주식회사 전역 및 국부 움직임 보상을 순차적으로 이용하는 움직임보상 방법, 복호화 방법, 장치, 인코더 및 디코더
DE102007018484B4 (de) * 2007-03-20 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Senden einer Folge von Datenpaketen und Decodierer und Vorrichtung zum Decodieren einer Folge von Datenpaketen
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
WO2009110738A2 (ko) * 2008-03-03 2009-09-11 엘지전자(주) 오디오 신호 처리 방법 및 장치
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
CN101552005A (zh) * 2008-04-03 2009-10-07 华为技术有限公司 编码方法、解码方法、系统及装置
CA2871252C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
KR101518532B1 (ko) * 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
BRPI0910796B1 (pt) * 2008-07-11 2021-07-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de áudio e decodificador de áudio
US8406307B2 (en) * 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
EP2192786A1 (en) * 2008-11-27 2010-06-02 Panasonic Corporation Frequency domain filters for video coding
EP2380363B1 (en) * 2009-01-20 2015-09-30 MED-EL Elektromedizinische Geräte GmbH High accuracy tonotopic and periodic coding with enhanced harmonic resolution
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8391212B2 (en) * 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
KR101487687B1 (ko) * 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
JP5625076B2 (ja) * 2010-03-10 2014-11-12 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. コーディングコンテキストのピッチ依存適合を用いた、オーディオ信号復号器、オーディオ信号符号化器、オーディオ信号を復号するための方法、オーディオ信号を符号化するための方法、およびコンピュータプログラム
CN101847413B (zh) * 2010-04-09 2011-11-16 北京航空航天大学 一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法
JP5387522B2 (ja) * 2010-07-01 2014-01-15 コニカミノルタ株式会社 カラー画像形成装置
KR102073544B1 (ko) * 2010-09-16 2020-02-05 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
CA2813898C (en) * 2010-10-07 2017-05-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for level estimation of coded audio frames in a bit stream domain
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
WO2012119655A1 (en) * 2011-03-10 2012-09-13 Telefonaktiebolaget L M Ericsson (Publ) Decoding of transforms with curved basis functions
KR102070430B1 (ko) * 2011-10-21 2020-01-28 삼성전자주식회사 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
WO2013093172A1 (en) * 2011-12-20 2013-06-27 Nokia Corporation Audio conferencing
PL3385950T3 (pl) 2012-05-23 2020-02-28 Nippon Telegraph And Telephone Corporation Sposoby dekodowania audio, dekodery audio oraz odpowiedni program i nośnik rejestrujący
CN102798870B (zh) * 2012-08-07 2013-09-25 中国空间技术研究院 一种卫星导航系统兼容性分析方法
EP3252762B1 (en) * 2012-10-01 2019-01-30 Nippon Telegraph and Telephone Corporation Encoding method, encoder, program and recording medium
MY173781A (en) * 2013-01-08 2020-02-20 Dolby Int Ab Model based prediction in a critically sampled filterbank
EP2961926A4 (en) * 2013-02-27 2016-06-01 Evolution Engineering Inc DEVICE FOR PRODUCING LIQUID PRESSURE PULSES AND METHOD FOR USING THEREOF
WO2014161996A2 (en) * 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
EP3011556B1 (en) * 2013-06-21 2017-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
ES2805744T3 (es) * 2013-10-31 2021-02-15 Fraunhofer Ges Forschung Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo
JP6031198B2 (ja) 2013-11-06 2016-11-24 株式会社日立製作所 信号伝送回路及びプリント基板
WO2015081699A1 (zh) * 2013-12-02 2015-06-11 华为技术有限公司 一种编码方法及装置
CN104934034B (zh) * 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
KR20240010550A (ko) * 2014-03-28 2024-01-23 삼성전자주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
EP2963646A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
JP5723472B1 (ja) * 2014-08-07 2015-05-27 廣幸 田中 データリンク生成装置、データリンク生成方法、データリンク構造および電子ファイル
JP6814146B2 (ja) * 2014-09-25 2021-01-13 サンハウス・テクノロジーズ・インコーポレーテッド オーディオをキャプチャーし、解釈するシステムと方法
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US20170022149A1 (en) * 2015-07-25 2017-01-26 Mark Quang Nguyen Fumarate compounds, pharmaceutical compositions thereof, and methods of use

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070016415A1 (en) * 2005-07-15 2007-01-18 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US20120029925A1 (en) * 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
EVS Codec Detailed Algorithmic Description (3GPP TS 26.445 version 12.0.0 Release 12). ETSI TS 126 445 V12.0.0. 2014.11. *
ISO/IEC FDIS 23003-3:2011(E), Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding. ISO/IEC JTC 1/SC 29/WG 11. 2011.09.20. *

Also Published As

Publication number Publication date
BR112017019185A2 (pt) 2018-04-24
AU2019203173A1 (en) 2019-05-30
ZA202204767B (en) 2022-08-31
CA2978815A1 (en) 2016-09-15
SG11201707349WA (en) 2017-10-30
US20170365267A1 (en) 2017-12-21
AR103890A1 (es) 2017-06-14
BR112017019185B1 (pt) 2023-09-26
AU2016231220B2 (en) 2019-05-16
TW201637002A (zh) 2016-10-16
EP4297027A2 (en) 2023-12-27
ZA202204765B (en) 2022-08-31
KR102151728B1 (ko) 2020-09-03
JP7078592B2 (ja) 2022-05-31
EP3268960B1 (en) 2020-06-24
AU2021215252B2 (en) 2023-07-06
WO2016142002A1 (en) 2016-09-15
PT3268960T (pt) 2020-09-29
CN114067813A (zh) 2022-02-18
AU2021215252A1 (en) 2021-09-02
AR122488A2 (es) 2022-09-14
CN114067812A (zh) 2022-02-18
EP3268960A1 (en) 2018-01-17
AR122486A2 (es) 2022-09-14
RU2017134620A3 (ko) 2019-04-09
US20200227058A1 (en) 2020-07-16
ES2821025T3 (es) 2021-04-23
AR122489A2 (es) 2022-09-14
AU2016231220A1 (en) 2017-09-28
TWI613644B (zh) 2018-02-01
CN107533847B (zh) 2021-09-10
ZA202204766B (en) 2022-08-31
ZA202204764B (en) 2022-08-31
ZA201706604B (en) 2022-08-31
MX365267B (es) 2019-05-22
JP2020038380A (ja) 2020-03-12
CA2978815C (en) 2021-02-02
US10600428B2 (en) 2020-03-24
PL3268960T3 (pl) 2021-01-11
ZA202204768B (en) 2022-08-31
CN107533847A (zh) 2018-01-02
MY181486A (en) 2020-12-23
RU2017134620A (ru) 2019-04-09
JP2018511821A (ja) 2018-04-26
AU2023241343A1 (en) 2023-10-26
AU2019203173B2 (en) 2021-05-13
EP3373298B1 (en) 2023-12-20
HK1244583A1 (zh) 2018-08-10
JP2022110116A (ja) 2022-07-28
AR122487A2 (es) 2022-09-14
EP3373298A1 (en) 2018-09-12
EP3373298C0 (en) 2023-12-20
MX2017011494A (es) 2018-01-25
JP6666356B2 (ja) 2020-03-13
RU2707151C2 (ru) 2019-11-22
EP4297027A3 (en) 2024-03-20
AR122219A2 (es) 2022-08-24

Similar Documents

Publication Publication Date Title
JP7078592B2 (ja) オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化する方法、および符号化されたオーディオ信号を復号化する方法
JP6744363B2 (ja) スペクトルエンベロープのサンプル値のコンテキストベースエントロピー復号化器、パラメトリック復号化器、コンテキストベースエントロピー符号化器、復号化方法、符号化方法およびコンピュータプログラム
JP6248194B2 (ja) 多チャネルオーディオ符号化におけるノイズ充填
JP6911080B2 (ja) 変換長切替えをサポートする周波数ドメインオーディオ符号化
WO2016142357A1 (en) Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right