KR101634979B1 - 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측 - Google Patents

임계적으로 샘플링된 필터뱅크에서 모델 기반 예측 Download PDF

Info

Publication number
KR101634979B1
KR101634979B1 KR1020157018150A KR20157018150A KR101634979B1 KR 101634979 B1 KR101634979 B1 KR 101634979B1 KR 1020157018150 A KR1020157018150 A KR 1020157018150A KR 20157018150 A KR20157018150 A KR 20157018150A KR 101634979 B1 KR101634979 B1 KR 101634979B1
Authority
KR
South Korea
Prior art keywords
subband
signal
prediction
samples
model
Prior art date
Application number
KR1020157018150A
Other languages
English (en)
Other versions
KR20150099770A (ko
Inventor
랄스 빌레모에스
Original Assignee
돌비 인터네셔널 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 인터네셔널 에이비 filed Critical 돌비 인터네셔널 에이비
Publication of KR20150099770A publication Critical patent/KR20150099770A/ko
Application granted granted Critical
Publication of KR101634979B1 publication Critical patent/KR101634979B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/32Circuit design at the digital level
    • G06F30/327Logic synthesis; Behaviour synthesis, e.g. mapping logic, HDL to netlist, high-level language to RTL or netlist
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Measurement Of Radiation (AREA)
  • Design And Manufacture Of Integrated Circuits (AREA)

Abstract

본 명세서는 오디오 소스 코딩 시스템들에 관한 것이다. 특히, 본 명세서는 필터 뱅크와 결합하여 선형 예측을 이용하는 오디오 소스 코딩 시스템들에 관한 것이다. 오디오 신호의 제 1 서브대역의 제 1 서브대역 신호의 제 1 샘플(615)을 추정하기 위한 방법이 기술된다. 오디오 신호의 제 1 서브대역 신호는 오디오 신호로부터 복수의 서브대역들의 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크(612)를 사용하여 결정된다. 상기 방법은, 신호 모델의 모델 파라미터(613)를 결정하는 단계; 신호 모델에 기초하여, 모델 파라미터(613)에 기초하여 및 분석 필터뱅크(612)에 기초하여 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호들의 이전 샘플(614)에 적용될 예측 계수를 결정하는 단계로서, 이전 샘플(614)의 타임 슬롯이 제 1 샘플(615)의 타입 슬롯 전인, 상기 결정 단계; 및 이전 샘플(614)에 예측 계수를 적용함으로써 제 1 샘플(615)의 추정치를 결정하는 단계를 포함한다.

Description

임계적으로 샘플링된 필터뱅크에서 모델 기반 예측{MODEL BASED PREDICTION IN A CRITICALLY SAMPLED FILTERBANK}
본 발명은 오디오 소스 코딩 시스템들에 관한 것이다. 특히, 본 발명은 필터뱅크와 결합하여 선형 예측을 사용하는 오디오 소스 코딩 시스템들에 관한 것이다.
오디오 신호들의 소스 코딩을 위한 시스템에 적용된 두 개의 중요한 신호 처리 툴들, 즉, 임계적으로 샘플링된 필터뱅크들 및 선형 예측이 존재한다. 임계적으로 샘플링된 필터뱅크들(예를 들면, 변조된 이산 코사인 변환(MDCT) 기반 필터뱅크들)은 지각적인 무관계 및 신호 리던던시가 이용될 수 있는 시간-주파수 표현들에 대해 직접 액세스하게 한다. 선형 예측은 오디오 신호들, 특히, 스피치 신호들의 효율적인 소스 모델링을 가능하게 한다. 두 개의 툴들의 조합, 즉, 필터뱅크의 서브대역들에서 예측의 사용은 주로 고 비트 레이트 오디오 코딩에 사용되었다. 저 비트 레이트 코딩을 위해, 서브대역들에서 예측에 의한 도전 과제는 예측자들의 디스크립션에 대한 비용(즉, 비트 레이트)을 낮게 유지하는 것이다. 다른 도전 과제는 서브대역 예측자에 의해 획득된 예측 에러 신호의 결과적인 잡음 성형을 제어하는 것이다.
US2006/0015329A1은 오디오 신호의 예측된 샘플들의 세트를 생성하기 위해 파형 합성기를 이용하는 오디오 코딩을 위한 방법을 기술한다.
비트-효율적 방식으로 서브대역 예측자의 디스크립션을 인코딩하는 도전 과제에 대하여, 가능한 경로는 오디오 신호의 이전 디코딩된 부분들로부터 예측자를 추정하고 그에 의해 예측자 디스크립션의 비용을 함께 회피하는 것이다. 예측자가 오디오 신호의 이전에 디코딩된 부분들로부터 결정될 수 있는 경우, 예측자는 인코더로부터 디코더로 예측자 디스크립션을 전송할 필요 없이 인코더에서 및 디코더에서 결정될 수 있다. 이러한 방식은 백워드 적응식 예측 방식이라고 불린다. 그러나, 백워드 적응식 예측 방식은 일반적으로 인코딩된 오디오 신호의 비트 레이트가 감소될 때 상당히 열화한다. 서브대역 예측자의 효율적인 인코딩에 대한 대안적이거나 추가적인 경로는 더 자연적인 예측자 디스크립션, 예를 들면, 인코딩될 오디오 신호의 고유한 구조를 이용하는 디스크립션을 식별하는 것이다. 예를 들면, 저 비트 레이트 속도 코딩은 일반적으로 단기 예측자(단기 상관들을 이용하는) 및 장기 예측자(속도 신호의 기본적인 피치에 의해 장기 상관들을 이용하는)의 간단한 표현에 기초하여 포워드 적응적 방식을 적용한다.
예측 에러 신호의 잡음 성형을 제어하는 도전 과제에 대하여, 예측자의 잡음 성형이 서브대역 내에서 잘 제어될 수 있는 동안, 인코더의 최종 출력 오디오 신호는 에일리어스 아티팩트들(실질적으로 평탄한 스펙트럼 잡음 성형을 나타내는 오디오 신호들을 제외하고)을 나타낸다는 것이 관찰된다.
서브대역 예측자의 중요한 경우는 중첩하는 윈도우들을 갖는 필터뱅크에서 장기 예측의 구현이다. 장기 예측자는 일반적으로 주기적이고 거의 주기적인 오디오 신호들(예컨대 고유한 피치를 나타내는 속도 신호들)에서 리던던시들을 이용하고, 단일의 또는 적은 수의 예측 파라미터들로 기술될 수 있다. 장기 예측자는 오디오 신호의 주기성을 반영하는 지연에 의해 연속하는 시간에 규정될 수 있다. 이러한 지연이 필터뱅크 윈도우의 길이와 비교하여 클 때, 장기 예측자는 시프트 또는 부분적인 지연에 의해 개별적인 시간 도메인에서 실행될 수 있고 서브대역 도메인에서 인과관계의 예측자로 다시 변환될 수 있다. 이러한 장기 예측자는 일반적으로 에일리어스 아티팩트들을 나타내지 않지만, 시간 도메인으로부터 서브대역 도메인으로의 변환에 대한 추가의 필터뱅크 연산들에 대한 필요에 의해 야기된 계산 복잡성에서 상당한 불이익이 존재한다. 또한, 시간 도메인에서 지연을 결정하고 지연을 서브대역 예측자로 변환시키는 방식은 인코딩될 오디오 신호의 주기가 필터뱅크 윈도우 사이즈와 비슷하거나 그보다 작은 경우에 대해 적용가능하지 않다.
본 발명은 서브대역 예측의 상기 언급된 단점들을 기술한다. 특히, 본 발명은 서브대역 예측자들의 비트-레이트 효율적인 기술을 위해 허용하고 및/또는 서브대역 예측자들에 의해 야기된 에일리어스 아티팩트들의 감소를 허용하는 방법들 및 시스템들을 기술한다. 특히, 본 발명에 기술된 방법 및 시스템들은 감소된 레벨의 에일리어싱 아티팩트들을 야기하는 서브대역 예측을 사용하는 저 비트 레이트 오디오 코더들의 구현을 가능하게 한다.
본 발명은 임계적으로 샘플링된 필터뱅크의 서브대역 도메인에서 예측을 채용하는 오디오 소스 코딩의 품질을 개선하는 방법들 및 시스템들을 기술한다. 상기 방법들 및 시스템들은 서브대역 예측자들의 간단한 디스크립션을 이용할 수 있고, 디스크립션은 신호 모델들에 기초한다. 대안적으로 또는 추가로, 상기 방법들 및 시스템들은 서브대역 도메인에서 직접 예측자들의 효율적인 구현을 이용할 수 있다. 대안적으로 또는 추가로, 상기 방법들 및 시스템들은 에일리어스 아티팩트들의 감소를 허용하기 위해 본 발명에서 기술된 교차 서브대역 예측자 용어들을 이용할 수 있다.
본 발명에서 개요로 서술된 바와 같이, 서브대역 예측자들의 간단한 기술은 사인파의 주파수, 주기적 신호의 주기, 팽팽한 스트링의 진동에 대해 겪는 약간 비고조파 스펙트럼, 및/또는 다성음 신호에 대한 피치들의 크기를 포함할 수 있다. 장기 예측자의 경우에 대하여, 주기적 신호 모델은 필터뱅크의 윈도우 크기보다 짧거나 및/또는 긴 값들을 포함하는 래그 파라미터들(또는 지연들)의 범위에 대해 고품질 인과 관계 예측자들을 제공하는 것이 도시된다. 이는 주기적 신호 모델이 효율적인 방식으로 장기 서브대역 예측자를 실행하기 위해 사용될 수 있다는 것을 의미한다. 끊김 없는 이동은 사인파 모델 기반 예측으로부터 임의의 지연의 근사치로 제공된다. 서브대역 도메인에서 예측자들의 직접 구현은 생성된 양자화 왜곡들의 지각적인 특징들에 대한 명시적 액세스를 가능하게 한다. 또한, 서브대역 도메인에서 예측자들의 구현은 파라미터들에 대한 예측 이득 및 예측자들의 의존성과 같은 수치적 속성들에 대한 액세스를 가능하게 한다. 예를 들면, 신호 모델 기반 분석은 예측 이득이 단지 고려된 서브대역들의 서브세트에서 중요하고, 송신을 위해 선택된 파라미터들의 함수로서 예측자 계수들의 변형이 파라미터 포맷들, 및 효율적인 인코딩 알고리즘의 설계에 도움이 될 수 있다. 더욱이, 계산 복잡성은 시간 도메인에서 및 서브대역 도메인에서 모두 동작하는 알고리즘들의 사용에 의존하는 예측자 구현들에 비교하여 상당히 감소될 수 있다는 것을 드러낼 수 있다. 특히, 본 발명에서 기술된 방법들 및 시스템들은 시간 도메인에서 예측자(예를 들면, 장기 지연)를 결정 및 적용할 필요 없이 서브대역 도메인에서 직접 서브대역 예측을 실행하기 위해 사용될 수 있다.
서브대역 예측자들에서 교차-서브대역 기간들의 사용은 대역내 예측자들(단지 대역내 예측에 의존하는)에 비하여 상당히 개선된 주파수 도메인 잡음 성형 속성들을 가능하게 한다. 이를 행함으로써, 에일리어싱 아티팩트들이 감소될 수 있고, 그에 의해 상대적으로 저 비트 레이트 오디오 코딩 시스템들에 대한 서브대역 예측의 사용을 가능하게 한다.
일 양태에 따라, 오디오 신호의 제 1 서브대역의 제 1 샘플을 추정하기 위한 방법이 기술된다. 오디오 신호의 제 1 서브대역은 오디오 신호로부터 복수의 서브대역들에서 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정될 수 있었다. 시간 도메인 오디오 신호는 분석 필터뱅크에 제출될 수 있고, 그에 의해 복수의 서브대역들에서 복수의 서브대역 신호들을 산출한다. 복수의 서브대역들의 각각은 일반적으로 상이한 주파수 범위의 오디오 신호를 포함하고, 그에 의해 오디오 신호의 상이한 주파수 성분들에 대한 액세스를 제공한다. 복수의 서브대역들은 동등하거나 균등한 서브대역 간격을 가질 수 있다. 제 1 서브대역은 분석 필터뱅크에 의해 제공된 복수의 서브대역들 중 하나에 대응한다.
분석 필터뱅크는 다양한 속성들을 가질 수 있다. 복수의 합성 필터들을 포함하는 합성 필터뱅크는 유사하거나 동일한 속성들을 가질 수 있다. 분석 필터뱅크 및 분석 필터들에 대해 기술된 속성들은 또한 합성 필터뱅크 및 합성 필터들의 속성들에 적용가능하다. 일반적으로, 분석 필터뱅크 및 합성 필터뱅크의 조합은 오디오 신호의 완전한 재구성을 허용한다. 분석 필터뱅크의 분석 필터들은 서로에 관하여 시프트-불변일 수 있다. 대안적으로 또는 추가로, 분석 필터뱅크의 분석 필터들은 공통 윈도우 함수를 포함할 수 있다. 특히, 분석 필터뱅크의 분석 필터들은 공통 윈도우 함수의 다르게 변조된 버전들을 포함할 수 있다. 일 실시예에서, 공통 윈도우 함수는 코사인 함수를 사용하여 변조되고, 그에 의해 코사인 변조된 분석 필터뱅크를 산출한다. 특히, 분석 필터뱅크는, MDCT, QMF, 및/또는 ELT 변환 중 하나 이상을 포함할 수 있다(또는 그에 대응할 수 있다). 공통 윈도우 함수는 유한 지속 기간(K)을 가질 수 있다. 공통 윈도우 함수의 지속 기간은 서브대역 신호의 연속하는 샘플들이 시간 도메인 오디오 신호의 중첩하는 세그먼트들을 사용하여 결정되는 것일 수 있다. 이와 같이, 분석 필터뱅크는 중첩된 변환을 포함할 수 있다. 분석 필터뱅크의 분석 필터들은 직교 및/또는 정규 직교 기반을 형성할 수 있다. 다른 속성으로서, 분석 필터뱅크는 임계적으로 샘플링된 필터뱅크에 대응할 수 있다. 특히, 복수의 서브대역 신호들의 샘플들의 수는 시간 도메인 오디오 신호의 샘플들의 수에 대응할 수 있다.
방법은 신호 모델의 모델 파라미터를 결정하는 단계를 포함할 수 있다. 신호 모델은 복수의 모델 파라미터들을 사용하여 기술될 수 있다는 것이 주의되어야 한다. 이와 같이, 방법은 신호 모델의 복수의 모델 파라미터들을 결정하는 단계를 포함할 수 있다. 모델 파라미터(들)는 모델 파라미터 및 예측 에러 신호를 포함하거나 또는 그를 나타내는 수신된 비트스트림으로부터 추출될 수 있다. 대안적으로, 모델 파라미터(들)는, 예를 들면, 평균 제곱 오차 방식을 사용하여, 신호 모델을 오디오 신호에 맞춤으로써(예를 들면, 프레임마다에 기초하여) 결정될 수 있다.
신호 모델은 하나 이상의 사인파 모델 성분들을 포함할 수 있다. 이러한 경우에, 모델 파라미터는 하나 이상의 사인파 모델 성분들의 하나 이상의 주파수들을 나타낼 수 있다. 예로서, 모델 파라미터는 다중-사인파 신호 모델의 기본 주파수(Ω)를 나타낼 수 있고, 다중-사인파 신호는 기본 주파수(Ω)의 배수들(qΩ)에 대응하는 주파수들에서 사인파 모델 성분들을 포함한다. 이와 같이, 다중-사인파 신호 모델은 주기적 신호 성분을 포함할 수 있고, 주기적 신호 성분은 복수의 사인파 성분들을 포함하고 복수의 사인파 성분들은 기본 주파수(Ω)의 배수인 주파수를 갖는다. 본 명세서에서 보여지는 바와 같이, 이러한 주기적 신호 성분은 (예를 들면, 장기 예측자들에 대해 사용되는) 시간 도메인에서 지연을 모델링하기 위해 사용될 수 있다. 신호 모델은 주기적 신호 모델로부터 신호 모델의 시프트 및/또는 편차를 나타내는 하나 이상의 모델 파라미터들을 포함할 수 있다. 시프트 및/또는 편차는 기본 주파수(Ω)의 각각의 배수들(qΩ)로부터 주기적 신호 모델의 복수의 사인파 성분들의 주파수들의 편차를 나타낼 수 있다.
신호 모델은 복수의 주기적 신호 성분들을 포함할 수 있다. 주기적 신호 성분들의 각각은 하나 이상의 모델 파라미터들을 사용하여 기술될 수 있다. 모델 파라미터들은 복수의 주기적 신호 성분들의 복수의 기본 주파수들(Ω0, Ω1, ..., ΩM-1)을 나타낼 수 있다. 대안적으로 또는 추가로, 신호 모델은 미리 결정된 및/또는 조정 가능한 완화 파라미터(모델 파라미터들 중 하나일 수 있는)에 의해 기술될 수 있다. 완화 파라미터는 주기적 신호 성분의 선형 스펙트럼을 안정화하거나 평탄화하도록 구성될 수 있다. 신호 모델 및 연관된 모델 파라미터들의 특정 예들은 본 명세서의 실시예 섹션에서 기술된다.
모델 파라미터(들)는 제곱된 예측 에러 신호의 평균값이 감소(예를 들면, 최소화)되도록 결정될 수 있다. 예측 에러 신호는 제 1 샘플과 제 1 샘플의 추정치 사이의 차에 기초하여 결정될 수 있다. 특히, 제곱된 예측 에러 신호의 평균값은 제 1 서브대역 신호의 복수의 연속하는 제 1 샘플들에 기초하여 및 대응하는 복수의 추정된 제 1 샘플들에 기초하여 결정될 수 있다. 특히, 본 명세서에서, 하나 이상의 모델 파라미터들에 의해 기술되는 신호 모델을 사용하여 오디오 신호 또는 오디오 신호의 적어도 제 1 서브대역 신호를 모델링하는 것이 제안된다. 모델 파라미터들은 제 1 추정된 서브대역 신호를 결정하는 선형 예측자의 하나 이상의 예측 계수들을 결정하기 위해 사용된다. 제 1 서브대역 신호와 제 1 추정된 서브대역 신호 사이의 차이는 예측 에러 서브대역 신호를 산출한다. 하나 이상의 모델 파라미터들은 제곱된 예측 에러 서브대역 신호의 평균값이 감소되도록(예를 들면, 최소화되도록) 결정될 수 있다.
방법은 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호의 이전 샘플에 적용될 예측 계수를 결정하는 단계를 추가로 포함할 수 있다. 특히, 이전 샘플은 제 1 서브대역 신호의 대응하는 샘플에 예측 에러 신호의 (양자화된 버전)을 추가함으로써 결정될 수 있다. 제 1 디코딩된 서브대역 신호가 제 1 서브대역 신호와 동일할 수 있다(예를 들면, 손실 없는 인코더의 경우). 이전 샘플의 타임 슬롯은 일반적으로 제 1 샘플의 타임 슬롯 전이다. 특히, 방법은 하나 이상의 이전 샘플들로부터 제 1 서브대역 신호의 제 1 샘플을 결정하도록 구성되는 반복되는 (유한 임펄스 응답) 예측 필터의 하나 이상의 예측 계수들을 결정하는 단계를 포함할 수 있다.
하나 이상의 예측 계수들은 신호 모델에 기초하여, 모델 파라미터에 기초하여, 및 분석 필터뱅크에 기초하여 결정될 수 있다. 특히, 예측 계수는 신호 모델의 및 분석 필터뱅크의 분석 평가에 기초하여 결정될 수 있다. 신호 모델의 및 분석 필터뱅크의 분석 평가는 참조표의 및/또는 분석 함수의 결정을 초래할 수 있다. 이와 같이, 예측 계수는 참조표 및/또는 분석 함수를 사용하여 결정될 수 있고, 참조표 및/또는 분석 함수는 신호 모델에 기초하여 및 분석 필터뱅크에 기초하여 미리 결정될 수 있다. 참조표 및/또는 분석 함수는 예측 계수(들)를 모델 파라미터(들)로부터 도출된 파라미터의 함수로서 제공할 수 있다. 모델 파라미터로부터 도출된 파라미터는 예를 들면, 모델 파라미터일 수 있거나 또는 미리 결정된 함수를 사용하여 모델 파라미터로부터 획득될 수 있다. 이와 같이, 하나 이상의 예측 계수들은 (단지) 하나 이상의 모델 파라미터들로부터 도출된 (단지) 하나 이상의 파라미터들의 의존성에서 하나 이상의 예측 계수들을 제공하는 분석 함수 및/또는 미리 결정된 참조표를 사용하여 계산 효율적인 방식으로 결정될 수 있다. 따라서, 예측 계수의 결정은 참조표 내 엔트리의 간단한 검색으로 감소될 수 있다. 상기 나타낸 바와 같이, 분석 필터뱅크는 변조된 구조를 포함하거나 나타낼 수 있다. 이러한 변조된 구조의 결과로서, 하나 이상의 예측 계수들의 절대값이 제 1 서브대역의 인덱스 수에 독립적인 것이 관찰된다. 이는, 참조표 및/또는 분석 함수가 복수의 서브대역들의 인덱스 수에 관하여 시프트-불변(신호값 제외)일 수 있다는 것을 의미한다. 이러한 경우들에서, 모델 파라미터로부터 도출된 파라미터, 즉, 예측 계수를 결정하기 위해 참조표 및/또는 분석 함수에 입력된 파라미터는 복수의 서브대역들 중 하나의 서브대역에 관하여 상대적인 방식으로 모델 파라미터를 표현함으로써 도출될 수 있다.
상기 개요로 서술된 바와 같이, 모델 파라미터는 다중-사인파 신호 모델의(예를 들면, 주기적 신호 모델의) 기본 주파수(Ω)를 나타낼 수 있다. 이러한 경우들에서, 예측 계수를 결정하는 단계는 제 1 서브대역 내에 놓인 기본 주파수(Ω)의 배수를 결정하는 단계를 포함할 수 있다. 기본 주파수(Ω)의 배수가 제 1 서브대역 내에 놓인 경우, 제 1 서브대역의 중심 주파수로부터 기본 주파수(Ω)의 배수의 상대적인 오프셋이 결정될 수 있다. 특히, 제 1 서브대역의 중심 주파수에 가장 가까운 기본 주파수(Ω)의 배수의 상대적인 오프셋이 결정될 수 있다. 참조표 및/또는 분석 함수는, 참조표 및/또는 분석 함수가 예측 계수를 서브대역의 중심 주파수로부터 가능한 상대적인 오프셋들의 함수로서(예를 들면, 본 명세서에서 기술되는, 정규화된 주파수(f)의 함수로서 및/또는 시프트 파라미터(
Figure 112015065692244-pct00001
)의 함수로서) 제공하도록 미리 결정될 수 있다. 이와 같이, 예측 계수는 결정된 상대적인 오프셋을 사용하여 참조표에 기초하여 및/또는 분석 함수에 기초하여 결정될 수 있다. 미리 결정된 참조표는 제한된 수의 가능한 상대적인 오프셋들에 대해 제한된 수의 엔트리들을 포함할 수 있다. 이러한 경우에서, 결정된 상대적인 오프셋은 참조표로부터 예측 계수를 검색하기 전에 제한된 수의 가능한 상대적인 오프셋들로부터 가장 가까운 가능한 상대적인 오프셋으로 근사될 수 있다.
다른 한편으로, 기본 주파수(Ω)의 어떠한 배수도 제 1 서브대역 내에 놓이지 않고, 즉 오히려, 제 1 서브대역을 둘러싸는 확장된 주파수 범위 내에 있는 경우, 예측 계수는 0으로 설정된다. 이러한 경우들에서, 제 1 샘플의 추정치는 또한 0일 수 있다.
예측 계수를 결정하는 단계는 모델 파라미터에 기초하여 복수의 참조표들 중 하나를 선택하는 단계를 포함할 수 있다. 예로서, 모델 파라미터는 주기적 신호 모델의 기본 주파수(Ω)를 나타낼 수 있다. 주기적 신호 모델의 기본 주파수(Ω)는 주기적 신호 모델의 주기성(T)에 대응한다. 상대적으로 작은 주기성들(T)의 경우에, 주기적 신호 모델은 단일 사인파 모델을 향해 수렴되는 것이 본 명세서에서 보여진다. 또한, 상대적으로 큰 주기성들(T)의 경우에, 참조표들은 T의 절대값에 따라 느리게 변하고 있고 주로 상대적인 오프셋(즉, 시프트 파라미터(
Figure 112015065692244-pct00002
))에 의존하는 것이 본 발명에서 보여진다. 이와 같이, 복수의 참조표들이 주기성(T)의 복수의 상이한 값들에 대해 미리 결정될 수 있다. 모델 파라미터(즉, 주기성(T))는 복수의 참조표들 중 적절한 것을 선택하기 위해 사용될 수 있고, 예측 계수는 (상대적인 오프셋을 사용하여, 예를 들면, 시프트 파라미터(
Figure 112015065692244-pct00003
)를 사용하여) 복수의 참조표들 중 선택된 것에 기초하여 결정될 수 있다. 이와 같이, 상대적으로 높은 정확도를 가질 수 있는 모델 파라미터(예를 들면, 주기성(T)을 나타내는)는 감소된 정확도의 한 쌍의 파라미터들(예를 들면, 주기성(T) 및 상대적인 오프셋)로 디코딩될 수 있다. 한 쌍의 파라미터들의 제 1 파라미터(예를 들면, 주기성(T))는 특정한 참조표를 선택하기 위해 사용될 수 있고, 제 2 파라미터(예를 들면, 상대적인 오프셋)는 선택된 참조표내 엔트리를 식별하기 위해 사용될 수 있다.
방법은 예측 계수를 이전 샘플에 적용함으로써 제 1 샘플의 추정치를 결정하는 단계를 추가로 포함할 수 있다. 예측 계수를 이전 샘플에 적용하는 단계는 예측 계수를 이전 샘플의 값과 곱하여, 그에 의해 제 1 샘플의 추정치를 산출하는 단계를 포함할 수 있다. 일반적으로, 제 1 서브대역 신호의 복수의 제 1 샘플들은 예측 계수를 일련의 이전 샘플들에 적용함으로써 결정된다. 제 1 샘플의 추정치를 결정하는 단계는 스케일링 이득을 예측 계수 및/또는 제 1 샘플에 적용하는 단계를 추가로 포함할 수 있다. 스케일링 이득 또는 그의 표시는, 예를 들면, 장기 예측(LTP)에 대하여 사용될 수 있다. 다시 말해서, 스케일링 이득은 상이한 예측자(예를 들면, 장기 예측자로부터)로부터 기인할 수 있다. 스케일링 이득은 상이한 서브대역들에 대해 상이할 수 있다. 또한, 스케일링 이득은 인코딩된 오디오 신호의 부분으로서 송신될 수 있다.
이와 같이, 서브대역 예측자의 효율적인 디스크립션(하나 이상의 예측 계수들을 포함하는)이 모델 파라미터에 의해 기술되는 신호 모델을 사용함으로써 제공된다. 모델 파라미터는 서브대역 예측자의 하나 이상의 예측 계수들을 결정하기 위해 사용된다. 이는 오디오 인코더가 하나 이상의 예측 계수들의 표시가 아니라 모델 파라미터의 표시를 송신할 필요가 있다는 것을 의미한다. 일반적으로, 모델 파라미터는 하나 이상의 예측 계수들보다 더 효율적으로(즉, 더 적은 수의 비트들을 갖고) 인코딩될 수 있다. 따라서, 모델 기반 예측의 사용은 저 비트 레이트 서브대역 인코딩을 가능하게 한다.
방법은 복수의 예측 마스크 지원 서브대역들에서 복수의 이전 샘플들을 나타내는 예측 마스크를 결정하는 단계를 추가로 포함할 수 있다. 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역들과 상이한 복수의 서브대역들 중 적어도 하나를 포함할 수 있다. 이와 같이, 서브대역 예측자는 제 1 서브대역 신호와 상이한 복수의 서브대역 신호들로부터의 하나 이상의 다른 서브대역 신호들의 샘플들로부터 제 1 서브대역 신호의 샘플을 추정하도록 구성될 수 있다. 이는 본 명세서에서 교차-서브대역 예측으로서 불린다. 예측 마스크는 제 1 서브대역 신호의 제 1 샘플을 추정하기 위해 사용되는 복수의 이전 샘플들(예를 들면, 제 1 샘플의 타임 슬롯에 관한 시간 래그 및/또는 제 1 서브대역의 인덱스 수에 관한 서브대역 인덱스 래그)의 정렬을 규정할 수 있다.
방법은 복수의 이전 샘플들에 적용될 복수의 예측 계수들을 결정하는 단계로 진행할 수 있다. 복수의 예측 계수들은 신호 모델에 기초하여, 모델 파라미터에 기초하여, 및 (예를 들면, 상기에 및 본 명세서에서 개요로 서술되는 모델 기반 예측 방식들을 사용하는) 분석 필터뱅크에 기초하여 결정될 수 있다. 이와 같이, 복수의 예측 계수들은 하나 이상의 모델 파라미터들을 사용하여 결정될 수 있다. 다시 말해서, 제한된 수의 모델 파라미터들은 복수의 예측 계수들을 결정하기에 충분할 수 있다. 이는, 모델 기반 서브대역 예측을 사용함으로써, 교차-서브대역 예측이 비트-레이트 효율적인 방식으로 실행될 수 있다는 것을 의미한다.
방법은 복수의 예측 계수들을 복수의 이전 샘플들에 각각 적용함으로써 제 1 샘플의 추정치를 결정하는 단계를 포함할 수 있다. 제 1 샘플의 추정치를 결정하는 단계는 일반적으로 복수의 각각의 예측 계수들에 의해 가중된 복수의 이전 샘플들의 합을 결정하는 단계를 포함한다.
상기 개요로 서술된 바와 같이, 모델 파라미터는 주기성(T)을 나타낼 수 있다. 하나 이상의 예측 계수들을 결정하기 위해 사용되는 복수의 참조표들은 주기성(T)의 상이한 값들에 대한 참조표들을 포함할 수 있다. 특히, 복수의 참조표들은 [Tmin, Tmax]의 범위 내에서 미리 결정된 단차 크기(ΔT)의 주기성(T)의 상이한 값들에 대한 참조표들을 포함할 수 있다. 본 명세서에서 개요로 서술된 바와 같이, Tmin은 0.25의 범위 내에 있을 수 있고, Tmax는 2.5의 범위 내에 있을 수 있다. Tmin은, T < Tmin에 대하여, 오디오 신호가 하나의 사인파 모델 성분을 포함하는 신호 모델을 사용하여 모델링될 수 있도록 선택될 수 있다. Tmax는, T > Tmax에 대하여, 주기성들(Tmax 내지 Tmax + 1)에 대한 참조표들이 주기성들(Tmax - 1 내지 Tmax)에 대한 참조표들에 실질적으로 대응하도록 선택될 수 있다. 일반적으로 주기성들(Tmax + n 내지 Tmax + n + 1(통상 n≥0에 대하여))에 대하여 동일하게 적용한다.
방법은 선택된 참조표를 모델 파라미터로 나타낸 주기성(T)에 대한 참조표로서 결정하는 단계를 포함할 수 있다. 하나 이상의 예측 계수들을 포함하거나 표시하는 선택된 참조표를 가진 후, 참조 파라미터는 하나 이상의 예측 계수들을 각각 나타내는 선택된 참조표 내 적절한 하나 이상의 엔트리들을 식별하기 위해 사용될 수 있다. 참조 파라미터는 시프트 파라미터(
Figure 112015065692244-pct00004
)에 대응할 수 있거나 또는 그로부터 도출될 수 있다.
방법은, 주기성(T > Tmax)을 나타내는 모델 파라미터에 대하여, 나머지 주기성(Tr)이 범위[Tmax - 1, Tmax]에 놓이도록 T로부터 정수값을 감산함으로써 나머지 주기성(Tr)을 결정하는 단계를 포함한다. 예측 계수를 결정하기 위한 참조표는 이후 나머지 주기성(Tr)에 대한 참조표로서 결정될 수 있다.
방법은, 주기성(T < Tmin)을 표시하는 모델 파라미터에 대하여, 하나 이상의 예측 계수들을 주기성(Tmin)에 대한 참조표로서 결정하기 위해 참조표를 선택하는 단계를 포함할 수 있다. 또한, 하나 이상의 예측 계수들을 제공하는 선택된 참조표의 하나 이상의 엔트리들을 식별하기 위한 참조 파라미터(예를 들면, 시프트 파라미터(
Figure 112015065692244-pct00005
))는 비율(Tmin/T)에 따라 크기 조정될 수 있다. 하나 이상의 예측 계수들은 이후 선택된 참조표 및 크기 조정된 참조 파라미터를 사용하여 결정될 수 있다. 특히, 하나 이상의 예측 계수들은 크기 조정된 참조 파라미터에 대응하는 선택된 참조표의 하나 이상의 엔트리들에 기초하여 결정될 수 있다.
이와 같이, 참조표들의 수는 미리 결정된 범위[Tmin, Tmax]로 한정될 수 있고, 그에 의해 오디오 인코더/디코더의 메모리 요구 조건들을 한정한다. 그럼에도 불구하고, 예측 계수들은 미리 결정된 참조표들을 사용하여 주기성(T)의 모든 가능한 값들에 대해 결정될 수 있고, 그에 의해 오디오 인코더/디코더의 계산 효율적인 구현을 가능하게 한다.
다른 양태에 따라, 오디오 신호의 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법이 기술된다. 상기에 개요로 서술되는 바와 같이, 오디오 신호의 제 1 서브대역 신호는 오디오 신호로부터 복수의 서브대역들에서 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정될 수 있다. 상기 기술된 특징들은 이하에 기술된 방법에 또한 적용가능하다.
방법은 복수의 예측 마스크 지원 서브대역들에서 복수의 이전 샘플들을 나타내는 예측 마스크를 결정하는 단계를 포함한다. 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역과 상이한 복수의 서브대역들 중 적어도 하나를 포함한다. 특히, 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역을 포함할 수 있고 및/또는 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역에 직접 인접한 복수의 서브대역들 중 하나 이상을 포함할 수 있다.
방법은 복수의 이전 샘플들에 적용될 복수의 예측 계수들을 결정하는 단계를 추가로 포함할 수 있다. 복수의 이전 샘플들은 일반적으로 오디오 신호의 복수의 서브대역 신호들로부터 도출될 수 있다. 특히, 복수의 이전 샘플들은 일반적으로 복수의 디코딩된 서브대역 신호들의 샘플들에 대응한다. 복수의 예측 계수들은 제 1 서브대역과 상이한 서브대역들의 하나 이상의 샘플들을 또한 고려하는 반복되는 (유한 임펄스 응답) 예측 필터의 예측 계수들에 대응할 수 있다. 제 1 샘플의 추정치는 복수의 예측 계수들을 복수의 이전 샘플들에 각각 적용함으로써 결정될 수 있다. 이와 같이, 방법은 다른 (예를 들면, 인접한) 서브대역들로부터의 하나 이상의 샘플들을 사용하여 서브대역 예측을 가능하게 한다. 이를 행함으로써, 서브대역 예측 기반 코더들에 의해 야기된 에일리어싱 아티팩트들은 감소될 수 있다.
방법은 신호 모델의 모델 파라미터를 결정하는 단계를 추가로 포함할 수 있다. 복수의 예측 계수들은 신호 모델에 기초하여, 모델 파라미터에 기초하여 및 분석 필터뱅크에 기초하여 결정될 수 있다. 이와 같이, 복수의 예측 계수들은 본 명세서에 기술되는 모델 기반 예측을 사용하여 결정될 수 있다. 특히, 복수의 예측 계수들은 참조표 및/또는 분석 함수를 사용하여 결정될 수 있다. 참조표 및/또는 분석 함수는 신호 모델에 기초하여 및 분석 필터뱅크에 기초하여 미리 결정될 수 있다. 또한, 참조표 및/또는 분석 함수는 복수의 예측 계수들을 (단지) 모델 파라미터로부터 도출된 파라미터의 함수로서 제공할 수 있다. 따라서, 모델 파라미터는 참조표 및/또는 분석 함수를 사용하여 복수의 예측 계수들을 직접 제공할 수 있다. 이와 같이, 모델 파라미터는 교차-서브대역 예측자의 계수를 효율적으로 기술하기 위해 사용될 수 있다.
다른 양태에 따라, 오디오 신호를 인코딩하기 위한 방법이 기술된다. 방법은 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 오디오 신호로부터 복수의 서브대역 신호들을 결정하는 단계를 포함할 수 있다. 방법은 본 명세서에 기술되는 예측 방법들 중 어느 하나를 사용하여 복수의 서브대역 신호들의 샘플들을 추정하는 단계로 진행하고, 그에 의해 복수의 추정된 서브대역 신호들을 산출할 수 있다. 또한, 복수의 예측 에러 서브대역 신호들의 샘플들은 복수의 서브대역 신호들의 대응하는 샘플들 및 복수의 추정된 서브대역 신호들의 샘플들에 기초하여 결정될 수 있다. 방법은 복수의 예측 에러 서브대역 신호들을 양자화하는 단계 및 인코딩된 오디오 신호를 생성하는 단계로 진행할 수 있다. 인코딩된 오디오 신호는 복수의 양자화된 예측 에러 서브대역 신호들을 나타낼 수 있다(예를 들면, 포함할 수 있다). 또한, 인코딩된 신호는 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 하나 이상의 파라미터들을 나타낼 수 있고(예를 들면, 포함할 수 있고), 예를 들면, 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 이후 사용되는 하나 이상의 예측 계수들을 결정하기 위해 사용된 하나 이상의 모델 파라미터들을 나타낼 수 있다.
다른 양태에 따라, 인코딩된 오디오 신호를 디코딩하기 위한 방법이 기술된다. 인코딩된 오디오 신호는 일반적으로 복수의 양자화된 예측 에러 서브대역 신호들 및 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용될 하나 이상의 파라미터들을 나타낼 수 있다. 방법은 복수의 양자화된 예측 에러 서브대역 신호들을 반양자화하는 단계를 포함할 수 있고, 그에 의해 복수의 반양자화된 예측 에러 서브대역 신호들을 산출한다.
또한, 방법은 본 명세서에 기술된 예측 방법들 중 어느 하나를 사용하여 복수의 추정된 서브대역 신호들의 샘플들을 추정하는 단계를 포함할 수 있다. 복수의 디코딩된 서브대역 신호들의 샘플들은 복수의 추정된 서브대역 신호들의 대응하는 샘플들에 기초하여 및 복수의 반양자화된 예측 에러 서브대역 신호들의 샘플들에 기초하여 결정될 수 있다. 디코딩된 오디오 신호는 복수의 합성 필터들을 포함하는 합성 필터뱅크를 사용하여 복수의 디코딩된 서브대역 신호들로부터 결정될 수 있다.
다른 양태에 따라, 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템이 기술된다. 오디오 신호의 제 1 서브대역 신호는 복수의 각각의 서브대역들에서 오디오 신호로부터 복수의 서브대역 신호들을 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정될 수 있다. 시스템은 신호 모델의 모델 파라미터를 결정하도록 구성된 예측자 계산기를 포함할 수 있다. 또한, 예측자 계산기는 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호의 하나 이상의 이전 샘플들에 적용될 하나 이상의 예측 계수들을 결정하도록 구성될 수 있다. 이와 같이, 예측자 계산기는 반복되는 예측 필터의, 특히 반복되는 서브대역 예측 필터의 하나 이상의 예측 계수들을 결정하도록 구성될 수 있다. 하나 이상의 예측 계수들은 신호 모델에 기초하여, 모델 파라미터에 기초하여 및 (예를 들면, 본 명세서에 기술된 모델 기반 예측 방법들을 사용하는) 분석 필터뱅크에 기초하여 결정될 수 있다. 하나 이상의 이전 샘플들의 타임 슬롯들은 일반적으로 하나 이상의 제 1 샘플들의 타임 슬롯들에 앞선다. 시스템은 하나 이상의 예측 계수들을 하나 이상의 이전 샘플들에 적용함으로써 하나 이상의 제 1 샘플들의 추정치를 결정하도록 구성된 서브대역 예측자를 추가로 포함할 수 있다.
다른 양태에 따라, 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템이 기술된다. 제 1 서브대역 신호는 복수의 서브대역들 중 제 1 서브대역에 대응한다. 제 1 서브대역 신호는 일반적으로 복수의 서브대역들에 대해 복수의 서브대역 신호들을 제공하는 복수의 분석 필터들을 각각 포함하는 분석 필터뱅크를 사용하여 결정된다. 시스템은 복수의 예측 마스크 지원 서브대역들에서 복수의 이전 샘플들을 나타내는 예측 마스크를 결정하도록 구성된 예측자 계산기를 포함한다. 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역과 상이한 복수의 서브대역들 중 적어도 하나를 포함한다. 예측자 계산기는 또한 복수의 이전 샘플들에 적용될 복수의 예측 계수들(또는 반복되는 예측 필터)을 결정하도록 구성된다. 또한, 시스템은 복수의 예측 계수들을 복수의 이전 샘플들에 각각 적용함으로써 하나 이상의 제 1 샘플들의 추정치를 결정하도록 구성된 서브대역 예측자를 포함한다.
다른 양태에 따라, 오디오 신호를 인코딩하도록 구성된 오디오 인코더가 기술된다. 오디오 인코더는 복수의 분석 필터들을 사용하여 오디오 신호로부터 복수의 서브대역 신호들을 결정하도록 구성된 분석 필터뱅크를 포함한다. 또한, 오디오 인코더는 복수의 서브대역 신호들의 샘플들을 추정하도록 구성되는 본 명세서에 기술되는 예측자 계산기 및 서브대역 예측자를 포함하고, 그에 의해 복수의 추정된 서브대역 신호들을 산출한다. 또한, 인코더는 복수의 서브대역 신호들의 및 복수의 추정된 서브대역 신호들의 대응하는 샘플들에 기초하여 복수의 예측 에러 서브대역 신호들의 샘플들을 결정하도록 구성된 차이 유닛을 포함할 수 있다. 양자화 유닛은 복수의 예측 에러 서브대역 신호들을 양자화하기 위해 사용될 수 있다. 또한, 비트스트림 생성 유닛은 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 복수의 양자화된 예측 에러 서브대역 신호들 및 하나 이상의 파라미터들(예를 들면, 하나 이상의 모델 파라미터들)을 나타내는 인코딩된 오디오 신호를 생성하도록 구성될 수 있다.
다른 양태에 따라, 인코딩된 오디오 신호를 디코딩하도록 구성된 오디오 디코더가 기술된다. 인코딩된 오디오 신호는 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 복수의 양자화된 예측 에러 서브대역 신호들 및 하나 이상의 파라미터들을 나타낸다(예를 들면, 포함한다). 오디오 디코더는 복수의 양자화된 예측 에러 서브대역 신호들을 반양자화하도록 구성된 역 양자화기를 포함할 수 있고, 그에 의해 복수의 반양자화된 예측 에러 서브대역 신호들을 산출한다. 또한, 디코더는 복수의 추정된 서브대역 신호들의 샘플들을 추정하도록 구성되는 본 명세서에 기술된 예측자 계산기 및 서브대역 예측자를 포함한다. 합산 유닛은 복수의 추정된 서브대역 신호들의 대응하는 샘플들에 기초하여 및 복수의 반양자화된 예측 에러 서브대역 신호들의 샘플들에 기초하여 복수의 디코딩된 서브대역 신호들의 샘플들을 결정하도록 사용될 수 있다. 또한, 합성 필터뱅크는 복수의 합성 필터들을 사용하여 복수의 디코딩된 서브대역 신호들로부터 디코딩된 오디오 신호를 결정하기 위해 사용될 수 있다.
다른 양태에 따라, 소프트웨어 프로그램이 기술된다. 소프트웨어 프로그램은 프로세서상에 실행을 위해 및 프로세서상에 실행될 때 본 명세서에서 개요로 서술된 방법 단계들을 수행하기 위해 적응될 수 있다.
다른 양태에 따라, 저장 매체가 기술된다. 저장 매체는 프로세서상에 실행을 위해 및 프로세서상에 실행될 때 본 명세서에서 개요로 서술된 방법 단계들을 수행하기 위해 적응된 소프트웨어 프로그램을 포함할 수 있다.
다른 양태에 따라, 컴퓨터 프로그램 제품이 기술된다. 컴퓨터 프로그램은 컴퓨터상에 실행될 때 본 명세서에서 개요로 서술된 방법 단계들을 수행하기 위해 실행가능한 명령들을 포함할 수 있다.
본 특허 출원에서 개요로 서술되는 그의 바람직한 실시예들을 포함하는 방법들 및 시스템들은 단독으로 또는 본 명세서에 개시된 다른 방법들 및 시스템들과 조합하여 사용될 수 있다는 것이 주의되어야 한다. 또한, 본 특허 출원에서 개요로 서술된 방법들 및 시스템들의 모든 양태들은 임의로 조합될 수 있다. 특히, 청구항들의 특징들은 임의의 방식으로 서로 조합될 수 있다.
본 발명은 임계적으로 샘플링된 필터뱅크의 서브대역 도메인에서 예측을 채용하는 오디오 소스 코딩의 품질을 개선하는 방법들 및 시스템들을 기술한다. 상기 방법들 및 시스템들은 서브대역 도메인에서 직접 예측자들의 효율적인 구현을 이용할 수 있다. 대안적으로 또는 추가로, 상기 방법들 및 시스템들은 에일리어스 아티팩트들의 감소를 허용하기 위해 본 발명에서 기술된 교차 서브대역 예측자 용어들을 이용할 수 있다.
도 1은 필터뱅크 도메인에서(즉, 서브대역 도메인에서) 선형 예측을 적용하는 예시적인 오디오 디코더의 블록도.
도 2는 시간 주파수 그리드에서 예시적인 예측 마스크들을 도시하는 도면.
도 3은 사인파 모델 기반 예측자 계산기에 대한 예시적인 통계표를 도시하는 도면.
도 4는 대역내 서브대역 예측으로부터 기인하는 예시적인 잡음 성형을 도시하는 도면.
도 5는 교차-대역 서브대역 예측으로부터 기인하는 예시적인 잡음 성형을 도시하는 도면.
도 6a는 주기적 모델 기반 예측자 계산에 대해 통계표에 기초하는 예시적인 2차원 양자화 그리드를 도시하는 도면.
도 6b는 상이한 범위들의 신호 주기성들에 대해 상이한 예측 마스크들의 사용을 도시하는 도면.
도 7a 및 도 7b는 모델 기반 서브대역 예측을 사용하여 예시적인 인코딩 및 디코딩 방법들의 플로차트들.
본 발명은 첨부하는 도면들을 참조하여 본 발명의 범위 또는 정신을 제한하지 않고 도시적인 예들로서 이하에 기술된다.
이하에 기술된 실시예들은 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측에 대한 본 발명의 원리들에 대하여 단순히 예시하는 것이다. 장치들의 변경들 및 변형들 및 여기에 기술된 상세 사항들은 당업자들에게 명백할 것이라는 것이 이해된다. 그러므로, 계류중인 특허 청구항들의 범위에 의해서만 제한되고, 여기 실시예들의 기술 및 설명으로서 표현된 특정한 상세 사항들에 의해 제한되지 않는 것이 의도된다.
도 1은 (또한 서브대역 도메인이라고 불림) 필터뱅크 도메인에서 선형 예측을 적용하는 예시적인 오디오 디코더(100)의 블록도를 도시한다. 오디오 디코더(100)는 예측 에러 신호(또한 나머지 신호라고도 불림)에 관한 정보 및 가능하게는 원래의 입력 오디오 신호로부터 예측 에러 신호를 결정하기 위해 대응하는 인코더에 의해 사용된 예측자의 디스크립션에 관한 정보를 포함하는 비트 스트림을 수신한다. 예측 에러 신호에 관한 정보는 입력 오디오 신호의 서브대역들에 관한 것일 수 있고 예측자의 디스크립션에 관한 정보는 하나 이상의 서버대역 예측자들에 관한 것일 수 있다.
수신된 비트 스트림 정보를 고려하면, 역 양자화기(101)는 예측 에러 서브대역 신호들의 샘플들(111)을 출력할 수 있다. 이들 샘플들은 서브대역 예측자(103)의 출력(112)에 추가될 수 있고, 합(113)은 디코딩된 오디오 신호의 서브대역들의 이전 디코딩된 샘플들(113)의 기록을 유지하는 서브대역 버퍼(104)로 전달될 수 있다. 서브대역 예측자(103)의 출력은 추정된 서브대역 신호들(112)이라고 불릴 수 있다. 디코딩된 오디오 신호의 서브대역들의 디코딩된 샘플들(113)은 서브대역 샘플들을 시간 도메인으로 변환하는 합성 필터뱅크(102)에 제출될 수 있고, 그에 의해 디코딩된 오디오 신호의 시간 도메인 샘플들(114)을 산출한다.
다시 말해서, 디코더(100)는 서브대역 도메인에서 동작할 수 있다. 특히, 디코더(100)는 서브대역 예측자(103)를 사용하여 복수의 추정된 서브대역 신호들(112)을 결정할 수 있다. 또한, 디코더(100)는 역 양자화기(101)를 사용하여 복수의 나머지 서브대역 신호들(111)을 결정할 수 있다. 복수의 추정된 서브대역 신호들(112) 및 복수의 나머지 서브대역 신호들(111)의 각각의 쌍들은 더해져서 대응하는 복수의 디코딩된 서브대역 신호들(113)을 산출할 수 있다. 복수의 디코딩된 서브대역 신호들(113)은 합성 필터뱅크(102)에 제출되어 시간 도메인 디코딩된 오디오 신호(114)를 산출할 수 있다.
서브대역 예측자(103)의 일 실시예에서, 주어진 추정된 서브대역 신호(112)의 주어진 샘플은 주어진 추정된 서브대역 신호(112)의 주어진 샘플과 상이한 시간 및 상이한 주파수(즉, 상이한 서브대역)에 대응하는 버퍼(104)의 서브대역 샘플들의 선형 조합에 의해 획득될 수 있다. 다시 말해서, 제 1 시간 순간에서 및 제 1 서브대역에서 추정된 서브대역 신호(112)의 샘플은 제 2 시간 순간(제 1 시간 순간과 상이함)에 관련되고 제 2 서브대역(제 1 서브대역과 상이한)과 관련되는 디코딩된 서브대역 신호들(113)의 하나 이상의 샘플들에 기초하여 결정될 수 있다. 예측 계수들 및 시간 및 주파수 마스크에 대한 그들의 부속물의 집합은 예측자(103)를 규정할 수 있고, 이러한 정보는 디코더(100)의 예측자 계산기(105)에 의해 공급될 수 있다. 예측자 계산기(105)는 수신된 비트 스트림에 포함된 신호 모델 데이터의 변환에 의해 예측자(103)를 규정하는 정보를 출력한다. 예측자(103)의 출력의 크기 조정을 변경하는 추가의 이득이 송신될 수 있다. 예측자 계산기(105)의 일 실시예에서, 신호 모델 데이터는 효율적인 파라미터화된 선 스펙트럼의 형태로 제공되고, 파라미터화된 선 스펙트럼의 각각의 선, 또는 파라미터화된 선 스펙트럼의 후속하는 일 그룹의 선들은 예측자 계수들의 통계값들을 지시하기 위해 사용된다. 이와 같이, 수신된 비트 스트림 내에 제공된 신호 모델 데이터는 미리 결정된 참조표내 엔트리들을 식별하기 위해 사용될 수 있고, 참조표로부터의 엔트리들은 예측자(103)에 의해 사용될 예측자 계수들(예측 계수들이라고도 불림)에 대하여 하나 이상의 값들을 제공한다. 참조표에 적용된 방법은 복잡성과 메모리 요구 조건들 사이의 균형들에 의존할 수 있다. 예를 들면, 가장 가까운 이웃 형태 검색은 가장 낮은 복잡성을 달성하기 위해 사용될 수 있고, 반면에 보간 검색 방법은 더 작은 표 크기를 갖는 유사한 성능을 제공할 수 있다.
상기에 나타낸 바와 같이, 수신된 비트 스트림은 하나 이상의 명시적으로 송신된 이득들 (또는 명시적으로 송신된 이득들의 표시들)을 포함할 수 있다. 이득들은 예측자 동작의 부분으로서 또는 그 후에 적용될 수 있다. 하나 이상의 명시적으로 송신된 이득들은 상이한 서브대역들에 대해 상이할 수 있다. 명시적으로 송신된 추가 이득들(의 표시들)은 예측자(103)의 결정된 예측 계수들에 사용되는 하나 이상의 모델 파라미터들에 추가하여 제공된다. 이와 같이, 추가의 이득들은 예측자(103)의 예측 계수들을 크기 조정하기 위해 사용될 수 있다.
도 2는 시간 주파수 그리드에서 예시적인 예측 마스크 지원들을 보여준다. 예측 마스크 지원들은 코사인 변조된 필터뱅크(예를 들면, MDCT 필터뱅크)와 같은 균등한 시간 주파수 해상도를 갖는 필터뱅크에서 동작하는 예측자들(103)에 대해 사용될 수 있다. 표기는 다이어그램(201)으로 도시되고, 즉, 목표된 어둡게 셰이딩된 서브대역 샘플(211)은 옅게 셰이딩된 서브대역 샘플(212)에 기초한 예측의 출력이다. 다이어그램들(202 내지 205)에서, 옅게 셰이딩된 서브대역 샘플들의 집합은 예측자 마스크 지원을 나타낸다. 소스 서브대역 샘플들(212) 및 타깃 서브대역 샘플들(211)의 조합은 예측 마스크(201)라고 불릴 것이다. 시간-주파수 그리드는 타깃 서브대역 샘플 근처에 서브대역 샘플들을 정렬하기 위해 사용될 수 있다. 타임 슬롯 인덱스는 좌로부터 우로 증가하고 있고 서브대역 주파수 인덱스는 아래로부터 위로 증가하고 있다. 도 2는 예측 마스크들 및 예측자 마스크 지원들의 예시적인 경우들을 도시하고 다수의 다른 예측 마스크들 및 예측자 마스크 지원들이 사용될 수 있다는 것이 주의되어야 한다. 예시적인 예측 마스크들은:
예측 마스크(202)는 시간 순간들(k-1, k-2)에서 두 개의 이전 디코딩된 서브대역 샘플들(222)로부터 시간 순간(k)에서 추정된 서브대역 샘플(221)의 대역내 예측을 규정한다.
예측 마스크(203)는 시간 순간(k-1)에서 및 서브대역(n-1, n, n+1)에서 세 개의 이전 디코딩된 서브대역 샘플들(232)에 기초하여 시간 순간(k)에서 및 서브대역(n)에서 추정된 서브대역 샘플(231)의 교차-대역 예측을 규정한다.
예측 마스크(204)는 시간 순간(k-1)에서 및 서브대역(n-1, n, n+1)에서 세 개의 이전 디코딩된 서브대역 샘플들(242)에 기초하여 시간 순간(k)에서 및 세 개의 상이한 서브대역들(n-1, n, n+1)에서 세 개의 추정된 서브대역 샘플들(241)의 교차-대역 예측을 규정한다. 교차-대역 예측은 각각의 추정된 서브대역 샘플(241)이 서브대역들(n-1, n, n+1)에서 세 개의 이전의 디코딩된 서브대역 샘플들(242)의 모두에 기초하여 결정될 수 있도록 수행될 수 있다.
예측 마스크(205)는 시간 순간(k-2, k-3, k-4, k-5)에서 및 서브대역들(n-1, n, n+1)에서 열두 개의 이전 디코딩된 서브대역 샘플들(252)에 기초하여 시간 순간(k)에서 및 서브대역(n)에서 추정된 서브대역 샘플들(251)의 교차-대역 예측을 규정한다.
도 3은 코사인 변조 필터뱅크에서 동작하는 사인파 모델 기반 예측자 계산기(105)에 대한 통계표를 도시한다. 예측 마스크 지원은 다이어그램(204)의 것이다. 주어진 주파수 파라미터에 대하여, 가장 가까운 서브대역 중심 주파수를 갖는 서브대역은 중앙 타깃 서브대역으로서 선택될 수 있다. 주파수 파라미터와 중심 타깃 서브대역의 중심 주파수 사이의 차는 필터뱅크의 주파수 간격의 유닛들(bins)로 계산될 수 있다. 이는 도 3의 9 개의 그래프들(301)의 가로좌표들로 도시된 통계표에서 가장 근접하게 이용가능한 엔트리로 근사될 수 있는 -0.5와 0.5 사이의 값을 제공한다. 이는 타깃 서브대역 및 그의 두 개의 인접한 서브대역들의 서브대역 버퍼(104)에서 복수의 디코딩된 서브대역 신호들(113)의 가장 최근의 값들에 적용될 계수들의 3 × 3 행렬을 생성한다. 결과의 3 × 1 벡터는 주어진 주파수 파라미터에 대해 이들 세 개의 서브대역들에 대한 서브대역 예측자(103)의 기여를 구성한다. 프로세스는 신호 모델에서 모든 사인파 성분들에 대해 부가적인 방식으로 반복될 수 있다.
다시 말해서, 도 3은 서브대역 예측자의 모델 기반 디스크립션의 일 예를 도시한다. 입력 오디오 신호가 기본 주파수들(Ω0, Ω1, ..., ΩM-1)에서 하나 이상의 사인파 성분들을 포함한다고 가정된다. 하나 이상의 사인파 성분들의 각각에 대하여, 미리 결정된 예측 마스크(예를 들면, 예측 마스크(204))를 사용하여 서브대역 예측자가 결정될 수 있다. 입력 오디오 신호의 기본 주파수(Ω)는 필터뱅크의 서브대역들 중 하나 내에 있을 수 있다. 이러한 서브대역은 이러한 특정 기본 주파수(Ω)에 대하여 중앙 서브대역이라고 불릴 수 있다. 기본 주파수(Ω)는 중앙 서브대역의 중심 주파수에 관하여 -0.5 내지 0.5의 범위에 있는 값으로서 표현될 수 있다. 오디오 인코더는 기본 주파수(Ω)에 관한 정보를 디코더(100)에 송신할 수 있다. 디코더(100)의 예측자 계산기(105)는 기본 주파수(Ω)의 각각의 주파수 값(303)에 대한 계수값(302)을 결정함으로써 예측 계수들의 3 × 3 행렬을 결정하기 위해 도 3의 3 × 3 행렬을 사용할 수 있다. 이는 예측 마스크(204)를 사용하는 서브대역 예측자(103)에 대한 계수가 특정 기본 주파수(Ω)에 관해 수신된 정보만을 사용하여 결정될 수 있다는 것을 의미한다. 다시 말해서, 예를 들면, 하나 이상의 사인파 성분들의 모델을 사용하여 입력 오디오 신호를 모델링함으로써, 서브대역 예측자의 비트-레이트 효율적인 디스크립션이 제공될 수 있다.
도 4는 코사인 변조 필터뱅크에서 대역내 서브대역 예측으로부터 기인한 예시적인 잡음 성형을 도시한다. 대역내 서브대역 예측을 수행하기 위해 사용된 신호 모델은 랜덤 가우시안 화이트 잡음에 의해 도출된 2차 미분식에 의해 기술되는 피크가 많은 공진을 갖는 2차 자동 회귀 확률 프로세스이다. 곡선(401)은 프로세스의 실현을 위해 측정된 크기 스펙트럼을 도시한다. 이러한 예에 대하여, 도 2의 예측 마스크(202)가 적용된다. 즉, 예측자 계산기(105)는 동일한 서브대역에서만 이전 서브대역 샘플들(222)에 기초하여 주어진 타깃 서브대역(221)에 대해 서브대역 예측자(103)를 제공한다. 역 양자화기(101)를 가우시안 화이트 잡음 발생기로 대체하는 것은 합성된 크기 스펙트럼(402)을 초래한다. 이해될 수 있는 바와 같이, 합성 스펙트럼(402)이 원래의 스펙트럼(401)과 일치하지 않는 피크들을 포함하기 때문에, 강한 에일리어스 아티팩트들이 합성시 발생한다.
도 5는 교차-대역 서브대역 예측으로부터 기인한 예시적인 잡음 성형을 도시한다. 설정은, 예측 마스크(203)가 적용된다는 사실을 제외하고 도 4의 설정과 동일하다. 따라서, 계산기(105)는 타깃 서브대역에서 및 그의 두 개의 인접한 서브대역들에서 이전 서브대역 샘플들(232)에 기초하여 주어진 타깃 서브대역(231)에 대한 예측자(103)를 제공한다. 도 5로부터 이해될 수 있는 바와 같이, 합성된 신호의 스펙트럼(502)은 원래의 신호의 스펙트럼(501)과 실질적으로 일치한다. 즉, 에일리어스 문제들은 교차-대역 서브대역 예측을 사용할 때 실질적으로 억제된다. 이와 같이, 도 4 및 도 5는 교차-대역 서브대역 예측을 사용할 때, 즉, 하나 이상의 인접한 서브대역들의 이전 서브대역 샘플들에 기초하여 서브대역 샘플을 예측할 때, 서브대역 예측에 의해 야기된 에일리어싱 아티팩트들이 감소될 수 있다는 것을 도시한다. 결과로서, 서브대역 예측은 또한 가청의 에일리어싱 아티팩트들을 야기할 위험 없이 저 비트 레이트 오디오 인코더들의 환경에서 적용될 수 있다. 교차-대역 서브대역 예측의 사용은 일반적으로 예측 계수들의 수를 증가시킨다. 그러나, 도 3의 환경에서 도시된 바와 같이, 입력 오디오 신호에 대한 모델들의 사용(예를 들면, 사인파 모델 또는 주기적 모델의 사용)은 서브대역 예측자의 효율적인 디스크립션을 허용하여, 그에 의해 저 비트 레이트 오디오 코더들에 대한 교차-대역 서브대역 예측의 사용을 가능하게 한다.
다음으로, 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측의 원리들의 기술은 도 1 내지 도 6을 참조하여 및 적절한 수학적 용어를 추가함으로써 개요로 서술될 것이다.
가능한 신호 모델 기반 선형 예측은 그의 통계치들이 그의 자기 상관 함수(
Figure 112015065692244-pct00006
)에 의해 결정되는 제로 평균 약하게 고정된 확률 프로세스(x(t))의 선형 예측이다. 여기서 고려될 임계적으로 샘플링된 필터뱅크들에 대한 양호한 모델로서, 이를 정규 직교 기반을 구성하는 실수값 합성 파형들(wα(t))의 집합인
Figure 112015065692244-pct00007
로 두자. 다시 말해서, 필터뱅크는 파형들(
Figure 112015065692244-pct00008
)에 의해 표현될 수 있다. 시간 도메인 신호(s(t))의 서브대역 샘플들은 내적들,
Figure 112015065692244-pct00009
에 의해 얻어지고, 신호는,
Figure 112015065692244-pct00010
에 의해 복구된다.
프로세스(x(t))의 서브대역 샘플들
Figure 112015065692244-pct00011
은 확률 변수들이고, 그의 공분산 행렬(Rαβ)은 다음과 같이 자동상관 함수(r(τ))에 의해 결정되고
Figure 112015065692244-pct00012
여기서 Wαβ(τ)는 두 개의 합성 파형들의 교차 상관이다.
Figure 112015065692244-pct00013
집합으로부터 서브대역 샘플
Figure 112015065692244-pct00014
또는 디코딩된 서브대역 샘플들
Figure 112015065692244-pct00015
의 선형 예측은 다음으로 규정될 수 있다:
Figure 112015065692244-pct00016
식(5)에서, 세트 B는 소스 서브대역 샘플들을 규정하고, 즉, 세트 B는 예측 마스크 지원을 규정한다. 제곱된 예측 에러의 평균값은:
Figure 112015065692244-pct00017
에 의해 주어지고 최소 평균 제곱 에러(MSE) 해는 예측 계수들(cβ)에 대한 표준 방정식들을 풀이함으로써 얻어진다:
Figure 112015065692244-pct00018
예측 계수들이 식(7)을 만족할 때, 식(6)의 우측항은
Figure 112015065692244-pct00019
로 감소된다. 표준 방정식들(7)은, 예를 들면, 레빈슨-더빈 알고리즘을 사용하여 효율적인 방식으로 풀 수 있다.
예측 계수들(
Figure 112015065692244-pct00020
)이 예측자 계산기(105)에서 도출될 수 있는 신호 모델의 파라미터 표현을 송신하는 것이 본 명세서에서 제안된다. 예를 들면, 신호 모델은 신호 모델의 자기 상관 함수(r(τ))의 파라미터 표현을 제공할 수 있다. 디코더(100)는 수신된 파라미터 표현을 사용하여 자기 상관 함수(r(τ))를 도출할 수 있고, 표준 방정식들(7)에 요구된 공분산 행렬 엔트리들을 도출하기 위해 자기 상관 함수(r(τ))를 합성 파형 교차 상관(Wαβ(τ))과 조합할 수 있다. 이들 식들은 이후 예측 계수들을 얻기 위해 풀이될 수 있다.
다시 말해서, 인코딩될 입력 오디오 신호는 제한된 수의 모델 파라미터들을 사용하여 기술될 수 있는 프로세스(x(t))에 의해 모델링될 수 있다. 특히, 모델링 프로세스(x(t))는 그의 자기 상관 함수(
Figure 112015065692244-pct00021
)가 제한된 수의 파라미터들을 사용하여 기술될 수 있는 것일 수 있다. 자기 상관 함수(r(τ))를 기술하는 제한된 수의 파라미터들이 디코더(100)에 송신될 수 있다. 디코더(100)의 예측자 계산기(105)는 수신된 파라미터들로부터 자기 상관 함수(r(τ))를 결정할 수 있고 표준 방정식(7)이 결정될 수 있는 서브대역 신호들의 공분산 행렬(Rαβ)을 결정하기 위해 식(3)을 사용할 수 있다. 표준 방정식(7)은 이후 예측자 계산기(105)에 의해 풀이될 수 있고, 그에 의해 예측 계수들(cβ)을 산출한다.
다음으로, 효율적인 방식으로 상기 기술된 모델 기반 예측 방식을 적용하기 위해 사용될 수 있는 예시적인 신호 모델들이 기술된다. 다음에 기술된 신호 모델들은 일반적으로, 코딩 오디오 신호들에 대해, 예를 들면, 코딩 속도 신호들에 대해 크게 관련된다.
신호 모델의 일 예는 사인파 프로세스에 의해
Figure 112015065692244-pct00022
로서 주어지고, 확률 변수들(a, b)은 상관되지 않고, 제로 평균, 및 분산 1을 갖는다. 이러한 사인파 프로세스의 자기 상관 함수는 다음으로 주어진다:
Figure 112015065692244-pct00023
이러한 사인파 프로세스의 일반화는 일 세트의 (각) 주파수들(S)을 포함하는, 즉, 복수의 상이한 (각) 주파수들(
Figure 112015065692244-pct00024
)을 포함하는 다중 사인 모델이다:
Figure 112015065692244-pct00025
모든 확률 변수들(
Figure 112015065692244-pct00026
,
Figure 112015065692244-pct00027
)이 쌍으로 상관되지 않는다면, 제로 평균 및 분산 1을 갖고, 다중 사인 프로세스는 자기 상관 함수를 갖는다:
Figure 112015065692244-pct00028
(자기 상관 함수의 푸리에 변환에 대응하는) 다중 사인 프로세스의 전력 스펙트럼 밀도(PSD)는 선 스펙트럼이다:
Figure 112015065692244-pct00029
수치상 고찰들은 수식 프로세스의 자기 상관 함수를 갖는 순수한 다중 사인 프로세스를 자기 상관 함수(
Figure 112015065692244-pct00030
)를 갖는 완화된 다중 사인 프로세스로의 교체를 초래할 수 있고,
Figure 112015065692244-pct00031
는 비교적 작은 완화 파라미터이다. 후자의 모델은 임펄스 함수들이 없는 완전히 양의 PSD를 초래한다.
다중 사인 모델의 주파수들의 세트(S)의 간단한 디스크립션들의 예들은 다음과 같다:
1. 하나의 기본 주파수 Ω:
Figure 112015065692244-pct00032
2. M 개의 기본 주파수들: Ω0, Ω1, ..., ΩM-1 :
Figure 112015065692244-pct00033
3. 하나의 측대역 시프트된 기본 주파수 Ω, θ:
Figure 112015065692244-pct00034
4. 약한 비조화 모델 : Ω,a :
Figure 112015065692244-pct00035
, a는 모델의 비조화 성분을 기술한다.
이와 같이, 식(12)에 의해 주어진 PSD를 나타내는 (가능하게 완화된) 다중 사인 모델은 상기에 나열된 예시적인 기술들 중 하나를 사용하여 효율적인 방식으로 기술될 수 있다. 예로서, 식(12)의 선 스펙트럼의 주파수들의 완전한 세트(S)가 단지 하나의 기본 주파수(Ω)를 사용하여 기술될 수 있다. 인코딩될 입력 오디오 신호가 하나의 기본 주파수(Ω)를 나타내는 다중 사인 모델을 사용하여 잘 기술될 수 있는 경우, 서브대역 예측자(103)에 의해 사용된 예측 계수들의 수에 관계없이(즉, 예측 마스크(202, 203, 204, 205)에 관계없이) 모델 기반 예측자는 하나의 파라미터에 의해(즉, 기본 주파수(Ω)에 의해) 기술된다.
주파수들의 세트(S)를 기술하기 위한 경우 1은 주기(T = 2π/Ω)를 갖는 입력 오디오 신호들을 모델링하는 프로세스(x(t))를 산출한다. 식(11)에 대해 분산 1/2을 갖는 제로 주파수(DC) 기여의 포함 및 팩터(2/T)에 의한 결과의 재 크기 조정을 겪을시, 주기적 모델 프로세스(x(t))의 자기 상관 함수는 다음과 같이 기재될 수 있다:
Figure 112015065692244-pct00036
완화 팩터(
Figure 112015065692244-pct00037
)의 정의에 의해, 주기적 모델의 완화 버전의 자기 상관 함수는 다음과 같이 주어진다:
Figure 112015065692244-pct00038
식(14)은 또한 화이트 잡음(z(t))이 공급되는 하나의 지연 루프로 규정된 프로세스의, 즉, 모델 프로세스의 자기 상관 함수
Figure 112015065692244-pct00039
에 대응한다.
이는 하나의 기본 주파수(Ω)를 나타내는 주기적 프로세스가 시간 도메인에서 지연에 대응한다는 것을 의미하고, 지연은 T = 2π/Ω이다.
상기 언급된 전반적인 신호 모델들은 사인파 진폭 파라미터들(
Figure 112015065692244-pct00040
,
Figure 112015065692244-pct00041
)의 단위 분산 가정에 의해 일반적으로 평탄한 대규모 전력 스펙트럼을 갖는다. 그러나, 신호 모델들은 일반적으로 임계적으로 샘플링된 필터뱅크의 서브대역들의 서브세트에 대해 로컬로만 고려된다는 것이 주의되어야 하고, 필터뱅크는 전체 스펙트럼의 성형시 중요하다. 다시 말해서, 서브대역 폭들과 비교하여 느린 변동을 갖는 스펙트럼 형상을 갖는 신호에 대하여, 평탄한 전력 스펙트럼 모델들은 신호에 양호한 매칭을 제공할 것이고, 이후, 모델 기반 예측자들은 예측 이득의 적절한 레벨들을 제공할 것이다.
더 일반적으로, PSD 모델은 자동 회귀(AR) 또는 자동 회기 이동 평균(ARMA) 프로세스들의 표준 파라미터화들에 의해 기술될 수 있다. 이는 기술적 모델 파라미터들에서 증가의 가능한 비용에서 모델 기반 예측의 성능을 증가시킨다.
다른 변동은 확률적인 신호 모델에 대한 정상성 가정을 폐기함으로써 얻어진다. 자기 상관 함수는 이후 두 개의 변수들의 함수(
Figure 112015065692244-pct00042
)로 된다. 예를 들면, 관련된 비정상 사인파 모델들은 진폭(AM) 및 주파수 변조(FM)를 포함할 수 있다.
또한, 더 결정론적인 신호 모델이 채용될 수 있다. 이하의 예들 중 일부에서 이해되는 바와 같이, 예측은 몇몇 경우들에서 소멸 에러를 가질 수 있다. 이러한 경우들에서, 확률적 방식은 회피될 수 있다. 예측이 모델 공간에서 모든 신호들에 대해 완전할 때, 고려된 모델 공간에 대한 확률 측정에 의해 평균값의 예측 수행을 수행할 필요가 없다.
다음으로, 변조된 필터뱅크들에 관한 다수의 양태들이 기술된다. 특히, 공분산 행렬의 결정에 영향을 끼치고, 그에 의해 서브대역 예측자의 예측 계수들을 결정하기 위한 효율적인 방식을 제공하는 양태들이 기술된다. 변조된 필터뱅크는 합성 파형들의; 2차원 인덱스 세트(α =(n, k))를 갖는 것으로 기술될 수 있고, n = 0, 1, ...는 서브대역 인덱스(주파수 대역)이고 k ∈ z는 서브대역 샘플 인덱스(타임 슬롯)이다. 설명의 편의를 위해, 합성 파형들은 연속적인 시간에서 주어지고 단위 시간 폭
Figure 112015065692244-pct00043
으로 정규화되고, 여기서 코사인 변조 필터뱅크의 경우에 다음과 같다:
Figure 112015065692244-pct00044
윈도우 함수(ν(t))는 실수값이고 짝수라는 것이 가정된다. 변조 규칙의 작은 변동들까지, 이는 시간 단차(1/L)에서 샘플링시 L 개의 서브대역들을 갖고 MDCT(변조된 이산 코사인 변환), QMF(직각 위상 미러 필터), 및 ELT(확장된 랩핑 변환들)와 같은 크게 관련있는 경우들의 범위를 포함한다. 윈도우는 간격[-K/2, K/2]에 포함된 지원을 갖는 길이 및 유한한 지속 기간인 것이 가정되고, K는 중첩된 변환의 중첩 팩터이고 K는 윈도우 함수의 길이를 나타낸다.
시프트 불변 구조에 의해, 합성 파형의 교차 상관 함수(식(4)에 정의된 바와 같은)는 다음과 같이 기록될 수 있다는 것을 찾았다:
Figure 112015065692244-pct00045
즉,
Figure 112015065692244-pct00046
이고, 정의
Figure 112015065692244-pct00047
를 갖는다. 변조 구조(17)는,
Figure 112015065692244-pct00048
로 다른 확장에 대해 허용한다. 커널 함수(
Figure 112015065692244-pct00049
)는 필터뱅크 윈도우의 와그너-빌 분포의 주파수 변수에서 필터뱅크 서브대역 단차를 갖는 샘플링을 나타낸다:
Figure 112015065692244-pct00050
커널은, 윈도우 함수(ν(t))에 대한 상기 언급된 가정들에 의해, ν 및 τ 모두에서 실수이고 짝수이다. 그의 푸리에 변환은 시프트된 윈도우 응답들의 곱,
Figure 112015065692244-pct00051
이다. 이는 커널(
Figure 112015065692244-pct00052
)은 |τ| > K에 대해 0이 되고 필터뱅크 윈도우들(ν(t))의 일반적인 선택들에 대해 |ν|의 함수로서 빠른 감쇠를 갖는 식들(20, 21)로부터 이해될 수 있다. 결과로서, ν = n + m + 1을 포함하는 식(19)의 제 2 항은 가장 낮은 서브대역들을 제외하고 종종 무시될 수 있다.
주어진 신호 모델의 자기 상관 함수(r(τ))에 대하여, 상기 언급된 수식들은 식(3)에 의해 주어진 서브대역 샘플 공분산 행렬의 정의로 삽입될 수 있다. 정의,
Figure 112015065692244-pct00053
에 의해
Figure 112015065692244-pct00054
를 얻는다.
(자기 상관 함수(r(τ))의 푸리에 변환에 대응하는) 주어진 신호 모델의 전력 스펙트럼 밀도(P(ω))의 함수로서, 다음을 찾았다:
Figure 112015065692244-pct00055
Figure 112015065692244-pct00056
Figure 112015065692244-pct00057
의 푸리에 변환이고, n, m은 서브대역 인덱스들을 식별하고, λ는 타임 슬롯 래그(λ = k - l)를 나타낸다. 식(23)의 수식은 다음과 같이 다시 쓸 수 있다:
Figure 112015065692244-pct00058
중요한 관찰은 식(24)의 제 1 항이 주파수 시프트들에 관하여 반드시 불변 속성을 갖는다는 것이다. 식(24)의 제 2 항이 정수(ν)와 서브대역 간격(π)의 곱에 의해 P(ω-πν)로 시프트되는 경우, 분산(
Figure 112015065692244-pct00059
)에서 대응하는 시프트를 찾고, 부호는 시간 래그(λ)의 (정수) 값들에 의존한다. 이는, 일반적인 필터 뱅크 경우와 비교하여, 변조 구조를 갖는 필터뱅크를 사용하는 이점을 반영한다.
식(24)은, 기본적인 신호 모델의 PSD를 알 때, 서브대역 샘플 공분산 행렬의 행렬 계수들을 결정하기 위한 효율적인 수단을 제공한다. 예로서, (각도) 주파수(
Figure 112015065692244-pct00060
)에서 하나의 사인파를 포함하는 신호 모델(x(t))을 사용하는 사인파 모델 기반 예측 방식의 경우, PSD는
Figure 112015065692244-pct00061
에 의해 주어진다. P(ω)를 수식(24)에 삽입하는 것은 네 개의 항들을 제공하고, 그 중 세 개는 n + m + 1이 크다는 가정 하에서 세 개가 무시될 수 있다. 나머지 항은,
Figure 112015065692244-pct00062
식(25)은 서브대역 공분산 행렬(Rn ,m)을 결정하기 위한 효율적인 수단을 제공한다. 서브대역 샘플(
Figure 112015065692244-pct00063
)은 고려된 주파수에 의해 상당히 영향을 받는 것으로 가정되는 주위의 서브대역 샘플들의 집합
Figure 112015065692244-pct00064
에 의해 신뢰할 수 있게 예측될 수 있다. 절대 주파수(
Figure 112015065692244-pct00065
)는 서브대역의 중심 주파수(
Figure 112015065692244-pct00066
)에 관련된 관련 항들에서
Figure 112015065692244-pct00067
로서 표현될 수 있고, p는 주파수(
Figure 112015065692244-pct00068
)를 포함하는 서브대역의 서브대역 인덱스이고, f는 -0.5와 +0.5 사이의 값들을 취하고 서브대역(p)의 중심 주파수에 관한 주파수(
Figure 112015065692244-pct00069
)의 위치를 나타내는 정규화된 주파수 파라미터이다. 서브대역 공분산 행렬(Rn ,m)을 결정하면, 샘플 인덱스(k)에서 서브대역(n) 내 서브대역 샘플을 추정하기 위해 샘플 인덱스(l)에서 서브대역(m) 내 서브대역 샘플에 적용되는 예측자 계수들(cm[l])이 표준 방정식들(7)을 풀이함으로써 발견되고, 상기 경우에 대해 바로 다음과 같이 기재될 수 있다:
Figure 112015065692244-pct00070
식(26)에서, 세트 B는 예를 들면, 도 2에 도시되는 예측 마스크 지원을 기술한다. 다시 말해서, 세트 B는 타깃 샘플을 예측하기 위해 사용되는 서브대역들(m) 및 샘플 인덱스들(l)을 식별한다.
다음으로, 상이한 예측 마스크 지원들(도 2에 도시된 바와 같은)에 대한 표준 방정식들(26)의 해들이 예시적인 방식으로 제공된다. 인과적인 2차 대역내 예측자의 예는 예측 마스크 지원 B = {(p,-1), (p,-2)}를 선택함으로써 얻어진다. 이러한 예측 마스크 지원은 도 2의 예측 마스크(202)에 대응한다. 식(25)의 근사를 사용하여 이러한 두 개의 탭 예측에 대한 표준 방정식들(26)은 다음과 같이 된다:
Figure 112015065692244-pct00071
식(27)에 대한 해는
Figure 112015065692244-pct00072
, cp[-2] = -1로 주어지고, 이는 주파수(
Figure 112015065692244-pct00073
)가
Figure 112015065692244-pct00074
이도록 선택되지 않는 한 유일하다. 식(6)에 따른 제곱된 예측 에러의 평균값이 0인 것을 찾았다. 따라서, 사인파 예측은 식(25)의 근사까지 완료한다. 주파수 시프트들에 대한 불변 속성은, 정의(
Figure 112015065692244-pct00075
)를 사용하여, 예측 계수(cp[-1])가 정규화된 주파수(f)에 의해
Figure 112015065692244-pct00076
로서 다시 쓸 수 있다는 사실에 의해 여기에 예시된다. 이는, 예측 계수들이 특정 서브대역내 정규화된 주파수(f)에만 의존한다는 것을 의미한다. 그러나, 예측 계수들의 절대값들은 서브대역 인덱스(p)에 독립적이다.
도 4에 대해 상기에 논의된 바와 같이, 대역내 예측은 잡음 성형에서 에일리어스 아티팩트들에 관한 특정 단점들을 갖는다. 다음의 예는 도 5에 도시되는 개선된 거동에 관한 것이다. 본 명세서에서 교시되는 인과적인 교차-대역 예측은 예측 마스크 지원 B = {(p-1, -1), (p, -1), (p+1, -1)}을 선택함으로써 얻어지고, 이는 두 개 대신에 단지 하나의 더 이른 타임 슬롯을 요구하고, 및 이는 제 1 예의 고전적인 예측 마스크(202)보다 더 적은 에일리어스 주파수 기여들을 갖는 잡음 성형을 수행한다. 예측 마스크 지원 B = {(p-1, -1), (p, -1), (p+1, -1)}은 도 2의 예측 마스크(203)에 대응한다. 식(25)의 근사에 기초한 표준 방정식들(26)은 이러한 경우에 세 개의 알려지지 않은 계수들(cm[-1], m = p-1, p, p+1)에 대한 두 개의 식들로 감소된다:
Figure 112015065692244-pct00077
식(28)에 대한 임의의 해가 식(6)에 따라 제곱된 예측 에러의 0인 평균값을 초래한다는 것을 찾았다. 식(28)에 대한 무한 수의 해들 중 하나의 해를 선택하기 위한 가능한 전략은 예측 계수들의 제곱들의 합을 최소화하는 것이다. 이는,
Figure 112015065692244-pct00078
에 의해 주어진 계수들을 초래한다. 예측 계수들이 단지 타깃 서브대역(p)의 중간 지점에 관하여 정규화된 주파수(f)에만 의존하고, 타깃 서브대역(p)의 패리티에 또한 의존한다는 것이 수식(29)으로부터 명백하다.
도 2의 예측 마스크(204)로 도시되는, m = p-1, p, p+1에 대해 세 개의 서브대역 샘플들(
Figure 112015065692244-pct00079
)을 예측하기 위해 동일한 예측 마스크 지원(B = {(p-1, -1), (p, -1), (p+1, -1)})을 사용함으로써, 3 × 3 예측 행렬이 얻어진다. 표준 방정식들에서 모호성을 피하기 위해 더 자연스러운 전략의 도입시, 즉,
Figure 112015065692244-pct00080
에 대응하는 완화된 사인파 모델(
Figure 112015065692244-pct00081
)을 삽입함으로써, 수치 계산들은 도 3의 3 × 3 예측 행렬 요소들을 초래한다. 예측 행렬 요소들은 사인파 윈도우 함수(ν(t) = cos(πt/2))를 갖는 중첩(K=2)의 경우에 및 홀수 서브대역(p)의 경우에 정규화된 주파수의 함수(
Figure 112015065692244-pct00082
)로서 보여진다.
이와 같이, 신호 모델(x(t))이 인코딩될 입력 오디오 신호의 기본적인 특징들을 기술하기 위해 사용되는 것이 보여졌다. 자기 상관 함수(r(τ))를 기술하는 파라미터들은 디코더(100)로 송신될 수 있고, 그에 의해 디코더(100)가 송신된 파라미터들로부터 및 신호 모델(x(t))의 지식으로부터 예측자를 계산하게 한다. 변조된 필터뱅크들에 대하여, 신호 모델의 서브대역 공분산 행렬을 결정하기 위해 및 예측자 계수들을 결정하기 위해 표준 방정식들을 풀이하기 위한 효율적인 수단이 도출될 수 있다는 것이 보여졌다. 특히, 결과의 예측자 계수들은 서브대역 시프트들에 대해 불변이고 일반적으로 단지 특정 서브대역에 관하여 정규화된 주파수에 의존한다는 것이 보여졌다. 결과로서, 예측자 계수들이 결정되는 서브대역 인덱스(p)의 독립적인(패리티값을 제외하고) 표준화된 주파수(f)를 아는 예측자 계수들의 결정에 대해 허용하는 미리 결정된 참조표들(예를 들면, 도 3에서 도시된 바와 같이)이 제공될 수 있다.
다음으로, 예를 들면, 단일 기본 주파수(Ω)를 사용하여, 주기적 모델 기반 예측이 더 상세히 기술된다. 이러한 주기적 모델의 자기 상관 함수(r(τ))는 식(13)으로 주어진다. 균등한 PSD 또는 선 스펙트럼은 다음으로 주어진다:
Figure 112015065692244-pct00083
주기적 모델의 기간(T)이 충분히 작을 때, 예를 들면, T≤1일 때, 기본 주파수(Ω = 2π/T)는 예측될 타깃 서브대역 샘플의 서브대역(p)의 중심 주파수(
Figure 112015065692244-pct00084
)에 가장 가까운 부분 주파수(
Figure 112015065692244-pct00085
)를 사용하여 상기에 도출되는 사인파 모델의 적용을 허용하기에 충분히 크다. 이는 작은 주기(T), 즉, 필터뱅크의 시간 스트라이드에 관하여 작은 기간을 갖는 주기적 신호들이 상기 기술된 사인파 모델을 사용하여 양호하게 모델링 및 예측될 수 있다는 것을 의미한다.
주기(T)가 필터뱅크 윈도우(ν(t))의 지속 기간(K)에 비해 충분히 클 때, 예측자는 T만큼 지연의 근사로 감소될 수 있다. 보여지는 바와 같이, 이러한 예측자의 계수들은 식(19)에 의해 주어진 파형 교차 상관 함수로부터 직접 판독될 수 있다.
식(13)에 따른 모델의 식(22)로의 삽입은, 다음을 초래한다:
Figure 112015065692244-pct00086
중요한 관찰은, T ≥ 2K인 경우, 식(31)의 많아야 하나의 항은 |τ|>K에 대하여 Un,m(τ) = 0이기 때문에 각각의 λ에 대해 0이 아니다. 타임 슬롯 직경(D=|J|≤T-K)을 갖는 예측 마스크 지원(B = I×J)을 선택함으로써, (n,k),(m,l)∈B는 |k-l|≤T-K를 암시하는 것이 관찰되고, 따라서, 식(31)의 단일 항은 q=0에 대한 것이다. 이는 직교 파형들의 내적이고, n=m이면서 k=l인 경우가 아니면 0이 되는
Figure 112015065692244-pct00087
를 따른다. 대체로, 표준 방정식들(7)은 다음과 같이 된다:
Figure 112015065692244-pct00088
예측 마스크 지원은
Figure 112015065692244-pct00089
주위에 중심을 두도록 선택될 수 있고, 이 경우에 식(32)의 우변은 q = -1로부터의 그의 단일 기여를 갖는다. 이후, 계수들은 다음으로 주어지고:
Figure 112015065692244-pct00090
식(19)으로부터의 명시적 표현이 삽입될 수 있다. 이러한 경우에 대한 예측 마스크 지원의 기하학적 구조는 도 2의 예측 마스크(205)의 예측 마스크 지원의 외관을 가질 수 있다. 식(6)에 의해 주어진 제곱 예측 에러의 평균값은 근사 파형들(wm ,l(t),
Figure 112015065692244-pct00091
)의 보완에 의해 걸쳐진 공간상에 up(t+T)의 투영의 제곱 평균과 같다.
상기의 관점에서, 서브대역 샘플(
Figure 112015065692244-pct00092
)(서브대역(p)으로부터 및 시간 인덱스(0)에서) T와 대략 같은 시간 다이어미터를 갖는 (p, -T) 주위에 중심을 둔 적절한 예측 마스크 지원(B)을 사용함으로써 예측될 수 있다. 표준 방정식들은 T 및 p의 각각의 값에 대해 풀이될 수 있다. 다시 말해서, 입력 오디오 신호의 각각의 주기성(T)에 대하여 및 각각의 서브대역(p)에 대하여, 주어진 예측 마스크 지원(B)에 대한 예측 계수들은 표준 방정식들(33)을 사용하여 결정될 수 있다.
다수의 서브대역들(p) 및 넓은 범위의 주기들(T)에 의해, 모든 예측자 계수들의 직접적인 표 작성은 실용적이지 않다. 그러나, 사인파 모델과 유사한 방식에서, 필터뱅크의 변조 구조는 주파수 시프트들에 관한 불변 속성을 통해 필요한 표 크기의 상당한 감소를 제공한다. 이는, 주파수들의 집합(
Figure 112015065692244-pct00093
, q∈Z) 중에서 양의 주파수들의 서브세트(S(θ))에 의해 규정된, 서브대역(p)의 중심 주위에 중심을 둔, 즉,
Figure 112015065692244-pct00094
주위에 중심을 둔, 시프트 파라미터(-1/2≤θ≤1/2)를 갖는 시프트된 조화 모델을 연구하기 위해 일반적으로 충분할 것이다:
Figure 112015065692244-pct00095
사실상, T 및 충분히 큰 서브대역 인덱스(p)를 고려하면, 식(30)에 따른 주기적 모델은 시프트 파라미터(θ)의 적절한 선택에 의해 식(34)에 따라 시프트된 모델에 의해 양호한 근사로 복구될 수 있다. 식(24)로의 식(34)의 삽입(n = p + ν 및 m = p + μ)(ν 및 μ는 예측 마스크 지원의 서브대역(p) 주위의 서브대역 인덱스들을 규정한다) 및 푸리에 분석에 기초한 조정들은 공분산 행렬에 대한 다음의 식을 초래한다:
Figure 112015065692244-pct00096
이해될 수 있는 바와 같이, 식(35)은 팩터((-1))를 통해서만 타깃 서브대역 인덱스(p)에 의존한다. 큰 주기(T) 및 작은 시간적 래그(λ)의 경우에 대하여, 단지 l=0에 대한 항이 식(35)에 기여하고, 다시 공분산 행렬은 단위 행렬인 것을 찾았다. (p,-T) 주위에 중심을 둔 적절한 예측 마스크 지원(B)에 대한 표준 방정식들(26)의 우변은 이후 다음과 같이 예측 계수들을 직접 제공한다:
Figure 112015065692244-pct00097
이는 시프트(
Figure 112015065692244-pct00098
)의 정규 선택에 의해 식(19) 내지 식(33)의 제 1 항의 기여를 복구한다.
식(36)은 시간 인덱스(k)에서 서브대역(p+ν)에 대한 예측 계수들(cp+ν[k])을 결정하는 것을 허용하고, 예측될 샘플은 시간 인덱스 0에서 서브대역(p)으로부터의 샘플이다. 식(36)으로부터 이해될 수 있는 바와 같이, 예측 계수들(cp+ν[k])은 예측 계수의 부호에 영향을 끼치는 팩터((-1)pk)를 통해서만 타깃 서브대역 인덱스(p)에 의존한다. 그러나, 예측 계수의 절대값은 타깃 서브대역 인덱스(p)에 독립적이다. 다른 한편으로, 예측 계수(cp+ν[k])는 주기성(T) 및 시프트 파라미터(θ)에 의존한다. 또한, 예측 계수(cp+ν[k])는 ν 및 k에, 즉, 타깃 서브대역(p)에서 타깃 샘플을 예측하기 위해 사용된 예측 마스크 지원(B)에 의존한다.
본 명세서에서, 미리 결정된 예측 마스크 지원(B)에 대해 예측 계수들(cp [k])의 세트를 검색하는 것을 허용하는 참조표를 제공하는 것이 제안된다. 주어진 예측 마스크 지원(B)에 대하여, 참조표는 주기성(T)의 값들 및 시프트 파라미터(θ)의 값들의 미리 결정된 세트에 대한 일 세트의 예측 계수들(cp [k])을 제공한다. 참조표 엔트리들의 수를 제한하기 위해, 주기성(T)의 미리 결정된 값들의 수 및 시프트 파라미터(θ)의 미리 결정된 값들의 수는 제한되어야 한다. 식(36)으로부터 이해될 수 있는 바와 같이, 주기성(T) 및 시프트 파라미터(θ)의 미리 결정된 값들에 대한 적절한 양자화 단차 크기는 주기성(T)에 의존할 것이다. 특히, 비교적 큰 주기성들(T)(윈도우 함수의 지속 기간(K)에 관하여), 주기성(T)에 대한 및 시프트 파라미터(θ)에 대한 비교적 큰 양자화 단차들이 사용될 수 있다는 것이 이해될 수 있다. 다른 극단으로서, 0이 되는 경향이 있는 비교적 작은 주기성들(T)에 대하여, 단지 하나의 사인파 기여가 고려되어야 하고, 그래서 주기성(T)이 그의 중요성을 잃는다. 다른 한편으로, 식(29)에 따른 사인파 예측에 대한 수식들은 느리게 변하는 정규화된 절대 주파수 시프트(
Figure 112015065692244-pct00099
)를 요구하고, 그래서 시프트 파라미터(θ)에 대한 양자화 단차 크기는 주기성(T)에 기초하여 크기 조정될 것이다.
대체로, 본 명세서에서는 고정된 단차 크기를 갖는 주기성(T)의 균등한 양자화를 이용하는 것이 제안된다. 시프트 파라미터(θ)는 또한 균등한 방식이지만 min(T, A)에 비례하는 단차 크기를 갖고 양자화될 수 있지만, A의 값은 필터뱅크 윈도우 함수의 특성들에 의존한다. 더욱이, T < 2에 대하여, 시프트 파라미터들(θ)의 범위는 절대 주파수 시프트들(f)에 대한 제한을 반영하여 몇몇 상수(C)에 대하여 |θ|≤min(CT,1/2)로 제한될 수 있다.
도 6a는 A = 2에 대하여 (T,θ)-평면에서 결과의 양자화 그리드의 일 예를 도시한다. 단지 0.25≤T≤1.5의 범위에 있는 중간 범위에서, 완전 2차원 의존성이 고려되지만, 반면에 식(29) 및 식(36)에 의해 주어진 1차원 파라미터화들은 반드시 관심 있는 나머지 범위에 대해 사용될 수 있다. 특히, 0이 되는 경향이 있는 주기성들(T)(예를 들면, T<0.25)에 대하여, 주기적 모델 기반 예측은 실질적으로 사인파 모델 기반 예측에 대응하고, 예측 계수들은 수식들(29)을 사용하여 결정될 수 있다. 다른 한편으로, 윈도우 지속 기간(K)을 실질적으로 초과하는 주기성들(T)(예를 들면, T>1.5)에 대하여, 주기적 모델 기반 예측을 사용하는 예측 계수들(cp [k])의 세트는 식(36)을 사용하여 결정될 수 있다. 이러한 식은
Figure 112015065692244-pct00100
로 치환에 의하여 재해석될 수 있다. 다음을 찾을 수 있다:
Figure 112015065692244-pct00101
φ에 표에서 파라미터(θ)로 주어진 역할을 제공함으로써, 본질적으로 분리가능한 구조는 등가의 (T,φ)-평면에서 얻어진다. 서브대역 및 타임 슬롯 인덱스들에 의존하는 신호 변경들까지, T에 대한 의존성은 제 1 느리게 변하는 팩터에 포함되고, φ에 대한 의존성은 식(37)에서 1-주기적 제 2 팩터에 포함된다.
변경된 오프셋 파라미터(φ)를 소스 및 타깃 빈들의 중간 지점들의 중간 지점으로부터 측정되는 기본 주파수의 단위들로 조화 급수의 시프트로서 해석할 수 있다. φ 및 ν의 동시적인 부호 변경들에 관하여 명백한 식(37)의 대칭들이 일반적으로 유지될 것이고 표 크기들을 감소시키기 위해 이용될 수 있기 때문에, 주기성들(T)의 모든 값들에 대하여 이러한 변경된 파라미터화(T,φ)를 유지하는 것이 이롭다.
상기에 나타낸 바와 같이, 도 6a는 코사인 변조된 필터뱅크에서 주기적 모델 기반 예측자 계산을 위해 통계표에 기초한 2차원 양자화 그리드를 도시한다. 신호 모델은 필터뱅크 시간 단차의 단위들로 측정된 주기(T)를 갖는 신호의 모델(602)이다. 동등하게, 모델은 주기(T)에 대응하는 기본 주파수의 부분들로서 또한 알려진, 정수배들의 주파수 선들을 포함한다. 각각의 타깃 서브대역에 대하여, 시프트 파라미터(θ)(601)는 기본 주파수(Ω)의 단위들로 측정된 중심 주파수에 가장 가까운 부분의 거리를 나타낸다. 시프트 파라미터(θ)(601)는 -0.5와 0.5 사이의 값을 갖는다. 도 6a의 검은 크로스들(603)은 주기적 모델에 기초하여 높은 예측 이득을 갖는 예측자들의 표에 대한 양자화 지점들의 적절한 밀도를 도시한다. 큰 주기들(T)(예를 들면, T>2)에 대하여, 그리드는 균등하다. 시프트 파라미터(θ)에서 증가된 밀도는 일반적으로 주기(T)가 감소하는 것으로 요구된다. 그러나, 선들(604) 밖의 영역에서, 거리(θ)는 필터뱅크의 하나의 주파수 빈보다 크고, 그래서 이 영역에서 대부분의 그리드 지점들은 무시될 수 있다. 다각형(605)은 전체 표에 대해 충분한 영역을 정한다. 선들(604)의 약간 밖으로 기울어진 선들에 더하여, T = 0.25 및 T = 1.5에서 경계들이 도입된다. 이는 작은 주기들(602)은 분리된 사인파들로서 처리될 수 있고, 큰 주기들(602)에 대한 예측자들은 주로 시프트 파라미터(θ)에(또는 변경된 시프트 파라미터(φ)에) 의존하는 반드시 1차원 표들에 의해 근사될 수 있다는 사실에 의해 가능해진다. 도 6a에 도시된 실시예에 대하여, 예측 마스크 지원은 일반적으로 큰 주기들(T)에 대하여 도 2의 예측 마스크(205)와 유사하다.
도 6b는 비교적 큰 주기들(T)의 경우에 및 비교적 작은 주기들(T)의 경우에 주기적 모델 기반 예측을 도시한다. 큰 주기들(T)에 대하여, 즉, 비교적 작은 기본 주파수들(Ω)(613)에 대하여, 필터뱅크의 윈도우 함수(612)가 비교적 큰 수의 선들 또는 주기적 신호의 PSD의 디락 펄스들(616)을 캡처한다는 것이 상부 도면으로부터 이해될 수 있다. 디락 펄스들(616)은 주파수들(610)(ω=qΩ;
Figure 112015065692244-pct00102
)에 위치된다. 필터뱅크의 서브대역들의 중심 주파수들은 주파수들(
Figure 112015065692244-pct00103
;
Figure 112015065692244-pct00104
)에 위치된다. 주어진 서브대역(p)에 대하여, 주어진 서브대역의 중심 주파수(
Figure 112015065692244-pct00105
)에 가장 가까운 주파수(ω=qΩ)를 갖는 펄스(616)의 주파수 위치는 비교항들에서
Figure 112015065692244-pct00106
로서 기술될 수 있고, 시프트 파라미터(θ)는 -0.5로부터 +0.5의 범위이다. 이와 같이, 항(
Figure 112015065692244-pct00107
)은 중심 주파수(
Figure 112015065692244-pct00108
)로부터 조화 모델의 가장 가까운 주파수 성분(616)까지의 거리(주파수로)를 반영한다. 이는 도 6b의 상부 도면에 도시되고 중심 주파수(617)는
Figure 112015065692244-pct00109
이고, 거리(618)(
Figure 112015065692244-pct00110
)는 비교적 큰 주기(T)의 경우에 대해 도시된다. 시프트 파라미터(
Figure 112015065692244-pct00111
)가 서브대역(p)의 중심의 관점으로부터 보여지는 완전 조화 급수들을 기술하는 것을 허용한다는 것이 이해될 수 있다.
도 6b의 아래 도면은 비교적 작은 주기들(T)에 대하여, 즉, 비교적 큰 기본 주파수들(Ω)(623), 특히, 윈도우(612)의 폭보다 큰 기본 주파수들(623)에 대한 경우를 도시한다. 이러한 경우들에서, 윈도우 함수(612)는 단지 주기적 신호의 단일 펄스(626)를 포함할 수 있어서, 신호는 윈도우(612)내 사인파 신호로서 보여질 수 있다는 것이 이해될 수 있다. 이는, 비교적 작은 주기들(T)에 대하여, 주기적 모델 기반 예측 방식은 사인파 모델 기반 예측 방식으로 수렴한다는 것을 의미한다.
도 6b는 또한 주기적 모델 기반 예측 방식을 위해 및 사인파 모델 기반 예측 방식을 위해 각각 사용될 수 있는 예시적인 예측 마스크들(611, 621)을 도시한다. 주기적 모델 기반 예측 방식에 사용된 예측 마스크(611)는 도 2의 예측 마스크(205)에 대응할 수 있고, 타깃 서브대역 샘플(615)을 추정하기 위해 예측 마스크 지원(614)을 포함할 수 있다. 사인파 모델 기반 예측 방식에 사용된 예측 마스크(621)는 도 2의 예측 마스크(203)에 대응할 수 있고 타깃 서브대역 샘플(625)을 추정하기 위해 예측 마스크 지원(624)을 포함할 수 있다.
도 7a는 (예를 들면, 하나의 기본 주파수(Ω)를 포함하는) 주기적 모델을 사용하는 모델 기반 서브대역 예측을 포함하는 일 예시적인 인코딩 방법(700)을 도시한다. 입력 오디오 신호의 프레임이 고려된다. 이러한 프레임에 대하여, 주기성(T) 또는 기본 주파수(Ω)가 결정될 수 있다(단계(701)). 오디오 인코더는 도 1에 도시된 디코더(100)의 요소들을 포함할 수 있고, 특히, 오디오 인코더는 예측자 계산기(105) 및 서브대역 예측자(103)를 포함할 수 있다. 주기성(T) 또는 기본 주파수(Ω)는 식(6)에 따라 제곱된 예측 에러 서브대역 신호들(111)의 평균값이 감소되도록(예를 들면, 최소화되도록) 결정될 수 있다. 예로서, 오디오 인코더는 상이한 기본 주파수들(Ω)을 사용하여 예측 에러 서브대역 신호들(111)을 결정하고 제곱된 예측 에러 서브대역 신호들(111)의 평균값이 감소되는(예를 들면, 최소화되는) 기본 주파수(Ω)를 결정하는 억지적인 방식을 적용할 수 있다. 방법은 결과의 예측 에러 서브대역 신호들(111)을 양자화하는 단계로 진행한다(단계(702)). 또한, 방법은 결정된 기본 주파수(Ω) 및 양자화된 예측 에러 서브대역 신호들(111)을 나타내는 정보를 포함하는 비트스트림을 생성하는 단계(703)를 포함한다.
단계(701)에서 기본 주파수(Ω)를 결정할 때, 오디오 인코더는 특정한 기본 주파수(Ω)에 대한 예측 계수들을 결정하기 위해 식들((36) 및/또는 (29))을 이용할 수 있다. 가능한 기본 주파수(Ω)의 세트는 결정된 기본 주파수(Ω)를 나타내는 정보의 송신에 이용가능한 비트들의 수로 한정될 수 있다.
오디오 코딩 시스템은 미리 결정된 모델(예를 들면, 하나의 기본 주파수(Ω)를 포함하는 주기적 모델 또는 본 명세서에 제공된 모델들 중 임의의 다른 것) 및/또는 미리 결정된 예측 마스크(202, 203, 204, 205)를 사용할 수 있다는 것이 주의되어야 한다. 다른 한편으로, 오디오 코딩 시스템은 오디오 디코더가 인코딩될 오디오 신호에 대한 적절한 예측 마스크 및/또는 적절한 모델을 결정하게 함으로써 추가의 자유도들이 제공될 수 있다. 선택된 모델 및/또는 선택된 예측 마스크에 관한 정보는 이후 비트 스트림으로 인코딩되고 대응하는 디코더(100)에 제공된다.
도 7b는 모델 기반 예측을 사용하여 인코딩된 오디오 신호를 디코딩하기 위한 일 예시적인 방법(710)을 도시한다. 디코더(100)가 (수신된 비트 스트림을 통해 또는 미리 결정된 설정들에 의해) 인코더에 의해 사용된 신호 모델 및 예측 마스크를 안다고 가정된다. 또한, 예시적인 목적들을 위해 주기적 예측 모델이 사용된 것이 가정된다. 디코더(100)는 수신된 비트 스트림으로부터 기본 주파수(Ω)에 관한 정보를 추출한다(단계(711)). 기본 주파수(Ω)에 관한 정보를 사용하여, 디코더(100)는 주기성(T)을 결정할 수 있다. 기본 주파수(Ω) 및/또는 주기성(T)은 상이한 서브대역 예측자들에 대한 일 세트의 예측 계수들을 결정하기 위해 사용될 수 있다(단계(712)). 서브대역 예측자들은 디코딩된 서브대역 신호들(113)을 산출하기 위해 반양자화된 예측 에러 서브대역 신호들(111)과 조합되는(단계(714)) 추정된 서브대역 신호들을 결정하기 위해 사용될 수 있다(단계(713)). 디코딩된 서브대역 신호들(113)은 합성 필터뱅크(102)를 사용하여 필터링될 수 있고(단계(715)), 그에 의해 디코딩된 시간 도메인 오디오 신호(114)를 산출한다.
예측자 계산기(105)는 기본 주파수(Ω)에 관해 수신된 정보에 기초하여 서브대역 예측자들(103)의 예측 계수들을 결정하기 위한 식들((36) 및/또는 (29))을 이용할 수 있다(단계(712)). 이는 도 6a 및 도 3에 도시된 바와 같이 참조표를 사용하여 효율적인 방식으로 수행될 수 있다. 예로서, 예측자 계산기(105)는 주기성(T)을 결정하고 주기성이 미리 결정된 하위 임계치(예를 들면, T=0.25) 이하에 있는지의 여부를 결정할 수 있다. 이러한 경우, 사인파 모델 기반 예측 방식이 사용된다. 이는, 수신된 기본 주파수(Ω)에 기초하여, 서브대역들(p)이 기본 주파수의 배수(ω=qΩ;
Figure 112015065692244-pct00112
)를 포함하는 것으로 결정된다. 이후, 정규화된 주파수(f)는 관계(
Figure 112015065692244-pct00113
)를 사용하여 결정되고, 주파수(
Figure 112015065692244-pct00114
)는 서브대역(p)에 있는 곱(ω=qΩ)에 대응한다. 예측자 계산기(105)는 이후 (예를 들면, 도 2의 예측 마스크(203) 또는 도 6b의 예측 마스크(621)를 사용하여) 예측 계수들의 세트를 결정하기 위해 식(29) 또는 미리 결정된 참조표를 사용할 수 있다.
예측 계수들의 상이한 세트는 각각의 서브대역에 대해 결정될 수 있다는 것이 주의되어야 한다. 그러나, 사인파 모델 기반 예측 방식의 경우에, 일 세트의 예측 계수들은 일반적으로 기본 주파수의 배수(ω=qΩ;
Figure 112015065692244-pct00115
)에 의해 상당히 영향을 받는 서브대역들(p)에 대해서만 결정된다. 다른 서브 대역들에 대해, 이러한 다른 서브대역들에 대한 추정된 서브대역 신호들(112)이 0인 것을 의미하는 예측 계수들이 결정되지 않는다. 디코더(100)의(및 동일한 예측자 계산기(105)를 사용하여 인코더의) 계산 복잡성을 감소시키기 위하여, 예측자 계산기(105)는 T 및
Figure 112015065692244-pct00116
에 대한 값들을 조건으로 하는 예측 계수들의 세트를 제공하는 미리 결정된 참조표를 이용할 수 있다. 특히, 예측자 계산기(105)는 T에 대하여 복수의 상이한 값들에 대한 복수의 참조표들을 이용할 수 있다. 복수의 참조표들의 각각은 시프트 파라미터(
Figure 112015065692244-pct00117
)의 복수의 상이한 값들에 대한 예측 계수들의 상이한 세트를 제공한다.
실제 구현에서, 복수의 참조표들은 주기 파라미터(T)의 상이한 값들에 대해 제공될 수 있다. 예로서, 참조표들은 0.25 및 2.5의 범위에서 T의 값들에 대해 제공될 수 있다(도 6a에 도시된 바와 같이). 참조표들은 상이한 주기 파라미터들(T)의 미리 결정된 입도 또는 단차 크기에 대해 제공될 수 있다. 일 예시적인 구현에서, 정규화된 주기 파라미터(T)에 대한 단차 크기는 1/16이고, 양자화된 예측 계수들에 대한 상이한 참조표들은 T=8/32 내지 T=80/32까지에 대해 제공된다. 따라서, 총 37 개의 상이한 참조표들은 양자화된 예측 계수들을 시프트 파라미터(
Figure 112015065692244-pct00118
)의 함수로서 또는 변경된 시프트 파라미터(φ)의 함수로서 제공할 수 있다. T=8/32 내지 T=80/32까지에 대한 참조표들은 단차 크기의 절반씩 증가되는 범위, 즉,
Figure 112015065692244-pct00119
에 대해 사용될 수 있다. 참조표들이 정의된 이용가능한 주기성들과 상이한 주어진 주기성에 대하여, 가장 근접한 이용가능한 주기성에 대한 참조표가 사용될 수 있다. 상기 개요로 서술된 바와 같이, 긴 주기들(T)에 대하여(예를 들면, 참조표가 정의되는 주기를 초과한 주기들(T)에 대하여), 식(36)이 사용될 수 있다. 대안적으로, 참조표들이 정의된 주기들을 초과하는 기간들(T)에 대하여, 예를 들면, 주기들(T>81/32)에 대하여, 주기(T)는 정수 지연(Ti) 및 나머지 지연(Tr)으로 분리될 수 있고, T = Ti + Tr이다. 상기 분리는 나머지 지연(Tr)이 식(36)이 적용가능하고 참조표들이 이용가능한 간격 내에, 예를 들면, 상기 예에 대하여 간격([1.5, 2.5] 또는 [49/32, 81/32]) 내에 있는 것일 수 있다. 이렇게 함으로써, 예측 계수들은 나머지 지연(Tr)에 대하여 참조표를 사용하여 결정될 수 있고, 서브대역 예측자(103)는 정수 지연(Ti)에 의해 지연된 서브대역 버퍼(104)상에 동작할 수 있다. 예를 들면, 주기가 T=3.7인 경우, 정수 지연은 Ti = 2이고, 다음으로 나머지 지연은 Tr = 1.7이다. 예측자는 (추가의) Ti = 2에 의해 지연되는 신호 버퍼상의 Tr = 1.7에 대한 계수들에 기초하여 적용될 수 있다.
분리 방식은 추출기가 [1.5, 2.5] 또는 [49/32, 81/32]의 범위의 T에 의한 지연을 근사한다는 타당한 가정에 의존한다. 식(36)의 사용과 비교하여 분리 절차의 이점은 예측 계수들이 계산 효율적인 표 검색 동작들에 기초하여 결정될 수 있다는 것이다.
상기에 개요로 서술된 바와 같이, 짧은 주기들(T < 0.25)에 대하여, 식(29)은 예측 계수들을 결정하기 위해 사용될 수 있다. 대안적으로, (계산 복잡성을 감소시키기 위해) (쉽게 이용가능한) 참조표들을 이용하는 것이 이로울 수 있다. 변경된 시프트 파라미터(φ)가 (T < 0.25에 대하여, 및 C=1, A=1/2에 대하여)
Figure 112015065692244-pct00120
의 샘플링 단차 크기를 갖고 범위 |φ|≤T로 한정되는 것이 관찰된다.
본 명세서에서, Tl/T을 갖는 변경된 시프트 파라미터(φ)의 크기 조정에 의해 가장 낮은 주기 T=0.25에 대한 참조표를 재사용하는 것이 제안되고, Tl은 참조표가 이용가능한 가장 낮은 주기(예를 들면, Tl = 0.25)에 대응한다. 예로서, T=0.1 및 φ=0.07을 갖고, T=0.25에 대한 표는 재 크기 조정된 시프트 파라미터(
Figure 112015065692244-pct00121
)로 문의될 수 있다. 이를 행함으로써, 짧은 주기들(예를 들면, T<0.25)에 대한 예측 계수들은 또한 표 검색 동작들을 사용하여 계산 효율적인 방식으로 결정될 수 있다. 또한, 참조표들의 수가 감소될 수 있기 때문에, 예측자에 대한 메모리 요구 사항들은 감소될 수 있다.
본 명세서에서, 모델 기반 서브대역 예측 방식이 기술되었다. 모델 기반 서브대역 예측 방식은 서브대역 예측자들의 효율적인 기술, 즉, 비교적 적은 수의 비트들만을 요구하는 기술을 가능하게 한다. 서브대역 예측자들에 대한 효율적인 기술의 결과로서, 교차-서브대역 예측 방식들이 사용될 수 있어 감소된 에일리어싱 아티팩트들을 초래한다. 전체적으로, 이는 서브대역 예측을 사용하여 저 비트 레이트 오디오 코더들의 제공을 허용한다.
101 : 역양자화기 102 : 합성 필터뱅크
103 : 서브대역 예측자 104 : 서브대역 버퍼
105 : 예측자 계산기

Claims (35)

  1. 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플(615)을 추정하기 위한 방법으로서, 상기 오디오 신호의 상기 제 1 서브대역 신호는 상기 오디오 신호로부터 복수의 서브대역들의 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크(612)를 사용하여 결정되는, 상기 방법에 있어서,
    신호 모델의 모델 파라미터(613)를 결정하는 단계;
    상기 신호 모델에 기초하여, 상기 모델 파라미터(613)에 기초하여, 및 상기 분석 필터뱅크(612)에 기초하여 상기 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호의 이전 샘플(614)에 적용될 예측 계수를 결정하는 단계로서, 상기 이전 샘플(614)의 타임 슬롯은 상기 제 1 샘플(615)의 타임 슬롯 전인, 상기 예측 계수를 결정하는 단계; 및
    상기 이전 샘플(614)에 상기 예측 계수를 적용함으로써 상기 제 1 샘플(615)의 추정치를 결정하는 단계를 포함하고,
    상기 예측 계수를 결정하는 단계는 참조표 또는 분석 함수를 사용하여 상기 예측 계수를 결정하는 단계를 포함하고,
    상기 참조표 또는 상기 분석 함수는 상기 예측 계수를 상기 모델 파라미터로부터 도출된 파라미터의 함수로서 제공하고,
    상기 참조표 또는 상기 분석 함수는 상기 신호 모델에 기초하여 및 상기 분석 필터 뱅크에 기초하여 미리 결정되는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  2. 제 1 항에 있어서,
    상기 신호 모델은 하나 이상의 사인파 모델 성분들을 포함하고,
    상기 모델 파라미터(613)는 상기 하나 이상의 사인파 모델 성분들의 주파수를 나타내고, 및
    선택적으로,
    상기 모델 파라미터(613)는 다중 사인파 신호 모델의 기본 주파수(Ω)를 나타내고,
    상기 다중 사인파 신호 모델은 주기적 신호 성분을 포함하고,
    상기 주기적 신호 성분은 복수의 사인파 성분들을 포함하고,
    상기 복수의 사인파 성분들은 상기 기본 주파수(Ω)의 배수인 주파수를 갖는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 모델 파라미터(613)를 결정하는 단계는 상기 모델 파라미터(613) 및 예측 에러 신호를 나타내는 수신된 비트스트림으로부터 상기 모델 파라미터(613)를 추출하는 단계를 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 모델 파라미터(613)를 결정하는 단계는 제곱된 예측 에러 신호의 평균값이 감소되도록 상기 모델 파라미터(613)를 결정하는 단계를 포함하고,
    상기 예측 에러 신호는 상기 제 1 샘플(615)과 상기 제 1 샘플(615)의 추정치 사이의 차이에 기초하여 결정되고, 및
    선택적으로,
    상기 제곱된 예측 에러 신호의 상기 평균값은 상기 제 1 서브대역 신호의 복수의 연속하는 제 1 샘플들에 기초하여 결정되는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 모델 파라미터는 다중 사인파 신호 모델의 기본 주파수(Ω)를 나타내고,
    상기 예측 계수를 결정하는 단계는 상기 제 1 서브대역 내에 놓인 상기 기본 주파수(Ω)의 배수를 결정하는 단계를 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  6. 제 5 항에 있어서,
    상기 예측 계수를 결정하는 단계는,
    상기 모델 파라미터에 기초하여 복수의 참조표들 중 하나를 선택하는 단계; 및
    상기 복수의 참조표들 중 선택된 것에 기초하여 상기 예측 계수를 결정하는 단계를 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  7. 제 6 항에 있어서,
    상기 모델 파라미터는 주기성(T)을 나타내고;
    상기 복수의 참조표들은 주기성(T)의 상이한 값들에 대한 참조표들을 포함하고;
    상기 방법은 상기 선택된 참조표를 상기 모델 파라미터로 나타낸 상기 주기성(T)에 대한 상기 참조표로서 결정하는 단계를 포함하고, 및
    선택적으로,
    상기 복수의 참조표들은 미리 결정된 단차 크기(ΔT)에서 [Tmin, Tmax]의 범위내 주기성(T)의 상이한 값들에 대한 참조표들을 포함하고;
    Tmin은, T < Tmin에 대하여, 상기 오디오 신호가 하나의 사인파 모델 성분을 포함하는 신호 모델을 사용하여 모델링될 수 있는 것이고;
    Tmax는, T > Tmax에 대하여, 상기 주기성들(Tmax 내지 Tmax+1)에 대한 참조표들이 상기 주기성(Tmax-1 내지 Tmax)에 대한 상기 참조표들에 대응하는 것인, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  8. 제 1 항 또는 제 2 항에 있어서,
    상기 복수의 서브대역들은 동일한 서브대역 간격을 가짐;
    상기 제 1 서브대역은 상기 복수의 서브대역들 중 하나임;
    상기 분석 필터뱅크의 상기 분석 필터들은 서로에 관하여 시프트-불변(shift-invariant)임;
    상기 분석 필터뱅크의 상기 분석 필터들은 공통 윈도우 함수를 포함함;
    상기 분석 필터뱅크의 상기 분석 필터들은 상기 공통 윈도우 함수의 상이하게 변조된 버전들을 포함함;
    상기 공통 윈도우 함수는 코사인 함수를 사용하여 변조됨;
    상기 공통 윈도우 함수는 유한 지속 기간(K)을 가짐;
    상기 분석 필터뱅크의 상기 분석 필터들은 직교 기반을 형성함;
    상기 분석 필터뱅크의 상기 분석 필터들은 정규 직교 기반을 형성함;
    상기 분석 필터뱅크는 코사인 변조된 필터뱅크를 포함함;
    상기 분석 필터뱅크는 임계적으로 샘플링된 필터뱅크임;
    상기 분석 필터뱅크는 중첩된 변환을 포함함;
    상기 분석 필터뱅크는 MDCT, QMF, 및 ELT 변환 중 하나 이상을 포함함; 및
    상기 분석 필터뱅크는 변조 구조를 포함함; 중 하나 이상이 참(true)인, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  9. 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법으로서, 상기 오디오 신호의 상기 제 1 서브대역 신호는 상기 오디오 신호로부터 복수의 서브대역들의 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정되고, 상기 분석 필터뱅크는 임계적으로 샘플링된 필터뱅크인, 상기 방법에 있어서,
    복수의 예측 마스크 지원 서브대역들의 복수의 이전 샘플들을 나타내는 예측 마스크(203, 205)를 결정하는 단계로서, 상기 복수의 예측 마스크 지원 서브대역들은 상기 제 1 서브대역과 상이한 상기 복수의 서브대역들 중 적어도 하나를 포함하는, 상기 예측 마스크(203, 205)를 결정하는 단계;
    상기 복수의 이전 샘플들에 적용될 복수의 예측 계수들을 결정하는 단계; 및
    상기 복수의 이전 샘플들에 상기 복수의 예측 계수들을 각각 적용함으로써 상기 제 1 샘플의 추정치를 결정하는 단계를 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  10. 제 9 항에 있어서,
    상기 복수의 예측 마스크 지원 서브대역들은:
    상기 제 1 서브대역을 포함하거나;
    상기 제 1 서브대역에 직접 인접한 상기 복수의 서브대역들 중 하나 이상을 포함하거나;
    상기 제 1 서브대역 및 상기 제 1 서브대역에 직접 인접한 상기 복수의 서브대역들 중 하나 이상을 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
  11. 오디오 신호를 인코딩하기 위한 방법에 있어서,
    복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 상기 오디오 신호로부터 복수의 서브대역 신호들을 결정하는 단계;
    제 1 항, 제 2 항, 제 9 항, 또는 제 10 항 중 어느 한 항의 방법을 사용하여 상기 복수의 서브대역 신호들의 샘플들을 추정하여, 그에 의해 복수의 추정된 서브대역 신호들을 산출하는 단계;
    상기 복수의 서브대역 신호들의 대응하는 샘플들 및 상기 복수의 추정된 서브대역 신호들의 샘플들에 기초하여 복수의 예측 에러 서브대역 신호들의 샘플들을 결정하는 단계;
    상기 복수의 예측 에러 서브대역 신호들을 양자화하는 단계; 및
    상기 복수의 양자화된 예측 에러 서브대역 신호들 및 상기 복수의 추정된 서브대역 신호들의 상기 샘플들을 추정하기 위해 사용된 하나 이상의 파라미터들을 나타내는 인코딩된 오디오 신호를 생성하는 단계를 포함하는, 오디오 신호를 인코딩하기 위한 방법.
  12. 인코딩된 오디오 신호를 디코딩하기 위한 방법으로서, 상기 인코딩된 오디오 신호는 복수의 양자화된 예측 에러 서브대역 신호들 및 상기 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용될 하나 이상의 파라미터들을 나타내는, 상기 디코딩하기 위한 방법에 있어서,
    상기 복수의 양자화된 예측 에러 서브대역 신호들을 반양자화하여, 복수의 반양자화된 예측 에러 서브대역 신호들을 산출하는 단계;
    제 1 항, 제 2 항, 제 9 항, 또는 제 10 항 중 어느 한 항의 방법을 사용하여 상기 복수의 추정된 서브대역 신호들의 샘플들을 추정하는 단계;
    상기 복수의 추정된 서브대역 신호들의 대응하는 샘플들 및 상기 복수의 반양자화된 예측 에러 서브대역 신호들의 샘플들에 기초하여 복수의 디코딩된 서브대역 신호들의 샘플들을 결정하는 단계; 및
    상기 복수의 합성 필터들을 포함하는 합성 필터뱅크를 사용하여 상기 복수의 디코딩된 서브대역 신호들로부터 디코딩된 오디오 신호를 결정하는 단계를 포함하는, 인코딩된 오디오 신호를 디코딩하기 위한 방법.
  13. 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템(103, 105)으로서, 상기 오디오 신호의 상기 제 1 서브대역 신호는 상기 오디오 신호로부터 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정되는, 상기 시스템(103, 105)에 있어서,
    신호 모델의 모델 파라미터를 결정하도록 구성되고 상기 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호의 하나 이상의 이전 샘플들에 적용될 하나 이상의 예측 계수들을 결정하도록 구성된 예측자 계산기(105)로서, 상기 하나 이상의 예측 계수들은, 상기 신호 모델에 기초하여, 상기 모델 파라미터에 기초하여, 및 상기 분석 필터뱅크에 기초하여 결정되고, 상기 하나 이상의 이전 샘플들의 타임 슬롯들은 상기 하나 이상의 제 1 샘플들의 타임 슬롯들 전인, 상기 예측자 계산기(105); 및
    상기 하나 이상의 예측 계수들을 상기 하나 이상의 이전 샘플들에 적용함으로써 상기 하나 이상의 제 1 샘플들의 추정치를 결정하도록 구성된 서브대역 예측자(103)를 포함하고,
    상기 예측 계수를 결정하는 단계는 참조표 또는 분석 함수를 사용하여 상기 예측 계수를 결정하는 단계를 포함하고,
    상기 참조표 또는 상기 분석 함수는 상기 예측 계수를 상기 모델 파라미터로부터 도출된 파라미터의 함수로서 제공하고,
    상기 참조표 또는 상기 분석 함수는 상기 신호 모델에 기초하여 및 상기 분석 필터 뱅크에 기초하여 미리 결정되는, 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템.
  14. 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템(103, 105)으로서, 상기 제 1 서브대역 신호는 제 1 서브대역에 대응하고, 상기 제 1 서브대역 신호는 복수의 서브대역들에서 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정되고, 상기 분석 필터뱅크는 임계적으로 샘플링된 필터뱅크인, 상기 시스템(103, 105)에 있어서,
    복수의 예측 마스크 지원 서브대역들에서 복수의 이전 샘플들을 나타내는 예측 마스크(203, 205)를 결정하도록 구성된 예측자 계산기(105)로서, 상기 복수의 예측 마스크 지원 서브대역들은 상기 제 1 서브대역과 상이한 상기 복수의 서브대역들 중 적어도 하나를 포함하고, 상기 예측자 계산기(105)는 또한 상기 복수의 이전 샘플들에 적용될 복수의 예측 계수들을 결정하도록 구성되는, 상기 예측자 계산기(105); 및
    상기 복수의 예측 계수들을 상기 복수의 이전 샘플들에 각각 적용함으로써 상기 하나 이상의 제 1 샘플들의 추정치를 결정하도록 구성된 서브대역 예측자(103)를 포함하는, 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템.
  15. 오디오 신호를 인코딩하도록 구성된 오디오 인코더에 있어서,
    복수의 분석 필터들을 사용하여 상기 오디오 신호로부터 복수의 서브대역 신호들을 결정하도록 구성된 분석 필터뱅크;
    상기 복수의 서브대역 신호들의 샘플들을 추정하여, 복수의 추정된 서브대역 신호들(112)을 산출하도록 구성된 제 13 항 또는 제 14 항에 따른 시스템(103, 105);
    상기 복수의 서브대역 신호들 및 상기 복수의 추정된 서브대역 신호들(112)의 대응하는 샘플들에 기초하여 복수의 예측 에러 서브대역 신호들의 샘플들을 결정하도록 구성된 차이 유닛;
    상기 복수의 예측 에러 서브대역 신호들을 양자화하도록 구성된 양자화 유닛; 및
    상기 복수의 양자화된 예측 에러 서브대역 신호들 및 상기 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 하나 이상의 파라미터들을 나타내는 인코딩된 오디오 신호를 생성하도록 구성된 비트스트림 생성 유닛을 포함하는, 오디오 인코더.
  16. 인코딩된 오디오 신호를 디코딩하도록 구성된 오디오 디코더(100)로서, 상기 인코딩된 오디오 신호는 복수의 양자화된 예측 에러 서브대역 신호들 및 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 하나 이상의 파라미터들을 나타내는, 상기 오디오 디코더(100)에 있어서,
    상기 복수의 양자화된 예측 에러 서브대역 신호들을 반양자화하여, 복수의 반양자화된 예측 에러 서브대역 신호들(111)을 산출하도록 구성된 역 양자화기(101);
    상기 복수의 추정된 서브대역 신호들(112)의 샘플들을 추정하도록 구성된 제 13 항 또는 제 14 항에 따른 시스템(105, 103);
    상기 복수의 추정된 서브대역 신호들(112)의 대응하는 샘플들에 기초하여 및 상기 복수의 반양자화된 예측 에러 서브대역 신호들(111)의 샘플들에 기초하여 복수의 디코딩된 서브대역 신호들(113)의 샘플들을 결정하도록 구성된 합산 유닛; 및
    복수의 합성 필터들을 사용하여 상기 복수의 디코딩된 서브대역 신호들(113)로부터 디코딩된 오디오 신호(114)를 결정하도록 구성된 합성 필터뱅크(102)를 포함하는, 오디오 디코더.
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
KR1020157018150A 2013-01-08 2014-01-07 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측 KR101634979B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361750052P 2013-01-08 2013-01-08
US61/750,052 2013-01-08
US201361875528P 2013-09-09 2013-09-09
US61/875,528 2013-09-09
PCT/EP2014/050139 WO2014108393A1 (en) 2013-01-08 2014-01-07 Model based prediction in a critically sampled filterbank

Publications (2)

Publication Number Publication Date
KR20150099770A KR20150099770A (ko) 2015-09-01
KR101634979B1 true KR101634979B1 (ko) 2016-06-30

Family

ID=50000954

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157018150A KR101634979B1 (ko) 2013-01-08 2014-01-07 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측

Country Status (20)

Country Link
US (8) US9659567B2 (ko)
EP (5) EP4372602A2 (ko)
JP (7) JP6173484B2 (ko)
KR (1) KR101634979B1 (ko)
CN (2) CN104919523B (ko)
AU (6) AU2014204954B2 (ko)
BR (2) BR122017000308B1 (ko)
CA (8) CA3234476A1 (ko)
DK (1) DK2943953T3 (ko)
ES (3) ES2613747T3 (ko)
HK (1) HK1213081A1 (ko)
HU (1) HUE032831T2 (ko)
IL (10) IL309437A (ko)
IN (1) IN2015MN01874A (ko)
MX (5) MX362990B (ko)
MY (2) MY193865A (ko)
PL (1) PL2943953T3 (ko)
RU (2) RU2636093C2 (ko)
SG (2) SG10201709631PA (ko)
WO (1) WO2014108393A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2559899C2 (ru) 2010-04-09 2015-08-20 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
DK2981958T3 (en) 2013-04-05 2018-05-28 Dolby Int Ab AUDIO CODES AND DECODS
EP2981961B1 (en) 2013-04-05 2017-05-10 Dolby International AB Advanced quantizer
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3800636B1 (en) 2017-09-12 2023-03-08 Dolby Laboratories Licensing Corporation Packet loss concealment for critically-sampled filter bank-based codecs using multi-sinusoidal detection
CN110068771B (zh) * 2019-05-28 2020-02-07 山东大学 基于输出响应重构的高精度电池模型参数辨识方法及系统
CN110849971B (zh) * 2019-11-21 2021-05-18 西南交通大学 基于双指数窗函数法的结构模态参数识别方法
TWI748484B (zh) * 2020-03-26 2021-12-01 瑞昱半導體股份有限公司 無線信號的封包檢測方法及其系統
US11348594B2 (en) * 2020-06-11 2022-05-31 Qualcomm Incorporated Stream conformant bit error resilience
CN112259116B (zh) * 2020-10-14 2024-03-15 北京字跳网络技术有限公司 一种音频数据的降噪方法、装置、电子设备及存储介质
CN115598489B (zh) * 2021-06-28 2024-04-05 本源量子计算科技(合肥)股份有限公司 量子比特参数的测量方法和装置、量子芯片的测试方法
CN114454237B (zh) * 2022-02-18 2024-05-14 杭州勤鹄科技有限公司 一种珍珠棉定长切断装置及方法
CN117610313B (zh) * 2024-01-18 2024-04-26 西安石油大学 页岩油藏人工裂缝的网格加密方法及装置

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62227198A (ja) * 1986-03-28 1987-10-06 松下電器産業株式会社 帯域分割予測符号化方法
EP0799531B1 (en) * 1994-12-20 2000-03-22 Dolby Laboratories Licensing Corporation Method and apparatus for applying waveform prediction to subbands of a perceptual coding system
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
FI114248B (fi) 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP4220108B2 (ja) * 2000-06-26 2009-02-04 大日本印刷株式会社 音響信号符号化システム
FR2815160B1 (fr) 2000-10-06 2003-01-17 France Telecom Procede et dispositif de codage d'un signal audiofrequence
US6633839B2 (en) * 2001-02-02 2003-10-14 Motorola, Inc. Method and apparatus for speech reconstruction in a distributed speech recognition system
US7225135B2 (en) * 2002-04-05 2007-05-29 Lectrosonics, Inc. Signal-predictive audio transmission system
JP4218271B2 (ja) 2002-07-19 2009-02-04 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
US20040252772A1 (en) * 2002-12-31 2004-12-16 Markku Renfors Filter bank based signal processing
US7277550B1 (en) * 2003-06-24 2007-10-02 Creative Technology Ltd. Enhancing audio signals by nonlinear spectral operations
KR101058064B1 (ko) * 2003-07-18 2011-08-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 저비트율 오디오 인코딩
AU2003291862A1 (en) * 2003-12-01 2005-06-24 Aic A highly optimized method for modelling a windowed signal
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
US20060015329A1 (en) * 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
CN102148035B (zh) * 2004-11-02 2014-06-18 皇家飞利浦电子股份有限公司 使用复值滤波器组的音频信号的编码和解码
JP2006211243A (ja) 2005-01-27 2006-08-10 Kobe Steel Ltd ディジタル信号符号化装置,ディジタル信号符号化方法
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP2038882A2 (en) * 2006-06-29 2009-03-25 Nxp B.V. Decoding sound parameters
EP3447916B1 (en) * 2006-07-04 2020-07-15 Dolby International AB Filter system comprising a filter converter and a filter compressor and method for operating the filter system
FR2912249A1 (fr) 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
GB2441835B (en) * 2007-02-07 2008-08-20 Sonaptic Ltd Ambient noise reduction system
KR101149448B1 (ko) * 2007-02-12 2012-05-25 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
EP2118885B1 (en) * 2007-02-26 2012-07-11 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
US8588427B2 (en) 2007-09-26 2013-11-19 Frauhnhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
MX2010004220A (es) * 2007-10-17 2010-06-11 Fraunhofer Ges Forschung Codificacion de audio usando mezcla descendente.
ATE518224T1 (de) 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
CN101971251B (zh) * 2008-03-14 2012-08-08 杜比实验室特许公司 像言语的信号和不像言语的信号的多模式编解码方法及装置
JP5122681B2 (ja) * 2008-05-23 2013-01-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
KR101400535B1 (ko) 2008-07-11 2014-05-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩
PL2301020T3 (pl) * 2008-07-11 2013-06-28 Fraunhofer Ges Forschung Urządzenie i sposób do kodowania/dekodowania sygnału audio z użyciem algorytmu przełączania aliasingu
EP2311271B1 (en) * 2008-07-29 2014-09-03 Dolby Laboratories Licensing Corporation Method for adaptive control and equalization of electroacoustic channels
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
CN101646123B (zh) * 2009-08-28 2012-09-05 中国科学院声学研究所 一种模拟听觉感知模型的滤波器组
ES2374008B1 (es) * 2009-12-21 2012-12-28 Telefónica, S.A. Codificación, modificación y síntesis de segmentos de voz.
EP2362375A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
CN102812651B (zh) * 2010-03-26 2014-07-23 飞路得新思探有限公司 发送装置及方法
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
CN102088603B (zh) * 2010-12-31 2013-12-04 北京大学深圳研究生院 用于视频编码器的熵编码器及其实现方法
US20120245927A1 (en) * 2011-03-21 2012-09-27 On Semiconductor Trading Ltd. System and method for monaural audio processing based preserving speech information
EP2530840B1 (en) * 2011-05-30 2014-09-03 Harman Becker Automotive Systems GmbH Efficient sub-band adaptive FIR-filtering
CN107326559A (zh) 2017-06-09 2017-11-07 杭州慧群机电设备有限公司 一种珠绣多色换珠装置

Also Published As

Publication number Publication date
CA3054712A1 (en) 2014-07-17
AU2017216470A1 (en) 2017-08-31
US20180108366A1 (en) 2018-04-19
CN107452392B (zh) 2020-09-01
JP7418637B2 (ja) 2024-01-19
BR122017000308B1 (pt) 2021-11-16
JP7053545B6 (ja) 2022-05-16
IL283412A (en) 2021-07-29
SG10201709631PA (en) 2018-01-30
EP3648104A1 (en) 2020-05-06
US10325608B2 (en) 2019-06-18
IL239444B (en) 2018-04-30
BR112015016275B1 (pt) 2021-02-02
MX2015008659A (es) 2015-10-12
AU2023203057A1 (en) 2023-06-08
RU2015127216A (ru) 2017-01-16
IL258153A (en) 2018-05-31
EP2943953B1 (en) 2016-11-16
PL2943953T3 (pl) 2017-07-31
US9892741B2 (en) 2018-02-13
IL268510A (en) 2019-09-26
JP2022043233A (ja) 2022-03-15
IL290600B (en) 2022-10-01
HUE032831T2 (en) 2017-11-28
JP2024038279A (ja) 2024-03-19
JP6173484B2 (ja) 2017-08-02
JP6530787B2 (ja) 2019-06-12
AU2019264642A1 (en) 2019-12-05
CA3140749A1 (en) 2014-07-17
AU2014204954A1 (en) 2015-07-02
JP6592634B2 (ja) 2019-10-16
US10971164B2 (en) 2021-04-06
CA3076775C (en) 2020-10-27
AU2014204954B2 (en) 2017-05-18
US20170221492A1 (en) 2017-08-03
RU2017134071A3 (ko) 2020-11-24
IL239444A0 (en) 2015-07-30
BR122017000308A2 (pt) 2019-09-03
CA3092138C (en) 2021-07-20
MX370086B (es) 2019-11-29
EP3893240B1 (en) 2024-04-24
IL309437A (en) 2024-02-01
MX342822B (es) 2016-10-13
JP2019152875A (ja) 2019-09-12
RU2742460C2 (ru) 2021-02-08
CA2897321A1 (en) 2014-07-17
AU2022201676A1 (en) 2022-03-31
IL262551A (en) 2018-12-31
RU2017134071A (ru) 2019-02-07
IL302061B1 (en) 2024-01-01
CA3054712C (en) 2020-06-09
IL296350B2 (en) 2023-09-01
ES2880252T3 (es) 2021-11-24
CN104919523A (zh) 2015-09-16
JP2020008875A (ja) 2020-01-16
EP3176784A1 (en) 2017-06-07
CA3234476A1 (en) 2014-07-17
CA3076775A1 (en) 2014-07-17
IL258153B (en) 2018-12-31
US20190013034A1 (en) 2019-01-10
IL277117A (en) 2020-10-29
CA3140749C (en) 2024-05-14
IL296350A (en) 2022-11-01
MY193865A (en) 2022-10-29
US10573330B2 (en) 2020-02-25
IL296350B1 (en) 2023-05-01
WO2014108393A1 (en) 2014-07-17
JP2016507776A (ja) 2016-03-10
EP2943953A1 (en) 2015-11-18
US20200258532A1 (en) 2020-08-13
IL302061B2 (en) 2024-05-01
EP3893240A1 (en) 2021-10-13
US20230306974A1 (en) 2023-09-28
CN107452392A (zh) 2017-12-08
CA3121651C (en) 2022-01-18
DK2943953T3 (en) 2017-01-30
AU2021200013A1 (en) 2021-02-25
US11915713B2 (en) 2024-02-27
US20160189720A1 (en) 2016-06-30
AU2021200013B2 (en) 2021-12-16
CA3012134A1 (en) 2014-07-17
US9659567B2 (en) 2017-05-23
CA3121651A1 (en) 2014-07-17
MX2022013536A (es) 2022-11-16
US10102866B2 (en) 2018-10-16
CA2897321C (en) 2018-09-04
IL277117B (en) 2021-07-29
JP7258118B2 (ja) 2023-04-14
JP2023082175A (ja) 2023-06-13
JP7053545B2 (ja) 2022-04-12
EP4372602A2 (en) 2024-05-22
MX2019014295A (es) 2020-01-27
CA3012134C (en) 2019-10-15
ES2769845T3 (es) 2020-06-29
MY173781A (en) 2020-02-20
HK1213081A1 (zh) 2016-06-24
AU2022201676B2 (en) 2023-02-23
IL268510B (en) 2020-09-30
BR112015016275A2 (pt) 2017-07-11
AU2019264642B2 (en) 2020-10-08
AU2023203057B2 (en) 2024-05-02
SG11201504705SA (en) 2015-07-30
RU2636093C2 (ru) 2017-11-20
IL290600B2 (en) 2023-02-01
IL302061A (en) 2023-06-01
MX362990B (es) 2019-03-01
ES2613747T3 (es) 2017-05-25
EP3176784B1 (en) 2020-01-01
IL283412B (en) 2022-03-01
JP2017201415A (ja) 2017-11-09
KR20150099770A (ko) 2015-09-01
IN2015MN01874A (ko) 2015-08-28
US20210287686A1 (en) 2021-09-16
IL290600A (en) 2022-04-01
EP3648104B1 (en) 2021-05-19
US11651777B2 (en) 2023-05-16
US20190259401A1 (en) 2019-08-22
CN104919523B (zh) 2017-10-13
IL262551B (en) 2019-08-29
CA3092138A1 (en) 2014-07-17
AU2017216470B2 (en) 2019-08-15

Similar Documents

Publication Publication Date Title
KR101634979B1 (ko) 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190613

Year of fee payment: 4