KR101634979B1 - Model based prediction in a critically sampled filterbank - Google Patents

Model based prediction in a critically sampled filterbank Download PDF

Info

Publication number
KR101634979B1
KR101634979B1 KR1020157018150A KR20157018150A KR101634979B1 KR 101634979 B1 KR101634979 B1 KR 101634979B1 KR 1020157018150 A KR1020157018150 A KR 1020157018150A KR 20157018150 A KR20157018150 A KR 20157018150A KR 101634979 B1 KR101634979 B1 KR 101634979B1
Authority
KR
South Korea
Prior art keywords
subband
signal
prediction
samples
model
Prior art date
Application number
KR1020157018150A
Other languages
Korean (ko)
Other versions
KR20150099770A (en
Inventor
랄스 빌레모에스
Original Assignee
돌비 인터네셔널 에이비
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 인터네셔널 에이비 filed Critical 돌비 인터네셔널 에이비
Publication of KR20150099770A publication Critical patent/KR20150099770A/en
Application granted granted Critical
Publication of KR101634979B1 publication Critical patent/KR101634979B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/32Circuit design at the digital level
    • G06F30/327Logic synthesis; Behaviour synthesis, e.g. mapping logic, HDL to netlist, high-level language to RTL or netlist
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Measurement Of Radiation (AREA)
  • Design And Manufacture Of Integrated Circuits (AREA)

Abstract

본 명세서는 오디오 소스 코딩 시스템들에 관한 것이다. 특히, 본 명세서는 필터 뱅크와 결합하여 선형 예측을 이용하는 오디오 소스 코딩 시스템들에 관한 것이다. 오디오 신호의 제 1 서브대역의 제 1 서브대역 신호의 제 1 샘플(615)을 추정하기 위한 방법이 기술된다. 오디오 신호의 제 1 서브대역 신호는 오디오 신호로부터 복수의 서브대역들의 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크(612)를 사용하여 결정된다. 상기 방법은, 신호 모델의 모델 파라미터(613)를 결정하는 단계; 신호 모델에 기초하여, 모델 파라미터(613)에 기초하여 및 분석 필터뱅크(612)에 기초하여 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호들의 이전 샘플(614)에 적용될 예측 계수를 결정하는 단계로서, 이전 샘플(614)의 타임 슬롯이 제 1 샘플(615)의 타입 슬롯 전인, 상기 결정 단계; 및 이전 샘플(614)에 예측 계수를 적용함으로써 제 1 샘플(615)의 추정치를 결정하는 단계를 포함한다.The present disclosure relates to audio source coding systems. In particular, the present disclosure relates to audio source coding systems that use linear prediction in combination with a filter bank. A method for estimating a first sample 615 of a first subband signal of a first subband of an audio signal is described. The first subband signal of the audio signal is determined using an analysis filterbank 612 that includes a plurality of analysis filters each providing a plurality of subband signals of a plurality of subbands from the audio signal. The method includes determining a model parameter (613) of a signal model; Based on the signal model, a prediction coefficient to be applied to the previous sample 614 of the first decoded subband signals derived from the first subband signal, based on the model parameter 613 and based on the analysis filter bank 612, Wherein the time slot of the previous sample (614) is before the type slot of the first sample (615); And determining an estimate of the first sample 615 by applying a prediction coefficient to the previous sample 614.

Description

임계적으로 샘플링된 필터뱅크에서 모델 기반 예측{MODEL BASED PREDICTION IN A CRITICALLY SAMPLED FILTERBANK}MODEL BASED PREDICTION IN A CRITICALLY SAMPLED FILTERBANK IN THRUALLY SAMPLED FILTER BANK.

본 발명은 오디오 소스 코딩 시스템들에 관한 것이다. 특히, 본 발명은 필터뱅크와 결합하여 선형 예측을 사용하는 오디오 소스 코딩 시스템들에 관한 것이다.The present invention relates to audio source coding systems. More particularly, the present invention relates to audio source coding systems that use linear prediction in combination with a filter bank.

오디오 신호들의 소스 코딩을 위한 시스템에 적용된 두 개의 중요한 신호 처리 툴들, 즉, 임계적으로 샘플링된 필터뱅크들 및 선형 예측이 존재한다. 임계적으로 샘플링된 필터뱅크들(예를 들면, 변조된 이산 코사인 변환(MDCT) 기반 필터뱅크들)은 지각적인 무관계 및 신호 리던던시가 이용될 수 있는 시간-주파수 표현들에 대해 직접 액세스하게 한다. 선형 예측은 오디오 신호들, 특히, 스피치 신호들의 효율적인 소스 모델링을 가능하게 한다. 두 개의 툴들의 조합, 즉, 필터뱅크의 서브대역들에서 예측의 사용은 주로 고 비트 레이트 오디오 코딩에 사용되었다. 저 비트 레이트 코딩을 위해, 서브대역들에서 예측에 의한 도전 과제는 예측자들의 디스크립션에 대한 비용(즉, 비트 레이트)을 낮게 유지하는 것이다. 다른 도전 과제는 서브대역 예측자에 의해 획득된 예측 에러 신호의 결과적인 잡음 성형을 제어하는 것이다.
US2006/0015329A1은 오디오 신호의 예측된 샘플들의 세트를 생성하기 위해 파형 합성기를 이용하는 오디오 코딩을 위한 방법을 기술한다.
There are two important signal processing tools applied to the system for source coding of audio signals, namely, thresholded sampled filter banks and linear prediction. Critically sampled filter banks (e.g., modulated discrete cosine transform (MDCT) -based filter banks) allow direct access to time-frequency representations where perceptual indifference and signal redundancy can be exploited. Linear prediction enables efficient source modeling of audio signals, particularly speech signals. The combination of the two tools, i. E. The use of prediction in the subbands of the filter bank, was mainly used for high bit rate audio coding. For low bit rate coding, the challenge by prediction in subbands is to keep the cost (i.e. bit rate) of the predictors' descriptions low. Another challenge is to control the resulting noise shaping of the prediction error signal obtained by the subband predictor.
US2006 / 0015329A1 describes a method for audio coding using a waveform synthesizer to generate a set of predicted samples of an audio signal.

비트-효율적 방식으로 서브대역 예측자의 디스크립션을 인코딩하는 도전 과제에 대하여, 가능한 경로는 오디오 신호의 이전 디코딩된 부분들로부터 예측자를 추정하고 그에 의해 예측자 디스크립션의 비용을 함께 회피하는 것이다. 예측자가 오디오 신호의 이전에 디코딩된 부분들로부터 결정될 수 있는 경우, 예측자는 인코더로부터 디코더로 예측자 디스크립션을 전송할 필요 없이 인코더에서 및 디코더에서 결정될 수 있다. 이러한 방식은 백워드 적응식 예측 방식이라고 불린다. 그러나, 백워드 적응식 예측 방식은 일반적으로 인코딩된 오디오 신호의 비트 레이트가 감소될 때 상당히 열화한다. 서브대역 예측자의 효율적인 인코딩에 대한 대안적이거나 추가적인 경로는 더 자연적인 예측자 디스크립션, 예를 들면, 인코딩될 오디오 신호의 고유한 구조를 이용하는 디스크립션을 식별하는 것이다. 예를 들면, 저 비트 레이트 속도 코딩은 일반적으로 단기 예측자(단기 상관들을 이용하는) 및 장기 예측자(속도 신호의 기본적인 피치에 의해 장기 상관들을 이용하는)의 간단한 표현에 기초하여 포워드 적응적 방식을 적용한다.For the challenge of encoding the description of the subband predictor in a bit-efficient manner, the possible path is to estimate the predictor from the previously decoded portions of the audio signal and thereby avoid the cost of the predictor description altogether. If the predictor can be determined from previously decoded portions of the audio signal, the predictor can be determined at the encoder and at the decoder without having to send the predictor description from the encoder to the decoder. This approach is called the backward adaptive prediction scheme. However, the backward-adaptive prediction scheme generally degrades significantly when the bit rate of the encoded audio signal is reduced. An alternative or additional path to efficient encoding of the subband predictor is to identify a more natural predictor description, e.g., a description using a unique structure of the audio signal to be encoded. For example, low bitrate rate coding generally applies a forward adaptive scheme based on a simple representation of a short-term predictor (using short-term correlations) and a long-term predictor (using long-term corrections by the fundamental pitch of the rate signal) do.

예측 에러 신호의 잡음 성형을 제어하는 도전 과제에 대하여, 예측자의 잡음 성형이 서브대역 내에서 잘 제어될 수 있는 동안, 인코더의 최종 출력 오디오 신호는 에일리어스 아티팩트들(실질적으로 평탄한 스펙트럼 잡음 성형을 나타내는 오디오 신호들을 제외하고)을 나타낸다는 것이 관찰된다.For the challenge of controlling the noise shaping of the predictive error signal, while the noise shaping of the predictor can be well controlled within the subband, the final output audio signal of the encoder is transformed into aliased artifacts (substantially smooth spectral noise shaping (Except for the audio signals that represent it).

서브대역 예측자의 중요한 경우는 중첩하는 윈도우들을 갖는 필터뱅크에서 장기 예측의 구현이다. 장기 예측자는 일반적으로 주기적이고 거의 주기적인 오디오 신호들(예컨대 고유한 피치를 나타내는 속도 신호들)에서 리던던시들을 이용하고, 단일의 또는 적은 수의 예측 파라미터들로 기술될 수 있다. 장기 예측자는 오디오 신호의 주기성을 반영하는 지연에 의해 연속하는 시간에 규정될 수 있다. 이러한 지연이 필터뱅크 윈도우의 길이와 비교하여 클 때, 장기 예측자는 시프트 또는 부분적인 지연에 의해 개별적인 시간 도메인에서 실행될 수 있고 서브대역 도메인에서 인과관계의 예측자로 다시 변환될 수 있다. 이러한 장기 예측자는 일반적으로 에일리어스 아티팩트들을 나타내지 않지만, 시간 도메인으로부터 서브대역 도메인으로의 변환에 대한 추가의 필터뱅크 연산들에 대한 필요에 의해 야기된 계산 복잡성에서 상당한 불이익이 존재한다. 또한, 시간 도메인에서 지연을 결정하고 지연을 서브대역 예측자로 변환시키는 방식은 인코딩될 오디오 신호의 주기가 필터뱅크 윈도우 사이즈와 비슷하거나 그보다 작은 경우에 대해 적용가능하지 않다.An important case of the subband predictor is the implementation of long-term prediction in a filter bank with overlapping windows. The long-term predictor can be described as a single or a small number of predictive parameters, typically using redundancies in periodic and nearly periodic audio signals (e.g., velocity signals representing inherent pitch). The long-term predictor may be defined at successive times by a delay reflecting the periodicity of the audio signal. When this delay is large compared to the length of the filter bank window, the long-term predictor can be executed in a separate time domain by shift or partial delay and can be transformed back into a causal predictor in the subband domain. These long-term predictors do not generally represent aliasing artifacts, but there are significant disadvantages in the computational complexity caused by the need for additional filter bank operations for conversion from the time domain to the subband domain. Also, the manner of determining the delay in the time domain and converting the delay to the subband predictor is not applicable for cases where the period of the audio signal to be encoded is similar to or less than the filter bank window size.

본 발명은 서브대역 예측의 상기 언급된 단점들을 기술한다. 특히, 본 발명은 서브대역 예측자들의 비트-레이트 효율적인 기술을 위해 허용하고 및/또는 서브대역 예측자들에 의해 야기된 에일리어스 아티팩트들의 감소를 허용하는 방법들 및 시스템들을 기술한다. 특히, 본 발명에 기술된 방법 및 시스템들은 감소된 레벨의 에일리어싱 아티팩트들을 야기하는 서브대역 예측을 사용하는 저 비트 레이트 오디오 코더들의 구현을 가능하게 한다.The present invention describes the above-mentioned disadvantages of subband prediction. In particular, the present invention describes methods and systems that allow for bit-rate efficient description of subband predictors and / or allow reduction of aliasing artifacts caused by subband predictors. In particular, the methods and systems described herein enable the implementation of low bit rate audio coders that use subband prediction to cause reduced levels of aliasing artifacts.

본 발명은 임계적으로 샘플링된 필터뱅크의 서브대역 도메인에서 예측을 채용하는 오디오 소스 코딩의 품질을 개선하는 방법들 및 시스템들을 기술한다. 상기 방법들 및 시스템들은 서브대역 예측자들의 간단한 디스크립션을 이용할 수 있고, 디스크립션은 신호 모델들에 기초한다. 대안적으로 또는 추가로, 상기 방법들 및 시스템들은 서브대역 도메인에서 직접 예측자들의 효율적인 구현을 이용할 수 있다. 대안적으로 또는 추가로, 상기 방법들 및 시스템들은 에일리어스 아티팩트들의 감소를 허용하기 위해 본 발명에서 기술된 교차 서브대역 예측자 용어들을 이용할 수 있다.The present invention describes methods and systems for improving the quality of audio source coding employing prediction in the subband domain of a critically sampled filter bank. The methods and systems may use a simple description of the subband predictors, and the description is based on signal models. Alternatively or additionally, the methods and systems may utilize an efficient implementation of direct predictors in the subband domain. Alternatively or additionally, the methods and systems may utilize the cross-subband predictor terms described herein to allow reduction of aliasing artifacts.

본 발명에서 개요로 서술된 바와 같이, 서브대역 예측자들의 간단한 기술은 사인파의 주파수, 주기적 신호의 주기, 팽팽한 스트링의 진동에 대해 겪는 약간 비고조파 스펙트럼, 및/또는 다성음 신호에 대한 피치들의 크기를 포함할 수 있다. 장기 예측자의 경우에 대하여, 주기적 신호 모델은 필터뱅크의 윈도우 크기보다 짧거나 및/또는 긴 값들을 포함하는 래그 파라미터들(또는 지연들)의 범위에 대해 고품질 인과 관계 예측자들을 제공하는 것이 도시된다. 이는 주기적 신호 모델이 효율적인 방식으로 장기 서브대역 예측자를 실행하기 위해 사용될 수 있다는 것을 의미한다. 끊김 없는 이동은 사인파 모델 기반 예측으로부터 임의의 지연의 근사치로 제공된다. 서브대역 도메인에서 예측자들의 직접 구현은 생성된 양자화 왜곡들의 지각적인 특징들에 대한 명시적 액세스를 가능하게 한다. 또한, 서브대역 도메인에서 예측자들의 구현은 파라미터들에 대한 예측 이득 및 예측자들의 의존성과 같은 수치적 속성들에 대한 액세스를 가능하게 한다. 예를 들면, 신호 모델 기반 분석은 예측 이득이 단지 고려된 서브대역들의 서브세트에서 중요하고, 송신을 위해 선택된 파라미터들의 함수로서 예측자 계수들의 변형이 파라미터 포맷들, 및 효율적인 인코딩 알고리즘의 설계에 도움이 될 수 있다. 더욱이, 계산 복잡성은 시간 도메인에서 및 서브대역 도메인에서 모두 동작하는 알고리즘들의 사용에 의존하는 예측자 구현들에 비교하여 상당히 감소될 수 있다는 것을 드러낼 수 있다. 특히, 본 발명에서 기술된 방법들 및 시스템들은 시간 도메인에서 예측자(예를 들면, 장기 지연)를 결정 및 적용할 필요 없이 서브대역 도메인에서 직접 서브대역 예측을 실행하기 위해 사용될 수 있다.As outlined in the present invention, a simple description of the subband predictors is based on the frequency of the sine wave, the period of the periodic signal, the slightly non-harmonic spectrum experienced by the vibrations of the tight string, and / . ≪ / RTI > For the case of the long-term predictor, the cyclic signal model is shown to provide high quality causal predictors for a range of lag parameters (or delays) that contain values that are shorter and / or longer than the window size of the filter bank . This means that the periodic signal model can be used to implement the long-term subband predictor in an efficient manner. Seamless motion is provided as an approximation of arbitrary delay from sine wave model based prediction. Direct implementations of predictors in the subband domain enable explicit access to perceptual features of the generated quantization distortions. In addition, the implementation of predictors in the subband domain enables access to numerical properties such as the prediction gain for the parameters and the dependence of the predictors. For example, a signal model based analysis may be useful in that the prediction gain is important only in a subset of the considered subbands, and that variations in the predictor coefficients as a function of the parameters selected for transmission may be helpful in the design of the parameter formats, . Moreover, it can be shown that the computational complexity can be significantly reduced compared to predictor implementations that rely on the use of algorithms that operate both in the time domain and in the subband domain. In particular, the methods and systems described herein can be used to perform subband prediction directly in the subband domain without having to determine and apply predictors (e.g., long term delay) in the time domain.

서브대역 예측자들에서 교차-서브대역 기간들의 사용은 대역내 예측자들(단지 대역내 예측에 의존하는)에 비하여 상당히 개선된 주파수 도메인 잡음 성형 속성들을 가능하게 한다. 이를 행함으로써, 에일리어싱 아티팩트들이 감소될 수 있고, 그에 의해 상대적으로 저 비트 레이트 오디오 코딩 시스템들에 대한 서브대역 예측의 사용을 가능하게 한다.The use of cross-subband periods in the subband predictors enables significantly improved frequency domain noise shaping properties as compared to in-band predictors (which depend only on in-band prediction). By doing this aliasing artifacts can be reduced, thereby enabling the use of subband prediction for relatively low bit rate audio coding systems.

일 양태에 따라, 오디오 신호의 제 1 서브대역의 제 1 샘플을 추정하기 위한 방법이 기술된다. 오디오 신호의 제 1 서브대역은 오디오 신호로부터 복수의 서브대역들에서 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정될 수 있었다. 시간 도메인 오디오 신호는 분석 필터뱅크에 제출될 수 있고, 그에 의해 복수의 서브대역들에서 복수의 서브대역 신호들을 산출한다. 복수의 서브대역들의 각각은 일반적으로 상이한 주파수 범위의 오디오 신호를 포함하고, 그에 의해 오디오 신호의 상이한 주파수 성분들에 대한 액세스를 제공한다. 복수의 서브대역들은 동등하거나 균등한 서브대역 간격을 가질 수 있다. 제 1 서브대역은 분석 필터뱅크에 의해 제공된 복수의 서브대역들 중 하나에 대응한다.According to an aspect, a method for estimating a first sample of a first subband of an audio signal is described. The first subband of the audio signal could be determined from the audio signal using an analysis filter bank comprising a plurality of analysis filters each providing a plurality of subband signals in a plurality of subbands. The time domain audio signal may be submitted to an analysis filter bank, thereby producing a plurality of subband signals in a plurality of subbands. Each of the plurality of subbands typically includes an audio signal in a different frequency range, thereby providing access to different frequency components of the audio signal. The plurality of subbands may have equal or equal subband spacing. The first subband corresponds to one of the plurality of subbands provided by the analysis filter bank.

분석 필터뱅크는 다양한 속성들을 가질 수 있다. 복수의 합성 필터들을 포함하는 합성 필터뱅크는 유사하거나 동일한 속성들을 가질 수 있다. 분석 필터뱅크 및 분석 필터들에 대해 기술된 속성들은 또한 합성 필터뱅크 및 합성 필터들의 속성들에 적용가능하다. 일반적으로, 분석 필터뱅크 및 합성 필터뱅크의 조합은 오디오 신호의 완전한 재구성을 허용한다. 분석 필터뱅크의 분석 필터들은 서로에 관하여 시프트-불변일 수 있다. 대안적으로 또는 추가로, 분석 필터뱅크의 분석 필터들은 공통 윈도우 함수를 포함할 수 있다. 특히, 분석 필터뱅크의 분석 필터들은 공통 윈도우 함수의 다르게 변조된 버전들을 포함할 수 있다. 일 실시예에서, 공통 윈도우 함수는 코사인 함수를 사용하여 변조되고, 그에 의해 코사인 변조된 분석 필터뱅크를 산출한다. 특히, 분석 필터뱅크는, MDCT, QMF, 및/또는 ELT 변환 중 하나 이상을 포함할 수 있다(또는 그에 대응할 수 있다). 공통 윈도우 함수는 유한 지속 기간(K)을 가질 수 있다. 공통 윈도우 함수의 지속 기간은 서브대역 신호의 연속하는 샘플들이 시간 도메인 오디오 신호의 중첩하는 세그먼트들을 사용하여 결정되는 것일 수 있다. 이와 같이, 분석 필터뱅크는 중첩된 변환을 포함할 수 있다. 분석 필터뱅크의 분석 필터들은 직교 및/또는 정규 직교 기반을 형성할 수 있다. 다른 속성으로서, 분석 필터뱅크는 임계적으로 샘플링된 필터뱅크에 대응할 수 있다. 특히, 복수의 서브대역 신호들의 샘플들의 수는 시간 도메인 오디오 신호의 샘플들의 수에 대응할 수 있다.The analysis filter bank may have various properties. A synthesis filter bank comprising a plurality of synthesis filters may have similar or identical properties. The attributes described for the analysis filterbank and analysis filters are also applicable to the properties of the synthesis filterbank and synthesis filters. In general, the combination of the analysis filter bank and the synthesis filter bank allows a complete reconstruction of the audio signal. The analysis filters of the analysis filter bank may be shift-invariant with respect to each other. Alternatively or additionally, the analysis filters of the analysis filter bank may include a common window function. In particular, the analysis filters of the analysis filter bank may contain different modulated versions of the common window function. In one embodiment, the common window function is modulated using a cosine function, thereby yielding a cosine modulated analysis filter bank. In particular, the analysis filter bank may (or may correspond to) one or more of MDCT, QMF, and / or ELT transformations. The common window function may have a finite duration (K). The duration of the common window function may be that successive samples of the subband signal are determined using overlapping segments of the time domain audio signal. As such, the analysis filter bank may include nested transforms. The analysis filters of the analysis filter bank may form an orthogonal and / or orthogonal basis. As another attribute, the analysis filter bank may correspond to a critically sampled filter bank. In particular, the number of samples of the plurality of subband signals may correspond to the number of samples of the time domain audio signal.

방법은 신호 모델의 모델 파라미터를 결정하는 단계를 포함할 수 있다. 신호 모델은 복수의 모델 파라미터들을 사용하여 기술될 수 있다는 것이 주의되어야 한다. 이와 같이, 방법은 신호 모델의 복수의 모델 파라미터들을 결정하는 단계를 포함할 수 있다. 모델 파라미터(들)는 모델 파라미터 및 예측 에러 신호를 포함하거나 또는 그를 나타내는 수신된 비트스트림으로부터 추출될 수 있다. 대안적으로, 모델 파라미터(들)는, 예를 들면, 평균 제곱 오차 방식을 사용하여, 신호 모델을 오디오 신호에 맞춤으로써(예를 들면, 프레임마다에 기초하여) 결정될 수 있다.The method may include determining a model parameter of the signal model. It should be noted that the signal model can be described using a plurality of model parameters. As such, the method may include determining a plurality of model parameters of the signal model. The model parameter (s) may be extracted from the received bitstream that includes or represents the model parameters and the prediction error signal. Alternatively, the model parameter (s) may be determined (e.g., based on frame-by-frame) by fitting the signal model to the audio signal, e.g., using a mean square error scheme.

신호 모델은 하나 이상의 사인파 모델 성분들을 포함할 수 있다. 이러한 경우에, 모델 파라미터는 하나 이상의 사인파 모델 성분들의 하나 이상의 주파수들을 나타낼 수 있다. 예로서, 모델 파라미터는 다중-사인파 신호 모델의 기본 주파수(Ω)를 나타낼 수 있고, 다중-사인파 신호는 기본 주파수(Ω)의 배수들(qΩ)에 대응하는 주파수들에서 사인파 모델 성분들을 포함한다. 이와 같이, 다중-사인파 신호 모델은 주기적 신호 성분을 포함할 수 있고, 주기적 신호 성분은 복수의 사인파 성분들을 포함하고 복수의 사인파 성분들은 기본 주파수(Ω)의 배수인 주파수를 갖는다. 본 명세서에서 보여지는 바와 같이, 이러한 주기적 신호 성분은 (예를 들면, 장기 예측자들에 대해 사용되는) 시간 도메인에서 지연을 모델링하기 위해 사용될 수 있다. 신호 모델은 주기적 신호 모델로부터 신호 모델의 시프트 및/또는 편차를 나타내는 하나 이상의 모델 파라미터들을 포함할 수 있다. 시프트 및/또는 편차는 기본 주파수(Ω)의 각각의 배수들(qΩ)로부터 주기적 신호 모델의 복수의 사인파 성분들의 주파수들의 편차를 나타낼 수 있다.The signal model may include one or more sine wave model components. In this case, the model parameter may represent one or more frequencies of one or more sine wave model components. By way of example, the model parameters may represent the fundamental frequency (?) Of a multi-sinusoidal signal model and the multi-sinusoidal signal includes sinusoidal model components at frequencies corresponding to multiples of the fundamental frequency (?) . As such, the multi-sinusoidal signal model may comprise a periodic signal component, wherein the periodic signal component comprises a plurality of sinusoidal components and the plurality of sinusoidal components have a frequency that is a multiple of the fundamental frequency ([Omega]). As shown herein, this periodic signal component can be used to model the delay in the time domain (e.g., used for long-term predictors). The signal model may include one or more model parameters indicative of a shift and / or a deviation of the signal model from the periodic signal model. The shift and / or deviation may represent a deviation of frequencies of a plurality of sinusoidal components of the periodic signal model from respective multiple (q?) Of the fundamental frequency (?).

신호 모델은 복수의 주기적 신호 성분들을 포함할 수 있다. 주기적 신호 성분들의 각각은 하나 이상의 모델 파라미터들을 사용하여 기술될 수 있다. 모델 파라미터들은 복수의 주기적 신호 성분들의 복수의 기본 주파수들(Ω0, Ω1, ..., ΩM-1)을 나타낼 수 있다. 대안적으로 또는 추가로, 신호 모델은 미리 결정된 및/또는 조정 가능한 완화 파라미터(모델 파라미터들 중 하나일 수 있는)에 의해 기술될 수 있다. 완화 파라미터는 주기적 신호 성분의 선형 스펙트럼을 안정화하거나 평탄화하도록 구성될 수 있다. 신호 모델 및 연관된 모델 파라미터들의 특정 예들은 본 명세서의 실시예 섹션에서 기술된다.The signal model may comprise a plurality of periodic signal components. Each of the periodic signal components may be described using one or more model parameters. The model parameters may represent a plurality of fundamental frequencies (Ω 0 , Ω 1 , ..., Ω M-1 ) of a plurality of periodic signal components. Alternatively or additionally, the signal model may be described by a predetermined and / or adjustable mitigation parameter (which may be one of the model parameters). The relaxation parameter may be configured to stabilize or planarize the linear spectrum of the periodic signal component. Specific examples of signal models and associated model parameters are described in the Examples section herein.

모델 파라미터(들)는 제곱된 예측 에러 신호의 평균값이 감소(예를 들면, 최소화)되도록 결정될 수 있다. 예측 에러 신호는 제 1 샘플과 제 1 샘플의 추정치 사이의 차에 기초하여 결정될 수 있다. 특히, 제곱된 예측 에러 신호의 평균값은 제 1 서브대역 신호의 복수의 연속하는 제 1 샘플들에 기초하여 및 대응하는 복수의 추정된 제 1 샘플들에 기초하여 결정될 수 있다. 특히, 본 명세서에서, 하나 이상의 모델 파라미터들에 의해 기술되는 신호 모델을 사용하여 오디오 신호 또는 오디오 신호의 적어도 제 1 서브대역 신호를 모델링하는 것이 제안된다. 모델 파라미터들은 제 1 추정된 서브대역 신호를 결정하는 선형 예측자의 하나 이상의 예측 계수들을 결정하기 위해 사용된다. 제 1 서브대역 신호와 제 1 추정된 서브대역 신호 사이의 차이는 예측 에러 서브대역 신호를 산출한다. 하나 이상의 모델 파라미터들은 제곱된 예측 에러 서브대역 신호의 평균값이 감소되도록(예를 들면, 최소화되도록) 결정될 수 있다.The model parameter (s) may be determined such that the mean value of the squared prediction error signal is reduced (e. G., Minimized). The prediction error signal may be determined based on the difference between the estimate of the first sample and the first sample. In particular, the mean value of the squared prediction error signal may be determined based on a plurality of successive first samples of the first subband signal and based on a corresponding plurality of estimated first samples. In particular, it is proposed herein to model at least a first subband signal of an audio signal or an audio signal using a signal model described by one or more model parameters. The model parameters are used to determine one or more prediction coefficients of a linear predictor that determines a first estimated subband signal. The difference between the first subband signal and the first estimated subband signal yields a predicted error subband signal. The one or more model parameters may be determined such that the mean value of the squared predicted error subband signal is reduced (e.g., minimized).

방법은 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호의 이전 샘플에 적용될 예측 계수를 결정하는 단계를 추가로 포함할 수 있다. 특히, 이전 샘플은 제 1 서브대역 신호의 대응하는 샘플에 예측 에러 신호의 (양자화된 버전)을 추가함으로써 결정될 수 있다. 제 1 디코딩된 서브대역 신호가 제 1 서브대역 신호와 동일할 수 있다(예를 들면, 손실 없는 인코더의 경우). 이전 샘플의 타임 슬롯은 일반적으로 제 1 샘플의 타임 슬롯 전이다. 특히, 방법은 하나 이상의 이전 샘플들로부터 제 1 서브대역 신호의 제 1 샘플을 결정하도록 구성되는 반복되는 (유한 임펄스 응답) 예측 필터의 하나 이상의 예측 계수들을 결정하는 단계를 포함할 수 있다.The method may further comprise determining a prediction coefficient to be applied to a previous sample of the first decoded subband signal derived from the first subband signal. In particular, the previous sample may be determined by adding a (quantized version) of the prediction error signal to the corresponding sample of the first subband signal. The first decoded subband signal may be the same as the first subband signal (e.g., for a lossless encoder). The time slot of the previous sample is typically before the time slot of the first sample. In particular, the method may comprise determining one or more prediction coefficients of a repeated (finite impulse response) prediction filter configured to determine a first sample of a first subband signal from one or more previous samples.

하나 이상의 예측 계수들은 신호 모델에 기초하여, 모델 파라미터에 기초하여, 및 분석 필터뱅크에 기초하여 결정될 수 있다. 특히, 예측 계수는 신호 모델의 및 분석 필터뱅크의 분석 평가에 기초하여 결정될 수 있다. 신호 모델의 및 분석 필터뱅크의 분석 평가는 참조표의 및/또는 분석 함수의 결정을 초래할 수 있다. 이와 같이, 예측 계수는 참조표 및/또는 분석 함수를 사용하여 결정될 수 있고, 참조표 및/또는 분석 함수는 신호 모델에 기초하여 및 분석 필터뱅크에 기초하여 미리 결정될 수 있다. 참조표 및/또는 분석 함수는 예측 계수(들)를 모델 파라미터(들)로부터 도출된 파라미터의 함수로서 제공할 수 있다. 모델 파라미터로부터 도출된 파라미터는 예를 들면, 모델 파라미터일 수 있거나 또는 미리 결정된 함수를 사용하여 모델 파라미터로부터 획득될 수 있다. 이와 같이, 하나 이상의 예측 계수들은 (단지) 하나 이상의 모델 파라미터들로부터 도출된 (단지) 하나 이상의 파라미터들의 의존성에서 하나 이상의 예측 계수들을 제공하는 분석 함수 및/또는 미리 결정된 참조표를 사용하여 계산 효율적인 방식으로 결정될 수 있다. 따라서, 예측 계수의 결정은 참조표 내 엔트리의 간단한 검색으로 감소될 수 있다. 상기 나타낸 바와 같이, 분석 필터뱅크는 변조된 구조를 포함하거나 나타낼 수 있다. 이러한 변조된 구조의 결과로서, 하나 이상의 예측 계수들의 절대값이 제 1 서브대역의 인덱스 수에 독립적인 것이 관찰된다. 이는, 참조표 및/또는 분석 함수가 복수의 서브대역들의 인덱스 수에 관하여 시프트-불변(신호값 제외)일 수 있다는 것을 의미한다. 이러한 경우들에서, 모델 파라미터로부터 도출된 파라미터, 즉, 예측 계수를 결정하기 위해 참조표 및/또는 분석 함수에 입력된 파라미터는 복수의 서브대역들 중 하나의 서브대역에 관하여 상대적인 방식으로 모델 파라미터를 표현함으로써 도출될 수 있다.The one or more prediction coefficients may be determined based on the signal model, based on the model parameters, and on the analysis filter bank. In particular, the prediction coefficients may be determined based on the analytical evaluation of the signal model and the analysis filter bank. Analysis of the signal model and analysis The analysis of the filterbank may result in the determination of the reference table and / or the analysis function. As such, the prediction coefficients may be determined using reference tables and / or analytic functions, and the reference tables and / or analytic functions may be predetermined based on the signal model and based on the analysis filter banks. The lookup table and / or analysis function may provide the prediction coefficient (s) as a function of the parameters derived from the model parameter (s). The parameters derived from the model parameters can be, for example, model parameters or can be obtained from the model parameters using a predetermined function. As such, the one or more prediction coefficients may be computed in an efficient manner using an analytical function that provides one or more prediction coefficients (only) in dependence of (more than) one or more parameters derived from one or more model parameters and / . ≪ / RTI > Thus, the determination of the prediction coefficients can be reduced by a simple search of the entries in the look-up table. As indicated above, the analysis filter bank may include or represent a modulated structure. As a result of this modulated structure, it is observed that the absolute value of one or more prediction coefficients is independent of the index number of the first subband. This means that the look-up table and / or analytic function may be shift-invariant (except signal values) with respect to the index number of the plurality of subbands. In these cases, the parameters derived from the model parameters, i.e., the parameters input to the look-up table and / or the analysis function to determine the prediction coefficients, may include model parameters in a relative manner with respect to one of the plurality of subbands . ≪ / RTI >

상기 개요로 서술된 바와 같이, 모델 파라미터는 다중-사인파 신호 모델의(예를 들면, 주기적 신호 모델의) 기본 주파수(Ω)를 나타낼 수 있다. 이러한 경우들에서, 예측 계수를 결정하는 단계는 제 1 서브대역 내에 놓인 기본 주파수(Ω)의 배수를 결정하는 단계를 포함할 수 있다. 기본 주파수(Ω)의 배수가 제 1 서브대역 내에 놓인 경우, 제 1 서브대역의 중심 주파수로부터 기본 주파수(Ω)의 배수의 상대적인 오프셋이 결정될 수 있다. 특히, 제 1 서브대역의 중심 주파수에 가장 가까운 기본 주파수(Ω)의 배수의 상대적인 오프셋이 결정될 수 있다. 참조표 및/또는 분석 함수는, 참조표 및/또는 분석 함수가 예측 계수를 서브대역의 중심 주파수로부터 가능한 상대적인 오프셋들의 함수로서(예를 들면, 본 명세서에서 기술되는, 정규화된 주파수(f)의 함수로서 및/또는 시프트 파라미터(

Figure 112015065692244-pct00001
)의 함수로서) 제공하도록 미리 결정될 수 있다. 이와 같이, 예측 계수는 결정된 상대적인 오프셋을 사용하여 참조표에 기초하여 및/또는 분석 함수에 기초하여 결정될 수 있다. 미리 결정된 참조표는 제한된 수의 가능한 상대적인 오프셋들에 대해 제한된 수의 엔트리들을 포함할 수 있다. 이러한 경우에서, 결정된 상대적인 오프셋은 참조표로부터 예측 계수를 검색하기 전에 제한된 수의 가능한 상대적인 오프셋들로부터 가장 가까운 가능한 상대적인 오프셋으로 근사될 수 있다.As described above, the model parameters may represent the fundamental frequency (Ω) of a multi-sinusoidal signal model (eg, of a periodic signal model). In these cases, the step of determining the prediction coefficients may comprise determining a multiple of the fundamental frequency (OMEGA) lying within the first subband. If a multiple of the fundamental frequency (?) Is within the first sub-band, the relative offset of a multiple of the fundamental frequency (?) From the center frequency of the first sub-band may be determined. In particular, the relative offset of a multiple of the fundamental frequency (?) Closest to the center frequency of the first sub-band can be determined. The reference table and / or analysis function may be used to determine whether the look-up table and / or the analysis function has a predictive coefficient as a function of the relative offsets possible from the center frequency of the subband (e.g., the normalized frequency f As a function and / or a shift parameter (
Figure 112015065692244-pct00001
) ≪ / RTI > As such, the prediction coefficients may be determined based on the lookup table using the determined relative offset and / or based on the analysis function. The predetermined reference table may include a limited number of entries for a limited number of possible relative offsets. In such a case, the determined relative offset can be approximated to a closest possible relative offset from a limited number of possible relative offsets before retrieving the prediction coefficients from the look-up table.

다른 한편으로, 기본 주파수(Ω)의 어떠한 배수도 제 1 서브대역 내에 놓이지 않고, 즉 오히려, 제 1 서브대역을 둘러싸는 확장된 주파수 범위 내에 있는 경우, 예측 계수는 0으로 설정된다. 이러한 경우들에서, 제 1 샘플의 추정치는 또한 0일 수 있다.On the other hand, if no multiple of the fundamental frequency? Is within the first sub-band, i.e. rather within the extended frequency range surrounding the first sub-band, then the prediction coefficient is set to zero. In these cases, the estimate of the first sample may also be zero.

예측 계수를 결정하는 단계는 모델 파라미터에 기초하여 복수의 참조표들 중 하나를 선택하는 단계를 포함할 수 있다. 예로서, 모델 파라미터는 주기적 신호 모델의 기본 주파수(Ω)를 나타낼 수 있다. 주기적 신호 모델의 기본 주파수(Ω)는 주기적 신호 모델의 주기성(T)에 대응한다. 상대적으로 작은 주기성들(T)의 경우에, 주기적 신호 모델은 단일 사인파 모델을 향해 수렴되는 것이 본 명세서에서 보여진다. 또한, 상대적으로 큰 주기성들(T)의 경우에, 참조표들은 T의 절대값에 따라 느리게 변하고 있고 주로 상대적인 오프셋(즉, 시프트 파라미터(

Figure 112015065692244-pct00002
))에 의존하는 것이 본 발명에서 보여진다. 이와 같이, 복수의 참조표들이 주기성(T)의 복수의 상이한 값들에 대해 미리 결정될 수 있다. 모델 파라미터(즉, 주기성(T))는 복수의 참조표들 중 적절한 것을 선택하기 위해 사용될 수 있고, 예측 계수는 (상대적인 오프셋을 사용하여, 예를 들면, 시프트 파라미터(
Figure 112015065692244-pct00003
)를 사용하여) 복수의 참조표들 중 선택된 것에 기초하여 결정될 수 있다. 이와 같이, 상대적으로 높은 정확도를 가질 수 있는 모델 파라미터(예를 들면, 주기성(T)을 나타내는)는 감소된 정확도의 한 쌍의 파라미터들(예를 들면, 주기성(T) 및 상대적인 오프셋)로 디코딩될 수 있다. 한 쌍의 파라미터들의 제 1 파라미터(예를 들면, 주기성(T))는 특정한 참조표를 선택하기 위해 사용될 수 있고, 제 2 파라미터(예를 들면, 상대적인 오프셋)는 선택된 참조표내 엔트리를 식별하기 위해 사용될 수 있다.The step of determining the prediction coefficients may comprise selecting one of the plurality of look-up tables based on the model parameters. By way of example, the model parameter may represent the fundamental frequency (?) Of the periodic signal model. The fundamental frequency (?) Of the periodic signal model corresponds to the periodicity (T) of the periodic signal model. In the case of relatively small periodicity (T), it is shown herein that the periodic signal model converges towards a single sinusoidal model. Also, in the case of relatively large periodicity (T), the look-up tables vary slowly according to the absolute value of T and are mainly used for relative offset (i.e., shift parameter
Figure 112015065692244-pct00002
)) Is shown in the present invention. As such, a plurality of look-up tables may be predetermined for a plurality of different values of the periodicity T. The model parameters (i.e., periodicity T) may be used to select the appropriate one of the plurality of look-up tables, and the prediction coefficients may be calculated using the relative offset (e.g.,
Figure 112015065692244-pct00003
)) May be determined based on the selected one of the plurality of reference tables. As such, a model parameter (e.g., representing periodicity T) that can have a relatively high accuracy can be decoded (e.g., periodicity T and relative offset) with a pair of reduced accuracy parameters . The first parameter (e.g., periodicity T) of the pair of parameters may be used to select a particular reference table and the second parameter (e.g., relative offset) may be used to identify the selected reference in- Can be used.

방법은 예측 계수를 이전 샘플에 적용함으로써 제 1 샘플의 추정치를 결정하는 단계를 추가로 포함할 수 있다. 예측 계수를 이전 샘플에 적용하는 단계는 예측 계수를 이전 샘플의 값과 곱하여, 그에 의해 제 1 샘플의 추정치를 산출하는 단계를 포함할 수 있다. 일반적으로, 제 1 서브대역 신호의 복수의 제 1 샘플들은 예측 계수를 일련의 이전 샘플들에 적용함으로써 결정된다. 제 1 샘플의 추정치를 결정하는 단계는 스케일링 이득을 예측 계수 및/또는 제 1 샘플에 적용하는 단계를 추가로 포함할 수 있다. 스케일링 이득 또는 그의 표시는, 예를 들면, 장기 예측(LTP)에 대하여 사용될 수 있다. 다시 말해서, 스케일링 이득은 상이한 예측자(예를 들면, 장기 예측자로부터)로부터 기인할 수 있다. 스케일링 이득은 상이한 서브대역들에 대해 상이할 수 있다. 또한, 스케일링 이득은 인코딩된 오디오 신호의 부분으로서 송신될 수 있다.The method may further comprise determining an estimate of the first sample by applying a prediction coefficient to the previous sample. Applying the prediction coefficient to the previous sample may include multiplying the prediction coefficient by the value of the previous sample, thereby calculating an estimate of the first sample. In general, a plurality of first samples of a first subband signal are determined by applying a prediction coefficient to a series of previous samples. The step of determining an estimate of the first sample may further comprise applying a scaling gain to the prediction coefficient and / or the first sample. The scaling gain or its indication may be used, for example, for long term prediction (LTP). In other words, the scaling gain may result from a different predictor (e.g., from a long-term predictor). The scaling gain may be different for different subbands. In addition, the scaling gain may be transmitted as part of the encoded audio signal.

이와 같이, 서브대역 예측자의 효율적인 디스크립션(하나 이상의 예측 계수들을 포함하는)이 모델 파라미터에 의해 기술되는 신호 모델을 사용함으로써 제공된다. 모델 파라미터는 서브대역 예측자의 하나 이상의 예측 계수들을 결정하기 위해 사용된다. 이는 오디오 인코더가 하나 이상의 예측 계수들의 표시가 아니라 모델 파라미터의 표시를 송신할 필요가 있다는 것을 의미한다. 일반적으로, 모델 파라미터는 하나 이상의 예측 계수들보다 더 효율적으로(즉, 더 적은 수의 비트들을 갖고) 인코딩될 수 있다. 따라서, 모델 기반 예측의 사용은 저 비트 레이트 서브대역 인코딩을 가능하게 한다.As such, an efficient description of the subband predictor (including one or more prediction coefficients) is provided by using the signal model described by the model parameters. The model parameters are used to determine one or more prediction coefficients of the subband predictor. This means that the audio encoder needs to transmit an indication of the model parameters, rather than an indication of one or more prediction coefficients. In general, model parameters can be encoded more efficiently (i.e., with fewer bits) than one or more prediction coefficients. Thus, the use of model-based prediction enables low bit rate subband encoding.

방법은 복수의 예측 마스크 지원 서브대역들에서 복수의 이전 샘플들을 나타내는 예측 마스크를 결정하는 단계를 추가로 포함할 수 있다. 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역들과 상이한 복수의 서브대역들 중 적어도 하나를 포함할 수 있다. 이와 같이, 서브대역 예측자는 제 1 서브대역 신호와 상이한 복수의 서브대역 신호들로부터의 하나 이상의 다른 서브대역 신호들의 샘플들로부터 제 1 서브대역 신호의 샘플을 추정하도록 구성될 수 있다. 이는 본 명세서에서 교차-서브대역 예측으로서 불린다. 예측 마스크는 제 1 서브대역 신호의 제 1 샘플을 추정하기 위해 사용되는 복수의 이전 샘플들(예를 들면, 제 1 샘플의 타임 슬롯에 관한 시간 래그 및/또는 제 1 서브대역의 인덱스 수에 관한 서브대역 인덱스 래그)의 정렬을 규정할 수 있다.The method may further comprise determining a prediction mask representing a plurality of previous samples in the plurality of prediction mask support subbands. The plurality of prediction mask support subbands may include at least one of a plurality of subbands different from the first subbands. As such, the subband predictor can be configured to estimate a sample of the first subband signal from samples of one or more other subband signals from a plurality of subband signals different from the first subband signal. This is referred to herein as cross-subband prediction. The prediction mask includes a plurality of previous samples used to estimate a first sample of the first subband signal (e.g., a time lag with respect to a time slot of the first sample and / Subband index lag). ≪ / RTI >

방법은 복수의 이전 샘플들에 적용될 복수의 예측 계수들을 결정하는 단계로 진행할 수 있다. 복수의 예측 계수들은 신호 모델에 기초하여, 모델 파라미터에 기초하여, 및 (예를 들면, 상기에 및 본 명세서에서 개요로 서술되는 모델 기반 예측 방식들을 사용하는) 분석 필터뱅크에 기초하여 결정될 수 있다. 이와 같이, 복수의 예측 계수들은 하나 이상의 모델 파라미터들을 사용하여 결정될 수 있다. 다시 말해서, 제한된 수의 모델 파라미터들은 복수의 예측 계수들을 결정하기에 충분할 수 있다. 이는, 모델 기반 서브대역 예측을 사용함으로써, 교차-서브대역 예측이 비트-레이트 효율적인 방식으로 실행될 수 있다는 것을 의미한다.The method may proceed to determining a plurality of prediction coefficients to be applied to a plurality of previous samples. The plurality of prediction coefficients may be determined based on the model parameters, based on the signal model, and on an analysis filter bank (e.g., using model-based prediction schemes as outlined above and herein) . As such, the plurality of prediction coefficients may be determined using one or more model parameters. In other words, a limited number of model parameters may be sufficient to determine a plurality of prediction coefficients. This means that by using model-based subband prediction, cross-subband prediction can be performed in a bit-rate efficient manner.

방법은 복수의 예측 계수들을 복수의 이전 샘플들에 각각 적용함으로써 제 1 샘플의 추정치를 결정하는 단계를 포함할 수 있다. 제 1 샘플의 추정치를 결정하는 단계는 일반적으로 복수의 각각의 예측 계수들에 의해 가중된 복수의 이전 샘플들의 합을 결정하는 단계를 포함한다.The method may include determining an estimate of the first sample by applying each of the plurality of prediction coefficients to a plurality of previous samples. The step of determining an estimate of the first sample generally includes determining a sum of a plurality of previous samples weighted by the plurality of respective prediction coefficients.

상기 개요로 서술된 바와 같이, 모델 파라미터는 주기성(T)을 나타낼 수 있다. 하나 이상의 예측 계수들을 결정하기 위해 사용되는 복수의 참조표들은 주기성(T)의 상이한 값들에 대한 참조표들을 포함할 수 있다. 특히, 복수의 참조표들은 [Tmin, Tmax]의 범위 내에서 미리 결정된 단차 크기(ΔT)의 주기성(T)의 상이한 값들에 대한 참조표들을 포함할 수 있다. 본 명세서에서 개요로 서술된 바와 같이, Tmin은 0.25의 범위 내에 있을 수 있고, Tmax는 2.5의 범위 내에 있을 수 있다. Tmin은, T < Tmin에 대하여, 오디오 신호가 하나의 사인파 모델 성분을 포함하는 신호 모델을 사용하여 모델링될 수 있도록 선택될 수 있다. Tmax는, T > Tmax에 대하여, 주기성들(Tmax 내지 Tmax + 1)에 대한 참조표들이 주기성들(Tmax - 1 내지 Tmax)에 대한 참조표들에 실질적으로 대응하도록 선택될 수 있다. 일반적으로 주기성들(Tmax + n 내지 Tmax + n + 1(통상 n≥0에 대하여))에 대하여 동일하게 적용한다.As described above, the model parameter may represent the periodicity (T). The plurality of look-up tables used to determine one or more prediction coefficients may include look-up tables for different values of the periodicity (T). In particular, the plurality of look-up tables may include look-up tables for different values of the periodicity (T) of the predetermined step size? T within the range of [T min , T max ]. As outlined herein, T min can be in the range of 0.25, and T max can be in the range of 2.5. T min can be selected such that for T < T min , the audio signal can be modeled using a signal model that includes one sinusoidal model component. T max is, T> with respect to the T max, the periodicity references to (T max to T max + 1) Table that the periodicity - be selected to substantially correspond to the reference schedule for the (T max 1 to T max) . In general, the same applies to the periodicity ( Tmax + n to Tmax + n + 1 (usually for n? 0)).

방법은 선택된 참조표를 모델 파라미터로 나타낸 주기성(T)에 대한 참조표로서 결정하는 단계를 포함할 수 있다. 하나 이상의 예측 계수들을 포함하거나 표시하는 선택된 참조표를 가진 후, 참조 파라미터는 하나 이상의 예측 계수들을 각각 나타내는 선택된 참조표 내 적절한 하나 이상의 엔트리들을 식별하기 위해 사용될 수 있다. 참조 파라미터는 시프트 파라미터(

Figure 112015065692244-pct00004
)에 대응할 수 있거나 또는 그로부터 도출될 수 있다.The method may include determining the selected reference table as a look-up table for the periodicity (T) as a model parameter. After having a selected reference table that includes or displays one or more prediction coefficients, the reference parameter may be used to identify one or more appropriate entries in the selected reference table that each represent one or more prediction coefficients. The reference parameter is a shift parameter (
Figure 112015065692244-pct00004
) Or may be derived therefrom.

방법은, 주기성(T > Tmax)을 나타내는 모델 파라미터에 대하여, 나머지 주기성(Tr)이 범위[Tmax - 1, Tmax]에 놓이도록 T로부터 정수값을 감산함으로써 나머지 주기성(Tr)을 결정하는 단계를 포함한다. 예측 계수를 결정하기 위한 참조표는 이후 나머지 주기성(Tr)에 대한 참조표로서 결정될 수 있다.Method, the periodicity (T> T max) for with respect to representing the model parameters, and the remaining periodicity (T r) is a range-rest periodicity by subtracting the integer value from T to lie in [T max 1, T max] (T r) . The look-up table for determining the prediction coefficients may then be determined as a look-up table for the remaining periodicity (T r ).

방법은, 주기성(T < Tmin)을 표시하는 모델 파라미터에 대하여, 하나 이상의 예측 계수들을 주기성(Tmin)에 대한 참조표로서 결정하기 위해 참조표를 선택하는 단계를 포함할 수 있다. 또한, 하나 이상의 예측 계수들을 제공하는 선택된 참조표의 하나 이상의 엔트리들을 식별하기 위한 참조 파라미터(예를 들면, 시프트 파라미터(

Figure 112015065692244-pct00005
))는 비율(Tmin/T)에 따라 크기 조정될 수 있다. 하나 이상의 예측 계수들은 이후 선택된 참조표 및 크기 조정된 참조 파라미터를 사용하여 결정될 수 있다. 특히, 하나 이상의 예측 계수들은 크기 조정된 참조 파라미터에 대응하는 선택된 참조표의 하나 이상의 엔트리들에 기초하여 결정될 수 있다.The method may include selecting a look-up table to determine, for a model parameter representing periodicity (T < T min ), one or more prediction coefficients as a look-up table for periodicity (T min ). Further, a reference parameter (e.g., a shift parameter (e.g., a reference value) for identifying one or more entries of a selected reference table that provides one or more prediction coefficients
Figure 112015065692244-pct00005
) Can be scaled according to the ratio Tmin / T. The one or more prediction coefficients may then be determined using the selected reference table and the scaled reference parameter. In particular, the one or more prediction coefficients may be determined based on one or more entries of the selected reference table corresponding to the scaled reference parameter.

이와 같이, 참조표들의 수는 미리 결정된 범위[Tmin, Tmax]로 한정될 수 있고, 그에 의해 오디오 인코더/디코더의 메모리 요구 조건들을 한정한다. 그럼에도 불구하고, 예측 계수들은 미리 결정된 참조표들을 사용하여 주기성(T)의 모든 가능한 값들에 대해 결정될 수 있고, 그에 의해 오디오 인코더/디코더의 계산 효율적인 구현을 가능하게 한다.As such, the number of look-up tables can be limited to a predetermined range [ Tmin , Tmax ], thereby defining the memory requirements of the audio encoder / decoder. Nevertheless, the prediction coefficients can be determined for all possible values of the periodicity T using predetermined reference tables, thereby enabling a computationally efficient implementation of the audio encoder / decoder.

다른 양태에 따라, 오디오 신호의 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법이 기술된다. 상기에 개요로 서술되는 바와 같이, 오디오 신호의 제 1 서브대역 신호는 오디오 신호로부터 복수의 서브대역들에서 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정될 수 있다. 상기 기술된 특징들은 이하에 기술된 방법에 또한 적용가능하다.According to another aspect, a method for estimating a first sample of a first subband signal of an audio signal is described. As outlined above, the first subband signal of the audio signal is determined using an analysis filter bank comprising a plurality of analysis filters each providing a plurality of subband signals in a plurality of subbands from the audio signal . The features described above are also applicable to the method described below.

방법은 복수의 예측 마스크 지원 서브대역들에서 복수의 이전 샘플들을 나타내는 예측 마스크를 결정하는 단계를 포함한다. 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역과 상이한 복수의 서브대역들 중 적어도 하나를 포함한다. 특히, 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역을 포함할 수 있고 및/또는 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역에 직접 인접한 복수의 서브대역들 중 하나 이상을 포함할 수 있다.The method includes determining a prediction mask representing a plurality of previous samples in a plurality of prediction mask supported subbands. The plurality of prediction mask support subbands include at least one of a plurality of subbands different from the first subbands. In particular, the plurality of prediction mask capable subbands may comprise a first subband and / or the plurality of prediction mask capable subbands may comprise one or more of a plurality of subbands directly adjacent to the first subband .

방법은 복수의 이전 샘플들에 적용될 복수의 예측 계수들을 결정하는 단계를 추가로 포함할 수 있다. 복수의 이전 샘플들은 일반적으로 오디오 신호의 복수의 서브대역 신호들로부터 도출될 수 있다. 특히, 복수의 이전 샘플들은 일반적으로 복수의 디코딩된 서브대역 신호들의 샘플들에 대응한다. 복수의 예측 계수들은 제 1 서브대역과 상이한 서브대역들의 하나 이상의 샘플들을 또한 고려하는 반복되는 (유한 임펄스 응답) 예측 필터의 예측 계수들에 대응할 수 있다. 제 1 샘플의 추정치는 복수의 예측 계수들을 복수의 이전 샘플들에 각각 적용함으로써 결정될 수 있다. 이와 같이, 방법은 다른 (예를 들면, 인접한) 서브대역들로부터의 하나 이상의 샘플들을 사용하여 서브대역 예측을 가능하게 한다. 이를 행함으로써, 서브대역 예측 기반 코더들에 의해 야기된 에일리어싱 아티팩트들은 감소될 수 있다.The method may further comprise determining a plurality of prediction coefficients to be applied to a plurality of previous samples. A plurality of previous samples may generally be derived from a plurality of subband signals of the audio signal. In particular, a plurality of previous samples generally correspond to samples of a plurality of decoded subband signals. The plurality of prediction coefficients may correspond to prediction coefficients of a repeated (finite impulse response) prediction filter that also considers one or more samples of subbands different from the first subband. The estimate of the first sample may be determined by applying a plurality of prediction coefficients to a plurality of previous samples, respectively. As such, the method enables subband prediction using one or more samples from different (e.g., adjacent) subbands. By doing this, the aliasing artifacts caused by the subband prediction based coders can be reduced.

방법은 신호 모델의 모델 파라미터를 결정하는 단계를 추가로 포함할 수 있다. 복수의 예측 계수들은 신호 모델에 기초하여, 모델 파라미터에 기초하여 및 분석 필터뱅크에 기초하여 결정될 수 있다. 이와 같이, 복수의 예측 계수들은 본 명세서에 기술되는 모델 기반 예측을 사용하여 결정될 수 있다. 특히, 복수의 예측 계수들은 참조표 및/또는 분석 함수를 사용하여 결정될 수 있다. 참조표 및/또는 분석 함수는 신호 모델에 기초하여 및 분석 필터뱅크에 기초하여 미리 결정될 수 있다. 또한, 참조표 및/또는 분석 함수는 복수의 예측 계수들을 (단지) 모델 파라미터로부터 도출된 파라미터의 함수로서 제공할 수 있다. 따라서, 모델 파라미터는 참조표 및/또는 분석 함수를 사용하여 복수의 예측 계수들을 직접 제공할 수 있다. 이와 같이, 모델 파라미터는 교차-서브대역 예측자의 계수를 효율적으로 기술하기 위해 사용될 수 있다.The method may further comprise determining a model parameter of the signal model. The plurality of prediction coefficients may be determined based on the model parameters and based on the analysis filter bank, based on the signal model. As such, the plurality of prediction coefficients may be determined using the model-based prediction described herein. In particular, the plurality of prediction coefficients may be determined using reference tables and / or analytic functions. The reference table and / or analysis function may be predetermined based on the signal model and based on the analysis filter bank. In addition, the look-up table and / or analysis function may provide a plurality of prediction coefficients as a function of (only) parameters derived from the model parameters. Thus, the model parameters can directly provide a plurality of prediction coefficients using a look-up table and / or analytic function. As such, the model parameters can be used to efficiently describe the coefficients of the cross-subband predictor.

다른 양태에 따라, 오디오 신호를 인코딩하기 위한 방법이 기술된다. 방법은 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 오디오 신호로부터 복수의 서브대역 신호들을 결정하는 단계를 포함할 수 있다. 방법은 본 명세서에 기술되는 예측 방법들 중 어느 하나를 사용하여 복수의 서브대역 신호들의 샘플들을 추정하는 단계로 진행하고, 그에 의해 복수의 추정된 서브대역 신호들을 산출할 수 있다. 또한, 복수의 예측 에러 서브대역 신호들의 샘플들은 복수의 서브대역 신호들의 대응하는 샘플들 및 복수의 추정된 서브대역 신호들의 샘플들에 기초하여 결정될 수 있다. 방법은 복수의 예측 에러 서브대역 신호들을 양자화하는 단계 및 인코딩된 오디오 신호를 생성하는 단계로 진행할 수 있다. 인코딩된 오디오 신호는 복수의 양자화된 예측 에러 서브대역 신호들을 나타낼 수 있다(예를 들면, 포함할 수 있다). 또한, 인코딩된 신호는 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 하나 이상의 파라미터들을 나타낼 수 있고(예를 들면, 포함할 수 있고), 예를 들면, 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 이후 사용되는 하나 이상의 예측 계수들을 결정하기 위해 사용된 하나 이상의 모델 파라미터들을 나타낼 수 있다.According to another aspect, a method for encoding an audio signal is described. The method may comprise determining a plurality of subband signals from the audio signal using an analysis filter bank comprising a plurality of analysis filters. The method may proceed to estimating samples of a plurality of subband signals using any one of the prediction methods described herein, thereby yielding a plurality of estimated subband signals. In addition, the plurality of samples of the prediction error subband signals may be determined based on the corresponding samples of the plurality of subband signals and samples of the plurality of estimated subband signals. The method may proceed to quantizing a plurality of prediction error subband signals and generating an encoded audio signal. The encoded audio signal may (e.g., contain) a plurality of quantized prediction error subband signals. In addition, the encoded signal may represent (e.g., include) one or more parameters used to estimate samples of a plurality of estimated subband signals and may include, for example, a plurality of estimated subband signals Lt; / RTI &gt; may be used to determine one or more predictor coefficients that are subsequently used to estimate the samples of the model.

다른 양태에 따라, 인코딩된 오디오 신호를 디코딩하기 위한 방법이 기술된다. 인코딩된 오디오 신호는 일반적으로 복수의 양자화된 예측 에러 서브대역 신호들 및 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용될 하나 이상의 파라미터들을 나타낼 수 있다. 방법은 복수의 양자화된 예측 에러 서브대역 신호들을 반양자화하는 단계를 포함할 수 있고, 그에 의해 복수의 반양자화된 예측 에러 서브대역 신호들을 산출한다.According to another aspect, a method for decoding an encoded audio signal is described. The encoded audio signal may generally represent one or more parameters to be used to estimate a plurality of quantized prediction error subband signals and samples of a plurality of estimated subband signals. The method may include semi-quantizing a plurality of quantized prediction error subband signals, thereby yielding a plurality of semi-quantized prediction error subband signals.

또한, 방법은 본 명세서에 기술된 예측 방법들 중 어느 하나를 사용하여 복수의 추정된 서브대역 신호들의 샘플들을 추정하는 단계를 포함할 수 있다. 복수의 디코딩된 서브대역 신호들의 샘플들은 복수의 추정된 서브대역 신호들의 대응하는 샘플들에 기초하여 및 복수의 반양자화된 예측 에러 서브대역 신호들의 샘플들에 기초하여 결정될 수 있다. 디코딩된 오디오 신호는 복수의 합성 필터들을 포함하는 합성 필터뱅크를 사용하여 복수의 디코딩된 서브대역 신호들로부터 결정될 수 있다.The method may also include estimating samples of the plurality of estimated subband signals using any one of the prediction methods described herein. Samples of the plurality of decoded subband signals may be determined based on corresponding samples of the plurality of estimated subband signals and based on samples of the plurality of semi-quantized prediction error subband signals. The decoded audio signal may be determined from a plurality of decoded subband signals using a synthesis filter bank comprising a plurality of synthesis filters.

다른 양태에 따라, 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템이 기술된다. 오디오 신호의 제 1 서브대역 신호는 복수의 각각의 서브대역들에서 오디오 신호로부터 복수의 서브대역 신호들을 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정될 수 있다. 시스템은 신호 모델의 모델 파라미터를 결정하도록 구성된 예측자 계산기를 포함할 수 있다. 또한, 예측자 계산기는 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호의 하나 이상의 이전 샘플들에 적용될 하나 이상의 예측 계수들을 결정하도록 구성될 수 있다. 이와 같이, 예측자 계산기는 반복되는 예측 필터의, 특히 반복되는 서브대역 예측 필터의 하나 이상의 예측 계수들을 결정하도록 구성될 수 있다. 하나 이상의 예측 계수들은 신호 모델에 기초하여, 모델 파라미터에 기초하여 및 (예를 들면, 본 명세서에 기술된 모델 기반 예측 방법들을 사용하는) 분석 필터뱅크에 기초하여 결정될 수 있다. 하나 이상의 이전 샘플들의 타임 슬롯들은 일반적으로 하나 이상의 제 1 샘플들의 타임 슬롯들에 앞선다. 시스템은 하나 이상의 예측 계수들을 하나 이상의 이전 샘플들에 적용함으로써 하나 이상의 제 1 샘플들의 추정치를 결정하도록 구성된 서브대역 예측자를 추가로 포함할 수 있다.According to another aspect, a system configured to estimate one or more first samples of a first subband signal of an audio signal is described. The first subband signal of the audio signal may be determined using an analysis filter bank comprising a plurality of analysis filters providing a plurality of subband signals from the audio signal in a plurality of respective subbands. The system may include a predictor calculator configured to determine model parameters of the signal model. The predictor calculator may also be configured to determine one or more prediction coefficients to be applied to one or more previous samples of the first decoded subband signal derived from the first subband signal. As such, the predictor calculator can be configured to determine one or more prediction coefficients of the repeated prediction filter, especially of the repeated subband prediction filter. The one or more prediction coefficients may be determined based on the model parameters based on the signal model and on an analysis filter bank (e.g., using model-based prediction methods described herein). The timeslots of one or more previous samples generally precede the timeslots of one or more first samples. The system may further comprise a subband predictor configured to determine an estimate of one or more first samples by applying one or more prediction coefficients to one or more previous samples.

다른 양태에 따라, 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템이 기술된다. 제 1 서브대역 신호는 복수의 서브대역들 중 제 1 서브대역에 대응한다. 제 1 서브대역 신호는 일반적으로 복수의 서브대역들에 대해 복수의 서브대역 신호들을 제공하는 복수의 분석 필터들을 각각 포함하는 분석 필터뱅크를 사용하여 결정된다. 시스템은 복수의 예측 마스크 지원 서브대역들에서 복수의 이전 샘플들을 나타내는 예측 마스크를 결정하도록 구성된 예측자 계산기를 포함한다. 복수의 예측 마스크 지원 서브대역들은 제 1 서브대역과 상이한 복수의 서브대역들 중 적어도 하나를 포함한다. 예측자 계산기는 또한 복수의 이전 샘플들에 적용될 복수의 예측 계수들(또는 반복되는 예측 필터)을 결정하도록 구성된다. 또한, 시스템은 복수의 예측 계수들을 복수의 이전 샘플들에 각각 적용함으로써 하나 이상의 제 1 샘플들의 추정치를 결정하도록 구성된 서브대역 예측자를 포함한다.According to another aspect, a system configured to estimate one or more first samples of a first subband signal of an audio signal is described. The first subband signal corresponds to a first one of the plurality of subbands. The first subband signal is typically determined using an analysis filter bank that includes a plurality of analysis filters each of which provides a plurality of subband signals for a plurality of subbands. The system includes a predictor calculator configured to determine a prediction mask representing a plurality of previous samples in a plurality of prediction mask supported subbands. The plurality of prediction mask support subbands include at least one of a plurality of subbands different from the first subbands. The predictor calculator is also configured to determine a plurality of prediction coefficients (or repeated prediction filters) to be applied to a plurality of previous samples. In addition, the system includes a subband predictor configured to determine an estimate of one or more first samples by applying a plurality of prediction coefficients to a plurality of previous samples, respectively.

다른 양태에 따라, 오디오 신호를 인코딩하도록 구성된 오디오 인코더가 기술된다. 오디오 인코더는 복수의 분석 필터들을 사용하여 오디오 신호로부터 복수의 서브대역 신호들을 결정하도록 구성된 분석 필터뱅크를 포함한다. 또한, 오디오 인코더는 복수의 서브대역 신호들의 샘플들을 추정하도록 구성되는 본 명세서에 기술되는 예측자 계산기 및 서브대역 예측자를 포함하고, 그에 의해 복수의 추정된 서브대역 신호들을 산출한다. 또한, 인코더는 복수의 서브대역 신호들의 및 복수의 추정된 서브대역 신호들의 대응하는 샘플들에 기초하여 복수의 예측 에러 서브대역 신호들의 샘플들을 결정하도록 구성된 차이 유닛을 포함할 수 있다. 양자화 유닛은 복수의 예측 에러 서브대역 신호들을 양자화하기 위해 사용될 수 있다. 또한, 비트스트림 생성 유닛은 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 복수의 양자화된 예측 에러 서브대역 신호들 및 하나 이상의 파라미터들(예를 들면, 하나 이상의 모델 파라미터들)을 나타내는 인코딩된 오디오 신호를 생성하도록 구성될 수 있다.According to another aspect, an audio encoder configured to encode an audio signal is described. The audio encoder includes an analysis filter bank configured to determine a plurality of subband signals from the audio signal using a plurality of analysis filters. The audio encoder also includes a predictor calculator and a subband predictor described herein configured to estimate samples of a plurality of subband signals, thereby producing a plurality of estimated subband signals. The encoder may also include a difference unit configured to determine samples of the plurality of prediction error subband signals based on the plurality of subband signals and the corresponding samples of the plurality of estimated subband signals. The quantization unit may be used to quantize a plurality of prediction error subband signals. In addition, the bitstream generation unit may be configured to generate a plurality of quantized prediction error subband signals and one or more parameters (e.g., one or more model parameters) used to estimate samples of a plurality of estimated subband signals And generate an encoded audio signal.

다른 양태에 따라, 인코딩된 오디오 신호를 디코딩하도록 구성된 오디오 디코더가 기술된다. 인코딩된 오디오 신호는 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 복수의 양자화된 예측 에러 서브대역 신호들 및 하나 이상의 파라미터들을 나타낸다(예를 들면, 포함한다). 오디오 디코더는 복수의 양자화된 예측 에러 서브대역 신호들을 반양자화하도록 구성된 역 양자화기를 포함할 수 있고, 그에 의해 복수의 반양자화된 예측 에러 서브대역 신호들을 산출한다. 또한, 디코더는 복수의 추정된 서브대역 신호들의 샘플들을 추정하도록 구성되는 본 명세서에 기술된 예측자 계산기 및 서브대역 예측자를 포함한다. 합산 유닛은 복수의 추정된 서브대역 신호들의 대응하는 샘플들에 기초하여 및 복수의 반양자화된 예측 에러 서브대역 신호들의 샘플들에 기초하여 복수의 디코딩된 서브대역 신호들의 샘플들을 결정하도록 사용될 수 있다. 또한, 합성 필터뱅크는 복수의 합성 필터들을 사용하여 복수의 디코딩된 서브대역 신호들로부터 디코딩된 오디오 신호를 결정하기 위해 사용될 수 있다.According to another aspect, an audio decoder configured to decode an encoded audio signal is described. The encoded audio signal represents (e.g., includes) a plurality of quantized prediction error subband signals and one or more parameters used to estimate samples of a plurality of estimated subband signals. The audio decoder may comprise an inverse quantizer configured to semi-quantize a plurality of quantized prediction error subband signals, thereby producing a plurality of semi-quantized prediction error subband signals. The decoder also includes a predictor calculator and a subband predictor described herein configured to estimate samples of a plurality of estimated subband signals. The summation unit may be used to determine samples of the plurality of decoded subband signals based on the corresponding samples of the plurality of estimated subband signals and based on the samples of the plurality of semi-quantized prediction error subband signals . The synthesis filter bank may also be used to determine the decoded audio signal from a plurality of decoded subband signals using a plurality of synthesis filters.

다른 양태에 따라, 소프트웨어 프로그램이 기술된다. 소프트웨어 프로그램은 프로세서상에 실행을 위해 및 프로세서상에 실행될 때 본 명세서에서 개요로 서술된 방법 단계들을 수행하기 위해 적응될 수 있다.According to another aspect, a software program is described. A software program may be adapted to perform the method steps outlined herein for execution on a processor and when executed on a processor.

다른 양태에 따라, 저장 매체가 기술된다. 저장 매체는 프로세서상에 실행을 위해 및 프로세서상에 실행될 때 본 명세서에서 개요로 서술된 방법 단계들을 수행하기 위해 적응된 소프트웨어 프로그램을 포함할 수 있다.According to another aspect, a storage medium is described. The storage medium may comprise a software program adapted for performing the method steps described herein in outline for execution on a processor and on a processor.

다른 양태에 따라, 컴퓨터 프로그램 제품이 기술된다. 컴퓨터 프로그램은 컴퓨터상에 실행될 때 본 명세서에서 개요로 서술된 방법 단계들을 수행하기 위해 실행가능한 명령들을 포함할 수 있다.According to another aspect, a computer program product is described. A computer program, when executed on a computer, may include executable instructions for performing the method steps outlined herein.

본 특허 출원에서 개요로 서술되는 그의 바람직한 실시예들을 포함하는 방법들 및 시스템들은 단독으로 또는 본 명세서에 개시된 다른 방법들 및 시스템들과 조합하여 사용될 수 있다는 것이 주의되어야 한다. 또한, 본 특허 출원에서 개요로 서술된 방법들 및 시스템들의 모든 양태들은 임의로 조합될 수 있다. 특히, 청구항들의 특징들은 임의의 방식으로 서로 조합될 수 있다.It should be noted that the methods and systems comprising their preferred embodiments outlined in this patent application may be used alone or in combination with other methods and systems described herein. In addition, all aspects of the methods and systems outlined in this patent application may be combined arbitrarily. In particular, the features of the claims may be combined with one another in any manner.

본 발명은 임계적으로 샘플링된 필터뱅크의 서브대역 도메인에서 예측을 채용하는 오디오 소스 코딩의 품질을 개선하는 방법들 및 시스템들을 기술한다. 상기 방법들 및 시스템들은 서브대역 도메인에서 직접 예측자들의 효율적인 구현을 이용할 수 있다. 대안적으로 또는 추가로, 상기 방법들 및 시스템들은 에일리어스 아티팩트들의 감소를 허용하기 위해 본 발명에서 기술된 교차 서브대역 예측자 용어들을 이용할 수 있다.The present invention describes methods and systems for improving the quality of audio source coding employing prediction in the subband domain of a critically sampled filter bank. The methods and systems may utilize an efficient implementation of direct predictors in the subband domain. Alternatively or additionally, the methods and systems may utilize the cross-subband predictor terms described herein to allow reduction of aliasing artifacts.

도 1은 필터뱅크 도메인에서(즉, 서브대역 도메인에서) 선형 예측을 적용하는 예시적인 오디오 디코더의 블록도.
도 2는 시간 주파수 그리드에서 예시적인 예측 마스크들을 도시하는 도면.
도 3은 사인파 모델 기반 예측자 계산기에 대한 예시적인 통계표를 도시하는 도면.
도 4는 대역내 서브대역 예측으로부터 기인하는 예시적인 잡음 성형을 도시하는 도면.
도 5는 교차-대역 서브대역 예측으로부터 기인하는 예시적인 잡음 성형을 도시하는 도면.
도 6a는 주기적 모델 기반 예측자 계산에 대해 통계표에 기초하는 예시적인 2차원 양자화 그리드를 도시하는 도면.
도 6b는 상이한 범위들의 신호 주기성들에 대해 상이한 예측 마스크들의 사용을 도시하는 도면.
도 7a 및 도 7b는 모델 기반 서브대역 예측을 사용하여 예시적인 인코딩 및 디코딩 방법들의 플로차트들.
1 is a block diagram of an exemplary audio decoder for applying linear prediction in a filter bank domain (i.e., in a subband domain);
Figure 2 illustrates exemplary prediction masks in a time frequency grid.
3 shows an exemplary statistical table for a sine wave model based predictor calculator.
4 is a diagram illustrating exemplary noise shaping resulting from in-band subband prediction;
5 illustrates an exemplary noise shaping resulting from a cross-band subband prediction;
FIG. 6A illustrates an exemplary two-dimensional quantization grid based on a statistical table for periodic model-based predictor computation. FIG.
Figure 6B illustrates the use of different prediction masks for different ranges of signal periodicity;
Figures 7A and 7B are flowcharts of exemplary encoding and decoding methods using model-based subband prediction.

본 발명은 첨부하는 도면들을 참조하여 본 발명의 범위 또는 정신을 제한하지 않고 도시적인 예들로서 이하에 기술된다.The present invention is described below as illustrative examples without limiting the scope or spirit of the invention with reference to the accompanying drawings.

이하에 기술된 실시예들은 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측에 대한 본 발명의 원리들에 대하여 단순히 예시하는 것이다. 장치들의 변경들 및 변형들 및 여기에 기술된 상세 사항들은 당업자들에게 명백할 것이라는 것이 이해된다. 그러므로, 계류중인 특허 청구항들의 범위에 의해서만 제한되고, 여기 실시예들의 기술 및 설명으로서 표현된 특정한 상세 사항들에 의해 제한되지 않는 것이 의도된다.The embodiments described below are merely illustrative of the principles of the present invention for model-based prediction in a critically sampled filter bank. Variations and modifications of the devices and details described herein will be apparent to those skilled in the art. It is, therefore, intended to be limited only by the scope of the pending patent claims, and not limited by the specific details expressed as the description and the description of the embodiments herein.

도 1은 (또한 서브대역 도메인이라고 불림) 필터뱅크 도메인에서 선형 예측을 적용하는 예시적인 오디오 디코더(100)의 블록도를 도시한다. 오디오 디코더(100)는 예측 에러 신호(또한 나머지 신호라고도 불림)에 관한 정보 및 가능하게는 원래의 입력 오디오 신호로부터 예측 에러 신호를 결정하기 위해 대응하는 인코더에 의해 사용된 예측자의 디스크립션에 관한 정보를 포함하는 비트 스트림을 수신한다. 예측 에러 신호에 관한 정보는 입력 오디오 신호의 서브대역들에 관한 것일 수 있고 예측자의 디스크립션에 관한 정보는 하나 이상의 서버대역 예측자들에 관한 것일 수 있다.Figure 1 shows a block diagram of an exemplary audio decoder 100 that applies linear prediction in a filterbank domain (also called a subband domain). The audio decoder 100 receives information about the prediction error signal (also referred to as the residual signal) and possibly about the description of the predictor used by the corresponding encoder to determine the prediction error signal from the original input audio signal And receives the bitstream including the bitstream. The information about the prediction error signal may be for subbands of the input audio signal and the information about the description of the predictor may be for one or more server band predictors.

수신된 비트 스트림 정보를 고려하면, 역 양자화기(101)는 예측 에러 서브대역 신호들의 샘플들(111)을 출력할 수 있다. 이들 샘플들은 서브대역 예측자(103)의 출력(112)에 추가될 수 있고, 합(113)은 디코딩된 오디오 신호의 서브대역들의 이전 디코딩된 샘플들(113)의 기록을 유지하는 서브대역 버퍼(104)로 전달될 수 있다. 서브대역 예측자(103)의 출력은 추정된 서브대역 신호들(112)이라고 불릴 수 있다. 디코딩된 오디오 신호의 서브대역들의 디코딩된 샘플들(113)은 서브대역 샘플들을 시간 도메인으로 변환하는 합성 필터뱅크(102)에 제출될 수 있고, 그에 의해 디코딩된 오디오 신호의 시간 도메인 샘플들(114)을 산출한다.Considering the received bitstream information, the dequantizer 101 may output samples 111 of the predicted error subband signals. These samples may be added to the output 112 of the subband predictor 103 and the sum 113 may be added to the output of the subband predictor 103 to maintain the recording of the previously decoded samples 113 of the subband of the decoded audio signal. (104). The output of subband predictor 103 may be referred to as estimated subband signals 112. The decoded samples 113 of the subbands of the decoded audio signal may be submitted to a synthesis filter bank 102 that transforms the subband samples into the time domain so that the time domain samples 114 of the decoded audio signal ).

다시 말해서, 디코더(100)는 서브대역 도메인에서 동작할 수 있다. 특히, 디코더(100)는 서브대역 예측자(103)를 사용하여 복수의 추정된 서브대역 신호들(112)을 결정할 수 있다. 또한, 디코더(100)는 역 양자화기(101)를 사용하여 복수의 나머지 서브대역 신호들(111)을 결정할 수 있다. 복수의 추정된 서브대역 신호들(112) 및 복수의 나머지 서브대역 신호들(111)의 각각의 쌍들은 더해져서 대응하는 복수의 디코딩된 서브대역 신호들(113)을 산출할 수 있다. 복수의 디코딩된 서브대역 신호들(113)은 합성 필터뱅크(102)에 제출되어 시간 도메인 디코딩된 오디오 신호(114)를 산출할 수 있다.In other words, the decoder 100 may operate in the subband domain. In particular, the decoder 100 may use the subband predictor 103 to determine a plurality of estimated subband signals 112. In addition, the decoder 100 may use a dequantizer 101 to determine a plurality of remaining subband signals 111. Each of a plurality of estimated subband signals 112 and a plurality of pairs of remaining subband signals 111 may be added to produce a corresponding plurality of decoded subband signals 113. A plurality of decoded subband signals 113 may be submitted to the synthesis filter bank 102 to produce a time domain decoded audio signal 114.

서브대역 예측자(103)의 일 실시예에서, 주어진 추정된 서브대역 신호(112)의 주어진 샘플은 주어진 추정된 서브대역 신호(112)의 주어진 샘플과 상이한 시간 및 상이한 주파수(즉, 상이한 서브대역)에 대응하는 버퍼(104)의 서브대역 샘플들의 선형 조합에 의해 획득될 수 있다. 다시 말해서, 제 1 시간 순간에서 및 제 1 서브대역에서 추정된 서브대역 신호(112)의 샘플은 제 2 시간 순간(제 1 시간 순간과 상이함)에 관련되고 제 2 서브대역(제 1 서브대역과 상이한)과 관련되는 디코딩된 서브대역 신호들(113)의 하나 이상의 샘플들에 기초하여 결정될 수 있다. 예측 계수들 및 시간 및 주파수 마스크에 대한 그들의 부속물의 집합은 예측자(103)를 규정할 수 있고, 이러한 정보는 디코더(100)의 예측자 계산기(105)에 의해 공급될 수 있다. 예측자 계산기(105)는 수신된 비트 스트림에 포함된 신호 모델 데이터의 변환에 의해 예측자(103)를 규정하는 정보를 출력한다. 예측자(103)의 출력의 크기 조정을 변경하는 추가의 이득이 송신될 수 있다. 예측자 계산기(105)의 일 실시예에서, 신호 모델 데이터는 효율적인 파라미터화된 선 스펙트럼의 형태로 제공되고, 파라미터화된 선 스펙트럼의 각각의 선, 또는 파라미터화된 선 스펙트럼의 후속하는 일 그룹의 선들은 예측자 계수들의 통계값들을 지시하기 위해 사용된다. 이와 같이, 수신된 비트 스트림 내에 제공된 신호 모델 데이터는 미리 결정된 참조표내 엔트리들을 식별하기 위해 사용될 수 있고, 참조표로부터의 엔트리들은 예측자(103)에 의해 사용될 예측자 계수들(예측 계수들이라고도 불림)에 대하여 하나 이상의 값들을 제공한다. 참조표에 적용된 방법은 복잡성과 메모리 요구 조건들 사이의 균형들에 의존할 수 있다. 예를 들면, 가장 가까운 이웃 형태 검색은 가장 낮은 복잡성을 달성하기 위해 사용될 수 있고, 반면에 보간 검색 방법은 더 작은 표 크기를 갖는 유사한 성능을 제공할 수 있다.In one embodiment of the subband predictor 103, a given sample of a given estimated subband signal 112 is at a different time and at a different frequency than a given sample of a given estimated subband signal 112 (i.e., ) &Lt; / RTI &gt; of the sub-band samples of the buffer 104 corresponding to the sub-band samples. In other words, at a first time instant and in a first subband, a sample of the estimated subband signal 112 is associated with a second time instant (different from the first instant in time) and a second subband May be determined based on one or more samples of the decoded subband signals 113 associated with the received signal. The prediction coefficients and a collection of their adjuncts to the time and frequency masks may define the predictor 103 and this information may be supplied by the predictor calculator 105 of the decoder 100. [ The predictor calculator 105 outputs information defining the predictor 103 by conversion of the signal model data included in the received bitstream. An additional gain may be transmitted that alters the scaling of the output of the predictor 103. [ In one embodiment of the predictor calculator 105, the signal model data is provided in the form of an efficient parameterized line spectrum, and each line of the parameterized line spectrum, or a subsequent group of parameterized line spectra The lines are used to indicate the statistical values of the predictor coefficients. As such, the signal model data provided in the received bitstream may be used to identify predetermined reference entries, and entries from the look-up table may include predictor coefficients (also referred to as prediction coefficients) to be used by the predictor 103 &Lt; / RTI &gt; The methodology applied in the reference table may depend on the balance between complexity and memory requirements. For example, the nearest neighborhood search may be used to achieve the lowest complexity, while the interpolation search method may provide similar performance with a smaller table size.

상기에 나타낸 바와 같이, 수신된 비트 스트림은 하나 이상의 명시적으로 송신된 이득들 (또는 명시적으로 송신된 이득들의 표시들)을 포함할 수 있다. 이득들은 예측자 동작의 부분으로서 또는 그 후에 적용될 수 있다. 하나 이상의 명시적으로 송신된 이득들은 상이한 서브대역들에 대해 상이할 수 있다. 명시적으로 송신된 추가 이득들(의 표시들)은 예측자(103)의 결정된 예측 계수들에 사용되는 하나 이상의 모델 파라미터들에 추가하여 제공된다. 이와 같이, 추가의 이득들은 예측자(103)의 예측 계수들을 크기 조정하기 위해 사용될 수 있다.As indicated above, the received bitstream may include one or more explicitly transmitted gains (or indications of explicitly transmitted gains). The gains may be applied as part of the predictor operation or thereafter. The one or more explicitly transmitted gains may be different for different subbands. The (explicitly transmitted) additional gains (indicia of) are provided in addition to one or more model parameters used for the predictor coefficients determined by the predictor 103. As such, the additional gains can be used to scale the prediction coefficients of the predictor 103.

도 2는 시간 주파수 그리드에서 예시적인 예측 마스크 지원들을 보여준다. 예측 마스크 지원들은 코사인 변조된 필터뱅크(예를 들면, MDCT 필터뱅크)와 같은 균등한 시간 주파수 해상도를 갖는 필터뱅크에서 동작하는 예측자들(103)에 대해 사용될 수 있다. 표기는 다이어그램(201)으로 도시되고, 즉, 목표된 어둡게 셰이딩된 서브대역 샘플(211)은 옅게 셰이딩된 서브대역 샘플(212)에 기초한 예측의 출력이다. 다이어그램들(202 내지 205)에서, 옅게 셰이딩된 서브대역 샘플들의 집합은 예측자 마스크 지원을 나타낸다. 소스 서브대역 샘플들(212) 및 타깃 서브대역 샘플들(211)의 조합은 예측 마스크(201)라고 불릴 것이다. 시간-주파수 그리드는 타깃 서브대역 샘플 근처에 서브대역 샘플들을 정렬하기 위해 사용될 수 있다. 타임 슬롯 인덱스는 좌로부터 우로 증가하고 있고 서브대역 주파수 인덱스는 아래로부터 위로 증가하고 있다. 도 2는 예측 마스크들 및 예측자 마스크 지원들의 예시적인 경우들을 도시하고 다수의 다른 예측 마스크들 및 예측자 마스크 지원들이 사용될 수 있다는 것이 주의되어야 한다. 예시적인 예측 마스크들은:Figure 2 shows exemplary prediction mask supports in a time frequency grid. Prediction mask supports may be used for predictors 103 operating in a filter bank with an equal time frequency resolution, such as a cosine modulated filter bank (e.g., an MDCT filter bank). The notation is shown in diagram 201, i.e., the target dark shaded subband sample 211 is the output of the prediction based on the lightly shaded subband sample 212. In diagrams 202-205, the set of lightly shaded subband samples represents predictor mask support. The combination of source subband samples 212 and target subband samples 211 will be referred to as prediction mask 201. [ The time-frequency grid can be used to align subband samples near the target subband samples. The time slot index is increasing from left to right and the subband frequency index is increasing from below to above. It should be noted that FIG. 2 illustrates exemplary cases of prediction masks and predictor mask supports and a number of other prediction masks and predictor mask supports may be used. Exemplary prediction masks include:

예측 마스크(202)는 시간 순간들(k-1, k-2)에서 두 개의 이전 디코딩된 서브대역 샘플들(222)로부터 시간 순간(k)에서 추정된 서브대역 샘플(221)의 대역내 예측을 규정한다. The prediction mask 202 is used to estimate the subband samples 221 in the band of estimated subband samples 221 at time instants k from the two previously decoded subband samples 222 at time instants k- Define the forecast.

예측 마스크(203)는 시간 순간(k-1)에서 및 서브대역(n-1, n, n+1)에서 세 개의 이전 디코딩된 서브대역 샘플들(232)에 기초하여 시간 순간(k)에서 및 서브대역(n)에서 추정된 서브대역 샘플(231)의 교차-대역 예측을 규정한다. The prediction mask 203 generates a time instant k based on three previous decoded subband samples 232 at time instant k-1 and in subband n-1, n, n + Band prediction of subband samples 231 estimated at subband n and at subband n.

예측 마스크(204)는 시간 순간(k-1)에서 및 서브대역(n-1, n, n+1)에서 세 개의 이전 디코딩된 서브대역 샘플들(242)에 기초하여 시간 순간(k)에서 및 세 개의 상이한 서브대역들(n-1, n, n+1)에서 세 개의 추정된 서브대역 샘플들(241)의 교차-대역 예측을 규정한다. 교차-대역 예측은 각각의 추정된 서브대역 샘플(241)이 서브대역들(n-1, n, n+1)에서 세 개의 이전의 디코딩된 서브대역 샘플들(242)의 모두에 기초하여 결정될 수 있도록 수행될 수 있다. The prediction mask 204 is used to estimate the time instant k based on the three previous decoded subband samples 242 at time instant k-1 and in subband n-1, n, n + Band prediction of three estimated subband samples 241 in three different subbands (n-1, n, n + 1). The cross-band prediction is determined based on all of the three previous decoded subband samples 242 in subbands (n-1, n, n + 1) Can be performed.

예측 마스크(205)는 시간 순간(k-2, k-3, k-4, k-5)에서 및 서브대역들(n-1, n, n+1)에서 열두 개의 이전 디코딩된 서브대역 샘플들(252)에 기초하여 시간 순간(k)에서 및 서브대역(n)에서 추정된 서브대역 샘플들(251)의 교차-대역 예측을 규정한다. The prediction mask 205 may be applied to the twelve previously decoded subbands at time instants k-2, k-3, k-4, k-5 and in subbands n- Band prediction of subband samples 251 estimated in subband n and at time instant k based on samples 252. [

도 3은 코사인 변조 필터뱅크에서 동작하는 사인파 모델 기반 예측자 계산기(105)에 대한 통계표를 도시한다. 예측 마스크 지원은 다이어그램(204)의 것이다. 주어진 주파수 파라미터에 대하여, 가장 가까운 서브대역 중심 주파수를 갖는 서브대역은 중앙 타깃 서브대역으로서 선택될 수 있다. 주파수 파라미터와 중심 타깃 서브대역의 중심 주파수 사이의 차는 필터뱅크의 주파수 간격의 유닛들(bins)로 계산될 수 있다. 이는 도 3의 9 개의 그래프들(301)의 가로좌표들로 도시된 통계표에서 가장 근접하게 이용가능한 엔트리로 근사될 수 있는 -0.5와 0.5 사이의 값을 제공한다. 이는 타깃 서브대역 및 그의 두 개의 인접한 서브대역들의 서브대역 버퍼(104)에서 복수의 디코딩된 서브대역 신호들(113)의 가장 최근의 값들에 적용될 계수들의 3 × 3 행렬을 생성한다. 결과의 3 × 1 벡터는 주어진 주파수 파라미터에 대해 이들 세 개의 서브대역들에 대한 서브대역 예측자(103)의 기여를 구성한다. 프로세스는 신호 모델에서 모든 사인파 성분들에 대해 부가적인 방식으로 반복될 수 있다.Figure 3 shows a statistical table for a sine wave model based predictor calculator 105 operating in a cosine modulation filter bank. The prediction mask support is in diagram 204. For a given frequency parameter, a subband with the closest subband center frequency may be selected as the central target subband. The difference between the frequency parameter and the center frequency of the central target subband may be calculated as the bins of the frequency spacing of the filter bank. This provides a value between -0.5 and 0.5, which can be approximated by the closest available entry in the statistical table shown in abscissa of the nine graphs 301 of FIG. Which produces a 3x3 matrix of coefficients to be applied to the most recent values of the plurality of decoded subband signals 113 in the subband buffer 104 of the target subband and its two adjacent subbands. The resulting 3x1 vector constitutes the contribution of the subband predictor 103 to these three subbands for a given frequency parameter. The process may be repeated in an additional manner for all sinusoidal components in the signal model.

다시 말해서, 도 3은 서브대역 예측자의 모델 기반 디스크립션의 일 예를 도시한다. 입력 오디오 신호가 기본 주파수들(Ω0, Ω1, ..., ΩM-1)에서 하나 이상의 사인파 성분들을 포함한다고 가정된다. 하나 이상의 사인파 성분들의 각각에 대하여, 미리 결정된 예측 마스크(예를 들면, 예측 마스크(204))를 사용하여 서브대역 예측자가 결정될 수 있다. 입력 오디오 신호의 기본 주파수(Ω)는 필터뱅크의 서브대역들 중 하나 내에 있을 수 있다. 이러한 서브대역은 이러한 특정 기본 주파수(Ω)에 대하여 중앙 서브대역이라고 불릴 수 있다. 기본 주파수(Ω)는 중앙 서브대역의 중심 주파수에 관하여 -0.5 내지 0.5의 범위에 있는 값으로서 표현될 수 있다. 오디오 인코더는 기본 주파수(Ω)에 관한 정보를 디코더(100)에 송신할 수 있다. 디코더(100)의 예측자 계산기(105)는 기본 주파수(Ω)의 각각의 주파수 값(303)에 대한 계수값(302)을 결정함으로써 예측 계수들의 3 × 3 행렬을 결정하기 위해 도 3의 3 × 3 행렬을 사용할 수 있다. 이는 예측 마스크(204)를 사용하는 서브대역 예측자(103)에 대한 계수가 특정 기본 주파수(Ω)에 관해 수신된 정보만을 사용하여 결정될 수 있다는 것을 의미한다. 다시 말해서, 예를 들면, 하나 이상의 사인파 성분들의 모델을 사용하여 입력 오디오 신호를 모델링함으로써, 서브대역 예측자의 비트-레이트 효율적인 디스크립션이 제공될 수 있다.In other words, FIG. 3 shows an example of a model-based description of a subband predictor. It is assumed that the input audio signal contains one or more sinusoidal components at the fundamental frequencies (? 0 ,? 1 , ..., M-1 ). For each of the one or more sinusoidal components, the subband predictor may be determined using a predetermined prediction mask (e.g., prediction mask 204). The fundamental frequency (?) Of the input audio signal may be in one of the subbands of the filter bank. These subbands may be referred to as the central subbands for this particular fundamental frequency ([Omega]). The fundamental frequency (?) Can be expressed as a value in the range of -0.5 to 0.5 with respect to the center frequency of the central sub-band. The audio encoder may send information about the fundamental frequency (?) To the decoder 100. [ The predictor calculator 105 of the decoder 100 determines the coefficient 3 of the prediction matrix by determining the coefficient value 302 for each frequency value 303 of the fundamental frequency X 3 matrix can be used. This means that the coefficients for the subband predictor 103 using the prediction mask 204 can be determined using only information received for a particular fundamental frequency ([Omega]). In other words, a bit-rate efficient description of the subband predictor can be provided, for example, by modeling the input audio signal using a model of one or more sinusoidal components.

도 4는 코사인 변조 필터뱅크에서 대역내 서브대역 예측으로부터 기인한 예시적인 잡음 성형을 도시한다. 대역내 서브대역 예측을 수행하기 위해 사용된 신호 모델은 랜덤 가우시안 화이트 잡음에 의해 도출된 2차 미분식에 의해 기술되는 피크가 많은 공진을 갖는 2차 자동 회귀 확률 프로세스이다. 곡선(401)은 프로세스의 실현을 위해 측정된 크기 스펙트럼을 도시한다. 이러한 예에 대하여, 도 2의 예측 마스크(202)가 적용된다. 즉, 예측자 계산기(105)는 동일한 서브대역에서만 이전 서브대역 샘플들(222)에 기초하여 주어진 타깃 서브대역(221)에 대해 서브대역 예측자(103)를 제공한다. 역 양자화기(101)를 가우시안 화이트 잡음 발생기로 대체하는 것은 합성된 크기 스펙트럼(402)을 초래한다. 이해될 수 있는 바와 같이, 합성 스펙트럼(402)이 원래의 스펙트럼(401)과 일치하지 않는 피크들을 포함하기 때문에, 강한 에일리어스 아티팩트들이 합성시 발생한다.4 illustrates an exemplary noise shaping resulting from in-band subband prediction in a cosine modulation filter bank. The signal model used to perform the in-band subband prediction is a second-order auto-regressive probability process with a peak-rich resonance described by a second order differential derived by random Gaussian white noise. Curve 401 shows the magnitude spectrum measured for the realization of the process. For this example, the prediction mask 202 of FIG. 2 is applied. That is, the predictor calculator 105 provides the subband predictor 103 for a given target subband 221 based on the previous subband samples 222 only in the same subband. Substituting the inverse quantizer 101 with a Gaussian white noise generator results in a synthesized magnitude spectrum 402. As can be appreciated, strong alias artifacts arise during synthesis because the synthesis spectrum 402 contains peaks that do not match the original spectrum 401.

도 5는 교차-대역 서브대역 예측으로부터 기인한 예시적인 잡음 성형을 도시한다. 설정은, 예측 마스크(203)가 적용된다는 사실을 제외하고 도 4의 설정과 동일하다. 따라서, 계산기(105)는 타깃 서브대역에서 및 그의 두 개의 인접한 서브대역들에서 이전 서브대역 샘플들(232)에 기초하여 주어진 타깃 서브대역(231)에 대한 예측자(103)를 제공한다. 도 5로부터 이해될 수 있는 바와 같이, 합성된 신호의 스펙트럼(502)은 원래의 신호의 스펙트럼(501)과 실질적으로 일치한다. 즉, 에일리어스 문제들은 교차-대역 서브대역 예측을 사용할 때 실질적으로 억제된다. 이와 같이, 도 4 및 도 5는 교차-대역 서브대역 예측을 사용할 때, 즉, 하나 이상의 인접한 서브대역들의 이전 서브대역 샘플들에 기초하여 서브대역 샘플을 예측할 때, 서브대역 예측에 의해 야기된 에일리어싱 아티팩트들이 감소될 수 있다는 것을 도시한다. 결과로서, 서브대역 예측은 또한 가청의 에일리어싱 아티팩트들을 야기할 위험 없이 저 비트 레이트 오디오 인코더들의 환경에서 적용될 수 있다. 교차-대역 서브대역 예측의 사용은 일반적으로 예측 계수들의 수를 증가시킨다. 그러나, 도 3의 환경에서 도시된 바와 같이, 입력 오디오 신호에 대한 모델들의 사용(예를 들면, 사인파 모델 또는 주기적 모델의 사용)은 서브대역 예측자의 효율적인 디스크립션을 허용하여, 그에 의해 저 비트 레이트 오디오 코더들에 대한 교차-대역 서브대역 예측의 사용을 가능하게 한다.Figure 5 illustrates an exemplary noise shaping resulting from cross-band subband prediction. The setting is the same as the setting in Fig. 4 except that the prediction mask 203 is applied. Thus, the calculator 105 provides the predictor 103 for a given target subband 231 based on the previous subband samples 232 in the target subband and in its two adjacent subbands. As can be understood from FIG. 5, the spectrum 502 of the synthesized signal substantially coincides with the spectrum 501 of the original signal. That is, aliasing problems are substantially suppressed when using cross-band subband prediction. Thus, FIGS. 4 and 5 illustrate when using cross-band subband prediction, i.e., when predicting subband samples based on previous subband samples of one or more adjacent subbands, aliasing RTI ID = 0.0 &gt; artifacts &lt; / RTI &gt; can be reduced. As a result, subband prediction can also be applied in the context of low bitrate audio encoders without the risk of causing audible aliasing artifacts. The use of cross-band subband prediction generally increases the number of prediction coefficients. However, as shown in the environment of FIG. 3, the use of models for the input audio signal (e.g., use of a sinusoidal model or periodic model) allows efficient description of the subband predictor, Enables the use of cross-band subband prediction for coders.

다음으로, 임계적으로 샘플링된 필터뱅크에서 모델 기반 예측의 원리들의 기술은 도 1 내지 도 6을 참조하여 및 적절한 수학적 용어를 추가함으로써 개요로 서술될 것이다.Next, a description of the principles of model-based prediction in a critically sampled filter bank will be outlined with reference to FIGS. 1-6 and by adding appropriate mathematical terms.

가능한 신호 모델 기반 선형 예측은 그의 통계치들이 그의 자기 상관 함수(

Figure 112015065692244-pct00006
)에 의해 결정되는 제로 평균 약하게 고정된 확률 프로세스(x(t))의 선형 예측이다. 여기서 고려될 임계적으로 샘플링된 필터뱅크들에 대한 양호한 모델로서, 이를 정규 직교 기반을 구성하는 실수값 합성 파형들(wα(t))의 집합인
Figure 112015065692244-pct00007
로 두자. 다시 말해서, 필터뱅크는 파형들(
Figure 112015065692244-pct00008
)에 의해 표현될 수 있다. 시간 도메인 신호(s(t))의 서브대역 샘플들은 내적들,Possible signal model-based linear predictions are based on the assumption that their statistics are based on their autocorrelation function
Figure 112015065692244-pct00006
0.0 &gt; x (t)) &lt; / RTI &gt; As good models for the critical sampling of the filter bank to be considered here, which is a set of real numbers in this composite waveform constituting the orthonormal base (w α (t))
Figure 112015065692244-pct00007
Let's do it. In other words, the filter bank includes waveforms
Figure 112015065692244-pct00008
). &Lt; / RTI &gt; The subband samples of the time domain signal s (t)

Figure 112015065692244-pct00009
Figure 112015065692244-pct00009

에 의해 얻어지고, 신호는,And the signal is obtained by:

Figure 112015065692244-pct00010
Figure 112015065692244-pct00010

에 의해 복구된다.Lt; / RTI &gt;

프로세스(x(t))의 서브대역 샘플들

Figure 112015065692244-pct00011
은 확률 변수들이고, 그의 공분산 행렬(Rαβ)은 다음과 같이 자동상관 함수(r(τ))에 의해 결정되고The subband samples of process x (t)
Figure 112015065692244-pct00011
Is a random variable, and its covariance matrix R ?? Is determined by the autocorrelation function r (?) As follows

Figure 112015065692244-pct00012
Figure 112015065692244-pct00012

여기서 Wαβ(τ)는 두 개의 합성 파형들의 교차 상관이다.Where W αβ (τ) is the cross-correlation of the two composite waveforms.

Figure 112015065692244-pct00013
Figure 112015065692244-pct00013

집합으로부터 서브대역 샘플

Figure 112015065692244-pct00014
또는 디코딩된 서브대역 샘플들
Figure 112015065692244-pct00015
의 선형 예측은 다음으로 규정될 수 있다:Subband samples from the set
Figure 112015065692244-pct00014
Or decoded subband samples
Figure 112015065692244-pct00015
Can be defined as: &lt; RTI ID = 0.0 &gt;

Figure 112015065692244-pct00016
Figure 112015065692244-pct00016

식(5)에서, 세트 B는 소스 서브대역 샘플들을 규정하고, 즉, 세트 B는 예측 마스크 지원을 규정한다. 제곱된 예측 에러의 평균값은:In equation (5), set B specifies the source subband samples, i.e., set B specifies the prediction mask support. The mean value of the squared prediction error is:

Figure 112015065692244-pct00017
Figure 112015065692244-pct00017

에 의해 주어지고 최소 평균 제곱 에러(MSE) 해는 예측 계수들(cβ)에 대한 표준 방정식들을 풀이함으로써 얻어진다:And the minimum mean square error (MSE) solution is obtained by solving the standard equations for the prediction coefficients c &lt; RTI ID = 0.0 &gt;

Figure 112015065692244-pct00018
Figure 112015065692244-pct00018

예측 계수들이 식(7)을 만족할 때, 식(6)의 우측항은

Figure 112015065692244-pct00019
로 감소된다. 표준 방정식들(7)은, 예를 들면, 레빈슨-더빈 알고리즘을 사용하여 효율적인 방식으로 풀 수 있다.When the prediction coefficients satisfy equation (7), the right term of equation (6)
Figure 112015065692244-pct00019
. Standard equations (7) can be solved in an efficient manner, for example using the Levinson-Durbin algorithm.

예측 계수들(

Figure 112015065692244-pct00020
)이 예측자 계산기(105)에서 도출될 수 있는 신호 모델의 파라미터 표현을 송신하는 것이 본 명세서에서 제안된다. 예를 들면, 신호 모델은 신호 모델의 자기 상관 함수(r(τ))의 파라미터 표현을 제공할 수 있다. 디코더(100)는 수신된 파라미터 표현을 사용하여 자기 상관 함수(r(τ))를 도출할 수 있고, 표준 방정식들(7)에 요구된 공분산 행렬 엔트리들을 도출하기 위해 자기 상관 함수(r(τ))를 합성 파형 교차 상관(Wαβ(τ))과 조합할 수 있다. 이들 식들은 이후 예측 계수들을 얻기 위해 풀이될 수 있다.Prediction coefficients (
Figure 112015065692244-pct00020
) To transmit a parameter representation of the signal model that can be derived from this predictor calculator 105 is proposed herein. For example, the signal model may provide a parameter representation of the autocorrelation function of the signal model (r (tau)). The decoder 100 may derive an autocorrelation function r () using the received parameter representation and may derive an autocorrelation function r (tau) to derive the required covariance matrix entries in the standard equations 7, )) may be combined with the composite waveform cross-correlation (W αβ (τ)). These equations can then be solved to obtain the prediction coefficients.

다시 말해서, 인코딩될 입력 오디오 신호는 제한된 수의 모델 파라미터들을 사용하여 기술될 수 있는 프로세스(x(t))에 의해 모델링될 수 있다. 특히, 모델링 프로세스(x(t))는 그의 자기 상관 함수(

Figure 112015065692244-pct00021
)가 제한된 수의 파라미터들을 사용하여 기술될 수 있는 것일 수 있다. 자기 상관 함수(r(τ))를 기술하는 제한된 수의 파라미터들이 디코더(100)에 송신될 수 있다. 디코더(100)의 예측자 계산기(105)는 수신된 파라미터들로부터 자기 상관 함수(r(τ))를 결정할 수 있고 표준 방정식(7)이 결정될 수 있는 서브대역 신호들의 공분산 행렬(Rαβ)을 결정하기 위해 식(3)을 사용할 수 있다. 표준 방정식(7)은 이후 예측자 계산기(105)에 의해 풀이될 수 있고, 그에 의해 예측 계수들(cβ)을 산출한다.In other words, the input audio signal to be encoded can be modeled by a process (x (t)) which may be described using a limited number of model parameters. In particular, the modeling process x (t)
Figure 112015065692244-pct00021
) May be described using a limited number of parameters. A limited number of parameters describing the autocorrelation function r ([tau]) may be transmitted to the decoder 100. [ The predictor calculator 105 of the decoder 100 can determine the autocorrelation function r (tau) from the received parameters and determine the covariance matrix R alpha beta of the subband signals for which the standard equation 7 can be determined Equation (3) can be used to determine. The standard equation (7) can then be solved by the predictor calculator 105, thereby calculating the prediction coefficients c ?.

다음으로, 효율적인 방식으로 상기 기술된 모델 기반 예측 방식을 적용하기 위해 사용될 수 있는 예시적인 신호 모델들이 기술된다. 다음에 기술된 신호 모델들은 일반적으로, 코딩 오디오 신호들에 대해, 예를 들면, 코딩 속도 신호들에 대해 크게 관련된다.Next, exemplary signal models that may be used to apply the model-based prediction scheme described above in an efficient manner are described. The signal models described below are generally largely related to, for example, coding rate signals for coded audio signals.

신호 모델의 일 예는 사인파 프로세스에 의해One example of a signal model is a sinusoidal process

Figure 112015065692244-pct00022
Figure 112015065692244-pct00022

로서 주어지고, 확률 변수들(a, b)은 상관되지 않고, 제로 평균, 및 분산 1을 갖는다. 이러한 사인파 프로세스의 자기 상관 함수는 다음으로 주어진다:, And the random variables (a, b) are not correlated, and have a zero mean, and variance 1. The autocorrelation function of this sinusoidal process is given by:

Figure 112015065692244-pct00023
Figure 112015065692244-pct00023

이러한 사인파 프로세스의 일반화는 일 세트의 (각) 주파수들(S)을 포함하는, 즉, 복수의 상이한 (각) 주파수들(

Figure 112015065692244-pct00024
)을 포함하는 다중 사인 모델이다:The generalization of this sinusoidal process involves the use of a set of (angular) frequencies S, i.e. a plurality of different (angular) frequencies
Figure 112015065692244-pct00024
): &Lt; RTI ID = 0.0 &gt;

Figure 112015065692244-pct00025
Figure 112015065692244-pct00025

모든 확률 변수들(

Figure 112015065692244-pct00026
,
Figure 112015065692244-pct00027
)이 쌍으로 상관되지 않는다면, 제로 평균 및 분산 1을 갖고, 다중 사인 프로세스는 자기 상관 함수를 갖는다:All random variables (
Figure 112015065692244-pct00026
,
Figure 112015065692244-pct00027
) Are not correlated with each other, the zero mean and variance 1, and the multiple sign process has autocorrelation function:

Figure 112015065692244-pct00028
Figure 112015065692244-pct00028

(자기 상관 함수의 푸리에 변환에 대응하는) 다중 사인 프로세스의 전력 스펙트럼 밀도(PSD)는 선 스펙트럼이다:The power spectral density (PSD) of the multinomial process (corresponding to the Fourier transform of the autocorrelation function) is the line spectrum:

Figure 112015065692244-pct00029
Figure 112015065692244-pct00029

수치상 고찰들은 수식 프로세스의 자기 상관 함수를 갖는 순수한 다중 사인 프로세스를 자기 상관 함수(

Figure 112015065692244-pct00030
)를 갖는 완화된 다중 사인 프로세스로의 교체를 초래할 수 있고,
Figure 112015065692244-pct00031
는 비교적 작은 완화 파라미터이다. 후자의 모델은 임펄스 함수들이 없는 완전히 양의 PSD를 초래한다.Numerical observations show that a pure multinomial process with an autocorrelation function of a mathematical process is called an autocorrelation function
Figure 112015065692244-pct00030
&Lt; RTI ID = 0.0 &gt; and / or &lt; / RTI &
Figure 112015065692244-pct00031
Is a relatively small relaxation parameter. The latter model results in a completely positive PSD without impulse functions.

다중 사인 모델의 주파수들의 세트(S)의 간단한 디스크립션들의 예들은 다음과 같다:Examples of simple descriptions of the set of frequencies (S) of the multi-sine model are:

1. 하나의 기본 주파수 Ω:

Figure 112015065692244-pct00032
1. One fundamental frequency Ω:
Figure 112015065692244-pct00032

2. M 개의 기본 주파수들: Ω0, Ω1, ..., ΩM-1 :

Figure 112015065692244-pct00033
2. M fundamental frequencies: Ω 0 , Ω 1 , ..., Ω M-1 :
Figure 112015065692244-pct00033

3. 하나의 측대역 시프트된 기본 주파수 Ω, θ:

Figure 112015065692244-pct00034
3. One sideband shifted fundamental frequency Ω, θ:
Figure 112015065692244-pct00034

4. 약한 비조화 모델 : Ω,a :

Figure 112015065692244-pct00035
, a는 모델의 비조화 성분을 기술한다.4. Weak harmonic model: Ω, a:
Figure 112015065692244-pct00035
, a describes the non-harmonics of the model.

이와 같이, 식(12)에 의해 주어진 PSD를 나타내는 (가능하게 완화된) 다중 사인 모델은 상기에 나열된 예시적인 기술들 중 하나를 사용하여 효율적인 방식으로 기술될 수 있다. 예로서, 식(12)의 선 스펙트럼의 주파수들의 완전한 세트(S)가 단지 하나의 기본 주파수(Ω)를 사용하여 기술될 수 있다. 인코딩될 입력 오디오 신호가 하나의 기본 주파수(Ω)를 나타내는 다중 사인 모델을 사용하여 잘 기술될 수 있는 경우, 서브대역 예측자(103)에 의해 사용된 예측 계수들의 수에 관계없이(즉, 예측 마스크(202, 203, 204, 205)에 관계없이) 모델 기반 예측자는 하나의 파라미터에 의해(즉, 기본 주파수(Ω)에 의해) 기술된다.As such, a (possibly relaxed) multisignal model representing the PSD given by equation (12) can be described in an efficient manner using one of the exemplary techniques listed above. By way of example, a complete set S of frequencies in the line spectrum of equation (12) can be described using only one fundamental frequency, [Omega]. Regardless of the number of prediction coefficients used by the subband predictor 103 (that is, the prediction), the input audio signal to be encoded can be well described using a multi-sine model that represents one fundamental frequency The model-based predictor is described by one parameter (i.e., by the fundamental frequency, [Omega]), independent of the masks 202, 203, 204,

주파수들의 세트(S)를 기술하기 위한 경우 1은 주기(T = 2π/Ω)를 갖는 입력 오디오 신호들을 모델링하는 프로세스(x(t))를 산출한다. 식(11)에 대해 분산 1/2을 갖는 제로 주파수(DC) 기여의 포함 및 팩터(2/T)에 의한 결과의 재 크기 조정을 겪을시, 주기적 모델 프로세스(x(t))의 자기 상관 함수는 다음과 같이 기재될 수 있다:1 for describing a set of frequencies S yields a process x (t) for modeling input audio signals having a period (T = 2 pi / [Omega]). When experiencing the inclusion of a zero frequency (DC) contribution with a variance of 1/2 for Eq. (11) and the resizing of the result by a factor (2 / T), the autocorrelation of the periodic model process (x The function can be written as:

Figure 112015065692244-pct00036
Figure 112015065692244-pct00036

완화 팩터(

Figure 112015065692244-pct00037
)의 정의에 의해, 주기적 모델의 완화 버전의 자기 상관 함수는 다음과 같이 주어진다:Mitigation Factor (
Figure 112015065692244-pct00037
), The autocorrelation function of the relaxed version of the periodic model is given by:

Figure 112015065692244-pct00038
Figure 112015065692244-pct00038

식(14)은 또한 화이트 잡음(z(t))이 공급되는 하나의 지연 루프로 규정된 프로세스의, 즉, 모델 프로세스의 자기 상관 함수Equation (14) can also be applied to the process defined by one delay loop to which the white noise z (t) is supplied, i.e., the autocorrelation function of the model process

Figure 112015065692244-pct00039
Figure 112015065692244-pct00039

에 대응한다..

이는 하나의 기본 주파수(Ω)를 나타내는 주기적 프로세스가 시간 도메인에서 지연에 대응한다는 것을 의미하고, 지연은 T = 2π/Ω이다.This means that a periodic process representing one fundamental frequency (?) Corresponds to a delay in the time domain, and the delay is T = 2? /?.

상기 언급된 전반적인 신호 모델들은 사인파 진폭 파라미터들(

Figure 112015065692244-pct00040
,
Figure 112015065692244-pct00041
)의 단위 분산 가정에 의해 일반적으로 평탄한 대규모 전력 스펙트럼을 갖는다. 그러나, 신호 모델들은 일반적으로 임계적으로 샘플링된 필터뱅크의 서브대역들의 서브세트에 대해 로컬로만 고려된다는 것이 주의되어야 하고, 필터뱅크는 전체 스펙트럼의 성형시 중요하다. 다시 말해서, 서브대역 폭들과 비교하여 느린 변동을 갖는 스펙트럼 형상을 갖는 신호에 대하여, 평탄한 전력 스펙트럼 모델들은 신호에 양호한 매칭을 제공할 것이고, 이후, 모델 기반 예측자들은 예측 이득의 적절한 레벨들을 제공할 것이다.The above-mentioned general signal models include sinusoidal amplitude parameters (
Figure 112015065692244-pct00040
,
Figure 112015065692244-pct00041
Lt; / RTI &gt; has a generally flat, large-scale power spectrum. It should be noted, however, that the signal models are generally only considered locally for a subset of the subbands of the filter bank that are critically sampled, and the filter bank is important in shaping the entire spectrum. In other words, for a signal having a spectral shape with slow variations compared to subband widths, the flat power spectral models will provide a good match to the signal, and then the model-based predictors will provide appropriate levels of prediction gain will be.

더 일반적으로, PSD 모델은 자동 회귀(AR) 또는 자동 회기 이동 평균(ARMA) 프로세스들의 표준 파라미터화들에 의해 기술될 수 있다. 이는 기술적 모델 파라미터들에서 증가의 가능한 비용에서 모델 기반 예측의 성능을 증가시킨다.More generally, the PSD model can be described by standard parameterizations of automatic regression (AR) or automatic session moving average (ARMA) processes. This increases the performance of the model-based prediction at a possible cost of increase in the technical model parameters.

다른 변동은 확률적인 신호 모델에 대한 정상성 가정을 폐기함으로써 얻어진다. 자기 상관 함수는 이후 두 개의 변수들의 함수(

Figure 112015065692244-pct00042
)로 된다. 예를 들면, 관련된 비정상 사인파 모델들은 진폭(AM) 및 주파수 변조(FM)를 포함할 수 있다.Other variations are obtained by discarding the normality hypothesis for a stochastic signal model. The autocorrelation function is then used to determine the function of the two variables
Figure 112015065692244-pct00042
). For example, the associated abnormal sinusoidal models may include amplitude (AM) and frequency modulation (FM).

또한, 더 결정론적인 신호 모델이 채용될 수 있다. 이하의 예들 중 일부에서 이해되는 바와 같이, 예측은 몇몇 경우들에서 소멸 에러를 가질 수 있다. 이러한 경우들에서, 확률적 방식은 회피될 수 있다. 예측이 모델 공간에서 모든 신호들에 대해 완전할 때, 고려된 모델 공간에 대한 확률 측정에 의해 평균값의 예측 수행을 수행할 필요가 없다.In addition, a more deterministic signal model may be employed. As will be appreciated in some of the examples below, prediction may have an extinction error in some cases. In these cases, the probabilistic approach can be avoided. When the prediction is complete for all signals in the model space, it is not necessary to perform the prediction of the mean value by the probability measurement on the considered model space.

다음으로, 변조된 필터뱅크들에 관한 다수의 양태들이 기술된다. 특히, 공분산 행렬의 결정에 영향을 끼치고, 그에 의해 서브대역 예측자의 예측 계수들을 결정하기 위한 효율적인 방식을 제공하는 양태들이 기술된다. 변조된 필터뱅크는 합성 파형들의; 2차원 인덱스 세트(α =(n, k))를 갖는 것으로 기술될 수 있고, n = 0, 1, ...는 서브대역 인덱스(주파수 대역)이고 k ∈ z는 서브대역 샘플 인덱스(타임 슬롯)이다. 설명의 편의를 위해, 합성 파형들은 연속적인 시간에서 주어지고 단위 시간 폭Next, a number of aspects relating to modulated filter banks are described. In particular, aspects are described that affect the determination of the covariance matrix, thereby providing an efficient way to determine the prediction coefficients of the subband predictor. The modulated filter bank may be any combination of synthetic waveforms; (N, k), where n = 0, 1, ... is a subband index (frequency band) and k ∈ z is a subband sample index )to be. For ease of explanation, the composite waveforms are given in consecutive times and the unit time width

Figure 112015065692244-pct00043
Figure 112015065692244-pct00043

으로 정규화되고, 여기서 코사인 변조 필터뱅크의 경우에 다음과 같다:, Where in the case of the cosine modulation filter bank: &lt; RTI ID = 0.0 &gt;

Figure 112015065692244-pct00044
Figure 112015065692244-pct00044

윈도우 함수(ν(t))는 실수값이고 짝수라는 것이 가정된다. 변조 규칙의 작은 변동들까지, 이는 시간 단차(1/L)에서 샘플링시 L 개의 서브대역들을 갖고 MDCT(변조된 이산 코사인 변환), QMF(직각 위상 미러 필터), 및 ELT(확장된 랩핑 변환들)와 같은 크게 관련있는 경우들의 범위를 포함한다. 윈도우는 간격[-K/2, K/2]에 포함된 지원을 갖는 길이 및 유한한 지속 기간인 것이 가정되고, K는 중첩된 변환의 중첩 팩터이고 K는 윈도우 함수의 길이를 나타낸다.It is assumed that the window function (v (t)) is a real number and is an even number. Up to small fluctuations of the modulation rule, it has L subbands at sampling at time step (1 / L), modulated discrete cosine transform (MDCT), quadrature phase mirror filter (QMF) ). &Lt; / RTI &gt; It is assumed that the window is of length and finite duration with the support contained in the interval [-K / 2, K / 2], K is the overlap factor of the nested transform and K is the length of the window function.

시프트 불변 구조에 의해, 합성 파형의 교차 상관 함수(식(4)에 정의된 바와 같은)는 다음과 같이 기록될 수 있다는 것을 찾았다:By the shift invariant structure, we found that the cross-correlation function of the composite waveform (as defined in equation (4)) can be written as:

Figure 112015065692244-pct00045
Figure 112015065692244-pct00045

즉,

Figure 112015065692244-pct00046
이고, 정의
Figure 112015065692244-pct00047
를 갖는다. 변조 구조(17)는,In other words,
Figure 112015065692244-pct00046
And definition
Figure 112015065692244-pct00047
. The modulation structure (17)

Figure 112015065692244-pct00048
Figure 112015065692244-pct00048

로 다른 확장에 대해 허용한다. 커널 함수(

Figure 112015065692244-pct00049
)는 필터뱅크 윈도우의 와그너-빌 분포의 주파수 변수에서 필터뱅크 서브대역 단차를 갖는 샘플링을 나타낸다:For other extensions. Kernel function (
Figure 112015065692244-pct00049
) Represents the sampling with the filter bank subband step in the frequency variable of the Waveness-Bill distribution of the filter bank window:

Figure 112015065692244-pct00050
Figure 112015065692244-pct00050

커널은, 윈도우 함수(ν(t))에 대한 상기 언급된 가정들에 의해, ν 및 τ 모두에서 실수이고 짝수이다. 그의 푸리에 변환은 시프트된 윈도우 응답들의 곱,The kernel is real and even in both v and tau, by the above-mentioned assumptions for the window function (v (t)). Its Fourier transform is the product of the shifted window responses,

Figure 112015065692244-pct00051
Figure 112015065692244-pct00051

이다. 이는 커널(

Figure 112015065692244-pct00052
)은 |τ| > K에 대해 0이 되고 필터뱅크 윈도우들(ν(t))의 일반적인 선택들에 대해 |ν|의 함수로서 빠른 감쇠를 갖는 식들(20, 21)로부터 이해될 수 있다. 결과로서, ν = n + m + 1을 포함하는 식(19)의 제 2 항은 가장 낮은 서브대역들을 제외하고 종종 무시될 수 있다.to be. This is the kernel (
Figure 112015065692244-pct00052
) Is | τ | Can be understood from equations (20, 21) with zero attenuation as a function of | v | for the general choices of filter bank windows (v (t)). As a result, the second term of equation (19), including v = n + m + 1, can often be ignored except for the lowest subbands.

주어진 신호 모델의 자기 상관 함수(r(τ))에 대하여, 상기 언급된 수식들은 식(3)에 의해 주어진 서브대역 샘플 공분산 행렬의 정의로 삽입될 수 있다. 정의,For the autocorrelation function r (?) Of a given signal model, the above-mentioned equations can be inserted into the definition of the subband sample covariance matrix given by equation (3). Justice,

Figure 112015065692244-pct00053
Figure 112015065692244-pct00053

에 의해

Figure 112015065692244-pct00054
를 얻는다.By
Figure 112015065692244-pct00054
.

(자기 상관 함수(r(τ))의 푸리에 변환에 대응하는) 주어진 신호 모델의 전력 스펙트럼 밀도(P(ω))의 함수로서, 다음을 찾았다:As a function of the power spectral density (P (?)) Of a given signal model (corresponding to the Fourier transform of the autocorrelation function r (?)), The following was found:

Figure 112015065692244-pct00055
Figure 112015065692244-pct00055

Figure 112015065692244-pct00056
Figure 112015065692244-pct00057
의 푸리에 변환이고, n, m은 서브대역 인덱스들을 식별하고, λ는 타임 슬롯 래그(λ = k - l)를 나타낸다. 식(23)의 수식은 다음과 같이 다시 쓸 수 있다:
Figure 112015065692244-pct00056
The
Figure 112015065692244-pct00057
N, m identifies subband indices, and lambda represents a timeslot lag (lambda = k - l). The formula in Eq. (23) can be rewritten as:

Figure 112015065692244-pct00058
Figure 112015065692244-pct00058

중요한 관찰은 식(24)의 제 1 항이 주파수 시프트들에 관하여 반드시 불변 속성을 갖는다는 것이다. 식(24)의 제 2 항이 정수(ν)와 서브대역 간격(π)의 곱에 의해 P(ω-πν)로 시프트되는 경우, 분산(

Figure 112015065692244-pct00059
)에서 대응하는 시프트를 찾고, 부호는 시간 래그(λ)의 (정수) 값들에 의존한다. 이는, 일반적인 필터 뱅크 경우와 비교하여, 변조 구조를 갖는 필터뱅크를 사용하는 이점을 반영한다.An important observation is that the first term in equation (24) necessarily has an invariant property with respect to frequency shifts. When the second term of equation (24) is shifted to P (? -? V) by the product of integer (?) And subband spacing (?),
Figure 112015065692244-pct00059
) And the sign depends on the (integer) values of the time lag lambda. This reflects the advantage of using a filter bank with a modulation structure, as compared to the case of a general filter bank.

식(24)은, 기본적인 신호 모델의 PSD를 알 때, 서브대역 샘플 공분산 행렬의 행렬 계수들을 결정하기 위한 효율적인 수단을 제공한다. 예로서, (각도) 주파수(

Figure 112015065692244-pct00060
)에서 하나의 사인파를 포함하는 신호 모델(x(t))을 사용하는 사인파 모델 기반 예측 방식의 경우, PSD는
Figure 112015065692244-pct00061
에 의해 주어진다. P(ω)를 수식(24)에 삽입하는 것은 네 개의 항들을 제공하고, 그 중 세 개는 n + m + 1이 크다는 가정 하에서 세 개가 무시될 수 있다. 나머지 항은,Equation (24) provides an efficient means for determining the matrix coefficients of the subband sample covariance matrix when knowing the PSD of the underlying signal model. By way of example, the (angular) frequency (
Figure 112015065692244-pct00060
In the case of a sinusoidal model-based prediction scheme that uses a signal model x (t) that includes one sinusoidal wave in the PSD,
Figure 112015065692244-pct00061
Lt; / RTI &gt; Inserting P (?) Into equation (24) provides four terms, three of which can be ignored under the assumption that n + m + 1 is large. The remaining terms,

Figure 112015065692244-pct00062
Figure 112015065692244-pct00062

식(25)은 서브대역 공분산 행렬(Rn ,m)을 결정하기 위한 효율적인 수단을 제공한다. 서브대역 샘플(

Figure 112015065692244-pct00063
)은 고려된 주파수에 의해 상당히 영향을 받는 것으로 가정되는 주위의 서브대역 샘플들의 집합
Figure 112015065692244-pct00064
에 의해 신뢰할 수 있게 예측될 수 있다. 절대 주파수(
Figure 112015065692244-pct00065
)는 서브대역의 중심 주파수(
Figure 112015065692244-pct00066
)에 관련된 관련 항들에서
Figure 112015065692244-pct00067
로서 표현될 수 있고, p는 주파수(
Figure 112015065692244-pct00068
)를 포함하는 서브대역의 서브대역 인덱스이고, f는 -0.5와 +0.5 사이의 값들을 취하고 서브대역(p)의 중심 주파수에 관한 주파수(
Figure 112015065692244-pct00069
)의 위치를 나타내는 정규화된 주파수 파라미터이다. 서브대역 공분산 행렬(Rn ,m)을 결정하면, 샘플 인덱스(k)에서 서브대역(n) 내 서브대역 샘플을 추정하기 위해 샘플 인덱스(l)에서 서브대역(m) 내 서브대역 샘플에 적용되는 예측자 계수들(cm[l])이 표준 방정식들(7)을 풀이함으로써 발견되고, 상기 경우에 대해 바로 다음과 같이 기재될 수 있다:Equation (25) provides an efficient means for determining the subband covariance matrix R n , m . Subband samples (
Figure 112015065692244-pct00063
) Is the set of surrounding subband samples that are assumed to be significantly affected by the considered frequency
Figure 112015065692244-pct00064
Lt; / RTI &gt; Absolute frequency (
Figure 112015065692244-pct00065
) Is the center frequency of the subband (
Figure 112015065692244-pct00066
),
Figure 112015065692244-pct00067
And p is the frequency (
Figure 112015065692244-pct00068
), F is a subband index of the subband including the center frequency of the subband p, taking values between -0.5 and +0.5
Figure 112015065692244-pct00069
) &Lt; / RTI &gt; Determining the subband covariance matrix R n , m applies to subband samples in subband m in sample index 1 to estimate subband samples in subband n at sample index k (C m [l]) are found by solving the standard equations (7), and can be described as follows:

Figure 112015065692244-pct00070
Figure 112015065692244-pct00070

식(26)에서, 세트 B는 예를 들면, 도 2에 도시되는 예측 마스크 지원을 기술한다. 다시 말해서, 세트 B는 타깃 샘플을 예측하기 위해 사용되는 서브대역들(m) 및 샘플 인덱스들(l)을 식별한다.In equation (26), set B describes, for example, the prediction mask support shown in FIG. In other words, set B identifies subbands m and sample indices 1 that are used to predict the target sample.

다음으로, 상이한 예측 마스크 지원들(도 2에 도시된 바와 같은)에 대한 표준 방정식들(26)의 해들이 예시적인 방식으로 제공된다. 인과적인 2차 대역내 예측자의 예는 예측 마스크 지원 B = {(p,-1), (p,-2)}를 선택함으로써 얻어진다. 이러한 예측 마스크 지원은 도 2의 예측 마스크(202)에 대응한다. 식(25)의 근사를 사용하여 이러한 두 개의 탭 예측에 대한 표준 방정식들(26)은 다음과 같이 된다:Next, solutions of standard equations (26) for different prediction mask supports (as shown in FIG. 2) are provided in an exemplary manner. An example of a causal second-order in-band predictor is obtained by selecting a prediction mask support B = {(p, -1), (p, -2)}. This prediction mask support corresponds to the prediction mask 202 of FIG. Using the approximation of equation (25), the standard equations (26) for these two tap predictions are:

Figure 112015065692244-pct00071
Figure 112015065692244-pct00071

식(27)에 대한 해는

Figure 112015065692244-pct00072
, cp[-2] = -1로 주어지고, 이는 주파수(
Figure 112015065692244-pct00073
)가
Figure 112015065692244-pct00074
이도록 선택되지 않는 한 유일하다. 식(6)에 따른 제곱된 예측 에러의 평균값이 0인 것을 찾았다. 따라서, 사인파 예측은 식(25)의 근사까지 완료한다. 주파수 시프트들에 대한 불변 속성은, 정의(
Figure 112015065692244-pct00075
)를 사용하여, 예측 계수(cp[-1])가 정규화된 주파수(f)에 의해
Figure 112015065692244-pct00076
로서 다시 쓸 수 있다는 사실에 의해 여기에 예시된다. 이는, 예측 계수들이 특정 서브대역내 정규화된 주파수(f)에만 의존한다는 것을 의미한다. 그러나, 예측 계수들의 절대값들은 서브대역 인덱스(p)에 독립적이다.The solution to equation (27) is
Figure 112015065692244-pct00072
, c p [-2] = -1, which is the frequency
Figure 112015065692244-pct00073
)end
Figure 112015065692244-pct00074
Unless selected to be. We found that the mean value of the squared prediction error according to Eq. (6) is zero. Thus, the sine wave prediction is completed up to the approximation of equation (25). The invariant properties for frequency shifts are defined by (
Figure 112015065692244-pct00075
), The prediction coefficient c p [-1] is multiplied by the normalized frequency f
Figure 112015065692244-pct00076
As shown in FIG. This means that the prediction coefficients depend only on the normalized frequency f in a particular subband. However, the absolute values of the prediction coefficients are independent of the subband index p.

도 4에 대해 상기에 논의된 바와 같이, 대역내 예측은 잡음 성형에서 에일리어스 아티팩트들에 관한 특정 단점들을 갖는다. 다음의 예는 도 5에 도시되는 개선된 거동에 관한 것이다. 본 명세서에서 교시되는 인과적인 교차-대역 예측은 예측 마스크 지원 B = {(p-1, -1), (p, -1), (p+1, -1)}을 선택함으로써 얻어지고, 이는 두 개 대신에 단지 하나의 더 이른 타임 슬롯을 요구하고, 및 이는 제 1 예의 고전적인 예측 마스크(202)보다 더 적은 에일리어스 주파수 기여들을 갖는 잡음 성형을 수행한다. 예측 마스크 지원 B = {(p-1, -1), (p, -1), (p+1, -1)}은 도 2의 예측 마스크(203)에 대응한다. 식(25)의 근사에 기초한 표준 방정식들(26)은 이러한 경우에 세 개의 알려지지 않은 계수들(cm[-1], m = p-1, p, p+1)에 대한 두 개의 식들로 감소된다:As discussed above with respect to FIG. 4, in-band prediction has certain disadvantages with aliasing artifacts in noise shaping. The following example relates to the improved behavior shown in Fig. The causal cross-band prediction taught herein is obtained by selecting a prediction mask support B = {(p-1, -1), (p, -1), (p + 1, -1) Requires only one earlier time slot instead of two, and this performs noise shaping with fewer alleys frequency contributions than the classical prediction mask 202 of the first example. The prediction mask support B = {(p-1, -1), (p, -1), (p + 1, -1)} corresponds to the prediction mask 203 of FIG. The standard equations 26 based on the approximation of Eq. (25) are based on two equations for three unknown coefficients (c m [-1], m = p-1, p, p + 1) Is reduced:

Figure 112015065692244-pct00077
Figure 112015065692244-pct00077

식(28)에 대한 임의의 해가 식(6)에 따라 제곱된 예측 에러의 0인 평균값을 초래한다는 것을 찾았다. 식(28)에 대한 무한 수의 해들 중 하나의 해를 선택하기 위한 가능한 전략은 예측 계수들의 제곱들의 합을 최소화하는 것이다. 이는,It has been found that any solution to equation (28) results in an average value of zero of the squared prediction error according to equation (6). A possible strategy for choosing one solution of the infinite number of solutions for equation (28) is to minimize the sum of the squares of the prediction coefficients. this is,

Figure 112015065692244-pct00078
Figure 112015065692244-pct00078

에 의해 주어진 계수들을 초래한다. 예측 계수들이 단지 타깃 서브대역(p)의 중간 지점에 관하여 정규화된 주파수(f)에만 의존하고, 타깃 서브대역(p)의 패리티에 또한 의존한다는 것이 수식(29)으로부터 명백하다.&Lt; / RTI &gt; It is clear from equation (29) that the prediction coefficients only depend on the normalized frequency f with respect to the midpoint of the target subband p and also on the parity of the target subband p.

도 2의 예측 마스크(204)로 도시되는, m = p-1, p, p+1에 대해 세 개의 서브대역 샘플들(

Figure 112015065692244-pct00079
)을 예측하기 위해 동일한 예측 마스크 지원(B = {(p-1, -1), (p, -1), (p+1, -1)})을 사용함으로써, 3 × 3 예측 행렬이 얻어진다. 표준 방정식들에서 모호성을 피하기 위해 더 자연스러운 전략의 도입시, 즉,
Figure 112015065692244-pct00080
에 대응하는 완화된 사인파 모델(
Figure 112015065692244-pct00081
)을 삽입함으로써, 수치 계산들은 도 3의 3 × 3 예측 행렬 요소들을 초래한다. 예측 행렬 요소들은 사인파 윈도우 함수(ν(t) = cos(πt/2))를 갖는 중첩(K=2)의 경우에 및 홀수 서브대역(p)의 경우에 정규화된 주파수의 함수(
Figure 112015065692244-pct00082
)로서 보여진다.Three subband samples for m = p-1, p, p + 1 (shown as prediction mask 204 in FIG. 2
Figure 112015065692244-pct00079
(P = 1, -1), (p, -1), (p + 1, -1)} is used to predict a prediction matrix Loses. In introducing more natural strategies to avoid ambiguity in standard equations,
Figure 112015065692244-pct00080
A relaxed sine wave model corresponding to
Figure 112015065692244-pct00081
), The numerical calculations result in the 3 × 3 prediction matrix elements of FIG. The prediction matrix elements are a function of the normalized frequency in the case of the superposition (K = 2) with the sinewave window function (v (t) = cos (t / 2)
Figure 112015065692244-pct00082
).

이와 같이, 신호 모델(x(t))이 인코딩될 입력 오디오 신호의 기본적인 특징들을 기술하기 위해 사용되는 것이 보여졌다. 자기 상관 함수(r(τ))를 기술하는 파라미터들은 디코더(100)로 송신될 수 있고, 그에 의해 디코더(100)가 송신된 파라미터들로부터 및 신호 모델(x(t))의 지식으로부터 예측자를 계산하게 한다. 변조된 필터뱅크들에 대하여, 신호 모델의 서브대역 공분산 행렬을 결정하기 위해 및 예측자 계수들을 결정하기 위해 표준 방정식들을 풀이하기 위한 효율적인 수단이 도출될 수 있다는 것이 보여졌다. 특히, 결과의 예측자 계수들은 서브대역 시프트들에 대해 불변이고 일반적으로 단지 특정 서브대역에 관하여 정규화된 주파수에 의존한다는 것이 보여졌다. 결과로서, 예측자 계수들이 결정되는 서브대역 인덱스(p)의 독립적인(패리티값을 제외하고) 표준화된 주파수(f)를 아는 예측자 계수들의 결정에 대해 허용하는 미리 결정된 참조표들(예를 들면, 도 3에서 도시된 바와 같이)이 제공될 수 있다.As such, it has been shown that the signal model x (t) is used to describe the basic features of the input audio signal to be encoded. The parameters describing the autocorrelation function r (tau) can be transmitted to the decoder 100 so that the decoder 100 derives predictors from the transmitted parameters and from knowledge of the signal model x (t) Let's calculate. For modulated filter banks, it has been shown that efficient means can be derived to determine the subband covariance matrix of the signal model and to solve the standard equations to determine the predictor coefficients. In particular, it has been shown that the resultant predictor coefficients are invariant to the subband shifts and generally depend only on the normalized frequency with respect to the particular subband. As a result, there are predetermined reference tables (for example, &lt; RTI ID = 0.0 &gt; e. G. &Lt; / RTI &gt; As shown in FIG. 3) may be provided.

다음으로, 예를 들면, 단일 기본 주파수(Ω)를 사용하여, 주기적 모델 기반 예측이 더 상세히 기술된다. 이러한 주기적 모델의 자기 상관 함수(r(τ))는 식(13)으로 주어진다. 균등한 PSD 또는 선 스펙트럼은 다음으로 주어진다:Next, using a single fundamental frequency (?), For example, periodic model-based prediction is described in more detail. The autocorrelation function r (τ) of this periodic model is given by Eq. (13). An even PSD or line spectrum is given by:

Figure 112015065692244-pct00083
Figure 112015065692244-pct00083

주기적 모델의 기간(T)이 충분히 작을 때, 예를 들면, T≤1일 때, 기본 주파수(Ω = 2π/T)는 예측될 타깃 서브대역 샘플의 서브대역(p)의 중심 주파수(

Figure 112015065692244-pct00084
)에 가장 가까운 부분 주파수(
Figure 112015065692244-pct00085
)를 사용하여 상기에 도출되는 사인파 모델의 적용을 허용하기에 충분히 크다. 이는 작은 주기(T), 즉, 필터뱅크의 시간 스트라이드에 관하여 작은 기간을 갖는 주기적 신호들이 상기 기술된 사인파 모델을 사용하여 양호하게 모델링 및 예측될 수 있다는 것을 의미한다.When the period T of the periodic model is sufficiently small, for example T? 1, the fundamental frequency? = 2? / T is the center frequency of the subband p of the target subband sample to be predicted
Figure 112015065692244-pct00084
) To the nearest partial frequency (
Figure 112015065692244-pct00085
) To allow the application of the sine wave model derived therefrom. This means that periodic signals with a small period (T), i.e. a small period with respect to the time stride of the filter bank, can be well modeled and predicted using the sine wave model described above.

주기(T)가 필터뱅크 윈도우(ν(t))의 지속 기간(K)에 비해 충분히 클 때, 예측자는 T만큼 지연의 근사로 감소될 수 있다. 보여지는 바와 같이, 이러한 예측자의 계수들은 식(19)에 의해 주어진 파형 교차 상관 함수로부터 직접 판독될 수 있다.When the period T is sufficiently large compared to the duration K of the filter bank window v (t), the predictor can be reduced to an approximation of the delay by T. [ As can be seen, these predictor coefficients can be read directly from the waveform cross-correlation function given by equation (19).

식(13)에 따른 모델의 식(22)로의 삽입은, 다음을 초래한다:Insertion of the model according to equation (13) into equation (22) results in:

Figure 112015065692244-pct00086
Figure 112015065692244-pct00086

중요한 관찰은, T ≥ 2K인 경우, 식(31)의 많아야 하나의 항은 |τ|>K에 대하여 Un,m(τ) = 0이기 때문에 각각의 λ에 대해 0이 아니다. 타임 슬롯 직경(D=|J|≤T-K)을 갖는 예측 마스크 지원(B = I×J)을 선택함으로써, (n,k),(m,l)∈B는 |k-l|≤T-K를 암시하는 것이 관찰되고, 따라서, 식(31)의 단일 항은 q=0에 대한 것이다. 이는 직교 파형들의 내적이고, n=m이면서 k=l인 경우가 아니면 0이 되는

Figure 112015065692244-pct00087
를 따른다. 대체로, 표준 방정식들(7)은 다음과 같이 된다:An important observation is that for T ≥ 2K, at most one term in Eq. (31) is not 0 for each λ, since U n, m (τ) = 0 for | τ |> K. (N, k), (m, l) E B implies | kl | TK by selecting a prediction mask support (B = I x J) with a time slot diameter (D = | J | , And therefore the single term in equation (31) is for q = 0. This is the inner product of orthogonal waveforms, and is zero unless n = m and k = l
Figure 112015065692244-pct00087
. In general, the standard equations (7) are as follows:

Figure 112015065692244-pct00088
Figure 112015065692244-pct00088

예측 마스크 지원은

Figure 112015065692244-pct00089
주위에 중심을 두도록 선택될 수 있고, 이 경우에 식(32)의 우변은 q = -1로부터의 그의 단일 기여를 갖는다. 이후, 계수들은 다음으로 주어지고:Predictive mask support
Figure 112015065692244-pct00089
, And in this case the right hand side of equation (32) has its single contribution from q = -1. The coefficients are then given as: &lt; RTI ID = 0.0 &gt;

Figure 112015065692244-pct00090
Figure 112015065692244-pct00090

식(19)으로부터의 명시적 표현이 삽입될 수 있다. 이러한 경우에 대한 예측 마스크 지원의 기하학적 구조는 도 2의 예측 마스크(205)의 예측 마스크 지원의 외관을 가질 수 있다. 식(6)에 의해 주어진 제곱 예측 에러의 평균값은 근사 파형들(wm ,l(t),

Figure 112015065692244-pct00091
)의 보완에 의해 걸쳐진 공간상에 up(t+T)의 투영의 제곱 평균과 같다.An explicit expression from Eq. (19) can be inserted. The geometry of the prediction mask support for this case may have the appearance of a prediction mask support of the prediction mask 205 of FIG. The average value of the squared prediction error given by equation (6) is the approximate waveforms w m , l (t)
Figure 112015065692244-pct00091
) Of the projection of u p (t + T) onto the space spanned by the complement of u p (t + T).

상기의 관점에서, 서브대역 샘플(

Figure 112015065692244-pct00092
)(서브대역(p)으로부터 및 시간 인덱스(0)에서) T와 대략 같은 시간 다이어미터를 갖는 (p, -T) 주위에 중심을 둔 적절한 예측 마스크 지원(B)을 사용함으로써 예측될 수 있다. 표준 방정식들은 T 및 p의 각각의 값에 대해 풀이될 수 있다. 다시 말해서, 입력 오디오 신호의 각각의 주기성(T)에 대하여 및 각각의 서브대역(p)에 대하여, 주어진 예측 마스크 지원(B)에 대한 예측 계수들은 표준 방정식들(33)을 사용하여 결정될 수 있다.In view of the above, the subband samples (
Figure 112015065692244-pct00092
May be predicted by using the appropriate prediction mask support B centered around (p, -T) with a time diagram approximately equal to T (at sub-band p and at time index 0) . Standard equations can be solved for each value of T and p. In other words, for each periodicity T of the input audio signal and for each subband p, the prediction coefficients for a given prediction mask support B can be determined using the standard equations 33 .

다수의 서브대역들(p) 및 넓은 범위의 주기들(T)에 의해, 모든 예측자 계수들의 직접적인 표 작성은 실용적이지 않다. 그러나, 사인파 모델과 유사한 방식에서, 필터뱅크의 변조 구조는 주파수 시프트들에 관한 불변 속성을 통해 필요한 표 크기의 상당한 감소를 제공한다. 이는, 주파수들의 집합(

Figure 112015065692244-pct00093
, q∈Z) 중에서 양의 주파수들의 서브세트(S(θ))에 의해 규정된, 서브대역(p)의 중심 주위에 중심을 둔, 즉,
Figure 112015065692244-pct00094
주위에 중심을 둔, 시프트 파라미터(-1/2≤θ≤1/2)를 갖는 시프트된 조화 모델을 연구하기 위해 일반적으로 충분할 것이다:Due to the large number of subbands p and the wide range of periods T, the creation of a direct table of all predictor coefficients is not practical. However, in a manner similar to a sinusoidal model, the modulation scheme of the filter bank provides a significant reduction in the required table size through an invariant property on the frequency shifts. This means that the set of frequencies
Figure 112015065692244-pct00093
, Centered around the center of the sub-band (p) defined by a subset (S (θ)) of the positive frequency from q∈ Z), that is,
Figure 112015065692244-pct00094
Will typically suffice to study a shifted harmonic model with a shift parameter centered around (-1 / 2 &amp;le;&amp;le;&amp;

Figure 112015065692244-pct00095
Figure 112015065692244-pct00095

사실상, T 및 충분히 큰 서브대역 인덱스(p)를 고려하면, 식(30)에 따른 주기적 모델은 시프트 파라미터(θ)의 적절한 선택에 의해 식(34)에 따라 시프트된 모델에 의해 양호한 근사로 복구될 수 있다. 식(24)로의 식(34)의 삽입(n = p + ν 및 m = p + μ)(ν 및 μ는 예측 마스크 지원의 서브대역(p) 주위의 서브대역 인덱스들을 규정한다) 및 푸리에 분석에 기초한 조정들은 공분산 행렬에 대한 다음의 식을 초래한다:In fact, considering a T and a sufficiently large subband index p, the cyclic model according to equation (30) can be recovered to a good approximation by the shifted model according to equation (34) by appropriate selection of the shift parameter [ . (N and p define the subband indices around the subband p of the prediction mask support) and the Fourier analysis &lt; RTI ID = 0.0 &gt; Based adjustments result in the following equation for the covariance matrix:

Figure 112015065692244-pct00096
Figure 112015065692244-pct00096

이해될 수 있는 바와 같이, 식(35)은 팩터((-1))를 통해서만 타깃 서브대역 인덱스(p)에 의존한다. 큰 주기(T) 및 작은 시간적 래그(λ)의 경우에 대하여, 단지 l=0에 대한 항이 식(35)에 기여하고, 다시 공분산 행렬은 단위 행렬인 것을 찾았다. (p,-T) 주위에 중심을 둔 적절한 예측 마스크 지원(B)에 대한 표준 방정식들(26)의 우변은 이후 다음과 같이 예측 계수들을 직접 제공한다:As can be appreciated, equation (35) depends on the target only through the factor ((-1) pλ) subband index (p). For the case of the large period T and the small temporal lag λ, we have found that the term for l = 0 only contributes to equation (35) and again the covariance matrix is the unit matrix. The right side of the standard equations (26) for the appropriate prediction mask support (B) centered around (p, -T) then directly provides the prediction coefficients as follows:

Figure 112015065692244-pct00097
Figure 112015065692244-pct00097

이는 시프트(

Figure 112015065692244-pct00098
)의 정규 선택에 의해 식(19) 내지 식(33)의 제 1 항의 기여를 복구한다.That is,
Figure 112015065692244-pct00098
(19) to (33) by the normal selection of the second term (i. E.

식(36)은 시간 인덱스(k)에서 서브대역(p+ν)에 대한 예측 계수들(cp+ν[k])을 결정하는 것을 허용하고, 예측될 샘플은 시간 인덱스 0에서 서브대역(p)으로부터의 샘플이다. 식(36)으로부터 이해될 수 있는 바와 같이, 예측 계수들(cp+ν[k])은 예측 계수의 부호에 영향을 끼치는 팩터((-1)pk)를 통해서만 타깃 서브대역 인덱스(p)에 의존한다. 그러나, 예측 계수의 절대값은 타깃 서브대역 인덱스(p)에 독립적이다. 다른 한편으로, 예측 계수(cp+ν[k])는 주기성(T) 및 시프트 파라미터(θ)에 의존한다. 또한, 예측 계수(cp+ν[k])는 ν 및 k에, 즉, 타깃 서브대역(p)에서 타깃 샘플을 예측하기 위해 사용된 예측 마스크 지원(B)에 의존한다.Equation (36) allows to determine the prediction coefficients c p + v [k] for the subband p + v at the time index k, p). As can be seen from equation (36), the prediction coefficients c p + v [k] can be obtained only from the target subband index p through the factor (-1) pk that affects the sign of the prediction coefficient, Lt; / RTI &gt; However, the absolute value of the prediction coefficient is independent of the target subband index p. On the other hand, the prediction coefficient c p + v [k] depends on the periodicity T and the shift parameter?. Further, the prediction coefficient (c p + v [k]) depends on v and k, i.e., the prediction mask support (B) used to predict the target sample in the target subband (p).

본 명세서에서, 미리 결정된 예측 마스크 지원(B)에 대해 예측 계수들(cp [k])의 세트를 검색하는 것을 허용하는 참조표를 제공하는 것이 제안된다. 주어진 예측 마스크 지원(B)에 대하여, 참조표는 주기성(T)의 값들 및 시프트 파라미터(θ)의 값들의 미리 결정된 세트에 대한 일 세트의 예측 계수들(cp [k])을 제공한다. 참조표 엔트리들의 수를 제한하기 위해, 주기성(T)의 미리 결정된 값들의 수 및 시프트 파라미터(θ)의 미리 결정된 값들의 수는 제한되어야 한다. 식(36)으로부터 이해될 수 있는 바와 같이, 주기성(T) 및 시프트 파라미터(θ)의 미리 결정된 값들에 대한 적절한 양자화 단차 크기는 주기성(T)에 의존할 것이다. 특히, 비교적 큰 주기성들(T)(윈도우 함수의 지속 기간(K)에 관하여), 주기성(T)에 대한 및 시프트 파라미터(θ)에 대한 비교적 큰 양자화 단차들이 사용될 수 있다는 것이 이해될 수 있다. 다른 극단으로서, 0이 되는 경향이 있는 비교적 작은 주기성들(T)에 대하여, 단지 하나의 사인파 기여가 고려되어야 하고, 그래서 주기성(T)이 그의 중요성을 잃는다. 다른 한편으로, 식(29)에 따른 사인파 예측에 대한 수식들은 느리게 변하는 정규화된 절대 주파수 시프트(

Figure 112015065692244-pct00099
)를 요구하고, 그래서 시프트 파라미터(θ)에 대한 양자화 단차 크기는 주기성(T)에 기초하여 크기 조정될 것이다.In the present specification, it is proposed to provide a look-up table that allows searching for a set of prediction coefficients (c p + v [k]) for a predetermined prediction mask support (B). For a given prediction mask support B, the lookup table provides a set of prediction coefficients c p + v [k] for a predetermined set of values of the periodicity T and the shift parameter [theta] do. In order to limit the number of reference table entries, the number of predetermined values of the periodicity (T) and the number of predetermined values of the shift parameter (?) Should be limited. As can be appreciated from equation (36), the appropriate quantization step size for the predetermined values of the periodicity (T) and the shift parameter (?) Will depend on the periodicity (T). In particular, it can be appreciated that relatively large quantization steps for the relatively large periodicity T (with respect to the duration K of the window function), for the periodicity T and for the shift parameter [theta] can be used. As another extreme, for relatively small periodicity (T) that tends to be zero, only one sine wave contribution has to be considered, so the periodicity (T) loses its importance. On the other hand, the equations for the sinusoidal prediction according to equation (29) are the slowly varying normalized absolute frequency shift
Figure 112015065692244-pct00099
), So the quantization step size for the shift parameter [theta] will be scaled based on the periodicity T.

대체로, 본 명세서에서는 고정된 단차 크기를 갖는 주기성(T)의 균등한 양자화를 이용하는 것이 제안된다. 시프트 파라미터(θ)는 또한 균등한 방식이지만 min(T, A)에 비례하는 단차 크기를 갖고 양자화될 수 있지만, A의 값은 필터뱅크 윈도우 함수의 특성들에 의존한다. 더욱이, T < 2에 대하여, 시프트 파라미터들(θ)의 범위는 절대 주파수 시프트들(f)에 대한 제한을 반영하여 몇몇 상수(C)에 대하여 |θ|≤min(CT,1/2)로 제한될 수 있다.In general, it is proposed herein to use uniform quantization of periodicity (T) with a fixed step size. The shift parameter [theta] may also be quantized with a step size proportional to min (T, A), but the value of A depends on the characteristics of the filter bank window function. Further, for T < 2, the range of the shift parameters [theta] is limited to |? |? Min (CT, 1/2) for some constant C Lt; / RTI &gt;

도 6a는 A = 2에 대하여 (T,θ)-평면에서 결과의 양자화 그리드의 일 예를 도시한다. 단지 0.25≤T≤1.5의 범위에 있는 중간 범위에서, 완전 2차원 의존성이 고려되지만, 반면에 식(29) 및 식(36)에 의해 주어진 1차원 파라미터화들은 반드시 관심 있는 나머지 범위에 대해 사용될 수 있다. 특히, 0이 되는 경향이 있는 주기성들(T)(예를 들면, T<0.25)에 대하여, 주기적 모델 기반 예측은 실질적으로 사인파 모델 기반 예측에 대응하고, 예측 계수들은 수식들(29)을 사용하여 결정될 수 있다. 다른 한편으로, 윈도우 지속 기간(K)을 실질적으로 초과하는 주기성들(T)(예를 들면, T>1.5)에 대하여, 주기적 모델 기반 예측을 사용하는 예측 계수들(cp [k])의 세트는 식(36)을 사용하여 결정될 수 있다. 이러한 식은

Figure 112015065692244-pct00100
로 치환에 의하여 재해석될 수 있다. 다음을 찾을 수 있다:FIG. 6A shows an example of a resultant quantization grid in the (T,?) - plane for A = 2. In the intermediate range only in the range of 0.25? T? 1.5, full two-dimensional dependence is considered, whereas one-dimensional parameterization given by equations (29) and (36) can be used for the remaining range of interest have. In particular, for periodicities T that tend to be zero (e.g., T < 0.25), periodic model-based predictions substantially correspond to sinusoidal model-based predictions, and prediction coefficients use equations 29 &Lt; / RTI &gt; On the other hand, for the periodicity T (e.g., T> 1.5) that substantially exceeds the window duration K, the prediction coefficients c p + v [k] using periodic model- ) May be determined using equation (36). These expressions
Figure 112015065692244-pct00100
Can be reinterpreted by substitution. You can find:

Figure 112015065692244-pct00101
Figure 112015065692244-pct00101

φ에 표에서 파라미터(θ)로 주어진 역할을 제공함으로써, 본질적으로 분리가능한 구조는 등가의 (T,φ)-평면에서 얻어진다. 서브대역 및 타임 슬롯 인덱스들에 의존하는 신호 변경들까지, T에 대한 의존성은 제 1 느리게 변하는 팩터에 포함되고, φ에 대한 의존성은 식(37)에서 1-주기적 제 2 팩터에 포함된다.By providing a role given by φ in the table as a parameter (θ), an essentially separable structure is obtained in the equivalent (T, φ) -plane. The dependence on T is included in the first slowly varying factor and the dependence on? Is included in the one-periodic second factor in equation (37), up to signal changes depending on the subband and time slot indices.

변경된 오프셋 파라미터(φ)를 소스 및 타깃 빈들의 중간 지점들의 중간 지점으로부터 측정되는 기본 주파수의 단위들로 조화 급수의 시프트로서 해석할 수 있다. φ 및 ν의 동시적인 부호 변경들에 관하여 명백한 식(37)의 대칭들이 일반적으로 유지될 것이고 표 크기들을 감소시키기 위해 이용될 수 있기 때문에, 주기성들(T)의 모든 값들에 대하여 이러한 변경된 파라미터화(T,φ)를 유지하는 것이 이롭다.The modified offset parameter phi may be interpreted as a shift of the harmonic series by the units of the fundamental frequency measured from the midpoint of the midpoints of the source and target bins. Since the symmetries of the explicit equation (37) with respect to the simultaneous sign changes of phi and v are generally to be retained and can be used to reduce the table sizes, this modified parameterization (T, &amp;phiv;).

상기에 나타낸 바와 같이, 도 6a는 코사인 변조된 필터뱅크에서 주기적 모델 기반 예측자 계산을 위해 통계표에 기초한 2차원 양자화 그리드를 도시한다. 신호 모델은 필터뱅크 시간 단차의 단위들로 측정된 주기(T)를 갖는 신호의 모델(602)이다. 동등하게, 모델은 주기(T)에 대응하는 기본 주파수의 부분들로서 또한 알려진, 정수배들의 주파수 선들을 포함한다. 각각의 타깃 서브대역에 대하여, 시프트 파라미터(θ)(601)는 기본 주파수(Ω)의 단위들로 측정된 중심 주파수에 가장 가까운 부분의 거리를 나타낸다. 시프트 파라미터(θ)(601)는 -0.5와 0.5 사이의 값을 갖는다. 도 6a의 검은 크로스들(603)은 주기적 모델에 기초하여 높은 예측 이득을 갖는 예측자들의 표에 대한 양자화 지점들의 적절한 밀도를 도시한다. 큰 주기들(T)(예를 들면, T>2)에 대하여, 그리드는 균등하다. 시프트 파라미터(θ)에서 증가된 밀도는 일반적으로 주기(T)가 감소하는 것으로 요구된다. 그러나, 선들(604) 밖의 영역에서, 거리(θ)는 필터뱅크의 하나의 주파수 빈보다 크고, 그래서 이 영역에서 대부분의 그리드 지점들은 무시될 수 있다. 다각형(605)은 전체 표에 대해 충분한 영역을 정한다. 선들(604)의 약간 밖으로 기울어진 선들에 더하여, T = 0.25 및 T = 1.5에서 경계들이 도입된다. 이는 작은 주기들(602)은 분리된 사인파들로서 처리될 수 있고, 큰 주기들(602)에 대한 예측자들은 주로 시프트 파라미터(θ)에(또는 변경된 시프트 파라미터(φ)에) 의존하는 반드시 1차원 표들에 의해 근사될 수 있다는 사실에 의해 가능해진다. 도 6a에 도시된 실시예에 대하여, 예측 마스크 지원은 일반적으로 큰 주기들(T)에 대하여 도 2의 예측 마스크(205)와 유사하다.As shown above, FIG. 6A shows a two-dimensional quantization grid based on statistical tables for periodic model-based predictor computation in a cosine-modulated filter bank. The signal model is a model of a signal 602 having a period T measured in units of filter bank time steps. Equally, the model includes integer lines of frequency lines, also known as parts of the fundamental frequency corresponding to period T. For each target subband, the shift parameter (?) 601 represents the distance of the portion closest to the center frequency measured in units of fundamental frequency (?). The shift parameter (?) 601 has a value between -0.5 and 0.5. The black crosses 603 of FIG. 6A illustrate the proper density of quantization points for a table of predictors with a high prediction gain based on a periodic model. For large periods T (e.g., T > 2), the grid is even. The increased density at the shift parameter [theta] is generally required that the period T decreases. However, in the area outside the lines 604, the distance [theta] is greater than one frequency bin of the filter bank, so that most of the grid points in this area can be ignored. The polygon 605 defines a sufficient area for the entire table. In addition to the slightly outwardly sloping lines of lines 604, boundaries are introduced at T = 0.25 and T = 1.5. This means that small cycles 602 can be handled as separate sine waves and predictors for large cycles 602 can be processed in a one-dimensional (&quot;Lt; / RTI &gt; can be approximated by means of tables. For the embodiment shown in FIG. 6A, the prediction mask support is generally similar to the prediction mask 205 of FIG. 2 for large periods (T).

도 6b는 비교적 큰 주기들(T)의 경우에 및 비교적 작은 주기들(T)의 경우에 주기적 모델 기반 예측을 도시한다. 큰 주기들(T)에 대하여, 즉, 비교적 작은 기본 주파수들(Ω)(613)에 대하여, 필터뱅크의 윈도우 함수(612)가 비교적 큰 수의 선들 또는 주기적 신호의 PSD의 디락 펄스들(616)을 캡처한다는 것이 상부 도면으로부터 이해될 수 있다. 디락 펄스들(616)은 주파수들(610)(ω=qΩ;

Figure 112015065692244-pct00102
)에 위치된다. 필터뱅크의 서브대역들의 중심 주파수들은 주파수들(
Figure 112015065692244-pct00103
;
Figure 112015065692244-pct00104
)에 위치된다. 주어진 서브대역(p)에 대하여, 주어진 서브대역의 중심 주파수(
Figure 112015065692244-pct00105
)에 가장 가까운 주파수(ω=qΩ)를 갖는 펄스(616)의 주파수 위치는 비교항들에서
Figure 112015065692244-pct00106
로서 기술될 수 있고, 시프트 파라미터(θ)는 -0.5로부터 +0.5의 범위이다. 이와 같이, 항(
Figure 112015065692244-pct00107
)은 중심 주파수(
Figure 112015065692244-pct00108
)로부터 조화 모델의 가장 가까운 주파수 성분(616)까지의 거리(주파수로)를 반영한다. 이는 도 6b의 상부 도면에 도시되고 중심 주파수(617)는
Figure 112015065692244-pct00109
이고, 거리(618)(
Figure 112015065692244-pct00110
)는 비교적 큰 주기(T)의 경우에 대해 도시된다. 시프트 파라미터(
Figure 112015065692244-pct00111
)가 서브대역(p)의 중심의 관점으로부터 보여지는 완전 조화 급수들을 기술하는 것을 허용한다는 것이 이해될 수 있다.FIG. 6B shows a cyclic model-based prediction in the case of relatively large periods T and in the case of relatively small periods T. FIG. For the large periods T, that is, for relatively small fundamental frequencies (OMEGA) 613, the window function 612 of the filter bank is applied to the DLEAK pulses 616 of the PSD of a relatively large number of lines or periodic signals From the top figure. Dail pulse 616 includes frequencies 610 (? = Q?;
Figure 112015065692244-pct00102
). The center frequencies of the subbands of the filter bank are frequency
Figure 112015065692244-pct00103
;
Figure 112015065692244-pct00104
). For a given subband p, the center frequency of a given subband (
Figure 112015065692244-pct00105
The frequency position of the pulse 616 having the closest frequency (? = Q?) To the frequency
Figure 112015065692244-pct00106
And the shift parameter [theta] ranges from -0.5 to +0.5. As such,
Figure 112015065692244-pct00107
) Is the center frequency (
Figure 112015065692244-pct00108
(Frequency) of the harmonic model to the closest frequency component 616 of the harmonic model. This is illustrated in the top view of FIG. 6B and center frequency 617 is
Figure 112015065692244-pct00109
, And distance 618 (
Figure 112015065692244-pct00110
) Is shown for the case of a relatively large period T. The shift parameter (
Figure 112015065692244-pct00111
) Allows describing the perfect harmonic series as seen from the perspective of the center of the subband p.

도 6b의 아래 도면은 비교적 작은 주기들(T)에 대하여, 즉, 비교적 큰 기본 주파수들(Ω)(623), 특히, 윈도우(612)의 폭보다 큰 기본 주파수들(623)에 대한 경우를 도시한다. 이러한 경우들에서, 윈도우 함수(612)는 단지 주기적 신호의 단일 펄스(626)를 포함할 수 있어서, 신호는 윈도우(612)내 사인파 신호로서 보여질 수 있다는 것이 이해될 수 있다. 이는, 비교적 작은 주기들(T)에 대하여, 주기적 모델 기반 예측 방식은 사인파 모델 기반 예측 방식으로 수렴한다는 것을 의미한다.The lower figure of Figure 6b shows the case for relatively small periods T, i.e. for relatively large fundamental frequencies OMEGA 623, and in particular for fundamental frequencies 623 larger than the width of window 612 Respectively. It can be appreciated that in these cases, the window function 612 may include only a single pulse 626 of the periodic signal so that the signal can be viewed as a sinusoidal signal in the window 612. This means that for relatively small periods T, the periodic model-based prediction scheme converges to a sinusoidal model-based prediction scheme.

도 6b는 또한 주기적 모델 기반 예측 방식을 위해 및 사인파 모델 기반 예측 방식을 위해 각각 사용될 수 있는 예시적인 예측 마스크들(611, 621)을 도시한다. 주기적 모델 기반 예측 방식에 사용된 예측 마스크(611)는 도 2의 예측 마스크(205)에 대응할 수 있고, 타깃 서브대역 샘플(615)을 추정하기 위해 예측 마스크 지원(614)을 포함할 수 있다. 사인파 모델 기반 예측 방식에 사용된 예측 마스크(621)는 도 2의 예측 마스크(203)에 대응할 수 있고 타깃 서브대역 샘플(625)을 추정하기 위해 예측 마스크 지원(624)을 포함할 수 있다.6B also shows exemplary prediction masks 611 and 621 that can be used for the periodic model-based prediction scheme and for the sinewave model-based prediction scheme, respectively. The prediction mask 611 used in the periodic model based prediction scheme may correspond to the prediction mask 205 of FIG. 2 and may include prediction mask support 614 to estimate the target subband samples 615. The prediction mask 621 used in the sinusoidal model based prediction scheme may correspond to the prediction mask 203 in FIG. 2 and may include prediction mask support 624 to estimate the target subband samples 625.

도 7a는 (예를 들면, 하나의 기본 주파수(Ω)를 포함하는) 주기적 모델을 사용하는 모델 기반 서브대역 예측을 포함하는 일 예시적인 인코딩 방법(700)을 도시한다. 입력 오디오 신호의 프레임이 고려된다. 이러한 프레임에 대하여, 주기성(T) 또는 기본 주파수(Ω)가 결정될 수 있다(단계(701)). 오디오 인코더는 도 1에 도시된 디코더(100)의 요소들을 포함할 수 있고, 특히, 오디오 인코더는 예측자 계산기(105) 및 서브대역 예측자(103)를 포함할 수 있다. 주기성(T) 또는 기본 주파수(Ω)는 식(6)에 따라 제곱된 예측 에러 서브대역 신호들(111)의 평균값이 감소되도록(예를 들면, 최소화되도록) 결정될 수 있다. 예로서, 오디오 인코더는 상이한 기본 주파수들(Ω)을 사용하여 예측 에러 서브대역 신호들(111)을 결정하고 제곱된 예측 에러 서브대역 신호들(111)의 평균값이 감소되는(예를 들면, 최소화되는) 기본 주파수(Ω)를 결정하는 억지적인 방식을 적용할 수 있다. 방법은 결과의 예측 에러 서브대역 신호들(111)을 양자화하는 단계로 진행한다(단계(702)). 또한, 방법은 결정된 기본 주파수(Ω) 및 양자화된 예측 에러 서브대역 신호들(111)을 나타내는 정보를 포함하는 비트스트림을 생성하는 단계(703)를 포함한다.7A illustrates an exemplary encoding method 700 that includes model-based subband prediction using a periodic model (e.g., comprising one fundamental frequency, [Omega]). The frame of the input audio signal is considered. For such a frame, the periodicity T or the fundamental frequency OMEGA can be determined (step 701). The audio encoder may include elements of the decoder 100 shown in FIG. 1, and in particular, the audio encoder may include a predictor calculator 105 and a subband predictor 103. The periodicity T or the fundamental frequency OMEGA can be determined such that the mean value of the squared predicted error subband signals 111 is reduced (e.g., minimized) according to equation (6). By way of example, the audio encoder may use the different fundamental frequencies [Omega] to determine the predicted error subband signals 111 and to reduce (e.g., minimize) the average value of the squared predicted error subband signals 111 ) Can be applied to determine the fundamental frequency (?). The method proceeds to quantizing the resulting prediction error subband signals 111 (step 702). The method also includes generating (703) a bitstream that includes information indicating the determined fundamental frequency ([Omega]) and the quantized predicted error subband signals (111).

단계(701)에서 기본 주파수(Ω)를 결정할 때, 오디오 인코더는 특정한 기본 주파수(Ω)에 대한 예측 계수들을 결정하기 위해 식들((36) 및/또는 (29))을 이용할 수 있다. 가능한 기본 주파수(Ω)의 세트는 결정된 기본 주파수(Ω)를 나타내는 정보의 송신에 이용가능한 비트들의 수로 한정될 수 있다.When determining the fundamental frequency [Omega] in step 701, the audio encoder may use the equations (36) and / or (29) to determine the prediction coefficients for a particular fundamental frequency [Omega]. The set of possible fundamental frequencies ([Omega]) may be limited to the number of bits available for transmission of information indicating the determined fundamental frequency ([Omega]).

오디오 코딩 시스템은 미리 결정된 모델(예를 들면, 하나의 기본 주파수(Ω)를 포함하는 주기적 모델 또는 본 명세서에 제공된 모델들 중 임의의 다른 것) 및/또는 미리 결정된 예측 마스크(202, 203, 204, 205)를 사용할 수 있다는 것이 주의되어야 한다. 다른 한편으로, 오디오 코딩 시스템은 오디오 디코더가 인코딩될 오디오 신호에 대한 적절한 예측 마스크 및/또는 적절한 모델을 결정하게 함으로써 추가의 자유도들이 제공될 수 있다. 선택된 모델 및/또는 선택된 예측 마스크에 관한 정보는 이후 비트 스트림으로 인코딩되고 대응하는 디코더(100)에 제공된다.The audio coding system may comprise a predetermined model (e.g., a periodic model comprising one fundamental frequency (?) Or any other of the models provided herein) and / or a predetermined prediction mask 202, 203, 204 , 205) may be used. On the other hand, the audio coding system may be provided with additional degrees of freedom by allowing the audio decoder to determine an appropriate prediction mask and / or an appropriate model for the audio signal to be encoded. Information about the selected model and / or the selected prediction mask is then encoded into a bitstream and provided to a corresponding decoder 100.

도 7b는 모델 기반 예측을 사용하여 인코딩된 오디오 신호를 디코딩하기 위한 일 예시적인 방법(710)을 도시한다. 디코더(100)가 (수신된 비트 스트림을 통해 또는 미리 결정된 설정들에 의해) 인코더에 의해 사용된 신호 모델 및 예측 마스크를 안다고 가정된다. 또한, 예시적인 목적들을 위해 주기적 예측 모델이 사용된 것이 가정된다. 디코더(100)는 수신된 비트 스트림으로부터 기본 주파수(Ω)에 관한 정보를 추출한다(단계(711)). 기본 주파수(Ω)에 관한 정보를 사용하여, 디코더(100)는 주기성(T)을 결정할 수 있다. 기본 주파수(Ω) 및/또는 주기성(T)은 상이한 서브대역 예측자들에 대한 일 세트의 예측 계수들을 결정하기 위해 사용될 수 있다(단계(712)). 서브대역 예측자들은 디코딩된 서브대역 신호들(113)을 산출하기 위해 반양자화된 예측 에러 서브대역 신호들(111)과 조합되는(단계(714)) 추정된 서브대역 신호들을 결정하기 위해 사용될 수 있다(단계(713)). 디코딩된 서브대역 신호들(113)은 합성 필터뱅크(102)를 사용하여 필터링될 수 있고(단계(715)), 그에 의해 디코딩된 시간 도메인 오디오 신호(114)를 산출한다.FIG. 7B illustrates an exemplary method 710 for decoding an encoded audio signal using model-based prediction. It is assumed that the decoder 100 knows the signal model and predictive mask used by the encoder (either via the received bitstream or by predetermined settings). It is also assumed that a cyclic prediction model is used for exemplary purposes. The decoder 100 extracts information on the fundamental frequency [Omega] from the received bitstream (step 711). Using information about the fundamental frequency ([Omega]), the decoder 100 can determine the periodicity (T). The fundamental frequency ([Omega]) and / or the periodicity (T) may be used to determine a set of prediction coefficients for different subband predictors (step 712). The subband predictors may be used to determine the estimated subband signals that are combined with the semi-quantized predicted error subband signals 111 (step 714) to yield decoded subband signals 113 (Step 713). The decoded subband signals 113 may be filtered using the synthesis filter bank 102 (step 715), thereby yielding the decoded time domain audio signal 114. [

예측자 계산기(105)는 기본 주파수(Ω)에 관해 수신된 정보에 기초하여 서브대역 예측자들(103)의 예측 계수들을 결정하기 위한 식들((36) 및/또는 (29))을 이용할 수 있다(단계(712)). 이는 도 6a 및 도 3에 도시된 바와 같이 참조표를 사용하여 효율적인 방식으로 수행될 수 있다. 예로서, 예측자 계산기(105)는 주기성(T)을 결정하고 주기성이 미리 결정된 하위 임계치(예를 들면, T=0.25) 이하에 있는지의 여부를 결정할 수 있다. 이러한 경우, 사인파 모델 기반 예측 방식이 사용된다. 이는, 수신된 기본 주파수(Ω)에 기초하여, 서브대역들(p)이 기본 주파수의 배수(ω=qΩ;

Figure 112015065692244-pct00112
)를 포함하는 것으로 결정된다. 이후, 정규화된 주파수(f)는 관계(
Figure 112015065692244-pct00113
)를 사용하여 결정되고, 주파수(
Figure 112015065692244-pct00114
)는 서브대역(p)에 있는 곱(ω=qΩ)에 대응한다. 예측자 계산기(105)는 이후 (예를 들면, 도 2의 예측 마스크(203) 또는 도 6b의 예측 마스크(621)를 사용하여) 예측 계수들의 세트를 결정하기 위해 식(29) 또는 미리 결정된 참조표를 사용할 수 있다.The predictor calculator 105 may use equations (36) and / or (29) to determine the predictive coefficients of the subband predictors 103 based on the received information about the fundamental frequency (Step 712). This can be done in an efficient manner using reference tables as shown in Figures 6A and 3. [ By way of example, the predictor calculator 105 may determine the periodicity T and determine whether the periodicity is below a predetermined lower threshold (e.g., T = 0.25). In this case, a sine wave model based prediction method is used. This is because, based on the received fundamental frequency ([Omega]), the subbands p are multiplied by a multiple of the fundamental frequency ([omega] = q [
Figure 112015065692244-pct00112
). Then, the normalized frequency f is expressed by the relationship (
Figure 112015065692244-pct00113
), And the frequency (
Figure 112015065692244-pct00114
) Corresponds to the product (? = Q?) In subband p. The predictor calculator 105 may then use Equation 29 or a predetermined reference to determine the set of prediction coefficients (e.g., using the prediction mask 203 of Figure 2 or the prediction mask 621 of Figure 6b) You can use tables.

예측 계수들의 상이한 세트는 각각의 서브대역에 대해 결정될 수 있다는 것이 주의되어야 한다. 그러나, 사인파 모델 기반 예측 방식의 경우에, 일 세트의 예측 계수들은 일반적으로 기본 주파수의 배수(ω=qΩ;

Figure 112015065692244-pct00115
)에 의해 상당히 영향을 받는 서브대역들(p)에 대해서만 결정된다. 다른 서브 대역들에 대해, 이러한 다른 서브대역들에 대한 추정된 서브대역 신호들(112)이 0인 것을 의미하는 예측 계수들이 결정되지 않는다. 디코더(100)의(및 동일한 예측자 계산기(105)를 사용하여 인코더의) 계산 복잡성을 감소시키기 위하여, 예측자 계산기(105)는 T 및
Figure 112015065692244-pct00116
에 대한 값들을 조건으로 하는 예측 계수들의 세트를 제공하는 미리 결정된 참조표를 이용할 수 있다. 특히, 예측자 계산기(105)는 T에 대하여 복수의 상이한 값들에 대한 복수의 참조표들을 이용할 수 있다. 복수의 참조표들의 각각은 시프트 파라미터(
Figure 112015065692244-pct00117
)의 복수의 상이한 값들에 대한 예측 계수들의 상이한 세트를 제공한다.It should be noted that a different set of prediction coefficients may be determined for each subband. However, in the case of a sinusoidal model-based prediction scheme, a set of prediction coefficients is generally a multiple of the fundamental frequency (? = Q?
Figure 112015065692244-pct00115
Lt; RTI ID = 0.0 &gt; p &lt; / RTI &gt; For the other subbands, the prediction coefficients that mean that the estimated subband signals 112 for these other subbands are zero are not determined. In order to reduce the computational complexity of the decoder 100 (and of the encoder using the same predictor calculator 105), the predictor calculator 105 calculates T and /
Figure 112015065692244-pct00116
Lt; / RTI &gt; may use a predetermined look-up table that provides a set of prediction coefficients that are conditional on the values for &lt; RTI ID = 0.0 &gt; In particular, the predictor calculator 105 may use a plurality of look-up tables for a plurality of different values for T. Each of the plurality of look-up tables includes a shift parameter
Figure 112015065692244-pct00117
&Lt; / RTI &gt; for a plurality of different values of the prediction coefficients.

실제 구현에서, 복수의 참조표들은 주기 파라미터(T)의 상이한 값들에 대해 제공될 수 있다. 예로서, 참조표들은 0.25 및 2.5의 범위에서 T의 값들에 대해 제공될 수 있다(도 6a에 도시된 바와 같이). 참조표들은 상이한 주기 파라미터들(T)의 미리 결정된 입도 또는 단차 크기에 대해 제공될 수 있다. 일 예시적인 구현에서, 정규화된 주기 파라미터(T)에 대한 단차 크기는 1/16이고, 양자화된 예측 계수들에 대한 상이한 참조표들은 T=8/32 내지 T=80/32까지에 대해 제공된다. 따라서, 총 37 개의 상이한 참조표들은 양자화된 예측 계수들을 시프트 파라미터(

Figure 112015065692244-pct00118
)의 함수로서 또는 변경된 시프트 파라미터(φ)의 함수로서 제공할 수 있다. T=8/32 내지 T=80/32까지에 대한 참조표들은 단차 크기의 절반씩 증가되는 범위, 즉,
Figure 112015065692244-pct00119
에 대해 사용될 수 있다. 참조표들이 정의된 이용가능한 주기성들과 상이한 주어진 주기성에 대하여, 가장 근접한 이용가능한 주기성에 대한 참조표가 사용될 수 있다. 상기 개요로 서술된 바와 같이, 긴 주기들(T)에 대하여(예를 들면, 참조표가 정의되는 주기를 초과한 주기들(T)에 대하여), 식(36)이 사용될 수 있다. 대안적으로, 참조표들이 정의된 주기들을 초과하는 기간들(T)에 대하여, 예를 들면, 주기들(T>81/32)에 대하여, 주기(T)는 정수 지연(Ti) 및 나머지 지연(Tr)으로 분리될 수 있고, T = Ti + Tr이다. 상기 분리는 나머지 지연(Tr)이 식(36)이 적용가능하고 참조표들이 이용가능한 간격 내에, 예를 들면, 상기 예에 대하여 간격([1.5, 2.5] 또는 [49/32, 81/32]) 내에 있는 것일 수 있다. 이렇게 함으로써, 예측 계수들은 나머지 지연(Tr)에 대하여 참조표를 사용하여 결정될 수 있고, 서브대역 예측자(103)는 정수 지연(Ti)에 의해 지연된 서브대역 버퍼(104)상에 동작할 수 있다. 예를 들면, 주기가 T=3.7인 경우, 정수 지연은 Ti = 2이고, 다음으로 나머지 지연은 Tr = 1.7이다. 예측자는 (추가의) Ti = 2에 의해 지연되는 신호 버퍼상의 Tr = 1.7에 대한 계수들에 기초하여 적용될 수 있다.In an actual implementation, a plurality of look-up tables may be provided for different values of the period parameter T. [ By way of example, reference tables may be provided for values of T in the range of 0.25 and 2.5 (as shown in FIG. 6A). The look-up tables may be provided for a predetermined granularity or step size of different period parameters (T). In one exemplary implementation, the step size for the normalized period parameter T is 1/16, and different lookup tables for the quantized prediction coefficients are provided for T = 8/32 to T = 80/32 . Thus, a total of 37 different lookup tables may be used to transform the quantized prediction coefficients into a shift parameter
Figure 112015065692244-pct00118
) Or as a function of the modified shift parameter ([phi]). The reference tables for T = 8/32 to T = 80/32 are in the range increased by half of the step size,
Figure 112015065692244-pct00119
Lt; / RTI > For a given periodicity where the reference tables differ from the defined available periodicity, a look-up table for the closest available periodicity may be used. As described above, equation (36) may be used for long periods T (e.g., for periods T exceeding the period in which the reference table is defined). Alternatively, for periods T in which reference tables exceed defined periods, for example, for periods (T &gt; 81/32), period T may be an integral delay (T i ) Can be separated into a delay (T r ), and T = T i + T r . The separation is such that the remainder of the delay (T r ) is within the available interval of the reference table, for example, [1.5, 2.5] or [49/32, 81/32 ]). By doing so, the prediction coefficients can be determined using the look-up table for the remaining delay T r and the sub-band predictor 103 operates on the sub-band buffer 104 delayed by the integer delay T i . For example, if the period is T = 3.7, the integer delay is T i = 2, and the remaining delay is then T r = 1.7. The predictor can be applied based on the coefficients for T r = 1.7 on the signal buffer, delayed by (additional) T i = 2.

분리 방식은 추출기가 [1.5, 2.5] 또는 [49/32, 81/32]의 범위의 T에 의한 지연을 근사한다는 타당한 가정에 의존한다. 식(36)의 사용과 비교하여 분리 절차의 이점은 예측 계수들이 계산 효율적인 표 검색 동작들에 기초하여 결정될 수 있다는 것이다.The separation scheme depends on a reasonable assumption that the extractor approximates the delay by T in the range [1.5, 2.5] or [49/32, 81/32]. The advantage of the separation procedure in comparison to the use of equation (36) is that the prediction coefficients can be determined based on computationally efficient table retrieval operations.

상기에 개요로 서술된 바와 같이, 짧은 주기들(T < 0.25)에 대하여, 식(29)은 예측 계수들을 결정하기 위해 사용될 수 있다. 대안적으로, (계산 복잡성을 감소시키기 위해) (쉽게 이용가능한) 참조표들을 이용하는 것이 이로울 수 있다. 변경된 시프트 파라미터(φ)가 (T < 0.25에 대하여, 및 C=1, A=1/2에 대하여)

Figure 112015065692244-pct00120
의 샘플링 단차 크기를 갖고 범위 |φ|≤T로 한정되는 것이 관찰된다.As briefly described above, for short periods (T < 0.25), equation (29) can be used to determine the prediction coefficients. Alternatively, it may be advantageous to use (readily available) reference tables (to reduce computational complexity). When the modified shift parameter phi (for T < 0.25 and C = 1, A = 1/2)
Figure 112015065692244-pct00120
Is limited to the range | φ | ≤T.

본 명세서에서, Tl/T을 갖는 변경된 시프트 파라미터(φ)의 크기 조정에 의해 가장 낮은 주기 T=0.25에 대한 참조표를 재사용하는 것이 제안되고, Tl은 참조표가 이용가능한 가장 낮은 주기(예를 들면, Tl = 0.25)에 대응한다. 예로서, T=0.1 및 φ=0.07을 갖고, T=0.25에 대한 표는 재 크기 조정된 시프트 파라미터(

Figure 112015065692244-pct00121
)로 문의될 수 있다. 이를 행함으로써, 짧은 주기들(예를 들면, T<0.25)에 대한 예측 계수들은 또한 표 검색 동작들을 사용하여 계산 효율적인 방식으로 결정될 수 있다. 또한, 참조표들의 수가 감소될 수 있기 때문에, 예측자에 대한 메모리 요구 사항들은 감소될 수 있다.In the present specification it is proposed to reuse the look-up table for the lowest period T = 0.25 by resizing the modified shift parameter φ with T l / T, where T l is the least frequent period For example, Tl = 0.25). For example, with T = 0.1 and phi = 0.07, the table for T = 0.25 shows the resized shift parameter (
Figure 112015065692244-pct00121
). By doing this, prediction coefficients for short periods (e.g., T < 0.25) can also be determined in a computationally efficient manner using table retrieval operations. Also, since the number of lookup tables can be reduced, the memory requirements for the predictor can be reduced.

본 명세서에서, 모델 기반 서브대역 예측 방식이 기술되었다. 모델 기반 서브대역 예측 방식은 서브대역 예측자들의 효율적인 기술, 즉, 비교적 적은 수의 비트들만을 요구하는 기술을 가능하게 한다. 서브대역 예측자들에 대한 효율적인 기술의 결과로서, 교차-서브대역 예측 방식들이 사용될 수 있어 감소된 에일리어싱 아티팩트들을 초래한다. 전체적으로, 이는 서브대역 예측을 사용하여 저 비트 레이트 오디오 코더들의 제공을 허용한다.In this specification, a model-based subband prediction scheme has been described. The model-based subband prediction scheme enables efficient description of subband predictors, i.e., a technique requiring only a relatively small number of bits. As a result of efficient techniques for subband predictors, cross-subband prediction schemes can be used resulting in reduced aliasing artifacts. Overall, this allows the provision of low bit rate audio coders using subband prediction.

101 : 역양자화기 102 : 합성 필터뱅크
103 : 서브대역 예측자 104 : 서브대역 버퍼
105 : 예측자 계산기
101: dequantizer 102: synthesis filter bank
103: Subband predictor 104: Subband buffer
105: Forecaster Calculator

Claims (35)

오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플(615)을 추정하기 위한 방법으로서, 상기 오디오 신호의 상기 제 1 서브대역 신호는 상기 오디오 신호로부터 복수의 서브대역들의 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크(612)를 사용하여 결정되는, 상기 방법에 있어서,
신호 모델의 모델 파라미터(613)를 결정하는 단계;
상기 신호 모델에 기초하여, 상기 모델 파라미터(613)에 기초하여, 및 상기 분석 필터뱅크(612)에 기초하여 상기 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호의 이전 샘플(614)에 적용될 예측 계수를 결정하는 단계로서, 상기 이전 샘플(614)의 타임 슬롯은 상기 제 1 샘플(615)의 타임 슬롯 전인, 상기 예측 계수를 결정하는 단계; 및
상기 이전 샘플(614)에 상기 예측 계수를 적용함으로써 상기 제 1 샘플(615)의 추정치를 결정하는 단계를 포함하고,
상기 예측 계수를 결정하는 단계는 참조표 또는 분석 함수를 사용하여 상기 예측 계수를 결정하는 단계를 포함하고,
상기 참조표 또는 상기 분석 함수는 상기 예측 계수를 상기 모델 파라미터로부터 도출된 파라미터의 함수로서 제공하고,
상기 참조표 또는 상기 분석 함수는 상기 신호 모델에 기초하여 및 상기 분석 필터 뱅크에 기초하여 미리 결정되는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
A method for estimating a first sample (615) of a first subband signal in a first subband of an audio signal, the first subband signal of the audio signal comprising a plurality of subbands of a plurality of subbands Wherein the analysis filter bank is determined using an analysis filter bank (612) comprising a plurality of analysis filters each providing a plurality of band signals,
Determining a model parameter (613) of the signal model;
(614) of the first decoded subband signal derived from the first subband signal based on the model parameter (613) based on the signal model and based on the analysis filter bank (612) Determining a prediction coefficient to be applied to the first sample (614), wherein the time slot of the previous sample (614) is before a time slot of the first sample (615); And
Determining an estimate of the first sample (615) by applying the prediction coefficient to the previous sample (614)
Wherein determining the prediction coefficients comprises determining the prediction coefficients using a reference table or an analysis function,
Wherein the lookup table or the analysis function provides the prediction coefficient as a function of a parameter derived from the model parameter,
Wherein the reference table or the analytic function is predetermined based on the signal model and based on the analysis filter bank.
제 1 항에 있어서,
상기 신호 모델은 하나 이상의 사인파 모델 성분들을 포함하고,
상기 모델 파라미터(613)는 상기 하나 이상의 사인파 모델 성분들의 주파수를 나타내고, 및
선택적으로,
상기 모델 파라미터(613)는 다중 사인파 신호 모델의 기본 주파수(Ω)를 나타내고,
상기 다중 사인파 신호 모델은 주기적 신호 성분을 포함하고,
상기 주기적 신호 성분은 복수의 사인파 성분들을 포함하고,
상기 복수의 사인파 성분들은 상기 기본 주파수(Ω)의 배수인 주파수를 갖는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
The method according to claim 1,
Wherein the signal model comprises one or more sine wave model components,
The model parameter 613 represents the frequency of the one or more sinusoidal model components, and
Optionally,
The model parameter 613 represents the fundamental frequency (?) Of the multi-sinusoidal signal model,
Wherein the multi-sinusoidal signal model comprises a periodic signal component,
Wherein the periodic signal component comprises a plurality of sinusoidal components,
Wherein the plurality of sinusoidal components have a frequency that is a multiple of the fundamental frequency ([Omega]), in the first subband of the audio signal.
제 1 항 또는 제 2 항에 있어서,
상기 모델 파라미터(613)를 결정하는 단계는 상기 모델 파라미터(613) 및 예측 에러 신호를 나타내는 수신된 비트스트림으로부터 상기 모델 파라미터(613)를 추출하는 단계를 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
3. The method according to claim 1 or 2,
Wherein determining the model parameter (613) comprises extracting the model parameter (613) and the model parameter (613) from a received bit stream representing a prediction error signal. A method for estimating a first sample of a first subband signal.
제 1 항 또는 제 2 항에 있어서,
상기 모델 파라미터(613)를 결정하는 단계는 제곱된 예측 에러 신호의 평균값이 감소되도록 상기 모델 파라미터(613)를 결정하는 단계를 포함하고,
상기 예측 에러 신호는 상기 제 1 샘플(615)과 상기 제 1 샘플(615)의 추정치 사이의 차이에 기초하여 결정되고, 및
선택적으로,
상기 제곱된 예측 에러 신호의 상기 평균값은 상기 제 1 서브대역 신호의 복수의 연속하는 제 1 샘플들에 기초하여 결정되는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
3. The method according to claim 1 or 2,
Wherein determining the model parameter (613) comprises determining the model parameter (613) such that an average value of the squared prediction error signal is reduced,
The prediction error signal is determined based on a difference between the estimate of the first sample 615 and the first sample 615,
Optionally,
Wherein the average value of the squared prediction error signal is determined based on a plurality of successive first samples of the first subband signal, estimating a first sample of the first subband signal in a first subband of the audio signal, Lt; / RTI &gt;
제 1 항 또는 제 2 항에 있어서,
상기 모델 파라미터는 다중 사인파 신호 모델의 기본 주파수(Ω)를 나타내고,
상기 예측 계수를 결정하는 단계는 상기 제 1 서브대역 내에 놓인 상기 기본 주파수(Ω)의 배수를 결정하는 단계를 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
3. The method according to claim 1 or 2,
The model parameter represents a fundamental frequency (?) Of a multi-sinusoidal signal model,
Wherein determining the prediction coefficient comprises determining a multiple of the fundamental frequency (OMEGA) lying within the first subband, estimating a first sample of the first subband signal in a first subband of the audio signal, Lt; / RTI &gt;
제 5 항에 있어서,
상기 예측 계수를 결정하는 단계는,
상기 모델 파라미터에 기초하여 복수의 참조표들 중 하나를 선택하는 단계; 및
상기 복수의 참조표들 중 선택된 것에 기초하여 상기 예측 계수를 결정하는 단계를 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
6. The method of claim 5,
Wherein the step of determining the prediction coefficients comprises:
Selecting one of the plurality of look-up tables based on the model parameter; And
And determining the prediction coefficients based on a selected one of the plurality of look-up tables. &Lt; Desc / Clms Page number 21 &gt;
제 6 항에 있어서,
상기 모델 파라미터는 주기성(T)을 나타내고;
상기 복수의 참조표들은 주기성(T)의 상이한 값들에 대한 참조표들을 포함하고;
상기 방법은 상기 선택된 참조표를 상기 모델 파라미터로 나타낸 상기 주기성(T)에 대한 상기 참조표로서 결정하는 단계를 포함하고, 및
선택적으로,
상기 복수의 참조표들은 미리 결정된 단차 크기(ΔT)에서 [Tmin, Tmax]의 범위내 주기성(T)의 상이한 값들에 대한 참조표들을 포함하고;
Tmin은, T < Tmin에 대하여, 상기 오디오 신호가 하나의 사인파 모델 성분을 포함하는 신호 모델을 사용하여 모델링될 수 있는 것이고;
Tmax는, T > Tmax에 대하여, 상기 주기성들(Tmax 내지 Tmax+1)에 대한 참조표들이 상기 주기성(Tmax-1 내지 Tmax)에 대한 상기 참조표들에 대응하는 것인, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
The method according to claim 6,
The model parameter representing a periodicity (T);
The plurality of look-up tables include look-up tables for different values of periodicity (T);
The method comprising the step of determining the selected reference table as the reference table for the periodicity (T) indicated by the model parameter, and
Optionally,
The plurality of look-up tables include look-up tables for different values of periodicity (T) within a range of [T min , T max ] at a predetermined step size? T;
T min is that for T < T min , the audio signal can be modeled using a signal model comprising one sinusoidal model component;
The T max is, T> with respect to the T max, see table for the periodicity of (T max to T max +1) to be corresponding to the reference table for the periodicity (T max to T max -1) , And estimating a first sample of the first subband signal in a first subband of the audio signal.
제 1 항 또는 제 2 항에 있어서,
상기 복수의 서브대역들은 동일한 서브대역 간격을 가짐;
상기 제 1 서브대역은 상기 복수의 서브대역들 중 하나임;
상기 분석 필터뱅크의 상기 분석 필터들은 서로에 관하여 시프트-불변(shift-invariant)임;
상기 분석 필터뱅크의 상기 분석 필터들은 공통 윈도우 함수를 포함함;
상기 분석 필터뱅크의 상기 분석 필터들은 상기 공통 윈도우 함수의 상이하게 변조된 버전들을 포함함;
상기 공통 윈도우 함수는 코사인 함수를 사용하여 변조됨;
상기 공통 윈도우 함수는 유한 지속 기간(K)을 가짐;
상기 분석 필터뱅크의 상기 분석 필터들은 직교 기반을 형성함;
상기 분석 필터뱅크의 상기 분석 필터들은 정규 직교 기반을 형성함;
상기 분석 필터뱅크는 코사인 변조된 필터뱅크를 포함함;
상기 분석 필터뱅크는 임계적으로 샘플링된 필터뱅크임;
상기 분석 필터뱅크는 중첩된 변환을 포함함;
상기 분석 필터뱅크는 MDCT, QMF, 및 ELT 변환 중 하나 이상을 포함함; 및
상기 분석 필터뱅크는 변조 구조를 포함함; 중 하나 이상이 참(true)인, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
3. The method according to claim 1 or 2,
The plurality of subbands having the same subband spacing;
The first subband is one of the plurality of subbands;
Wherein the analysis filters of the analysis filter bank are shift-invariant with respect to each other;
Wherein the analysis filters of the analysis filter bank include a common window function;
Wherein the analysis filters of the analysis filter bank include different modulated versions of the common window function;
The common window function being modulated using a cosine function;
The common window function having a finite duration (K);
The analysis filters of the analysis filter bank forming an orthogonal basis;
The analysis filters of the analysis filter bank forming a normal orthogonal basis;
The analysis filter bank comprising a cosine modulated filter bank;
Said analysis filter bank being a threshold sampled filter bank;
The analysis filter bank comprising a nested transform;
Wherein the analysis filter bank comprises one or more of MDCT, QMF, and ELT transformations; And
The analysis filter bank comprising a modulation structure; Band signal in the first sub-band of the audio signal, wherein at least one of the first sub-band signal and the second sub-band signal is true.
오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법으로서, 상기 오디오 신호의 상기 제 1 서브대역 신호는 상기 오디오 신호로부터 복수의 서브대역들의 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정되고, 상기 분석 필터뱅크는 임계적으로 샘플링된 필터뱅크인, 상기 방법에 있어서,
복수의 예측 마스크 지원 서브대역들의 복수의 이전 샘플들을 나타내는 예측 마스크(203, 205)를 결정하는 단계로서, 상기 복수의 예측 마스크 지원 서브대역들은 상기 제 1 서브대역과 상이한 상기 복수의 서브대역들 중 적어도 하나를 포함하는, 상기 예측 마스크(203, 205)를 결정하는 단계;
상기 복수의 이전 샘플들에 적용될 복수의 예측 계수들을 결정하는 단계; 및
상기 복수의 이전 샘플들에 상기 복수의 예측 계수들을 각각 적용함으로써 상기 제 1 샘플의 추정치를 결정하는 단계를 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
A method for estimating a first sample of a first subband signal in a first subband of an audio signal, the first subband signal of the audio signal comprising a plurality of subband signals of a plurality of subband Wherein the analysis filter bank is determined using an analysis filter bank comprising a plurality of analysis filters each providing a plurality of analysis filters,
Determining a prediction mask (203, 205) indicative of a plurality of previous samples of a plurality of prediction mask support subbands, wherein the plurality of prediction mask support subbands comprises one of the plurality of subbands different from the first subband Determining the prediction mask (203, 205), the prediction mask comprising at least one;
Determining a plurality of prediction coefficients to be applied to the plurality of previous samples; And
Estimating a first sample of a first subband signal in a first subband of the audio signal, and determining an estimate of the first sample by applying each of the plurality of prediction coefficients to the plurality of previous samples, Way.
제 9 항에 있어서,
상기 복수의 예측 마스크 지원 서브대역들은:
상기 제 1 서브대역을 포함하거나;
상기 제 1 서브대역에 직접 인접한 상기 복수의 서브대역들 중 하나 이상을 포함하거나;
상기 제 1 서브대역 및 상기 제 1 서브대역에 직접 인접한 상기 복수의 서브대역들 중 하나 이상을 포함하는, 오디오 신호의 제 1 서브대역에서 제 1 서브대역 신호의 제 1 샘플을 추정하기 위한 방법.
10. The method of claim 9,
Wherein the plurality of prediction mask support subbands are:
The first sub-band;
At least one of the plurality of subbands directly adjacent to the first subband;
Wherein the first subband includes one or more of the plurality of subbands directly adjacent to the first subband and the first subband.
오디오 신호를 인코딩하기 위한 방법에 있어서,
복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 상기 오디오 신호로부터 복수의 서브대역 신호들을 결정하는 단계;
제 1 항, 제 2 항, 제 9 항, 또는 제 10 항 중 어느 한 항의 방법을 사용하여 상기 복수의 서브대역 신호들의 샘플들을 추정하여, 그에 의해 복수의 추정된 서브대역 신호들을 산출하는 단계;
상기 복수의 서브대역 신호들의 대응하는 샘플들 및 상기 복수의 추정된 서브대역 신호들의 샘플들에 기초하여 복수의 예측 에러 서브대역 신호들의 샘플들을 결정하는 단계;
상기 복수의 예측 에러 서브대역 신호들을 양자화하는 단계; 및
상기 복수의 양자화된 예측 에러 서브대역 신호들 및 상기 복수의 추정된 서브대역 신호들의 상기 샘플들을 추정하기 위해 사용된 하나 이상의 파라미터들을 나타내는 인코딩된 오디오 신호를 생성하는 단계를 포함하는, 오디오 신호를 인코딩하기 위한 방법.
A method for encoding an audio signal,
Determining a plurality of subband signals from the audio signal using an analysis filter bank comprising a plurality of analysis filters;
16. A method comprising: estimating samples of the plurality of subband signals using the method of any one of claims 1, 2, 9, or 10, thereby yielding a plurality of estimated subband signals;
Determining samples of a plurality of prediction error subband signals based on corresponding samples of the plurality of subband signals and samples of the plurality of estimated subband signals;
Quantizing the plurality of prediction error subband signals; And
Generating an encoded audio signal representative of one or more parameters used to estimate the plurality of quantized prediction error subband signals and the samples of the plurality of estimated subband signals, Lt; / RTI &gt;
인코딩된 오디오 신호를 디코딩하기 위한 방법으로서, 상기 인코딩된 오디오 신호는 복수의 양자화된 예측 에러 서브대역 신호들 및 상기 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용될 하나 이상의 파라미터들을 나타내는, 상기 디코딩하기 위한 방법에 있어서,
상기 복수의 양자화된 예측 에러 서브대역 신호들을 반양자화하여, 복수의 반양자화된 예측 에러 서브대역 신호들을 산출하는 단계;
제 1 항, 제 2 항, 제 9 항, 또는 제 10 항 중 어느 한 항의 방법을 사용하여 상기 복수의 추정된 서브대역 신호들의 샘플들을 추정하는 단계;
상기 복수의 추정된 서브대역 신호들의 대응하는 샘플들 및 상기 복수의 반양자화된 예측 에러 서브대역 신호들의 샘플들에 기초하여 복수의 디코딩된 서브대역 신호들의 샘플들을 결정하는 단계; 및
상기 복수의 합성 필터들을 포함하는 합성 필터뱅크를 사용하여 상기 복수의 디코딩된 서브대역 신호들로부터 디코딩된 오디오 신호를 결정하는 단계를 포함하는, 인코딩된 오디오 신호를 디코딩하기 위한 방법.
A method for decoding an encoded audio signal, the encoded audio signal comprising a plurality of quantized prediction error subband signals and one or more parameters to be used to estimate samples of the plurality of estimated subband signals, A method for decoding, comprising:
Semi-quantizing the plurality of quantized prediction error subband signals to produce a plurality of semi-quantized prediction error subband signals;
Estimating samples of the plurality of estimated subband signals using the method of any one of claims 1, 2, 9, or 10;
Determining samples of a plurality of decoded subband signals based on corresponding samples of the plurality of estimated subband signals and samples of the plurality of semi-quantized prediction error subband signals; And
And determining a decoded audio signal from the plurality of decoded subband signals using a synthesis filter bank comprising the plurality of synthesis filters.
오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템(103, 105)으로서, 상기 오디오 신호의 상기 제 1 서브대역 신호는 상기 오디오 신호로부터 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정되는, 상기 시스템(103, 105)에 있어서,
신호 모델의 모델 파라미터를 결정하도록 구성되고 상기 제 1 서브대역 신호로부터 도출된 제 1 디코딩된 서브대역 신호의 하나 이상의 이전 샘플들에 적용될 하나 이상의 예측 계수들을 결정하도록 구성된 예측자 계산기(105)로서, 상기 하나 이상의 예측 계수들은, 상기 신호 모델에 기초하여, 상기 모델 파라미터에 기초하여, 및 상기 분석 필터뱅크에 기초하여 결정되고, 상기 하나 이상의 이전 샘플들의 타임 슬롯들은 상기 하나 이상의 제 1 샘플들의 타임 슬롯들 전인, 상기 예측자 계산기(105); 및
상기 하나 이상의 예측 계수들을 상기 하나 이상의 이전 샘플들에 적용함으로써 상기 하나 이상의 제 1 샘플들의 추정치를 결정하도록 구성된 서브대역 예측자(103)를 포함하고,
상기 예측 계수를 결정하는 단계는 참조표 또는 분석 함수를 사용하여 상기 예측 계수를 결정하는 단계를 포함하고,
상기 참조표 또는 상기 분석 함수는 상기 예측 계수를 상기 모델 파라미터로부터 도출된 파라미터의 함수로서 제공하고,
상기 참조표 또는 상기 분석 함수는 상기 신호 모델에 기초하여 및 상기 분석 필터 뱅크에 기초하여 미리 결정되는, 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템.
A system (103, 105) configured to estimate one or more first samples of a first subband signal of an audio signal, the first subband signal of the audio signal providing a plurality of subband signals The system (103, 105) as defined in claim 1, wherein the system is determined using an analysis filter bank comprising a plurality of analysis filters,
A predictor calculator (105) configured to determine a model parameter of a signal model and to determine one or more prediction coefficients to be applied to one or more previous samples of a first decoded subband signal derived from the first subband signal, Wherein the one or more prediction coefficients are determined based on the model parameters and based on the analysis filter bank based on the signal model and wherein the timeslots of the one or more previous samples are time slots of the one or more first samples The predictor calculator 105; And
And a subband predictor (103) configured to determine an estimate of the one or more first samples by applying the one or more prediction coefficients to the one or more previous samples,
Wherein determining the prediction coefficients comprises determining the prediction coefficients using a reference table or an analysis function,
Wherein the lookup table or the analysis function provides the prediction coefficient as a function of a parameter derived from the model parameter,
Wherein the reference table or the analysis function is configured to estimate one or more first samples of a first subband signal of an audio signal that is predetermined based on the signal model and based on the analysis filter bank.
오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템(103, 105)으로서, 상기 제 1 서브대역 신호는 제 1 서브대역에 대응하고, 상기 제 1 서브대역 신호는 복수의 서브대역들에서 복수의 서브대역 신호들을 각각 제공하는 복수의 분석 필터들을 포함하는 분석 필터뱅크를 사용하여 결정되고, 상기 분석 필터뱅크는 임계적으로 샘플링된 필터뱅크인, 상기 시스템(103, 105)에 있어서,
복수의 예측 마스크 지원 서브대역들에서 복수의 이전 샘플들을 나타내는 예측 마스크(203, 205)를 결정하도록 구성된 예측자 계산기(105)로서, 상기 복수의 예측 마스크 지원 서브대역들은 상기 제 1 서브대역과 상이한 상기 복수의 서브대역들 중 적어도 하나를 포함하고, 상기 예측자 계산기(105)는 또한 상기 복수의 이전 샘플들에 적용될 복수의 예측 계수들을 결정하도록 구성되는, 상기 예측자 계산기(105); 및
상기 복수의 예측 계수들을 상기 복수의 이전 샘플들에 각각 적용함으로써 상기 하나 이상의 제 1 샘플들의 추정치를 결정하도록 구성된 서브대역 예측자(103)를 포함하는, 오디오 신호의 제 1 서브대역 신호의 하나 이상의 제 1 샘플들을 추정하도록 구성된 시스템.
A system (103, 105) configured to estimate one or more first samples of a first subband signal of an audio signal, the first subband signal corresponding to a first subband and the first subband signal comprising a plurality The system (103, 105) being determined using an analysis filter bank comprising a plurality of analysis filters each of which provides a plurality of subband signals in subbands, the analysis filterbank being a critically sampled filter bank, In this case,
A predictor calculator (105) configured to determine a prediction mask (203, 205) representative of a plurality of previous samples in a plurality of prediction mask support subbands, the plurality of prediction mask support subbands being different from the first subband Wherein the predictor calculator (105) is further configured to determine a plurality of prediction coefficients to be applied to the plurality of previous samples, the predictor calculator (105) comprising: at least one of the plurality of subbands; And
And a subband predictor (103) configured to determine an estimate of the one or more first samples by applying the plurality of prediction coefficients to the plurality of previous samples, respectively, And to estimate the first samples.
오디오 신호를 인코딩하도록 구성된 오디오 인코더에 있어서,
복수의 분석 필터들을 사용하여 상기 오디오 신호로부터 복수의 서브대역 신호들을 결정하도록 구성된 분석 필터뱅크;
상기 복수의 서브대역 신호들의 샘플들을 추정하여, 복수의 추정된 서브대역 신호들(112)을 산출하도록 구성된 제 13 항 또는 제 14 항에 따른 시스템(103, 105);
상기 복수의 서브대역 신호들 및 상기 복수의 추정된 서브대역 신호들(112)의 대응하는 샘플들에 기초하여 복수의 예측 에러 서브대역 신호들의 샘플들을 결정하도록 구성된 차이 유닛;
상기 복수의 예측 에러 서브대역 신호들을 양자화하도록 구성된 양자화 유닛; 및
상기 복수의 양자화된 예측 에러 서브대역 신호들 및 상기 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 하나 이상의 파라미터들을 나타내는 인코딩된 오디오 신호를 생성하도록 구성된 비트스트림 생성 유닛을 포함하는, 오디오 인코더.
An audio encoder configured to encode an audio signal,
An analysis filter bank configured to determine a plurality of subband signals from the audio signal using a plurality of analysis filters;
A system (103, 105) according to claim 13 or 14 configured to estimate samples of the plurality of subband signals to produce a plurality of estimated subband signals (112);
A difference unit configured to determine samples of a plurality of prediction error subband signals based on the plurality of subband signals and corresponding samples of the plurality of estimated subband signals 112;
A quantization unit configured to quantize the plurality of prediction error subband signals; And
A bitstream generation unit configured to generate an encoded audio signal representing one or more parameters used to estimate the plurality of quantized prediction error subband signals and samples of the plurality of estimated subband signals, Encoder.
인코딩된 오디오 신호를 디코딩하도록 구성된 오디오 디코더(100)로서, 상기 인코딩된 오디오 신호는 복수의 양자화된 예측 에러 서브대역 신호들 및 복수의 추정된 서브대역 신호들의 샘플들을 추정하기 위해 사용된 하나 이상의 파라미터들을 나타내는, 상기 오디오 디코더(100)에 있어서,
상기 복수의 양자화된 예측 에러 서브대역 신호들을 반양자화하여, 복수의 반양자화된 예측 에러 서브대역 신호들(111)을 산출하도록 구성된 역 양자화기(101);
상기 복수의 추정된 서브대역 신호들(112)의 샘플들을 추정하도록 구성된 제 13 항 또는 제 14 항에 따른 시스템(105, 103);
상기 복수의 추정된 서브대역 신호들(112)의 대응하는 샘플들에 기초하여 및 상기 복수의 반양자화된 예측 에러 서브대역 신호들(111)의 샘플들에 기초하여 복수의 디코딩된 서브대역 신호들(113)의 샘플들을 결정하도록 구성된 합산 유닛; 및
복수의 합성 필터들을 사용하여 상기 복수의 디코딩된 서브대역 신호들(113)로부터 디코딩된 오디오 신호(114)를 결정하도록 구성된 합성 필터뱅크(102)를 포함하는, 오디오 디코더.
An audio decoder (100) configured to decode an encoded audio signal, the encoded audio signal comprising one or more parameters used to estimate a plurality of quantized prediction error subband signals and samples of a plurality of estimated subband signals , The audio decoder (100) comprising:
An inverse quantizer (101) configured to semi-quantize the plurality of quantized prediction error subband signals to produce a plurality of semi-quantized prediction error subband signals (111);
A system (105,103) according to claim 13 or 14 configured to estimate samples of the plurality of estimated subband signals (112);
Based on samples of the plurality of estimated subband signals (112) and a plurality of decoded subband signals (112) based on samples of the plurality of semi-quantized prediction error subband signals (111) A summation unit configured to determine the samples of the input signal (113); And
And a synthesis filter bank (102) configured to determine an audio signal (114) decoded from the plurality of decoded subband signals (113) using a plurality of synthesis filters.
삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete
KR1020157018150A 2013-01-08 2014-01-07 Model based prediction in a critically sampled filterbank KR101634979B1 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361750052P 2013-01-08 2013-01-08
US61/750,052 2013-01-08
US201361875528P 2013-09-09 2013-09-09
US61/875,528 2013-09-09
PCT/EP2014/050139 WO2014108393A1 (en) 2013-01-08 2014-01-07 Model based prediction in a critically sampled filterbank

Publications (2)

Publication Number Publication Date
KR20150099770A KR20150099770A (en) 2015-09-01
KR101634979B1 true KR101634979B1 (en) 2016-06-30

Family

ID=50000954

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157018150A KR101634979B1 (en) 2013-01-08 2014-01-07 Model based prediction in a critically sampled filterbank

Country Status (20)

Country Link
US (8) US9659567B2 (en)
EP (5) EP3176784B1 (en)
JP (7) JP6173484B2 (en)
KR (1) KR101634979B1 (en)
CN (2) CN107452392B (en)
AU (6) AU2014204954B2 (en)
BR (2) BR122017000308B1 (en)
CA (8) CA3012134C (en)
DK (1) DK2943953T3 (en)
ES (3) ES2769845T3 (en)
HK (1) HK1213081A1 (en)
HU (1) HUE032831T2 (en)
IL (10) IL309437A (en)
IN (1) IN2015MN01874A (en)
MX (5) MX362990B (en)
MY (2) MY173781A (en)
PL (1) PL2943953T3 (en)
RU (2) RU2742460C2 (en)
SG (2) SG10201709631PA (en)
WO (1) WO2014108393A1 (en)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2559899C2 (en) 2010-04-09 2015-08-20 Долби Интернешнл Аб Mdct-based complex prediction stereo coding
EP3671738B1 (en) 2013-04-05 2024-06-05 Dolby International AB Audio encoder and decoder
KR102072365B1 (en) 2013-04-05 2020-02-03 돌비 인터네셔널 에이비 Advanced quantizer
JP6543838B2 (en) * 2014-08-28 2019-07-17 株式会社緑野リサーチ Phase imaging apparatus and restoration method thereof
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3454336B1 (en) 2017-09-12 2020-11-04 Dolby Laboratories Licensing Corporation Packet loss concealment for critically-sampled filter bank-based codecs using multi-sinusoidal detection
CN110068771B (en) * 2019-05-28 2020-02-07 山东大学 High-precision battery model parameter identification method and system based on output response reconstruction
CN110849971B (en) * 2019-11-21 2021-05-18 西南交通大学 Structural modal parameter identification method based on double-exponential window function method
CN113452472B (en) * 2020-03-26 2024-05-31 瑞昱半导体股份有限公司 Packet detection method and system for wireless signals
US11348594B2 (en) 2020-06-11 2022-05-31 Qualcomm Incorporated Stream conformant bit error resilience
CN112259116B (en) * 2020-10-14 2024-03-15 北京字跳网络技术有限公司 Noise reduction method and device for audio data, electronic equipment and storage medium
CN115598489B (en) * 2021-06-28 2024-04-05 本源量子计算科技(合肥)股份有限公司 Quantum bit parameter measuring method and device and quantum chip testing method
CN114454237B (en) * 2022-02-18 2024-05-14 杭州勤鹄科技有限公司 Fixed-length cutting device and method for pearl cotton
CN117610313B (en) * 2024-01-18 2024-04-26 西安石油大学 Mesh encryption method and device for artificial cracks of shale reservoir

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62227198A (en) * 1986-03-28 1987-10-06 松下電器産業株式会社 Band division forecast encoding system
DE69515907T2 (en) * 1994-12-20 2000-08-17 Dolby Lab Licensing Corp METHOD AND DEVICE FOR APPLYING WAVEFORM PREDICTION TO PARTIAL TAPES IN A PERCEPTIVE ENCODING SYSTEM
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP2891193B2 (en) * 1996-08-16 1999-05-17 日本電気株式会社 Wideband speech spectral coefficient quantizer
FI114248B (en) 1997-03-14 2004-09-15 Nokia Corp Method and apparatus for audio coding and audio decoding
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP4220108B2 (en) * 2000-06-26 2009-02-04 大日本印刷株式会社 Acoustic signal coding system
FR2815160B1 (en) 2000-10-06 2003-01-17 France Telecom METHOD AND DEVICE FOR CODING AN AUDIO FREQUENCY SIGNAL
US6633839B2 (en) * 2001-02-02 2003-10-14 Motorola, Inc. Method and apparatus for speech reconstruction in a distributed speech recognition system
US7225135B2 (en) * 2002-04-05 2007-05-29 Lectrosonics, Inc. Signal-predictive audio transmission system
JP4218271B2 (en) * 2002-07-19 2009-02-04 ソニー株式会社 Data processing apparatus, data processing method, program, and recording medium
US20040252772A1 (en) * 2002-12-31 2004-12-16 Markku Renfors Filter bank based signal processing
US7277550B1 (en) * 2003-06-24 2007-10-02 Creative Technology Ltd. Enhancing audio signals by nonlinear spectral operations
ATE425533T1 (en) * 2003-07-18 2009-03-15 Koninkl Philips Electronics Nv LOW BIT RATE AUDIO ENCODING
WO2005055201A1 (en) * 2003-12-01 2005-06-16 Aic A highly optimized method for modelling a windowed signal
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US20060015329A1 (en) * 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
WO2006048814A1 (en) * 2004-11-02 2006-05-11 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
JP2006211243A (en) 2005-01-27 2006-08-10 Kobe Steel Ltd Device and method for digital signal encoding
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
JP4876574B2 (en) * 2005-12-26 2012-02-15 ソニー株式会社 Signal encoding apparatus and method, signal decoding apparatus and method, program, and recording medium
JP2009543112A (en) * 2006-06-29 2009-12-03 エヌエックスピー ビー ヴィ Decoding speech parameters
JP4704499B2 (en) * 2006-07-04 2011-06-15 ドルビー インターナショナル アクチボラゲット Filter compressor and method for producing a compressed subband filter impulse response
FR2912249A1 (en) 2007-02-02 2008-08-08 France Telecom Time domain aliasing cancellation type transform coding method for e.g. audio signal of speech, involves determining frequency masking threshold to apply to sub band, and normalizing threshold to permit spectral continuity between sub bands
GB2441835B (en) * 2007-02-07 2008-08-20 Sonaptic Ltd Ambient noise reduction system
KR101149448B1 (en) * 2007-02-12 2012-05-25 삼성전자주식회사 Audio encoding and decoding apparatus and method thereof
US8195454B2 (en) * 2007-02-26 2012-06-05 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
KR101380170B1 (en) * 2007-08-31 2014-04-02 삼성전자주식회사 A method for encoding/decoding a media signal and an apparatus thereof
CN101816191B (en) 2007-09-26 2014-09-17 弗劳恩霍夫应用研究促进协会 Apparatus and method for extracting an ambient signal
EP2082396A1 (en) * 2007-10-17 2009-07-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
EP2077551B1 (en) 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
EP2269188B1 (en) * 2008-03-14 2014-06-11 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
BR122020009727B1 (en) * 2008-05-23 2021-04-06 Koninklijke Philips N.V. METHOD
ES2401487T3 (en) * 2008-07-11 2013-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and procedure for encoding / decoding an audio signal using a foreign signal generation switching scheme
ES2379761T3 (en) 2008-07-11 2012-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Provide a time distortion activation signal and encode an audio signal with it
MX2011000375A (en) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Audio encoder and decoder for encoding and decoding frames of sampled audio signal.
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
CN102113346B (en) * 2008-07-29 2013-10-30 杜比实验室特许公司 Method for adaptive control and equalization of electroacoustic channels
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
CN101646123B (en) * 2009-08-28 2012-09-05 中国科学院声学研究所 Filter bank simulating auditory perception model
ES2374008B1 (en) * 2009-12-21 2012-12-28 Telefónica, S.A. CODING, MODIFICATION AND SYNTHESIS OF VOICE SEGMENTS.
EP2362375A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
WO2011118018A1 (en) * 2010-03-26 2011-09-29 株式会社フィールドシステム Sending device
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
CN102088603B (en) * 2010-12-31 2013-12-04 北京大学深圳研究生院 Entropy coder for video coder and implementation method thereof
US20120245927A1 (en) * 2011-03-21 2012-09-27 On Semiconductor Trading Ltd. System and method for monaural audio processing based preserving speech information
EP2530840B1 (en) * 2011-05-30 2014-09-03 Harman Becker Automotive Systems GmbH Efficient sub-band adaptive FIR-filtering
CN107326559A (en) 2017-06-09 2017-11-07 杭州慧群机电设备有限公司 A kind of pearl embroidery polychrome changes pearl device

Also Published As

Publication number Publication date
IL239444B (en) 2018-04-30
AU2023203057B2 (en) 2024-05-02
CN104919523A (en) 2015-09-16
US10102866B2 (en) 2018-10-16
US9659567B2 (en) 2017-05-23
IL268510B (en) 2020-09-30
IL258153B (en) 2018-12-31
AU2017216470B2 (en) 2019-08-15
SG10201709631PA (en) 2018-01-30
CN107452392B (en) 2020-09-01
CA3012134C (en) 2019-10-15
US9892741B2 (en) 2018-02-13
RU2636093C2 (en) 2017-11-20
HK1213081A1 (en) 2016-06-24
CN104919523B (en) 2017-10-13
IL302061B2 (en) 2024-05-01
JP2024038279A (en) 2024-03-19
CA3092138A1 (en) 2014-07-17
CN107452392A (en) 2017-12-08
IN2015MN01874A (en) 2015-08-28
BR112015016275B1 (en) 2021-02-02
HUE032831T2 (en) 2017-11-28
EP3176784B1 (en) 2020-01-01
US20190013034A1 (en) 2019-01-10
DK2943953T3 (en) 2017-01-30
AU2019264642A1 (en) 2019-12-05
WO2014108393A1 (en) 2014-07-17
US10325608B2 (en) 2019-06-18
IL239444A0 (en) 2015-07-30
IL283412B (en) 2022-03-01
CA3054712A1 (en) 2014-07-17
CA3121651A1 (en) 2014-07-17
US20170221492A1 (en) 2017-08-03
MX370086B (en) 2019-11-29
EP3648104B1 (en) 2021-05-19
ES2769845T3 (en) 2020-06-29
AU2017216470A1 (en) 2017-08-31
RU2015127216A (en) 2017-01-16
IL296350A (en) 2022-11-01
JP2023082175A (en) 2023-06-13
JP6530787B2 (en) 2019-06-12
JP2019152875A (en) 2019-09-12
EP3893240B1 (en) 2024-04-24
JP6592634B2 (en) 2019-10-16
US20160189720A1 (en) 2016-06-30
MX2022013536A (en) 2022-11-16
RU2742460C2 (en) 2021-02-08
JP6173484B2 (en) 2017-08-02
IL302061B1 (en) 2024-01-01
MX342822B (en) 2016-10-13
US20230306974A1 (en) 2023-09-28
EP4372602A3 (en) 2024-07-10
IL283412A (en) 2021-07-29
ES2613747T3 (en) 2017-05-25
EP4372602A2 (en) 2024-05-22
JP2017201415A (en) 2017-11-09
AU2014204954A1 (en) 2015-07-02
RU2017134071A (en) 2019-02-07
CA2897321A1 (en) 2014-07-17
MY173781A (en) 2020-02-20
CA3140749C (en) 2024-05-14
MX2015008659A (en) 2015-10-12
IL290600B (en) 2022-10-01
US11651777B2 (en) 2023-05-16
CA3012134A1 (en) 2014-07-17
JP7418637B2 (en) 2024-01-19
CA3076775A1 (en) 2014-07-17
BR122017000308A2 (en) 2019-09-03
US10573330B2 (en) 2020-02-25
JP2022043233A (en) 2022-03-15
IL268510A (en) 2019-09-26
US20200258532A1 (en) 2020-08-13
JP2016507776A (en) 2016-03-10
MX362990B (en) 2019-03-01
US20210287686A1 (en) 2021-09-16
EP2943953B1 (en) 2016-11-16
IL296350B1 (en) 2023-05-01
AU2019264642B2 (en) 2020-10-08
AU2021200013B2 (en) 2021-12-16
US20190259401A1 (en) 2019-08-22
AU2022201676A1 (en) 2022-03-31
CA3234476A1 (en) 2014-07-17
IL262551A (en) 2018-12-31
AU2021200013A1 (en) 2021-02-25
AU2022201676B2 (en) 2023-02-23
EP3893240A1 (en) 2021-10-13
EP3648104A1 (en) 2020-05-06
IL277117A (en) 2020-10-29
JP7053545B6 (en) 2022-05-16
RU2017134071A3 (en) 2020-11-24
CA3076775C (en) 2020-10-27
IL258153A (en) 2018-05-31
ES2880252T3 (en) 2021-11-24
AU2023203057A1 (en) 2023-06-08
CA3121651C (en) 2022-01-18
BR112015016275A2 (en) 2017-07-11
AU2014204954B2 (en) 2017-05-18
SG11201504705SA (en) 2015-07-30
EP2943953A1 (en) 2015-11-18
US11915713B2 (en) 2024-02-27
IL309437A (en) 2024-02-01
PL2943953T3 (en) 2017-07-31
CA2897321C (en) 2018-09-04
US20180108366A1 (en) 2018-04-19
JP7053545B2 (en) 2022-04-12
CA3054712C (en) 2020-06-09
IL296350B2 (en) 2023-09-01
MY193865A (en) 2022-10-29
IL290600A (en) 2022-04-01
BR122017000308B1 (en) 2021-11-16
EP3176784A1 (en) 2017-06-07
CA3092138C (en) 2021-07-20
US10971164B2 (en) 2021-04-06
MX2019014295A (en) 2020-01-27
JP7258118B2 (en) 2023-04-14
IL290600B2 (en) 2023-02-01
IL302061A (en) 2023-06-01
KR20150099770A (en) 2015-09-01
IL277117B (en) 2021-07-29
CA3140749A1 (en) 2014-07-17
IL262551B (en) 2019-08-29
JP2020008875A (en) 2020-01-16

Similar Documents

Publication Publication Date Title
KR101634979B1 (en) Model based prediction in a critically sampled filterbank
RU2820849C2 (en) Model-based prediction in set of filters with critical sampling

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190613

Year of fee payment: 4