KR100701452B1 - 스펙트럼 모델링 - Google Patents

스펙트럼 모델링 Download PDF

Info

Publication number
KR100701452B1
KR100701452B1 KR1020027000641A KR20027000641A KR100701452B1 KR 100701452 B1 KR100701452 B1 KR 100701452B1 KR 1020027000641 A KR1020027000641 A KR 1020027000641A KR 20027000641 A KR20027000641 A KR 20027000641A KR 100701452 B1 KR100701452 B1 KR 100701452B1
Authority
KR
South Korea
Prior art keywords
parameters
spectrum
filter
noise
audio signal
Prior art date
Application number
KR1020027000641A
Other languages
English (en)
Other versions
KR20020015377A (ko
Inventor
덴브린커알베르투스씨
우멘아놀더스더블유제이
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20020015377A publication Critical patent/KR20020015377A/ko
Application granted granted Critical
Publication of KR100701452B1 publication Critical patent/KR100701452B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10046Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10305Improvement or modification of read or write signals signal quality assessment
    • G11B20/10398Improvement or modification of read or write signals signal quality assessment jitter, timing deviations or phase and frequency errors
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/24Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0255Filters based on statistics
    • H03H17/0258ARMA filters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
    • G11B2020/10583Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account parameters controlling audio interpolation processes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Noise Elimination (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

타겟 스펙트럼(S)를 모델링하는 것은 상기 타겟 스펙트럼(S)을 근사화하는 주파수 응답을 갖는 필터의 필터 파라미터들(pi,qi)을 결정함으로써 제공되며, 상기 타겟 스펙트럼은 적어도 제 1 부분 및 제 2 부분으로 분할되고, 제 1 모델링 동작은 자동-회귀 파라미터들을 획득하기 위해 타겟 스펙트럼의 제 1 부분에 대해 사용되고, 제 2 모델링 동작은 이동-평균 파라미터들을 획득하기 위해 타겟 스펙트럼의 제 2 부분에 대해 사용되며, 자동-회귀 파라미터들 및 이동-평균 파라미터들은 필터 파라미터들을 획득하기 위해 조합된다. 본 발명은 오디오 코딩에 적용되는 것이 바람직하며, 신호(A) 내의 잡음 성분(S)의 스펙트럼이 모델링된다.
타겟 스펙트럼, 필터 파라미터, 자동-회귀 파라미터, 이동-평균 파라미터, 잡음 성분

Description

스펙트럼 모델링{Spectrum modeling}
본 발명은 타겟 스펙트럼(target spectrum)을 근사화하는 주파수 응답(frequency response)을 갖는 필터의 필터 파라미터들을 결정함으로써 타겟 스펙트럼을 모델링하는 것에 관한 것이다.
1997년 뉴저지주, 프렌티스 홀사가 출판하고, 저자가 P.Stoica 및 R.L.Moses인 '스펙트럼 분석 개론'의 101-108페이지에 유리 스펙트럼들(rational spectra)을 모델링하기 위한 파라메트릭 방법들(parametric methods)이 공개되어 있다. 일반적으로, 이동-평균(Moving-Average; MA) 신호가 전체-영점 필터(all-zero filter)로 백색 잡음을 필터링함으로써 획득된다. 이러한 전체-영점 구조 때문에, MA 차수가 '충분히 큰(sufficiently large)' 것으로 선택되지 않을 경우, 뾰족한 피크들을 갖는 스펙트럼을 모델링하기 위해 MA 방정식을 사용하는 것은 불가능하다. 이것은, 상당히 낮은 모델 차수들을 사용함으로써 협대역 스펙트럼들을 모델링하기 위한 자동-회귀(Auto-Regressive; AR) 또는 전체-극점(all-pole) 방정식의 기능에 대조되는 것이다. MA 모델은 넓은 피크들 및 뾰족한 널(null)들을 특징으로 하는 그 스펙트럼들에 대한 훌륭한 근사화를 제공한다. 그러한 스펙트럼들은 협대역 스펙트럼들보다 응용들에서 덜 빈번하게 마주치므로, 스펙트럼 추정에 MA 신호 모델을 사용하는 것은, 다소 공학적 관심이 제한된다. 이러한 제한된 관심에 대한 또 다른 이유는, MA 파라미터 추정 문제가 근본적으로 비선형이며, AR 파라미터 추정 문제보다 해결하기 상당히 어렵다는 것이다. 어느 경우에도, MA 및 ARMA 추정 문제들에서 어려움의 유형들이 아주 유사하다.
뾰족한 피크들 및 깊은 널들 모두를 갖는 스펙트럼들은 합리적으로 작은 차수들의 AR 또는 MA 방정식들에 의해 모델링될 수 없다. 이것은, 극점-영점(pole-zero) 모델이라고도 불리는 보다 일반적인 ARMA 모델이 유익한 경우에 속한다. 그러나, ARMA 스펙트럼 추정의 큰 초기 전망은 어느 정도 감소하는데, ARMA 파라미터 추정에 대한 이론적이고 실용적인 관점에서의 어떤 잘 정립된 알고리즘이 없기 때문이다. '이론적으로 최적의 ARMA 추정기들'은 전체적인 수렴이 보증되지 않은 반복 절차들에 기초한다. '실용적인 ARMA 추정기들'은 계산이 간단하고 거의 신뢰할 수 있지만, 그들의 통계적 정확성은 몇몇 경우들에 열악할 수 있다. 종래 기술은 두 단계의 모델들을 개시하는데, 먼저, AR 추정이 수행되고, 그 후에, MA 추정이 수행된다. 두 가지 방법 모두는, ARMA 모델 기술의 극점들 및 영점들이 단위원 부근의 위치들에서 서로 근접하게 이격되는 경우에서 추정들이 부정확하거나 높은 계산 노력을 요구한다. 절대값이 1에 가깝고, 거의 일치하는 극점들 및 영점들을 갖는 ARMA 모델들은 협대역 신호들에 대응한다. 두가지 방법들에서, 영점들의 추정은 비선형 최적화 문제로 바뀐다.
본 발명의 목적은 보다 덜 복잡한 ARMA 스펙트럼 모델링을 제공하는 것이다. 이를 위해, 본 발명은 독립항들에서 정의된 바와 같이, 타겟 스펙트럼을 모델링하기 위한 방법 및 장치, 오디오 신호를 인코딩하는 방법, 인코딩된 오디오 신호를 디코딩하는 방법, 오디오 인코더, 오디오 재생기, 오디오 시스템, 인코딩된 오디오 신호 및 저장 매체를 제공한다.
본 발명의 제 1 실시예에서, 모델링될 스펙트럼은 제 1 부분과 제 2 부분으로 분할되고, 제 1 부분은 자동-회귀 파라미터들을 획득하기 위해 제 1 모델에 의해 모델링되고, 제 2 부분은 이동-평균 파라미터들을 획득하기 위해 제 2 모델에 의해 모델링된다. 이러한 구성 프로세스들(constituent processes)의 조합은 정확한 ARMA 모델을 제공한다. 분할(splitting)은 반복 절차로 수행되는 것이 바람직하다. 본 발명에 따른 방법에서, 비선형 최적화 문제는 생략될 수 있다.
본 발명은 실시간 수행에 적절한 ARMA 모델 추정치를 제공한다. 본 발명은, AR 또는 MA 모델들이 파워 스펙트럼 추정의 정보를 전달하는데, 언제나 충분히 정확하거나 경제적인 것은 아님을 인식한다. 대수적 스케일 상에서, 선형 예측 코딩(LPC: Linear Predictive Coding) 방법들(전체-극점 모델링)에 의해, 함수들의 피크들은 보통 잘 모델링되지만, 밸리(valley)들은 낮게 추정(under-estimated)된다. 그 역은 전체-영점 모델에서 발생한다. 본 발명의 바람직한 응용 분야인 오디오 및 음성 코딩에서, 대수적 스케일이 선형 스케일보다 더 적절하다. 따라서, 대수적 스케일 상의 파워 스펙트럼에 적합한 것이 바람직하다. 본 발명에 따른 모델은 복잡성과 정확성 간의 더 나은 트레이드-오프(trade-off)를 제공한다. 이러한 모델에서의 에러는 대수적 스케일에서 평가될 수 있다.
본 발명의 바람직한 실시예에서, 제 2 모델링 동작은 타겟 스펙트럼의 제 2 부분의 역(reciprocal)에 제 1 모델링 동작을 사용하는 단계를 포함한다. 이러한 실시예에서, 단지 하나의 모델링 동작이 정의될 필요가 있으며, 자동-회귀 파라미터들은 스펙트럼의 제 1 부분을 모델링함으로써 획득되고, 이동-평균 파라미터들은 스펙트럼의 제 2 부분의 역을 모델링, 즉, 제 1 모델링 동작에 의해 획득된다. 비록 덜 바람직할지라도, 제 2 부분에 대한 이동-평균 파라미터들을 산출하는 제 2 모델링 동작을 사용하고, 스펙트럼의 제 1 부분의 역에 동일한 제 2 모델링 동작을 사용하여 자동-회귀 파라미터들을 획득하는 것이 가능하다.
본 발명은 오디오 신호 내의 잡음 성분의 파라메트릭 모델링에 사용되는 것이 바람직하다. 오디오 신호는 일반적으로 음악 뿐만 아니라 음성과 같은 오디오를 포함할 수 있다. 앞서 언급된 이점들 이외에, 본 발명에 따른 ARMA 모델은 잡음 성분의 정확한 모델링에 필요한 파라미터들이 비슷한 정확성을 갖는 완전한 AR 또는 MA 모델링의 경우보다 작다는 다른 이점을 가진다. 보다 적은 파라미터들은 더 나은 압축을 의미한다.
비록, 본 발명이 오디오 신호 내의 잡음 성분의 파라메트릭 모델링에 사용되는 것이 바람직하지만, 본 발명은 또한 잡음 스펙트럼의 추정이 신호로부터 감산되는 잡음 압축 방식들에 사용될 수 있다.
Stoica 및 Moses에 따른 종래 기술의 방법들에서, 행렬 반전(matrix inversion)에서 계산 상의 어려움이 존재한다. 또한 단위원에 근접한 영점들에 대해 차수가 높을 필요가 있다는 것을 제외하고, AR 모델의 차수가 설정되어야 하는 값이 불명료하다. 따라서, 계산의 복잡성은 액세스하기 어렵다. 본 발명에 따른 방법에서, 분할 처리 및 주파수 영역(Stoica 및 Moses은 주로 시간 영역에서 계산함)으로의 변환의 반복적 성질에서 계산 상의 어려움이 존재한다. 본 발명은 단위원에 근접한 영점들의 경우에 더 좋은 결과들을 제공한다. 또한, 주파수 영역으로의 변환은 조작의 가능성을 열어둔다. 한 예는 선험적(priori) 또는 측정 데이터를 기초로 하여 분할 주파수를 만드는 것이다. 또 다른 이점은 이후 설명되는 바와 같이, 워핑된(warped) 주파수 데이터에 대한 적응성이다. 실시간 ARMA 모델링을 보증하기 위해서, 주파수 영역으로의 빠른 변환, 예를 들어, 본 기술 분야에 잘 공지되어 있는 Welch의 평균화 피리오드그램 방법(averaged periodogram method)이 적용되여야 한다.
자동-회귀 및 이동-평균 파라미터들은, 예를 들어, 다항식들, 다항식들의 영점들(이득 팩터와 함께), 반사 계수들 또는 로그(영역) 비들에 의해, 여러 방법들로 표현될 수 있다. 오디오 코딩 응용에 있어서, 자동-회귀 및 이동-평균 파라미터들의 표현은 바람직하게 로그(영역) 비이다. 본 발명에 따른 ARMA 모델링에서 결정된 자동-회귀 및 이동-평균 파라미터들은 전송되는 필터 파라미터들을 획득하기 위해서 조합된다.
WO 97/28527호는, 배경 잡음 PSD 추정을 결정하고, 잡음 음성 파라미터들을 결정하고, 음성 파라미터들로부터 잡음 음성 PSD 추정을 결정하고, 그 잡음 음성 PSD 추정치로부터 배경 잡음 PSD 추정치를 감산하고, 향상된 음성 PSD 추정치로부터 향상된 음성 파라미터들을 추정함으로써 음성 파라미터들을 향상시키는 방법을 개시한다. 향상된 파라미터들은, 잡음을 억제하기 위해 잡음 음성을 필터링하기 위해 사용되거나, 음성 인코딩 내의 음성 파라미터들로서 직접적으로 사용될 수 있다. PSD의 추정은 자동-회귀 모델에 의해 획득된다. 이 문헌에서, 그러한 추정은 통계적으로 일관된 것이 아니지만, 음성 신호 처리에 있어서, 심각한 문제는 아님을 주목해야 한다.
US-A 5,943,429호는 프레임 기반 디지털 통신 시스템에서의 스펙트럼의 감산 잡음 억제 방법을 개시한다. 상기 방법은 비음성 프레임들의 배경 잡음의 파워 스펙트럼 밀도의 추정 및 음성 프레임들의 파워 스펙트럼 밀도의 추정에 기초하는 스펙트럼 감산 함수에 의해 수행된다. 각각의 음성 프레임은 자유도(degrees of freedom)의 수를 감소시키는 파라메트릭 모델에 의해 근사화된다. 각각의 음성 프레임의 파워 스펙트럼 밀도의 추정은 대략적인 파라메트릭 모델로부터 추정된다. 또한, 이러한 경우, 그 파라메트릭 모델은 AR 모델이다.
US-A 4,188,667호는 ARMA 필터 및 ARMA 필터에 대한 파라미터들을 획득하기 위한 방법을 개시한다. 상기 방법의 제 1 단계는, 안정된 순수 이동-평균 필터 모델의 생략된 시퀀스 계수들(truncated sequence of coefficients), 즉, 비회귀(non-recursive) 필터 모델의 파라미터들을 획득하기 위해, 진폭의 임의로 선택된 주파수 스펙트럼의 역이산 퓨리에 변환을 수행하는 단계를 포함한다. 그후, N+1개의 항을 갖는 생략된 시퀀스 계수들은 랜덤 시퀀스와 연관된 출력을 획득하기 위해 랜덤 시퀀스와 얽혀(convolved)진다. 그후, 소망의 진폭 및 위상 주파수 응답들을 갖는 모델의 거의 최소 차수의 자동-회귀 및 이동-평균 파라미터들을 획득하기 위해, 시간 영역의 수렴 파라미터 식별이 적분 에러 함수 놈(integral error function norm)을 최소화시키는 방식으로 수행된다. 파라미터들은 오프라인(off-line)으로 식별된다. 이 실시예의 목적은 최소 또는 최소 부근의 안정된 ARMA 필터를 제공하는 것이다. 그 파라미터들은 배치 필터 프로그램으로 결정된다.
일반적으로, 파워 스펙트럼 밀도 함수(power spectral density function)를 추정하는 것은 선형 시스템의 특성을 나타내는 것과는 다르며, 특히, 그러한 특성화에서, 입력 및 출력 신호들이 사용가능하고 사용되는 반면, 파워 스펙트럼 밀도 함수를 추정할 때는, 단지 파워 스펙트럼 밀도 함수만이 사용 가능하다(연관된 입력 신호가 아니다).
본 발명의 앞서 언급된 것 및 다른 양태들은 앞서 기재된 실시예들로부터 명백해질 것이고, 명료해질 것이다.
도 1은 본 발명에 따른 오디오 인코더를 포함하는 예시적인 실시예를 도시하는 도면.
도 2는 본 발명에 따른 오디오 재생기를 포함하는 예시적인 실시예를 도시하는 도면.
도 3은 본 발명에 따른 오디오 시스템의 예시적인 실시예를 도시하는 도면.
도 4는 예시적인 매핑 함수(mapping function) m을 도시하는 도면.
도 5는 본 발명에 따른 잡음 억제 장치(noise suppression device)의 실시예를 도시하는 도면.
도면들은 단지 본 발명을 이해하기 위해 필요한 요소들을 도시한다.
본 발명은 합성 잡음 발생이 채용되는 오디오 및 음성 코딩 방식들에 적용되는 것이 바람직하다. 일반적으로, 오디오 신호는 프레임 단위로 코딩된다. 프레임 내 잡음의 파워 스펙트럼 밀도 함수(또는 그것의 가능한 비균일하게 샘플링된 버전)가 추정되고, 필터들의 임의의 등급의 구형파 진폭 응답들(squared amplitude responses)의 집합으로부터 함수의 최상의 근사화가 구해진다. 본 발명의 일 실시예에서, 파워 스펙트럼 밀도 함수에 대해 AR 및 MA 모델들에 적합한 기존의 낮은 복잡성 기술(low-complexity technique)들에 기초한 ARMA 모델을 추정하는데 반복 절차가 사용된다.
도 1은 본 발명에 따른 예시적인 오디오 인코더(2)를 도시한다. 오디오 신호(A)는 마이크로폰, 저장 매체, 네트워크 등과 같은 오디오 소스(1)로부터 획득된다. 오디오 신호(A)는 오디오 인코더(2)에 입력된다. 오디오 신호(A)는 프레임 단위로 오디오 인코더(2)에서 파라메트릭하게 모델링된다. 코딩 유닛(20)은 분석 유닛(Analysis Unit; AU)(200) 및 합성 유닛(Synthesis Unit; SU)(201)을 포함한다. AU(200)는 오디오 신호의 분석을 수행하고, 오디오 신호(A) 내의 기본 파형들을 결정한다. 또한, AU(200)는 기본 파형들을 표현하기 위해 파형 파라미터들 또는 계수들(Ci)을 산출한다. 파형 파라미터들(Ci)은 재구성된 오디오 신호를 획득하기 위해, SU(201)에 공급되고, 이는 합성된 기본 파형들을 구성한다. 이러한 재구성된 오디오 신호는 원래 오디오 신호(A)로부터 감산되도록 감산기(21)에 공급된다. 이 휴지 신호(rest signal; S)는 오디오 신호(A)의 잡음 성분으로서 간주된다. 바람직한 실시예에서, 코딩 유닛(20)은 두 단계들: 과도 모델링을 수행하는 단계, 및 모델링된 과도 성분들의 감산 후에 오디오 신호 상에 사인 곡선(sinusoidal)의 모델링을 수행하는 다른 단계를 포함한다.
본 발명의 특징에 따르면, 오디오 신호(A) 내의 잡음 성분(S)의 파워 스펙트럼 밀도 함수는 자동-회귀 파라미터들(pi) 및 이동-평균 파라미터들(qi)을 초래하여 모델링된 ARMA이다. 잡음 성분(S)의 스펙트럼은 필터 파라미터들(pi,qi)을 획득하기 위해 잡음 분석기(NA)(22)에서 본 발명에 따라서 모델링된다. 그 파라미터들(pi,qi)의 추정들은, 스펙트럼적으로 가능한 평탄하게, 즉, '주파수 스펙트럼을 백색으로 하여', 필터링 후에 함수(S)를 만드는 전달 함수(H-1), 즉, H-1(S)를 갖는, NA(22) 내의 필터의 필터 파라미터들을 결정함으로써 수행된다. 디코더에서, 인코더에서 사용되는 필터와 상반되는 전달 함수(H)를 갖는 필터로 백색 잡음을 필터링함으로써 잡음 성분(S)과 대략적으로 동일한 속성들을 갖는 재구성된 잡음 성분이 생성될 수 있다. 이러한 상반되는 필터의 필터링 동작은 ARMA 파라미터들(pi,qi)에 의해 결정된다. 필터 파라미터들(pi,qi)은, 멀티플렉서(23)에서 인코딩된 오디오 신호(A') 내의 파형 파라미터들(Ci)과 함께 포함된다. 오디오 스트림(A')은 통신 채널(3)을 통해 오디오 인코더로부터 오디오 재생기에 공급되고, 그것은 무선 접속, 데이터 버스, 또는 저장 매체 등이 될 수 있다.
본 발명에 따른 오디오 재생기(4)를 포함하는 실시예가 도 2에 도시된다. 오디오 신호(A')는 통신 채널(3)로부터 획득되고, 인코딩된 오디오 신호(A')에 포함된 파라미터들(pi,qi) 및 파형 파라미터들(Ci)을 획득하기 위해, 디멀티플렉서 (40)에서 디멀티플렉싱된다. 파라미터들(pi,qi)은 잡음 합성기(Noise Synthesizer; NS)(41)에 공급된다. NS(41)는 주로 전달 함수(H)를 갖는 필터이다. 백색 잡음 신호(y)는 NS(41)에 입력된다. NS(41)의 필터링 동작은 ARMA 파라미터들(pi,qi)에 의해 결정된다. 인코더(2)에서 사용되는 필터(NA)(22)에 상반되는 NS(41)로 백색 잡음(y)을 필터링함으로써, 원래 오디오 신호(A) 내의 잡음 성분(S)과 대략적으로 동일한 확률론적인 속성들을 갖는 잡음 성분(S')이 발생된다. 잡음 성분(S')은, 예를 들어, 재구성된 오디오 신호(A")를 획득하기 위해 합성 유닛(SU)(42)으로부터 획득된 다른 재구성된 성분과 가산기(43)에서 가산된다. SU(42)는 SU(201)와 유사하다. 재구성된 오디오 신호(A")는 확성기(loudspeaker) 등일 수 있는 출력(5)에 공급된다.
도 3은 도 1에 도시된 바와 같은 오디오 인코더(2) 및 도 2에 도시된 바와 같은 오디오 재생기(4)를 포함하는 본 발명에 따른 오디오 시스템을 도시한다. 그러한 시스템은 재생 및 기록 특성들을 제공한다. 통신 채널(3)은 오디오 시스템의 일부일 수 있으나, 종종 오디오 시스템 외부(outside)에 있을 것이다. 통신 채널(3)이 저장 매체인 경우, 그 저장 매체는 시스템 내에 고정될 수 있거나 착탈 가능한 디스크, 메모리 스틱, 테이프 등일 수 있다.
이후, S의 스펙트럼의 모델링이 또한 설명될 것이다. S는 이산 시간 실제값의 신호의 파워 스펙트럼 밀도 함수라고 가정한다. 또한, S는 간격 I=(-π,π)으로 정의된 실제값의 함수이다. S는 min(S)>0 및 max(S)<∞내에서 대칭이라고 가정된다. 편의를 위해, S의 대수적 평균은 0 이며, 즉,
Figure 112002001274774-pct00001
(1)
로 가정된다. 0과 같지 않은 로그 스케일 상의 평균을 갖는 경우들의 확장은 똑바르지만, 여러가지 방법들로 처리될 수 있다. S는 적절한 보간법 및 정규화에 의해 실제로 측정된 파워 스펙트럼 밀도 함수의 샘플들로부터 획득될 수 있음을 주목하라.
H가 H=B/A,
Figure 112006069976276-pct00002
Figure 112006069976276-pct00003
에 따른 유리 전달 함수(rational transfer function)로 하자. 여기서, pi 및 qi는 각각 전달 함수(H)의 극점들 및 영점들이다. |H|2의 대수적 평균이 0과 같음을 주목하라.
타겟 함수는 H의 제곱 계수, 즉,
Figure 112002001274774-pct00004
에 의해 근사화된다.
근사치의 정확성을 위해 측정이 다음에 의해 도입된다.
Figure 112002001274774-pct00005
(2)
그 기준(2)은 S 및|H|2 모두가 0과 동일한 대수적 평균을 갖는다는 사실의 관점에서, 다음과 같이 다시 쓰여질 수 있다.
Figure 112002001274774-pct00006
(3)
또한, 각 θ에 대해
Figure 112005025778873-pct00007
인 경우, 기준(2)은 J'-1에 의해 근사화되고, 다음과 같다.
Figure 112002001274774-pct00008
(4)
이것은 최적의 해법의 근처에서, 기준(2) 및 (4)는 실질적으로 동일함을 의미한다.
H=1/A(즉, B=1), (4)는 순방향 선형 예측(FLP: Forward Linear Prediction)과 연관된 경우에서, 그것은 LPC 방법의 한 예하는 것은 잘 공지되어 있다. 따라서, 다항식(A)은 S와 연관된 자동-상관 함수를 계산하고(또는 적어도 근사화하고), Wiener-Hopf 방정식들을 해결함으로써 구해질 수 있다. 그러한 절차의 정성적인 결과(qualitative result)들 또한 잘 공지되어 있다. 앞서 기술된 절차는 S의 피크치들에 대한 훌륭한 근사치들을 제공할 것이지만, 보통 S의 밸리들에 대해 단지 열악한 적합성들을 제공한다. 상기 결론을 내리기 위해, 파워 스펙트럼 밀도 함수로부터 전체-극점 모델을 추정하기 위한 표준 절차가 사용 가능하고, 파워 스펙트럼 밀도 함수는 (2)를 갖는 최적의 해법에 대한 근사치화를 제공하고, 근본적으로 S의 피크치들을 모델링하는데 좋다.
ln S의 피크치들 및 밸리들이 필수적으로 부호의 반전을 제외하고 동일한 특성을 가지며: 피크치가 양의 진폭(excursion)인 반면, 골(trough)이 음의 진폭이다. 결과적으로,
Figure 112005025778873-pct00009
을 취했을 때, 전체-영점 모델은 전체-극점 모델에 대해 앞서 기술된 절차를 사용함으로써 추정될 수 있다. 이러한 절차의 결과로부터, S의 밸리들에 양호한 적합성이 예상되지만, S의 피크치들에 대하여 열악하거나 기껏해야 올바른 적합성들이 예상된다.
본 발명의 목적은 피크치들 및 밸리들 둘 모두에 대한 S의 양호한 표현을 제공하는 것이다. 본 발명의 실시예에서, 전체-극점 모델 및 전체-영점 모델이 다음의 방식으로 조합되는 ARMA 모델이 제공된다. S는 SA/SB로서 두 부분으로 분할된다. SA로부터 전체-극점 모델이 다항식 A를 산출하여 추정되고, SB로부터 전체-영점 모델이 다항식 B를 산출하여 추정된다. 그 조합(|H|2=|B|2/|A|2)은 S의 근사화로 고려된다.
본 발명의 바람직한 특징에 따라, S의 분할은 반복 처리에서 수행된다. 그 반복 단계는 l로 언급된다. 반복의 각각의 단계에서, 새로운 분할(SA,l, SB,l)이 발생되고, 대응하는 추정치들(Al, Bl)이 계산된다. SA 및 SB 내의 S 의 주어진 세분화는 시작하는데 사용되고, 그 후, 정확하게 모델링되지 않는 SB의 부분들이 SA에 귀착되고, 그 역도 마찬가지이다. 반복적 방식의 단계(l-1)에서, Hl-1=Bl-1/Al-1이다. 이후, 부분적인 함수들
Figure 112005025778873-pct00010
Figure 112005025778873-pct00011
이 고려된다. 이러한 방식으로, S로부터 전체-극점 모델에 의해 정확하게 모델링될 수 있는 부분들은 SB에 기여하는 것으로부터 제외된다. 유사하게, 전체-영점 필터들에 의해 모델링될 수 있는 S의 부분들은 SA로부터 배제된다. SA,l 및 SB,l로부터, 함수들(Al, Bl)이 추정된다. 이러한 방식으로, 이전 반복에서 모델링될 수 없는 부분들이 적절히 교환된다.
다음 단계에서, 바람직하게, 다음 4개의 가능한 조합들이 고려된다.
G0=Bl-1/Al-1 G1=Bl-1/Al
G2=Bl/Al-1 G3=Bl/Al
이들 네개의 후보 필터들의 S에 대한 최상의 적합성은 최소 오차를 갖는 것으로서 정의된다; 연관된 필터는 단계 l의 최종 결과이다. 바람직하게는, Hl(그러므로, Al 및 Bl)은 다음 식에 따른 대수적 기준으로 i=0,1,2,3을 갖는 최상의 후보들(Gi)로서 선택된다.
Figure 112002001274774-pct00012
(5)
여기로부터, 그 절차는 SA,l+1=S/|Bl2 및 SB,l+1=1/S|A l2을 취함으로써 단계 l+1로 진행된다.
임의의 공통의 중지 절차, 예를 들어, 반복의 최대수, 현재 추정의 충분한 정확성, 또는 하나의 단계로부터 또 다른 단계로 갈 때의 불충분한 진행이 사용될 수 있다.
대안으로는, 약간 다른 절차가 AR 및 MA 모델링을 수행한다.
만일, 이전 단계가 분자(Bl-1)의 정제된 추정으로 회귀된다면, 그때
Figure 112002001274774-pct00013
이고, Al을 계산한다. Bl은 Bl-1로 취해진다.
만일, 이전 단계가 분자(Al-1)의 정제된 추정으로 회귀된다면, 그때
Figure 112002001274774-pct00014
이고, Bl을 계산한다. Al은 Al-1로 취해진다.
Al 및 Bl로부터, Hl가 구성되고, 오차 평가된다(예를 들어, 로그 스케일 상의 평균 제곱 차).
반복 구성을 초기화하기 위한 많은 대안들이 있다. 제한 없이, 다음의 가능성들이 언급된다:
첫째, 초기화하는 간단한 방법이 SA,0=S, SB,0=1, SA,0=1, 1/SB,0=S를 취함으로써 제공된다. 다음으로, A0 및 B0가 계산된다. 이러한 두 개의 초기 추정치들로부터, (몇 가지 기준에 따른) 최상의 적합성이 선택된다. 이러한 방식에서, 제 1 추측은 전체-극점 또는 전체-영점 모델 중 하나이다.
둘째, S가 SA,0=1/SB,0=√S에 따른 동일한 부분들로 분할될 수 있다.
셋째, SA가 피크치들 및 SB의 밸리치들을 포함해야하기 때문에, 유리한 분할이 SA,0에 대한 평균 대수적 레벨(예를 들어, 상기 0) 이상의 모든 것 및 SB,0에 대한 상기 레벨 이하의 임의의 것을 귀착시키는 것이다. 전체 대수적 평균 뿐만 아니라 일부 전역 대수적 평균에서 분할이 이루어질 수 있다.
넷째, 다른 분할 처리는 대수적 스케일 상의 파워 스펙트럼 밀도 함수들에서, 단위원에 근접한 극점들 및 영점들이 각각 진술된 피크치들 및 밸리치들을 발생시킨다는 것을 고려한다. 데이터(S)는, logS 내의 피크치들 및 밸리치들이 각각 전체-극점 및 전체-영점 모델에 의해 보다 적절하게 처리되는 개념으로 분할된다.
P=logS
PA=logSA
PB=logSB
를 정의한다. m:R→[-1,1]인 매핑 함수 m을 고려한다. 그 매핑 함수는 통상적으로 로그 스케일 상의 극점 및 영점 거동의 대칭의 관점에서, 비감소, 점-대칭 시그모이달 함수(point-symmetric sigmoidal function)일 것이다. 그러나, 비대칭 함수들이 또한 사용될 수 있으며, 더 많은 가중치를 극점 또는 영점 모델 중 하나에 제공하는 효과를 갖는다. 예시적인 매핑 함수 m이 도 4에 도시된다.
다음의 초기 분할을 고려한다.
Figure 112002001274774-pct00015
Figure 112002001274774-pct00016
이러한 방법에서, P의 양의 진폭(피크치들)은 압도적으로 PA에 귀착되고, 결과적으로, 전체-극점 필터에 의해 모델링된다. P의 음의 진폭들(밸리치들)은 대부분 PB에 귀착되고, 결과적으로, 전체-영점 필터에 의해 모델링된다. PA 및 PB로부터 SA 및 SB가 구성되고, 다음으로, A0 및 B0가 계산된다.
(앞서 논의된 바와 같은 제 2 및 제 3 초기치와 유사한) m의 두 개의 제한적 경우들이 있다.
- m=0이면, SA,0=1/SB,0=√S
- m이 시그넘 함수(signum function):
Figure 112002001274774-pct00017
이 경우,
Figure 112005025778873-pct00027
Figure 112005025778873-pct00028
근본적으로, 이들이 극점들 및 영점들에 의해 제공된 자유도에 의해 생성된 패턴들을 구성하기 때문에, 제안된 스펙트럼 모델링은 피크치들 및 밸리치들을 모델링하는데 매우 적절하다. 결과적으로, 그 절차는 분리물들(outliers)에 평활하기보다는 민감하며, 이들은 근사치로 나타날 것이다. 그러므로, 입력 데이터(S)는 정확한 추정치가 되어야 하거나(표준 편차와 주파수 샘플링 당 평균의 작은 비의 관점에서), 또는 S가 분리물들의 바람직하지 않은 모델링을 억제하기 위해서 전처리(pre-processed)(예를 들어, 평활화)되어야 한다. 이러한 관찰은, 모델 내의 자유도의 수가 파워 스펙트럼 밀도 함수가 기초하는 데이터 포인트들에 대해 상대적으로 클 경우, 특히 유지된다.
수렴(covergence)이 실제적인 최적화 단계들(A, B) 및 선택 기준 없이는 확립될 수 없다. 그 오차가 반복 처리시, 모든 단계에서 감소하는 것이 보증되는 것은 아니다.
많은 경우에서, 대수적 스케일된 주파수 축에 파워 스펙트럼 밀도 함수의 좋은 근사화를 갖는 것이 바람직하다. 예를 들어, 보드 선도(Bode plot)의 형태로 시각적 스펙트럼에서 적합성의 결과를 시각적으로 평가하는 것이 통상적인 실행이다. 유사하게, 오디오 및 음성 응용들에 대해서, 그 바람직한 스케일은 대수적 스케일이 많거나 적은 Bark 또는 ERB(Equivalent Rectangular Bandwidth) 스케일일 것이다. 본 발명에 따른 방법은 주파수-워핑된 모델링(frequency-warped modeling)에 적절하다. 스펙트럼 밀도 측정들은 임의의 주파수 그리드 상에서 계산될 수 있다. 주파수 워핑이 1차 전통과부의 워핑에 가깝다는 조건하에서, 이것은 ARMA 모델의 차수를 유지하면서, 다시 래핑될(re-wraped) 수 있다.
본 발명의 응용 영역들은 오디오 코딩, 매립된 데이터 기술들, 잡음 정형(noise shaping) 및 고속 필터 설계를 포함한다. 본 발명의 다른 예시적인 실시예가 도 5에 도시된다. 도 5에서, 오디오 신호(A)는 도 1과 같은 유사한 방식으로 소스(1)로부터 획득된다. 오디오 신호(A)는 잡음-억제 장치(6)에서 처리된다. 그 잡음-억제 장치는 잡음 분석기(NA)(60) 및 잡음 합성기(NS)(noise synthesizer; 61)을 포함한다. 이러한 실시예에서, NA(60)은 직접적으로 오디오 신호에서 잡음을 분석한다. 잡음 스펙트럼은 본 발명에 따라 ARMA 파라미터들(pi,qi)을 결정함으로써 모델링된다. 주로 필터인 NS(61)는 잡음의 스펙트럼을 근사화하는 주파수 응답을 갖는다. NS(61)는 백색 잡음(y)을 필터링함으로써 재구성된 잡음을 생성하고, NS(61)의 필터링 속성들은 ARMA 파라미터들(pi,qi)에 의해 결정된다. 가산기(61)에서, 재구성된 잡음은, 잡음-필터링된 오디오 신호({A})를 획득하기 위해 오디오 신호(A)로부터 감산된다. 바람직하게는, 잡음 스펙트럼은 잡음 외에도, 많은 신호를 함유하지 않는 하나 이상의(이전의) 프레임들, 예를 들어, 음성 코딩에서의 무음성 프레임들에서 모델링된다. 그 재구성된 잡음은 보다 많은 신호를 함유하는 프레임들, 예를 들어, 음성 코딩에 음성 프레임들에서 감산될 수 있다.
앞서 언급된 실시예들이 본 발명을 제한하기보다는 예시하는 것이고, 당업자들이 첨부 청구항들의 범위를 벗어나지 않고 많은 대안의 실시예들을 설계할 수 있을 것임을 이해해야 한다. 청구항들에서, 괄호 안에 위치된 임의의 참조 부호들은 청구항들을 제한하는 것으로 해석되어서는 안된다. 단어 '포함하는'은 청구항들에 리스트된 것들과는 다른 요소들 또는 단계들의 존재를 배제하지 않는다. 본 발명은 몇가지 구별 요소들을 포함하는 하드웨어에 의해, 그리고, 적절하게 프로그램된 컴퓨터에 의해 수행될 수 있다. 몇가지 수단을 열거하는 장치 청구항에서, 이 수단들의 몇몇은 하드웨어의 하나 또는 동일한 아이템에 의해 구현될 수 있다. 임의의 측정들이 서로 인용된다는 사실은 단순한 것이다. 다른 종속 항들은 이들 측정들의 조합이 유리하게 사용될 수 있음을 나타내는 것이다.
요약하면, 타겟 스펙트럼을 모델링하는 것은 타겟 스펙트럼을 근사화하는 주파수 응답을 갖는 필터의 필터 파라미터들을 결정함으로써 제공되며, 타겟 스펙트럼은 적어도 제 1 부분 및 제 2 부분으로 분할되며, 제 1 모델링 동작이 자동-회귀 파라미터들을 획득하기 위해 타겟 스펙트럼의 제 1 부분에 대해 사용되고, 제 2 모델링 동작이 이동-평균 파라미터들을 획득하기 위해 타겟 스펙트럼의 제 2 부분에 대해 사용될 수 있으며, 자동-회귀 파라미터들 및 이동-평균 파라미터들은 필터 파라미터들을 획득하기 위해 조합될 수 있다. 본 발명은 오디오 코딩에 적용되는 것이 바람직하며, 신호 내의 잡음 성분의 스펙트럼이 모델링된다.
파워 스펙트럼 밀도 데이터로부터의 고속 ARMA 추정을 위한 모델이 설명되었다. 예를 들어, 분자 및 분모 다항식들의 추정을 위한 FLP 기술들 및 전체-극점 모델에 대한 데이터의 부분들 및 전체-영점 모델에 대한 다른 부분들을 귀착시키기 위해 파워 스펙트럼 밀도 데이터에서의 가장 적절한 분할을 제시하는 반복 절차를 사용한다.

Claims (17)

  1. 타겟 스펙트럼(S)을 근사화하는 주파수 응답(S')을 갖는 필터(41)의 필터 파라미터들(pi,qi)을 결정함으로써 타겟 스펙트럼(S)을 모델링(2, 22)하는 방법에 있어서,
    상기 타겟 스펙트럼을 적어도 제 1 부분 및 제 2 부분으로 분할하는 단계(22);
    자동-회귀 파라미터들(pi)을 획득하기 위해, 상기 타겟 스펙트럼(S)의 상기 제 1 부분에 대한 제 1 모델링 동작을 사용하는 단계(22);
    이동-평균 파라미터들(qi)을 획득하기 위해 상기 타겟 스펙트럼의 상기 제 2 부분에 대한 제 2 모델링 동작을 사용하는 단계(22); 및
    상기 필터 파라미터들(pi,qi)을 획득하기 위해, 상기 자동-회귀 파라미터들(pi) 과 상기 이동-평균 파라미터들(qi)을 조합하는 단계를 포함하는 것을 특징으로 하는, 타겟 스펙트럼 모델링 방법.
  2. 제 1 항에 있어서,
    상기 제 2 모델링 동작(22)은,
    상기 타겟 스펙트럼의 상기 제 2 부분의 역에 대한 상기 제 1 모델링 동작을 사용하는 단계를 포함하는, 타겟 스펙트럼 모델링 방법.
  3. 제 1 항에 있어서,
    상기 분할 단계(21)는,
    초기의 제 1 부분 및 초기의 제 2 부분으로 초기 분할을 취하는 단계; 및
    몇가지 중지 기준이 만족될 때까지, 상기 초기 분할보다 더 나은 분할을 획득하기 위해 반복 절차를 사용하는 단계를 포함하는, 타겟 스펙트럼 모델링 방법.
  4. 제 3 항에 있어서,
    상기 반복 절차는,
    새로운 자동-회귀 파라미터들을 획득하기 위해 이전의 분할의 제 1 부분에 대한 제 1 모델링 동작을 사용하는 단계;
    새로운 이동-평균 파라미터들을 획득하기 위해 이전의 분할의 제 2 부분에 대한 제 2 모델링 동작을 사용하는 단계; 및
    새로운 분할을 획득하기 위해, 상기 제 1 모델링 동작에 의해 정확하게 모델링될 수 없는 상기 이전 분할의 상기 제 1 부분의 부분들을 다시 상기 이전 분할의 상기 제 2 부분으로 돌리고(re-attributing), 상기 제 2 모델링 동작에 의해 정확하게 모델링될 수 없는 상기 이전 분할의 상기 제 2 부분의 부분들을 다시 상기 이전 분할의 상기 제 1 부분으로 돌리는 단계를 포함하는, 타겟 스펙트럼 모델링 방법.
  5. 제 4 항에 있어서,
    상기 다시 돌리는 단계는,
    이동-평균 파라미터들에 기초한 상기 타겟 스펙트럼의 추정에 의해 상기 이전 분할의 상기 제 1 부분을 나누는 단계; 및
    자동-회귀 파라미터들에 기초한 상기 타겟 스펙트럼의 추정에 의해 상기 이전 분할의 상기 제 2 부분을 나누는 단계를 포함하는, 타겟 스펙트럼 모델링 방법.
  6. 제 2 항에 있어서,
    상기 초기의 제 1 부분은 평균 대수적 레벨 이상의 상기 타겟 스펙트럼의 적어도 유효한 부분을 포함하고, 상기 초기의 제 2 부분은 상기 레벨 이하의 적어도 유효한 부분을 포함하는, 타겟 스펙트럼 모델링 방법.
  7. 제 2 항에 있어서,
    상기 초기 분할은,
    Figure 112006069976276-pct00020
    Figure 112006069976276-pct00021
    에 의해 결정되고,
    여기서,
    P=log(타겟 스펙트럼)
    PA=log(타겟 스펙트럼의 제 1 부분)
    PB=log(타겟 스펙트럼의 제 2 부분)이고,
    m은 m: R→[-1,1]인 매핑 함수인, 타겟 스펙트럼 모델링 방법.
  8. 타겟 스펙트럼을 근사화하는 주파수 응답(S')을 갖는 필터(41)의 필터 파라미터들(pi,qi)을 결정하기 위한 수단(22)을 포함하는 장치(2)에 있어서,
    상기 장치는,
    상기 타겟 스펙트럼(S)을 적어도 제 1 부분 및 제 2 부분으로 분할하기 위한 수단(22);
    자동-회귀 파라미터들(pi)을 획득하기 위해 상기 타겟 스펙트럼(S)의 상기 제 1 부분에 대한 제 1 모델링 동작을 사용하기 위한 수단(22);
    이동-평균 파라미터들(qi)을 획득하기 위해 상기 타겟 스펙트럼의 상기 제 2 부분에 대한 제 2 모델링 동작을 사용하는 수단(22), 및
    상기 필터 파라미터들(pi,qi)을 획득하기 위해 상기 자동-회귀 파라미터들(pi) 및 상기 이동-평균 파라미터들(qi)을 조합하기 위한 수단(22)을 더 포함하는 것을 특징으로 하는, 장치(2).
  9. 오디오 신호(A) 내의 잡음 억제(6) 방법에 있어서,
    상기 잡음의 스펙트럼을 근사화하는 주파수 응답을 갖는 필터(61)의 필터 파라미터들(pi,qi)을 결정함으로써 상기 잡음의 상기 스펙트럼을 모델링하는 단계(60);
    필터(61)로 백색 잡음(y)을 필터링함으로써 재구성된 잡음을 획득하는 단계(61)로서, 필터의 특성들은 상기 필터 파라미터들(pi,qi)에 의해 결정되는, 상기 재구성된 잡음 획득 단계(61); 및
    잡음-필터링된 오디오 신호({A})를 획득하기 위해 상기 오디오 신호(A)로부터 상기 재구성된 잡음을 감산하는 단계(62)를 포함하고,
    상기 모델링 단계(60)는:
    상기 스펙트럼을 적어도 제 1 부분 및 제 2 부분으로 분할하는 단계(60);
    자동-회귀 파라미터들(pi)을 획득하기 위해 상기 스펙트럼의 상기 제 1 부분에 대한 제 1 모델링 동작을 사용하는 단계(60);
    이동-평균 파라미터들(qi)을 획득하기 위해 상기 잡음 스펙트럼의 상기 제 2 부분에 대한 제 2 모델링 동작을 사용하는 단계(60); 및
    상기 필터 파라미터들(pi,qi)을 획득하기 위해 상기 자동-회귀 파라미터들(pi) 및 상기 이동-평균 파라미터들(qi)을 조합하는 단계(60)를 포함하는, 잡음 억제 방법.
  10. 오디오 신호(A) 내의 잡음을 억제하는 장치(6)에 있어서,
    상기 잡음의 스펙트럼을 근사화하는 주파수 응답을 갖는 필터(61)의 필터 파라미터들(pi,qi)을 결정함으로써 상기 잡음의 상기 스펙트럼을 모델링하기 위한 수단(60);
    필터(61)로 백색 잡음(y)을 필터링(61)함으로써 재구성된 잡음을 획득하기 위한 수단(61)으로서, 필터의 특성들은 상기 필터 파라미터들(pi,qi)에 의해 결정되는, 상기 재구성된 잡음을 획득하기 위한 수단(61);
    잡음-필터링된 오디오 신호({A})를 획득하기 위해 상기 오디오 신호(A)로부터 상기 재구성된 잡음을 감산하기 위한 수단(62)을 포함하고,
    상기 모델링하기 위한 수단(60)은:
    상기 스펙트럼을 적어도 제 1 부분 및 제 2 부분으로 분할하기 위한 수단;
    자동-회귀 파라미터들(pi)을 획득하기 위해 상기 스펙트럼의 상기 제 1 부분에 대한 제 1 모델링 동작을 사용하기 위한 수단(60);
    이동-평균 파라미터들(qi)을 획득하기 위해 상기 잡음 스펙트럼의 상기 제 2 부분에 대한 제 2 모델링 동작을 사용하기 위한 수단(60); 및
    상기 필터 파라미터들(pi,qi)을 획득하기 위해 상기 자동-회귀 파라미터들(pi) 및 상기 이동-평균 파라미터들(qi)을 조합하기 위한 수단(60)을 포함하는, 잡음 억제 장치(6).
  11. 오디오 신호(A)를 인코딩(2, 21)하는 방법에 있어서,
    상기 오디오 신호(A) 내에서 기본 파형들을 결정하는 단계(200);
    상기 오디오 신호(A)로부터 상기 기본 파형들을 감산함으로써 상기 오디오 신호(A)로부터 잡음 성분(S)을 획득하는 단계(21);
    상기 잡음 성분(S)의 스펙트럼을 근사화하는 주파수 응답(S')을 갖는 필터(41)의 필터 파라미터들(pi,qi)을 결정함으로써 상기 잡음 성분(S)의 상기 스펙트럼을 모델링하는 단계(22); 및
    인코딩된 오디오 신호(A')에 상기 기본 파형들을 나타내는 파형 파라미터들(Ci) 및 상기 필터 파라미터들(pi,qi)을 포함하는 단계(23)를 포함하고,
    상기 모델링 단계는:
    상기 스펙트럼(S)을 적어도 제 1 부분 및 제 2 부분으로 분할하는 단계(22);
    자동-회귀 파라미터들(pi)을 획득하기 위해 상기 스펙트럼(S)의 상기 제 1 부분에 대한 제 1 모델링 동작을 사용하는 단계(22);
    이동-평균 파라미터들(qi)을 획득하기 위해 상기 잡음 스펙트럼(S)의 상기 제 2 부분에 대한 제 2 모델링 동작을 사용하는 단계(22); 및
    상기 필터 파라미터들(pi,qi)을 획득하기 위해 상기 자동-회귀 파라미터들(pi)과 상기 이동-평균 파라미터들(qi)을 조합하는 단계(22)를 포함하는, 오디오 신호 인코딩 방법.
  12. 인코딩된 오디오 신호(A')를 디코딩(4)하는 방법에 있어서,
    기본 파형들을 나타내는 파형 파라미터들(Ci) 및 필터 파라미터들(pi,qi)을 포함하는 인코딩된 오디오 신호(A')를 수신하는 단계(40)로서, 상기 필터 파라미터들(pi,qi)은 제 11 항의 방법에 따라 획득된 자동-회귀 파라미터들(pi) 및 이동-평균 파라미터들(qi)의 조합인, 상기 수신 단계(40);
    재구성된 잡음 성분(S')을 획득하기 위해 백색 잡음 신호(y)를 필터링하는 단계(41)로서, 상기 필터링은 상기 필터 파라미터들(pi,qi)에 의해 결정되는, 상기 필터링 단계(41);
    상기 파형 파라미터들(Ci)에 기초하여 기본 파형들을 합성하는 단계(42); 및
    디코딩된 오디오 신호(A")를 획득하기 위해 상기 합성된 기본 파형들에 상기 재구성된 잡음 성분(S')을 가산하는 단계(43)를 포함하는, 디코딩 방법.
  13. 오디오 인코더(2)에 있어서,
    오디오 신호(A)의 기본 파형들을 결정하기 위한 수단(200);
    상기 오디오 신호(A)로부터 상기 기본 파형들을 감산(21)함으로써 상기 오디오 신호(A)로부터 잡음 성분(S)을 획득하기 위한 수단(21);
    상기 잡음 성분(S)의 스펙트럼을 근사화하는 주파수 응답(S')을 갖는 필터(41)의 필터 파라미터들(pi,qi)을 결정함으로써 상기 잡음 성분(S)의 상기 스펙트럼을 모델링하기 위한 수단(22); 및
    인코딩된 오디오 신호(A')에 상기 기본 파형들을 나타내는 파형 파라미터들(Ci) 및 상기 필터 파라미터들(pi,qi)을 포함하기 위한 수단(23)을 포함하고,
    상기 모델링하기 위한 수단(22)은,
    상기 스펙트럼(S)을 적어도 제 1 부분 및 제 2 부분으로 분할하는 수단(22);
    자동-회귀 파라미터들(pi)을 획득하기 위해 상기 스펙트럼(S)의 상기 제 1 부분에 대한 제 1 모델링 동작을 사용하기 위한 수단(22);
    이동-평균 파라미터들(qi)을 획득하기 위해 상기 잡음 스펙트럼(S)의 상기 제 2 부분에 대한 제 2 모델링 동작을 사용하기 위한 수단(22); 및
    상기 필터 파라미터들(pi,qi)을 획득하기 위해, 상기 자동-회귀 파라미터들(pi)과 상기 이동-평균 파라미터들(qi)을 조합하기 위한 수단(22)을 포함하는, 오디오 인코더(2).
  14. 오디오 재생기(4)로서,
    기본 파형들을 나타내는 파형 파라미터들(Ci) 및 필터 파라미터들(pi,qi)을 포함하는 인코딩된 오디오 신호(A')를 수신하기 위한 수단(40)으로서, 상기 필터 파라미터들(pi,qi)은 제 11 항의 방법에 따라 획득된 자동-회귀 파라미터들(pi) 및 자동-평균 파라미터들(qi)의 조합인, 상기 인코딩된 오디오 신호 수신 수단(40);
    재구성된 잡음 성분(S')을 획득하기 위해 백색 잡음 신호(y)를 필터링하기 위한 수단(41)으로서, 상기 필터링은 상기 필터 파라미터들(pi,qi)에 의해 결정되는, 상기 필터링 수단(41);
    상기 파형 파라미터들(Ci)에 기초하여 기본 파형들을 합성하기 위한 수단(42); 및
    디코딩된 오디오 신호(A")를 획득하기 위해 상기 합성된 기본 파형들에 상기 재구성된 잡음 성분(S')을 가산하기 위한 수단(43)을 포함하는, 오디오 재생기(4).
  15. 제 13 항에 청구된 바와 같은 오디오 인코더(2) 및 제 14 항에 청구된 바와 같은 오디오 재생기(4)를 포함하는 오디오 시스템.
  16. 인코딩된 오디오 신호(A')가 저장되는 저장 매체에 있어서,
    인코딩된 오디오 신호(A')는:
    기본 파형들을 나타내는 파형 파라미터들(Ci); 및
    제 11 항의 방법에 따라 획득한 자동-회귀 파라미터들(pi)과 이동-평균 파라미터들(qi)의 조합으로 표현되는 잡음 성분(S)의 스펙트럼을 포함하는, 저장 매체.
  17. 삭제
KR1020027000641A 2000-05-17 2000-05-17 스펙트럼 모델링 KR100701452B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2000/004599 WO2001089086A1 (en) 2000-05-17 2000-05-17 Spectrum modeling

Publications (2)

Publication Number Publication Date
KR20020015377A KR20020015377A (ko) 2002-02-27
KR100701452B1 true KR100701452B1 (ko) 2007-03-29

Family

ID=8163950

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027000641A KR100701452B1 (ko) 2000-05-17 2000-05-17 스펙트럼 모델링

Country Status (8)

Country Link
US (1) US20060129389A1 (ko)
EP (1) EP1216504A1 (ko)
JP (1) JP2003533753A (ko)
KR (1) KR100701452B1 (ko)
CN (1) CN1223087C (ko)
BR (1) BR0012519A (ko)
TR (1) TR200200103T1 (ko)
WO (1) WO2001089086A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1523863A1 (en) 2002-07-16 2005-04-20 Koninklijke Philips Electronics N.V. Audio coding
JP2007509363A (ja) 2003-10-13 2007-04-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法及び装置
KR100703265B1 (ko) * 2004-05-12 2007-04-03 삼성전자주식회사 멀티캐리어 변조 방식의 통신 시스템에서 피크-대-평균전력비를 감소시키는 송신기 및 수신기와 적응적피크-대-평균 전력비 제어 방법
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
JP4735711B2 (ja) * 2008-12-17 2011-07-27 ソニー株式会社 情報符号化装置
JP5884338B2 (ja) * 2011-08-26 2016-03-15 ヤマハ株式会社 信号処理装置
ES2657802T3 (es) * 2011-11-02 2018-03-06 Telefonaktiebolaget Lm Ericsson (Publ) Decodificación de audio basada en una representación eficiente de coeficientes autoregresivos
CN102620807A (zh) * 2012-03-22 2012-08-01 内蒙古科技大学 风力发电机状态监测系统及方法
CN102750956B (zh) * 2012-06-18 2014-07-16 歌尔声学股份有限公司 一种单通道语音去混响的方法和装置
US9159336B1 (en) * 2013-01-21 2015-10-13 Rawles Llc Cross-domain filtering for audio noise reduction
CN108226636B (zh) * 2016-12-15 2021-06-11 欧姆龙株式会社 自动滤波方法和装置
CN106762472B (zh) * 2017-01-03 2019-02-22 国网福建省电力有限公司 一种基于时变增强虚拟现实技术风电机组检修系统
US10481831B2 (en) * 2017-10-02 2019-11-19 Nuance Communications, Inc. System and method for combined non-linear and late echo suppression

Also Published As

Publication number Publication date
CN1223087C (zh) 2005-10-12
TR200200103T1 (tr) 2002-06-21
JP2003533753A (ja) 2003-11-11
CN1361941A (zh) 2002-07-31
KR20020015377A (ko) 2002-02-27
EP1216504A1 (en) 2002-06-26
US20060129389A1 (en) 2006-06-15
WO2001089086A8 (en) 2002-05-30
BR0012519A (pt) 2002-04-02
WO2001089086A1 (en) 2001-11-22

Similar Documents

Publication Publication Date Title
US20060129389A1 (en) Spectrum modeling
JP5068653B2 (ja) 雑音のある音声信号を処理する方法および該方法を実行する装置
CA2210490C (en) Spectral subtraction noise suppression method
JP4805540B2 (ja) ステレオ信号の符号化
TWI420509B (zh) 語音增強用雜訊變異量估計器
CA2183282C (en) Signal restoration using left-sided and right-sided autoregressive parameters
TWI470623B (zh) 用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式、以及用以時間捲曲編碼輸入音訊信號的時間捲曲音訊編碼器
JP3299277B2 (ja) 音声符号化補間に基づく時変スペクトル分析
TWI520129B (zh) 使用改良機率分布估計之基於線性預測的音訊寫碼技術
JP4856662B2 (ja) 雑音除去装置、その方法、そのプログラム及び記録媒体
KR20070051857A (ko) 스케일러블 오디오 코딩
JP2009212599A (ja) 残響除去装置とその方法と、そのプログラムと記録媒体
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
JP2004519741A (ja) 音声の符号化
Fattah et al. Identification of autoregressive moving average systems based on noise compensation in the correlation domain
JP4977100B2 (ja) 残響除去装置、残響除去方法、そのプログラムおよび記録媒体
KR100718483B1 (ko) 오디오 코딩
JPH0248815A (ja) 信号処理システム
Srivastava Fundamentals of linear prediction
KR20050007574A (ko) 오디오 코딩
Anushiravani Example-based audio editing
Ramadan Compressive sampling of speech signals
KR100817424B1 (ko) 부호화 장치 및 복호 장치
Fattah et al. A ramp cosine cepstrum model for the parameter estimation of autoregressive systems at low SNR
JPH05206955A (ja) 反復性をもつサンプル化されたアナログ信号のコード化方法およびその装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee