KR20210118224A - 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치 - Google Patents

오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR20210118224A
KR20210118224A KR1020217029645A KR20217029645A KR20210118224A KR 20210118224 A KR20210118224 A KR 20210118224A KR 1020217029645 A KR1020217029645 A KR 1020217029645A KR 20217029645 A KR20217029645 A KR 20217029645A KR 20210118224 A KR20210118224 A KR 20210118224A
Authority
KR
South Korea
Prior art keywords
filtered
filter
current frame
audio signal
processing
Prior art date
Application number
KR1020217029645A
Other languages
English (en)
Other versions
KR102459857B1 (ko
Inventor
엠마누엘 라벨리
마누엘 잔더
그레체고로츠 피에트직
마틴 디에츠
마르크 가이어
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority to KR1020227036973A priority Critical patent/KR102615475B1/ko
Publication of KR20210118224A publication Critical patent/KR20210118224A/ko
Application granted granted Critical
Publication of KR102459857B1 publication Critical patent/KR102459857B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/038Cross-faders therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/10Means associated with receiver for limiting or suppressing noise or interference
    • H04B1/1027Means associated with receiver for limiting or suppressing noise or interference assessing signal quality or detecting noise/interference for the received signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Stereophonic System (AREA)

Abstract

오디오 신호(100)를 처리하는 방법이 설명된다. 선형 예측 필터링(102, 110, 112)을 사용하여 오디오 신호의 필터링된 현재 프레임 및 필터링된 과거 프레임 사이의 불연속성이 제거된다.

Description

오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치{METHOD AND APPARATUS FOR PROCESSING AN AUDIO SIGNAL, AUDIO DECODER, AND AUDIO ENCODER}
본 발명은 오디오 신호들의 분야에 관한 것으로서, 특히, 복수의 오디오 프레임들을 포함하는 오디오 신호를 처리하기 위한 방법이며, 연속적인 필터링된 오디오 프레임들 사이의 불연속성(discontinuity)들이 감소되거나 또는 생략된다.
오디오 신호 처리의 분야에서, 오디오 신호는 다양한 이유들로 필터링될 수 있다. 예를 들어, 롱-텀(long-term) 예측 필터는 오디오 신호의 고조파들의 세트를 감쇠시키거나 또는 나아가 완전하게 억제하기 위해 오디오 신호 인코더에서 사용될 수 있다.
오디오 신호는 복수의 오디오 프레임들을 포함하고, 상기 프레임들은 롱-텀 예측 필터를 사용하여 필터링된다. 오디오 신호의 2개의 연속적인 프레임들, 과거 프레임 및 현재 프레임을 고려할 때, 오디오 신호를 필터링하기 위해 파라미터들의 세트 c를 갖는 선형 필터 H(z)가 사용된다. 보다 구체적으로, 과거 프레임은 소위 필터링된 과거 프레임을 생성하는 파라미터들의 제 1 세트 c0를 사용하여 필터 H(z)로 필터링된다. 현재 프레임은 필터링된 현재 프레임을 생성하는 파라미터들의 세트 c1을 사용하여 필터 H(z)로 필터링된다. 도 1은 공지된 방식에 따라 오디오 신호의 연속적인 프레임들을 처리하기 위한 블록도를 도시한다. 복수의 오디오 프레임들을 포함하는 오디오 신호(100)가 제공된다. 오디오 신호(100)는 필터 블록(102)으로 공급되고, 오디오 신호(100)의 현재 프레임 n은 필터링된다. 오디오 신호 (100) 외에, 필터 블록은 오디오 신호의 현재 프레임에 대한 필터 파라미터들의 세트 cn을 수신한다. 필터 블록(102)은 오디오 신호의 현재 프레임 n을 필터링하고 연속적인 필터링된 프레임들을 포함하는 필터링된 오디오 신호(104)를 출력한다. 도 1에서, 필터링된 현재 프레임 n, 필터링된 과거 프레임 n-1 및 필터링된 제 2 마지막 프레임 n-2가 개략적으로 도시되어 있다. 필터링된 프레임들은 필터링된 프레임들 사이의 필터링 프로세스에 의해 발생할 수 있는 불연속성(106a, 106b)을 개략적으로 나타내기 위하여 그들 사이에 각각의 갭을 갖도록 도 1에 개략적으로 도시된다. 필터 블록(102)은 과거 프레임 n-1 및 현재 프레임 n에 대한 각각의 필터 파라미터들 c0 및 c1을 사용하여 오디오 신호의 프레임들의 필터링을 발생시킨다. 일반적으로, 필터 블록 (102)은 선형 필터 H(z) 일 수 있고, 이러한 선형 필터 H(z)의 일례는 전술한 롱-텀 예측 필터
H(z) = 1 - g·z-T
이며, 여기에서 필터 파라미터들은 이득 "g"및 피치 지연(pitch lag) "T"이다. 보다 일반적인 형태로, 롱-텀 예측 필터는 다음과 같이 기술될 수 있다:
H(z) = 1 - g·A(z)·z-T
여기에서 A(z)는 FIR 필터이다. 롱-텀 예측 필터는 오디오 신호에 있는 고조파들의 세트를 감쇠시키거나 또는 나아가 완전히 억제하는데 사용될 수 있다. 그러나, 이러한 롱-텀 예측 필터를 사용할 때 그리고 과거 프레임 필터 파라미터들 c0가 현재 프레임 필터 파라미터들 c1과 다를 때, 필터링된 과거 프레임 n-1과 필터링된 현재 프레임 n 사이에 불연속성(106a, 106b) (도 1 참조)이 발생할 가능성이 높다. 이러한 불연속성은 필터링된 오디오 신호(104)에 아티팩트(artifact)를 생성할 수 있으며, 예를 들어 “클릭”이다.
결과적으로, 연속적인 프레임들의 필터링에서 발생한 불연속성들이 불필요한 아티팩트들을 생성할 수 있는 상기 상기 설명한 문제점들을 고려하여, 가능성 있는 불연속성을 제거하는 기법이 필요하다. 오디오 신호의 필터링된 프레임들의 불연속성의 제거를 다루는 몇몇 종래 기술의 방식들이 당업계에 공지되어 있다.
선형 필터 H(z)가 FIR 필터인 경우, 현재 프레임은 필터링된 현재 프레임을 생성하기 위해 현재 프레임의 필터 파라미터들 c1로 필터링된다. 또한, 현재 프레임의 시작 부분은 필터링된 프레임 부분을 생성하기 위해 과거 프레임의 필터 파라미터들 c0로 필터링되고, 그 후 오버랩-추가(overlap-add) 또는 크로스-페이드(cross-fade) 동작이 필터링된 현재 프레임의 시작 부분 및 필터링된 프레임 부분에 대해 수행된다. 도 2는 불연속성을 제거하기 위해 연속적인 오디오 프레임들을 처리하기 위한 종래의 방식의 블록도를 도시한다. 도 1과 비교할 때, 필터 블록(102)은 오버랩-추가 또는 크로스-페이드 동작을 수행하기 위한 추가적인 프로세싱 블록(108)을 포함한다. 도 1의 갭들 없이 연속적인 필터링된 프레임들 n, n-1 및 n-2를 도시하는 도 2에 개략적으로 도시된 바와 같이, 필터링된 오디오 신호(104)에서, 연속적인 필터링된 프레임들 사이에 불연속이 없거나 또는 감소될 것이다.
다른 종래 기술의 방식들에서, 필터 H(z)는 재귀(recursive) 부분을 가지는 필터, 예를 들어 IIR 필터 일 수 있다. 그러한 경우, 도 2와 관련하여 전술 한 바와 같은 방식이 샘플 단위(sample-by-sample) 기반으로 적용된다. 제 1 단계에서, 처리는 현재 프레임 n의 시작 부분의 제 1 샘플이 과거 프레임 n-1의 필터 파라미터들 c0로 필터링되어 제 1 필터링된 샘플을 산출하는 것으로 시작한다. 샘플은 또한 현재 프레임 n의 필터 파라미터들 c1로 필터링되어 제 2 필터링된 샘플을 생성한다. 그 다음, 오버랩-추가 또는 크로스-페이드 연산은 필터링된 현재 프레임 n의 대응하는 샘플을 생성하는 제 1 및 제 2 필터링된 샘플들에 기초하여 수행된다. 그 다음, 다음 샘플이 처리되고, 위의 단계들은 현재 프레임 n의 시작 부분의 마지막 샘플이 처리될 때까지 반복된다. 현재 프레임 n의 나머지 샘플들은 현재 프레임 n의 필터 파라미터들 c1로 필터링된다.
연속적인 필터링된 프레임들로부터 불연속성을 제거하기 위한 상술한 공지된 방법들의 예들은, 예를 들어, US 5,012,517 A에 있는 변환 코더의 문맥(context), EP 0732687 A2에 있는 스피치 대역폭 확장기의 문맥, US 5,999,899 A에 있는 변환 오디오 코더의 문맥, 또는 US 7,353,168 B2에 있는 디코딩 스피치 포스트 필터의 문맥에서 설명된다.
상기 방식들은 불필요한 신호 불연속성들을 제거하는데 효율적이지만, 상기 방식들은 효과적이기 위하여 현재 프레임의 특정 부분, 시작 부분에 대하여 동작하기 때문에, 프레임 부분의 길이는 충분히 길어야 하며, 예를 들어 프레임 길이가 20ms인 경우 프레임 부분 또는 시작 부분의 길이는 5ms만큼 길 수 있다. 특정 경우들에서, 특히 과거 프레임 필터 파라미터들 c0이 현재 프레임에 잘 적용되지 않는 상황들에서, 이것은 너무 길 수 있으며, 이것은 추가적인 아티팩트들을 생성할 수 있다. 하나의 예가 피치(pitch)가 빠르게 변화하는 고조파(harmonic) 오디오 신호 및, 고조파들의 진폭을 감소시키기 위해 설계된 롱-텀 예측 필터이다. 이러한 경우, 피치-지연(pitch-lag)은 한 프레임부터 다음 프레임까지 다르다. 현재 프레임에서 추정(estimate)된 피치를 갖는 롱-텀 예측 필터는 현재 프레임에서 고조파들의 진폭을 효과적으로 감소시키지만, 오디오 신호의 피치가 상이한 다른 프레임(예를 들어, 다음 프레임의 시작 부분)에서 사용될 경우 고조파들의 진폭을 감소시키지 않는다. 나아가, 이것은 신호의 비-고조파 관련 컴포넌트들의 진폭을 줄임으로써 신호에서의 왜곡을 발생시켜 상황을 악화시킬 수도 있다.
본 발명의 목적은 필터링된 오디오 신호에서 임의의 잠재적인 왜곡을 생성하지 않으면서 필터링된 오디오 프레임들 간의 불연속성들을 제거하기 위한 개선된 방식을 제공하는 것이다.
이러한 목적은 독립항들에 따른 방법 및 장치에 의해 달성된다.
본 발명은 선형 예측 필터링을 이용하여 오디오 신호의 필터링된 과거 프레임 및 필터링된 현재 프레임 간의 불연속성을 제거하는 단계를 포함하는, 오디오 신호를 처리하기 위한 방법을 제공한다.
선형 예측 필터는 다음과 같이 정의될 수 있다:
Figure pat00001
여기서, M은 필터 차수이고 am은 필터 계수들(여기서, a0=1)이다. 이러한 종류의 필터는 또한 선형 예측 코딩(LPC: Linear Predictive Coding)이으로서 알려져 있다.
실시예들에 따르면, 상기 방법은 오디오 신호의 현재 프레임을 필터링하는 단계, 과거 프레임의 마지막 부분에 기초하여 정의된 선형 예측 필터의 초기 상태들을 이용하여 미리 정의된 신호를 선형 예측 필터링함으로써 얻어진 신호에 의하여 필터링된 현재 프레임의 시작 부분을 수정함으로써 불연속성을 제거하는 단계를 포함한다.
실시예들에 따르면, 선형 예측 필터의 초기 상태들은 현재 프레임을 필터링 하기 위한 필터 파라미터들의 세트를 사용하여 필터링된 필터링되지 않은 과거 프레임의 마지막 부분에 기초하여 정의된다.
실시예들에 따르면, 상기 방법은 필터링된 또는 필터링되지 않은 오디오 신호에 대한 선형 예측 필터를 추정(estimate)하는 단계를 포함한다.
실시예들에 따르면, 선형 예측 필터를 추정하는 단계는 레빈슨-더빈(Levinson-Durbin) 알고리즘을 이용하여 오디오 신호의 과거 필터링된 프레임에 기초하여 또는 오디오 신호의 과거 또는 현재 프레임에 기초하여 필터를 추정하는 단계를 포함한다.
실시예들에 따르면, 선형 예측 필터는 오디오 코덱의 선형 예측 필터를 포함한다.
실시예들에 따르면, 불연속성을 제거하는 단계는 필터링된 현재 프레임의 시작 부분을 처리하는 단계를 포함하고, 현재 프레임의 시작 부분은 현재 프레임에 있는 총 샘플 개수보다 작거나 같은 미리 정의된 개수의 샘플들을 가지며, 현재 프레임의 시작 부분을 처리하는 단계는 필터링된 현재 프레임의 시작 부분으로부터 제로-입력-응답(ZIR: Zero-Input-Response)의 시작 부분을 빼는 단계를 포함한다.
실시예들에 따르면, 상기 방법은 필터링된 현재 프레임을 생성하기 위하여, FIR 필터와 같은 비-재귀(non-recursive) 필터를 사용하여 오디오 신호의 현재 프레임을 필터링하는 단계를 포함한다.
실시예들에 따르면, 상기 방법은 IIR 필터와 같은 재귀(recursive) 필터를 사용하여 샘플 단위(sample-by-sample) 기반으로 오디오 신호의 필터링되지 않은 현재 프레임을 처리하는 단계를 포함하고, 현재 프레임의 시작 부분의 샘플을 처리하는 단계는:
필터링된 샘플을 생성하기 위하여 현재 프레임의 필터 파라미터들을 사용하여 재귀 필터로 샘플을 필터링하는 단계, 및
필터링된 현재 프레임의 대응하는 샘플을 생성하기 위하여 필터링된 샘플로부터 대응하는 ZIR 샘플을 빼는 단계를 포함한다.
실시예들에 따르면, 필터링하는 단계 및 빼는 단계는 현재 프레임의 시작 부분의 마지막 샘플이 처리될 때까지 반복되고, 상기 방법은, 현재 프레임의 필터 파라미터들을 사용하여 재귀 필터로 현재 프레임에 있는 나머지 샘플들을 필터링하는 단계를 더 포함한다.
실시예들에 따르면, 상기 방법은 ZIR을 생성하는 단계를 포함하고, ZIR을 생성하는 단계는:
필터링된 신호의 제 1 부분을 생성하기 위해 현재 프레임을 필터링하는데 사용되는 필터 및 필터 파라미터들로 필터링되지 않은 과거 프레임의 M개의 마지막 샘플들을 필터링하는 단계 ?여기서, M은 선형 예측 필터의 차수(order)임?,
필터링된 신호의 제 2 부분을 생성하기 위해, 과거 프레임의 필터 파라미터들을 사용하여 필터링된, 필터링된 과거 프레임의 M 개의 마지막 샘플들을 필터링된 신호의 제 1 부분으로부터 빼는 단계, 및
필터링된 신호의 제 2 부분과 동일한 초기 상태들 및 선형 예측 필터를 사용하여 제로(zero) 샘플들의 프레임을 필터링함으로써 선형 예측 필터의 ZIR을 생성하는 단계를 포함한다.
실시예들에 따르면, 상기 방법은 ZIR의 진폭이 제로로 더 빠르게 감소하도록 ZIR을 윈도우잉(windowing)하는 단계를 포함한다.
본 발명은 앞서 설명한 불필요한 추가적인 왜곡을 초래하는 신호 불연속성들을 제거하기 위한 기존의 방식들에서 인식된 문제들이 주로 현재 프레임 또는 적어도 그 일부의 처리가 과거 프레임에 대한 필터 파라미터들에 기초하는 것에 기인한다는 발명자의 발견에 기초한다. 본 발명의 방식에 따르면 이 문제가 회피되며, 즉, 본 발명의 방식은 현재 프레임의 부분을 과거 프레임의 필터 파라미터들로 필터링하지 않으며 그리하여 상기 설명한 문제들을 회피한다. 실시예들에 따르면, 불연속성을 제거하기 위하여, LPC 필터(선형 예측 필터)가 불연속성을 제거하기 위하여 사용된다. LPC 필터는 오디오 신호에서 추정될 수 있으며, 그 결과 그것은 오디오 신호의 스펙트럼 형태의 좋은 모델이고, 따라서 LPC 필터를 사용할 때, 오디오 신호의 스펙트럼 형태가 불연속성을 마스킹(mask)할 것이다. 일 실시예에서, LPC 필터는 필터링되지 않은 오디오 신호에 기초하여, 또는 전술한 선형 필터 H(z)에 의하여 필터링된 오디오 신호에 기초하여 추정될 수 있다. 실시예들에 따르면, LPC 필터는 오디오 신호, 예를 들어 현재 프레임 및/또는 과거 프레임, 및 레빈슨-더빈(Levenson-Durbin) 알고리즘을 사용하여 추정될 수 있다. LPC 필터는 또한 레빈슨-더빈 알고리즘을 사용하여 과거 필터링된 프레임 신호에만 기초하여 계산될 수도 있다.
또 다른 실시예들에서, 오디오 신호를 처리하기 위한 오디오 코덱은 선형 필터 H(z)를 사용할 수 있으며, 예를 들어, 변환-기반 오디오 코덱에서 양자화 잡음을 쉐이핑(shape)하기 위해, 양자화되거나 또는 그렇지 않은, LPC 필터를 사용할 수도 있다. 이러한 실시예에서, 이러한 기존 LPC 필터는 새로운 LPC 필터를 추정하는데 필요한 추가적인 복잡성 없이 불연속성을 스무딩(smoothing)하는데 직접 사용될 수 있다.
이하, 첨부 도면들을 참조하여 본 발명의 실시예들을 설명한다:
도 1은 종래의 방식에 따라 오디오 신호의 연속적인 프레임들을 처리하기 위한 블록도를 도시한다.
도 2는 불연속성을 제거하기 위하여 연속적인 오디오 프레임들을 처리하기 위한 또 다른 종래의 방법의 블록도를 도시한다.
도 3은 인코더 측면 및/또는 디코더 측면에서 오디오 신호의 연속적인 프레임들 사이의 불연속성을 제거하기 위한 본 발명의 방식을 구현하는 오디오 신호들을 전송하기 위한 시스템의 간략화된 블록도를 도시한다.
도 4는 일 실시예에 따른 오디오 신호의 연속적인 프레임들 간의 불연속성을 제거하기 위한 본 발명의 방식을 나타내는 흐름도를 도시한다.
도 5는 불연속성들의 제거에도 불구하고 출력 신호의 원하지 않는 왜곡을 회피하는 본 발명의 실시예들에 따른 현재 오디오 프레임을 처리하기 위한 개략적인 블록도를 도시한다.
도 6은 ZIR을 생성하기 위한 도 5의 블록의 기능을 나타내는 흐름도를 도시한다.
도 7은 필터 블록이 IIR과 같은 재귀 필터를 포함하는 경우 필터링된 현재 프레임 시작 부분을 처리하기 위한 도 5의 블록의 기능을 나타내는 흐름도를 도시한다.
도 8은 필터 블록이 FIR 필터와 같은 비-재귀 필터를 포함하는 경우 필터링된 현재 프레임 시작 부분을 처리하기 위한 도 5의 블록의 기능을 나타내는 흐름도를 도시한다.
이하에서, 본 발명의 방식의 실시예들이 보다 상세하게 설명될 것이며, 첨부된 도면에서 동일하거나 유사한 기능을 갖는 엘리먼트들은 동일한 참조 부호들로 표시되어 있다.
도 3은 인코더 측면 및/또는 디코더 측면에서 본 발명의 방식을 구현하는 오디오 신호들을 전송하기 위한 시스템의 간략화된 블록도를 도시한다. 도 3의 시스템은 입력(202)에서 오디오 신호(204)를 수신하는 인코더(205)를 포함한다. 인코더는 오디오 신호(204)를 수신하고 인코더의 출력(208)에서 제공되는 인코딩된 오디오 신호를 생성하는 인코딩 프로세서(206)를 포함한다. 인코딩 프로세서는 불연속성들을 회피하기 위해 수신된 오디오 신호의 연속적인 오디오 프레임들을 처리하기 위한 본 발명의 방식을 구현하도록 프로그래밍되거나 또는 구축될 수 있다. 다른 실시예들에서, 인코더는 송신 시스템의 일부일 필요는 없지만, 인코더는 인코딩된 오디오 신호들을 생성하는 독립형(standalone) 디바이스일 수 있거나 또는 인코더는 오디오 신호 송신기의 일부일 수도 있다. 일 실시예에 따르면, 인코더(200)는 212로 표시된 바와 같이 오디오 신호의 무선 송신을 허용하기 위한 안테나(210)를 포함할 수 있다. 다른 실시예들에서, 인코더(200)는, 예를 들어 참조 부호(214)로 표시된 바와 같이, 유선 접속을 이용하여 출력(208)에 제공된 인코딩된 오디오 신호를 출력할 수 있다.
도 3의 시스템은, 예를 들어, 유선 라인(214)을 통해 또는 안테나(254)를 통해 인코더(250)에 의해 처리될 인코딩된 오디오 신호를 수신하는 입력(252)을 갖는 디코더(250)를 더 포함한다. 인코더(250)는 인코딩된 신호에 대하여 동작하고 출력(260)에서 디코딩된 오디오 신호(258)를 제공하는 디코딩 프로세서 (256)를 포함한다. 디코딩 프로세서(256)는 불연속성들이 회피되는 방식으로 필터링되는 연속적인 프레임들에 대한 본 발명의 방식에 따라 동작하도록 구현될 수 있다. 다른 실시예들에서, 디코더는 전송 시스템의 일부일 필요는 없고, 오히려 디코더는 인코딩된 오디오 신호들을 디코딩하기 위한 독립형 디바이스일 수 있거나 또는 디코더는 오디오 신호 수신기의 일부일 수도 있다.
이하에서, 인코딩 프로세서(206) 및 디코딩 프로세서(256) 중 적어도 하나에서 구현될 수 있는 본 발명의 방식의 실시예들이 보다 상세히 설명될 것이다. 도 4는 본 발명의 방식의 실시예에 따라 오디오 신호의 현재 프레임을 처리하기 위한 흐름도를 도시한다. 현재 프레임의 처리가 설명될 것이며, 과거 프레임은 후술되는 동일한 기법으로 이미 처리된 것으로 가정한다. 본 발명에 따르면, 단계 S100에서 오디오 신호의 현재 프레임이 수신된다. 현재 프레임은 단계 S102에서, 예를 들어, 도 1 및 2와 관련하여 상술된 바와 같은 방식으로 필터링된다 (필터 블록 102 참조). 본 발명의 방식에 따라, 필터링된 과거 프레임 n-1과 필터링된 현재 프레임 n 사이의 불연속성(도 1 또는 2 참조)은 단계 S104에 표시된 바와 같이 선형 예측 필터링을 사용하여 제거될 것이다. 일 실시예에 따르면, 선형 예측 필터는 다음과 같이 정의될 수 있다:
Figure pat00002
여기서, M은 필터 차수이고 am은 필터 계수들(여기서, a0=1)이다. 이러한 종류의 필터는 또한 선형 예측 코딩(LPC: Linear Predictive Coding)으로서 알려져 있다. 실시예들에 따르면, 필터링된 현재 프레임은 선형 예측 필터링을 필터링된 현재 프레임의 적어도 일부에 적용함으로써 처리된다. 불연속성은 필터링된 현재 프레임의 시작 부분을, 과거 프레임의 마지막 부분을 기초로 하여 정의된 선형 예측 코딩 필터의 초기 상태들로 미리 정의된 신호를 선형 예측 필터링함으로써 얻어진 신호에 의해 변경함으로써 제거될 수 있다. 선형 예측 코딩 필터의 초기 상태들은 현재 프레임에 대한 필터 파라미터들의 세트를 사용하여 필터링된 과거 프레임의 마지막 부분에 기초하여 정의될 수 있다. 본 발명의 방식은 과거 프레임에 대해 사용된 필터 계수로 오디오 신호의 현재 프레임을 필터링하는 것을 요구하지 않으며 그에 의해 도 2와 관련하여 상기 기술된 종래 기술의 방식들에서 경험되는 바와 같은 현재 프레임에 대한 필터 파라미터들과 과거 프레임에 대한 필터 파라미터들의 미스매치(mismatch)에 기인하여 발생하는 문제들을 피할 수 있으므로 유리하다.
도 5는 불연속들의 제거에도 불구하고 출력 신호에서 원하지 않는 왜곡을 피하는 본 발명의 실시예들에 따른 오디오 신호의 현재 오디오 프레임을 처리하기 위한 개략적인 블록도를 도시한다. 도 5에서는, 도 1 및 2에서와 동일한 참조 부호들이 사용된다. 오디오 신호(100)의 현재 프레임 n이 수신되고, 오디오 신호(100)의 각 프레임은 복수의 샘플들을 갖는다. 오디오 신호(100)의 현재 프레임 n은 필터 블록(102)에 의하여 처리된다. 도 1 및 2의 종래 기술의 방식들과 비교할 때, 도 5와 관련하여 기술된 실시예들에 따르면, 필터링된 현재 프레임은 블록(110)에 의하여 개략적으로 도시된 바와 같이 ZIR 샘플들에 기초하여 추가적으로 처리된다. 일 실시예에 따르면, 과거 프레임 n-1에 기초하여, 그리고 LPC 필터에 기초하여, 블록(112)에 의하여 개략적으로 도시된 바와 같이 ZIR 샘플들이 생성된다.
프로세싱 블록들(110 및 112)의 기능을 이제 더 상세히 설명한다. 도 6은 ZIR 샘플들을 생성하기 위한 처리 블록(112)의 기능을 나타내는 흐름도를 도시한다. 전술한 바와 같이, 오디오 신호(100)의 프레임들은 각각의 프레임에 대해 선택되거나 또는 결정되는 필터 파라미터들 c를 사용하여 선형 필터 H(z)로 필터링된다. 필터 H(z)는 재귀적 필터, 예를 들어 IIR 필터일 수 있거나, 또는 비-재귀 필터, 예를 들어 FIR 필터일 수 있다. 처리 블록(112)에서는 양자화될 수 있거나 또는 양자화되지 않을 수 있는 LPC 필터가 사용된다. LPC 필터는 차수 M을 가지며 필터링된 또는 필터링되지 않은 오디오 신호에서 추정되거나, 또는 오디오 코덱에서도 사용되는 LPC 필터일 수 있다. 제 1 단계 S200에서, 과거 프레임 n-1의 M개의 마지막 샘플들(여기서, M은 LPC 필터의 차수)은 그러나 현재 프레임 n의 필터 파라미터들 또는 계수들 c1을 사용하여 필터 H(z)로 필터링된다. 이에 따라 단계 S200은 필터링된 신호의 제 1 부분을 생성한다. 단계 S202에서 필터링된 과거 프레임 n-1의 M개의 마지막 샘플들(과거 프레임 n-1의 필터 파라미터들 또는 계수들 c0을 사용하여 필터링된 과거 프레임의 M개의 마지막 샘플들)은 단계 S200에 의하여 제공된 필터링된 신호의 제 1 부분으로부터 차감되며, 이에 따라 필터링된 신호의 제 2 부분을 생성한다. 단계 S204에서 차수 M을 갖는 LPC 필터가 적용되고, 보다 구체적으로 LPC 필터의 제로 입력 응답(ZIR: Zero Input Response)이 단계 S204에서 제로 샘플들의 프레임을 필터링함으로써 생성되며, 여기서, 필터의 초기 상태들은 필터링된 신호들의 제 2 부분과 동일하고, 이에 따라 ZIR을 생성한다. 실시예들에 따르면, ZIR은 그 진폭이 0으로 더 빠르게 감소하도록 윈도우잉(windowing)될 수 있다.
도 5와 관련하여 전술한 바와 같이, ZIR은 프로세싱 블록(110)에 적용되며, 그 기능은 선형 필터 H(z)로서 IIR 필터와 같은 재귀 필터를 사용하는 경우에 대한 도 7의 흐름도를 참조하여 설명된다. 도 5와 관련하여 설명된 실시예에 따르면, 현재 프레임과 과거 프레임 간의 불연속성들을 제거하면서 원하지 않는 왜곡들을 피하기 위해, 현재 프레임 n을 필터링하는 단계는 샘플 단위(sample-by-sample) 기초로 현재 프레임 n을 처리(필터링)하는 단계를 포함하며, 여기서 시작 부분의 샘플들은 본 발명의 방식에 따라 처리된다. 보다 구체적으로, 현재 프레임 n의 시작 부분의 M개의 샘플들이 처리되고, 제 1 단계 S300에서 변수 m은 0으로 설정된다. 다음 단계 S302에서, 현재 프레임 n의 샘플 m은 필터 H(z) 및 현재 프레임 n에 대한 필터 파라미터들 또는 계수들 c1을 사용하여 필터링된다. 따라서, 종래의 방식들과는 달리 본 발명의 방식에 따라서, 현재 프레임은 과거 프레임으로부터의 계수들을 사용하여 필터링되는 것이 아니라, 현재 프레임으로부터의 계수들만을 사용하여 필터링되며, 이것은 결과적으로 불연속성들이 제거된다는 사실에도 불구하고 종래의 방식들에서 존재하는 원하지 않는 왜곡을 회피한다. 단계 S302는 필터링된 샘플 m을 생성하고, 단계 S304에서 샘플 m에 대응하는 ZIR 샘플이 필터링된 샘플 m으로부터 차감되어 필터링된 현재 프레임 n의 대응하는 샘플을 생성한다. 단계 S306에서, 현재 프레임 n의 시작 부분의 마지막 샘플 M이 처리되는지 여부가 결정된다. 시작 부분들의 모든 M개의 샘플들이 처리되지 않은 경우, 변수 m이 증가되고, 방법 단계들 S302 내지 S306이 현재 프레임 n의 다음 샘플을 위하여 반복된다. 일단 시작 부분들의 모든 M개의 샘플들이 처리되면, 단계 S308에서 현재 프레임 n의 나머지 샘플들은 현재 프레임의 필터 파라미터들 c1을 사용하여 필터링되고, 이에 따라 연속되는 프레임들 간의 불연속성들을 제거함에도 원하지 않는 왜곡을 회피하는 본 발명의 방식에 따라 처리된 필터링된 현재 프레임 n을 제공한다.
다른 실시예에 따르면, 선형 필터 H(z)는 FIR 필터와 같은 비-재귀 필터이고, 도 5와 관련하여 전술한 바와 같이, ZIR은 처리 블록(110)에 적용된다. 이 실시예의 기능은 도 8의 흐름도를 참조하여 설명된다. 단계 S400에서 현재 프레임 n은 현재 프레임에 대한 필터 파라미터들 또는 계수들 c1을 사용하여 필터 H(z)로 필터링된다. 따라서, 기존의 방식들과 달리 본 발명의 방식에 따라서, 현재 프레임은 과거 프레임으로부터의 계수들을 사용하여 필터링되지 않고, 오직 현재 프레임으로부터의 계수들을 사용하여 필터링 되며, 이는 결과적으로 불연속성들을 제거한다는 사실에도 불구하고 종래의 방식들에서 존재하는 원하지 않는 왜곡을 회피한다. 단계 S402에서, ZIR의 시작 부분은 필터링된 현재 프레임의 대응하는 시작 부분으로부터 차감되며, 이에 따라 본 발명의 방식에 따라서 필터링/처리된 시작 부분을 갖는 필터링된 현재 프레임 n 및 오직 현재 프레임에 대한 필터 파라미터들 또는 계수들 c1을 사용하여 필터링된 나머지 부분을 제공하고, 이에 따라 연속적인 프레임들 간의 불연속성들을 제거하면서 원하지 않는 왜곡을 회피한다.
본 발명의 방식은 오디오 신호가 필터링될 때 상술한 바와 같은 상황들에 적용될 수 있다. 실시예들에 따르면, 본 발명의 방식은, 예를 들어 신호 고조파들 사이의 코딩 노이즈의 레벨을 감소시키기 위해 오디오 코덱 포스트필터(postfilter)를 사용할 때, 디코더 측면에서도 적용될 수 있다. 디코더에서 오디오 프레임들을 처리하기 위하여, 일 실시예에 다르면, 포스트필터는 다음과 같을 수 있다:
H(z) = (1 - B(z)) / (1 - A(z)·z-T)
여기서, B(z) 및 A(z)는 두 개의 FIR 필터들이고 H(z) 필터 파라미터들은 FIR 필터들 B(z) 및 A(z)의 계수들이며, T는 피치 지연(pitch lag)을 나타낸다. 이러한 시나리오에서, 예를 들어 과거 프레임 필터 파라미터들 c0이 현재 프레임 필터 파라미터들 c1과 다를 때, 필터는 두 필터링된 프레임들 사이에 불연속성을 발생시킬 수 있으며, 이러한 불연속성은 필터링된 오디오 신호(104) 안에 예를 들어 “클릭”과 같은 아티팩트(artifact)를 생성할 수 있다. 이러한 불연속성은 상술한 바와 같이 필터링된 현재 프레임을 처리함으로써 제거된다.
본 발명에 따라, 오디오 신호(100)를 처리하기 위한 방법이 제공되었고, 그 방법은 선형 예측 필터링을 사용하여 상기 오디오 신호의 필터링된 현재 프레임과 필터링된 과거 프레임 사이의 불연속성(discontinuity)(106a, 106b)을 제거(S102, S104, S300-S308, S400-S402)하는 단계를 포함한다.
상기 오디오 신호를 처리하기 위한 방법은, 상기 오디오 신호의 상기 현재 프레임을 필터링하는 단계, 및 상기 과거 프레임의 마지막 부분에 기초하여 정의된 상기 선형 예측 필터의 초기 상태들로 미리 정의된 신호를 선형 예측 필터링함으로써 얻어진 신호에 의해 상기 필터링된 현재 프레임의 시작 부분을 수정함으로써 상기 불연속성을 제거하는 단계를 포함한다.
상기 선형 예측 필터의 상기 초기 상태들은 상기 현재 프레임의 필터링을 위한 필터 파라미터들의 세트를 이용하여 필터링된 필터링되지 않은 과거 프레임의 마지막 부분에 기초하여 정의된다.
상기 필터링된 또는 필터링되지 않은 오디오 신호(100)에 대한 상기 선형 예측 필터를 추정(estimate)하는 단계;를 더 포함한다.
상기 선형 예측 필터를 추정하는 단계는, 레빈슨-더빈(Levinson-Durbin) 알고리즘을 사용하여, 상기 오디오 신호(100)의 상기 과거 및/또는 현재 프레임에 기초하여, 또는 상기 오디오 신호(100)의 상기 필터링된 과거 프레임에 기초하여, 상기 필터를 추정하는 단계;를 포함한다.
상기 선형 예측 필터는 오디오 코덱의 선형 예측 필터를 포함한다.
상기 불연속성을 제거하는 단계는 상기 필터링된 현재 프레임의 상기 시작 부분을 처리하는 단계를 포함하고, 상기 현재 프레임의 상기 시작 부분은 상기 현재 프레임에 있는 상기 총 샘플 개수보다 작거나 같은 미리 정의된 개수의 샘플들을 가지며, 상기 현재 프레임의 상기 시작 부분을 처리하는 단계는 상기 필터링된 현재 프레임의 상기 시작 부분으로부터 제로-입력-응답(ZIR: Zero-Input-Response)의 시작부분을 빼는 단계(S304, S402)를 포함한다.
상기 필터링된 현재 프레임을 생성하기 위하여, FIR 필터와 같은 비-재귀(non-recursive) 필터를 사용하여 상기 오디오 신호의 상기 현재 프레임을 필터링하는 단계(S400)을 포함한다.
IIR 필터와 같은 재귀(recursive) 필터를 사용하여 샘플 단위(sample-by-sampe) 기반으로 상기 오디오 신호의 상기 필터링되지 않은 현재 프레임을 처리하는 단계를 포함하고, 상기 현재 프레임의 상기 시작 부분의 샘플을 처리하는 단계는: 필터링된 샘플을 생성하기 위하여 상기 현재 프레임의 상기 필터 파라미터들을 사용하여 상기 재귀 필터로 상기 샘플을 필터링하는 단계(S302)와, 상기 필터링된 현재 프레임의 대응하는 샘플을 생성하기 위하여 상기 필터링된 샘플로부터 대응하는 ZIR 샘플을 빼는 단계(S304)를 포함한다.
필터링하는 단계(S302) 및 빼는 단계(S304)는 상기 현재 프레임의 상기 시작 부분의 마지막 샘플이 처리될 때까지 반복되고, 상기 방법은, 상기 현재 프레임의 상기 필터 파라미터들을 사용하여 상기 재귀 필터로 상기 현재 프레임에 있는 상기 나머지 샘플들을 필터링하는 단계(S306)을 더 포함한다.
상기 ZIR을 생성하는 단계를 포함하고, 상기 ZIR을 생성하는 단계는: 필터링된 신호의 제 1 부분을 생성하기 위해 상기 현재 프레임을 필터링하는데 사용되는 필터 및 필터 파라미터들로 상기 필터링되지 않은 상기 과거 프레임의 M개의 마지막 샘플들을 필터링하는 단계(S200) ―여기서, M은 상기 선형 예측 필터의 차수(order)임―, 필터링된 신호의 제 2 부분을 생성하기 위해, 상기 과거 프레임의 상기 필터 파라미터들을 사용하여 필터링된, 상기 필터링된 과거 프레임의 M개의 마지막 샘플들을 상기 필터링된 신호의 제 1 부분으로부터 빼는 단계(S202), 및 상기 필터링된 신호의 제 2 부분과 동일한 초기 상태들 및 상기 선형 예측 필터를 사용하여 제로(zero) 샘들들의 프레임을 필터링함으로써 선형 예측 필터의 ZIR을 생성하는 단계(S204);를 포함한다.
상기 ZIR의 진폭이 제로로 더 빠르게 감소하도록 상기 ZIR을 윈도우잉(windowing)하는 단계를 포함한다.
본 발명의 어느 하나의 실시예에 따르면 컴퓨터 상에서 실행될 때, 앞서 예시한 어느 하나의 방법을 수행하는 명령들을 저장하는 컴퓨터 판독가능 매체를 포함하는, 비일시적인(non-transitory) 컴퓨터 프로그램 제품이 제공된다.
본 발명의 어느 하나의 실시예에 따르면 오디오 신호(100)를 처리하기 위한 장치가 제공되며, 그 장치는 선형 예측 필터를 사용하여 상기 오디오 신호의 필터링된 현재 프레임 및 필터링된 과거 프레임 사이의 불연속성을 제거하기 위한 프로세서(102, 110, 112)를 포함한다.
본 발명의 어느 하나의 실시예에 따르면 오디오 신호(100)를 처리하기 위한 장치가 제공되며, 그 장치는 앞서 예시한 어느 하나의 방법에 따라 동작하도록 구성된다.
본 발명의 어느 하나의 실시예에 따르면 오디오 디코더(decoder)(250)가 제공되고, 그 오디오 디코더는 앞서 예시한 장치를 포함한다.
본 발명의 어느 하나의 실시예에 따르면 오디오 인코더(encoder)(200)가 제공되고, 그 오디오 인코더는 앞서 예시한 장치를 포함한다.
설명된 개념의 몇몇 양상들이 장치의 문맥에서 기술되었지만, 이들 양상들은 대응하는 방법으로도 설명될 수 있음이 명백하며, 여기서 블록 또는 디바이스는 방법 단계 또는 방법 단계의 특징에 대응한다. 유사하게, 방법 단계의 문맥에서 기술된 양상들은 대응하는 장치의 대응하는 블록 또는 아이템 또는 특징으로도 설명될 수 있다.
특정 구현 요건들에 따라, 본 발명의 실시예들은 하드웨어 또는 소프트웨어로 구현될 수 있다. 구현은 각각의 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력하는 (또는 협력할 수 있는) 전기적으로 판독 가능한 제어 신호들이 저장된 디지털 저장 매체, 예를 들어, 플로피 디스크, DVD, 블루 레이, CD, ROM, PROM, EPROM, EEPROM 또는 플래시 메모리를 사용하여 수행될 수 있다. 그러므로, 디지털 저장 매체는 컴퓨터로 판독 가능할 수 있다.
본 발명에 따른 몇몇 실시예들은 본 명세서에서 설명된 방법들 중 하나가 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력할 수 있는 전기적으로 판독 가능한 제어 신호들을 갖는 데이터 캐리어를 포함한다.
일반적으로, 본 발명의 실시예들은 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로 구현될 수 있으며, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때 상기 방법들 중 하나를 수행하도록 동작한다. 프로그램 코드는 예를 들어 기계 판독 가능 캐리어(machine readable carrier)에 저장될 수 있다.
다른 실시예들은 기계 판독 가능 캐리어 상에 저장되는, 본 명세서에 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.
다시 말하면, 본 발명의 방법의 일 실시예는, 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때, 본 명세서에서 설명된 방법들 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
따라서, 본 발명의 방법의 또 다른 실시예는 본 명세서에서 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이, 여기에 기록되어, 포함되는 데이터 캐리어 (또는 디지털 저장 매체, 또는 컴퓨터 판독 가능 매체)이다.
그러므로, 본 발명의 또 다른 실시예는 본 명세서에서 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 신호들의 시퀀스이다. 데이터 스트림 또는 신호들의 시퀀스는 예를 들어 인터넷을 통해 데이터 통신 접속을 통하여 전송되도록 구성될 수 있다.
다른 실시예는 본 명세서에서 설명된 방법들 중 하나를 수행하도록 구성되거나 또는 적응된 처리 수단, 예를 들어 컴퓨터 또는 프로그램 가능한 로직 디바이스를 포함한다.
다른 실시예는 본 명세서에서 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.
몇몇 실시예들에서, 본 명세서에서 설명된 방법들의 기능들 중 몇몇 또는 전부를 수행하도록 프로그램 가능한 로직 디바이스 (예를 들어 필드 프로그래머블 게이트 어레이(Field Programmable Gate Array))가 사용될 수 있다. 몇몇 실시예들에서, 필드 프로그래머블 게이트 어레이는 본 명세서에서 설명된 방법들 중 하나를 수행하도록 마이크로프로세서와 협력할 수 있다. 일반적으로, 상기 방법들은 임의의 하드웨어 장치에 의해 수행되는 것이 바람직하다.
전술한 실시예들은 단지 본 발명의 원리들을 설명하기 위한 것일 뿐이다. 본 명세서에서 설명된 구성들 및 세부사항들의 변경들 및 변형들은 통상의 기술자에게 명백할 것이다. 따라서, 본 발명은 특허 청구범위의 범위에 의해서만 제한되고, 본 명세서의 실시예들의 기술 및 설명에 의해 제공된 구체적인 세부 사항에 의하여 제한되지 않는다.

Claims (12)

  1. 오디오 신호(100)를 처리하기 위한 방법에 있어서,
    신호 고조파들 사이의 코딩 노이즈의 레벨을 감소시키기 위해 상기 오디오 신호의 오디오 프레임들을 오디오 디코더에서 오디오 코덱 포스트 필터를 사용하여 처리하는 단계; 및
    상기 오디오 신호의 필터링된 현재 프레임과 필터링된 과거 프레임 사이의 불연속성(discontinuity)(106a, 106b)을 제거(S102, S104, S300-S308, S400-S402)하기위 하여 선형 예측 필터링을 사용하는 단계를 포함하고,
    상기 방법은,
    상기 오디오 신호의 상기 현재 프레임을 필터링하는 단계, 및
    상기 현재 프레임의 필터링을 위한 필터 파라미터들의 세트를 이용하여 필터링되는 필터링되지 않은 과거 프레임의 마지막 부분에 기초하여 정의된 상기 선형 예측 필터의 초기 상태를 이용하여 미리 결정된 신호를 선형 예측 예측 필터링함으로써 얻어진 신호에 의해 상기 필터링된 현재 프레임의 시작 부분을 수정함으로써 상기 불연속성을 제거하는 단계를 포함하는,
    오디오 신호를 처리하기 위한 방법.
  2. 제 1 항에 있어서,
    상기 필터링된 또는 필터링되지 않은 오디오 신호(100)에 대한 상기 선형 예측 필터를 추정(estimate)하는 단계;를 더 포함하는,
    오디오 신호를 처리하기 위한 방법.
  3. 제 2 항에 있어서,
    상기 선형 예측 필터를 추정하는 단계는,
    레빈슨-더빈(Levinson-Durbin) 알고리즘을 사용하여,
    상기 오디오 신호(100)의 상기 과거 및/또는 현재 프레임에 기초하여, 또는 상기 오디오 신호(100)의 상기 필터링된 과거 프레임에 기초하여,
    상기 필터를 추정하는 단계;를 포함하는,
    오디오 신호를 처리하기 위한 방법.
  4. 제 1 항에 있어서,
    상기 선형 예측 필터는 오디오 코덱의 선형 예측 필터를 포함하는,
    오디오 신호를 처리하기 위한 방법.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 불연속성을 제거하는 단계는 상기 필터링된 현재 프레임의 상기 시작 부분을 처리하는 단계를 포함하고,
    상기 현재 프레임의 상기 시작 부분은 상기 현재 프레임에 있는 상기 총 샘플 개수보다 작거나 같은 미리 정의된 개수의 샘플들을 가지며,
    상기 현재 프레임의 상기 시작 부분을 처리하는 단계는 상기 필터링된 현재 프레임의 상기 시작 부분으로부터 제로-입력-응답(ZIR: Zero-Input-Response)의 시작부분을 빼는 단계(S304, S402)를 포함하는,
    오디오 신호를 처리하기 위한 방법.
  6. 제 5 항에 있어서,
    상기 필터링된 현재 프레임을 생성하기 위하여, FIR 필터와 같은 비-재귀(non-recursive) 필터를 사용하여 상기 오디오 신호의 상기 현재 프레임을 필터링하는 단계(S400)을 포함하는,
    오디오 신호를 처리하기 위한 방법.
  7. 제 5 항에 있어서,
    IIR 필터와 같은 재귀(recursive) 필터를 사용하여 샘플 단위(sample-by-sampe) 기반으로 상기 오디오 신호의 상기 필터링되지 않은 현재 프레임을 처리하는 단계를 포함하고,
    상기 현재 프레임의 상기 시작 부분의 샘플을 처리하는 단계는:
    필터링된 샘플을 생성하기 위하여 상기 현재 프레임의 상기 필터 파라미터들을 사용하여 상기 재귀 필터로 상기 샘플을 필터링하는 단계(S302)와,
    상기 필터링된 현재 프레임의 대응하는 샘플을 생성하기 위하여 상기 필터링된 샘플로부터 대응하는 ZIR 샘플을 빼는 단계(S304)를 포함하는,
    오디오 신호를 처리하기 위한 방법.
  8. 제 7 항에 있어서,
    필터링하는 단계(S302) 및 빼는 단계(S304)는 상기 현재 프레임의 상기 시작 부분의 마지막 샘플이 처리될 때까지 반복되고,
    상기 방법은, 상기 현재 프레임의 상기 필터 파라미터들을 사용하여 상기 재귀 필터로 상기 현재 프레임에 있는 상기 나머지 샘플들을 필터링하는 단계(S306)을 더 포함하는,
    오디오 신호를 처리하기 위한 방법.
  9. 제 5 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 ZIR을 생성하는 단계를 포함하고,
    상기 ZIR을 생성하는 단계는:
    필터링된 신호의 제 1 부분을 생성하기 위해 상기 현재 프레임을 필터링하는데 사용되는 필터 및 필터 파라미터들로 상기 필터링되지 않은 상기 과거 프레임의 M개의 마지막 샘플들을 필터링하는 단계(S200) ―여기서, M은 상기 선형 예측 필터의 차수(order)임―,
    필터링된 신호의 제 2 부분을 생성하기 위해, 상기 과거 프레임의 상기 필터 파라미터들을 사용하여 필터링된, 상기 필터링된 과거 프레임의 M개의 마지막 샘플들을 상기 필터링된 신호의 제 1 부분으로부터 빼는 단계(S202), 및
    상기 필터링된 신호의 제 2 부분과 동일한 초기 상태들 및 상기 선형 예측 필터를 사용하여 제로(zero) 샘들들의 프레임을 필터링함으로써 선형 예측 필터의 ZIR을 생성하는 단계(S204);를 포함하는,
    오디오 신호를 처리하기 위한 방법.
  10. 제 9 항에 있어서,
    상기 ZIR의 진폭이 제로로 더 빠르게 감소하도록 상기 ZIR을 윈도우잉(windowing)하는 단계를 포함하는,
    오디오 신호를 처리하기 위한 방법.
  11. 컴퓨터 상에서 실행될 때, 제 1 항 내지 제 10 항 중 어느 한 항의 방법을 수행하는 명령들을 저장하는 컴퓨터 판독가능 매체를 포함하는,
    비일시적인(non-transitory) 컴퓨터 프로그램 제품.
  12. 오디오 디코더(decoder)(250)에 있어서,
    오디오 신호를 처리하기 위해 프로세서(102, 110, 112)를 갖는 장치를 포함하고,
    상기 프로세서(102, 110, 112)는
    신호 고조파들 사이의 코딩 노이즈의 레벨을 감소시키기 위해 오디오 코덱 포스트 필터를 사용하여 오디오 디코더에서 상기 오디오 신호의 오디오 프레임들을 처리하고, 또한
    상기 오디오 신호의 필터링된 과거 프레임 및 필터링된 현재 프레임 사이의 불연속성(106a, 106b)을 제거하는 단계(S102, S104, S300-S308, S400-S402)를 위해 선형 예측 필터링을 사용하기 위해 구성되고,
    상기 프로세서(102, 110, 112)는 상기 오디오 신호의 상기 현재 프레임을 필터링하고 또한 상기 현재 프레임의 필터링을 위한 필터 파라미터들의 세트를 이용하여 필터링되는 필터링되지 않은 과거 프레임의 마지막 부분에 기초하여 정의된 상기 선형 예측 필터의 초기 상태를 이용하여 미리 결정된 신호를 선형 예측 예측 필터링함으로써 얻어진 신호에 의해 상기 필터링된 현재 프레임의 시작 부분을 수정함으로써 상기 불연속성을 제거하기 위해 구성되는,
    오디오 디코더.
KR1020217029645A 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치 KR102459857B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020227036973A KR102615475B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP14178821.6 2014-07-28
EP14178821.6A EP2980796A1 (en) 2014-07-28 2014-07-28 Method and apparatus for processing an audio signal, audio decoder, and audio encoder
KR1020197018895A KR102304326B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치
PCT/EP2015/065219 WO2016015950A1 (en) 2014-07-28 2015-07-03 Method and apparatus for precessing an audio signal, audio decoder, and audio encoder

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020197018895A Division KR102304326B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020227036973A Division KR102615475B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20210118224A true KR20210118224A (ko) 2021-09-29
KR102459857B1 KR102459857B1 (ko) 2022-10-27

Family

ID=51224879

Family Applications (5)

Application Number Title Priority Date Filing Date
KR1020217029645A KR102459857B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치
KR1020197018895A KR102304326B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치
KR1020177005450A KR101997006B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치
KR1020237043141A KR20230173744A (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치
KR1020227036973A KR102615475B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치

Family Applications After (4)

Application Number Title Priority Date Filing Date
KR1020197018895A KR102304326B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치
KR1020177005450A KR101997006B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치
KR1020237043141A KR20230173744A (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치
KR1020227036973A KR102615475B1 (ko) 2014-07-28 2015-07-03 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치

Country Status (18)

Country Link
US (5) US20170133028A1 (ko)
EP (7) EP2980796A1 (ko)
JP (5) JP6503051B2 (ko)
KR (5) KR102459857B1 (ko)
CN (2) CN106575507B (ko)
AR (1) AR101287A1 (ko)
AU (1) AU2015295709B2 (ko)
CA (6) CA3193302A1 (ko)
ES (4) ES2960422T3 (ko)
HK (1) HK1259289A1 (ko)
MX (1) MX362737B (ko)
MY (1) MY179016A (ko)
PL (4) PL3407351T3 (ko)
PT (3) PT3654333T (ko)
RU (1) RU2665282C1 (ko)
SG (1) SG11201700684YA (ko)
TW (1) TWI595480B (ko)
WO (1) WO2016015950A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
CN117040487B (zh) * 2023-10-08 2024-01-02 武汉海微科技有限公司 音频信号处理的滤波方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110085483A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Methods for power headroom reporting, resource allocation, and power control
WO2011085483A1 (en) * 2010-01-13 2011-07-21 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering
KR101997006B1 (ko) * 2014-07-28 2019-07-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5012517A (en) 1989-04-18 1991-04-30 Pacific Communication Science, Inc. Adaptive transform coder having long term predictor
EP1239456A1 (en) * 1991-06-11 2002-09-11 QUALCOMM Incorporated Variable rate vocoder
US5784532A (en) * 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
SE9700772D0 (sv) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
FR2762464B1 (fr) * 1997-04-16 1999-06-25 France Telecom Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere"
GB2326572A (en) 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
GB2356538A (en) * 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US7512535B2 (en) 2001-10-03 2009-03-31 Broadcom Corporation Adaptive postfiltering methods and systems for decoding speech
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7145484B2 (en) 2002-11-21 2006-12-05 Nippon Telegraph And Telephone Corporation Digital signal processing method, processor thereof, program thereof, and recording medium containing the program
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
JP4606264B2 (ja) * 2005-07-19 2011-01-05 三洋電機株式会社 ノイズキャンセラ
JP2009539132A (ja) * 2006-05-30 2009-11-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号の線形予測符号化
CN101197134A (zh) * 2006-12-05 2008-06-11 华为技术有限公司 消除编码模式切换影响的方法和装置以及解码方法和装置
US8000969B2 (en) * 2006-12-19 2011-08-16 Nuance Communications, Inc. Inferring switching conditions for switching between modalities in a speech application environment extended for interactive text exchanges
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
US8069051B2 (en) * 2007-09-25 2011-11-29 Apple Inc. Zero-gap playback using predictive mixing
CN101527138B (zh) 2008-03-05 2011-12-28 华为技术有限公司 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
ES2895268T3 (es) * 2008-03-20 2022-02-18 Fraunhofer Ges Forschung Aparato y método para modificar una representación parametrizada
RU2498419C2 (ru) * 2008-07-11 2013-11-10 Фраунхофер-Гезелльшафт цур Фёердерунг дер ангевандтен Устройство аудио кодирования и декодирования для кодирования фреймов, представленных в виде выборок звуковых сигналов
ES2683077T3 (es) * 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
JP5551693B2 (ja) * 2008-07-11 2014-07-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ エイリアシングスイッチスキームを用いてオーディオ信号を符号化/復号化するための装置および方法
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
CN101355692B (zh) * 2008-07-30 2013-03-20 浙江大学 一种实时跟踪运动目标区域的智能监控装置
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
JP5699141B2 (ja) * 2009-06-23 2015-04-08 ヴォイスエイジ・コーポレーション 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し
KR101411759B1 (ko) * 2009-10-20 2014-06-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 인코더, 오디오 신호 디코더, 앨리어싱-소거를 이용하여 오디오 신호를 인코딩 또는 디코딩하는 방법
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
PL4120248T3 (pl) * 2010-07-08 2024-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder wykorzystujący kasowanie aliasingu w przód
CN101976566B (zh) * 2010-07-09 2012-05-02 瑞声声学科技(深圳)有限公司 语音增强方法及应用该方法的装置
US8738385B2 (en) * 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
CN102368385B (zh) * 2011-09-07 2013-08-14 中科开元信息技术(北京)有限公司 后向块自适应Golomb-Rice编解码方法及装置
US9043201B2 (en) * 2012-01-03 2015-05-26 Google Technology Holdings LLC Method and apparatus for processing audio frames to transition between different codecs
CN103548080B (zh) * 2012-05-11 2017-03-08 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110085483A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Methods for power headroom reporting, resource allocation, and power control
WO2011085483A1 (en) * 2010-01-13 2011-07-21 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering
KR101997006B1 (ko) * 2014-07-28 2019-07-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ISO/IEC FDIS 23003-3:2011(E), Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding. ISO/IEC JTC 1/SC 29/WG 11. 2011.09.20. *

Also Published As

Publication number Publication date
EP3654333B1 (en) 2022-03-09
AU2015295709B2 (en) 2017-12-21
EP3407351B1 (en) 2020-01-01
US20240135943A1 (en) 2024-04-25
JP6503051B2 (ja) 2019-04-17
KR102615475B1 (ko) 2023-12-19
ES2773690T3 (es) 2020-07-14
JP7202545B2 (ja) 2023-01-12
KR20220150992A (ko) 2022-11-11
JP6864382B2 (ja) 2021-04-28
CN106575507A (zh) 2017-04-19
JP2024138295A (ja) 2024-10-08
CN113012704A (zh) 2021-06-22
US20230335147A1 (en) 2023-10-19
PT3654333T (pt) 2022-05-19
ES2960422T3 (es) 2024-03-04
KR20230173744A (ko) 2023-12-27
TW201606754A (zh) 2016-02-16
CA3193316A1 (en) 2016-02-04
WO2016015950A1 (en) 2016-02-04
TWI595480B (zh) 2017-08-11
HK1259289A1 (zh) 2019-11-29
KR101997006B1 (ko) 2019-07-08
RU2665282C1 (ru) 2018-08-28
EP4235667A2 (en) 2023-08-30
CA2955674C (en) 2023-08-15
US11869525B2 (en) 2024-01-09
EP3407351A1 (en) 2018-11-28
CA2955674A1 (en) 2016-02-04
KR20170036084A (ko) 2017-03-31
MX2017001245A (es) 2017-07-07
JP2021107932A (ja) 2021-07-29
PL3654333T3 (pl) 2022-07-04
AU2015295709A1 (en) 2017-03-16
JP7509859B2 (ja) 2024-07-02
BR112017001362A2 (pt) 2017-11-21
PT3175452T (pt) 2018-10-22
CN106575507B (zh) 2021-02-02
EP4235667C0 (en) 2024-09-04
PL3175452T3 (pl) 2019-01-31
ES2685984T3 (es) 2018-10-15
EP3175452A1 (en) 2017-06-07
EP4030426A1 (en) 2022-07-20
EP4235667B1 (en) 2024-09-04
EP4235667A3 (en) 2023-09-13
PT3407351T (pt) 2020-03-31
US20170133028A1 (en) 2017-05-11
SG11201700684YA (en) 2017-02-27
PL3407351T3 (pl) 2020-06-29
US20220157328A1 (en) 2022-05-19
CA3193302A1 (en) 2016-02-04
KR102459857B1 (ko) 2022-10-27
EP4030426C0 (en) 2023-08-16
JP2017522606A (ja) 2017-08-10
US12033648B2 (en) 2024-07-09
MY179016A (en) 2020-10-26
EP3654333A1 (en) 2020-05-20
KR20190080982A (ko) 2019-07-08
AR101287A1 (es) 2016-12-07
MX362737B (es) 2019-02-06
EP4447048A2 (en) 2024-10-16
US12014746B2 (en) 2024-06-18
EP2980796A1 (en) 2016-02-03
JP2023036651A (ja) 2023-03-14
EP4030426B1 (en) 2023-08-16
EP3175452B1 (en) 2018-07-11
EP4447048A3 (en) 2024-10-23
JP2019164348A (ja) 2019-09-26
US20220148609A1 (en) 2022-05-12
CN113012704B (zh) 2024-02-09
CA3193306A1 (en) 2016-02-04
CA3193309A1 (en) 2016-02-04
PL4030426T3 (pl) 2024-02-12
ES2914632T3 (es) 2022-06-14
CA3193319A1 (en) 2016-02-04
KR102304326B1 (ko) 2021-09-23

Similar Documents

Publication Publication Date Title
KR102304326B1 (ko) 오디오 인코더, 오디오 디코더 및 오디오 신호를 처리하기 위한 방법 및 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant