KR20080103088A - 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법 - Google Patents

디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법 Download PDF

Info

Publication number
KR20080103088A
KR20080103088A KR1020087023143A KR20087023143A KR20080103088A KR 20080103088 A KR20080103088 A KR 20080103088A KR 1020087023143 A KR1020087023143 A KR 1020087023143A KR 20087023143 A KR20087023143 A KR 20087023143A KR 20080103088 A KR20080103088 A KR 20080103088A
Authority
KR
South Korea
Prior art keywords
signal
echoes
digital audio
current frame
energy
Prior art date
Application number
KR1020087023143A
Other languages
English (en)
Other versions
KR101376762B1 (ko
Inventor
발라즈 코베시
가이어더 알라인 르
Original Assignee
프랑스 텔레콤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프랑스 텔레콤 filed Critical 프랑스 텔레콤
Publication of KR20080103088A publication Critical patent/KR20080103088A/ko
Application granted granted Critical
Publication of KR101376762B1 publication Critical patent/KR101376762B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other

Abstract

본 발명의 목적은, 한편으로는 인코더로부터의 특정한 보조 표시(indication)를 전송함이 없이도, 다른 한편으로는 추가적인 복잡도를 인코딩에 도입하지 않으면서도, 에코 감쇠 디바이스에서 잘못된 트리거링을 방지하기 위한 것이다. 또한, 본 발명의 다른 목적은, 인코더로부터 오류-알람(false-alarm) 표시가 전송되지 않는 경우에 있어서, 발성(attack)의 출현에 동기되어 에코의 감쇠가 금지되는 것을 가능하게끔하는 것이며, 이는 종래기술에 따른 디바이스들에서는 실현될 수 없는 것인바, 왜나하면, 일반적으로 시간 인코더는 발성(attack)에 즉각적으로 반응하지 않기 때문이다. 또한, 본 발명의 또 다른 목적은, 변환 디코더로부터 유도된 신호가 일정한 동적 범위를 갖는 때에, 에코 감쇠 디바이스의 잘못된 트리거링을 회피하기 위한 것인바, 발성이 없기 때문에 에코 감쇠 디바이스는 활성화될 필요가 없다. 이는, 변환 디코더에 의해 디코딩된 신호에 비하여 시간 디코더에 의해 디코딩된 신호가 약할 때, 에코 감쇠 디바이스가 트리거링되는 종래기술에서의 디바이스들과는 상이한 것이다.
사후 에코, 사전 에코, 감쇠

Description

디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법{METHOD FOR TRAINED DISCRIMINATION AND ATTENUATION OF ECHOES OF A DIGITAL SIGNAL IN A DECODER AND CORRESPONDING DEVICE}
본 발명은 디코더 및 대응 디바이스에서 디지털 신호의 반향(echo : 이하에서는 '반향' 또는 '에코'라 한다)들을 안전하게 구별하고 감쇠시키는 방법에 관한 것이다.
고정 네트워크, 이동 네트워크 또는 방송 네트워크 등의 전송 네트워크를 통하여 디지털 오디오 신호들을 전송하기 위해서 또는 이들 신호들을 저장하기 위해서는, 압축 프로세스들이 이용되어, 시간 인코딩(time encoding) 유형(가능하다면, 예측형) 또는 소위 변환 인코딩(transform encoding) 유형의 인코딩 시스템을 구현한다.
본 발명에 따른 방법 및 디바이스는, 소리 신호, 특히 코딩된 디지털 오디오 신호들의 압축에 적용가능하며, 이들 신호들의 프레임들은 악기, 파열 음절들(plosive syllables)을 포함하는 음성 신호들에 의해 생성되는 소리 증가 및/또는 소리 감소의 소스가 된다. 또한, 본 발명은, 시간 도메인(예측형 또는 기타)에서의 디코더들 및 역 주파수 변환(inverse frequency transform) 디코더들을 포함 하는 다계층(multilayer) 디코더 디바이스들에도 적용가능하다.
도1은 종래 기술에 따라, 변환(transform)과 합산/오버랩에 의해서 디지털 오디오 신호를 인코딩 및 디코딩하는 것을 일례로서 도시한 도면이다.
전술한 인코딩 및 디코딩 프로세스들을 좀더 상세히 설명하기 위해서, 예를 들면, 본 출원인에 의해 2005년 7월 12일자로 출원된 프랑스 특허 출원(번호: 05 07471)의 상세한 설명의 도입부를 참조할 수 있다.
가령, 타악기 소리(percussions)와 같은 몇몇 음악 소리들과 가령, 파열 음절들과 같은 스피치 시퀀스(speech sequence)는, 극도로 갑작스러운 발성들(extremely abrupt attacks)로 특징지워질 수 있는바, 이들은 매우 적은 샘플 범위의(도1의 샘플 410 에서부터) 샘플링된 신호의 동적 범위내에서 매우 강력한 변화를 갖는 매우 빠른 변이들(transitions) 내에서 반사된다.
변환 인코딩에서 적용되는 샘플들의 연속적인 블록들로의 세분(subdivision)은, 소리 신호에 전혀 무관한바, 따라서 변이들(transitions)은 분석 윈도우의 임의의 포인트에서 나타난다. 그렇다면, 변환 인코딩에서, 잡음은, 길이 2L을 갖는 샘플링된 블록의 전체 지속기간(duration)에 걸쳐서 시간상으로 균일하게 분포한다. 이것은, 변이 이전의 사전-에코들(pre-echoes) 및 변이 이후의 사후-에코들(post-echoes)의 출현하에서 반사된다.
잡음 레벨은 상기 변이 다음에 즉시 후속하는 고-에너지 샘플들에 대한 신호의 레벨보다는 작지만, 저-에너지 샘플들, 특히 상기 변이에 선행하는 부분(도1의 160-410 샘플들)에 대한 신호의 레벨보다는 크다. 앞서 언급한 부분의 경우, 신호 대잡음비는 매우 좋지 않으며 그리고 그 결과로서 생기는 열화(degradation), 지정된 사전-잡음들(designated pre-echoes)은, 매우 불쾌(annoying)한 것이 될 수 있다.
도1을 참조하면, 상기 사전-에코는 변이 이전의 프레임에 영향을 미치며 변이가 발생한 프레임에도 영향을 미치는 것을 알 수 있다.
실제로, 인간의 귀는, 상기 발성의 생리적인 전송 이전에, 수 밀리세컨드 정도의 섬세하게 제한된 사전-마스킹(pre-masking)을 적용한다.
사전-에코의 지속기간이 사전-마스킹의 지속기간보다 큰 경우에는, 생성된 노이즈, 또는 사전-에코를 청취할 수 있다.
또한, 인간의 귀는, 고-에너지 시퀀스로부터 저-에너지 시퀀스로의 변이에 대해, 5 에서 60 밀리세컨드 정도의 좀더 긴 지속기간을 갖는 사후-마스킹(post-masking)을 적용한다. 따라서, 사후-에코의 경우 용인할 수 있는 불쾌 비율 또는 불쾌 레벨은, 사전-에코의 그것보다 매우 크다.
사전-에코 현상이 좀더 심각해질 수록, 샘플들의 갯수 관점에서 블록들의 길이가 증가함에 따라, 불쾌한 정도가 점점 더 심해진다. 그렇다면, 변환 인코딩에서, 가장 중요한 주파수 존(zone : 이하에서는 '존' 또는 '영역' 이라 함)에 대해 정확한 해상력(resolution)을 가질 필요가 있다. 고정 샘플링 주파수와 고정 비트 레이트에서, 윈도우의 포인트들의 숫자가 증가한다면, 음향심리학적(psycho-acoustics) 모델에 의해 유용한 것으로 간주되는 주파수 라인들(frequency lines)을 인코딩하기 위한 이용가능한 비트들이 좀더 많이 존재하게 될 것이며, 따라서, 좀더 긴 길이를 갖는 블록들을 사용할 수 있는 장점들을 갖게 될 것이다. 인코딩 프로세스, 예컨대 AAA(Advanced Audio Coding)가 구현되는 경우, 긴 길이를 갖는 윈도우는 고정된 숫자의 샘플들을 포함하는바, 예를 들어 샘플링 주파수가 32 kHz 라면, 64 ms의 지속기간에 대해 2048 개의 샘플들을 갖게될 것이다. 통상적인 응용예들에서 사용되는 인코더들은, 16 kHz에서 40 ms의 지속기간 및 20 ms의 프레임 재생(frame renewal) 지속기간을 갖는 윈도우를 흔히 이용한다.
앞서 언급된 사전-에코의 불쾌 효과를 감소시키고 더 적은 정도로 사후-에코의 효과를 감소시키기 위해서, 다양한 해결책들이 지금까지 제공되었다.
첫번째 해결책은 필터링의 적용을 수반한다. 변이에 선행하는 영역(zone)에서, 재구성된 신호(reconstituted signal)는, 발성(attack)으로 인하여, 실제로는 원래의 신호와 상기 신호에 중첩된 양자화 잡음으로 이루어진다.
이에 관한 필터링 기법은, Y. Mahieux 와 J.P. Petit 에 의한 논문 "High Quality Audio Transform Coding at 64 kbits" IEEE Trans on Communications Vol 42 No. 11, November 1994 에 기술되어 있다.
이러한 필터링을 구현한다는 것은 파라미터들에 대한 지식을 수반하는바, 이들 파라미터들 중 몇몇은, 잡음에 영향을 받은 샘플들(noise-affected samples)로부터 디코더 상에서 평가된다. 하지만, 예컨대 원래 신호의 에너지와 같은 정보는, 인코더 측에서만 알 수 있으며 따라서 이는 필히 전송되어야만 한다. 수신된 블록이 갑작스런 변화를 동적 범위내에서 포함하고 있는 경우, 상기 필터링 프로세싱이 이에 적용된다.
전술한 필터링 프로세스로는 원래 신호를 복원하는 것이 불가능하며, 사전-에코들을 강력히 감소시킬 수는 있다. 하지만, 상기 필터링 프로세스는 디코더측으로 전송되어야할 추가적인 보조 파라미터들을 요구한다.
두번째 해결책은, 윈도우들의 동적 스위칭에 의해서 사전-에코들을 감소시키는 것을 포함한다.
이러한 기법은, B. Edler 에게 허여된 미국등록특허 US 5,214,742에 서술되어 있다. 상기 해결책은 국제 기준에 따른 다양한 오디오 인코딩 해결책들에서 응용예들의 주제가 되어왔다.
상기 해결책에 따르면, 신호들의 시간 및 주파수 해상력은 코딩 윈도우의 길이에 강력하게 의존한다라는 사실 때문에, 주파수 인코더들은 긴 윈도우(예컨대, 2048개의 샘플들)와 짧은 윈도우(예컨대, 256개의 샘플들) 사이에서 스위칭한다. 여기서, 긴 윈도우는 정상 신호(stationary signal)에 대한 것이며, 짧은 윈도우는 폭 넓게 변화하는 동적 범위를 구비한 신호 또는 과도 신호(transient signal)에 대한 것이다. 이러한 적응(adaptation)은 AAA 모듈에서 수행되는바, 인코더 상에서 프레임별로 결정이 이루어진다.
상기 두번째 해결책의 단점중 하나는 N/2 샘플 정도의(order of N/2 samples) 추가적인 지연을 포함한다는 점이다. 만일, 다음 윈도우에서 변이가 시작된다면, 변이를 준비할 수 있어야만 하고 그리고 완전한 재구성을 유지하는 것이 가능한 변이 윈도우로 스위칭하는 것이 필수적이라는 사실 때문에, 상기 두번째 해결책은 추가적인 지연을 포함한다라는 단점을 갖는다.
하지만, 디코더가 복수개의 시간 디코딩 스테이지들(아마도, 예측형)과 변환 디코딩 스테이지들을 포함하여 구성된 경우, 에코들은 계층적인(hierarchical) 인코더들에서 용이하게 감소될 수 있다. 이러한 케이스에서, 시간 디코딩 스테이지들은 에코를 검출하기 위해 이용될 수 있다. 이러한 유형의 디코딩에 관한 일례는, KiKuiri 등에 의한 미국 특허출원 2003/0154074 에 서술되어 있다.
상기 미국 특허출원에 기술된 종래기술로부터 알 수 있는 방법은, 디코딩된 CELP 기본 코어 신호에 기초하여 사전-에코의 검출을 수행하는 것인바, 여기서 CELP는, 코드 여기 선형 예측(Code Excited Linear Prediction: CELP)을 나타낸다.
상기 방법은, 이러한 이유로, 부속 정보에 기초하고 시간 디코더와 변환 디코더로부터의 재구성 프레임들에 동기되는 사전-에코 감소 프로세싱을 제공할 수 없다.
앞서 언급된 프랑스 특허출원 05 07471은, 에코들의 존재를 구별할 수 있으며, 변환 인코딩과 시간 인코딩으로부터의 다계층 계층적 인코딩(multi-layer hierarchical encoding)에 의해 생성된 디지털 오디오 신호의 에코들을 감쇠시킬 수 있다. 여기서, 상기 변환 인코딩은 에코를 발생하지만, 시간 인코딩은 에코를 발생하지 않는다. 이러한 특허 출원의 디코딩에서는, 디지털 오디오 신호의 현재 프레임들 각각에 대해, 에코-비발생 디코딩으로부터 획득한 신호의 진폭에 대한 에코-발생 디코딩으로부터 획득한 신호의 진폭의 비율이 실시간으로 임계값과 비교된다. 상기 비율이 임계값보다 크거나 같으면, 변환 인코딩으로부터 유도된 에코가 현재 프레임 내에 존재한다고 결론지을 수 있다. 그렇지 않다면, 즉 상기 비율이 임계값보다 작으면, 변환 인코딩으로부터 유도된 에코가 현재 프레임 내에 존재하지 않는다고 결론지을 수 있다.
이러한 방법은, 상기 프랑스 특허출원의 도3a 및 도3b에 대응하는 본 출원의 도2a 및 도2b를 참조하여 설명된다. 이하에서는, 본 출원의 상세한 설명의 도입부에서 괄호 안의 도면부호들은, 프랑스 특허출원 05 07471의 도면 부호를 지칭하는것으로서, 상기 프랑스 특허출원은 참조를 위해 본 출원에 도입된다.
도2a는, "예측 디코딩 계층 i" 라고 지칭되는 다수의 에코-비발생 디코더들과 "변환 디코딩 계층 j" 라고 지칭되는 다수의 변환 디코더들을 포함하는, 계층적 디코더를 도시한 것이다.
도2b(도3b)는 입력으로서, 에코들과 시간 디코더로부터 유도된 디코딩된 신호 및 변환 디코더로부터 유도된 디코딩된 신호를 구별하기 위한 디바이스(1)를 기술한다. 에코 디바이스의 출력은, 디코딩된 신호를 합산/오버랩의 출력에서 감쇠시킴으로써, 에코 감쇠 디바이스(2)를 제어한다.
도2c(도3c)는, 시간 디코더와 변환 디코더로부터 각각 유도된 신호들의 시간 엔벨로프(envelope : 이하, '엔벨로프' 라 함)들과 에코 존재 플래그(echo presence flag)를 어떻게 계산하는지를 도시한 것이다.
도2d(도3e)는, 합산/오버랩 출력신호에 이득 g(k)을 곱함으로써, 에코 존재 지속기간 동안에 에코들이 어떻게 감쇠되는지를 도시한 것이다. 여기서, 이득 g(k)은, 변환-디코딩된 신호의 엔벨로프에 대한 시간신호의 엔벨로프의 비율과 같다.
g(k) = Min ( EnvPi(k) / EnvTj(k), 1)
상기 도면에서, POS 값이 0 이라면, 사전-에코 프로세싱은 전체 프레임에 대해 수행된다.
도2e(도11)는 다계층 시스템에서 에코들을 구별하는 원리를 설명한 것으로, 에코들의 구별 및 에코들의 감쇠는 2개의 주파수 서브-밴드들에서 비제한적인 방식(non-limiting way)으로 수행된다.
이러한 일례에서, 신호 필터링은, 시간 신호 Xpi(n)에 대한 시간 필터링에 의해서 수행되거나 또는 MDCT(Modified DCT : 변형된 이산 코사인 변환) 주파수 도메인에서의 필터링에 의해서 수행된다. MDCT 주파수 도메인에서의 필터링은 다음과 같이 수행되는바, 시간 신호를 MDCT 계수들로 변환하고, 다음으로 MDCT 계수들을 조작하고(MDCT 계수들을 0으로 설정, 합산, 대체(replacement), 등등) 그리고 마지막으로 역 MDCT 변환을 적용하고 이어서 각각의 서브 밴드에 대한 합산/오버랩이 수행된다.
앞서 언급된 프랑스 특허출원 05 07471에 설명된 방법 및 디바이스는, 전술한 바와같은 종래기술의 단점들에 대한 해결책을 제공한다.
프랑스 특허출원 05 07471에 설명된 해결책에서는, 에코 감쇠 디바이스의 잘못된 트리거링(triggering)을 치유하기 위해서, 에코 감쇠 디바이스의 트리거링(triggering)을 예측하기 위한 절차(procedure)가 인코더에서 이용된다.
좀더 상세하게는, 인코더는 신호가 변환-인코딩(transform-encoding)되게 하기 때문에, 비-양자화된 신호 상의 에코들의 구별은 인코더에서 수행된다. 그리고 인코더는 사전-에코의 영향을 받지 않기 때문에, 임의의 트리거링은 오류가 있다고 보장될 수 있다. 에코는 인코더에서 검출되며, 그리고 만일 비정상적인 검출이 있었다면, 플래그가 프레임내에서 전송되어, 디코더에서 에코의 감쇠를 금지시킨다.
본 발명의 목적은, 한편으로는 인코더로부터의 특정한 보조 표시(indication)를 전송함이 없이도, 다른 한편으로는 추가적인 복잡도를 인코딩에 도입하지 않으면서도, 에코 감쇠 디바이스에서 잘못된 트리거링을 방지하기 위한 것이다.
또한, 본 발명의 다른 목적은, 인코더로부터 오류-알람(false-alarm) 표시가 전송되지 않는 경우에 있어서, 발성(attack)의 출현에 동기되어 에코의 감쇠가 금지되는 것을 가능하게끔하는 것이며, 이는 종래기술에 따른 디바이스들에서는 실현될 수 없는 것인바, 왜나하면, 일반적으로 시간 인코더는 발성(attack)에 즉각적으로 반응하지 않기 때문이다.
또한, 본 발명의 또 다른 목적은, 변환 디코더로부터 유도된 신호가 일정한 동적 범위를 갖는 때에, 에코 감쇠 디바이스의 잘못된 트리거링을 회피하기 위한 것인바, 발성이 없기 때문에 에코 감쇠 디바이스는 활성화될 필요가 없다. 이는, 변환 디코더에 의해 디코딩된 신호에 비하여 시간 디코더에 의해 디코딩된 신호가 약할 때, 에코 감쇠 디바이스가 트리거링되는 종래기술에서의 디바이스들과는 상이한 것이다.
본 발명의 다른 목적은, 시간 인코더에 낮은 데이터 속도(data rate)가 할당되는 경우, 즉 결과적으로, 모든 입력 신호들을 올바르게 인코딩할 수 없는 케이스에서의 구현예를 제공하는 것이다.
일례로서 들 수 있는 것은, 4000 ~ 7000 Hz의 감소된 주파수 신호 대역에서 동작하며, 그리고 이 대역에서 나타나는 사인 곡선들(sinusoids)을 올바르게 인코딩할 수 없는, 종래기술의 몇몇 시간 인코더들의 경우이다. 따라서, 시간 인코더 출력에서의 신호는 약하며, 에코 감쇠는 그릇되게 활성화되는바, 이는 인코딩 품질을 매우 열화시킨다.
또한, 본 발명의 목적은, 다계층 디코더에서 디지털 신호의 에코들을 안전하게 구별하고 감쇠시키기 위한 방법 및 디바이스의 구현예를 제공하는 것인바, 본 발명에서는, 선행 프레임에 발성(attack)이 있는 경우, 사후-에코들의 감쇠가 부당하게 금지되는 것을 방지할 수 있다.
에코들을 생성하는 변환 인코딩으로부터 생성된 디지털 오디오 신호의 에코들을 구별 및 감쇠시키기 위한 방법, 즉 본 발명의 주제는, 적어도 디코딩에서, 상기 디지털 오디오 신호의 현재 프레임 각각에 대해서, 다음의 단계들을 포함한다. 변이에 선행하는 저-에너지 존과 고-에너지 존을 구별하고, 현재 프레임의 구별되지 않은(non-discriminated) 존들에 대응하는 오류-알람 존을 정의하고, 감쇠 이득값들로 에코들의 초기 프로세싱을 결정하고, 현재 프레임의 저-에너지 구별 존들내의 에코들에 대한 초기 프로세싱에 따라 에코들을 감쇠시키고, 오류-알람 존에서 초기 프로세싱의 에코들의 감쇠를 금지시킨다.
본 발명의 주제인 상기 방법은, 발성에 의해서 생성된 고-에너지 신호의 품질을 열화시키지 않으면서도, 에코들, 사전-에코들과 사후-에코들의 제거를 가능케 한다.
도1은 종래 기술에 따라, 변환(transform)과 합산/오버랩에 의해서 디지털 오디오 신호를 인코딩 및 디코딩하는 것을 일례로서 도시한 도면이다.
도2a는, "예측 디코딩 계층 i" 라고 지칭되는 다수의 에코-비발생 디코더들과 "변환 디코딩 계층 j" 라고 지칭되는 다수의 변환 디코더들을 포함하는, 계층적 디코더를 도시한 것이다.
도2b(도3b)는 입력으로서, 에코들과 시간 디코더로부터 유도된 디코딩된 신호 및 변환 디코더로부터 유도된 디코딩된 신호를 구별하기 위한 디바이스(1)를 기술한다.
이들은 발명의 상세한 설명을 읽고 하기의 도면들을 연구함으로써 좀더 잘 이해될 것인바, 도면들 중 도1과 도2a 내지 도2e는 프랑스 출원 05 07471에서 기술된 바와같이 종래기술에 관한 것이며, 그리고 도2f는 종래기술에 관한 것이다.
- 도3a는 본 발명에 따른 방법을 구현하기 위한 단계들에 대한 일반적인 순서도를 일례로서 나타낸 것이다.
- 도3b는 에코 감쇠가 없는 경우에, 낮은 신호 대역의 CELP 예측/다계층 변환 인코더에서 디지털 오디오 신호들의 타이밍도를 도시한 것이다.
- 도3c는 도2b에 예시된 종래기술의 에코 감쇠가 있는 경우에, 낮은 신호 대역의 CELP 예측/다계층 변환 인코더에서 디지털 오디오 신호들의 타이밍도를 도 시한 것이다.
- 도3d는 CELP/다계층 변환 인코더에서 오디오 신호들의 타이밍도를 도시한 것으로, 저 주파수 신호대역에서 오류 활동들로 인한 감쇠는 금지시키는 에코 감쇠 활동을 구비한 경우의 타이밍도를 도시한 것이다.
- 도4a는 예시적이고, 바람직하며, 비-제한적인 본 발명의 제 1 구현예에 따라 상기 연쇄신호, 에코 감쇠의 금지를 제어하는 신호를 일례로서 도시한 것이다.
- 도4b는 예시적이고, 바람직하며, 비-제한적인 본 발명의 제 2 구현예에 따라 상기 연쇄신호, 에코 감쇠의 금지를 제어하는 신호를 일례로서 도시한 것이다.
- 도4c는 사인 신호의 디코딩에 대해, 에코 감쇠가 없는 경우에, 고 주파수 신호대역의 시간/다계층 변환 디코더에서 디지털 오디오 신호의 타이밍도를 나타낸 것이다.
- 도4d는 종래기술에 따른 사인 신호의 디코딩에 대해, 에코 감쇠의 활동을 구비한 경우, 고 주파수 신호대역의 시간/다계층 변환 디코더에서 디지털 오디오 신호의 타이밍도를 나타낸 것이다.
- 도4e는 본 발명에 따라 사인 신호를 디코딩하는 경우에 있어서, 고 주파수 신호대역의 시간/다계층 변환 디코더에서 디지털 오디오 신호의 타이밍도를 나타낸 것으로, 에코 감쇠 활동과 에코 감쇠 금지 활동을 구비한 경우를 도시한 것이다.
- 도5는 예시적이고, 바람직하며, 비-제한적인 본 발명의 제 1 구현예에 따라 상기 연쇄신호, 에코 감쇠의 금지를 제어하는 신호를 일례로서 도시한 것이다.
- 도6은 변환 디코딩에서 사후-에코의 생산(production)과 프레임 합산/오버 랩 프로세스를 도시한 것이다.
- 도7은 본 발명에 따라, 다계층 계층적 인코더에 의해 생성된 디지털 오디오 신호의 에코를 구별 및 감쇠시키기 위한 디바이스의 기능적 블록도를 도시한 것으로, 에코 감쇠 및 에코 감쇠 금지 수단을 구비한 경우를 도시한 것이다.
- 도8a은 사전-에코 감소 금지 샘플들의 범위를 계산하기 위한 순서도를 일례로서 도시한 것이다.
- 도8b는 사전-에코 및 사후-에코 감소 금지 샘플들의 범위를 계산하기 위한 순서도를 일례로서 도시한 것이다.
- 도8c는 사전-에코 감쇠 금지에 대한 구현예의 순서도를 일례로서 도시한 것이다.
- 도8d는 이득 팩터 평활화(smoothing) 순서도를 일례로서 도시한 것이다.
- 도9a는 오류-알람 존을 정의하기 위한 모듈의 블록도를 일례로서 도시한 것이다.
- 도9b는 도9a의 이득 계산 서브-모듈에서 이득을 계산하기 위한 순서도를 일례로서 도시한 것이다.
이하에서는, 도2f와 다음의 공식을 참조하여 다음의 표시법(notation)이 이용된다.
Xrec(n) = h(n+L)Xprev(N+L) + h(n)Xcur(n) for n ∈ [0, L-1]
변환 인코더에서, 현재 프레임의 재구성된 신호(Xrec(n), n = 0 ~ L-1)는, 선행 프레임의 MDCT 계수들의 역 MDCT 출력의 제 2 부분(Xprev(n), n = L ~ 2L-1)과 현재 프레임의 MDCT 계수들의 역 MDCT 출력의 제 1 부분(Xcur(n), n = 0 ~ L-1)의 가중 합산(weighted addition)에 의해서 얻어진다. 현재 프레임의 MDCT 계수들의 역 MDCT 출력의 제 2 부분(Xcur(n), n = L ~ 2L-1)은, 다음 프레임의 재구성된 신호를 얻는데 이용되기 위하여 메모리에 보관될 것이다. 이하에서는 설명을 간략히 하기 위해, "현재 프레임의 제 1 부분", "현재 프레임의 제 2 부분", "현재 프레임의 재구성된 신호" 라는 용어가 사용될 것이다. 다음번 프레임의 경우, 현재 프레임의 제 2 부분은, 따라서, 선행 프레임의 제 2 부분이 된다.
특히, 현재 프레임의 제 1 부분 또는 제 2 부분내에 위치한 발성의 경우, 본 발명에 따른 방법은, 현재 프레임의 재구성된 신호와 현재 프레임의 제 2 부분의 신호로부터 연쇄 신호(concatenated signal)를 생성하고, 상기 연쇄 신호를 기결정된 길이를 갖는 샘플들의 짝수개의 서브-블록들로 나누고, 기결정된 길이를 갖는 각 서브-블록들의 신호의 에너지를 계산하고, 최대 에너지 샘플의 랭크(rank)를 나타내는 제 1 인덱스와 마지막 고-에너지 샘플을 나타내는 제 2 인덱스를 계산하고, 디지털 오디오 신호의 제 1 서브-블록들의 서브 블록들의 짝수의 절반인 소정 수(number)에 대해 최소 에너지를 계산하고 그리고, 상기 최소 에너지에 대한 상기 최대 에너지의 비율이 기결정된 임계값보다 크다면, 사전-에코들의 리스크(risk)는 오직 신호의 저-에너지 부분에서만 나타나며, 제 1 및 제 2 인덱스 사이의 랭크의 고에너지 샘플들에 대한 임의의 감쇠 동작을 금지시킨다.
제 1 및 제 2 인덱스들의 판별은, 고-에너지 신호에 대응하는 오류-알람 범위를 이들 사이에서 정의하는 것을 가능케 하는바, 상기 범위내에서는, 의미가 없거나 또는 신호에 손상을 주는 에코들의 감쇠는 제거되어야만 한다.
본 발명의 주제인 다계층 계층적 인코더에 의해 생성된 디지털 오디오 신호의 에코들을 구별 및 감쇠하기 위한 디바이스는, 디코더에서, 상기 디코더는 에코들을 생성하지 않는 적어도 하나의 시간 디코더와 에코들을 적발할 수 있는 적어도 하나의 변환 디코더를 포함하며, 적어도 시간 디코더 및 변환 디코더 상에서 다음을 포함하는 것을 특징으로 한다. 변이에 선행하는 저-에너지 존과 고-에너지 존을 구별하는 수단, 현재 프레임의 구별되지 않은(non-discriminated) 존들에 대응하는 오류-알람 존을 정의하는 수단, 감쇠 이득값들을 갖는 에코들의 초기 프로세싱을 결정하는 수단, 현재 프레임의 저-에너지 구별 존들에 적용된 에코들에 대한 초기 프로세싱에 따라 에코들을 감쇠시키는 수단 그리고 오류-알람 존에 적용된 초기 프로세싱의 에코들의 감쇠를 금지시키는 수단을 포함한다.
이들은 발명의 상세한 설명을 읽고 하기의 도면들을 연구함으로써 좀더 잘 이해될 것인바, 도면들 중 도1과 도2a 내지 도2e는 프랑스 출원 05 07471에서 기술된 바와같이 종래기술에 관한 것이며, 그리고 도2f는 종래기술에 관한 것이다.
- 도3a는 본 발명에 따른 방법을 구현하기 위한 단계들에 대한 일반적인 순서도를 일례로서 나타낸 것이다.
- 도3b는 에코 감쇠가 없는 경우에, 낮은 신호 대역의 CELP 예측/다계층 변 환 인코더에서 디지털 오디오 신호들의 타이밍도를 도시한 것이다.
- 도3c는 도2b에 예시된 종래기술의 에코 감쇠가 있는 경우에, 낮은 신호 대역의 CELP 예측/다계층 변환 인코더에서 디지털 오디오 신호들의 타이밍도를 도시한 것이다.
- 도3d는 CELP/다계층 변환 인코더에서 오디오 신호들의 타이밍도를 도시한 것으로, 저 주파수 신호대역에서 오류 활동들로 인한 감쇠는 금지시키는 에코 감쇠 활동을 구비한 경우의 타이밍도를 도시한 것이다.
- 도4a는 예시적이고, 바람직하며, 비-제한적인 본 발명의 제 1 구현예에 따라 상기 연쇄신호, 에코 감쇠의 금지를 제어하는 신호를 일례로서 도시한 것이다.
- 도4b는 예시적이고, 바람직하며, 비-제한적인 본 발명의 제 2 구현예에 따라 상기 연쇄신호, 에코 감쇠의 금지를 제어하는 신호를 일례로서 도시한 것이다.
- 도4c는 사인 신호의 디코딩에 대해, 에코 감쇠가 없는 경우에, 고 주파수 신호대역의 시간/다계층 변환 디코더에서 디지털 오디오 신호의 타이밍도를 나타낸 것이다.
- 도4d는 종래기술에 따른 사인 신호의 디코딩에 대해, 에코 감쇠의 활동을 구비한 경우, 고 주파수 신호대역의 시간/다계층 변환 디코더에서 디지털 오디오 신호의 타이밍도를 나타낸 것이다.
- 도4e는 본 발명에 따라 사인 신호를 디코딩하는 경우에 있어서, 고 주파수 신호대역의 시간/다계층 변환 디코더에서 디지털 오디오 신호의 타이밍도를 나타낸 것으로, 에코 감쇠 활동과 에코 감쇠 금지 활동을 구비한 경우를 도시한 것이다.
- 도5는 예시적이고, 바람직하며, 비-제한적인 본 발명의 제 1 구현예에 따라 상기 연쇄신호, 에코 감쇠의 금지를 제어하는 신호를 일례로서 도시한 것이다.
- 도6은 변환 디코딩에서 사후-에코의 생산(production)과 프레임 합산/오버랩 프로세스를 도시한 것이다.
- 도7은 본 발명에 따라, 다계층 계층적 인코더에 의해 생성된 디지털 오디오 신호의 에코를 구별 및 감쇠시키기 위한 디바이스의 기능적 블록도를 도시한 것으로, 에코 감쇠 및 에코 감쇠 금지 수단을 구비한 경우를 도시한 것이다.
- 도8a은 사전-에코 감소 금지 샘플들의 범위를 계산하기 위한 순서도를 일례로서 도시한 것이다.
- 도8b는 사전-에코 및 사후-에코 감소 금지 샘플들의 범위를 계산하기 위한 순서도를 일례로서 도시한 것이다.
- 도8c는 사전-에코 감쇠 금지에 대한 구현예의 순서도를 일례로서 도시한 것이다.
- 도8d는 이득 팩터 평활화(smoothing) 순서도를 일례로서 도시한 것이다.
- 도9a는 오류-알람 존을 정의하기 위한 모듈의 블록도를 일례로서 도시한 것이다.
- 도9b는 도9a의 이득 계산 서브-모듈에서 이득을 계산하기 위한 순서도를 일례로서 도시한 것이다.
본 발명에 따른 방법은 도2b 및 도3a를 참조하여 상세히 설명될 것이다.
본 발명에 따른 방법은 디코딩에서 디지털 오디오 신호의 에코들을 구별하는 것을 가능케 하는바, 상기 디지털 오디오 신호는 변환 인코딩 및 예측 인코딩으로부터의 다계층 계층적 인코딩에 의해 생성된다.
도2b를 참조하면,
- XTj(n)은, 다계층 계층적 디코더의 계층 j 변환 디코더에 의해 수행된 역 변환 디코딩에 의해 전달된 신호를 지칭한다.
- Xa pi(n)은, 대응 계층적 디코더의 계층 i 예측 디코더에 의해 수행된 예측 디코딩에 의해 전달된 신호를 지칭한다. 상기 신호 Xa pi(n)은, 에코를 생성하지 않는 예측 디코더로부터의 출력 신호 또는 이 신호의 필터링된 버전이 될 수 있으며, 또는 이 신호의 단기(short-term) 에너지를 나타낼 수도 있다.
도2a, 도2b 및 도3a를 참조하면, 본 발명에 따른 방법은, 단계 A에서, 에코를 생성하지 않는 디코딩으로부터 유도되는 신호의 진폭에 대한 에코를 생성하는 디코딩으로부터 유도되는 신호의 진폭의 비율인 R(k)를 임계값 S를 비교하는 것을 포함한다.
도3a에서, 에코를 생성하는 디코딩으로부터 유도되는 신호의 진폭은 EnvTj(k)로 표시되며, 에코를 생성하지 않는 디코딩으로부터 유도되는 상기 신호의 진폭은 Envpi(k)로 표시된다.
이러한 표시법을 참조하면, 에코를 생성하는 디코딩으로부터 유도되는 신호의 진폭과 에코를 생성하지 않는 디코딩으로부터 유도되는 신호의 진폭은, 에코 생 성 디코딩 신호 XTj(n)의 엔벨로프 신호와 에코 비생성 디코딩으로부터 유도되는 신호 Xa pi(n)의 엔벨로프 신호 각각에 의해 유용하게 표시될 수 있다는 점이 이해될 것이다.
도3a에서, 진폭 신호의 획득은 다음의 관계식들에 의해서 표시된다
XTj(n) → EnvTj(k)
Xa pi(n) → Envpi(k)
일반적으로, 다음과 같은 점을 유의해야 하는바, 에코 생성 디코딩으로부터 유도된 신호의 진폭과 에코 비생성 디코딩으로부터 유도된 신호의 진폭은, 앞서 언급된 바와 같은 엔벨로프 신호에 의해서 표시될 수 있을 뿐만 아니라 가령, 전술한 진폭을 대표하는 절대값, 또는 다른 값과 같은 임의의 신호에 의해서도 표시될 수 있다는 점을 유의해야 한다.
도3a를 참조하면, 에코 비생성 디코딩으로부터 유도된 신호의 진폭에 대한 에코 생성 디코딩으로부터 유도된 신호의 진폭의 비율은 다음의 관계식으로 나타낼 수 있다.
R(k) = [EnvTj(k)] / [Envpi(k)] k = 0, k-1
앞서 언급된 표시법을 참조하면, 도3a의 비교 단계 A는, 우월성(superiority) 및 대등성(equality) 비교를 적용하여, 상기 비율 R(k)의 값과 임계값 S를 비교하는 것이다.
만일, 상기 비율값이 임계값 S 보다 크거나 또는 같으면(즉, 단계 A의 긍정적인 응답), 전술한 테스트는 단계 B에서, 변환 인코딩으로부터 유도되는 에코가 현재 프레임에 존재한다고 결론낼 수 있으며, 이후 이 에코는 디코딩에서 검출된다.
단계 B에서, 에코의 존재는 다음의 관계식에 의해 표현된다.
∃ echo XTj(n)
그렇지 않다면(즉, 단계 A의 부정적인 응답), 상기 비율값이 임계값 S 보다 작으면, 단계 A의 테스트는 단계 C에서, 변환 인코딩으로부터 유도되는 에코가 현재 프레임에 존재하지 않는다고 결론낼 수 있다.
이러한 관계식은 단계 C에서 다음과 같이 표현된다.
Figure 112008066567349-PCT00001
특히, 본 발명에 따른 방법의 구현예에서는 다음이 유의되어야 하는바, 현재 프레임에서 에코의 본래 위치(original position)는 사실상, 현재 프레임에서 임계값 S와 대략 동등한 비율값의 위치에 의해 주어진다.
앞서 언급된 값은 도3a의 단계 B에서 다음의 관계식으로 주어진다.
Pos k|R(k) = S
일반적으로, 단계 A의 테스트와 궁극적으로는 도2b 또는 도3a의 테스트 C 및 B의 구현에 대하여, 특히 단계 A에 후속하는 단계 B의 구현에 대해서, 비율값 R(k) 는 현재 프레임에 대해 평활화된 값으로 계산될 수 있다는 점이 이해될 것인바, 이는 전술한 비율값과 임계값 S를 실시간으로 비교하기 위함이다. 상기 비율값과 임계값 S가 같은 경우, 에코의 본래 위치는, 현재 프레임에서 디코딩 신호의 대응 샘플의 랭크 k의 특정 값에 의해 주어진다.
단계 B는 에코들의 존재하는 경우, 단계 D로 후속되는바, 단계 D는 XTj(n)low 라고 표시되는 저-에너지 디지털 오디오 신호 부분들내에 에코들이 존재하는지를 식별하는 것이다. 해당 에코들은 EXTj(n)low 라고 표시된다. 더 나아가, 단계 D는 전술한 식별에 의해서, 오류-알람 존을 정의하는 것을 가능케하는바, 상기 오류-알람 존은 현재 프레임의 구별되지 않은 존들(non-discriminated zones)에 대응한다.
단계 D에서의 식별에 이어서, 단계 E가 수행되는바, 단계 E는 감쇠 이득값들을 갖는 에코의 초기 프로세싱을 결정하고 저-에너지 디지털 오디오 신호 부분들의 에코들을 감쇠시킨다. 단계 E 다음에는 단계 F가 수행되며, 단계 F는 XTj(n)hiw 로 지칭되는 고-에너지 디지털 오디오 신호 부분들에서 에코들의 감쇠를 금지한다.
일반적으로, 본 발명에 따른 방법은 다수의 신호대역에서 에코들의 구별 및 감쇠를 수행함에 의해 구현될 수 있는데, 비제한적인 일례로서 2개의 주파수 대역들, 저 대역(low band)(0 - 4 kHz)과 고 대역(high band)(4 - 8 kHz)을 일례로 들 수 있다. 이러한 일례에서, 시간/변환 다계층 인코더는 신호의 각각의 대역에서 구비된다. 저 대역에서, 변환 인코더는, 원래 신호와 디코딩된 CELP 신호 사이의 차이를 지각 도메인(perceptual domain)(지각 필터(perceptual filter) W(z)에 의한 필터링 이후)에서 양자화하며, 반면에 고 대역에서는 지각 필터링 없이 본래 신호를 양자화한다. 그리고 디코딩시, 올바르게 디코딩된 대역들이, 대역 확장(extension) 모듈에서 공급된 시간 신호의 MDCT로부터 유도된 이전에 디코딩된 대역들을 대체한다. 따라서, 본 발명은 각 서브-대역의 디바이스에 대해 설명된다.
도3b는 도2a에서 설명된 유형의 CELP 예측/다계층 변환 디코더에서 저 대역의 신호를 합성(synthesizing)하는 것에 관한 오디오 신호들을 도시한 것이다. 변환/CELP 디코딩 스테이지는, 변환 출력 스테이지와 달리 에코를 생성하지 않는다는 점을 알 수 있으며, 변환 출력 스테이지(TDAC(Time Domain Aliasing Cancellation) 디코더로부터의 출력 신호, 완전한 복원을 갖는 필터 뱅크)에서는, n=0 부터 n=85 까지의 샘플들 사이에서 사전-에코 형태의 에코가 출현하기 쉽다는 것을 알 수 있다. 따라서, 이 사실로부터, CELP 예측 인코더의 출력 스테이지가 변환 디코딩 스테이지의 출력과 결합되어 사용될 수 있다는 점이 도출되는바, 이는 에코를 감쇠시키기 위함이다.
디코딩된 CELP 신호와 디코딩된 변환 신호의 합산의 결과인 최종 출력 신호는 또한, 그 자체로 동일한 에코 현상의 소스가 된다.
종래기술에 따른 에코 감쇠 디바이스(예컨대, 도2b의 그것)가 활성화되는 때에, 도3c의 신호들이 얻어진다. 처음 3개의 그래프들은 도3b의 그래프와 같다. 다음 3개의 그래프들은 각각 다음을 나타낸다.
- 0 에서 1 사이의 값은 갖는 사전 에코 프로세싱 이득(도2b의 사각형 1),
- 사전-에코 프로세싱 이후의 변환 디코딩 스테이지의 출력신호(TDAC 디코더 출력). 발성(attack)에 선행하는 에코는 제거되었지만, 변환 디코더로부터 유도된 발성 부분은 부당하게 감쇠되었다는 점을 알 수 있다. 본 발명에 따른 방법 및 디바이스의 중요한 장점들 중 하나는 이러한 단점을 해결할 수 있다는 점이다.
- 최종 출력 신호, CELP 디코더의 출력신호와 TDAC 디코더 출력의 합계, 사전-에코는 나타나지 않으나 그것의 발성(attack)은 거의 사라졌다. 이는 디지털 오디오 신호의 열화에서 청취 경험(listening experience)에서 반영된다.
본 발명에 따른 방법 및 디바이스는, 도3d에 예시된 바와 같이, 변환 디코딩 스테이지 또는 종래기술의 스테이지들의 출력의 잘못된 감쇠를 치유할 수 있게 한다. 이 도면에서, 오디오 출력들은 이전 도면의 출력들과 같다.
도3c와 도3d를 비교하여 보면, 본 발명의 방법에서는, 발성 이전에 에코를 제거하면서도(사전-에코 프로세싱 이득을 참조하라), 발성의 그 순간에서(80 에서 120 사이의 샘플들) 에코의 감쇠를 금지시킬 수 있음을 알 수 있다. 즉, 이로부터, 사전-에코들의 프로세싱 이후에 TDAC 디코더의 출력에서 복구된 신호는, 더 이상 에코를 갖고 있지 않다는 점을 알 수 있으며, 발성의 양호한 복원이 얻어진다는 점을 알 수 있다. 이러한 내용은 CELP 디코더의 출력과 상기 신호를 합산함에 의해서 얻어지는 최종 출력 신호에도 동일하게 적용되는바, 최종 출력 신호에서는 에코가 더 이상 나타나지 않는다.
이제, 도4a 및 도4b를 참조하여, 에코 프로세싱 이득 생성 프로세스를 설명한다.
만일, 에코가 있다면, MDCT 윈도우에서 신호의 그 부분의 에너지는 다른 부 분들의 에너지보다 상당히 커야만 한다. 에코는 저-에너지 부분들에서 관찰되며, 따라서 고-에너지 존이 아니라 이들 저-에너지 부분들에서만 에코들을 감쇠시킬 필요가 있다.
가능한 2가지 케이스가 존재한다.
발성(attack)이 현재 프레임 또는 다음 프레임 중 어느 하나에 위치한다. 첫번째 경우에서는, 에코들을 부당하게 감쇠시키는 리스크가 존재한다.
도2f를 참조하면, 도4a에는 n = 0 부터 n = 2L-1(L=160)인 샘플들에 대한 상기 연쇄신호가 도시되어 있다. n = 0 부터 n = L-1(L=160) 샘플들에 대해, 이는 현재 프레임의 복원된 신호와 같으며, n = L 부터 n = 2L-1 샘플들에 대해, 현재 프레임의 제 2 부분과 같다. 다음 프레임에서, 상기 제 2 부분은, 신호 Xprev(n+L)에 대응하는 선행 프레임이 된다.
본 발명에 따른 에코 감쇠 보정 프로세스는 2개의 인덱스들 ind1 과 ind2 을 전달하는바, 이는 에코를 감소시키기 위한 종래기술에 따른 디바이스의 활동을 금지시킬 필요가 있는 잠재 영역(possible area)의 시작과 끝이다. ind1 > ind2 은 현재 프레임에는 이러한 존이 없다는 것을 나타낸다.
본 발명의 방법에 대한 비제한적이며 바람직한 실시예는 도4a 및 도4b를 참조하여 좀더 상세히 설명될 것이다.
도4a에 도시된 전술한 실시예에 따르면, 본 발명에 따른 방법은,
- 도4a의 신호를 N2 = L/K2 길이의 2k2 서브 블록들로 나누고,
- 도4a에 도시된 신호의 길이 N2 의 서브 블록들 각각의 에너지를 계산하는 것이다. 상기 신호의 후반부(second half)의 대칭성 때문에, 오직 처음 1.5 K2 블록들의 에너지만이 계산되어야함을 유의해야 한다.
또한, 본 발명에 따른 방법은,
- 최대 에너지 블록의 처음 샘플의 인덱스 ind1 를 계산하고, 그리고
- 복원된 신호 Xrec(n)의 처음 K2 블록들에 대해 최소 에너지를 계산하는 것을 포함한다.
최대 에너지 대 최소 에너지의 비율이 임계값 S 보다 큰 때에는, 오직 저-에너지 존에서만 사전-에코의 리스크가 있다. 고-에너지 샘플들에서는 에코가 없다.
에코를 감쇠시키는 종래기술에 따른 에코 검출 디바이스에 대해서,
고-에너지 샘플들을 포함하는 신호의 존을 정의하는 인덱스 ind1 및 ind2 에 의해 한계가 정해지는 고-에너지 샘플들에 대한 후자의 감쇠 활동을 금지시킬 필요가 있으며 상기 이득값을 1로 재설정할 필요가 있다. 도4a의 아래에 그 표현이 나타나 있는 이들 2개의 인덱스들은 다음과 같이 판별된다.
- ind1 은 에너지 최대값이 발생하는 블록의 제 1 샘플의 인덱스이며,
- ind2 는 ind1 + C-1 과 프로세스되는 블록의 말미의 인덱스인 L-1 사이의 최소값이다. C 는 다수의 샘플들로서 오류-알람 존의 최대 길이이며, 한 블록 또는 그 이상의 지속기간 정도의 값으로 설명된다. 예를 들어, C = 80 값은 좋은 결과를 제공할 것이다.
도4a의 일례에서는 에코 감쇠에 대한 금지가 없는바, 이는 사전-에코를 야기하는 발성이 다음 프레임에서 검출되기 때문이며, ind1 는 ind2 보다 크다. 이러한 결과는, 전체 현재 프레임, n=0 부터 n=159 까지의 샘플들에 대해, 에코가 올바르게 감쇠된다는 것을 나타낸다.
도4b에 도시된 바와 같이 하나의 신호 프레임(L=160 샘플들)의 옵셋이 적용되는바, 따라서 발성은 이제 현재 프레임에 위치한다.
L=160; K2 = 4; N2 = L/K2; C = 60
이러한 상황에서, 전술한 바와같은 에너지 최대값 및 최소값을 계산하기 위한 절차가 반복된다.
n=80에서 시작하는 블록에서 에너지 최대값이 발견된다고 판명되며, 최대 에너지 대 최소 에너지의 비율은, 임계값 S 보다 크다고 말한 순 없지만 꽤 높다고 판명된다. 일례로서, S=8 값은 좋은 결과를 가져온다.
이 경우, 에너지 최대값 이전에 사전-에코가 존재하며, 그 반대로, 최대값이 위치한 블록 및 소수의 후속 블록들은 에코 현상을 격지 않는다. 따라서, 본 발명의 방법에 따르면, 발성 그 순간 및 이후에 에코 감쇠 활동을 금지시킬 필요가 있다. 이는 도4b에서 n=80 에서 159까지 범위의 샘플들에 대해 행해진 것이며, 전술한 n=80 에서 159 까지의 샘플들 사이에 포함된 상기 존은 오류-알람 존으로 정의된다.
결과적으로, 도3d에서는, n=80 에서 120의 샘플들에 대해서 실질적으로 1과 같은 이득(평활화됨)이 얻어지며, 도3c의 동일한 샘플들과의 비교에 의해 이득 감쇠는 금지되었다. 그리고 사전-에코 프로세싱 이후의 TDAC 디코더로부터의 출력 신호의 n=80 에서 n=160 까지의 샘플들은, 더이상 부당하게 감쇠되지 않는다. 이러한 결과는, 상기 신호와 CELP 디코더의 출력 신호가 합산됨으로써 얻어진 최종 출력 신호는, 이제 올바르게 복원된다는 점을 나타낸다.
본 발명에 따른 방법은, 사인파 신호들에 대한 저주파수 대역 또는 고주파수 대역의 다계층 인코더의 에코들을 감쇠시키기 위한 특정한 변형예들로 구현될 수 있는바, 이에 대해서는 도4c를 참조하여 후술된다.
도4c는 시간 디코더, 즉 도2a에서 도시된 유형의 고주파수 대역의 오디오 신호의 가능한 예측/다계층 변환에서의 신호 합성에 포함된 오디오 신호들을 도시한 것이다. 디코딩될 신호는 사인파이다. 시간 디코딩 스테이지의 출력은 입력 신호에 비해 열화되었다는 알 수 있을 것이다. 현재 케이스에서, 이는, 상기 사인파를 제대로 복원하기에는 너무 낮은 비트율로 상기 시간 디코더가 동작한다라는 사실 때문이다. TDAC 디코더 출력은 올바르다. 동일한 것이 최종 출력신호에도 적용된다.
예를 들면 도2a와 같은 종래기술의 에코 감쇠 프로세스가 활성화되는 경우, 도4a의 신호들이 얻어진다. 처음 3개의 그래프는 도4c의 그것들과 동일한 신호들을 나타낸다. 다음 3개의 신호들은 각각 다음과 같은 것들을 나타낸다.
- 0 에서 1 사이의 값인 에코 감쇠 이득(도2b의 직사각형 1)
- 에코를 프로세싱한 이후의 TDAC 디코더의 출력신호. 에코들의 감쇠가 활성 화되었다는 점을 알 수 있을 것이며, 이는 감쇠 이득의 곱셈때문에 진폭-변조된 사인파에 해당하는 TDAC 스테이지의 출력신호를 생성하며, 그리고 이는 처음 사인파를 충실하게 복원하지 못한다.
- TDAC 디코더 출력 신호들과 동일한 결함들을 나타내는 최종 출력 신호, 이들 2개의 신호들은 서로 동일하다.
도4e에 도시된 바와같이, 본 발명은 신호의 조악한 모델링을 치유할 수 있다.
이제 도5를 참조하여, 사인파의 존재하에서, 에코 감쇠의 금지 동작이 설명될 것이다. 앞서 설명된 에너지 최대값 및 최소값을 계산하기 위한 절차가 다시한번 적용될 것이다.
전술한 도면에서는, 최대 순(net) 에너지가 없다는 점을 알 수 있다. 이 경우, 최대 에너지 대 최소 에너지의 비율은 상당히 낮으며, 임계값 S 보다 낮다. 이러한 점은, 에코가 존재하지 않는다는 것을 나타낸다. 본 발명의 방법에 따르면, 전체 프레임에 대해서 에코 감쇠기의 활동을 금지시키는 것이 필수적이다. 이러한 점은, 도4e에서 n=0 부터 n=159 범위의 샘플들에 대해서 나타나며, 여기서 에코 프로세싱 이득은 이들 샘플들에 대해서 1이다. 사전-에코 프로세싱 이후의 TDAC 디코더 출력 신호는, 더 이상 부당하게 감쇠되지 않는다. 이러한 결과는, 이제 제대로 복원된 상기 신호와 최종 출력신호가 서로 동일하다는 것을 의미한다.
도5에서,
L = 60; K2 = 4; N2 = L/K2 = 40; C = 80; S=8
도6은 사후-에코 현상을 예시한 것이다.
도6을 참조하면, 사후-에코 현상은, 입력 신호의 빠른 하락(decline)을 포함하고 있는 프레임 및 다음 프레임의 출력신호 상에서 관찰될 수 있다. 강한 하락에 후속하는 프레임에서(사후-에코 존)는, 에코 감쇠를 금지시키지 말아야 함은 명백하다.
사후-에코 상황은, 선행 프레임의 최대 에너지와 현재 프레임의 최대 에너지 사이의 비율을 체크함으로써 검출될 수 있다. 상기 비율이 임계값보다 크면, 그 프레임은 사후-에코들을 생성하는 프레임으로 간주되며 그리고 에코 감쇠 알고리즘은 상기 프레임의 에코들을 감쇠시키도록 유지된다.
본 발명에 따른, 다계층 계층적 인코더에 의해 생성된 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스에 대한 상세한 설명은 도7을 참조하여 후속될 것이다.
일반적으로, 도7에 도시된 본 발명에 따른 디바이스는, 도2b에 도시된 바와같은 종래기술의 에코 구별 디바이스에 통합된다는 점을 유의해야 한다.
본 발명에 따른 디바이스는, 종래기술의 구별 디바이스와 유사하게, 에코의 본래 위치의 존재(existence)를 계산하고 그리고 한편으로는 다수의 예측 디코더들의 랭크 i의 예측 디코더의 제 2 출력에 의해 전달된 보조 신호 Xa pi(n)를 받아들이고, 다른 한편으로는 다수의 역 변환 디코더들의 랭크 j의 역 변환 디코더의 출력 에 의해 전달된 디코딩된 신호 XTj(n)를 받아들이는 감쇠 값을 계산하기 위한 모듈을 포함한다.
또한, 원하지 않는 에코들이 감쇠되는 것을 보장하기 위하여, 본 발명의 디바이스는 랭크 j의 역 변환 디코더에 의해 전달된 현재 프레임의 복원된 신호와 그리고 존재(presence), 본래 에코 위치 및 적용가능한 에코 감쇠 값 신호을 받아들이는 에코 감쇠 모듈을 포함한다.
따라서, 도7에서는 앞서 설명된 구성에 따라 비제한적인 방식으로, 랭크 i의 예측 디코더 및 변환 디코더, 랭크 j의 MDCT 디코더가 도시되어 있다.
이제, 본 발명에 따른, 다계층 계층적 인코더에 의해 생성된 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스에 대한 비제한적이고 바람직한 실시예가 도7을 참조하여 설명될 것이다.
도7에 도시된 본 발명에 따른 디바이스는 도2b에 도시된 종래기술의 디바이스와 동일한 구조를 사용한다. 하지만, 그 구성요소들은 특화된다.
특히, 도7에 도시된 바와같이, 현재 프레임의 저주파수 대역 및/또는 고주파수 대역 중 적어도 하나에서 에코의 존재 및 본래 위치를 계산하기 위한 구조는 유용하게도, 디바이스의 디멀티플렉서(00)에 연결되어 있는, 디지털 오디오 신호에 대한 저주파수 대역 디코딩 채널(채널 L 로 표현됨)과 디지털 오디오 신호에 대한 고주파수 대역 디코딩 채널(채널 H 로 표현됨)을 포함한다.
또한, 합산회로(14)는 고주파수 대역 디코딩 채널(채널 H) 및 저주파수 대역 디코딩 채널(채널 L)에 의해 전달된 신호를 각각 수신하고 그리고 재구성된 디지털 오디오 신호를 전달한다.
특히, 도7를 참조하면, 상기 고주파수 대역 채널 및 저주파수 대역 채널은, 도2b에 도시된 종래기술에 따른 구조에서의 랭크 i의 예측 디코더 및 랭크 j의 변환 디코더에 각각 대략적으로 대응한다는 점을 알 수 있을 것이다.
특히, 도7에 도시된 바와같이, 저주파수 대역 디코딩 채널(채널 L)은, 디멀티플렉싱된 디지털 오디오 비트스트림을 수신하고 예측 디코딩에 의해 디코딩된 신호를 전달하는 예측 디코딩 모듈(01)을 포함하며, 디멀티플렉싱된 디지털 오디오 비트스트림을 수신하고 그리고 저 주파수 대역에서, 코딩된 차이(difference) 신호(X^ lo 로 표시됨)의 스펙트럼 계수들을 전달하는 변환 디코딩 모듈(04)를 포함한다.
또한, 상기 저주파수 대역 디코딩 채널(채널 L)은, 저주파수 대역에서, 코딩된 차이 신호(X^ lo) 의 스펙트럼 계수들을 수신하고 그리고 저주파수 대역 디지털 오디오 신호(x^ lo)를 전달하는 역 변환 주파수-시간 전환(transposition) 모듈(05)을 포함한다.
또한, 저에너지 신호의 부분들에서 에코의 존재를 구별하기 위한 리소스들 및 저주파수 대역 디코딩 채널(채널 L)에 대해 특화된 감쇠 금지 리소스들은, 도7에 도시된 바와 같이, 오류-알람 존을 정의하기 위한 모듈(15)과 저주파수 대역 디 지털 오디오 신호(x^ lo)와 예측 디코딩에 의해 디코딩된 신호로부터 에코를 검출하기 위한 모듈(16)을 포함한다.
마지막으로, 저주파수 대역 디코딩 채널(채널 L)은, 저주파수 이득값 Glo을 변환에 의해 디코딩되고 WNB(z)-1 에 의해 필터링된 신호에 적용하기 위한 회로(17)를 포함하며, 합산 리소스(08), 포스트 필터링 리소스(09), 오버샘플링 리소스(10) 및 QMF 합성 필터링 리소스(11)를 포함하는바, 이들 다양한 구성요소들은 케스케이드 연결되며, 디지털 오디오 저주파수 대역 합성 신호를 합산기(14)로 전달한다.
또한, 도7에 도시된 바와 같이, 고주파수 대역 디코딩 채널(채널 H)은, 디멀티플렉싱된 디지털 오디오 비트스트림을 수신하고 사전-에코가 없는 시간 기준 신호를 전달하는 밴드 확장 채널(02)을 포함한다. 상기 신호는 고주파수 대역 디코딩 채널에 대해 기준으로서 작용하며, 저주파수 대역 디코딩 채널(채널 L)에 대한 예측 디코딩 기능을 실질적으로 제공한다.
또한, 고주파수 대역 디코딩 채널(채널 H)은, 디멀티플렉싱된 디지털 오디오 비트스트림을 수신하고, MDCT 변환 시간-주파수 전환기(03)를 통해 시간 기준 신호의 스펙트럼 계수들을 수신하는, 변환 디코딩 모듈(04)을 포함하는바, 이는 고주파수에서 시간 기준 신호의 스펙트럼 계수들(X^ hi)을 변환 디코딩 모듈(04)에게로 전달하는 것을 가능케한다.
후자의 것은, 인코딩된 고 주파수 대역 디지털 오디오 신호의 스펙트럼 계수 들(X^ hi)을 전달한다.
또한, 디지털 오디오 신호에 대한 고주파수 대역 디코딩 채널, 즉 채널 H는, 역 변환 주파수-시간 전환 모듈(06)을 포함하며, MDCT-1 로 표시되는 역 변환 동작 및 이에 후속하는 "합산/오버랩" 으로 표시되는 합산-오버랩 동작을 포함하는바, 이는, 고주파수 대역에서 디지털 오디오 신호의 스펙트럼 계수들(X^ hi)을 수신하고, 고주파수 대역 시간 디지털 오디오 신호(x^ hi)를 전달한다
저주파수 대역 디코딩 채널의 구조와 유사한 방식으로, 사전-에코 오류-알람 존을 정의하기 위한 리소스(18) 그리고 사전-에코를 검출하기 위한 리소스(19)가 제공되는바, 이들은 에코 감쇠 금지 리소스를 형성한다. 후자의 것은, 오류-알람 존을 정의하기 위한 모듈(18) 및 고주파수 대역 디지털 오디오 신호(x^ hi)로부터 에코를 검출하기 위한 모듈(19)로 구성된다. 그리고, 대역 확장 모듈의 출력신호로부터, 에코들 특히 사전 에코들을 검출하기 위한 모듈(19)은, Ghi 로 표시되는 고주파수 이득값 신호를 전달한다.
마지막으로, 고주파수 이득값을 고주파수 대역 디지털 오디오 신호에 적용하기 위한 회로(20)가 제공되며, 이에 후속하여, 오버샘플링 회로(12)와 고역통과 필터링 회로(13)가 제공되는바, 고역통과 필터링 회로(13)는 디지털 오디오 신호의 고주파수 대역 합성 신호를 합산 회로(14)로 전달한다.
도7에 도시된 본 발명에 따른 디바이스의 동작은, 다음과 같다. 20ms의 각 프레임을 기술하는 비트들은 디멀티플렉서(00)에서 디멀티플렉싱된다. 여기의 설명은, 8 에서부터 32 비트들에서 동작하는 디코딩에 대한 것이다. 실제로는, 상기 비트스트림은 8, 12, 14 값들을 가지며, 14 와 32 kbit/s 사이에서 요구에 따라 비트스트림이 선택될 수 있다.
8 및 12 kbit/s 의 계층들(layers)의 비트스트림이 CELP 디코더에 의해 사용되어, 제 1 협대역 합성(0 ~ 4000 Hz)을 생성한다.
14 kbit 의 계층과 관계된 비트스트림 부분은 대역 확장 모듈(02)에 의해서 디코딩된다. 높은 대역(4000 ~ 7000 Hz)에서 얻어진 시간 신호는 MDCT 모듈(03)에 의해 스펙트럼 X~ hi 로 변환된다. 수신된 비트율(14 ~ 32 kbit)의 가변 부분은, 낮은 대역의 차이 신호 및 높은 대역의 대체(replacement) 신호의 MDCT 계수들의 디코딩을 제어하며, 지각 중요성(perceptual importance)의 순서대로 인코딩되었던 MDCT 계수들을 디코딩하기 위한 모듈(04). 낮은 대역에서는, 인코딩된 차이 신호의 스펙트럼 (X^ lo)은 재구성된 스펙트럼 대역들과 디코더 상에서 수신되지 않았던 디코딩되지않은 대역들에 대한 제로들(zeros)을 포함한다. 높은 대역에서, X^ hi 는, 대역 확장 X~ hi 로부터 유도된 스펙트럼과 직접적으로 인코딩된 높은 대역의 MDCT 계수들의 스펙트럼 대역들과의 조합을 포함한다. 이들 2개의 스펙트럼들은, 역 MDCT 주파수-시간 전환 및 합산/오버랩 모듈들(05 및 06)에 의해서, 시간 도메인 x^ lo 와 x^ hi 로 조절된다.
모듈들(15, 18)은 재구성된 프레임에서, 종래기술의 에코 감쇠를 금지시킬 필요가 있는 임의의 존을 결정한다.
앞서 설명된 바와같이, 모듈(15)은, 현재 프레임의 재구성된 신호 x^ lo 와 현재 프레임의 제 2 부분(도7에서 Memlo 로 표시됨)을 입력으로서 수신한다.
도8a 및 도8b는 모듈(15)의 기능을 수행하기 위한 예시적인 2개의 순서도를 도시한 것이다. 모듈(15)의 출력은 2개의 인덱스들로 구성되는바, 에코 감쇠를 적용할 필요가 없는 존의 시작과 끝은 정의하고 그리고 오류-알람 존을 지정한다. 만약, 이들 2개의 인덱스들이 동일하다면, 이는 곧 현재 프레임에서 종래기술에 따른 에코 감쇠를 수정할 필요가 없다는 뜻이다.
블록(07)은 인코더상에서 수행되는, 역 변환 인코더(05)의 출력에 대한 역 지각 필터링(inverse perceptual filtering)을 수행한다. 상기 신호의 엔벨로프와 CELP 디코더 출력신호의 엔벨로프 사이의 비율에 따라서, 상기 모듈(16)은 사전-에코 감쇠 이득들을 결정하며, 또한 본 발명의 모듈(15)에서 획득한 인덱스들을 고려한다. 모듈(16)에서는, 소정 범위의 이득값들은 1 로 설정되며 그리고 사실, 에코 감쇠가 없는 상태인 1 값으로 이들을 리셋함으로써 종래기술에 따라 확립된 이득 값들을 금지시키는 것도 가능하다.
모듈(16)에 대한 예시적인 실시예는 도8c의 순서도에 의해 주어지는바, 이는 종래기술의 상태와 도8c의 블록 310에서 313 과 같이 본 발명에 따른 보정을 결합한 것이다. 또한 모듈(16)은 저역통과 필터링에 의해 이득들을 평활화하는 모듈을 포함하는바, 예시적인 일실시예는 도8d에 관련하여 주어진다.
모듈(17)은 모듈(16)에 의해 계산된 이득을 변환 디코더의 출력신호(역 지각 필터(07)에 의해 필터링된)에 적용하는바, 이는 감쇠된 에코를 갖는 신호를 제공하기 위함이다. 이후, 상기 신호는 합산기(08)에 의해서 CELP 디코더의 출력신호에 합산되어 새로운 신호를 제공하는바, 이는 포스트 필터링 모듈(09)에 의해 포스트-필터링된, 재구성된 낮은-대역 신호이다. 오버 샘플링(10) 및 낮은 대역 합성 QMF 필터(11)로 전송된 이후, 상기 신호는 합산기(14)에 의해서 높은 대역의 신호와 합산되어, 재구성된 신호를 제공한다.
높은 대역에서, 모듈(18)의 동작은 모듈(15)의 동작과 같다. 현재 프레임의 재구성된 신호인 x^ hi 및 현재 프레임의 제 2 부분이 재구성된 신호(도7에서 Memhi 로 표시됨)로부터, 모듈(18)은 에코 감쇠가 적용될 필요가 없는 존의 시작과 끝을 결정한다.
주파수-시간 전환부(06)의 출력 신호의 엔벨로프와 대역 확장부(02) 출력의 엔벨로프의 비율에 따라, 모듈(19)은 사전-에코 감쇠 이득들을 판별하며, 또한 모듈(18)에 의해 얻어진 인덱스들, 도8a 및 도8b의 순서도, 본 발명에 따라 이득들이 1 값으로 세팅되는 도8c도 고려된다. 이후 획득된 이득들은 저역통과 필터링에 의해 평활화된다(도8c). 모듈(20)은, 모듈(19)에 의해서 계산된 이득을, 주파수-시간 전환기(06)의 출력인 조합된 신호 x^ hi에 적용한다.
16 kHz에서 샘플링되는 광대역 출력신호는, 오버 샘플링(10) 및 저역통과 필터링(11)에 의해 합성된 낮은 대역으로부터의 신호와 오버 샘플링(12) 및 고역통과 필터링(13)에 의해 합성된 높은 대역으로부터의 신호를 합산(14)함에 의해 얻어진다.
도7의 모듈(15)와 모듈(18)에 의해 수행되는 에코 감쇠 금지 동작은, 도8a의 순서도를 참조하여 설명되는바, 이에 대해서는 도4a, 도4b 및 도4c를 참조할 수 있다.
단계 103 주변인 순서도의 제 1 부분은, 합산/오버랩 이후에 재구성된 신호 Xrec(n)의 K2 서브 블록들의 에너지를 계산하는 것이다. 이 순서도에서 Xrec(n)는, 도7의 신호 x^ lo 및 x^ hi 에 각각 대응한다.
단계 107 주변인 순서도의 다음 부분은, 역 MDCT의 출력에서 현재 프레임의 제 2 부분의 각 서브-블록의 에너지를 계산하는 것이다. 상기 신호의 이 부분에서의 대칭성 때문에 오직 K2/2 값들만이 상이하다.
최소 에너지 minen 은, 재구성된 신호의 K2 서브 블록들에 대해서 계산된다 (단계 110). 신호 서브 블록 Xrec(n) 와 Xcur(n)의 최대 에너지들은 K2 + K2/2 블록들에 대해서 계산된다(단계 111).
도8a에 도시된 순서도의 마지막 부분은 인덱스들 ind1 및 ind2 를 계산하는 것이며, 이는 에코 감쇠 이득을 1 값으로 재설정하는 것을 가능케 한다. 따라서, 종래기술의 이득 감쇠는 금지될 수 있다. 이를 위해서, 최대 에너지 대 최소 에너지의 비율이 계산되며, 이 비율은 임계값 S와 비교된다(단계 112). 만일, 상기 비율이 임계값 S 보다 작다면, ind1 은 0으로 설정되며, ind2는 L-1로 설정된다. 즉, 상기 이득은 이후에 현재 프레임(n=0 부터 n=L-1 까지의 범위)에 걸쳐서 1 로 리셋된다. 실제로는, 에너지들 간의 차이는 작으며 따라서 거기에는 발성(attack)이 없다. 다른 한편으로는, ind2 는 ind1 + C-1(여기서, C는 샘플들의 소정갯수) 값을 갖는다고 예시할 수 있다. 따라서, 발성이 존재하는 샘플들의 상기 범위에 대해서 에코 이득 감쇠의 금지를 유발함으로써, 이득이 1 로 리셋되는 소정 범위의 샘플들이 선택된다. ind2 값이 프레임 길이(L)보다 크다면, 그것은 L-1 로 세팅된다. ind2 는 프레임의 마지막 샘플을 가리킨다.
도8a의 순서도에 따른 절차는 사후-에코 감쇠를 부당하게 금지한다. 사후-에코의 경우, 발성(attack)은 선행 프레임내에 있으며 반면에 현재 프레임 및 다음 프레임에서 에너지는 상당히 균일(unform)할 수 있다. 더 나아가, 일반적으로 상기 에너지는 감소한다. 이러한 2가지 이유들 중 하나 때문에, 도8a의 절차에 의해 오 류 알람이 부당하게 검출될 수 있다.
사후-에코 감쇠 프로세싱을 손대지 않고 그대로 두기 위하여, 도8a에 도시된 절차에 수정이 가해진다. 사전-에코 및 사후-에코의 감쇠를 금지시키는 샘플들의 범위를 계산하기 위한 수정된 순서도는, 도8b를 참조하여 수정된 절차에서 설명된다.
단계 208 까지인 도8b의 순서도의 제 1 부분은 도8a의 순서도의 단계 108 까지와 유사하다.
또한, 다음 부분은 사후-에코 이득 감쇠의 활동을 금지시킬 필요가 없는 사후-에코 경우들을 고려한 것이다.
재구성된 신호의 K2 블록들에 대한 최대 에너지(maxrec)가, 단계 210에서 계산된다. 이전 프레임의 최대 에너지 maxprev 를 메모리에 보존했기 때문에, maxprev 와 현재 최대값인 maxrec 의 비율이 비교된다. 상기 비율이 임계값 S1 보다 큰때에는, 사후-에코 환경이며 그리고 사후-에코 감쇠는 금지되어서는 않된다. 따라서, maxrec 다음 프레임을 위해 저장되며 그리고 ind1은 L로 예시될 수 있으며 ind2는 L-1로 예시될 수 있으며(단계 212), 그리고 절차는 종료한다. 다른 경우에서는, maxrec 는 다음 프레임을 위해서 저장된다(단계 213). 다음으로, 연쇄 신호의 모든 1.5K2 블록들에 대한 최대 에너지 maxen 과 최대 에너지 블록의 시작 인덱스가 계산된다(단계 214). 다음으로 최소 에너지가 계산되며, 이어서 최소 에너지에 대한 최 대 에너지의 비율이 비교되는바, 이는 도8a의 순서도의 단계 112, 113, 114 및 115 에서와 유사하다. 상기 비율이 임계값보다 작은 경우, ind1 은 0으로 설정되고 ind2는 L-1로 설정된다. 즉, 0부터 L-1까지의 샘플들의 범위 또는 전체 프레임에 대해서 상기 이득을 1로 설정함으로써, 에코 감쇠는 금지된다. 반대의 경우, ind2 에는 ind1 + C-1(C는 소정 갯수의 샘플들) 값이 할당되며, 따라서 상기 이득은, ind1 부터 ind2 까지의 샘플들의 범위에 대해 1 값으로 예시된다. ind2 값이 프레임의 길이(L)를 초과하는 경우, 이는 L-1로 예시되며, 따라서 ind2 는 프레임의 마지막 샘플을 가리킨다.
오류-알람 범위에 대한 에코 감쇠의 금지는, 도8c를 참조하여 설명될 것이다. 도8c의 순서도는, 제 1 부분에서, 에코 감쇠의 계산을 위한 종래기술의 도2d의 순서도를 반복한다.
변환 디코더로부터 유도된 신호의 엔벨로프를 계산하기 위한 단계 301과 시간 디코더로부터 유도된 신호의 엔벨로프를 계산하기 위한 단계 302가, 상기 순서도의 시작부분에 추가되었다. 다음으로, 도2d와 비교하여 도8c에 추가된 중요 부분은, 도8c의 단계 310 내지 단계 314 에 관한 것이다. 이 부분에서는, ind1 내지 ind2 사이의 샘플들에서, 에코 감쇠 이득값을 1로 세팅하는 것에 관심이 있다. 본 발명의 방법에 따르면, 범위 ind1 내지 ind2 는, 종래기술의 에코 감쇠 활동이 부적절하게 작용하는 샘플들의 범위라고 판별된바 있으며 따라서 전술한 바와같이 수정 되어야 한다.
도8c에 예시된 방법을 구현하기 위해서는, 사실, 초기 이득 팩터 g(n)은, 신호의 각 샘플에 대해 1차 순환 필터(first order recursive filter)에 의해서 평활화되는바, 이는 불연속들을 회피하기 위함이다. 평활화 필터의 전달함수는 다음과 같다.
Figure 112008066567349-PCT00002
따라서, 시간 도메인에서 상기 필터링 공식은,
g'(n) = αg'(n-1) + (1-α)g(n)
상기 공식에서 α 는 0 과 1 사이의 실수(real value)이다.
실제로, 상기 초기 이득은 매 K2 샘플들(전형적으로 K2 = 40) 마다 계산되며 그리고 그 값은 서브 블록의 모든 샘플들에 대해 반복되는바, 이는 계단 형상(staircase appearance)을 제공하며 따라서 도8d의 순서도에 의해 설명된 평활화의 이용이 가능하다. 에코 이득 감쇠의 평활화는 명백해 보이며, 일례로서 도3d에서는, 낮은 값에서부터 1 값으로 이득이 완만히 상승한다.
오류-알람 영역(15 및/또는 18)을 정의하기 위한 모듈들은, 합산/오버랩을 위한 역 변환으로부터 유도된 신호들만을 입력신호로 하여 동작할 수도 있다는 점을 유의해야 한다. 상기 모듈은, 재구성된 신호를 생성하기 위한 합산/오버랩부에 의해 역 변환을 이용하는 임의의 디코더(계층적이거나 아니거나, 다중대역이거나 아니거나)내에서 구현될 수 있는바, 이는 또 다른 디바이스에 의해 주어진 초기 에 코 감쇠 결정을 보장하기 위함이다.
이하에서는 도9a를 참조하여 예시적인 구현예를 설명한다. 이득들의 개시(initiation)는 에코 감쇠 이득을 계산하는 임의의 다른 방법으로부터 올 수 있다.
도9a에서, 이중 참조번호 05, 06; 15, 18; 16a, 19a 및 17, 20은, 오류-알람 존을 정의하기 위한 모듈(15 및 18)에 대한 도7의 대응 구성요소들은 나타낸다. 또한, 이득 초기화 서브-모듈(16a, 19a)이 추가되었다.
초기 이득들을 계산하기 위한 예시적인 구현예가 도9b를 참조하여 설명된다. 이 경우, 상기 이득들은 0 으로 초기 설정되며 그리고 에코 감쇠 금지 절차는 에코가 존재하지 않는 모든 존들에 대해 이득을 1로 재설정하는 것이 보통이다.
대응 하부 단계들은 다음과 같은 것들을 포함한다. 오류-알람 존을 정의하기 위한 모듈(15, 18)에 대해, 샘플의 랭크 n의 이득 G(n)을 0 값으로 초기화하는 서브 단계(500), 프로세싱되는 샘플의 랭크 n을 제 1 인덱스 값 ind1 으로 초기화하는 서브 단계(501), 제 2 인덱스 값 빼기 1에 대해 랭크 n의 열세(inferiority)를 비교하는 테스트 단계(502).
상기 값이 도달하지 않는 한, 이득값 G(n)은 1 값으로 수정되며(503), 그리고 상기 방법은 n=n+1 에 의해 다음 랭크의 샘플로 진행한다(504). 서브 단계(502) 이득 수정 동작은 종료한다.
본 발명에 따른 방법은, 발성(attack)의 시작을 계산하는 것에 관한 특정한 사례(각각의 서브-블록에 대해 최대 에너지를 검색)를 이용하는바, 이는 발성(attack)의 시작을 판별하는 임의의 다른 방법과도 함께 동작할 수 있다.
본 발명에 따른 방법과 앞서 설명한 본 발명의 변형예는, MDCT 필터들의 뱅크 또는 실수 또는 복소수 값으로 완벽한 복원을 하는 필터들의 임의의 뱅크, 또는 거의 완벽한 복원을 하는 필터들의 뱅크들 및 프리에 변환 또는 웨이브렛(wavelet) 변환을 이용하는 필터들의 뱅크들을 이용하는 임의의 인코더에서 에코를 감쇠시키는데 적용될 수 있다.
또한, 본 발명은 컴퓨터 또는 전용 디바이스에 의한 실행을 위해 매체상에 저장된 일련의 명령들을 포함하여 이루어진 컴퓨터 프로그램을 포함하며, 특히 이들 명령들의 수행시에, 도3a 내지 도5b에 대하여 앞서 설명된 바와같은 본 발명에 따른 방법이 수행된다.
전술한 컴퓨터 프로그램은, 저 에너지 신호 부분들에서 에코들의 존재를 구별하기 위한 모듈, 에코 감쇠 모듈 및 현재 프레임의 고 에너지 신호 부분에서 에코의 감쇠를 금지시키기 위한 모듈, 도7 내지 도8d에 관하여 설명된 에코 감쇠 검출 디바이스의 모듈에 설치된 직접적으로 실행가능한 프로그램이다.

Claims (22)

  1. 에코들을 생성하는 변환 인코딩으로부터 생성된 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법으로서, 적어도 디코딩에서, 상기 디지털 오디오 신호의 각각의 현재 프레임에 대해,
    - 고-에너지 존으로의 변이에 선행하는 저-에너지 존을 구별하고;
    - 현재 프레임의 구별되지 않은(non-discriminated) 존들에 대응하는 오류-알람 존을 정의하고;
    - 현재 프레임의 감쇠 이득값들로 상기 에코들의 초기 프로세싱을 결정하고;
    - 현재 프레임의 상기 구별된 저-에너지 존들내에서 에코들의 초기 프로세싱에 따라 에코들을 감쇠시키고;
    - 오류-알람 존에서의 초기 프로세싱에서 에코들의 감쇠를 금지시키는 것
    을 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  2. 제 1 항에 있어서,
    상기 인코딩은, 또한 에코들을 생성하는 상기 변환 인코딩 스테이지와 병렬로, 에코들을 생성하지 않는 시간 인코딩 스테이지를 포함하며,
    에코들의 초기 프로세싱을 결정하는 것은, 디코딩에서, 상기 디지털 오디오 신호의 각각의 현재 프레임에 대해,
    - 에코-생성 디코딩으로부터 획득한 신호의 시간 엔벨로프의 특성으로부터 획득한 변수의 대표값과 에코-비생성 디코딩으로부터 획득한 신호의 대응 특성으로부터 획득한 변수의 대표값을, 적어도 하나의 주파수 대역에서 실시간으로, 임계값과 비교하고; 그리고
    - 상기 비교의 결과에 따라, 현재 프레임에서의 상기 변환 인코딩으로부터 획득한 에코의 존재 또는 비존재를 결론짓고; 그리고 만일 에코가 존재한다면,
    - 상기 에코-생성 디코딩 및 상기 에코-비생성 디코딩으로부터 획득한 상기 변수들에 따라, 에코들의 초기 감쇠 이득들을 결정하는 것
    을 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  3. 제 1 항에 있어서,
    상기 에코들의 초기 프로세싱을 결정하는 것은, 디코더에서, 상기 디지털 오디오 신호의 각각의 현재 프레임에 대해,
    상기 현재 프레임에 대한 초기 이득들로 0 값을 지정하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    현재 프레임은 제 1 부분 및 제 2 부분을 포함하며, 오류-알람 존을 정의하는 것은,
    - 현재 프레임의 재구성된 신호로부터 그리고 현재 프레임의 상기 제 2 부분의 신호로부터, 연쇄신호를 생성하고;
    - 상기 연쇄신호를 샘플들의 짝수개의 서브-블록들로 나누고, 상기 서브 블록들은 기결정된 길이를 가지며;
    - 기결정된 길이의 상기 서브 블록들 각각의 신호의 에너지를 계산하고;
    - 상기 모든 서브 블록의 에너지 값들의 최대값을 계산하고;
    - 현재 프레임의 재구성된 신호의 서브 블록들에 대해, 에너지 값들의 최소값을 계산하고; 그리고
    - 최소 에너지 값에 대한 최대 에너지 값의 비율이 소정 임계값보다 작거나 같으면, 현재 프레임의 모든 곳에서 에코의 부재(absence)가 드러나며, 현재 프레임의 첫번째 샘플의 랭크(rank)에 제 1 인덱스를 할당하고 현재 프레임의 마지막 샘플의 랭크에 제 2 인덱스를 할당하고;
    - 상기 제 1 인덱스와 상기 제 2 인덱스 사이에 포함된 현재 프레임의 샘플들을 상기 오류-알람 존으로서 식별하는 것
    들을 적어도 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  5. 제 4 항에 있어서,
    상기 최소 에너지 값에 대한 상기 최대 에너지 값의 비율이 상기 소정의 임계값보다 큰 경우, 사전-에코들의 리스크는 오직 신호의 저-에너지 부분에서만 나 타나며,
    고-에너지 존의 첫번째 샘플의 랭크를 대표하는 제 1 인덱스와 고-에너지 존의 마지막 샘플의 랭크를 대표하는 제 2 인덱스를 계산하는 것
    을 더 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  6. 제5항에 있어서,
    상기 제 1 인덱스는, 제 1 고-에너지 서브 블록의 첫번째 샘플의 인덱스인 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  7. 제4항 내지 제6항 중 어느 한 항에 있어서,
    상기 제 2 인덱스는,
    상기 샘플들의 갯수로서 오류-알람의 최대 길이를 제 1 인덱스에 더하고 여기에서 1을 뺀 값과, 프로세싱 중인 현재 프레임의 말단(end) 샘플의 인덱스 값 사이의 최소값으로서 계산되는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    상기 오류-알람 존 내에서는 상기 감쇠 이득 값들을 1로 세팅하는 반면에 상기 오류-알람 존 외부에서는 초기 이득 값들을 유지하고 그리고 결과적인 감쇠 이 득 값들을 현재 프레임의 재구성된 신호의 샘플들에 적용함에 의해서, 상기 금지가 수행되는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 결과적인 이득값들은, 현재 프레임의 재구성된 신호의 샘플들에 적용되기 이전에, 필터링에 의해 평활화되는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    선행 프레임의 최대 에너지의 비율은 저장되며, 그리고
    - 현재 프레임의 에너지에 대한 선행 프레임의 에너지의 비율이 소정 임계값보다 큰 경우, 사후-에코들의 리스크는 현재 프레임에서 나타나며, 또한 상기 방법은,
    현재 프레임에서 에코들의 초기 프로세싱에 따라 에코들을 감쇠시키는 것
    을 더 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 방법.
  11. 에코들을 나타낼 수 있는 변환 인코더에 의해 생성된 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스로서, 적어도 변환 디코더에서,
    - 고-에너지 존으로의 변이에 선행하는 저-에너지 존을 구별하는 수단;
    - 현재 프레임의 구별되지 않은(non-discriminated) 존들에 대응하는 오류-알람 존을 정의하는 수단;
    - 감쇠 이득값들로 상기 에코들의 초기 프로세싱을 결정하는 수단;
    - 현재 프레임의 상기 구별된 저-에너지 존들에 적용된 에코들의 초기 프로세싱에 따라 에코들을 감쇠시키는 수단; 및
    - 오류-알람 존에 적용된 상기 에코들의 초기 프로세싱의 감쇠를 금지시키는 수단
    을 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스.
  12. 제11항에 있어서,
    다계층 계층적 인코더에 의해 생성된 디지털 오디오 신호에 대해, 디코더에서, 상기 디코더는, 에코들을 생성하지 않는 적어도 하나의 시간 디코더와 에코들을 나타낼 수 있는 적어도 하나의 변환 디코더를 포함하며,
    상기 디바이스는, 시간 디코더 및 변환 디코더 중 적어도 하나에 대하여,
    - 고-에너지 존으로의 변이에 선행하는 저-에너지 존을 구별하고, 에코들의 감쇠가 금지되어야만 하는 존에 대한 인덱스들을 전달하는 수단;
    - 현재 프레임의 적어도 하나의 주파수 대역에서 에코의 존재 및 본래 위치를 계산하고, 에코들의 감쇠가 금지되어야만 하는 상기 존에 대한 상기 인덱스들 중 적어도 하나를 수신하고, 현재 프레임에 적용될 수 있는 에코 감쇠 값들을 전달하는 수단; 및
    - 상기 역 변환 디코더에 의해 전달된, 현재 프레임의 상기 디코딩된 신호를 수신하고 그리고 현재 프레임에 적용될 수 있는 상기 에코 감쇠 값들을 수신하고, 에코를 감쇠시키는 수단
    을 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스.
  13. 제11항 또는 제12항에 있어서,
    현재 프레임의 적어도 하나의 고주파수 대역 및 적어도 하나의 저주파수 대역에서 에코의 존재 및 본래 위치를 계산하는 상기 수단은, 상기 디코더의 디멀티플렉서에 연결되어,
    - 상기 디지털 오디오 신호에 대한 저주파수 대역 디코딩 채널;
    - 상기 디지털 오디오 신호에 대한 고주파수 대역 디코딩 채널;
    - 상기 저주파수 대역 디코딩 채널 및 상기 고주파수 대역 디코딩 채널 각각에 의해 전달된 신호를 수신하며, 그리고 재구성된 디지털 오디오 신호를 전달하는 합산 회로
    를 통합 및 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스.
  14. 제13항에 있어서,
    상기 저주파수 대역 디코딩 채널은,
    - 디멀티플렉싱된 비트스트림을 수신하고 그리고 예측 디코딩에 의해 디코딩된 신호를 전달하는 예측 디코딩 모듈;
    - 디멀티플렉싱된 비트스트림을 수신하고 그리고 저주파수 대역의 인코딩된 차이 신호 (X^ lo)의 스펙트럼 계수들을 전달하는 스펙트럼 계수 디코딩 모듈;
    - 상기 저주파수 대역의 인코딩된 차이 신호 (X^ lo)의 스펙트럼 계수들을 수신하고 그리고 저주파수 대역 디지털 오디오 신호(x^ lo)를 전달하며; 그리고 저에너지 신호의 부분들에서 에코들의 존재를 판별하는 상기 수단과 상기 감쇠 금지 수단을 형성하는 주파수/시간 전환 모듈,
    - 저주파수 대역 디지털 오디오 신호(x^ lo), 필터링된 신호 (x^ lo) 및 예측 디코딩에 의해 디코딩된 신호의 Memlo 로부터 오류-알람 존을 정의하고 그리고 에코를 검출하며, 그리고 저주파수 이득 신호 G(lo)를 전달하는 수단;
    - 저주파수 이득 값(Glo)을 변환 디코딩 및 가능하다면 필터링에 의해 디코딩된 신호에 적용하는 수단, 합산 수단, 사후-필터링 수단, 오버-샘플링 수단, 및 디지털 오디오 신호의 저주파수 대역 합성 신호를 전달하는 QMF 합성 필터링 수단
    을 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스.
  15. 제 13항에 있어서,
    상기 고주파수 대역 디코딩 채널은,
    - 상기 디멀티플렉싱된 비트스트림을 수신하고 사전-에코들이 없는 디지털 오디오 신호의 시간 엔벨로프 기준 신호를 전달하는 대역 확장 채널;
    - 상기 디멀티플렉싱된 비트스트림과 시간 기준 신호의 스펙트럼 계수를 수신하고 고주파수 대역 인코딩된 디지털 오디오 신호(X^ hi)의 스펙트럼 계수들을 전달하는 상기 스펙트럼 계수 디코딩 모듈;
    - 고주파수 대역 인코딩된 디지털 오디오 신호의 스펙트럼 계수들을 수신하고고주파수 대역 디지털 오디오 신호(x^ hi)를 전달하며; 그리고 저에너지 신호의 부분들에서 에코들의 존재를 판별하는 상기 수단과 상기 감쇠 금지 수단을 형성하는 주파수/시간 전환 모듈,
    - 고주파수 대역 디지털 오디오 신호(x^ hi), Memhi, 그리고 고주파수 대역 이득값 신호G(hi)를 전달하는 대역 확장 모듈의 출력으로부터 오류-알람 존을 정의하고 그리고 에코를 검출하는 수단;
    - 고주파수 이득 값(Ghi)을 고주파수 대역 디지털 오디오 신호에 적용하는 수단, 오버-샘플링 수단, 및 디지털 오디오 신호의 고주파수 대역 합성 신호를 전달하는 고역 통과 필터링 수단
    을 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스.
  16. 제 14항에 있어서,
    상기 저주파수 대역 디코딩 채널에서, 오류 알람 존을 정의하는 상기 수단은 현재 프레임에서 제 1 및 제 2 인덱스를 계산하는 수단을 포함하며, 상기 제 1 인덱스는 최대 에너지 샘플의 랭크를 대표하며 그리고 제 2 인덱스는 마지막 고에너지 샘플을 대표하며, 상기 에코 검출 수단은 상기 제 1 및 제 2 인덱스들, 인코딩에서 적용된 것의 반대인 지각 가중치 필터에 의해 가중화된 저주파수 대역 디지털 오디오 신호(x^ lo) 및 상기 예측 디코딩에 의해 디코딩된 신호를 이용하여 상기 저주파수 이득값 신호(Glo)를 전달하며, 상기 이득값은 조절가능한-이득 증폭기를 통해 인코딩에서 적용된 것의 반대인 지각 가중치 필터에 의해 가중화된 저주파수 대역 디지털 오디오 신호(x^ lo)에 적용되는 인코딩에서 적용된 것의 반대인 지각 가중치 필터에 의해 가중화된 저주파수 대역 디지털 오디오 신호(x^ lo)에 적용되는 것
    을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스.
  17. 제 15 항에 있어서,
    상기 고주파수 대역 디코딩 채널에서,
    오류 알람 존을 정의하는 상기 수단은 현재 프레임에서 제 1 및 제 2 인덱스를 계산하는 수단을 포함하며, 상기 제 1 인덱스는 최대 에너지 샘플의 랭크를 대표하며 그리고 제 2 인덱스는 마지막 고에너지 샘플을 대표하며, 상기 에코 검출 수단은 상기 제 1 및 제 2 인덱스들, 고주파수 대역 디지털 오디오 신호(x^ hi) 및 대역 확장 모듈로부터 획득한 디지털 오디오 신호를 이용하여 상기 고주파수 이득값 신호(Ghi)를 전달하며, 상기 이득값은 조절가능한-이득 증폭기를 통해 고주파수 대역 디지털 오디오 신호(x^ hi)에 적용되는 것
    을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스.
  18. 제16항 또는 제17항에 있어서,
    에코들의 존재하에서 오류 알람 존을 정의하기 위해서, 제 1 및 제 2 인덱스들 사이에서, 상기 정의 수단은 적어도,
    - 저주파수 대역(x^ lo) 및 고주파수 대역(x^ hi) 각각에서, 현재 프레임의 재구 성된 신호의 K2 서브 블록들의 에너지를 계산하고;
    - 저주파수 대역 memlo 및 고주파수 대역 memhi 각각에서, 현재 프레임의 제 2 부분의 디지털 오디오 신호의 제 1 K2/2 서브 블록들의 에너지를 계산하고;
    - 저주파수 대역 및 고주파수 대역 각각에서, 현재 프레임의 재구성된 신호의 상기 K2 서브 블록들에 대해 최소 에너지를 계산하고;
    - 저주파수 대역 및 고주파수 대역 각각에서, 계산된 모든 에너지들에 대해 서브 블록들의 에너지들의 최대값을 계산하고;
    - 최소 에너지에 대한 최대 에너지의 비율과 소정 임계값의 열화성 비교에 의해 제 1 및 제 2 인덱스들을 계산하고, 상기 제 1 인덱스 값은 0 값으로 예시되고 그리고 상기 제 2 인덱스 값은 현재 프레임의 샘플들의 갯수에 대한 최대값에서 1 이 감산된 것이 되며, 에코들에 적용된 이득은 1과 같게 취해지며 그리고 상기 열화 비교가 검증된 때에 현재 프레임의 모든 길이에 대해 감쇠가 금지되며;
    - 최대 에너지 블록의 제 1 샘플의 위치로 상기 제 1 인덱스를 예시하며, 상기 제 2 인덱스 값은 제 1 인덱스가 소정 갯수의 샘플들만큼 증가한 것에 1 이 감산된 것과 프레임의 마지막 샘플의 인덱스 사이에서 최소값으로 예시되며,
    제 1 및 제 2 인덱스 사이에 발성이 있는 샘플들의 범위에 걸쳐서 신호에 적용되는 이득은 1과 같게 취해지며 그리고 다른 경우에는 감쇠가 금지되는 것
    을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스.
  19. 제 18항에 있어서,
    사후-에코들의 프로세싱과 그리고 사전-에코들 및 사후-에코들의 프로세싱의 실행을 고려하기 위해서, 사후-에코들의 감쇠의 금지를 제거함에 의해, 현재 프레임의 신호의 각 서브 블록의 에너지를 계산하기 위한 상기 수단은,
    - 현재 프레임의 재구성된 신호의 상기 K2 서브 블록들의 최대 에너지를 계산;
    - 우세성 비교에 의한, 현재 프레임의 최대 에너지에 대한 선행 프레임의 최대 에너지의 비율과 소정 임계값과의 비교; 그리고 성공적인 우세성 비교시에, 사후-에코의 존재가 드러나며;
    - 다음 프레임을 위한 현재 프레임의 최대 에너지의 저장 그리고 종료 상태로의 복귀, 최소 에너지의 계산, 에너지들의 최대값의 계산 및 금지되고 있는 제 1 및 제 2 인덱스들의 계산 그리고 제거되는 사후-에코들의 감쇠의 금지, 제 2 인덱스 값보다 큰 제 1 인덱스 값에 의해 시그널링되며, 그리고 비성공적인 우세성 비교시에, 사후-에코의 존재는 드러나지 않으며;
    - 다음 프레임을 위해 재구성된 신호의 프레임의 최대 에너지를 저장
    - 청구항 제12항에 청구된 바와같은 제 1 및 제 2 인덱스들의 계산
    을 포함하는 것을 특징으로 하는 디지털 오디오 신호의 에코들을 구별 및 감쇠시키는 디바이스.
  20. 제 11 항에 있어서,
    상기 에코 감쇠 수단은 조정가능한 이득 증폭기를 포함하고, 상기 조정가능한 이득 값은 0의 값으로 실증(instantiate)되고, 상기 감쇠는 상기 이득 값을 1로 설정함으로써 상기 제 1 인덱스 값과 상기 제 2 인덱스 값 사이에 포함되는 샘플들에 대하여 금지되며, 이에 의해 상기 고 에너지 디지털 오디오 신호의 샘플들에 적용되는 감쇠는 금지시키고, 상기 이전 프레임 및 현재 프레임 각각에서의 변환의 외형에 의해 발생되는 프리-에코들에 대한 각각의 포스트-에코들에 적용되는 감쇠는 유지할 수 있는 것을 특징으로 하는 장치.
  21. 컴퓨터 또는 전용 장치에 의해 실행될 수 있도록 매체 상에 저장되어 있는 일련의 명령어들을 포함하는 컴퓨터 프로그램으로서,
    상기 명령어들을 실행하게 되면, 상기 명령어들은 제 1 항 내지 제 10 항 중의 어느 한 항에서 청구되는 디지털 오디오 신호의 에코들을 식별하여 감쇠시키는 방법을 실시하는 것을 특징으로 하는 컴퓨터 프로그램.
  22. 제 21 항에 있어서,
    상기 프로그램은, 제 11 항 내지 제 20 항 중의 어느 한 항에서 청구되는 에코들을 검출하고 감쇠시키기 위한 장치에 있어서, 상기 신호의 저 에너지 부분들에서의 에코들의 존재를 식별하기 위한 모듈, 상기 에코들을 감쇠시키기 위한 모듈 및 현재 프레임 또는 이전 프레임의 상기 신호의 고 에너지 부분들에서의 에코들의 감쇠를 금지하기 위한 모듈에 내장되는 직접 실행가능한 프로그램인 것을 특징으로 하는 컴퓨터 프로그램.
KR1020087023143A 2006-02-20 2008-09-22 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법 KR101376762B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0601466A FR2897733A1 (fr) 2006-02-20 2006-02-20 Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR0601466 2006-02-20
PCT/FR2007/050786 WO2007096552A2 (fr) 2006-02-20 2007-02-13 Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant

Publications (2)

Publication Number Publication Date
KR20080103088A true KR20080103088A (ko) 2008-11-26
KR101376762B1 KR101376762B1 (ko) 2014-03-21

Family

ID=36968787

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087023143A KR101376762B1 (ko) 2006-02-20 2008-09-22 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법

Country Status (8)

Country Link
US (1) US8756054B2 (ko)
EP (1) EP2002428B1 (ko)
JP (1) JP5202335B2 (ko)
KR (1) KR101376762B1 (ko)
CN (1) CN101390159B (ko)
AT (1) ATE520123T1 (ko)
FR (1) FR2897733A1 (ko)
WO (1) WO2007096552A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013062392A1 (ko) * 2011-10-27 2013-05-02 엘지전자 주식회사 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
US8571852B2 (en) * 2007-03-02 2013-10-29 Telefonaktiebolaget L M Ericsson (Publ) Postfilter for layered codecs
US8463603B2 (en) * 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
US8676365B2 (en) 2008-09-17 2014-03-18 Orange Pre-echo attenuation in a digital audio signal
ES2683648T3 (es) * 2010-07-02 2018-09-27 Dolby International Ab Descodificación de audio con pos-filtración selectiva
MY165853A (en) 2011-02-14 2018-05-18 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
JP5666021B2 (ja) 2011-02-14 2015-02-04 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 復号後オーディオ信号をスペクトル領域で処理する装置及び方法
SG192734A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
JP5914527B2 (ja) 2011-02-14 2016-05-11 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 過渡検出及び品質結果を使用してオーディオ信号の一部分を符号化する装置及び方法
WO2012110473A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
SG192745A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Noise generation in audio codecs
EP2676267B1 (en) 2011-02-14 2017-07-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of pulse positions of tracks of an audio signal
CA2827335C (en) 2011-02-14 2016-08-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
WO2012110478A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
FR2992766A1 (fr) * 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
FR3000328A1 (fr) * 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
FR3003682A1 (fr) * 2013-03-25 2014-09-26 France Telecom Mixage partiel optimise de flux audio codes selon un codage par sous-bandes
FR3003683A1 (fr) * 2013-03-25 2014-09-26 France Telecom Mixage optimise de flux audio codes selon un codage par sous-bandes
GB201401689D0 (en) * 2014-01-31 2014-03-19 Microsoft Corp Audio signal processing
FR3024581A1 (fr) 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
CN107595311A (zh) * 2017-08-30 2018-01-19 沈阳东软医疗系统有限公司 双能量ct图像处理方法、装置以及设备
US10984808B2 (en) * 2019-07-09 2021-04-20 Blackberry Limited Method for multi-stage compression in sub-band processing

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2687871B1 (fr) * 1992-02-25 1995-07-07 France Telecom Procede et dispositif de filtrage pour la reduction des preechos d'un signal audio-numerique.
JP3341440B2 (ja) * 1994-02-04 2002-11-05 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JPH08223049A (ja) * 1995-02-14 1996-08-30 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
JP3307138B2 (ja) * 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
JP2005049429A (ja) * 2003-07-30 2005-02-24 Sharp Corp 符号化装置及びそれを用いた情報記録装置
US7443978B2 (en) * 2003-09-04 2008-10-28 Kabushiki Kaisha Toshiba Method and apparatus for audio coding with noise suppression
KR100915726B1 (ko) * 2005-04-28 2009-09-04 지멘스 악티엔게젤샤프트 잡음 억제 방법 및 장치
FR2888704A1 (ko) * 2005-07-12 2007-01-19 France Telecom

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013062392A1 (ko) * 2011-10-27 2013-05-02 엘지전자 주식회사 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치
US9672840B2 (en) 2011-10-27 2017-06-06 Lg Electronics Inc. Method for encoding voice signal, method for decoding voice signal, and apparatus using same

Also Published As

Publication number Publication date
CN101390159A (zh) 2009-03-18
US20090313009A1 (en) 2009-12-17
KR101376762B1 (ko) 2014-03-21
JP2009527773A (ja) 2009-07-30
WO2007096552A2 (fr) 2007-08-30
WO2007096552A3 (fr) 2007-10-18
EP2002428B1 (fr) 2011-08-10
US8756054B2 (en) 2014-06-17
FR2897733A1 (fr) 2007-08-24
ATE520123T1 (de) 2011-08-15
EP2002428A2 (fr) 2008-12-17
CN101390159B (zh) 2012-07-04
JP5202335B2 (ja) 2013-06-05

Similar Documents

Publication Publication Date Title
KR101376762B1 (ko) 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법
US11238876B2 (en) Methods for improving high frequency reconstruction
US10249310B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
US10381012B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
JP4166673B2 (ja) 相互使用可能なボコーダ
US10170126B2 (en) Effective attenuation of pre-echoes in a digital audio signal
MXPA06006497A (es) Metodo para el ocultamiento de errores en el dominio de frecuencia, mejorado.
US8676365B2 (en) Pre-echo attenuation in a digital audio signal
CN106716529B (zh) 对数字音频信号中的前回声进行辨别和衰减
CN105632504B (zh) Adpcm编解码器及adpcm解码器丢包隐藏的方法
TWI776236B (zh) 支援一組不同丟失消隱工具之音訊解碼器
KR20240033691A (ko) 불요 음향학적 거칠기를 제거하는 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant