KR20150052812A - 디지털 오디오 신호에서 유효 프리-에코 감쇠 - Google Patents

디지털 오디오 신호에서 유효 프리-에코 감쇠 Download PDF

Info

Publication number
KR20150052812A
KR20150052812A KR1020147036551A KR20147036551A KR20150052812A KR 20150052812 A KR20150052812 A KR 20150052812A KR 1020147036551 A KR1020147036551 A KR 1020147036551A KR 20147036551 A KR20147036551 A KR 20147036551A KR 20150052812 A KR20150052812 A KR 20150052812A
Authority
KR
South Korea
Prior art keywords
echo
attack
filtering
attenuation
signal
Prior art date
Application number
KR1020147036551A
Other languages
English (en)
Other versions
KR102082156B1 (ko
Inventor
발라즈 코베지
스테파니 라고트
Original Assignee
오렌지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오렌지 filed Critical 오렌지
Publication of KR20150052812A publication Critical patent/KR20150052812A/ko
Application granted granted Critical
Publication of KR102082156B1 publication Critical patent/KR102082156B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

본 발명은 변환 코딩으로부터 생성된 디지털 오디오 신호에서 프리-에코 감쇠를 프로세싱하기 위한 방법에 관한 것이며, 디코딩 포인트에서, 방법은, 디코딩 신호의 어택 포지션을 검출하는 단계(Detect.); 디코딩 신호에서 검출된 어택 포지션 앞에 있는 프리-에코 구역을 결정하는 단계(ZPE); 프리-에코 구역의 서브블록당 감쇠 인자들을 적어도 어택이 검출되었던 프레임과 이전 프레임에 따라 계산하는 단계(F.Att.); 및 대응하는 감쇠 인자들에 의해 프리-에코 구역의 서브블록들에서 프리-에코를 감쇠시키는 단계(Att.)를 포함한다. 방법은 또한, 검출된 어택 포지션까지 현재 프레임 상에서 프리-에코 구역의 스펙트럼 정형에 대해 필터를 적용하는 단계(F)를 더 포함한다. 본 발명은 또한 상기 방법을 구현하는 디바이스와 이러한 디바이스를 포함하는 디코더에 관한 것이다.

Description

디지털 오디오 신호에서 유효 프리-에코 감쇠{EFFECTIVE PRE-ECHO ATTENUATION IN A DIGITAL AUDIO SIGNAL}
본 발명은 디지털 오디오 신호의 디코딩 동안 프리-에코들의 감쇠를 프로세싱하기 위한 방법 및 장치에 관한 것이다.
전송 네트워크, 예를 들어 고정 또는 이동 네트워크들을 통한 디지털 오디오 신호의 전송을 위해, 또는 신호들을 저장하기 위해서, 변환-기반 주파수 코딩 또는 시간적 코딩 타입의 코딩 시스템을 구현하는 압축 (또는 소스 코딩) 프로세스들이 사용되었다.
따라서, 본 발명의 목적인 방법 및 디바이스의 적용 분야는 사운드 신호들의 압축, 특히, 주파수 변환에 의해 코딩된 디지털 오디오 신호들의 압축이다.
도 1은 종래 기술에 따른 부가/오버랩에 의해 분석-합성을 포함하는 디지털 오디오 신호의 변환-기반 코딩 및 디코딩의 기본 다이어그램을 예시로서 도시한다.
특정 음악적 시퀀스들, 이를 테면, 타악기들 및 특정 음성 세그먼트들, 이를 테면 파열음(/k/,/t/,...)은 몇몇 샘플들의 공간 내에서 신호의 동역학의 매우 빠른 트랜지션 및 매우 강력한 변화에 의해 나타내어지는 매우 갑작스러운 어택을 특징으로 한다. 예시적인 트랜지션이, 도 1에 샘플(410) 전방으로 제공된다.
코딩/디코딩 프로세싱 동안, 입력 신호는, 도 1에서 수직 점선들로 나타내어진 길이 L의 샘플들의 블록들로 나눠진다. 입력 신호가 x(n)으로 표기되고, 여기서 n은 샘플의 인덱스이다. 연속하는 블록들로 슬라이싱한 결과 블록들이 XN(n) = [ x(N.L) … x(N.L+L-1) ] = [ xN(0) … xN(L-1)]로 정의되게 하고, N은 프레임의 인덱스이고, L은 프레임의 길이이다. 도 1에서, L=160 샘플들을 갖는다. 수정된 코사인 변조 변환 MDCT("Modified Discrete Cosine Transform")의 경우, 2개의 블록들 XN(n) 및 XN +1(n)이 함께 분석되어 인덱스 N의 프레임과 연관된 변환 계수들의 블록을 제공한다.
변환-기반 코딩에 의해 동작되는 블록들(프레임들로도 또한 지칭됨)로의 분할은 사운드 신호와는 전적으로 무관하고 따라서 그 트랜지션들은 분석 윈도우의 임의의 포인트에서 나타날 수 있다. 이제, 변환-기반 디코딩 이후, 재구성된 신호는, 양자화(Q)-역양자화(Q-1) 동작에 의해 발생된 "노이즈"(또는 왜곡)에 의해 손상된다. 이 코딩 노이즈는 변환된 블록의 시간적인 서포트 전체에 걸쳐서, 즉, (L개의 샘플들이 중첩되어 있는) 샘플들의 길이 2L의 윈도우의 전체 길이에 걸쳐서 상대적으로 균일한 방식으로 시간적으로 분포된다. 코딩 노이즈의 에너지는 일반적으로 블록의 에너지와 비례하고 코딩/디코딩 비트레이트에 의존한다.
(도 1의 블록 320-480과 같이) 어택을 포함하는 블록의 경우 신호의 에너지가 높고, 따라서 노이즈 또한 고 레벨이다.
변환-기반 코딩에서, 코딩 잡음의 레벨은 통상적으로 트랜지션 직후의 고 에너지 세그먼트들에 대한 신호의 레벨보다 낮지만, 그 레벨은 저 에너지의 세그먼트들에 대한 신호의 레벨을 초과하며, 특히, 트랜지션에 선행하는 부분(도 1의 샘플들(160-410))을 초과한다. 상술된 부분의 경우, 신호 대 잡음 비는 음수이고 결과적으로 발생된 저하는 리스닝 동안 매우 성가신 것으로 나타날 수 있다. 트랜지션 전의 코딩 노이즈를 프리-에코라 지칭하고 그 트랜지션 후의 노이즈를 포스트-에코라 지칭한다.
도 1에서, 프리-에코가 트랜지션 전의 프레임과 트랜지션이 발생하는 프레임에 영향을 미치는 것을 관찰할 수 있다.
음향 심리학 실험들은, 인간의 귀가 사운드의 몇 밀리초, 시간적 프리-마스킹 정도로 상당히 제한되게 수행한다는 것을 보여주었다. 프리-에코의 지속기간이 프리-마스킹의 지속기간보다 더 긴 경우, 어택 앞의 노이즈, 즉 프리-에코는 가청이다.
또한, 고-에너지 시퀀스들로부터 저 에너지 시퀀스들로 지나가는 경우, 사람의 귀는 5 내지 60 밀리초의 더 긴 지속기간의 포스트-마스킹을 수행한다. 따라서, 포스트-에코들에 대해 수용가능한 성가심 속도 또는 레벨은 프리-에코들의 경우보다 더 크다.
더 중요한 프리-에코들의 현상은, 샘플들의 수 관점에서 블록들의 길이가 길어질수록 성가심이 더욱 더 커진다는 것이다. 이제, 변환-기반 코딩에서, 정지 신호들의 경우 변환 길이가 더 증가할수록, 코딩 이득이 더 커진다는 것이 잘 알려져 있다. 고정 샘플링 주파수 및 고정 비트레이트에서, 윈도우의 포인트들의 수(따라서 변환의 길이임)가 증가되는 경우, 프레임당 비트들이 더 많은 것은 음향심리학적 모델에 의해 유용한 것으로 간주되는 주파수 스펙트럼선들을 코딩하는 데에 이용가능할 것이므로, 긴 길이의 블록들을 이용하는 이점이 있다. MPEG ACC 코딩(어드밴스드 오디오 코딩)은, 예를 들어, 고정수(2048)의 샘플들을 포함하는 긴 길이의, 즉, 32㎑의 샘플링 주파수에서 64ms의 지속기간에 걸친 윈도우를 사용한다; 프리-에코들의 이러한 문제는, 중간(트랜지션) 윈도우들에 의해 이러한 롱 윈도우들로부터 8개의 짧은 윈도우들로 전환하는 것을 가능하게 함으로써 내부에서 관리되므로, 트랜지션의 존재를 검출하고 윈도우들을 적응시키기 위해 코딩에 대한 일정한 지연을 요구한다. 이러한 짧은 윈도우들의 길이는 따라서 8ms이다. 저 비트레이트에서, 수 ms의 가청 프리-에코를 갖는 것은 항상 가능하다. 윈도우들을 스위칭하는 것은, 프리-에코를 감쇠시키는 것이 가능할 뿐 이것을 제거하는 것은 아니다. UIT-T G.722.1, G.722.1C 또는 G.719와 같은 종래의 출원들에서 사용된 변환-기반 코더들은 종종 16, 32 또는 48㎑ (각각)에서 지속기간 40 ㎳의 윈도우와 20㎳의 프레임 길이를 사용한다. UIT-T G.719 코더는 과도 검출이 있는 스위칭 윈도우들에 대한 메커니즘을 통합시키지만, 프리-에코는 저 비트레이트(통상적으로 32kbit/s)에서 완전히 감소되지 않는다는 것을 주목한다.
프리-에코들의 현상의 상술된 성가심 효과를 감소시키기 위해서, 코더 및/또는 디코더 레벨에서 다양한 솔루션들이 제안되었다.
윈도우들의 스위칭은 상술되었다. 다른 솔루션은 적응형 필터링을 적용하는 것으로 이루어진다. 어택 선행 구역에서, 재구성된 신호는 원래 신호의 그리고 양자화 잡음의 합으로서 보여진다.
대응하는 필터링 기술은, Y. Mahieux 및 J. P. Petit에 의해 발행된, 64 kbits에서의 고품질 오디오 변환 코딩이라는 제목의 기사로, IEEE Trans. on Communications Vol 42, No. 1994년 11월 11일에 기재되어 있다.
이러한 필터링의 구현은 파라미터들의 정보를 요구하고, 예측 계수들 및 프리-에코에 의해 손상된 신호의 변화와 같은 파라미터들 중 일부는 노이즈 샘플들에 기초하여 디코더에서 추정된다. 반면에, 원래 신호의 에너지와 같은 정보가 코더에서만 알려질 수 있고 따라서 전송되어야만 한다. 변환-기반 코딩에 할당된 상대적인 버짓이 감소하는 제약된 비트레이트에서 추가적인 정보를 전송할 필요가 있게 한다. 수신된 블록이 갑작스러운 동적 변화를 포함하는 경우, 필터링 프로세싱이 이것에 적용된다.
상술된 필터링 프로세스는, 원래 신호를 리트리브하는 것을 가능하게 하지 않지만, 프리-에코들에 있어서 큰 감소를 얻는다. 그러나, 추가적인 파라미터들이 디코더로 전송될 것을 요구한다.
특정한 전송 정보를 이용하지 않는 다양한 프리-에코 감소 기술이 제안되어 왔다. 예를 들어, 계층적 코딩의 맥락에서 프리-에코들의 감소의 검토는 B. Kovesi, S. Ragot, M. Gartner, H. Taddei에 의한, 2008년 8월 스위스의 로잔, EUSIPCO의 "Pre-echo reduction in the ITU-T G.729.1 embedded coder"의 기사에 제시되어있다.
프리-에코들을 감쇠시키는 방법의 통상적인 예가 프랑스 특허 출원 FR 08 56248에 설명된다. 이 예에서, 감쇠 인자들은 트랜지션 또는 어택이 검출되었던 서브-블록 앞에 있는 저에너지 서브-블록들에서 서브-블록마다 결정된다.
서브-블록 당 감쇠 인자 g(k)는 예를 들어, 최고 에너지의 서브-블록의 에너지 대 해당하는 k번째 서브-블록의 에너지의 비 R(k)의 함수로서 계산된다.
g(k)=f(R(k))
여기서 f는 0과 1 사이의 값들을 가진 감소 함수이고 k는 서브-블록 수이다. 예를 들어, 현재 서브-블록의 에너지 En(k)의 함수 그리고 이전 서브-블록의 에너지 En(k-1)의 함수로서 인자 g(k)의 다른 정의가 가능하다.
최대 에너지에 대한 에너지의 변화가 낮으면, 감쇠는 필요하지 않다. 이후, 인자 g(k)가 감쇠를 억제하는 감쇠값으로 고정되는데, 즉 1이다. 그렇지 않으면, 감쇠 인자는 0과 1 사이이다.
대부분의 경우, 특히 프리-에코가 성가신 경우, 프리-에코 프레임 앞의 프레임은 저 에너지(통상적으로, 백그라운 노이즈)의 세그먼트의 에너지에 해당하는 동종 에너지를 갖는다. 실험에 따르면, 프리-에코 감쇠 이후 신호의 에너지를 프로세싱하는 것은 프로세싱 구역 앞의 신호의 서브-블록 당 평균 에너지 (통상적으로 이전 프레임의 에너지
Figure pct00001
또는 이전 서브프레임의 후반부 에너지
Figure pct00002
) 미만이어야 한다는 것은 유용하지도 않고 심지어 바람직하지도 않다.
프로세싱될 서브블록(k)의 경우, 인자
Figure pct00003
의 한계치를 계산하는 것이 가능하므로, 프로세싱될 서브-블록 앞의 세그먼트의 서브블록 당 평균 에너지와 정확히 동일한 에너지를 획득하는 것이 가능하다. 이 값은 물론 1의 최대치로 제한되는데, 우리는 여기서 감쇠 값들에 대하여 관심이 있기 때문이다. 더 정확하게는 다음 식과 같다:
Figure pct00004
이전 세그먼트의 평균 에너지는
Figure pct00005
에 의해 근사화된다.
이와 같이 획득된 값
Figure pct00006
는 서브블록 감쇠 인자의 최종 계산 시 더 낮은 한계치로 역할을 한다:
Figure pct00007
서브블록 당 결정된 감쇠 인자들(또는 이득들)g(k)는 이후 블록들의 경계들에서 감쇠 인자의 갑작스러운 변화들을 방지하기 위해 샘플 단위로 적용된 평활화 함수에 의해 평활화된다.
예를 들어, 첫째, 구분적 상수 함수(piecewise constant function)로서 샘플 당 이득을 정의하는 것이 가능하다:
Figure pct00008
L'는 서브블록의 길이를 나타낸다.
이 함수는 이후 다음 식에 따라 평활화된다.
Figure pct00009
관례상,
Figure pct00010
는 이전 서브블록의 최종 샘플에 대해 얻어진 최종 감쇠 인자이고, α는 평활화 계수이며, 통상적으로 α는 0.85이다.
다른 평활화 함수들도 가능하다. 일단 인자들
Figure pct00011
이 이와 같이 계산되면, 각각의 샘플을 대응 인자와 승산함으로써, 현재 프레임
Figure pct00012
의 재구성된 신호에 대해 프리-에코 감쇠가 실행된다:
Figure pct00013
Figure pct00014
는 디코딩되고 프리-에코 감소를 위해 포스트 프로세싱된 신호이다.
도 2 및 도 3은 종래 기술의 상술된 특허 출원에 설명되고 상기 요약된 바와 같은 감쇠 방법의 구현을 도시한다.
이러한 예들에서, 신호는 32㎑에서 샘플링되고, 프레임의 길이는 L=640개의 샘플들이고 각각의 프레임은 K=80개의 샘플들의 8개의 서브블록들로 분할된다.
도 2의 a) 부분에서, 32㎑에서 샘플링된 원래 신호의 프레임이 제시된다. 신호의 어택(또는 트랜지션)이 인덱스 320에서 시작하는 서브블록에 위치된다. 이 신호는 저-비트레이트(24 kbit/s) MDCT 타입의 변환-기반 코더에 의해 코딩되었다.
도 2의 b) 부분에서, 프리-에코 프로세싱을 하지 않은 디코딩의 결과가 도시된다. 어택을 포함하는 서브블록 앞에 있는 서브블록들에서, 샘플(160) 전방으로 프리-에코를 관찰할 수 있다.
c) 부분은 종래 기술의 상술된 특허 출원에 설명된 방법에 의해 획득된 프리-에코 감쇠 인자(연속선)의 전개를 보여준다. 점선은 평활화 전의 인자를 나타낸다. 여기서, 어택의 포지션이 (샘플들(320과 400)에 의해 구분된 블록의) 샘플 (380) 주위에서 추정된다는 것을 주목한다.
d) 부분은 프리-에코 프로세싱 (신호 b)와 신호 c)의 승산)의 적용 이후, 디코딩 결과를 도시한다. 프리-에코는 실제로 감쇠되었다는 것을 알 수 있다. 도 2는 또한, 평활화 인자가 어택의 순간에 1로 다시 이동하지 않으므로, 어택의 진폭이 감소한다는 암시를 보여준다. 이 감소의 지각할만한 영향은 매우 작지만 그럼에도 불구하고 방지될 수 있다. 도 3은 도 2와 동일한 예를 도시하며, 여기서, 평활화 전에, 어택이 위치되는 서브블록 앞에 있는 서브블록의 몇 개의 샘플들에 대해 감쇠 인자 값이 강제로 1로 된다. 도 3의 c) 부분은 이러한 보정의 예이다.
이 예에서, 인자 값 1이, 인덱스(364) 전방으로, 어택에 선행하는 서브블록의 마지막 16개의 샘플들에 할당된다. 이와 같이 평활화 함수는 인자를 점진적으로 증가시키므로, 어택의 순간에 1에 가까운 값을 갖는다. 이후, 도 3의 d)부분에 도시된 바와 같이, 어택의 진폭이 보존되는 반면, 몇 개의 프리-에코 샘플들이 감쇠되지 않는다.
도 3의 예에서, 감쇠에 의한 프리-에코 감소는, 이득의 평활화 때문에, 어택의 레벨까지 프리-에코를 감소시키는 것이 가능하지 않다.
도 3의 경우와 동일한 설정을 지닌 또 다른 예가 도 4에 도시된다. 이 도면은 2개의 프레임들을 나타내어, 어택 전의 신호의 성질을 더 잘 보여준다. 여기서, 어택 전의 원래 신호의 에너지가 도 3에 의해 도시된 경우 보다 더 높고(a)부분), 어택 전의 신호는 가청이다(샘플들 0-850). b) 부분에서, 구역 700-850에서, 프리-에코 프로세싱을 하지 않은 상태의 디코딩 신호 상에서 프리-에코를 관측하는 것이 가능하다. 앞서 설명된 감쇠를 제한하기 위한 절차에 따르면, 프리-에코 구역의 신호의 에너지가 프로세싱 구역 앞의 신호의 평균 에너지까지 감쇠된다. c)부분에서, 에너지 한계치를 고려함으로써 계산된 감쇠 인자가 1에 가깝고, 신호가 프리-에코 구역의 올바른 레벨로 설정되었다는 사실에도 불구하고, 프리-에코 프로세싱의 적용 (신호 b)와 신호 c)의 승산) 이후에, 파트 d)에 프리-에코가 여전히 존재한다는 것이 관찰된다. 파형 상에서 이 프리-에코를 명확하게 구분하는 것이 실제로 가능한데, 여기서 고주파 성분이 이 구역의 신호에 중첩된다는 것을 주목한다.
이러한 고주파 성분은 명확히 가청이고 성가시며, 어택은 샤프(도 4의 d)부분)하지는 않다.
이러한 현상을 위한 설명은 다음과 같다: (도 4에 도시된 바와 같이)매우 급격하고 임펄스성인 어택의 경우, (어택을 포함하는 프레임에서의) 신호의 스펙트럼은 오히려 백색이고 따라서 많은 고주파들을 포함한다. 이와 같이, 양자화 잡음은 또한 백색이고 고주파들로 이루어지고, 이는 프리-에코 구역 앞에 있는 신호에 대한 경우가 아니다. 따라서, 프레임마다 스펙트럼에서의 갑작스러운 변화가 존재하는데, 이는, 에너지가 올바른 레벨로 설정되었다는 사실에도 불구하고 가청 프리-에코가 되게 한다.
이러한 현상은 다시 도 5a 및 도 5b에 나타내어지는데, 도 5a 및 도 5b는 각각, 도 4의 a) 부분에 나타낸 신호에 해당하는 5a에서의 원래 신호의 스펙트로그램들을 그리고 도 4의 d) 부분에 나타낸 신호에 해당하는 5b에서의 종래 기술에 따른 프리-에코들의 감쇠를 지닌 신호의 스펙트로그램들을 나타낸다.
도 5b에서 윤곽선이 그려진 부분에서 여전히 가청인 프리-에코를 분명히 주목한다.
따라서, 디코딩 시 프리-에코들의 개선된 감쇠를 위한 기술이 필요하며, 이는 바람직하지 않은 고주파들 또는 스퓨리어스 프리-에코들을 감쇠시키는 것이 또한 가능하므로, 어떠한 보조 정보도 코더에 의해 전송되지 않는다.
본 발명은 종래 기술의 상황을 개선한다.
이를 위해, 본 발명은 변환-기반 코딩에 기초하여 생성된 디지털 오디오 신호에서 프리-에코의 프로세싱 감쇠 방법을 다루며, 이 방법에서, 디코딩 시에, 방법은, 다음 단계들:
- 디코딩 신호의 어택 포지션을 검출하는 단계;
- 디코딩 신호에서 검출된 어택 포지션 앞에 있는 프리-에코 구역의 결정하는 단계;
- 프리-에코 구역의 서브블록 당 감쇠 인자들을, 적어도 어택이 검출되었던 프레임과 이전 프레임의 함수로서 계산하는 단계;
- 대응하는 감쇠 인자들만큼 프리-에코 구역의 서브블록들의 프리-에코를 감쇠시키는 단계를 포함한다.
이 방법은, 검출된 어택 포지션까지 현재 프레임 상에서 프리-에코 구역의 스펙트럼 정형을 위해 적응형 필터링을 적용하는 단계를 더 포함한다.
이와 같이, 적용되는 스펙트럼 정형은 프리-에코 감쇠를 개선할 수 있다. 이 프로세싱은, 종래 기술 분야에서 설명된 바와 같이 프리-에코 감쇠를 구현하는 경우 지속될 수 있는 프리-에코 컴포넌트들을 감쇠시키는 것이 가능하다.
검출된 어택 포지션까지 필터가 적용되어, 가능한 한 어택에 가까워질 때까지 프리-에코의 감쇠를 프로세싱할 수 있다. 따라서, 이것은, 어택 포지션(예를 들어 16개의 샘플들의 마진)까지 확장되지 않은 구역으로 제한되는 시간적인 감쇠에 의해 에코 감소의 단점을 보상한다.
이 필터링은 코더로부터 비롯되는 어떠한 정보도 요구하지 않는다.
이 프리-에코 감쇠 프로세싱 기술은 시간적인 디코딩으로부터 발생된 신호의 정보를 이용하여 또는 이를 이용하지 않고도 구현될 수 있고 모노포닉 신호의 코딩 또는 스테레오포닉 신호의 코딩에 대해 구현될 수 있다.
필터링의 적응은 신호에 적응하는 것과 성가신 스퓨리어스 성분들만 제거하는 것이 가능하다.
이하에서 언급된 다양한 특정한 실시형태들은, 상기 정의된 방법의 단계들에 대해, 독립적으로 또는 서로 결합하여 추가될 수 있다.
특정 실시형태에서, 이 방법은 또한, 프리-에코 구역에 적용될 필터링에 관한 적어도 하나의 결정 파라미터를 계산하는 단계와 상기 적어도 하나의 결정 파라미터의 함수로서 필터링의 계수들을 적응시키는 단계를 포함한다.
이와 같이, 이후, 프로세싱은 적응된 필터링 레벨에서 필요한 경우에만 적용된다.
일 실시형태에서, 상기 적어도 하나의 결정 파라미터는 검출된 어택의 강도의 측정이다.
어택의 강도는 실제로 프리-에코 구역 내 가청 고주파 성분들의 존재를 결정한다. 어택이 갑작스러운 경우, 프리-에코 구역 내에 성가신 스퓨리어스 컴포넌트를 가질 위험이 크고 본 발명에 따라 구현될 필터링이 고찰되어야만 한다.
이 파라미터 계산의 가능한 모드에서, 검출된 어택의 강도의 측정은 다음 형태이다:
Figure pct00015
, k는 어택이 검출되었던 서브블록의 수이고 EN(k)는 k번째 서브블록의 에너지이다.
이 계산은 덜 복잡하고 검출된 어택의 강도를 적절하게 정의할 수 있게 한다.
상기 적어도 하나의 결정 파라미터는 또한 어택의 포지션을 포함하는 선행 서브블록의 감쇠 인자의 값일 수 있다.
실제로, 어택은, 이 감쇠가 주목할 만하다면 갑작스러운 것으로 여겨질 수 있다.
다른 실시형태에서, 상기 적어도 하나의 결정 파라미터는 프리-에코 구역의 신호의 그리고/또는 프리-에코 구역 앞의 신호의 스펙트럼 분포 분석에 기초한다.
예를 들어, 이것은 프리-에코 신호의 고주파 성분들의 중요도를 결정하고 또한 이러한 고주파 성분들이 프리-에코 구역 전의 신호에 이미 존재하고 있었는지 여부를 아는 것을 가능하게 한다.
따라서, 고주파 성분들이 이미 프리-에코 구역 전에 존재했던 경우, 이러한 고주파 성분들을 감쇠시키기 위해 필터링을 수행하는 것이 불필요하고, 이후, 필터링 계수들의 적응은, 필터링 계수들을 0으로 또는 0에 가까운 값으로 설정함으로써 수행된다.
따라서, 필터링의 계수들의 적응은 적어도 하나의 결정 파라미터를 미리결정된 임계치와 비교한 것에 따라 개별 방식으로 수행될 수 있다.
필터링 계수들은 일 세트의 값들에 따라서 결정된 값들을 취할 수 있다. 이러한 값들의 최소 세트는 2개의 값들만이 가능한 것으로, 즉, 예를 들면, 필터링과 필터링을 하지 않는 것 사이의 선택이다.
변형 실시형태에서, 필터링의 계수들의 적응은, 상기 적어도 하나의 결정 파라미터의 함수로서 연속 방식으로 수행된다.
이후, 이 적응은 더 정확하고 더 진보적이다.
특정 실시형태에서, 필터링은 다음의 전달 함수를 이용한 제로-위상 유한 임펄스 응답 필터링이다.
Figure pct00016
c(n)은 0내지 0.25에 있는 계수이다.
이러한 타입의 필터링은 복잡성이 낮고 더욱이 지연없는 프로세싱을 가능하게 한다(현재 프레임의 종료 전에 프로세싱이 정지함). 이 제로 지연 덕분에, 필터링은 어택 그 자체를 수정하지 않고 어택 전에 고주파들을 감쇠시킬 수 있다.
이러한 타입의 필터링은 불연속성을 회피할 수 있고 필터링되지 않은 신호에서 필터링된 신호로 진보하는 방식으로 통과시킬 수 있다.
일 실시형태에 따르면, 감쇠 단계는, 감쇠 인자들을 필터링을 정의하는 계수들로 통합시킴으로써 스펙트럼 정형 필터링과 동시에 수행된다.
본 발명은 또한, 변환-기반 코더에 기초하여 발생된 디지털 오디오 신호에서 프리-에코들의 감쇠를 프로세싱하기 위한 디바이스를 목표로 하며, 디코더와 연관되는 이 디바이스는,
- 디코딩 신호에서 어택 포지션을 검출하기 위한 검출 모듈;
- 디코딩 신호에서 검출된 어택 포지션 앞의 프리-에코 구역을 결정하기 위한 결정 모듈;
- 프리-에코 구역의 서브블록 당 감쇠 인자들을, 적어도 어택이 검출되었던 프레임과 이전 프레임의 함수로서 계산하기 위한 모듈;
- 대응하는 감쇠 인자들만큼 프리-에코 구역의 서브블록들의 프리-에코를 감쇠시키기 위한 감쇠 모듈을 포함한다.
이 디바이스는, 검출된 어택 포지션까지 현재 프레임 상에서 프리-에코 구역의 스펙트럼 정형을 수행하기 위한 적응형 필터링 모듈을 더 포함한다.
본 발명은 상술된 바와 같은 디바이스를 포함하는 디지털 오디오 신호의 디코더를 목표로 한다.
마지막으로 본 발명은, 명령들이 프로세서에 의해 실행되는 경우, 설명된 것과 같은 감쇠 프로세싱 방법의 단계들을 구현하기 위한 코드 명령들을 포함하는 계산 프로그램을 목표로 한다.
마지막으로 본 발명은 프로세서에 의해 판독가능하고, 가능하다면 프로세싱 디바이스에 통합되고, 선택적으로 삭제가능하고, 상술된 바와 같은 프로세싱 방법을 구현하는 연산 프로그램을 저장하는 저장 매체에 관한 것이다.
본 발명의 다른 특징들 및 이점들은 비제한적인 예에 의해 단독으로 제공되는 다음 설명을 읽고 첨부된 도면들을 참고로 하여 더욱 명백하게 분명해질 것이다.
앞서 설명된 도 1은 종래 기술에 따른 변환-기반 코딩-디코딩 시스템을 도시한다.
앞서 설명된 도 2는 종래 기술에 따른 감쇠 방식이 수행되는 예시적인 디지털 오디오 신호를 도시한다.
앞서 설명된 도 3은 종래 기술에 따른 감쇠 방식이 수행되는 다른 예시적인 디지털 오디오 신호를 도시한다.
앞서 설명된 도 4는 종래 기술에 따른 감쇠 방식이 수행되는 또 다른 예시적인 디지털 오디오 신호를 도시한다.
도 5a 및 도 5b는 종래 기술에 따른 (도 4의 a) 및 d) 부분에 각각 대응함) 원래 신호의 스펙트로그램과 프리-에코들의 감쇠가 있는 신호의 스펙트로그램을 도시한다.
도 6은 디지털 오디오 신호 디코더에서 프리-에코들의 프로세싱 감쇠를 위한 디바이스와, 본 발명의 실시형태에 따른 프로세싱 방법에 의해 구현된 단계들을 도시한다.
도 7은 본 발명의 실시형태에 따라 구현된 스펙트럼 정형 필터의 주파수 응답을, 필터의 파라미터의 함수로서 도시한다.
도 8은 본 발명에 따른 프로세싱이 구현되었던 예시적인 디지털 오디오 신호를 도시한다.
도 9는 본 발명에 따른 프로세싱이 구현되는 도 4의 신호 d)에 대응하는 신호의 스펙트로그램을 도시한다.
도 10은 종래 기술에 따른 프리-에코들을 감쇠시키기 위한 방식이 구현되는 것에 대한 원점에서 고주파 성분들을 나타내는 예시적인 신호를 도시한다.
도 11은 본 발명에 따른 프로세싱이 적용될 필터링 레벨을 결정하기 위한 기준을 고려하지 않고 구현되었던 것에 대한 원점에서 고주파 성분들을 나타내는 도 11과 동일한 신호를 도시한다.
도 12는 본 발명에 따른 감쇠 프로세싱 디바이스의 하드웨어 예를 도시한다.
도 6을 참고하면, 프리-에코 감쇠 프로세싱 디바이스(600)가 설명된다. 일 실시예에서, 이 디바이스는, 예를 들어, 특허 출원 FR 08 56248에 설명된 방식과 같이 디코딩 신호에서 프리-에코들을 감쇠시키기 위한 방식을 구현한다. 또한, 이것은 프리-에코 구역의 스펙트럼 정형에 대한 필터링을 구현한다.
따라서, 디바이스(600)는 디코딩 오디오 신호의 어택 포지션을 검출하는 단계(Detect.)를 구현할 수 있는 검출 모듈(601)을 포함한다.
어택(온셋(onset)으로도 알려짐)은 신호의 고속 트랜지션이고 갑작스러운 동역학적인 (또는 진폭의) 변화이다. 이러한 타입의 신호들은 보다 일반적인 용어 "과도(transient)"로 지정될 수 있다. 이후에 그리고 일반성에 대한 손실 없이, 단지 용어 어택 또는 트랜지션은 과도들을 또한 지정하기 위해 사용될 것이다.
일 실시형태에서, 디코딩 신호
Figure pct00017
의 L개의 샘플들의 각각의 프레임이, 길이가 L'인 K개의 서브블록들로 분할되고, 예를 들면, 32㎑에서 L=640개의 샘플들(20ms)이 L'=80개의 샘플들(2.5ms)로 분할되고 K=8이다.
UIT-T 표준 G.718에서 설명된 것과 유사한 특수 저-지연 분석-합성 윈도우가 MDCT 변환의 분석 부분용으로 그리고 합성 부분용으로 사용된다. MDCT 합성 윈도우는, 종래의 사인곡선적 윈도우를 이용할 경우 640개의 샘플들과 대조적으로 단지 415개의 논-제로 샘플들을 포함한다. 이러한 실시형태의 변형예에서, 다른 분석/합성 윈도우들이 사용될 수 있고, 또는 긴 윈도우와 짧은 윈도우 사이의 변환들이 사용될 수 있다.
또한, MDCT 메모리
Figure pct00018
가 사용되며, 이는 추후의 신호를 시간적으로 축소시키는(temporal folding) 버전을 제공한다. 이 메모리는 또한, 길이 L'의 서브블록들로 분할되고, 사용된 MDCT 윈도우에 따라, 처음 K'의 서브블록들만이 유지되며, 여기서, K'는 사용된 윈도우에 의존하고- 예를 들어, 사인곡선적 윈도우의 경우 K'=4이다. 실제로, 도 1은 프리-에코가 어택이 위치되는 곳 앞에 있는 프레임에 영향을 주고, MDCT 메모리에 부분적으로 포함되는 추후의 프레임에서 어택을 검출하는 것이 바람직하다는 것을 도시한다.
프리-에코 감소는 여기서 몇 가지 파라미터들:
○길이 L의 현재 프레임에서 (프리-에코들을 잠재적으로 포함하는) 디코딩 신호,
○부가-중첩 전에 다음 프레임에서 부분적으로 디코딩 신호에 대응하는 MDCT 역변환의 메모리,
○이전 프레임(또는 하프-프레임)에서의 평균 에너지 레벨에 의존한다.
MDCT 메모리 내에 포함된 신호는 시간적인 축소를 포함한다(이는 후속 프레임이 수신되는 경우 보상됨)는 것을 주목할 수 있다. 이하 설명되는 바와 같이, MDCT 메모리는 본원에서 본질적으로 다음(추후) 프레임에서 신호의 서브블록 당 에너지를 추정하고, 이 추정이 추후의 프레임에서 완전히 디코딩 신호 대신 현재 프레임에서 이용가능한 MDCT 메모리를 이용하여 수행되는 경우, 이 추정이 프리-에코 검출 및 감소의 요구들에 대해 충분히 정확한 것으로 여겨진다.
현재 프레임과 MDCT 메모리는 길이(K+K')L'의 신호를 (K+K')개의 연속 서브블록들로 분할하여 형성한 연접 신호들로 볼 수 있다. 이러한 조건들에서, k번째 서브블록에서의 에너지는 k번째 서브블록이 현재 프레임에 위치되는 경우, 다음과 같이 정의되고:
Figure pct00019
서브블록이 MDCT 메모리에 있는 경우(이는 미래의 프레임에 대해 이용가능한 신호를 나타낸다) 다음과 같다:
Figure pct00020
현재 프레임의 서브블록들의 평균 에너지는 따라서 다음과 같이 획득된다:
Figure pct00021
현재 프레임의 제 2 부분의 서브블록들의 평균 에너지는 또한 다음과 같이 정의된다:
Figure pct00022
고려되는 서브블록들 중 하나에서, 비(ratio)
Figure pct00023
가 미리정의된 임계치를 초과하는 경우 프리-에코와 연관된 트랜지션이 검출된다. 본 발명의 본질을 변경하지 않는 다른 프리-에코 검출 기준이 가능하다.
또한, 어택의 포지션이 다음과 같이 정의되는 것으로 고려된다.
Figure pct00024
여기서 L로 제한하는 것은, MDCT 메모리가 전혀 수정되지 않는다는 것을 보장한다. 어택의 포지션의 더욱 정확한 추정을 위한 다른 방식들도 가능하다.
윈도우들의 스위칭을 이용하는 변형 실시형태들에서, 서브블록의 스케일부터 샘플 범위 이내의 일 포지션에 이르는 정확도로, 어택의 포지션을 제공하는 다른 방식들이 사용될 수 있다.
디바이스(600)는 또한, 검출된 어택 포지션 앞의 프리-에코 구역의 결정 단계(ZPE)를 구현하는 결정 모듈(602)을 포함한다.
에너지들
Figure pct00025
는 시간순으로 연접되는데, 먼저 디코딩 신호의 시간 엔벨로프 다음에 MDCT 변환의 메모리에 기초하여 추정된 다음 프레임의 신호의 엔벨로프가 이어진다. 이 연속 시간 엔벨로프의 함수와 이전 프레임의 평균 에너지들
Figure pct00026
Figure pct00027
의 함수로서, 비 R(k)가 충분히 높다면 프리-에코의 존재가 검출된다.
이와 같이, 프리-에코가 검출되었던 서브블록들이 프리-에코 구역을 구성하고, 이는 일반적으로 샘플들 n=0,...,pos-1, 즉, 현재 프레임의 시작부터 어택의 포지션(pos)까지 커버한다.
변형 실시형태들에서, 프리-에코 구역은 반드시 프레임의 시작부에서 시작하지 않고, 프리-에코의 길이의 추정에 관여할 수 있다. 윈도우들의 스위칭이 사용되는 경우, 프리-에코 구역은 사용된 윈도우들을 고려하기 위해 정의되어야 할 것이다.
디바이스(600)의 모듈(603)은 결정된 프리-에코 구역의 서브블록마다 감쇠 인자들을, 어택이 검출되었던 프레임과 이전 프레임의 함수로서 계산하는 단계를 구현한다.
특허 출원 FR 08 56248의 설명에 따르면, 감쇠들 g(k)가 서브블록마다 추정된다.
서브블록마다의 감쇠 인자 g(k)는 예를 들어, 최고 에너지의 서브블록의 에너지 대 당해 k번째 서브블록의 에너지의 비 R(k)의 함수로서 계산된다.
Figure pct00028
f는 0과 1 사이의 값들을 가진 감소 함수이다. 인자 g(k)의 다른 정의도 가능한데, 예를 들어 En(k)와 En(k-1)의 함수로서 정의될 수 있다.
최대 에너지에 대한 에너지의 변화가 작다면, 감쇠는 필수적이지 않다. 그러면, 인자는 감쇠를 억제하는 감쇠값, 즉 1로 고정된다. 그렇지 않으면, 감쇠 인자는 0과 1사이이다.
이러한 감쇠들은 이전 프레임의 평균 에너지의 함수로서 제한된다.
서브블록이 프로세싱될 경우, 프로세싱될 서브블록 앞의 세그먼트의 평균 에너지와 정확하게 동일한 에너지를 획득하기 위해서 인자 limg(k)의 한계 값을 계산하는 것이 가능하다. 물론, 이 값은 최대치가 1로 제한되는데, 여기서 우리는 감쇠 값들에 관심이 있기 때문이다. 더 정확하게는 다음 식과 같다.
이와 같이 획득된 값 limg(k)는 서브블록 감쇠 인자의 최종 계산의 하한치가 된다:
Figure pct00030
이후, 서브블록마다 결정된 감쇠 인자들 g(k)는 샘플마다 적용된 평활화 함수에 의해 평활화되어 블록들의 경계들에서 감쇠 계수의 갑작스러운 변동을 회피한다.
샘플 당 이득은 먼저 구분적 상수 함수로서 정의된다:
Figure pct00031
이 평활화 함수는 예를 들어 다음 식에 따라 평활화된다:
Figure pct00032
관례상,
Figure pct00033
는 이전 서브블록의 최종 샘플에 대해 얻어진 최종 감쇠 인자이고, α는 평활화 계수이며, 통상적으로 α는 0.85이다.
다른 평활화 함수들도 가능하다.
도 6의 디바이스(600)의 모듈(604)은, 획득된 감쇠 인자들에 의해, 프리-에코 구역의 서브블록들에서 감쇠(Att.)를 구현한다.
이와 같이, 일단 인자들 gpre(n)이 계산되었다면, 각각의 샘플을 대응하는 인자로 승산함으로써, 프리-에코 감쇠가 현재 프레임의 재구성된 신호, xrec(n)에 대해 실시된다:
Figure pct00034
xrec ,g(n)은 디코딩되고 프리-에코 감소를 위해 포스트 프로세싱된 신호이다.
디바이스(600)는, 검출된 어택 포지션까지, 디코딩 신호의 현재 프레임 상에서 프리-에코 구역의 스펙트럼 정형을 위한 필터링을 적용하는 단계(F)를 수행할 수 있는 필터링 모듈(606)을 포함한다.
통상적으로, 사용된 스펙트럼 정형 필터는 선형 필터이다. 이득을 승산하는 동작 또한 선형 동작이기 때문에 그 순서는 뒤집어질 수 있다: 프리-에코 구역의 스펙트럼 정형을 위한 필터링을 먼저 수행한 후 프리-에코 구역의 각각의 샘플을 대응하는 인자로 승산함으로써 프리-에코 감쇠를 수행하는 것이 가능하다.
예시적인 실시형태에서, 프리-에코 구역 내 고주파들을 감쇠시키기 위해 사용된 필터는 3개의 계수와 제로 위상의 전달 함수
Figure pct00035
를 가진 FIR 필터(finite impulse response filter)이고, c(n)은 0과 0.25 사이에 존재하는 값이고, 여기서
Figure pct00036
은 스펙트럼 정형 필터의 계수들이다; 이 필터는 차분 방정식(difference equation)으로 구현된다:
Figure pct00037
예를 들어, 구역 n=5,...,pos-5에 걸쳐 c(n)=0.25이다.
이 필터의 주파수 응답이 계수 c(n)의 함수로서 도 7에 도시되며, c(n)=0.05, 0.1, 0.15, 0.2 및 0.25이다. 이 필터를 사용하는 동기는 낮은 복잡성, 제로 위상이고 따라서 제로 지연(현재 프레임의 종료 전에 프로세싱이 정지하기 때문에 가능함)뿐만 아니라 이 필터에 대해 요구되는 저역통과 특징들에 잘 대응하는 주파수 응답이다.
이 필터의 적용은, 프리-에코의 시간적 감쇠는 통상적으로 어택의 포지션(예를 들어, 16개의 샘플들의 마진)까지 확장되지 않는 구역으로 제한된다는 사실을 보상할 수 있는 반면, 전달 함수
Figure pct00038
에 의해 정의된 바와 같은 스펙트럼 정형 필터링이 어택의 포지션까지 적용될 수 있으며, 선택적으로 몇 개의 샘플들이 필터의 계수를 보간하기 위해 있다.
필터링되지 않은 신호에서 필터링된 신호로 통과시키고 불연속성을 방지하기 위해서는 점진적인 방식으로 필터링을 도입하는 것이 바람직하다. 제안된 FIR 필터는, 그 계수들의 변경 또는 느린 보간에 의해, 필터링되지 않은 도메인으로부터 필터링된 도메인으로 그리고 그 반대로 서서히 통과시키는 것을 용이하게 한다. 예를 들어, 어택의 포지션이 pos=16인 경우, 프리-에코 구역(n=0,...,pos-1)에서의 16개 샘플들의 필터링은 다음 방식으로 수행될 수 있다:
Figure pct00039
Figure pct00040
제로 지연에 의해, 필터
Figure pct00041
는 어택 자체를 변경하지 않고 어택 전에 고주파들을 감쇠시킬 수 있다는 것이 관찰된다.
본원에 설명된 바와 같은 프로세싱이 실시되는 예시적인 디지털 오디오 신호가 도 8의 d) 부분에 설명된다. 이 도면의 a)부분, b)부분, c)부분은 이전에 도 4에 관하여 설명된 것과 동일한 신호들을 도시한다. d)부분은 본 발명에 따른 필터링의 구현에 의해 다르다. 이와 같이, 성가신 고주파 컴포넌트가 크게 감소되므로, 필터링 후 디코딩 신호가 도 4의 d)부분에 설명된 신호보다 더 양호한 품질이라는 것을 주목할 수 있다.
이 필터링된 신호를 나타내는 스펙트로그램이 도 9에 도시된다. 어택 전 성가신 고주파들의 감쇠가, 정형 필터링을 하지 않고 동일한 신호를 나타내는 도 5b에 대하여 명백하게 관찰된다. 이후, 어택은 디코딩 시에 더 예리해질 수 있다.
물론, 필터
Figure pct00042
를 대체할 다른 형태의 스펙트럼 정형 필터가 구상될 수 있다. 예를 들어, 상이한 차수의 FIR 필터를 이용하거나 또는 상이한 계수를 갖는 FIR 필터를 이용하는 것이 가능하다. 대안으로, 스펙트럼 정형 필터는 무한 임펄스 응답(IIR)을 가질 수 있다. 더욱이, 스펙트럼 정형은 저역통과 필터링과는 상이할 수 있고, 예를 들어, 대역통과 필터가 구현될 수 있다.
형태
Figure pct00043
의, 차수 1의 필터가 또한 본 발명의 실시형태에 사용될 수 있다.
특정 실시형태에서, 설명된 방법에 따라 구현된 필터링은 적응형 필터링이다. 이와 같이, 이것이 디코딩 오디오 신호의 특징들에 적응될 수 있다.
이 구현에서, 프리-에코 구역에 적용될 필터링에 관한 결정 파라미터(P)를 계산하는 단계가 도 6의 계산 모듈(605)에서 구현된다.
실제로, 예를 들어, 도 10에 도시된 것과 같은 경우가 존재하며, 여기서 프리-에코 구역에서 이러한 필터링을 적용하지 않는 것이 바람직할 수 있다.
실제로, 도 10에 도시된 드문 경우에, a)부분 고주파들이 코딩될 신호에 이미 존재한다. 이 경우, 고주파들의 감쇠는 가청 저하의 원인이 될 수 있고 따라서 이는 반드시 방지되어야 한다. 이 예시적인 신호에서, 어택은 앞의 예들에서보다는 덜 급격하다는 것이 관찰된다.
그런 다음, 고주파들을 감쇠시킴으로써(또는 감쇠시키기 않음으로써), 프리-에코를 포함하는 신호의 구역을 스펙트럼식으로 정형할 필요가 있는지 여부를 결정할 수 있게 하는 적어도 하나의 파라미터를 결정하는 것이 유리하다.
예시적인 실시형태에서, 이 결정 파라미터는 프리-에코 구역 내 고주파 성분들의 존재를 나타낸다.
이 파라미터는 예를 들어 어택의 강도의 측정(갑작스러운지 여부)일 수 있다. 어택이 서브블록 번호 k에 위치되는 경우, 파라미터는 다음과 같이 계산될 수 있다.
Figure pct00044
k는 서브블록 수이고 En(k)는 k번째 서브블록의 에너지이다.
실험적인 셋팅에 따르면, 이 예시적인 실시형태에서, P>=32는 갑작스러운 어택(매우 임펄스성)을 나타낸다.
어택의 강도의 측정은, 어택 앞의 서브블록 g(k-1)에 대해 결정된 감쇠도 고려함으로써 보충될 수 있다. 어택은, 이 감쇠가 감지가능한 경우 예를 들어, g(k-1)≤0.5인 경우, 갑작스러운 것으로 고려될 수 있다. 이는, 프리-에코 구역 내 에너지가 프리-에코 때문에 상당히 증가되고(2배를 초과하여), 따라서 갑작스러운 어택을 또한 시그널링한다는 것을 보여준다.
P<32 이고 g(k-1)>0.5인 경우, k는 어택의 시작을 포함하는 서브블록의 인덱스이고, 필터링은 불필요하다. 실제로, g(k-1)>0.5, limg(k)>0.5인 경우, 프리-에코 구역이 이전 프레임의 에너지와 필적할만한 에너지를 갖는 것을 의미하고 프리-에코를 생성하는 어택이 갑작스러운 것이 아니기 때문에, 성가신 스퓨리어스 컴포넌트를 가질 위험은 낮다.
따라서, 조건들(P<32 그리고 g(k-1)>0.5)인 실시형태에서, 프리-에코 구역에서 필터링이 수행되지 않을 것이다.
(g(k-1)≤0.5 또는 P>32)인 다른 경우에는, 현재 프레임부터 시작하여 어택 포지션의 포지션(pos)까지 본 발명에 따른 스펙트럼 정형 필터가 적용된다.
상기 설명된 예시적인 실시형태에서, 본 발명에 따른 필터링에 의해 프리-에코 구역의 스펙트럼 정형은 파라미터 P의 함수 그리고 감쇠 값들의 함수로서 적응적이다. 이와 같이, 필터링은 계수들[0.25, 0.5, 0.25]을 이용하여 적용되거나, 계수들[0,1,0]을 이용하여 비활성화된다.
이후, 미리정의된 세트의 값들로 제한된 불연속적인 방식으로 필터링 계수들의 적응이 수행된다.
따라서, 필터링 계수들의 적응(고주파들의 감쇠 레벨을 적응시킬 수 있음)은 파라미터들 P와 g(k-1)과 같은 어택의 강도를 측정하는 결정 파라미터들에 의해 결정된다.
이 경우, 이것은, 가능한 값들의 2개의 세트([0.25, 0.5, 0.25] 또는 [0,1,0])가 뒤따르는 불연속 방식으로 필터의 계수들의 적응을 수반한다. 계수들[0,1,0]의 세트는 필터링의 비활성화에 해당한다는 것을 주목할 수 있다.
이러한 2개의 필터들 간의 점진적인 트랜지션은 또한, 예를 들어, 계수 [0.05,0.9,0.05],[0.1,0.8,0.1],[0.15,0.7,0.15] 및 [0.2,0.6,0.2]를 갖는 중간 필터들을 이용함으로써 수행될 수 있다.
이 경우, 느린 변화(또는 보간)가 고려되는 경우라면, 이것은 가능한 값들의 몇 개의 세트들이 뒤따르는 불연속 방식으로 필터의 계수들의 적응을 수반한다.
변형 실시형태들에서, 다른 보간 방식들이 사용될 수 있다.
예를 들어, 16<P<32인 경우, 필터링은, 예를 들어 중간 필터를 이용함으로써 c(n)=f(p)에 의해 한층 더 정교하게 적응될 수 있고, c(n)=[0.15,0.7,0.15]이다. c(n)은 또한, 예를 들어 식
Figure pct00045
를 이용하여 P의 함수로서 연속적인 방식으로 계산될 수 있다.
이 경우, 이는 가능한 값들에 따라 연속적인 방식으로 필터의 계수들의 적응을 수반하고, 여기서 c(n)은 인터벌이 [0,0.25]이다.
예를 들어, 필터의 선택과 적응의 결정 시에, 현재 프레임의 그리고/또는 이전 프레임의 프리-에코 구역의 디코딩 신호의 영교차 레이트와 같은 다른 결정 파라미터들이 또한 사용될 수 있다. 영교차 레이트는, 예시로서, 구역 n=0,...,L-1을 고려한다면, 다음 방식으로 계산될 수 있다.
Figure pct00046
여기서,
Figure pct00047
이다.
실제로, 이전 프레임(따라서 프리-에코가 없음)에서의 높은 영교차 레이트 zc는 신호에서 고주파들의 존재를 시그널링한다. 이 경우, 예를 들어, 이전 프레임 상에서 zc > L/2인 경우, 필터링
Figure pct00048
를 적용하지 않는 것이 바람직하다.
연속 컴포넌트의 바이어스를 제거하기 위해서, 디코딩 신호의 프리필터링은 또한 영교차 레이트를 계산하기 전에 가능하고, 그렇지 않으면 추정된 도함수
Figure pct00049
의 영교차들의 수가 사용될 수 있다.
변형예에서, 결정을 돕기 위해 신호의 스펙트럼 분석이 또한 수행될 수 있다. 예를 들어, MDCT 코딩/디코딩으로부터 비롯된 MDCT 도메인의 스펙트럼 엔벨로프가, 사용될 필터의 선택 시 활용될 수 있지만, 이러한 변형예는, MDCT 분석/합성 윈도우들은 어택 전의 신호의 로컬 통계를 위해 윈도우의 길이에 걸쳐 안정적으로 유지되기에 충분히 짧다는 것을 가정한다.
대안적으로, 프리-에코 구역과 과거의 프레임의 신호를
Figure pct00050
와 같은 고역 보상 필터를 통과시켜 필터링하는 것이 가능할 것이며, 예를 들어, c(n)=0.25이고, 이후 c(n)의 값이, 프리-에코 구역 내 그리고 과거 프레임 상의 필터링된 신호의 평균 에너지가 가능한 한 가까워지는 방식으로 선택될 것이다; c(n)은 선택은, 프리-에코 구역의 그리고 과거 프레임의 고역-통과 필터링 후 도 7에 도시된 가능한 값들의 제한된 세트에 걸쳐 또는 신호의 에너지비(또는 에너지의 제곱근과 같은 동등한 수량)에 기초하여 이루어질 수 있을 것이다.
고역 통과 필터링은 또한 신호
Figure pct00051
과 저역 통과 필터
Figure pct00052
에 의해 필터링된 신호 간의 차를 계산함으로써 대안적인 방식으로 구현될 수 있다는 것을 주목한다.
다른 변형예에서, 정형 필터링이 타입
Figure pct00053
인 경우, 선형 예측(LPC(Linear Predictive Coding))에 의한 분석으로부터 비롯된 예측 계수 -r(1)/r(0)의 함수로서 c(n)의 값을 프리-에코 구역의 신호 그리고 과거 프레임의 신호의 차수 1로 고정하는 것이 바람직할 것이다.
이러한 모든 앞의 변형예들(영교차 레이트, MDCT 스펙트럼 엔벨로프, 고역통과 필터링, LPC 분석)에서, 프리-에코 구역에 적용될 필터링에 관한 결정 파라미터는 프리-에코 구역의 신호의 그리고/또는 프리-에코 구역 앞의 신호의 스펙트럼 분포 분석에 기초한다; 프리-에코 구역 앞의 신호가 이미 많은 고주파들을 포함하는 경우 또는 프리-에코 구역의 신호의 그리고 프리-에코 구역 앞의 신호의 고주파들의 양이 실질적으로 동일한 경우, 본 발명에 따른 필터링이 불필요하고 심지어 약간의 저하를 유발할 수 있다. 이러한 경우, c(n)을 0에 또는 0에 가까운 낮은 값으로 고정함으로써 본 발명에 따른 필터링을 비활성시키거나 감쇠시킬 필요가 있다.
본 발명의 변형예에서, 감쇠와 필터링 단계 사이에 순서를 뒤집는 것이 가능할 것이다.
이것은 실제로, 스펙트럼 정형 필터링(F)이 감쇠(Att.) 전에 수행된다는 것일 수 있다. 따라서, 현재 프레임의 재구성된 신호의 프리-에코 구역의 샘플들의 적응형 필터링이 수행된 후, 이후, 이러한 샘플들은 각각의 샘플을 이전에 계산된 대응 감쇠 인자로 승산함으로써 가중된다:
Figure pct00054
"조인트" 필터 계수들의 세트를 정의함으로써 진폭들의 감쇠가 또한 결합(또는 통합)될 수 있는데, 예를 들어, 샘플 n의 경우 필터가 계수들
Figure pct00055
을 갖고 감쇠 계수가 g(n)인 경우, 필터
Figure pct00056
가 직접적으로 사용될 수 있다.
도 11은 필터링 적응을 렌더링하는 장점을 나타낸다. 이는, 도 10과 동일한 신호들의 a), b) 및 c) 부분들을 도시하며, 고주파 성분들이 코딩될 신호에 이미 존재하는 경우 d) 부분에 나타낸 비적응형 필터링의 구현이 불필요하게 신호를 수정한다는 사실을 나타낸다. 샘플(640) 전방으로 고주파들이 불필요하게 감쇠되고, 이는 약간의 품질 저하를 초래할 수 있다는 것이 관찰된다. 상술된 바와 같은 적응형 필터링의 사용은 이러한 조건들에서 필터링을 억제하거나 또는 감쇠시키고, 코딩될 신호에 이미 존재하는 고주파들을 제거하지 않고 따라서 필터링으로 인해 발생할 수 있는 저하를 방지하는 것을 가능하게 한다.
도 6으로 돌아가면, 설명된 바와 같은 감쇠 프로세싱 디바이스(600)는 본원에서, 본 발명에 따라, 신호 S를 수신하는 역양자화(Q-1) 모듈(610), 역변환(MDCT-1) 모듈(620), 도 1을 참고로 하여 설명된 바와 같이 부가/중첩(add/lap)에 의해 신호를 재구성하고 재구성된 신호를 감쇠 프로세싱 디바이스로 전달하기 위한 모듈(630)을 포함하는 디코더에 포함된다.
디바이스(600)의 출력에서, 프리-에코 감쇠가 수행되었던 프로세싱된 신호(Sa)가 제공된다. 수행된 프로세싱은, 경우에 따라, 프리-에코 구역에서, 고주파 성분들의 감쇠에 의해 프리-에코 감쇠를 개선할 수 있게 한다.
본 발명에 따른 감쇠 프로세싱 디바이스의 예시적인 실시형태가 도 12를 참고로 하여 이제 설명된다.
본 발명의 의미 내에서 하드웨어-방식의 본 디바이스(100)는 통상적으로 스토리지 및/또는 워크 메모리뿐만 아니라 도 6과 관련하여 설명된 바와 같은 감쇠 프로세싱 방법의 구현을 위해 필요한 데이터 모두를 저장하기 위한 수단으로 구실을 하는 앞서 언급된 버퍼 메모리 MEM을 포함하는 메모리 블록 BM과 협력하는 프로세서 μP를 포함한다. 본 디바이스는 디지털 신호(Se)의 연속적 프레임들을 입력으로서 수신하고 경우에 따라서는 프리-에코 감쇠 및 스펙트럼 정형 필터링으로 재구성된 신호 Sa를 전달한다.
메모리 블록 BM은, 코드 명령들이 디바이스의 프로세서 μP에 의해 실행되는 경우, 본 발명에 따른 방법의 단계들 특히, 디코딩 신호의 어택 포지션을 검출하는 단계, 디코딩 신호에서 검출된 어택 포지션 앞에 있는 프리-에코 구역을 결정하는 단계, 프리-에코 구역의 서브블록당 감쇠 인자들을 어택이 검출되었던 프레임과 이전 프레임의 함수로서 계산하는 단계, 대응하는 감쇠 인자들에 의해 프리-에코 구역의 서브블록들의 프리-에코를 감쇠시키는 단계 및 또한, 어택의 검출 위치까지 현재 프레임 상의 프리-에코 구역의 스펙트럼 정형을 위한 필터링을 적용하는 단계를 구현하기 위한 이러한 코드 명령들을 포함하는 계산 프로그램을 포함한다. 도 6은 이러한 계산 프로그램의 알고리즘을 도시할 수 있다.
본 발명에 따른 이 감쇠 디바이스는 독립적이거나 디지털 신호 디코더에 통합될 수 있다.

Claims (13)

  1. 변환-기반 코딩에 기초하여 발생된 디지털 오디오 신호에서 프리-에코의 감쇠를 프로세싱하는 방법으로서, 디코딩 시에, 상기 방법은
    -디코딩 신호의 어택 포지션을 검출하는 단계(Detect.);
    -상기 디코딩 신호에서 검출된 어택 포지션 앞의 프리-에코 구역을 결정하는 단계(ZPE);
    -상기 프리-에코 구역의 서브블록당 감쇠 인자들을, 적어도, 상기 어택이 검출되었던 프레임과 이전 프레임의 함수로서 계산하는 단계(F.Att.);
    -대응하는 감쇠 인자들에 의해 상기 프리-에코 구역의 서브블록들에서 프리-에코를 감쇠시키는 단계(Att.)를 포함하고;
    상기 방법은,
    검출된 상기 어택 포지션까지 현재 프레임 상에서 상기 프리-에코 구역의 스펙트럼 정형의 적응형 필터링을 적용하는 단계(F)를 더 포함하는, 방법.
  2. 제 1 항에 있어서,
    상기 프리-에코 구역에 적용될 상기 필터링에 관한 적어도 하나의 결정 파라미터를 계산하는 단계와 상기 적어도 하나의 결정 파라미터의 함수로서 상기 필터링의 계수들을 적응시키는 단계를 더 포함하는, 방법.
  3. 제 2 항에 있어서,
    상기 적어도 하나의 결정 파라미터는 검출된 어택의 강도의 측정인, 방법.
  4. 제 2 항에 있어서,
    상기 적어도 하나의 결정 파라미터는 상기 어택 포지션을 포함하는 서브블록 앞의 서브블록의 상기 감쇠 인자의 값인, 방법.
  5. 제 2 항에 있어서,
    상기 적어도 하나의 결정 파라미터는 상기 프리-에코 구역의 신호의 그리고/또는 상기 프리-에코 구역 앞의 신호의 스펙트럼 분포 분석에 기초하는, 방법.
  6. 제 3 항에 있어서,
    상기 검출된 어택의 강도의 상기 측정은
    Figure pct00057
    의 형태이고, k는 상기 어택이 검출되었던 상기 서브블록의 수이고 EN(k)는 k번째 서브블록의 에너지인, 방법.
  7. 제 2 항에 있어서,
    상기 필터링의 상기 계수들을 적응시키는 단계는 적어도 하나의 결정 파라미터를 미리결정된 임계치와 비교하는 함수로서 개별 방식으로 수행되는, 방법.
  8. 제 2 항에 있어서,
    상기 필터링의 상기 계수들을 적응시키는 단계는 상기 적어도 하나의 결정 파라미터의 함수로서 연속 방식으로 수행되는, 방법.
  9. 제 1 항에 있어서,
    상기 필터링은 전달 함수:
    Figure pct00058
    를 이용한 제로-위상 유한 임펄스 응답 필터링이고, c(n)은 0과 0.25 사이에 있는 계수인, 방법.
  10. 제 1 항에 있어서,
    상기 감쇠시키는 단계는 상기 감쇠 인자들을 상기 필터링을 정의하는 계수들에 통합시킴으로써 상기 스펙트럼 정형 필터링과 동일한 시각에 수행되는, 방법.
  11. 변환-기반 코더에 기초하여 발생된 디지털 오디오 신호에서 프리-에코의 감쇠를 프로세싱하기 위한 디바이스로서,
    디코더와 연관되는 상기 디바이스는
    -디코딩 신호에서 어택 포지션을 검출하기 위한 검출 모듈(601);
    -상기 디코딩 신호에서 검출된 상기 어택 포지션 앞의 프리-에코 구역을 결정하기 위한 결정 모듈(602);
    -상기 프리-에코 구역의 서브블록당 감쇠 인자들을, 적어도, 상기 어택이 검출되었던 프레임과 상기 이전 프레임의 함수로서 계산하기 위한 계산 모듈(603);
    -대응하는 감쇠 인자들에 의해 상기 프리-에코 구역의 서브블록들의 상기 프리-에코들을 감쇠시키기 위한 감쇠 모듈(604)을 포함하고,
    상기 디바이스는
    검출된 상기 어택 포지션까지 현재 프레임 상에서 상기 프리-에코 구역의 스펙트럼 정형을 수행하기 위한 적응형 필터링 모듈(606)을 더 포함하는, 디바이스.
  12. 제 11 항에 따른 디바이스를 포함하는, 디지털 오디오 신호의 디코더.
  13. 프로세서에 의해 실행될 경우, 제 1 항 내지 제 10 항 중 어느 한 항에 따른 방법의 단계들을 구현하기 위한 코드 명령들을 포함하는, 계산 프로그램.
KR1020147036551A 2012-06-29 2013-06-28 디지털 오디오 신호에서 유효 프리-에코 감쇠 KR102082156B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1256285 2012-06-29
FR1256285A FR2992766A1 (fr) 2012-06-29 2012-06-29 Attenuation efficace de pre-echos dans un signal audionumerique
PCT/FR2013/051517 WO2014001730A1 (fr) 2012-06-29 2013-06-28 Atténuation efficace de pré-échos dans un signal audionumérique

Publications (2)

Publication Number Publication Date
KR20150052812A true KR20150052812A (ko) 2015-05-14
KR102082156B1 KR102082156B1 (ko) 2020-04-14

Family

ID=47191858

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147036551A KR102082156B1 (ko) 2012-06-29 2013-06-28 디지털 오디오 신호에서 유효 프리-에코 감쇠

Country Status (12)

Country Link
US (1) US9489964B2 (ko)
EP (1) EP2867893B1 (ko)
JP (1) JP6271531B2 (ko)
KR (1) KR102082156B1 (ko)
CN (1) CN104395958B (ko)
BR (1) BR112014032587B1 (ko)
CA (1) CA2874965C (ko)
ES (1) ES2711132T3 (ko)
FR (1) FR2992766A1 (ko)
MX (1) MX349600B (ko)
RU (1) RU2607418C2 (ko)
WO (1) WO2014001730A1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2992766A1 (fr) * 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
FR3023646A1 (fr) * 2014-07-11 2016-01-15 Orange Mise a jour des etats d'un post-traitement a une frequence d'echantillonnage variable selon la trame
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique
EP3382701A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3483880A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110076936A (ko) * 2008-09-17 2011-07-06 프랑스 텔레콤 디지털 오디오 신호에서의 프리-에코 감쇠

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2674710B1 (fr) * 1991-03-27 1994-11-04 France Telecom Procede et systeme de traitement des preechos d'un signal audio-numerique code par transformee frequentielle.
US5731767A (en) * 1994-02-04 1998-03-24 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JPH08223049A (ja) * 1995-02-14 1996-08-30 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
JP3307138B2 (ja) * 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
JP4581190B2 (ja) * 2000-06-19 2010-11-17 ヤマハ株式会社 音楽信号の時間軸圧伸方法及び装置
WO2002049001A1 (fr) * 2000-12-14 2002-06-20 Sony Corporation Dispositif d'extraction d'informations
US7561688B2 (en) * 2001-11-16 2009-07-14 Koninklike Philips Electronics N.V. Embedding supplementary data in an information signal
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US7443978B2 (en) * 2003-09-04 2008-10-28 Kabushiki Kaisha Toshiba Method and apparatus for audio coding with noise suppression
EP1542226A1 (en) * 2003-12-11 2005-06-15 Deutsche Thomson-Brandt Gmbh Method and apparatus for transmitting watermark data bits using a spread spectrum, and for regaining watermark data bits embedded in a spread spectrum
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
DE102006047197B3 (de) * 2006-07-31 2008-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
US8463603B2 (en) * 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
CN101826327B (zh) * 2009-03-03 2013-06-05 中兴通讯股份有限公司 一种基于时域掩蔽的瞬态判决方法及设备
JP5287546B2 (ja) * 2009-06-29 2013-09-11 富士通株式会社 情報処理装置およびプログラム
KR20140085453A (ko) * 2011-10-27 2014-07-07 엘지전자 주식회사 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치
FR2992766A1 (fr) * 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
FR3000328A1 (fr) * 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110076936A (ko) * 2008-09-17 2011-07-06 프랑스 텔레콤 디지털 오디오 신호에서의 프리-에코 감쇠

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729. ITU-T Recommendation G.729.1. 2006.05.* *

Also Published As

Publication number Publication date
BR112014032587A2 (pt) 2017-06-27
CN104395958B (zh) 2017-09-05
KR102082156B1 (ko) 2020-04-14
MX349600B (es) 2017-08-03
CA2874965C (fr) 2021-01-19
FR2992766A1 (fr) 2014-01-03
BR112014032587B1 (pt) 2022-08-09
ES2711132T3 (es) 2019-04-30
US20150170668A1 (en) 2015-06-18
RU2607418C2 (ru) 2017-01-10
EP2867893B1 (fr) 2018-11-28
EP2867893A1 (fr) 2015-05-06
JP2015522847A (ja) 2015-08-06
CN104395958A (zh) 2015-03-04
MX2014015065A (es) 2015-02-17
RU2015102814A (ru) 2016-08-20
CA2874965A1 (fr) 2014-01-03
US9489964B2 (en) 2016-11-08
WO2014001730A1 (fr) 2014-01-03
JP6271531B2 (ja) 2018-01-31

Similar Documents

Publication Publication Date Title
KR102082156B1 (ko) 디지털 오디오 신호에서 유효 프리-에코 감쇠
RU2608878C1 (ru) Регулировка уровня во временной области для декодирования или кодирования аудиосигналов
US10170126B2 (en) Effective attenuation of pre-echoes in a digital audio signal
EP3285255A1 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
JP7008756B2 (ja) デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
JP2020052414A (ja) ハーモニックフィルタツールのハーモニック依存制御
EP2980799A1 (en) Apparatus and method for processing an audio signal using a harmonic post-filter
CN110832581A (zh) 用于使用瞬态位置检测后处理音频信号的装置
KR101655913B1 (ko) 디지털 오디오 신호에서의 프리-에코 감쇠
RU2742739C1 (ru) Выбор задержки основного тона
WO2018177613A1 (en) Apparatus and method for post-processing an audio signal using prediction based shaping

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right