KR102000227B1 - 디지털 오디오 신호의 프리에코 판별 및 감쇠 - Google Patents

디지털 오디오 신호의 프리에코 판별 및 감쇠 Download PDF

Info

Publication number
KR102000227B1
KR102000227B1 KR1020177009719A KR20177009719A KR102000227B1 KR 102000227 B1 KR102000227 B1 KR 102000227B1 KR 1020177009719 A KR1020177009719 A KR 1020177009719A KR 20177009719 A KR20177009719 A KR 20177009719A KR 102000227 B1 KR102000227 B1 KR 102000227B1
Authority
KR
South Korea
Prior art keywords
sub
echo
block
attenuation
signal
Prior art date
Application number
KR1020177009719A
Other languages
English (en)
Other versions
KR20170055515A (ko
Inventor
발라즈 코베시
스테판 라고트
Original Assignee
오렌지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오렌지 filed Critical 오렌지
Publication of KR20170055515A publication Critical patent/KR20170055515A/ko
Application granted granted Critical
Publication of KR102000227B1 publication Critical patent/KR102000227B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

본 발명은 변환 코딩으로부터 발생한 디지털 오디오 신호의 프리에코를 판별 및 감쇠하기 위한 방법에 관한 것이다. 상기 방법은 하기의 단계들을 포함한다: 서브블록으로 분해된 현재 프레임에 대해, 저에너지 서브블록은 변이 또는 시작부가 검출(E601)되는 서브블록에 선행하고, 프리에코 감쇠 처리가 수행(E607)되는 프리에코 구역을 결정한다(E602). 상기 방법은, 시작부가 현재 프레임의 서브블록으로부터 검출되는 경우에, 시작부가 검출되는 서브블록에 선행하는 현재 프레임의 적어도 2개의 서브블록에 대한 에너지 선두 계수를 연산하는 단계 E603; 상기 선두 계수를 사전규정된 임계치와 비교하는 단계 E604; 및 연산된 선두 계수가 사전규정된 임계치 미만인 경우에 프리에코 구역에서의 프리에코 감쇠 처리를 금지하는 단계 E602를 포함하도록 한다. 본 발명은 또한 개시된 방법으로부터의 단계들을 구현하는 판별 및 감쇠 장치, 및 이와 같은 장치를 포함하는 디코더에 관한 것이다.

Description

디지털 오디오 신호의 프리에코 판별 및 감쇠{DISCRIMINATION AND ATTENUATION OF PRE-ECHOES IN A DIGITAL AUDIO SIGNAL}
본 발명은 디지털 오디오 신호의 디코딩(decoding)시에 프리에코(pre-echo)의 판별 및 감쇠 처리를 위한 방법 및 장치에 관한 것이다.
예를 들어 고정 네트워크이든 이동 네트워크이든 전기통신 네트워크를 통한 디지털 오디오 신호의 전송을 위해, 또는 신호의 저장을 위해, 일반적으로 선형 예측 시간 코딩 또는 변환 주파수 코딩 유형인 코딩 시스템을 구현하는 압축(또는 소스 코딩) 프로세스가 사용된다.
따라서, 본 발명의 대상인 방법 및 장치의 응용 분야는 사운드 신호, 특히 주파수 변환에 의해 코딩(coding)된 디지털 오디오 신호의 압축이다.
도 1은 종래 기술에 따른 오버랩/가산(overlap/addition) 분석-합성을 포함하는 변환에 의해 디지털 오디오 신호의 코딩 및 디코딩의 이론적인 블록도를 예시로서 나타낸다.
타악기(percussion)와 같은 일부 음악 시퀀스와, 파열음(/k/, /t/,...)과 같은 특정 음성 세그먼트(speech segment)는 몇몇 샘플들의 공간에 있어서의 신호의 동적 범위의 매우 강한 변화 및 매우 급속한 변이(transition)에 의해 반영되는 매우 급작스런 시작부에 의해 특징지어진다. 변이의 하나의 예가 샘플 410에 기초하여 도 1에 제공되어 있다.
코딩/디코딩 처리를 위해, 입력 신호는 그 경계가 도 1에서 수직 점선으로 나타나는 길이 L의 샘플의 블록으로 분해된다. 입력 신호는 x(n)으로 표시되고, n은 샘플의 지수이다. 연속적인 블록(또는 프레임)으로의 분해는 블록 X N(n) = [x(N.L) ... x(N.L+L-1)] = [xN(0) ... xN(L-1)]의 정의를 도출하고, N은 블록(또는 프레임) 지수이고, L은 프레임의 길이이다. 도 1에서, L=160개의 샘플이 존재한다. 수정 이산 코사인 변환(modified discrete cosine transform; MDCT)의 경우에, 2개의 블록 X N(n) 및 X N +1(n)이 함께 분석되어, 지수 N의 프레임과 연관된 변환 계수의 블록을 제공하고, 분석 윈도우는 정현파 형태이다.
변환 코딩에 의해 적용되는, 프레임이라고도 불리는 블록으로의 분할은 사운드 신호와 완전히 독립적이고, 따라서 변이는 분석 윈도우의 임의의 지점에서 나타날 수 있다. 이제, 변환 디코딩 후에, 재구성된 신호는 양자화(Q)-역 양자화(Q-1) 작동에 의해 발생하는 "잡음(noise)"(또는 왜곡)에 의해 영향을 받는다. 이와 같은 코딩 잡음은 변환된 블록의 모든 시간적 서포트에 걸쳐, 즉 (L개의 샘플들의 오버랩으로) 샘플의 길이 2L의 윈도우의 전체 길이에 걸쳐, 비교적 균일하게 시간적으로 분포된다. 코딩 잡음의 에너지는 블록의 에너지에 대체로 비례하고, 코딩/디코딩 비트 속도의 함수이다.
(도 1의 블록(320-480)과 같은) 시작부를 포함하는 블록의 경우, 신호의 에너지는 높고, 따라서 잡음 역시 높은 레벨을 갖는다.
변환 코딩에서, 코딩 잡음의 레벨은 변이에 바로 이어지는 고에너지 세그먼트에 대한 신호의 레벨보다 통상적으로 낮지만, 그 레벨은 특히, 변이에 선행하는 부분(도 1의 샘플 160-410)에 걸쳐, 저에너지 세그먼트의 신호의 레벨보다 높다. 전술한 부분의 경우, 신호 대 잡음 비가 마이너스이고, 결과적인 저하는 매우 듣기 성가신 것으로 나타날 수 있다. 변이 이전의 코딩 잡음은 프리에코(pre-echo)라고 불리고, 변이 이후의 잡음은 포스트에코(post-echo)라고 불린다.
프리에코가 변이에 선행하는 프레임 및 변이가 생기는 프레임에 영향을 미친다는 것을 도 1에서 알 수 있다.
음향 심리학 실험은 사람의 귀가 수 밀리 초 정도의, 상당히 제한된 사운드의 시간적 프리마스킹(temporal pre-masking)을 수행하는 것을 실증하고 있다. 시작부에 선행하는 잡음 또는 프리에코는 프리에코의 지속시간이 프리마스킹 지속시간보다 큰 경우에 들을 수 있다.
사람의 귀는 고에너지 시퀀스로부터 저에너지 시퀀스로의 변이시에 5 내지 60밀리 초의 보다 긴 지속시간의 포스트마스킹(post-masking)을 또한 수행한다. 따라서, 포스트에코에 대해 수용가능한 교란의 속도 또는 레벨은 프리에코보다 크다.
더 중요한 프리에코 현상은 샘플 수 면에서 블록의 길이가 큰 경우에 더욱더 교란된다는 것이다. 이제, 변환 코딩에서, 스탠딩 신호(standing signal)의 경우, 변환 길이가 더 증가할수록, 코딩 이득이 커지는 것이 잘 알려져 있다. 고정 샘플링 주파수 및 고정 비트 속도에서, 윈도우의 점들의 수(그에 따라 변환의 길이)가 증가되면, 음향심리학적 모델에 의해 유용한 것으로 간주되는 주파수 레이(frequency ray)를 코딩하기 위해 프레임당 더 많은 비트가 있고, 따라서 큰 길이의 블록을 이용하는 이점이 있을 것이다. MPEG AAC(Advanced Audio Coding) 코딩은, 예를 들어, 샘플링 주파수가 32 kHz일 경우 64 ms의 지속시간에 걸쳐 고정된 수, 즉, 2048개의 샘플을 포함하는 큰 길이의 윈도우를 이용하고, 이와 같은 긴 윈도우로부터 (변이 윈도우라고 불리는) 중간 윈도우를 통해 8개의 짧은 윈도우로 전환하는 것을 가능하게 함으로써 프리에코의 문제가 관리되며, 이는 변이의 존재를 검출하고 윈도우를 적응시키도록 코딩에 있어서의 특정 지연을 필요로 한다. 따라서, 이와 같은 짧은 윈도우의 길이는 256개의 샘플(32 kHz에서 8 ms)이다. 낮은 비트 속도에서, 수 ms의 가청 프리에코를 갖는 것이 여전히 가능하다. 윈도우의 전환은 프리에코를 감쇠시킬 수 있지만 이를 제거시킬 수는 없다. ITU-T G.722.1, G.722.1C 또는 G.719와 같은 대화 애플리케이션에 사용되는 변환 코더는 각각 16, 32, 또는 48 kHz에서 20 ms의 프레임 길이 및 40 ms 지속시간의 윈도우를 흔히 이용했다. ITU-T G.719 코더는 윈도우 전환 메커니즘을 과도상태 검출(transient detection)과 통합하지만, 프리에코는 낮은 비트 속도(전형적으로 32 Kbit/s)에서 완전히 감소하지 않는다는 것에 주목할 수 있다.
프리에코 현상의 전술한 교란 효과를 감소시키기 위해, 다양한 해결책이 코더 및/또는 디코더에 제안되고 있다.
윈도우 전환은 이미 언급되었고; 현재 프레임에 사용되는 윈도우의 유형을 식별하기 위해 보조 정보 항목을 전송하는 것을 필요로 한다. 다른 해결책은 적응 필터링을 적용하는 것이다. 시작부에 선행하는 구역에서, 재구성된 신호는 원래 신호 및 양자화 잡음의 합으로 간주된다.
대응하는 필터링 기술은 "64Kbit/s에서의 고품질 오디오 변환 코딩(High Quality Audio Transform Coding at 64Kbit/s)"(IEEE Trans. on Communications Vol 42, No. 11, November 1994, published by Y. Mahieux and J. P. Petit)이라는 명칭의 논문에 개시되어 있다.
이와 같은 필터링의 구현은 파라미터의 지식을 요구하며, 그 중 일부, 예를 들어 예측 계수 및 프리에코에 의해 오류가 생긴 신호의 변화는 잡음 샘플로부터 디코더에서 추정된다. 그러나 원래 신호의 에너지와 같은 정보는 코더에만 알려질 수 있고, 결과적으로 전송되어야 한다. 이것은 추가 정보의 전송을 수반하고, 이는 제한된 비트 속도에서, 변환 코딩에 할당된 상대 버짓(budget)을 감소시킨다. 수신된 블록이 동적 범위의 급격한 변화를 포함하는 경우, 필터링 처리가 그것에 적용된다.
전술한 필터 프로세스는 원래 신호를 복원시킬 수 없지만, 프리에코의 강한 감소를 제공한다. 그러나, 디코더에 추가의 파라미터의 전송을 수반한다.
상기 해결책과 달리, 정보의 특정 전송 없이 다양한 프리에코 감소 기술이 제안되고 있다. 예를 들면, 계층적 코딩(hierarchical coding)의 맥락에서 프리에코의 감소의 검토가 "ITU-T G.729.1 내장형 코더에서의 프리에코 감소(Pre-echo reduction in the ITU-T G.729.1 embedded coder)"(B. Koevesi, S. Ragot, M. Gartner, H. Taddei)(EUSIPCO, Lausanne, Switzerland, August 2008)라는 명칭의 논문에 제시되어 있다.
보조 정보를 갖지 않는 프리에코 감쇠 처리 방법의 전형적인 예가 프랑스 특허 출원 FR 08 56248호에 개시되어 있다. 이와 같은 예에서, 감쇠 인자는 변이 또는 시작이 검출되는 서브블록에 선행하는 저에너지 서브블록에서, 각각의 서브블록에 대해 결정된다.
k번째 서브블록의 감쇠 인자 g(k)는 예를 들어, 최고 에너지 서브블록의 에너지와, 관련된 k번째 서브블록의 에너지 사이의 비 R(k)의 함수로서 연산된다:
g(k) = f(R(k))
여기서, f는 0과 1 사이의 값을 갖는 감소 함수이고, k는 서브블록의 번호이다. 인자 g(k)의 다른 정의는 예를 들어, 현재 서브블록의 에너지 En(k)와 이전 서브블록의 에너지 En(k-1)의 함수로서 가능하다.
서브블록의 에너지가 현재 프레임에서 고려되는 서브블록의 최대 에너지에 비해 거의 변화하지 않으면, 감쇠가 필요하지 않고, 인자 g(k)는 감쇠를 금지하는 감쇠 값, 즉 1로 설정된다. 그렇지 않으면, 감쇠 인자는 0과 1 사이에 놓인다.
대부분의 경우에, 무엇보다도 프리에코가 교란중일 때, 프리에코 프레임에 선행하는 프레임은 저에너지 세그먼트(전형적으로 배경 잡음)의 에너지에 대응하는 균일한 에너지를 가진다. 실험으로부터, 프리에코 감쇠 처리 후, 신호의 에너지가 처리 구역에 선행하는 신호의 (서브블록당) 평균 에너지 - 전형적으로,
Figure 112017034913585-pct00001
으로 표시되는 이전 프레임의 에너지 또는
Figure 112017034913585-pct00002
으로 표시되는 이전 프레임의 후반부의 에너지 - 보다 낮아지는 것이 유용하지도 않고 심지어 바람직하지도 않다.
지수 k의 서브블록을 처리하기 위해, 감쇠 인자의, limg(k)로 표시되는 극한값이, 처리될 서브블록에 선행하는 세그먼트의 서브블록당 평균 에너지와 정확하게 동일한 에너지를 획득하기 위해, 연산될 수 있다. 이와 같은 값은 여기서의 관심 대상인 감쇠 값이기 때문에 물론 1의 최대값으로 제한된다. 보다 구체적으로, 하기가 여기서 정의된다:
Figure 112017034913585-pct00003
여기서, 이전 세그먼트의 평균 에너지는
Figure 112017034913585-pct00004
에 의해 근사된다.
그에 따라 획득된 limg(k) 값은 서브블록의 감쇠 인자의 최종 연산시 하한값으로 기능하며, 따라서 하기와 같이 사용된다:
Figure 112017034913585-pct00005
이와 같은 서브블록에 대해 결정된 감쇠 인자(또는 이득) g(k)는 그 후 샘플 단위로 적용되는 평활 함수(smoothing function)에 의해 평활화되어서, 블록 경계에서 감쇠 인자의 급작스런 변화를 회피할 수 있다.
예를 들면, 샘플당 이득은 무엇보다도 구분적으로 일정한 함수로 정의될 수 있다:
Figure 112017034913585-pct00006
여기서, L'은 서브블록의 길이를 나타낸다.
이와 같은 함수는 다음에 하가의 방정식에 따라 평활화된다.
Figure 112017034913585-pct00007
관례에 따르면, gpre(-1)이 이전 서브블록의 최종 샘플에 대해 획득된 최종 감쇠 인자이고, α는 평활 계수로서 전형적으로 α=0.85이다.
예를 들어 u개의 샘플에 대해 선형 크로스-페이드(linear cross-fade)와 같은 다른 평활 함수도 또한 가능하다:
Figure 112017034913585-pct00008
여기서, gpre'(n)은 비-평활 감쇠이고, gpre(n)은 평활화된 감쇠이며, n=-(u-1),...,-1의 경우의 gpre'(n)은 이전 서브블록의 최종 샘플에 대해 획득된 최종 u-1의 감쇠 인자이다. 예를 들면, u=5가 취해질 수 있다.
그에 따라 인자 gpre(n)이 연산되면, 프리에코의 감쇠는 각각의 샘플을 대응 인자와 곱함으로써 현재 프레임에서 재구성된 신호 xrec(n)에 대해 행해진다:
Figure 112017034913585-pct00009
여기서, xrec,g(n)은 프리에코 감소에 의해 디코딩되고 후처리된 신호이다.
도 2 및 도 3은 종래 기술의 특허 출원에 개시되고, 상기에 언급되며, 이전에 요약된 바와 같은 감쇠 방법의 구현예를 도시한다.
이들 예에서, 신호는 32 kHz에서 샘플링되고, 프레임 길이는 L=640 샘플이며, 각각의 프레임은 K=80개의 샘플의 8개의 서브블록으로 나누어진다.
도 2의 부분 a)에서, 32 kHz에서 샘플링된 원래 신호의 프레임이 나타난다. 신호의 시작부(또는 변이부)가 지수 320으로 시작하는 서브블록에 위치한다. 이와 같은 신호는 낮은 비트 속도(24Kbit/s)에서 MDCT 유형의 변환 코더에 의해 코딩되었다.
도 2의 부분 b)에서, 프리에코 처리를 갖지 않은 디코딩 결과가 도시된다. 시작부를 포함하는 서브블록에 선행하는 서브블록에서, 샘플 160으로부터의 프리에코가 관찰될 수 있다.
부분 c)는 전술한 종래 기술의 특허 출원에 개시된 방법에 의해 획득된 프리에코 감쇠 인자(실선)의 경향을 도시한다. 점선은 평활화 이전의 인자를 나타낸다. 여기서, 시작부의 위치가 (샘플 320 및 400에 의해 한정된 블록 내의) 샘플 380 주위로 추정되는 것에 주목하자.
부분 d)는 프리에코 처리(신호 b)와 신호 c)의 곱)의 적용 후 디코딩 결과를 도시한다. 프리에코가 정말로 감쇠되었음을 알 수 있다. 도 2는 시작부의 순간에 평활화된 인자가 1로 되돌아가지 않음을 또한 보여주며, 이는 시작부의 진폭 감소를 의미한다. 이와 같은 감소의 지각 가능한 영향은 매우 낮지만 그럼에도 불구하고 회피될 수 있다. 도 3은 도 2와 동일한 예를 도시하며, 평활화 이전에, 감쇠 인자 값이 시작부가 위치한 서브블록에 선행하는 서브블록의 몇 개의 샘플에 대해 1로 강제된다. 도 3의 부분 c)는 이와 같은 교정의 예를 제공한다.
이와 같은 예에서, 인자 값 1은 지수 364로부터, 시작부에 선행하는 서브블록의 최종 16개의 샘플에 할당되었다. 따라서, 평활 함수는 시작부의 순간에 1에 가까운 값을 갖도록 인자를 점진적으로 증가시킨다. 그러면, 시작부의 진폭이 도 3의 부분 d)에 도시되는 바와 같이 보전되지만, 몇 개의 프리에코 샘플은 감쇠되지 않는다.
도 3의 예에서, 감쇠에 의한 프리에코 감소는 이득의 평활화 때문에, 프리에코를 시작부의 레벨로 감소시킬 수 없다.
그러나 이와 같은 프리에코 감소 기술은 예를 들어 현대 음악 신호와 같은 일부 유형의 신호에 대해 완벽해질 수 있다. 실제로, 일부 경우에, 잘못된 프리에코 검출이 이루어질 수 있다. 도 4는 코딩되지 않고 그에 따라 프리에코가 없는 그러한 원래 신호의 예를 도시한다. 이는 전자/합성 타악기 기기의 두드림(beating)이다. 지수 1600을 향한 선명한 시작부 이전에, 지수 1250을 향해 시작되는 합성 잡음이 존재하는 것을 여기서 알 수 있다. 따라서 신호의 일부를 형성하는 이와 같은 합성 잡음은, 신호의 완전한 코딩/디코딩을 가정하면, 상기에 설명된 프리에코 검출 알고리즘에 의해 프리에코로서 검출된다. 따라서 프리에코 감쇠 처리는 신호의 이와 같은 성분을 제거한다. 이것은 (코딩/디코딩이 완전한 경우에) 디코딩된 신호를 왜곡시키고, 이는 바람직하지 않다.
따라서, 어떤 보조 정보도 코더에 의해 전송되지 않고서 프리에코를 신뢰성 있게 검출할 수 있고 오검출을 회피할 수 있게 하는, 디코딩시에 프리에코를 판별 및 감쇠하기 위한 개선된 기술에 대한 필요성이 존재한다.
본 발명은 이와 같은 종래 기술의 상황을 개선한다.
이와 같은 목적을 위해, 본 발명은, 변환 코딩으로부터 발생하는 디지털 오디오 신호의 프리에코를 판별 및 감쇠하기 위한 방법에 관한 것이며, 서브블록으로 분해된 현재 프레임에 대하여, 변이 또는 시작부가 검출되는 서브블록에 선행하는 저에너지 서브블록은, 프리에코 감쇠 처리가 수행되는 프리에코 구역을 결정한다. 상기 방법은, 시작부가 현재 프레임의 제3 서브블록으로부터 검출되는 경우에,
- 시작부가 검출되는 서브블록에 선행하는 현재 프레임의 적어도 2개의 서브블록에 대한 에너지의 선두 계수(leading coefficient)를 연산하는 단계;
- 선두 계수를 사전규정된 임계치와 비교하는 단계; 및
- 연산된 선두 계수가 사전규정된 임계치 미만인 경우에 프리에코 구역에서의 프리에코 감쇠 처리를 금지하는 단계를 포함하도록 한다.
시작부의 위치에 선행하는 서브블록에 대해 연산된 에너지의 선두 계수는 프리에코 구역에서의 신호의 에너지의 상향 경향을 검증할 수 있게 한다. 이것은 잘못된 프리에코 검출을 회피함으로써 프리에코 검출을 신뢰성있게 한다. 실제로, 도 1을 참조하면, 프리에코가 전형적인 특성을 갖는다는 것을 알 수 있다: 그 에너지는 프리에코를 생성시키는 시작부에 접근하면서 증가 경향을 가진다. 오버랩-가산 가중 윈도우의 형태가 그것을 설명한다. 프리에코가 가산-오버랩 이전에 거의 일정한 에너지를 갖더라도, 오버랩-가산 모듈의 입력부에서의 신호는 가중치가 과거를 향해 감소하는 가중 윈도우와 곱해진다. 도 4의 예시적인 신호의 경우에, 시작부 이전의 신호의 에너지는 대략 일정하고, 이는 프리에코를 차별화할 수 있게 한다. 따라서, 프리에코 구역에서의 신호의 증가 에너지 검증은 프리에코 검출의 신뢰성을 증가시킬 수 있다.
특정 실시예에서, 상기 방법은 디지털 오디오 신호를 주파수 기준의 함수로서 적어도 2개의 서브신호로 분해하는 단계를 추가로 포함하며, 비교 연산 단계는 서브신호들 중 적어도 하나에 대해 수행된다.
시작부의 위치가 현재 프레임의 제3 서브블록에서 검출되는 경우, 2개의 서브블록의 에너지가 프리에코 구역에서 사용되어, 선두 계수를 연산하고 이를 임계치와 비교할 수 있다. 단 2개의 지점의 경우에 있어서, 2개의 서브신호로의 분해의 경우에 고주파수 서브신호에 대한 검증만이 잘못된 프리에코를 검출하기에 충분하다.
시작부 위치가 검출된 서브블록에 선행하는 서브블록의 수가 충분한 경우에, 상기 방법은 디지털 오디오 신호를 주파수 기준의 함수로서 적어도 2개의 서브신호로 분해하는 단계를 추가로 포함하며, 연산 및 비교 단계가 각각의 서브신호에 대해 수행되며, 모든 서브신호의 프리에코 구역에서의 프리에코 감쇠 처리의 금지는 연산된 선두 계수가 적어도 하나의 서브신호에 대한 사전규정된 임계치 미만인 경우에 수행된다.
따라서, 서브신호로의 분해는 프리에코 감쇠를 독립적으로, 그리고 서브신호에 적합한 방식으로 수행할 수 있게 한다. 프리에코 구역 검출 신뢰성은 각각의 선두 계수의 값의 검증에 의해 서브신호 각각에 대해 강화된다.
특정 실시예에 따르면, 각각의 서브신호에 대해 상이한 임계치가 규정된다.
이것은 서브신호의 스펙트럼 특성에 검증을 적응시킬 수 있게 한다.
하나의 실시예에서, 선두 계수는 최소 제곱 추정법에 따라 연산된다.
이와 같은 연산법은 복잡도가 낮다.
하나의 가능한 실시예에서, 선두 계수는 정규화된다.
따라서, 선두 계수는 임계치가 0과 상이한 경우에 임계치와 보다 용이하게 비교될 수 있다.
하나의 가능한 실시예에서, 시작부가 현재 프레임의 제1 또는 제2 서브블록에서 검출되는 경우에, 이전 프레임에 대해 연산된 선두 계수가 비교 단계에 사용된다.
본 발명은 또한 변환 코딩으로부터 발생한 디지털 오디오 신호의 프리에코를 판별 및 감쇠하기 위한 장치에 관한 것이며, 상기 장치는 변이 또는 시작부 검출 모듈, 프리에코 구역 판별 모듈, 및 프리에코 감쇠 처리 모듈을 포함하고, 서브블록으로 분해된 현재 프레임에 대해 프리에코 감쇠 처리가 수행되고, 변이 또는 시작부가 검출되는 서브블록에 선행하는 저에너지 서브블록은 프리에코 구역을 결정한다. 상기 장치는, 시작부가 현재 프레임의 제3 서브블록으로부터 검출되는 경우에,
- 시작부가 검출되는 서브블록에 선행하는 현재 프레임의 적어도 2개의 서브블록에 대한 에너지의 선두 계수를 연산하는 연산 모듈;
- 사전규정된 임계치와 상기 선두 계수의 비교를 수행할 수 있는 비교기; 및
- 연산된 선두 계수가 사전규정된 임계치 미만인 경우에 프리에코 구역에서의 프리에코 감쇠 처리를 금지할 수 있는 판별 모듈을 추가로 포함하도록 한다.
이와 같은 장치의 이점은 그것이 구현하는 감쇠 판별 및 처리 방법에 대해 설명된 것과 동일하다.
본 발명은 앞서 설명된 장치를 포함하는 디지털 오디오 신호 디코더를 목표로 한다.
본 발명은 또한, 코드 명령어를 포함하는 컴퓨터 프로그램을 목표로 하며, 이들 명령어가 프로세서에 의해 실행될 때 앞서 설명된 방법의 단계들을 구현한다.
마지막으로, 본 발명은 앞서 설명된 처리 방법을 구현하는 컴퓨터 프로그램을 저장하는, 가능하다면 제거 가능한, 처리 장치에 통합되거나 또는 통합되지 않은, 프로세서에 의해 판독될 수 있는 저장 매체에 관한 것이다.
본 발명의 다른 특징 및 장점은 첨부 도면을 참조하여, 순수하게 비제한적인 예로 주어지는 하기의 설명을 읽으면 보다더 명확해질 것이다:
- 도 1은 앞서 설명되었고, 종래 기술에 따른 변환 코딩-디코딩 시스템을 도시하고;
- 도 2는 앞서 설명되었고, 종래 기술에 따른 감쇠 방법이 수행되는 디지털 오디오 신호의 일 예를 도시하고;
- 도 3은 종래 기술에 따른 감쇠 방법이 수행되는 디지털 오디오 신호의 다른 예를 도시하고;
- 도 4는 앞서 설명되었고, 종래 기술이 프리에코를 오검출하는 신호의 예를 도시하고;
- 도 5는 본 발명에 따른 디코더에 포함되는 프리에코 판별 및 감쇠 처리 장치의 일 실시예를 도시하고;
- 도 6은 프리에코 현상을 생성할 가능성이 있는, 변환 코딩 및 디코딩에 대해 짧은 지연을 갖는 합성 윈도우 및 분석 윈도우의 예를 도시하고;
- 도 7은 본 발명의 일 실시예에 따른 프리에코 감쇠 방법이 구현되는 디지털 오디오 신호의 일 예를 도시하고;
- 도 8은 본 발명에 따른 판별 및 감쇠 처리 장치의 하드웨어 예를 도시한다.
도 5를 참조하면, 프리에코 판별 및 감쇠 처리 장치(600)가 설명된다. 하기에서 설명되는 감쇠 처리 장치(600)는 신호(S)를 수신하는 역 양자화 모듈(610)(Q-1)과, 역 변환 모듈(620)(MDCT- 1)과, 도 1을 참조하여 설명되는 바와 같은, 본 발명에 따른 판별 및 감쇠 처리 장치에 재구성된 신호 xrec(n)을 전달하는 가산-오버랩(add-overlap) 신호 재구성 모듈(630)(add/rec)을 포함하는 디코더에 포함된다. 음성 및 오디오 코딩에 가장 일반적으로 사용되는 MDCT 변환의 예가 여기서 취해지지만, 장치(600)는 임의의 다른 유형의 변환(FFT, DCT 등)에 동등하게 적용되는 것에 주목할 수 있다.
장치(600)의 출력에서, 프리에코 감쇠가 수행된 처리 신호 Sa가 공급된다.
장치(600)는 디코딩된 신호 odxrec(n)에서 프리에코 판별 및 감쇠 처리 방법을 구현한다.
본 발명의 일 실시예에서, 판별 및 감쇠 처리 방법은 디코딩된 신호 xrec(n)에서 프리에코를 발생시킬 수 있는 시작부의 검출 단계 E601을 포함한다.
따라서, 장치(600)는 디코딩된 오디오 신호의 시작부의 위치의 검출 단계 E601을 구현할 수 있는 검출 모듈(601)을 포함한다.
시작부는 신호의 동적 범위(또는 진폭)의 급속한 변이 및 급작스런 변화이다. 이와 같은 유형의 신호는 보다 일반적인 용어 "과도상태(transient)"로 표기될 수 있다. 하기에서, 일반성의 손실 없이, 시작부 및 변이라는 용어만이 "과도상태"를 또한 표기하는데 사용될 것이다.
디코딩된 신호 xrec(n)의 L개의 샘플의 각각의 현재 프레임은 길이 L'의 K개의 서브블록으로 나누어지고, 예를 들면, 32kHz에서 L=640 샘플(20 ms), L'=80 샘플(2.5 ms) 및 K=8이다. 바람직하게, 이와 같은 서브블록들의 크기는 동일하지만, 서브블록이 가변 크기를 가질 때도 본 발명은 유효하게 유지되고 용이하게 일반화될 수 있다. 예를 들면, 프레임 길이 L이 서브블록의 수 K로 나누어질 수 없을 때 또는 프레임 길이가 가변적일 때가 그러한 경우일 수 있다.
ITU-T G.718 표준에 개시된 것과 유사한 짧은 지연을 갖는 특수 분석-합성 윈도우가 MDCT 변환의 분석 부분 및 합성 부분에 사용된다. 이와 같은 윈도우의 일 예가 도 6을 참조하여 도시된다. 변환에 의해 발생하는 지연은 종래의 정현파형 윈도우를 이용하는 경우의 640 샘플의 지연과 달리 280 샘플에 불과하다. 따라서, 짧은 지연의 특수 분석-합성 윈도우를 가진 MDCT 메모리는 종래의 정현파형 윈도우를 이용하는 경우의 320 샘플과 달리, 140개의 독립적인 샘플들만을 포함한다(현재 프레임과 폴딩되지 않음).
폴딩 구역(folding zone)이 샘플 820과 1100 사이의 점선에 의해 제한되는 것에 사실상 분석 윈도우(Ana.)에 대한 도 6에서 주목할 수 있다.
합성(Synth.)에 대해서, 대칭을 이용함으로써 분석의 폴딩 구역에 대한 정보를 획득하기 위해, 구간 M에 의해 표현되는 샘플들(140 샘플)만이 필요하다. 메모리에 수용된 이와 같은 샘플들은 그 후 다음 프레임의 윈도우의 폴딩된 샘플을 또한 이용함으로써 이와 같은 폴딩 구역을 디코딩하는데 유용하다. 샘플 820과 1100 사이의 이와 같은 구역에서의 시작부의 경우에, 구간 M에 의해 나타나는 샘플의 평균 에너지는 샘플 820에 선행하는 서브프레임의 에너지보다 확실히 크다. 따라서, MDCT 메모리에 수용되는 구간 M의 에너지의 급작스런 증가는 현재 프레임에 프리에코를 발생시킬 수 있는 다음 프레임의 시작부를 신호할 수 있다.
MDCT 메모리 XMDCT(n)이 사용되며, 이는 차후 신호의 시간적 폴딩("folding")을 갖는 버전을 제공한다. 도 6에 도시되는 짧은 지연의 특수 분석-합성 윈도우를 이용하여, 길이 Lm(0)=140의 하나(K'=1)의 블록만이 보유되며, 이는 MDCT 메모리의 모든 독립적 샘플을 포함한다. 이와 같은 서브블록 내의 보다 많은 샘플의 수에도 불구하고, 그 에너지는 (신호가 안정되게 유지될 경우) 현재 프레임의 서브블록의 에너지와 비교 가능하게 유지되며, 이는 메모리 부분이 분석 윈도우에 의해 윈도우 형성(windowing)(그에 따라 감쇠)되기 때문이다.
실제로, 도 1은 프리에코가, 시작부가 위치한 프레임에 선행하는 프레임에 영향을 미치는 것을 보여주며, MDCT 메모리에 부분적으로 수용되는 차후 프레임 내의 시작부를 검출하는 것이 바람직하다.
현재 프레임 및 MDCT 메모리는 (K+K')개의 연이은 서브블록으로 나누어지는 신호를 형성하는 연쇄 신호로서 보일 수 있다. 이와 같은 조건에서, k번째 서브블록의 에너지는, k번째 서브블록이 현재 프레임에 위치하는 경우에,
Figure 112017034913585-pct00010
로 규정되고, 서브블록이 MDCT 메모리에 있는 경우(차후 프레임에 이용 가능한 신호를 나타냄)에,
Figure 112017034913585-pct00011
로 규정되며, 여기서 Lmem은 메모리 부분의 서브블록의 길이이다.
따라서, 현재 프레임의 서브블록의 평균 에너지는 하기와 같이 획득된다:
Figure 112017034913585-pct00012
현재 프레임의 제2 부분 내의 서브블록의 평균 에너지는 또한 하기와 같이 규정된다(K가 짝수라고 가정):
Figure 112017034913585-pct00013
프리에코와 관련된 시작부는 고려되는 서브블록들 중 하나에서 비
Figure 112017034913585-pct00014
가 사전규정된 임계치를 초과하는 경우 검출된다. 본 발명의 속성을 변화시키지 않으면서 다른 프리에코 검출 기준도 가능하다.
더욱이, 시작부의 위치가 하기와 같이 규정되는 것으로 간주된다:
Figure 112017034913585-pct00015
여기서, L에 대한 제한은 MDCT 메모리가 결코 수정되지 않는 것을 보장한다. 시작부 위치 추정을 위한 다른 보다 정확한 방법이 또한 가능하다.
장치(600)는 검출되는 시작부 위치에 선행하는 프리에코 구역(ZPE)의 결정 단계 E602를 구현하는 프리에코 구역 판별 모듈(602)을 또한 포함한다. 여기서, 용어 프리에코 구역은, 이와 같은 프리에코의 감쇠가 바람직한, 시작부에 의해 발생한 프리에코에 의해 교란되는 시작부의 추정 위치 이전에 샘플을 덮는 구역을 표시하는데 사용된다. 제시된 실시예에서, 프리에코 구역은 디코딩된 신호에 대해 결정될 수 있다.
프리에코 구역을 획득하는 일 실시예에서, 에너지 En(k)는 무엇보다도, 디코딩된 신호의 시간 엔벨로프와, 그리고 MDCT 변환 메모리로부터 추정되는 다음 프레임의 신호의 엔벨로프와 시계열 순으로 연쇄된다. 이와 같은 연쇄 시간 엔벨로프 및 이전 프레임의 평균 에너지
Figure 112017034913585-pct00016
Figure 112017034913585-pct00017
에 기초하여, 예를 들어 비 R(k)가 임계치를 초과하는 경우, 프리에코의 존재가 검출되며, 전형적으로 이와 같은 임계치는 16이다.
따라서 프리에코가 검출된 서브블록은 프리에코 구역을 구성하고, 이는 일반적으로 샘플 n=0,..., pos-1을, 즉 현재 프레임의 시작으로부터 시작부의 위치(pos)까지를 커버한다. 시작부가 차후 프레임에서 검출된 경우 프리에코 구역이 모든 현재 프레임에 걸쳐 매우 잘 연장될 수 있다는 것에 또한 주목할 수 있다.
장치(600)는 시작부가 검출된 서브블록에 선행하는 서브블록의 에너지의 선두 계수(leading coefficient)(또는 변화 경향 인디케이터)의 연산 단계를 구현할 수 있는 연산 모듈(603)을 포함한다.
n개의 현실화(realizaition)(ti, ei) 세트를 나타내는 선형 모델(0<=i<n)이 하기의 방정식과 같이 규정되며, 여기서 ti는 서브블록의 시간 지수이고, ei는 그 에너지이다:
Figure 112017034913585-pct00018
여기서, b0는 시간 t=0에서의 값이고 b1은 선두 계수이다. 선두 계수는 에너지의 변화 경향(평균)에 대한 정보를 부여한다. 양의 선두 계수는 에너지 증가를 신호한다. 0에 가까운 값은 일정한 에너지를 신호한다.
b1의 값은 선형 최소 제곱 회귀(linear least squares regression)에 의해 결정될 수 있다:
Figure 112017034913585-pct00019
여기서, 합산이 사전결정된 지수 i에 걸쳐서 수행된다.
b1의 값은 그 에너지의 양(절대값)에 또한 좌우되고, 이는 시간에 따른 에너지와 실제로 균일하다. b1의 값을 임계치(예를 들면, 고정 임계치)와 보다 잘 비교할 수 있도록, 이와 같은 종속성이 제거될 수 있다. 예를 들면, b1의 값은 정규화된 선두 계수를 얻기 위해 에너지의 평균값으로 나눌 수 있다:
Figure 112017034913585-pct00020
대안적으로, 상관 계수가 취해질 수 있을 것이다.
Figure 112017034913585-pct00021
이와 같은 대안적인 해결책은 제곱근 연산을 수반하기 때문에 보다 높은 연산 복잡도를 갖는다.
예를 들면, 터키(Tukey)의 중간값-중간값 방법(median-median method)과 같은, 선두 계수를 추정하기 위한 다른 방법이 또한 가능하다.
선두 계수가 제로 값의 임계치(이와 같은 계수의 부호를 검증하는 것에 해당함)와 비교되어야 하는 경우, 이와 같은 계수를 정규화할 필요가 없다는 것에 또한 주목할 수 있다.
더욱이, 선두 계수를 정규화하는 대신에, 하기의 관계가 등가이기 때문에 임계치를 변수화하는 것이 가능할 것이다:
Figure 112017034913585-pct00022
Figure 112017034913585-pct00023
제1 또는 제2 서브블록에서 시작부가 검출되면, 본 발명에 따른 검증이 가능하지 않다. 시작부가 제3 서브블록에서 검출되면, 프리에코 구역에서의 2개의 서브블록의 에너지 e0 및 e1이 본 검증에 이용 가능하다(e1이 시작부에 가장 가까움). 따라서, 2개의 지점으로, 방정식 (3)은 단순화된다:
Figure 112017034913585-pct00024
시작부가 제4 서브블록에서 검출되면, 프리에코 구역 내에 이와 같은 검증에 이용 가능한 3개의 서브블록의 에너지 e0, e1, e2가 존재한다(e2가 시작부에 가장 가깝다). 따라서 3개의 지점으로, 방정식 (3)은 단순화된다:
Figure 112017034913585-pct00025
4개 이상의 서브블록이 존재하는 경우, 선두 계수는 4개 이상의 서브블록에 대해 연산될 수 있다. 실험은 시작부가 검출된 서브블록에 선행하는 3개의 서브블록에 대해 연산된 선두 계수의 검증이 잘못된 프리에코 검출을 회피하기에 충분하다는 것을 보여준다 - 이와 같은 결론은 각각의 20ms 프레임에 대한 8개의 서브블록의 경우에 적용되며, 프레임 및 서브블록의 크기에 따라 적응될 수 있다.
따라서, 바람직한 실시예에서, 선두 계수는 기껏해야 3개의 서브블록으로 연산된다. 이것은 선두 계수 연산의 최대 복잡도를 제한할 수 있게 한다.
본 발명에 따르면, 그에 따라 획득되는 정규화된 선두 계수 b1n은 그 후 사전규정된 임계치에 비교기 모듈(604)에 의해 단계 E604에서 비교된다. 임계치는 고정 값으로 사전규정될 수 있거나, 또는 예를 들어, 음성 또는 음악 기준에 따른 신호의 분류의 함수로서 가변적일 수 있다. 전형적으로 이와 같은 임계치는 에너지가 감소하지 않는다는 점만이 확인되면 0과 같고, 에너지의 약간의 증가가 프리에코 구역에서 나타날 경우 0.2와 같다. 정규화된 선두 계수 b1n이 이와 같은 임계치 미만인 경우, 프리에코 구역에서의 신호가 전형적인 프리에코에 해당하지 않고 이와 같은 구역에서의 프리에코의 감쇠가 단계 E602에서 금지되는 것으로 결론지을 수 있다. 따라서, 이와 같은 성분을 프리에코로 검출함으로써 프리에코 감쇠 모듈에 의해 에러로 시작부가 수정/변경되기 전에 저에너지 성분을 포함하는 원래 입력 신호를 포함하는 디코딩된 신호의 상황을 회피할 수 있다.
프리에코 감쇠는 판별된 프리에코 구역을 위한 감쇠 모듈(607)에 의해 단계 E607에서 구현된다. 감쇠 인자는 예를 들어, 출원 FR 08 56248호에서와 같이 연산된다. 모듈(604)이 잘못된 프리에코 검출을 검출한 경우에, 감쇠 인자는 1로 강제될 수 있고, 따라서, 감쇠를 금지하거나 또는 판별 모듈(602)이 프리에코 구역으로 이와 같은 구역을 판별하지 않고 그러면 감쇠 모듈이 호출되지 않는다.
특정 실시예에서, 장치(600)는 사전결정된 기준에 따라 디코딩된 신호를 적어도 2개의 서브신호로 분해하는 단계 E605를 수행할 수 있는 신호 분해 모듈(605)을 추가로 포함한다. 이와 같은 방법은 특히 출원 FR 12 62598에 개시되어 있고 그 중 몇 개의 요소만이 여기서 호출된다.
본 발명의 특정 실시예에서, 디코딩된 신호 xrec(n)은 단계 E605에서 하기와 같이 2개의 서브신호로 분해된다:
- 전달 함수
Figure 112017034913585-pct00026
의 제로 위상과 3개의 계수를 갖는 FIR 필터(finite impulse response filter)를 이용함으로써 저역 통과 필터링에 의해 제1 서브신호 xrec,ss1(n)이 획득되며, 여기서 c(n)은 0과 0.25 사이의 값이고,
Figure 112017034913585-pct00027
은 저역 통과 필터의 계수이며, 이와 같은 필터는 차이 방정식으로 구현된다:
Figure 112017034913585-pct00028
특정 실시예에서, 일정 값 c(n) = 0.25가 사용된다. 따라서 이와 같은 필터링으로부터 나타나는 서브신호 xrec , ss1(n)은 디코딩된 신호의 주로 저주파수 성분을 포함한다.
- 제2 서브신호 xrec,ss2(n)은 전달 함수
Figure 112017034913585-pct00029
의 제로 위상과, 3개의 계수를 갖는 FIR 필터를 이용함으로써 상보형 고역 통과 필터링에 의해 획득되고,
Figure 112017034913585-pct00030
은 고역 통과 필터의 계수이며, 이 필터는 차이 방정식으로 구현된다:
Figure 112017034913585-pct00031
따라서, 이와 같은 필터링으로부터 나타나는 서브신호 xrec , ss2(n)은 디코딩된 신호의 주로 고주파수 성분을 포함한다.
Figure 112017034913585-pct00032
에 주목하자.
따라서, xrec(n)으로부터 xrec , ss1(n)을 빼는 것에 의해 xrec , ss2(n)을 얻는 것이 또한 가능하며, 이는 연산 복잡도를 감소시킨다:
Figure 112017034913585-pct00033
감쇠 신호 Sa를 얻기 위해 감쇠된 서브신호의 조합은 하기에 설명되는 단계 E608에서 감쇠된 서브신호들의 간단한 추가에 의해 이루어진다.
이와 같은 필터링을 위한 차후 신호를 이용하지 않도록, 예를 들어, 블록의 종료부에서 0의 샘플과 함께 디코딩된 신호를 보완하는 것이 가능하다. n=L-1의 경우에 블록의 종료부에서 0 샘플로 보완되는 디코딩된 신호의 경우에, 서브신호 xrec,ss1(n)은 하기와 같이 획득된다:
Figure 112017034913585-pct00034
xrec,ss2(n)은 항상
Figure 112017034913585-pct00035
으로 연산된다.
2개의 서브신호가 여전히 디코딩된 신호와 동일한 샘플링 주파수를 갖는다는 것에 주목할 수 있다.
프리에코 감쇠 인자의 연산 단계 E606이 연산 모듈(606)에서 구현된다. 이와 같은 연산은 2개의 서브신호에 대해 개별적으로 이루어진다.
이와 같은 감쇠 인자들은 시작부가 검출된 프레임과 이전 프레임의 함수로 E602에서 결정되는 프리에코 구역의 각각의 샘플에 대해 획득된다.
인자 gpre , ss1'(n) 및 gpre , ss2'(n)이 그 후 획득되고, n은 대응 샘플의 지수이다. 이와 같은 인자는 필요할 경우, 각각 인자 gpre,ss1(n) 및 gpre,ss2(n)를 얻기 위해 평활화될 것이다. 이와 같은 평활화는 저주파수 성분을 포함하는 서브신호(따라서 본 예에서 gpre,ss1'(n))에 대해 무엇보다도 중요하다.
감쇠 연산의 현실화의 일 예가 특허 출원 FR 08 56248호에 개시되어 있다. 감쇠 인자는 각각의 서브블록에 대해 연산된다. 본 명세서에 설명되는 방법에서, 이들은, 추가로, 각각의 서브신호에 대해 개별적으로 연산된다. 따라서, 검출되는 시작부에 선행하는 샘플에 대하여, 감쇠 인자 gpre , ss1'(n) 및 gpre , ss2'(n)이 연산된다. 다음에, 이와 같은 감쇠 값이 각각의 샘플에 대한 감쇠 값을 얻기 위해, 필요할 경우, 평활화된다.
서브신호의 감쇠 인자(예를 들어 gpre,ss2'(n))의 연산은 디코딩된 신호의 k번째 서브블록의 에너지와 최고 에너지 서브블록의 에너지 사이의 비 R(k)(시작부 검출에 또한 사용됨)의 함수로 디코딩된 신호에 대한 특허 출원 FR 08 56248호에 개시된 것과 유사할 수 있다. gpre , ss2'(n)은 하기와 같이 초기화된다:
Figure 112017034913585-pct00036
여기서, f는 0과 1 사이의 값을 갖는 감소 함수이고, 예를 들면, R(k)≤16인 경우 f=0이고, 16>R(k)≥32인 경우, f=0.1이며, r(k)>>32인 경우 f=0.01이다.
최대 에너지에 대한 에너지 변화가 작을 경우, 그 후 감쇠가 필요치 않다. 그 후 인자는 감쇠를 금지하는 감쇠 값으로 설정되고, 이는 즉 1이다. 그렇지 않을 경우 감쇠 인자는 0과 1 사이에 놓인다. 이와 같은 초기화는 모든 서브신호들에 대해 공통일 수 있다.
그 후 감쇠 인자는 디코딩된 신호의 특성의 함수로 서브신호당 최적 감쇠 레벨을 설정할 수 있도록 각각의 서브신호별로 정제된다. 예를 들면, 감쇠는 이전 프레임의 서브신호의 평균 에너지의 함수로 제한될 수 있고, 이는 프리에코 감쇠 처리 후, 신호의 에너지가 처리 구역에 선행하는 신호의 서브블록당(전형적으로 이전 프레임, 또는 이전 프레임의 후반부) 평균 에너지보다 낮아지는 것이 바람직하지 않기 때문이다.
이와 같은 제한사항은 특허 출원 FR 08 56248호에 개시된 것과 유사한 방식으로 이루어질 수 있다. 예를 들면, 제2 서브신호 xrec , ss2(n)에 대하여, 현재 프레임의 k번째 서브블록의 에너지는 무엇보다도 하기와 같이 연산된다:
Figure 112017034913585-pct00037
이전 프레임의 평균 에너지
Figure 112017034913585-pct00038
와 이전 프레임의 후반부의 평균 에너지
Figure 112017034913585-pct00039
가 또한 메모리로부터 알려질 수 있고, 이는 (이전 프레임에 대해) 하기와 같이 연산될 수 있다:
Figure 112017034913585-pct00040
Figure 112017034913585-pct00041
여기서, 0부터 K까지의 서브블록 지수가 현재 프레임에 대응한다.
서브블록 k를 처리하기 위해, 인자의 극한값 limg , ss2(k)는 처리될 서브블록에 선행하는 세그먼트의 서브블록당 평균 에너지와 정확히 동일한 에너지를 얻도록, 연산될 수 있다. 이와 같은 값은 물론 1의 최대값으로 제한되며, 이는 여기서의 관심대상이 감쇠 값에 대한 것이기 때문이다. 보다 구체적으로:
Figure 112017034913585-pct00042
여기서, 이전 세그먼트의 평균 에너지는
Figure 112017034913585-pct00043
에 의해 근사된다.
따라서, 값 limg,ss2(k)는 서브블록의 감쇠 인자의 최종 연산의 하한 값으로 기능한다:
Figure 112017034913585-pct00044
제1 변형 실시예에서, 프리에코 구역에서의 감쇠는 현재 프레임의 시작으로부터 시작부가 검출된 서브블록의 시작까지, 즉 지수 pos까지, 연장되며, 여기서
Figure 112017034913585-pct00045
이다. 시작부의 서브블록의 샘플과 연관된 감쇠는 시작부가 이와 같은 서브블록의 종점을 향해 위치할 경우에도 모두 1로 설정된다.
다른 변형 실시예에서, 시작부의 시작 위치 pos는 예를 들어, 서브블록을 서브-서브블록으로 나눔으로써 그리고 서브-서브블록들의 에너지의 경향을 관찰함으로써, 시작부의 서브블록에서 정제된다. 시작부의 시작 위치가 서브블록 k에서 검출되고 k>0이며 정제된 시작부 pos의 시작이 이와 같은 서브블록에 위치한다고 가정하면, pos 지수 이전에 위치하는 이와 같은 서브블록의 샘플에 대한 감쇠 값이 이전 서브블록의 최종 샘플에 대응하는 감쇠 값의 함수로 초기화될 수 있다:
Figure 112017034913585-pct00046
pos 지수로부터의 모든 감쇠는 1로 설정된다.
디코딩된 신호의 저주파수 성분을 포함하는 제1 서브신호의 경우에, 서브신호 xrec , ss1(n)에 기초한 감쇠 값 연산은 디코딩된 신호 xrec(n)에 기초한 감쇠 값 연산과 유사할 수 있다. 따라서, 변형 실시예에서, 연산 복잡도를 감소시키는 관점에서, 감쇠 값들은 디코딩된 신호 xrec(n)에 기초하여 결정될 수 있다. 시작부 검출이 디코딩된 신호에 대해 이루어지는 경우에, 따라서, 서브블록의 에너지 재연산이 더 이상 필요치 않고, 이는 이와 같은 신호에 대해, 서브블록당 에너지 값이 시작부 검출을 위해 이미 연산되어 있기 때문이다. 대부분의 신호에 대하여, 저주파수가 고주파수보다 훨씬 더 에너지-집약적이기 때문에, 디코딩된 신호 xrec(n) 및 서브신호 xrec,ss1(n)의 서브블록당 에너지가 매우 가깝고, 이와 같은 근사는 매우 만족스런 결과를 제공한다.
그 후 각각의 서브블록에 대해 결정되는 감쇠 인자 gpre , ss1(n) 및 gpre , ss2(n)은 블록 경계부에서 감쇠 인자의 급작스런 변화를 회피하기 위해 샘플 단위로 적용되는 평활 함수에 의해 평활화될 수 있다. 이것은 서브신호 xrec , ss1(n)과 같은 저주파수 성분을 포함하는 서브신호에는 특히 중요하지만, 서브신호 xrec,ss2(n)과 같은 고주파수 성분만을 포함하는 서브신호에는 필요치 않다.
도 7은 화살표 L로 표시되는 평활 함수를 갖는 감쇠 이득의 적용의 예를 도시한다.
이와 같은 도면은 a)에서, 원래 신호의 일 예를, b)에서 프리에코 감쇠가 없는 디코딩된 신호를, c)에서 분해 단계 E605에 따라 획득된 2개의 서브신호의 감쇠 이득을, 그리고 d)에서 단계 E607, E608의 프리에코 감쇠와 함께 (즉, 2개의 감쇠되는 서브신호의 조합 후) 디코딩된 신호를 도시한다.
이와 같은 도면에서, 저주파수 성분을 포함하는 제1 서브신호에 대해 연산된 이득에 대응하는, 점선으로 표시된 감쇠 이득은, 상기에서 설명된 바와 같이 평활 함수를 포함한다. 고주파수 성분을 포함하는 제2 서브신호에 대해 연산되는, 실선으로 표시된 감쇠 이득은 어떠한 평활 이득도 포함하지 않는다.
d)에서 표현된 신호는 프리에코가 구현된 감쇠 처리에 의해 효과적으로 감쇠되고 있는 것을 명확하게 보여준다.
평활 함수는 예를 들어 하가의 방정식에 의해 규정되는 것이 바람직하다:
Figure 112017034913585-pct00047
관례에 따라, gpre,ss1'(n)=-(u-1),..., -1은 서브신호 xrec,ss1(n)에 선행하는 서브블록의 최종 샘플에 대해 획득된 최종 u-1의 감쇠 인자이다. 전형적으로 u=5이지만 다른 값도 사용될 수 있다. 따라서, 사용되는 평활화에 따라, 시작부 검출이 디코딩된 신호에 기초하여 공통적으로 이루어지는 경우에도, 프리에코 구역(감쇠된 샘플 수)이 개별적으로 처리되는 2개의 서브신호에 대해 상이할 수 있다.
평활화된 감쇠 인자는 시작부의 시간에서 1까지 되돌아가지 않고, 이는 시작부의 진폭 감소를 의미한다. 이와 같은 감소의 지각 가능한 영향은 매우 작지만 그럼에도 불구하고 회피되어야 한다. 이와 같은 문제를 완화시키기 위해, 시작부의 시작이 위치하는 pos 지수에 선행하는 u-1개의 샘플에 대해 감쇠 인자 값이 1로 강제될 수 있다. 이것은 평활화가 적용되는 서브신호에 대한 u-1개의 샘플만큼 pos 마커를 전진시키는 것과 대등하다. 따라서, 평활 함수는 시작부의 순간에 값 1을 갖도록 인자를 점진적으로 증가시킨다. 시작부의 진폭이 그 후 보존된다.
신호 분해를 이용하는 본 실시예에서, 본 발명에 따른 프리에코 구역의 에너지 증가의 검증은 적어도 하나의 서브신호에 대해, 또는 이와 같은 서브신호들 각각에 대해 수행된다.
사용되는 비교 임계치는 서브신호에 따라, 그리고 시작부 이전에 이용 가능한 서브블록의 수에 따라 상이할 수 있다.
적어도 하나의 서브신호에서, 정규화된 선두 계수 b1n이 이와 같은 서브신호의 임계치 미만인 경우, 프리에코의 감쇠가 모든 서브신호에 대해 금지된다.
역 MDCT 변환으로부터 유도되는 신호의 프리에코의 경우에, 프리에코 성분의 에너지가 모든 서브신호에서 증가하거나 또는 적어도 안정하다. 프리에코 처리 금지는 예를 들어, 감쇠 인자를 1로 설정함으로써, 또는 구역을 프리에코 구역으로 판별하지 않음으로써 이루어질 수 있고, 그 후 프리에코 감쇠 처리 모듈이 블록 604과 602 사이의 링크에 의해 도 5의 실시예에서 예로서 도시되는 바와 같이 호출되지 않는다.
변형예에서, 감쇠는, 정규화된 선두 계수 b1n이 이와 같은 서브신호의 임계치 미만이 되자마자, 각각의 서브신호에 대해 개별적으로 금지될 것이다. 이와 같은 금지는 예를 들어 감쇠 인자를 1로 설정함으로써, 또는 고려되는 서브신호에 대한 프리에코 모듈을 호출하지 않음으로써, 구현될 수 있을 것이다.
따라서, 2개의 서브신호로 분해되는 상기에 설명된 특정 실시예에서, 시작부 이전의 서브블록의 수가 이와 같은 검증을 가능하게 하는 경우, 시작부가 검출된 서브블록에 선행하는 서브블록의 에너지의 경향이 선형 회귀에 의해 2개의 서브신호에서 검증된다. 이와 같은 검증은 디코딩된 신호를 서브신호로 나눈(E605) 후, 그리고 프리에코의 감쇠 인자를 적용(E607)하기 전, 임의의 순간에 단계 E603, E604에 따라 이루어질 수 있다. 적어도 2개의 서브블록이 시작부가 검출된 서브블록에 선행하는 경우에 검증이 가능하다. 시작부가 제1 또는 제2 서브블록에서 검출되는 경우, 본 발명에 따른 검증이 가능하지 않다.
변형예에서, 현재 프레임의 제1 또는 제2 서브블록에서 시작부가 검출되는 경우에 이전 프레임에서 연산될 수 있는 선두 계수를 재사용하는 것이 가능할 것이다.
시작부가 제3 서브블록에서 검출되면, 그 후 프리에코 구역에서의 2개의 서브블록의 에너지가 이와 같은 검증을 행하는데 이용 가능하다. 실험에 의해, 2개의 지점으로는, 검증이 저주파수 서브신호 xrec , ss1(n)에서 충분히 신뢰할만하지 않다. 그 후 고주파수 서브신호 xrec , ss2(n)만이 검증되고, 그 에너지는 감소하지 않는다. 고주파수 서브신호 xrec , ss2(n)의 선두 계수가 0 값의 임계치와 비교된다. 그 부호만이 여기서 중요할 뿐, 어떠한 정규화도 필요치 않다. 따라서 하기와 같이 (정규화 없이) 단일 선두 계수를 단계 E603에서 연산하는 것으로 충분하다:
Figure 112017034913585-pct00048
b1ss2가 0 미만인 경우, 이와 같은 프리에코 구역에 대한 프리에코의 감쇠는 모든 서브신호에 대해 금지된다.
시작부가 제4 서브블록, 또는 4보다 큰 지수의 서브블록에서 검출되면, 시작부가 검출된 서브블록에 선행하는 프리에코 구역에서의 최종 3개의 서브블록의 에너지의 경향이 검증된다. 저주파수 서브신호 xrec , ss1(n)의 선두 계수가 0과 비교되고, 그 부호만이 중요하며, 이와 같은 계수를 정규화할 필요가 없다. 따라서, 단일 선두 계수를 연산하는 것으로 충분하다. 시작부가 id≥3인 지수 id의 서브블록에서 검출되면, 이와 같은 계수는 하기와 같이 결정된다:
Figure 112017034913585-pct00049
b1ss1이 0 미만인 경우, 프리에코의 감쇠는 이와 같은 프리에코 구역에 대해, 그리고 모든 서브신호에 대해 금지된다.
고주파수 서브신호 xrec , ss2(n)의 선두 계수가 0.2 값의 임계치와 비교된다. 정규화된 선두 계수가 연산된다. 시작부가 id≥3인 지수 id의 서브블록에서 검출되면, 이와 같은 계수는 하기와 같이 결정된다:
Figure 112017034913585-pct00050
b1nss2가 0.2 미만인 경우, 프리에코의 감쇠는 이와 같은 프리에코 구역에 대해, 그리고 모든 서브신호에 대해 금지된다.
하기의 조건에 주목해보면,
Figure 112017034913585-pct00051
상기 식은 하기 식과 등가이다:
Figure 112017034913585-pct00052
따라서, 복잡도를 감소시키고 고정 소수점 연산으로 DSP 프로세서(디지털 신호 프로세서) 상의 구현을 용이하게 하기 위해, 분할 연산(division operation)이 회피될 수 있다.
도 5의 장치(600)의 모듈(607)은 그렇게 연산된 감쇠 인자의 서브신호에의 적용에 의해 각각의 서브신호의 프리에코 구역에서의 프리에코 감쇠 단계 E607을 구현한다.
따라서, 프리에코 감쇠는 서브신호에서 독립적으로 이루어진다. 따라서, 상이한 주파수 대역을 나타내는 서브신호에서, 감쇠는 프리에코의 스펙트럼 분포의 함수로 선택될 수 있다.
마지막으로, 획득 모듈(608)의 단계 E608은 하기의 방정식에 따라, 감쇠되는 서브신호의 조합에 의해(이와 같은 예에서 간단한 가산에 의해) 감쇠된 출력 신호(프리에코 감쇠 후의 디코딩된 신호)를 획득할 수 있게 한다.
Figure 112017034913585-pct00053
서브대역으로의 종래의 분해와 달리, 사용되는 필터링이 서브신호 데시메이션(decimation) 작동과 연관되지 않고, 복잡도 및 지연("예견(lookahead)" 또는 차후 프레임)이 최소값으로 감소하는 것에 여기서 주목할 수 있다.
본 발명에 따른 감쇠 판별 및 처리 장치의 예시적인 실시예가 도 8을 참조하여 이제 설명된다.
물리적으로, 본 발명의 의미 내의 이와 같은 장치(100)는 기억 메모리 및/또는 작동 메모리와, 도 5를 참조하여 설명한 판별 및 감쇠 처리 방법의 구현에 필요한 모든 데이터를 저장하기 위한 수단으로 상기에 언급된 버퍼 메모리(MEM)를 포함하는 메모리 블록(BM)과 협력하는 프로세서(μP)를 전형적으로 포함한다. 이와 같은 장치는 디지털 신호(Se)의 연속적인 프레임을 입력으로 수신하고, 판별된 프리에코 구역에서의 프리에코 감쇠로 재구성된 신호(Sa)를 전달하며, 감소된 신호의 재구성은, 적절한 경우, 감쇠된 신호의 조합에 의해 이루어진다.
메모리 블록(BM)은 코드 명령어를 포함하는 컴퓨터 프로그램을 포함할 수 있으며, 이와 같은 코드 명령어는, 이 명령어가 장치의 프로세서(μP)에 의해 실행될 때, 본 발명에 따른 방법의 단계들, 특히, 시작부가 검출되는 서브블록에 선행하는 적어도 2개의 서브블록에 대한 에너지의 선두 계수의 연산 단계, 사전규정된 임계치에 선두 계수의 비교 단계, 및 연산된 선두 계수가 사전규정된 임계치 미만인 경우에 프리에코 구역에서의 프리에코 감쇠 처리 금지 단계를 구현한다. 도 5는 이와 같은 컴퓨터 프로그램의 알고리즘을 도시한다.
본 발명에 따른 이와 같은 판별 및 감쇠 처리 장치는 독립적이거나 디지털 신호 디코더에 포함될 수 있다. 이와 같은 디코더는 디지털 오디오 신호 스토리지, 또는 통신 네트워크의 통신 게이트웨이, 통신 단자 또는 서버와 같은 전송 장비 물품에 포함될 수 있다.

Claims (11)

  1. 변환 코딩으로부터 발생한 디지털 오디오 신호의 프리에코(pre echo)를 판별 및 감쇠시키기 위한 방법으로서,
    디코딩시에, 서브블록들로 분해된 현재 프레임에 대하여, 변이(transition) 또는 시작부(onset)가 검출(E601)되는 서브블록에 선행하는 저에너지(low-energy) 서브블록들이 프리에코 감쇠 처리가 수행(E607)되는 프리에코 구역을 결정(E602)하고,
    상기 방법은,
    시작부가 상기 현재 프레임의 제3 서브블록으로부터 검출되는 경우에:
    - 시작부가 검출되는 상기 서브블록에 선행하는 상기 현재 프레임의 적어도 2개의 서브블록들에 대한 에너지들의 선두 계수(leading coefficient)를 연산하는 단계(E603);
    - 상기 선두 계수를 사전정의된 임계치와 비교하는 단계(E604); 및
    - 연산된 선두 계수가 상기 사전정의된 임계치 미만인 경우에 상기 프리에코 구역에서의 상기 프리에코 감쇠 처리를 금지하는 단계(E602)를 포함하는 것을 특징으로 하는, 프리에코를 판별 및 감쇠시키기 위한 방법.
  2. 제1항에 있어서,
    상기 디지털 오디오 신호를 주파수 기준의 함수로서 적어도 2개의 서브신호들로 분해하는 단계를 더 포함하고,
    상기 비교하는 단계 및 상기 연산하는 단계는 상기 서브신호들 중 적어도 하나에 대해 수행되는 것을 특징으로 하는, 프리에코를 판별 및 감쇠시키기 위한 방법.
  3. 제1항에 있어서,
    상기 디지털 오디오 신호를 주파수 기준의 함수로서 적어도 2개의 서브신호들로 분해하는 단계를 더 포함하고,
    상기 연산하는 단계 및 상기 비교하는 단계는 상기 서브신호들 각각에 대해 수행되고, 연산된 선두 계수가 적어도 하나의 서브신호에 대해 상기 사전정의된 임계치 미만인 경우에 모든 서브신호들의 상기 프리에코 구역에서의 상기 프리에코 감쇠 처리의 금지가 수행되는 것을 특징으로 하는, 프리에코를 판별 및 감쇠시키기 위한 방법.
  4. 제3항에 있어서,
    각각의 서브신호에 대해 상이한 임계치가 정의되는 것을 특징으로 하는, 프리에코를 판별 및 감쇠시키기 위한 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 선두 계수는 최소 제곱 추정법에 따라 연산되는 것을 특징으로 하는, 프리에코를 판별 및 감쇠시키기 위한 방법.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 선두 계수가 정규화되는 것을 특징으로 하는, 프리에코를 판별 및 감쇠시키기 위한 방법.
  7. 제1항에 있어서,
    시작부가 상기 현재 프레임의 제1 또는 제2 서브블록에서 검출되는 경우에, 선행 프레임에 대해 연산된 선두 계수가 상기 비교하는 단계에 사용되는 것을 특징으로 하는, 프리에코를 판별 및 감쇠시키기 위한 방법.
  8. 변환 코더에 의해 발생한 디지털 오디오 신호의 프리에코를 판별 및 감쇠시키기 위한 장치로서,
    상기 장치는 디코더와 연관되고, 변이 또는 시작부 검출 모듈(601), 프리에코 구역 판별 모듈(602), 및 프리에코 감쇠 처리 모듈(607)을 포함하며, 서브블록들로 분해된 현재 프레임에 대해 에코 감쇠 처리가 수행되고, 변이 또는 시작부가 검출되는 서브블록에 선행하는 저에너지 서브블록들에서 프리에코 구역을 결정하고,
    상기 장치는,
    - 시작부가 상기 현재 프레임의 제3 서브블록으로부터 검출되는 경우에, 시작부가 검출되는 상기 서브블록에 선행하는 상기 현재 프레임의 적어도 2개의 서브블록들에 대한 에너지들의 선두 계수를 연산하는 연산 모듈(603);
    - 사전정의된 임계치와 상기 선두 계수의 비교를 수행할 수 있는 비교기(604); 및
    - 연산된 선두 계수가 상기 사전정의된 임계치 미만인 경우에 상기 프리에코 구역에서의 프리에코 감쇠 처리를 금지할 수 있는 판별 모듈(602)을 더 포함하는 것을 특징으로 하는, 프리에코를 판별 및 감쇠시키기 위한 장치.
  9. 제8항에 기재된 프리에코 판별 및 감쇠 장치를 포함하는, 디지털 오디오 신호 디코더.
  10. 프로세서에 의해 실행될 때, 제1항 내지 제4항 중 어느 한 항에 기재된 방법의 단계들을 구현하기 위한 코드 명령어들을 포함하는, 저장 매체상에 저장된 컴퓨터 프로그램.
  11. 제1항 내지 제4항 중 어느 한 항에 기재된 프리에코 판별 및 감쇠 처리 방법의 단계들을 실행하기 위한 코드 명령어들을 포함하는 컴퓨터 프로그램이 저장되는, 프리에코 판별 및 감쇠 처리 장치에 의해 판독될 수 있는 저장 매체.
KR1020177009719A 2014-09-12 2015-09-11 디지털 오디오 신호의 프리에코 판별 및 감쇠 KR102000227B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1458608 2014-09-12
FR1458608A FR3025923A1 (fr) 2014-09-12 2014-09-12 Discrimination et attenuation de pre-echos dans un signal audionumerique
PCT/FR2015/052433 WO2016038316A1 (fr) 2014-09-12 2015-09-11 Discrimination et atténuation de pré-échos dans un signal audionumérique

Publications (2)

Publication Number Publication Date
KR20170055515A KR20170055515A (ko) 2017-05-19
KR102000227B1 true KR102000227B1 (ko) 2019-07-15

Family

ID=51842602

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177009719A KR102000227B1 (ko) 2014-09-12 2015-09-11 디지털 오디오 신호의 프리에코 판별 및 감쇠

Country Status (8)

Country Link
US (1) US10083705B2 (ko)
EP (1) EP3192073B1 (ko)
JP (2) JP6728142B2 (ko)
KR (1) KR102000227B1 (ko)
CN (2) CN112086107B (ko)
ES (1) ES2692831T3 (ko)
FR (1) FR3025923A1 (ko)
WO (1) WO2016038316A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
US11100942B2 (en) * 2017-07-14 2021-08-24 Dolby Laboratories Licensing Corporation Mitigation of inaccurate echo prediction
JP7172030B2 (ja) * 2017-12-06 2022-11-16 富士フイルムビジネスイノベーション株式会社 表示装置及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010031951A1 (fr) 2008-09-17 2010-03-25 France Telecom Attenuation de pre-echos dans un signal audionumerique
FR3000328A1 (fr) 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL249503A (ko) 1959-03-19
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
FR2739736B1 (fr) * 1995-10-05 1997-12-05 Jean Laroche Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio
JP3660599B2 (ja) * 2001-03-09 2005-06-15 日本電信電話株式会社 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体
US7583724B2 (en) * 2003-12-05 2009-09-01 Aquantia Corporation Low-power mixed-mode echo/crosstalk cancellation in wireline communications
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
TWI275074B (en) * 2004-04-12 2007-03-01 Vivotek Inc Method for analyzing energy consistency to process data
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
KR101697497B1 (ko) * 2009-09-18 2017-01-18 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
US8582443B1 (en) * 2009-11-23 2013-11-12 Marvell International Ltd. Method and apparatus for virtual cable test using echo canceller coefficients
CN103325379A (zh) * 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CN103391381B (zh) * 2012-05-10 2015-05-20 中兴通讯股份有限公司 回声消除方法及装置
FR2992766A1 (fr) * 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
CN103730125B (zh) * 2012-10-12 2016-12-21 华为技术有限公司 一种回声抵消方法和设备
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
FR3023036A1 (fr) * 2014-06-27 2016-01-01 Orange Re-echantillonnage par interpolation d'un signal audio pour un codage / decodage a bas retard
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010031951A1 (fr) 2008-09-17 2010-03-25 France Telecom Attenuation de pre-echos dans un signal audionumerique
FR3000328A1 (fr) 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique

Also Published As

Publication number Publication date
CN106716529A (zh) 2017-05-24
ES2692831T3 (es) 2018-12-05
CN112086107A (zh) 2020-12-15
JP2017532595A (ja) 2017-11-02
KR20170055515A (ko) 2017-05-19
EP3192073A1 (fr) 2017-07-19
JP6728142B2 (ja) 2020-07-22
US20170263263A1 (en) 2017-09-14
US10083705B2 (en) 2018-09-25
CN106716529B (zh) 2020-09-22
FR3025923A1 (fr) 2016-03-18
JP7008756B2 (ja) 2022-01-25
CN112086107B (zh) 2024-04-02
WO2016038316A1 (fr) 2016-03-17
EP3192073B1 (fr) 2018-08-01
JP2020170187A (ja) 2020-10-15

Similar Documents

Publication Publication Date Title
KR102082156B1 (ko) 디지털 오디오 신호에서 유효 프리-에코 감쇠
KR101376762B1 (ko) 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법
JP4512574B2 (ja) 音声活動に基づくゲイン制限による音声強化についての方法、記録媒体、及び装置
RU2199157C2 (ru) Способ последующей обработки с высокой разрешающей способностью для речевого декодера
JP6076247B2 (ja) ディジタルオーディオ信号エンコーダでのノイズシェーピングフィードバックループの制御
JP7008756B2 (ja) デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
US20070232257A1 (en) Noise suppressor
US10170126B2 (en) Effective attenuation of pre-echoes in a digital audio signal
EP2458585B1 (en) Error concealment for sub-band coded audio signals
RU2719543C1 (ru) Устройство и способ для определения предварительно определенной характеристики, относящейся к обработке искусственного ограничения частотной полосы аудиосигнала
WO2010126709A1 (en) Low complexity auditory event boundary detection
US8676365B2 (en) Pre-echo attenuation in a digital audio signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant