KR101409305B1 - 정보의 부재 시에 디코더측에서의 여기를 생성하기 위한 과유성음화의 감쇄 - Google Patents

정보의 부재 시에 디코더측에서의 여기를 생성하기 위한 과유성음화의 감쇄 Download PDF

Info

Publication number
KR101409305B1
KR101409305B1 KR1020097010004A KR20097010004A KR101409305B1 KR 101409305 B1 KR101409305 B1 KR 101409305B1 KR 1020097010004 A KR1020097010004 A KR 1020097010004A KR 20097010004 A KR20097010004 A KR 20097010004A KR 101409305 B1 KR101409305 B1 KR 101409305B1
Authority
KR
South Korea
Prior art keywords
samples
signal
digital audio
audio signal
blocks
Prior art date
Application number
KR1020097010004A
Other languages
English (en)
Other versions
KR20090090312A (ko
Inventor
다비드 비레떼
발라즈 코베시
Original Assignee
오렌지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오렌지 filed Critical 오렌지
Publication of KR20090090312A publication Critical patent/KR20090090312A/ko
Application granted granted Critical
Publication of KR101409305B1 publication Critical patent/KR101409305B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Abstract

본 발명은 연속 블록으로 이루어지는 신호의 합성을 제안한다. 보다 구체적으로, 이러한 신호의 수신 시에, 이 신호의 손실된 블록 또는 오류를 갖고 있는 블록을 합성에 의해 교체하는 방법 및 장치를 개시한다. 이를 위해, 신호 합성의 생성 동안 과유성음화(overvoicing)를 감쇄시킨다. 보다 구체적으로는, 피치 주기의 듀레이션(샘플의 개수로 카운트되는)의 샘플에 가산 또는 감산의 보정을 옵션으로 적용하고, 적어도 2개의 샘플의 그룹(A', B', C', D')을 구성하여, 그룹 내의 샘플의 위치를 랜덤하게(B', C') 또는 강제 방식으로 반전시킴으로써, 이전의 블록에서 추정되거나 송신된 피치 주기(T)에 기초하여, 유성음화된 여기(excitation)가 생성된다. 그에 따라, 생성된 여기에서의 오버-하모닉서티(over-harmonicity)가 제거되어, 생성된 신호의 합성 시의 과유성음화의 효과가 감쇄된다.
Figure R1020097010004
전화통신, 스피치 신호, 디지털 오디오 신호, 디코더, 유성음화

Description

정보의 부재 시에 디코더측에서의 여기를 생성하기 위한 과유성음화의 감쇄{ATTENUATION OF OVERVOICING, IN PARTICULAR FOR GENERATING AN EXCITATION AT A DECODER, IN THE ABSENCE OF INFORMATION}
본 발명은 전화통신에서의 스피치 신호와 같은 디지털 오디오 신호의 처리에 관한 것으로, 보다 구체적으로는 이러한 신호의 복호화에 관한 것이다.
간략하면, 스피치 신호는 짧은 구간(이 예에서는 10 내지 20 ㎳)을 통해 평가되는 파라미터를 이용하여 스피치 신호의 최근의 이전 신호(예컨대, 8㎑에서는 8 내지 12개의 샘플)로부터 예측될 수 있다. 성도 전달함수(vocal tract transfer function)(예컨대, 자음을 발음하기 위한)를 나타내는 단기 예측 파라미터(short-term predictive parameter)는 선형 예측 부호화(LPC) 방법에 의해 획득된다. 성대의 진동에서 비롯되는 유성음(예컨대, 모음)의 주기성(periodicity)을 결정하기 위해 장기 상관(longer-term correlation)이 이용된다. 이러한 결정 과정에는, 적어도 화자(speaker)에 따라 통상적으로 60 ㎐(저음성) 내지 600 ㎐(고음성)에서 변화하는 유성음화된 신호(voiced signal)의 기본 주파수를 결정하는 과정을 포함한다. 그 후, 종종 "피치 주기"로 지칭되는, 구체적으로는 기본 주파수의 역(inverse)인 장기 예측자(long-term predictor)의 파라미터를 결정하기 위해 장 기 예측(LTP) 분석이 이용된다. 그 후, 피치 주기 내의 샘플의 개수가 Fe/Fo(또는 그 정수부)에 의해 정해지며, 여기서 Fe는 샘플링 레이트이고, Fo는 기본 주파수이다. 따라서, 피치 주기를 포함하는 장기 예측 LTP 파라미터는 스피치 신호(스피치 신호가 유성음화된 때의)의 기본 진동을 나타내는 한편, 단기 예측 LPC 파라미터는 이 신호의 스펙트럼 인벨로프(pectrum envelope)를 나타낸다.
스피치 부호화에서 비롯되는 이들 LPC 및 LTP 파라미터의 세트는 하나 이상의 전화통신 네트워크를 통해 블록 단위로 동종의 디코더에 전송되어, 원래의 스피치가 재구성될 수 있다.
블록 단위로 이러한 신호를 통신하는 프레임워크 내에서, 하나 이상의 연속 블록의 손실이 발생할 수 있다. "블록"이라는 표현은 신호 데이터의 연속체(succession)를 의미하며, 예컨대 이동 무선통신에서는 프레임이 되거나 또는 예컨대 인터넷 프로토콜(IP) 등을 통한 통신에서는 패킷이 될 수 있다.
예컨대, 이동 무선통신에서, 최고의 예측 합성 부호화 기술, 구체적으로는 "코드 여기 선형 예측(code excited linear predictive, CELP)" 타입의 부호화 기술은 삭제된 프레임의 복원을 위한 해법을 제시한다. 디코더는 삭제된 프레임의 발생에 대하여 예컨대 채널 디코더로부터 발원하는 프레임 삭제 정보의 전송에 의해 통지된다. 삭제된 프레임의 복원은 유효한 것으로 간주되는 하나 이상의 이전 프레임으로부터 삭제 프레임의 파라미터를 외삽(extrapolation)하는 것을 목표로 한다. 예측 부호화기에 의해 조작되거나 부호화된 특정 파라미터는 프레임 간에 높 은 상관을 갖는다. 통상적으로, 이 파라미터는 예컨대 유성음에 대해 장기 예측 LTP 파라미터와, 단기 예측 LPC 파라미터를 포함한다. 이러한 상관에 의해, 삭제된 프레임을 합성하기 위해 랜덤한 심지어는 오류가 있는 파라미터를 이용하는 것보다 최종의 유효 프레임의 파라미터를 재사용하는 것이 훨씬 더 이롭다.
표준 방식에서, CELP 여기(CELP excitation)를 생성하기 위해, 삭제된 프레임의 파라미터는 다음과 같이 획득된다. 재구성될 프레임의 LPC 파라미터가 최종의 유효 프레임의 LPC 파라미터로부터 파라미터의 단순 복사에 의해 또는 특정 댐핑(예컨대 G723.1 표준형 부호화기에서 이용되는 기술)의 도입에 의해 획득된다. 그 후, 삭제된 프레임에서의 신호의 하모닉서티의 정도(a degree of harmonicity)를 결정하기 위해 스피치 신호에서 유성음화 또는 비유성음화(non-voicing)가 검출된다. 신호가 비유성음화되면, 여기 신호가 랜덤하게 생성될 수 있다(과거 여기의 이득의 약한 댐핑에 의해, 과거 여기에서의 랜덤한 선택에 의해, 또는 전체적으로 오류를 나타낼 수 있는 추가로 전송된 코드를 이용하는 것에 의해). 신호가 유성음화되면, 일반적으로 피치 주기(또한 "LTP 지연"으로도 지칭됨)가 이전 프레임에 대해 산출되며, 이 때 옵션으로 약한 "지터"(연속적인 에러 프레임에 대해 LTP 지연의 값이 증가하며, LTP 이득이 1에 매우 근접하거나 1과 동일하게 되도록 취해짐)가 포함된다. 따라서, 여기 신호는 과거 여기로부터 실행되는 장기 예측으로 한정되지 않는다.
복호화에서의 삭제 프레임의 은닉 수단은, 일반적으로 디코더의 구조와 상당히 정도로 관련되며, 이 디코더의 예컨대 신호 합성 모듈과 같은 모듈에 공통될 수 있다. 이들 수단 또한 예컨대 삭제된 프레임 이전의 유효 프레임의 처리 동안에 저장된 과거의 여기 신호와 같은 디코더 내에서 이용 가능한 중간 신호를 이용한다.
타임-타입 부호화(time-type coding)에 따라 부호화된 데이터의 전송 동안에 손실된 패킷에 의해 발생되는 에러를 은닉하기 위해 사용되는 특정의 기술은, 흔히 파형 치환 기술(waveform substitution techniques)에 의존한다. 이러한 기술은 손실된 기간 이전에 복호화된 신호의 일부분을 선택함으로써 신호를 재구성하는 것을 목적으로 하며, 합성 모델을 구현하지는 못한다. 또한, 상이한 신호의 연결에 의해 발생되는 어색함(artifact)을 방지하기 위해 평활화 기술(smoothing techniques )이 이용된다.
변환 부호화에 의해 부호화된 신호에 대해 작동하는 디코더에 대해, 삭제된 프레임을 재구성하기 위한 기술은 일반적으로 사용된 부호화의 구조에 좌우된다. 어떠한 기술은, 손실된 변환 계수를, 삭제 전에 이들 계수에 의해 취해진 값들로부터 재생성하는 것을 목적으로 한다.
삭제된 프레임의 은닉을 위한 다른 기술이 채널 부호화와 함께 개발되었다. 이러한 기술은 채널 디코더에 의해 제공된 정보, 예컨대 수신된 파라미터의 신뢰도에 관한 정보를 이용한다. 여기서는, 본 발명의 대상이 채널 코더가 존재하는 것으로 가정하는 않는다는 것에 유의하기 바란다.
Combescure 등이 저술한 문헌 "A 16.24.32 kbit/s Wideband Speech Codec Based on ATCELP"(P. Combescure, J. Schnitzler, K. Ficher, R. Kirchherr, C. Lamblin, A. Le Guyader, D. Massaloux, C. Quinquis, J. Stegmann, P. Vary, ICASSP (1998) Conference Proceedings)에는, 변환 코더로서의 CELP 코더에 사용된 것과 동등한 삭제 프레임 은닉 방법의 사용이 제안되어 있다. 이 방법의 단점은 청취 가능한 스펙트럼 왜곡("합성" 음성, 원하지 않는 공진 등)이 유입된다는 것이다. 이러한 단점은 구체적으로 열악하게 제어된 장기 합성 필터(유성음에서의 하나의 화성 성분(harmonic component), 비유성음에서의 과거의 나머지 신호의 일부분을 이용)를 사용하는 것에 의해 비롯된다. 또한, 여기 신호 레벨에서 에너지 제어가 수행되며, 이 신호의 에너지 레벨은 전체 삭제 기간 동안 일정하게 유지되어, 역시 문제가 되는 청취 가능한 어색함(audible artifact)을 발생시킨다.
FR-2.813.722에는 더 큰 왜곡을 더 높은 에러율로 발생하지 않거나 및/또는 더 큰 왜곡을 더 긴 삭제 구간 동안 발생하지 않는 삭제된 프레임의 은닉을 위한 기술이 제안되어 있다. 이 기술은 유성음에 대한 과도한 주기성을 방지하고 또한 무성음 여기의 생성에 대한 제어를 향상시키는 것을 목적으로 한다. 이로써, 여기 신호(유성음화된 경우)가 2개의 신호의 합으로서 간주된다:
- 대역이 전체 스펙트럼의 낮은 주파수로 제한되는 높은 화성 성분, 및
- 더 높은 주파수로 제한된 또 다른 낮은 화성 성분.
높은 화성 성분은 LTP 필터링에 의해 획득된다. 제2 성분 또한 기본 주기의 랜덤한 수정에 의해 비주기성이 이루어지는 LPT 필터링에 의해 획득된다.
CELP 부호화기에 지금까지 사용된 에러 은닉 기술의 주요 문제점은, 여러 개의 연속 프레임이 손실된 경우, 여러 프레임에 걸친 동일한 피치 주기의 반복으로 인해 과유성음화 효과(overvoicing effect)를 초래할 수 있다는 것이다.
본 발명은 이러한 상황에 맞는 개선을 제공한다.
이를 위해, 본 발명은, 샘플의 연속적인 블록에 의해 표현된 디지털 오디오 신호의 수신 시에, 하나 이상의 유효하지 않은 블록을, 상기 유효하지 않은 블록에 선행하는 하나 이상의 유효 블록의 샘플로부터 생성되는 교체 블록으로 교체하기 위해, 상기 디지털 오디오 신호를 합성하는 방법을 제공한다.
본 발명에 따른 방법은 이하의 단계를 포함한다:
a) 상기 유효하지 않은 블록에 선행하는 하나 이상의 유효 블록에서 연속체(succession)를 형성하는 선별된 개수의 샘플을 선택하는 단계;
b) 상기 샘플의 연속체를 샘플의 그룹(A, B, C, D)으로 분할하고, 그룹의 적어도 일부 그룹에서, 소정의 규칙에 따라 샘플을 반전시키는 단계;
c) 적어도 상기 교체 블록의 일부분(T")을 형성하기 위해, 적어도 일부분이 상기 단계 b)에서 반전되었던 샘플인 그룹(A', B', C', D')을 재연결하는 단계; 및
d) 상기 c) 단계에서 획득된 상기 일부분이 상기 교체 블록의 전체를 채우지 못하면, 상기 일부분(T")을 상기 교체 블록에 복사하고, 복사된 부분에 대해 다시 상기 a), b) 및 c) 단계를 적용하는 단계.
컴퓨터 연산 및 처리 수단을 통해 저비용으로 이루어지는 매우 간단한 샘플 조작으로 이루어지는 샘플의 이러한 반전은, 피치 주기의 샘플 복사가 이용되는 경우에 나타날 수도 있는 오버-하모닉서티(over-harmonicity)를 제거하는 것을 목적으로 한다.
그러므로, 본 발명에 의해 제공된 이점 중에서도, 본 발명의 구현을 위해서는 매우 낮은 컴퓨터 연산 비용만을 필요로 한다는 이점이 있다.
본 발명은, 디지털 오디오 신호가 유성음화된 스피치 신호 및 특히 약하게 유성음화된 스피치 신호인 경우에, 피치 주기의 간단한 복사가 보통의 결과를 얻을 수 있기 때문에, 이 경우에 적용될 수 있다는 이점이 있다. 그러므로, 이러한 유익한 특징에 따라, 스피치 신호에서 유성음화된 정도가 검출되며, 신호가 적어도 약하게 유성음화된 경우에는 상기한 a) 내지 d) 단계가 적용된다.
본 발명은 상기 b) 단계에서의 그룹을 구성하기 위해 디지털 오디오 신호의 기본 주파수에 좌우된다는 이점이 있다. 그러므로, 상기 a) 단계에서는,
a1) 상기 디지털 오디오 신호에서 음조(tone)를 검출하고,
a2) 상기 a) 단계에서 선택된 샘플의 선별된 개수가, 검출된 음조의 기본 주파수의 역에 대응하는 주기(T)에 의해 이루어지는 샘플의 개수에 대응한다.
당연히, 스피치 신호의 경우에, 상기 a1) 단계는 유성음화를 검출하는 단계를 포함할 수 있으며, 상기 a2) 단계는, 스피치 신호가 유성음화되었다면, 전체 피치 주기(음성 톤의 기본 주파수의 역)에 걸쳐 연장하는 샘플의 개수를 선택하는 단계를 포함할 것이다. 한편, 이러한 구현에서는, 전체적인 음악 톤에 특정되는 기본 주파수가 검출될 수 있다면, 스피치 신호 이외의 신호, 특히 음악 신호를 포함할 수 있다.
실시예에서, 상기 b) 단계의 분할은 2개의 샘플의 그룹 단위로 수행되며, 단일 그룹의 샘플의 위치가 서로 반전될 수 있다.
그러나, 본 실시예에서는, 피치 주기(또는, 보다 일반적으로는, 기본 주파수의 역주기)가 짝수 개의 샘플을 포함하는지 아니면 홀수 개의 샘플을 포함하는지를 구별하는 것이 좋다. 구체적으로, 검출된 음조의 주기에 의해 이루어진 샘플의 개수가 짝수이면, 상기 a) 단계의 선택을 형성하기 위해 상기 주기의 샘플로부터 홀수 개의 샘플(바람직하게는, 1개의 샘플)을 추가하거나 감산하는 것이 이롭다.
"소정의 반전 규칙"이 무엇을 의미하는지를 구체화하는 것이 바람직하다. 수신된 신호의 특성에 따라 선택될 수 있는 이러한 규칙은, 구체적으로 상기 b) 단계에서의 그룹 당의 샘플의 개수와, 그룹 내의 샘플을 반전시키는 방식을 암시한다. 상기한 실시예에서, 2개의 샘플의 그룹 및 2개의 샘플의 각각의 위치의 간단한 반전이 제공된다. 그러나, 다른 구성(그룹이 2개보다 많은 샘플과 이러한 그룹의 모든 샘플의 치환을 포함하는 구성)도 가능하다. 또한, 반전 규칙은 반전이 수행되는 그룹의 개수를 설정할 수도 있다. 특정의 실시예는, 각각의 그룹 내의 샘플 반전의 인스턴스(instance)를 랜덤화하는 것과, 그룹의 샘플을 반전시키거나 반전시키지 않기 위한 확률 임계치를 설정하는 것을 포함한다. 이러한 확률 임계치는 고정 값 또는 가변 값을 가질 수 있으며, 피치 주기에 관한 상관 함수에 좌우되는 것이 이롭다. 이 경우, 피치 주기 자체에 대한 결정은 불필요하다. 또한, 보다 일반적으로, 본 발명의 사상 내에서의 처리는, 수신된 유효 신호가 단순히 비유성음화된 경우에도 수행될 수 있으며, 그 경우 실제의 검출 가능한 피치 주기는 존재하지 않는다. 이러한 경우에, 소정의 임의의 개수의 샘플을 설정하고(예컨대, 200개의 샘플), 이러한 개수의 샘플에 대해 본 발명의 사상 내에서의 처리를 수행할 수 있다. 또한, 값의 간격에 대한 탐색(예컨대, MAX_PITCH/2와 MAX_PITCH 사이, 여기서 MAX_PITCH는 피치 주기 탐색에서의 최대값)을 제한함으로써, 상관 함수의 최대치에 대응하는 값을 취하는 것도 가능하다.
과유성음화의 감쇄를 제안하는 본 발명은 이하의 장점을 제공한다:
- 블록의 손실 동안 합성된 스피치가 실제로 오버-하모닉서티 또는 과유성음화 현상을 더 이상 나타내지 않으며,
- 이하에 구체적으로 설명되는 실시예로부터 명백해지는 바와 같이, 유성음화된 여기를 생성하는 데 필요한 복잡도가 매우 낮아진다.
또한, 본 발명의 특징 및 장점은 예시를 목적으로 하는 상세한 설명 및 첨부 도면을 통해 명백하게 될 것이다.
도 1은, 샘플의 랜덤한 반전을 통합함으로써, 전체 피치 주기에 걸쳐, 2개의 샘플의 블록에 대하여 과유성음화 효과가 도시된 예에서는 50%의 확률로 감쇄되도록 하는 여기 생성(excitation generation)의 원리를 도시하는 도면이다.
도 2는, 전체 피치 주기에 걸쳐, 도시된 예에서는 2개의 샘플의 블록에 대해, 체계적으로 이루어지는 샘플의 반전을 통합한 여기 생성의 원리를 도시하는 도면이다.
도 3a는 도 2의 체계적인 반전을 홀수 개의 샘플을 포함하는 상태에서 피치 주기가 추정되는 신호에 적용하는 예를 나타내는 도면이다.
도 3b는, 순수하게 예시를 목적으로, 도 2의 체계적인 반전을 짝수 개의 샘플을 포함하는 상태에서 피치 주기가 추정되는 신호에 적용하는 예를 나타내는 도면이다.
도 3c는, 피치 주기에 대응하는 듀레이션에 샘플을 추가하는 보정을 행하여, 포함하고 있는 샘플의 개수를 통해 이러한 듀레이션을 홀수로 하기 위해, 도 2의 체계적인 반전을 적용하는 예를 나타내는 도면이다.
도 4는 복호화측에서의 본 발명의 사상 내에서의 방법의 주요 단계를 도식적으로 예시하는 도면이다.
도 5는 본 발명의 사상 내에서의 방법의 구현을 위해 합성 장치를 포함하는 디지털 오디오 신호 수신 장치의 구조를 도식적으로 예시하는 도면이다.
먼저, 본 발명의 실시 내용을 예시하기 위해 도 4를 참조한다. 복호화 시에 입력 신호(Si)를 수신하면, 하나 이상의 연속 블록의 손실이 검출된다(단계 50). 블록이 손실되지 않은 것으로 판명되면(단계 50의 출력에서 화살표 Y), 당연히 문제가 없는 것이며, 도 4의 처리가 종료된다.
한편, 하나 이상의 연속 블록의 손실이 판명되면(단계 50의 출력에서 화살표 N), 신호의 유성음화의 정도(degree of voicing)가 검출된다(단계 51).
신호가 비유성음화되면(단계 51의 출력에서 화살표 N), 손실 블록은 예컨대 "컴포트 노이즈(comfort noise)"(52)로 지칭되는 청취 가능한 화이트 노이즈에 의해 교체되며, 이와 같이 하여 재구성된 블록의 샘플의 이득(61)이 조정된다. 재구 성된 신호(So)의 에너지에 대해 진화 법칙(evolution law)을 적용하여 제어를 행하거나, 및/또는 컴포트 노이즈(52)와 같은 리셋 신호에 대한 모드 변경의 파라미터를 구성할 수 있다.
본 발명의 변형예에서, 단지 2개 부류의 신호, 즉 유성음화된 신호와, 약하게 유성음화된 신호 또는 비유성음화된 신호가 고려된다. 이러한 변형예의 이점은, 비유성음화된 신호의 생성이 약하게 유성음화된 합성(weakly voiced synthesis)과 동일하게 될 것이라는 점이다. 전술한 바와 같이, 비유성음화된 신호에 대해 사용된 "피치 주기"는 랜덤한 값으로, 꽤 큰 것이 바람직하다(예컨대, 200 개의 샘플). 비유성음화된 블록에서, 이전의 신호는 비화성(non-harmonic)이며, 본 발명의 요지 내에서의 처리를 충분히 큰 주기에 적용함으로써, 이와 같이 생성된 신호가 비화성을 유지하도록 보장될 수 있다. 신호의 특성은 유지되는 것이 이로울 것이며, 이것은 랜덤하게 생성된 신호(예컨대, 화이트 노이즈)를 이용할 때의 경우에는 이루어지지 않을 것이다.
신호가 높게 유성음화되면(단계 51의 출력에서 화살표 Y), 손실 블록은 피치 주기 T를 복사함으로써 교체된다. 그러므로, 수신된 신호의 최종의 유효 부분에서 식별된 피치 주기 T가 결정된다(공지된 임의의 기술(53)을 이용하여). 이 피치 주기 T의 샘플이 손실 블록에 복사된다. 그 후, 적합한 이득(61)이 샘플에 가해져 교체된다(예컨대, 감쇄 또는 "페이딩"을 실행하기 위해).
전술한 예에서, 신호가 평균적으로 유성음화되면(또는, 덜 복잡하고 보다 일반적인 변형예에서는, 신호가 간략하게 유성음화되면), 본 발명의 사상 내의 방법 이 적용된다(유성음화의 정도와 관련된 단계 51의 출력에서 화살표 A).
도 1 및 도 2를 참조하면, 본 발명의 원리는 수신된 최종의 유효 블록의 샘플을 적어도 2개의 샘플을 그룹으로 하여 통합하는 것을 포함한다. 도 1 및 도 2의 예에서, 이들 샘플은 쌍으로 그룹화되어 유효화된다. 그러나, 이들 샘플은 2개보다 큰 샘플 단위로 그룹화될 수도 있으며, 이 경우에는, 그룹 단위로 또한 상세히 후술되는 피치 주기 T의 샘플의 번호에서의 패리티를 고려하여 샘플을 반전시키는 규칙이 다소 채용될 것이다.
특히 도 2를 참조하면, 수신된 최종의 유효 블록 내의 2개의 샘플의 그룹 A, B, C, D가 복사되어, 수신된 최종 샘플과 연결된다. 그러나, A', B', C', D'로 나타내어져 있는 이들 복사된 그룹에서, 각각의 그룹 내의 2개의 샘플의 값은 반전되어 있다(또는, 이들 값이 유지되고, 이들의 각각의 위치가 반전되어 있다). 그러므로, 그룹 A는 이들의 2개의 샘플이 그룹 A에 관련하여 반전되어 있는(도 2의 그룹 A'의 2개의 화살표에 따라) 그룹 A'이 된다. 그룹 B는 이들의 2개의 샘플이 그룹 B에 관련하여 반전되어 있는 그룹 B'가 되고, 나머지들도 동일한 양상으로 된다. 그룹 A', B', C', D'의 복사 및 연결은 피치 주기 T를 유념하면서 실행되는 것이 바람직하다. 그러므로, 그룹 A의 반전된 샘플로 구성되는 그룹 A'은 피치 주기 T의 듀레이션에 대응하는 샘플의 개수만큼 그룹 A로부터 떨어져 있게 된다. 마찬가지로, 그룹 B는 피치 주기 T에 대응하는 듀레이션만큼 그룹 B로부터 떨어져 있게 되며, 나머지들도 동일한 양상으로 된다.
도 2에서, 그룹 단위의 샘플의 반전은 체계적으로 이루어진다. 도 1에 나타 낸 바와 같은 변형예에서, 이러한 반전의 발생은 랜덤화될 수 있다. 변형예는 그룹의 샘플을 반전시키거나 반전시키지 않기 위한 확률 임계치 p를 설정하도록 제공될 수 있다. 도 1에 나타낸 예에서, 임계치 p는 4개 중의 2개의 그룹 B' 및 C'만이 반전된 샘플을 갖도록 50%로 설정된다. 또한, 확률의 임계치 p를 가변적으로 하도록, 특히 아래에 나타낸 바와 같이 피치 주기 T에 관한 상관 함수에 좌우되도록 제공될 수 있다.
도 2에 예시된 실시예를 다시 참조하면, 그룹 단위의 샘플의 체계적인 반전(systematic inversion)이 적용되며, 도 3a를 참조하면, 피치 주기 T에 대응하는 듀레이션을 갖지만 쌍을 이루고 있는 샘플의 반전을 갖는 샘플 T'의 새로운 연속체가 획득된다. 도 3a에는, 신호 Si에서 수신되고 디코더에 저장되어 있는 최종의 유효 블록의 최종 샘플이 도시되어 있다. 이 경우, 반전이 체계적이고 랜덤하지 않기 때문에, 추정 상관(estimated correlation)을 이용하면, 유성음화된 신호의 피치 주기 T가 결정되며(공지의 수단에 의해), 피치 주기 T의 듀레이션에 걸쳐 연장하는 신호 Si의 최종 샘플(10, 11,..,22)이 수집된다. 2개의 최초 샘플(10, 11)은 "So"로 표시된 재구성될 신호에서 반전된다. 제3 및 제4 샘플(12, 13) 또한 반전되며, 나머지들도 마찬가지로 반전된다. 피치 주기와 동일한 듀레이션에 걸쳐 연장하는 샘플(11, 10, 13, 12,...)의 연속체 T'이 획득된다. 여러 개의 피치 주기에 걸쳐 연장하는 여러 개의 블록이 복호화 시에 손실되어 있다면, 연속체 T'를 취하고 연속체 T'의 쌍에서의 샘플의 반전을 재개하여 새로운 연속체 T" 등을 획득함으로써 신호 So의 재구성이 지속된다.
도 3a의 경우에, 주기 T, T', T" 당의 샘플의 개수는 홀수(도시된 예에서는 13개의 샘플)이며, 이에 의해 신호 So의 재구성이 진행되고 있을 때에 샘플의 점진적인 혼합 및 오버-하모닉서티(over-harmonicity)(즉, 재구성된 신호의 과유성음화)의 효과적인 감쇄를 획득할 수 있게 된다.
한편, 도 3b에 도시된 경우에, 주기 T, T', T" 당의 샘플의 개수는 짝수(도시된 예에서는 12개의 샘플)이며, 피치 주기 T의 쌍을 이루고 있는 샘플의 2회 반전(주기 T에서 T'으로, 그리고나서 주기 T'에서 T"으로)을 수행함으로써, 연속체 T"에서의 피치 주기 T와 동일한 연속체가 발견되어, 오버-하모닉서티를 발생한다.
이 문제점은 그룹당 반전될 샘플의 개수를 수정함으로써(또한 예컨대 그룹당 홀수 개의 샘플을 취함으로써) 해소될 수 있다.
또한, 도 3c에는 추가의 실시예가 도시되어 있다. 본 실시예는, 피치 주기가 짝수 개의 샘플을 포함하고 있을 때에 또한 반전이 그룹당 짝수 개의 샘플을 수반하고 있을 때에, 재구성될 신호의 피치 주기에 홀수 개의 샘플을 추가하는 것을 포함한다. 도 3c에서, 최종의 검출된 피치 주기 T는 12개의 샘플(31, 32,..., 42)을 포함한다. 그러므로, 피치 주기에 하나의 샘플이 추가되며, 홀수 개의 샘플을 포함하는 주기 T+1이 획득된다. 따라서, 도 3c에 도시된 예에서, 샘플(30)은 도 2(또는 도 3a)에 예시된 바와 같이 쌍을 이루고 있는 샘플의 반전이 적용되는 것에 의해 메모리의 제1 샘플이 된다. 주기 T"를 획득하기 위해 쌍을 이루고 있는 샘플의 반전이 다시 적용되는 홀수 개의 샘플을 구성하고, 다시 홀수 개의 샘플을 포함하는 재구성된 신호 So의 주기 T'가 획득된다. 주기 T"의 샘플(33, 30, 35, 32, 34 등)의 연속체는 이때 원래의 피치 주기 T의 샘플(30, 31, 32, 33 등)의 연속체와는 매우 상이하다.
도 2, 도 3a 및 도 3c에 예시된 실시예를 구현하는 도 4를 참조하면, 신호 Si가 평균적으로 유성음화될 때(단계 51의 출력에서 화살표 A), 유효하게 수신된 신호 Si의 최종 샘플에 대해 피치 주기 T가 결정된다(공지의 기술(56)에 의해). 피치 주기 T 내의 샘플이 홀수인지 아니면 짝수인지의 여부에 대한 검출이 수행된다. 홀수인 경우(단계 57의 출력에서의 화살표 A), 도 3a를 참조하여 전술한 바와 같이, 쌍을 이루고 있는 샘플의 반전(단계 58)이 직접 수행된다. 피치 주기 T의 샘플의 개수가 짝수인 경우(단계 57의 출력에서 화살표 Y), 피치 주기 T에 샘플이 추가되고(단계 59), 쌍을 이루고 있는 샘플의 반전(단계 58)이 도 3c를 참조하여 전술한 처리에 따라 수행된다. 그 후, 옵션으로, 최종적으로 재구성된 신호 So를 형성하기 위해, 이와 같이 획득된 샘플의 연속체에 선별된 이득(chosen gain)(61)이 가해진다.
도 4를 참조하여 앞에서 나타낸 바와 같이, 피치 주기는 먼저 하나 이상의 이전 프레임으로부터 계산된다. 그리고나서, 감소된 하모닉서티 여기(reduced harmonicity excitation)가 도 2에 예시된 방식으로 체계적인 반전으로 생성된다. 그러나, 도 1에 예시된 변형예에서는, 감소된 하모닉서티 여기가 랜덤한 반전으로 생성될 수 있다. 유성음화된 여기 샘플의 이러한 불규칙적인 반전은 오버-하모닉서티를 감쇄시킬 수 있어 이롭다. 이하에서는 이러한 유용한 실시예를 구체적으로 설명한다.
일반적으로, 피치 주기의 단순 복사에서는, 유성음화된 여기가 아래의 수식에 따라 계산된다:
s(n) = gltpㆍs(n-T) (1)
여기서, T는 추정된 피치 주기이며, gltp는 선택된 LTP 이득이다.
본 발명의 실시예에서, 유성음화된 여기는 2개의 샘플의 그룹당으로 계산되며, 그 후의 처리에 따라 랜덤한 반전으로 계산된다. 먼저, 임의의 수 x가 구간 [0; 1]에서 생성된다. 그 후, x의 값에 따라,
ㆍ x<p인 경우, 수식 (1)로부터 s(n) 및 s(n+1)이 계산된다.
ㆍ x≥p인 경우, 이하의 수식 (2) 및 (3)에 따라 s(n) 및 s(n+1)이 계산된다.
s(n) = gltpㆍs(n-T+1) (2)
s(n+1) = gltpㆍs(n-T) (3)
p는 2개의 샘플 s(n)과 s(n+1)을 반전시킬 확률을 나타낸다. 예컨대, p는 p=50%가 되도록 설정될 수 있다.
유용한 변형예에서, 예컨대 이하의 형태로 가변의 확률이 선택될 수 있다:
p = corr (4)
여기서, 변수 corr 은 피치 주기에 걸친 상관 함수의 최대값에 대응하고, Corr(T)로 표현된다. 피치 주기 T에 대해, 상관 함수 Corr(T)는 저장된 신호의 종료 시에 2*Tm 개의 샘플만을 이용하여 다음과 같이 계산된다:
Figure 112009029223179-pct00001
(5)
여기서, m0...mLmem-1은 이전에 디코드된 신호의 최종 샘플이며, 디코더 메모리에서 여전히 이용 가능하다.
이 수식으로부터, 이 메모리 Lmem의 길이(저장된 샘플의 개수)는 피치 주기(샘플의 수)의 듀레이션의 최대값의 적어도 2배와 동등하게 되어야 한다. 최저의 음성(50 ㎐ 정도의 최저 기본 주파수)을 고려하기 위해, 저장될 샘플의 개수는 낮은 협대역 샘플링 레이트에 대해서는 300개 정도이고, 그 이상의 샘플링 레이트에 대해서는 300개보다 많다.
수식 (5)에 의해 제공된 상관 함수 corr(T)는 변수 T가 피치 주기 T0에 대응할 때 최대값에 도달하며, 이 최대값은 유성음화의 정도에 대한 표시를 제공한다. 통상적으로, 이 최대값이 1에 매우 근접하면, 신호는 높게 유성음화된다. 이 최대값이 0에 근접하면, 신호는 유성음화되지 않는다.
그러므로, 본 실시예에서, 피치 주기의 사전 결정은 반전될 샘플의 그룹을 구성하는 데 필수적이지 않다라는 것을 이해할 수 있을 것이다. 구체적으로, 피치 주기 T0의 결정은 상기한 수식 (5)를 적용함으로써 본 발명의 사상 내에서의 그룹의 구성과 함께 수행될 수 있다.
신호가 높게 유성음화되면, 확률 p는 매우 높을 것이며, 유성음화가 수식 (1)에 따른 계산에 따라 유지될 것이다. 한편, 신호 Si의 유성음화가 아주 현저하지 않다면, 확률 p는 낮게 될 것이며, 수식 (2) 및 (3)을 이용하는 것이 이롭다.
다른 상관 계산이 이용될 수도 있음은 자명하다.
예컨대, 또한 소정의 부류에 따라 화성 여기를 계산하는 것도 가능하다. 높게 유성음화된 부류에 대해, 수식 (1)이 사용되는 것이 바람직하다. 평균적으로 또는 약하게 유성음화된 부류에 대해서는, 수식 (2) 및 (3)이 사용되는 것이 바람직하다. 비유성음화된 부류에 대해서는, 하모닉서티 여기가 생성되지 않고, 화이트 노이즈로부터 여기가 생성될 수 있다. 그러나, 전술한 변형예에서, 수식 (2) 및 (3)은 충분하게 큰 임의의 피치 주기와 함께 사용된다.
보다 일반적으로, 본 발명은 단지 예로서 설명된 실시예로 한정되지 않고, 다른 변형예로 확장될 수 있다.
앞에서 구체적으로 설명된 본 발명의 실시예에서는, CELP 예측 합성에 의한 부호화에서의 여기 생성은 프레임 전송 오류 은닉의 관점에서 과유성음화를 방지하는 것을 목적으로 한다. 한편, 대역 확장을 위해 본 발명의 원리를 이용하는 것도 가능하다. 그러므로, CELP(또는 CELP 부대역) 타입의 모델에 기초하여, 대역 확장 시스템(데이터 전송이 이루어지거나 또는 이루어지지 않는)에서 확장된 대역폭 여기의 생성을 이용하는 것이 가능하다. 따라서, 전술한 바와 같이 높은 대역 여기가 계산될 수 있으며, 이에 의해 여기의 오버-하모닉서티를 제한하는 것이 가능하게 된다.
또한, 본 발명의 구현예는, 복잡도의 제한을 보장하면서, 패킷이 손실되어 있을 때에 IP를 통해 수용 가능한 품질을 제공하기 위해, 예컨대 "VOIP(voice over internet protocol)"와 같은 네트워크를 통한 신호의 프레임 또는 패킷 전송에 특히 적합하다.
샘플의 반전은 2개보다 큰 사이즈의 샘플의 그룹에 대해 수행될 수 있음은 자명하다.
또한, 유효하지 않은 블록 이전의 유효 블록의 샘플로부터 유효하지 않은 블록에 대한 교체 블록을 생성하는 것에 대해 앞에서 설명한 바 있다. 변형예에서는, 유효하지 않은 블록의 합성을 수행하기 위해 유효하지 않은 블록에 후속하는 유효 블록에 의존하는 것도 가능하다(후방 합성). 이러한 구현예는 특히 여러 개의 연속적인 유효하지 않은 블록의 합성 및 구체적으로는 이하의 블록의 합성에 유익하다:
- 선행하는 유효 블록을 바로 후속하는 유효하지 않은 블록을 이들 선행 블록으로부터 합성,
- 후속하는 유효 블록의 바로 앞의 유효하지 않은 블록을 이들 후속 블록으로부터 합성.
본 발명은 디지털 오디오 신호 합성 장치의 메모리에 저장될 컴퓨터 프로그램을 포함한다. 이 프로그램은, 프로세서 또는 이러한 합성 장치에 의해 실행될 때에 본 발명의 사상 내에서의 방법을 구현하기 위한 명령어를 포함한다. 또한, 전술한 도 4는 이러한 컴퓨터 프로그램의 흐름도를 예시할 수 있다.
또한, 본 발명은 블록의 연속체에 의해 구성된 디지털 오디오 신호 합성 장치를 포함한다. 디지털 오디오 신호 합성 장치는 전술한 컴퓨터 프로그램을 저장하기 위한 메모리를 추가로 포함할 수 있다. 도 5를 참조하면, 디지털 오디오 신호 합성 장치(SYN)는 이하의 구성요소를 포함한다:
- 합성될 적어도 하나의 현재 블록을 선행하는 신호 Si의 블록을 수신하기 위한 입력(I), 및
- 합성된 신호 So를 전달하고 또한 적어도 이러한 합성될 현재 블록을 포함하는 출력(O).
본 발명의 사상 내에서의 합성 장치(SYN)는 작업 저장 메모리(MEM)(또는 전술한 컴퓨터 프로그램을 저장하기 위한 메모리)와 같은 수단, 및 메모리(MEM)와 연동하는 프로세서(PROC)를 포함하며, 본 발명의 사상 내의 방법을 구현하고, 신호 Si의 선행 블록 중의 적어도 하나로부터 개시되는 현재 블록을 합성한다.
본 발명은 또한 예컨대 블록의 연속체에 의해 구성된 디지털 오디오 신호의 디코더와 같은 디지털 오디오 신호 수신 장치를 포함한다. 도 5를 다시 참조하면, 디지털 오디오 신호 수신 장치는 유효하지 않은 블록의 검출기(DET)와, 검출기(DET)에 의해 검출된 유효하지 않은 블록을 합성하기 위한 본 발명의 사상 내의 합성 장치(SYN)를 포함하는 것이 이롭다.

Claims (11)

  1. 샘플의 연속적인 블록에 의해 표현된 디지털 오디오 신호의 수신 시에, 하나 이상의 유효하지 않은 블록을, 상기 유효하지 않은 블록에 선행하는 하나 이상의 유효 블록의 샘플로부터 생성되는 교체 블록으로 교체하기 위해, 상기 디지털 오디오 신호를 합성하는 방법으로서,
    a) 상기 유효하지 않은 블록에 선행하는 하나 이상의 유효 블록에서 연속체(succession)를 형성하는 선별된 개수의 샘플을 선택하는 단계;
    b) 상기 샘플의 연속체를 샘플의 그룹(A, B, C, D)으로 분할하고, 그룹의 적어도 일부 그룹에서, 소정의 규칙에 따라 샘플을 반전시키는 단계;
    c) 적어도 상기 교체 블록의 일부분(T")을 형성하기 위해, 적어도 일부분이 상기 단계 b)에서 반전되었던 샘플인 그룹(A', B', C', D')을 재연결하는 단계; 및
    d) 상기 c) 단계에서 획득된 상기 일부분이 상기 교체 블록의 전체를 채우지 못하면, 상기 일부분(T")을 상기 교체 블록에 복사하고, 복사된 부분에 대해 다시 상기 a), b) 및 c) 단계를 적용하는 단계
    를 포함하는 디지털 오디오 신호 합성 방법.
  2. 제1항에 있어서,
    상기 디지털 오디오 신호는 스피치 신호이며, 상기 스피치 신호에서 유성음화(voicing)의 정도(51)가 검출되며, 상기 신호가 적어도 약하게 유성음화된 경우 에 상기 a) 내지 d) 단계가 적용되는, 디지털 오디오 신호 합성 방법.
  3. 제1항에 있어서,
    상기 디지털 오디오 신호는 스피치 신호이며,
    상기 스피치 신호에서 유성음화의 정도(51)가 검출되며, 상기 신호가 약하게 유성음화되거나 또는 유성음화되지 않은 경우에 상기 a) 내지 d) 단계가 적용되는, 디지털 오디오 신호 합성 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 a) 단계를 수행하기 위해,
    a1) 상기 디지털 오디오 신호에서 음조(tone)를 검출하며(56),
    a2) 상기 a) 단계에서 선택된 샘플의 선별된 개수가, 검출된 음조의 기본 주파수의 역에 대응하는 주기(T)에 포함되는 샘플의 개수에 대응하는,
    디지털 오디오 신호 합성 방법.
  5. 제4항에 있어서,
    상기 b) 단계에서의 분할은 2개의 샘플의 그룹 단위로 수행되며, 단일 그룹(B', C')의 샘플의 위치가 서로 반전되는, 디지털 오디오 신호 합성 방법.
  6. 제5항에 있어서,
    검출된 음조의 주기(T)에 포함된 샘플의 개수가 짝수이면, 상기 a) 단계의 선택을 형성하기 위해 상기 주기(T)의 샘플로부터 홀수 개의 샘플(30)이 추가되거나 감산되는, 디지털 오디오 신호 합성 방법.
  7. 제4항에 있어서,
    상기 소정의 규칙은, 각각의 그룹 내의 샘플의 반전의 인스턴스(instance)가 랜덤화되고, 또한 확률 임계치(p)가 그룹의 샘플을 반전시키거나 반전시키지 않도록 설정되는 것을 요구하는, 디지털 오디오 신호 합성 방법.
  8. 제7항에 있어서,
    상기 확률 임계치(p)는 가변적이며, 상기 주기(T)에 관한 상관 함수에 좌우되는, 디지털 오디오 신호 합성 방법.
  9. 디지털 오디오 신호 합성 장치의 비-일시적(non-transitory) 컴퓨터 판독가능 저장 매체로서,
    실행 가능한 프로그램이 상기 비-일시적 컴퓨터 판독가능 저장 매체에 저장되고,
    상기 실행 가능한 프로그램은,
    이러한 합성 장치의 프로세서에 의해 실행될 때에 청구항 1 내지 청구항 3 중의 어느 하나에 따른 방법을 구현하기 위한 명령어를 포함하는, 디지털 오디오 신호 합성 장치의 비-일시적 컴퓨터 판독가능 저장 매체.
  10. 블록의 연속체에 의해 구성된 디지털 오디오 신호의 합성 장치에 있어서,
    - 합성될 적어도 하나의 현재 블록에 선행하는, 신호(Si)의 블록을 수신하기 위한 입력; 및
    - 합성된 신호(So)를 전달하고 또한 적어도 상기 현재 블록을 포함하는 출력
    을 포함하며,
    선행 블록 중의 하나 이상으로부터 개시하는 현재 블록을 합성하기 위해, 청구항 1 내지 청구항 3 중의 어느 하나에 따른 디지털 오디오 신호 합성 방법을 구현하기 위한 수단(MEM 및 PROC)을 포함하는,
    디지털 오디오 신호 합성 장치.
  11. 블록의 연속체에 의해 구성된 디지털 오디오 신호를 수신하는 장치에 있어서,
    유효하지 않은 블록을 검출하는 검출기(DET); 및
    유효하지 않은 블록을 합성하기 위한 청구항 10에 따른 디지털 오디오 신호 합성 장치(SYN)
    를 포함하는 디지털 오디오 신호 수신 장치.
KR1020097010004A 2006-10-20 2007-10-17 정보의 부재 시에 디코더측에서의 여기를 생성하기 위한 과유성음화의 감쇄 KR101409305B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0609225 2006-10-20
FR0609225 2006-10-20
PCT/FR2007/052188 WO2008047051A2 (fr) 2006-10-20 2007-10-17 Attenuation du survoisement, notamment pour la generation d'une excitation aupres d'un decodeur, en absence d'information

Publications (2)

Publication Number Publication Date
KR20090090312A KR20090090312A (ko) 2009-08-25
KR101409305B1 true KR101409305B1 (ko) 2014-06-18

Family

ID=38011219

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097010004A KR101409305B1 (ko) 2006-10-20 2007-10-17 정보의 부재 시에 디코더측에서의 여기를 생성하기 위한 과유성음화의 감쇄

Country Status (11)

Country Link
US (1) US8417520B2 (ko)
EP (1) EP2080194B1 (ko)
JP (1) JP5289319B2 (ko)
KR (1) KR101409305B1 (ko)
CN (1) CN101573751B (ko)
AT (1) ATE536613T1 (ko)
BR (1) BRPI0718423B1 (ko)
ES (1) ES2378972T3 (ko)
MX (1) MX2009004212A (ko)
RU (1) RU2437170C2 (ko)
WO (1) WO2008047051A2 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL196146A (en) * 2008-12-23 2014-01-30 Elta Systems Ltd Signal transmission system and method back to the source of transmission
GB0920729D0 (en) * 2009-11-26 2010-01-13 Icera Inc Signal fading
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
FR3004876A1 (fr) * 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.
EP3011561B1 (en) 2013-06-21 2017-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved signal fade out in different domains during error concealment
KR101854296B1 (ko) 2013-10-31 2018-05-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
PT3288026T (pt) 2013-10-31 2020-07-20 Fraunhofer Ges Forschung Descodificador áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002021515A1 (fr) 2000-09-05 2002-03-14 France Telecom Dissimulation d'erreurs de transmission dans un signal audio
WO2006079348A1 (en) 2005-01-31 2006-08-03 Sonorit Aps Method for generating concealment frames in communication system

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3374109D1 (en) * 1983-10-28 1987-11-19 Ibm Method of recovering lost information in a digital speech transmission system, and transmission system using said method
EP0712218B1 (en) * 1994-11-10 1999-07-14 Telefonaktiebolaget Lm Ericsson A method and an arrangement for sound reconstruction during erasures
GB2360178B (en) * 2000-03-06 2004-04-14 Mitel Corp Sub-packet insertion for packet loss compensation in Voice Over IP networks
EP1217613A1 (fr) * 2000-12-19 2002-06-26 Koninklijke Philips Electronics N.V. Reconstitution de trames manquantes ou mauvaises en téléphonie cellulaire
US7711563B2 (en) * 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE10219133B4 (de) * 2002-04-29 2007-02-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verschleiern eines Fehlers
JP4445328B2 (ja) * 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法
US7930176B2 (en) * 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
US7805297B2 (en) * 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002021515A1 (fr) 2000-09-05 2002-03-14 France Telecom Dissimulation d'erreurs de transmission dans un signal audio
WO2006079348A1 (en) 2005-01-31 2006-08-03 Sonorit Aps Method for generating concealment frames in communication system

Also Published As

Publication number Publication date
JP2010507120A (ja) 2010-03-04
CN101573751B (zh) 2013-09-25
RU2009118918A (ru) 2010-11-27
BRPI0718423A2 (pt) 2013-11-12
US20100324907A1 (en) 2010-12-23
WO2008047051A3 (fr) 2008-06-12
WO2008047051A2 (fr) 2008-04-24
BRPI0718423B1 (pt) 2020-03-10
JP5289319B2 (ja) 2013-09-11
RU2437170C2 (ru) 2011-12-20
EP2080194B1 (fr) 2011-12-07
EP2080194A2 (fr) 2009-07-22
CN101573751A (zh) 2009-11-04
KR20090090312A (ko) 2009-08-25
MX2009004212A (es) 2009-07-02
ATE536613T1 (de) 2011-12-15
US8417520B2 (en) 2013-04-09
ES2378972T3 (es) 2012-04-19

Similar Documents

Publication Publication Date Title
KR101406742B1 (ko) 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법
KR101409305B1 (ko) 정보의 부재 시에 디코더측에서의 여기를 생성하기 위한 과유성음화의 감쇄
ES2434947T3 (es) Procedimiento y dispositivo para la ocultación eficiente de un borrado de trama en códecs de voz
JP5405456B2 (ja) ピッチ調整コーディング及び非ピッチ調整コーディングを使用する信号符号化
US20210375296A1 (en) Methods, Encoder And Decoder For Linear Predictive Encoding And Decoding Of Sound Signals Upon Transition Between Frames Having Different Sampling Rates
RU2496156C2 (ru) Маскирование ошибки передачи в цифровом аудиосигнале в иерархической структуре декодирования
BRPI0311523B1 (pt) “Método e dispositivo de ocultação de apagamento de quadro causado por quadros de um sinal de som codificado apagados durante transmissão”
JP2004508597A (ja) オーディオ信号における伝送エラーの抑止シミュレーション
JP6158214B2 (ja) 音声符号化装置、音声符号化方法、音声符号化プログラム、音声復号装置、音声復号方法及び音声復号プログラム
KR20130133846A (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
JP6687599B2 (ja) Fd/lpd遷移コンテキストにおけるフレーム喪失管理
JP5604572B2 (ja) 複雑さ分散によるデジタル信号の転送誤り偽装
KR20220045260A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
Gueham et al. Packet loss concealment method based on interpolation in packet voice coding
Chibani Increasing the robustness of CELP speech codecs against packet losses.
KR20090076797A (ko) 고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치
MX2008008477A (es) Metodo y dispositivo para ocultamiento eficiente de borrado de cuadros en codec de voz

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180601

Year of fee payment: 5