KR20090082415A - 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법 - Google Patents

피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법 Download PDF

Info

Publication number
KR20090082415A
KR20090082415A KR1020097010326A KR20097010326A KR20090082415A KR 20090082415 A KR20090082415 A KR 20090082415A KR 1020097010326 A KR1020097010326 A KR 1020097010326A KR 20097010326 A KR20097010326 A KR 20097010326A KR 20090082415 A KR20090082415 A KR 20090082415A
Authority
KR
South Korea
Prior art keywords
signal
digital audio
audio signal
sample
amplitude
Prior art date
Application number
KR1020097010326A
Other languages
English (en)
Other versions
KR101406742B1 (ko
Inventor
발라즈 코베시
스테판 라고트
Original Assignee
프랑스 텔레콤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프랑스 텔레콤 filed Critical 프랑스 텔레콤
Publication of KR20090082415A publication Critical patent/KR20090082415A/ko
Application granted granted Critical
Publication of KR101406742B1 publication Critical patent/KR101406742B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명은 디지털 오디오 신호를 복호화할 때에 손실된 블록의 합성을 위해 피치 주기 반복 전에 신호를 수정하는 것을 목표로 한다. 스피치 신호의 파열음과 같은 전이(transient)가 반복되는 영향은, 피치 주기의 샘플과 이전 피치 주기의 샘플을 비교함으로써 방지된다. 최종 피치 주기(Tj)의 현재 샘플(e(3))과 이전 피치 주기(Tj-1)에서의 실질적으로 동일한 위치에 있는 하나 이상의 샘플(e(2-T0)) 간의 최소치를 취함으로써 신호가 수정되는 것이 바람직하다.
Figure P1020097010326
복호화기, 피치 주기, 유성음화, 스피치 신호, 교체 블록

Description

피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법{SYNTHESIS OF LOST BLOCKS OF A DIGITAL AUDIO SIGNAL, WITH PITCH PERIOD CORRECTION}
본 발명은 디지털 오디오 신호(특히, 스피치 신호)의 처리에 관한 것이다.
본 발명은 이러한 신호의 송신/수신에 적합한 부호화/복호화 시스템에 관한 것이다. 보다 구체적으로, 본 발명은 데이터 블록이 손실되었을 때 복호화된 신호의 품질을 향상시킬 수 있는 수신측 처리에 관한 것이다.
디지털 오디오 신호를 디지털 방식으로 변환 및 압축하기 위한 여러 가지의 상이한 기술이 존재하고 있다. 그 중에서 가장 일반적인 기술로는 다음과 같은 기술이 있다:
- 펄스 부호 변조(PCM) 및 적응형 차동 펄스 부호 변조(ADPCM) 등의 파형 부호화 방법,
- 부호 여기 선형 예측(code excited linear prediction, CELP) 부호화 등의 분석-합성(analysis-by-synthesis) 부호화 방법, 및
- 부대역 지각 부호화 방법(sub-band perceptual coding method) 및 변환 부호화.
이들 기술은 입력 신호를 샘플 단위로(PCM 또는 ADPCM) 또는 "프레임"으로 지칭되는 샘프의 블록 단위로(CELP 및 변환 부호화) 순차적으로 처리한다. 간략하게 설명하면, 스피치 신호는 짧은 구간(이 예에서는 10 내지 20 ㎳)을 통해 평가되는 파라미터를 이용하여 스피치 신호의 최근의 이전 신호(예컨대, 8㎑에서는 8 내지 12개의 샘플)로부터 예측될 수 있다. 성도 전달함수(vocal tract transfer function)(예컨대, 자음을 발음하기 위한)를 나타내는 단기 예측 파라미터(short-term predictive parameter)는 선형 예측 부호화(LPC) 방법에 의해 획득된다. 성대의 진동에서 비롯되는 유성음(예컨대, 모음)의 주기성(periodicity)을 결정하기 위해 장기 상관(longer-term correlation)이 이용된다. 이러한 결정 과정에는, 적어도 화자(speaker)에 따라 통상적으로 60 ㎐(저음성) 내지 600 ㎐(고음성)에서 변화하는 음성 신호의 기본 주파수를 결정하는 과정을 포함한다. 그 후, 종종 "피치 주기"로 지칭되는, 구체적으로는 기본 주파수의 역(inverse)인 장기 예측자(long-term predictor)의 LTP 파라미터를 결정하기 위해 장기 예측(LTP) 분석이 이용된다. 그 후, 피치 주기 내의 샘플의 개수가 Fe/Fo(또는 그 정수부)에 의해 정해지며, 여기서 Fe는 샘플링 레이트이고, Fo는 기본 주파수이다. 따라서, 피치 주기를 포함하는 장기 예측 LTP 파라미터는 스피치 신호(스피치 신호가 유성음화된 때의)의 기본 진동을 나타내는 한편, 단기 예측 LPC 파라미터는 이 신호의 스펙트럼 인벨로프(pectrum envelope)를 나타낸다.
어떠한 부호화기에서는, 스피치 부호화에서 비롯되는 이들 LPC 및 LTP 파라 미터의 세트가 하나 이상의 전화통신 네트워크를 통해 블록 단위로 동종의 복호화기에 전송되어, 원래의 스피치가 재구성될 수 있다.
그러나, 스피치 신호의 광대역 송신을 위한 ITU-T에 의해 표준화된 48, 56 및 64 kbit/s의 G.722 부호화 시스템이 참조될 것이다(예로서). G.722 부호화기는 쿼드러쳐 미러 필터 뱅크(QMF)에 의해 획득된 2개의 부대역의 ADPCM 부호화 방식을 갖는다. 추가의 세부 사항에 대해서는 G.722 권장사항 문서를 참조하는 것이 유용할 것이다.
본 기술 분야를 나타내고 있는 도 1은 G.722 권장사항에 따른 부호화 및 복호화 구조를 도시하고 있다. 블록 101 내지 103은 입력 신호에 적용된 송신 QMF 필터 뱅크(고주파(102) 및 저주파(100)와 서브샘플링(101, 103)으로의 스펙트럼 분리)를 나타낸다. 그 다음 블록(104, 105)은 각각 저대역과 고대역의 ADPCM 부호화기에 대응한다. ADPCM 부호화기의 저대역 출력은 각각 샘플당 6, 5, 또는 4-비트 출력을 나타내는 0, 1, 또는 2의 모드값에 의해 특정되는 한편, ADPCM 부호화기의 고대역 출력은 고정된다(샘플당 2 비트). 복호화기 내에 등가의 ADPCM 복호화 블록(106, 107)이 있기 때문에, 그 출력은 QMF 수신 필터 뱅크(오버-샘플링(108, 110), 인버스 필터(109, 111), 및 고주파 대역과 저주파 대역의 통합부(112))에서 조합되어, 합성 신호 So가 생성된다. 여기서 고려되는 일반적인 문제점은 복호화 시의 블록 손실의 보정에 관련된다. 실제로, 부호화측으로부터의 비트스트림 출력은 일반적으로 다수의 네트워크 유형을 통한 송신을 위해 2진 블록으로 포맷화된다. 이들은 예컨대 인터넷 네트워크를 통해 송신되는 블록에 대해서는 "인터넷 프 로토콜(IP) 패킷"으로 지칭되고, 동기 전송 모드(ATM) 네트워크를 통해 송신되는 블록에 대해서는 "프레임"으로 지칭되며, 그 밖의 다른 네트워크를 통해 송신되는 블록에 대해서는 다른 명칭으로 지칭된다. 부호화 후에 송신된 블록은 아래와 같은 여러 이유로 손실될 수 있다:
- 네트워크 라우터가 오버로드되어 그 대기열(queue)을 덤프한 경우,
- 실시간의 연속-흐름 복호화 동안 블록이 지연되어 수신되는 경우(따라서, 고려되지 못한 경우),
- 수신된 블록이 붕괴된 경우(예컨대, 수신된 블록의 CRC 패리티가 검증되지 않는 경우).
하나 이상의 연속 블록의 손실이 발생할 때, 복호화기는 손실 블록 또는 에러 블록에 대한 정보없이 신호를 재구성해야만 한다. 복호화기는 수신된 유효 블록으로부터의 이전에 복호화된 정보에 의지한다. "손실 블록의 보정"(또는, 이후 "삭제된 프레임의 보정")으로 지칭되는 이러한 문제점은, 특히 손실 블록의 보정이 예측성의 것인 때에는, 프레임의 손실이 부호화기와 복호화기 간의 동기화의 손실을 초래하고, 또한 외삽된 정보(extrapolated information)와 손실 부분 후의 복호화된 정보 간의 연속성의 문제를 초래하기 때문에, 단순히 손실 정보를 외삽하는 것보다는 실제로 더욱 일반적이다. 따라서, 삭제된 프레임의 보정은 상태 정보 복원 및 컨버전스 기술 및 기타 기술을 수반한다.
ITU-T G.711 권장사항의 "Annex I"는 PCM 부호화에 적합한 삭제된 프레임의 보정을 기술하고 있다. PCM 부호화가 예측성의 것이 아니므로, 프레임 손실의 보 정은, 단순히, 재구성된 프레임과 손실 부분에 후속하는 정확하게 수신된 프레임 사이에 손실 정보를 외삽하여, 연속성을 보장하는 것이라 할 수 있다. 외삽은 기본 주파수(또는, 반대로 표현하면 "피치 주기")와 동기하는 방식으로 과거 신호의 반복에 의해, 즉 단순히 피치 주기를 반복함으로써 시행된다. 이러한 연속성은 수신된 샘플과 외삽된 샘플 간의 평활화 또는 크로스-페이딩(cross-fading)에 의해 보장된다.
문헌 "A packet loss concealment method using pitch waveform repetition and internal state update on the decoded speech for the sub-band ADPCM wideband speech codec"(M. Serizawa and Y. Nozawa, IEEE Speech Coding Workshop, pages 68-70 (2002))에는, 피치 주기 반복 알고리즘(G.711 권장사항의 "Annex I"에 기술된 것과 유사하게 이루어질 수 있는 반복)을 이용하여 손실 프레임을 외삽함으로써 G.722 표준화된 부호화기/복호화기에 대한 삭제된 프레임의 보정이 제안되어 있다. G.722 부호화기 상태(즉, 필터 메모리 및 피치 적용 메모리)를 갱신하기 위해, 이와 같이 외삽된 프레임은 ADPCM 부호화에 의해 재부호화되는 2개의 부대역으로 분할된다.
그러나, 피치 주기의 반복에 의해 프레임 손실을 보정하는 이러한 기술은, 이전 신호가 불변의 신호(stationary)이거나 또는 적어도 주기적 불변의 신호(cyclostationary)인 경우에만 정확하게 작용할 수 있다. 따라서, 이들 기술은 손실된 프레임(외삽되어야 하는)에 관련되는 신호가 프레임 손실 부분 바로 이전까지 복호화된 신호에 "유사"하다는 함축적인 가설에 의존한다. 스피치 신호의 경우 에, 이러한 이전 신호가 불변의 신호라는 가설은 엄밀하게는 반복될 모음 부분과 같은 사운드에 대해서만 유효하다. 예컨대, 모음 "a"는 여러 번 박복될 수 있다(청취 불편감을 야기하지 않는 "aaaa 등"). 스피치 신호는 "트랜지터리(transitory)"로 지칭되는 사운드(통상적으로 모음의 착수(개시) 및 "p", "b", "d", "t", "k" 등의 짧은 자음에 상응하는 "파열음"으로 지칭되는 사운드를 포함하는 비불변의 사운드)를 포함한다. 그러므로, 예컨대, 사운드 "t"의 직후에 프레임이 손실된 경우, 여러 개의 연속 프레임이 손실(예컨대, 5개의 연속 손실)된 때에, 단순한 반복에 의해 프레임의 손실을 보정하는 것은, 일련의 "t"의 버스트("t-t-t-t-t")를 생성할 것이므로, 청취감을 매우 불편하게 한다.
도 2의 (a) 및 (b)는 G.722 권장사항에 따른 부호화기에 의해 부호화된 광대역 신호의 경우에서의 이러한 음향적인 효과를 예시하고 있다. 보다 구체적으로, 도 2의 (a)는 이상적인 채널로(프레임 손실없이) 복호화된 스피치 신호를 나타낸다. 도시된 예에서, 이 신호는 2개의 프랑스어 음소(phoneme) "/t/" 및 "/an/"으로 분할되는 단어 "temps"에 대응한다. 수직 방향의 점선은 프레임 간의 경계를 나타낸다. 여기서 고려되고 있는 프레임의 길이는 10 ms 정도이다. 도 2의 (b)는, 프레임의 손실 부분을 음소 "/t/"가 바로 후속할 때에, 앞에서 언급한 "Serizawa" 등의 기술과 유사한 기술에 따라 복호화된 신호를 나타낸다. 도 2의 (b)는 이전 신호의 반복의 문제점을 나타내며, 외삽된 프레임에서 음소 "/t/"가 반복된다는 것에 유의하여야 한다. 또한, 정상적인 상태 하에서(즉, 수신된 신호에 유용한 데이터가 존재할 때에) 복호화로 크로스-페이딩을 수행하기 위해, 도시된 예에서는 손실 부분 후에 외삽이 다소 연장되어 있는 것으로 다음 프레임에 나타내어져 있다.
파열음이 반복되는 문제점은 공지의 종래 기술에서는 명확하게 언급되어 있지 않다.
본 발명은 이 상황에 맞는 개선을 제공한다.
이를 위해, 본 발명은, 샘플의 연속적인 블록으로 표현되는 디지털 오디오 신호의 수신 시에, 하나 이상의 유효하지 않은 블록을 교체하기 위해, 하나 이상의 유효 블록의 샘플로부터 교체 블록이 생성되는, 디지털 오디오 신호의 합성 방법을 제안한다.
상기 방법은 일반적으로 이하의 단계를 포함한다:
a) 하나 이상의 유효 블록에서의 반복 주기를 결정하는 단계; 및
b) 상기 반복 주기의 샘플을 하나 이상의 상기 교체 블록에 복사하는 단계.
본 발명의 사상 내에서의 상기 방법에 있어서,
- 상기 a) 단계에서는, 유효하지 않은 블록에 바로 선행하는 하나 이상의 유효 블록에서 최종 반복 주기가 결정되며,
- 상기 b) 단계에서는, 상기 최종 반복 주기에서 존재할 수 있는 어떠한 트랜지터리 신호(transitory signal)의 진폭을 제한하기 위해, 상기 최종 반복 주기의 샘플이 상기 최종 반복 주기의 샘플 이전의 반복 주기의 샘플에 따라 보정되며,
이와 같이 보정된 샘플이 상기 교체 블록에 복사된다.
본 발명의 사상 내에서의 상기 방법은, 유성음화된 신호(voiced signal)의 경우뿐만 아니라 비유성음화된 신호의 경우에도 마찬가지로 스피치 신호의 처리에 적용될 수 있는 이점이 있다. 그러므로, 신호가 유성음화되면, 피치 주기는 피치 주기로 구성되며, 상기 방법의 단계 a)는 손실 부분에 선행하는 하나 이상의 유효 블록 내의 신호의 톤(예컨대, 스피치 신호에서의 음성의 톤)의 피치 주기(통상적으로, 기본 주파수의 역에 의해 주어짐)를 결정하는 과정을 수반한다.
수신된 유효 신호가 비유성음화된 신호이면, 실제로는 검출 가능한 피치 주기가 존재하지 않는다. 이 경우에는, 피치 주기의 길이로서 간주될 임의의 소정수의 샘플(일반적으로 "피치 주기"로 지칭될 수 있음)을 설정하고, 반복 주기에 기초하여 본 발명의 사상 내의 상기 방법을 구현하는 것이 가능하다. 예컨대, 피치 주기는 가능한 한 길게, 통상적으로는 20 ms(50 ㎐의 매우 낮은 음성에 해당함), 즉 8 ㎑ 샘플링 주파수에서의 160개의 샘플로 선택될 수 있다. 또한, 값의 간격에 대한 탐색(예컨대, MAX_PITCH/2와 MAX_PITCH 사이, 여기서 MAX_PITCH는 피치 주기 탐색에서의 최대값)을 제한함으로써, 상관 함수의 최대치에 대응하는 값을 취하는 것도 가능하다.
바람직하게는, 복수의 연속적인 유효하지 않은 블록이 수신 시에 교체되어야 하고, 이들 블록이 하나 이상의 반복 주기에 걸쳐 연장되어 있다면, 최종 반복 주기의 샘플 모두에 상기 b) 단계의 샘플 보정이 적용되어, 하나하나씩 현재 샘플로서 취해진다.
또한, 이들 유효하지 않은 블록이 여러 개의 반복 주기에 걸쳐 연장되면, 이와 같이 상기 b) 단계에서 보정된 반복 주기가 교체 블록을 형성하기 위해 여러 번 복사된다.
특정의 실시예에서, 상기 b) 단계에서 수행되는 전술한 샘플 보정을 위해, 이하의 과정이 채용될 수 있다. 최종 반복 주기로부터의 현재 샘플에 대하여, 이 현재 샘플의 진폭의 절대값과, 현재 샘플 전의 반복 주기에 시간적으로 매우 근접하여 위치된 하나 이상의 샘플의 진폭의 절대값의 비교가 이루어지고, 이들 2개의 진폭의 절대값의 최소 진폭을 현재 샘플에 할당한다. 이 때, 이들 2개의 진폭의 절대값의 최소 진폭에는 원래 진폭의 부호가 할당되는 것은 당연하다.
여기서, "매우 근접하여 위치된"이라는 표현은, 현재 샘플에 관련되는 이전의 반복 주기에서 그 이웃이 탐색된다는 것을 의미한다. 그러므로, 바람직하게는, 최종 반복 주기의 현재 샘플에 대해,
- 상기 현재 샘플 이전의 반복 주기에 시간적으로 위치된 샘플을 중심으로 하는 이웃에 한 세트의 샘플이 구성되고,
- 상기 이웃의 샘플의 진폭으로부터, 선별된 진폭(76)이 절대값의 형태로 결정되고,
- 상기 선별된 진폭과 상기 현재 샘플의 진폭으로부터 절대값이 최소인 진폭을 상기 현재 샘플에 할당하기 위해, 상기 선별된 진폭이 상기 현재 샘플의 진폭의 절대값과 비교된다.
상기 이웃의 샘플의 진폭으로부터의 선별된 진폭은, 절대값이 최대인 진폭(M)인 것이 바람직하다.
또한, 일반적으로, 상기 교체 블록 내의 샘플의 진폭에 댐핑(damping)(점진적인 감쇄)이 가해진다. 이 경우, 블록의 손실 부분 이전에서 신호의 트랜지터리 특징이 검출되며, 적용 가능한 경우, 불변의 신호(stationary signal)(넌 트랜지터리 신호)에 대해서는 더 신속한 댐핑이 가해진다.
이에 추가하여 또는 그 변형으로서, 특히 트랜지터리 사운드에 채용되는 합성 처리 동안 다음 필터 메모리의 갱신(제로 리셋)을 수행하여, 다음의 유효 블록의 처리에서 이러한 트랜지터리 사운드의 영향을 방지하는 것이 가능하다.
바람직하게는, 블록의 손실 부분에 선행하는 트랜지터리 신호의 검출은 다음과 같이 수행된다:
- 최종 반복 주기의 복수의 현재 샘플에 대해, 상기 선별된 진폭(전술한 바와 같이 이웃에서 결정된)에 대한 현재 샘플의 진폭의 관계가 절대값으로 측정되며,
- 상기 관계가 소정의 제1 임계치(예컨대, 후술되는 바와 같이 4 부근의 값)보다 크게 되는 상기 현재 샘플이 발생하는 횟수를 카운트하며,
- 발생 횟수가 소정의 제2 임계치(예컨대, 후술되는 바와 같이 하나 이상의 인스턴스가 있다면)보다 큰 경우에는, 트랜지터리 신호의 존재를 검출한다.
전술한 단계는, 블록의 손실 부분의 바로 앞에 선행하는 반복 주기에서 트랜지터리 신호의 검출의 경우에, 본 발명의 사상 내에서의 보정 단계 b)를 트리거하기 위해 이용될 수도 있다.
그러나, 본 발명의 사상 내의 방법의 보정 단계 b)를 적용할지의 여부를 결정하기 위해, 이하의 과정이 수행되는 것이 바람직하다. 디지털 오디오 신호가 스피치 신호이면, 스피치 신호 내의 유성음화의 정도가 검출되고, 스피치 신호가 높게 유성음화되었다면(피치 주기에 대한 탐색에서 "1"에 근접한 상관 계수로 나타남), 보정 단계 b)가 실시되지 않는다. 즉, 이러한 보정은 신호가 비유성음화되었거나 또는 약하게 유성음화된 경우에만 실시된다.
그러므로, 수신된 유효 신호가 높게 유성음화되어(따라서, 불변의 신호), 현실감에 있어서 안정한 모음(예컨대, "aaaa")의 발음에 해당하면, 교체 블록 내의 신호에 단계 b)의 보정을 적용하여 불필요하게 감쇄시키는 것이 방지된다.
그러므로, 간략하면, 본 발명은 디지털 오디오 신호의 복호화 시에 손실된 블록의 합성을 위해, 반복 주기(또는 유성음화된 스피치 신호에 대해서는 "피치")의 반복 전에 신호를 수정하는 것에 관련된다. 트랜지터리의 반복의 영향은, 피치 주기의 샘플을 이전의 피치 주기의 샘플과 비교함으로써 방지된다. 현재 샘플과 이전 피치 주기의 동일한 위치로부터의 매우 근접하여 있는 하나 이상의 샘플 중의 최소의 것을 취함으로써 신호가 수정되는 것이 바람직하다.
본 발명은 특히 블록 손실의 존재 시의 복호화의 관점에서 여러 가지의 장점을 제공한다. 구체적으로, 본 발명은 트랜지터리의 오류성 반복(간단한 피치 반복 주기가 이용될 때의)에 기인하여 발생하는 어색함을 방지하는 것을 가능하게 한다. 또한, 본 발명은 외삽된 신호(가변 감쇄를 통한)의 에너지 제어를 채용하기 위해 이용될 수 있는 트랜지터리의 검출을 수행한다.
본 발명의 추가의 장점 및 특징은 예로서 제공된 상세한 설명 및 첨부 도면을 통해 더욱 명확하게 될 것이다.
도 1은 G.722 권장사항에 따른 부호화 및 복호화 구조를 도시하는 도면이다.
도 2의 (a) 및 (b)는 G.722 권장사항에 따른 부호화기에 의해 부호화된 광대역 신호의 경우에서의 이러한 음향적인 효과를 예시하고, 도 2의 (c)는 프레임 "TP"가 손실된 경우에 도 2의 (a) 및 (b)의 신호와 동일한 신호에 대한 본 발명의 처리의 영향을 비교를 통해 예시하는 도면이다.
도 3은 G.722 권장사항에 따르지만 본 발명의 사상 내의 삭제된 프레임을 보정하는 장치를 통합함으로써 변형된 복호화기를 나타내는 도면이다.
도 4는 저역의 외삽의 원리를 예시하는 도면이다.
도 5는 피치 반복(여기 영역에서의)의 원리를 예시하는 도면이다.
도 6은 피치 반복이 후속되는 본 발명의 사상 내의 여기 신호의 수정을 예시하는 도면이다.
도 7은 특정의 실시예에 따른 본 발명의 방법의 단계를 예시하는 도면이다.
도 8은 본 발명의 사상 내의 방법을 구현하기 위한 합성 장치를 개략적으로 예시하는 도면이다.
도 8a는 2-채널 쿼드러쳐 미러 필터 뱅크(QMF)의 일반적인 구조를 예시하는 도면이다.
도 8b는 L(z) 및 H(z) 필터가 이상적인 것(즉, f'e=2fe)일 때의 도 8a의 신 호 스펙트럼 x(n), xl(n), xh(n)을 예시하는 도면이다.
이하에서는, G.722 권장사항에 따른 부호화 시스템에 좌우되는 예로서의 본 발명의 실시예를 설명한다. 여기에서는 G.722 복호화기(도 1을 참조하여 전술된)에 대한 설명을 반복하지 않는다. 여기에서의 설명은 프레임의 손실의 경우에 재생될 피치 주기의 보정 장치를 통합함으로써 변형된 G.722 복호화기로 제한될 것이다.
도 3을 참조하면, 본 발명의 사상 내의(여기서는, G.722 권장사항에 따른) 복호화기는 QMF 수신 필터 뱅크(블록 310 내지 314)를 갖는 2개의 부대역의 아키텍쳐를 나타낸다. 도 1의 복호화기에 대하여, 도 3의 복호화기는 삭제된 프레임의 보정을 위한 장치(320) 또한 포함한다.
G.722 복호화기는, 16 ㎑로 샘플링되고 10, 20 또는 40 ms의 시간적 프레임(temporal frame)(또는 샘플의 블록)으로 분할된 출력 신호 So를 생성한다. 이 동작은 프레임의 손실이 존재하는지의 여부에 따라 상이하다.
프레임의 손실이 전체적으로 존재하지 않는 경우(따라서, 모든 프레임이 수신되어 유효한 경우), 저주파 대역(LF)의 비트스트림이 본 발명의 사상 내의 장치(320)의 블록(300)에 의해 복호화되고, 크로스 페이드(블록 303)가 수행되지 않으며, 재구성된 신호가 단순히 zl = xl로 제공된다. 마찬가지로, 고주파(HF)의 대역의 비트스트림은 블록(304)에 의해 복호화된다. 스위치(307)는 채널 uh = xh을 선택하고, 스위치(309)는 채널 zh = uh = xh를 선택한다.
한편, 하나 이상의 프레임의 손실이 발생한 경우, 저역(LF)에서는, 삭제된 프레임이 이전의 신호 xl로부터 블록(301)에 외삽되며(구체적으로, 피치의 복사), ADPCM 복호화기의 상태가 블록(302)에서 갱신된다. 삭제된 프레임은 zl = yl로서 재구성된다. 이러한 과정은 프레임의 손실이 검출될 때마다 반복된다. 외삽 블록(301)이 현재 프레임(손실 프레임)에 대한 외삽된 신호를 생성하는 것으로만 제한되지 않고, 또한 블록(303)에서 크로스-페이드를 수행하기 위해 다음 프레임에 대해 10 ms의 신호를 생성한다는 점에 유의하여야 한다.
그 후, 유효 프레임이 수신될 때, 이 유효 프레임이 블록(300)에 의해 복호화되고, 유효 프레임 xl과 이전의 외삽된 프레임 yl 사이의 최초의 10 ms 동안 크로스-페이드(303)가 수행된다.
고역(HF)에서, 삭제된 프레임은 이전 신호 xh로부터 블록(305)에 외삽되고, ADPCM 복호화기의 상태가 블록(306)에서 갱신된다. 바람직한 실시예에서, 외삽 yh은 이전 신호 xh의 최종 주기의 단순한 반복이다. 스위치(307)는 경로 uh = yh를 선택한다.
이 신호 uh는 신호 vh를 생성하기 위해 필터링되는 것이 바람직하다. 실제로, G.722 부호화는 후방 예측 부호화 방식이다. 각각의 부대역에서, G.722 부호화는, 부호화기와 복호화기에서 동일하게, 자동 회귀 이동 편균(auto-regressive moving average, ARMA) 타입의 예측 동작과, 피치 양자화의 적용 및 ARMA 필터의 적용을 위한 과정을 이용한다. 피치의 예측 및 적용은 복호된 데이터(예측 오차, 재구성된 신호)에 의존한다.
송신 에러, 보다 구체적으로는 프레임의 손실은 복호화기와 부호화기의 변수 간의 비동기화를 발생시킨다. 그러므로, 피치 적용 및 예측 과정은 오류가 있게 되며, 상당한 주기의 시간(최대 300 내지 500 ms)에 걸쳐 한쪽으로 편중되게 된다. 고역에서, 이러한 편중은, 다른 어색함(artifact) 중에서, 진폭의 가장 약한 직선 성분의(최대 역학이 +/-32767인 신호에 대해서는 +/-10 정도의) 출현을 발생시킬 수 있다. 그러나, QMF 합성 필터 뱅크를 통과한 후, 이 직선 성분은 청취 가능하고 청취감이 매우 안좋은 8 ㎑의 사인파의 형태를 갖는다.
이하에서는 직선 성분(또는 "DC 성분")을 8 ㎑의 사인파로 변환하는 과정을 설명한다. 도 8a는 2채널 쿼드러쳐 필터 뱅크(QMF)를 나타낸다. 신호 x(n)은 분석 뱅크에 의해 2개의 부대역으로 나누어져, 저역 xl(n)과 고역 xh(n)이 획득된다. 이들 신호는 이들의 z 변환에 의해 정의된다:
Figure 112009030245041-PCT00001
저역 L(z) 및 고역 H(z) 필터가 쿼드러쳐(quadrature)에 있을 때, H(z)=L(-z)이 된다.
L(z)가 완벽한 재구성의 제약을 검증하면, 합성 필터 뱅크 후에 획득된 신호는 가장 근접한 시간 지연까지는 신호 x(n)과 동일하다.
그러므로, 신호 x(n)의 샘플링 주파수가 fe'이면, 신호 xl(n) 및 xh(n)가 주 파수 fe=fe'/2로 샘플링된다. 통상적으로, fe'=16 ㎑, 즉 fe=8 ㎑ 이다. 또한, 필터 L(z) 및 H(z)가 예컨대 ITU-T 권장사항 G.722에 특정된 24-계수 QMF 필터로 될 수 있는 것으로 나타난다.
도 8b는 필터 L(z) 및 H(z)가 이상적인 중간 대역 필터인 경우에서의 신호 x(n), xl(n) 및 xh(n)의 스펙트럼을 나타낸다. 구간 [-f'e/2, +fe'/2] 동안의 L(z) 주파수 응답은, 이상적인 경우에는 다음과 같이 주어진다:
Figure 112009030245041-PCT00002
xh(n) 스펙트럼은 폴디드 고역(folded high band)에 대응하는 것에 유의하는 것으로 알려져 있다. 종래 기술에서 널리 공지된 이러한 "폴딩" 특성은 가시적으로 설명될 수 있을뿐만 아니라 XH(z)를 정의하는 전술한 수식을 통해 설명될 수 있다. 고역의 폴딩은 고역 스펙트럼을 자연스러운 정도(natural order)의 주파수로 복원하는 합성 필터 뱅크에 의해 "반전"된다.
그러나, 실제로는, L(z) 및 H(z) 필터는 이상적이지 않다. 이들 필터의 이상적이지 않은 특성은 합성 필터 뱅크에 의해 소거되는 스펙트럼 폴딩 성분의 출현을 발생시킨다. 한편, 고역은 반전된 채로 유지된다.
그 후, 블록(308)은 직선 성분을 제거하는 고역 필터링(HPF)("DC 성분 제거")을 수행한다. 이러한 필터의 사용은 본 발명의 사상 내에서의 저역 피치 주기 보정의 범위 이외의 것을 포함하므로 특히 이롭다.
또한, 고역에서의 직선 성분을 제거하는 이러한 HPF 필터(블록 308)의 사용은, 복호화측에서의 프레임의 손실의 일반적인 설명에서 별도의 보호의 주체가 될 수 있다. 일반적인 의미에서, 수신된 신호를 고주파 대역과 저주파 대역으로 분리하여 G.722 표준에 따른 복호화에서와 같이 적어도 2개의 채널로 분리하는 이러한 수신된 신호의 복호화의 설명에서, 복호화기의 고주파 경로 상에서의 교체 신호의 합성에 후속하여 신호 손실이 발생할 때, 이에 의해 교체 신호에서의 직선 성분이 존재하는 결과를 발생할 수 있다. 이러한 직선 성분의 효과는, 어떠한 시간 동안에는, 수신된 부호화된 신호가 다시 한번 유효화됨에도 불구하고, 부호화기와 복호화기 간의 비동기화 및 필터의 메모리 사이즈로 인해, 복호화된 신호 내로 확장될 수 있다.
고주파 경로에 고역 필터(308)가 제공되는 것이 이롭다. 이러한 고역 필터(308)는 예컨대 G.722 복호화기의 고주파 경로의 QMF 필터 뱅크의 상류측에 제공되는 것이 이롭다. 이러한 구성에 의해, 직선 성분이 QMF 필터 뱅크에 적용될 때에 8 ㎑(샘플링 레이트 f'e로부터 취해진 값)의 직선 성분의 폴딩을 방지할 수 있다. 보다 일반적으로, 복호화기가 고주파 경로 상의 처리의 끝단에 필터 뱅크를 포함할 때, 이 필터 뱅크의 상류측에 고역 필터(308)가 제공되는 것이 바람직하다.
그러므로, 다시 도 3을 참조하면, 스위치(309)는 프레임의 손실이 있는 한 경로 zh = vh를 선택한다.
그 후, 유효 프레임이 수신되는 즉시, 유효 프레임이 블록(304)에 의해 복호 화되며, 스위치(307)는 경로 uh = xh를 선택한다. 다음의 약간의 시간 간격 동안(예컨대, 4초 후에), 스위치(309)는 다시 경로 zh = vh를 선택하지만, 이러한 수 초가 경과한 후에, 블록(308)을 우회하여 고역 통과 필터(308)를 적용하지 않고, 스위치(309)가 다시 경로 zh = vh를 선택하는 "정상적인" 동작으로 복귀된다.
일반적으로, 유효 블록이 다시 수신되는 경우에도, 이러한 고역 통과 필터(308)는 블록의 손실 동안 및 손실 후에 일시적으로(예컨대, 수 초 동안) 적용되는 것이 바람직하다. 고역 통과 필터(308)는 영구적으로 사용될 수 있다. 그러나, 이 경우에는 직선 성분으로 인한 장애(disturbance)가 발생되므로, 수정된 G.722 복호화기(손실 보정 메카니즘을 통합한)의 출력이 프레임의 손실이 없는 경우에 ITU-T G.722 복호화기의 출력과 동일하게 되도록, 프레임 손실의 경우에만 활성화된다. 이 고역 통과 필터(308)는 프레임의 손실에 대한 보정 동안 및 손실이 발생할 때의 수 초 동안에만 적용된다. 실제로, 손실의 경우에, G.722 복호화기는 손실 다음의 100 내지 500 ms의 기간 동안 부호화기로부터 비동기화된다. 고역 통과 필터(308)는 안전 마진(예컨대, 4초)을 갖기 위해 약간 더 길게 유지된다.
본 발명이 특히 저역 외삽 블록(301)으로 구현되는 것으로 이해할 수 있으므로, 도 3의 주체인 복호화기는 더 상세하게 설명되지 않을 것이다. 저역 외삽 블록(301)은 도 4에 상세하게 도시되어 있다.
도 4를 참조하면, 저역의 외삽은 이전 신호 xl의 분석(도 4에서 "분석"으로 표시된 부분)과 이에 후속하는 전달된 신호 yl의 합성(도 4에서 "합성"으로 표시된 부분)에 의존한다. 블록 400은 이전 신호 xl에 대한 선형 예측 분석(LPC)을 수행 한다. 이 분석은 표준화된 G.729 부호화기에서 수행된 것과 특히 유사하다. 이 분석은, 신호의 간격을 정하는 단계, 자동상관을 계산하는 단계, 및 선형 예측 계수를 찾아내기 위해 레빈슨-더빈(Levinson-Durbin) 알고리즘을 이용하는 단계로 이루어질 수 있다. 신호의 마지막 10초만이 사용되고, LPC 오더가 8로 설정되는 것이 바람직하다. 이와 같이 하여, 9개의 LPC 계수가 이하의 형태로 획득된다(이후, a0, a1,..., ap로 지칭됨):
Figure 112009030245041-PCT00003
LPC 분석 후, 블록(401)에 의해 이전의 여기 신호가 계산된다. 이전의 여기 신호는 n = -M,...,-1을 갖는 e(n)으로 지칭되며, 여기서 M은 저장된 이전 샘플의 수에 대응한다. 블록(402)은 기본 주파수 또는 기본 주파수의 역, 즉 피치 주기 T0의 추정을 수행한다. 이러한 추정은 예컨대 피치 분석과 유사한 방식(구체적으로, 표준화된 G.729 부호화기에서와 같이 "개방 루프"로 지칭됨)으로 수행된다.
이와 같이 추정된 피치 T0는 블록 403에 의해 사용되어 현재 프레임의 여기(excitation)를 외삽한다.
또한, 블록 404에서는 이전 신호 xl이 분류된다. 블록 404에서는 본 발명의 사상 내에서의 피치 주기 보정을 적용하기 위해 예컨대 파열음의 존재와 같은 트랜지터리의 존재를 검출할 수 있지만, 바람직한 변형예에서는 그 대신에 신호 Si가 높게 유성음화(voicing)되는지를 검출한다(예컨대, 피치주기에 대한 상관이 1에 매 우 근접한 때에). 신호가 높게 유성음화되었다면(예컨대 "aaaa..."와 같은 안정한 모음의 발음에 해당하는), 신호 Si는 트랜지터리로부터 자유로우며, 본 발명의 사상 내에서 피치 주기 보정을 구현하는 것이 가능하지 않다. 그렇지 않다면, 본 발명의 사상 내의 피치 주기 보정이 모든 다른 경우에 적용되는 것이 바람직할 것이다.
유성음화의 정도의 검출에 대한 세부 내용은 공지의 것이므로 여기서는 설명되지 않으며, 본 발명의 범위에서 벗어나 있는 것이다.
다시 도 4를 참조하면, 합성은 "소스-필터"로 지칭되는 본 기술 분야에 널리 공지된 모델을 따른다. 이 모델은 LPC 필터에 의해 외삽된 여기를 필터링하는 단계로 이루어진다. 여기서, 외삽된 여기 e(n)(여기서, n=0,..., L-1, L은 외삽될 프레임의 길이)은 인버스 필터 1/A(z)(블록 405)에 의해 필터링된다. 그리고나서, 획득된 신호는 블록 406에서 계산된 감쇄량에 따라 블록 407에 의해 감쇄되어, 최종적으로는 yl로 전달된다. 이러한 본 발명은 그 기능이 추후에 상세하게 설명되는 도 4의 블록 403에 의해 구현된다.
도 5는 본 기술 분야에서 구현된 바와 같은 간략한 여기 반복의 원리를 예시의 목적으로 도시하고 있다. 여기는 최종의 피치 주기 T0를 단순히 반복함으로써, 즉 이전 여기의 최종 샘플의 연속체를 복사함으로써 외삽될 수 있으며, 이 연속체에서의 샘플의 개수는 피치 주기 T0에 의해 이루어지는 샘플의 개수에 대응한다.
도 6을 참조하면, 최종 피치 주기 T0를 반복하기 전에, 이 피치 주기가 본 발명의 사상 내에서 다음과 같이 수정된다.
각각의 샘플 n = -T0,...,-1에 대해, 샘플 e(n)은 아래 유형의 수식에 따라 emod(n)으로 수정된다:
Figure 112009030245041-PCT00004
전술한 바와 같이, 이러한 신호 수정은, 신호 M(및 입력 신호 Si)이 높게 유성음화되었다면 적용되지 않는다. 실제로, 높게 유성음화된 신호의 경우, 수정없이 최종 피치 주기를 단순하게 반복하는 것은 더 우수한 결과를 발생할 수 있는 한편, 최종 피치 주기의 수정 및 그 반복은 약간의 품질 저하를 초래할 수 있다.
도 7은 본 발명의 실시예에 따른 방법의 단계를 예시하기 위해 이 수식의 적용에 대응하는 처리를 흐름도의 형태로 도시하고 있다. 여기서, 개시 지점은 블록 401에 의해 전달된 이전 신호 e(n)이다. 단계 70에서, 신호 xl이 높게 유성음화되었는지의 여부에 따라, 유성음화의 정도를 결정하는 모듈(404)로부터 정보가 획득된다. 신호가 높게 유성음화되면(단계 71의 출력에서 화살표 Y), 유효 블록의 최종 피치 주기가 도 4의 블록 403에서와 같이 복사되며, 그 후 모듈 405에 의해 반전 필터링 1/A(z)의 적용에 의해 처리를 직접 지속한다.
한편, 신호 xl이 높게 유성음화되지 않았다면(단계 71의 출력에서 화살표 N), 수신된 최종 유효 블록에 대응하는 여기 신호 e(n)의 최종 샘플을 수정하고자 할 것이며, 이들 샘플은 도 4의 모듈 402에 의해 제공된 피치 주기 T0(단계 73)의 전체에 걸쳐 연장한다(단계 72). 도 7에 예시된 실시예에서, n1-T0+1 과 n1 사이에 n이 포함되면, 피치 주기 T0의 전체에 걸쳐 샘플 e(n) 전부를 수정하고자 하며, e(n1)은 수신된 최종의 유효 샘플에 대응한다(단계 74). 그러므로, 이러한 표기법으로, n이 n1-T0+1 과 n1 사이에 포함된 샘플 e(n)이 단순히 최종의 유효하게 수신된 피치 주기에 속하게 된다.
단계 75에서, 이전의 피치 주기의 이웃(NEIGH)은 끝에서 두 번째의 피치 주기인 최종 피치 주기의 각각의 샘플 e(n)에 대응하도록 구성된다. 이 방안은 이롭지만 필수적은 아니다. 이하에서는 이 방안이 제공하는 장점을 설명할 것이다. 여기에서는 이러한 이웃이 전술한 예에서 홀수 개인 2k+1 개의 샘플을 포함하는 것으로 간략하여 설명한다. 물론, 변형예에서는 이 개수가 짝수일 수도 있다. 또한, 도 6의 예에서, k=1을 갖는다. 실제로, 도 6을 다시 참조하면, 최종 피치 주기의 세 번째 샘플 e(3)가 선택되고(단계 74), 끝에서 두 번째의 피치 주기에 있는 샘플과 관련되는 이웃(NEIGH)의 샘플이 굵게 표현되어 e(2-T0), e(3-T0) 및 e(4-T0)이 된다. 따라서, 이들은 e(3-T0) 부근에 분포된다.
단계 76에서, 최대치는 이웃(NEIGH)의 샘플(즉, 도 6의 예에서는 샘플 e(2-T0))로부터 절대값으로 결정된다. 이 특징은 이롭지만 필수적이지는 않다. 이 특징이 제공하는 장점을 이하에 설명한다. 통상적으로, 변형예에서는, 예컨대 이웃(NEIGH)에 걸쳐 평균을 결정하도록 선택하는 것이 가능하다.
단계 77에서, 최소치는 현재 샘플 e(n)과 단계 76에서의 이웃(NEIGH)에 걸쳐 발견된 최대치 M의 값 사이의 절대값으로 결정된다. 도 6에 예시된 예에서, e(3)와 e(2-T0) 사이의 이 최소치는 실제로 끝에서 두 번째의 피치 주기 e(2-T0)의 샘플이다. 여전히 단계 77에서는, 그 후에 현재 샘플 e(n)의 진폭이 이 최소치로 교체된다. 도 6에서, 샘플 e(3)의 진폭은 샘플 e(2-T0)의 진폭과 동일하게 된다. e(1)부터 e(12)까지의 최종 주기의 모든 샘플에 동일한 방법이 적용된다. 도 6에서, 보정된 샘플은 점선에 의해 교체된다. 본 발명에 따라 보정된, 외삽된 피치 주기 Tj+1, Tj+2의 샘플은 진한 화살표(closed arrow)로 표시된다.
이 단계 77의 유용한 구현에 의해, 파열음이 실제로 최종 피치 주기 Tj(도 6에 도시된 바와 같이 절대값이 큰 신호 강도)에 걸쳐 제공되면, 파열음의 강도와 이전의 피치 주기에서 동일한 시간적 위치에 매우 근접하여 있는 샘플의 강도 간의 최소치가 결정될 것이며(여기서, "매우 근접하여"라는 표현은 "최인접 이웃±k 까지"를 의미하여, 단계 75에서의 실시예의 장점을 발생한다), 적합하다면, 파열음의 강도가 끝에서 두 번째의 피치 주기(Tj-1)에 속하는 더 낮은 강도에 의해 교체된다. 한편, 최종 피치 주기 Tj의 샘플링의 강도가 끝에서 두 번째의 주기 Tj-1의 샘플링의 강도보다 낮으면, 현재의 샘플 e(3)와 끝에서 두 번째의 주기 Tj-1에서의 강도 값 e(2-T0) 중의 최소치를 선택함으로써, 끝에서 두 번째의 피치 주기 Tj-1로부터 파열음(높은 강도를 가짐)이 복사되는 위험이 방지된다.
그러므로, 단계 76에서, 이웃의 샘플의 절대값의 최대치 M(및 예컨대 이 이웃에 걸친 평균과 같은 다른 파라미터를 제외)을 결정하여, 값 e(n)의 교체를 수행하기 위한 단계 77에서의 최소치를 선택하는 영향을 보상할 수 있다. 이 방안은 교체 피치 주기 Tj+1, Tj+2(도 6)의 진폭을 제한하는 것을 방지할 수 있다.
또한, 이웃 결정의 단계 75는, 피치 주기가 항상 규칙적인 것인 아니고, 또한 샘플 e(n)이 피치 주기 T0에서 최대 강도를 갖는다면, 이러한 이웃 결정 과정이 항상 다음 피치 주기 내의 샘플 e(n+T0)에 대한 경우에 해당하는 것은 아니기 때문에, 실시되는 것이 이롭다. 또한, 피치 주기는 2개의 샘플(소정의 샘플링 주파수에서의) 간의 시간적인 위치 폴링까지 연장할 수 있다. 이것은 "부분 피치(fractional pitch)"로 지칭된다. 그러므로, 이 샘플을 e(n-T0)을 다음 피치 주기에 위치된 샘플 e(n)과 관련시키는 것이 필수적이면, 샘플 e(n-T0)을 중심으로 하는 이웃을 취하는 것이 바람직하다.
최종적으로, 단계 75 내지 77의 처리가 필수적으로 샘플의 절대값에 관련되므로, 단계 78은 수정된 샘플 emod(n)에 원래 샘플 e(n)의 부호를 재할당하는 단계로 이루어진다.
단계 75 내지 78은, 피치 주기 To가 고갈될 때까지(따라서, 최종 유효 샘플 e(nl)에 도달할 때까지), 다음 샘플 e(n)에 대해 반복된다.
그러므로, 수정된 신호 emod(n)가 복호화측의 다른 구성요소를 위해 인버스 필터 1/A(z)(도 4에서의 405)에 전달된다.
그러나, 2개의 가능한 변형 실시예에 대해 주목해야 한다. 최종 피치 주기 Tj를 이러한 방식으로 보정하여 최종 피치 주기 Tj에 이 보정치 T'j를 적용하고, 또한 다음 피치 주기를 위한 이 보정치를 복사하는 것이 가능하다. 즉, Tj=Tj+1=Tj+2=T'j 이 된다. 변형으로, 최종 피치 주기 Tj는 변하지 않고 유지되는 한편, 그 보정치 T'j는 다음 피치 주기 Tj+1, Tj+2 내로 복사된다.
도 5 및 도 6의 비교는 이와 같이 실행된 여기(excitation)의 수정이 어떻게 이로운지를 보여준다. 그러므로, 간략하면, 파열음이 최종 피치 주기에 존재하는 경우, 파열음은 끝에서 두 번째의 피치 주기에 동등하지 않을 것이므로, 피치 반복 전에 자동으로 제거될 것이다. 그러므로, 이러한 구현은 파열음의 반복으로 이루어진 피치 반복의 더욱 문제가 되는 어색함 중의 하나를 제거할 수 있게 한다.
또한, 파열음이 최종 피치 주기에서 검출되면, 합성 및 반복된 신호의 더욱 신속한 감쇄가 제공되는 것이 이롭다. 일반적으로, 트랜지터리의 검출의 일례의 실시예는, 이하의 상태 (1)의 발생의 수를 카운트하는 단계로 이루어질 수 있다:
Figure 112009030245041-PCT00005
이 상태가 예컨대 현재 프레임에 걸쳐 2회 이상으로 검증되면, 이전 신호 xl은 트랜지터리를 포함하며(예컨대, 파열음), 이것은 합성 신호 yl에 대한 블록 406에 의한 더욱 신속한 감쇄를 가능하게 한다(예컨대, 10 ms에 걸친 감쇄).
도 2의 (c)는, 파열음 "/t/"를 포함하는 프레임이 손실된 경우 도 2의 (a) 및 (b)와 비교하여 본 발명이 구현될 때의 복호된 신호를 예시한다. 이 경우에는, 본 발명의 구현에 의해 음소 "/t/"의 반복이 방지된다. 프레임의 손실에 따른 차이는 파열의 실제의 검출에 연결되지 않는다. 실제로, 도 2의 (c)에서의 프레임의 손실 후의 신호의 감쇄는, 이 경우에는 G.722 복호화기가 재초기화(도 3의 블록 302에서의 상태의 완벽한 갱신)되는 한편, 도 2의 (b)의 경우에는 재초기화되지 않는다는 사실에 의해 설명될 수 있다. 그럼에도 불구하고, 본 발명은 삭제된 프레임의 외삽을 위한 파열음의 검출에 관련되고, 프레임 손실 후의 재개시(restarting)의 문제에는 관련되지 않는다는 것을 이해할 수 있을 것이다.
그러나, 사람의 청각 기관에서, 도 2의 (c)에 예시된 신호가 도 2의 (b)에 예시된 신호보다 더 우수한 품질의 것이 된다.
본 발명은 또한 디지털 오디오 신호 합성 장치의 메모리에 저장될 컴퓨터 프로그램에 관한 것이다. 이 프로그램은, 이러한 합성 장치의 프로세서에 의해 실행될 때에 본 발명의 사상 내에서의 방법의 구현을 위한 명령어를 포함한다. 또한, 전술한 도 7은 이러한 컴퓨터 프로그램의 흐름도를 예시한다.
또한, 본 발명은 블록의 연속체(succession)에 의해 구성된 디지털 오디오 신호를 합성하는 장치에 관련된다. 디지털 오디오 신호 합성 장치는 전술한 컴퓨터 프로그램을 저장하는 메모리를 추가로 포함할 수 있으며, 전술한 기능과 함께 도 4의 블록 403으로 이루어질 수 있다. 도 8을 참조하면, 디지털 오디오 신호 합성 장치(SYN)는 이하의 구성요소를 포함한다:
- 합성될 적어도 하나의 현재 블록에 선행하는 신호 e(n)의 블록을 수신하기 위한 입력(I), 및
- 합성된 신호 emod(n)을 전달하고 또한 적어도 이러한 현재의 합성 블록을 포함하는 출력(O).
본 발명의 사상 내에서의 합성 장치(SYN)는 작업 저장 메모리(MEM)(또는 전술한 컴퓨터 프로그램을 저장하기 위한 메모리)와 같은 수단, 및 메모리(MEM)와 연동하는 프로세서(PROC)를 포함하여, 본 발명의 사상 내의 방법을 구현하고, 신호 e(n)의 선행 블록 중의 적어도 하나로부터 개시되는 현재 블록을 합성한다.
본 발명은 또한 디지털 오디오 신호 복호화기에 관련되며, 이 신호는 블록의 연속체에 의해 구성되고, 이 복호화기는 유효하지 않은 블록을 합성하기 위해 본 발명의 사상 내의 장치(403)를 포함한다.
보다 일반적으로, 본 발명은 예시를 목적으로 전술된 실시예로 한정되지 않으며, 다른 변형예로 확장될 수 있다.
변형 실시예에서, 피치 주기의 검출 및/또는 트랜지터리의 검출을 위한 파라미터가 다음과 같이 될 수 있다. 끝에서 두 번째의 피치 주기에서 상이한 개수의 3개의 샘플을 포함하는 반전이 취해진다. 예컨대, 전체적으로 고려되는 5개의 샘플을 갖기 위해 k=2가 취해질 수 있다. 마찬가지로, 트랜지터리 검출을 위한 임계값(상기한 상태 (1)의 예에서는 1/4)을 채용하는 것이 가능하다. 또한, 검출 상태가 적어도 m회 검증된다면, 신호를 트랜지터리 신호로 하는 것도 가능하며, 여기서 m≥1 이다.
또한, 본 발명은 전술한 것과 상이한 내용에도 동등하게 적용될 수 있다.
예컨대, 신호 영역(signal domain)(여기 영역이 아닌)에서 신호 검출 및 수정이 수행될 수 있다. 통상적으로, CELP 복호화기(또한 소스-필터 모델에 따라 동작하는)에서의 프레임 손실의 보정을 위해, 여기는 피치의 반복에 의해 또한 옵션으로는 랜덤한 기여(contribution)의 추가에 의해 외삽되며, 이 여기는 1/A(z) 타입의 필터에 의해 필터링되며, 여기서 A(z)는 적확하게 수신된 최종의 예측 필터로부터 구해진다.
본 발명은 G.711 표준에 따른 복호화기에도 동등하게 적용할 수 있다.
물론, 새로운 합성된 주기(Tj+1, Tj+2)를 구성하기 위해 끝에서 두 번째의 피치 주기(Tj-1)를 단순하게 복사하는 것은 파열음의 반복의 문제점을 해소할 수 있게 하며, 또한 끝에서 두 번째의 피치 주기에서의 파열음을 검출하기 위한 구성이 이루어진다(예컨대, 전술한 상태 (1)의 타입의 구성을 이용함으로써). 이 실시예는 본 발명의 사상 내에 있다.
또한, 전술한 설명에서의 명확성을 위해, 단계 (b)에서의 샘플의 보정이 기술되며, 그에 후속하여 보정된 샘플을 교체 블록 내로 복사하는 것이 후속된다. 물론, 기술적으로, 엄격한 등가의 양상에서, 이전의 최종 반복 주기의 샘플을 먼저 복사하고, 그 후 이들 모두를 교체 블록에서 보정하는 것도 가능하다. 그러므로, 샘플의 보정 및 복사는, 어떤 순서로도 발생할 수 있고, 특히 반대로 될 수도 있 다.

Claims (13)

  1. 샘플의 연속적인 블록으로 표현되는 디지털 오디오 신호의 수신 시에, 하나 이상의 유효하지 않은 블록을 교체하기 위해, 상기 유효하지 않은 블록에 선행하는 하나 이상의 유효 블록의 샘플로부터 교체 블록이 생성되는, 디지털 오디오 신호의 합성 방법에 있어서,
    a) 하나 이상의 유효 블록 내의 반복 주기를 결정하는 단계(402); 및
    b) 상기 반복 주기의 샘플을 하나 이상의 상기 교체 블록에 복사하는 단계(403)
    를 포함하며,
    - 상기 a) 단계에서는, 유효하지 않은 블록에 바로 선행하는 하나 이상의 유효 블록에서 최종 반복 주기(Tj)가 결정되며,
    - 상기 b) 단계에서는, 상기 최종 반복 주기 내의 어떠한 트랜지터리 신호(transitory signal)의 진폭을 제한하기 위해, 상기 최종 반복 주기(Tj)의 샘플(e(3))이 상기 최종 반복 주기(Tj)에 선행하는 이전의 반복 주기(Tj-1)의 샘플(e(2-T0), e(3-T0), e(4-T0))에 따라 보정되며, 이와 같이 보정된 샘플이 상기 교체 블록(Tj+1, Tj+2)에 복사되는,
    디지털 오디오 신호의 합성 방법.
  2. 제1항에 있어서,
    상기 디지털 오디오 신호는 유성음화된 스피치 신호(voiced speech signal)이며, 상기 반복 주기는 그 신호의 기본 주파수의 역에 대응하는 피치 주기인, 디지털 오디오 신호의 합성 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 b) 단계에서, 상기 최종 반복 주기의 현재 샘플(e(3))은,
    상기 현재 샘플의 진폭의 절대값과, 상기 현재 샘플 전의 반복 주기에 시간적으로 매우 근접하여 위치된 하나 이상의 샘플(e(2-T0))의 진폭의 절대값을 비교하고,
    이들 2개의 진폭의 절대값의 최소 진폭을 상기 현재 샘플에 할당함으로써 보정되는,
    디지털 오디오 신호의 합성 방법.
  4. 제3항에 있어서,
    상기 최종 반복 주기의 현재 샘플(e(3))에 대해,
    - 상기 현재 샘플 이전의 반복 주기에 시간적으로 위치된 샘플(e(3-T0))을 중심으로 하는 이웃에 한 세트의 샘플(75)이 구성되고,
    - 상기 이웃의 샘플의 진폭으로부터, 선별된 진폭(76)이 절대값의 형태로 결정되고,
    - 상기 선별된 진폭과 상기 현재 샘플의 진폭으로부터 절대값이 최소인 진폭을 상기 현재 샘플(e(3))에 할당(77)하기 위해, 상기 선별된 진폭이 상기 현재 샘플의 진폭의 절대값과 비교되는,
    디지털 오디오 신호의 합성 방법.
  5. 제4항에 있어서,
    상기 이웃의 샘플의 진폭으로부터 선별된 진폭은, 절대값 형태의 최대 진폭(M)인, 디지털 오디오 신호의 합성 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 디지털 오디오 신호는 스피치 신호이고, 상기 스피치 신호에서 유성음화의 정도가 검출되며(71), 상기 스피치 신호가 비유성음화(non-voiced)되어 있거나 또는 약하게 유성음화된 경우, 상기 a) 및 상기 b) 단계가 시행되는,
    디지털 오디오 신호의 합성 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 교체 블록 내의 샘플의 진폭의 댐핑(damping)이 가해지며, 상기 최종 반복 주기 내의 신호의 어떠한 트랜지터리 특징이 검출되며, 적용 가능한 경우, 불 변의 신호(stationary signal)에 대해서는 더 신속한 댐핑이 가해지는, 디지털 오디오 신호의 합성 방법.
  8. 제3항 및 제4항 중의 하나와 조합된 제7항에 있어서,
    - 상기 최종 반복 주기의 복수의 현재 샘플에 대해, 상기 선별된 진폭에 대한 현재 샘플의 진폭의 관계가 절대값으로 측정되며,
    - 상기 관계가 소정의 제1 임계치보다 크게 되는 상기 현재 샘플이 발생하는 횟수가 카운트되며,
    - 발생 횟수가 소정의 제2 임계치보다 큰 경우에는, 트랜지터리 특성의 존재가 검출되는,
    디지털 오디오 신호의 합성 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    복수의 연속적인 유효하지 않은 블록의 수신이 하나 이상의 반복 주기에 걸쳐 연장하고 있는 경우에, 상기 최종 반복 주기의 샘플 모두에 상기 b) 단계에서의 샘플 보정이 가해져 하나하나씩 현재 샘플로 취해지는, 디지털 오디오 신호의 합성 방법.
  10. 제9항에 있어서,
    복수의 연속적인 유효하지 않은 블록의 수신이 여러 개의 반복 주기에 걸쳐 연장하고 있는 경우에, 상기 복수의 유효하지 않은 블록을 교체하기 위해, 상기 단계 b)에서 보정된 반복 주기가 복수 회 복사되어 상기 교체 블록을 형성하는, 디지털 오디오 신호의 합성 방법.
  11. 디지털 오디오 신호 합성 장치의 메모리에 저장되는 컴퓨터 프로그램으로서, 이러한 합성 장치의 프로세서에 의해 실행될 때에, 청구항 1 내지 청구항 10 중의 어느 한 항에 따른 디지털 오디오 신호의 합성 방법을 구현하기 위한 명령어를 포함하는, 컴퓨터 프로그램.
  12. 블록의 연속체에 의해 구성되는 디지털 오디오 신호를 합성하는 장치로서,
    - 합성될 하나 이상의 현재 블록에 선행하는 신호(e(n))의 블록을 수신하기 위한 입력(I), 및
    - 합성된 신호(emod(n))를 전달하고 또한 상기 현재 블록을 포함하는 출력(O)
    을 포함하며,
    상기 선행 블록 중의 하나 이상의 블록으로부터 현재 블록을 합성하기 위해, 청구항 1 내지 청구항 10 중의 어느 한 항에 따른 디지털 오디오 신호의 합성 방법을 구현하기 위한 수단(MEM, PROC)
    을 포함하는 디지털 오디오 신호 합성 장치.
  13. 블록의 연속체에 의해 구성된 디지털 오디오 신호의 복호화기로서,
    유효하지 않은 블록을 합성하기 위해 청구항 12에 따른 디지털 오디오 신호 합성 장치(403)를 포함하는 복호화기.
KR1020097010326A 2006-10-20 2007-10-17 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법 KR101406742B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0609227 2006-10-20
FR0609227A FR2907586A1 (fr) 2006-10-20 2006-10-20 Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch.
PCT/FR2007/052189 WO2008096084A1 (fr) 2006-10-20 2007-10-17 Synthèse de blocs perdus d'un signal audionumérique, avec correction de période de pitch

Publications (2)

Publication Number Publication Date
KR20090082415A true KR20090082415A (ko) 2009-07-30
KR101406742B1 KR101406742B1 (ko) 2014-06-12

Family

ID=37735201

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097010326A KR101406742B1 (ko) 2006-10-20 2007-10-17 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법

Country Status (14)

Country Link
US (1) US8417519B2 (ko)
EP (1) EP2080195B1 (ko)
JP (1) JP5289320B2 (ko)
KR (1) KR101406742B1 (ko)
CN (1) CN101627423B (ko)
AT (1) ATE502376T1 (ko)
BR (1) BRPI0718422B1 (ko)
DE (1) DE602007013265D1 (ko)
ES (1) ES2363181T3 (ko)
FR (1) FR2907586A1 (ko)
MX (1) MX2009004211A (ko)
PL (1) PL2080195T3 (ko)
RU (1) RU2432625C2 (ko)
WO (1) WO2008096084A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9293144B2 (en) 2013-02-05 2016-03-22 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for controlling audio frame loss concealment
US9478221B2 (en) 2013-02-05 2016-10-25 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced audio frame loss concealment
US9847086B2 (en) 2013-02-05 2017-12-19 Telefonaktiebolaget L M Ericsson (Publ) Audio frame loss concealment

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8706479B2 (en) * 2008-11-14 2014-04-22 Broadcom Corporation Packet loss concealment for sub-band codecs
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
JP5456370B2 (ja) * 2009-05-25 2014-03-26 任天堂株式会社 発音評価プログラム、発音評価装置、発音評価システムおよび発音評価方法
US8976675B2 (en) * 2011-02-28 2015-03-10 Avaya Inc. Automatic modification of VOIP packet retransmission level based on the psycho-acoustic value of the packet
JP5932399B2 (ja) * 2012-03-02 2016-06-08 キヤノン株式会社 撮像装置及び音声処理装置
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
FR3001593A1 (fr) * 2013-01-31 2014-08-01 France Telecom Correction perfectionnee de perte de trame au decodage d'un signal.
PL3011555T3 (pl) * 2013-06-21 2018-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja ramki sygnału mowy
SG11201510463WA (en) 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
KR101854296B1 (ko) 2013-10-31 2018-05-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
PT3288026T (pt) 2013-10-31 2020-07-20 Fraunhofer Ges Forschung Descodificador áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo
NO2780522T3 (ko) 2014-05-15 2018-06-09
US9706317B2 (en) * 2014-10-24 2017-07-11 Starkey Laboratories, Inc. Packet loss concealment techniques for phone-to-hearing-aid streaming
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
GB2547877B (en) * 2015-12-21 2019-08-14 Graham Craven Peter Lossless bandsplitting and bandjoining using allpass filters
CN106970950B (zh) * 2017-03-07 2021-08-24 腾讯音乐娱乐(深圳)有限公司 相似音频数据的查找方法及装置
WO2022045395A1 (ko) * 2020-08-27 2022-03-03 임재윤 파열음 제거를 위한 오디오데이터를 보정하는 방법 및 장치

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3369077A (en) * 1964-06-09 1968-02-13 Ibm Pitch modification of audio waveforms
WO1994026036A1 (en) * 1993-05-04 1994-11-10 Motorola Inc. Apparatus and method for substantially eliminating noise in an audible output signal
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
JP2001228896A (ja) * 2000-02-14 2001-08-24 Iwatsu Electric Co Ltd 欠落音声パケットの代替置換方式
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US20030163304A1 (en) * 2002-02-28 2003-08-28 Fisseha Mekuria Error concealment for voice transmission system
US20030220787A1 (en) * 2002-04-19 2003-11-27 Henrik Svensson Method of and apparatus for pitch period estimation
US7411985B2 (en) * 2003-03-21 2008-08-12 Lucent Technologies Inc. Low-complexity packet loss concealment method for voice-over-IP speech transmission
KR20060011854A (ko) * 2003-05-14 2006-02-03 오끼 덴끼 고오교 가부시끼가이샤 소거된 주기 신호 데이터를 은닉하는 장치 및 방법
JP4135621B2 (ja) * 2003-11-05 2008-08-20 沖電気工業株式会社 受信装置および方法
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
US8005678B2 (en) * 2006-08-15 2011-08-23 Broadcom Corporation Re-phasing of decoder states after packet loss

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9293144B2 (en) 2013-02-05 2016-03-22 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for controlling audio frame loss concealment
KR20160045917A (ko) * 2013-02-05 2016-04-27 텔레폰악티에볼라겟엘엠에릭슨(펍) 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치
US9478221B2 (en) 2013-02-05 2016-10-25 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced audio frame loss concealment
US9721574B2 (en) 2013-02-05 2017-08-01 Telefonaktiebolaget L M Ericsson (Publ) Concealing a lost audio frame by adjusting spectrum magnitude of a substitute audio frame based on a transient condition of a previously reconstructed audio signal
US9847086B2 (en) 2013-02-05 2017-12-19 Telefonaktiebolaget L M Ericsson (Publ) Audio frame loss concealment
KR20180049145A (ko) * 2013-02-05 2018-05-10 텔레폰악티에볼라겟엘엠에릭슨(펍) 오디오 프레임 손실 은폐
US10332528B2 (en) 2013-02-05 2019-06-25 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for controlling audio frame loss concealment
US10339939B2 (en) 2013-02-05 2019-07-02 Telefonaktiebolaget Lm Ericsson (Publ) Audio frame loss concealment
US10559314B2 (en) 2013-02-05 2020-02-11 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for controlling audio frame loss concealment
KR20200052983A (ko) * 2013-02-05 2020-05-15 텔레폰악티에볼라겟엘엠에릭슨(펍) 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치
KR20210041107A (ko) * 2013-02-05 2021-04-14 텔레폰악티에볼라겟엘엠에릭슨(펍) 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치
US11437047B2 (en) 2013-02-05 2022-09-06 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for controlling audio frame loss concealment
US11482232B2 (en) 2013-02-05 2022-10-25 Telefonaktiebolaget Lm Ericsson (Publ) Audio frame loss concealment

Also Published As

Publication number Publication date
WO2008096084A1 (fr) 2008-08-14
JP2010507121A (ja) 2010-03-04
RU2432625C2 (ru) 2011-10-27
CN101627423A (zh) 2010-01-13
US8417519B2 (en) 2013-04-09
EP2080195B1 (fr) 2011-03-16
CN101627423B (zh) 2012-05-02
US20100318349A1 (en) 2010-12-16
PL2080195T3 (pl) 2011-09-30
EP2080195A1 (fr) 2009-07-22
ES2363181T3 (es) 2011-07-26
BRPI0718422A2 (pt) 2013-11-12
MX2009004211A (es) 2009-07-02
ATE502376T1 (de) 2011-04-15
KR101406742B1 (ko) 2014-06-12
BRPI0718422B1 (pt) 2020-02-11
RU2009118929A (ru) 2010-11-27
JP5289320B2 (ja) 2013-09-11
DE602007013265D1 (de) 2011-04-28
FR2907586A1 (fr) 2008-04-25

Similar Documents

Publication Publication Date Title
KR101406742B1 (ko) 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법
RU2667029C2 (ru) Аудиодекодер и способ обеспечения декодированной аудиоинформации с использованием маскирования ошибки, модифицирующего сигнал возбуждения во временной области
RU2419891C2 (ru) Способ и устройство эффективной маскировки стирания кадров в речевых кодеках
US10249313B2 (en) Adaptive bandwidth extension and apparatus for the same
KR101032119B1 (ko) 선형 예측 기반 음성 코덱에서 효율적인 프레임 소거 은폐방법 및 장치
RU2678473C2 (ru) Аудиодекодер и способ обеспечения декодированной аудиоинформации с использованием маскирования ошибки на основании сигнала возбуждения во временной области
RU2496156C2 (ru) Маскирование ошибки передачи в цифровом аудиосигнале в иерархической структуре декодирования
JP2004508597A (ja) オーディオ信号における伝送エラーの抑止シミュレーション
JP6687599B2 (ja) Fd/lpd遷移コンテキストにおけるフレーム喪失管理
JP2016510134A (ja) 潜在的なフレームの不安定性を軽減するためのシステムおよび方法
KR101409305B1 (ko) 정보의 부재 시에 디코더측에서의 여기를 생성하기 위한 과유성음화의 감쇄

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180601

Year of fee payment: 5