KR100563293B1 - 음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및시스템 - Google Patents

음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및시스템 Download PDF

Info

Publication number
KR100563293B1
KR100563293B1 KR1020037005909A KR20037005909A KR100563293B1 KR 100563293 B1 KR100563293 B1 KR 100563293B1 KR 1020037005909 A KR1020037005909 A KR 1020037005909A KR 20037005909 A KR20037005909 A KR 20037005909A KR 100563293 B1 KR100563293 B1 KR 100563293B1
Authority
KR
South Korea
Prior art keywords
long term
term prediction
speech
delay value
gain
Prior art date
Application number
KR1020037005909A
Other languages
English (en)
Other versions
KR20030086577A (ko
Inventor
매키넨자리
믹콜라한누제이
바이니오잔느
로톨라-푹킬라자니
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20030086577A publication Critical patent/KR20030086577A/ko
Application granted granted Critical
Publication of KR100563293B1 publication Critical patent/KR100563293B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Error Detection And Correction (AREA)

Abstract

복호기에 수신되는 부호화된 비트 스트림의 부분으로서 음성 시퀀스에서의 하나 이상의 불량 프레임들의 오류들을 은폐하기 위한 방법 및 시스템이 개시된다. 음성 시퀀스가 유성음인 경우, 불량 프레임들의 LTP-매개변수들은 최종 프레임에서의 대응하는 매개변수들에 의해 대체된다. 음성 시퀀스가 무성음인 경우, 불량 프레임들의 LTP-매개변수들은 적응-제한 랜덤 항과 함께 LTP 이력에 기초하여 계산된 값들에 의해 대체된다.

Description

음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및 시스템{Method and system for speech frame error concealment in speech decoding}
본 발명은 일반적으로 부호화된 비트 스트림으로부터 음성 신호들의 복호화에 관한 것으로, 보다 상세하게는, 음성 복호화 동안 음성 프레임들에서 오류들이 검출되는 경우 손상된 음성 매개변수들의 은폐에 관한 것이다.
음성 및 오디오 부호화 알고리즘들은 통신, 멀티미디어 및 저장 시스템들에서 광범위하게 다양한 애플리케이션들을 갖는다. 부호화 알고리즘들의 개발은 합성 신호의 고품질을 유지하면서 전송 및 저장 용량을 절약할 필요성에 의해 유도된다. 부호기의 복잡함은 예를 들어 애플리케이션 플랫폼의 처리 능력에 의해 제한된다. 몇몇 애플리케이션들, 예를 들어 음성 저장 장치에 있어서, 부호기는 매우 복잡할 수 있지만, 복호기는 가능한 한 간단해야 한다.
현대의 음성 코덱들은 프레임들로 지칭되는 짧은 세그먼트들로 음성 신호를 처리함으로써 동작한다. 음성 코덱의 전형적인 프레임 길이는 20 ms이고, 이것은 8 kHz 샘플링 주파수를 가정하면 160 음성 샘플들에 대응한다. 광대역 코덱들에 있어서, 20 ms의 전형적인 프레임 길이는 16 kHz 샘플링 주파수를 가정하면 320 음성 샘플들에 대응한다. 상기 프레임은 다수의 서브프레임들로 더 분할될 수 있다. 모 든 프레임에 대해, 부호기는 입력 신호의 매개 변수적 표현을 결정한다. 상기 매개변수들은 양자화되고 디지털 형태로 통신 채널을 통해 전송된다(또는 저장 매체에 저장된다). 도 1에 도시된 바와 같이, 복호기는 수신되는 매개변수들에 기초하여 합성 음성 신호를 생성한다.
추출되는 부호화 매개변수들의 전형적인 집합은 신호의 단기 예측에 사용되는 (선형 예측 부호화(LPC; Linear Predictive Coding) 매개변수들과 같은) 스펙트럼 매개변수들, 신호의 장기 예측(LTP)에 사용되는 매개변수들, 다양한 이득 매개변수들, 및 여진(excitation) 매개변수들을 포함한다. LTP 매개변수는 음성 신호의 기본 주파수에 밀접하게 관련된다. 이 매개변수는 종종 음성 샘플들에 의한 기본 주기를 나타내는, 소위 피치-지연(pitch-lag) 매개변수로 알려져 있다. 또한, 이득 매개변수들 중 하나는 상기 기본 주기에 매우 관련되고 따라서 LTP 이득으로 지칭된다. 상기 LTP 이득은 음성을 가능한 한 자연스럽게 만드는데 매우 중요한 매개변수이다. 상기 부호화 매개변수들의 설명은 어떤 시간 동안 가장 성공적인 음성 코덱들이었던, 소위 부호-여진 선형 예측(CELP; Code-Excited Linear Prediction) 코덱들을 포함하는, 다양한 음성 코덱들과의 일반적인 관계에 적합하다.
음성 매개변수들은 디지털 형태로 전송 채널을 통해 전송된다. 때때로 통신 채널의 상태가 변하고 그것은 비트 스트림에 오류들을 야기할 수 있다. 이것은 프레임 오류들(불량 프레임들)을 야기할 것이다. 즉, 특정 음성 세그먼트(전형적으로 20 ms)를 나타내는 몇몇 매개변수들이 손상된다. 2가지 종류의 프레임 오류들이 있다: 전체적으로 손상된 프레임들 및 부분적으로 손상된 프레임들. 때때로 이들 프 레임들은 복호기에 전혀 수신되지 않는다. 보통의 인터넷 접속들에서와 같은, 패킷-기반 전송 시스템들에 있어서, 데이터 패킷이 전혀 수신기에 도달하지 않거나 데이터 패킷이 너무 늦게 도착해서 음성의 실시간 성질로 인하여 사용될 수 없는 경우가 발생할 수 있다. 부분적으로 손상된 프레임은 수신기에 도달하고 또한 오류가 없는 몇몇 매개변수들을 포함할 수 있는 프레임이다. 이것은 보통 현존 GSM 접속에서와 같은 회선 교환 접속에서의 경우이다. 부분적으로 손상되는 프레임들의 비트-오류율(BER; bit-error rate)은 전형적으로 대략 0.5-5%이다.
상기 설명으로부터, 불량이거나 손상된 프레임들의 2가지 경우들은 음성 매개변수들의 손실로 인하여 재구성된 음성에서의 성능 저하를 처리하는데 상이한 접근들을 요구한다는 것을 알 수 있다.
손실되거나 오류가 있는 음성 프레임들은 비트 스트림에 오류들을 야기하는 통신 채널의 불량 상태의 결과들이다. 수신된 음성 프레임에서 오류가 검출되는 경우, 오류 정정 절차가 시작된다. 이 오류 정정 절차는 보통 대체(substitution) 절차 및 묵음(muting) 절차를 포함한다. 선행 기술에 있어서, 불량 프레임의 음성 매개변수들은 이전 우량 프레임으로부터 감소되거나 수정된 값들에 의해 대체된다. 그러나, 손상된 프레임의 (CELP 매개변수들에서의 여진과 같은) 몇몇 매개변수들은 여전히 복호화에 사용될 수 있다.
도 2는 선행 기술 방법의 원리를 도시한다. 도 2에 도시된 바와 같이, "매개변수 이력(parameter history)"으로 표시된 버퍼는 최종 우량 프레임의 음성 매개변수들을 저장하는데 사용된다. 불량 프레임이 검출되는 경우, 불량 프레임 표시자(BFI; Bad Frame Indicator)가 1로 세팅되고 오류 은폐 절차가 시작된다. 상기 BFI가 세팅되지 않는 경우(BFI = 0), 매개변수 이력이 갱신되고 음성 매개변수들은 오류 은폐되지 않고 복호화하는데 사용된다. 선행 기술 시스템에 있어서, 오류 은폐 절차는 손상된 프레임들의 손실되거나 오류가 있는 매개변수들을 은폐하기 위해 상기 매개변수 이력을 사용한다. 비록 몇몇 음성 매개변수들이 불량 프레임으로 분류된다 하더라도(BFI = 1), 상기 몇몇 음성 매개변수들은 수신된 프레임으로부터 사용될 수 있다. 예를 들어, GSM 적응 다중율(AMR; Adaptive Multi-Rate) 음성 코덱(ETSI 사양 06.91)에 있어서, 채널로부터의 여진 벡터가 항상 사용된다. (예를 들어, 몇몇 IP-기반 전송 시스템들에서) 음성 프레임들이 전체적으로 손실된 프레임들인 경우, 수신된 불량 프레임으로부터 어떠한 매개변수들도 사용되지 않을 것이다. 몇몇 경우들에 있어서, 어떠한 프레임도 수신되지 않거나, 프레임이 너무 늦게 도착해서 손실된 프레임으로 분류되어져야 할 것이다.
선행 기술 시스템에 있어서, LTP-지연 은폐는 약간 수정된 소수부를 갖는 최종 우량 LTP-지연 값을 사용하고, 스펙트럼 매개변수들은 고정 평균을 향해 약간 이동된 최종 우량 매개변수들에 의해 대체된다. 상기 이득들(LTP 및 고정 부호록)은 보통 감소된 최종 우량 값에 의해 또는 몇몇 최종 우량 값들의 중앙값에 의해 대체될 수 있다. 동일한 대체되는 음성 매개변수들은 그들 중 몇몇에 약간의 수정을 하여 모든 서브-프레임들에 대해 사용된다.
선행 기술 LTP 은폐는 정적 음성 신호들, 예를 들어 유성음 또는 정적 음성에 대해 적합할 수 있다. 그러나, 비-정적 음성 신호들에 대해, 선행 기술 방법은 불쾌하고 들을 수 있는 인공물들(artifacts)을 야기할 수 있다. 예를 들어, 음성 신호가 무성음 또는 비-정적인 경우, 불량 프레임의 지연 값을 최종 우량 지연 값으로 간단히 대체하는 것은 무성음 버스트의 중간에 짧은 유성음-음성 세그먼트를 생성하는 효과를 갖는다(도 10 참조). "빙(bing)" 인공물로서 알려진 효과는 불쾌할 수 있다.
음성 품질을 개선하기 위하여 음성 복호화에서 오류 은폐를 위한 방법 및 시스템을 제공하는 것이 유리하고 바람직하다.
본 발명은 음성 신호들에서의 장기 예측(LTP; long-term prediction) 매개변수들 사이에 인식 가능한 관계가 있다는 사실을 이용한다. 특히, LTP-지연은 LTP-이득과 강한 상관관계를 갖는다. LTP-이득이 높고 상당히 안정된 경우, LTP-지연은 전형적으로 매우 안정되고 인접 지연 값들간의 변화가 작다. 그 경우에 있어서, 음성 매개변수들은 유성음-음성 시퀀스를 나타낸다. LTP-이득이 낮고 불안정한 경우, LTP-지연은 전형적으로 무성음이고, 음성 매개변수들은 무성음-음성 시퀀스를 나타낸다. 일단 음성 시퀀스가 정적(유성음) 또는 비-정적(무성음)으로 분류되는 경우, 시퀀스에서의 손상되거나 불량한 프레임은 상이하게 처리될 수 있다.
따라서, 본 발명의 제1 태양은 음성 복호기에 수신되는 음성 신호들을 나타내는 부호화된 비트 스트림에서의 오류들을 은폐하기 위한 방법으로서, 상기 부호화된 비트 스트림은 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나 의 손상된 프레임을 포함하며, 상기 손상된 프레임은 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하며, 상기 제2 장기 예측 지연 값들은 최종 장기 예측 지연 값을 포함하고, 상기 제2 장기 예측 이득 값들은 최종 장기 예측 이득 값을 포함하며, 상기 음성 시퀀스들은 정적(stationary) 및 비-정적(non-stationary) 음성 시퀀스들을 포함하고, 상기 손상된 프레임은 전체적으로 손상되거나 부분적으로 손상될 수 있는 오류 은폐 방법이다. 상기 방법은:
상기 제1 장기 예측 지연 값이 상기 제2 장기 예측 지연 값들에 기초하여 결정되는 상한 및 하한 내부에 있는지 외부에 있는지를 결정하는 단계;
상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우, 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 제3 지연 값으로 대체하는 단계; 및
상기 제1 장기 예측 지연 값이 상기 상한 및 하한 내부에 있는 경우, 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 보유하는 단계를 포함한다.
대안으로, 상기 방법은:
상기 제2 장기 예측 이득 값들에 기초하여, 상기 손상된 프레임이 배열되는 상기 음성 시퀀스가 정적인지 비-정적인지를 결정하는 단계;
상기 음성 시퀀스가 정적인 경우, 상기 손상된 프레임의 상기 제1 장기 예측 지연 값을 상기 최종 장기 예측 지연 값으로 대체하는 단계; 및
상기 음성 시퀀스가 비-정적인 경우, 상기 손상된 프레임의 상기 제1 장기 예측 지연 값을 상기 제2 장기 예측 지연 값들 및 적응-제한 랜덤 지연 지터(adaptively-limited random lag jitter)에 기초하여 결정되는 제3 장기 예측 지연 값으로 대체하고, 상기 손상된 프레임의 상기 제1 장기 예측 이득 값을 상기 제2 장기 예측 이득 값들 및 적응-제한 랜덤 이득 지터(adaptively-limited random gain jitter)에 기초하여 결정되는 제3 장기 예측 이득 값으로 대체하는 단계를 포함한다.
바람직하기로는, 상기 제3 장기 예측 지연 값은 적어도 부분적으로 상기 제2 장기 예측 지연 값들의 가중된 중앙값에 기초하여 계산되고, 상기 적응-제한 랜덤 지연 지터는 상기 제2 장기 예측 지연 값들에 기초하여 결정되는 한계들에 의해 제한되는 값이다.
바람직하기로는, 상기 제3 장기 예측 이득 값은 적어도 부분적으로 상기 제2 장기 예측 이득 값들의 가중된 중앙값에 기초하여 계산되고, 상기 적응-제한 랜덤 이득 지터는 상기 제2 장기 예측 이득 값들에 기초하여 결정되는 한계들에 의해 제한되는 값이다.
대안으로, 상기 방법은:
상기 손상된 프레임이 부분적으로 손상되었는지 전체적으로 손상되었는지를 결정하는 단계;
상기 손상된 프레임이 전체적으로 손상된 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값을 제3 지연 값으로 대체하는 단계로서, 상기 전체적으로 손 상된 프레임이 배열되는 상기 음성 시퀀스가 정적인 경우, 상기 제3 지연 값을 상기 최종 장기 예측 지연 값과 동일하게 설정하고, 상기 음성 시퀀스가 비-정적인 경우, 상기 제2 장기 예측 값들 및 적응-제한 랜덤 지연 지터에 기초하여 상기 제3 지연 값을 결정하는 단계; 및
상기 손상된 프레임이 부분적으로 손상된 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값을 제4 지연 값으로 대체하는 단계로서, 상기 부분적으로 손상된 프레임이 배열되는 상기 음성 시퀀스가 정적인 경우, 상기 제4 지연 값을 상기 최종 장기 예측 지연 값과 동일하게 설정하고, 상기 음성 시퀀스가 비-정적인 경우, 상기 손상된 프레임을 앞서는 상기 손상되지 않은 프레임과 연관되는 적응 부호록(adaptive codebook)으로부터 검색되는 복호화된 장기 예측 지연 값에 기초하여 상기 제4 지연 값을 설정하는 단계를 포함한다.
본 발명의 제2 태양은 부호화된 비트 스트림으로 음성 신호들을 부호화하고 상기 부호화된 비트 스트림을 합성 음성으로 복호화하기 위한 음성 신호 송신기 및 수신기 시스템으로서, 상기 부호화된 비트 스트림은 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나의 손상된 프레임을 포함하며, 상기 손상된 프레임은 제1 신호에 의해 표시되고 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하며, 상기 제2 장기 예측 지연 값들은 최종 장기 예측 지연 값을 포함하고, 상기 제2 장기 예측 이득 값들은 최종 장기 예측 이득 값을 포함하 며, 상기 음성 시퀀스들은 정적 및 비-정적 음성 시퀀스들을 포함하는 음성 신호 송신기 및 수신기 시스템이다. 상기 시스템은:
상기 제1 신호에 응답하여, 상기 제2 장기 예측 이득 값들에 기초하여, 상기 손상된 프레임이 배열되는 상기 음성 시퀀스가 정적인지 비-정적인지를 결정하고, 상기 음성 시퀀스가 정적인지 비-정적인지를 나타내는 제2 신호를 제공하기 위한 제1 메커니즘; 및
상기 제2 신호에 응답하여, 상기 음성 시퀀스가 정적인 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값을 상기 최종 장기 예측 지연 값으로 대체하고, 상기 음성 시퀀스가 비-정적인 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값 및 상기 제1 장기 예측 이득 값을 각각 제3 장기 예측 지연 값 및 제3 장기 예측 이득 값으로 대체하기 위한 제2 메커니즘으로서, 상기 제3 장기 예측 지연 값은 상기 제2 장기 예측 지연 값들 및 적응-제한 랜덤 지연 지터에 기초하여 결정되고, 상기 제3 장기 예측 이득 값은 상기 제2 장기 예측 이득 값들 및 적응-제한 랜덤 이득 지터에 기초하여 결정되는 제2 메커니즘을 포함한다.
바람직하기로는, 상기 제3 장기 예측 지연 값은 적어도 부분적으로 상기 제2 장기 예측 지연 값들의 가중된 중앙값에 기초하여 계산되고, 상기 적응-제한 랜덤 지연 지터는 상기 제2 장기 예측 지연 값들에 기초하여 결정되는 한계들에 의해 제한되는 값이다.
바람직하기로는, 상기 제3 장기 예측 이득 값은 적어도 부분적으로 상기 제2 장기 예측 이득 값들의 가중된 중앙값에 기초하여 계산되고, 상기 적응-제한 랜덤 이득 지터는 상기 제2 장기 예측 이득 값들에 기초하여 결정되는 한계들에 의해 제한되는 값이다.
본 발명의 제3 태양은 부호화된 비트 스트림으로부터 음성을 합성하기 위한 복호기로서, 상기 부호화된 비트 스트림은 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나의 손상된 프레임을 포함하며, 상기 손상된 프레임은 제1 신호에 의해 표시되고 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하며, 상기 제2 장기 예측 지연 값들은 최종 장기 예측 지연 값을 포함하고, 상기 제2 장기 예측 이득 값들은 최종 장기 예측 이득 값을 포함하며, 상기 음성 시퀀스들은 정적 및 비-정적 음성 시퀀스들을 포함하는 복호기이다. 상기 복호기는:
상기 제1 신호에 응답하여, 상기 제2 장기 예측 이득 값들에 기초하여, 상기 손상된 프레임이 배열되는 상기 음성 시퀀스가 정적인지 비-정적인지를 결정하고, 상기 음성 시퀀스가 정적인지 비-정적인지를 나타내는 제2 신호를 제공하기 위한 제1 메커니즘; 및
상기 제2 신호에 응답하여, 상기 음성 시퀀스가 정적인 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값을 상기 최종 장기 예측 지연 값으로 대체하고, 상기 음성 시퀀스가 비-정적인 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값 및 상기 제1 장기 예측 이득 값을 각각 제3 장기 예측 지연 값 및 제3 장기 예측 이득 값으로 대체하기 위한 제2 메커니즘으로서, 상기 제3 장기 예측 지연 값은 상기 제2 장기 예측 지연 값들 및 적응-제한 랜덤 지연 지터에 기초하여 결정되고, 상기 제3 장기 예측 이득 값은 상기 제2 장기 예측 이득 값들 및 적응-제한 랜덤 이득 지터에 기초하여 결정되는 제2 메커니즘을 포함한다.
본 발명의 제4 태양은 음성 신호들을 나타내는 음성 데이터를 포함하는 부호화된 비트 스트림을 수신하도록 정해지는 이동국으로서, 상기 부호화된 비트 스트림은 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나의 손상된 프레임을 포함하며, 상기 손상된 프레임은 제1 신호에 의해 표시되고 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하며, 상기 제2 장기 예측 지연 값들은 최종 장기 예측 지연 값을 포함하고, 상기 제2 장기 예측 이득 값들은 최종 장기 예측 이득 값을 포함하며, 상기 음성 시퀀스들은 정적 및 비-정적 음성 시퀀스들을 포함하는 이동국이다. 상기 이동국은:
상기 제1 신호에 응답하여, 상기 제2 장기 예측 이득 값들에 기초하여, 상기 손상된 프레임이 배열되는 상기 음성 시퀀스가 정적인지 비-정적인지를 결정하고, 상기 음성 시퀀스가 정적인지 비-정적인지를 나타내는 제2 신호를 제공하기 위한 제1 메커니즘; 및
상기 제2 신호에 응답하여, 상기 음성 시퀀스가 정적인 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값을 상기 최종 장기 예측 지연 값으로 대체하고, 상기 음성 시퀀스가 비-정적인 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값 및 상기 제1 장기 예측 이득 값을 각각 제3 장기 예측 지연 값 및 제3 장기 예측 이득 값으로 대체하기 위한 제2 메커니즘으로서, 상기 제3 장기 예측 지연 값은 상기 제2 장기 예측 지연 값들 및 적응-제한 랜덤 지연 지터에 기초하여 결정되고, 상기 제3 장기 예측 이득 값은 상기 제2 장기 예측 이득 값들 및 적응-제한 랜덤 이득 지터에 기초하여 결정되는 제2 메커니즘을 포함한다.
본 발명의 제5 태양은 이동국으로부터 음성 데이터를 포함하는 부호화된 비트 스트림을 수신하도록 정해지는 통신 네트워크 구성요소로서, 상기 음성 데이터는 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나의 손상된 프레임을 포함하며, 상기 손상된 프레임은 제1 신호에 의해 표시되고 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하며, 상기 제2 장기 예측 지연 값들은 최종 장기 예측 지연 값을 포함하고, 상기 제2 장기 예측 이득 값들은 최종 장기 예측 이득 값을 포함하며, 상기 음성 시퀀스들은 정적 및 비-정적 음성 시퀀스들을 포함하는 통신 네트워크 구성요소이다. 상기 통신 네트워크 구성요소는:
상기 제1 신호에 응답하여, 상기 제2 장기 예측 이득 값들에 기초하여, 상기 손상된 프레임이 배열되는 상기 음성 시퀀스가 정적인지 비-정적인지를 결정하고, 상기 음성 시퀀스가 정적인지 비-정적인지를 나타내는 제2 신호를 제공하기 위한 제1 메커니즘; 및
상기 제2 신호에 응답하여, 상기 음성 시퀀스가 정적인 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값을 상기 최종 장기 예측 지연 값으로 대체하고, 상기 음성 시퀀스가 비-정적인 경우 상기 손상된 프레임의 상기 제1 장기 예측 지연 값 및 상기 제1 장기 예측 이득 값을 각각 제3 장기 예측 지연 값 및 제3 장기 예측 이득 값으로 대체하기 위한 제2 메커니즘으로서, 상기 제3 장기 예측 지연 값은 상기 제2 장기 예측 지연 값들 및 적응-제한 랜덤 지연 지터에 기초하여 결정되고, 상기 제3 장기 예측 이득 값은 상기 제2 장기 예측 이득 값들 및 적응-제한 랜덤 이득 지터에 기초하여 결정되는 제2 메커니즘을 포함한다.
본 발명은 도 3 내지 도 11c에 관련하여 취해진 설명을 읽는 경우 명백하게 될 것이다.
도 1은 음성 데이터를 포함하는 부호화된 비트 스트림이 부호기로부터 통신 채널 또는 저장 매체를 경유하여 복호기에 전달되는 일반적인 분산 음성 코덱을 나타내는 블록도이다.
도 2는 수신기에서의 선행 기술 오류 은폐 장치를 나타내는 블록도이다.
도 3은 본 발명에 따른 수신기에서의 오류 은폐 장치를 나타내는 블록도이다.
도 4는 본 발명에 따른 오류 은폐 방법을 나타내는 흐름도이다.
도 5는 본 발명에 따른 오류 은폐 모듈을 포함하는 이동국의 도면이다.
도 6은 본 발명에 따른 복호기를 사용하는 통신 네트워크의 도면이다.
도 7은 유성음 음성 시퀀스의 지연 및 이득 프로필들을 나타내는 LTP-매개변수들의 도면이다.
도 8은 무성음 음성 시퀀스의 지연 및 이득 프로필들을 나타내는 LTP-매개변수들의 도면이다.
도 9는 선행 기술 오류 은폐 접근 및 본 발명에 따른 접근간의 차이를 나타내는 일련의 서브-프레임들의 LTP-지연 값들의 도면이다.
도 10은 선행 기술 오류 은폐 접근 및 본 발명에 따른 접근간의 차이를 나타내는 일련의 서브-프레임들의 LTP-지연 값들의 다른 도면이다.
도 11a는 도 11b 및 도 11c에 도시된 바와 같이, 음성 채널의 불량 프레임의 위치를 갖는 오류 없는 음성 시퀀스를 나타내는 음성 신호들의 도면이다.
도 11b는 선행 기술 접근에 따른 불량 프레임의 매개변수들의 은폐를 나타내는 음성 신호들의 도면이다.
도 11c는 본 발명에 따른 불량 프레임의 매개변수들의 은폐를 나타내는 음성 신호들의 도면이다.
도 3은 복호화 모듈(20) 및 오류 은폐 모듈(30)을 포함하는 복호기(10)를 도시한다. 상기 복호화 모듈(20)은 보통 음성 합성을 위한 음성 매개변수들(102)을 나타내는 신호(140)를 수신한다. 상기 복호화 모듈(20)은 해당 기술에 공지되어 있다. 상기 오류 은폐 모듈(30)은 음성 시퀀스들에 배열되는 복수의 음성 스트림들을 포함하는 부호화된 비트 스트림(100)을 수신하도록 정해진다. 불량-프레임 검출 장치(32)는 음성 시퀀스들에서의 손상된 프레임들을 검출하는데 사용되고, 손상된 프레임이 검출되는 경우 BFI 플래그를 나타내는 불량-프레임-표시자(BFI; Bad-Frame-Indicator) 신호(110)를 제공한다. BFI도 또한 해당 기술에 공지되어 있다. 상기 BFI 신호(110)는 2개의 스위치들(40 및 42)을 제어하는데 사용된다. 보통, 음성 프레임들은 손상되지 않고 상기 BFI 플래그는 0이다. 단말기(S)는 상기 스위치들(40 및 42)에서 단말기(0)에 효과적으로 접속된다. 상기 음성 매개변수들(102)은 버퍼 또는 "매개변수 이력" 저장부(50) 및 음성 합성을 위한 복호화 모듈(20)에 전달된다. 불량 프레임이 불량-프레임 검출 장치(32)에 의해 검출되는 경우, 상기 BFI 플래그는 1로 세팅된다. 단말기(S)는 상기 스위치들(40 및 42)에서 단말기(1)에 접속된다. 따라서, 음성 매개변수들(102)은 분석기(70)에 제공되고, 음성 합성에 필요한 음성 매개변수들은 매개변수 은폐 모듈(60)에 의해 상기 복호화 모듈(20)에 제공된다. 상기 음성 매개변수들(102)은 전형적으로 단기 예측을 위한 LPC 매개변수들, 여진 매개변수들, 장기 예측(LTP) 지연 매개변수, LTP 이득 매개변수 및 다른 이득 매개변수들을 포함한다. 상기 매개변수 이력 저장부(50)는 다수의 손상되지 않은 음성 프레임들의 LTP-지연 및 LTP-이득을 저장하는데 사용된다. 상기 매개변수 이력 저장부(50)의 내용들은 상기 저장부(50)에 저장된 최종 LTP-지연 매개변수 및 최종 LTP-이득 매개변수가 최종 손상되지 않은 음성 프레임의 최종 LTP-지연 매개변수 및 최종 LTP-이득 매개변수가 되도록 끊임없이 갱신된다. 음성 시퀀스의 손상된 프레임이 상기 복호기(10)에 수신되는 경우, 상기 BFI 플래그는 1로 세팅되고 손상된 프레임의 음성 매개변수들(102)은 스위치(40)를 통해 분석기(70)에 전달된다. 손상된 프레임의 LTP-이득 매개변수 및 상기 저장부(50)에 저장된 LTP-이득 매개변수들을 비교함으로써, 상기 분석기(70)로 하여금 이웃하는 프레임들의 LTP-이득 매개변수들에서의 변화 및 크기에 기초하여 음성 시퀀스가 정적인지 비-정적인지를 결정하는 것이 가능하다. 전형적으로, 정적 시퀀스에 있어서, 도 7에 도시된 바와 같이, LTP-이득 매개변수들은 높고 상당히 안정되며, LTP-지연 값은 안정되고 인접 LTP-지연 값들에서의 변화가 작다. 대비하여, 비-정적 시퀀스에 있어서, 도 8에 도시된 바와 같이, LTP-이득 매개변수들은 낮고 불안정하며, LTP-지연 값도 또한 불안정하다. LTP-지연 값들은 다소 랜덤하게 변화한다. 도 7은 단어 "viinia"에 대한 음성 시퀀스를 도시한다. 도 8은 단어 "exhibition"에 대한 음성 시퀀스를 도시한다.
손상된 프레임을 포함하는 음성 시퀀스가 유성음 또는 정적인 경우, 최종 우량 LTP-지연이 상기 저장부(50)로부터 검색되고 매개변수 은폐 모듈(60)에 전달된다. 검색된 우량 LTP-지연은 손상된 프레임의 LTP-지연을 대체하는데 사용된다. 정적 음성 시퀀스에서의 LTP-지연이 안정되고 그 변화가 작기 때문에, 손상된 프레임의 대응하는 매개변수를 은폐하기 위해 작은 수정을 갖는 이전 LTP-지연을 사용하는 것은 적합하다. 그 다음, RX 신호(104)는 참조 번호 134로 표시되는 대체 매개변수들로 하여금 스위치(42)를 통해 복호화 모듈(20)에 전달되도록 야기한다.
손상된 프레임을 포함하는 음성 시퀀스가 무성음 또는 비-정적인 경우, 분석기(70)는 매개변수 은폐를 위해 대체 LTP-지연 값 및 대체 LTP-이득 값을 계산한 다. 비-정적 음성 시퀀스에서의 LTP-지연은 불안정하고 인접 프레임들에서의 변화가 전형적으로 매우 크기 때문에, 매개변수 은폐는 오류 은폐되는 비-정적 시퀀스에서의 LTP-지연이 랜덤하게 변동하도록 허용해야 한다. 손상된 프레임의 매개변수들이 손실된 프레임에서와 같이 전체적으로 손상되는 경우, 대체 LTP-지연은 적응-제한 랜덤 지터와 함께 이전 우량 LTP-지연 값들의 가중된 중간값을 사용함으로써 계산된다. 상기 적응-제한 랜덤 지터는 LTP 값들의 이력으로부터 계산된 한계들 내에서 변화하도록 허용되고, 오류-은폐 세그먼트에서의 매개변수 변동은 동일 음성 시퀀스의 이전 우량 부분에 유사하다.
LTP-지연 은폐에 대한 예시적인 규칙은 다음과 같은 조건들의 집합에 의해 결정된다.
minGain > 0.5 및 LagDif < 10인 경우; 또는
lastGain > 0.5 및 secondLastGain > 0.5인 경우,
최종 수신된 우량 LTP-지연은 전체적으로 손상된 프레임에 대해 사용된다. 그렇지 않은 경우, 랜덤화된 LTP-지연 버퍼의 가중된 평균인 Update_lag가 전체적으로 손상된 프레임에 대해 사용된다. Update_lag는 후술되는 방식으로 계산된다:
LTP-지연 버퍼가 정렬되고 3개의 가장 큰 버퍼 값들이 검색된다. 이들 3개의 가장 큰 값들의 평균이 가중된 평균 지연(WAL; weighted average lag)으로 지칭되고, 이들 가장 큰 값들로부터의 차이는 가중된 지연차(WLD; weighted lag difference)로 지칭된다.
RAND가 (-WLD/2, WLD/2)의 스케일을 갖는 랜덤화인 경우,
Update_lag = WAL + RAND (-WLD/2,WLD/2)이고,
여기서,
minGain은 LTP-이득 버퍼의 가장 작은 값이고;
LagDif는 가장 작은 LTP-지연 값 및 가장 큰 LTP-지연 값간의 차이이며;
lastGain은 최종 수신된 우량 LTP-이득이고;
secondLastGain은 제2 최종 수신된 우량 LTP-이득이다.
손상된 프레임의 매개변수들이 부분적으로 손상되는 경우, 손상된 프레임의 LTP-지연 값은 그에 따라서 대체된다. 프레임이 부분적으로 손상되는 것은 아래 주어지는 예시적인 LTP-특징 기준의 집합에 의해 결정된다:
(1) LagDif<10 및 (minLag - 5)< Tbf < (maxLag + 5)인 경우; 또는
(2) lastGain>0.5 및 secondLastGain>0.5 및 (lastLag-10)< Tbf < (lastLag+10)인 경우; 또는
(3) minGain < 0.4 및 lastGain = minGain 및 minLag < Tbf < maxLag인 경우; 또는
(4) LagDif < 70 및 minLag < Tbf < maxLag인 경우; 또는
(5) meanLag < Tbf < maxLag인 경우,
Tbf는 손상된 프레임의 LTP-지연을 대체하는데 사용된다. 그렇지 않은 경우, 손상된 프레임은 상술된 바와 같은 전체적으로 손상된 프레임으로 취급된다. 상기 조건들에 있어서,
maxLag는 LTP-지연 버퍼의 가장 큰 값이고;
meanLag는 LTP-지연 버퍼의 평균이며;
minLag는 LTP-지연 버퍼의 가장 작은 값이고;
lastLag는 최종 수신된 우량 LTP-지연 값이며;
Tbf는 BFI가 세팅되는 경우, BFI가 세팅되지 않은 경우와 같은 적응 부호록으로부터 검색되는 복호화된 LTP 지연이다.
매개변수 은폐의 2가지 예들은 도 9 및 도 10에서 도시된다. 도시된 바와 같이, 선행 기술에 따른 불량 프레임에서의 대체 LTP-지연 값들의 프로필들은 다소 평평하지만, 본 발명에 따른 대체의 프로필은 오류가 없는 프로필과 유사하게 얼마간의 변동을 허용한다. 선행 기술 접근 및 본 발명간의 차이는 도 11a에 도시된 바와 같은 에러가 없는 채널에서의 음성 신호들에 기초하여, 도 11b 및 도 11c에 각각 추가로 도시된다.
손상된 프레임의 매개변수들이 부분적으로 손상되는 경우, 매개변수 은폐가 추가로 최적화될 수 있다. 부분적으로 손상된 프레임들에 있어서, 손상된 프레임들의 LTP-지연들은 수용 가능한 합성 음성 세그먼트를 여전히 제공할 수 있다. GSM 사양들에 따라, BFI 플래그는 주기적 덧붙임 검사(CRC; Cyclic Redundancy Check) 메커니즘 또는 다른 오류 검출 메커니즘들에 의해 세팅된다. 이들 오류 검출 메커니즘들은 채널 복호화 과정에서 최상위 비트들에서의 오류들을 검출한다. 따라서, 극히 소수의 비트들이 오류가 있는 경우조차, 오류가 검출될 수 있고 그에 따라 BFI 플래그가 세팅된다. 선행 기술 매개변수 은폐 접근에 있어서, 전체 프레임이 폐기된다. 그 결과, 올바른 비트들에 포함된 정보가 버려진다.
전형적으로, 채널 복호화 과정에 있어서, 프레임 당 BER은 채널 상태에 대한 좋은 표시자이다. 채널 상태가 좋은 경우, 프레임 당 BER이 작고 오류가 있는 프레임들에서의 LTP-지연 값들의 높은 백분율이 올바르다. 예를 들어, 프레임 오류율(FER)이 0.2%인 경우, LTP-지연 값들의 70% 이상이 올바르다. FER이 3%에 도달하는 경우조차, LTP-지연 값들의 대략 60%가 여전히 올바르다. CRC는 불량 프레임을 정확하게 검출할 수 있고 그에 따라 BFI 플래그를 세팅할 수 있다. 그러나, CRC는 프레임에서의 BER의 추정을 제공하지 않는다. BFI 플래그가 매개변수 은폐에 대한 유일한 기준으로 사용되는 경우, 올바른 LTP-지연 값들의 높은 백분율이 낭비될 수 있다. 많은 양의 올바른 LTP-지연들이 버려지는 것을 방지하기 위하여, LTP 이력에 기초하는 매개변수 은폐에 대한 결정 기준을 적합하게 하는 것이 가능하다. 또한 예를 들어 결정 기준으로서 FER을 사용하는 것이 가능하다. LTP-지연이 결정 기준을 충족하는 경우, 어떠한 매개변수 은폐도 필요하지 않다. 그 경우에 있어서, 분석기(70)는 스위치(40)를 통해 수신되는 음성 매개변수들(102)을 매개변수 은폐 모듈(60)에 전달하고, 그 다음 상기 매개변수 은폐 모듈(60)은 스위치(42)를 통해 복호화 모듈(20)에 상기 매개변수들을 전달한다. LTP-지연이 상기 결정 기준을 충족하지 않는 경우, 손상된 프레임은 상술된 바와 같이 매개변수 은폐에 대한 LTP-특징 기준을 사용하여 추가로 검사된다.
정적 음성 시퀀스들에 있어서, LTP-지연은 매우 안정된다. 손상된 프레임의 대부분의 LTP-지연 값들이 올바른지 오류가 있는지는 높은 확률을 가지고 올바르게 예측될 수 있다. 따라서, 매개변수 은폐에 대한 매우 엄격한 기준을 적합화하는 것이 가능하다. 비-정적 음성 시퀀스들에 있어서, LTP 매개변수들의 불안정한 성질로 인하여, 손상된 프레임의 LTP-지연 값이 올바른지를 예측하는 것이 어려울 수 있다. 그러나, 예측이 올바른지 그른지는 정적 음성에서보다 비-정적 음성에서 덜 중요하다. 오류가 있는 LTP-지연 값들이 정적 음성을 복호화하는데 사용되도록 허용하는 것은 합성 음성을 인식할 수 없게 할 수 있지만, 오류가 있는 LTP-지연 값들이 비-정적 음성을 복호화하는데 사용되도록 허용하는 것은 보통 단지 들을 수 있는 인공물들을 증가시킨다. 따라서, 비-정적 음성에서의 매개변수 은폐에 대한 결정 기준은 비교적 엄격하지 않을 수 있다.
상술된 바와 같이, LTP-이득은 비-정적 음성에서 크게 변동한다. 최종 우량 프레임으로부터의 동일한 LTP-이득 값이 음성 시퀀스에서의 하나 이상의 손상된 프레임들의 LTP-이득 값을 대체하는데 반복해서 사용되는 경우, 이득 은폐된 세그먼트에서의 LTP-이득 프로필은 손상되지 않은 프레임들의 변동하는 프로필에 아주 대비되어, 평평할 것이다(도 7 및 도 8에 도시된 바와 같이, 선행 기술 LTP-지연 대체와 유사하게). LTP-이득 프로필에서의 갑작스러운 변화는 불쾌한 들을 수 있는 인공물들을 야기할 수 있다. 이들 들을 수 있는 인공물들을 최소화하기 위하여, 대체 LTP-이득 값으로 하여금 오류-은폐된 세그먼트에서 변동하도록 허용하는 것이 가능하다. 이것을 위하여, 분석기(70)는 또한 대체 LTP-이득 값이 LTP 이력에서의 이득 값들에 기초하여 변동하도록 허용되는 한계들을 결정하는데 사용될 수 있다.
LTP-이득 은폐는 후술되는 방식으로 수행될 수 있다. BFI가 세팅되는 경우, 대체 LTP-이득 값은 LTP-이득 은폐 규칙들의 집합에 따라 계산된다. 대체 LTP-이득은 Updated_gain으로 표시된다.
(1) gainDif>0.5 및 lastGain = maxGain > 0.9 및 subBF=1인 경우,
Updated_gain = (secondLastGain + thirdLastGain)/2;
(2) gainDif>0.5 및 lastGain = maxGain > 0.9 및 subBF=2인 경우,
Updated_gain = meanGain + randVar* (maxGain - meanGain);
(3) gainDif>0.5 및 lastGain = maxGain > 0.9 및 subBF=3인 경우,
Updated_gain = meanGain - randVar* (meanGain - minGain);
(4) gainDif>0.5 및 lastGain = maxGain > 0.9 및 subBF=4인 경우,
Updated_gain = meanGain + randVar* (maxGain - meanGain);
앞의 조건들에서, Updated_gain은 lastGain보다 더 클 수 없다. 앞의 조건들이 충족될 수 없는 경우, 다음 조건들이 사용된다:
(5) gainDif > 0.5인 경우,
Updated_gain = lastGain;
(6) gainDif < 0.5 및 lastGain = maxGain인 경우,
Updated_gain = meanGain;
(7) gainDIF < 0.5인 경우,
Updated_gain = lastGain,
여기서
meanGain은 LTP-이득 버퍼의 평균이고;
maxGain은 LTP-이득 버퍼의 가장 큰 값이며,
minGain은 LTP-이득 버퍼의 가장 작은 값이고,
randVar은 0과 1 사이의 랜덤 값이며,
gainDIF는 LTP-이득 버퍼에서 가장 작은 LTP-이득 값 및 가장 큰 LTP-이득 값 사이의 차이이고,
lastGain은 최종 수신된 우량 LTP-이득이며,
secondLastGain은 제2 최종 수신된 우량 LTP-이득이고,
thirdLastGain은 제3 최종 수신된 우량 LTP-이득이며,
subBF는 서브프레임의 차수이다.
도 4는 본 발명에 따른 오류-은폐 방법을 도시한다. 단계 160에서 부호화된 비트 스트림이 수신되는 경우, 단계 162에서 프레임이 손상되었는지를 알아보기 위해 검사된다. 프레임이 손상되지 않은 경우, 단계 164에서 음성 시퀀스의 매개변수 이력이 갱신되고, 단계 166에서 현재 프레임의 음성 매개변수들이 복호화된다. 그 다음 상기 절차는 단계 162로 되돌아간다. 프레임이 불량이거나 손상된 경우, 단계 170에서 매개변수들이 매개변수 이력 저장부로부터 검색된다. 단계 172에서 손상된 프레임이 정적 음성 시퀀스의 부분인지 비-정적 음성 시퀀스의 부분인지가 결정된다. 음성 시퀀스가 정적인 경우, 단계 174에서 최종 우량 프레임의 LTP-지연이 손상된 프레임의 LTP-지연을 대체하는데 사용된다. 음성 시퀀스가 비-정적인 경우, 단계 180에서 신규 지연 값 및 신규 이득 값이 LTP 이력에 기초하여 계산되고, 단계 182에서 손상된 프레임의 대응하는 매개변수들을 대체하는데 사용된다.
도 5는 본 발명의 일 실시예에 따라 이동국(200)의 블록도를 나타낸다. 이동국은 마이크로폰(201), 키패드(207), 디스플레이(206), 이어폰(214), 송신/수신 스위치(208), 안테나(209) 및 제어 유닛(205)과 같은 상기 장치의 전형적인 부분들을 포함한다. 더욱이, 도면은 이동국에 전형적인 송신기 및 수신기 블록들(204, 211)을 나타낸다. 상기 송신기 블록(204)은 음성 신호를 부호화하기 위한 부호기(221)를 포함한다. 상기 송신기 블록(204)은 또한 RF 기능들뿐만 아니라 채널 부호화, 암호화 및 변조에 필요한 동작들을 포함하지만 도 5에는 명료함을 위해 도시되지 않는다. 상기 수신기 블록(211)은 또한 본 발명에 따라 복호화 블록(220)을 포함한다. 복호화 블록(220)은 도 3에 도시된 매개변수 은폐 모듈(30)과 같은 오류 은폐 모듈(222)을 포함한다. 마이크로폰(201)으로부터 들어오는 신호는 증폭단(202)에서 증폭되고 A/D 변환기(203)에서 디지털화되며, 송신기 블록(204), 전형적으로 상기 송신기 블록이 포함하는 음성 부호화 장치에 취해진다. 상기 송신기 블록에 의해 처리되고 변조되며 증폭된 전송 신호는 송신/수신 스위치(208)를 경유하여 안테나(209)에 취해진다. 수신되는 신호는 안테나로부터 송신/수신 스위치(208)를 경유하여 수신기 블록(211)에 취해진다. 상기 수신기 블록은 상기 수신된 신호를 복조하고 암호를 해독하며 채널 부호화를 복호화한다. 결과적인 음성 신호는 D/A 변환기(212)를 경유하여 증폭기(213)에 그리고 이어서 이어폰(214)에 취해진다. 상기 제어 유닛(205)은 이동국(200)의 동작을 제어하고, 상기 키패드(207)로부터 사 용자가 제공한 제어 명령들을 독출하며 디스플레이(206)를 통하여 사용자에게 메시지들을 제공한다.
본 발명에 따른 매개변수 은폐 모듈(30)은 또한 보통의 전화망과 같은 통신 네트워크(300)에서 또는 GSM 네트워크와 같은 이동국 네트워크에서 사용될 수 있다. 도 6은 그러한 통신 네트워크의 블록도의 예를 도시한다. 예를 들어, 통신 네트워크(300)는 보통의 전화들(370), 기지국들(340), 기지국 제어기들(350) 및 통신 네트워크들의 다른 중앙 장치들(355)이 접속되는, 전화 교환들 또는 대응하는 스위칭 시스템들(360)을 포함할 수 있다. 이동국들(330)은 기지국들(340)을 경유하여 통신 네트워크에 접속을 설정할 수 있다. 도 3에 도시된 오류 은폐 모듈(30)과 유사한 오류 은폐 모듈(322)을 포함하는 복호화 블록(320)은 예를 들어 상기 기지국(340)에 특히 바람직하게 위치될 수 있다. 그러나, 복호화 블록(320)이 또한 예를 들어 상기 기지국 제어기(350) 또는 다른 중앙 또는 스위칭 장치(355)에 위치될 수 있다. 상기 이동국 시스템이 무선 채널 상에서 취해진 부호화된 신호를 통신 시스템에서 전송되는 전형적인 64 kbit/s 신호로 변환하고 그 반대로 변환하기 위하여, 예를 들어 상기 기지국들 및 상기 기지국 제어기들간에 별개의 트랜스코더들을 사용하는 경우, 상기 복호화 블록(320)은 또한 그러한 트랜스코더에 위치될 수 있다. 일반적으로, 매개변수 은폐 모듈(322)을 포함하는 복호화 블록(320)은 부호화된 데이터 스트림을 부호화되지 않은 데이터 스트림으로 변환하는 통신 네트워크(300)의 어떤 구성요소에 위치될 수 있다. 상기 복호화 블록(320)은 이동국(330)으로부터 들어오는 부호화된 음성 신호를 복호화하고 필터링하며, 그 다음 상기 음성 신호는 통신 네트워크(300)에서 압축되지 않은 보통의 방식으로 전송될 수 있다.
본 발명의 오류 은폐 방법은 정적 및 비-정적 음성 시퀀스들에 관하여 설명되었고, 정적 음성 시퀀스들은 보통 유성음이고 비-정적 음성 시퀀스들은 보통 무성음인 것을 주목해야 한다. 따라서, 개시된 방법은 유성음 및 무성음 음성 시퀀스들에서 오류 은폐에 적용할 수 있다는 것이 이해되어야할 것이다.
본 발명은 CELP 유형 음성 코덱들에 적용할 수 있고 또한 다른 유형의 음성 코덱들에 적합화될 수 있다. 따라서, 비록 본 발명이 본 발명의 바람직한 실시예에 관하여 기술되었다 하더라도, 본 발명의 정신 및 범위를 벗어나지 않으면서 본 발명의 형태 및 상세에서 상기 및 다양한 다른 변화들, 생략들 및 변형들이 수행될 수 있다는 것이 당업자에 의해 이해될 것이다.

Claims (32)

  1. 음성 복호기에 수신되는 음성 신호들을 나타내는 부호화된 비트 스트림에서의 오류들을 은폐하기 위한 방법으로서, 상기 부호화된 비트 스트림은 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나의 부분적으로 손상된 프레임을 포함하며, 상기 부분적으로 손상된 프레임은 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하는 오류 은폐 방법에 있어서,
    상기 제2 장기 예측 지연 값들에 기초하는 상한 및 하한을 제공하는 단계;
    상기 제1 장기 예측 지연 값이 상기 상한 및 하한 내부에 있는지 외부에 있는지를 결정하는 단계;
    상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우, 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 제3 지연 값으로 대체하는 단계; 및
    상기 제1 장기 예측 지연 값이 상기 상한 및 하한 내부에 있는 경우, 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 보유하는 단계를 포함하는 것을 특징으로 하는 오류 은폐 방법.
  2. 제1항에 있어서, 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우, 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 이득 값을 제3 이득 값으로 대체하는 단계를 더 포함하는 것을 특징으로 하는 오류 은폐 방법.
  3. 제1항에 있어서, 상기 제3 지연 값은 상기 제2 장기 예측 지연 값들에 기초하여 결정되는 추가 한계들에 의해 제한되는 적응-제한 랜덤 지연 지터(adaptively-limited random lag jitter) 및 상기 제2 장기 예측 지연 값들에 기초하여 계산되는 것을 특징으로 하는 오류 은폐 방법.
  4. 제2항에 있어서, 상기 제3 이득 값은 상기 제2 장기 예측 이득 값들에 기초하여 결정되는 한계들에 의해 제한되는 적응-제한 랜덤 이득 지터(adaptively-limited random gain jitter) 및 상기 제2 장기 예측 이득 값들에 기초하여 계산되는 것을 특징으로 하는 오류 은폐 방법.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 부호화된 비트 스트림으로 음성 신호들을 부호화하고 상기 부호화된 비트 스트림을 합성 음성으로 복호화하기 위한 음성 신호 송신기 및 수신기 시스템으로서, 상기 부호화된 비트 스트림은 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나의 부분적으로 손상된 프레임을 포함하며, 상기 부분적으로 손상된 프레임은 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하며, 제1 신호가 상기 부분적으로 손상된 프레임을 나타내는데 사용되는 음성 신호 송신기 및 수신기 시스템에 있어서,
    상기 제1 신호에 응답하여, 상기 제1 장기 예측 지연 값이 상한과 하한 내부에 있는지를 결정하고, 상기 결정을 나타내는 제2 신호를 제공하기 위한 제1 수단; 및
    상기 제2 신호에 응답하여, 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 제3 지연 값으로 대체하고, 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 내부에 있는 경우, 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 보유하기 위한 제2 수단을 포함하는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  12. 제11항에 있어서, 상기 제3 지연 값은 상기 제2 장기 예측 지연 값들 및 적응-제한 랜덤 지연 지터에 기초하여 결정되는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  13. 제11항에 있어서, 상기 제2 수단은 추가로 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 이득 값을 제3 이득 값으로 대체하는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  14. 제13항에 있어서, 상기 제3 이득 값은 상기 제2 장기 예측 이득 값들 및 적응-제한 랜덤 이득 지터에 기초하여 결정되는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  15. 삭제
  16. 부호화된 비트 스트림으로부터 음성을 합성하기 위한 복호기로서, 상기 부호화된 비트 스트림은 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나의 부분적으로 손상된 프레임을 포함하며, 상기 부분적으로 손상된 프레임은 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하며, 제1 신호가 상기 부분적으로 손상된 프레임을 나타내는데 사용되는 복호기에 있어서,
    상기 제1 신호에 응답하여, 상기 제1 장기 예측 지연 값이 상한과 하한 내부에 있는지를 결정하고, 상기 결정을 나타내는 제2 신호를 제공하기 위한 제1 수단; 및
    상기 제2 신호에 응답하여, 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 제3 지연 값으로 대체하고, 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 내부에 있는 경우, 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 보유하기 위한 제2 수단을 포함하는 것을 특징으로 하는 복호기.
  17. 제16항에 있어서, 상기 제3 지연 값은 상기 제2 장기 예측 지연 값들 및 적응-제한 랜덤 지연 지터에 기초하여 결정되는 것을 특징으로 하는 복호기.
  18. 제16항에 있어서, 상기 제2 수단은 추가로 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 이득 값을 제3 이득 값으로 대체하는 것을 특징으로 하는 복호기.
  19. 제18항에 있어서, 상기 제3 이득 값은 상기 제2 장기 예측 이득 값들 및 적응-제한 랜덤 이득 지터에 기초하여 결정되는 것을 특징으로 하는 복호기.
  20. 삭제
  21. 음성 신호들을 나타내는 음성 데이터를 포함하는 부호화된 비트 스트림을 수신하도록 정해지는 이동국으로서, 상기 부호화된 비트 스트림은 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나의 부분적으로 손상된 프레임을 포함하며, 상기 부분적으로 손상된 프레임은 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하며, 제1 신호가 상기 부분적으로 손상된 프레임을 나타내는데 사용되는 이동국에 있어서,
    상기 제1 신호에 응답하여, 상기 제1 장기 예측 지연 값이 상한과 하한 내부에 있는지를 결정하고, 상기 결정을 나타내는 제2 신호를 제공하기 위한 제1 수단; 및
    상기 제2 신호에 응답하여, 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 제3 지연 값으로 대체하고, 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 내부에 있는 경우, 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 보유하기 위한 제2 수단을 포함하는 것을 특징으로 하는 이동국.
  22. 제21항에 있어서, 상기 제3 지연 값은 상기 제2 장기 예측 지연 값들 및 적응-제한 랜덤 지연 지터에 기초하여 결정되는 것을 특징으로 하는 이동국.
  23. 제21항에 있어서, 상기 제2 수단은 추가로 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 이득 값을 제3 이득 값으로 대체하는 것을 특징으로 하는 이동국.
  24. 제23항에 있어서, 상기 제3 이득 값은 상기 제2 장기 예측 이득 값들 및 적응-제한 랜덤 이득 지터에 기초하여 결정되는 것을 특징으로 하는 이동국.
  25. 삭제
  26. 이동국으로부터 음성 데이터를 포함하는 부호화된 비트 스트림을 수신하도록 정해지는 통신 네트워크 구성요소로서, 상기 음성 데이터는 음성 시퀀스들로 배열되는 복수의 음성 프레임들을 포함하고, 상기 음성 프레임들은 하나 이상의 손상되지 않은 프레임들이 앞서는 적어도 하나의 부분적으로 손상된 프레임을 포함하며, 상기 부분적으로 손상된 프레임은 제1 장기 예측 지연 값 및 제1 장기 예측 이득 값을 포함하고, 상기 손상되지 않은 프레임들은 제2 장기 예측 지연 값들 및 제2 장기 예측 이득 값들을 포함하며, 제1 신호가 상기 부분적으로 손상된 프레임을 나타내는데 사용되는 통신 네트워크 구성요소에 있어서,
    상기 제1 신호에 응답하여, 상기 제1 장기 예측 지연 값이 상한과 하한 내부에 있는지를 결정하고, 상기 결정을 나타내는 제2 신호를 제공하기 위한 제1 수단; 및
    상기 제2 신호에 응답하여, 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 제3 지연 값으로 대체하고, 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 내부에 있는 경우, 상기 부분적으로 손상된 프레임의 상기 제1 장기 예측 지연 값을 보유하기 위한 제2 수단을 포함하는 것을 특징으로 하는 통신 네트워크 구성요소.
  27. 제26항에 있어서, 상기 제3 지연 값은 상기 제2 장기 예측 지연 값들 및 적응-제한 랜덤 지연 지터에 기초하여 결정되는 것을 특징으로 하는 통신 네트워크 구성요소.
  28. 제26항에 있어서, 상기 제2 수단은 추가로 상기 제1 장기 예측 지연 값이 상기 상한 및 하한 외부에 있는 경우 상기 제1 장기 예측 이득 값을 제3 이득 값으로 대체하는 것을 특징으로 하는 통신 네트워크 구성요소.
  29. 제28항에 있어서, 상기 제3 이득 값은 상기 제2 장기 예측 이득 값들 및 적응-제한 랜덤 이득 지터에 기초하여 결정되는 것을 특징으로 하는 통신 네트워크 구성요소.
  30. 삭제
  31. 삭제
  32. 삭제
KR1020037005909A 2000-10-31 2001-10-29 음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및시스템 KR100563293B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/702,540 US6968309B1 (en) 2000-10-31 2000-10-31 Method and system for speech frame error concealment in speech decoding
US09/702,540 2000-10-31
PCT/IB2001/002021 WO2002037475A1 (en) 2000-10-31 2001-10-29 Method and system for speech frame error concealment in speech decoding

Publications (2)

Publication Number Publication Date
KR20030086577A KR20030086577A (ko) 2003-11-10
KR100563293B1 true KR100563293B1 (ko) 2006-03-22

Family

ID=24821628

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037005909A KR100563293B1 (ko) 2000-10-31 2001-10-29 음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및시스템

Country Status (14)

Country Link
US (1) US6968309B1 (ko)
EP (1) EP1330818B1 (ko)
JP (1) JP4313570B2 (ko)
KR (1) KR100563293B1 (ko)
CN (1) CN1218295C (ko)
AT (1) ATE332002T1 (ko)
AU (1) AU2002215138A1 (ko)
BR (2) BRPI0115057B1 (ko)
CA (1) CA2424202C (ko)
DE (1) DE60121201T2 (ko)
ES (1) ES2266281T3 (ko)
PT (1) PT1330818E (ko)
WO (1) WO2002037475A1 (ko)
ZA (1) ZA200302556B (ko)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7821953B2 (en) * 2005-05-13 2010-10-26 Yahoo! Inc. Dynamically selecting CODECS for managing an audio message
EP1428206B1 (en) * 2001-08-17 2007-09-12 Broadcom Corporation Bit error concealment methods for speech coding
US20050229046A1 (en) * 2002-08-02 2005-10-13 Matthias Marke Evaluation of received useful information by the detection of error concealment
US7634399B2 (en) * 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
GB2398982B (en) * 2003-02-27 2005-05-18 Motorola Inc Speech communication unit and method for synthesising speech therein
US7610190B2 (en) * 2003-10-15 2009-10-27 Fuji Xerox Co., Ltd. Systems and methods for hybrid text summarization
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7409338B1 (en) * 2004-11-10 2008-08-05 Mediatek Incorporation Softbit speech decoder and related method for performing speech loss concealment
CA2596341C (en) * 2005-01-31 2013-12-03 Sonorit Aps Method for concatenating frames in communication system
WO2006098274A1 (ja) * 2005-03-14 2006-09-21 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル復号化方法
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
WO2007077841A1 (ja) * 2005-12-27 2007-07-12 Matsushita Electric Industrial Co., Ltd. 音声復号装置および音声復号方法
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
KR100862662B1 (ko) 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
CN100578618C (zh) * 2006-12-04 2010-01-06 华为技术有限公司 一种解码方法及装置
CN101226744B (zh) * 2007-01-19 2011-04-13 华为技术有限公司 语音解码器中实现语音解码的方法及装置
KR20080075050A (ko) * 2007-02-10 2008-08-14 삼성전자주식회사 오류 프레임의 파라미터 갱신 방법 및 장치
GB0703795D0 (en) * 2007-02-27 2007-04-04 Sepura Ltd Speech encoding and decoding in communications systems
US8165224B2 (en) * 2007-03-22 2012-04-24 Research In Motion Limited Device and method for improved lost frame concealment
WO2008143871A1 (en) * 2007-05-15 2008-11-27 Radioframe Networks, Inc. Transporting gsm packets over a discontinuous ip based network
MX2009013519A (es) * 2007-06-11 2010-01-18 Fraunhofer Ges Forschung Codificador de audio para codificar una señal de audio que tiene una porcion similar a un impulso y una porcion estacionaria, metodos de codificacion, decodificador, metodo de decodificacion, y señal de audio codificada.
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
KR101525617B1 (ko) * 2007-12-10 2015-06-04 한국전자통신연구원 다중 경로를 이용한 스트리밍 데이터 송수신 장치 및 그방법
US20090180531A1 (en) * 2008-01-07 2009-07-16 Radlive Ltd. codec with plc capabilities
EP2289065B1 (en) * 2008-06-10 2011-12-07 Dolby Laboratories Licensing Corporation Concealing audio artifacts
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US10218327B2 (en) * 2011-01-10 2019-02-26 Zhinian Jing Dynamic enhancement of audio (DAE) in headset systems
JP6088644B2 (ja) * 2012-06-08 2017-03-01 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
US9830920B2 (en) 2012-08-19 2017-11-28 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
US9406307B2 (en) * 2012-08-19 2016-08-02 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
MX2018016263A (es) * 2012-11-15 2021-12-16 Ntt Docomo Inc Dispositivo codificador de audio, metodo de codificacion de audio, programa de codificacion de audio, dispositivo decodificador de audio, metodo de decodificacion de audio, y programa de decodificacion de audio.
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922055A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
BR112021013720A2 (pt) * 2019-01-13 2021-09-21 Huawei Technologies Co., Ltd. Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US6188980B1 (en) 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6453287B1 (en) * 1999-02-04 2002-09-17 Georgia-Tech Research Corporation Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder

Also Published As

Publication number Publication date
EP1330818B1 (en) 2006-06-28
CN1489762A (zh) 2004-04-14
BRPI0115057B1 (pt) 2018-09-18
ATE332002T1 (de) 2006-07-15
ES2266281T3 (es) 2007-03-01
ZA200302556B (en) 2004-04-05
PT1330818E (pt) 2006-11-30
WO2002037475A1 (en) 2002-05-10
CA2424202A1 (en) 2002-05-10
CA2424202C (en) 2009-05-19
DE60121201T2 (de) 2007-05-31
EP1330818A1 (en) 2003-07-30
BR0115057A (pt) 2004-06-15
JP4313570B2 (ja) 2009-08-12
DE60121201D1 (de) 2006-08-10
CN1218295C (zh) 2005-09-07
KR20030086577A (ko) 2003-11-10
AU2002215138A1 (en) 2002-05-15
JP2004526173A (ja) 2004-08-26
US6968309B1 (en) 2005-11-22

Similar Documents

Publication Publication Date Title
KR100563293B1 (ko) 음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및시스템
KR100718712B1 (ko) 복호장치와 방법 및 프로그램 제공매체
JP3155952B2 (ja) 音声復号装置
JP2007065679A (ja) 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替
JP2004508597A (ja) オーディオ信号における伝送エラーの抑止シミュレーション
JP2011237809A (ja) フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ
JP4527369B2 (ja) データ埋め込み装置及びデータ抽出装置
JPH06202696A (ja) 音声復号化装置
US10607624B2 (en) Signal codec device and method in communication system
JP2001511917A (ja) 伝送エラーの修正を伴う音声信号の復号方法
EP1617417A1 (en) Voice coding/decoding method and apparatus
CA2293165A1 (en) Method for transmitting data in wireless speech channels
JPH1022937A (ja) 誤り補償装置および記録媒体
JP4437052B2 (ja) 音声復号化装置および音声復号化方法
US7584096B2 (en) Method and apparatus for encoding speech
JP4597360B2 (ja) 音声復号装置及び音声復号方法
JP3107620B2 (ja) 音声符号化方法
KR20010113780A (ko) 피치 변화 검출로 에러 정정하는 방법
KR100244217B1 (ko) 음성 및 데이터 동시 송수신 장치 및 방법
KR20050027272A (ko) 스피치 프레임들의 에러 경감을 위한 스피치 통신 유닛 및방법
JPH07336311A (ja) 音声復号化装置
JPWO2003021573A1 (ja) コーデック
JPH0865275A (ja) 音声信号の受信方法
JPH07143075A (ja) 音声符号化通信方式及びその装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130221

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140220

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150226

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160218

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20170220

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20180219

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20200218

Year of fee payment: 15