KR20030046463A - 디코딩된 음향신호의 디코딩에 관한 에러 은폐 - Google Patents

디코딩된 음향신호의 디코딩에 관한 에러 은폐 Download PDF

Info

Publication number
KR20030046463A
KR20030046463A KR10-2003-7004048A KR20037004048A KR20030046463A KR 20030046463 A KR20030046463 A KR 20030046463A KR 20037004048 A KR20037004048 A KR 20037004048A KR 20030046463 A KR20030046463 A KR 20030046463A
Authority
KR
South Korea
Prior art keywords
spectrum
signal
data
frequency
reconstruction
Prior art date
Application number
KR10-2003-7004048A
Other languages
English (en)
Other versions
KR100882752B1 (ko
Inventor
스테판 브룬
Original Assignee
텔레폰악티에볼라겟엘엠에릭슨(펍)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텔레폰악티에볼라겟엘엠에릭슨(펍) filed Critical 텔레폰악티에볼라겟엘엠에릭슨(펍)
Publication of KR20030046463A publication Critical patent/KR20030046463A/ko
Application granted granted Critical
Publication of KR100882752B1 publication Critical patent/KR100882752B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Error Detection And Correction (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

본 발명은 전송매체를 통한 전송 도중에 부분적으로 손실되었거나 또는 손상된 음향신호들을 나타내는 엔코딩된 데이터에 의해 야기되는 디코딩 음향신호에서 에러의 은폐에 관한 것이다. 데이터가 손실되었거나 또는 손상되어 수신된 경우에, 일차 재구성 신호를 기반으로 이차 재구성 신호를 생성한다. 스펙트럼 형상에 관해서 이 신호는 일차 재구성 신호의 스펙트럼(Z'4) 보다, 이전에 수신한 데이터로부터 생성되는 이전에 재구성된 신호의 스펙트럼(Z3)에서부터 덜 벗어나도록 스펙트럼적으로 조정된 스펙트럼(Z4 E)를 가진다.

Description

디코딩된 음향신호의 디코딩에 관한 에러 은폐{Error Concealment in Relation to Decoding of Encoded Acoustic Signals}
오디오와 음성 코덱(codec =coder 와decoder)에 대해 많은 상이한 응용이 있다. 예컨대, 고정 및 이동통신 시스템들과 비디오회의 시스템에서 음향신호들의 효율적인 비트율(bit-rate) 전송을 위해 엔코딩과 디코딩 방법이 사용된다. 또한, 음성코덱들은 비밀전화에 활용되고 또한 음성저장을 위해 활용될 수 있다.
특히, 이동응용에서, 코덱들은 종종 불리한 채널조건 하에서 동작한다. 이와 같은 비-최적 전송조건의 한 결과는, 음성신호를 나타내는 엔코딩된 비트들이 송신기와 수신기 사이의 어디에선가 훼손되거나 또는 손실되는 것이다. 오늘날의 이동통신시스템들과 인터넷 응용장치들의 음성코덱들 대부분은 블록-방식(block-wise)으로 동작하는데, GSM(Global System for Mobile Communication), WCDMA(Wideband Code Division Multiple Access), TDMA(Time Division Multiple Access) 및 IS95(인터넷 표준-95)들이 몇몇 예이다. 블록-방식 동작은, 음향 소오스신호가 특정 지속기간, 예컨대 20ms의 음성 코덱 프레임들로 분할되는 것을 의미한다. 따라서, 음성 코덱 프레임 내 정보는 유닛(unit)으로서 엔코딩된다. 그러나, 일반적으로 음성 코덱 프레임들은, 예컨대 5ms의 지속주기를 가지는 서브-프레임들로 분할된다. 그러면, 서브-프레임들은 GSM FR-코덱(FR = Full Rate(완전율)), GSM EFR-코덱(EFR = Enhanced Full Rate(확장 완전율)), GSM AMR-코덱(AMR = Adaptive Multi Rate(적응성 가변율)), ITU G.729-코덱(ITU = Internation Telecommunication Union(국제전기통신연맹)) 및 EVRC(Enhanced Variable Rate Codec(확장 가변율 코덱))에서 합성 필터 여기(synthesis filter excitation)의 엔코딩과 같은, 특정 파라미터들에 대한 코딩 유닛들이 된다.
여기 파라미터들 이외에, 상기 코덱들은 또한 예컨대, LPC-파라미터(LPC = Linear Predictive Coding(선형 예측 코딩)), LTP-래그(lag)(LTP = Long Term Prediction(장주기 예측)) 및 다양한 이득 파라미터들과 같은 다른 파라미터들에 의해 음향신호들을 모델링할 수 있다. 이들 파라미터들 중 소정의 비트들은, 디코딩된 음향신호의 감각(perceived) 음품질에 관해 매우 중요한 정보를 나타낸다. 만일 이러한 비트들이 전송 동안에 훼손된다면, 디코딩된 음향신호의 음품질은 적어도 일시적으로, 인간 가청자에게 비교적 낮은 품질을 가지는 것으로 인지되게 된다. 따라서, 만일 에러를 가지는 파라미터들이 도달하게 된다면 대응하는 음성 코덱프레임에 대한 에러성 파라미터들을 버리고, 대신에 이전에 수신된 정확한 파라미터들을 사용하는 것이 유리하다. 비-이상적인 채널로 음향신호들을 전송하는 대부분의 시스템들에서, 이 에러 은폐기술이 형식상으로 적용된다.
에러 은폐방법은 일반적으로, 비교적 늦게 변하는 음성 코덱 파라미터들을 동결시킴으로서 손실된/손상된 음성 코덱 프레임의 영향을 경감시키는 것을 목적으로 한다. 이러한 에러 은폐는 예컨대, GSM EFR-코덱과 GSM AMR-코덱에서 손실된 또는 손상된 음성 코덱 프레임의 경우에 LPC-이득 및 LPC-래그 파라미터들을 반복하는 에러 은폐 유닛에 의해 수행된다. 그러나, 만일 수 개의 연속적인 음성 코덱 프레임들이 손실되거나 또는 손상된다면, 감소계수(decaying factor)와 그들의 장주기 평균을 향해 이동하는 LPC-파라미터들의 반복으로 이득 파라미터들의 반복을 수반할 수 있는 다양한 뮤팅(muting)기술이 적용된다. 게다가, 하나 또는 그 이상의 손상된 프레임들의 수신 후에 첫번째로 정확히 수신된 프레임의 전력레벨은 손상된 프레임들의 수신 전에 가장 마지막으로 정확히 수신된 프레임의 전력레벨로 제한될 수 있다. 이는, 손상된 프레임의 수신 동안에 에러가 있는 상태로 설정되는 음성 합성필터 및 적응성 코드북(codebook)으로 인해 발생할 수 있는, 디코딩된 음성신호에서 바람직하지 않은 인위물을 완화시킨다.
송신기와 수신기 간의 전송 동안에 손실되거나 또는 손상되는 음성 코덱 프레임들의 불리한 영향을 개선하는 대체 수단과 방향의 몇몇 예들을 아래에서 언급한다.
미국특허 제5,907,822호는 손실 내성(tolerant) 음성 디코더를 기술하는데, 디지탈 음성 프레임 에러들을 은폐하기 위하여, 손실(missing) 데이터 세그먼트들에 삽입을 위해 과거 신호-히스토리 데이터를 활용한다. 음성 압축 파라미터들의 원스템(one-step) 보외(補外)(extrapolation)를 위해 역전파(back-porpagation)으로 훈련되는 멀티-레이어 피드-포워드(multi-layer feed forward) 인공지능망이 손실 프레임의 경우에 필요한 파라미터들을 추출하고 또한 대체 프레임을 생성한다.
유럽특허 제 B1, 0 665 161호는 음성 디코더에서 손실 프레임들의 영향을 은폐하기 위한 장치와 방법을 기술한다. 이 특허는, 손실 프레임의 경우에 배경음을 결정하기 위한 임계값의 갱신을 제한하는데 음성활동(voice activity) 검출기의 사용을 제안한다. 일반적으로 포스트 필터(post filter)는 디코딩된 신호의 스펙트럼을 틸딩(tilt)한다. 그러나, 손실 프레임의 경우에. 포스트 필터의 틸팅 계수는 갱신되지 않는다.
미국특허 제 5,909,663호는, 여러 개의 연속된 손상프레임들의 수신시에 동일 파라미터의 반복사용을 피함으로써 디코딩된 음성신호의 인지(認知) 음품질을강화시키는 음성 디코더를 기술한다. 여기신호에 잡음성분을 부가하고, 여기신호를 잡음성분들로 대체하거나 또는 다수의 여기신호들을 포함하는 잡음 코드북에서 무작위로 여기신호를 판독함으로써 상기 음성 디코더가 그 목적을 달성한다.
협대역(narrow-band) 코덱들에 대한 공지된 에러 은폐 해결책은, 훼손된 음성 코덱 프레임 동안에 가장 최근에 수신된, 손상되지 않은 음성 코덱 프레임에서부터 소정의 스펙트럼적 파라미터들을 단순히 반복함으로써 대부분의 환경에서 만족스러운 결과를 제공한다. 실제로 이 절차는, 손상되지 않은 새로운 음성 코덱 프레임이 수신될 때까지 디코딩 음성 신호의 스펙트럼의 크기(magnitute)와 형상을 암묵적으로 유지한다. 이와 같은 음성 신호의 스펙트럼적 크기와 형상의 보존으로써, 디코더에서 여기신호가 스펙트럼적으로 평탄(또는 백색)이라는 것을 암시적으로 추정할 수 있다.
그러나, 항상 이러한 것은 아니다. 예컨대 대수 부호 여기 선형 예측-코덱 (Algebraic Code Excited Linear Predictive-codec;ACELP)은 비-백색 여기신호들을 생성할 수 있다. 게다가, 여기신호의 스펙트럼적 형상은 한 음성 코덱 프레임에서 다른 음성 코덱 프레임으로 상당히 변할 수 있다. 가장 늦게 수신된, 손상되지 않은 음성 코덱 프레임에서부터 스펙트럼적 파라미터들의 단순한 반복은 디코딩된 음향신호의 스펙트럼에서 갑작스러운 변화를 일으킬 수 있는데, 물론 이는 낮은 음질을 경험하게 된다는 것을 의미한다.
특히, CELP 코딩 계열 범례에 따라 동작하는 광대역 음성 코덱들은 상기에서 설명한 문제점들을 겪는 것으로 증명되었는데, 이들 코덱들에서 합성 필터 여기의 스펙트럼 형상은 한 음성 코덱 프레임에서 다른 음성 코덱 프레임으로 보다 극적으로 변할 수 있기 때문이다.
본 발명은 부분적으로 손실되거나 또는 손상되는 음향신호를 나타내는 엔코드된 데이터에 의해 야기되는, 디코딩된 음향신호에서 에러의 은폐에 관한 것이다. 보다 상세히 말하면, 본 발명은 청구항 1 및 39 각각의 전재부에 따른 에러은폐 유닛과 전송매체로부터 엔코딩된 정보의 형태로 데이터를 수신받는 방법에 관한 것이다. 본 발명은 또한 청구항 41 및 42 각각의 전재부에 따른 엔코드된 정보형태의 수신데이터와, 청구항 37에 따른 컴퓨터 프로그램 및 청구항 38에 따른 컴퓨터판독가능 매체로부터 음향신호를 발생시키는 디코드에 관한 것이다.
도 1은 본 발명에 따른 에러 은폐 유닛에 대한 일반적인 블록도.
도 2는 음향신호를 나타내는 엔코딩된 정보를 포함하는 연속적인 신호 프레임들을 보여주는 도면.
도 3은 도 2에서 신호 프레임들 내 엔코딩된 정보를 기반으로 한 디코딩된 음향신호를 보여주는 도면.
도 4는 도 2의 신호프레임들에 대응하는 도 3의 디코딩된 음향신호들의 부분들에 대한 스펙트럼 조합을 보여주는 도면.
도 5는 본 발명에 따른, 이전의 손상되지 않은 데이터, 손상된 데이터의 1차 재구성 및 손상된 데이터의 2차 재구성을 기반으로 생성된 스펙트럼을 보여주는 도면.
도 6은 본 발명에 따른 에러 은폐 유닛의 제1실시예를 보여주는 블럭도.
도 7은 본 발명에 따른 에러 은폐 유닛의 제2실시예를 보여주는 블럭도.
도 8은 본 발명에 따른 일반적인 방법을 설명하는 흐름도.
따라서, 본 발명의 목적은 상기에서 설명한 문제점들을 경감시키는, 음성 코덱 해결책을 제공하는 것이다.
본 발명의 한 특징에 따라서, 본 발명의 목적은 앞서 설명한 것과 같이 엔코딩된 정보의 형태로 데이터를 수신하고 또한 데이터를 음향신호를 디코딩하는 방법으로 달성되는데, 데이터가 손상되어 수신된 경우에 1차적으로 재구성된 (reconstructed) 신호를 기반으로 2차 재구성 신호를 생성하는 것을 특징으로 한다. 2차 재구성 신호는 1차 재구성 신호의 스펙트럼의 스펙트럼적으로 조정된 버전인 스펙트럼을 가지는데, 이전에 재구성된 신호의 스펙트럼에 대한 스펙트럼적 형상에 대한 편차는 1차 재구성 신호의 스펙트럼과 이전에 재구성된 신호의 스펙트럼 간에 대응하는 편차보다 작다.
본 발명의 다른 특징에 따라, 본 발명의 목적은 컴퓨터의 내부 메모리에 직접 로딩할 수 있는 컴퓨터 프로그램으로 달성되는데, 상기 프로그램을 컴퓨터에서실행할 때에 상기 문장에서 설명한 방법을 수행하기 위한 소프트웨어를 포함한다.
본 발명의 또 다른 특징에 따라, 본 발명의 목적은 컴퓨터로 판독할 수 있는 매체로 달성되는데, 상기 끝에서 두번째 문장에 기술된 방법을 컴퓨터가 수행하도록 하기 위한 프로그램이 상기 매체에 기록된다.
본 발명의 또 다른 특징에 따라서, 본 발명의 목적은 초기에 설명한 것과 같은 에러 은폐 유닛으로 달성되는데, 손상되어 수신된 데이터의 경우에 스펙트럼 교정 유닛이, 이전에 재구성된 신호의 스펙트럼으로부터의 스펙트럼적 형상에 관해서, 2차 재구성 스펙트럼의 스펙트럼적 형상이 1차 재구성 신호를 기반으로한 스펙트럼보다 덜 편향하도록 1차 재구성된 신호를 기반으로 한 2차 재구성 스펙트럼을 생성하는 것을 특징으로 한다.
본 발명의 또 다른 특징에 따라서, 본 발명의 목적은 엔코딩된 정보의 형태로 수신된 데이터로부터 음향신호를 발생하기 위한 디코더로 달성된다. 상기 디코더는 적어도 하나의 파라미터를 생성하기 위한 1차 에러은폐 유닛을 포함한다. 또한, 음성 코덱 프레임들과, 상기 1차 에러은폐로부터 상기 적어도 하나의 파라미터를 수신하고 또한 이에 응해 음향신호를 제공하기 위한 음성 디코더를 포함한다. 게다가, 상기 디코더는 제안된 에러은폐 유닛을 포함하는데, 1차 재구성 신호는 음성 디코더에 의해 생성되는 디코딩된 음성신호를 구성하고 그리고 2차 재구성 신호는 향상된 음향신호를 구성한다.
본 발명의 또 다른 특징에 따라, 본 발명의 목적은 엔코딩된 정보의 형태로 수신된 데이터로부터 음향신호를 발생하기 위한 디코더로 이루어진다. 상기 디코더는 적어도 하나의 파라미터를 생성하기 위한 1차 에러은폐 유닛을 포함한다. 또한, 음성 코덱 파라미터들과 상기 적어도 하나의 파라미터를 수신하고 또한 상기 1차 에러은폐 유닛으로부터의 상기 적어도 하나의 파라미터에 응해 여기신호를 생성하는 여기 발생기(excitation generator)를 포함한다. 마지막으로, 디코더는 제안된 에러은폐 유닛을 포함하는데, 1차 재구성 신호는 상기 여기 발생기에 의해 생성되는 여기신호를 구성하고, 그리고 2차 재구성 신호는 향상된 여기신호를 구성한다.
손실되거나 또는 손상되어 수신된 데이터의 결과로서 제안된 재구성 스펙트럼의 명확한 생성은 손상되지 않고 수신된 데이터의 주기들과 손상되어 수신된 데이터의 주기들 간에 스펙트럼적으로 부드러운 천이를 보장한다. 결국, 이는 ACELP-코딩 방법들을 수반하는, 진보된 광대역 코덱들에 대해 디코딩신호의 향상된 감각 음질을 제공하게 된다.
지금부터 예로서 기술되는 바람직한 실시예들과 함께 첨부도면을 참조하여 본 발명을 보다 상세히 설명하게 된다.
도 1은 본 발명에 따른 에러 은폐 유닛(100)을 보여주는 블럭도이다. 에러 은폐 유닛(100)의 목적은, 수신 데이터가 손실되거나 또는 손상된 경우에 수신 데이터로부터 디코딩된 강화(enhanced) 신호(zn E)를 생성하는 것이다. 디코딩된 강화 신호(zn E)는 여기 파라미터와 같은 음성신호의 파라미터를 나타내거나, 또는 디코딩된 강화신호(zn E) 그 자체가 음향신호이다. 유닛(100)은 수신데이터로부터 유도되는1차 재구성 신호(yn)을 수신하는 제1 변환기(transformer)(101)를 포함한다. 상기 1차 재구성 신호(yn)는 시간영역에서 신호로 간주되고 또한 제1 변환기(101)는 1차 재구성 신호(yn)중에서 가장 늦게 수신된 타임세그먼트(부분)의 1차 재구성 주파수 변환(Yn)을 제1스펙트럼의 형태로 주기적으로 생성한다. 전형적으로, 각 세그먼트는 수신신호의 신호 프레임에 대응한다.
제1 스펙트럼(Yn)은 스펙트럼 정정 유닛(102)으로 전송되는데, 유닛은 제1 스펙트럼(Yn)을 근거로 2차 재구성 스펙트럼(Zn E)를 생성한다. 2차 재구성 스펙트럼(Zn E)은, 스펙트럼 형상에 관해서 이전에 재구성된 신호의 스펙트럼으로부터 1차 재구성 신호(yn)를 기반으로 한 스펙트럼보다 덜 편향되도록 생성된다.
이를 설명하기 위하여 도 2를 참조한다. 도면에서 음향신호를 나타내는 연속적인 신호 프레임들 F(1)-F(5)들이 도시되어 있다. 신호 프레임들 F(1)-F(5)은 각각 주기적인 간격(t1, t2, t3, t4, t5)으로 송신기에 의해 생성된다.
그럼에도 불구하고, 수신기가 디코딩 전에 정확한 순서로 신호 프레임 F(1)-F(5)들을 재-배열(re-arrange)할 수 있기 때문에, 신호 프레임 F(1)-F(5)들이 충분히 작은 지연 이내에 도달하는 한, 신호 프레임 F(1)-F(5)들은 수신기에 동일 주기성으로 또는 동일 순서로 도달할 필요가 없다. 그러나, 간략화의 이유로, 본 예에서 신호 프레임 F(1)-F(5)들은 타임리(timely;때 맞춘) 방식으로 또한 신호들이 송신기에 의해 생성되었던과 같은 순서로 도달하는 것으로 간주한다. 초기의 세 신호 프레임 F(1)-F(3)들은 손상되지 않은채 도달한다. 즉, 포함정보에 에러가 전혀 없다. 그러나, 네번째 신호 프레임 F(4)은 손상되거나, 또는 디코딩유닛에 도달하기 전에 완전히 손실된다. 후속하는 신호 프레임 F(5)은 다시 손상되지 않은채 도달한다.
도 3은 도 2의 신호 프레임 F(1)-F(5)들을 기반으로 하는 디코딩된 음향신호 z(t)를 보여준다. 시간영역(t)에서 음향신호(z(t))는 제1 타임 인스턴스(t1)과 제2 타임 인스턴스(t2) 간의 제1 신호 프레임 F(1)에 포함된 정보를 기반으로 발생된다. 마찬가지로, 음향신호(z(t))는 제2 신호 프레임 F(2)과 제2 신호 프레임 F(3)내의 정보를 기반으로 제4 타임 인스턴스(t4)까지 발생된다. 실제에 있어서, 엔코딩 지연, 전송시간 및 디코딩지연 때문에, 송신기측에서는 간격들(t1- t5)들 간에 시프트가 있을 수 있고 또한 수신기측에서도 대응한 타임 인스턴스(t1- t5)들 간에 시프트가 있을 수 있다. 다시 간략화를 위해, 이러한 현상을 여기에서 무시하였다.
그럼에도 불구하고, 네번째 타임 인스턴스(t4)에서, 음향신호(z(t))를 근거로 할 수신정보가 없다(또는, 판독불가능하다). 따라서, 음향신호(z'(t4)-z'(t5))는 제4 타임 인스턴스(t4)와 제5 타임 인스턴스(t5) 사이에서 1차 에러 은폐 유닛에 의해 생성되는 재구성 신호 프레임 Frec(4)를 근거로 한다. 도 3에 설명되어 있듯이, 재구성 신호 프레임 Frec(4)로부터 유도되는 음향신호(z(t))는 인접 신호 프레임 F(3)와 F(5)로부터 유도되는 음향신호(z(t))의 부분들과는 상이한 파형 특성을 보인다.
도 4는 도 3에서 디코딩된 음향신호(z(t))의 각 세그먼트 z(t1)-z(t2), z(t2)-z(t3), z(t3)-z(t4) 및 z'(t4)-z'(t5) 에 대응하는 스펙트럼 Z1, Z2, Z3, Z'4및 Z5셋트를 보여준다. 디코딩된 음향신호(z(t))은 제3 타임 인스턴스(t3)와 제4 타임인스턴스(t4) 사이의 시간영역에서 비교적 평탄하여, 따라서 저주파수 영역에 위치하는 대부분의 에너지를 가지는 대응 스펙트럼 Z3로 표시되는, 비교적 강한 저주파수 내용을 가진다. 이와는 반대로, 재구성 신호 프레임 Frec(4)를 기반으로 하는 음향신호 z'(t4)-z'(t5) 의 스펙트럼은 고주파수 대역에서 상당히 많은 에너지를 포함하고 그리고 시간영역 t에서 신호 z'(t4)-z'(t5)는 비교적 빠른 진폭 변화를 보여준다. 가장 마지막으로 수신된 비-손상 신호 프레임 F(3)을 기반으로 하는 디코딩된 음향신호의 스펙트럼 Z3와 재구성 신호 프레임 Frec(4)를 기반으로 하는 디코딩된 음향신호의 스펙트럼 Z'(4)의 대조 스펙트럼 형상은 음향신호에 바람직하지 않은 인위음을 만들어내어, 인간이 청취자는 낮은 음질을 느끼게 된다.
도 5는 가장 늦게 수신된 비-손상 신호 프레임 F(3)를 기반으로 하는 디코딩된 음향신호의 스펙트럼 Z3와 재구성 신호 프레임 Frec(4)를 기반으로 하는 디코딩된 음향신호의 스펙트럼 Z'4의 확대부가 각각 실선으로 표시되어 있는 도면이다. 스펙트럼 정정 유닛(102)에 의해 생성되는 2차 재구성 스펙트럼 Zn E이 점선으로 도면에 도시되어 있다. 후자의 스펙트럼 Zn E의 스펙트럼 형상은, 가장 늦게 수신된 비-손상 음향신호 프레임 F(3)를 기반으로 하는 디코딩된 음향신호의 스펙트럼 Z3에서부터 재구성 신호 프레임 Frec(4)을 기반으로 하는 디코딩된 음향신호의 스펙트럼 Z'4보다는 덜 편향된다. 예컨대, 스펙트럼 Zn E은 저-주파수 영역으로 보다 많이 시프트한다.
도 1을 다시 참조하면, 제2 변환기(103)는 2차 재구성 스펙트럼 Zn E을 수신하고, 역주파수 변환을 수행하고 그리고 강화 디코딩 신호를 구성하는 시간영역에 대응하는 2차 재구성 신호 zn E를 제공한다. 도 3은 파형특성을 수반하는 이 신호 zE(t4)-zE(t5)를 점선으로서 보여주는데, 재구성 신호 프레임 Frec(4)를 기반으로 하는 음향신호 z'(t4)-z'(t5) 보다는, 가장 늦게 수신된 비-손상 신호 프레임 F(3)로부터 디코딩된 음향신호 z(t3)-z(t4)에 보다 유사하다.
2차 재구성 스펙트럼 Zn E은 재구성 신호 프레임 Frec(4)에 대응하는 제1 스펙트럼 Yn의 위상, 즉을 정정 스펙트럼 Cn으로 승산하여 생성된다(Yn은 제1 스펙트럼을 나타내고,은 제1 스펙트럼의 진폭을 나타낸다). 실제로 이는 다음식에 따라서 수행될 수 있다.
본 발명의 바람직한 실시예에 따라서, 정정 스펙트럼 Cn은 다음에 따라 이전에 수신된 비-손상 데이터 F(n-1)로부터 생성된다. 스펙트럼 정정 유닛(102)은 먼저, 이전에 수신된 비-손상 데이터 F(n-1)로부터 생성되는 신호의 이전 스펙트럼 Yn-1을 생성하는데, 이는 도 4와 5의 Z3와 도 3의 F(3)에 각각 대응한다. 그런 다음, 스펙트럼 정정 유닛(102)은 이전 스펙트럼 Yn-1의 크기 스펙트럼을 생성한다.
본 발명의 다른 바람직한 실시예에 따라서, 정정 스펙트럼 Cn은 이전에 수신된 비-손상 데이터 F(n-1)으로부터 생성되는 신호의 이전 스펙트럼 Yn-1을 생성함으로써 발생된다. 그런 다음, 최종 스펙트럼은 필터링된 이전 스펙트럼 H(Yn-1)으로 필터링된다. 마지막으로, 필터링된 이전 스펙트럼 H(Yn-1)의 크기 스펙트럼이 생성된다.
필터링은 이전 스펙트럼 Yn-1의 많은 대체 수정안들을 수반할 수 있다. 그러나, 전반적인 필터링의 목적은 항상, 이전의 비손상 신호 프레임으로부터 디코딩되는 신호의 스펙트럼의 부드러운 반복인, 대응하는 스펙트럼을 가지는 신호를 생성하는 것이다. 따라서, 저대역(Low-Pass) 필터링은 하나의 적당한 대안을 구성한다. 다른 대안은 캡스트럼(cepstral)영역에서 평탄화될 수 있다. 이는 이전 (가능하다면 로그) 크기 스펙트럼을 캡스트럼 영역으로 변환하고, 특정 순서(5-7) 및 그 위의 캡스트럼 계수들을 버리고, 그리고 주파수 영역으로 역변환하는 것을 수반할 수 있다. 다른 비-선형 필터링 대안은 이전 스펙트럼 Yn-1을 적어도 두 개의 주파수 서브-대역(sub-band) f1- fM으로 분할하고 그리고 각각의 주파수 서브-대역 f1-fM내에서 최초 스펙트럼 계수들의 평균 계수값을 계산하는 것이다. 마지막으로, 최초 스펙트럼 계수들을 각각의 평균 계수값으로 대체한다. 결과적으로, 전체 주파수대역은 평탄화된다. 주파수 서브-대역 f1-fM은 등거리(equdistant)가 될 수 있거나, 즉 이전 스펙트럼 Yn-1을 동일 크기의 세크먼트들로 분할하거나, 또는 비-등거리가 될 수 있다(예컨대, 바크(Bark) 또는 멜(Mel) 스케일 대역 분할에 따라서). 스펙트럼 Yn-1의 비-등거리 로그 분할(logarithmic division)은 바람직한데, 인간 청각이 주파수 해상도와 소음감각에 관해서 거의 로그적이기 때문이다.
또한, 주파수 서브-대역들은 부분적으로 서로 겹칠 수 있다. 이 경우에 있어서, 중첩영역에서 최종 계수값들은 먼저, 각각의 주파수 서브-대역을 윈도우함수로 승산하고, 그리고 두번째로 각각의 중첩영역에서 윈도우된 이웃하는 주파수 서브-대역들의 계수값들을 부가함으로써 유도된다. 윈도우함수는 비-중첩 주파수영역에서 일정한 크기를 가져야만 하고, 이웃하는 주파수 서브-대역들이 중첩하는 상부 및 하부 천이영역에서 점진적으로 기울어져 감소하는 크기를 가져야만 한다.
본 발명의 또 다른 바람직한 실시예에 따라서, 2차 재구성 신호 Zn E의 스펙트럼은 정정 스펙트럼 Cn의 동적인 범위에 대해 소위 타겟 무팅(target muting) 스펙트럼를 감소시킴으로써 생성된다. 예컨대, 타겟 무팅 스펙트럼는 음향 소오스신호의 장주기(long term) 평균값을 나타낸다.
타겟 무팅 스펙트럼에 관하여 정정 스펙트럼 Cn의 범위의 동적인 감축은 다음 관계에 따라 수행될 수 있다.
여기에서 Yn-1은 이전에 재구성된 신호 프레임의 스펙트럼을 나타내고(주의, 이 프레임이 비손상 신호 프레임일 필요는 없고, 이전에 재구성된 손상 또는 손실 신호 프레임일 수 있다),는 타겟 무팅 스펙트럼을 나타내고, k는 예컨대 2와 같은 지수를 나타내고, 그리고 comp(x)는 압축함수를 나타낸다. 압축함수는 입력변수의 절대값 보다 작은 절대값을 가지는 것을 특징으로 한다. 즉,이다. 그러므로, 감소계수(decaying factor) η<1 는 압축함수 comp(x)=η·x 의 단순한 예를 구성한다.
감소계수 η 는 바람직하게 상태기계(state machine)로 주어지는데, 이는 GSM AMR-표준에서와 같이 일곱개의 상이한 상태를 가질 수 있다. 따라서, 감소계수 η 는 다음의 값을 가지는 상태 변수 s의 함수 η(s)로 기술할 수 있다.
상 태(들) 0 1 2 3 4 5 6
η(s) 1 0,98 0,98 0,98 0,98 0,98 0,7
데이터 중 비손상부의 수신시에 상태변수는 0에 설정된다. 손상된 데이터의 제1부분을 수신하는 경우에, 상태변수는 1에 설정된다. 만일 손상된 데이터의 제1부분의 수신 이후에 손상데이터의 후속부분들이 수신된다면, 상태변수는 수신한 손상데이터의 각 부분에 대해 한 상태씩 상태 6까지 증가한다. 상태 6에서 손상된 데이터의 다른 부분의 수신시에, 상태변수는 상태 6에 남아 있는다. 만일 손상되지 않은 데이터의 부분이 상태 6에서 수신된다면, 상태변수는 상태 5로 설정되고, 그리고 만일 이 상태 5에서 손상되지 않은 데이터의 후속부분이 수신된다면, 상태변수는 0으로 리셋된다.
본 발명의 또 다른 바람직한 실시예에 따라서, 2차 재구성 신호 Zn E의 스펙트럼은 정규화된 타겟 무팅 스펙트럼에 관해서 정정 스펙트럼 Cn의 동적인 범위를 감소시킴으로써 생성된다. 이는 다음의 식을 계산함으로써 이루어질 수 있다.
여기에서,은 이전에 재구성된 신호 프레임의 스펙트럼의 Lk-놈(norm)을 나타낸다. 벡터 Yn-1= {y1,y2, ...., ym}의 Lk-놈(norm)은 다음식으로 주어진다.
여기에서 k는 지수이고, yi는 Yn-1의 i:번째 스펙트럼 계수이다. 또한, Cs n은 다음의 관계식에 따라 유도된다.
여기에서는 타겟 무팅 스펙트럼을 나타내고,는 사용한 Lk-놈에 따른 타겟 무팅 스펙트럼의 멱(power)를 나타내고, k는 예컨대 2와 같은 지수를 나타내고, 그리고 comp(x)는 압축함수를 나타낸다.
본 발명의 바람직한 실시예에 따라서, 정정 스펙트럼 Cn은 선형 놈 Lk에 따라 타겟 멱에 관하여 이전에 재구성된 신호 프레임의 스펙트럼의 크기를 압축함으로써 발생된다. 예컨대, 여기에서 지수 k는 2와 동일하다.
일반적인 경우에 있어서, 이 압축은 다음 식을 계산함으로써 이루어진다.
여기에서,는 이전에 재구성된 신호 프레임의 스펙트럼의 크기를 나타내고,sms Lk-놈에 따른 타겟 무팅 멱(power)을 나타내고(여기서 k는 2와 같은지수), 그리고 comp(x)는 압축함수를 나타낸다.
본 발명의 바람직한 실시예에 따라서, 정정 스펙트럼 Cn은 다음 관계식으로 기술된다.
여기에서 η는 감소계수 < 1 을 나타내고,은 이전에 재구성된 신호 프레임의 스펙트럼의 크기를 나타낸다.
또한 이 경우에 있어서도, 감소계수 η는 일 곱개의 상이한 상태들, 0 -6를 가지는 상태기계에 의해 주어지는 것이 바람직하다. 또한, 상기와 동일한 η의 값들과 상태기계의 규칙이 적용될 수 있다.
본 발명의 바람직한 실시예에 따라서, 정정 스펙트럼 Cn은 먼저, 이전에 재구성된 신호 프레임의 스펙트럼 Yn-1생성함으로서 발생된다. 그런 다음, 대응하는 크기 스펙트럼을 생성하고, 그리고 마지막으로 크기 스펙트럼의 부분 m(즉, m:번째 서브-대역)을 적응성(adaptive) 무팅계수 rm은 다음의 식에 따라서, 이전에 재구성된 신호 프레임과 수신한 손상 데이터 F(n)으로부터 유도될 수 있다.
여기에서 "low(m)" 재구성된 데이터로부터 디코딩되는 신호의 스펙트럼 서브-대역 fm의 하위 저주파수 대역 경계에 대응하는 주파수계수 인텍스를 나타내고, "high(m)"는 재구성된 데이터로부터 디코딩되는 신호의 스펙트럼의 서브-대역 fm의 상위 주파수대역 경계에 대응하는 주파수계수 인덱스를 나타내고,는 제1 스펙트럼에서 k:번째 주파수성분을 나타내는 계수의 크기이고,는 이전 스펙트럼에서 k:번째 주파수성분을 나타내는 계수의 크기이다.
게다가, 스펙트럼을 더 분할(sub-divide)할 필요가 없다. 따라서, 스펙트럼은 단지 재구성된 데이터로부터 디코드되는 신호의 전체 주파수대역의 경계에 대응하는 계수 인덱스들을 가지는 하나의 서브-대역 fm을 가질 수 있다. 그러나, 만일 서브-대역 분할이 이루어진다면, 바크 스케일 대역 분할 또는 멜 스케일 대역 분할과 일치하는 것이 바람직하다.
본 발명의 바람직한 실시예에 따라서, 정정 스펙트럼 Cn은 임계주파수 위의 주파수성분에 독점적으로 영향을 미친다. 실시의 이유로, 이 임계주파수는 특정 임 계계수에 대응하도록 선택된다. 그러므로, 정정 스펙트럼 Cn은 다음의 식으로 표현할 수 있다.
, k ≤ 임계계수
, k > 임계계수
여기에서 Cn(k)는 정정 스펙트럼 Cn에서 k:번째 주파수성분을 나타내는 계수 k의 크기를 나타내고,는 제1스펙트럼에서 k:번째 주파수성분을 나타내는 계수 k의 크기를 나타내고,는 이전 스펙트럼에서 k:번째 주파수성분을 나타내는 계수의 크기를 나타내고 그리고는 적응성 무팅계수 < 1 을 나타낸다.
예컨대, 적응성 무팅계수는 제1스펙트럼 Yn의 제곱과 이전 스펙트럼 Yn-1의 제곱간의 비의 제곱근으로서 선택할 수 있다. 즉 다음과 같다:
적응성 무팅계수는 또한 다음식에 따라 특정 주파수대역에 대해 유도될 수 있다:
여기에서 "low"는 재구성된 데이터로부터 디코딩되는 신호의 스펙트럼의 하위(lower) 주파수대역 경계에 대응하는 주파수계수 지표(index)를 나타내고,"high"는 재구성된 데이터로부터 디코딩되는 신호의 스펙트럼의 상위(upper) 주파수대역 경계에 대응하는 주파수계수 지표를 나타내고,는 제1스펙트럼에서 k:번째 주파수성분을 나타내는 계수의 크기를 나타내고 그리고는 이전 스펙트럼에서 k:번째 주파수성분을 나타내는 계수의 크기를 나타낸다. 전형적으로, 하위 주파수대역 경계는 0㎑ 일 수 있고 그리고 상위 주파수대역 경계는 2㎑ 일 수 있다. 상기 정정 스펙트럼 Cn(k)를 설명하기 위한 식에서 임계계수는, 꼭 필요한 것은 아니지만 상위 주파수대역 경계와 일치할 수 있다. 본 발명의 바람직한 실시예에 따라서, 임계주파수는 3㎑ 이다.
일반적으로 일차 에러은폐 유닛은 주파수대역 중에서 하위부분에서 가장 효과적이기 때문에, 제안한 무팅작용은 이 대역에서 가장 효과적이다. 따라서, 제1스펙트럼 Yn에서 고주파수대역 전력과 저주파수대역 전력 간의 비율을 이전 신호프레임의 대응하는 비율과 같게되도록 함으로써, 일차 에러은폐 유닛으로부터의 무팅은 주파수대역 중에서 상위부분에도 마찬가지로 확장될 수 있다.
손실 또는 손상 프레임 이후에 첫번재 프레임의 전력레벨을, 에러/손실이 발생하기 전에 가장 마지막으로 수신한 비손상 신호의 전력레벨로 한정하는 것이 현재의 에러은폐 방법에서 공통적인 특징이다. 또한, 본 발명에 따라서, 유사한 원리를 적응시키고 또한 정정 스펙트럼 Cn의 서브-대역의 전력을 이전에 수신한 비손상데이터 F(n-1)의 대응하는 서브-대역의 전력으로 제한하는 것이 장점이 있다. 예컨대, 서브-대역은 (임계계수 k로 표현되는)임계주파수 위의 주파수 성분들을 나타내는 계수들로서 규정할 수 있다. 즉, 이러한 크기 제한은 고주파수 대역 에너지 대 저주파수 대역 에너지 비율이 프레임 삭제 후에 첫번째 프레임에서 왜곡되지 않도록 보장한다. 크기제한은 다음의 식으로 표현할 수 있다.
, k > 임계계수
여기에서는 가장 늦게 수신한 비손상 신호프레임 F(n-1)으로부터 유도되는 신호프레임의 전력의 근(root)을 나타내고, σh,n은 현재 신호프레임으로부터 유도되는 신호프레임의 전력의 근을 나타내고,는 현재 신호프레임으로부터 유도되는 스펙트럼에서 k:번째 주파수성분을 나타내는 계수 k의 크기를 나타낸다.
본 발명은 주로 음성신호들의 엔코딩과 관련해서 사용할 목적이기 때문에, 일차 재구성 신호는 음향신호인 것이 바람직하다. 또한, 엔코딩된 음성데이터는 신호프레임들로 세그먼트(분할)되거나, 또는 정확히 말하면 음성 코덱프레임들로 세그먼트된다. 음성 코덱프레임들은 또한 음성 코덱 서브-프레임들로 더 분할될 수 있는데, 이는 마찬가지로 본 발명에 따른 에러은폐유닛의 동작을 위한 근간을 구성할 수 있다. 그래서, 손상된 데이터는, 특정 음성 코덱 또는 음성 코덱 서브-프레임이 손실되었는지 또는 적어도 하나의 에러를 가지고서 수신되었는지를 기반으로결정된다.
도 6은 음향신호 a가 일차 재구성 신호 y로서 공급되는 에러은폐유닛(100)을 포함하는 CELP-디코더에 대한 블록도를 보여준다.
디코더는 일차 에러은폐유닛(603)를 포함하는데, 이는 손상된 음성프레임(F)이 수신되는 경우 또는 음성프레임(F)이 손실되는 경우에 적어도 하나의 파라미터 p1을 생성한다. 데이터품질 결정유닛(601)은 특정 음성프레임(F)이 정확히 또는 에러가 있게 수신되는지를 결정하기 위해, 순환 중복 검사(CRC)를 수행함으로써 모든 입중계(incoming) 음성프레임들을 확인한다. 비손상 음성프레임(F)들은 데이터품질 결정유닛(601)을 통해 음성 디코더(602)로 전달되고, 디코더는 그의 출력에 폐스위치(closed switch)(605)를 통해 음향신호를 발생한다.
만일 데이터품질 결정유닛(601)이 손상되거나 또는 손실된 음성프레임(F)을 검출한다면, 유닛(601)은 일차 에러은폐유닛(603)을 활성화시키고, 유닛은 손상된 음성프레임(F)의 첫번째 재구성을 위한 근간을 나타내는 적어도 하나의 파라미터 p1을 생성한다. 그런 다음, 음성디코더(602)는 재구성된 음성프레임에 응해 첫번째 재구성 음성신호를 발생한다. 데이터품질 결정유닛(601)은 또한 에러은폐유닛(100)을 활성화시키고 또한 스위치(605)를 개방한다. 그러므로, 첫번째로 재구성된 음성신호 a는, 상기에서 제안한 방법들에 따라 음향신호 a의 더 나은 향상을 위해 신호 y로서 에러은폐유닛(100)으로 전송된다. 강화된 최종 음향신호는 신호 zE로서 출력에 전달되고, 스펙트럼의 형상에 관해서 그 스펙트럼이 첫번째로 재구성된 음향신호의 스펙트럼보다, 이전에 수신한 비손상 음성프레임으로부터 생성된 음향신호 a로부터 덜 벗어나도록 스펙트럼적으로 조정된다.
도 7은 본 발명에 따른 에러은폐유닛의 다른 응용에 대한 블록도를 보여준다. 여기에서, 데이터품질 결정유닛(701)은 음향 소오스신호의 중요한 특징들을 나타내는 입중계 파라미터들(S)을 수신한다. 파라미터(s)들이 (예컨태 CRC를 통해 결정되어) 손상되지 않은 경우에, 이들은 여기발생기(excitation generator)(702)로 전송된다. 여기발생기(702)는 스위치(705)를 통해 여긴신호(e)를 합성필터(704)로 전송하고, 필터는 음향신호 a를 발생시킨다.
그러나, 만일 데이터품질 결정유닛(701)이, 파라미터(S)들이 손상되거나 또는 손실되었는 것을 발견한다면, 일차 에러은폐유닛(703)을 활성화시키고, 유닛은 적어도 하나의 파라미터(p2)를 생성한다. 여기발생기(702)는 상기 적어도 하나의 파라미터(p2)를 수신하여, 이에 응해 제1 재구성 여기신호 e를 제공한다. 데이터품질 결정유닛(701)은 또한 스위치(705)를 개방하고, 에러은폐유닛(100)을 활성화시킨다. 이 결과, 여긴신호 e를 일차 재구성 신호 y로서 에러은폐유닛(100)이 수신한다. 에러은폐유닛(100)은 이에 응해 이차 재구성 신호 zE를 생성하는데, 스펙트럼 형상에 관해서 이차 재구성 신호의 스펙트럼이 제1 재구성 여기신호의 스펙트럼보다, 이전에 수신된 비손상 음성 프레임 F로부터 생성되는 여기신호 e로부터 덜 벗어나도록 스펙트럼적으로 조정된다.
본 발명의 바람직한 실시예에 따라서, 일차 에러은폐유닛(703)은 또한, 적어도 하나의 파라미터 ci를 에러은폐유닛(100)으로 전송한다. 이 전송은 데이터품질 결정유닛(701)에 의해 제어된다.
요약을 위해, 본 발명의 일반적인 방법을 도 8의 흐름도를 참조하여 기술한다. 제1단계(801)에서 데이터가 수신된다. 후속단계(802)는 수신데이터가 손상되었는지 여부를 검사하고, 만일 데이터가 손상되지 않았다면 절차는 단계(803)으로 지속된다. 이 단계는 나중에 있을 수도 있는 사용을 위해 데이터를 저장한다. 그런 다음, 다음단계(804)에서, 데이터는 여기신호와 같은, 소오스신호 자체, 파라미터 또는 소오스신호에 관련된 신호의 추정(estimate)으로 디코딩된다. 그런 다음에, 절차는 새로운 데이터의 수신을 위해 단계(801)로 복귀한다.
만일 단계9802)에서 수신데이터가 손상된 것으로 검출된다면, 절차는 단계 (805)로 진행하고, 이 단계에서 단계(803)에서 이전에 저장된 데이터가 검색된다.실제로, 데이터의 많은 연속적인 조각들이 손상되거나 또는 손실될 수 있기 때문에, 검색되는 데이터가 현재 손실된 또는 손상된 데이터 바로 직전의 데이터일 필요는 없다. 그럼에도 불구하고, 검색은 가장 늦게 수신된 비손상 데이터이다. 그런다음, 이 데이터는 후속단계(806)에서 활용되는데, 이 단계에서 일차 재구성 신호를 생성한다. 일차 재구성 신호는 (있다면) 현재 검색되는 데이터와 그리고 저장된 이전 데이터의 적어도 하나의 파라미터를 기반으로 한다. 마지막으로, 단계(807)은 스펙트럼적 형상이 일차 재구성 신호의 스펙트럼보다, 이전에 수신한 비손상 데이터이 스펙트럼으로부터 덜 벗어나도록 일차 재구성 신호를 기반으로 이차 재구성 신호를 발생시킨다. 그런 다음에, 절차는 새로운 데이터의 수신을 위해 단계(801)로 복귀한다.
현재 재구성된 프레임을 기반으로 데이터를 발생시켜 저장하는 다른 가능성이 단계(808)에 포함된다. 바로 후속하는 프레임이 삭제되는 경우에, 이 데이터를 단계(805)에서 검색할 수 있다.
상기에서 기술된 다른 실시예들 뿐만 아니라, 본 발명의 방법은 컴퓨터의 내부메모리에 직접 로딩될 수 있는 컴퓨터에 의해 수행될 수 있다. 이러한 프로그램은 컴퓨터에서 가동될 때 상기에서 제안한 단계들을 수행하기 위한 소프트웨어를 포함한다. 또한, 소프트웨어는 기록가능한 소정의 매체에 저장될 수 있다.
또한, 주파수영역에서 필터링을 수행하는 음성코덱용 고도화유닛과 함께 본 발명에 따른 에러은폐유닛(100)을 같이 사용하는 것이 유리하다는 것도 생각해 볼 수 있다. 즉, 이들 유닛들은 주파수영역에서 유사한 방식으로 동작하고 또한 시간영역으로 역 주파수변환을 수반한다.
상기 이차 재구성 신호가 주파수영역에서 필터링동작을 수행함으로써 얻어지는 정정 크기 스펙트럼 Cn의 사용으로 생성되는 것으로 제안하였다 하더라도, 대응하는 시간영역 필터를 대신에 사용함으로써 동일한 필터링이 시간영역에서 동등하게 마찬가지로 수행될 수 있다. 소정의 공지된 디자인방법이 주파수응답을 가지는 필터를 추론하기 위해 적용할 수 있는데, 정정 크기 스펙트럼 Cn을 근사 (approximate)한다.
본 명세서에 사용되는 용어 "포함한다/포함하는"은 상술한 특징, 완전체, 단계 또는 성분(부품)의 실제를 명기하기 위해 취한 것이다. 그러나, 이 용어는 하나 이상의 추가적인 특징, 완전체, 단계 또는 성분들 또는 이들의 그룹의 추가 또는 실재를 배제하지 않는다.
본 발명은 도면에 기술된 실시예들에 한정되지 않고, 청구항의 범위 내에서
자유롭게 수정될 수 있다

Claims (42)

  1. 전송매체로부터 엔코딩된 정보(F(1)-F(5))의 형태로 데이터를 수신하고 또한 상기 데이터를 음향신호(z(t))로 디코딩하며, 수신한 데이터(F(4))가 손실 또는 손상된 경우에:
    이전에 재구성된 신호(F(3))의 적어도 하나의 파라미터(p1;p2)을 기반으로 재구성 데이터(Frec(4))를 생성하는 단계와,
    상기 재구성 데이터(Frec(4))로부터, 제1스펙트럼(Z'4)를 가지는 일차 재구성 신호(z'(t4)-z'(t5))를 생성하는 단계를 포함하는 방법에 있어서,
    스펙트럼의 형상에 관해서 이차 재구성된 신호(zE(t4)-zE(t5))의 스펙트럼(Z4 E)이 제1스펙트럼(Z'4)보다는, 이전에 재구성된 신호(z(t3)-z(t4))로부터 덜 벗어나도록 제1스펙트럼(Z'4)의 스펙트럼 조정을 수행함으로써 일차 재구성 신호 (z'(t4)-z'(t5))를 기반으로 이차 재구성 신호(zE(t4)-zE(t5))를 생성하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서, 이전에 재구성된 신호(z(t3)-z(t4))의 스펙트럼(Z3)은 이전에 수신한 비손상 데이터(F(3))로부터 생성되는 것을 특징으로 하는 방법.
  3. 제1항 또는 제2항 중 어느 한 항에 있어서, 상기 스펙트럼 조정은 재구성 데이터로부터 발생되는 제1스펙트럼의 위상 스펙트럼과 정정 스펙트럼(Cn)의 승산을 수반하는 것을 특징으로 하는 방법.
  4. 제3항 또는 제4항 중 어느 한 항에 있어서, 이차 재구성 신호(Zn E)의 스펙트럼은 다음의 식: Cn·Yn/|Yn|에 따라 유도되고,
    Cn은 정정 스펙트럼을 나타내고,
    Yn은 제1스펙트럼을 나타내고,
    |Yn|은 제1스펙트럼의 크기를 나타내는 것을 특징으로 하는 방법.
  5. 제3항 또는 제4항 중 어느 한 항에 있어서,
    이전에 재구성된 신호의 이전 스펙트럼을 생성하고,
    이전 스펙트럼의 크기 스펙트럼을 생성함으로써 정정 스펙트럼(Cn)을 생성하는 것을 특징으로 하는 방법.
  6. 제5항에 있어서, 이전에 재구성된 신호(z(t3)-z(t4))의 스펙트럼(Z3)은 이전에 수신된 비손상 데이터(F(3))로부터 생성되는 것을 특징으로 하는 방법.
  7. 제3항 또는 제4항 중 어느 한 항에 있어서,
    이전에 수신한 비손상 데이터로부터 생성되는 신호의 이전 스펙트럼을 생성하고,
    상기 이전 스펙트럼을 필터링함으로써 필터링된 이전 스펙트럼을 생성하고,
    상기 필터링된 이전 스펙트럼의 크기 스펙트럼을 생성함으로써 정정 스펙트럼(Cn)을 생성하는 것을 특징으로 하는 방법.
  8. 제7항에 있어서, 상기 필터링이 저-대역 필터링을 수반하는 것을 특징으로 하는 방법.
  9. 제7항에 있어서, 상기 필터링이 캡스트럼영역에서 평탄화를 수반하는 것을 특징으로 하는 방법.
  10. 제7항에 있어서, 상기 필터링이:
    이전 스펙트럼을 적어도 두 개의 주파수 서브-대역들로 분할하는 것과,
    주파수 서브-대역 각각에 대해, 각 주파수 서브-대역 내에서 최초 스펙트럼 계수들의 평균 계수값을 계산하는 것과,
    주파수 서브-대역 각각에 대해, 상기 최초 스펙트럼 계수들 각각을 평균 계수값 각각으로 대체하는 것을 수반하는 것을 특징으로 하는 방법.
  11. 제10항에 있어서, 상기 주파수 서브-대역들이 등거리인 것을 특징으로 하는 방법.
  12. 제10항 또는 제11항에 있어서, 상기 주파수 서브-대역들이 적어도 부분적으로 중첩하는 것을 특징으로 하는 방법.
  13. 제12항에 있어서, 주파수 서브-대역들의 중첩하는 영역에서 최종 계수값들은,
    각각의 주파수 서브-대역을 윈도우함수와 승산함으로써 대응하는 윈도우된 주파수 서브-대역들을 생성하고,
    각각의 중첩영역에서 이웃하는 윈도우된 주파수 서브-대역들의 계수값들을 부가함으로써 유도되는 것을 특징으로 하는 방법.
  14. 제13항에 있어서, 상기 윈도우함수는 비-중첩 주파수 영역에서 일정한 크기를 가지고 또한 이웃하는 주파수 서브-대역들이 중첩하는 상부 및 하부 천이영역에서 점진적으로 기울어지는 크기를 가지는 것을 특징으로 하는 방법.
  15. 제3항 또는 제4항 중 어느 한 항에 있어서, 타겟 무팅 스펙트럼에 관해 정정 스펙트럼(Cn)의 동적인 범위를 감소시킴으로써 이차 재구성 신호(Zn E)의 스펙트럼을 생성하는 것을 특징으로 하는 방법.
  16. 제15항에 있어서, 다음의 관계식에 따라서 정정 스펙트럼(Cn)을 생성하고,
    여기에서: Yn-1은 이전에 재구성된 신호프레임의 스펙트럼을 나타내고,
    |Y0| 타겟 무팅 스펙트럼을 나타내고,
    k는 지수를 나타내고, 그리고
    comp(x)는 |comp(x)| < |x|가 되도록 압축함수를 나타내는 것을 특징으로 하는 방법.
  17. 제16항에 있어서, 상기 압축함수는 다음의 식: η·x 로 기술되는 감소계수이고, 여기에서,
    η는 감소계수 < 1 을 나타내고,
    x는 압축할 값을 나타내는 것을 특징으로 하는 방법.
  18. 제3항 또는 제4항 중 어느 한 항에 있어서, 정규화된 타겟 무팅 스펙트럼에 관해 정정 스펙트럼(Cn)의 동적인 범위를 감소시킴으로서 이차 재구성 신호(Zn E)의 스펙트럼을 생성하는 것을 특징으로 하는 방법.
  19. 제18항에 있어서, 다음의 관계식에 따라서 정정 스펙트럼(Cn)을 생성하고:
    ,
    여기에서,
    은 이전에 재구성된 신호프레임의 스펙트럼의 Lk-놈을 나타내고,
    이고
    여기에서,는 타겟 무팅 스펙트럼을 나타내고,
    는 Lk-놈에 따른 타겟 무팅 스펙트럼의 제곱(power)
    를 나타내고,
    k는 지수를 나타내고, 그리고
    comp(x)는 |comp(x)| < 1 이 되는 압축함수를 나타내는 것을 특징으로 하는 방법.
  20. 제3항 또는 제4항 중 어느 한 항에 있어서, 타겟 무팅 스펙트럼의 전력에 관해서 이전에 재구성된 신호의 이전 스펙트럼의 크기를 압축함으로써 정정 스펙트럼(Cn)을 생성하는 것을 특징으로 하는 방법.
  21. 제20항에 있어서, 다음 관계식에 따라서 정정 스펙트럼(Cn)을 나타내고:
    , 여기에서
    은 이전에 재구성된 신호프레임의 스펙트럼의 크기를 나타내고,
    는 타겟 무팅 스펙트럼의 Lk-놈을 나타내고,
    k는 지수를 나타내고, 그리고
    comp(x)는 |comp(x)| < |x|와 같은 압축함수를 나타내는 것을 특징으로 하는 방법.
  22. 제21항에 있어서, 다음의 관계식에 따라 정정 스펙트럼(Cn)을 생성하고:
    , 여기에서
    η는 감소계수 < 1 을 나타내고,
    은 이전에 재구성된 신호프레임의 스펙트럼의 크기를 나타내는 것을 특징으로 하는 방법.
  23. 제17항 또는 제22항 중 어느 한 항에 있어서, 감소계수 η는 일곱개의 상태를 가지는 상태기계에 의해 주어지고 또한 다음의 식으로 기술되고:
    η(s); 여기에서 η(s)는 상태변수들에 따라 다르고, 이는 다음과 같은 관계로 주어지고,
    η(s) = 1, s = 0에 대해
    η(s) = 0,98, s ∈ [1,5]에 대해
    η(s) = 0,7, s = 6에 대해서,
    비손상 데이터의 수신시에 상태변수는 0에 설정되고,
    손상 데이터의 부분을 수신할 시에 상태변수는 1에 설정되고,
    손상 데이터의 제1부분을 수신한 후에 계속하여 수신되는 손상 데이터 부분 각각에 대해 상태변수는 한 상태씩 증가되고, 그리고
    상태 6에서,
    손상 데이터의 수신시에 상태변수는 6과 동일하게 남아있고,
    비손상 데이터의 수신시에 상태변수는 상태 5로 설정되는
    것을 특징으로 하는 방법.
  24. 제3항 또는 제4항 중 어느 한 항에 있어서,
    이전에 재구성된 신호프레임의 스펙트럼을 생성하고,
    상기 이전에 재구성된 신호프레임의 상기 스펙트럼의 크기를 생성하고,
    크기 스펙트럼의 적어도 한 주파수대역을 적어도 하나의 적응성 무팅계수로승산하여 정정 스펙트럼(Cn)을 생성하고,
    상기 적어도 하나의 무팅계수는 이전에 재구성된 신호프레임으로부터 유도되고, 또한 상기 이전에 재구성된 신호프레임의 스펙트럼의 적어도 한 주파수 서브-대역에 관해서 생성되는 것을 특징으로 하는 방법.
  25. 제24항에 있어서, 상기 적어도 하나의 적응성 무팅계수 중 하나는 다음의 식에 따라 유도되고:
    , 여기서
    "low(m)"은 재구성 데이터로부터 디코딩되는 스펙트럼의 서브-대역 fm
    의 하위 주파수대역 경계에 대응하는 주파수계수 인덱스를 나타내고,
    "high(m)"은 재구성 데이터로부터 디코딩되는 스펙트럼의 서브-대역 fm
    의 상위 주파수대역 경계에 대응하는 주파수계수 인덱스를 나타내고,
    는 제1스펙트럼에서 k:번째 주파수성분을 나타내는 계수의 크기
    를 나타내고, 그리고
    는 이전 스펙트럼에서 k:번째 주파수성분을 나타내는 계수의
    크기를 나타내는
    것을 특징으로 하는 방법.
  26. 제10항, 제24항 또는 제25항 중 어느 한 항에 있어서, 이전 스펙트럼과 제1스펙트럼은 각각 바크 스케일 대역분할에 따라서 적어도 두 개의 서브-대역들로 분할되는 것을 특징으로 하는 방법.
  27. 제10항, 제24항 또는 제25항 중 어느 한 항에 있어서, 이전 스펙트럼과 제1스펙트럼은 각각 멜 스케일 대역분할에 따라서 적어도 두 개의 서브-대역들로 분할되는 것을 특징으로 하는 방법.
  28. 제3항 또는 제4항 중 어느 한 항에 있어서, 정정 스펙트럼(Cn)만이 전적으로 특정 임계계수에 대응하는 임계주파수 위의 주파수성분들에 영향을 미치는 것을 특징으로 하는 방법.
  29. 제28항에 있어서, 정정 스펙트럼(Cn)은 다음의 식들:
    , k ≤ 임계계수
    , k > 임계계수
    로 기술하고, 여기에서
    Cn(k)는 정정 스펙트럼(Cn)에서 k:번째 주파수성분을 나타내는 계수의
    크기를 나타내고,
    는 제1스펙트럼에서 k:번째 주파수성분을 나타내는 계수의
    크기를 나타내고,
    는 이전 스펙트럼에서 k:번째 주파수성분을 나타내는 계수의
    크기를 나타내고, 그리고
    는 적응성 무팅계수 < 1 을 나타내는 것을 특징으로 하는 방법.
  30. 제29항에 있어서, 상기 적응성 무팅계수는 다음의 식에 따라 유도되고:
    여기에서,
    "low"는 재구성 데이터로부터 디코딩되는 신호의 스펙트럼의 하위
    주파수대역 경계에 대응하는 주파수계수 인덱스를 나타내고,
    "high"는 재구성 데이터로부터 디코딩되는 신호의 스펙트럼의 상위
    주파수대역 경계에 대응하는 주파수계수 인덱스를 나타내고,
    는 제1스펙트럼에서 k:번째 주파수성분을 나타내는 계수의
    크기를 나타내고, 그리고
    는 이전 스펙트럼에서 k:번째 주파수성분을 나타내는 계수의
    크기를 나타내는 것을 특징으로 하는 방법.
  31. 제28항 내지 제30항 중 어느 한 항에 있어서, 정정 스펙트럼(Cn)의 적어도 하나의 서브-대역의 전력은 임계주파수 위의 주파수성분들을 나타내는 계수들에 대해 이전에 수신한 비손상 데이터의 적어도 하나의 서브-대역의 전력으로 제한되는 것을 특징으로 하는 방법.
  32. 상기 청구항들 중 어느 한 항에 있어서, 일차 재구성 신호 (z'(t4)-z'(t5))와 이차 재구성 신호 (zE(t4)-zE(t5))는 음향신호인 것을 특징으로 하는 방법.
  33. 제1항 내지 제31항 중 어느 한 항에 있어서, 일차 재구성 신호 (z'(t4)-z'(t5))와 이차 재구성 신호 (zE(t4)-zE(t5))는 여기신호인 것을 특징으로 하는 방법.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 데이터는 신호프레임들(F(1)-F(5))로 분할되고 그리고 비손상 데이터는 특정 신호프레임이 손실되었는지 또는 적어도 하나의 에러를 가지고 수신되었는지 여부를 기반으로 결정되는 것을 특징으로 하는 방법.
  35. 제34하에 있어서, 상기 신호프레임이 음성코덱 프레임을 구성하는 것을 특징으로 하는 방법.
  36. 제34항에 있어서, 신호프레임이 음성코덱 서브-프레임을 구성하는 것을 특징으로 하는 방법.
  37. 컴퓨터의 내부메모리에 직접 저장될 수 있으며, 컴퓨터에서 실행될 때 상기 청구항 제1항 내지 제36항 중 어느 항의 단계들을 수행하는데 필요한 소프트웨어를 포함하는 컴퓨터 프로그램.
  38. 청구항 제1항 내지 제36항 중 어느 항의 단계들을 컴퓨터가 수행하도록 하는 프로그램이 기록되어 있는 컴퓨터 판독가능 매체.
  39. 데이터가 손실되었거나 또는 손상된 데이터가 수신된 경우에 엔코딩된 정보의 형태로 수신되는 데이터로부터 디코딩되는 신호를 향상시키고,
    수신데이터(F(n))로부터 디코딩되는 일차 재구성 신호(yn)를 수신하기 위한 입력과 일자 재구성 주파수변환(Yn)을 제공하기 위한 출력을 가지는 제1변환기(101)와,
    상기 일차 재구성 주파수변환(Yn)을 수신하기 위한 입력과 이차 재구서 스펙트럼(Zn E)을 제공하기 위한 출력을 가지는 스펙트럼 정정 유닛(102)과,
    이차 재구성 스펙트럼(Zn E)을 수신하기 위한 입력과 이차 재구성 신호(zn E)를 제공하기 위한 출력을 가지는 이차변환기(103)를 가지는 에러은폐유닛에 있어서,
    스펙트럼 형상에 관해서 상기 이차 재구성 스펙트럼 신호(Zn E)가 상기 일차 재구성 신호(yn)를 기반으로 한 스펙트럼(Z'4)보다, 이전에 재구성된 신호(yn-1)의 스펙트럼(Z3)에서부터 덜 벗어나도록 상기 스펙트럼 정정유닛(102)이 일차 재구성 신호(yn)를 기반으로 이차 재구성 신호(Zn E)를 생성하는 것을 특징으로 하는 에러은폐유닛.
  40. 제39항에 있어서, 상기 이전에 재구성된 신호(z(t3)-z(t4))의 스펙트럼(Z3)은 이전에 수신한 비손상 데이터(F(3))로부터 생성되는 것을 특징으로 하는 에러은폐유닛.
  41. 수신 데이터로부터 엔코딩된 정보의 형태로 음향신호를 발생하고:
    출력을 통해 적어도 하나의 파라미터(p1)를 생성하는 일차 에러은폐유닛 (603)과,
    음성코덱 프레임(F)을 수신하기 위한 제1입력과, 상기 적어도 하나의 파라미터(p1)를 수신하기 위한 제2입력과 그리고 상기 적어도 하나의 파라미터(p1)에 응해 음향신호를 제공하기 위한 출력을 가지는 음성디코더(602)를 포함하는 디코더에 있어서,
    상기 디코더는 청구항 37에 따른 에러은폐유닛을 포함고, 일차 재구성 음성신호(yn)는 음성 디코더(602)에 의해 생성된 디코딩된 음성신호를 구성하고 또한 이차 재구성신호(zn E)는 향상된 음향신호를 구성하는 것을 특징으로 하는 디코더.
  42. 수신 데이터로부터 엔코딩된 정보의 형태로 음향신호를 발생하고:
    출력을 통해 적어도 하나의 파라미터(p2)를 생성하는 일차 에러은폐유닛 (703)과,
    음성코덱 파라미터(S)들을 수신하기 위한 제1입력과, 상기 적어도 하나의 파라미터(p2)를 수신하기 위한 제2입력과 그리고 상기 적어도 하나의 파라미터(p2)에 응해 여기신호(e)를 제공하기 위한 출력을 가지는 여기발생기(702)를 포함하는 디코더에 있어서,
    상기 디코더는 청구항 37에 따른 에러은폐유닛을 포함하고, 일차 재구성 신호(yn)는 여기발생기(702)에 의해 생성된 여기신호를 구성하고 그리고 이차 재구성 신호(zn E)는 향상된 여기신호를 구성하는 것을 특징으로 하는 디코더.
KR1020037004048A 2000-10-20 2001-09-07 인코드된 음향신호의 디코딩에 관한 에러 은폐 KR100882752B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP00850171.0 2000-10-20
EP00850171A EP1199709A1 (en) 2000-10-20 2000-10-20 Error Concealment in relation to decoding of encoded acoustic signals
PCT/SE2001/001921 WO2002033694A1 (en) 2000-10-20 2001-09-07 Error concealment in relation to decoding of encoded acoustic signals

Publications (2)

Publication Number Publication Date
KR20030046463A true KR20030046463A (ko) 2003-06-12
KR100882752B1 KR100882752B1 (ko) 2009-02-09

Family

ID=8175679

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037004048A KR100882752B1 (ko) 2000-10-20 2001-09-07 인코드된 음향신호의 디코딩에 관한 에러 은폐

Country Status (10)

Country Link
US (1) US6665637B2 (ko)
EP (2) EP1199709A1 (ko)
JP (1) JP5193413B2 (ko)
KR (1) KR100882752B1 (ko)
CN (1) CN1288621C (ko)
AT (1) ATE409939T1 (ko)
AU (2) AU8460801A (ko)
CA (1) CA2422790A1 (ko)
DE (1) DE60136000D1 (ko)
WO (1) WO2002033694A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7068851B1 (en) * 1999-12-10 2006-06-27 Ricoh Co., Ltd. Multiscale sharpening and smoothing with wavelets
US7013267B1 (en) * 2001-07-30 2006-03-14 Cisco Technology, Inc. Method and apparatus for reconstructing voice information
WO2003047115A1 (en) * 2001-11-30 2003-06-05 Telefonaktiebolaget Lm Ericsson (Publ) Method for replacing corrupted audio data
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
US7359979B2 (en) 2002-09-30 2008-04-15 Avaya Technology Corp. Packet prioritization and associated bandwidth and buffer management techniques for audio over IP
US20040073690A1 (en) 2002-09-30 2004-04-15 Neil Hepworth Voice over IP endpoint call admission
US7729267B2 (en) 2003-11-26 2010-06-01 Cisco Technology, Inc. Method and apparatus for analyzing a media path in a packet switched network
US7835916B2 (en) * 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
WO2005086138A1 (ja) * 2004-03-05 2005-09-15 Matsushita Electric Industrial Co., Ltd. エラー隠蔽装置およびエラー隠蔽方法
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
ATE352138T1 (de) * 2004-05-28 2007-02-15 Cit Alcatel Anpassungsverfahren für ein mehrraten-sprach- codec
US7978827B1 (en) 2004-06-30 2011-07-12 Avaya Inc. Automatic configuration of call handling based on end-user needs and characteristics
CN101010730B (zh) * 2004-09-06 2011-07-27 松下电器产业株式会社 可扩展解码装置以及信号丢失补偿方法
EP1638337A1 (en) 2004-09-16 2006-03-22 STMicroelectronics S.r.l. Method and system for multiple description coding and computer program product therefor
US9197857B2 (en) 2004-09-24 2015-11-24 Cisco Technology, Inc. IP-based stream splicing with content-specific splice points
US8966551B2 (en) 2007-11-01 2015-02-24 Cisco Technology, Inc. Locating points of interest using references to media frames within a packet flow
KR100612889B1 (ko) * 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
WO2006098274A1 (ja) * 2005-03-14 2006-09-21 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル復号化方法
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
WO2007000988A1 (ja) * 2005-06-29 2007-01-04 Matsushita Electric Industrial Co., Ltd. スケーラブル復号装置および消失データ補間方法
WO2008022184A2 (en) * 2006-08-15 2008-02-21 Broadcom Corporation Constrained and controlled decoding after packet loss
JP5123516B2 (ja) * 2006-10-30 2013-01-23 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法及び符号化方法
US7738383B2 (en) * 2006-12-21 2010-06-15 Cisco Technology, Inc. Traceroute using address request messages
US7706278B2 (en) * 2007-01-24 2010-04-27 Cisco Technology, Inc. Triggering flow analysis at intermediary devices
BRPI0808200A8 (pt) * 2007-03-02 2017-09-12 Panasonic Corp Dispositivo de codificação de áudio e dispositivo de decodificação de áudio
US7936695B2 (en) 2007-05-14 2011-05-03 Cisco Technology, Inc. Tunneling reports for real-time internet protocol media streams
US8023419B2 (en) 2007-05-14 2011-09-20 Cisco Technology, Inc. Remote monitoring of real-time internet protocol media streams
EP2112653A4 (en) * 2007-05-24 2013-09-11 Panasonic Corp AUDIO DEODICATION DEVICE, AUDIO CODING METHOD, PROGRAM AND INTEGRATED CIRCUIT
US7835406B2 (en) * 2007-06-18 2010-11-16 Cisco Technology, Inc. Surrogate stream for monitoring realtime media
US7817546B2 (en) 2007-07-06 2010-10-19 Cisco Technology, Inc. Quasi RTP metrics for non-RTP media flows
CN100550712C (zh) * 2007-11-05 2009-10-14 华为技术有限公司 一种信号处理方法和处理装置
CN101207665B (zh) 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法
US8892228B2 (en) * 2008-06-10 2014-11-18 Dolby Laboratories Licensing Corporation Concealing audio artifacts
US8218751B2 (en) * 2008-09-29 2012-07-10 Avaya Inc. Method and apparatus for identifying and eliminating the source of background noise in multi-party teleconferences
US8301982B2 (en) 2009-11-18 2012-10-30 Cisco Technology, Inc. RTP-based loss recovery and quality monitoring for non-IP and raw-IP MPEG transport flows
KR101761629B1 (ko) 2009-11-24 2017-07-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8819714B2 (en) 2010-05-19 2014-08-26 Cisco Technology, Inc. Ratings and quality measurements for digital broadcast viewers
US8774010B2 (en) 2010-11-02 2014-07-08 Cisco Technology, Inc. System and method for providing proactive fault monitoring in a network environment
US8559341B2 (en) 2010-11-08 2013-10-15 Cisco Technology, Inc. System and method for providing a loop free topology in a network environment
EP2458585B1 (en) * 2010-11-29 2013-07-17 Nxp B.V. Error concealment for sub-band coded audio signals
CN102610231B (zh) * 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置
US8982733B2 (en) 2011-03-04 2015-03-17 Cisco Technology, Inc. System and method for managing topology changes in a network environment
US8670326B1 (en) 2011-03-31 2014-03-11 Cisco Technology, Inc. System and method for probing multiple paths in a network environment
US8724517B1 (en) 2011-06-02 2014-05-13 Cisco Technology, Inc. System and method for managing network traffic disruption
US8830875B1 (en) 2011-06-15 2014-09-09 Cisco Technology, Inc. System and method for providing a loop free topology in a network environment
US9450846B1 (en) 2012-10-17 2016-09-20 Cisco Technology, Inc. System and method for tracking packets in a network environment
ES2597829T3 (es) * 2013-02-05 2017-01-23 Telefonaktiebolaget Lm Ericsson (Publ) Ocultación de pérdida de trama de audio
KR101987894B1 (ko) * 2013-02-12 2019-06-11 삼성전자주식회사 보코더 잡음 억제 방법 및 장치
KR101475894B1 (ko) * 2013-06-21 2014-12-23 서울대학교산학협력단 장애 음성 개선 방법 및 장치
ES2635027T3 (es) 2013-06-21 2017-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para el desvanecimiento de señales mejorado para sistemas de codificación de audio cambiados durante el ocultamiento de errores
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
CN104751849B (zh) * 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
JP6472600B2 (ja) * 2014-03-18 2019-02-20 株式会社アストロスケール 宇宙用装置、デブリ除去システム及びデブリ除去方法
CN104934035B (zh) 2014-03-21 2017-09-26 华为技术有限公司 语音频码流的解码方法及装置
NO2780522T3 (ko) 2014-05-15 2018-06-09
WO2020164751A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
CN111009257B (zh) * 2019-12-17 2022-12-27 北京小米智能科技有限公司 一种音频信号处理方法、装置、终端及存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8400728A (nl) * 1984-03-07 1985-10-01 Philips Nv Digitale spraakcoder met basisband residucodering.
US5630011A (en) * 1990-12-05 1997-05-13 Digital Voice Systems, Inc. Quantization of harmonic amplitudes representing speech
JP3459417B2 (ja) * 1991-05-29 2003-10-20 パシフィック、マイクロソニックス、インコーポレーテッド 符号化する方法およびシステム、復号化し変換する方法およびシステム
SE503547C2 (sv) 1993-06-11 1996-07-01 Ericsson Telefon Ab L M Anordning och förfarande för döljande av förlorade ramar
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
CA2142391C (en) * 1994-03-14 2001-05-29 Juin-Hwey Chen Computational complexity reduction during frame erasure or packet loss
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
US6041297A (en) * 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
FR2762464B1 (fr) * 1997-04-16 1999-06-25 France Telecom Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere"
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
FR2774827B1 (fr) * 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
DE19921122C1 (de) * 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치

Also Published As

Publication number Publication date
AU8460801A (en) 2002-04-29
AU2001284608B2 (en) 2007-07-05
US6665637B2 (en) 2003-12-16
WO2002033694A1 (en) 2002-04-25
US20020072901A1 (en) 2002-06-13
CN1288621C (zh) 2006-12-06
EP1199709A1 (en) 2002-04-24
EP1327242A1 (en) 2003-07-16
CA2422790A1 (en) 2002-04-25
EP1327242B1 (en) 2008-10-01
JP2004512561A (ja) 2004-04-22
ATE409939T1 (de) 2008-10-15
JP5193413B2 (ja) 2013-05-08
CN1470049A (zh) 2004-01-21
KR100882752B1 (ko) 2009-02-09
DE60136000D1 (de) 2008-11-13

Similar Documents

Publication Publication Date Title
KR100882752B1 (ko) 인코드된 음향신호의 디코딩에 관한 에러 은폐
AU2001284608A1 (en) Error concealment in relation to decoding of encoded acoustic signals
US9111532B2 (en) Methods and systems for perceptual spectral decoding
CA2169822C (en) Synthesis of speech using regenerated phase information
US7386445B2 (en) Compensation of transient effects in transform coding
CN113544773B (zh) 用于lc3隐藏的解码器和解码方法
JP5222452B2 (ja) 音響信号の符号化の知覚的改善
EP3217398B1 (en) Advanced quantizer
AU2001284606A1 (en) Perceptually improved encoding of acoustic signals
KR20100084632A (ko) 복잡성 분배를 이용하는 디지털 신호에서의 전송 에러 위장
JP2005148539A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130124

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140124

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150126

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160122

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170125

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180125

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190123

Year of fee payment: 11