KR20010006091A - 전송에러보정을 갖는 오디오신호 디코딩방법 - Google Patents

전송에러보정을 갖는 오디오신호 디코딩방법 Download PDF

Info

Publication number
KR20010006091A
KR20010006091A KR1019997009169A KR19997009169A KR20010006091A KR 20010006091 A KR20010006091 A KR 20010006091A KR 1019997009169 A KR1019997009169 A KR 1019997009169A KR 19997009169 A KR19997009169 A KR 19997009169A KR 20010006091 A KR20010006091 A KR 20010006091A
Authority
KR
South Korea
Prior art keywords
frame
audio signal
filter
estimated
synthesis filter
Prior art date
Application number
KR1019997009169A
Other languages
English (en)
Other versions
KR100395458B1 (ko
Inventor
프루스트스테판
Original Assignee
아니싸 헤셍-베이
프랑스 텔레콤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아니싸 헤셍-베이, 프랑스 텔레콤 filed Critical 아니싸 헤셍-베이
Publication of KR20010006091A publication Critical patent/KR20010006091A/ko
Application granted granted Critical
Publication of KR100395458B1 publication Critical patent/KR100395458B1/ko

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/14Digital recording or reproducing using self-clocking codes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

일련의 프레임으로 코딩된 오디오 신호가 가능한 소거 프레임을 신호하는 데이타 (BFI)와 함께 수신되되는 2진 스트림 (F)으로 표시된다. 각 프레임에 대해, 본 방법은 이진 스트림 (유효 프레임 ) 또는 그렇지 않은 경우 (소거 프레임 )에서 복구된 여기 파라메터 (EX(n))를 근거로 형성된 여진 신호 (Ek(n))를 필터링하고 디코딩된 신호 (Σn(t))를 얻기 위하여 합성 필터 (22)를 이용하는 것으로 이루어진다. 디코딩된 신호의 라인예측은 현재의 프레임에 관한 합성 필터를 추정하기 위해 이전 프레임까지 수행된다. 프레임이 소거되지 않는한 이용되는 이 합성필터는 추정된 합성필터들과 부합된다. 만일 한 프레임 n0가 소거되면, 후속 프레임 n0+ i 에 대해 사용된 합성 필터는 n0+ i 에 관한 추정된 필터와 프레임 n0이후로 이용된 적어도 하나의 합성필터와의 가중결합에 의해 결정된다.

Description

전송에러보정을 갖는 오디오신호 디코딩방법{METHOD FOR DECODING AN AUDIO SIGNAL WITH TRANSMISSION ERROR CORRECTION}
본 발명은 오디오신호의 디지탈 코딩분야에 관한 것이다. 보다 구체적으로, 본 발명은 "역방향 LPC" 합성 필터를 채용하는 방법을 이용하여 코딩된 오디오 신호를 재구성하는데 사용되는 디코딩 방법에 관한 것이다.
예측 블럭 코딩 시스템은 각 프레임에 대한 다수의 파라메터들을 추출하기위하여 코딩될 오디오신호 (일반적으로, 음성 또는 음악)샘플들의 일련의 프레임들을 분석한다. 이들 파라메터들은 통신채널을 통해 전송된 비트 스트림을 형성하도록 양자화된다.
채널량 및 전송포트의 종류에 따라, 전송 신호가 간섭을 받아 디코더에 의해 수신되는 비트스트림에서 에러가 야기될 수 있다. 비트스트림에서의 이들 에러는 분리될 수 있다. 그러나, 이들 에러는 높은 레벨의 간섭을 갖는 이동 무선채널 및 패킷 포드 전송 네트워크에서 특히 집중적으로 빈번하게 발생한다. 이 경우에, 하나 이상의 신호 프레임들에 대응하는 전체 패킷 비트에 에러가 발생하거나 또는 수신되지 않는다.
이용되는 전송 시스템은 디코더 수준에서 에러가 있거나 또는 실종된 프레임을 빈번히 검출할 수 있다. 이른바, 실종된 프레임의 복구" 절차들이 이용된다. 이들 절차는 디코더로 하여금 프레임이 실종된 영역 이전 및 가능하게는 이후의 프레임들에서 복구된 샘플들로 부터 상기 실종된 신호 샘플들을 외삽법을 통해 추정할 수 있게 한다.
본 발명은 실종 프레임의 존재시 디코더에서 인지된 신호의 저하를 크게 제한하는 방식으로 실종 프레임을 복구하는 기법을 향상시키는데 목적을 두고 있다. 본 발명은 일반적으로 "역방향 LPC"로 알려진 기법을 연속적으로 또는 간헐적으로 상용하는 예상되는 코더들의 경우에 보다 특별한 장점을 나타낸다. 약자 "LPC"는 선형 예측 코딩 (linear predictive coding)"을 표시하고, "역방향(backward)" 는 현재의 프레임에 선행하는 신호들에 대해 분석이 표시한다. 이 기법은 특히 일반적으로는 전송에러에 그리고 특별하게는 실종 프레임에 예민하다.
가장 광범위하게 이용되는 선형 예측 코딩 시스템은 CELP (Code-Exited Linear Predictive) 코더이다. CELP 코더에서의 역방향 LPC 분석은 ITU-T (ITU-T 권고 G. 728 참조) 에 의해 채택된 LD-CELP 코더에서 처음으로 사용되었다. 이 코더는 인지된 양을 저하시킴이 없이 비트율을 64 kbit/s 로부터 16 kbit/s 로 감소시킬 수 있다.
역방향 LPC 분석은 원래의 오디오 신호의 현재 프레임에서 보다는 합성된 신호에서 LPC 분석을 수행하도록 구성된다. 실제로, 이 분석은 현재의 프레임 이전의 프레임으로 부터 합성된 신호의 샘플들에 대해 수행되는데, 그 이유는 이 신호가 (합성에 의한 분석 코더들에서 일반적으로 유용한 국부 디코딩에 의하여) 상기 코더와 원격 디코더 모두에서 이용가능하기 때문이다. 이 분석이 코더와 디코더에서 수행되기 때문에, 얻어지는 LPC 계수들이 전송될 필요가 없다.
선형 예측이 상기 코더의 입력에서 상기 신호에 인가되는 통상적인 "순방향(forward)" LPC 분석과 비교하여, 역방향 LPC 분석은 보다 높은 비트율을 제공하므로 예컨데 CELP의 경우에 여기 사전 (excitation dictionaries)을 향상시키는데 이용될 수 있다. 또한, 비트율을 증대시킴이 없이도, 분석의 정도를 크게 증대시킬수 있는바, LPC 합성 필터는 순방향 LPC 분석을 이용하는 대부분의 코더들에 대해 10개의 계수를 갖는것과 비교하여 LD-CELP 코더에 대해 50개의 계수를 전형적으로 갖는다.
LPC 필터의 보다 높은 정도 때문에, 역방향 LPC 분석은 음악신호에 대한 보다 뛰어난 모델링을 제공하는바, 이 음악신호의 스펙트럼은 음성 신호의 스펨트럼보다 훨씬 풍부하다. 이 기법이 음악 신호들을 코딩하는데 적합한가의 또다른 이유는 음악신호들은 일반적으로 음성 신호들보다 보다 정적인 스펙트럼을 많이 가져, 역방향 LPC 분석의 수행을 향상시키기 때문이다. 다른 한편으로, 역방향 LPC 분석의 정확한 기능들은 다음을 요구한다.
(1) 원래의 신호에 가장 밀접해야되는 최적의 품질의 합성신호이어야 한다. 이는 비교적 높은 고팅 비트율을 부과한다. 현재의 CELP 코더들의 품질을 고려해볼때, 13kibt/s는 낮은한계치인것으로 보인다.
(2) 짧은 프레임 또는 충분히 정적인 신호이어야 한다. 분석된 신호와 코딩될 신호와의 사이에는 1 프레임의 지연이 있다. 그러므로, 이 프레임 길이는 그 신호가 정적상태가 되는 평균시간과 비교하여 짧아져야 한다.
(3) 코더와 디코더 사이에 전송에러가 없어야 한다. 합성된 신호들이 서로 상이한 한 코더와 디코더는 동일한 필터를 계산하지 못한다. 따라서, 어떤 새로운 간섭의 부재시에도 큰 다이버전스가 야기되어 증폭된다.
역방향 LPC 분석 코더/디코더들의 전송에러 민감성은 주로 다음의 순환 현상에 의해 발생된다. 즉, 코더 (지역 코더)에서 발생되는 합성신호와 그리고 실종 프레임 복구 장치에 의해 디코더에서 재구성되는 합성신호 사이의 차가 다음 프레임동안 디코더에서 계산된 역방향 LPC 필터와 코더에서 계산된 역방향 LPC 필터 사이의 차이를 야기하는바, 이는 이들 필터들이 서로다른 신호에 근거하여 계산되기 때문이다. 이들 필터들은 또한 다음 프레임의 합성신호를 발생하는데 이용되며, 그러므로 코더와 디코더에서 차이가 발생된다. 따라서, 이 현상은 그 크기가 점점 증대되어 코더와 디코더가 크게 및 변경할수 없게 발산되게 한다. 역방향 LPC 필터는 일반적으로 높은 수준 (30 내지 50 개의 계수를 가짐)으로 되어 있으므로 합성된 신호의 스펙트럼 (높은 예측 이득)에 큰 기여를 제공한다.
많은 코딩 알고리즘들은 실종 프레임 복구 기법을 이용한다. 디코더는 하나 또는 다른 수단 (예컨데, 이동 무선 시스템에서 전송에러들을 검출하고 그리고 이들중 일부를 보정할 수있는 채널 디코더 로부터의 프레임 손실 정보를 수신하므로써)에 의해 실종 프레임을 통보 받는다. 실종 프레임 복구 장치의 목적은 유효해 보이는 가장 최근의 이전 프레임들중 하나 이상의 프레임들로부터 실조 프레임의 샘플을 보간하는 것이다. 일부 시스템들은 이전에 디코딩된 신호들로부터 직접 샘플을 취하는 파형 대체 기법을 이용하여 이들 샘플들을 외삽한다 (1986년 12월 IEEE Trans. On ASSP, Vol. ASSP-34, No.6 에 게재된 저자 D.J. Goodman 등의 "Waveform Substitution Techniques for Recovering Missing Speech Segments in Packet Voice Communications"). 예컨데, CELP 타입의 예측 코더들의 경우에, 실종 프레임들의 샘플들은 유효 프레임들을 합성하는데 이용되는 합성 모델을 이용하여 대체된다. 이와같은 실종 프레임 복구 절차는 실종 프레임들에 대해 유용하지 않은 합성에 필요한 파라메터들을 공급해야 한다 (예컨데, ITU-T 권고사항 G.723.1 및 G. 729 참조). 예측 코더들에 의해 처리 또는 코딩된 일부 파라메터들은 프레임들사이에 높은 상관관계를 나타낸다. 이들은 특히 음성 사운드에 대해서 LPC 파라메터 및 긴 항의 예측 파라메터 (LTP 지연 및 관련 이득)에 적용된다. 이들 상관관계 때문에, 에러가 있거나 또는 무작위 파라메터들을 이용하는 것보다는 마지막 유효 프레임의 파라메터들을 다시 이용하여 실종 프레임을 합성하는것이 보다 장점이 있다.
CELP 코딩 알고리즘의 경우에, 실종 프레임의 파라메터는 통상적으로 다음 방식으로 얻어진다.
- LPC 필터는 단지 파라메터들을 복사하거나 또는 일부 댐핑을 도입하므로써 마지막 유효 프레임의 LPC 파라메터들로 부터 얻어진다.
- 음성/비음성 검출은 실종 프레임의 레벨에 있는 신호의 조화 내용을 결정한다 ( ITU-T 권고사항 G.723.1 참조)
- 비음성 검출의 경우에, 여진 신호는 부분적인 무작위 방식 예컨데, 무작위로 코드 워드를 작성하고 그리고 약간 댐핑된 이전의 여진이득을 사용하거나 (ITU-T 권고사항 G. 729) 또는 이전의 여진에서 무작위 선택을 사용 (ITU-T 권고사항 G. 728 참조)함으로써 발생된다.
- 음성 신호의 경우에, LTP 지연은 일반적으로 과도하게 지연된 공진 사운드를 방지하기위해 약간의 "지터(jitter)"로 이전 프레임에서 계산된 것이다. 상기 여진 신호는 일반적으로 이전의 여진에 근거하여 긴 항의 예측으로 제한된다.
순방향 분석을 이용하는 코딩 시스템의 경우에, LPC 필터의 파라메터들은 이전 프레임의 파라메터들로부터 간단한 방식으로 외삽되는바, 제1 실종 프레임에 대해 이용되는 LPC 필터는 (약간 평평하게된 스펙트럼의 윤곽 및 감소된 예측이득으로) 약간 댐핑된 이전 프레임의 필터가 된다. 이 댐핑은 한 스펙트럴 확장 계수를 필터의 계수들에 적용하거나 또는 만일 이들 계수들이 LSP (라인 스펙트럼 쌍)으로 나타내지는 경우 상기 라인 스펙트럼 쌍의 최소 분리를 (ITU-T 권고사항 G.723.1 참조) 부과함으로써 얻어질수 있다. 역방향 LPC 분석을 이용하는 ITU-T 권고사항 G.728의 코더의 경우에 스펙트럴 확장 기법이 제안되는바, 제1 실종 프레임의 경우에, 먼저 이전의 (유효) 합성 신호를 근거로 LPC 파라메터 세트가 계산된다. 0.97의 확장인자가 이 필터에 적용되고, 이 인자는 각각의 새로운 실종 프레임에 대해 0.97로 반복 승산된다. 그 프레임이 실종된 경우에만 상기 기법이 활용되는 것임을 주목해보자. 실종되지 않은 제1의 다음 프레임에서, 디코더에 의해 사용되는 LPC 파라메터들은 정상적으로 즉, 합성 신호들을 토대로 계산되는 파라메터들이다.
순방향 LPC 분석의 경우에, 예측에서 사용되는 LPC 필터들을 양자화하는 경우 (이 경우에, 예측, 즉 MA 타입 예측에서의 누설 인자들을 이용하여 특정 수의 유효 프레임을 재 동기화하는 메카니즘이 제공된다)를 제외하고는 LPC 필터들이 관계하는 곳에서는 메모리 에러 현상이 나타나지 않는다.
역방향 분석의 경우에, 실종 섹션을 뒤따르는 유효 프레임의 LPC 필터들을 발생하기 위하여 디코더에서 사용되는 잘못 합성된 신호에 의해 에러가 발생된다. 그러므로, 실종 프레임에 대해 생성되는 합성 신호를 개선 ( 여진 신호 및 이득의 외삽)하는 것은 이후의 LPC 필터들 (이전의 합성 신호에 근거하여 계산됨 )이 코더들에서 계산된 필터들과 매우 밀접하게되도록 보장하기위한 하나의 방법이 된다.
상기 언급한 조건 (1) 내지 (3)은 순수한 역방향 분석의 제한이 165kbit보다 훨씬 작은 비트 비율로 빠르게 나타남을 보여준다. LPC 필터의 성능을 저하시키는 합성신호의 감소된 품질과는 별개로, 비트비율을 감소시키기 위해 보다 큰 프레임 길이 (10 내지 30 ms)를 받아드리는 것이 필요하다.
역방향 분석의 장점, 특히 음악신호를 코딩하는데 있어 양호한 성능을 비트비율의 감소와 함께 결합지탱하기 위해서, 하이브리드 "순방향/역방향" LPC 분석 코딩 시스템이 개발되었다(S. Proust 등이 저자인 "Dual Rate Low Delsy CELP Coding(8kbits/s 16kbits/s) using a Mixed Backward / Forward Adaptive LPC Prediction"와, Proc. of the IEEE Workshop on speech coding for Telecommunications, 페이지 37-38, 1995년 9월호 및 프랑스 특허출원번호 97 04684 참조).
두타입의 LPC 분석을 결합함으로써 두 기법의 장점을 얻을 수 있다: 순방향 LPC 분석은 천이 및 비정지 영역을 코딩하는데 이용되고, 보다 높은 순위의 역방향 LPC 분석은 정지 영역을 코딩하는데 이용된다.
순방향 코딩된 프레임을 역방향 코딩된 프레임에 도입함으로써 또한 전송에러의 경우에 코더 및 디코더를 커버할 수 있으며, 그러므로, 순수한 역방향 코딩보다 더 많은 로버스트나스(robustness)를 그러한 에러에 제공한다. 그러나, 훨씬 더 큰 비율의 정지 신호들이 역방향 모드에서 코딩되며, 이 경우 전송에러의 문제들이 여전히 중요한 사항이 된다.
이들 하이브리드 순방향/역방향 시스템은 예컨대 제한되거나 또는 분배된 자원을 갖는 네트워크상에서 멀티미디어 응용을 위해 의도되거나 또는 향상된 품질의 이동 무선통신을 위해 의도된다. 이와 같은 타입의 응용에서, 패킷 비트들의 손실 가능성이 높으며, 이는 역방향 LPC 분석과 같은 그러한 실종 프레임에 민감한 기법에서 프라이어리 페널티(priori penalty)를 나타낸다. 역방향 LPC 분석 또는 하이브리드 순방향/역방향 LPC 분석을 이용하는 시스템에서 실종 프레임의 영향을 크게 줄임으로써, 본 발명은 이와 같은 타입의 응용에 특히 적합하다.
순방향 LPC 분석 및 역방향 LPC 분석 모두를 이용하는 또다른 타입의 오디오 코딩 시스템이 있다. 합성필터는 특히 순방향 LPC 필터와 역방향 LPC 필터의 조합(임펄스 응답의 컨벌루션)으로 될 수 있다(유럽공개특허번호 EP-A-0 782 128 참조). 순방향 LPC 필터의 계수들은 코더에 의해 계산되어 양자형태로 전송된다. 역방향 LPC 필터의 계수들은 순방향 LPC 필터의 역인 필터에 합성신호를 인가한 후 상기 설명한 바와 같이 수행되는 역방향 LPC 분석 프로세스를 이용하여 코더와 디코더에서 공동으로 결정된다.
본 발명의 목적은 전송 태널의 불량 또는 패킷전송시스템에서 패킷이 잃어버리거나 수신되지 않음으로 해서 하나 이상의 프레임이 실종되었을 때 역방향 LPC 분석 또는 하이브리드 순방향/역방향 LPC 분석을 이용하는 예측 블럭 코딩시스템에서 디코더에 의해 생성되는 음성신호의 품질을 향상시키는 것이다.
그러므로, 본 발명은 역방향 LPC 분석을 연속적으로 이용하는 시스템의 경우에, 일련의 프레임에 의해 코딩된 오디오 신호를 나타내는 비트스트림을 디코딩하는 방법을 제안하는 바, 이 비트스트림은 어떤 실종 프레임을 표시하는 플래그와 함께 수신되며, 여기서 각 프레임에 대해 프레임이 유효하면 비트 스트림으로 복구되고 그리고 프레임이 실종되었으면 추정된 어떤 다른 방식으로 복구되는 여진 파라메터들로 부터 형성되며 상기 여진 신호는 입력 필터를 통해 필터링되어, 디코딩된 오디오 신호가 얻어지게 된다.
여기서, 현재의 프레임에 관한 합성 필터를 적어도 부분적으로 추정하기 위해 이전의 프레임까지 얻어진 디코딩된 신호를 근거로하여 선형 예측 분석이 수행되며, 일련의 합성 필터들이 상기 추정된 합성필터들에 부합되는 실종 프레임이 없는 한 여진 신호들을 필터링하는데 이용된다.
그리고 여기서, 만일 프레임 no이 실종되었으면, 후속 프레임 no+1 에 관한 여진 신호를 필터링하는데 이용되는 적어도 하나의 필터가 프레임 no+1과 관계하여 추전된 합성 필터와 프레임 no이래로 사용된 적어도 하나의 합성 필터와의 가중된 결합으로 결정된다.
하나 이상의 실종 프레임후 프레임 수에 대해, 이전의 합성된 신호들을 토대로 디코더에 의해 추정된 역방향 LPC 필터들은 실제로 상기 합성된 신호를 재구성하기 위해 이용하는 것이 아니다. 후자를 합성하기 위해, 디코더는 이 방법에 의해 추정되는 역방향 필터에 따라 LPC 필터를 사용하며, 또한 필터들은 최종 필터가 유효 합성신호를 토대로 계산되기 때문에 하나 이상의 이전 프레임을 합성하는데 사용된다. 이는 실종 프레임을 뒤따르는 LPC 필터들에 적용된 가중된 결합에 의해 얻어지는 바, 이는 완만한 동작을 수행함과 아울러 정지 스펙트럼을 어느 정도로 강압한다. 이 결합은 전송되는 마지막 유효 프레임까지의 거리에 따라 변화할 수 있다. 실종 프레임후 합성을 위해 이용되는 LPC 필터들의 트래젝토리를 완만하게 하는 효과는 분산의 현상을 크게 제한하는 것이며, 그럼으로써, 디코딩된 신호의 품질을 크게 향상시킬 수 있다.
역방향 LPC 분석의 전송 에러 민감성은 전술한 바와 같이 주로 다이버젼스 현상 때문이다. 주된 저하 요인은 원격 디코더에서 계산된 필터들 및 로컬 디코더에서 계산된 필터들의 점진적인 분산인바, 이 분산은 합성 신호에서 돌발적인 왜곡을 일으킬 수 있다. 그러므로, 두개의 계산된 필터들 사이에서의 차(스펙트럴 거리면에서)를 최소화하고 그리고 실종 프레임을 뒤따르는 에러가 없는 프레임의 수가 증가할때(코딩 시스템의 재컨버젼스 성분) 상기 차가 제로로 되도록 하는 것이 중요하다. 일반적으로 높은 수준으로 된 역방향 필터는 합성 신호의 스펙트럼에 영향을 준다. 본 발명이 꾀하는 필터들의 컨버젼스는 합성 신호들의 컨버젼스를 보장한다. 이는 실종 프레임의 종래시 합성신호의 품질을 향상시켜 준다.
만일 실종 프레임 no를 뒤따르는 프레임 no+1 이 또는 실종된 경우, 프레임 no+1에 관한 여진 신호를 필터링하는데 이용되는 합성 필터는 프레임 no에 관한 여진 신호를 필터링하는데 이용되는 합성필터로 부터 바람직하게 결정된다. 이들 두개의 필터는 동일할 수 있다. 두번째는 전술한 바와 같이 스펙트럴 확장계수를 인가함으로써 동일하게 결정될 수 있다.
본 발명의 바람직한 실시예에서, 상기 가중된 결합에 사용되는 가중계수는 프레임 no+1 가 마지막 실종 프레임 no사이에서 프레임의 수 i 에 따라 변하여, 점진적으로 사용되는 합성필터가 추정된 합성필터에 가깝게 된다.
특히, 프레임 n에 관한 여진 신호를 필터링 하는데 이용되는 각각의 합성필터는 k 파라메터 Pk(n)(1≤k≤k)와 그리고 프레임 no+i 에 관한 여기 신호를 필터링하는데 사용되는 합성 필터의 파라메터 Pk(no+i)로 표시되며, 실종 프레임 no만큼 선행되는 다음의 i-1 유효프레임(i≥1)은 다음식으로 계산된다.
Pk(no+i)=[1-α(i)]ㆍPk(no+i)+α(i)ㆍPk(no) 여기서, Pk(no+i)는 프레임 no+i와 관계하여 추정되는 합성 필터의 Kth파라메터이며, αmax로 부터 i로 감소하는 양(+) 또는 제로 가중계수이다.
계수 α(i)에서의 감소는 실종 프레임을 뒤따르는 제 1 유효 프레임에서, 프레임no에 대해 이용되는 것에 비교적 가까운 합성필터를 제공하는데, 이는 일반적으로 양호한 조건하에서 결정되며 이 필터의 메모리가 프레임 no+1 에 대해 추정된 필터쪽으로 움직이도록 프레임 no에서 점진적으로 상실되게 한다.
파라메터 Pk(n) 는 합성필터, 즉 그것의 임펄스 음답의 계수가 될 수 있다. 파라메터 Pk(n)는 선형 예측 코더들에서 통상적으로 사용되는 것들 즉, 반사계수, LARC(로그영역 비율), PARCOR(부분 상관), LSP(라인 스펙트럼쌍) 등과 같은 계수들의 다른 표현과 동등하게 될 수 있다.
i) 1에 대해 계수 α(i)는 다음식으로 부터 계산될 수 있다.
α(i)= max{0, α(i-1)-β}--- (2)
여기서 β는 범위 0 내지 1 에서 계수이다.
본 발명의 바람직한 실시예에서, 가중 결합에 활용되는 가중 계수는 오디오신호의 스펙트럼이 정지되는 정도의 추정치(Istat(n))에 따라 변하며, 약한 정지 신호의 경우에 실종 프레임 no를 뒤따르는 프레임 no+i 에 관한 여진신호를 필터링하는데 사용되는 합성 필터는 큰 정지신호의 경우에서 보다 추정 합성필터에 더 가깝다.
역방향 LPC 필터의 슬레이빙 및 결과적인 정지 스펙트럼은 측정된 실질적인 평균 정지 신호 스펙트럼의 함수로서 채택된다. 완만함(그러므로 정지 스펙트럼)은 만일 신호가 매우 정적이고 그리고 반대의 경우에 감소되면 매우 커진다. 매우 정적인 스펙트럼의 경우에, 연속적인 역방향 필터들은 매우 작아진다. 그러므로, 일련의 필터들이 크게 슬레이브 될 수 있다. 이는 다이버젼스의 위험을 제한하며 요구되는 정지 스펙트럼을 보장한다.
오디오 신호의 스펙트럼이 정지되는 정도는 비트스트림의 각 유효 프레임에 포함된 정보로 부터 추정될 수 있다. 일부 시스템에서, 이러한 타입의 정보는 전송하는 비트율을 설정하기 위한, 디코더가 코드 신호의 스펙트럼이 어떻게 정지되는가를 결정할 수 있게 하는 옵션이 있다.
이에 대한 대안으로서, 오디오 신호의 스펙트럼이 정지하는 정도가 여진신호를 필터링하기 위해 디코더에 의해 사용되는 일련의 합성 필터들의 비교 분석으로 부터 추정될 수 있다. 디코더에 의해 사용되는 일련의 역방향 LPC 필터들 사이에서 스펙트럴 거리를 (예컨대, 이타구라 거리)를 측정하는 여러가지 방법으로 측정될 수 있다.
신호의 스펙트럼이 정지하는 정도는 상기 식(1)을 이용하는 합성 필터의 파라메터들을 계산하는데 이용될 수 있다. i〉1 에서 α(i)의 가중 계수는 오디오 신호의 스펙트럼이 정지하는 추정된 정도의 기능을 증가시킨다. 그러므로, 디코더에 의해 사용되는 신호는 아주 정적이지 않을때보다 스펙트럼이 아주 정정일때가 보다 높을때 추정된 필터에 보다 느리게 접근한다.
특히, α(i)가 식(2)로 부터 계산될 때, 계수 β는 오디오 신호의 스펙트럼이 정지하는 추정정도의 감소하는 함수가 된다.
전술한 바와 같이, 본 발명의 방법은 단지 역방향 LPC 분석을 이용하는 시스템에 적용될 수 있는 바, 이 경우 합성필터는 1/AB(Z)의 전달함수를 가지며, AB(Z)는 Z-1에서의 폴리노미널이며 이것의 계수는 디코딩된 오디오 신호의 선형예측분석으로부터 디코더에 의해 얻어진다.
본 발명은 또한 EP-A-0 782 128에 기술된 바와 같은 방식으로 순방향 및 역방향 LPC 필터들의 컨벌루션과 함께 역방향 LPC 분석이 순방향 LPC 분석과 결합되는 시스템에도 적용될 수 있다. 이 경우에, 합성필터는 1/[AF(Z)ㆍAB(Z)]의 전달함수를 가지며, AF(Z) 및 AB(Z)는 Z-1의 다항식이며, 다항식 AF(Z)의 계수는 비트스트림의 유효 프레임에 포함된 파라메터들로부터 얻어지고 다항식 AB(Z)는 전달함수 AF(Z)를 갖는 필터를 이용하여 디코딩 오디오 신호를 필터링함으로써 얻어진 신호에 적용되는 선형예측분석으로부터 디코더에 의해 얻어진다.
하이드브리드 순방향/역방향 LPC 분석 코딩 시스템의 콘텍스트에서, 본 발명은 일련의 프레임에 의해 코딩된 오디오 신호를 표시하는 비트 스트림을 디코딩하는 방법을 제안하는 바, 이 비트스트림은 어떤 실종 프레임을 표시하는 프래그와 함께 수신되며, 비트스트림의 각 유효 프레임은 코딩모드가 프레임에 관한 오디오 신호를 코딩하기 위해 적용 되었음을 나타내는 표시를 포함하는 바, 이것은 프레임이 스펙트럴 파라메터를 포함하는 제 1 코딩 모드 또는 제 2 코딩 모드가 된다.
여기서, 각 프레임에 대해, 여진 신호는 만일 프레임이 유효한 경우 비트스트림으로 그리고 만일 프레임이 실종된 경우 추정된 일부 다른 방식으로 복귀되는 여진 파라메터들로 부터 형성되며, 이 여진신호는 디코딩된 오디오 신호를 얻기 위해 합성 필터에 의해 필터링된다.
여진 신호를 필터링하는데 이용되는 합성필터는 만일 비트스트림이 제 1 코딩 모드를 표시하는 경우 상기 스펙트럴 파라메터로 부터 구성된다.
여기서, 선형예측분석은 현재 프레임과 관계하는 합성 필터를 적어도 부분적으로 추정하기 위한 이전 프레임과 관계 하여 얻어지는 디코딩된 오디오 신호에 근거하여 수행되며, 프레임 실종이 없고 그리고 비트 스트림이 제 2 코딩 모드를 표시하는 경우, 여진 신호를 필터링 하는데 사용되는 일련의 합성 필터들이 추정된 합성 필터들과 합치된다.
그리고 여기서, 만일 프레임 no가 실종된 경우, 이전의 유효 프레임 및 프레임 no에 대한 제 2 코딩 모드를 표시한 비트스트림에는 복수의 유효프레임이 뒤따르며, 이 경우 비트 스트림은 제 2 코딩 모드를 표시하며, 훗속 프레임 no+1와 관계하는 여진 신호를 필터링하는데 사용되는 적어도 하나의 합성 필터는 프레임 no+i와 관하여 추정된 합성필터와 프레임no이래로 사용된 적어도 하나의 필터와의 가중 결합에 의해 결정된다.
상기 특성들은 단지 역방향 코딩을 사용하는 시스템에서와 실질적으로 동일한 방식으로 코더와 역방향 모드에서 동작하는 주기에서 실종 프레임의 상황을 커버하고 있다. 단지 역방향 코딩을 이용하는 시스템에 대해 상기 기술한 바람직한 실시예는 하이브리드 순방향/역방향 시스템의 상황에도 직접 적용될 수가 있다.
사용시 오디오 신호의 스펙트럼이 정지하는 추정정도는 제 2 코딩 모드에 의해 처리되는 프레임과 그리고 현재의 프레임에 선행하는 시간창에 속하며 N 프레임(N은 소정의 정수) 순위로 지속구간을 갖는 제 1 코딩모드에 의해 처리되는 프레임을 카운트다움 함으로써 특별히 유추될 수 있다.
프레임 실종의 경우에 코더가 순방향 모드에서 역방향 모드로 변할때, 만일 프레임 no가 실종 되었으면 비트스트림은 이전의 유효 프레임에 대해 제 1 코딩 모드(또는 제 2 코딩 모드)를 표시하며, 프레임 no에는 비드 스트림이 제 1 코딩 모드를 표시하는 적어도 하나의 유효 프레임이 뒤따르며, 다음 프레임 no+1 에 관한 여진 신호를 필터링하는데 사용되는 합성필터는 프레임 no에 관한 추정된 합성필터로 부터 결정될 수 있다. 다음 프레임 no+1 에 관한 여진 신호를 필터링하는데 사용되는 필터는 특히 프레임 no에 관한 추정된 합성 필터와 일치하게 취해질 수 있다.
본 발명은 다른 특성 및 장점들이 첨부도면을 참조로한 본 발명의 실시예들에 대한 다음의 상세한 설명으로부터 명확해 질 것이다. 여기서,
도 1 은 그 출력 비트 스트림이 본 발명에 따라 디코딩 될 수 있는 오디오 코더의 블록선도이고,
도 2 는 본 발명에 따라 역방향 필터를 이용하는 오디오 디코더의 블록선도이고,
도 3 은 도 2 의 디코더에 적용될 수 있는, 신호 스펙트럼이 정지되는 정도를 추정하는 절차의 플로우 챠트도 이고, 그리고
도 4 는 도 2 의 디코더에 적용될 수 있는 역방향 LPC 필터 계산의 플로우챠트도이다.
도 1 에 보인 오디오 디코더는 하이브리드 순방향/역방향 LPC 분석코더이다.
코딩될 오디오 신호 Sn(t)가 정수 n으로 인덱스된 일련의 디지탈 프레임 형태로 수신된다. 각 프레임은 샘플수 L을 구비한다. 예컨대, 이 프레임은 10ms의 지속구간, 즉 8kHz의 샘플링 주파수에서 L=80 인 지속구간을 가질 수 있다.
상기 코더는 전달함수 1/A(z)를 갖는 합성 필터 5 를 포함하며, A(z)는 Z-1에서 다항식이다. 필터 5 는 관련 디코더에 의해 사용되는 합성필터와 동일하다. 필터 5 는 잔류 에러 코딩모듈(6)에 의해 공급되는 여진신호 En(t)를 수신하여 전송에러가 없을시 디코더가 생성하는 합성신호 버젼n(t)을 국부적으로 형성한다.
모듈 6 에 의해 공급되는 여진신호 En(t)는 여진 파라메터 EX(n)을 특징으로 한다. 모듈 6 에 의해 수행된 코딩은 국부적으로 합성된 신호n(t)를 특별한 기준에 따라 입력신호 Sn(t)에 가능한한 가깝도록 하는데 목적이 있다. 이 기준은 통상적으로 합성필터 5의 계수에 근거하여 결정된 특별히 인지되는 가중치를 갖는 필터로 필터링되는 코딩에러n(t)-Sn(t)를 최소화하는 것에 상응한다. 코딩 모듈 6 은 일반적으로 프레임(서브 프레임) 보다 짧은 블럭을 이용한다. 여기서, EX(n)은 프레임 n의 서브프레임에 대해 모듈 6에 의해 결정되는 여진 파라메터 세트들을 표시한다.
코딩 모듈 6 은 장기간의 예측지연, 언어의 피치에 관한 이득과 잔류 에러 여진 시퀀스 및 관련 이득을 결정하기 위한 통상적인 장기간의 예측을 수행할 수 있다. 잔류 에러 여진 시퀀스의 형태는 관련 코더의 종류에 따라 달라진다. MP-LPC 코더의 경우에, 이는 그 위치 및 진폭이 양자화되는 펄스세트에 대응한다. CELP 코더의 경우, 이는 소정 사전으로부터의 코드워드에 대응한다.
합성필터(5)의 전달함수의 역함수인 다항식 A(z)는 다음과 같다.
여기서, ak(n)은 프레임 n에 대해 결정된 선형 예측 계수이다. 도 1 에서 스위치 7 로 표시된 바와 같이, 이들은 프레임을 차별화하는 결정모듈 8 에 의해 결정된 비트 d(n)의 값에 따라 순방향 LPC 분석 모듈 10 또는 역방향 LPC 분석모듈 12에 의해 공급되며, 이 경우 LPC 분석은 프레임으로 부터 순방향 (d(n)=0)으로 수행되고 그리고 역방향(d(n)=1)으로 수행된다.
코딩될 신호 Sn(t)는 선형 예측 분석 모듈 10 에 공급되며, 이때 이 선형 예측 분석 모듈 10 은 신호에 대한 순방향 LPC 분석을 수행한다. 메모리 모듈 11 은 신호 Sn(t)를 수신하며 이를 현재의 프레임까지 수개의 프레임을 커버하는 분석기간 창에 저장한다. 모듈 10 은 이 시간창에서 신호 Sn(t)에 대해 KF (전형적으로 KF0)의 선형 예측 계산을 수행하여, 그 전달함수가
형태인 선형예측필터를 결정한다.
여기서, Pk F(n)은 프레임 n을 처리한 후 얻어지는 K의 예측 계수를 표시한다.
이들 계수()를 계산하는데 이용될 수 있는 선형 추정 분석 방법은 디지털 코딩 분야에 널리 공지된 것이다. 예를 들면, 1978년 Prentice-Hall Int.에서 L.R. Rabiner과 R.W. Shafer의 "음성 신호의 디지털 프로세싱" 및 1976년 Spring Verlag Berlin Heidelberg에서 J.D. Markel과 A.H. Gray의 "음성의 선형 추정"을 참조하시오.
d(n)=0(순방향 모드) 일시, 모듈(10)이 계산한 계수들()은 합성 필터(5)에 공급되며, 즉 1≤k≤K 에서 K=KF, ak(n)=이다. 모듈(10)은 또한 순방향 LPC 필터를 양자화한다. 이런 방법으로 d(n)=0인 각 프레임에 대해 양자화 파라메터들(Q(n))을 결정한다. 여러가지 양자화 방법들이 이용될 수 있다. 프레임(n)을 결정하는 파라메터들(Q(n))은 필터의 계수들()을 직접 나타낼 수 있다. 양자화는 반사 계수들, LAR(로그 면적 비율(log-area-ratio)), LSP(선 스펙트럼 쌍들(line spectrum pairs)) 등에 균일하게 인가될 수 있다. d(n)=0일 시 필터(5)에 공급되는 계수들()은 양자화된 값들에 대응한다.
합성된 지역 신호()는 역방향 LPC 분석을 실행하는 선형 추정 분석 모듈(12)에 공급된다. 메모리 모듈(13)은 신호()를 수신하여 분석 시간 윈도우에서 그것을 기억하며, 상기 윈도우는 통상적으로 현재의 프레임 앞에 있는 프레임까지의 다수의 프레임들을 커버한다. 모듈(12)은 선형 추정 필터를 결정하기 위해서 이러한 합성된 신호의 윈도우에서 KB 차수(통상적으로 KB50)의 선형 추정 계산을 실행하며, 이 필터의 전달 함수(A8(z))는 다음 형태를 갖는다.
(5)
여기서,은 프레임(n-1)을 처리한 후의 k차수의 추정 계수를 나타낸다.
모듈(12)이 사용한 추정 방법들은 모듈(10)이 사용한 방법들과 동일할 수 있다. 그러나, 모듈(12)은 필터(AB(z))을 양자화할 필요가 없다.
d(n)=1(역방향 모드) 일시, 모듈(12)이 계산한 계수들()은 합성 필터(5)에 공급되며, 즉 1≤k≤K 에서 K=KB, ak(n)=다.
각각의 모듈들(10,12)은 각자의 추정 계수들(,)을 획득하도록 최대화한 추정 이득(GF(n),GB(n))을 제공한다. 결정 모듈(8)은 코더가 순방향 모드 및 역방향 모드로 동작할 시간을 결정하기 위해서 프레임별로 이득들(GF(n),GB(n))의 값을 분석한다.
일반적으로, 역방향 추정 이득(GB(n))은 순방향 추정 이득(GF(n))에 비해 상대적으로 높고, 코딩될 신호가 다소 정상상태일 것이라고 가정될 것이다. 이것이 아주 많은 수의 연속적인 프레임들에 대한 경우라면, 모듈(8)이 d(n)=1을 취하도록 코더를 역방향 모드로 동작시키는 것이 현명하다. 대조적으로, 비정상상태 면적들에서는 d(n)=0을 취한다. 순방향/역방향 결정 방법에 대한 상세한 설명은 프랑스 특허 출원 97 04684를 참조하시오.
도1은 비트 스트림(F)를 포맷하는 코더의 출력 다중화기(14)를 보여준다. 스트림(F)은 각 프레임에 대한 순방향/역방향 결정 비트(d(n))를 포함한다.
d(n)=0(순방향 모드) 일시, 스트림(F)의 프레임(n)은 순바향 LPC 필터 계수들 ()을 양자화하는 스펙트럼 파라메터들(Q(n))을 포함한다. 프레임의 나머지는 모듈(6)이 결정한 여기(excitation) 파라메터들(EX(n))을 포함한다.
d(n)=1(역방향 모드)인 경우, 스트림(F)의 프레임(n)은 소정의 스펙트럼 파라메터들(Q(n))을 포함하지 않는다. 출력 2진 비트 비율은 동일하고, 더 이상의 비트들은 나머지 에러 여기를 코딩하는데 이용될 수 있다. 따라서, 모듈(6)은 몇몇 파라메터들(LTP 지연, 이득 등)을 양자화시키는데 더 이상의 비트들을 할당하거나, 또는 CELP 사전 크기를 증가시켜서 나머지 에러의 코딩을 풍부하게 한다.
예를 들면, 2진 비트 비율은 KF=10 차수의 순방향 LPC 분석, KB=30 차수의 역방향 LPC 분석 및 2개의 서브프레임들로 분리되는 각 프레임, 10ms의 프레임들(L=80)을 갖는 전화 대역(300-3400Hz)에서 동작하는 ACELP(대수 사전 CELP) 코더에 대해 11.8kbit/s 일 수 있다(각 프레임에 대해 계산된 순방향 및 역방향 LPC 필터들은 제2 서브프레임을 처리하는데 이용되고 그리고 이들 필터들과 선행 프레임을 위해 계산된 것들 간의 외삽법은 서브프레임을 처리하는데 이용될 수 있다).
도2 블록도의 디코더는 비트 스트림(F)외에 실종 프레임들을 나타내는 플래그(BFI)를 수신한다.
디코더의 출력 비트 스트림(F)은 일반적으로 전송 에러 검출 및/또는 보정 능력을 갖는 코드에 따라 나머지를 소개하는 채널 코더에 제공된다. 오디오 디코더의 엎스트림(upstream) 측상에서, 관련 채널 디코더는 전송 에러를 검출하여 그들중 어떤 것들을 보정하기 위해서 이 나머지를 이용한다. 프레임 전송이 너무 나빠서 채널 디코더의 보정 능력이 불충분한 경우, 후자는 오디오 디코더가 적당한 행동을 채택하도록 BFI 플래그를 활성화시킨다.
도2는 디코더의 입력 역다중화기(20)를 보여주며, 이 역다중화기(20)는 수신된 비트 스트림의 각각의 유효 프레임(n)을 위해서 순방향/역방향 결정(d(n)), 여기 파라메터들(EX(n)과, d(n)=0 일 경우 스펙트럼 파라메터들(Q(n))을 전달한다.
프레임(n)이 실종된 것으로 나타내어질 경우, 디코더는 코딩 모드가 최종 유효 프레임의 코딩 모드와 동일한 것으로 간주한다. 따라서, 값(d(n)=d(n-1))을 채택한다.
유효 순방향 모드 프레임(비트 스트림(F)에서 판독된 d(n)=0)의 경우에, 모듈(21)은 수신된 양자화 지수(Q(n))로부터 순방향 LPC 필터(1≤k≤KF)의 계수들을 계산한다. 스위치들(23,24)은 도2에 도시된 위치에 존재하며, 계산된 계수들 ()은 합성 필터(22)에 제공되며, 이 필터(22)의 전달 함수는 그때 식(3)에 의해 주어진 AF(z)를 갖는 1/A(z)=1/AF(z)이다.
실종 프레임을 위한 d(n)=0 경우, 디코더는 계속해서 순방향 모드로 동작하여, 평가 모듈(36)이 제공한 계수들(ak(n))을 합성 필터(KF)에 제공한다.
역방향 모드 프레임(n)(비트 스트림에서 판독되거나 또는 실종 프레임 사건에서 유지된 d(n)=1)의 경우에, 합성 필터(22)의 계수들은 역방향 LPC 필터를 계산하기 위해서 모듈(25)이 결정한 계수들()(1≤k≤K=KB)이며, 이것은 나중에 설명된다. 합성 필터(22)의 전달 함수는 그때 아래 관계식을 갖는 1/A(z)이다.
(5)
합성 필터(22)는 LPC 코딩 나머지를 합성하기 위해 모듈(26)이 전달한 여기 신호(En(t))를 프레임(n)을 위해 수신한다.
유효 프레임(n)에 대해, 합성 모듈(26)은 비트 스트림에서 판독된 여기 매개벼수들 (EX(n))로부터 여기 신호(En(t))를 계산하며, 스위치(27)는 도2에 도시된 위치에 존재한다. 이 경우에, 합성 모듈(26)이 제공한 여기 신호(En(t))는 동일한 프레임을 위해 코더의 모듈(6)에 의해 전달된 여기 신호(En(t))와 동일한다. 이 코더에서 처럼, 여기 신호가 계산되는 방법은 순방향/역방향 결정 비트(d(n))에 의존하다.
필터(22)의 출력 신호()는 디코더가 획득한 합성 신호를 구성한다. 이 합성 신호는 그때 통상적으로 디코더에 (도시되지 않은)하나 이상의 형상화 후방 필터들에 제공된다.
합성 신호()는 선형 추정 분석 모듈(30)에 제공되며, 상기 모듈(30)은 합성 필터를 평가하기 위해서 도1의 디코더 모듈(12)과 동일한 방식으로 역방향 LPC 분석을 실행하고, 상기 필터의 계수들(Pk(n))(1≤k≤KB)은 계산 모듈(25)에 제공된다. 프레임(n)과 관련있는 계수들(Pk(n))은 프레임(n-1)까지 합성된 신호를 고려한 후에 획득된다. 메모리 모듈(31)은 신호()를 수신하여 도1의 모듈(13)과 동일한 분석 시간 윈도우에서 그것을 기억한다. 분석 모듈(30)은 그때 기억된 합성 신호에 기초하여 모듈(12)과 동일한 계산을 실행한다.
어떠한 프레임도 빠지지 않는 다면, 모듈(25)은 분석 모듈(30)에 의해 공급된 추정 계수 Pk(n)과 같은 계수 Pk(n)을 전달한다. 결과적으로, 어떠한 프레임도 빠지지 않는 다면, 물론 비트 스트림(F)의 유효 프레임에 잘못된 비트가 없다는 것을 조건으로 하여, 디코더에 전달된 합성 신호 n(t)는 코더에서 결정된 합성 신호n(t)와 정확히 같다.
d(n)=0 이라면 디코더에 의해 수신된 여기 파라미터 EX(n) 및 순방향 LPC 필터의 계수 PF k(n)은 각각의 모듈(33, 34, 34)들에 의하여 적어도 하나의 프레임에 대하여 기억되며, 그러므로 프레임이 빠지는 경우 여기 파라미터 및/또는 순방향 LPC 파마리터는 재저장될 수 있다. 이러한 경우에 사용되는 파라미터는 BF1 플래그가 빠진 프레임을 나타낸다면 메모리(33, 34)들의 내용을 기초로 하여 각각의 모듈(35, 36)에 의해 공급된 것으로 추정된다. 모듈(35, 36)들에 의해 사용될 수 있는 추정 방법은 상기에서 설명한 방법으로부터 선택될 수 있다. 특히, 모듈(35)은 음성화된/음성화되지 않은 검출기(37)에 의해 공급된 합성 신호n(t)의 얼마간의 음성화된 특성에 대한 정보를 주는 여기 파라미터를 추정할 수 있다.
빠진 프레임이 표시될 때의 역방향 LPC 필터 계수의 재생은 모듈(25)에 의한 계수 Pk(n)의 계산으로부터 이루어진다. 이러한 계산은 유익하게는 오디오 신호의 스펙트럼이 추정기 모듈(38)에 의해 일정하게 형성되는 정도의 추정 Istat(n)에 달려있다.
모듈(38)은 도 3에 나타낸 순서도에 따라서 동작할 수 있다. 이러한 진행 절차에서, 모듈(38)은 그 값들이 N0및 N1으로 표시되는 2개의 카운터를 이용한다. 그들의 비 N1/N0는 그의 지속기간이 N개(전형적으로 N100, 즉 1s 정도의 범위)의 신호 프레임들의 순서를 나타내는 번호 N에 의해 규정되는 시간 범위 동안 순방향 코드된 프레임들의 비를 나타낸다.
프레임에 대한 추정 Istat(n)은 N0및 N1의 함수이다. 이는 특히 이진 함수가 될 수 있는데, 예를 들어:
N1〉4N0이면(상대적으로 불변), f(N0, N1) = 1
또는
N1≤4N0이면(상대적으로 불변), f(N0, N1) = 0 이다.
만일 불충분한 에너지를 갖는 프레임들이 무시될 수 있도록(테스트 40) 현재의 프레임(n)에서 필터(22)에 의해 전달된 합성 신호n(t)의 에너지 E(n)이 선택된 임계치 미만이라면, 카운터(N0, N1)들은 프레임(n)에서 변경되지 않으며 모듈(38)은 단계(41)에서 Istat(n)을 바로 계산한다. 만일 그렇지 않다면, 테스트(42)에서 프레임(n)에 대하여 나타낸 코딩 모드를 검사한다{비트 스트림내의 d(n) 또는 빠린 프레임의 경우에는 d(n)=d(n-1)}. 만일 d(n)=0이면, 카운터(N0)는 단계(43)에서 증가된다. 이후, N0+N1의 합이 N에 이르지 않는 다면(테스트 45) 모듈(38)은 단계(41)에서 Istat(n)을 계산하는데, 이 경우 2개의 카운터(N0, N1)의 값들이 먼저 2로 나누어진다.
모듈(25)에 의한 계수 Pk(n) (1≤k≤KB)의 계산 절차는 도 4의 순서도에 따라 이루어진다. 이러한 절차는, 유효 또는 빠진 프레임이든지, 그리고 순방향 또는 역방향 코딩이 사용되는 지에 상관없이, 모든 n 프레임들에 대하여 수행됨을 유념하자. 마지막의 빠진 프레임 및 연속적인 추정 Istat(n)때문에, 계산된 필터는 지나가는 프레임들의 수에 번갈아서 의존하는 가중 계수(α)에 의존한다. 현재 프레임 바로 앞의 마지막의 빠진 프레임은 no로 표시된다.
프레임(n)에 대하여 수행되는 절차의 처음에, 모듈(25)은 d(n)=0일 경우 프레임(n)의 합성 신호(n)에 대하여 필터(22)에 공급되는 KB 계수 Pk(n)을 생성한다. d(n)=0이면, 계수 Pk(n)은 간단하게 계산되어 기억된다. 계산은 단계(50)에서 하기의 방정식을 이용하여 수행된다.
Pk(n) = (1-α).Pk(n) + α.Pk(no) (6)
여기서 Pk(n)은 프레임(n) 관련하여 {즉, 프레임(n-1)까지 합성된 신호에 대하여} 모듈(30)에 의해 추정되는 계수이며, Pk(no)는 마지막의 빠진 프레임(no)에 관련하여 모듈(25)에 의해 계산된 계수이고, α는 0으로 초기화되는 가중 계수이다.
방정식 (7)은 적어도 하나의 유효 프레임(no+i)가 프레임(no)를 따를 때 방정식 (1)과 일치한다(i=1,2,...).
만일 프레임(n)이 유효하다면(테스트 51), 모듈(25)는 단계(52)에서 비트 스트림내에서 리드되는 순방향/역방향 결정 비트 d(n)을 검사한다.
만일 d(n)=1이면, 모듈(25)은 단계(53 내지 57)에서 방정식 (2)에 따라서 계수 α의 새로운 값을 계산하며, 계수 β는 프레임(n)에 대하여 모듈(38)에 의해 추정된 Istat(n)의 감소 함수로서 선택된다. 만일 단계(53)에서 Istat(n)=0 이면(상대적으로 변화되는 신호), 계수 α는 단계(54)에서 β=βo양만큼 감소된다. 만일 단계(53)에서 Istat(n)=1 이면(상대적으로 불변 신호), 계수 α는 단계(55)에서 β=β1양만큼 감소된다. Istat(n)은 상기에서 설명한 바와 같이 이진 방법으로 결정되며, βO및 β1의 양은 각각 0.5 및 0.1이 될 수 있다. 단계(56)에서, α의 새로운 값이 0과 비교된다. 프레임(n)에 관련된 절차는 α≥0일 경우 종료된다. 만일 α〈0이면, 계수 α는 단계(57)에서 0으로 설정된다.
순방향으로 코드된 프레임(n)의 경우{단계(52)에서 d(n)=0}, 계수 α는 단계(57)에서 0으로 바로 설정된다.
만일 프레임(n)이 빠졌다면(테스트 51), 현재 프레임의 인덱스(n)는 마지막 빠진 프레임을 나타내는 인덱스(no)로 할당되며 계수 α는 단계(58)에서 그의 최대값 αmax로 초기화 된다(0〈αmax≤1).
계수 α의 최대값 αmax는 1 이하가 될 수 있다. 그렇지만, 바람직하게는 αmax=1의 값이 선택된다. 이 경우, 만일 프레임(n0)이 빠진다면, 모듈(25)에 의해 계산된 다음의 필터 Pk(no+1)은 마지막 유효 프레임을 수신한 후에 계산된 필터와 일치한다. 만일 다수의 연속적인 빠진 프레임들이 있다면, 모듈(25)에 의해 계산된 필터는 마지막 유효 프레임을 수신한 후에 계산된 것과 같게 유지된다.
만일 빠진 프레임 다음에 수신된 첫 번째 유효 프레임이 순방향으로 코드된다면{d(n0+1)=0}, 합성 필터(22)는 모듈(21)에 의해 계산된 유효 계수 Pk(no+1) 및 유효 여기 신호를 수신한다. 그 결과, 분석기 모듈(30)에 의해 수행된 합성 필터의 추정 Pk(no+2)와 같이, 합성 신호 n0+1(t)는 비교적 확실하다. 계수 α는 단계(57)에서 0으로 설정되기 때문에, 이 Pk(no+2)는 다음 프레임(no+2)에 대한 계산 모듈(25)에 의해 받아들여질 수 있다.
만일 프레임 손실 이후에 수신된 첫 번째 유효 프레임이 역방향으로 코드된다면{d(n)=1}, 합성 필터(22)는 그 유효 프레임에 대한 계수 Pk(no+1)를 받는다. αmax=1을 선택하게 되면 계수들을 계산할 때, 빠진 프레임(n0)의 합성 신호 n0(t)를 처리한 후에 모듈(30)에 의해 비교적 불확실하게 결정된 추정 Pk(no+1)을 참작해야 하는 필요성을 완전하게 없애준다(여기서 n0(t)는 잘못된 여기 신호를 필터링함으로써 얻어진다).
만일 다음의 프레임들(n0+2 등)이 여전히 역방향으로 코드된다면, 사용되는 합성 필터는, 그 값이 신호 영역이 다소 불변인지에 따라서 다소 빠르게 감소되는 계수 α를 이용하여 평활될 것이다. 특정한 수의 프레임들(불변의 경우에는 10, 그리고 β 및 β0의 표시 값을 갖는 가변의 경우에는 20) 후, 계수 α는 다시 0이 된다. 바꾸어 말하면, 코딩 모드가 역방향 모드로 남아있는 경우 사용되는 필터 Pk(no+i)는 합성 신호로부터 모듈(30)에 의해 추정된 필터 Pk(no+i)와 같게 된다.
상기의 설명은 하이브리드 순방향/역방향 코딩 시스템의 예를 상세히 설명한다. 본 발명의 이용법은 단지 역방향 코딩만을 이용하는 코더의 경우와 매우 유사하다:
-출력 비트 스트림(F)은 결정 비트 d(n) 및 스펙트럼 파라미터 Q(n)를 포함하는 것이 아니라, 단지 여기 파라미터 EX(n)을 포함하고,
-도 1로부터의 코더의 기능 유닛(7, 8, 10, 11)은 필요하지 않으며, 역방향 LPC 분석기 모듈에 의해 계산된 계수 PB k(n)이 합성 필터(5)에 의해 바로 이용되고,
-도 2로부터의 디코더의 기능 유닛(21, 23, 24, 34, 36)은 필요하지 않으며, 모듈(25)에 의해 계산된 계수 Pk(n)이 합성 필터(22)에 의해 바로 이용된다.
결정 비트 d(n)은 더 이상 디코더에서 유용하지 않으며, 계산 모듈(25)이 Istat(n)을 이용한다면, 다른 어떠한 방법으로 계산될 것이다. 만일 디코더가 Istat(n)을 추정할 수 있게 하는 어떠한 특정한 정보를 전송된 비트 스트림이 포함하지 않는 다면, 모듈(25)에 의해 연속적으로 계산된 합성 필터 Pk(n)의 비교 분석기를 기반으로 하여 추정될 수 있다. 만일 연속적인 필터들간에 측정된 스펙트럼 간격이 특정한 시간 범위에 걸쳐서 비교적 작게 유지된다면, 신호는 비교적 불변인 것으로 간주될 수 있다.

Claims (33)

  1. 일련의 프레임에 의해 코딩되는 오디오신호 (Sn(t))를 표시하며, 어떤 실종 프레임을 나타내는 플래그 (BF1)와 함께 수신되는 비트 스트림 (F)을 디코딩하는 방법으로서,
    각 프레임에 대해 만일 상기 프레임이 유효한 경우 비트 스트림으로 복구되고 만일 상기 프레임이 실종된 경우 다른 방식으로 추정되는 여진 파라메터(EX(n))로 부터 여진신호 (Ek(n))가 형성되며, 상기 여진신호는 디코딩된 오디오 신호 (Σn(t))가 얻어지도록 합성필터 (22)에 의해 필터링되며,
    선형 예측분석이 현재의 프레임에 관한 합성필터를 적어도 부분적으로 추정하기 위해 이전 프레임까지 얻어진 디코딩된 오디오신호에 근거하여 수행되고, 상기 일련의 합성필터들은 추정된 합성필터에 부합되는 실종 프레임이 없는한 상기 여진 신호를 필터링하는데 사용되며,
    만일 프레임 n0가 실종된 경우, 후속 프레임 n0+ i 에 관한 여진 신호를 필터링하는데 이용되는 적어도 하나의 합성필터가 프레임 n0에 관하여 추정된 합성필터와 그리고 프레임 n0 +i 이후로 사용된 적어도 하나의 합성필터와의 가중 결합에 의해 결정되는 것을 특징으로하는 오디오 신호 디코딩 방법.
  2. 제1항에 있어서,
    실종 프레임 n0을 뒤따르는 프레임 n0 +i 역시 실종된 경우, 프레임 n0+ i 에 관한 여진 신호를 필터링하는데 사용되는 합성필터가 프레임 n0에 관한 여진 신호를 필터링하는데 사용되는 합성필터로 부터 결정되는 것을 특징으로하는 오디오 신호 디코딩 방법
  3. 제1 또는 2항에 있어서,
    사용되는 합성필터가 추정된 합성필터에 점진적으로 가까워지도록, 상기 가중결합에서 사용되는 가중계수 (α(i), 1-α(i))가 프레임 n0와 마지막 실종 프레임 n0+ i 사이의 프레임의 수 i 에 의존되는 것을 특징으로하는 오디오 신호 디코딩 방법.
  4. 제3항에 있어서,
    프레임 n 에 관한 여진신호를 필터링하는데 사용되는 각 합성필터가 K 파라메터 pk(n) (1≤k≤K) 로 나타내지며, 여기서 실종 프레임 n0과 그다음의 i - 1 유효 프레임들 ( i ≥ 1)에 뒤따르는 프레임 n0+1 에 관한 여진신호를 필터링 하는데 사용되는 합성필터의 파라메터 pk(n0+ 1) 가 식
    Pk(n0+i)=[1-α(i)].Pk(n0+i) + α(i).Pk(n0)
    로 부터 계산되며, pk(n0+ 1)는 프레임 n0+ 1에 관하여 추정된 합성필터의 kth파라메터이고, α(i)는 1과 동일한 α(1) = αmax값으로 부터 i로 감소하는 양(+) 또는 제로 가중 계수인 것을 특징으로하는 오디오 신호 디코딩 방법.
  5. 제 4항에 있어서,
    α(1) = αmax인 것을 특징으로 하는 오디오 신호 디코딩 방법.
  6. 제 4항 또는 5항에 있어서,
    i 〉 1 인 경우, 계수 α(i) 는 식 α(i) = max { 0, α(i-1)-β 로 부터 계산되며, β는 범위 0 내지 1의 계수인 것을 특징으로하는 디코딩 방법.
  7. 제1 내지 제6항중 어느한 항에 있어서,
    상기 가중 결합에 이용되는 가중 계수가 오디오 신호의 스펙트럼이 정지하는 정도의 추정치 (Istat(n)) 에 좌우되어, 정지신호가 약한 경우 실종 프레임 n0에 (i≥1) 뒤따르는 프레임 n0+ 1에 관한 여진 신호를 필터링 하는데 사용되는 합성신호가 정지신호가 강한 경우보다 상기 추정된 합성 필터에 더 가깝게 되는 것을 특징으로하는 오디오 신호 디코딩 방법.
  8. 제7항에 있어서,
    오디오 신호의 스펙트럼이 정지하는 정도 (Istat(n)) 가 비트스트림의 각 유효 프레임에 포함된 정보로 부터 추정되는 것을 특징으로하는 오디오 신호 디코딩 방법.
  9. 제 7항에 있어서,
    오디오 신호의 스펙트럼이 정지하는 정도 (Istat(n)) 가 여진신호를 필터링 하는데 사용되는 일련의 합성 필터들의 비교분석으로 부터 추정되는 것을 특징으로하는 오디오 신호 디코딩 방법.
  10. 제4항과 그리고 제7항 내지 제9항중 어느 한 항에 있어서,
    i 〉 1 에서 가중계수 α(i) 는 오디오 신호의 스펙트럼이 정지하는 상기 추정된 정도 (Istat(n))의 증가하는 함수인 것을 특징으로 하는 오디오 신호 디코딩 방법.
  11. 제6항 및 제10항에 있어서,
    계수 β는 오디오 신호의 스펙트럼이 정지하는 상기 추정된 정도 (Istat(n)) 의 감소하는 함수인 것을 특징으로하는 오디오 신호 디코딩 방법.
  12. 제11항에 있어서,
    상기 오디오 신호의 스펙트럼이 정지하는 상기 정도 (Istat(n)) 는 이진 방식으로 추정되며, 계수 β는 상기 추정치에 따라 0.5 또는 0.1 값을 취하는 것을 특징으로하는 오디오 신호 디코딩 방법.
  13. 합성 필터 (22)는 1/AB(z)의 전달함수를 갖고, 여기서 AB(z)는 Z-1의 다항식이며, 그 계수 ((n)) 는 디코딩된 오디오 신호 (Σn(t))에 적용되는 상기 선형 예측분석으로 부터 얻어지는 것을 특징으로하는 오디오 신호 디코딩 방법.
  14. 제1항 내지 제12항중 어느한 항에 있어서,
    상기 합성 필터 (22)는 1/[Af(z).AB(z)]의 전달함수를 가지며, 여기서 Af(z) 와 AB(z)는 z-1의 다항식이고, 다항식 Af(z)의 계수 ((n))는 비트 스트림의 유효프레임에 포함된 파라메터 (Q(n))으로부터 얻어지며, 다항식 AB(z)의 계수 ((n))은 전달함수 Af(z)를 갖는 필터를 이용하여 상기 디코딩된 오디오 신호 (Σn(t))를 필터링함으로서 구해진 신호에 인가된 상기 선형 예측분석으로부터 얻어지는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  15. 일련의 프레임에 의해 코딩되는 오디오신호 (Sn(t))를 표시하며, 어떤 실종 프레임을 나타내는 플래그 (BFI)와 함께 수신되는 비트 스트림 (F)을 디코딩하는 방법으로서, 상기 비트스트림의 각 유효 프렘임이 프레임이 스펙트럴 파라메터(Q(n))를 포함하는 제1 코딩 모드 또는 제2 코딩모드인 프레임에 관한 오디오 신호를 코딩하기위해 코딩모드가 적용된 표시 (d(n))를 포함하며,
    각 프레임에 대해 만일 상기 프레임이 유효한 경우 비트 스트림으로 복구되고 만일 상기 프레임이 실종된 경우 다른 방식으로 추정되는 여진 파라메터(EX(n))로 부터 여진신호(Ek(n))가 형성되며, 상기 여진신호는 디코딩된 오디오 신호 (Σn(t))가 얻어지도록 합성필터 (22)에 의해 필터링되며,
    여진 신호를 필터링하는데 사용되는 합성 필터가 만일 비트스트림이 제1 코딩 모드를 표시하는 경우 상기 스펙트럴 파라메터로 부터 구성되며,
    선형 예측분석이 현재의 프레임에 관한 합성필터를 적어도 부분적으로 추정하기 위해 이전프레임까지 얻어진 디코딩된 오디오신호에 근거하여 수행되고,
    프레임 실종이 없고 그리고 비트스트림이 제2 코딩 모드를 표시하면, 여진신호를 필터링하는데 이용되는 일련의 합성필터가 상기 추정된 합성 필터에 부합되며,
    만일 프레임 n0가 실종되고, 비트스트림이 이전 유효 프레임에 대한 제2 코딩 모드를 포함하고 그리고 프레임 n0에 비트 스트림이 제2 코딩 모드를 표시하는 복수의 유효 프레임이 뒤따르는 경우, 후속 프레임 n0+ i 에 관한 여진 신호를 필터링하는데 이용되는 적어도 하나의 합성필터가 프레임 n0에 관하여 추정된 합성필터와 그리고 프레임 n0 +i 이후로 사용된 적어도 하나의 합성필터와의 가중 결합에 의해 결정되는 것을 특징으로하는 오디오 신호 디코딩 방법. 는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  16. 제15항에 있어서,
    만일 프레임 n0이 실종되고 그리고 비트 스트림이 제2 코딩 모드를 표시하는 적어도 하나의 유효 프레임이 상기 프레임을 뒤따르는 경우, 후속 프레임 n0+i 에 관한 여진 신호를 필터링하기위해 사용되는 합성 필터가 프레임 n0에 관하여 추정된 합성필터로 부터 결정되는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  17. 제15 또는 16항에 있어서,
    두개의 연속 프레임 n0와 n0+i 가 둘다 실종되고 그리고 비트 스트림이 이전의 유효 프레임에 대한 제 2 코딩 모드를 표시한 경우, 프레임 n0+ 1에 관한 여진 신호를 필터링 하기위해 이용되는 합성 필터가 프레임 n0에 관한 여진 신호를 필터링 하는데 사용된 합성 필터로 부터 결정되는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  18. 제 15 내지 제 17항중 어느 한 항에 있어서,
    사용되는 합성필터가 추정된 합성필터에 점진적으로 가까워지도록, 상기 가중결합에서 사용되는 가중계수 (α(i), 1-α(i))가 프레임 n0+ 1와 마지막 실종 프레임 n0사이의 프레임의 수 i 에 의존되는 것을 특징으로하는 오디오 신호 디코딩 방법.
  19. 제18항에 있어서,
    프레임 n 에 관한 여진신호를 필터링하는데 사용되는 각 합성필터가 K 파라메터 pk(n) (1≤k≤K) 로 나타내지며, 여기서 실종 프레임 n0과 그 다음의 i-1 유효 프레임들 (i≥1)에 뒤따르는 프레임 n0+1 에 관한 여진신호를 필터링 하는데 사용되는 합성필터의 파라메터 pk(n0+1)가 식
    Pk(n0+i)=[1-α(i)].Pk(n0+i) + α(i).Pk(n0)
    로 부터 계산되며, pk(n0+1)는 프레임 (n0+1)에 관하여 추정된 합성필터의 kth파라메터이고, α(1) 는 1과 동일한 α(1) = αmax값으로 부터 i 로 감소하는 양(+) 또는 제로 가중계수 인 것을 특징으로하는 오디오 신호 디코딩 방법.
  20. 제 19항에 있어서,
    αmax= 1 인 것을 특징으로 하는 오디오 신호 디코딩 방법.
  21. 제 4항 또는 5항에 있어서,
    i 〉 1 인 경우, 계수 α(i) 는 식 α(1) = max (0, α(i-1)-β 로 부터 계산되며, β는 범위 0 내지 1의 계수인 것을 특징으로하는 디코딩 방법.
  22. 제15 내지 제 21항중 어느한 항에 있어서,
    상기 가중 결합에 이용되는 가중 계수가 오디오 신호의 스펙트럼이 정지하는 정도의 추정치 (Istat(n)) 에 좌우되어, 정지 신호가 약한 경우 실종 프레임 n0에 뒤따르고 비트 스트림이 제2 모드 (i≥1)를 표시하는 프레임 n0+ 1 에 관한 여진 신호를 필터링 하는데 사용되는 합성필터가 정지신호가 강한 경우보다 상기 추정된 합성 필터에 더 가깝게 되는 것을 특징으로하는 오디오 신호 디코딩 방법.
  23. 제22항에 있어서,
    오디오 신호의 스펙트럼이 정지하는 정도 (Istat(n))가 비트스트림 (F)의 각 유효 프레임에 포함된 정보 (d(n))로 부터 추정되는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  24. 제 23항에 있어서,
    오디오 신호의 스펙트럼이 정지하는 정도 (Istat(n)) 의 상기 정보가 오디오 신호 코딩 모드를 표시하는 정보 (d(n))로 부터 추정되는 것을 특징으로하는 오디오 신호 디코딩 방법.
  25. 제24항에 있어서,
    오디오 신호의 스펙트럼이 정지하는 상기 추정된 정도 (Istat(n))가 제2 코딩 모드에서처리된 프레임과 현재의 프레임에 선행하는 시간 창에 속하며 소정의 자연수인 N 프레임 순으로 지속구간을 갖는 제1 코딩 모드에서 처리된 프레임을 다운카운팅하므로써 유추되는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  26. 제 25항에 있어서,
    오디오 신호의 스펙트럼이 정지하는 정도 (Istat(n)) 는 두개의 카운터를 반복적으로 사용하여 추청되며, 한 카운터의 값 N0는 제1 코딩 모드를 이용하여 처리된 각 프레임에 대해 증분되고 다른 카운터의 값 N1은 제2 코딩 모드를 이용하여 처리된 각 프레임에 대해 증분되며, 상기 두 카운터의 값은 두 값의 합이 수 N 에 도달할때 하께 감소하며, 오디오 신호의 스펙트럼이 정지하는 상기 추정된 정도는 비율 N1/ N0에 따라 감소하는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  27. 제 26항에 있어서,
    오디오 신호의 스펙트럼이 정지하는 정도 (Istat(n)) 는 비율 N1/ N0의 2진 함수인 것을 특징으로하는 오디오 신호 디코딩 방법.
  28. 제22항에 있어서,
    오디오 신호의 스펙트럼이 정지하는 정도 (Istat(n)) 가 여진신호 (Ek(n))를 필터링하는데 사용되는 일련의 합성필터의 비교 분석으로부터 추정되는 것을 특징으로 하는 오디오 신호 디코딩 방법.
  29. 제19항 과 그리고 제 22항 내지 제28항중 어느 한 항에 있어서,
    i 〉 1 인 경우, 가중계수 α(i) 는 오디오 신호의 스펙트럼이 정지하는 추정된 정도 (Istat(n)) 의 감소하는 함수인 것을 특징으로하는 오디오 신호 디코딩 방법.
  30. 제21항 및 제19항에 있어서,
    상기 계수 β 는 오디오 신호의 스펙트럼이 정지하는 추정된 정도 (Istat(n)) 의 감소하는 함수인 것을 특징으로 하는 오디오 신호 디코딩 방법.
  31. 제27항 및 30항에 있어서,
    상기 계수 β 는 상기 오디오 신호의 스펙트럼이 정지하는 상기 추정된 정도 (Istat(n))에 따라 0.5 또는 0.1 값을 취하는 것을 특징으로하는 오디오 신호 디코딩 방법.
  32. 제15항 내지 제31항중 어느 한 항에 있어서,
    비트 스트림이 제2 코딩 모드를 표시할 때 사용되는 합성 필터는 1/AB(z)의 전달함수를 갖고, 여기서 1/AB(z)는 z-1의 다항식이며, 그 계수 ((n))는 디코딩된 오디오 신호 (Σn(t))에 적용되는 상기 선형 예측분석으로 부터 얻어지는 것을 특징으로하는 오디오 신호 디코딩 방법.
  33. 제15항 내지 제31항중 어느 한 항에 있어서,
    비트 스트림이 제2 코딩 모드를 표시할때 사용되는 합성 필터는 1/[AF(z).AB(z)] 의전달함수를 가지며, 여기서 AF(z) 와 AB(z)는 z-1의 다항식이고, 다항식 AF(z)의 계수 ((n) 는 비트 스트림의 유효프레임에 포함된 파라메터 (Q(n))으로부터 얻어지며, 다항식 AB(z)의 계수 ((n))는 전달함수 (AF(z)를 갖는 필터를 이용하여 상기 디코딩된 오디오 신호 (Σn(t))를 필터링함으로서 구해진 신호에 인가된 상기 선형 예측분석으로 부터 얻어 지는 것을 특징으로하는 오디오 신호 디코딩 방법.
KR10-1999-7009169A 1998-02-06 1999-02-03 전송에러보정을 갖는 오디오신호 디코딩방법 KR100395458B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR9801441A FR2774827B1 (fr) 1998-02-06 1998-02-06 Procede de decodage d'un flux binaire representatif d'un signal audio
FR98/01441 1998-02-06
PCT/FR1999/000221 WO1999040573A1 (fr) 1998-02-06 1999-02-03 Procede de decodage d'un signal audio avec correction des erreurs de transmission

Publications (2)

Publication Number Publication Date
KR20010006091A true KR20010006091A (ko) 2001-01-15
KR100395458B1 KR100395458B1 (ko) 2003-08-25

Family

ID=9522700

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1999-7009169A KR100395458B1 (ko) 1998-02-06 1999-02-03 전송에러보정을 갖는 오디오신호 디코딩방법

Country Status (13)

Country Link
US (1) US6408267B1 (ko)
EP (1) EP1051703B1 (ko)
JP (1) JP3565869B2 (ko)
KR (1) KR100395458B1 (ko)
CN (1) CN1133151C (ko)
AU (1) AU756082B2 (ko)
BR (1) BRPI9904776B1 (ko)
CA (1) CA2285650C (ko)
DE (1) DE69911169T2 (ko)
ES (1) ES2209383T3 (ko)
FR (1) FR2774827B1 (ko)
HK (1) HK1027892A1 (ko)
WO (1) WO1999040573A1 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2784218B1 (fr) * 1998-10-06 2000-12-08 Thomson Csf Procede de codage de la parole a bas debit
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
EP1199709A1 (en) 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
FR2830970B1 (fr) * 2001-10-12 2004-01-30 France Telecom Procede et dispositif de synthese de trames de substitution, dans une succession de trames representant un signal de parole
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP4445328B2 (ja) * 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法
US7706481B2 (en) * 2004-08-20 2010-04-27 Broadcom Corporation Method and system for improving reception in wired and wireless receivers through redundancy and iterative processing
US20060059411A1 (en) * 2004-09-16 2006-03-16 Sony Corporation And Sony Electronics, Inc. Method and system for increasing channel coding gain
KR100708123B1 (ko) * 2005-02-04 2007-04-16 삼성전자주식회사 자동으로 오디오 볼륨을 조절하는 방법 및 장치
JP4606264B2 (ja) * 2005-07-19 2011-01-05 三洋電機株式会社 ノイズキャンセラ
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
US8024192B2 (en) 2006-08-15 2011-09-20 Broadcom Corporation Time-warping of decoded audio signal after packet loss
CN101366080B (zh) * 2006-08-15 2011-10-19 美国博通公司 一种更新解码器的状态的方法和系统
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
CN100578618C (zh) * 2006-12-04 2010-01-06 华为技术有限公司 一种解码方法及装置
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
EP2242048B1 (en) * 2008-01-09 2017-06-14 LG Electronics Inc. Method and apparatus for identifying frame type
CN101894565B (zh) * 2009-05-19 2013-03-20 华为技术有限公司 语音信号修复方法和装置
US8344186B2 (en) * 2010-02-02 2013-01-01 Celanese International Corporation Processes for producing ethanol from acetaldehyde
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
ES2952973T3 (es) * 2014-01-15 2023-11-07 Samsung Electronics Co Ltd Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal
CN106683681B (zh) * 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
FR2742568B1 (fr) 1995-12-15 1998-02-13 Catherine Quinquis Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application
FR2762464B1 (fr) * 1997-04-16 1999-06-25 France Telecom Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere"

Also Published As

Publication number Publication date
WO1999040573A1 (fr) 1999-08-12
US6408267B1 (en) 2002-06-18
CA2285650A1 (fr) 1999-08-12
BR9904776A (pt) 2000-03-08
ES2209383T3 (es) 2004-06-16
FR2774827B1 (fr) 2000-04-14
EP1051703A1 (fr) 2000-11-15
DE69911169D1 (de) 2003-10-16
CN1263625A (zh) 2000-08-16
EP1051703B1 (fr) 2003-09-10
JP2001511917A (ja) 2001-08-14
KR100395458B1 (ko) 2003-08-25
JP3565869B2 (ja) 2004-09-15
BRPI9904776B1 (pt) 2015-07-14
AU756082B2 (en) 2003-01-02
DE69911169T2 (de) 2004-06-17
CA2285650C (fr) 2003-09-16
FR2774827A1 (fr) 1999-08-13
AU2170699A (en) 1999-08-23
HK1027892A1 (en) 2001-01-23
CN1133151C (zh) 2003-12-31

Similar Documents

Publication Publication Date Title
KR100395458B1 (ko) 전송에러보정을 갖는 오디오신호 디코딩방법
US6202046B1 (en) Background noise/speech classification method
US6134518A (en) Digital audio signal coding using a CELP coder and a transform coder
EP1088205B1 (en) Improved lost frame recovery techniques for parametric, lpc-based speech coding systems
US5574825A (en) Linear prediction coefficient generation during frame erasure or packet loss
US5450449A (en) Linear prediction coefficient generation during frame erasure or packet loss
RU2419891C2 (ru) Способ и устройство эффективной маскировки стирания кадров в речевых кодеках
EP0877355B1 (en) Speech coding
EP2026330B1 (en) Device and method for lost frame concealment
EP0673017A2 (en) Excitation signal synthesis during frame erasure or packet loss
US5717822A (en) Computational complexity reduction during frame erasure of packet loss
US7302385B2 (en) Speech restoration system and method for concealing packet losses
US6871175B2 (en) Voice encoding apparatus and method therefor
US8078457B2 (en) Method for adapting for an interoperability between short-term correlation models of digital signals
EP0747884A2 (en) Codebook gain attenuation during frame erasures
KR20070059860A (ko) 디지털 오디오 패킷 손실을 복구하기 위한 방법 및 장치
KR20100084632A (ko) 복잡성 분배를 이용하는 디지털 신호에서의 전송 에러 위장
KR100594599B1 (ko) 수신단 기반의 패킷 손실 복구 장치 및 그 방법
Hayashi et al. 8 kbit/s short and medium delay speech codecs based on CELP coding
MXPA99009122A (en) Method for decoding an audio signal with transmission error correction

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120802

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20130805

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20160801

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20180801

Year of fee payment: 16

EXPY Expiration of term