KR101228165B1 - 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체 - Google Patents

프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체 Download PDF

Info

Publication number
KR101228165B1
KR101228165B1 KR1020117000982A KR20117000982A KR101228165B1 KR 101228165 B1 KR101228165 B1 KR 101228165B1 KR 1020117000982 A KR1020117000982 A KR 1020117000982A KR 20117000982 A KR20117000982 A KR 20117000982A KR 101228165 B1 KR101228165 B1 KR 101228165B1
Authority
KR
South Korea
Prior art keywords
frame
parameter value
parameter
stored
frame error
Prior art date
Application number
KR1020117000982A
Other languages
English (en)
Other versions
KR20110040835A (ko
Inventor
라세 라크소넨
미코 타미
아드리안나 바실라체
앤시 라모
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20110040835A publication Critical patent/KR20110040835A/ko
Application granted granted Critical
Publication of KR101228165B1 publication Critical patent/KR101228165B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

인코딩된 오디오 데이터에서의 프레임 에러를 은폐하는 방법은 다수의 프레임에서 인코딩된 오디오 데이터를 수신하는 단계와, 프레임 에러를 갖는 프레임을 재구성하기 위해서 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하는 단계를 포함한다. 상기 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하는 단계는 적어도 부분적으로 상기 하나 이상의 저장된 파라미터 값에 기초하여 파라미터 값들을 도출하고 상기 도출된 파라미터 값들을 상기 프레임 에러를 갖는 프레임에 적용시키는 단계를 포함한다.

Description

프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체{METHOD AND APPARATUS FOR ERROR CONCEALMENT OF ENCODED AUDIO DATA}
본 발명은 오디오 데이터를 인코딩 및 디코딩하는 분야에 관한 것이다. 특히, 본 발명은 인코딩된 오디오 데이터에서의 에러를 은폐(concealment)하는 분야에 관한 것이다.
이 부분에서는 청구 범위에서 규정되는 본 발명에 대한 배경 기술을 제공된다. 이 부분에서의 기술되는 사항들은 추구될 수 있는 기술적 개념들을 포함하지만 이들이 반드시 기존에 착상되거나 추구되었던 기술적 개념들일 필요는 없다. 그러므로, 이 부분에서 달리 제시되지 않는다면, 이 부분에서 기술되는 사항들은 본 출원의 명세서 및 청구 범위 이전의 종래 기술이 아니며 이 부분에 포함되었다고 해서 종래 기술로서 인정하는 것이 아니다.
계층 코딩(layered coding)이라고 지칭되는 임베디드 가변 레이트 코딩(embedded variable rate coding)은 일반적으로 비트 스트림의 서브세트가 양호한 품질로 디코딩될 수 있도록 비트 스트림을 생성하는 음성 코딩 알고리즘을 말한다. 통상적으로, 코어 코덱(core codec)은 저 비트 레이트로 동작하며 (가령, 가능하게는 주파수 대역폭을 확장하거나 코딩의 입도(granularity)를 개선하는 것과 같이) 출력 품질을 개선하기 위해서 다수의 계층들이 코어 코덱의 상부 상에서 사용된다. 디코더에서, 상기 코어 코덱에 대응하는 비트 스트림의 부분만이 디코딩되거나 또한 이에 추가하여 상기 코어 코덱의 상부 상의 하나 이상의 계층에 대응하는 전체 비트 스트림 또는 이의 일부가 디코딩되어서 출력 신호가 생성된다.
ITU-T(International Telecommunication Union Telecommunication Standardization Sector)는 G.718 (EV-VBR로 알려짐) 임베디드 가변 레이트 음성 코덱 및 G.729.1 임베디드 가변 레이트 음성 코덱에 대한 SWB(super-wideband) 확장(extensions) 및 스테레오 확장을 개발 중에 있다. 상기 EV-VBR 코덱의 주파수 대역을 7 kHz에서 14 kHz로 확장하는 SWB 확장 및 표준화될 스테레오 확장은 음성과 오디오 코딩 간의 간격을 줄인다. G.718 및 G.729.1은 그 상부 상에 확장이 도입될 수 있는 코어 코덱들의 실례들이다.
무선 통신 네트워크 및 패킷 네트워크에서 채널 에러가 발생한다. 이러한 채널 에러로 인해서 수신기에 도달하는 데이터 세그먼트 중 몇몇이 변질되며(가령, 비트 에러에 의해 오염되며), 데이터 세그먼트 중 몇몇은 전적으로 유실되거나 소거될 수 있다. 가령, G.718 코덱 및 G.729.1 코덱의 경우에는, 채널 에러로 인해서 프레임이 소거된 문제를 처리해야 한다. 따라서, SWB (및 스테레오) 확장 시에 채널 에러에 강인한 방식을 제공할 필요가 있고, 특히 G.718 코덱의 측면에서 그러하다.
본 발명의 일 측면에 따라서, 인코딩된 오디오 데이터에서의 프레임 에러 은폐(concealment) 방법이 제공되며, 이 방법은 다수의 프레임에서 인코딩된 오디오 데이터를 수신하는 단계와, 프레임 에러를 갖는 프레임을 재구성하기 위해서 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하는 단계를 포함한다. 상기 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하는 단계는 적어도 부분적으로 상기 하나 이상의 저장된 파라미터 값에 기초하여 파라미터 값들을 도출하고 상기 도출된 파라미터 값들을 상기 프레임 에러를 갖는 프레임에 적용시키는 단계를 포함한다.
일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값에 대응한다.
일 실시예에서, 상기 저장된 파라미터 값은 고 주파수 내의 주기적 성분을 유지하도록 스케일링된다.
일 실시예에서, 상기 저장된 파라미터 값은 MDCT(modified discrete cosine transform) 스펙트럼 값을 포함한다. 상기 MDCT 스펙트럼 값은 다음에 따라서 고 주파수 범위 전체에 대해서 스케일링된다.
Figure 112011003076327-pct00001
일 실시예에서, 상기 저장된 파라미터 값은 사인 성분 값을 포함한다. 이 사인 성분 값은 다음에 따라서 스케일링된다.
Figure 112011003076327-pct00002
일 실시예에서, 상기 스케링일은 긴 에러 버스트 동안에 에너지를 점진적으로 감소시키도록 구성된다.
본 발명의 다른 측면에 따라서, 디코더를 포함하는 장치가 제공되되, 상기 디코더는 다수의 프레임에서 인코딩된 오디오 데이터를 수신하고, 프레임 에러를 갖는 프레임을 재구성하기 위해서 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용한다. 상기 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하는 동작은 상기 하나 이상의 저장된 파라미터 값을 스케일링하고 이 스케일링된 값을 상기 프레임 에러를 갖는 프레임에 적용시킨다.
일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값에 대응한다.
일 실시예에서, 상기 저장된 파라미터 값은 고 주파수 내의 주기적 성분을 유지하도록 스케일링된다.
일 실시예에서, 상기 저장된 파라미터 값은 MDCT 스펙트럼 값을 포함한다. 상기 MDCT 스펙트럼 값은 다음에 따라서 고 주파수 범위 전체에 대해서 스케일링된다.
Figure 112011003076327-pct00003
일 실시예에서, 상기 저장된 파라미터 값은 사인 성분 값을 포함한다. 이 사인 성분 값은 다음에 따라서 스케일링된다.
Figure 112011003076327-pct00004
일 실시예에서, 상기 스케링일은 긴 에러 버스트 동안에 에너지를 점진적으로 감소시키도록 구성된다.
본 발명의 또 다른 측면에 따라서, 프로세서 및 이 프로세서에 통신 가능하게 접속된 메모리 유닛을 포함하는 장치가 제공된다. 상기 메모리 유닛은 상기 장치로 하여금 다수의 프레임에서 인코딩된 오디오 데이터를 수신하게 하는 컴퓨터 코드와, 프레임 에러를 갖는 프레임을 재구성하기 위해서 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하기 위한 컴퓨터 코드를 포함한다. 상기 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하기 위한 컴퓨터 코드는 상기 하나 이상의 저장된 파라미터 값을 스케일링하기 위한 컴퓨터 코드와 상기 스케일링된 값을 상기 프레임 에러를 갖는 프레임에 적용시키기 위한 컴퓨터 코드를 포함한다.
일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값에 대응한다.
일 실시예에서, 상기 저장된 파라미터 값은 고 주파수 내의 주기적 성분을 유지하도록 스케일링된다.
일 실시예에서, 상기 저장된 파라미터 값은 MDCT 스펙트럼 값을 포함한다. 상기 스케일링하기 위한 컴퓨터 코드는 상기 MDCT 스펙트럼 값을 다음에 따라서 고 주파수 범위 전체에 대해서 스케일링하도록 구성된다.
Figure 112011003076327-pct00005
일 실시예에서, 상기 저장된 파라미터 값은 사인 성분 값을 포함한다. 상기 스케일링하기 위한 컴퓨터 코드는 상기 사인 성분 값을 다음에 따라서 스케일링하도록 구성된다.
Figure 112011003076327-pct00006
일 실시예에서, 상기 스케링일하기 위한 컴퓨터 코드는 긴 에러 버스트 동안에 에너지를 점진적으로 감소시키도록 구성된다.
본 발명의 또 다른 측면에 따라서, 컴퓨터 판독가능한 매체 상에 포함되는 컴퓨터 프로그램 제품이 제공된다. 이 컴퓨터 프로그램 제품은 다수의 프레임에서 인코딩된 오디오 데이터를 수신하게 하는 컴퓨터 코드와, 프레임 에러를 갖는 프레임을 재구성하기 위해서 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하기 위한 컴퓨터 코드를 포함한다. 상기 하나 이상의 저장된 파라미터 값을 사용하기 위한 컴퓨터 코드는 상기 하나 이상의 저장된 파라미터 값을 스케일링하기 위한 컴퓨터 코드와 상기 스케일링된 값을 상기 프레임 에러를 갖는 프레임에 적용시키기 위한 컴퓨터 코드를 포함한다.
일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값에 대응한다.
일 실시예에서, 상기 저장된 파라미터 값은 고 주파수 내의 주기적 성분을 유지하도록 스케일링된다.
일 실시예에서, 상기 저장된 파라미터 값은 MDCT 스펙트럼 값을 포함한다. 상기 스케일링하기 위한 컴퓨터 코드는 상기 MDCT 스펙트럼 값을 다음에 따라서 고 주파수 범위 전체에 대해서 스케일링하도록 구성된다.
Figure 112011003076327-pct00007
일 실시예에서, 상기 저장된 파라미터 값은 사인 성분 값을 포함한다. 상기 스케일링하기 위한 컴퓨터 코드는 상기 사인 성분 값을 다음에 따라서 스케일링하도록 구성된다.
Figure 112011003076327-pct00008
일 실시예에서, 상기 스케링일하기 위한 컴퓨터 코드는 긴 에러 버스트 동안에 에너지를 점진적으로 감소시키도록 구성된다.
본 발명의 다양한 실시예들의 상술한 장점과 특징 및 이와 다른 장점 및 특징뿐만 아니라 본 발명의 다양한 실시예들의 동작 방식 및 구성이 다음의 첨부 도면을 참조하여 이하의 본 발명에 대한 상세한 설명 부분을 독해하면 명백하게 이해될 것이다.
본 발명의 예시적인 실시예들이 다음의 첨부 도면을 참조하여 기술될 것이다.
도 1은 본 발명의 실시예에 따른 예시적인 프레임 에러 은폐 방법을 설명하는 흐름도이다.
도 2(a) 및 도 2(b)는 본 발명의 실시예에 따른 프레임 에러 은폐 방법을 일반 프레임(generic frame)에 적용한 바를 나타내고 있다.
도 3(a) 및 도 3(b)는 본 발명의 실시예에 따른 프레임 에러 은폐 방법을 톤 프레임(tonal frame)에 적용한 바를 나타내고 있다.
도 4는 본 발명의 다양한 실시예들이 구현될 수 있는 시스템의 개요도이다.
도 5는 본 발명의 다양한 실시예에 따라서 사용될 수 있는 예시적인 전자 장치의 사시도이다.
도 6은 도 5의 전자 장치 내에 포함될 수 있는 회로의 개략도이다.
도 7은 본 발명에 따른 다양한 실시예들이 구현될 수 있는 일반 멀티미디어 통신 시스템의 개략적 블록도이다.
다음의 상세한 설명 부분에서, 본 발명에 대한 세부 사항들이 본 발명의 철저한 이해를 돕기 위해서 본 발명을 한정하는 방식이 아닌 단지 예를 드는 방식으로 제시될 것이다. 그러나, 본 발명은 이하에서 기술되는 세부 사항과는 다른 실시예에 따라서 역시 구현될 수 있다는 바는 본 기술 분야의 당업자에게는 자명할 것이다.
프레임이 소거되면 코어 코덱 출력이 왜곡될 수 있다. 이러한 프레임 소거로 인한 지각적 영향은 G.718과 같은 코덱에서 사용되고 있는 기존의 메카니즘에 의해서 최소화될 수 있지만, 특히 유실된 프레임의 개수가 상당할 때에는 시간 영역 및 주파수 영역 모두에서 신호 형상이 크게 영향을 받을 수 있다. 확장 코딩을 위해서 사용되는 방식 중 하나의 실례는 저 주파수 콘텐츠를 고주파수 콘텐츠로 맵핑하는 것이다. 이러한 방식에서, 저 주파수 콘텐츠 상에서 프레임 소거가 발생하면 고주파수 콘텐츠에서 신호 품질이 영향을 받을 수 있다. 이로써, 재구성된 출력 신호에서 감지할 수 있는 불쾌한 왜곡이 발생할 수 있다.
상술한 바와 같은 G.718 코덱 및 G.729.1 코덱과 같은 코어 코덱에 대한 확장 코딩 프레임워크의 실례는 2 개의 모드를 사용할 수 있다. 일 모드는 주기적 고주파수 범위를 나타내는 톤 신호(tonal singal)를 처리하도록 최적화된 톤 코딩 모드(tonal coding mode)일 수 있다. 두 번째 모드는 다른 타입의 프레임을 처리하는 일반 코딩 모드일 수 있다. 확장 코딩은 가령 MDCT(modified discrete cosine tranform) 영역에서 동작할 수 있다. 다른 실시예에서, FFT(Fast Fourier Transform)과 같은 다른 변환 영역이 사용될 수 있다. 톤 코딩 모드에서, 지각적으로 가장 유사한 신호 성분들을 서로 근사화시키는 사인파(sinusoids)가 가령 MDCT 스펙트럼과 같은 변환 영역 스펙트럼에 삽입된다. 일반 코딩 모드에서는, 고주파수 범위는 하나 이상의 주파수 대역들로 분할되고 각 주파수 대역에서 고주파수 콘텐츠와 가장 유사한 저 주파수 구역이 (가령, 2 개의 개별적인 이득 계수(gain factor)와 같은) 이득 계수 세트를 사용하여 고 주파수에 대해 맵핑된다. 이러한 기술의 일 변형이 "대역폭 확장 기술"로 일반적으로 지칭된다.
본 발명의 실시예들은 프레임 에러 은폐(concealment)를 위해서 일반 코딩 모드 및 톤 코딩 모드를 채용하는 상술한 예시적인 프레임워크의 확장 코딩 파라미터를 사용하여 비정상적인 아티팩트의 수를 최소화시키고 프레임 에러 동안 확장부의 지각적 신호 특성을 유지한다.
일 실시예에서, 프레임 에러 은폐는 프레임 기반 분류 동작, 저 주파수를 고 주파수로 맵핑함으로써 상부 주파수 범위가 구성되는 일반 코딩 모드(가령, 대역폭 확장 모드) 동작 및 다수의 사인 성분을 삽입함으로써 프레임이 인코딩되는 톤 코딩 모드 동작을 포함하는 확장 코딩 프레임워크의 일부로서 구현된다. 다른 실시예에서, 프레임 에러 은폐는 프레임을 분류하지 않고서 모든 프레임에 대해서 상기 방법들의 조합(즉, 일반 코딩 모드 및 톤 코딩 모드에서 사용되는 메카니즘들의 조합)을 사용하는 확장 코딩 프레임워크의 일부로서 구현된다. 또 다른 실시예에서, 일반 코딩 모드 및 톤 코딩 모드와 더불어 추가적인 코딩 모드가 사용된다.
가령 G.718 코어 코덱 코딩과 같은 소정의 코어 코덱 코딩과 결합되어 사용되는 확장 코딩은 프레임 에러 은폐를 위해서 사용될 수 있는 다양한 파라미터를 제공한다. 이러한 확장 코딩 프레임워크에서 가용한 파라미터들은 코어 코덱 코딩 모드 파라미터, 확장 코딩 모드 파라미터, 일반 코딩 모드 파라미터(가령, 대역들에 대한 지연 인덱스(lag index), 주파수 대역 맵핑을 위한 이득 계수 세트, 시간 영역 에너지 조절 파라미터 및 톤 코딩 모드에 사용되는 바와 유사한 파라미터들) 및 톤 코딩 모드 파라미터들(가령, 사인 위치, 부호 및 진폭)을 포함한다. 또한, 처리된 신호는 단일 채널로 구성되거나 (가령, 스테레오 신호와 같이) 다수의 채널로 구성될 수 있다.
본 발명의 실시예에 따르면 긴 에러 버스트에 대해 에너지를 감소시키면서 개별 프레임 에러에 있어서 고 주파수를 앞선 프레임에서와 지각적으로 유사하게 유지시킬 수 있다. 이로써, 본 발명의 실시예들은 상기와 같이 확장된 부분을 포함하는 신호(가령, SWB 신호)에서 코어 코덱 출력으로만 구성된 신호(가령, WB 신호)로 스위칭하는데 사용될 수 있고, 이는 비트스트림이 디코딩되기 이전에 절단되는 때에, 가령 임베디드 스케일가능한 코딩 또는 전송 시에 발생할 수 있다.
톤 코딩 모드는 고 주파수에서 주기적 성질을 갖는 신호의 부분에 대해서 일반적으로 사용되기 때문에, 본 발명의 특정의 실시예들에서는 프레임 에러 동안에 불연속 점이 생성되기보다는 그러한 품질들이 신호 내에서 보존됨이 가정된다. 몇몇 프레임에서 에너지 레벨을 급격하게 변화시키게 되면 지각적으로 거슬리는 효과가 생성되지만, 일반 프레임 내에서의 목적은 에러가 있는 출력을 감쇠시키는 것일 수 있다. 본 발명의 특정의 실시예들에 따르면, 에너지를 감소시키는 것이 느리게 이루어지며, 이로써 단일 프레임 에러 동안에 이전의 프레임 또는 프레임들의 지각적 특성을 유지할 수 있다. 이와 관련하여, 본 발명의 실시예들은 확장된 부분을 갖는 코덱 출력에서 오직 코어 코덱으로만 구성된 출력으로 스위칭하는데 유용하다(가령, SWB 계층들의 말단이 절단될 때에 SWB에서 WB로 스위칭하는데 유용하다). MDCT의 중첩-부가 성질(overlap-add nature)로 인해서, 이전의 유효한 프레임으로부터 기여된 부분이 제 1 소거된 프레임(또는 비트스트림의 말단이 절단된 바로 후의 프레임)에 영향을 주며, 에너지를 서서히 감소시키는 것과 제로 값을 갖는 샘플들로 구성된 프레임을 삽입하는 것 간의 차이는 몇몇 신호에 대해서는 반드시 현저하게 되지는 않는다.
본 발명의 실시예에 따른 프레임 에러 은폐 프로세스(200)의 실례를 나타내는 도 1을 참조한다. 본 발명의 다양한 실시예들을 구현하기 위해서, 하나 이상의 이전 프레임으로부터의 고 계층 MDCT 스펙트럼 및 가령 위치, 부호 및 진폭과 같은 사인파 성분에 대한 정보가, 만일에 프레임 에러가 있으면, 다음 프레임에서 사용되기 위해서 메모리 내에 저장된다(단계(202)). 단계(204)에서, 이 프로세스는 다음 프레임으로 진행하고, 단계(206)에서, 프레임 에러가 존재하는지의 여부가 판정된다. 프레임 에러가 존재하지 않는다면, 프로세스는 단계(202)로 들어가서 상술된 바와 같은 파라미터들을 저장한다. 이로써, 프레임 에러 동안에, 상기 하나 이상의 이전의 프레임의 MDCT 스펙트럼은 사용할 수 있게 되고, 처리되어, 가령 스케일링 다운되어 현 프레임을 위한 고 주파수 기여 부분으로서 전달된다. 또한, MDCT 스펙트럼 내의 가령 위치, 부호 및 진폭과 같은 사인파 성분에 대한 정보가 알려진다. 이로써, 재구성된 프레임이 생성된다(단계(208)).
도 2(a), 도 2(b), 도 3(a) 및 도 3(b)는 본 발명의 실시예에 따른 프레임 에러 은폐 방법을 구체적으로 구현한 예를 설명하고 있다. 도 2(a) 및 도 2(b)는 본 발명의 실시예에 따른 프레임 에러 은폐 방법을 일반 프레임(generic frame)에 적용한 바를 나타내고 있다. 이와 관련하여, 도 2(a)는 어떠한 프레임 에러도 존재하지 않는 유효한 프레임(210)의 스펙트럼을 나타내고 있다. 상술한 바와 같이, 상기 유효한 하나 이상의 이전의 프레임(210)으로부터의 고 계층 MDCT 스펙트럼 및 사인 성분에 대한 정보가 저장된다. 도 2(b)는 본 발명에 따른 프레임 에러 은폐 프로세스를 적용한 후에 유실 프레임을 대체할 재구성된 프레임(220)의 스펙트럼의 실례를 나타내고 있다. 도 2(a) 및 도 2(b)에 나타난 바와 같이, 이전 프레임(도 2(a))으로부터 획득된 콘텐츠의 에너지는 보다 강하게 감쇠되는 반면에, 사인 성분(212,214,222,224)에 있어서는 감쇠 정도는 보다 약하다.
도 3(a) 및 도 3(b)는 본 발명의 실시예에 따른 프레임 에러 은폐 방법을 톤 프레임(tonal frame)에 적용한 바를 나타내고 있다. 이와 관련하여, 도 3(a)는 어떠한 프레임 에러도 존재하지 않는 유효한 프레임(230)의 스펙트럼을 나타내고, 도 3(b)는 본 발명에 따른 프레임 에러 은폐 프로세스를 적용한 후에 유실 프레임을 대체할 재구성된 프레임(24)의 스펙트럼의 실례를 나타내고 있다. 톤 프레임(230,240)의 경우에는, 도 2(a) 및 도 2(b)의 일반 프레임의 사인 성분(212,214,222,224)에 있어서의 감쇠 정도보다 더욱 약한 감쇠가 나타난다.
따라서, 본 발명의 실시예에 따르면, MDCT 스펙트럼을 처리하는 바는 다음과 같이 기술될 수 있다. 제 1 스케일링이 고 주파수 범위 전체에 대해서 다음과 같이 수행된다.
Figure 112011003076327-pct00009
제 2 스케일링은 다음과 같이 사인 성분에 대해서 적용된다.
Figure 112011003076327-pct00010
다른 실시예에서, 일정한 스케일링 계수를 모든 주파수 성분에 대해서 적용하는 대신에, 가령 고 주파수 범위의 상위 부분을 고 주파수 범위의 하위 부분보다 더 감쇠시키는 스케일링 함수를 사용할 수도 있다.
본 발명의 실시예에 따라서, 스케일링 계수 값들은 에러 은폐 프로세스에서 사용되는 선행하는 프레임들의 타입과 같은 정보에 기초하여 결정될 수 있다. 일 실시예에서, 선행하는 유효한 프레임의 확장 코딩 모드(가령, SWB 모드)만이 고려된다. 이 선행하는 유효한 프레임이 일반 프레임이면, 가령 0.5 및 0.6의 스케일링 계수가 사용된다. 톤 프레임의 경우에는, 사인 성분의 진폭에 대해서 0.9의 스케일링 계수가 사용된다. 따라서, 본 실시예에서는, 톤 프레임 내의 MDCT 스펙트럼에서는 사인 성분을 제외하고 어떠한 다른 콘텐츠도 존재하지 않으며, 그러므로, 현 프레임에 대한 MDCT 스펙트럼을 획득하기 위한 프로세스 m(k)는 크게 간소화될 수 있다. 다른 실시예에서, 톤 모드로 간주될 수 있는 모드에서는 상기 사인 성분 이외의 다른 정보도 존재한다.
특정의 실시예에서, 하나 이상의 선행 프레임들로부터의 데이터가 고려될 수 있다. 또한, 몇몇 실시예들에서는, 가령 가장 최근의 프레임이 아닌 단일 선행 프레임으로부터의 데이터가 고려될 수도 있다. 또 다른 실시예에서는, 하나 이상의 후속 프레임들로부터의 데이터가 고려될 수도 있다.
유실 프레임에 대한 MDCT 스펙트럼이 구성되면, 이 프레임은 유효 프레임과 유사한 방식으로 처리될 수 있다. 따라서, 시간 영역 신호를 획득하기 위해서 역변환이 사용될 수 있다. 특정의 실시예에서, 유실 프레임으로부터의 MDCT 스펙트럼은 프레임이 유실되어서 에러 은폐 프로세스가 작동될 필요가 있을 경우에 다음 프레임에서 사용하기 위해서 저장될 수 있다.
본 발명의 특정의 실시예에서, 시간 영역에서의 후속 스케일링이 신호에 대해 적용된다. 본 명세서에서 예시적으로 제시되면서 가령 G.718 또는 G.729.1 코덱과 함께 사용될 수 있는 프레임워크에서, 신호 다운스케일링은, 인코더 측에서 필요하다고 판단되면, 가령 각 프레임 내의 8 개의 서브프레임에 걸쳐서 매 서브프레임마다 시간 영역에서 수행될 수 있다. 본 발명의 예시적인 실시예에 따르면, 불필요하게 강한 에너지 콘텐츠를 고주파수 내에 도입하는 것을 피하기 위해서, 이러한 바를 회피하기 위해서 사용될 수 있는 2 개의 예시적인 방안이 다음과 같이 강구될 수 있다.
먼저, 선행 유효 프레임이 일반 코딩 프레임이면, 서브프레임마다 다운스케일링이 수행된다. 이 다운스케일링은 가령 선행 유효 프레임의 스케일링 값을 사용하거나 프레임 소거를 위해서 설계된 특정 스케일링 방식을 사용할 수 있다. 후자의 경우는 가령 현 프레임의 고 주파수 에너지를 간단하게 점진적으로 감소시키는 것일 수 있다.
두 번째 방안은 하나 이상의 유실된 (재구성된) 프레임들에 걸쳐서 평탄화 윈도우(smooth window)를 사용함으로써 고 주파수 대역에서의 기여 부분을 감소(ramp down)시키는 것이다. 다양한 실시예에서, 이러한 동작은 이전의 시간 영역 스케일링 대신에 수행되거나 이전의 시간 영역 스케일링에 대해 추가적으로 수행될 수 있다.
이러한 스케일링 방식에 대한 결정 로직은 본 발명의 다른 실시예에서는 더 복잡해지거나 덜 복잡해질 수 있다. 특히, 몇몇 실시예에서는, 코어 코덱 코딩 모드가 확장 코딩 모드와 함께 고려될 수 있다. 몇몇 실시예에서는, 코어 코덱의 몇몇 파라미터들이 고려될 수 있다. 일 실시예에서, 프레임 소거 상태가 하나의 프레임보다 긴 경우에 사인 성분을 더 신속하게 감쇠시키기 위해서 제 1 유실 프레임 이후에 톤 모드 플래그(tonal mode flag)는 제로로 스위칭된다.
이로써, 본 발명의 실시예에 따르면, 임의의 거슬리는 아티팩트를 도입하지 않고서 프레임 소거 또는 에러 동안에 개선된 성능이 제공되게 된다.
도 4는 본 발명의 다양한 실시예들이 구현될 수 있는 시스템(10)을 나타내고 있으며, 이 시스템(10)은 하나 이상의 네트워크를 통해서 통신하는 다수의 통신 장치들을 포함한다. 이 시스템(10)은 다음으로 한정되는 것은 아니지만 이동 전화 네트워크, 무선 LAN(Local Area Network), 블루투스 PAN(personal area network), 이더넷 LAN, 토큰 링 LAN, WAN(wide area network), 인터넷 등을 포함하는 무선 네트워크 또는 유선 네트워크의 임의의 조합을 포함한다. 이 시스템(10)은 무선 통신 장치 및 유선 통신 장치 양자를 포함한다.
예를 들자면, 도 4에 도시된 시스템(10)은 이동 전화 네트워크(11) 및 인터넷(28)을 포함한다. 인터넷(28)으로의 접속은 다음으로 한정되는 것은 아니지만 장거리 무선 접속, 단거리 무선 접속 및 다양한 유선 접속을 포함하며, 상기 유선 접속은 다음으로 한정되는 것은 아니지만 전화선, 케이블선, 전력선 등을 포함한다.
이 시스템(10)의 예시적인 통신 장치들은 다음으로 한정되는 것은 아니지만 이동 전화 형태로 된 전자 장치(12), PDA와 이동 전화의 결합형 장치(14), PDA(16), IMD(integrated messaging device)(18), 데스크탑 컴퓨터(20), 노트북 컴퓨터(22) 등을 포함한다. 이러한 통신 장치들은 정지 상태에 있거나, 이동 중인 개인이 휴대하는 경우에서와 같이 이동 상태에 있을 수 있다. 또한, 이러한 통신 장치들은 다음으로 한정되지는 않지만 자동차, 트럭, 택시, 버스, 열차, 보트, 비행기, 자전거, 오토바이 등을 포함하는 교통 수단 내에 위치할 수도 있다. 통신 장치 모두 또는 일부는 호 및 메시지를 전송 및 수신하고 기지국(24)과의 무선 접속(25)을 통해서 서비스 제공자와 통신할 수 있다. 기지국(24)은 이동 전화 네트워크(11)와 인터넷(28) 간의 통신을 허용하는 네트워크 서버(26)에 접속될 수 있다. 이 시스템(10)은 추가 통신 장치 및 다른 타입의 통신 장치를 포함할 수 있다.
이러한 통신 장치들은 다음으로 한정되는 것은 아니지만 CDMA(code division multiple access), GSM(Global System for Mobile Communications), UMTS(universal mobile telecommunication system), TDMA(time division multiple access), FDMA(frequency division multiple access), TCP/IP(transmission control protocol/internet protocol), SMS(short messaging service), MMS(multimedia messaging service), 전자 메일, IMS(instant messaging service), 블루투스, IEEE 802.11 등을 포함하는 다양한 전송 기술들을 사용하여 통신할 수 있다. 본 발명의 다양한 실시예들을 구현할 시에 사용되는 통신 장치는 다음으로 한정되지 않지만 무선, 자외선, 레이저, 케이블 접속 등을 포함하는 다양한 매체를 사용하여 통신할 수 있다.
도 5 및 도 6은 본 발명의 실시예에 따른 네트워크 노드로서 사용될 수 있는 일 대표적인 전자 장치(28)를 도시하고 있다. 그러나, 본 발명의 범위는 이러한 특정 타입의 전자 장치로 한정되지 않는다. 도 5 및 도 6의 전자 장치(28)는 하우징(30), 액정 디스플레이 형태의 디스플레이(32), 키패드(34), 마이크로폰(36), 이어 피스(38), 배터리(40), 적외선 포트(42), 안테나(44), 일 실시예에 따라 UICC 형태로 된 스마트 카드(46), 카드 리더(48), 무선 인터페이스 회로(52), 코덱 회로(54), 제어기(56) 및 메모리(58)를 포함한다. 이러한 구성 요소들은 전자 장치(28)로 하여금 본 발명의 다양한 실시예에 따라서 다양한 메시지를 네트워크 상에 상주하는 다른 장치로/로부터 송신/수신하게 한다. 개별 구성 요소 또는 회로들은 가령 노키아(Nokia) 사의 이동 전화와 같은 본 기술 분야에서 잘 알려진 타입의 회로 또는 요소들이다.
도 7은 본 발명의 다양한 실시예들이 구현될 수 있는 일반 멀티미디어 통신 시스템의 블록도이다. 도 7에 도시된 바와 같이, 데이터 소스(100)는 아날로그 형태, 압축된 디지털 형태, 압축되지 않은 디지털 형태 또는 이들의 임의의 조합으로 소스 신호를 제공한다. 인코더(110)는 소스 신호를 코딩된 미디어 비트스트림으로 인코딩한다. 디코딩될 비트스트림이 실제로 임의의 타입의 네트워크 내에 위치하는 원격 디바이스로부터 직접 또는 간접적으로 수신될 수 있음을 주목할 필요가 있다. 또한, 비트스트림은 로컬 하드웨어 또는 소프트웨어부터 수신될 수 있다. 인코더(110)는 오디오 및 비디오와 같은 하나 이상의 미디어 타입을 인코딩할 수 있다. 또는, 하나 이상의 인코더(110)가 상이한 미디어 타입의 소스 신호를 코딩할 필요가 있을 수도 있다. 또한, 인코더(110)는 그래픽과 텍스트와 같은 합성하여 생성된 입력을 수신하거나 인코더(110)는 코딩된 합성 미디어 비트스트림을 생성할 수도 있다. 이후부터는, 오직 일 미디어 타입으로 된 하나의 코딩된 미디어 비트스트림을 처리하는 동작만이 발명의 설명을 간단하게 하기 위해서 고려될 것이다. 그러나, 통상적으로 실시간 브로드캐스트 서비스는 몇 개의 스트림(통상적으로, 적어도 하나의 오디오 스트림, 비디오 스트림 및 텍스트 서브 타이틀 스트림)을 포함한다. 또한, 이 시스템은 다수의 인코더를 포함할 수 있지만 도 7에서는 오직 하나의 인코더(110)만이 나타나 있는데 그 이유는 보편성을 해치지 않고서 발명의 설명을 단순화시키기 위해서이다. 또한, 본 명세서에서 포함된 텍스트 및 실례들이 인코딩 프로세스를 상세하게 설명하고 있을지라도, 동일한 원리 및 개념이 대응하는 디코딩 프로세스에도 적용될 수 있음을 본 기술 분야의 당업자는 이해할 것이다. 물론, 디코딩 프로세스의 원리 및 개념이 인코딩 프로세스에도 적용될 수 있음도 이해할 것이다.
상기 코딩된 미디어 비트스트림은 저장 장치(120)에 전달된다. 이 저장 장치(120)는 상기 코딩된 미디어 비트스트림을 저장할 수 있는 임의의 타입의 대용량 메모리를 포함한다. 저장 장치(120) 내에서의 상기 코딩된 미디어 비트스트림의 포맷은 기본적인 자체 포함형(self-contained) 비트스트림 포맷이거나, 하나 이상의 코딩된 미디어 비트스트림은 콘테이너 파일 내에 인캡슐레이팅될 수 있다(encapsulated). 몇몇 시스템은 실황으로 동작하기에 이 저장 장치가 필요 없으며 상기 코딩된 미디어 비트스트림을 상기 인코더(110)에서 송신기(130)에 바로 전달한다. 이어서, 코딩된 미디어 비트스트림이 필요에 따라서 서버로 지칭되는 송신기(130)에 전달된다. 전송 시에 사용되는 포맷은 기본적인 자체 포함형 비트스트림 포맷이거나 패킷 스트림 포맷이다. 또는, 하나 이상의 코딩된 미디어 비트스트림이 콘테이너 파일 내에 인캡슐레이팅된다. 인코더(110), 저장 장치(120) 및 서버(130)는 동일한 물리적 장치 내에 상주하거나 서로 개별 장치 내에 포함될 수 있다. 인코더(110) 및 서버(130)는 실시간 실황 방식으로 동작할 수 있다. 이 경우에, 상기 코딩된 미디어 비트스트림은 통상적으로 영구적으로 저장되지 않고, 프로세싱 지연 편차, 데이터 전달 편차 및 코딩된 미디어 비트레이트 편차가 제거되도록 콘텐츠 인코더(110) 및/또는 서버(130) 내에서 짧은 기간 동안만 버퍼링된다.
서버(130)는 통신 프로토콜 스택을 사용하여 상기 코딩된 미디어 비트스트림을 전송한다. 이 통신 프로토콜 스택은 다음으로 한정되지는 않지만 RTP(Real-Time Transport Protocol), UDP(User Datagram Protocol) 및 인터넷 프로토콜(IP)을 포함한다. 이 통신 프로토콜 스택이 패킷 지향형일 경우에, 서버(130)는 코딩된 미디어 비트스트림을 패킷 내로 인캡슐레이팅한다. 예를 들어, RTP가 사용되는 경우, 서버(130)는 상기 코딩된 미디어 비트스트림을 RTP 페이로드 포맷(payload format)에 따라서 RTP 패킷 내로 인캡슐레이팅한다. 통상적으로, 각 미디어 타입은 전용 RTP 페이로드 포맷을 갖는다. 시스템은 하나 이상의 서버(130)를 포함할 수 있지만, 설명을 단순하게 하기 위해서, 다음의 설명 부분에서는 오직 하나의 서버(130)만을 고려할 것이다.
서버(130)는 통신 네트워크를 통해서 게이트웨이(140)에 온/오프 방식으로 접속 가능하다. 게이트웨이(140)는 일 통신 프로토콜 스택에 따른 패킷 스트림을 다른 통신 프로토콜 스택에 따른 패킷 스트림으로 변환시키는 기능, 데이터 스트림을 병합 및 포킹(forking)하는 기능 및 우세한 다운링크 네트워크 상태에 따라서 포워딩된 스트림의 비트 레이트를 제어하는 것과 같이 다운링크 능력 및/또는 수신기 능력에 따라서 데이터 스트림을 조작하는 기능과 같은 상이한 타입의 기능들을 수행한다. 게이트웨이(140)의 실례들은 MCU, 서킷 스위칭형 비디오 전화와 패킷 스위칭형 비디오 전화 간의 게이트웨이, POC(Push-to-talk over Cellular) 서버, DVB-H(digital video broadcasting-handheld) 시스템 내의 IP 인캡슐레이터(encapsulator) 또는 브로드캐스트 전송 신호를 홈 무선 네트워크로 국부적으로 포워딩하는 셋탑 박스를 포함한다. RTP가 사용되면, 게이트웨이(140)는 RTP 믹서 또는 RTP 변환기로서 지칭되고 통상적으로 RTP 접속의 엔드포인트로서 기능한다.
시스템은 통상적으로 전송된 신호를 수신하여 코딩된 미디어 비트스트림으로 복조 및 디캡슐레이팅(de-capsulating)할 수 있는 하나 이상의 수신기(150)를 포함한다. 이 코딩된 미디어 비트스트림은 기록 저장 장치(155)에 전달된다. 이 기록 저장 장치(155)는 상기 코딩된 미디어 비트스트림을 저장할 수 있는 임의의 타입의 대용량 메모리를 포함한다. 이와 달리 또는 이와 더불어, 이 기록 저장 장치(155)는 랜덤 액세스 메모리와 같은 컴퓨팅 메모리를 포함한다. 기록 저장 장치(155) 내에 저장된 코딩된 미디어 비트스트림의 포맷은 기본적인 자체 포함형 비트스트림 포맷이거나, 하나 이상의 코딩된 미디어 비트스트림이 컨테이너 파일 내에 인캡슐레이팅될 수 있다. 서로 연관된 오디오 스트림 및 비디오 스트림과 같은 다수의 코딩된 미디어 비트스트림이 존재하면, 통상적으로 컨테이너 파일이 사용되고 수신기(150)는 입력 스트림으로부터 컨테이너 파일을 생성하는 컨테이너 파일 생성기를 포함하거나 이에 부착된다. 몇몇 시스템은 실황으로 동작하기에 이 기록 저장 장치(155)가 필요 없으며 상기 코딩된 미디어 비트스트림을 상기 수신기(150)에서 디코더(160)에 바로 전달한다. 몇몇 시스템에서는, 가령 기록된 스트림 중 가장 최근의 10 분 발췌분과 같은 기록된 스트림 중 가장 최근의 부분만이 기록 저장 장치(155) 내에 유지되며, 임의의 보다 조기의 기록된 데이터는 기록 저장 장치(155)로부터 폐기된다.
상기 코딩된 미디어 비트스트림은 기록 저장 장치(155)에서 디코더(160)에 전달된다. 컨테이너 파일 내로 인캡슐레이팅된, 서로 관련된 오디오 스트림 및 비디오 스트림과 같은 다수의 코딩된 미디어 비트스트림이 존재한다면, 파일 파서(file parser)(미도시)가 사용되어서 각 코딩된 미디어 비트스트림을 상기 컨테이너 파일로부터 디캡슐레이팅한다. 기록 저장 장치(155) 또는 디코더(160)는 파일 파서를 포함할 수 있다. 또는, 파일 파서가 기록 저장 장치(155) 또는 디코더(160)에 부착될 수 있다.
통상적으로, 상기 코딩된 미디어 비트스트림은 디코더(160)에 의해서 더 처리되며, 이 디코더(160)의 출력은 하나 이상의 압축되지 않은 미디어 스트림이다. 마지막으로, 랜더러(renderer)(170)가 상기 압축되지 않은 미디어 스트림을 가령 스피커 또는 디스플레이를 사용하여 재생한다. 수신기(150), 기록 저장 장치(155), 디코더(160) 및 랜더러(170)는 동일한 물리적 장치 내에 상주하거나, 서로 개별적으로 장치 내에 포함될 수 있다.
본 발명의 다양한 실시예에 따른 송신기(130)는 수신기(150)의 요청 또는 그 상에서 비트스트림이 전달되는 네트워크의 주요한(prevailing) 상태에 응답하는 것과 같은 여러 이유로 해서 상기 전달된 계층들을 선택하도록 구성될 수 있다. 상기 수신기로부터의 요청은 가령 디스플레이할 계층을 변경하라는 요청이거나 이전의 장치와 비교하여 상이한 능력을 갖는 랜더링 장치에 대한 변경 요청일 수 있다.
지금까지 기술된 다양한 실시예들은, 일 실시예로서, 네트워크 환경에서 컴퓨터에 의해서 실행되는 프로그램 코드와 같은 컴퓨터 실행가능한 인스트럭션을 포함하는 컴퓨터 판독 가능한 매체 내에서 실현되는 컴퓨터 프로그램 제품에 의해서 구현될 수 있는 방법 또는 프로세스의 단계들이라는 일반적인 상황으로 기술되었다. 컴퓨터 판독가능한 매체는 다음으로 한정되지 않지만 ROM(read only memory), RAM(random access memory), CD(compact disc), DVD(digital versatile disc) 등을 포함하는 분리형 저장 장치 및 고정형 저장 장치를 포함한다. 일반적으로, 프로그램 모듈들은 특정 작업을 수행하거나 특정 추상 데이터 타입을 구현하는 루틴, 프로그램, 객체, 구성 요소, 데이터 구조 등을 포함한다. 컴퓨터 실행가능한 인스트럭션, 관련 데이터 구조 및 프로그램 모듈은 본 명세서에서 개시된 방법의 여러 단계를 실행하기 위한 프로그램 코드의 실례를 나타낸다. 이러한 실행 가능한 인스트럭션들 또는 관련 데이터 구조들의 특정 시퀀스는 본 명세서에서 개시된 방법 또는 프로세스에서의 단계들에서 기술된 여러 기능들을 실행하기 위한 대응하는 동작들의 실례들을 나타낸다.
본 발명의 실시예들은 소프트웨어, 하드웨어, 애플리케이션 로직 또는 이들의 임의의 조합으로 구현될 수 있다. 소프트웨어, 애플리케이션 로직 및/또는 하드웨어는 가령 칩세트, 이동 장치, 데스크탑, 랩탑 또는 서버 상에 상주할 수 있다. 본 발명의 다양한 실시예들을 소프트웨어 또는 웹에서 구현하는 바는 다양한 데이터베이스 탐색 단계 또는 프로세스, 다양한 상관 단계 또는 프로세스, 다양한 비교 단계 또는 프로세스, 다양한 결정 단계 또는 프로세스 등을 수행하는 규칙 기반형 로직 및 다른 로직을 구비한 표준 프로그래밍 기술들을 사용하여 이루어질 수 있다. 또한, 본 발명의 다양한 실시예들은 전적으로 또는 부분적으로 네트워크 요소 또는 네트워크 모듈 내에서 구현될 수 있다. 본 명세서 및 다음의 청구 범위에서 사용되는 용어 "구성 요소" 및 "모듈"은 소프트웨어 코드의 하나 이상의 라인들, 및/또는 하드웨어적 구현 수단 및/또는 수동 입력 사항을 수신하는 장치를 사용하는 임의의 구현 수단 또는 구현 부분을 포함한다.
지금까지 설명된 본 발명의 예시적인 실시예들은 본 발명을 단지 예시적으로 설명하기 위해서 제공되었다. 따라서, 위의 설명들이 망라적인 것은 아니지만, 위에서 개시된 특정 형태로 본 발명을 한정하지도 않는다. 본 발명의 상술한 교시 사항의 조명 하에서 다양한 수정 및 변경 사항이 역시 가능하다. 또한, 다양한 실시예들을 실시함으로부터 다양한 수정 및 변경이 획득될 수 있다. 본 기술 분야의 당업자에게 본 발명의 원리 및 특성을 설명하고 또한 본 발명의 실제적 응용 실례를 제시하기 위해서 위에서 설명된 실시예들이 선택되었고 기술되었다. 따라서, 본 기술 분야의 당업자는 본 발명을 다양한 실시예로 해서 필요하다면 특정 사용 상황에 적합하게 수정된 변경 사항과 함께 구현할 수 있다. 위에서 설명된 실시예들의 특징들은 방법, 장치, 모듈, 시스템 및 컴퓨터 프로그램 제품의 모든 가능한 조합으로 결합될 수 있다.
본 발명의 일 측면에 따라서, 인코딩된 오디오 데이터에서의 프레임 에러를 은폐하는 방법이 제공되며, 이 방법은 다수의 프레임에서 인코딩된 오디오 데이터를 수신하는 단계와, 프레임 에러를 갖는 프레임을 재구성하기 위해서 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하는 단계를 포함한다. 상기 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하는 단계는 적어도 부분적으로 상기 하나 이상의 저장된 파라미터 값에 기초하여 파라미터 값들을 도출하고 상기 도출된 파라미터 값들을 상기 프레임 에러를 갖는 프레임에 적용시키는 단계를 포함한다.
일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값에 대응한다.
일 실시예에서, 상기 저장된 파라미터 값은 고 주파수 내의 주기적 성분을 유지하도록 스케일링된다.
일 실시예에서, 상기 저장된 파라미터 값은 MDCT(modified discrete cosine transform) 스펙트럼 값을 포함한다. 상기 MDCT 스펙트럼 값은 다음에 따라서 고 주파수 범위 전체에 대해서 스케일링된다.
Figure 112011003076327-pct00011
일 실시예에서, 상기 저장된 파라미터 값은 사인 성분 값을 포함한다. 이 사인 성분 값은 다음에 따라서 스케일링된다.
Figure 112011003076327-pct00012
일 실시예에서, 상기 스케링일은 긴 에러 버스트 동안에 에너지를 점진적으로 감소시키도록 구성된다.
본 발명의 다른 측면에 따라서, 디코더를 포함하는 장치가 제공되되, 상기 디코더는 다수의 프레임에서 인코딩된 오디오 데이터를 수신하고, 프레임 에러를 갖는 프레임을 재구성하기 위해서 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용한다. 상기 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하는 동작은 상기 하나 이상의 저장된 파라미터 값을 스케일링하고 이 스케일링된 값을 상기 프레임 에러를 갖는 프레임에 적용시킨다.
일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값에 대응한다.
일 실시예에서, 상기 저장된 파라미터 값은 고 주파수 내의 주기적 성분을 유지하도록 스케일링된다.
일 실시예에서, 상기 저장된 파라미터 값은 MDCT 스펙트럼 값을 포함한다. 상기 MDCT 스펙트럼 값은 다음에 따라서 고 주파수 범위 전체에 대해서 스케일링된다.
Figure 112011003076327-pct00013
일 실시예에서, 상기 저장된 파라미터 값은 사인 성분 값을 포함한다. 이 사인 성분 값은 다음에 따라서 스케일링된다.
Figure 112011003076327-pct00014
일 실시예에서, 상기 스케링일은 긴 에러 버스트 동안에 에너지를 점진적으로 감소시키도록 구성된다.
본 발명의 또 다른 측면에 따라서, 프로세서 및 이 프로세서에 통신 가능하게 접속된 메모리 유닛을 포함하는 장치가 제공된다. 상기 메모리 유닛은 상기 장치로 하여금 다수의 프레임에서 인코딩된 오디오 데이터를 수신하게 하는 컴퓨터 코드와, 프레임 에러를 갖는 프레임을 재구성하기 위해서 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하기 위한 컴퓨터 코드를 포함한다. 상기 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하기 위한 컴퓨터 코드는 상기 하나 이상의 저장된 파라미터 값을 스케일링하기 위한 컴퓨터 코드와 상기 스케일링된 값을 상기 프레임 에러를 갖는 프레임에 적용시키기 위한 컴퓨터 코드를 포함한다.
일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값에 대응한다.
일 실시예에서, 상기 저장된 파라미터 값은 고 주파수 내의 주기적 성분을 유지하도록 스케일링된다.
일 실시예에서, 상기 저장된 파라미터 값은 MDCT 스펙트럼 값을 포함한다. 상기 스케일링하기 위한 컴퓨터 코드는 상기 MDCT 스펙트럼 값을 다음에 따라서 고 주파수 범위 전체에 대해서 스케일링하도록 구성된다.
Figure 112011003076327-pct00015
일 실시예에서, 상기 저장된 파라미터 값은 사인 성분 값을 포함한다. 상기 스케일링하기 위한 컴퓨터 코드는 상기 사인 성분 값을 다음에 따라서 스케일링하도록 구성된다.
Figure 112011003076327-pct00016
일 실시예에서, 상기 스케링일하기 위한 컴퓨터 코드는 긴 에러 버스트 동안에 에너지를 점진적으로 감소시키도록 구성된다.
본 발명의 또 다른 측면에 따라서, 컴퓨터 판독가능한 매체 상에 포함되는 컴퓨터 프로그램 제품이 제공된다. 이 컴퓨터 프로그램 제품은 다수의 프레임에서 인코딩된 오디오 데이터를 수신하게 하는 컴퓨터 코드와, 프레임 에러를 갖는 프레임을 재구성하기 위해서 하나 이상의 이전의 프레임으로부터의 하나 이상의 저장된 파라미터 값을 사용하기 위한 컴퓨터 코드를 포함한다. 상기 하나 이상의 저장된 파라미터 값을 사용하기 위한 컴퓨터 코드는 상기 하나 이상의 저장된 파라미터 값을 스케일링하기 위한 컴퓨터 코드와 상기 스케일링된 값을 상기 프레임 에러를 갖는 프레임에 적용시키기 위한 컴퓨터 코드를 포함한다.
일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값에 대응한다. 일 실시예에서, 상기 저장된 파라미터 값은 프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값에 대응한다.
일 실시예에서, 상기 저장된 파라미터 값은 고 주파수 내의 주기적 성분을 유지하도록 스케일링된다.
일 실시예에서, 상기 저장된 파라미터 값은 MDCT 스펙트럼 값을 포함한다. 상기 스케일링하기 위한 컴퓨터 코드는 상기 MDCT 스펙트럼 값을 다음에 따라서 고 주파수 범위 전체에 대해서 스케일링하도록 구성된다.
Figure 112011003076327-pct00017
일 실시예에서, 상기 저장된 파라미터 값은 사인 성분 값을 포함한다. 상기 스케일링하기 위한 컴퓨터 코드는 상기 사인 성분 값을 다음에 따라서 스케일링하도록 구성된다.
Figure 112011003076327-pct00018
일 실시예에서, 상기 스케링일하기 위한 컴퓨터 코드는 긴 에러 버스트 동안에 에너지를 점진적으로 감소시키도록 구성된다.

Claims (28)

  1. 인코딩된 오디오 데이터에서의 프레임 에러 은폐(concealment) 방법으로서,
    다수의 프레임에서 인코딩된 오디오 데이터를 수신하는 단계와,
    프레임 에러를 갖는 프레임에 대한 적어도 하나의 파라미터를, 상기 다수의 프레임 중 적어도 하나의 다른 프레임으로부터의 적어도 하나의 저장된 파라미터 값에 기초하여서 재구성하는 단계를 포함하며,
    상기 적어도 하나의 파라미터를 재구성하는 단계는,
    제 1 방식을 사용하여서 적어도 부분적으로 상기 적어도 하나의 저장된 파라미터 값에 기초하여서 제 1 파라미터 세트의 값들을 도출하는 단계와,
    제 2 방식을 사용하여서 적어도 부분적으로 상기 적어도 하나의 저장된 파라미터 값에 기초하여서 제 2 파라미터 세트의 값들을 도출하는 단계와,
    상기 도출된 값들을 프레임 에러를 갖는 상기 프레임에 적용하는 단계를 포함하되,
    상기 제 1 파라미터 세트는 MDCT(modified discrete cosine transform) 스펙트럼 값을 포함하고,
    상기 제 2 파라미터 세트는 상기 MDCT 스펙트럼 내에 삽입된 사인파(sinusoid) 성분을 포함하는
    프레임 에러 은폐 방법.
  2. 제 1 항에 있어서,
    상기 적어도 하나의 저장된 파라미터 값은,
    프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값과,
    프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값과,
    프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값과,
    적어도 하나의 후속 프레임의 적어도 하나의 파라미터 값
    중 적어도 하나를 포함하는,
    프레임 에러 은폐 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 방식을 사용하여서 제 1 파라미터 세트에 대한 값들을 도출하는 단계는 제 1 스케일링 계수 세트를 사용하여 상기 적어도 하나의 저장된 파라미터 값을 스케일링하는 단계를 포함하며,
    상기 제 2 방식을 사용하여서 제 2 파라미터 세트에 대한 값들을 도출하는 단계는 제 2 스케일링 계수 세트를 사용하여 상기 적어도 하나의 저장된 파라미터 값을 스케일링하는 단계를 포함하는,
    프레임 에러 은폐 방법.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 파라미터 세트는 고 주파수 범위에 대한 파라미터를 포함하는,
    프레임 에러 은폐 방법.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 제 2 파라미터 세트는 상기 제 1 파라미터 세트의 서브세트(subset)를 포함하는,
    프레임 에러 은폐 방법.
  6. 삭제
  7. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 방식은
    Figure 112011003082223-pct00019

    에 따라서 상기 제 1 파라미터 세트에 대한 파라미터 값 m을 도출하는 단계를 포함하며,
    mprev는 상기 적어도 하나의 저장된 파라미터 값을 나타내고,
    facspect는 각각의 스케일링 계수를 나타내는,
    프레임 에러 은폐 방법.
  8. 제 1 항 또는 제 2 항에 있어서,
    상기 제 2 방식은
    Figure 112011003082223-pct00020

    에 따라서 상기 제 2 파라미터 세트에 대한 파라미터 값 m을 도출하는 단계를 포함하며,
    mprev는 상기 적어도 하나의 저장된 파라미터 값을 나타내고,
    facsin는 각각의 스케일링 계수를 나타내며,
    possin은 m 및 mprev 내에서 상기 제 2 파라미터 세트의 위치를 나타내는 변수인,
    프레임 에러 은폐 방법.
  9. 제 1 항 또는 제 2 항에 있어서,
    상기 파라미터 값들을 도출하는 단계는 신호 에너지를 점진적으로 감소시키는(gradually ramping down) 단계를 포함하는,
    프레임 에러 은폐 방법.
  10. 디코더를 포함하는 장치로서,
    상기 디코더는,
    다수의 프레임에서 인코딩된 오디오 데이터를 수신하고,
    프레임 에러를 갖는 프레임에 대한 적어도 하나의 파라미터를, 상기 다수의 프레임 중 적어도 하나의 다른 프레임으로부터의 적어도 하나의 저장된 파라미터 값에 기초하여서 재구성하도록 구성되되,
    상기 적어도 하나의 파라미터를 재구성하는 것은,
    제 1 방식을 사용하여 적어도 부분적으로 상기 적어도 하나의 저장된 파라미터 값에 기초하여 제 1 파라미터 세트에 대한 값들을 도출하는 것과,
    제 2 방식을 사용하여 적어도 부분적으로 상기 적어도 하나의 저장된 파라미터 값에 기초하여 제 2 파라미터 세트에 대한 값들을 도출하는 것과,
    상기 도출된 값들을 프레임 에러를 갖는 상기 프레임에 적용하는 것을 포함하되,
    상기 제 1 파라미터 세트는 MDCT 스펙트럼 값을 포함하고,
    상기 제 2 파라미터 세트는 상기 MDCT 스펙트럼 내에 삽입된 사인파 성분을 포함하는
    장치.
  11. 제 10 항에 있어서,
    상기 적어도 하나의 저장된 파라미터 값은,
    프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값과,
    프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값과,
    프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값과,
    적어도 하나의 후속 프레임의 적어도 하나의 파라미터 값
    중 적어도 하나를 포함하는,
    장치.
  12. 제 10 항 또는 제 11 항에 있어서,
    상기 제 1 방식을 사용하여 제 1 파라미터 세트에 대한 값들을 도출하는 것은 제 1 스케일링 계수 세트를 사용하여 상기 적어도 하나의 저장된 파라미터 값을 스케일링하는 것을 포함하며,
    상기 제 2 방식을 사용하여 제 2 파라미터 세트에 대한 값들을 도출하는 것은 제 2 스케일링 계수 세트를 사용하여 상기 적어도 하나의 저장된 파라미터 값을 스케일링하는 것을 포함하는
    장치.
  13. 제 10 항 또는 제 11 항에 있어서,
    상기 제 1 파라미터 세트는 고 주파수 범위에 대한 파라미터를 포함하는,
    장치.
  14. 제 10 항 또는 제 11 항에 있어서,
    상기 제 2 파라미터 세트는 상기 제 1 파라미터 세트의 서브세트를 포함하는,
    장치.
  15. 삭제
  16. 제 10 항 또는 제 11 항에 있어서,
    상기 제 1 방식은
    Figure 112011003082223-pct00021

    에 따라서 상기 제 1 파라미터 세트의 파라미터 값 m을 도출하는 것을 포함하며,
    mprev는 상기 적어도 하나의 저장된 파라미터 값을 나타내고,
    facspect는 각각의 스케일링 계수를 나타내는,
    장치.
  17. 제 10 항 또는 제 11 항에 있어서,
    상기 제 2 방식은
    Figure 112011003082223-pct00022

    에 따라서 상기 제 2 파라미터 세트에 대한 파라미터 값 m을 도출하며,
    mprev는 상기 적어도 하나의 저장된 파라미터 값을 나타내고,
    facsin는 각각의 스케일링 계수를 나타내며,
    possin은 m 및 mprev 내에서 상기 제 2 파라미터 세트의 위치를 나타내는 변수인,
    장치.
  18. 제 10 항 또는 제 11 항에 있어서,
    상기 파라미터 값들을 도출하는 것은 신호 에너지를 점진적으로 감소시키는 것을 포함하는,
    장치.
  19. 프로세서 및 상기 프로세서에 통신상(communicatively) 접속된 메모리 유닛을 포함하는 장치로서,
    상기 메모리 유닛은,
    상기 장치로 하여금 다수의 프레임에서 인코딩된 오디오 데이터를 수신하게 하는 컴퓨터 코드와,
    프레임 에러를 갖는 프레임에 대한 적어도 하나의 파라미터를, 상기 다수의 프레임 중 적어도 하나의 다른 프레임으로부터의 적어도 하나의 저장된 파라미터 값에 기초하여 재구성하기 위한 컴퓨터 코드를 포함하며,
    상기 적어도 하나의 파라미터를 재구성하기 위한 컴퓨터 코드는,
    제 1 방식을 사용하여 적어도 부분적으로 상기 적어도 하나의 저장된 파라미터 값에 기초하여 제 1 파라미터 세트에 대한 값들을 도출하기 위한 컴퓨터 코드와,
    제 2 방식을 사용하여 적어도 부분적으로 상기 적어도 하나의 저장된 파라미터 값에 기초하여 제 2 파라미터 세트에 대한 값들을 도출하기 위한 컴퓨터 코드와,
    상기 도출된 값들을 프레임 에러를 갖는 상기 프레임에 적용하기 위한 컴퓨터 코드를 포함하되,
    상기 제 1 파라미터 세트는 MDCT 스펙트럼 값을 포함하고,
    상기 제 2 파라미터 세트는 상기 MDCT 스펙트럼 내에 삽입된 사인파 성분을 포함하는
    장치.
  20. 컴퓨터에서 사용하기 위해서 그 내부에서 저장된 컴퓨터 프로그램 코드를 포함하는 컴퓨터 판독가능한 저장 매체로서,
    상기 컴퓨터 프로그램 코드는,
    장치로 하여금 다수의 프레임에서 인코딩된 오디오 데이터를 수신하게 하는 코드와,
    프레임 에러를 갖는 프레임에 대한 적어도 하나의 파라미터를, 상기 다수의 프레임 중 적어도 하나의 다른 프레임으로부터의 적어도 하나의 저장된 파라미터 값에 기초하여서 재구성하기 위한 코드를 포함하며,
    상기 적어도 하나의 파라미터를 재구성하기 위한 코드는,
    제 1 방식을 사용하여 적어도 부분적으로 상기 적어도 하나의 저장된 파라미터 값에 기초하여 제 1 파라미터 세트에 대한 값들을 도출하기 위한 코드와,
    제 2 방식을 사용하여 적어도 부분적으로 상기 적어도 하나의 저장된 파라미터 값에 기초하여 제 2 파라미터 세트에 대한 값들을 도출하기 위한 코드와,
    상기 도출된 값들을 프레임 에러를 갖는 상기 프레임에 적용하기 위한 코드를 포함하되,
    상기 제 1 파라미터 세트는 MDCT 스펙트럼 값을 포함하고,
    상기 제 2 파라미터 세트는 상기 MDCT 스펙트럼 내에 삽입된 사인파 성분을 포함하는
    컴퓨터 판독가능한 저장 매체.
  21. 제 20 항에 있어서,
    상기 적어도 하나의 저장된 파라미터 값은,
    프레임 에러가 없는 적어도 하나의 이전의 프레임의 적어도 하나의 파라미터 값과,
    프레임 에러가 없는 가장 최근의 이전 프레임의 적어도 하나의 파라미터 값과,
    프레임 에러를 갖는 적어도 하나의 이전의 재구성된 프레임의 적어도 하나의 파라미터 값과,
    적어도 하나의 후속 프레임의 적어도 하나의 파라미터 값
    중 적어도 하나를 포함하는,
    컴퓨터 판독가능한 저장 매체.
  22. 제 20 항 또는 제 21 항에 있어서,
    상기 제 1 방식을 사용하여 제 1 파라미터 세트에 대한 값들을 도출하는 것은 제 1 스케일링 계수 세트를 사용하여 상기 적어도 하나의 저장된 파라미터 값을 스케일링하는 것을 포함하며,
    상기 제 2 방식을 사용하여 제 2 파라미터 세트에 대한 값들을 도출하는 것은 제 2 스케일링 계수 세트를 사용하여 상기 적어도 하나의 저장된 파라미터 값을 스케일링하는 것을 포함하는,
    컴퓨터 판독가능한 저장 매체.
  23. 제 20 항 또는 제 21 항에 있어서,
    상기 제 1 파라미터 세트는 고 주파수 범위에 대한 파라미터를 포함하는,
    컴퓨터 판독가능한 저장 매체.
  24. 제 20 항 또는 제 21 항에 있어서,
    상기 제 2 파라미터 세트는 상기 제 1 파라미터 세트의 서브세트를 포함하는,
    컴퓨터 판독가능한 저장 매체.
  25. 삭제
  26. 제 20 항 또는 제 21 항에 있어서,
    상기 제 1 방식은
    Figure 112011003082223-pct00023

    에 따라서 상기 제 1 파라미터 세트에 대한 파라미터 값 m을 도출하며,
    mprev는 상기 적어도 하나의 저장된 파라미터 값을 나타내고,
    facspect는 각각의 스케일링 계수를 나타내는,
    컴퓨터 판독가능한 저장 매체.
  27. 제 20 항 또는 제 21 항에 있어서,
    상기 제 2 방식은
    Figure 112011003082223-pct00024

    에 따라서 상기 제 2 파라미터 세트에 대한 파라미터 값 m을 도출하며,
    mprev는 상기 적어도 하나의 저장된 파라미터 값을 나타내고,
    facsin는 각각의 스케일링 계수를 나타내며,
    possin은 m 및 mprev 내에서 상기 제 2 파라미터 세트의 위치를 나타내는 변수인,
    컴퓨터 판독가능한 저장 매체.
  28. 제 20 항 또는 제 21 항에 있어서,
    상기 파라미터 값들을 도출하는 것은 신호 에너지를 점진적으로 감소시키는 것을 포함하는,
    컴퓨터 판독가능한 저장 매체.
KR1020117000982A 2008-06-13 2009-05-15 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체 KR101228165B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US6157208P 2008-06-13 2008-06-13
US61/061,572 2008-06-13
PCT/FI2009/050403 WO2009150290A1 (en) 2008-06-13 2009-05-15 Method and apparatus for error concealment of encoded audio data

Publications (2)

Publication Number Publication Date
KR20110040835A KR20110040835A (ko) 2011-04-20
KR101228165B1 true KR101228165B1 (ko) 2013-01-30

Family

ID=41416403

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117000982A KR101228165B1 (ko) 2008-06-13 2009-05-15 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체

Country Status (10)

Country Link
US (1) US8397117B2 (ko)
EP (1) EP2301015B1 (ko)
KR (1) KR101228165B1 (ko)
CN (1) CN102057424B (ko)
AU (1) AU2009256551B2 (ko)
BR (1) BRPI0915358B1 (ko)
RU (1) RU2475868C2 (ko)
TW (1) TWI466102B (ko)
WO (1) WO2009150290A1 (ko)
ZA (1) ZA201100279B (ko)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8489403B1 (en) * 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
PL2975610T3 (pl) 2010-11-22 2019-08-30 Ntt Docomo, Inc. Sposób i urządzenie do kodowania audio
TWI585747B (zh) 2011-10-21 2017-06-01 三星電子股份有限公司 訊框錯誤修補方法與裝置、音訊解碼方法與裝置
CN104718570B (zh) * 2012-09-13 2017-07-18 Lg电子株式会社 帧丢失恢复方法,和音频解码方法以及使用其的设备
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
WO2014108738A1 (en) * 2013-01-08 2014-07-17 Nokia Corporation Audio signal multi-channel parameter encoder
WO2014126520A1 (en) * 2013-02-13 2014-08-21 Telefonaktiebolaget L M Ericsson (Publ) Frame error concealment
FR3004876A1 (fr) * 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.
EP3540731A3 (en) 2013-06-21 2019-10-30 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Pitch lag estimation
ES2671006T3 (es) * 2013-06-21 2018-06-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Reconstrucción de una trama de voz
CN103646647B (zh) * 2013-12-13 2016-03-16 武汉大学 混合音频解码器中帧差错隐藏的谱参数代替方法及系统
CN104751849B (zh) 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
EP3095117B1 (en) 2014-01-13 2018-08-22 Nokia Technologies Oy Multi-channel audio signal classifier
CN107369454B (zh) 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
CN105374367B (zh) * 2014-07-29 2019-04-05 华为技术有限公司 异常帧检测方法和装置
US10424305B2 (en) 2014-12-09 2019-09-24 Dolby International Ab MDCT-domain error concealment
CA3016949C (en) 2016-03-07 2021-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Error concealment unit, audio decoder, and related method and computer program fading out a concealed audio frame out according to different damping factors for different frequency bands
MX2018010756A (es) 2016-03-07 2019-01-14 Fraunhofer Ges Forschung Unidad de ocultamiento de error, decodificador de audio, y método relacionado y programa de computadora que usa características de una representación decodificada de una trama de audio decodificada apropiadamente.
US10217467B2 (en) * 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2020165265A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
WO2020164751A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
CN117354585A (zh) * 2023-12-06 2024-01-05 深圳感臻智能股份有限公司 一种针对视频网络丢包的优化方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148487A (en) 1990-02-26 1992-09-15 Matsushita Electric Industrial Co., Ltd. Audio subband encoded signal decoder
KR20050091034A (ko) * 2002-12-31 2005-09-14 노키아 코포레이션 압축-도메인 패킷 손실 은폐를 위한 방법 및 장치
US20060093048A9 (en) 2003-12-19 2006-05-04 Anisse Taleb Partial Spectral Loss Concealment In Transform Codecs
KR20080047230A (ko) * 2006-11-24 2008-05-28 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치, 이를 이용한 오디오신호 복호화 방법 및 장치

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
TW241350B (ko) * 1991-11-07 1995-02-21 Rca Thomson Licensing Corp
JP3085606B2 (ja) * 1992-07-16 2000-09-11 ヤマハ株式会社 ディジタルデータの誤り補正方法
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
SE504397C2 (sv) * 1995-05-03 1997-01-27 Ericsson Telefon Ab L M Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering
US5797121A (en) * 1995-12-26 1998-08-18 Motorola, Inc. Method and apparatus for implementing vector quantization of speech parameters
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
FI106325B (fi) * 1998-11-12 2001-01-15 Nokia Networks Oy Menetelmä ja laite tehonsäädön ohjaamiseksi
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6438518B1 (en) * 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
US7047187B2 (en) * 2002-02-27 2006-05-16 Matsushita Electric Industrial Co., Ltd. Method and apparatus for audio error concealment using data hiding
DE60327371D1 (de) * 2003-01-30 2009-06-04 Fujitsu Ltd EINRICHTUNG UND VERFAHREN ZUM VERBERGEN DES VERSCHWINDENS VON AUDIOPAKETEN, EMPFANGSENDGERuT UND AUDIOKOMMUNIKAITONSSYSTEM
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7546508B2 (en) * 2003-12-19 2009-06-09 Nokia Corporation Codec-assisted capacity enhancement of wireless VoIP
JP4741476B2 (ja) * 2004-04-23 2011-08-03 パナソニック株式会社 符号化装置
ATE414679T1 (de) * 2004-06-10 2008-12-15 Imerys Kaolin Inc Ultrarückstandsarme feststoffreiche feuchtkuchenprodukte und zugehörige herstellungsverfahren
AU2006208530B2 (en) * 2005-01-31 2010-10-28 Microsoft Technology Licensing, Llc Method for generating concealment frames in communication system
US20060184363A1 (en) * 2005-02-17 2006-08-17 Mccree Alan Noise suppression
CN101199004B (zh) * 2005-04-22 2011-11-09 高通股份有限公司 用于增益因数平滑的系统、方法及设备
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
BRPI0520729B1 (pt) * 2005-11-04 2019-04-02 Nokia Technologies Oy Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
EP2220646A1 (en) * 2007-11-06 2010-08-25 Nokia Corporation Audio coding apparatus and method thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148487A (en) 1990-02-26 1992-09-15 Matsushita Electric Industrial Co., Ltd. Audio subband encoded signal decoder
KR20050091034A (ko) * 2002-12-31 2005-09-14 노키아 코포레이션 압축-도메인 패킷 손실 은폐를 위한 방법 및 장치
US20060093048A9 (en) 2003-12-19 2006-05-04 Anisse Taleb Partial Spectral Loss Concealment In Transform Codecs
KR20080047230A (ko) * 2006-11-24 2008-05-28 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치, 이를 이용한 오디오신호 복호화 방법 및 장치

Also Published As

Publication number Publication date
RU2475868C2 (ru) 2013-02-20
CN102057424B (zh) 2015-06-17
TW201005730A (en) 2010-02-01
RU2010154191A (ru) 2012-07-20
AU2009256551A1 (en) 2009-12-17
WO2009150290A1 (en) 2009-12-17
TWI466102B (zh) 2014-12-21
BRPI0915358B1 (pt) 2020-04-22
US20100115370A1 (en) 2010-05-06
ZA201100279B (en) 2012-06-27
BRPI0915358A2 (pt) 2015-11-03
KR20110040835A (ko) 2011-04-20
US8397117B2 (en) 2013-03-12
CN102057424A (zh) 2011-05-11
EP2301015B1 (en) 2019-09-04
EP2301015A4 (en) 2016-04-13
EP2301015A1 (en) 2011-03-30
AU2009256551B2 (en) 2015-08-13

Similar Documents

Publication Publication Date Title
KR101228165B1 (ko) 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체
FI119533B (fi) Audiosignaalien koodaus
CN101346760B (zh) 用于音频编码的编码器辅助的帧丢失隐藏技术
US9767810B2 (en) Packet loss concealment for speech coding
JP5226777B2 (ja) 音声信号中に埋め込まれた隠れデータの回復
US8612236B2 (en) Method and device for noise suppression in a decoded audio signal
WO2006021849A1 (en) Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (aac) system
RU2408089C9 (ru) Декодирование кодированных с предсказанием данных с использованием адаптации буфера
Hwang Multimedia networking: From theory to practice
KR101548846B1 (ko) 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스
CN105814629A (zh) 带宽扩展模式选择
WO2008065487A1 (en) Method, apparatus and computer program product for stereo coding
CN114550732B (zh) 一种高频音频信号的编解码方法和相关装置
US20100042416A1 (en) Coding/decoding method, system and apparatus
KR20100063097A (ko) Amr-wb dtx 동기화를 제공하는 시스템 및 방법
WO2022258036A1 (zh) 编解码方法、装置、设备、存储介质及计算机程序
CN115512711A (zh) 语音编码、语音解码方法、装置、计算机设备和存储介质
WO2004015690A1 (en) Speech communication unit and method for error mitigation of speech frames
KR20080082103A (ko) 디지털 멀티미디어 방송 시스템에서의 오디오 데이터부호화 방법 및 장치
Ehret et al. Evaluation of real-time transport protocol configurations using aacPlus

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160104

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170102

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180103

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190103

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20200103

Year of fee payment: 8