KR20090076797A - 고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치 - Google Patents

고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치 Download PDF

Info

Publication number
KR20090076797A
KR20090076797A KR1020087016750A KR20087016750A KR20090076797A KR 20090076797 A KR20090076797 A KR 20090076797A KR 1020087016750 A KR1020087016750 A KR 1020087016750A KR 20087016750 A KR20087016750 A KR 20087016750A KR 20090076797 A KR20090076797 A KR 20090076797A
Authority
KR
South Korea
Prior art keywords
frame
signal
frequency signal
high frequency
pitch period
Prior art date
Application number
KR1020087016750A
Other languages
English (en)
Inventor
지안팽 허
레이 미아오
첸 후
큉 창
리징 허
웨이 리
챙총 두
이 양
팽얀 퀴
워초우 쟌
동퀴 왕
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CNB2007101945709A external-priority patent/CN100524462C/zh
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20090076797A publication Critical patent/KR20090076797A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L2013/021Overlap-add techniques

Abstract

본 발명은 고역 시그널에 대해 프레임 삭제 은폐를 수행하는 방법을 개시하며, 다음과 같은 단계를 포함한다: 저역 시그널에 대한 고역 시그널의 주기적 강도를 계산하는 단계; 상기 고역 시그널의 상기 주기적 강도가 기구성된 임계치보다 높거나 동일한지 여부를 판단하는 단계; 상기 고역 시그널의 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 피치 주기 반복 방법을 사용하여 현재의 손실된 프레임의 고역 시그널에 대해 프레임 삭제 은폐를 수행하는 단계; 및 상기 고역 시그널의 상기 주기적 강도가 상기 기구성된 임계치보다 낮은 경우, 이전 프레임 데이터 반복 방법을 사용하여 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 상기 프레임 삭제 은폐를 수행하는 단계. 본 발명은 고역 시그널에 대해 프레임 삭제 은폐를 수행하는 장치 및 스피치 디코더를 더 개시한다. 보이스 시그널의 품질이 저하되는 문제를 방지한다.

Description

고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치{Method and device for performing frame erasure concealment to higher-band signal}
본 출원은 "고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치{Method and device for performing frame erasure concealment to higher-band signal}"를 명칭으로 하는, 2007년 9월 15일에 출원된 중국 출원 번호 No.200710153955.0 및 "고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치{Method and device for performing frame erasure concealment to higher-band signal}"를 명칭으로 하는, 2007년 11월 24일에 출원된 중국 출원 번호 No.200710194570.9 를 기반으로 우선권을 주장하고, 그 내용 전체가 참조로서 이하 도입된다.
본 발명은 시그널 디코딩 기술에 관한 것으로, 구체적으로 고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치에 관한 것이다.
종래의 대부분의 보이스 코덱(voice codec)에서, 보이스 시그널(voice signal)의 대역폭은 낮다. 소수의 보이스 코덱만이 넓은 대역폭을 가지며, 네트워크 기술의 발달로, 네트워크 전송 레이트(network transmission rate)는 증가하고 광대역 코덱의 요구는 높아져 간다. 선택적으로, 보이스 코덱의 대역폭이 초광대역(ultra-wideband)(50 Hz - 14000 Hz) 및 전대역(fullband)(20 Hz - 20000 Hz)에 이르는 것이 요구된다.
종래의 보이스 코덱과 호환되는 광대역 보이스 코덱을 제작하기 위해, 보이스 코덱은 다수의 계층(layer)으로 분할될 수 있다. 예로서, 다음과 같은 기술 내용이 두 개의 계층을 포함하는 보이스 코덱으로 주어질 것이다.
우선, 두 개의 계층을 포함하는 보이스 코덱은 입력 시그널을 코딩 측(coding side)에서 QMF(Quadrature-Mirror Filterbank) 해석으로 고역(higher-band) 시그널과 저역(lower-band) 시그널로 분리한다. 저역 시그널은 코딩(coding)을 위한 저역 코더(lower-band coder)로의 입력이고 고역 시그널은 코딩을 위한 고역 코더(higher-band coder)로의 입력이다. 획득된 저역 데이터 및 고역 데이터는 비트스트림 멀티플렉서(bitstream multiplexer)를 통해 비트스트림으로 합성되고(synthesized) 상기 비트스트림은 외부로 송신된다. 상기 저역 시그널은 시그널의 대역폭의 저역에 주파수가 존재하는 시그널이며, 고역 시그널은 시그널의 대역폭의 고역에 주파수가 존재하는 시그널이다. 예를 들어, 입력 시그널의 대역폭이 50 Hz - 7000 Hz인 경우, 저역 시그널의 대역폭은 50 Hz - 4000 Hz일 수 있고 고역 시그널의 대역폭은 4000 Hz - 7000 Hz 일 수 있다. 디코딩(decoding)은 디코딩 측에서 구현된다. 상기 비트스트림은 저역 비트스트림 및 고역 비트스트림으로 분할되고, 상기 저역 비트스트림 및 고역 비트스트림은 각각 디코딩을 위한 저역 디코더 및 고역 디코더로의 입력이다. 따라서, 상기 저역 시그널 및 상기 고역 시그널은 획득된다. 상기 저역 시그널 및 상기 고역 시그널은 QMF 합성기(synthesis Quadrature-Mirror Filterbank)의 출력이 되는 보이스 시그널로 합성된다.
현재, VoIP(Voice over IP)의 응용 및 무선 네트워크 보이스의 응용은 점차 대중화되고 있다. 보이스 전송은 작은 데이터 패킷을 실시간으로 그리고 신뢰성있게 전송하는 것이 요구된다. 전송 도중 보이스 프레임이 손실되는 경우, 손실된 보이스 프레임을 재전송할 시간은 없다. 유사하게, 보이스 프레임이 재생될 예정인 경우 보이스 프레임이 긴 전달 과정(long routing)을 통해 전달되고 따라서 제 시간에 도달하지 못할 경우, 상기 보이스 프레임은 손실된 프레임과 동등하다. 따라서, 보이스 시스템에서, 보이스 프레임이 도달할 수 없거나 제 시간에 도달할 수 없는 경우, 상기 보이스 프레임은 손실된 프레임으로 간주될 수 있다.
상기 손실된 프레임에 대해 어떠한 프로세싱도 수행되지 않는 경우, 상기 보이스는 단속적이며 이는 보이스의 질에 중대한 영향을 미친다. 따라서, 손실된 프레임을 위해, 프레임 삭제 은폐 프로세싱(frame erasure concealment processing)이 요구된다. 다른 표현으로는, 손실된 보이스 데이터는 추측되고(estimated) 상기 추측된 데이터는 상기 손실된 데이터를 대체하기 위해 사용된다. 그 결과, 보다 질 좋은 보이스 품질이 프레임 손실 환경에서 획득될 수 있다. 입력 시그널을 고역 시그널 및 저역 시그널로 분할하는 보이스 코덱에 대해서도, 상기 프레임 삭제 은폐는 프레임 삭제 은폐 도중 상기 저역 시그널 및 상기 고역 시그널 각각에 대해서 수행되고, 상기 프레임 삭제 은폐 후 획득된 고역 시그널 및 저역 시그널은 QMF 합성을 통해 출력이 되는 보이스 시그널로 합성된다.
프레임 삭제 은폐 방법은 삽입 방법(insertion method), 인터폴레이션 방법(interpolation method) 및 재생 방법(regeneration method)을 포함한다.
상기 프레임 삭제 은폐를 위한 상기 삽입 방법은 스플라이싱(splicing), 무음 대체(silence replacement), 노이즈 대체(noise replacement) 및 이전 프레임 반복(previous frame repetition)을 포함한다.
상기 프레임 삭제 은폐를 위한 상기 인터폴레이션 방법은 파형 대체(waveform replacement), 피치 반복(pitch repetition) 및 시간 영역 파형 수정(time domain waveform revision)을 포함한다.
상기 재생 방법은 코더 파라미터 인터폴레이션(coder parameter interpolation) 및 모델-기반 재생 방법(model-based regeneration method)을 포함한다.
상기 모델-기반 재생 방법은 가장 우수한 보이스 품질 및 가장 높은 알고리즘 복잡성을 가지고, 이전 프레임 반복 방법은 우수한 보이스 품질 및 높지 않은 알고리즘 복잡성을 가진다.
저역 시그널에 의한 보이스 품질에의 영향이 고역 시그널에 의한 영향보다 높기 때문에, 높은 복잡성 및 높은 보이스 품질의 프레임 삭제 은폐 알고리즘(예를 들어, 피치 반복, 시간 영역 파형 수정, 코더 파라미터 인터폴레이션 및 모델-기반 재생 방법)은 저역 시그널에 대해 사용된다. 낮은 복잡성 및 낮은 보이스 품질의 프레임 삭제 은폐 알고리즘은 고역 시그널에 대해 사용된다. 그 결과, 보이스 품질 및 복잡성 간의 절충이 달성된다.
종래의 스피치 디코더(speech decoder)에서는, 피치 반복은 프레임 삭제 은폐의 구현을 위해 저역 시그널에 대해 사용되는 반면, 이전 프레임 반복 및 감 쇠(attenuation) 방법은 프레임 삭제 은폐의 구현을 위해 고역 시그널에 대해 사용된다.
이전 프레임 반복 및 감쇠 방법을 기반으로 한 고역 시그널 회복(recovering) 공식은 다음과 같다:
shb(n) = shb(n-N)·α, n=0,...,N-1
공식에서, shb(n), n=0,...,N-1은 손실된 프레임의 회복된 고역 시그널을 나타내고, N은 프레임의 샘플 개수를 나타내며; 감쇠 계수(attenuation coefficient) α는 0부터 1까지의 비음수(nonnegative number)이다. 감쇠 계수 α는 0.8과 같이 상수일 수 있거나 연속적으로 손실된 패킷의 개수에 따라 적응적으로(adaptively) 변하는 변수일 수 있다. 예를 들어, 첫 번째 손실 프레임은 0.9와 같은 보다 큰 감쇠 계수가 승산되는 반면, 두 번째 손실 프레임 및 이어지는 프레임은 0.7과 같은 보다 작은 감쇠 계수가 승산된다.
본 발명의 구현 프로세스에서, 발명자는 다음과 같은 문제점을 발견하였다: 시그널이 강한 주기성(periodicity)을 가지는 경우, 고역 시그널은 정확하게 회복될 수 없다. 저역 시그널 및 고역 시그널이 일관된 주기성을 가지는 경우, 종래 기술에 따른 프레임 삭제 은폐가 고역 시그널에 대해 수행되는 경우 고역 시그널의 본래의 주기성은 붕괴된다. 그 결과, 스피치 디코더로부터의 보이스 시그널 출력의 품질은 낮아진다.
본 발명의 일 실시예는 고역 시그널에 대한 프레임 삭제 은폐를 수행하는 방법을 제공하여 스피치 디코더로부터의 보이스 시그널 출력의 품질을 향상시킨다.
본 발명의 다른 실시예는 고역 시그널에 대한 프레임 삭제 은폐를 수행하는 장치를 제공하여 스피치 디코더로부터의 보이스 시그널 출력의 품질을 향상시킨다.
본 발명의 또 다른 실시예는 스피치 디코더를 제공하여 스피치 디코더로부터의 보이스 시그널 출력의 품질을 향상시킨다.
본 발명의 실시예에 따른 기술적 해결책은 다음과 같이 구현되어 상술한 목적을 달성한다.
고역 시그널에 대한 프레임 삭제 은폐 수행 방법은 다음과 같은 단계를 포함한다:
저역 시그널의 피치 주기 정보(pitch period information)에 대한 고역 시그널의 주기적 강도(periodic intensity)를 계산하는 단계;
상기 주기적 강도가 기구성된 임계치(preconfigured threshold)보다 높거나 동일한지 여부를 판단하여, 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 현재의 손실된 프레임의 고역 시그널에 대해 피치 주기 반복 기반 방법(pitch period repetition based method)으로 프레임 삭제 은폐를 수행하는 단계.
고역 시그널에 대한 프레임 삭제 은폐 수행 장치는 다음과 같은 구성 요소를 포함한다:
저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도를 계산하고, 상기 주기적 강도가 기구성된 임계치보다 높거나 동일한지 여부를 판단하여, 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 현재의 손실된 프레임의 고역 시그널을 피치 주기 반복 모듈로 전송하고, 상기 주기적 강도가 상기 기구성된 임계치보다 낮은경우, 상기 현재의 손실된 프레임의 고역 시그널을 이전 프레임 데이터 반복 모듈로 전송하도록 구성된 주기적 강도 계산 모듈;
상기 현재의 손실 프레임의 고역 시그널에 대해 피치 주기 반복 기반 방법으로 프레임 삭제 은폐를 수행하도록 구성된 피치 주기 반복 모듈; 및
상기 현재의 손실된 프레임의 고역 시그널에 대해 이전 프레임 데이터 반복 기반 방법으로 프레임 삭제 은폐를 수행하도록 구성된 이전 프레임 데이터 반복 모듈.
스피치 디코더는 다음과 같은 구성 요소를 포함한다:
입력 비트스트림을 저역 비트스트림 및 고역 비트스트림으로 디멀티플렉스하도록 구성된 비트스트림 디멀티플렉스 모듈;
상기 저역 비트스트림 및 상기 고역 비트스트림을 저역 시그널 및 고역 시그널로 각각 디코딩하도록 구성된 저역 디코더 및 고역 디코더;
상기 저역 시그널에 대해 프레임 삭제 은폐를 수행하여 상기 저역 시그널의 피치 주기를 획득하도록 구성된 저역 시그널 프레임 삭제 은폐 장치;
상기 저역 시그널의 피치 주기 정보에 대한 상기 고역 시그널의 주기적 강도를 계산하고, 상기 고역 시그널의 상기 주기적 강도가 기구성된 임계치보다 높거나 동일한지 여부를 결정하며; 상기 고역 시그널의 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 현재의 손실된 프레임의 상기 고역 시그널에 대해 피치 주기 반복 기반 방법으로 프레임 삭제 은폐를 수행하고, 상기 고역 시그널의 상기 주기적 강도가 상기 기구성된 임계치보다 낮은 경우, 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 이전 프레임 데이터 반복 기반 방법으로 상기 프레임 삭제 은폐를 수행하도록 구성된 고역 시그널 프레임 삭제 은폐 방법; 및
상기 프레임 삭제 은폐 후 상기 저역 시그널 및 상기 고역 시그널을 출력될 보이스 시그널로 합성하도록 구성된 QMF 합성기(synthesis Quadrature-Mirror Filterbank).
종래 기술과 비교하면, 본 발명의 일 실시예에 따른 기술적 해결책에서, 저역 시그널의 피치 주기에 관한 고역 시그널의 주기적 강도가 계산되며; 그리고 나서, 저역 시그널의 피치 주기 정보에 관한 고역 시그널의 주기적 강도가 기구성된 임계치보다 높거나 동일한지 여부가 결정되며; 상기 주기적 강도가 상기 임계치보다 높거나 동일한 경우, 상기 피치 주기 반복 기반 방법은 현재의 손실된 프레임의 고역 시그널에 대해 프레임 삭제 은폐를 수행하기 위해 사용된다. 따라서, 상기 고역 시그널가 강한 주기성을 가지는 경우, 상기 고역 시그널의 주기성이 있다 해도 상기 고역 시그널의 주기성은 붕괴되지 않는다. 따라서, 상기 고역 시그널의 주기성이 붕괴되기 때문에 보이스 시그널의 품질이 저하되는 문제점이 방지될 수 있다. 상기 고역 시그널의 주기적 강도가 상기 임계치보다 낮고 상기 고역 시그널의 주기적 강도가 약하다고 결정되는 경우, 이전 프레임 데이터 반복 기반 방법은 현재의 손실된 프레임에 대해 프레임 삭제 은폐를 수행하기 위해 사용된다. 고역 시그널의 주기적 강도가 약한 경우, 고주파수 노이즈가 도입된다. 따라서, 소주파수 노이즈가 도입되기 때문에 보이스 시그널의 보이스 품질이 낮아지는 문제점이 방지될 수 있다. 이와 같이, 본 발명의 일 실시예에 따른 고역 시그널에 대한 프레임 삭제 은폐 수행을 위한 기술적 해결책은 스피치 디코더로부터의 보이스 시그널 출력의 품질을 향상시킬 수 있다.
도 1은 본 발명의 일 실시예에 따른 스피치 디코더의 블록 구조도이다.
도 2는 본 발명의 일 실시예에 따른 고역 시그널를 위한 프레임 삭제 은폐 방법을 설명하는 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 고역 시그널를 위한 프레임 삭제 은폐 장치의 블록 구조도이다.
도 4는 본 발명의 일 실시예에 따른 피치 주기 반복 모듈의 블록 구조도이다.
도 5는 본 발명의 일 실시예에 따른 이전 프레임 데이터 반복 모듈의 블록 구조도이다.
도 6은 본 발명의 일 실시예에 따른 다른 이전 프레임 데이터 반복 모듈의 블록 구조도이다.
본 발명은 첨부한 도면 및 구체적인 실시예를 참조로 이하 구체적으로 기술될 것이다.
도 1은 본 발명의 일 실시예에 따른 스피치 디코더의 블록 구조도이다. 도 1에 도시된 바와 같이, 스피치 디코더는 비트스트림 디멀티플렉스 모듈, 저역 디코더, 고역 디코더, 저역 시그널 프레임 삭제 은폐 장치, 고역 시그널 프레임 삭제 은폐 장치 및 QMF 합성기(synthesis Quadrature-Mirror Filterbank)를 포함한다.
상기 비트스트림 디멀티플렉스 모듈은 입력 비트스트림을 저역 비트스트림 및 고역 비트스트림으로 디멀티플렉스 하도록 구성된다. 상기 저역 시그널 및 상기 고역 시그널은 상기 저역 비트스트림 및 상기 고역 비트스트림을 상기 저역 디코더 및 상기 고역 디코더로 각각 디코딩함으로써 획득된다. 상기 저역 시그널 및 상기 고역 시그널은 저역 시그널 프레임 삭제 은폐 장치 및 고역 시그널 프레임 삭제 은폐 장치에 의해 각각 처리되고, 그리고 나서 QMF 합성기에 의해 출력이 되는 보이스 시그널로 합성된다.
상기 저역 시그널 프레임 삭제 은폐 장치는 상기 저역 시그널의 프레임 삭제 은폐를 처리하고 상기 저역 시그널의 피치 주기를 상기 고역 시그널 프레임 삭제 은폐 장치로 제공한다.
고역 시그널 프레임 삭제 은폐 장치는 본 발명의 일 실시예에 따른 고역 시그널에 대해 프레임 삭제 은폐 방법을 수행한다. 본 발명의 일 실시예에 따른 고역 시그널에 대한 프레임 삭제 은폐 방법은 다음과 같은 단계를 포함한다: 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도(periodic intensity)를 계산하는 단계; 상기 고역 시그널의 상기 주기적 강도가 기구성된 임계치(preconfigurred threshold)보다 높거나 동일한지 여부를 결정하는 단계; 상기 고역 시그널의 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 현재의 손실된 프레임의 고역 시그널에 대해 프레임 삭제 은폐를 수행하기 위해 피치 주기 반복 기반 방법(pitch period repetition based method)를 사용하고, 상기 고역 시그널의 상기 주기적 강도가 상기 기구성된 임계치보다 낮은 경우, 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 프레임 삭제 은폐를 수행하기 위해 이전 프레임 데이터 반복 기반 방법(previous frame data repetition based method)를사용하는 단계.
도 2는 본 발명의 일 실시예에 따른 고역 시그널에 대한 프레임 삭제 은폐 방법을 설명하는 흐름도이다. 도 3은 본 발명의 일 실시예에 따른 고역 시그널에 대한 프레임 삭제 은폐 장치의 구조 블록도이다. 도 2 및 도 3을 참조하여, 본 발명의 일 실시예에 따른 프레임 삭제 은폐 구현을 위한 기술적 해결책의 상세한 설명이 다음과 같이 개시될 것이다.
도 2에 도시된 바와 같이, 고역 시그널에 대한 프레임 삭제 은폐 수행 방법은 다음과 같은 단계를 포함한다.
단계 700: 저역 시그널에 대한 고역 시그널의 주기적 강도가 저역 시그널의 프레임 삭제 은폐를 통해 획득된 저역 시그널 피치 주기에 따라 계산된다.
단계 700에서, 저역 시그널의 프레임 삭제 은폐는 피치 주기를 획득할 수 있는 프레임 삭제 은폐 방법, 예컨대 피치 반복 기반 방법(pitch repetition based method), 모델-기반 재생 기반 방법(model-based regeneration based method) 및 코더 파라미터 인터폴레이션 기반 방법(coder parameter interpolation based method)을 사용하고, 코더 파라미터는 피치 주기 파라미터를 포함한다. 예를 들어, 모델-기반 재생 기반 방법은 선형 예측 모델을 기반으로 한 재생을 구현한 프레임 삭제 은폐 방법일 수 있다.
단계 700에서, 고역 시그널 프레임 삭제 은폐 장치는 먼저 저역 시그널에 대한 시그널 프레임 삭제 은폐를 사용하여 저역 시그널의 피치 주기 tlb를 계산하고, 그리고 나서 고역 시그널의 히스토리 버퍼 시그널(history buffer signal)을 사용하여 tlb에 대한 고역 시그널의 주기적 강도 r(tlb)를 계산한다.
일반적으로, 시그널의 주기적 강도를 구하는 함수는 자기상관 함수(autocorrelation function) 및 정규화된 상관 함수(normalized correlation function)를 포함한다.
저역 시그널의 피치 주기는 저역 시그널에 대해 자기상관 함수를 계산함으로써 획득될 수 있다. 상관 함수의 공식은 다음과 같다:
Figure 112008049697513-PCT00001
상기 공식에서, r(i)는 i에 대한 상관 함수를 나타내며; slb(j)는 저역 시그널을 나타내며; N은 상관 함수를 계산하기 위한 윈도우(window)의 길이, 예컨대 프레임의 보이스 시그널에 대한 샘플의 개수를 나타내며; min_pitch는 피치 주기를 검색하기 위한 하한 한계(lower limit)이고 max_pitch는 피치 주기를 검색하기 위한 상한 한계(upper limit)이다. 따라서, 저역 시그널의 피치 주기는 다음과 같다:
Figure 112008049697513-PCT00002
다른 표현으로, tlb는 r(i)가 최대값을 가지는 경우 i의 값과 동일하다.
자기상관 함수를 사용하여 시그널의 주기적 강도를 계산하기 위한 공식은 다음과 같다:
Figure 112008049697513-PCT00003
상기 공식에서, shb(n), n=-M,...,-1은 고역 시그널의 히스토리 버퍼 시그널을 나타내고 M은 고역 시그널의 히스토리 버퍼 시그널에서 샘플의 개수를 나타낸다. N은 상수인 양의 정수, 예컨대 프레임에서 고역 시그널에 대한 샘플의 개수이다.
정규화된 상관 함수를 사용하여 시그널의 주기적 강도를 계산하기 위한 공식은 다음과 같다:
Figure 112008049697513-PCT00004
상기 공식에서, N은 상수인 양의 정수, 예컨대 프레임에서 고역 시그널에 대한 샘플의 개수이다.
도 3을 참조하면, 도 3에 도시된 바와 같이, 고역 시그널 프레임 삭제 은폐 장치는 주기적 강도 계산 모듈, 피치 주기 반복 모듈 및 이전 프레임 데이터 반복 모듈을 포함한다. 단계 700에서, 상기 주기적 강도 계산 모듈은 저역 시그널에 대한 시그널 프레임 삭제 은폐를 사용하여 저역 시그널 피치 주기를 계산하고 상기 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도를 계산한다.
단계 700에서, 저역 시그널 tlb의 피치 주기에 추가하여, 저역 시그널의 피치 주기 정보는 저역 시그널의 피치 주기에 대한 값(value around the pitch period of the lower band signal) tlb를 포함할 수 있다. 고역 시그널 프레임 삭제 은폐 장치는 우선 저역 시그널에 대한 시그널 프레임 삭제 은폐를 사용하여 저역 시그널의 피치 주기 tlb를 계산할 수 있다. 고역 시그널의 피치 주기를 검색하기 위한 복잡성을 감소하고 고역 시그널의 피치 주기를 위한 정확성을 향상시키기 위해, 저역 시그널의 피치 주기 tlb에서 인터벌(interval), 예컨대 [max(tlb - m,pit_min),min(tlb + m,pit_max)]는 고역 시그널에 대한 정규화된 상관 함수를 계산하기 위해 사용될 수 있다. 고역 시그널의 히스토리 버퍼 시그널 shb(n)은 [max(tlb - m,pit_min),min(tlb + m,pit_max)]에 대한 고역 시그널의 주기적 강도 r(tlb)를 계산하기 위해 사용된다.
Figure 112008049697513-PCT00005
위 공식에서, m은 검색 인터벌의 반경, 예컨대 3 또는 3보다 작은 임의의 값 또는 그와 동일한 값이다. 실험 결과에 따르면, m이 클수록, 정확도는 높아지고 알고리즘 복잡성은 높아진다. 본 실시예에서, m은 3이다. pit_min은 최소 피치 주기이다. 본 실시예에서, pit_min=16이다. pit_max는 최대 피치 주기이다. 본 실시예에서, pit_max=144이다. 다른 실시예에서, pit_min=20 및 pit_max=143 또는 pit_min=16 및 pit_max=160일 수도 있다. 고역 시그널에 대한 피치 주기 thb는 다음과 같다:
Figure 112008049697513-PCT00006
이에 대응하여, 정규화된 상관 함수는 다음과 같다:
Figure 112008049697513-PCT00007
따라서, 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도는 획득된다.
단계 701에서, 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도가 기구성된 임계치보다 높거나 동일한지 여부가 결정된다. 저역 시그널의 피치 주기에 대한 고역 시그널의 주기적 강도가 기구성된 임계치보다 높거나 동일한 경우, 단계 702가 수행되며, 저역 시그널의 피치 주기에 대한 고역 시그널의 주기적 강도가 기구성된 임계치보다 낮은 경우, 단계 703이 수행된다.
단계 701에서, 상관 함수를 사용한 주기적 강도 계산 방법에서, 임계치 R은 테스트를 통해 큰 숫자로 선택될 수 있다. 예를 들어, 시뮬레이션에서, 본 발명의 일 실시예에 따른 고역 시그널에 대한 프레임 삭제 은폐 방법을 구현하기 위한 스피치 디코더는 상이한 임계치에 대한 보이스 시그널 출력을 획득하기 위해 사용되고, 그리고 나서 보이스 시그널의 SNR(signal to noise ratio)이 계산되고, 그리고 나서 최대 SNR에 대한 보이스 시그널에 대응하는 임계치가 단계 701에서 선택된 임계치로 선택될 수 있다. 선택적으로, 단계 701에서 선택된 임계치는 경험적인 값(empirical value)에 따라 결정될 수 있다. r(ttb)≥R인 경우, 고역 시그널의 히스토리 버퍼 시그널 shb(n)은 tlb에 대한 강한 주기적 강도를 가지는 것으로 결정되며, 그렇지 않으면, 고역 시그널의 히스토리 버퍼 시그널 shb(n)은 tlb에 대한 강한 주기적 강도를 가지지 않는 것으로 결정된다.
정규화된 상관 함수를 사용하여 주기적 강도를 계산하는 방법에서, 임계치는 0부터 1까지의 범위의 비음수일 수 있다. Rnor, 예컨대 0.7은 테스트를 통해 큰 숫자로 선택될 수 있다. 상기 프로세스는 상관 함수를 사용하여 주기적 강도를 계산하는 압법과 동일하다. 선택적으로, 경험적인 값이 선택될 수 있다. rnor(ttb)≥Rnor 또는 rnor _ max≥Rnor인 경우, 고역 시그널의 히스토리 버퍼 시그널 shb(n)은 저역 시그 널의 피치 주기 정보에 대한 강한 주기적 강도를 가지는 것으로 결정되며, 그렇지 않은 경우, 고역 시그널의 히스토리 버퍼 시그널은 저역 시그널의 피치 주기 정보에 대한 강한 주기적 강도를 가지지 않는 것으로 결정된다.
도 3에 도시된 바와 같이, 고역 시그널 프레임 삭제 은폐 장치에서, 주기적 강도 계산 모듈은 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도를 계산하며, 그리고 나서 상기 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 계산된 주기적 강도가 주기적 강도 계산 모듈에 기구성된 임계치보다 높거나 동일한지 여부를 판단한다. 계산된 주기적 강도가 상기 임계치보다 높거나 동일한 경우, 피치 주기 반복 모듈은 다음 프로세스를 수행한다; 계산된 주기적 강도가 상기 임계치보다 낮은 경우, 이전 프레임 데이터 반복 모듈이 다음 프로세스를 수행한다.
단계 702에서, 피치 주기 반복 방법은 손실된 프레임에서 고역 시그널의 프레임 삭제 은폐를 수행하기 위해 사용된다.
단계 702에서, 피치 주기 반복 방법은 피치 반복 방법, 모델-기반 재생 기반 방법 또는 피치 반복 및 감쇠 기반 방법을 포함한다.
단계 702에서, 예를 들어, 피치 반복이 고역 시그널에 대한 프레임 삭제 은폐를 수행하기 위해 사용되는 경우이다. 다음과 같은 공식이 손실된 프레임의 고역 시그널을 재생하기 위해 사용된다.
shb(n)=shb(n-tlb), n=0,...,N-1
상기 공식에서, shb(n), n=0,...,N-1은 손실된 프레임의 회복된 고역 시그널을 나타내고, N은 프레임에 포함된 샘플의 개수를 나타낸다. shb(n), n=-M,...,-1은 고역 시그널의 히스토리 버퍼 시그널을 나타내고 M은 고역 시그널의 히스토리 버퍼 시그널에서 샘플의 개수를 나타낸다.
프레임 삭제 은폐가 단순히 주기성(periodicity)을 반복함으로써 고역 시그널에 대해 수행되는 경우, 연속적으로 손실된 프레임의 개수가 큰 경우에는, 과도한 주기성을 가진 시그널이 야기될 수 있다. 효과를 강화시키기 위해, 회복된 시그널에 감쇠 계수 α를 곱한다. 피치 주기 반복 방법은 피치 반복 및 감쇠 기반 방법을 포함하며, 프레임 삭제 은폐는 현재의 손실된 프레임의 고역 시그널에 대해 수행된다. 획득된 고역 시그널은 다음과 같다:
shb(n)=shb(n-tlb)·α, n=0,...,N-1.
상기 공식에서, N은 프레임의 샘플 개수를 나타내며; 감쇠 계수 α는 0부터 1까지의 비음수이다. 상기 감쇠 계수 α는 0.8과 같은 상수일 수 있거나, 연속적으로 손실된 패킷의 개수에 따라 적응적으로 변하는 변수일 수 있다. 예를 들어, 첫 번째로 손실된 프레임에 대해, 보다 큰 감쇠 계수, 예컨대 0.9가 곱해지며; 두 번째로 손실된 프레임 및 이어지는 프레임에 대해, 보다 작은 감쇠 계수, 예컨대 0.7이 곱해진다. 상기 임계치를 결정하는 방법은 감쇠 계수를 결정하기 위해서도 사용될 수 있으며 따라서 그 반복되는 기술은 생략한다.
피치 반복 및 감쇠 기반 방법에서는, 프레임 삭제 은폐는 현재의 손실된 프 레임의 고역 시그널에 대해 수행되며, 또한, 상기 프레임 삭제 은폐가 MDCT(Modified Discrete Cosine Transform)을 기반으로 하는 경우, 두 개의 프레임의 시그널 s'hb(n)은 피치 주기 반복을 통해 첫 번째로 복제된다(duplicated):
s'hb(n)=shb(n-tlb), n=0,...,2N-1.
신호 s'hb(n)은 사인 곡선 윈도우(sinusoid window) wtdac(n)에 추가되고 감쇠되며, 현재의 프레임에 대한 IMDCT(Invert Modified Discrete Cosine Transform) 계수의 추정된 값 dcur(n)은 다음과 같이 획득된다:
dcur(n)=wtdac(n)shb(n)β, n=0,...2N-1.
β는 감쇠 인자(attenuation factor), 예컨대
Figure 112008049697513-PCT00008
이다. dcur(n)은 이전 프레임의 IMDCT 계수 dpre(n)에 오버랩-애드(overlap-added)되며, 따라서 현재의 프레임의 출력 시그널은 다음과 같이 획득된다:
shb(n)=(wtdac(n+N)dpre(n+N)+wtdac(n)dcur(n))α, n=0,...,N-1.
이전 프레임의 IMDCT 계수 dpre(n)의 나중 프레임(latter frame)은 이전 프레임의 IMDCT 계수의 나중 파트로 언급된다. 감쇠 계수 α는 0부터 1까지 범위의 비음수일 수 있다. 감쇠 계수 α는 0.8과 같은 상수일 수 있거나 연속적으로 손실된 패킷의 개수에 따라 적응적으로 변하는 변수, 예컨대 α=1-0.005×(n+1)일 수 있 다. 감쇠는 하나하나씩 증가되고 따라서 출력 시그널은 부드러워진다.
도 4는 본 발명의 일 실시예에 따른 피치 주기 반복 모듈을 도시하며, 다음과 같은 구성 요소를 포함한다: 피치 주기에 따라 프레임의 시그널을 복제하도록 구성된 반복모듈; 프레임의 복제된 시그널에 사인 곡선 윈도우를 추가하고 시그널을 감쇠하여 프레임에 대한 IMDCT 계수의 추정된 값을 획득하도록 구성된 감쇠 모듈; 및 이전 프레임의 IMDCT 계수의 나중 프레임에 현재의 프레임의 추정된 값을 오버랩-애드하고 감쇠하도록 구성된 OLA(OverLap-Add) 모듈.
단계 702에서, 프레임 삭제 은폐가 선형 예측 모델을 기반으로 한 재생 기반 방법을 사용하여 고역 시그널에 대해 수행되는 경우, 다음과 같은 공식은 고역 잔여 시그널(higher-band residual signal) ehb(n)에 대한 피치 주기 반복을 구현하기 위해 사용된다:
ehb(n)=ehb(n-tlb), n=0,...N-1.
상기 공식에서, ehb(n), n=0,...N-1은 현재의 손실된 프레임의 고역 잔여 시그널을 나타내고; ehb(n),n=-M,...,-1은 선형 예측 분석에 대한 고역 시그널의 히스토리 버퍼 시그널의 잔여분을 나타낸다.
그리고 나서, 손실된 프레임의 고역 시그널은 선형 예측 합성기(linear predictive synthesizer)를 통해 고역 시그널의 잔여분을 사용하여 획득된다. 공식은 다음과 같다:
Figure 112008049697513-PCT00009
선택적으로, 본질적인 효과(subjective effect)를 향상시키기 위해, 회복된 시그널에 감쇠 계수 α를 곱하고, 선형 예측 모델을 기반으로 한 재생 방법을 사용하여 프레임 삭제 은폐를 수행함으로써 획득된 고역 시그널은 다음과 같다:
Figure 112008049697513-PCT00010
상기 공식에서, shb(n), n=0,...,N-1은 현재의 손실된 프레임의 회복된 고역 시그널을 나타내고, N은 프레임에서 샘플의 개수를 나타낸다. shb(n), n=-M,...,-1은 고역 시그널의 히스토리 버퍼 시그널을 나타내고 M은 고역 시그널에서 샘플의 개수를 나타낸다. 감쇠 계수 α는 0부터 1까지 범위의 비음수일 수 있다. 감쇠 계수 α는 0.8과 같은 상수일 수 있거나, 연속적으로 손실된 패킷의 개수에 따라 적응적으로 변하는 변수일 수 있다. 예를 들어, 첫 번째로 손실된 프레임에 0.9와 같은 보다 큰 감쇠 계수를 곱하는 반면, 두 번째로 손실된 프레임 및 다음 프레임에는 0.7과 같은 보다 작은 감쇠 계수를 곱한다.
단계 702에서, 도 3에 도시된 피치 주기 반복 모듈은 피치 주기 반복 기반 방법을 사용하여 손실된 프레임의 고역 시그널에 대해 프레임 삭제 은폐를 수행한다. 피치 주기 반복 모듈은 피치 반복 기반 방법을 사용하여 고역 시그널에 대해 프레임 삭제 은폐를 수행하거나, 선형 예측 모델 방법과 같은 모델을 기반으로 한 재생 기반 방법을 사용하여 고역 시그널에 대해 프레임 삭제 은폐를 수행할 수 있다.
단계 703에서, 이전 프레임 데이터 반복 기반 방법은 손실된 프레임의 고역 시그널에 대해 프레임 삭제 은폐를 수행하기 위해 사용된다.
단계 703에서, 이전 프레임 데이터 반복 기반 방법은 이전 프레임 반복 기반방법, 이전 프레임 반복 및 감쇠 기반 방법, 및 코더 파라미터 인터폴레이션 기반방법을 포함한다.
단계 703에서, 도 3에 도시된 이전 프레임 데이터 반복 모듈은 이전 데이터 반복 기반 방법을 사용하여 손실된 프레임의 고역 시그널에 대해 프레임 삭제 은폐를 수행한다. 구체적으로, 이전 프레임 반복 기반 방법, 이전 프레임 반복 및 감쇠 기반 방법 또는 코더 파라미터 인터폴레이션 기반 방법이 사용될 수 있다.
예를 들어, 이전 프레임 반복 및 감쇠 방법이 사용되는 경우, 현재의 손실된 프레임의 이전 프레임의 시간 영역 데이터(time domain data)는 현재의 손실된 프레임으로 복제되고 감쇠 계수 α가 곱해진다. 다른 말로, 다음과 같은 공식은 손실된 프레임을 회복하기 위해 사용될 수 있다:
shb(n)=shb(n-N)·α, n=0,...,N-1.
상기 공식에서, N은 프레임에 포함된 샘플의 개수를 나타낸다. 감쇠 계수 α는 0부터 1까지 범위의 비음수일 수 있다. 감쇠 계수 α는 0.8과 같은 상수이거나 연속적으로 손실된 패킷의 개수에 따라 적응적으로 변하는 변수일 수 있다. 예를 들어, 첫 번째로 손실된 프레임에 0.9와 같은 큰 감쇠 계수를 곱하는 반면, 두 번째로 손실된 프레임 및 다음 프레임에는 0.7과 같은 작은 감쇠 계수를 곱한다.
도 5는 본 발명의 일 실시예에 따른 이전 프레임 데이터 반복 모듈을 도시한다. 도 5에 도시된 바와 같이, 이전 프레임 데이터 반복 모듈은 이전 프레임의 고역 시그널을 현재의 손실된 프레임에 복제하고 상기 복제된 프레임을 감쇠 모듈로 입력하도록 구성된 이전 프레임의 고역 시그널 반복 모듈; 및 상기 복제된 프레임에 감쇠 계수 α를 곱하여 프레임 삭제 은폐 후 고역 시그널을 획득하도록 구성된 감쇠 모듈을 포함한다.
고역 시그널 디코더의 알고리즘이 주파수 영역 알고리즘(frequent domain algorithm)인 경우, 이전 프레임 반복 및 감쇠 기반 방법은 이전 프레임의 주파수 영역 데이터로부터 시간 영역 데이터를 회복하는 동안 임의의 중간 데이터(intermediate data)를 반복하고 감쇠하기 위해 사용되며, 다음과 같은 단계를 포함한다: 현재의 손실된 프레임의 이전 프레임의 주파수 영역 데이터로부터 시간 영역 데이터를 회복하는 동안 획득된 중간 데이터를 현재의 손실된 프레임의 중간 데이터로서 사용하고 상기 중간 데이터를 감쇠하는 단계, 및 현재의 손실된 프레임의 감쇠된 시간 영역 데이터를 현재의 손실된 프레임의 중간 데이터와 합성하는 단계; 또는 이전 프레임의 주파수 영역 데이터로부터 시간 영역 데이터를 회복하는 동안 획득되고 감쇠된 중간 데이터를 현재의 손실된 프레임의 중간 데이터로서 사용하고, 그리고 나서 손실된 프레임의 시간 영역 데이터가 중간 데이터와 합성되는 단계.
예를 들어, 고역 디코더가 MDCT를 기반으로 한 고역 디코더인 경우, 이전 프레임의 IMDCT 계수는 반복되고 감쇠되어 현재의 손실된 프레임의 IMDCT 계수를 추정할 수 있다. 합성 공식에 따라, 이전 프레임의 IMDCT 계수 및 현재의 손실된 프레임의 IMDCT 계수는 현재의 손실된 프레임의 시간 영역 데이터를 획득하기 위해 오버랩-애드된다.
현재의 손실된 프레임의 IMDCT 계수는 다음과 같은 공식으로 추정될 수 있다:
dcur(n)=dpre(n)·α, n=0,...,2N-1.
상기 공식에서, dcur(n)은 현재의 손실된 프레임의 IMDCT 계수이며, dpre(n)는 이전 프레임의 IMDCT 계수이며, N은 프레임에 포함된 샘플의 개수를 나타낸다. 감쇠 계수 α는 0.8과 같은 상수이거나 연속적으로 손실된 패킷의 개수에 따라 적응적으로 변하는 변수일 수 있다. 예를 들어, 첫 번째로 손실된 프레임에 보다 큰 가쇠 계수, 예컨대 0.9를 곱하는 반면, 두 번째로 손실된 프레임 및 다음 프레임에는 0.7과 같은 보다 작은 감쇠 계수를 곱한다.
현재의 손실된 프레임의 시간 영역 데이터는 다음과 같은 공식을 사용하여 IMDCT 계수에 OLA를 수행함으로써 획득된다:
shb(n)=wtdac(n+N)dpre(n+N)+wtdac(n)dcur(n), n=0,...,N-1
상기 공식에서, shb(n)는 현재의 손실된 프레임의 시간 영역 데이터이며, wtdac(n)은 OLA 합성 동안 추가될 윈도우 함수(window function), 예컨대 해밍 윈도우(hamming window) 및 사인 곡선 윈도우(sinusoid window)이다. 상기 윈도우 함수를 결정하는 방법은 종래 기술에서 shb(n)을 계산하는 동안 윈도우 함수를 결정하는 방법과 동일하다.
도 6은 본 발명의 일 실시예에 따른 또 다른 이전 프레임 데이터 반복 모듈의 블록 구조도이다. 도 6에 도시된 바와 같이, 이전 프레임 데이터 반복 모듈은 이전 프레임 IMDCT 계수 저장 모듈, 감쇠 모듈 및 OLA 모듈을 포함한다. 이전 프레임 IMDCT 계수 저장 모듈은 주파수 영역 데이터로부터 시간 영역 데이터를 회복하는 동안 IMDCT 계수를 저장하도록 구성된다. 감쇠 모듈은 α를 사용하여 IMDCT 계수를 감쇠하여 현재의 손실된 프레임의 IMDCT 계수를 획득하도록 구성된다. 이전 프레임의 IMDCT 계수 및 감쇠 후 획득된 현재의 손실된 프레임의 IMDCT 계수는 오버랩-애드를 위해 OLA 모듈로 입력된다. 그리고 나서, 프레임 삭제 은폐 후 현재의 손실된 프레임의 고역 시그널이 획득된다.
IMDCT 계수 대신 MDCT 계수가 반복되고 감쇠된 경우, IMDCT가 MDCT 계수에 수행되어 IMDCT 계수를 획득하고, IMDCT 계수는 감쇠된다. 현재의 손실된 프레임의 시간 영역 데이터는 OLA프로세스를 통해 획득된다. 그러나, IMDCT 프로세스의 계산량이 더 추가된다. 이전 프레임의 IMDCT 계수가 반복되고 직접적으로 감쇠되고 현재의 손실된 프레임의 시간 영역 데이터가 OLA 프로세스를 사용하여 합성된 경우, 계산량이 감소될 수 있음을 당업자는 인식할 수 있다.
또한, 예를 들어, 고역 디코더가 FFT(Fast Fourier Trasform)를기반으로 한 고역 디코더인 경우, 이전 프레임의 IFFT(Invert Fast Fourier Transform) 계수가 반복되고 감쇠되어 현재의 손실된 프레임의 IFFT 계수를 추정할 수 있다. 그리고 나서, OLA는 현재의 손실된 프레임의 시간 영역 데이터를 획득하기 위해 수행된다.
현재의 손실된 프레임의 IFFT 계수는 다음과 같은 공식을 사용하여 추정될 수 있다:
dcur(n)=dpre(n)·α, n=0,...,M-1
상기 공식에서, dcur(n)은 현재의 손실된 프레임의 IFFT 계수이며, dpre(n)은 이전 프레임의 IFFT 계수이며, M은 프레임에서 샘플의 개수를 나타낸다. 감쇠 계수 α는 0부터 1까지 범위의 비음수이다. 감쇠 계수 α는 0.875와 같은 상수이거나 연속적으로 손실된 패킷의 개수에 따라 적응적으로 변하는 변수일 수 있다. 예를 들어, 첫 번째로 손실된 프레임에 0.9와 같은 보다 큰 감쇠 계수를 곱하는 반면, 두 번째로 손실된 프레임에는 0.7과 같은 보다 작은 감쇠 계수를 곱한다.
현재의 손실된 프레임 전의 (M-N) 샘플은 다음과 같은 OLA 공식을 사용하여회복된다:
shb(n)=w(n+N)dpre(n+N)+w(n)dcur(n), n=0,...,M-N-1.
상기 공식에서, shb(n)는 현재의 손실된 프레임의 시간 영역 데이터이며, w(n)은 OLA 합성 동안 추가될 윈도우 함수, 예컨대 해밍 윈도우 및 사인 곡선 윈도 우이다.
현재의 손실된 프레임 후 (2N-M) 샘플은 다음과 같은 공식을 사용하여 회복된다:
shb(n)=dcur(n), n=M-N,...,N-1
상기 공식에서, M은 프레임에 의해 요구되는 IFFT 계수의 개수이고, N은 프레임의 샘플의 개수이다.
두 개의 계층 코덱(two layer codec)을 제외하고, 스피치 디코더는 핵심 계층(core layer) 및 강화 계층(enhance layer)을 포함한 다중-계층 디코더를 더 포함할 수 있다. 핵심 코덱(core codec)은 종래의 협대역 또는 광대역 코덱이다. 임의의 강화 계층은 핵심 코덱의 핵심 계층을 기반으로 확장된다. 따라서, 핵심 계층은 해당 종래의 보이스 코덱과 직접적으로 상호간 통신할 수 있다. 강화 계층은 저역 보이스 시그널의 보이스 품질을 향상시키도록 구성된 저역 강화 계층 및 보이스 대역폭을 확장하도록 구성된 고역 강화 계층을 포함한다. 예를 들어, 협대역 시그널은 광대역 시그널로 확장되거나, 광대역 시그널은 초광대역 시그널(ultra-wideband signal)로 확장되거나, 초광대역 시그널은 전대역 시그널(fullband signal)로 확장된다. 그러나, 적어도 두 개의 계층을 포함하는 스피치 디코더는 저역 시그널 및 고역 시그널로 디코딩된 상이한 계층의 시그널을 합성하고, 각각에 대해 프레임 삭제 은폐 프로세싱을 수행하며, 따라서, 스피치 디코더로부터 출력될 보이스 시그널이 획득된다. 따라서, 본 발명의 일 실시예에 따른 고역 시그널에 대 한 프레임 삭제 은폐 수행을 위한 기술적 해결책은 핵심 계층 및 강화 계층을 포함한 다중 계층 디코더에도 적용 가능하다.
상술한 바로부터 확인할 수 있는 것처럼, 본 발명의 일 실시예에 따라 제공된 기술적 해결책에 따라, 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도가 계산되고; 그리고 나서, 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도가 기구성된 임계치보다 높거나 동일한지 여부가 결정되며; 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 피치 주기 반복 기반 방법이 현재의 손실된 프레임의 고역 시그널에 대한 프레임 삭제 은폐를 수행하기 위해 사용된다. 따라서, 고역 시그널이 강한 주기성을 가지는 경우, 고역 시그널의 주기성은 고역 시그널의 주기성이 붕괴되는 경우에도 붕괴되지 않는다. 그 결과, 고역 시그널의 주기성이 붕괴되어 보이스 시그널의 품질이 저하되는 문제는 방지될 수 있다.
또한, 본 발명의 일 실시예에 따르면, 프레임 삭제 은폐가 저역 시그널에 대해 수행되고 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도가 계산되는 경우, 저역 시그널의 피치 주기가 획득된다. 따라서, 주기성 강도 계산 모듈(periodicity intensity calculation module)의 구성으로 인한 하드웨어 오버헤드(hardware overrhead)는 감소될 수 있다.
고역 시그널의 주기적 강도가 임계치보다 낮고 고역 시그널의 주기적 강도가 약한 것으로 결정되는 경우, 이전 프레임 데이터 반복 기반 방법이 현재의 손실된 프레임에 대해 프레임 삭제 은폐를 수행하기 위해 사용된다. 고역 시그널의 주기적 강도가 약한 경우, 고주파수 노이즈가 개입된다. 따라서, 고주파수 노이즈가 개입됨으로써 보이스 시그널의 보이스 품질이 저하되는 문제점이 방지될 수 있다. 이와 같은 방법으로, 본 발명의 일 실시예에 따른 고역 시그널에 대한 프레임 삭제 은폐 수행을 위한 기술적 해결책은 스피치 디코더로부터의 보이스 시그널 출력의 품질을 향상시킬 수 있다.
또한, 고역 시그널 디코더의 알고리즘이 주파수 영역 알고리즘인 경우, 이전 프레임의 주파수 영역 데이터로부터 시간 영역 데이터를 회복하는 동안의 중간 데이터는 현재의 손실된 프레임의 고역 시그널에 대한 프레임 삭제 은폐를 수행하기 위해 사용될 수 있다. 고역 시그널이 MDCT를 기반으로 인코딩된 경우, 디코더로부터 획득된 IMDCT 계수가 반복되고 감쇠될 수 있으며, 그리고 나서 OLA 프로세스가 현재의 손실된 프레임의 시간 영역 데이터를 회복하기 위해 수행된다. 따라서, 계산량이 감소될 수 있다.
당업자는 본 발명이 하드웨어 또는 소프트웨어 또는 둘 모두를 사용하여 구현될 수 있음을 용이하게 인식할 것이다. 본 발명의 범위 내에서 실시예는 또한 컴퓨터-실행가능 명령어, 컴퓨터-판독가능 명령어, 또는 컴퓨터-판독가능 미디어에 저장된 데이터 구조를 전달하거나 가지기 위한 컴퓨터-판독가능 미디어를 포함할 수 있다. 이러한 컴퓨터-판독가능 미디어는 물리적 저장 미디어(physical storage media), 예컨대 RAM, ROM, 다른 광 디스크 저장 매체, 또는 자기 디스크 저장 매체를 포함할 수 있다. 상기 컴퓨터-판독가능 미디어에 저장된 프로그램의 구조는 기계에 의해 실행되어 방법을 수행할 수 있다. 상기 방법은 본 발명의 어느 하나의 방법 실시예의 단계를 포함할 수 있다.
상술한 실시예는 설명을 위해서만 제공되며, 상기 실시예의 순서는 상기 실시예를 구현하기 위한 기준으로써 고려되지 않을 것이다. 또한, 실시예에서 "단계"라는 표현은 본 발명을 구현하기 위한 단계의 순서를 명세서에 기술된 순서로 제한하지 않도록 의도된다.
추가적인 장점 및 변경은 당업자에 의해 용이하게 이루어질 것이다. 따라서, 보다 넓은 관점에서 본 발명은 구체적인 세부 사항 및 명세서에 도시되고 기술된 대표적인 실시예에 제한되지 않는다. 따라서, 다양한 변경 및 변화는 추가된 청구항 및 그 균등물에 의해 정의된 본 발명의 범위로부터 분리되지 않으면서 만들어질 수 있다.

Claims (18)

  1. 고역 시그널에 대한 프레임 삭제 은폐 수행 방법으로서,
    저역 시그널의 피치 주기 정보(pitch period information)에 대한 고역 시그널의 주기적 강도(periodic intensity)를 계산하는 단계;
    상기 주기적 강도가 기구성된 임계치(preconfigured threshold)보다 높거나 동일한지 여부를 판단하고, 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 피치 주기 반복 기반 방법(pitch period repetition based method)으로 현재의 손실된 프레임의 상기 고역 시그널에 대해 프레임 삭제 은폐(frame erasure concealment)를 수행하는 단계, 그리고 상기 주기적 강도가 상기 기구성된 임계치보다 낮은 경우, 이전 프레임 데이터 반복 기반 방법(previous frame data repetition based method)으로 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 프레임 삭제 은폐를 수행하는 단계;
    를 포함하는 프레임 삭제 은폐 수행 방법.
  2. 제 1항에 있어서, 상기 저역 시그널의 상기 피치 주기 정보는
    상기 저역 시그널의 피치 주기 및 상기 저역 시그널의 상기 피치 주기 내의 인터벌(interval)을 포함하며, 상기 인터벌의 제 1 경계(first border)는 상기 저역 시그널의 상기 피치 주기로부터 m을 감산함으로써 획득된 값 및 최소 피치 주기 중 큰 값이며, 상기 인터벌의 제 2 경계(second border)는 상기 저역 시그널의 상 기 피치 주기에 m을 더함으로써 획득된 값 및 최대 피치 주기 중 작은 값이고, m은 3보다 작거나 동일한 프레임 삭제 은폐 수행 방법.
  3. 제 1항 또는 제 2항에 있어서, 상기 저역 시그널의 상기 피치 주기는 상기 저역 시그널의 프레임 삭제 은폐 프로세스를 통해 획득되는 프레임 삭제 은폐 수행 방법.
  4. 제 1항에 있어서, 상기 저역 시그널의 피치 주기 정보에 대한 고역 시그널의 주기적 강도를 계산하는 단계는:
    현재의 손실된 프레임의 상기 고역 시그널의 히스토리 버퍼 시그널(history buffer signal)을 사용한 자동상관 함수(autocorrelation fuction) 및 정규화된 상관 함수(normalized correlation function)를 통해 상기 저역 시그널의 상기 피치 주기 정보에 대한 상기 고역 시그널의 상기 주기적 강도를 계산하는 단계를 포함하는 프레임 삭제 은폐 수행 방법.
  5. 제 1항 또는 제 4항에 있어서,
    상기 피치 주기 반복 기반 방법은 피치 반복 기반 방법(pitch repetition based method), 피치 반복 및 감쇠 기반 방법(pitch repetition and attenuation based method) 및 모델-기반 재생 방법(model-based regeneration method)을 포함하는 프레임 삭제 은폐 수행 방법.
  6. 제 5항에 있어서, 상기 피치 반복 및 감쇠 기반 방법으로 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 상기 프레임 삭제 은폐를 수행하는 단계는:
    상기 피치 주기를 기반으로 상기 고역 시그널의 히스토리 버퍼 시그널을 복제하고, 사인 곡선 윈도우(sinusoid window)를 복제된 시그널에 추가하고, 윈도우된 시그널(windowed signal)을 감쇠하여 상기 현재의 프레임의 IMDCT(Invert Modified Discrete Cosine Transform) 계수의 추정된 값을 획득하는 단계; 및
    상기 추정된 값을 이전 프레임의 IMDCT 계수의 나중 부분(latter part)과 오버랩-애드(overlap-adding)하고 감쇠하는 단계;
    를 포함하는 프레임 삭제 은폐 수행 방법.
  7. 제 6항에 있어서,
    상기 추정된 값을 상기 이전 프레임의 IMDCT 계수의 상기 나중 부분과 오버랩-애드하고 감쇠하기 위한 감쇠 계수(attenuation coefficient)는 연속적으로 손실된 패킷의 개수에 따라 적응적으로(adaptively) 변하는 변수인 프레임 삭제 은폐 수행 방법.
  8. 제 1항에 있어서,
    상기 이전 프레임 데이터 반복 기반 방법은 이전 프레임 반복 기반 방법(previous frame repetition based method), 이전 프레임 반복 및 감쇠 기반 방 법(previous frame repetition and attenuation based method) 및 코더 파라미터 인터폴레이션 기반 방법(coder parameter interpolation based method)를 포함하는 프레임 삭제 은폐 수행 방법.
  9. 제 8항에 있어서, 이전 프레임 데이터 반복 및 감쇠 기반 방법으로 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 상기 프레임 삭제 은폐를 수행하는 단계는:
    상기 현재의 손실된 프레임의 이전 프레임의 시간 영역 데이터(time domain data)를 상기 현재의 프레임의 상기 시간 영역 데이터로 사용하고 상기 시간 영역 데이터를 감쇠하는 단계를 포함하는 프레임 삭제 은폐 수행 방법.
  10. 제 8항 또는 제 9항에 있어서, 상기 이전 프레임 반복 방법으로 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 상기 프레임 삭제 은폐를 수행하는 단계는:
    상기 현재의 손실된 프레임의 상기 이전 프레임의 주파수 영역 데이터(frequent domain data)로부터 시간 영역 데이터를 회복하는 동안 획득된 중간 데이터(intermediate data)를 상기 현재의 손실된 프레임의 상기 중간 데이터로 사용하고 상기 중간 데이터를 감쇠하는 단계, 및 상기 현재의 손실된 프레임의 상기 감쇠된 시간 영역 데이터를 상기 현재의 손실된 프레임의 상기 중간 데이터와 합성하는 단계; 또는, 상기 이전 프레임의 상기 주파수 영역 데이터로부터 상기 시간 영역 데이터를 회복하는 동안 획득되고 감쇠된 상기 중간 데이터를 상기 현재의 손실된 프레임의 상기 중간 데이터로 사용하는 단계, 및 상기 현재의 손실된 프레임의 상기 시간 영역 데이터를 상기 현재의 손실된 프레임의 상기 중간 데이터와 합성하는 단계;
    를 포함하는 프레임 삭제 은폐 수행 방법.
  11. 제 10항에 있어서, 상기 중간 데이터가 상기 IMDCT 계수인 경우, 상기 현재의 손실된 프레임의 상기 시간 영역 데이터를 상기 현재의 손실된 프레임의 상기 중간 데이터와 합성하는 단계는:
    상기 현재의 손실된 프레임의 상기 IMDCT 계수 및 상기 이전 프레임의 상기 IMDCT 계수를 오버랩-애드하여 상기 현재의 손실된 프레임의 상기 시간 영역 데이터를 획득하는 단계를 포함하는 프레임 삭제 은폐 수행 방법.
  12. 고역 시그널에 대한 프레임 삭제 은폐 수행 장치로서,
    저역 시그널의 피치 주기 정보에 대한 상기 고역 시그널의 주기적 강도를 계산하고, 상기 주기적 강도가 기구성된 임계치보다 높거나 동일한지 여부를 판단하고, 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 현재의 손실된 프레임의 상기 고역 시그널을 피치 주기 반복 모듈로 전송하고, 상기 주기적 강도가 상기 기구성된 임계치보다 낮은 경우, 상기 현재의 손실된 프레임의 상기 고역 시그널을 이전 프레임 데이터 반복 모듈로 전송하도록 구성된 주기적 강도 계 산 모듈;
    피치 주기 반복 기반 방법으로 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 상기 프레임 삭제 은폐를 수행하도록 구성된 상기 피치 주기 반복 모듈; 및
    이전 프레임 데이터 반복 기반 방법으로 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 상기 프레임 삭제 은폐를 수행하도록 구성된 상기 이전 프레임 데이터 반복 모듈;
    을 포함하는 프레임 삭제 은폐 수행 장치.
  13. 제 12항에 있어서, 상기 이전 프레임 데이터 반복 모듈은
    상기 이전 프레임의 상기 고역 시그널을 상기 현재의 손실된 프레임으로 복제하도록 구성된 이전 프레임 고역 시그널 반복 모듈; 및
    상기 이전 프레임의 상기 고역 시그널에 대해 상기 반복 모듈에 의해 복제된 상기 이전 프레임의 상기 고역 시그널에 감쇠 계수를 승산하여 상기 프레임 삭제 은폐 후 상기 고역 시그널을 획득하도록 구성된 감쇠 모듈;
    을 포함하는 프레임 삭제 은폐 수행 장치.
  14. 제 12항에 있어서, 상기 이전 프레임 데이터 반복 모듈은
    상기 이전 프레임의 주파수 영역 데이터로부터 시간 영역 데이터를 회복하는 동안 IMDCT 계수를 저장하도록 구성된 이전 프레임 IMDCT(Invert Modified Discrete Cosine Transform) 계수 저장 모듈;
    상기 이전 프레임 IMDCT 계수 저장 모듈의 상기 IMDCT 계수를 감쇠하여 상기 현재의 손실된 프레임의 상기 IMDCT 계수를 획득하도록 구성된 감쇠 모듈; 및
    상기 이전 프레임 IMDCT 계수 저장 모듈의 상기 이전 프레임의 상기 IMDCT 계수 및 상기 감쇠 모듈에 의해 획득된 상기 현재의 손실된 프레임의 상기 IMDCT 계수를 오버랩-애드(overlap-add)하여, 상기 현재의 손실된 프레임의 상기 시간 영역 데이터를 획득하도록 구성된 OLA(OverLap-Add) 모듈;
    을 포함하는 프레임 삭제 은폐 수행 장치.
  15. 제 12항에 있어서, 상기 피치 주기 반복 모듈은
    피치 주기에 따라 현재의 프레임의 시그널을 복제하도록 구성된 반복 모듈;
    사인 곡선 윈도우를 복제된 시그널로 추가하고 윈도우된 시그널(windowed signal)을 감쇠하여, 상기 현재의 프레임의 상기 IMDCT 계수의 추정된 값을 획득하도록 구성된 감쇠 모듈; 및
    상기 추정된 값을 상기 이전 프레임의 상기 IMDCT 계수의 나중 부분과 오버랩-애드하고 감쇠하도록 구성된 OLA(OverLap-Add) 모듈;
    을 포함하는 프레임 삭제 은폐 수행 장치.
  16. 입력 비트스트림을 저역 비트스트림 및 고역 비트스트림으로 디멀티플렉스하도록 구성된 비트스트림 디멀티플렉스 모듈;
    상기 저역 비트스트림 및 상기 고역 비트스트림을 저역 시그널 및 고역 시그널로 각각 디코딩하도록 구성된 저역 시그널 디코더 및 고역 시그널 디코더;
    상기 저역 시그널의 피치 주기를 획득하기 위해 상기 저역 시그널에 대해 프레임 삭제 은폐를 수행하도록 구성된 저역 시그널 프레임 삭제 은폐 장치;
    상기 저역 시그널의 피치 주기 정보에 대한 상기 고역 시그널의 주기적 강도를 계산하고, 상기 고역 시그널의 상기 주기적 강도가 기구성된 임계치보다 높거나 동일한지 여부를 결정하고, 상기 고역 시그널의 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 피치 주기 반복 기반 방법을 사용하여 현재의 손실된 프레임의 상기 고역 시그널에 대해 프레임 삭제 은폐를 수행하고, 상기 고역 시그널의 상기 주기적 강도가 상기 기구성된 임계치보다 낮은 경우, 잉전 프레임 데이터 반복 기반 방법을 사용하여 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 프레임 삭제 은폐를 수행하도록 구성된 고역 시그널 프레임 삭제 은폐 장치; 및
    상기 프레임 삭제 은폐 후 상기 저역 시그널 및 상기 고역 시그널을 출력될 보이스 시그널로 합성하도록 구성된 QMF 합성기(synthesis Quadrature-Mirror Filterbank);
    를 포함하는 스피치 디코더(speech decoder).
  17. 제 16항에 있어서, 상기 고역 시그널 프레임 삭제 은폐 장치는
    상기 현재의 손실된 프레임의 상기 저역 시그널의 피치 주기 정보에 대한 상 기 고역 시그널의 상기 주기적 강도를 계산하고, 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한지 여부를 판단하고, 상기 주기적 강도가 상기 기구성된 임계치보다 높거나 동일한 경우, 상기 현재의 손실된 프레임의 상기 고역 시그널을 피치 주기 반복 모듈로 전송하고, 상기 주기적 강도가 상기 기구성된 임계치보다 낮은 경우, 상기 현재의 손실된 프레임의 상기 고역 시그널을 이전 프레임 데이터 반복 모듈로 전송하도록 구성된 주기적 강도 계산 모듈;
    피치 주기 반복 기반 방법으로 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 상기 프레임 삭제 은폐를 수행하도록 구성된 상기 피치 주기 반복 모듈; 및
    이전 프레임 데이터 반복 기반 방법으로 상기 현재의 손실된 프레임의 상기 고역 시그널에 대해 상기 프레임 삭제 은폐를 수행하도록 구성된 상기 이전 프레임 데이터 반복 모듈;
    을 포함하는 스피치 디코더.
  18. 컴퓨터 유닛에 의해 실행되는 경우, 상기 컴퓨터 유닛을 제 1항 내지 제 11항 중 어느 한 항에 따른 단계를 수행하게 하는 컴퓨터 프로그램 제품.
KR1020087016750A 2007-09-15 2008-05-04 고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치 KR20090076797A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN200710153955.0 2007-09-15
CN200710153955 2007-09-15
CNB2007101945709A CN100524462C (zh) 2007-09-15 2007-11-24 对高带信号进行帧错误隐藏的方法及装置
CN200710194570.9 2007-11-24

Publications (1)

Publication Number Publication Date
KR20090076797A true KR20090076797A (ko) 2009-07-13

Family

ID=41333853

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087016750A KR20090076797A (ko) 2007-09-15 2008-05-04 고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20090076797A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200481B2 (en) 2007-09-15 2012-06-12 Huawei Technologies Co., Ltd. Method and device for performing frame erasure concealment to higher-band signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200481B2 (en) 2007-09-15 2012-06-12 Huawei Technologies Co., Ltd. Method and device for performing frame erasure concealment to higher-band signal

Similar Documents

Publication Publication Date Title
KR100998430B1 (ko) 상위대역 시그널에 대한 프레임 손실 은닉을 수행하는 방법및 장치
JP6306175B2 (ja) 時間ドメイン励振信号に基づくエラーコンシールメントを用いて、復号化されたオーディオ情報を提供するオーディオデコーダおよび復号化されたオーディオ情報を提供する方法
JP6306177B2 (ja) 時間ドメイン励振信号を修正するエラーコンシールメントを用いて、復号化されたオーディオ情報を提供する、オーディオデコーダおよび復号化されたオーディオ情報を提供する方法
RU2630390C2 (ru) Устройство и способ для маскирования ошибок при стандартизированном кодировании речи и аудио с низкой задержкой (usac)
JP6190052B2 (ja) Tcx ltpについての向上した概念を実現する装置及び方法
TWI553628B (zh) 訊框錯誤隱藏方法
US8744841B2 (en) Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus
RU2680352C1 (ru) Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ и устройство для декодирования аудиосигналов
JP6625544B2 (ja) オーディオ周波数信号の周波数帯域を拡張する方法及び装置
KR102250472B1 (ko) 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합
KR20100134709A (ko) 계층적 디코딩 구조에서의 디지털 오디오 신호의 송신 에러에 대한 은닉
WO2016016724A2 (ko) 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치
KR101409305B1 (ko) 정보의 부재 시에 디코더측에서의 여기를 생성하기 위한 과유성음화의 감쇄
KR20220045260A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
KR20090076797A (ko) 고역 시그널에 대한 프레임 삭제 은폐 수행 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
WITB Request for withdrawal (abandonment) before grant