KR101350285B1 - 신호를 부호화 및 복호화하는 방법, 장치 및 시스템 - Google Patents
신호를 부호화 및 복호화하는 방법, 장치 및 시스템 Download PDFInfo
- Publication number
- KR101350285B1 KR101350285B1 KR1020117017706A KR20117017706A KR101350285B1 KR 101350285 B1 KR101350285 B1 KR 101350285B1 KR 1020117017706 A KR1020117017706 A KR 1020117017706A KR 20117017706 A KR20117017706 A KR 20117017706A KR 101350285 B1 KR101350285 B1 KR 101350285B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- region
- ltp
- flag
- prediction
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 230000007774 longterm Effects 0.000 claims abstract description 123
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims 1
- 230000006835 compression Effects 0.000 abstract description 7
- 238000007906 compression Methods 0.000 abstract description 7
- 238000009432 framing Methods 0.000 description 13
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 신호를 부호화 및 복호화하는 방법, 장치, 및 시스템에 관한 것이다. 부호화 방법은, 제1 영역 신호를 제2 영역 신호로 변환하는 단계; 제2 영역 신호에 대하여, 선형 예측(LP) 처리 및 장기 예측(LTP) 처리를 수행하는 단계; 판정 기준에 따라, 장기 플래그를 취득하는 단계; 장기 플래그가 제1 플래그인 경우에는, LP 처리 결과와 LTP 처리 결과에 따라, 제2 영역 예측 신호를 취득하고, 장기 플래그가 제2 플래그인 경우에는, LP 처리 결과에 따라, 제2 영역 예측 신호를 취득하는 단계; 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하여, 제1 영역 예측 잔차 신호를 계산하는 단계; 및 제1 영역 예측 잔차 신호를 포함하는 비트스트림을 출력하는 단계를 포함한다. 본 발명에 의하면, 장기 플래그가 제2 플래그인 경우에 장기 플래그에 따라 후속되는 부호화 처리 또는 복호화 처리가 적응적으로 수행된다. 이에 따라, LTP 처리 결과를 고려할 필요가 없게 되어, 코덱의 압축 성능이 향상된다.
Description
본 발명은 음성 부호화 및 복호화, 특히 신호를 부호화 및 복호화하기 위한 방법, 장치 및 시스템에 관한 것이다.
관련출원
본 출원은 2008년 12월 31일에 ""Method for Encoding Signal, and Method for Decoding Signal"이란 명칭으로 출원된 중국특허출원 제200810247427.6호와, 2009년 6월 25일에 "Method for Encoding Signal, and Method for Decoding Signal"이란 명칭으로 출원된 중국특허출원 제200910151835.6호에 대하여 우선권을 주장하며, 그 기재 내용을 본 명세서에 참조에 의해 원용한다.
음성 부호화 분야에 광범위하게 적용되는 부호화 모델 중의 하나는 코드 여기 선형 예측(Code Excited Linear Prediction: 이하, 간단히 "CELP"라고 함) 부호화 기법이다. CELP 모델은 시간에 따라 변화하는 2개의 선형 회귀 필터(linear recursive filter)를 여기시키기 위해 거의 백색의 여기 신호를 사용한다. 여기 신호(excitation signal)는 가우스 백색 잡음(Gaussian white noise) 시퀀스로 이루어진 코드북(codebook)에서 선택되는 것이 일반적이다. 각 필터의 피드백 루프는 예측기(predictor)를 포함한다. 예측기 중의 하나는 장기 예측기(long-term predictor)[또는 피치 예측기(pitch predictor)로서, P(z)로 표시된다. P(z)는 유성음(voiced speech)의 음조 구조(예를 들어, 스펙트럼의 미세 구조)를 생성하는 데에 사용된다. 다른 일반적인 예측기는 단기 예측기(short-term predictor)로서, F(z)로 표시된다. F(z)는 음성의 단기 스펙트럼 포락(short-term spectrum envelope)을 복원하는 데에 사용된다. 이러한 모델은 역 과정(reverse process)에 의해 유도된다. 즉 F(z)는 음성 신호의 근점 샘플 포인트(near sample point)의 중복(redundancy)을 제거하는 데에 사용되며, P(z)는 음성 신호의 원점 샘플 포인트(far sample point)의 중복을 제거하는 데에 사용된다. 정규화된 잔차 신호(normalized residual signal)는 2가지 레벨의 예측에 의해 취득된다. 이 잔차 신호는 표준 정규화 분포(standard normal distribution)를 근사적으로 따른다.
CELP 모델을 손실이 생긴 압축 필드에 적용하는 경우, 먼저 음성 신호 x(i)에 대하여 선형 예측 부호화(Linear Predictive Coding: 이하, 간단히 "LPC"라고 함) 분석을 행하여 LPC 잔차 신호 res(i)를 구한다. LPC 잔차 신호 res(i)를 프레이밍한 후에, 각각의 서브프레임 신호에 대하여 장기 예측(Long-Term Prediction: 이하, 간단히 "LTP"라고 함) 분석을 행하여, 대응하는 적응 코드북 및 적응 코드북 이득(adaptive codebook gain)을 구한다. 적응 코드북은 자기상관(autocorrelation)과 같은 많은 방법으로 검색해낼 수 있다. LPC 잔차 신호 res(i)의 장기 의존성(long-term dependence)을 제거한 후에, LTP 잔차 신호 x2(i)를 구한다. 대수 코드북(algebraic codebook)을 사용하여 LTP 잔차 신호 x2(i)를 표시 및 조정하는 데에 사용한 후, 전체 부호화 과정을 완료한다. 마지막으로, 적응 코드북 및 고정된 코드북을 부호화하여 비트스트림으로 기입하고, 적응 코드북 이득 및 고정된 코드북 이득에 대하여 결합 벡터 양자화(joint vector quantization) 또는 스칼라 양자화(scalar quantization)를 수행한다. 최적의 이득에 대응하는 인덱스(index)가 복호화기(decoder)로 전송된다. 전체 부호화 과정은 펄스 코드 변조(Pulse Code Modulation: 이하, 간단히 "PCM"이라 함) 영역에서 이루어진다.
무손실(lossless) 압축 필드에서는, MPEG ALS(Moving Pictures Experts Group Audio Lossless Coding) 장치가 예측을 위한 음성 신호의 단기 및 장기 의존성을 사용한다. 그 예측 과정은 다음과 같다. 먼저, 음성 신호에 대하여 LPC를 수행하고, LPC 계수에 대해 엔트로피 부호화(entropy coding)를 행하여 비트스트림으로 기입한다. LPC 잔차 신호에 대하여 LTP를 수행하여 LTP의 피치 및 피치 이득을 구한 후, LPC 잔차 신호를 비트스트림으로 기입한다. LTP 이후에, LTP 잔차 신호를 구하고, LTP 잔차 신호에 대하여 엔트로피 부호화를 행한 후, 비트스트림으로 기입하면, 전체 부호화 과정이 끝난다.
상기 설명한 종래 기술에서는, 음성 신호의 주기성이 비교적 약하다면, LTP 처리를 거의 사용하지 못한다. 이 경우, LTP 잔차 신호는 여전히 비트스트림으로 기입된다. 따라서, 피치 이득 양자화에 너무 많은 비트를 사용하게 되어, 부호화기의 압축 성능이 떨어진다.
본 발명의 실시예는 코덱의 압축 성능을 향상시키기 위해 신호를 부호화 및 복호화하는 방법, 장치 및 시스템을 제공한다.
본 발명의 실시예에 의한 신호 부호화 방법은, 제1 영역 신호(domain signal)를 제2 영역 신호로 변환하는 단계; 제2 영역 신호에 대하여, 선형 예측(linear prediction: LP) 처리 및 장기 예측(long-term prediction: LTP) 처리를 수행하는 단계; 판정 기준에 따라, 장기 플래그(long-term flag)를 취득하는 단계; 장기 플래그가 제1 플래그인 경우에는, LP 처리 결과와 LTP 처리 결과에 따라, 제2 영역 예측 신호(domain predictive signal)를 취득하고, 장기 플래그가 제2 플래그인 경우에는, LP 처리 결과에 따라, 제2 영역 예측 신호를 취득하는 단계; 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하여, 제1 영역 예측 잔차 신호(domain predictive residual signal)를 계산하는 단계; 및 제1 영역 예측 잔차 신호를 포함하는 비트스트림(bit stream)을 출력하는 단계를 포함한다.
본 발명의 실시예에 의한 신호 복호화 방법은, 수신한 비트스트림을 복호화하여 복호화된 제1 영역 예측 잔차 신호(domain predictive residual signal)를 취득하는 단계; 현재 프레임 신호의 제1 샘플 포인트를 복호화하는 단계; 현재 프레임 신호의 제2 샘플 포인트로부터 모든 현재 샘플 포인트에 대하여 이하의 복호화 단계를 수차로 수행하는 단계; 복호화된 샘플 포인트의 제2 영역 신호에 따라, 현재 샘플 포인트의 선형 예측(linear prediction: LP) 신호를 계산하는 단계; 취득한 장기 플래그(long-term flag)가 제1 플래그인 경우에, LP 신호와, 복호화된 샘플 포인트의 LP 잔차 신호에 따라 취득되는 장기 예측(long-term prediction: LTP) 기여 신호(contribution signal)에 따라, 제2 영역 예측 신호를 취득하는 단계; 취득한 장기 플래그가 제1 플래그가 아닌 경우에, LP 신호에 따라 제2 영역 예측 신호를 취득하는 단계; 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 제1 영역 예측 잔차 신호와 제1 영역 예측 신호에 따라, 현재 샘플 포인트의 제1 영역 신호를 복호화하는 단계; 및 현재 샘플 포인트의 제1 영역 신호를 제2 영역 신호로 변환하고, 제2 영역 신호와 LP 신호에 따라 LP 잔차 신호를 취득하는 단계를 포함한다.
본 발명의 실시예에 의한 신호 부호화 장치는, 제1 영역 신호를 제2 영역 신호로 변환하고, 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하는 변환 모듈; 제2 영역 신호에 대하여, 선형 예측(linear prediction: LP) 처리를 수행하는 선형 예측(LP) 모듈; 제2 영역 신호에 대하여, 장기 예측(long-term prediction: LTP) 처리를 수행하는 장기 예측(LTP) 모듈; 판정 기준에 따라, 장기 플래그(long-term flag)를 취득하는 판정 모듈; 장기 플래그가 제1 플래그인 경우에는, LP 처리 결과와 LTP 처리 결과에 따라, 제2 영역 예측 신호(domain predictive signal)를 취득하고, 장기 플래그가 제2 플래그인 경우에는, LP 처리 결과에 따라, 제2 영역 예측 신호를 취득하는 제2 영역 예측 모듈; 제1 영역 예측 신호에 따라 제1 영역 예측 잔차 신호(domain predictive residual signal)를 계산하는 제1 영역 예측 잔차 모듈; 및 제1 영역 예측 잔차 신호를 포함하는 비트스트림(bit stream)을 출력하는 출력 모듈을 포함한다.
본 발명의 실시예에 의한 신호 복호화 장치는, 수신한 비트스트림을 복호화하여, 제1 영역 예측 잔차 신호(domain predictive residual signal)를 취득하는 비트스트림 복호화 모듈; 현재 프레임 신호의 제1 샘플 포인트를 복호화하는 제1 샘플 포인트 복호화 모듈; 복호화된 샘플 포인트의 제2 영역 신호에 따라, 현재 샘플 포인트의 선형 예측(linear prediction: LP) 신호를 계산하는 선형 예측(LP) 모듈; 취득한 장기 플래그(long-term flag)가 제1 플래그인 경우에, LP 신호와, 복호화된 샘플 포인트의 LP 잔차 신호에 따라 취득되는 장기 예측(long-term prediction: LTP) 기여 신호에 따라, 제2 영역 예측 신호를 취득하거나, 취득한 장기 플래그가 제1 플래그가 아닌 경우에, LP 신호에 따라 제2 영역 예측 신호를 취득하는 제2 영역 예측 모듈; 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 현재 샘플 포인트의 제1 영역 신호를 제2 영역 신호로 변환하는 변환 모듈; 제1 영역 예측 잔차 신호와 제1 영역 예측 신호에 따라, 현재 샘플 포인트의 제1 영역 신호를 복호화하는 현재 샘플 포인트 복호화 모듈; 및 제2 영역 신호와 LP 신호에 따라, LP 잔차 신호를 취득하는 LP 잔차 모듈을 포함한다.
본 발명의 실시예에 의한 신호 코덱 시스템(signal codec system)은, 제1 영역 신호를 제2 영역 신호로 변환하고, 제2 영역 신호에 대하여, 선형 예측(linear prediction: LP) 처리 및 장기 예측(long-term prediction: LTP) 처리를 수행하고, 판정 기준에 따라 장기 플래그(long-term flag)를 취득하고, 장기 플래그가 제1 플래그인 경우에는, LP 처리 결과와 LTP 처리 결과에 따라, 제2 영역 예측 신호(domain predictive signal)를 취득하며, 장기 플래그가 제2 플래그인 경우에는, LP 처리 결과에 따라, 제2 영역 예측 신호를 취득하고, 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 제1 영역 예측 잔차 신호를 계산하고, 제1 영역 예측 잔차 신호를 포함하는 비트스트림(bit stream)을 출력하도록 구성된 신호 부호화 장치; 및
수신한 비트스트림을 복호화하여, 제1 영역 예측 잔차 신호와 장기 플래그를 취득하고, 현재 프레임 신호의 제1 샘플 포인트를 복호화하고, 현재 프레임 신호의 제2 샘플 포인트로부터 모든 현재 샘플 포인트에 대하여 이하의 복호화 단계를 순차적으로 수행하고, 복호화된 샘플 포인트의 제2 영역 신호에 따라 현재 샘플 포인트의 선형 예측(LP) 신호를 계산하고, 취득한 장기 플래그가 제1 플래그인 경우에, LP 신호와, 복호화된 샘플 포인트의 LP 잔차 신호에 따라 취득되는 장기 예측(LTP) 기여 신호에 따라, 제2 영역 예측 신호를 취득하거나, 취득한 장기 플래그가 제1 플래그가 아닌 경우에, LP 신호에 따라 제2 영역 예측 신호를 취득하고, 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 제1 영역 예측 잔차 신호 및 제1 영역 예측 신호에 따라 현재 샘플 포인트의 제1 영역 신호를 복호화하고, 현재 샘플 포인트의 제1 영역 신호를 제2 영역 신호로 변환하고, 제2 영역 신호와 LP 신호에 따라 LP 잔차 신호를 취득하는 신호 복호화 장치를 포함한다.
본 발명의 실시예에 의하면, 장기 플래그가 제2 플래그인 경우에 장기 플래그에 따라, 후속되는 부호화 처리 또는 복호화 처리가 적응적으로 수행된다. 이에 따라, LTP 처리 결과를 고려할 필요가 없게 되어, 코덱의 압축 성능이 향상된다.
도 1은 본 발명의 제1 실시예에 의한 신호 부호화 방법의 플로차트이다.
도 2는 본 발명의 제2 실시예에 의한 신호 부호화 방법의 플로차트이다.
도 3은 본 발명의 제2 실시예에 의한 신호 부호화 방법에서 프레이밍 이후의 프레임의 신호를 나타낸다.
도 4는 본 발명의 제1 실시예에 의한 신호 복호화 방법의 플로차트이다.
도 5는 본 발명의 제2 실시예에 의한 신호 복호화 방법의 플로차트이다.
도 6은 본 발명의 제2 실시예에 의한 신호 복호화 방법 중의 단계 404를 나타내는 플로차트이다.
도 7은 본 발명의 제2 실시예에 의한 신호 복호화 방법 중의 단계 405를 나타내는 플로차트이다.
도 8은 본 발명의 실시예에 의한 신호 부호화 장치의 구조를 나타낸다.
도 9는 본 발명의 실시예에 의한 신호 복호화 장치의 구조를 나타낸다.
도 10은 본 발명의 실시예에 의한 신호 코덱 시스템의 구조를 나타낸다.
도 2는 본 발명의 제2 실시예에 의한 신호 부호화 방법의 플로차트이다.
도 3은 본 발명의 제2 실시예에 의한 신호 부호화 방법에서 프레이밍 이후의 프레임의 신호를 나타낸다.
도 4는 본 발명의 제1 실시예에 의한 신호 복호화 방법의 플로차트이다.
도 5는 본 발명의 제2 실시예에 의한 신호 복호화 방법의 플로차트이다.
도 6은 본 발명의 제2 실시예에 의한 신호 복호화 방법 중의 단계 404를 나타내는 플로차트이다.
도 7은 본 발명의 제2 실시예에 의한 신호 복호화 방법 중의 단계 405를 나타내는 플로차트이다.
도 8은 본 발명의 실시예에 의한 신호 부호화 장치의 구조를 나타낸다.
도 9는 본 발명의 실시예에 의한 신호 복호화 장치의 구조를 나타낸다.
도 10은 본 발명의 실시예에 의한 신호 코덱 시스템의 구조를 나타낸다.
이하, 본 발명의 실시예에 대하여, 첨부 도면과 실시예를 참조하여 더 구체적으로 설명한다.
도 1은 본 발명의 제1 실시예에 의한 신호 부호화 방법의 플로차트이다. 본 방법은 다음의 단계를 포함한다.
단계 101: 제1 영역 신호를 제2 영역 신호로 변환한다.
단계 102: 제2 영역 신호에 대하여 선형 예측(Linear Predictive: LP) 처리와 장기 예측(Long-Term Prediction: LTP) 처리를 수행한다.
단계 103: 판정 기준에 따라, 장기 플래그(long-term flag)를 취득한다.
단계 104: 장기 플래그가 제1 플래그이면, LP 처리 결과와 LTP 처리 결과에 따라, 제2 영역 예측 신호(domain predictive signal)를 취득하고, 장기 플래그가 제2 플래그이면, LP 처리 결과에 따라, 제2 영역 예측 신호(domain predictive signal)를 취득한다.
단계 105: 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 제1 영역 예측 잔차 신호(domain predictive residual signal)를 계산한다.
단계 106: 제1 영역 예측 잔차 신호를 포함하는 비트스트림을 출력한다.
본 실시예에서, 장기 플래그는 판정 기준에 따라 취득된다. 제2 영역 예측 신호는 장기 플래그가 제1 플래그인 경우에는 LP 처리 결과와 LTP 처리 결과에 따라 취득되며, 장기 플래그가 제2 플래그인 경우에는 LP 처리 결과에 따라 취득된다. 비트스트림은 제2 영역 예측 신호에 따라 취득된다. 본 실시예에서, 장기 플래그에 따라 후속하는 부호화 처리가 적응적으로 수행된다. 장기 플래그가 제2 플래그이면, LTP 처리 결과를 고려할 필요가 없기 때문에, 코덱(codec)의 압축 성능이 향상된다.
도 2는 본 발명의 제2 실시예에 의한 신호 부호화 방법의 플로차트이다. 본 실시예에서, 제1 영역은 비선형 영역(nonlinear domain)이며, 제1 영역은 A-law 또는 Mu-law 방식이 될 수 있다. 제2 영역은 펄스 코드 변조(Pulse Code Modulation: PCM) 영역이며, LP 처리는 선형 예측 부호화(Linear Predictive Coding: LPC) 처리이고, LTP 처리는 장기 예측(Long Term Prediction) 처리이다.
본 실시예의 방법은 다음과 같은 단계를 포함한다.
단계 201: 비선형 영역 신호를 PCM 영역 신호로 변환한다.
x(i)는 비선형 영역 신호를 나타내며, y(i)는 PCM 영역 신호를 나타낸다. 변환 프로세스가 정확도 손실(precision loss)을 포함한다고 하면, 대응하는 후방 변환(back-conversion) 프로세스는 정확도 손실을 포함하지 않는다.
단계 202: PCM 영역의 전체 프레임 신호(entire-frame signal) y(i)에 대한 LPC 처리를 수행하여, LP 처리 결과를 취득한다. LP 처리 결과는 LP 신호로서 작용하는 LPC 예측 신호 y'(i)를 포함하며, 다음 식으로 표현되는 LP 계수를 포함한다.
상기 식에서 aj는 LP 계수이며, L은 프레임 길이이고, lpc_order는 LP 차수이다. i < 0일 때에 y'(0)=0이면, y(i)=0이다.
단계 203: LP 잔차 신호로서 작용하는 LPC 잔차 신호 res(i)를 PCM 영역 신호 y(i)와 LPC 예측 신호 y'(i)에 따라 계산한다. LPC 잔차 신호는 LP 처리 결과인 것으로 이해해도 된다.
단계 204: LPC 잔차 신호 res(i)에 대하여 프레이밍(framing)를 수행하고, LTP 처리를 수행하여, LTP 처리 결과를 취득한다. 프레이밍 동작은 임의 선택적이며, 적응형 프레이밍 동작으로 해도 된다. LTP 처리 결과에는 피치(pitch) 및 피치 이득(pitch gain)이 포함된다.
구체적으로 말하면, 본 단계에서의 LTP 처리는, LPC 잔차 신호에 대하여 피치 검색을 수행하는 과정, LPC 잔차 신호의 최적의 피치를 취득하는 과정, 또는 LPC 잔차 신호의 최적의 피치 및 피치 이득 모두를 취득하는 과정을 포함한다.
구체적으로, 본 단계에서는, 프레이밍이 수행되지 않는 경우에는, 현재 프레임의 PCM 영역 신호에 대하여 피치 검색을 수행하여, PCM 영역 신호의 최적의 피치를 취득한 후, PCM 영역 신호의 최적의 피치에 따라, LPC 잔차 신호에 대해 상세 검색을 수행하여, LPC 잔차 신호의 최적의 피치를 취득하거나 LPC 잔차 신호의 최적의 피치 및 피치 이득을 취득한다. 프레이밍이 수행되는 경우에는, 프레이밍 동작을 행하기 전에, 현재 프레임의 PCM 영역 신호에 대해 피치 검색을 수행하여, 현재 프레임의 PCM 영역 신호의 최적의 피치를 제1 서브프레임(subframe)의 최적의 피치로서 사용하여, PCM 영역 신호의 최적의 피치를 취득하고, 잔차 영역에서의 각각의 서브프레임에 대해 프레이밍을 수행하며; 잔차 영역에서의 각각의 서브프레임의 피치에 대해 상세 검색을, 즉 이전 서브프레임의 피치 주위의 각 서브프레임의 피치에 대해 검색을 수행함으로써, 서브프레임 피치에 대해 차분 부호화(differential coding)를 행할 수 있으며, 각 서브프레임의 최적의 피치를 취득하거나, 최적의 피치 및 피치 이득 모두를 취득한다.
피치를 검색하는 앞서 설명한 처리 과정에서, 피치 이득을 취득할 수 없으면, 피치 이득을, 취득한 최적의 피치에 따라, 적응적으로 선택해도 된다.
LPC 처리에서는, 처음 몇몇 샘플의 예측 결과가 부정확한 것이 일반적이다. LTP 성능에 영향을 주는 것을 피하기 위해, 본 실시예에서는, 처음 M개의 샘플은 LTP 처리에 참가시키지 않는다. 처음 M개의 샘플을 제외한 LPC 잔차 신호 res(i)에 대해 피치 검색(pitch search)을 수행하여, 각 서브프레임의 피치, 피치 이득 및 LTP 잔차 신호 z(i)를 취득한다.
도 3은 본 발명의 제2 실시예에 의한 신호 부호화 방법에서 프레이밍을 행한 후의 프레임의 신호를 나타낸다. 처음 M개의 샘플은 프레이밍 또는 LTP 처리에 참가하지 않으며, M과 lpc_order 간의 관계는 0≤M≤lpc_order 이다. T1은 제1 서브프레임의 피치를 나타내며, M부터 T1 +M-1까지의 샘플은 버퍼 내의 샘플이다. n0 = T1+M이라고 하면, n0부터 n1-1까지의 샘플은 제1 서브프레임 내의 샘플이고, 제1 서브프레임의 길이는 N1 = n1-n0이다. 유추해보면, nj - 1 부터 nj - 1 까지의 샘플은 서브프레임 j 내의 샘플이며, 서브프레임 j의 길이는 Nj = nj-nj -1이다. 프레임 내의 신호 샘플의 총 수는 L이다.
0부터 T1+M-1까지의 샘플에 대하여, 다음의 등식을 적용한다.
제1 서브프레임의 샘플에 대하여, 다음의 등식을 적용한다.
상기 식에서, g1은 제1 서브프레임의 피치 이득을 나타낸다.
서브프레임 j의 샘플에 대하여, 다음의 등식을 적용한다.
상기 식에서, Tj는 서브프레임 j의 피치를 나타내며, gj는 서브프레임 j의 피치 이득을 나타낸다.
단계 205: LTP 처리를 행하지 않은 LPC 잔차 신호 res(i)의 에너지와 경험 인자(empirical factor)의 곱이 LTP 처리를 행한 LTP 잔차 신호 z(i)의 에너지보다 큰지 여부를 판단해서, 크다면 단계 206을 수행하고, 크지 않다면 단계 207을 수행한다.
E1은 LTP 잔차 신호 z(i)의 에너지를 나타내며, E는 LPC 잔차 신호 res(i)의 에너지를 나타내고, k는 0 또는 M이 될 수 있다. 본 단계에서는 E*fac가 E1보다 큰지 여부를 판단한다. fac는 경험 인자이다. 일반적으로, fac = 0.94이다.
본 단계의 대체가능한 실시예로서, LTP 처리를 행한 LPC 잔차 신호 res(i)의 절대값의 합과 경험 인자의 곱이 LTP 처리를 행한 LTP 잔차 신호 z(i)의 절대값의 합보다 큰지 여부를 판단해서, 크다면 단계 206을 수행하고, 크지 않다면 단계 207을 수행한다.
단계 206: 제1 플래그의 값을 장기 플래그 Tflag에 할당한다. 구체적으로, Tflag를 1로 설정한다. 그리고, 단계 208을 수행한다.
장기 플래그는 LTP 모듈의 트리거 신호가 될 수 있다. Tflag가 1이면, LTP 모듈이 인에이블 상태라는 것을 나타낸다.
단계 207: 제2 플래그의 값을 장기 플래그 Tflag에 할당한다. 구체적으로, Tflag를 0으로 설정한다. 단계 210을 수행한다. Tflag가 0이면, LTP 모듈이 디스에이블 상태라는 것을 나타낸다.
단계 208: 피치, 피치 이득, 및 LPC 잔차 신호 res(i)에 따라, LTP 기여 신호로서 작용하는 LTP 기여 신호 res'(i)를 취득한다. 본 단계는 단계 204에 포함시켜도 된다. 즉, 본 단계를 LPC 처리 과정에 포함시킬 수 있다. LTP 처리는 다음의 식 8로 표현되는 LTP 기여 신호 res'(i)를 더 포함한다.
단계 209: 식 9로 표현되는 바와 같이, PCM 예측 신호 y"(i)로서, LTP 기여 신호 res'(i)와 LPC 예측 신호 y'(i)의 합을 사용하고, 단계 211로 진행한다.
단계 210: 식 10으로 표현되는 바와 같이, PCM 예측 신호 y"(i)로서 LPC 예측 신호 y'(i)를 사용하고, 단계 211로 진행한다.
단계 211: 식 11로 표현되는 바와 같이, PCM 예측 신호 y"(i)를 비선형 영역 예측 신호 x'(i)로 변환한다.
상기 식에서, 함수 PCM2A[]는 PCM 영역 신호를 A-law 신호로 변환하는 것을 의미한다.
단계 212: x(i)와 x'(i)의 차를 계산해서, 비선형 영역 예측 잔차 신호를 취득하고, 비선형 영역 예측 잔차 신호에 대한 엔트로피 부호화를 수행한다.
단계 213: 비선형 영역 예측 잔차 신호의 엔트로피 코드(entropy code)와 장기 플래그를 포함하는 비트스트림을 출력한다. 구체적으로, Tflag가 0이면, 비트스트림은 LPC 계수 aj를 더 포함한다. Tflag가 1이면, 비트스트림은 LPC 계수 aj, 피치, 및 피치 이득을 더 포함한다.
일부 실시예에서, 가변 길이 코딩 필드(length-varying coding field)에서, Tflag가 0이면, LTP 모듈이 디스에이블되고, 장기 플래그를 가진 비트스트림을 출력할 필요가 없다. Tflag가 1이면, LTP 모듈이 인에이블되고, 장기 플래그로서 제1 플래그를 포함하는 비트스트림이 출력되는데, 이 비트스트림은 LPC 계수 aj, 피치, 및 피치 이득을 더 포함한다.
본 실시예에서, 시스템은, LTP 처리를 행하지 않은 LPC 잔차 신호의 에너지와 경험 인자의 곱이 LTP 처리를 행한 LTP 잔차 신호의 에너지보다 큰지 연부를 판단함으로써, LTP 모듈이 인에이블 상태인지 디스에이블 상태인지를 알 수 있다. 음성 신호의 주기성이 비교적 약하다면, LTP 처리는 기여를 거의 하지 않으며, LTP 모듈은 디스에이블 상태로 된다. 따라서, LTP 기여 신호를 고려할 필요가 없으며, 이에 따라 더 적은 수의 비트를 사용하게 되어, 부호화기의 압축 성능이 향상된다.
도 4는 본 발명의 제1 실시예에 의한 신호 복호화 방법의 플로차트이다. 본 방법은 다음의 단계를 포함한다.
단계 301: 수신한 비트스트림을 복호화하여, 제1 영역 예측 잔차 신호를 취득한다.
단계 302: 현재 프레임의 신호의 제1 샘플 포인트(sample point)를 복호화한다.
현재 프레임의 신호의 제2 샘플 포인트로부터 모든 현재의 샘플 포인트에 대하여 복호화 단계 303-306를 차례로 수행한다.
단계 303: 복호화된 샘플 포인트의 제2 영역 신호에 따라, 현재 샘플 포인트의 LP 잔차 신호 및 LP 신호를 계산한다.
단계 304: 취득한 장기 플래그가 제1 플래그인 경우에, LTP 기여 신호와 LP 신호에 따라, 제2 영역 예측 신호를 취득하거나, 취득한 장기 플래그가 제1 플래그가 아닌 경우, LP 신호에 따라, 제2 영역 예측 신호를 취득한다. LTP 기여 신호는 복호화된 샘플 포인트의 LP 잔차 신호에 따라 취득된다.
단계 305: 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 제1 영역 예측 잔차 신호와 제1 영역 예측 신호에 따라, 현재 샘플 포인트의 제1 영역 신호를 복호화한다.
단계 306: 현재 샘플 포인트의 제1 영역 신호를 제2 영역 신호로 변환한다.
본 실시예에서, 후속하는 복호화 처리는 장기 플래그에 따라, 적응적으로 수행된다. 장기 플래그가 제2 플래그인 경우에는, LTP 기여 신호를 고려할 필요가 없기 때문에, 복호화 처리 과정이 단순해진다.
도 5는 본 발명의 제2 실시예에 의한 신호 복호화 방법의 플로차트이다. 본 실시예의 방법은 제2 실시예에서의 신호 부호화 방법에 대응할 수 있으며, 본 실시예에서의 용어의 정의 및 파라미터 표현은 제2 실시예에서의 용어의 정의 및 파라미터 표현과 동일하다. 본 실시예에서의 방법은 다음의 단계를 포함한다.
단계 401: 수신한 비트스트림을 복호화하여, 비선형 영역 예측 잔차 신호와 장기 플래그를 취득한다.
일부 실시예에서, 비트스트림이 장기 플래그로 부호화된 비트스트림을 포함한다면, 비트스트림은 장기 플래그를 취득하기 위해 복호화될 수 있다. 구체적으로, 장기 플래그 Tflag가 0이면, 비트스트림은 LPC 계수 aj를 더 포함하고, Tflag가 1이면, 비트스트림은 LPC 계수 aj 및 최적의 피치를 포함하며, 피치 이득을 더 포함할 수 있다. 비트스트림이 피치 이득을 포함하지 않으면, 본 실시예의 방법은 최적의 피치에 따라 피치 이득을 적응적으로 선택하는 단계를 포함한다.
d(i)가 비선형 영역 예측 잔차 신호를 표현한다고 가정하면, 다음의 등식이 적용된다.
따라서, 비선형 영역 신호 x(i)는, 복호화 이후, 다음의 식 13에 의해 취득될 수 있다.
단계 402: 현재 프레임의 신호의 제1 샘플 포인트를 복호화한다.
제1 샘플 포인트는 LPC 처리를 행하지 않는다. 따라서, 제1 샘플 포인트의 비선형 영역 예측 신호는 x'(0) = 0이다. 식 3은 비선형 영역의 제1 샘플 포인트가 손실 없이 복호화될 수 있다는 것을 나타낸다. 즉, x(0) = d(0)이다.
후속되는 복호화 처리 과정에 대하여, 본 실시예는 제1 샘플 포인트의 PCM 영역 신호 y(0)과 LPC 잔차 신호 res(0)(즉, LP 잔차 신호)를 유지할 필요가 있다. 즉, 다음과 같이 된다.
함수 A2PCM[]는 A-law 신호를 PCM 영역 신호로 변환하는 것을 의미한다.
일부 실시예에서, 가변 길이 코딩 필드에서, 수신된 비트스트림은 제2 플래그에 해당하는 장기 플래그를 취득하지 않고, 제1 영역 예측 잔차 신호를 취득하도록 복호화된다. 복호화 결과가 제1 플래그에 해당하는 장기 플래그를 포함한다면, LTP 모듈이 인에이블 상태라는 것을 나타낸다. 그렇지 않다면, LTP 모듈이 디스에이블 상태이다. 시스템은, 취득한 장기 플래그가 제1 플래그인 경우에, LP 신호 및 LTP 기여 신호에 따라, 제2 영역 예측 신호를 취득하고, 취득한 장기 플래그가 제1 플래그가 아닌 경우에는, LP 신호에 따라, 제2 영역 예측 신호를 취득한다. LTP 기여 신호를 복호화된 샘플 포인트의 LP 잔차 신호에 따라 취득된다.
단계 403: 장기 플래그의 값이 제1 플래그인지 여부를 판단해서, 장기 플래그의 값이 제1 플래그이면 단계 404 및 단계 405를 수행하고, 장기 플래그의 값이 제1 플래그가 아니면, 단계 406-408을 수행한다.
LTP 모듈은 2가지 상태, 즉 인에이블 상태(Tflag=1)와 디스에이블 상태(Tflag=0)를 갖는다. 본 단계에서, 시스템은 Tflag가 1인지 여부를 판단한다. 대안으로서, 시스템은 LTP 모듈이 인에이블 상태인지 여부를 알기 위해 Tflag가 0인지 여부를 판단할 수 있다.
LTP 모듈의 여러 상태는 후속되는 여러 복호화 처리에 대응한다.
본 실시예에서 단계 403을 완료한 후, 다음의 복호화 처리는 주기적인 회귀 처리이다. 다음의 복호화 단계는 현재 프레임의 제2 샘플 포인트로부터 현재 샘플 포인트마다 연속으로 수행된다.
일부 실시예에서, 부호화기 측에서 제2 플래그에 해당하는 장기 플래그의 코드를 출력하지 않으면, 시스템은 제1 플래그가 장기 플래그로서 취득되는지 여부를 판단하여, 그렇다면 단계 404 및 단계 405를 수행하고, 그렇지 않다면, 단계 406-408을 수행한다.
단계 404: 제1 샘플 포인트를 제외한, 이전 T1+M-1개의 샘플 포인트를 복호화한다.
본 실시예의 방법은 제2 실시예의 신호 부호화 방법에 대응한다. 즉, 부호화 처리 과정에서, 현재 프레임의 이전 M개의 샘플은 LTP 처리 과정에 참여하지 않는다. 따라서, 본 실시예에서, 이전 M개의 샘플과 버퍼 내의 샘플이 먼저 복호화된다. 도 6은 다음과 같은 단계를 포함하는 본 발명의 제2 실시예에 의한 신호 복호화 방법 중의 단계 404를 나타내는 플로차트이다.
단계 4041: 이하의 식 15에 의해, 복호화된 샘플 포인트의 PCM 영역 신호 y(i)에 따라, 현재 샘플 포인트의 LPC 예측 신호 y'(i)를 계산한다.
상기 식에서, i≤0이면, y(i)는 0이다.
예를 들어, 현재 샘플 포인트가 현재 프레임의 신호의 제2 샘플 포인트이면, 복호화된 샘플 포인트는 현재 프레임의 신호의 제1 샘플 포인트이다. 이 경우, 단계 402에서의 복호화 결과를 참조로서 사용한다.
단계 4042: 현재 샘플의 LPC 예측 신호 y'(i)에 따라, PCM 영역 예측 신호 y"(i)를 취득한다. 이전 T1+M 개의 샘플은 LTP 처리에 포함되지 않기 때문에, y"(i)=y'(i)이다. 즉, 현재 샘플 포인트의 LPC 예측 신호의 값이 PCM 영역 예측 신호 y"(i)에 할당된다.
단계 4043: PCM 영역 예측 신호 y"(i)를 비선형 영역 예측 신호 x'(i)로 변환한다.
단계 4044: 비선형 영역 예측 신호 x'(i)와 비선형 영역 예측 잔차 신호 d(i)에 따라, 식 13에 의해 비선형 영역 신호 x(i)를 취득한다.
단계 4045: 후속하는 샘플을 복호화하기 위해, 비선형 영역 신호 x(i)를 PCM 영역 신호 y(i)로 변환하고, PCM 영역 신호 y(i)와 LPC 예측 신호 y'(i)에 따라, LPC 잔차 신호 res(i)를 취득한다.
단계 405: 이전 T1+M 개의 샘플 포인트를 제외한, 모든 서브프레임 신호를 복호화한다.
도 7은 다음의 단계를 포함하는, 본 발명의 제2 실시예에 의한 신호 복호화 방법 중의 단계 405에 대한 플로차트이다.
단계 4051: 식 18을 사용하여, 복호화된 샘플 포인트의 PCM 영역 신호 y(i)에 따라, 현재 샘플 포인트의 LPC 예측 신호 y'(i)를 계산한다.
상기 식에서, i≤0인 경우, y(i) = 0이다.
예를 들어, 현재 샘플 포인트가 제1 서브프레임의 제1 샘플 포인트인 경우, 복호화된 샘플은 이전 T1+M개의 샘플이다. 이 경우, 단계 404에서의 복호화 결과를 참조로서 사용한다.
단계 4052: 이하의 식 19를 사용하여, 현재 샘플 포인트의 LPC 예측 신호 y'(i)에 따라, PCM 영역 예측 신호 y"(i)를 계산한다.
단계 4053: PCM 영역 예측 신호 y"(i)를 비선형 영역 예측 신호 x'(i)로 변환한다.
단계 4054: 상기 식 13을 사용하여, 비선형 영역 예측 신호 x'(i)와 비선형 영역 예측 잔차 신호 d(i)에 따라, 비선형 영역 신호 x(i)를 취득한다.
단계 4055: 후속하는 샘플을 복호화하기 위해, 비선형 영역 신호 x(i)를 PCM 영역 신호 y(i)로 변환하고, PCM 영역 신호 y(i)와 LPC 예측 신호 y'(i)에 따라, LPC 잔차 신호 res(i)를 취득한다.
현재 샘플 포인트에 대한 복호화를 완료한 후에, 후속하는 샘플을 복호화하는 처리 과정에서, 단계 4055에서 취득한 LPC 잔차 신호를 사용하여, 후속하는 샘플의 PCM 영역 예측 신호를 계산한다.
단계 406: 이하의 식 22를 사용하여, 복호화된 샘플 포인트의 PCM 영역 신호 y(i)에 따라, 현재 샘플 포인트의 LPC 예측 신호 y'(i)를 계산한다.
상기 식에서, i≤0인 경우, y(i) = 0이다.
단계 407: PCM 영역 예측 신호로서 LPC 예측 신호 y'(i)를 사용하고, PCM 영역 예측 신호를 비선형 영역 예측 신호 x'(i)로 변환한다.
LTP 모듈이 디스에이블 상태로 되고, 현재 프레임 신호의 샘플 포인트가 LTP 처리 과정에 포함되지 않기 때문에, y"(i) = y'(i)이고, y'(i)는 직접 x'(i)로 변환될 수 있다.
단계 408: 상기 식 13을 사용하여, 비선형 영역 예측 신호 x'(i)와 비선형 영역 예측 잔차 신호 d(i)에 따라, 비선형 영역 신호 x(i)를 취득한다.
본 실시예에서, 후속하는 복호화 처리는 장기 플래그에 따라 적응적으로 수행된다. 장기 플래그가 제2 플래그이면, LTP 기여 신호를 고려할 필요가 없기 때문에, 복호화 처리가 단순해진다.
도 8은 본 발명의 실시예에 의한 신호 부호화 장치의 구조를 나타낸다. 본 장치는 변환 모듈(11), LP 모듈(12), LTP 모듈(13), 판정 모듈(14), 제2 영역 예측 모듈(15), 제1 영역 예측 잔차 모듈(16), 및 출력 모듈(17)을 포함한다. 변환 모듈(11)은 제1 영역 신호를 제2 영역 신호로 변환하고, 제2 영역 예측 신호를 제1 영역 예측 신호로 변환한다. LP 모듈(12)은 제2 영역 신호에 대하여 LP 처리를 수행한다. LTP 모듈(13)은 제2 영역 신호에 대하여 LTP 처리를 수행한다. 판정 모듈(14)은 판정 기준에 따라, 장기 플래그를 취득한다. 제2 영역 예측 모듈(15)은 장기 플래그가 제1 플래그인 경우, LP 처리 결과와 LTP 처리 결과에 따라, 제2 영역 예측 신호를 취득하고, 장기 플래그가 제2 플래그인 경우, LP 처리 결과에 따라, 제2 영역 예측 신호를 취득한다. 제1 영역 예측 잔차 모듈(16)은 제1 영역 예측 신호에 따라, 제1 영역 예측 잔차 신호를 계산한다. 출력 모듈(17)은 제1 영역 잔차 신호를 포함하는 비트스트림을 출력한다.
앞서 설명한 LP 처리 결과에는 LP 계수, LP 신호, 및 LP 잔차 신호가 포함될 수 있다. 앞서 설명한 비트스트림은 LP 계수를 더 포함할 수 있다.
또한, LTP 모듈(13)은 LP 잔차 신호의 최적의 피치 또는 최적의 피치 및 피치 이득 모두를 취득하고, LTP 기여 신호를 취득하기 위해, LP 잔차 신호에 대한 피치 검색을 수행할 수 있다.
제2 영역 예측 모듈(15)은 장기 플래그가 제1 플래그인 경우에, 제2 영역 예측 신호로서, LTP 기여 신호와 LP 잔차 신호의 합을 사용하거나, 장기 플래그가 제2 플래그인 경우에, 제2 영역 예측 신호로서 LP 신호를 사용한다.
판정 모듈(14)은 2개의 판정 기준에 따라, 판정을 행할 수 있다. 즉, LP 잔차 신호의 에너지와 경험 인자의 곱이 LTP 잔차 신호의 에너지보다 큰지 여부를 판단하거나, LP 잔치 신호의 절대값의 합과 경험 인자의 곱이 LTP 잔차 신호의 절대값의 합보다 큰지 여부를 판단한다. 판단한 결과, 크다면, 판정 모듈(14)은 제1 플래그의 값을 장기 플래그에 할당하고, 그렇지 않다면, 판정 모듈(14)은 제2 플래그의 값을 장기 플래그에 할당한다.
본 실시예의 장치는 피치 이득을 취득한 최적의 피치에 따라 적응적으로 선택하는 피치 이득 모듈을 더 포함할 수 있으며, LP 잔차 신호에 대한 프레이밍을 수행하는 프레이밍 모듈을 더 포함할 수 있다.
본 실시예에서, 후속하는 부호화 처리 과정은 장기 플래그에 따라 적응적으로 수행되는데, 장기 플래그가 제2 플래그인 경우에는, LTP 처리를 고려할 필요가 없기 때문에, 코덱의 성능이 향상된다.
도 9는 본 발명의 실시예에 의한 신호 복호화 장치의 구조를 나타낸다. 본 장치는, 비트스트림 복호화 모듈(21), 제1 샘플 포인트 복호화 모듈(22), LP 모듈(23), 제2 영역 예측 모듈(24), 변환 모듈(25), 현재 샘플 포인트 복호화 모듈(26), 및 LP 잔차 모듈(27)을 포함한다. 비트스트림 복호화 모듈(21)은 수신한 비트스트림을 복호화하여 제1 영역 예측 잔차 신호를 취득한다. 제1 샘플 포인트 복호화 모듈(22)은 현재 프레임의 신호의 제1 샘플 포인트를 복호화한다. LP 모듈(23)은 복호화된 샘플 포인트의 제2 영역 신호에 따라 현재 샘플 포인트의 LP 신호를 계산한다. 제2 영역 예측 모듈(24)은 취득한 장기 플래그가 제1 플래그인 경우에는 LP 신호 및 LTP 기여 신호에 따라, 제2 영역 예측 신호를 취득하고, 또는 취득한 장기 플래그가 제1 플래그가 아닌 경우에는 LP 신호에 따라 제2 영역 예측 신호를 취득한다. LTP 기여 신호는 복호화된 샘플 포인트의 LP 잔차 신호에 따라 취득된다. 변환 모듈(25)은 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 현재 샘플 포인트의 제1 영역 신호는 제2 영역 신호로 변환한다. 현재 샘플 포인트 복호화 모듈(26)은 제1 영역 예측 잔차 신호와 제1 영역 예측 신호에 따라, 현재 샘플 포인트의 제1 영역 신호를 복호화한다. LP 잔차 모듈(27)은 제2 영역 신호와 LP 신호에 따라, LP 잔차 신호를 취득한다.
또한, 장기 플래그가 제1 플래그이며 현재 샘플 포인트가 부호화기에서의 LTP 처리에 포함되어 있다면, 제2 영역 예측 모듈(24)은 LP 신호와 LTP 기여 신호의 합을 제2 영역 예측 신호로서 사용한다. 장기 플래그가 제1 플래그이고 현재 샘플 포인트가 부호화기에서의 LTP 처리에 포함되지 않는다면, 제2 영역 예측 모듈(24)은 LP 신호를 제2 영역 예측 신호로서 사용한다.
본 실시예의 장치는 취득한 최적의 피치에 따라, 피치 이득을 적응적으로 선택하는 피치 이득 모듈을 더 포함할 수 있다.
본 실시예에서, 후속하는 복호화 처리는 장기 플래그에 따라 적응적으로 수행되는데, 장기 플래그가 제2 플래그인 경우에는, LTP 기여 신호를 고려할 필요가 없기 때문에, 복호화 처리가 단순해진다.
도 10은 본 발명의 실시예의 신호 코덱 시스템의 구조를 나타낸다. 본 시스템은 신호 부호화 장치(31)와 신호 복호화 장치(32)를 포함한다.
신호 부호화 장치(31)는 제1 영역 신호를 제2 영역 신호로 변환하고; 제2 영역 신호에 대하여 LTP 처리와 LP 처리를 수행하며; 판정 기준에 따라, 장기 플래그를 취득하며; 장기 플래그가 제1 플래그인 경우에는 LP 처리 결과와 LTP 처리 결과에 따라 제2 영역 예측 신호를 취득하고; 장기 플래그가 제2 플래그인 경우에는 LP 처리 결과에 따라 제2 영역 예측 신호를 취득하며; 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 제1 영역 예측 잔차 신호를 계산하며, 제1 영역 예측 잔차 신호를 포함하는 비트스트림을 출력한다.
신호 부호화 장치(32)는, 수신한 비트스트림을 복호화하여 제1 영역 예측 잔차 신호를 취득하고; 현재 프레임의 신호의 제1 샘플 포인트를 복호화하며; 현재 프레임의 신호의 제2 샘플 포인트로부터 현재 샘플 포인트마다 이후 복호화 단계를 순차적으로 수행하고; 복호화된 샘플 포인트의 제2 영역 신호에 따라, 현재 샘플 포인트의 LP 신호를 계산하며; 취득한 장기 플래그가 제1 플래그인 경우에, 복호화된 샘플 포인트의 LP 잔차 신호에 따라 취득한 LTP 기여 신호와 LP 신호에 따라 제2 영역 예측 신호를 취득하거나; 취득한 장기 플래그가 제1 플래그가 아닌 경우에, LP 신호에 따라 제2 영역 예측 신호를 취득하며; 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 제1 영역 예측 잔차 신호와 제1 영역 예측 신호에 따라, 현재 샘플 포인트의 제1 영역 신호를 복호화하며; 현재 샘플 포인트의 제1 영역 신호를 제2 영역 신호로 변환하고, 제2 영역 신호와 LP 신호에 따라, LP 잔차 신호를 취득한다.
또한, 본 실시예의 신호 부호화 장치(31)는 앞서 설명한 실시예에서의 임의의 신호 부호화 장치가 될 수 있다. 신호 복호화 장치(32)는 앞서 설명한 실시예에서 설명한 임의의 신호 복호화 장치가 될 수 있다.
당업자라면, 앞서 설명한 방법 실시예의 모든 단계 또는 일부의 단계는 프로그램에 의해 지시되는 하드웨어에 의해 구현될 수 있다는 것을 알 수 있을 것이다. 프로그램은 컴퓨터로 판독가능한 기억 매체에 기억될 수 있다. 프로그램은, 실행되면, 앞서 설명한 방법 실시예의 단계를 수행한다. 기억 매체는, 판독전용 메모리(ROM), 랜덤 액세스 메모리(RAM), 자기 디스크, 또는 컴팩트 디스크 등과 같이 프로그램 코드를 기억하기에 적합한 임의의 매체가 될 수 있다.
삭제
Claims (25)
- 비선형 영역 신호인 제1 영역 신호(domain signal)를 펄스 코드 변조(Pulse Code Modulation, PCM) 신호인 제2 영역 신호로 변환하는 단계;
상기 제2 영역 신호에 대하여, 선형 예측(linear prediction: LP) 처리 결과 및 장기 예측(long-term prediction: LTP) 처리 결과를 취득하기 위하여 LP 처리 및 LTP 처리를 수행하는 단계;
상기 LP 처리 결과와 상기 LTP 처리 결과의 비교인 판정 기준에 따라, 장기 플래그(long-term flag)를 취득하는 단계;
상기 장기 플래그가 제1 플래그인 경우에는, LP 처리 결과와 LTP 처리 결과에 따라, 제2 영역 예측 신호(domain predictive signal)를 취득하고, 상기 장기 플래그가 제2 플래그인 경우에는, 상기 LP 처리 결과에 따라, 제2 영역 예측 신호를 취득하는 단계;
상기 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하여, 제1 영역 예측 잔차 신호(domain predictive residual signal)를 계산하는 단계; 및
상기 제1 영역 예측 잔차 신호를 포함하는 비트스트림(bit stream)을 출력하는 단계
를 포함하는 것을 특징으로 하는 신호 부호화 방법. - 제1항에 있어서,
상기 LP 처리 결과에는 선형 예측(LP) 신호가 포함된, 신호 부호화 방법. - 제2항에 있어서,
상기 LP 처리 결과에는 LP 계수(coefficient), 및 LP 잔차 신호(residual signal)가 포함되며,
상기 비트스트림은 상기 LP 계수를 포함하는, 신호 부호화 방법. - 제3항에 있어서,
상기 LTP 처리 결과는 LTP 기여 신호(contribution signal)를 포함하는, 신호 부호화 방법. - 제4항에 있어서,
상기 LTP 처리 결과는 상기 LP 잔차 신호의 최적의 피치(best pitch) 또는 상기 LP 잔차 신호의 최적의 피치와 상기 LP 잔차 신호의 피치 이득(pitch gain)을 더 포함하며,
LTP 처리를 수행하는 단계는,
상기 LP 잔차 신호에 대해 피치 검색(pitch search)을 수행하는 단계;
상기 LP 잔차 신호의 최적의 피치, 또는 상기 LP 잔차 신호의 최적의 피치 및 상기 LP 잔차 신호의 피치 이득을 취득하는 단계; 및
상기 LP 잔차 신호의 최적의 피치 및 상기 LP 잔차 신호의 피치 이득 중의 하나와 상기 LP 잔차 신호에 따라, LTP 기여 신호를 취득하는 단계를 포함하는, 신호 부호화 방법. - 제1항 또는 제2항에 있어서,
상기 LP 처리를 수행하기 전에,
상기 제2 영역 신호에 대하여 피치 검색을 수행하는 단계; 및
상기 제2 영역 신호의 최적의 피치를 취득하는 단계를 더 포함하는 신호 부호화 방법. - 제6항에 있어서,
상기 LTP 처리를 수행하는 단계는,
상기 제2 영역 신호의 최적의 피치에 따라, LP 잔차 신호에 대하여 상세 검색(fine search)을 수행하는 단계;
상기 LP 잔차 신호의 최적의 피치, 또는 상기 LP 잔차 신호의 최적의 피치 및 상기 LP 잔차 신호의 피치 이득을 취득하는 단계; 및
상기 LP 잔차 신호의 최적의 피치 및 상기 LP 잔차 신호의 피치 이득 중의 하나와 상기 LP 잔차 신호에 따라, LTP 기여 신호를 취득하는 단계를 포함하는, 신호 부호화 방법. - 제5항에 있어서,
상기 LP 잔차 신호에 대하여 피치 검색을 수행하는 단계와 상기 LP 잔차 신호의 최적의 피치를 취득하는 단계를 수행하는 경우에,
취득한 상기 최적의 피치에 따라, 상기 피치 이득을 적응적으로 선택하는 단계를 더 포함하는 신호 부호화 방법. - 제2항에 있어서,
상기 LP 처리 결과에 따라 제2 영역 예측 신호를 취득하는 단계는,
상기 LP 신호를 제2 영역 예측 신호로서 사용하는 단계를 포함하는, 신호 부호화 방법. - 제4항에 있어서,
상기 LP 처리 결과와 상기 LTP 처리 결과에 따라 제2 영역 예측 신호를 취득하는 단계는, 상기 LP 신호 및 상기 LTP 기여 신호의 합(sum)을 상기 제2 영역 예측 신호로서 사용하는 단계를 포함하는, 신호 부호화 방법. - 제3항에 있어서,
상기 LTP 처리 결과는 LTP 잔차 신호를 더 포함하며,
상기 판정 기준에 따라 장기 플래그를 취득하는 단계는,
상기 LP 잔차 신호의 에너지와 경험 인자(empirical factor)의 곱(product)이 상기 LTP 잔차 신호의 에너지보다 큰지 여부를 판정하는 단계; 및
상기 LP 잔차 신호의 에너지와 상기 경험 인자의 곱이 상기 LTP 잔차 신호의 에너지보다 큰 경우에는 상기 제1 플래그의 값을 장기 플래그에 할당하고, 상기 LP 잔차 신호의 에너지와 경험 인자의 곱이 상기 LTP 잔차 신호의 에너지보다 크지 않은 경우에는 상기 제2 플래그의 값을 장기 플래그에 할당하는 단계를 포함하는, 신호 부호화 방법. - 제3항에 있어서,
상기 LTP 처리 결과는 LTP 잔차 신호를 더 포함하며,
상기 판정 기준에 따라 장기 플래그를 취득하는 단계는,
상기 LP 잔차 신호의 절대값의 합과 경험 인자의 곱이 상기 LTP 잔차 신호의 절대값의 합보다 큰지 여부를 판정하는 단계; 및
상기 LP 잔차 신호의 절대값의 합과 경험 인자의 곱이 상기 LTP 잔차 신호의 절대값의 합보다 큰 경우에는, 상기 제1 플래그의 값을 장기 플래그에 할당하고, 상기 LP 잔차 신호의 절대값의 합과 경험 인자의 곱이 상기 LTP 잔차 신호의 절대값의 합보다 크지 않은 경우에는, 상기 제2 플래그의 값을 장기 플래그에 할당하는 단계를 포함하는, 신호 부호화 방법. - 제5항에 있어서,
상기 LP 잔차 신호에 대한 피치 검색을 수행하기 전에,
상기 LP 잔차 신호를 프레임(frame)으로 분할하는 단계를 더 포함하는 신호 부호화 방법. - 수신한 비트스트림을 복호화하여 복호화된 제1 영역 예측 잔차 신호(domain predictive residual signal)를 취득하는 단계;
현재 프레임 신호의 제1 샘플 포인트를 복호화하는 단계;
상기 현재 프레임 신호의 제2 샘플 포인트로부터 모든 현재 샘플 포인트에 대하여 이하의 복호화 단계를 순차적으로 수행하는 단계;
복호화된 샘플 포인트의 제2 영역 신호에 따라, 현재 샘플 포인트의 선형 예측(linear prediction: LP) 신호를 계산하는 단계;
상기 수신한 비트스트림의 제1 프레임의 LP 처리 결과와 장기 예측(long-term prediction, LTP) 처리 결과의 비교인 판정 기준에 의해 결정되는 장기 플래그(long-term flag) 값을 취득하는 단계;
취득한 장기 플래그가 제1 플래그인 경우에, 상기 LP 신호와, 복호화된 상기 샘플 포인트의 LP 잔차 신호에 따라 취득되는 LTP 기여 신호에 따라, 제2 영역 예측 신호를 취득하는 단계;
취득한 상기 장기 플래그가 제1 플래그가 아닌 경우에, 상기 LP 신호에 따라 제2 영역 예측 신호를 취득하는 단계;
상기 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 상기 제1 영역 예측 잔차 신호와 상기 제1 영역 예측 신호에 따라, 현재 샘플 포인트의 제1 영역 신호를 복호화하는 단계; 및
상기 현재 샘플 포인트의 제1 영역 신호를 제2 영역 신호로 변환하고, 상기 제2 영역 신호와 상기 LP 신호에 따라 LP 잔차 신호를 취득하는 단계
를 포함하고,
상기 제1 영역 신호는 비선형 영역 신호이고, 상기 제2 영역 신호는 펄스 코드 변조 신호인, 신호 복호화 방법. - 제14항에 있어서,
상기 LP 신호와 상기 LTP 기여 신호에 따라 제2 영역 예측 신호를 취득하는 단계는,
부호화기(encoder)측에서의 현재 샘플 포인트가 LTP 처리에 참여하는 경우에, 상기 LP 잔차 신호와 상기 LTP 기여 신호의 합을 상기 제2 영역 예측 신호로서 사용하는 단계; 및
상기 부호화기측에서의 현재 샘플 포인트가 상기 LTP 처리에 참여하지 않는 경우에, 상기 LP 신호를 제2 영역 예측 신호로서 사용하는 단계를 포함하는, 신호 복호화 방법. - 삭제
- 제1 영역 신호(domain signal)를 펄스 코드 변조(Pulse Code Modulation, PCM) 신호인 제2 영역 신호로 변환하고, 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하는 변환 모듈;
선형 예측(linear prediction: LP) 처리 결과를 취득하기 위하여, 상기 제2 영역 신호에 대하여, LP 처리를 수행하는 선형 예측(LP) 모듈;
장기 예측(long-term prediction: LTP) 처리 결과를 취득하기 위하여, 상기 제2 영역 신호에 대하여, LTP 처리를 수행하는 장기 예측(LTP) 모듈;
상기 LP 처리 결과와 상기 LTP 처리 결과의 비교인 판정 기준에 따라, 장기 플래그(long-term flag)를 취득하는 판정 모듈;
상기 장기 플래그가 제1 플래그인 경우에는, LP 처리 결과와 LTP 처리 결과에 따라, 제2 영역 예측 신호(domain predictive signal)를 취득하고, 상기 장기 플래그가 제2 플래그인 경우에는, 상기 LP 처리 결과에 따라, 제2 영역 예측 신호를 취득하는 제2 영역 예측 모듈;
제1 영역 예측 신호에 따라 제1 영역 예측 잔차 신호(domain predictive residual signal)를 계산하는 제1 영역 예측 잔차 모듈; 및
부호화된 상기 제1 영역 예측 잔차 신호를 포함하는 비트스트림(bit stream)을 출력하는 출력 모듈
을 포함하는 것을 특징으로 하는 신호 부호화 장치. - 제17항에 있어서,
상기 LP 처리 결과에는 LP 계수(coefficient), 및 LP 잔차 신호(residual signal)가 포함되며, 상기 비트스트림은 상기 LP 계수를 포함하며,
상기 LTP 모듈은 상기 LP 잔차 신호에 대해 피치 검색(pitch search)을 수행하며, 상기 LP 잔차 신호의 최적의 피치, 또는 상기 LP 잔차 신호의 최적의 피치 및 상기 LP 잔차 신호의 피치 이득을 취득하며, LTP 기여 신호를 취득하는, 신호 부호화 장치. - 제18항에 있어서,
취득한 최적의 피치에 따라 피치 이득을 적응적으로 선택하는 피치 이득 모듈을 더 포함하는 신호 부호화 장치. - 제18항에 있어서,
상기 제2 영역 예측 모듈은, 장기 예측(LTP) 플래그가 제1 플래그인 경우에, 상기 LP 잔차 신호와 상기 LTP 기여 신호의 합을, 상기 제2 영역 예측 신호로서 사용하며,
상기 제2 영역 예측 모듈은, 상기 LTP 플래그가 제2 플래그인 경우에, LP 신호를 상기 제2 영역 예측 신호로서 사용하는, 신호 부호화 장치. - 제17항 또는 제19항에 있어서,
상기 LTP 처리 결과는 LTP 잔차 신호를 더 포함하며,
상기 판정 모듈은, 상기 LP 잔차 신호의 에너지와 경험 인자(empirical factor)의 곱(product)이 상기 LTP 잔차 신호의 에너지보다 큰지 여부를 판정하거나, 상기 LP 잔차 신호의 절대값의 합과 경험 인자의 곱이 상기 LTP 잔차 신호의 절대값의 합보다 큰지 여부를 판정하며,
상기 LP 잔차 신호의 에너지와 경험 인자의 곱이 상기 LTP 잔차 신호의 에너지보다 큰 경우, 또는 상기 LP 잔차 신호의 절대값의 합과 경험 인자의 곱이 상기 LTP 잔차 신호의 절대값의 합보다 큰 경우에는, 제1 플래그의 값을 장기 플래그에 할당하고;
상기 LP 잔차 신호의 에너지와 경험 인자의 곱이 상기 LTP 잔차 신호의 에너지보다 같거나 작은 경우, 또는 상기 LP 잔차 신호의 절대값의 합과 경험 인자의 곱이 상기 LTP 잔차 신호의 절대값의 합보다 같거나 작은 경우에는, 제2 플래그의 값을 장기 플래그에 할당하는, 신호 부호화 장치. - 수신한 비트스트림을 복호화하여, 제1 영역 예측 잔차 신호(domain predictive residual signal)를 취득하는 비트스트림 복호화 모듈;
현재 프레임 신호의 제1 샘플 포인트를 복호화하는 제1 샘플 포인트 복호화 모듈;
복호화된 상기 샘플 포인트의 제2 영역 신호에 따라, 현재 샘플 포인트의 선형 예측(linear prediction: LP) 신호를 계산하고, 상기 수신한 비트스트림의 제1 프레임의 LP 처리 결과와 장기 예측(long-term prediction, LTP) 처리 결과의 비교인 판정 기준에 의해 결정되는 장기 플래그(long-term flag) 값을 취득하는 선형 예측(LP) 모듈;
취득한 장기 플래그(long-term flag)가 제1 플래그인 경우에, 상기 LP 신호와, 복호화된 상기 샘플 포인트의 LP 잔차 신호에 따라 취득되는 장기 예측(long-term prediction: LTP) 기여 신호에 따라, 제2 영역 예측 신호를 취득하거나, 취득한 상기 장기 플래그가 제1 플래그가 아닌 경우에, 상기 LP 신호에 따라 제2 영역 예측 신호를 취득하는 제2 영역 예측 모듈;
상기 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 현재 샘플 포인트의 제1 영역 신호를 제2 영역 신호로 변환하는 변환 모듈;
상기 제1 영역 예측 잔차 신호와 제1 영역 예측 신호에 따라, 현재 샘플 포인트의 제1 영역 신호를 복호화하는 현재 샘플 포인트 복호화 모듈; 및
상기 제2 영역 신호와 LP 신호에 따라, LP 잔차 신호를 취득하는 LP 잔차 모듈
을 포함하고
상기 제1 영역 신호는 비선형 영역 신호이고, 상기 제2 영역 신호는 펄스 코드 변조 신호인 것을 특징으로 하는 신호 복호화 장치. - 제22항에 있어서,
상기 LTP 플래그가 제1 플래그이고, 부호화기(encoder) 내의 현재 샘플 포인트가 LPT 처리에 참여하는 경우에는, LP 잔차 신호와 LTP 기여 신호의 합을 제2 영역 예측 신호로서 사용하고,
상기 LTP 플래그가 제1 플래그이고, 부호화기 내의 현재 샘플 포인트가 LTP 처리에 참여하지 않는 경우에는, LP 신호를 제2 영역 예측 신호로서 사용하는 신호 복호화 장치. - 제22항 또는 제23항에 있어서,
상기 수신한 비트스트림에 포함되어 있는 최적의 피치에 따라 피치 이득을 적응적으로 선택하는 피치 이득 모듈을 더 포함하는 신호 복호화 장치. - 신호 부호화 장치 및 신호 복호화 장치를 포함하는 신호 코덱 시스템(signal codec system)에 있어서,
비선형 영역 신호인 제1 영역 신호를 펄스 코드 변조 신호인 제2 영역 신호로 변환하고, 상기 제2 영역 신호에 대하여, 선형 예측(linear prediction: LP) 처리 및 장기 예측(long-term prediction: LTP) 처리를 수행하고, LP 처리 결과와 LTP 처리 결과의 비교인 판정 기준에 따라 장기 플래그(long-term flag)를 취득하고, 상기 장기 플래그가 제1 플래그인 경우에는, LP 처리 결과와 LTP 처리 결과에 따라, 제2 영역 예측 신호(domain predictive signal)를 취득하며, 상기 장기 플래그가 제2 플래그인 경우에는, 상기 LP 처리 결과에 따라, 제2 영역 예측 신호를 취득하고, 상기 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 제1 영역 예측 잔차 신호를 계산하고, 상기 제1 영역 예측 잔차 신호를 포함하는 비트스트림(bit stream)을 출력하고, 상기 제1 영역 예측 잔차 신호를 포함하는 비트스트림을 신호 부호화 장치로 출력하는 상기 신호 부호화 장치; 및
수신한 비트스트림을 복호화하여, 제1 영역 예측 잔차 신호와 장기 플래그를 취득하고, 현재 프레임 신호의 제1 샘플 포인트를 복호화하고, 상기 현재 프레임 신호의 제2 샘플 포인트로부터 모든 현재 샘플 포인트에 대하여 이하의 복호화 를 순차적으로 수행하고, 복호화된 샘플 포인트의 제2 영역 신호에 따라 현재 샘플 포인트의 선형 예측(LP) 신호를 계산하고, 취득한 장기 플래그가 제1 플래그인 경우에, 상기 LP 신호와, 복호화된 샘플 포인트의 LP 잔차 신호에 따라 취득되는 장기 예측(LTP) 기여 신호에 따라, 제2 영역 예측 신호를 취득하거나, 취득한 상기 장기 플래그가 제1 플래그가 아닌 경우에, 상기 LP 신호에 따라 제2 영역 예측 신호를 취득하고, 상기 제2 영역 예측 신호를 제1 영역 예측 신호로 변환하고, 제1 영역 예측 잔차 신호 및 제1 영역 예측 신호에 따라 현재 샘플 포인트의 제1 영역 신호를 복호화하고, 현재 샘플 포인트의 제1 영역 신호를 제2 영역 신호로 변환하고, 제2 영역 신호와 LP 신호에 따라 LP 잔차 신호를 취득하는 상기 신호 복호화 장치
를 포함하는 것을 특징으로 하는 신호 코덱 시스템.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810247427.6 | 2008-12-31 | ||
CN200810247427 | 2008-12-31 | ||
CN2009101518356A CN101615395B (zh) | 2008-12-31 | 2009-06-25 | 信号编码、解码方法及装置、系统 |
CN200910151835.6 | 2009-06-25 | ||
PCT/CN2009/076306 WO2010075792A1 (zh) | 2008-12-31 | 2009-12-30 | 信号编码、解码方法及装置、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110110262A KR20110110262A (ko) | 2011-10-06 |
KR101350285B1 true KR101350285B1 (ko) | 2014-01-10 |
Family
ID=41495006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117017706A KR101350285B1 (ko) | 2008-12-31 | 2009-12-30 | 신호를 부호화 및 복호화하는 방법, 장치 및 시스템 |
Country Status (8)
Country | Link |
---|---|
US (2) | US8515744B2 (ko) |
EP (2) | EP2385522A4 (ko) |
JP (2) | JP5436576B2 (ko) |
KR (1) | KR101350285B1 (ko) |
CN (1) | CN101615395B (ko) |
BR (1) | BRPI0923887A2 (ko) |
RU (1) | RU2486610C2 (ko) |
WO (1) | WO2010075792A1 (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101615395B (zh) | 2008-12-31 | 2011-01-12 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
JP5314771B2 (ja) * | 2010-01-08 | 2013-10-16 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 |
EP2551848A4 (en) * | 2010-03-23 | 2016-07-27 | Lg Electronics Inc | METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL |
CN104347067B (zh) | 2013-08-06 | 2017-04-12 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
CN107452391B (zh) * | 2014-04-29 | 2020-08-25 | 华为技术有限公司 | 音频编码方法及相关装置 |
ES2838006T3 (es) * | 2014-07-28 | 2021-07-01 | Nippon Telegraph & Telephone | Codificación de señal de sonido |
EP3900362A4 (en) | 2019-02-01 | 2022-03-02 | Beijing Bytedance Network Technology Co., Ltd. | SIGNALING LOOP SHAPED INFORMATION USING PARAMETER SETS |
CN113574889B (zh) * | 2019-03-14 | 2024-01-12 | 北京字节跳动网络技术有限公司 | 环路整形信息的信令和语法 |
CN113632476B (zh) | 2019-03-23 | 2024-03-19 | 北京字节跳动网络技术有限公司 | 默认的环内整形参数 |
CN113129913B (zh) * | 2019-12-31 | 2024-05-03 | 华为技术有限公司 | 音频信号的编解码方法和编解码装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995016260A1 (en) | 1993-12-07 | 1995-06-15 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction with multiple codebook searches |
US5659698A (en) | 1994-11-01 | 1997-08-19 | Motorola, Inc. | Method and apparatus for generating a circular buffer address in integrated circuit that performs multiple communications tasks |
US5933803A (en) | 1996-12-12 | 1999-08-03 | Nokia Mobile Phones Limited | Speech encoding at variable bit rate |
US20050075873A1 (en) * | 2003-10-02 | 2005-04-07 | Jari Makinen | Speech codecs |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE9006717U1 (de) * | 1990-06-15 | 1991-10-10 | Philips Patentverwaltung GmbH, 22335 Hamburg | Anrufbeantworter für die digitale Aufzeichnung und Wiedergabe von Sprachsignalen |
JP3232701B2 (ja) | 1992-10-15 | 2001-11-26 | 株式会社日立製作所 | 音声符号化方法 |
JPH07239699A (ja) | 1994-02-28 | 1995-09-12 | Hitachi Ltd | 音声符号化方法およびこの方法を用いた音声符号化装置 |
US5652903A (en) * | 1994-11-01 | 1997-07-29 | Motorola, Inc. | DSP co-processor for use on an integrated circuit that performs multiple communication tasks |
JP3137176B2 (ja) * | 1995-12-06 | 2001-02-19 | 日本電気株式会社 | 音声符号化装置 |
US5978756A (en) * | 1996-03-28 | 1999-11-02 | Intel Corporation | Encoding audio signals using precomputed silence |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US7031926B2 (en) * | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
JP3426207B2 (ja) * | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
DE10124420C1 (de) * | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Codierung und zur Übertragung von Sprachsignalen |
JP4622164B2 (ja) * | 2001-06-15 | 2011-02-02 | ソニー株式会社 | 音響信号符号化方法及び装置 |
US20040167772A1 (en) * | 2003-02-26 | 2004-08-26 | Engin Erzin | Speech coding and decoding in a voice communication system |
ATE368279T1 (de) * | 2003-05-01 | 2007-08-15 | Nokia Corp | Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate |
GB0326263D0 (en) * | 2003-11-11 | 2003-12-17 | Nokia Corp | Speech codecs |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
US7933767B2 (en) * | 2004-12-27 | 2011-04-26 | Nokia Corporation | Systems and methods for determining pitch lag for a current frame of information |
TWI276047B (en) | 2005-12-15 | 2007-03-11 | Ind Tech Res Inst | An apparatus and method for lossless entropy coding of audio signal |
EP1852848A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
RU2319222C1 (ru) * | 2006-08-30 | 2008-03-10 | Валерий Юрьевич Тарасов | Способ кодирования и декодирования речевого сигнала методом линейного предсказания |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
CN101197576A (zh) * | 2006-12-07 | 2008-06-11 | 上海杰得微电子有限公司 | 一种音频信号编码、解码方法 |
CN101615395B (zh) | 2008-12-31 | 2011-01-12 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
-
2009
- 2009-06-25 CN CN2009101518356A patent/CN101615395B/zh active Active
- 2009-12-30 RU RU2011132152/08A patent/RU2486610C2/ru active
- 2009-12-30 EP EP20090836079 patent/EP2385522A4/en not_active Withdrawn
- 2009-12-30 BR BRPI0923887-5A patent/BRPI0923887A2/pt not_active IP Right Cessation
- 2009-12-30 EP EP20130186070 patent/EP2680444A1/en not_active Withdrawn
- 2009-12-30 JP JP2011543970A patent/JP5436576B2/ja active Active
- 2009-12-30 WO PCT/CN2009/076306 patent/WO2010075792A1/zh active Application Filing
- 2009-12-30 KR KR1020117017706A patent/KR101350285B1/ko active IP Right Grant
-
2011
- 2011-06-29 US US13/172,575 patent/US8515744B2/en active Active
-
2013
- 2013-07-17 US US13/943,812 patent/US8712763B2/en active Active
- 2013-08-09 JP JP2013165706A patent/JP5521097B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995016260A1 (en) | 1993-12-07 | 1995-06-15 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction with multiple codebook searches |
US5659698A (en) | 1994-11-01 | 1997-08-19 | Motorola, Inc. | Method and apparatus for generating a circular buffer address in integrated circuit that performs multiple communications tasks |
US5933803A (en) | 1996-12-12 | 1999-08-03 | Nokia Mobile Phones Limited | Speech encoding at variable bit rate |
US20050075873A1 (en) * | 2003-10-02 | 2005-04-07 | Jari Makinen | Speech codecs |
Also Published As
Publication number | Publication date |
---|---|
US20130304460A1 (en) | 2013-11-14 |
JP2012514225A (ja) | 2012-06-21 |
US20110313761A1 (en) | 2011-12-22 |
US8712763B2 (en) | 2014-04-29 |
JP2013232013A (ja) | 2013-11-14 |
CN101615395A (zh) | 2009-12-30 |
EP2385522A1 (en) | 2011-11-09 |
CN101615395B (zh) | 2011-01-12 |
KR20110110262A (ko) | 2011-10-06 |
RU2486610C2 (ru) | 2013-06-27 |
JP5521097B2 (ja) | 2014-06-11 |
WO2010075792A1 (zh) | 2010-07-08 |
US8515744B2 (en) | 2013-08-20 |
JP5436576B2 (ja) | 2014-03-05 |
EP2385522A4 (en) | 2011-11-09 |
RU2011132152A (ru) | 2013-02-20 |
EP2680444A1 (en) | 2014-01-01 |
BRPI0923887A2 (pt) | 2015-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101350285B1 (ko) | 신호를 부호화 및 복호화하는 방법, 장치 및 시스템 | |
USRE49363E1 (en) | Variable bit rate LPC filter quantizing and inverse quantizing device and method | |
JP4005359B2 (ja) | 音声符号化及び音声復号化装置 | |
JPH0990995A (ja) | 音声符号化装置 | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
KR20200123285A (ko) | 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램 | |
KR100647290B1 (ko) | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 | |
JP5544370B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
CN108053830B (zh) | 解码方法、解码装置、和计算机可读取的记录介质 | |
KR101996307B1 (ko) | 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체 | |
EP1187337A1 (en) | Speech coder, speech processor, and speech processing method | |
JP3576485B2 (ja) | 固定音源ベクトル生成装置及び音声符号化/復号化装置 | |
JP4438654B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP2892462B2 (ja) | コード励振線形予測符号化器 | |
JPH09269798A (ja) | 音声符号化方法および音声復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20161219 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20171219 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20181219 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20191217 Year of fee payment: 7 |