KR100544731B1 - 음성 코덱에서 의사 고대역 신호 추정 방법 및 시스템 - Google Patents

음성 코덱에서 의사 고대역 신호 추정 방법 및 시스템 Download PDF

Info

Publication number
KR100544731B1
KR100544731B1 KR1020037005298A KR20037005298A KR100544731B1 KR 100544731 B1 KR100544731 B1 KR 100544731B1 KR 1020037005298 A KR1020037005298 A KR 1020037005298A KR 20037005298 A KR20037005298 A KR 20037005298A KR 100544731 B1 KR100544731 B1 KR 100544731B1
Authority
KR
South Korea
Prior art keywords
speech
signal
periods
voice
input signal
Prior art date
Application number
KR1020037005298A
Other languages
English (en)
Other versions
KR20040005838A (ko
Inventor
로톨라-푹킬라자니
믹콜라한누제이.
바이니오잔느
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20040005838A publication Critical patent/KR20040005838A/ko
Application granted granted Critical
Publication of KR100544731B1 publication Critical patent/KR100544731B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

입력 신호가 부호화 및 복호화 과정들에서 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 상위 주파수 대역의 복호화가 상기 하위 주파수 대역으로부터 획득된 음성-관련 매개변수들과 함께 의사 신호(artificial signal)를 사용함으로써 수행되는, 입력 신호를 부호화하고 복호화하기 위한 방법 및 시스템이 개시된다. 특히, 상기 의사 신호는 스케일링된 후에 하위 및 상위 주파수 대역의 유색 잡음을 포함하는 의사 광대역 신호로 변환된다. 추가로, 음성 활성 정보가 상기 입력 신호의 음성 기간들 및 비-음성 기간들을 정의하는데 사용된다. 상기 음성 활성 정보에 기초하여, 상이한 가중치 인자들이 음성 기간들 및 비-음성 기간들의 의사 신호를 스케일링하는데 사용된다.

Description

음성 코덱에서 의사 고대역 신호 추정 방법 및 시스템{Method and system for estimating artificial high band signal in speech codec}
본 발명은 일반적으로 합성 음성을 부호화하고 복호화하는 분야에 관한 것으로, 보다 상세하게는, 광대역 음성의 부호화 및 복호화에 관한 것이다.
현재 많은 음성 부호화 방법들은 선형 예측(LP; linear predictive) 부호화에 기초를 둔다. 상기 선형 예측은 (소위 채널 보코더(channel vocoder) 또는 소위 포먼트 보코더(formant vocoder)와 같이) 음성 신호의 주파수 스펙트럼으로부터 보다는 시간 파형으로부터 직접 음성 신호의 지각으로 중요한 특징들을 추출한다. LP 부호화에 있어서, 전송 기능 및 음성 신호를 야기하는 성도(vocal tract) 여진(excitation)의 시간-변화 모델을 결정하기 위하여 음성 파형이 우선 분석(LP 분석)된다. 복호기(부호화된 음성 신호가 전송되는 수신 단말기내의)는 그 다음 상기 성도를 모델링하는 매개변수로 표시된 시스템을 통해 상기 여진을 전달하는 합성기(LP 합성을 수행하기 위한)를 이용하여 원래 음성을 재현한다. 상기 성도 모델의 매개변수들 및 상기 모델의 여진은 음성 신호를 생성하는 스피커와 같은 스피커에서 일어나는 대응하는 변화들에 적응하도록 주기적으로 갱신된다. 그러나, 갱신들 사이에, 즉 어떤 설명 간격 동안, 상기 시스템의 매개변수들 및 여진은 일정하 게 유지되고, 따라서 상기 모델에 의해 실행되는 과정은 선형 시간-불변 과정이다. 전체적인 부호화 및 복호화 (분산) 시스템은 코덱(codec)으로 지칭된다.
음성을 생성하기 위하여 LP 부호화를 이용하는 코덱에서, 복호기는 부호기가 3개의 입력들을 제공하는 것을 필요로 한다: 여진이 유성음화되는 경우 피치 기간, 이득 인자 및 예측기 계수들. (몇몇 코덱들에서, 상기 여진의 성질, 즉 유성음화되는지 무성음화되는지 여부가 또한 제공되지만, 보통은 예를 들어, 대수 부호 여진 선형 예측(ACELP; Algebraic Code Excited Linear Predictive) 코덱의 경우에 필요가 없다.) LP 부호화는 순방향 예측 과정에서 매개변수들이 적용되는 음성 파형(설명 기간 동안)의 실제 입력 세그먼트들에 기초한 예측 매개변수들을 사용한다는 점에서 예측 가능하다.
기본 LP 부호화 및 복호화는 비교적 낮은 데이터율을 가지고 디지털로 음성을 통신하는데 사용될 수 있다. 그러나, 그것은 여진의 매우 간단한 시스템을 사용하기 때문에, 합성 음성을 생성한다. 소위 부호 여진 선형 예측(CELP) 코덱은 개선된 여진 코덱이다. 그것은 "잔류(residual)" 부호화에 기초한다. 성도의 모델링은 디지털 필터의 매개변수들이 압축된 음성으로 부호화되는 디지털 필터들에 의한다. 이들 필터들은 원래 스피커의 음성 코드들의 진동을 나타내는 신호에 의해 구동, 즉 "여진(excited)" 된다. 오디오 음성 신호의 잔류는 디지털로 필터링된 오디오 음성 신호를 제외하고 (원래) 오디오 음성 신호이다. CELP 코덱은 상기 잔류를 부호화하고, "잔류 펄스 여진(residual pulse excitation)"으로 알려진 여진에 대한 기초로서 그것을 사용한다. 그러나, 한 샘플씩을 기초로 하는 잔류 파형들을 부호 화하는 것 대신에, CELP는 한 블록의 잔류 샘플들을 나타내기 위하여 소정 세트의 파형 템플릿들로부터 선택된 파형 템플릿을 사용한다. 부호 워드는 상기 부호기에 의해 결정되고 상기 복호기에 제공되며, 상기 복호기는 그 다음 원래 잔류 샘플들을 나타내기 위해 잔류 시퀀스를 선택하는데 상기 부호 워드를 사용한다.
도 1은 송신기/부호기 시스템의 구성요소들 및 수신기/복호기 시스템의 구성요소들을 도시한다. 전체 시스템은 LP 코덱으로서 역할을 하고 CELP형 코덱일 수 있다. 상기 송신기는 샘플링된 음성 신호(s(n))를 받아들이고 분석기에 제공하며, 상기 분석기는 코덱을 위해 LP 매개변수들(역 필터 및 합성 필터)을 결정한다. sq(n)은 잔류(x(n))를 결정하는데 사용된 역 필터링된 신호이다. 여진 검색 모듈은 양자화 에러(xq(n))로서 잔류(x(n)) 및 합성기 매개변수들을 전송을 위해 부호화하고 그들을 수신기에 앞서는 통신 채널에 인가한다. 상기 수신기(복호기 시스템) 측에서, 복호기 모듈은 전송된 신호로부터 합성기 매개변수들을 추출하고 합성기에 제공한다. 상기 복호기 모듈은 또한 전송된 신호로부터 양자화 에러(xq(n))를 결정한다. 상기 합성기로부터의 출력은 상기 양자화 에러(xq(n))와 결합되어 원래 음성 신호(s(n))를 나타내는 양자화 값(sq(n))을 생성한다.
CELP형 코덱을 이용하는 송신기 및 수신기는 에러(xq(n))가 에러들(잔류들)(x(n))을 추정하는데 적합한 다양한 파형들을 나타내는 부호록(codebook)에 인덱스로서 전송된다는 것을 제외하고, 유사한 방식으로 기능 한다.
나이키스트의 정리에 따르면, 샘플링 비율(Fs)을 갖는 음성 신호는 0부터 0.5Fs까지의 주파수 대역을 나타낼 수 있다. 요즘, 대부분의 음성 코덱들(부호기들-복호기들)은 8 kHz의 샘플링 비율을 사용한다. 샘플링 비율이 8 kHz보다 증가하는 경우, 더 높은 주파수들이 표시될 수 있기 때문에 음성의 자연스러움이 개선된다. 현재, 음성 신호의 샘플링 비율이 보통 8 kHz이지만, 16 kHz의 샘플링 비율을 이용하는 이동 전화국들이 개발되고 있다. 나이키스트의 정리에 따라, 16 kHz의 샘플링 비율은 0-8 kHz의 주파수 대역을 갖는 음성을 나타낼 수 있다. 샘플링된 음성은 그 다음 송신기에 의해 전송을 위해 부호화되고, 그 다음 수신기에 의해 복호화된다. 16 kHz의 샘플링 비율을 이용하여 샘플링된 음성의 음성 부호화는 광대역 음성 부호화로 지칭된다.
음성의 샘플링 비율이 증가되는 경우, 부호화 복잡도도 또한 증가한다. 어떤 알고리즘들에 있어서, 샘플링 비율이 증가함에 따라, 부호화 복잡도는 기하급수적으로까지 증가할 수 있다. 따라서, 부호화 복잡도는 종종 광대역 음성 부호화에 대한 알고리즘을 결정하는데 제한 인자이다. 이것은 특히 예를 들어 전력 소모, 이용가능한 처리 능력, 및 메모리 요건들이 알고리즘들의 이용가능성에 중요하게 영향을 미치는 이동 전화국에 대해 사실이다.
때때로 음성 부호화에 있어서, 데시메이션(decimation)으로 알려진 절차가 부호화의 복잡도를 줄이는데 사용된다. 데시메이션은 시퀀스에 대해 원래의 샘플링 비율을 더 낮은 비율로 줄인다. 보간(interpolation)으로 알려진 절차와는 반대이 다. 데시메이션 과정은 저역 통과 필터를 가지고 입력 데이터를 필터링하고 그 다음 더 낮은 비율로 결과적인 평활한(smoothed) 신호를 다시 샘플링한다. 보간은 시퀀스에 대해 원래 샘플링 비율을 더 높은 비율로 증가시킨다. 보간은 원래 시퀀스에 제로들을 삽입하고 그 다음 특별한 저역 통과 필터를 인가하여 상기 제로 값들을 보간된 값들로 대체한다. 샘플들의 수는 따라서 증가된다.
다른 선행 기술 광대역 음성 코덱은 부-대역 부호화(sub-band coding)를 사용함으로써 복잡도를 제한한다. 그러한 부-대역 부호화 접근에 있어서, 광대역 신호를 부호화하기 전에, 상기 광대역 신호는 2개의 신호들, 하위 대역 신호 및 상위 대역 신호로 분할된다. 양 신호들은 그 다음 다른 것과 독립하여 부호화된다. 복호기에서, 합성 과정에서, 2개의 신호들은 재결합된다. 그러한 접근은 복잡도가 샘플링 비율의 함수로서 기하급수적으로 증가하는 부호화 알고리즘(혁신적인 부호록을 검색하는 것과 같은)의 부분들에서 부호화 복잡도를 감소시킨다. 그러나, 복잡도가 선형으로 증가하는 부분들에서, 그러한 접근은 복잡도를 감소시키지 않는다.
상기 부-대역 부호화 선행 기술 해결책의 부호화 복잡도는 도 2에 도시된 바와 같이, 부호기에서는 상위 대역의 분석을 무시하고 복호기에서는 필터링된 백색 잡음, 또는 필터링된 의사-랜덤 잡음으로 그것을 대체함으로써 더 감소될 수 있다. 인간의 청력이 높은 주파수 대역의 위상 응답에 민감하지 않고 진폭 응답에만 민감하기 때문에 상위 대역의 분석은 무시될 수 있다. 다른 이유는 잡음과 같은 무성음 음소들은 상위 대역에 에너지를 포함하고, 반면 위상이 중요한 유성음 신호는 상위 대역에 상당한 에너지를 포함하지 않기 때문이다. 이 접근에 있어서, 상위 대역의 스펙트럼은 하위 대역 LP 필터로부터 발생된 LP 필터를 가지고 추정된다. 따라서, 상위 주파수 대역 내용들의 정보는 전송 채널상에서 전송되지 않고, 상위 대역 LP 합성 필터링 매개변수들의 생성은 하위 주파수 대역에 기초를 둔다. 백색 잡음, 의사(artificial) 신호는 하위 대역 신호의 특성들로부터 추정되는 잡음의 에너지를 가지고 상위 대역 필터링을 위한 소스로서 사용된다. 부호기 및 복호기 양자가 여진, 장기간 예측기(LTP; Long Term Predictor) 및 하위 대역에 대한 고정 부호록 이득들을 알고 있기 때문에, 이들 매개변수들로부터 상위 대역에 대한 LP 합성 필터링 매개변수들 및 에너지 스케일링 인자를 추정할 수 있다. 선행기술 접근에 있어서, 광대역 백색 잡음의 에너지는 하위 대역 여진의 에너지에 균등하게 된다. 따라서, 하위 대역 합성 신호의 경사(tilt)가 계산된다. 경사 인자의 계산에 있어서, 최하위 주파수 대역이 절단(cut off)되고 균등화된 광대역 백색 잡음 신호는 상기 경사 인자에 의해 곱해진다. 상기 광대역 잡음은 그 다음 LP 필터를 통해 필터링된다. 결국 하위 대역이 상기 신호로부터 절단된다. 상기와 같이, 상위 대역 에너지의 스케일링은 에너지 스케일러 추정기로부터 추정된 상위 대역 에너지 스케일링 인자에 기초를 두고, 상위 대역 LP 합성 필터링은 입력 신호가 음성인지 배경 잡음인지에 상관없이, LP 필터링 추정기에 의해 제공되는 상위 대역 LP 합성 필터링 매개변수들에 기초를 둔다. 이 접근은 음성만을 포함하는 신호들을 처리하는데 적합하지만, 입력 신호들이 특히 비-음성 기간들 동안에 배경 잡음을 포함하는 경우 적합하게 기능하지 않는다.
배경 잡음을 포함하는 입력 신호들의 광대역 음성 부호화 방법이 필요한데, 상기 방법은 사용된 특정 부호화 알고리즘에 상관없이 충분한 광대역 음성 신호를 부호화하는 복잡도에 비해 복잡도를 감소시키고, 음성 신호를 나타내는데 충분히 동일하게 우수한 충실도를 여전히 제공한다.
본 발명은 입력 신호의 음성 및 비-음성 기간들을 구별하기 위하여 음성 활성 정보를 이용하고, 상기 입력 신호의 상위 주파수 대역에 대한 선형 예측(LP; Linear Predictive) 합성 필터링 매개변수들 및 에너지 스케일링 인자를 추정하는 경우 상기 입력 신호에서의 배경 잡음의 영향이 고려된다.
따라서, 본 발명의 제1 태양은 음성 기간들(speech periods) 및 비-음성 기간들(non-speech periods)을 구비하는 입력 신호를 부호화하고 복호화하며 상위 주파수 성분들 및 하위 주파수 성분들을 구비하는 합성 음성을 제공하기 위한 음성 부호화 방법으로서, 상기 입력 신호는 부호화 및 복호화 과정들에서 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 하위 주파수 대역의 특성을 나타내는 음성 관련 매개변수들은 상기 합성 음성의 상기 상위 주파수 성분들을 제공하기 위하여 의사 신호(artificial signal)를 처리하는데 사용되며, 상기 입력 신호는 상기 음성 기간들내의 제1 신호 및 상기 비-음성 기간들내의 제2 신호를 포함하는 음성 부호화 방법이다.
상기 방법은 상기 제1 신호를 나타내는 음성 관련 매개변수들에 기초하여 상기 음성 기간들내의 상기 의사 신호를 스케일링하고 합성 필터링(synthesis filtering)하는 단계; 및 상기 제2 신호를 나타내는 음성 관련 매개변수들에 기초 하여 상기 비-음성 기간들내의 상기 의사 신호를 스케일링하고 합성 필터링하는 단계를 포함하는 것을 특징으로 한다. 여기서, 상기 제1 신호는 음성 신호를 포함하고 상기 제2 신호는 잡음 신호를 포함한다.
바람직하기로는, 상기 음성 기간들내의 상기 의사 신호의 상기 스케일링 및 합성 필터링은 또한 상기 합성 음성의 상기 하위 주파수 성분들로부터 계산된 스펙트럼 경사 인자(spectral tilt factor)에 기초한다.
바람직하기로는, 상기 입력 신호가 배경 잡음을 포함하는 경우, 상기 음성 기간들내의 상기 의사 신호의 상기 스케일링 및 합성 필터링은 상기 배경 잡음의 특성을 나타내는 정정 인자(correction factor)에 더 기초한다.
바람직하기로는, 상기 비-음성 기간들내의 상기 의사 신호의 상기 스케일링 및 합성 필터링은 상기 배경 잡음의 특성을 나타내는 상기 정정 인자에 더 기초한다.
바람직하기로는, 음성 활성 정보는 상기 제1 및 제2 신호 기간들을 나타내는데 사용된다.
본 발명의 제2 태양은 음성 기간들 및 비-음성 기간들을 구비하는 입력 신호를 부호화하고 복호화하며 상위 주파수 성분들 및 하위 주파수 성분들을 구비하는 합성 음성을 제공하기 위한 음성 신호 송신기 및 수신기 시스템으로서, 상기 입력 신호는 부호화 및 복호화 과정들에서 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 하위 주파수 대역의 특성을 나타내는 음성 관련 매개변수들은 상기 합성 음성의 상기 상위 주파수 성분들을 제공하기 위하여 의사 신호(artificial signal)를 처리하는데 사용되며, 상기 입력 신호는 상기 음성 기간들내의 제1 신호 및 상기 비-음성 기간들내의 제2 신호를 포함하는 음성 신호 송신기 및 수신기 시스템이다.
상기 시스템은 상기 부호화된 입력 신호를 수신하고 상기 음성 관련 매개변수들을 제공하기 위한 복호기;
상기 음성 관련 매개변수들에 응답하여, 상기 의사 신호를 스케일링하기 위하여 에너지 스케일링 인자를 제공하기 위한 에너지 스케일 추정기(energy scale estimator);
상기 음성 관련 매개변수들에 응답하여, 상기 의사 신호를 합성 필터링하기 위한 선형 예측 필터링 추정기; 및
상기 음성 기간들 및 상기 비-음성 기간들에 대한 상기 에너지 스케일링 인자가 각각 상기 제1 및 제2 신호들에 기초하여 추정되도록 상기 음성 및 비-음성 기간들에 관한 정보를 제공하기 위한 수단을 포함하는 것을 특징으로 한다.
바람직하기로는, 상기 정보 제공 수단은 상기 음성 기간들에 대한 제1 가중치 정정 인자 및 상기 비-음성 기간들에 대한 다른 제2 가중치 정정 인자를 제공할 수 있고, 상기 에너지 스케일 추정기로 하여금 상기 제1 및 제2 가중치 정정 인자들에 기초하여 상기 에너지 스케일링 인자를 제공하도록 허용한다.
바람직하기로는, 상기 음성 기간들 및 상기 비-음성 기간들내의 상기 의사 신호의 상기 합성 필터링은 또한 각각 상기 제1 가중치 정정 인자 및 상기 제2 가중치 정정 인자에 기초한다.
바람직하기로는, 상기 음성 관련 매개변수들은 상기 제1 신호를 나타내는 선형 예측 부호화 계수들을 포함한다.
본 발명의 제3 태양은 음성 기간들 및 비-음성 기간들을 구비하는 입력 신호를 나타내는 부호화된 데이터로부터 상위 주파수 성분들 및 하위 주파수 성분들을 구비하는 음성을 합성하기 위한 복호기로서, 상기 입력 신호는 부호화 및 복호화 과정들에서 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 입력 신호의 부호화는 상기 하위 주파수 대역에 기초하며, 상기 부호화된 데이터는 상기 합성 음성의 상기 상위 주파수 성분들을 제공하고 의사 신호(artificial signal)를 처리하기 위한 상기 하위 주파수 대역의 특성을 나타내는 음성 매개변수들을 포함하는 복호기이다.
상기 시스템은 상기 음성 매개변수에 응답하여, 상기 음성 기간들내의 상기 의사 신호를 스케일링하기 위한 제1 에너지 스케일링 인자 및 상기 비-음성 기간들내의 상기 의사 신호를 스케일링하기 위한 제2 에너지 스케일링 인자를 제공하기 위한 에너지 스케일 추정기; 및
상기 의사 신호를 합성 필터링하기 위하여 복수의 필터링 매개변수들을 제공하기 위한 합성 필터링 추정기를 포함하는 것을 특징으로 한다.
바람직하기로는, 상기 복호기는 또한 상기 에너지 스케일 추정기로 하여금 상기 에너지 스케일링 인자들을 변경하도록 허용하기 위하여 상기 음성 기간들 및 상기 비-음성 기간들을 감시하기 위한 수단을 포함한다.
본 발명의 제4 태양은 입력 신호를 나타내는 음성 데이터를 포함하는 부호화 된 비트 스트림을 수신하도록 정해지는 이동국으로서, 상기 입력 신호는 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 입력 신호는 음성 기간들내의 제1 신호 및 비-음성 기간들내의 제2 신호를 포함하며, 상기 음성 데이터는 상기 하위 주파수 대역으로부터 획득되는 음성 관련 매개변수들을 포함하는 이동국이다.
상기 이동국은 상기 음성 관련 매개변수들을 사용하여 상기 하위 주파수 대역을 복호화하기 위한 제1 수단;
의사 신호로부터 상기 상위 주파수 대역을 복호화하기 위한 제2 수단;
상기 음성 데이터에 응답하여, 상기 음성 및 비-음성 기간들에 관한 정보를 제공하기 위한 제3 수단;
상기 음성 기간 정보에 응답하여, 상기 의사 신호를 스케일링하기 위하여 상기 제1 신호에 기초한 제1 에너지 스케일링 인자 및 상기 제2 신호에 기초한 제2 에너지 스케일링 인자를 제공하기 위한 에너지 스케일 추정기; 및
상기 음성 관련 매개변수들 및 상기 음성 기간 정보에 응답하여, 상기 의사 신호를 필터링하기 위하여 상기 제1 신호에 기초한 제1 복수의 선형 예측 필터링 매개변수들 및 제2 복수의 선형 예측 필터링 매개변수들을 제공하기 위한 예측 필터링 추정기를 포함하는 것을 특징으로 한다.
본 발명의 제5 태양은 입력 신호를 부호화하기 위한 수단을 구비하는 이동국으로부터 음성 데이터를 포함하는 부호화된 비트 스트림을 수신하도록 정해지는 통신 네트워크 구성요소로서, 상기 입력 신호는 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 입력 신호는 음성 기간들내의 제1 신호 및 비-음성 기간들 내의 제2 신호를 포함하며, 상기 음성 데이터는 상기 하위 주파수 대역으로부터 획득되는 음성 관련 매개변수들을 포함하는 통신 네트워크 구성요소이다.
상기 구성요소는 상기 음성 관련 매개변수들을 사용하여 상기 하위 주파수 대역을 복호화하기 위한 제1 수단;
의사 신호로부터 상기 상위 주파수 대역을 복호화하기 위한 제2 수단;
상기 음성 데이터에 응답하여, 상기 음성 및 비-음성 기간들에 관한 정보를 제공하고, 음성 기간 정보를 제공하기 위한 제3 수단;
상기 음성 기간 정보에 응답하여, 상기 의사 신호를 스케일링하기 위하여 상기 제1 신호에 기초한 제1 에너지 스케일링 인자 및 상기 제2 신호에 기초한 제2 에너지 스케일링 인자를 제공하기 위한 에너지 스케일 추정기; 및
상기 음성 관련 매개변수들 및 상기 음성 기간 정보에 응답하여, 상기 의사 신호를 필터링하기 위하여 상기 제1 신호에 기초한 제1 복수의 선형 예측 필터링 매개변수들 및 제2 복수의 선형 예측 필터링 매개변수들을 제공하기 위한 예측 필터링 추정기를 포함하는 것을 특징으로 한다.
본 발명은 도 3 내지 도 6과 관련된 설명을 읽는 경우 명백하게 될 것이다.
도 1은 선형 예측 부호기 및 복호기를 사용하는 송신기 및 수신기를 나타내는 도면이다.
도 2는 백색 잡음이 상위 대역 필터링에 대한 의사 신호로서 사용되는, 선행 기술 CELP 음성 부호기 및 복호기를 나타내는 도면이다.
도 3은 본 발명에 따른 상위 대역 복호기를 나타내는 도면이다.
도 4는 입력 신호의 잡음 레벨에 따른 가중치 계산을 나타내는 흐름도이다.
도 5는 본 발명에 따른 복호기를 포함하는 이동국을 나타내는 도면이다.
도 6은 본 발명에 따른 복호기를 사용하는 통신 네트워크를 나타내는 도면이다.
도 3에 도시된 바와 같이, 상위 대역 복호기(10)는 도 2에 도시된 바와 같은 선행 기술 상위 대역 복호기에 의해 취해진 접근과 유사하게, 하위 대역 복호기(2)로부터 발생된 하위 대역 매개변수들(102)에 기초한 복수의 상위 대역 선형 예측(LP) 합성 필터링 매개변수들(142) 및 상위 대역 에너지 스케일링 인자(140)를 제공하는데 사용된다. 도 2에 도시된 바와 같은 선행 기술 코덱에 있어서, 데시메이션 장치는 광대역 입력 신호를 하위 대역 음성 입력 신호로 변환하는데 사용되고, 하위 대역 부호기는 복수의 부호화된 음성 매개변수들을 제공하기 위하여 하위 대역 음성 입력 신호를 분석하는데 사용된다. 선형 예측 부호화(LPC; Linear Predictive Coding) 신호, LP 필터에 대한 정보 및 여진(excitation)을 포함하는 부호화된 매개변수들은 전송 채널을 통해 수신단에 전송되고, 상기 수신단은 입력 음성을 재구성하기 위해 음성 복호기를 사용한다. 복호기에 있어서, 하위 대역 음성 신호는 하위 대역 복호기에 의해 합성된다. 특히, 합성 하위 대역 음성 신호는 LB 분석-대-합성(A-b-S; Analysis-by-Synthesis) 모듈(미도시)에 의해 제공되는 바와 같은 하위 대역 여진 exc(n)을 포함한다. 따라서, 보간기(interpolator)가 하위 대역에만 에너지를 포함하는 합성 광대역 음성 신호를 가산 장치에 제공하는데 사용된다. 상위 주파수 대역의 음성 신호의 재구성에 있어서, 상위 대역 복호기는 에너지 스케일러 추정기, LP 필터링 추정기, 스케일링 모듈 및 상위 대역 LP 합성 필터링 모듈을 포함한다. 도시된 바와 같이, 상기 에너지 스케일러 추정기는 상위 대역 에너지 스케일링 인자, 또는 이득을 상기 스케일링 모듈에 제공하고, 상기 LP 필터링 추정기는 LP 필터 벡터 또는 한 세트의 상위 대역 LP 합성 필터링 매개변수들을 제공한다. 상기 에너지 스케일링 인자를 이용하여, 상기 스케일링 모듈은 백색 잡음 발생기에 의해 제공되는 바와 같은 의사 신호의 에너지를 적합한 레벨로 스케일링한다. 상위 대역 LP 합성 필터링 모듈은 적합하게 스케일링된 백색 잡음을 하위 및 상위 주파수 대역들에서 유색 잡음을 포함하는 의사 광대역 신호로 변환된다. 그 다음, 고역 통과 필터는 전체 광대역의 합성 음성을 생성하기 위하여 상위 대역에만 유색 잡음을 포함하는 의사 광대역 신호를 상기 가산 장치에 제공하는데 사용된다.
본 발명에 있어서, 도 3에 도시된 바와 같이, 백색 잡음 또는 의사 신호(e(n))는 또한 백색 잡음 발생기(4)에 의해 발생된다. 그러나, 도 2에 도시된 바와 같은 선행 기술 복호기에 있어서, 배경 잡음 신호의 상위 대역은 상위 대역 음성 신호를 추정하기 위한 알고리즘과 같은 알고리즘을 사용하여 추정된다. 배경 잡음의 스펙트럼이 음성의 스펙트럼보다 보통 더 평평하기 때문에, 선행 기술 접근은 합성 배경 잡음의 상위 대역에 대한 매우 작은 에너지를 생성한다. 본 발명에 따라, 2 세트의 에너지 스케일러 추정기들 및 2 세트의 LP 필터링 추정기들이 상위 대역 복호기(10)에 사용된다. 도 3에 도시된 바와 같이, 에너지 스케일러 추정기(20) 및 LP 필터링 추정기(22)는 음성 기간들에 대해 사용되고, 에너지 스케일러 추정기(30) 및 LP 필터링 추정기(32)는 비-음성 기간들에 대해 사용되며, 이들 모두는 동일한 하위 대역 복호기(2)에 의해 제공되는 하위 대역 매개변수들(102)에 기초를 둔다. 특히, 에너지 스케일러 추정기(20)는 신호가 음성인 것으로 가정하고 그와 같이 상위 대역 에너지를 추정하며, LP 필터링 추정기(22)는 음성 신호를 모델링하도록 설계된다. 유사하게, 에너지 스케일러 추정기(30)는 신호가 배경 잡음인 것으로 가정하고 그러한 가정하에 상위 대역 에너지를 추정하며, LP 필터링 추정기(32)는 배경 잡음 신호를 모델링하도록 설계된다. 따라서, 에너지 스케일러 추정기(20)는 음성 기간들에 대한 상위 대역 에너지 스케일링 인자(120)를 가중치 조정 모듈(24)에 제공하는데 사용되고, 에너지 스케일러 추정기(30)는 비-음성 기간들에 대한 상위 대역 에너지 스케일링 인자(130)를 가중치 조정 모듈(34)에 제공하는데 사용된다. LP 필터링 추정기(22)는 음성 기간들에 대한 상위 대역 LP 합성 필터링 매개변수들(122)을 가중치 조정 모듈(26)에 제공하는데 사용되고, LP 필터링 추정기(32)는 비-음성 기간들에 대한 상위 대역 LP 합성 필터링 매개변수들(132)을 가중치 조정 모듈(36)에 제공하는데 사용된다. 일반적으로, 에너지 스케일러 추정기(30) 및 LP 필터링 추정기(32)는 에너지 스케일러 추정기(20) 및 LP 필터링 추정기(22)에 의해 추정되는 것들에 비해, 스펙트럼이 더 평평하고 에너지 스케일링 인자가 더 크다고 생각한다. 신호가 음성 및 배경 잡음 둘 다를 포함하는 경우, 2 세트의 추정기들이 사용되지만, 최종 추정은 상위 대역 에 너지 스케일링 인자들(120, 130)의 가중치 평균 및 상위 대역 LP 합성 필터링 매개변수들(122, 132)의 가중치 평균에 기초를 둔다.
음성 및 배경 잡음 신호들이 구별 가능한 특징들을 가진다는 사실에 기초하여, 배경 잡음 모드 및 음성 모드간의 상위 대역 매개변수 추정 알고리즘의 가중치를 변화시키기 위하여, 가중치 계산 모듈(18)은 그 입력으로서 음성 활성 정보(106) 및 복호화된 하위 대역 음성 신호(108)를 이용하고, 이 입력을 이용하여 잡음 처리를 위해 가중치 인자(
Figure 112003013306493-pct00001
) 및 음성 처리를 위해 가중치 인자(
Figure 112003013306493-pct00002
)를 세팅함으로써 비-음성 기간들 동안 배경 잡음의 레벨을 감시한다. 여기서
Figure 112003013306493-pct00003
+
Figure 112003013306493-pct00004
= 1이다. 상기 음성 활성 정보(106)는 해당 기술에서 공지된 음성 활성 검출기(VAD; voice activity detector, 미도시)에 의해 제공된다는 것을 주목해야 한다. 상기 음성 활성 정보(106)는 상기 복호화된 음성 신호(108)의 어느 부분이 음성 기간들로부터 온 것이고 어느 부분이 비-음성 기간들로부터 온 것인지를 구별하는데 사용된다. 배경 잡음은, 음성의 중지들 동안, 또는 비-음성 기간들 동안 감시될 수 있다. 상기 음성 활성 정보(106)가 전송 채널 상에서 복호기에 전송되지 않는 경우, 비-음성 기간들을 음성 기간들과 구별하기 위하여 상기 복호화된 음성 신호(108)를 분석하는 것이 가능하다는 것을 주목해야 한다. 상당한 레벨의 배경 잡음이 검출된 경우, 도 4에 도시된 바와 같이, 가중치 정정 인자(
Figure 112003013306493-pct00005
)를 증가시키고 가중치 정정 인자(
Figure 112003013306493-pct00006
)를 감소시킴으로써 배경 잡음에 대해 상위 대역 생성쪽으로 가중치가 주어진다. 예를 들어, 음성 에너지 대 잡음 에너지(SNR)의 실제 비율에 따라 가중치가 수행될 수 있다. 따라서, 가중치 계산 모듈(18)은 음성 기간들에 대해 가중치 정정 인자(116 또는
Figure 112003013306493-pct00007
)를 가중치 조정 모듈들(24, 26)에 제공하고, 비-음성 기간들에 대해 다른 가중치 정정 인자(118 또는
Figure 112003013306493-pct00008
)를 가중치 조정 모듈들(34, 36)에 제공한다. 배경 잡음의 파워는 예를 들어 비-음성 기간들 동안 신호(102)에 포함된, 합성 신호의 파워를 분석함으로써 발견될 수 있다. 전형적으로, 이 파워 레벨은 매우 안정되고 상수로 고려될 수 있다. 따라서, SNR은 합성 음성 신호의 파워 대 배경 잡음의 파워의 대수 비이다. 상기 가중치 정정 인자들(116 및 118)을 가지고, 가중치 조정 모듈(24)은 음성 기간들에 대한 상위 대역 에너지 스케일링 인자(124)를 가산 모듈(40)에 제공하고, 가중치 조정 모듈(34)은 비-음성 기간들에 대한 상위 대역 에너지 스케일링 인자(134)를 가산 모듈(40)에 제공한다. 상기 가산 모듈(40)은 음성 및 비-음성 기간들에 대한 상위 대역 에너지 스케일링 인자(140)를 제공한다. 유사하게, 가중치 조정 모듈(26)은 음성 기간들에 대한 상위 대역 LP 합성 필터링 매개변수들(126)을 가산 장치(42)에 제공하고, 가중치 조정 모듈(36)은 상위 대역 LP 합성 필터링 매개변수들(136)을 가산 장치(42)에 제공한다. 이들 매개변수들에 기초하여, 상기 가산 장치(42)는 음성 및 비-음성 기간들에 대한 상위 대역 LP 합성 필터링 매개변수들(142)을 제공한다. 도 2에 도시된 바와 같이, 선행 기술 상위 대역 부호기의 대응부들과 유사하게, 스케일링 모듈(50)은 백색 잡음 발생기(4)에 의해 제공되는 의사 신호(104)의 에너지를 적합하게 스케일링하고 상위 대역 LP 합성 필터링 모듈(52)은 백색 잡음을 하위 및 상위 주파수 대역들로 유 색 잡음을 포함하는 의사 광대역 신호(152)로 변환한다. 적합하게 스케일링된 에너지를 갖는 의사 신호는 참조 번호(150)에 의해 표시된다.
본 발명을 수행하기 위한 일 방법은 에너지 스케일러 추정기(20)로부터의 상위 대역 에너지 스케일링 인자(120)에 기초한 배경 잡음에 대한 상위 대역의 에너지를 증가시키는 것이다. 따라서, 상위 대역 에너지 스케일링 인자(130)는 단순히 상수 정정 인자(ccorr)가 곱해진 상위 대역 에너지 스케일링 인자(120)일 수 있다. 예를 들어, 에너지 스케일러 추정기(20)에 의해 사용되는 경사 인자(ctilt)가 0.5이고, 정정 인자가 ccorr = 2.0인 경우, 가산 상위 대역 에너지 인자(140 또는
Figure 112003013306493-pct00009
)는 수학식 1에 따라 계산될 수 있다.
Figure 112003013306493-pct00010
가중치 정정 인자(116 또는
Figure 112003013306493-pct00011
)가 음성만에 대해 1.0, 잡음만에 대해 0.0, 낮은 레벨의 배경 잡음을 갖는 음성에 대해 0.8, 높은 레벨의 배경 잡음을 갖는 음성에 대해 0.5와 같이 세팅되는 경우, 가산 상위 대역 에너지 인자(
Figure 112003013306493-pct00012
)는 다음에 의해 주어진다:
Figure 112003013306493-pct00013
= 1.0 x 0.5 + 0.0 x 0.5 x 2.0 = 0.5(음성만에 대해)
Figure 112003013306493-pct00014
= 0.0 x 0.5 + 1.0 x 0.5 x 2.0 = 1.0(잡음만에 대해)
Figure 112003013306493-pct00015
= 0.8 x 0.5 + 0.2 x 0.5 x 2.0 = 0.6(낮은 배경 잡음을 갖는 음성에 대해)
Figure 112003013306493-pct00016
= 0.5 x 0.5 + 0.5 x 0.5 x 2.0 = 0.75(높은 배경 잡음을 갖는 음성에 대해)
예시적인 구현은 도 5에 도시된다. 이 간단한 절차는 상위 대역의 에너지를 정정함으로써 합성 음성의 품질을 개선할 수 있다. 배경 잡음의 스펙트럼이 음성의 스펙트럼보다 보통 더 평평하기 때문에 정정 인자(ccorr)가 여기서 사용된다. 음성 기간들에 있어서, 낮은 값의 ctilt 때문에 정정 인자(ccorr)의 영향은 비-음성 기간들에서만큼 크지 않다. 이 경우에 있어서, ctilt의 값은 선행기술에서와 같이 음성 신호에 대해 설계된다.
배경 잡음의 평평함에 따라 경사 인자를 적합하게 변경하는 것이 가능하다. 음성 신호에 있어서, 경사는 주파수 도메인의 에너지의 일반적인 경사로 정의된다. 전형적으로, 경사 인자는 하위 대역 합성 신호로부터 계산되고 균등화된 광대역 의사 신호에 곱해진다. 상기 경사 인자는 수학식 2를 이용하여, 제1 자기상관 계수(r)를 계산함으로써 추정된다.
Figure 112003013306493-pct00017
여기서 s(n)는 합성 음성 신호이다. 따라서, 추정 경사 인자(ctilt)는 0.2≤ctilt ≤1.0인, ctilt = 1.0 - r로부터 결정되고, 위 첨자(T)는 벡터의 전치(transpose)를 나타낸다.
또한 수학식 3과 같이 LPC 여진 exc(n) 및 필터링된 의사 신호 e(n)로부터 스케일링 인자를 추정하는 것이 가능하다.
Figure 112003013306493-pct00018
스케일링 인자
Figure 112003013306493-pct00019
는 참조 번호(140)에 의해 표시되고, 스케일링된 백색 잡음(escaled)은 참조 번호(150)에 의해 표시된다. 상기 LPC 여진, 상기 필터링된 의사 신호 및 상기 경사 인자는 신호(102)에 포함될 수 있다.
음성 기간들에서 LPC 여진 exc(n)는 비-음성 기간들과 상이하다는 것을 주목해야 한다. 음성 기간들에서 하위 대역 신호 및 상위 대역 신호의 특성들간의 관계가 비-음성 기간들과 상이하기 때문에, 경사 인자(ctilt)를 정정 인자(ccorr)로 곱함으로써 상위 대역의 에너지를 증가시키는 것이 바람직하다. 상술된 예(도 4)에 있어서, ccorr은 상수 2.0으로 선택된다. 그러나, 정정 인자(ccorr)는 0.1 ≤ctilt ccorr ≤1.0이 되도록 선택되어야 한다. 에너지 스케일러 추정기(20)의 출력 신호(120)가 ctilt인 경우, 에너지 스케일러 추정기(30)의 출력 신호(130)는 ctilt ccorr이다.
잡음에 대한 LP 필터링 추정기(32)의 일 구현은 배경 잡음이 존재하지 않는 경우 상위 대역 플래터(flatter)의 스펙트럼을 구성하는 것이다. 이것은 생성된 광 대역 LP 필터 다음에 가중치 필터
Figure 112003013306493-pct00020
을 더함으로써 달성될 수 있다. 여기서
Figure 112003013306493-pct00021
는 양자화된 LP 필터이고 0<
Figure 112003013306493-pct00022
Figure 112003013306493-pct00023
<1이다. 예를 들어, 다음에 있어서,
Figure 112003013306493-pct00024
이다.
Figure 112003013306493-pct00025
=0.5,
Figure 112003013306493-pct00026
=0.5 (음성만에 대해)
Figure 112003013306493-pct00027
=0.8,
Figure 112003013306493-pct00028
=0.5 (잡음만에 대해)
Figure 112003013306493-pct00029
=0.56,
Figure 112003013306493-pct00030
=0.46 (낮은 배경 잡음을 갖는 음성에 대해)
Figure 112003013306493-pct00031
=0.65,
Figure 112003013306493-pct00032
=0.40 (높은 배경 잡음을 갖는 음성에 대해)
Figure 112003013306493-pct00033
Figure 112003013306493-pct00034
간의 차이가 더 커지게 되는 경우 스펙트럼은 더 평평해지고 가중치 필터는 LP 필터의 영향을 상쇄하는 것을 주목해야 한다.
도 5는 본 발명의 일 실시예에 따라 이동국(200)의 블록도를 나타낸다. 이동국은 마이크로폰(201), 키패드(207), 디스플레이(206), 이어폰(214), 송신/수신 스위치(208), 안테나(209) 및 제어 유닛(205)과 같은 상기 장치의 전형적인 부분들을 포함한다. 더욱이, 도면은 이동국에 전형적인 송신 및 수신 블록들(204, 211)을 나타낸다. 상기 송신 블록(204)은 음성 신호를 부호화하기 위한 부호기(221)를 포함한다. 상기 송신 블록(204)은 또한 RF 기능들뿐만 아니라 채널 부호화, 암호화 및 변조에 필요한 동작들을 포함하지만 도 5에는 명료함을 위해 도시되지 않는다. 상기 수신 블록(211)은 또한 본 발명에 따라 복호화 블록(220)을 포함한다. 복호화 블록(220)은 도 3에 도시된 상위 대역 복호기(10)와 같은 상위 대역 복호기(222)를 포함한다. 마이크로폰(201)으로부터 들어오는 신호는 증폭단(202)에서 증폭되고 A/D 변환기(203)에서 디지털화되며, 전송 블록(204), 전형적으로 상기 전송 블록이 포함하는 음성 부호화 장치에 취해진다. 상기 전송 블록에 의해 처리되고 변조되며 증폭된 전송 신호는 송신/수신 스위치(208)를 경유하여 안테나(209)에 취해진다. 수신되는 신호는 안테나로부터 송신/수신 스위치(208)를 경유하여 수신 블록(211)에 취해진다. 상기 수신 블록은 상기 수신된 신호를 복조하고 암호를 해독하며 채널 부호화를 복호화한다. 결과적인 음성 신호는 D/A 변환기(212)를 경유하여 증폭기(213)에 그리고 이어서 이어폰(214)에 취해진다. 상기 제어 유닛(205)은 이동국(200)의 동작을 제어하고, 상기 키패드(207)로부터 사용자가 제공한 제어 명령들을 독출하며 디스플레이(206)에 의하여 사용자에게 메시지들을 제공한다.
본 발명에 따른 상위 대역 복호기(10)는 또한 보통의 전화망과 같은 통신 네트워크(300)에서 또는 GSM 네트워크와 같은 이동국 네트워크에서 사용될 수 있다. 도 6은 그러한 통신 네트워크의 블록도의 예를 도시한다. 예를 들어, 통신 네트워크(300)는 보통의 전화들(370), 기지국들(340), 기지국 제어기들(350) 및 통신 네트워크들의 다른 중앙 장치들(355)이 접속되는, 전화 교환들 또는 대응하는 스위칭 시스템들(360)을 포함할 수 있다. 이동국들(330)은 기지국들(340)을 경유하여 통신 네트워크에 접속을 설정할 수 있다. 도 3에 도시된 상위 대역 복호기(10)와 유사한 상위 대역 복호기(322)를 포함하는 복호화 블록(320)은 예를 들어 상기 기지국(340)에 특히 바람직하게 위치될 수 있다. 그러나, 복호화 블록(320)이 또한 예를 들어 상기 기지국 제어기(350) 또는 다른 중앙 또는 스위칭 장치(355)에 위치 될 수 있다. 상기 이동국 시스템이 무선 채널 상에서 취해진 부호화 신호를 통신 시스템에서 전송되는 전형적인 64 kbit/s 신호로 변환하고 그 반대로 변환하기 위하여, 예를 들어 상기 기지국들 및 상기 기지국 제어기들간에 별개의 트랜스코더들을 사용하는 경우, 상기 복호화 블록(320)은 또한 그러한 트랜스코더에 위치될 수 있다. 일반적으로, 상위 대역 복호기(322)를 포함하는 복호화 블록(320)은 부호화된 데이터 스트림을 부호화되지 않은 데이터 스트림으로 변환하는 통신 네트워크(300)의 어떤 구성요소에 위치될 수 있다. 상기 복호화 블록(320)은 이동국(330)으로부터 들어오는 부호화된 음성 신호를 복호화하고 필터링하며, 그 다음 상기 음성 신호는 통신 네트워크(300)에서 압축되지 않은 보통의 방식으로 전송될 수 있다.
본 발명은 CELP 유형 음성 코덱들에 적용 가능하고 또한 다른 유형의 음성 코덱들에 적합하게 될 수 있다. 더욱이, 도 3에 도시된 바와 같은 복호기에서, 상위 대역 에너지를 추정하기 위해 단 하나의 에너지 스케일러 추정기를 사용하거나, 음성 및 배경 잡음 신호를 모델링하기 위해 하나의 LP 필터링 추정기를 사용하는 것이 가능하다.
따라서, 비록 본 발명이 본 발명의 바람직한 실시예에 관하여 설명되었다 하더라도, 본 발명의 범위 및 정신을 벗어나지 않으면서 본 발명의 상세 및 형태에서 상기 및 다양한 다른 변화들, 생략들 및 변형들이 수행될 수 있다는 것이 당업자에게 이해될 것이다.

Claims (37)

  1. 음성 기간들(speech periods) 및 비-음성 기간들(non-speech periods)을 구비하는 입력 신호를 부호화하고 복호화하며 상위 주파수 성분들 및 하위 주파수 성분들을 구비하는 합성 음성을 제공하기 위한 음성 부호화 방법으로서, 상기 입력 신호는 상기 음성 기간의 제1 신호와 상기 비-음성 기간의 제2 신호를 포함하고, 상기 입력 신호는 부호화 동안에 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 입력 신호에서 상기 하위 주파수 대역의 특성을 나타내는 음성 관련 매개변수들은 상기 합성 음성의 상기 상위 주파수 성분들을 제공하기 위하여 의사 신호(artificial signal)를 처리하는데 사용되며, 음성 활성 정보(voice activity information)가 상기 음성 기간들 및 상기 비-음성 기간들을 나타내는데 사용되는 음성 부호화 방법에 있어서,
    각각 상기 음성 기간들 및 비-음성 기간들을 나타내는 상기 음성 활성 정보에 기초하여 상기 음성 기간들 및 상기 비-음성 기간들내의 상기 의사 신호를 스케일링하는 단계를 포함하는 것을 특징으로 하는 음성 부호화 방법.
  2. 제1항에 있어서,
    상기 제1 신호를 나타내는 상기 음성 관련 매개변수들에 기초하여 상기 음성 기간들내의 상기 의사 신호를 합성 필터링(synthesis filtering)하는 단계; 및
    상기 제2 신호를 나타내는 상기 음성 관련 매개변수들에 기초하여 상기 비-음성 기간들내의 상기 의사 신호를 합성 필터링하는 단계를 더 포함하는 것을 특징으로 하는 음성 부호화 방법.
  3. 제1항 또는 제2항에 있어서, 상기 제1 신호는 음성 신호를 포함하고 상기 제2 신호는 잡음 신호를 포함하는 것을 특징으로 하는 음성 부호화 방법.
  4. 제3항에 있어서, 상기 제1 신호는 상기 잡음 신호를 더 포함하는 것을 특징으로 하는 음성 부호화 방법.
  5. 제1항, 제2항 및 제4항 중 어느 한 항에 있어서, 상기 음성 기간들 및 상기 비-음성 기간들은 상기 입력 신호에 기초하여 음성 활성 검출 수단에 의해 정해지는 것을 특징으로 하는 음성 부호화 방법.
  6. 제1항, 제2항 및 제4항 중 어느 한 항에 있어서, 상기 음성 관련 매개변수들은 상기 제1 신호를 나타내는 선형 예측 부호화 계수들을 포함하는 것을 특징으로 하는 음성 부호화 방법.
  7. 제1항, 제2항 및 제4항 중 어느 한 항에 있어서, 상기 음성 기간들 내의 상기 의사 신호의 상기 스케일링은 상기 합성 음성의 상기 하위 주파수 성분들로부터 계산된 스펙트럼 경사 인자(spectral tilt factor)에 더 기초하는 것을 특징으로 하는 음성 부호화 방법.
  8. 제7항에 있어서, 상기 입력 신호는 배경 잡음을 포함하고, 상기 음성 기간들내의 상기 의사 신호의 상기 스케일링이 상기 배경 잡음의 특성을 나타내는 정정 인자(correction factor)에 더 기초하는 것을 특징으로 하는 음성 부호화 방법.
  9. 제8항에 있어서, 상기 비-음성 기간들내의 상기 의사 신호의 상기 스케일링은 상기 정정 인자에 더 기초하는 것을 특징으로 하는 음성 부호화 방법.
  10. 음성 기간들 및 비-음성 기간들을 구비하는 입력 신호를 부호화하고 복호화하며 상위 주파수 성분들 및 하위 주파수 성분들을 구비하는 합성 음성을 제공하기 위한 음성 신호 송신기 및 수신기 시스템으로서, 상기 입력 신호는 상기 음성 기간들의 제1 신호와 상기 비-음성 기간들의 제2 신호를 포함하고, 상기 입력 신호는 부호화 동안에 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 입력신호에서 상기 하위 주파수 대역의 특성을 나타내는 음성 관련 매개변수들은 상기 합성 음성의 상기 상위 주파수 성분들을 제공하기 위하여 의사 신호(artificial signal)를 처리하는데 사용되며, 음성 활성 정보가 상기 음성 기간들 및 비-음성 기간들을 나타내는데 사용되는 음성 신호 송신기 및 수신기 시스템에 있어서,
    상기 부호화된 입력 신호를 수신하고 상기 음성 관련 매개변수들을 제공하기 위한 복호기;
    상기 음성 관련 매개변수들에 응답하여, 각각 상기 음성 기간들 및 비-음성 기간들을 나타내는 상기 음성 활성 정보에 기초하여 상기 음성 기간들 및 상기 비-음성 기간들내의 상기 의사 신호를 스케일링하기 위하여 에너지 스케일링 인자를 제공하기 위한 에너지 스케일 추정기(energy scale estimator); 및
    또한 상기 음성 관련 매개변수들에 응답하여, 상기 의사 신호를 합성 필터링하기 위한 선형 예측 필터링 성분을 포함하는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  11. 제10항에 있어서, 상기 정보 제공 수단은 상기 입력 음성의 음성 활성 정보에 기초하여 상기 음성 및 비-음성 기간들을 감시하는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  12. 제10항에 있어서, 상기 정보 제공 수단은 상기 음성 기간들에 대한 제1 가중치 정정 인자 및 상기 비-음성 기간들에 대한 다른 제2 가중치 정정 인자를 제공할 수 있고, 상기 에너지 스케일 추정기로 하여금 상기 제1 및 제2 가중치 정정 인자들에 기초하여 상기 에너지 스케일링 인자를 제공하도록 허용하는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  13. 제12항에 있어서, 상기 음성 기간들 및 상기 비-음성 기간들내의 상기 의사 신호의 상기 합성 필터링은 각각 상기 제1 가중치 정정 인자 및 상기 제2 가중치 정정 인자에 기초하는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  14. 제10항 내지 제13항 중의 어느 한 항에 있어서,
    상기 입력 신호는 상기 음성 기간들내의 제1 신호 및 상기 비-음성 기간들내의 제2 신호를 포함하고,
    상기 제1 신호는 음성 신호를 포함하고 상기 제2 신호는 잡음 신호를 포함하는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  15. 제14항에 있어서, 상기 제1 신호는 상기 잡음 신호를 더 포함하는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  16. 제10항,제11항,제12항,제13항 및 제15항 중의 어느 한 항에 있어서, 상기 음성 관련 매개변수들은 상기 제1 신호를 나타내는 선형 예측 부호화 계수들을 포함하는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  17. 제10항,제11항,제12항,제13항 및 제15항 중의 어느 한 항에 있어서, 상기 음성 기간들에 대한 상기 에너지 스케일링 인자는 또한 상기 합성 음성의 상기 하위 주파수 성분들의 스펙트럼 경사 인자로부터 추정되는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  18. 제17항에 있어서,
    상기 입력 신호는 배경 잡음을 포함하고,
    상기 음성 기간들에 대한 상기 에너지 스케일링 인자는 상기 배경 잡음의 특 성을 나타내는 정정 인자로부터 더 추정되는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  19. 제18항에 있어서, 상기 비-음성 기간들에 대한 상기 에너지 스케일링 인자는 상기 정정 인자로부터 더 추정되는 것을 특징으로 하는 음성 신호 송신기 및 수신기 시스템.
  20. 음성 기간들 및 비-음성 기간들을 구비하는 입력 신호를 나타내는 음성 데이터를 구비하는 부호화된 비트 스트림으로부터 상위 주파수 성분들 및 하위 주파수 성분들을 구비하는 음성을 합성하기 위한 복호기로서, 상기 입력 신호는 음성 기간들의 제1 신호와 비-음성 기간들의 제2 신호를 포함하고, 상기 입력 신호는 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 음성 데이터는 상기 입력 신호의 상기 하위 주파수 대역의 특성을 나타내는 음성 매개변수들을 포함하고, 음성 활성 정보는 상기 음성 기간들 및 비-음성 기간들을 나타내는데 사용되는 복호기에 있어서,
    상기 부호화된 비트 스트림에 응답하여, 상기 합성 음성의 하위 주파수 성분들을 제공하기 위한 음성 관련 매개변수들을 사용하여 상기 입력 신호에서 상기 하위 주파수 대역을 부호화하기 위한 제1 수단들;
    상기 부호화된 비트 스트림에 응답하여, 상기 의사 신호에 기초하여 상기 합성 신호의 상기 상위 주파수 성분들을 발생하기 위한 제2 수단들; 및
    상기 음성 매개변수에 응답하여, 상기 음성 활성 정보가 상기 음성 기간들을 나타내는 경우 상기 음성 기간들 내의 상기 의사 신호를 스케일링하기 위한 제1 에너지 스케일링 인자, 및 상기 음성 활성 정보가 상기 비-음성 기간들을 나타내는 경우 상기 비-음성 기간들 내의 상기 의사 신호를 스케일링하기 위한 제2 에너지 스케일링 인자를 제공하기 위한 에너지 스케일 추정기를 포함하는 것을 특징으로 하는 복호기.
  21. 제20항에 있어서, 상기 음성 기간들 및 상기 비-음성 기간들을 감시하기 위한 수단을 더 포함하는 것을 특징으로 하는 복호기.
  22. 제20항에 있어서,
    상기 입력 신호는 음성 기간들내의 제1 신호 및 비-음성 기간들내의 제2 신호를 포함하고,
    상기 제1 에너지 스케일링 인자는 상기 제1 신호에 기초하여 추정되고 상기 제2 에너지 스케일링 인자는 상기 제2 신호에 기초하여 추정되는 것을 특징으로 하는 복호기.
  23. 제22항에 있어서, 상기 음성 기간들 및 상기 비-음성 기간들에 대한 상기 필터링 매개변수들은 각각 상기 제1 및 제2 신호들로부터 추정되는 것을 특징으로 하는 복호기.
  24. 제22항 또는 제23항에 있어서, 상기 제1 에너지 스케일링 인자는 상기 합성 음성의 상기 하위 주파수 성분들의 특성을 나타내는 스펙트럼 경사 인자에 기초하여 더 추정되는 것을 특징으로 하는 복호기.
  25. 제22항 내지 제23항 중의 어느 한 항에 있어서, 상기 제1 신호는 배경 잡음을 포함하고, 상기 제1 에너지 스케일링 인자는 상기 배경 잡음의 특성을 나타내는 정정 인자에 기초하여 더 추정되는 것을 특징으로 하는 복호기.
  26. 제25항에 있어서, 상기 제2 에너지 스케일링 인자는 상기 정정 인자로부터 더 추정되는 것을 특징으로 하는 복호기.
  27. 입력 신호를 나타내는 음성 데이터를 포함하는 부호화된 비트 스트림을 수신하도록 정해지는 이동국으로서, 상기 입력신호는 음성 기간들의 제1 신호와 비-음성 기간들의 제2 신호를 포함하고, 상기 입력 신호는 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 음성 활성 정보가 상기 음성 기간들 및 상기 비-음성 기간들을 나타내는데 사용되며, 상기 음성 데이터는 상기 입력신호의 상기 하위 주파수 대역으로부터 획득되는 음성 관련 매개변수들을 포함하는 이동국에 있어서,
    상기 부호화된 비트 스트림에 응답하여, 합성 음성의 하위 주파수 성분들을 제공하기 위한 상기 음성 관련 매개변수들을 사용하여 상기 하위 주파수 대역을 복호화하기 위한 제1 수단;
    상기 부호화된 비트 스트림에 응답하여, 의사 신호로부터 상기 합성 음성의 상기 상위 주파수 성분들을 발생하기 위한 제2 수단; 및
    상기 음성 활성 정보에 응답하여, 각각 상기 음성 기간들 및 상기 비-음성 기간들을 나타내는 음성 활성 정보에 기초하여 상기 음성 기간들 내의 의사 신호를 스케일링하기 위한 제1 에너지 스케일링 인자 및 상기 비-음성 기간들내의 의사 신호를 스케일링하기 위한 제2 에너지 스케일링 인자를 제공하기 위한 에너지 스케일 추정기를 포함하는 것을 특징으로 하는 이동국.
  28. 제27항에 있어서, 상기 음성 관련 매개변수들 및 상기 음성 활성 정보에 응답하여, 상기 의사 신호를 필터링하기 위하여 상기 제1 신호에 기초한 제1 복수의 선형 예측 필터링 매개변수들 및 제2 복수의 선형 예측 필터링 매개변수들을 제공하기 위한 예측 필터링 성분을 더 포함하는 것을 특징으로 하는 이동국.
  29. 이동국으로부터 입력 신호를 나타내는 음성 데이터를 포함하는 부호화된 비트 스트림을 수신하도록 정해지는 통신 네트워크 구성요소로서, 상기 입력신호는 음성 기간들이 제1 신호와 비-음성 기간들의 제2 신호를 포함하고, 상기 입력 신호는 상위 주파수 대역 및 하위 주파수 대역으로 분할되고, 상기 음성 데이터는 상기 입력 신호의 상기 하위 주파수 대역으로부터 획득되는 음성 관련 매개변수들을 포함하며, 음성 활성 정보가 음성 기간들 및 비-음성 기간들을 나타내는데 사용되는 통신 네트워크 구성요소에 있어서,
    합성 음성의 하위 주파수 성분들을 제공하기 위한 상기 음성 관련 매개변수들을 사용하여 상기 하위 주파수 대역을 복호화하기 위한 제1 수단;
    의사 신호로부터 상기 합성 음성의 상기 상위 주파수 성분들을 발생하기 위한 제2 수단; 및
    상기 음성 기간 정보에 응답하여, 상기 음성 기간들 및 비-음성 기간들을 나타내는 음성 활성 정보에 기초하여 상기 음성 기간들내의 의사 신호를 스케일링하기 위한 제1 에너지 스케일링 인자 및 상기 비-음성 기간들내의 의사 신호를 스케일링하기 위한 제2 에너지 스케일링 인자를 제공하기 위한 에너지 스케일 추정기를 포함하는 것을 특징으로 하는 통신 네트워크 구성요소.
  30. 제29항에 있어서, 상기 음성 관련 매개변수들 및 상기 음성 기간 정보에 응답하여, 상기 의사 신호를 필터링하기 위하여 상기 제1 신호에 기초한 제1 복수의 선형 예측 필터링 매개변수들 및 제2 복수의 선형 예측 필터링 매개변수들을 제공하기 위한 예측 필터링 성분을 더 포함하는 것을 특징으로 하는 통신 네트워크 구성요소.
  31. 제1항에 있어서, 상기 입력 신호는 적어도 데시메이션에 의해 상위 주파수 대역과 하위 주파수대역으로 분할되는 것을 특징으로 하는 음성 부호화 방법.
  32. 제31항에 있어서, 상기 입력 신호는 또한 필터링에 의해 상위 주파수 대역과 하위 주파수대역으로 분할되는 것을 특징으로 하는 음성 부호화 방법.
  33. 합성 음성을 제공하기 위한 음성 기간들 및 비-음성 기간들을 구비하는 입력신호를 나타내는 부호화된 데이터를 복호화 방법으로서, 상기 합성 음성은 상위 주파수 성분들 및 하위 주파수 성분들을 포함하고, 상기 입력 신호는 상기 부호화 동안에 상위 주파수 대역과 하위 주파수 대역으로 분할되고, 부호화된 데이터는 상기 함성 음성의 상기 상위 주파수 성분들을 제공하기 위한 의산 신호를 처리하도록 사용되는 상기 입력신호 내의 상기 하위 주파수 대역의 특성인 음성 매개변수들을 포함하는 복호화 방법에 있어서,
    음성 기간들 내의 상기 의사신호를 스케일링하기 위한 제1 에너지 스케일링 인자와 비-음성 기간들 내의 상기 의사신호를 스케일링하기 위한 제2 에너지 스케일링 인자를 제공하는 단계; 및
    상기 의사 신호를 합성 필터링하기 위한 복수개의 필터링 매개변수들을 제공하는 단계를 포함하는 것을 특징으로 하는 복호화 방법.
  34. 제33항에 있어서, 상기 입력 신호는 상기 음성 기간들 내의 제1 신호 및 상기 비-음성 기간들 내의 제2 신호를 포함하고, 상기 제1 에너지 스케일링 인자는 상기 제1 신호에 기초하여 추정되고, 상기 제2 에너지 스케일링 인자는 상기 제2 신호에 기초하여 추정되는 것을 특징으로 하는 복호화 방법.
  35. 제34항에 있어서, 상기 음성 기간들을 위한 상기 필터링 매개변수들은 상기 제1 신호로부터 추정되고, 상기 비-음성 기간들을 위한 상기 필터링 매개변수들은 상기 음성 신호로부터 추정되는 것을 특징으로 하는 복호화 방법.
  36. 제34항에 있어서, 상기 제1 스케일링 인자는 상기 합성 음성의 상기 하위 주파수 성분들의 특성을 나타내는 스펙트럼 경사 인자에 기초하여 더 추정되는 것을 특징으로 하는 복호화 방법.
  37. 제34항에 있어서, 상기 제1 신호는 배경 잡음을 포함하고, 제1 에너지 스케일링 인자는 상기 배경 잡음의 특성을 나타내는 정정 인자에 기초하여 더 추정되는 것을 특징으로 하는 복호화 방법.
KR1020037005298A 2000-10-18 2001-08-31 음성 코덱에서 의사 고대역 신호 추정 방법 및 시스템 KR100544731B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/691,323 US6691085B1 (en) 2000-10-18 2000-10-18 Method and system for estimating artificial high band signal in speech codec using voice activity information
US09/691,323 2000-10-18
PCT/IB2001/001596 WO2002033696A1 (en) 2000-10-18 2001-08-31 Method and system for estimating artificial high band signal in speech codec

Publications (2)

Publication Number Publication Date
KR20040005838A KR20040005838A (ko) 2004-01-16
KR100544731B1 true KR100544731B1 (ko) 2006-01-23

Family

ID=24776068

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037005298A KR100544731B1 (ko) 2000-10-18 2001-08-31 음성 코덱에서 의사 고대역 신호 추정 방법 및 시스템

Country Status (15)

Country Link
US (1) US6691085B1 (ko)
EP (2) EP1328927B1 (ko)
JP (2) JP4302978B2 (ko)
KR (1) KR100544731B1 (ko)
CN (1) CN1295677C (ko)
AT (1) ATE362634T1 (ko)
AU (1) AU2001284327A1 (ko)
BR (1) BRPI0114706B1 (ko)
CA (1) CA2426001C (ko)
DE (1) DE60128479T2 (ko)
DK (1) DK1328927T3 (ko)
ES (1) ES2287150T3 (ko)
PT (1) PT1328927E (ko)
WO (1) WO2002033696A1 (ko)
ZA (1) ZA200302465B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1735927B (zh) * 2003-01-09 2011-08-31 爱移通全球有限公司 用于高质量语音编码转换的方法和装置
KR100940531B1 (ko) 2003-07-16 2010-02-10 삼성전자주식회사 광대역 음성 신호 압축 및 복원 장치와 그 방법
KR20050027179A (ko) * 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
WO2006025337A1 (ja) * 2004-08-31 2006-03-09 Matsushita Electric Industrial Co., Ltd. ステレオ信号生成装置およびステレオ信号生成方法
KR100707174B1 (ko) 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
DE602006009215D1 (de) * 2005-01-14 2009-10-29 Panasonic Corp Audioumschaltungsvorrichtung und -methode
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US8086451B2 (en) * 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US7546237B2 (en) 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
KR100653643B1 (ko) * 2006-01-26 2006-12-05 삼성전자주식회사 하모닉과 비하모닉의 비율을 이용한 피치 검출 방법 및피치 검출 장치
DE602007013026D1 (de) * 2006-04-27 2011-04-21 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
EP3629328A1 (en) * 2007-03-05 2020-04-01 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for smoothing of stationary background noise
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
KR101444099B1 (ko) * 2007-11-13 2014-09-26 삼성전자주식회사 음성 구간 검출 방법 및 장치
CN103187065B (zh) 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
JP5443547B2 (ja) * 2012-06-27 2014-03-19 株式会社東芝 信号処理装置
ES2881672T3 (es) * 2012-08-29 2021-11-30 Nippon Telegraph & Telephone Método de descodificación, aparato de descodificación, programa, y soporte de registro para ello
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
PT3121813T (pt) * 2013-01-29 2020-06-17 Fraunhofer Ges Forschung Preenchimento de ruído sem informação lateral para codificadores do tipo celp
US10978083B1 (en) * 2019-11-13 2021-04-13 Shure Acquisition Holdings, Inc. Time domain spectral bandwidth replication

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235669A (en) 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JPH08102687A (ja) * 1994-09-29 1996-04-16 Yamaha Corp 音声送受信方式
JP2638522B2 (ja) * 1994-11-01 1997-08-06 日本電気株式会社 音声符号化装置
FI980132A (fi) 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP2000181494A (ja) * 1998-12-11 2000-06-30 Sony Corp 受信装置及び方法、通信装置及び方法
JP2000181495A (ja) * 1998-12-11 2000-06-30 Sony Corp 受信装置及び方法、通信装置及び方法
JP4135240B2 (ja) * 1998-12-14 2008-08-20 ソニー株式会社 受信装置及び方法、通信装置及び方法
KR20000047944A (ko) 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
JP4135242B2 (ja) * 1998-12-18 2008-08-20 ソニー株式会社 受信装置及び方法、通信装置及び方法
JP2000206997A (ja) * 1999-01-13 2000-07-28 Sony Corp 受信装置及び方法、通信装置及び方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
KR101235829B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
US9135925B2 (en) 2007-12-06 2015-09-15 Electronics And Telecommunications Research Institute Apparatus and method of enhancing quality of speech codec
US9135926B2 (en) 2007-12-06 2015-09-15 Electronics And Telecommunications Research Institute Apparatus and method of enhancing quality of speech codec
US9142222B2 (en) 2007-12-06 2015-09-22 Electronics And Telecommunications Research Institute Apparatus and method of enhancing quality of speech codec

Also Published As

Publication number Publication date
CN1484824A (zh) 2004-03-24
EP1772856A1 (en) 2007-04-11
PT1328927E (pt) 2007-06-14
ATE362634T1 (de) 2007-06-15
BR0114706A (pt) 2005-01-11
EP1328927B1 (en) 2007-05-16
EP1328927A1 (en) 2003-07-23
CA2426001C (en) 2006-04-25
JP4302978B2 (ja) 2009-07-29
CA2426001A1 (en) 2002-04-25
ES2287150T3 (es) 2007-12-16
BRPI0114706B1 (pt) 2016-03-01
WO2002033696B1 (en) 2002-07-25
AU2001284327A1 (en) 2002-04-29
JP2009069856A (ja) 2009-04-02
CN1295677C (zh) 2007-01-17
DE60128479T2 (de) 2008-02-14
US6691085B1 (en) 2004-02-10
ZA200302465B (en) 2004-08-13
JP2004537739A (ja) 2004-12-16
KR20040005838A (ko) 2004-01-16
DK1328927T3 (da) 2007-07-16
WO2002033696A1 (en) 2002-04-25
DE60128479D1 (de) 2007-06-28

Similar Documents

Publication Publication Date Title
KR100544731B1 (ko) 음성 코덱에서 의사 고대역 신호 추정 방법 및 시스템
EP1328928B1 (en) Apparatus for bandwidth expansion of a speech signal
US6732070B1 (en) Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
KR100769508B1 (ko) Celp 트랜스코딩
JP4927257B2 (ja) 可変レートスピーチ符号化
EP2040253B1 (en) Predictive dequantization of voiced speech
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
JP4874464B2 (ja) 遷移音声フレームのマルチパルス補間的符号化
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
EP1397655A1 (en) Method and device for coding speech in analysis-by-synthesis speech coders
Yu et al. Harmonic+ noise coding using improved V/UV mixing and efficient spectral quantization
Drygajilo Speech Coding Techniques and Standards
JP4230550B2 (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置
JPH08160996A (ja) 音声符号化装置
GB2352949A (en) Speech coder for communications unit

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121226

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20131220

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20141231

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20151217

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20161220

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20171219

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20181226

Year of fee payment: 14