KR20060085118A - Method and apparatus for bandwidth extension of speech - Google Patents

Method and apparatus for bandwidth extension of speech Download PDF

Info

Publication number
KR20060085118A
KR20060085118A KR20050006096A KR20050006096A KR20060085118A KR 20060085118 A KR20060085118 A KR 20060085118A KR 20050006096 A KR20050006096 A KR 20050006096A KR 20050006096 A KR20050006096 A KR 20050006096A KR 20060085118 A KR20060085118 A KR 20060085118A
Authority
KR
Grant status
Application
Patent type
Prior art keywords
speech signal
band
signal
high
band speech
Prior art date
Application number
KR20050006096A
Other languages
Korean (ko)
Other versions
KR100708121B1 (en )
Inventor
마쓰마누
한우진
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Abstract

협대역 음성 신호로부터 광대역의 음성 신호를 생성하는 음성신호의 대역 확장 방법 및 장치가 개시된다. The bandwidth extension method and apparatus of the audio signal for generating a wideband audio signal from a narrowband audio signal is disclosed.
본 발명에 따른 음성 신호의 대역 확장 장치는 스펙트럴 폴딩 기법 및 비선형화 기법을 이용하여 상기 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 수단과, 상기 추정된 고대역 음성 신호의 스펙트럼 포락선을 조정하는 수단을 포함한다. Bandwidth extension unit of the audio signal according to the present invention, the spectral folding method, and non-linear Technique using a means for estimating a high-band speech signal from the narrow-band speech signal and the estimated high-band to adjust the spectral envelope of the speech signal It means for.
본 발명에 의하면, 스펙트럴 폴딩 기법과 비선형화 기법을 이용하여 협대역 음성 신호로부터 고대역 음성신호를 추정하여 효과적으로 음성 신호의 대역을 확장할 수 있으며, 통신 시스템의 수신측에 사용되어 향상된 품질의 음성 신호를 제공할 수 있다. According to the present invention, the spectral folding method and using a non-linear Technique and from the narrow-band speech signal can be estimated by effectively extended the bandwidth of the audio signal in-band audio signal, it is used on the receiving side of the communication system of improved quality it is possible to provide a speech signal.

Description

음성 신호의 대역 확장 방법 및 장치{Method and apparatus for bandwidth extension of speech} Bandwidth extension method and apparatus of the audio signal {Method and apparatus for bandwidth extension of speech}

도 1은 본 발명에 따른 대역 확장 장치의 개략적인 구성을 나타낸 블록도. 1 is a block diagram showing a general configuration of the bandwidth extension device according to the present invention.

도 2는 본 발명에 따른 고대역 신호 생성부의 구체적인 구성을 나타낸 블록도. Figure 2 is a block diagram illustrating a high-band signal generating unit specific structure according to the present invention.

도 3은 본 발명에 따른 고대역 추정부의 구체적인 구성을 나타낸 블록도. Figure 3 is a block diagram illustrating a high-band estimation unit specific structure according to the present invention.

도 4는 본 발명에 사용되는 스펙트럴 윈도우를 나타낸 도면. Figure 4 is a view of the spectral window for use in the present invention.

도 5는 본 발명에 따른 음성 신호의 대역 확장 방법을 나타낸 플로우 차트. 5 is a flowchart illustrating a bandwidth extension method for audio signal in accordance with the present invention.

본 발명은 음성 신호의 처리에 관한 것으로, 보다 상세히는 협대역(narrowband) 음성 신호로부터 광대역(wideband)의 음성 신호를 생성하는 음성신호의 대역 확장 방법 및 장치에 관한 것이다. The present invention relates to a method and apparatus for bandwidth extension of speech signals from a process that, in more detail is a narrow band (narrowband) audio signal on the audio signal to generate a speech signal of a broadband (wideband).

일반적으로, 전화망의 대역(bandwidth)은 300~3200(㎐)으로 좁기 때문에, 전화망을 통하여 전송된 음성 신호의 주파수 대역은 제한된다. In general, since the band (bandwidth) of the telephone network is narrow as 300 ~ 3200 (㎐), frequency band of the audio signal transmitted through the telephone network is limited. 즉, 전화망을 통해 전송되는 0~300(Hz), 3.2~8(KHz) 대역의 신호가 손실되어, 음성 신호의 열화가 일 어난다. That is, the loss is 0 ~ 300 (Hz), the signal of 3.2 ~ 8 (KHz) bandwidth to be transmitted over a telephone network, one fly control the degradation of the speech signal.

이러한 문제를 해결하기 위한 한 가지 방법으로, 대역 확장(bandwidth extension) 방법이 오랫동안 연구되어 왔다. One way to solve this problem, there has been a bandwidth extension (bandwidth extension) how to study for a long time. 상기 대역 확장 방법은, 송신측에서 오디오(audio) 신호를 입력받아 소정 주파수 이상의 높은 주파수 대역의 데이터를 잘라내어 버리는 한편 잘라내어 버린 높은 주파수 대역의 데이터를 복원하기 위해 필요한 부가 정보를 생성하고 상기 낮은 주파수 대역의 신호와 상기 부가 정보를 전송하면, 수신측에서 상기 부가 정보를 이용하여 높은 주파수 대역의 데이터를 복원하는 방식으로 동작한다. The bandwidth extension method, the transmitting audio (audio) receives the signal ll cut data of at least a high frequency band predetermined frequency hand cut and generates additional information that is needed to restore the data in the high frequency band abandoned and the low frequency band in When the transmission of the signal and the additional information, the operation at the receiving end in such a way that by using the additional information to restore the data in the high frequency band. 이러한 대역 확장 기술의 대표적인 예로는 Coding Technology사의 SBR(Spectral Band Replication) 기술을 들 수 있다. A typical example of such a bandwidth extension technique, may be mentioned (Spectral Band Replication) Coding Technology Corporation SBR technology. SBR에 대한 상세한 설명은 2002년 5월 10-13일 Audio Engineering Society 112차 컨벤션에서 발표된 Convention Paper 5560에 개시되어 있다. A detailed description of the SBR are disclosed in the 10 to 13 May 2002 Audio Engineering Society 112 cars Convention The Convention Paper 5560 published in.

상기 SBR을 이용하는 대역 확장 기술은 음악과 같은 오디오 신호에 있어서 큰 성공을 거두었다. Bandwidth extension technique using the SBR is a great success in audio signals such as music. 최근에는 AAC(Advanced Audio Coding) 및 상기 SBR을 이용하는 aaaPLUS가 제 3세대 통신의 표준으로 선택된 바 있다. Recently, the bar aaaPLUS use and the SBR (Advanced Audio Coding) AAC selected as the standard for the third generation communication. 그러나, 상기 SBR을 비롯한 다른 대역 확장 기술들은 오디오 신호에 초점을 맞추고 있으며, 상대적으로 스피치(speech)와 같은 음성 신호에 적합한 대역 확장 기술은 빈약한 실정이다. However, other bandwidth extension techniques, including the SBR have focuses on the audio signal, the bandwidth extension technique is relatively suitable for the audio signal such as a speech (speech) is poor circumstances.

따라서, 본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로, 음성 신호의 대역을 확장하는 방법 및 그 장치를 제공하는 데에 목적이 있다. Accordingly, the present invention has been made in view of the above problems, it aims to provide a method and apparatus for extending the bandwidth of a speech signal. 특히, 본 발명은 스피치와 같은 음성 신호의 대역을 효과적으로 확장할 수 있는 음성 신호의 대역 확장 방법 및 장치를 제공하는 데에 목적이 있다. In particular, the present invention aims to provide a method and apparatus for bandwidth extension of the audio signal which can effectively extend the bandwidth of a speech signal such as a speech.

또한, 본 발명은 수신측의 디코더에 사용되어 4~8(KHz)의 주파수 성분을 생성하여 16(KHz)까지 샘플링률의 증가를 가능하게 함으로써, 향상된 품질의 음성 신호를 제공할 수 있는 음성 신호의 대역 확장 방법 및 장치를 제공하는 데에 목적이 있다. In addition, the audio signal that can be the present invention is used in the decoder at the receiving end to provide a four or audio signals, improved quality by enabling an increase in the sampling rate to generate a frequency component of 8 (KHz) 16 (KHz) the band aims to provide a method and an expansion device.

전술한 바와 같은 기술적 과제를 해결하기 위하여 본 발명인 음성 신호의 대역 확장 장치는 스펙트럴 폴딩 기법 및 비선형화 기법을 이용하여 상기 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 수단; Bandwidth expansion apparatus according to the present inventors the speech signal in order to solve the technical problems as described above, includes means for estimating a spectral folding method, and non-linearity high-band speech signal from the narrow-band speech signal using the method; 및 상기 추정된 고대역 음성 신호의 스펙트럼 포락선을 조정하는 수단을 포함한다. And means for adjusting the spectral envelope of the highband speech signal estimate the.

상기 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 수단은, 상기 협대역 음성 신호를 업샘플링, 고역 통과 필터를 이용한 필터링, 및 다운 샘플링 과정을 수행하여 상기 협대역 음성 신호에 대하여 미러 대칭적인 스펙트럼 성분을 갖는 신호를 출력하는 스펙트럴 폴딩부; Means for estimating a high-band speech signal from the narrow-band speech signal, the narrowband mirror symmetrical spectrum with respect to performing the filtering, and downsampling process the audio signal with the up-sampling, high-pass filter to said narrow-band speech signal spectral folding unit for outputting a signal having a component; 및 상기 협대역 음성 신호를 비선형화하는 비선형화부를 구비하고, 상기 스펙트럴 폴딩부 및 상기 비선형화부의 출력 신호를 선형적으로 결합하여 상기 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 것이 바람직하다. And it is preferable to provided, and estimating the spectral folding portion and the high-band speech signal to an output signal by combining linearly from the narrow-band speech signal of the non-linear conversion unit the non-linear conversion unit which non-linearity for the narrowband speech signal .

또한, 상기 추정된 고대역 음성 신호의 스펙트럼 포락선을 조정하는 수단은, 미리 훈련된 소정의 테이블을 이용하여 상기 협대역 음성 신호에 대응되는 고대역 음성 신호를 출력하는 매핑부; In addition, the means for adjusting the spectral envelope of the highband speech signal is estimated, a mapping unit for outputting the high-band speech signal corresponding to the narrow-band speech signal using a predetermined table of pre-training; 및 상기 매핑부에서 출력되는 고대역 음성 신호에 일치되도록 상기 추정된 고대역 음성 신호의 스펙트럼을 조정하는 포락선 조정부를 포함하는 것이 바람직하다. And preferably it includes an envelope adjustment section for adjusting the estimated high-band spectrum of the speech signal to match the high-band speech signal output from the mapping unit.

여기서, 상기 매핑부 및 포락선 조정부는 선형 주파수 켑스트럴 계수(LFCC)에 의하여 제공되는 음성 신호의 특징을 이용하는 것이 바람직하다. Here, the mapping unit and the envelope adjuster is preferred to use the characteristics of the speech signal provided by the linear frequency Kep host barrels coefficient (LFCC).

또한, 본 발명인 음성 신호의 대역 확장 방법은 상기 협대역 음성 신호의 피치 성분을 제거하고, 스펙트럴 폴딩 및 비선형화 기법을 이용하여 상기 피치 성분이 제거된 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 단계; In addition, the present inventors bandwidth extension method for audio signal is to remove the pitch component of the narrow-band speech signal, and estimating the spectral folding and non-linearity high-band speech signal from a narrowband speech signal and the pitch component is removed using the techniques the method comprising; 및 상기 협대역 음성 신호의 선형 주파수 켑스트럴 계수(LFCC)를 추출하여, 상기 협대역 음성 신호에 대응되는 고대역 음성신호를 검색하고, 상기 검색된 고대역 음성신호에 일치되도록 상기 추정된 고대역 음성 신호의 스펙트럴 포락선을 조정하는 단계를 포함한다. And the narrow-band the estimated high-band such that extracts a linear frequency Kep host barrels coefficient (LFCC) of the audio signal, searching for a high-band speech signal corresponding to the narrow-band speech signal, and matched to high the searched band speech signal and a step of adjusting the spectral envelope of the speech signal.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세히 설명한다. With reference to the accompanying drawings, it will be described in detail a preferred embodiment of the present invention.

도 1은 본 발명에 따른 대역 확장 장치의 개략적인 구성을 나타낸 블록도이다. Figure 1 is a block diagram showing a general configuration of a bandwidth expansion apparatus according to the present invention.

협대역 음성 신호의 대역 확장 방법은, 음성 신호의 발생 과정을 고려하여, 협대역 음성 신호나 고대역 음성 신호의 포락선(envelope)은 상호 의존적이고, 따라서 협대역 음성 신호를 알고 있다면 상기 협대역 음성 신호로부터 고대역의 음성 신호를 생성해 낼 수 있다는 사실에 기반하고 있다. Bandwidth extension method of the narrow-band speech signal, if considering the generation process of the audio signal, and narrowband audio signals and said envelope (envelope) of the band speech signal, mutually dependent, and thus knows the narrow-band speech signal of the narrow-band speech It is based on the fact that it can generate an audio signal from the high-band signal.

도 1을 참조하면, 본 발명에 따른 대역 확장 장치(100)는 제 1, 2 업샘플링 부(110,150), 저역통과필터(120), 고대역 신호 생성부(130), 고역통과필터(160), 및 결합부(170)를 포함한다. 1, the bandwidth extension device 100 includes a first and second up-sampling unit (110 150), the low-pass filter 120, a high-band signal generator 130, a high-pass filter 160 and an engaging portion 170. the

상기 제 1 업샘플링부(110)는 대역 확장 장치(100)로 입력되는 협대역 음성 신호(101)를 2배로 업샘플링한다. The first up-sampling unit 110 up-sampling two times of narrow-band speech signal 101 that is input to the bandwidth extension device 100. 이렇게 업샘플링된 신호는 16(KHz)에서 샘플링된다. The thus up-sampled signal is sampled at 16 (KHz). 그 결과, 상기 업샘플링부(110)에서 출력되는 신호는 0~4(KHz)의 대역에서 입력 신호와 동일하고, 고대역인 4~8(KHz)에서는 입력 신호의 폴딩된 버전(folded version)과 동일한 스펙트럼을 갖게 된다. As a result, the signal output from the up-sampling unit 110 is identical to the input signal in a band of 0 ~ 4 (KHz), and forward inverse of 4 ~ 8 (KHz) in the folded version of the input signal (folded version) and have the same spectrum.

상기 저역통과필터(120)는 상기 업샘플링된 신호를 필터링하여 상기 폴딩된 버전을 제거하여 입력 신호와 동일한 스펙트럼 특성을 갖는 저대역 신호(121)를 출력한다. The low-pass filter 120 and outputs the low band signal 121 that has the same spectral characteristics as the input signal to remove the folded version filters the upsampled signal.

상기 고대역 신호 생성부(130)는 상기 협대역 음성 신호(101)로부터 4~8(KHz)의 고대역 음성 신호를 추정하는 부분으로, 후술되는 바와 같이 고대역 신호 추정부 및 고대역 스펙트럼 포락선 수정부를 포함하여 상기 협대역 음성신호로부터 고대역 신호를 추정하는 한편, 상기 협대역 음성신호와 대응되는 고대역 음성신호를 소정의 테이블을 이용하여 검색하고, 상기 추정된 고대역 신호를 수정하여 출력하는 방식으로 동작한다. The high-band signal generator 130 is a part for estimating a high-band speech signal of 4 ~ 8 (KHz) from the narrow-band speech signal 101, the high-band signal estimation and the high-band spectral envelope, as described below modified to estimate the narrow-band high-band signal from the audio signal, including parts other hand, the narrow-band speech signal and to a high-band speech signal corresponding to the search by using a predetermined table, modifying the estimated high-band signal output It operates in a manner that.

상기 고대역 신호 생성부(130)에서 출력되는 고대역 음성 신호는 상기 제 2 업샘플링부(150)에서 2배로 업샘플링되고, 상기 고역 통과 필터(160)는 상기 업샘플링된 신호로부터 4~8(KHz) 대역의 음성 신호(161)를 추출한다. The high band signal the high band audio signal outputted from the generator 130 is the second-up and 2-fold up-sampled from the sampling section 150, the high-pass filter 160 is 4 to 8 from the up-sampled signal (KHz) to extract the audio signal 161 of the band.

상기 결합부(170)는 상기 저역통과필터(120)에서 출력되는 0~4(KHz)의 저역 음성 신호(121) 및 상기 고역통과필터(160)에서 출력되는 4~8(KHz)의 고역 음성 신호(161)를 결합하여 전체적으로 0~8(KHz)으로 대역 확장된 광대역 음성 신호(171)를 출력하게 된다. The coupling portion 170 is a high-band speech in the low-band speech signal 121 and the high-pass filter (160) 4 ~ 8 (KHz) is output in the 0 ~ 4 (KHz) output from the low-pass filter 120 combining signal 161, and outputs to the BWE the wide-band speech signal 171 to 0 ~ 8 (KHz) as a whole.

도 2는 본 발명에 따른 상기 고대역 신호 생성부(130)의 구체적인 구성을 나타낸 블록도이다. 2 is a block diagram showing a specific configuration of the high-band signal generation section 130 according to the present invention.

상기 고대역 신호 생성부(130)는 입력되는 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 부분(A)과, 상기 추정된 고대역 음성 신호의 스펙트럼 포락선(envelope)을 조정하는 부분(B)으로 구분된다. Part (B) of the high adjustment part (A) and the spectral envelope (envelope) of the estimated high-band speech signal to estimate the high-band speech signal from a narrowband speech signal to be input is the band signal generator 130 It is divided into.

상기 고대역 음성 신호를 추정하는 부분(A)은 피치 필터(134), 피치 인버스 필터(135) 및 고대역 추정부(136)를 포함한다. The high and part (A) for estimating a band speech signal comprises a pitch filter 134, an inverse pitch filter 135 and the high-band estimator 136.

구체적으로는, 상기 피치 필터(134)는 입력되는 협대역 음성 신호로부터 3차 피치 필터 계수 및 피치에 대한 정보를 얻는다. Specifically, the pitch filter 134 obtains the information about the third-order pitch filter coefficient and the pitch from the narrow-band speech signal is input. 상기 피치 필터(134)에서는 수정된 공분산(covariance) 방법을 사용한다. In the pitch filter 134 to use a modified covariance (covariance) method.

상기 피치 인버스 필터(135)는 상기 피치 필터(134)의 출력신호에 포함된 피치 성분을 제거한다. The inverse pitch filter (135) removes a pitch component included in the output signal of the pitch filter 134. 이는, 고대역의 음성 신호에는 일반적으로 적은 피치 성분을 가지고 있기 때문이다. This is because generally have a small pitch to the component, the audio signal of the high band.

상기 고대역 추정부(136)는 상기 피치 인버스 필터(135)로부터 출력되는 피치 성분이 제거된 협대역 음성신호로부터 고대역의 음성신호를 추정하는 부분이다. The high-band estimation unit 136 is a part for estimating a sound signal in the high band from a narrowband speech signal pitch component is removed, output from the inverse pitch filter (135).

구체적으로는, 상기 고대역 추정부(136)는 스펙트럴 폴딩부(137) 및 비선형화부(138)를 포함한다. Specifically, the high-band estimation unit 136 comprises a spectral folding unit 137 and the non-linear conversion unit (138).

상기 스펙트럴 폴딩부(137)는 상기 피치 성분이 제거된 협대역 음성신호를 2배로 업샘플링하고, 고역 통과 필터를 통해 필터링한 다음, 다시 2배로 다운 샘플링함으로써, 원래 협대역 음성 신호와 비교하여 미러 대칭적인 스펙트럼 성분을 갖는 신호를 출력한다. As compared to the spectral folding unit 137 by the two-times up-sampling the removing narrow-band speech signal, and filtering through a high pass filter, and then again twice downsampling the pitch component, the original narrow-band speech signal and it outputs a signal having a mirror symmetrical spectral components.

상기 비선형화부(138)는 상기 피치 성분이 제거된 협대역 음성신호를 2배로 업샘플링하고, 저역 통과 필터를 통해 필터링된 신호를 전파 정류기(full wave rectifier)와 같은 비선형화 수단을 통해 통과시킨다. The nonlinear conversion unit 138, passes through the non-linearity means, such as is the removal narrow-band speech signal to double up-sampling, and propagating the filtered signal through a low pass filter rectifier (full wave rectifier) ​​the pitch component. 또한, 상기 비선형화부(138)는 상기 비선형화된 신호를 다시 고역 통과 필터를 통해 필터링하고 2배로 다운 샘플링한다. In addition, the non-linear conversion unit 138 is filtered through the high pass filter back to the signal obtained by the non-linearity is two-fold downsampling.

상기 스펙트럴 폴딩부(137) 및 비선형화부(138)에서의 출력 신호는 선형적으로 결합되어 고대역의 음성신호, 즉 4~8(KHz) 대역의 추정된 음성신호가 출력된다. The spectral folding unit 137, and the output signal from the nonlinear conversion unit 138, the speech signal is estimated for coupling high-band speech signal, that is 4 ~ 8 (KHz) of the band is linearly output.

상기 고대역 추정부(136)의 구체적인 구성을 나타낸 도 3을 참조하여 설명하면 다음과 같다. The high will be described with reference to Figure 3 showing a specific configuration of the band estimating unit 136 is as follows.

도 3을 참조하면, 상기 고대역 추정부(136)는 주로 무성음 성분의 고주파 대역을 복원하는데 유효한 스펙트럴 폴딩부(137)와, 유성음 성분의 하모닉(Harmonic) 구조를 생성하기 위한 비선형화부(138)를 구비한다. 3, the high-band estimator 136 is to primarily to restore the high frequency band of the unvoiced component effective spectral folding unit 137, and a non-linear section (138 for generating a harmonic (Harmonic) structure of the voiced components ) and a.

상기 스펙트럴 폴딩부(137)는 업샘플링부(137a)에 의하여 대역 제한된 신호(협대역 음성신호)를 업샘플링하며, 이로 인해 고주파 대역의 성분은 저주파 대역의 성분의 대칭적인 형태로 복원된다. The spectral folding unit 137 and up-sampling the band-limited signals (narrow-band speech signal) by the up-sampling unit (137a), which causes components of the high frequency band is restored to the symmetrical shape of the component of the low frequency band. 이러한 과정을 거치면, 고주파 대역에도 성분이 생성된다. Geochimyeon this process, the components are generated in the high frequency band. 일반적으로 음성의 무성음 성분은 고주파 대역에서도 상당한 에너지 를 가지고 있으므로, 상기 스펙트럴 폴딩부(137)는 무성음 성분의 고주파 대역을 복원하는데 유효하다. In general, components of the unvoiced sound is because it has a significant energy in the high frequency band, the spectral folding portion 137 is effective to restore the high frequency band of the unvoiced component.

상기 비선형화부(138)는 상기 스펙트럴 폴딩부(137)와는 달리, 유성음 성분의 하모닉 구조를 만들어내기 위해서 사용된다. The nonlinear conversion unit 138, unlike the spectral folding unit 137, is used to produce a harmonic structure of voiced sound component. 일반적으로, 유성음 성분은 많은 수의 하모닉 구조로 이루어져 있으므로, 비선형화를 적용하면 유성음 성분의 고주파 대역을 추정할 수 있다. In general, voiced component is so made to a large number of harmonic structure, it is possible by applying a non-linearity to estimate the high-frequency band component of the voiced sound. 상세히는, 원신호를 저역통과필터(138a)를 통해 필터링하여 저주파 성분만을 얻은 후에, 이를 비선형화 함수(x(n) 2 )(138b)를 통해 고주파 대역까지 확장함으로써 고주파 대역에 저주파 대역이 갖는 강한 하모닉 성분을 확장시킨다. Specifically, by filtering the original signal through a low pass filter (138a) only the low frequency component after obtaining, through a non-linearity function (x (n) 2) ( 138b) this by expansion up to a high frequency band in the high frequency band is a low frequency band having It extends a strong harmonic component. 여기서, 상기 비선형화 함수는 상기한 이외에 다양한 형태가 적용될 수 있다. Here, the non-linearity function may take various forms can be applied in addition to the above.

상기 스펙트럴 폴딩부(137) 및 비선형화부(138)에서 얻어진 신호는 각각 가중부(137b,138c)에서 α, 1-α가 곱해져서 더해짐으로써 가중 합산된다. Signal obtained from the spectral folding unit 137 and the non-linear conversion unit 138 is weighted by summing α, deohaejim haejyeoseo 1-α is multiplied in weighting section (137b, 138c), respectively. 상기 α는 상기 스펙트럴 폴딩 기법 및 비선형화 기법 중에 어느쪽에 더 비중을 둘 것인가를 의미한다. The α refers to whether both the spectral folding method, and non-linearity which side the more specific gravity techniques. 상기 α는, 상기 스펙트럴 폴딩 기법 및 비선형화 기법이 각각 무성음, 유성음 성분에 적합하다는 것을 고려하여 음성의 주기성(pitch)을 측정한 다음, 상기 측정된 주기성으로부터 추정될 수 있다. The α, each said spectral folding method, and non-linear Technique unvoiced, estimate the periodicity (pitch) of the speech in consideration of that is suitable for a voiced sound component may be then estimated from the measured periodicity. 음성의 주기성 측정 방법은 여러 가지가 있으나 일반적으로 스피치 코덱에서 주기성을 처리하기 위해서 사용되는 피치 필터의 이득값을 이용할 수 있으며, 이외에 정규화된 자기 상관 계수(normalized autocorrelation coefficient) 등을 이용할 수 있다. How to measure the periodicity of the voice or the like can be used, but the number of the autocorrelation coefficients (normalized autocorrelation coefficient) may take advantage of a gain of the pitch filter, in addition to the normalization used to normally process the periodicity in the speech codec.

상기와 같이 가중 합산된 신호는 고역 통과 필터(137d)를 통해 필터링되고, 2배로 다운 샘플링(137e)되어 고대역에 관한 신호가 추정되어 출력되게 된다. The weighted sum signal as described above is filtered through a high-pass filter (137d), 2-fold down the sampling (137e) and is to be output signal is estimated on the band.

이와 같이, 본 발명에서는 대역 확장을 위해 스펙트럴 폴딩 기법 및 비선형화 기법을 함께 적용함으로써 개선된 대역 확장이 가능하다. In this way, according to the present invention can be improved by applying extension band with a spectral folding method, and non-linear Technique for bandwidth extension.

다시 도 2를 참조하면, 상기 추정된 고대역 음성 신호의 스펙트럼 포락선을 조정하는 부분(B)은 제 1,2 이산 여현 변환부(131,139), 제 1,2 켑스트럴(cepstral) 계수 추출부(132,140), 매핑부(133) 및 포락선 조정부(141)를 포함한다. Referring back to Figure 2, part (B) for adjusting a spectral envelope of the estimated high-band speech signal has first and second DCT unit (131 139), the first and second host Kep barrels (cepstral) coefficient extractor (132 140), and a mapping unit 133, and an envelope adjustment section 141.

상기 제 1,2 이산 여현 변환부(Discrete Cosine Transform:DCT)(131,139)는 입력되는 시간 영역의 음성 신호를 주파수 영역으로 변환한다. The first and second DCT portions (Discrete Cosine Transform: DCT) (131,139) converts the audio signal of the input time domain to the frequency domain.

상기 켑스트럴 계수 추출부(132,140)는 상기 주파수 영역으로 변환된 음성 신호로부터 상기 음성 신호의 특징을 나타내는 켑스트럴 계수를 추출한다. The host Kep barrels coefficient extracting section (132 140) extracts the constructor Kep barrels coefficients that represent a feature of the audio signal from the audio signal converted to the frequency domain.

널리 알려진 바와 같이, MFCC(Mel-Frequency Cepstral Coefficients)는 음성인식 등의 분야에서 음성의 특징을 나타내는데 사용되는 계수이다. , MFCC (Mel-Frequency Cepstral Coefficients) As is well known is a coefficient used for indicating the characteristics of the speech in the field of speech recognition. 본 발명에서는 상기 MFCC를 변형한 선형 주파수 켑스트럴 계수(Linear-Frequency Cepstral Coefficient, 이하 "LFCC"라 한다.)를 이용하여 음성 신호의 특징을 추출한다. In the present invention, it extracts the characteristic of the speech signal using the linear frequency Kep host barrels coefficients (Linear-Frequency Cepstral Coefficient, hereinafter "LFCC" d) deforming the MFCC. 본 발명에서는 선형 스케일 주파수 대역을 사용하기 때문에, 종래의 멜(Mel)-스케일 단위를 이용하는 MFCC와 구별하여 LFCC라고 명명한 선형 주파수 켑스트럴 계수를 이용하여 음성 신호의 특징을 나타낸다. According to the present invention because it uses a linear scale frequency band, conventional enamel (Mel) - using the MFCC and distinct from the use of a linear frequency scale unit named as LFCC Kep host barrels coefficient indicates the characteristics of the speech signal.

또한, 본 발명에서는 상기 LFCC를 추출함에 있어서 이산 푸리에 변환/고속 푸리에 변환(Discrete Fourier Transform/Fast Fourier Transform: DFT/FFT) 대신에 DCT를 이용할 수 있다. In the present invention, DFT / FFT as in extracting the LFCC: can be used in place of DCT (Discrete Fourier Transform / Fast Fourier Transform DFT / FFT). 이는 상기 DCT가 상기 DFT/FFT에 비하여 더 저렴하게 구현될 수 있기 때문이다. This is because it may be cheaper to implement than is the DCT the DFT / FFT.

또한, 본 발명에 사용되는 스펙트럴 윈도우를 나타낸 도 4를 참조하면, 상기 LFCC를 추출하는 과정에 이용되는 스펙트럴 윈도우는 첫 번째 및 마지막이 평평한 에지(edge)를 갖는다. Also, Referring to Figure 4 showing the spectral window for use in the present invention, the spectral window for use in the process of extracting the LFCC has a first end and a flat edge (edge). 이러한 스펙트럴 윈도우 형태는 종래의 MFCC/LFCC에 이용되는 윈도우에 비하여 개선된 스펙트럴 포락선 조정을 가능하게 한다. The spectral window shape enables the spectral envelope adjustment improved as compared to the window to be used in a conventional MFCC / LFCC.

전술한 상기 이산 여현 변환부(131,139) 및 상기 켑스트럴 계수 추출부(132,140)는 각각 입력 음성 신호의 특징을 파악하여 협대역 음성 신호로부터 매핑되는 고대역 음성 신호의 검색 및 상기 고대역 추정부(136)으로부터 추정된 고대역 음성 신호의 특징을 얻는데 사용된다. The above-mentioned transform the DCT unit (131 139) and the Kep host barrels coefficient extracting section (132 140) the detection and the high-band estimation of high-band speech signal is mapped from the narrow-band speech signal to identify the characteristics of the respectively input audio signal and the estimated from 136 is used to obtain the characteristics of the band speech signal.

구체적으로는, 입력단과 연결된 제 1 이산 여현 변환부(131)는 입력 협대역 음성 신호를 주파수 영역으로 변환하고, 제 1 켑스트럴 계수 추출부(132)는 상기 주파수 영역으로 변환된 음성 신호로부터 상기 음성 신호의 특징을 나타내는 LFCC를 출력한다. Specifically, the first DCT unit 131 connected to the input stage converts the input narrow-band speech signal into a frequency domain, and the first Kep host barrels coefficient extracting unit 132 from the audio signal converted to the frequency domain outputs LFCC indicating a feature of said speech signal.

상기 제 1 켑스트럴 계수 추출부(132)에서 출력되는 LFCC를 이용하여, 상기 매핑부(133)는 미도시된 소정의 테이블로부터 입력된 협대역 음성 신호에 대응되는 고대역 음성 신호를 검색한다. Using LFCC output from the first Kep host barrels coefficient extracting unit 132, the mapping unit 133 retrieves the high-band speech signal corresponding to the narrow-band speech signal input from a predetermined table not shown . 상기 매핑부(133)에 내장되는 테이블에는 벡터 양자화기 등을 이용하여 미리 협대역 음성 신호에 대응되는 고대역 음성 신호가 훈련되어 저장된다. Table to be embedded in the mapping section 133 is a vector quantizer, such as by using a narrow band is previously stored in the high-band speech signal corresponding to the training speech signal.

한편, 상기 고대역 추정부(136)에서 추정된 고대역 음성 신호는 상기 제 2 이산 여현 변환부(139)에서 주파수 영역으로 변환되고, 제 2 켑스트럴 계수 추출부(140)에서는 상기 추정된 고대역 음성 신호의 특징을 나타내는 LFCC를 출력한다. On the other hand, the above and is converted to the frequency domain in a band estimating unit 136, the high-band speech signal and the second DCT unit 139 estimated by the second Kep the host barrels coefficient extracting unit 140, the estimated outputs LFCC indicating a feature of a high-band speech signal.

상기 포락선 조정부(141)는 상기 매핑부(133)에서 출력된 고대역 음성 신호에 상기 추정된 고대역 음성 신호의 스펙트럼이 매칭될 수 있도록, 상기 추정된 고대역 음성 신호의 스펙트럼을 조정한다. The envelope adjustment section 141 so that the spectrum of the estimated high-band speech signal to the high-band speech signal output from the mapping unit 133 can be matched to adjust the spectrum of the estimated high-band speech signal.

상기 포락선 조정부(141)에서 조정된 주파수 영역의 고대역 음성 신호는 역이산 여현 변환부(Inverse Discrete Cosine Transform:IDCT)(142)에서 시간 영역 신호로 변환되어 최종적으로 4~8(KHz) 대역의 고대역 음성 신호를 출력한다. In the frequency domain adjusted by the envelope adjustment section 141, the high-band speech signal is inverse discrete cosine transform unit: is converted into a time domain signal in the (Inverse Discrete Cosine Transform IDCT), (142), and finally 4 ~ 8 (KHz) of the band and it outputs a high-band speech signal.

도 5는 본 발명에 따른 음성 신호의 대역 확장 방법을 나타낸 플로우 차트이다. 5 is a flow chart illustrating a bandwidth extension method for audio signal in accordance with the present invention.

도 5를 참조하면, 본 발명에 따른 음성 신호의 대역 확장 방법은 크게 입력되는 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 단계(200) 및 미리 훈련되어 저장된 상기 입력 협대역 음성 신호에 대응되는 고대역 음성 신호의 정보를 이용하여 상기 추정된 고대역 음성 신호의 포락선을 조정하는 단계(250)로 나뉜다. 5, the bandwidth extension method for audio signal according to the invention is significantly input narrow band is step 200 and the pre-training for estimating a high-band speech signal from the speech signal corresponding to the input narrow-band speech signal is stored which a high-band divided using the information of the audio signal in step 250 to adjust the envelope of the estimated high-band speech signal.

먼저, 상기 고대역 음성 신호를 추정하기 위하여, 상기 피치 필터(134) 및 피치 인버스 필터(134)를 이용하여 피치 정보를 획득하고, 협대역 음성 신호에 포함된 피치 성분을 제거하여 피치를 평탄화한다(단계 202). First, the high to obtain a band speech signal pitch information using the pitch filter 134 and pitch inverse filter 134 to estimate and remove the pitch component contained in the narrow-band speech signal, and smooths the pitch (step 202).

다음, 상기 피치 성분이 제거된 협대역 음성 신호를 이용하여, 상기 스펙트럴 폴딩부(137)는 업샘플링, 고역 통과 필터를 이용한 필터링 및 다운샘플링 과정 을 순차적으로 수행하여 원래의 신호에 대칭적인 스펙트럼 성분을 갖는 신호를 출력하고, 상기 비선형화부(138)는 업샘플링, 비선형화, 고역 통과 필터를 이용한 필터링, 및 다운 샘플링 과정을 수행함으로써 비선형화된 신호를 출력하며, 상기 스펙트럴 폴딩부(137) 및 비선형화부(138)에서 출력되는 신호가 선형적으로 결합되어 입력되는 협대역 음성 신호에 의하여 고대역 음성 신호가 추정된다(단계 204). Next, using the said pitch component is removed narrow-band speech signal, it said spectral folding portion 137 is up-sampled, to perform filtering and down-sampling process using a high-pass filter in order symmetrical spectrum to the original signal outputting a signal having a component, and the non-linear conversion unit 138 up-sampling, non-linearity, filtering using a high-pass filter, and by performing a down-sampling process, and outputs the non-linearity signal, the spectral folding portion (137 ) and the high-band speech signal by a narrow-band speech signal in which a signal is input is coupled to the linear output from the nonlinear conversion unit 138 is estimated (step 204).

다음, 상기 추정된 고대역 음성 신호를 더욱 정확하게 수정하기 위한 과정을 살펴보면, 먼저 입력되는 협대역 음성 신호를 주파수 영역으로 변환하고, 전술한 바와 같이 상기 협대역 음성 신호의 특징을 나타내는 LFCC를 추출한다. Next, look at the estimated high-band process to more accurately correct the sound signal, converts the narrow-band speech signal is first input into the frequency domain, extracts the LFCC indicating the characteristics of the narrow-band speech signal as described above, . 상기 매핑부(133)에서는 상기 LFCC 정보와 미리 훈련되어 소정의 테이블에 저장된 상기 입력 협대역 음성 신호에 대응되는 고대역 음성 신호에 관한 LFCC 정보를 상기 포락선 조정부(141)로 출력한다(단계 254). The mapping in the portion 133 is pre-trained with the LFCC information and outputs it to the high band above the LFCC information envelope adjustment section 141 of the audio signal corresponding to the input narrow-band speech signal is stored in a predetermined table (step 254) .

상기 포락선 조정부(141)는 상기 고대역 추정부(136)에서 추정된 고대역 음성 신호의 스펙트럼을 상기 매핑부(133)에서 출력되는 LFCC 정보를 이용하여 상기 매핑부(133)의 고대역 음성 신호에 매칭될 수 있도록 조정하여, 고대역 음성 신호의 스펙트럴 포락선을 조정한다(단계 256). The envelope adjustment section 141 is high-band speech signal of the high-band estimation unit 136, the mapping unit 133 using the LFCC information output from the mapping unit 133, the spectrum of the high-band speech signal estimate from adjusted so as to be matched to, and adjusts the spectral envelope of the highband speech signal (step 256).

전술한 단계들에 의하여 추정 및 조정 과정을 거친 고대역 음성 신호는 역이산변환부에 의하여 시간영역으로 변환되어 출력되고, 상기 도 1을 참조하여 설명한 바와 같이, 저대역 음성 신호와 결합되어 최종적으로 0~8(KHz)의 대역을 갖는 광대역 신호가 출력된다. Rough estimates and the adjustment process by the above-described step-band speech signal by the inverse discrete transformation unit and the output is converted to the time domain, as described with reference to FIG 1, in combination with the low-band speech signal and finally a wideband signal having a bandwidth of 0 ~ 8 (KHz) are output.

이와 같이, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발 명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. Thus, one of ordinary skill in the art will appreciate that it can be implemented without departing from the person to the essential characteristics of the invention in a modified form. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. The exemplary embodiments should be considered in a descriptive sense only and not for purposes of limitation. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다. The scope of the invention, not by the detailed description given in the appended claims, and all differences within the equivalent scope will be construed as being included in the present invention.

전술한 바와 같은 본 발명에 의하면, 스펙트럴 폴딩 기법과 비선형화 기법을 이용하여 협대역 음성 신호로부터 고대역 음성신호를 추정하여 효과적으로 음성 신호의 대역을 확장할 수 있다. According to the present invention as described above, the spectral folding method and by using a non-linear Technique narrowband band of the speech signal by estimating the high-band speech signal from the speech signal it can be effectively extended.

또한, 본 발명은 통신 시스템의 수신측에 사용되어 향상된 품질의 음성 신호를 제공할 수 있다. In addition, the present invention is used on the receiving side of the communication system can provide a speech signal of improved quality.

Claims (5)

  1. 협대역 음성 신호의 대역 확장 장치에 있어서, In bandwidth extension unit of the narrow-band speech signal,
    스펙트럴 폴딩 기법 및 비선형화 기법을 이용하여 상기 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 수단; Spectral means using the folding technique and a non-linear Technique for estimating a high-band speech signal from the narrow-band speech signal; And
    상기 추정된 고대역 음성 신호의 스펙트럼 포락선을 조정하는 수단을 포함하는 음성 신호의 대역 확장 장치. Bandwidth extension unit of the audio signal comprises means for adjusting the spectral envelope of the estimated high-band speech signal.
  2. 제 1항에 있어서, According to claim 1,
    상기 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 수단은, It means for estimating a high-band speech signal from the narrow-band speech signal,
    상기 협대역 음성 신호를 업샘플링, 고역 통과 필터를 이용한 필터링, 및 다운 샘플링 과정을 수행하여 상기 협대역 음성 신호에 대하여 미러 대칭적인 스펙트럼 성분을 갖는 신호를 출력하는 스펙트럴 폴딩부; Spectral folding unit that performs the up-sampling the narrowband speech signal, filtered using a high pass filter, and downsampling process, and outputs a signal having a mirror symmetrical spectral components with respect to the narrow-band speech signal; And
    상기 협대역 음성 신호를 비선형화하는 비선형화부를 구비하고, 상기 스펙트럴 폴딩부 및 상기 비선형화부의 출력 신호를 선형적으로 결합하여 상기 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 것을 특징으로 하는 음성 신호의 대역 확장 장치. Having a non-linear conversion unit which non-linearity for the narrowband speech signal, said spectral folding unit and wherein estimating the high-band speech signal to an output signal from a linearly the narrow-band speech signal in conjunction with the non-linear conversion unit bandwidth extension unit of the audio signal.
  3. 제 1항에 있어서, According to claim 1,
    상기 추정된 고대역 음성 신호의 스펙트럼 포락선을 조정하는 수단은, It means for adjusting the spectral envelope of the estimated high-band speech signal,
    미리 훈련된 소정의 테이블을 이용하여 상기 협대역 음성 신호에 대응되는 고대역 음성 신호를 출력하는 매핑부; By using a predetermined table mapping the pre-training unit for outputting the high-band speech signal corresponding to the narrow-band speech signal; And
    상기 매핑부에서 출력되는 고대역 음성 신호에 일치되도록 상기 추정된 고대역 음성 신호의 스펙트럼을 조정하는 포락선 조정부를 포함하는 것을 특징으로 하는 음성 신호의 대역 확장 장치. Bandwidth extension unit of the audio signal comprising the envelope adjustment section for adjusting the spectrum of the estimated high-band speech signal to match the high-band speech signal output from the mapping unit.
  4. 제 3항에 있어서, 4. The method of claim 3,
    상기 매핑부 및 포락선 조정부는 선형 주파수 켑스트럴 계수(LFCC)에 의하여 제공되는 음성 신호의 특징을 이용하는 것을 특징으로 하는 음성 신호의 대역 확장 장치. Bandwidth extension unit of the audio signal, characterized in that using the characteristic of the audio signal to which the mapping unit and the envelope adjuster is provided by a linear frequency Kep host barrels coefficient (LFCC).
  5. 협대역 음성 신호의 대역을 확장하는 방법에 있어서, A method for extending the band of the narrowband speech signal,
    상기 협대역 음성 신호의 피치 성분을 제거하고, 스펙트럴 폴딩 및 비선형화 기법을 이용하여 상기 피치 성분이 제거된 협대역 음성 신호로부터 고대역 음성 신호를 추정하는 단계; Removing a pitch component of the narrow-band speech signal, and estimating the spectral folding and non-linearity high-band speech signal from a narrowband speech signal and the pitch component is removed by using the method; And
    상기 협대역 음성 신호의 선형 주파수 켑스트럴 계수(LFCC)를 추출하여, 상기 협대역 음성 신호에 대응되는 고대역 음성신호를 검색하고, 상기 검색된 고대역 음성신호에 일치되도록 상기 추정된 고대역 음성 신호의 스펙트럴 포락선을 조정하는 단계를 포함하는 음성 신호의 대역 확장 방법. The narrow-band high-band the estimated high-band to search for a voice signal, and the searched and matched in-band speech signal corresponding to a linear frequency Kep host barrels extracts the coefficients (LFCC), the narrow-band speech signal of the speech signal sound band expansion methods of the audio signal includes adjusting a spectral envelope of the signal.
KR20050006096A 2005-01-22 2005-01-22 Method and apparatus for bandwidth extension of speech KR100708121B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20050006096A KR100708121B1 (en) 2005-01-22 2005-01-22 Method and apparatus for bandwidth extension of speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20050006096A KR100708121B1 (en) 2005-01-22 2005-01-22 Method and apparatus for bandwidth extension of speech

Publications (2)

Publication Number Publication Date
KR20060085118A true true KR20060085118A (en) 2006-07-26
KR100708121B1 KR100708121B1 (en) 2007-04-16

Family

ID=37174950

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20050006096A KR100708121B1 (en) 2005-01-22 2005-01-22 Method and apparatus for bandwidth extension of speech

Country Status (1)

Country Link
KR (1) KR100708121B1 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011128723A1 (en) * 2010-04-12 2011-10-20 Freescale Semiconductor, Inc. Audio communication device, method for outputting an audio signal, and communication system
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US8463412B2 (en) 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8527283B2 (en) 2008-02-07 2013-09-03 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
WO2015065137A1 (en) * 2013-11-02 2015-05-07 삼성전자 주식회사 Broadband signal generating method and apparatus, and device employing same

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
KR100503415B1 (en) * 2002-12-09 2005-07-22 한국전자통신연구원 Transcoding apparatus and method between CELP-based codecs using bandwidth extension

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US8527283B2 (en) 2008-02-07 2013-09-03 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US8463412B2 (en) 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
WO2011128723A1 (en) * 2010-04-12 2011-10-20 Freescale Semiconductor, Inc. Audio communication device, method for outputting an audio signal, and communication system
WO2015065137A1 (en) * 2013-11-02 2015-05-07 삼성전자 주식회사 Broadband signal generating method and apparatus, and device employing same

Also Published As

Publication number Publication date Type
KR100708121B1 (en) 2007-04-16 grant

Similar Documents

Publication Publication Date Title
US6691090B1 (en) Speech recognition system including dimensionality reduction of baseband frequency signals
US6768979B1 (en) Apparatus and method for noise attenuation in a speech recognition system
US7949522B2 (en) System for suppressing rain noise
US6199041B1 (en) System and method for sampling rate transformation in speech recognition
Kanedera et al. On the relative importance of various components of the modulation spectrum for automatic speech recognition
US6925116B2 (en) Source coding enhancement using spectral-band replication
Ris et al. Assessing local noise level estimation methods: Application to noise robust ASR
US7035797B2 (en) Data-driven filtering of cepstral time trajectories for robust speech recognition
US20050096917A1 (en) Methods for improving high frequency reconstruction
US20010044722A1 (en) System and method for modifying speech signals
Chennoukh et al. Speech enhancement via frequency bandwidth extension using line spectral frequencies
US6182035B1 (en) Method and apparatus for detecting voice activity
US20080126081A1 (en) Method And Device For The Artificial Extension Of The Bandwidth Of Speech Signals
US6988066B2 (en) Method of bandwidth extension for narrow-band speech
US20030093279A1 (en) System for bandwidth extension of narrow-band speech
US20100246849A1 (en) Signal processing apparatus
US20080140396A1 (en) Model-based signal enhancement system
US20090201983A1 (en) Method and apparatus for estimating high-band energy in a bandwidth extension system
US20060293016A1 (en) Frequency extension of harmonic signals
US6751588B1 (en) Method for performing microphone conversions in a speech recognition system
US20050004803A1 (en) Audio signal bandwidth extension
US8249861B2 (en) High frequency compression integration
US6173258B1 (en) Method for reducing noise distortions in a speech recognition system
US20050267739A1 (en) Neuroevolution based artificial bandwidth expansion of telephone band speech
US20100198588A1 (en) Signal bandwidth extending apparatus

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment
FPAY Annual fee payment
FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee