KR100474826B1 - 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 - Google Patents
음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 Download PDFInfo
- Publication number
- KR100474826B1 KR100474826B1 KR1019980016629A KR19980016629A KR100474826B1 KR 100474826 B1 KR100474826 B1 KR 100474826B1 KR 1019980016629 A KR1019980016629 A KR 1019980016629A KR 19980016629 A KR19980016629 A KR 19980016629A KR 100474826 B1 KR100474826 B1 KR 100474826B1
- Authority
- KR
- South Korea
- Prior art keywords
- subband
- power spectrum
- meteorization
- degree
- frequency
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/937—Signal energy in various frequency bands
Abstract
본 발명은 음성 부호화기에서의 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법 및 그 장치를 개시한다. 음성 부호화기에서의 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법은, (a) 입력 음성신호에 대해 윈도우를 적용하고, 윈도윙된 신호를 푸리에 변환하여 얻은 음성 스펙트럼으로부터 파워 스펙트럼을 구하는 단계, (b) 파워 스펙트럼을 소정 개수의 부밴드로 분할한 후에, 각 부밴드에 대해 원점으로 주파수를 이동시키는 단계, (c) 원점으로 주파수 이동된 파워 스펙트럼을 역푸리에 변환하여 부밴드별로 자기 상관치를 구하는 단계 및 (d) 자기 상관치를 각각 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 단계를 구비하는 것을 특징으로 한다.
Description
본 발명은 음성 부호화기에서 사용되는 유성화도 측정방법에 관한 것으로서, 특히, 자기상관 방식에 근거하여 유성화도를 결정하는, 음성 부호화기에서의 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법 및 그 장치에 관한 것이다.
일반적으로, 저비트율의 음성 부호화기(또는 보코더(vocoder))에서는 음성을 피치(pitch), 유성화도 및 성도계수 등으로 나타내는데, 피치와 유성화도는 여기신호로, 성도계수는 전달함수로서 모델링한다. 여기서, 유성화도는 음성신호에 유성음이 포함되는 정도를 나타내며, 음성을 표현하는데 중요한 파라미터들중 하나로서, 음성 부호화기를 거친 음성의 음질을 결정하는데 상당한 부분을 차지한다. 따라서, 음성 부호화기에 사용되는 유성화도 측정방법은 많은 연구 대상이 되어왔다. 전통적으로 유성화도는 단순하게 전 대역에 대해 유성 또는 무성으로 결정하였다. 이는 LPC10:DoD 2.4 kbit/s 표준 음성 부호화기에 채택되었는데, 이와같이 이분적으로 유성화도를 결정하는 것은 음성 부호화기의 음질을 크게 저하시키는 원인이 되었다. 근래에는 음질을 상당히 많이 개선시킨 개선된 방법이 사용되고 있다. 예컨대, 다중 밴드 여기(MiltiBand Excitation, 이하 MBE라 칭함) 보코더에서는 음성의 주파수 대역에서 전 대역을 소정 개수의 부밴드(subband)로 분할하고, 각 부밴드에 대해 이분적으로 유성/무성(voice/unvoice)을 결정하는 방식을 채택한다. 또한, 정현파 변환 코더(Sinusoidal Transform Coder, 이하 STC라 칭함)에서는 분석신호의 주기적 강도를 측정하여 이를 0과 1 사이의 값으로 표현하고, 이 강도에 따라 저역 주파수의 밴드는 유성으로 하고, 고역 주파수의 강도는 무성으로 결정하는 방식을 채택한다.
부밴드별로 유성화도를 다르게 표현하는 방식은 공지의 기술로 널리 알려져 있으며, 다음과 같이 몇가지 방식으로 정리할 수 있다.
첫번째로, 전술한 MBE 보코더 방식이 있다. MBE 보코더에서는 전 밴드가 유성음이라는 가정하에 모델링을 통해 얻어진 합성한 스펙트럼과 원 스펙트럼간의 차의 자승을 해당 밴드에서 합한 값을 정규화한 후에, 미리 설정된 임계치들과 비교하여 해당 밴드가 유성/무성인지를 결정한다. 두번째로, STC 방식이 있다. MBE 보코더 방식이 스펙트럼상에서 유성화도를 결정하는데 반해, STC 방식에서는 시간축 신호에서 피치 간격의 합성된 주기신호와 원 신호간의 차의 자승의 합을 정규화하여 구한 후에, 미리 설정된 임계치들과 비교하여 유성/무성의 차단 주파수를 결정한다. 차단 주파수 미만의 스펙트럴 밴드는 유성이고, 그 이상은 무성으로 판단된다. 위의 두가지 방식은 주파수 또는 시간축에서 원 신호(또는 스펙트럼)와 합성 신호(또는 스펙트럼)간의 차의 값을 임계치와 비교하여 부밴드별로 유성화도를 결정하는 것을 특징으로 한다.
세번째로, 시간 포락선(Time envelope) 신호의 자기상관 방식이 있다. 이 방식은 고주파수 부밴드에서 견고한 자기 상관치 계산을 위해 음성 신호를 밴드패스 필터링하고, 필터링된 신호의 시간 포락선을 추정하고, 추정된 신호로부터 정규화된 자기 상관치를 계산한다. 이 자기 상관치에 근거하여 각 스펙트럴 부밴드의 유성화도를 결정한다. 네번째로, 업샘플링(upsampling) 신호의 자기상관 방식이 있다. 이 방식은 마찬가지로 음성 신호를 부밴드별로 분할하고, 고주파수 밴드에 대해서는 업샘플링을 함으로써 시간 분해능을 보상한다. 이와같이 업샘블링된 신호로부터 정규화된 자기 상관치를 구하고, 이 값에 근거하여 유성화도를 결정한다.
위의 두가지 방식은 특히, 자기상관법(autocorrelation)에 근거하여 부밴드별로 유성화도를 결정하는 것을 특징으로 한다. 이는 즉, 음성의 유성화도가 높을 수록 자기 상관치가 크다는 점에 근거한다. 여기서, 특히 자기 상관치를 계산하는데 에러가 많이 발생하는 고주파수 부밴드에서 자기 상관치를 어떻게 계산할 것인가는 중요한 관건이 된다.
본 발명이 이루고자하는 기술적 과제는, 주파수 이동법을 이용한 자기상관 방식에 근거하여, 부밴드별로 주파수를 원점으로 이동시킨 후에 자기 상관치를 구함으로써, 특히 고주파수 부밴드에서 효과적으로 자기 상관치를 구하며, 유성화도를 보다 견고하고 효율적으로 결정하는, 음성 부호화기에서의 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법을 제공하는데 있다.
본 발명이 이루고자하는 다른 기술적 과제는, 상기 방법을 수행하는 다중 밴드의 유성화도 결정장치를 제공하는데 있다.
상기 과제를 이루기 위하여, 음성 부호화기에서의 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법은,
(a) 입력 음성신호에 대해 윈도우를 적용하고, 윈도윙된 신호를 푸리에 변환하여 얻은 음성 스펙트럼으로부터 파워 스펙트럼을 구하는 단계, (b) 파워 스펙트럼을 소정 개수의 부밴드로 분할한 후에, 각 부밴드에 대해 원점으로 주파수를 이동시키는 단계, (c) 원점으로 주파수 이동된 파워 스펙트럼을 역푸리에 변환하여 부밴드별로 자기 상관치를 구하는 단계 및 (d) 자기 상관치를 각각 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 단계를 구비하는 것을 특징으로 한다.
상기 다른 과제를 이루기 위하여, 음성 부호화기에서의 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정장치는,
입력 음성신호에 대한 음성 스펙트럼으로부터 구해진 파워 스펙트럼을 소정 개수의 부밴드로 분할하는 밴드 분할부, 분할된 각 부밴드에 대해 원점으로 주파수를 이동시키는 주파수 이동부, 원점으로 주파수 이동된 파워 스펙트럼을 개선된 게젤의 역푸리에 방식으로 역푸리에 변환하여 부밴드별 자기 상관치를 구하는 역푸리에 변환부 및 자기 상관치를 각각 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 유성화도 결정부를 구비하는 것을 특징으로 한다.
이하, 본 발명에 의한 음성 부호화기에서의 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법 및 그 장치의 구성 및 동작을 첨부한 도면을 참조하여 다음과 같이 설명한다.
도 1은 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법을 설명하기 위한 플로우챠트이다.
도 2는 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정장치의 바람직한 실시예의 블럭도로서, 윈도잉부(200), 푸리에 변환부(210), 파워 스펙트럼 계산부(220), 밴드 분할부(230), 주파수 이동부(240 ~ 20B-1), 역푸리에 변환부(250 ~ 25B-1) 및 유성화도 결정부(260 ~ 26B-1)로 구성된다.
본 발명은 음성 부호화기 예컨대, 정현파 보코더에서 다중 밴드의 각 부밴드별로 유성/무성을 결정하고자 할때, 자기상관법에 근거하는데 고주파수의 밴드를 원점으로 이동한 후에 자기 상관치를 계산하므로, 고주파수 대역에 대해서도 효율적으로 유성화도를 결정하게 된다.
도 1 및 도 2를 참조하여 구체적으로 설명하면, 먼저 입력 음성신호에 대해 윈도우를 적용하고, 윈도윙된 신호를 푸리에 변환하여 얻은 음성 스펙트럼으로부터 파워 스펙트럼을 구한다(제100단계).
입력 음성신호(s(n), n=0,1,...N-1)를 주파수축에서 분석하기 위해 먼저, 윈도우(w(n))가 적용된다. 바람직하게, 윈도우는 해밍(Hamming) 윈도우(w(n))가 사용된다. 도 2에서, 윈도윙부(200)는 입력단자 IN을 통해 입력된 음성신호(s(n))를 s(n)w(n)(n=0,1,...N-1)하여 윈도윙된 신호(sw(n))로 출력한다. 푸리에 변환부(210)는 윈도윙된 신호(sw(n))를 주파수축으로 변환하기 위해서 푸리에 변환을 한다. 여기서, 푸리에 변환방식으로서 계산의 효율을 위해 바람직하게, M-포인트 고속 푸리에 변환방식(Fast Fourier Transform)을 사용한다. 파워 스펙트럼 계산부(220)는 푸리에 변환에 의한 음성의 스펙트럼(S(ω))으로부터 파워 스펙트럼(P(ω))을 계산한다. 즉, P(ω)=|S(ω)|2(ω=0,1,...,M/2)가 된다.
제100단계 후에, 파워 스펙트럼을 소정 개수의 부밴드로 분할한 후에, 각 부밴드에 대해 원점으로 주파수를 이동시킨다(제110단계).
밴드 분할부(230)는 파워 스펙트럼 계산부(220)에서 계산된 파워 스펙트럼(P(ω))을 구하고자하는 B개(여기서, B는 자연수)의 부밴드(subband)로 분할(decomposition)한다. 분할 후에, b-번째(b = 0,1,...,B-1) 부밴드에 대해서 유성화도를 결정하기 위해 본 발명에서는 특징적으로 주파수 이동법을 이용한다. B개의 부밴드로 분할한 후에, 밴드0 ~ 밴드B-1는 각각에 해당하는 주파수 이동부(240 ~ 24B-1)에서 원점으로 주파수 이동된다. 원점으로 주파수 이동된 b-번째 파워 스펙트럼(Pb(ω))은 바람직하게 다음 수학식 1을 이용하여 계산될 수 있다.
여기서, T는 피치를 나타내고, M은 푸리에 변환부(210)에서 M-포인트 고속 푸리에 변환방식으로 푸리에 변환할때 그때의 M-포인트에 해당한다. 피치(T)는 공지된 방법을 이용하여 구할 수 있다. 실제로, 파워 스펙트럼부(220)로부터 출력된 파워 스펙트럼(P(ω))은 수학식 1에 의해 B개의 부밴드로 분할되면서 원점으로 주파수가 이동된다. 수학식 1에 따라서, 주파수축에서 부밴드는 단순히 일정 간격으로 분할되지 않고, 소정 구간에서 진폭의 정점을 찾아 그 점을 기준으로 분할되며, 만큼 원점으로의 이동량을 갖는다.
제110단계 후에, 원점으로 주파수 이동된 파워 스펙트럼을 바람직하게, 개선된 게젤 방식으로 역푸리에 변환하여 각 부밴드별로 자기 상관치를 구한다(제120단계).
일반적으로, 파워 스펙트럼을 역푸리에 변환하면 자기 상관치가 된다. 그러나, 실상 역푸리에 변환으로부터 필요한 값은 래그(lag)가 0인 경우의 자기 상관치와, 래그가 피치(T)인 경우의 자기 상관치이다. 일반적인 푸리에 변환(예컨대, DFT,FFT)을 하면, 전 래그에 대해 값이 구해지므로, 역푸리에 변환시에 계산량이 많아지는 문제점이 있다. 게젤(Goertzel)의 역푸리에 변환은 주어진 한개의 포인트에 대해서 푸리에 변환을 할때 적은 계산량으로 구할 수 있는 이점이 있다. 본 발명에서는 이러한 게젤의 역푸리에 변환을 더욱 개선하여 보다 효율적으로 계산량을 줄이고자한다.
게젤의 방식으로 역푸리에 변환을 할때, 본 발명에서 자기 상관치를 구하고자하는 경우는 파워 스펙트럼에 대해서 적용되는 경우이며, 파워 스펙트럼은 허수부(imaginary part)가 0이고, 실수부(real part)가 대칭적인(symmetric) 특징이 있다. 이러한 특징으로부터, 래그가 피치(T)인 경우에 자기 상관치(Rb(T))는 바람직하게 다음 수학식 2와 같이 개선된 게젤의 역푸리에 변환방식을 이용하여 계산될 수 있다.
여기서, T는 피치를 나타내고, M은 푸리에 변환부(210)에서 M-포인트 고속 푸리에 변환방식으로 푸리에 변환할때 그때의 M-포인트에 해당한다. Rb(T) 이하의 수식들은 게젤의 역푸리에 변환 방식에 따른 수식들을 나타낸다. 한편, 래그가 0인 경우의 자기 상관치(Rb(0))는 파시발(Parseval)의 정리에 의해서 다음 수학식 3과 같이 계산될 수 있다.
도 2에서, 각 부밴드에 대해 역푸리에 변환부(250 ~ 25B-1)는 각각의 파워 스펙트럼(P0(ω) ~ PB-1(ω))을 개선된 게젤 방식으로 역푸리에 변환하여 부밴드별로 래그가 피치(T)인 경우의 자기 상관치(R0(T) ~ RB-1(T))와, 래그가 0인 경우의 자기 상관치(R0(0) ~ RB-1(0))를 각각 구한다.
제120단계후에, 자기 상관치를 각각 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정한다(제130단계).
음의 무한대에서 양의 무한대 사이에 존재할 수 있는 b-번째 부밴드의 자기 상관치(Rb(T))를 -1과 1사이에 분포시키기 위해, 제120단계에서 구해진 자기 상관치들(Rb(T), Rb(0))로부터 정규화된 자기 상관치(Rb'(T))를 각 스펙트럴 부밴드에 대하여 구한다. 이때, 다음 수학식 4를 이용하여 계산될 수 있다.
정규화된 자기 상관치(Rb'(T))로부터 b-번째 부밴드의 유성화도(Vb)를 결정한다. 유성화(Vb)는 다음 수학식 5와 같이 나타낼 수 있다.
여기서, TH1, TH2는 실험을 통해 미리 정해진 0 과 1 사이의 임계치들로서, TH1은 상한 임계치를, TH2는 하한 임계치를 나타낸다. 이에 따라, Vb = 1 일때, b-번째 부밴드는 완전히 유성음임을 나타내고, Vb = 0 일때, 완전히 무성음임을 나타내고, 그렇지않은 경우에는 유성/무성 성분이 혼합되어 있는 것으로 판단하고, 그때의 값은 위의 식에서 나타낸 바와 같다. 도 2에서, 유성화도 결정부(260 ~ 26B-1)는 각 부밴드에 대해 자기 상관치들(R0(T) ~ RB-1(T), R0(0) ~ RB-1(0))로부터 정규화된 자기 상관치를 각각 구하고, 이 값에 근거하여 부밴드별 유성화도(V0 ~ VB-1)를 결정하여 출력단자 OUT0 ~ OUTB-1을 통해 각각 출력한다.
도 3 (a)~(d)는 본 발명과 종래의 방법을 비교하기 위한 시뮬레이션 결과를 나타내는 도면들이다.
본 발명에 대한 성능 실험을 도 3 (a)~(d)를 참조하여 설명한다. 도 3 (a)는 시간축의 원 음성신호를 나타내며, 이때의 샘플링 주파수는 8000Hz이다. 도 3 (b)는 고속 푸리에 변환한 파워 스펙트럼을 나타낸다. 이에 대해, 도 3 (c)는 밴드패스 필터링(밴드 : 2000 ~ 3000Hz)한 신호의 종래의 자기 상관치를 나타낸다. 여기서, "A"로 마크한 부분은 피치(T)에서의 자기 상관치를 나타내고, “*”로 마크한 부분은 피치(T)가 1만큼 틀리게 구해졌을 때, 자기 상관치의 변화가 매우 큼을 나타내고 있다. 도 3 (d)는 본 발명에 의해 얻어지는 자기 상관치를 나타낸다. 본 발명을 사용할 때, 원 피치("B"로 마크한 부분)에 대해 피치("*"로 마크한 부분)가 1 만큼 오류가 발생하더라도 자기 상관치의 변화가 매우 미미함을 확인할 수 있다. 즉, 만약 음성에 잡음이 섞여있을 때, 특히 고주파 대역에서는 피치가 국소적으로 틀린 값으로 구해질 수 있는데, 본 발명을 사용하면 잡음 환경하에서도 견고하게 자기 상관치를 구할 수 있음을 확인할 수 있다.
본 발명에 의한 유성화도 결정방법 및 장치에 따라 음질 성능이 개선된 음성 부호화기는 다음과 같은 분야에서 널리 적용될 수 있다. 디지탈 셀룰러폰용 음성 통신용 보코더, 개인 통신 시스템(PCS)용 음성 통신용 보코더, 음성 페이저에서 음성 메시지 전달용 음성 부호화기, 위성 통신용 보코더, 음성 사서함 시스템(VMS)용 보코더 및 음성 이메일(e-mail)용 보코더 등이 있으며, 이 밖에도 산업상으로 이용가능한 분야는 상당히 넓다.
이상에서 설명한 바와 같이, 본 발명에 의한 주파수 이동법을 이용한 유성화도 결정방법 및 그 장치는, 고주파수 부밴드에서 효과적으로 자기 상관치를 구하며, 유성화도를 보다 견고하고 효율적으로 결정하며, 또한 잡음 환경에서도 견고하게 자기 상관치를 구하는 이점이 있다.
도 1은 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법을 설명하기 위한 플로우챠트이다.
도 2는 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정장치의 바람직한 실시예의 블럭도이다.
도 3 (a)~(d)는 본 발명과 종래의 방법을 비교하기 위한 시뮬레이션 결과를 나타내는 도면들이다.
Claims (5)
- 음성 부호화기에서의 주파수 이동법을 이용한 유성화도 결정방법에 있어서,(a) 입력 음성신호에 대해 윈도우를 적용하고, 윈도윙된 신호를 푸리에 변환하여 얻은 음성 스펙트럼으로부터 파워 스펙트럼을 구하는 단계;(b) 상기 파워 스펙트럼을 소정 개수의 부밴드로 분할한 후에, 분할된 각 부밴드에 대한 파워 스펙트럼의 주파수를 원점으로 이동시키는 단계;(c) 원점으로 주파수 이동된 파워 스펙트럼을 역푸리에 변환하여 부밴드별로 자기 상관치를 구하는 단계; 및(d) 상기 부밴드별로 구하여진 상기 자기 상관치를 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 단계를 구비하는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정방법.
- 제1항에 있어서, 상기 (b) 단계에서, 상기 파워 스펙트럼(P(ω))을 B개(여기서, B는 자연수)의 부밴드로 분할한 후에, 원점으로 주파수 이동시킨 b-번째(b = 0 내지 B-1) 파워 스펙트럼(Pb(ω))은 다음 수학식 1을 이용하여 계산되며,여기서, T는 피치를 나타내고, M은 상기 (a) 단계에서 M-포인트 고속 푸리에 변환방식으로 푸리에 변환할 때 M-포인트에 해당하는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정방법.[수학식 1]
- 제1항에 있어서, 상기 (c) 단계에서, B개의 분할된 부밴드에 대해, 원점으로 주파수 이동된 b-번째 파워 스펙트럼(Pb(ω))의 상기 자기 상관치(Rb(T))는 다음 수학식 2와 같이 변형된 게젤의 역푸리에 변환 방식을 이용하여 계산되며,여기서, T는 피치를 나타내고, M은 상기 (a) 단계에서 M-포인트 고속 푸리에 변환방식으로 푸리에 변환할때 M-포인트에 해당하는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정방법.[수학식 2]
- 제3항에 있어서, 상기 (c) 단계에서 래그가 피치(T)인 경우의 자기 상관치(Rb(T))와 함께, 래그가 0인 경우의 자기 상관치(Rb(0))가 계산되며,상기 (d) 단계에서, 상기 자기 상관치들(Rb(T),Rb(0))로부터 정규화된 자기 상관치(Rb'(T))는 미리 정해진 상한 임계치보다 크면 유성음으로, 하한 임계치보다 작으면 무성음으로, 그렇지않은 경우에는 유성/무성 성분의 혼합으로 판단되어 각 부밴드별로 유성화도가 결정되는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정방법.
- 음성 부호화기에서의 주파수 이동법을 이용한 유성화도 결정장치에 있어서,입력 음성신호에 대한 음성 스펙트럼으로부터 구해진 파워 스펙트럼을 소정 개수의 부밴드로 분할하는 밴드 분할부;분할된 각 부밴드에 대한 파워 스펙트럼의 주파수를 원점으로 이동시키는 주파수 이동부;원점으로 주파수 이동된 파워 스펙트럼을 개선된 게젤의 역푸리에 방식으로 역푸리에 변환하여 부밴드별 자기 상관치를 구하는 역푸리에 변환부; 및상기 부밴드별로 구하여진 자기 상관치를 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 유성화도 결정부를 구비하는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정장치.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980016629A KR100474826B1 (ko) | 1998-05-09 | 1998-05-09 | 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 |
US09/296,242 US6233551B1 (en) | 1998-05-09 | 1999-04-22 | Method and apparatus for determining multiband voicing levels using frequency shifting method in vocoder |
JP11127369A JP2000003186A (ja) | 1998-05-09 | 1999-05-07 | 音声符号化器における周波数移動法を用いた多重バンドの有声化度決定方法及びその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980016629A KR100474826B1 (ko) | 1998-05-09 | 1998-05-09 | 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100474826B1 true KR100474826B1 (ko) | 2005-05-16 |
Family
ID=19537176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019980016629A KR100474826B1 (ko) | 1998-05-09 | 1998-05-09 | 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6233551B1 (ko) |
JP (1) | JP2000003186A (ko) |
KR (1) | KR100474826B1 (ko) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
US7246058B2 (en) * | 2001-05-30 | 2007-07-17 | Aliph, Inc. | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
US20070233479A1 (en) * | 2002-05-30 | 2007-10-04 | Burnett Gregory C | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors |
US8280072B2 (en) | 2003-03-27 | 2012-10-02 | Aliphcom, Inc. | Microphone array with rear venting |
US8019091B2 (en) | 2000-07-19 | 2011-09-13 | Aliphcom, Inc. | Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US7469206B2 (en) | 2001-11-29 | 2008-12-23 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US9066186B2 (en) | 2003-01-30 | 2015-06-23 | Aliphcom | Light-based detection for acoustic applications |
KR100527002B1 (ko) * | 2003-02-26 | 2005-11-08 | 한국전자통신연구원 | 음성 신호의 에너지 분포 특성을 고려한 쉐이핑 장치 및 방법 |
US9099094B2 (en) | 2003-03-27 | 2015-08-04 | Aliphcom | Microphone array with rear venting |
US8489392B2 (en) * | 2006-11-06 | 2013-07-16 | Nokia Corporation | System and method for modeling speech spectra |
US8503686B2 (en) | 2007-05-25 | 2013-08-06 | Aliphcom | Vibration sensor and acoustic voice activity detection system (VADS) for use with electronic systems |
US8494177B2 (en) | 2007-06-13 | 2013-07-23 | Aliphcom | Virtual microphone array systems using dual omindirectional microphone array (DOMA) |
US8180634B2 (en) * | 2008-02-21 | 2012-05-15 | QNX Software Systems, Limited | System that detects and identifies periodic interference |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR960030558A (ko) * | 1995-01-27 | 1996-08-17 | 김광호 | 음성신호 부호화 및 복호화 방법 |
KR960032295A (ko) * | 1995-02-28 | 1996-09-17 | 김광호 | 부프레임별 유/무성 대역 정보를 이용한 음성합성 방법 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5216747A (en) * | 1990-09-20 | 1993-06-01 | Digital Voice Systems, Inc. | Voiced/unvoiced estimation of an acoustic signal |
DE4316297C1 (de) * | 1993-05-14 | 1994-04-07 | Fraunhofer Ges Forschung | Frequenzanalyseverfahren |
AU696092B2 (en) * | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
GB2297465B (en) * | 1995-01-25 | 1999-04-28 | Dragon Syst Uk Ltd | Methods and apparatus for detecting harmonic structure in a waveform |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
JP3687181B2 (ja) * | 1996-04-15 | 2005-08-24 | ソニー株式会社 | 有声音/無声音判定方法及び装置、並びに音声符号化方法 |
-
1998
- 1998-05-09 KR KR1019980016629A patent/KR100474826B1/ko not_active IP Right Cessation
-
1999
- 1999-04-22 US US09/296,242 patent/US6233551B1/en not_active Expired - Lifetime
- 1999-05-07 JP JP11127369A patent/JP2000003186A/ja not_active Ceased
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR960030558A (ko) * | 1995-01-27 | 1996-08-17 | 김광호 | 음성신호 부호화 및 복호화 방법 |
KR960032295A (ko) * | 1995-02-28 | 1996-09-17 | 김광호 | 부프레임별 유/무성 대역 정보를 이용한 음성합성 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2000003186A (ja) | 2000-01-07 |
US6233551B1 (en) | 2001-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100474826B1 (ko) | 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 | |
EP0566131B1 (en) | Method and device for discriminating voiced and unvoiced sounds | |
EP2352145B1 (en) | Transient speech signal encoding method and device, decoding method and device, processing system and computer-readable storage medium | |
US8160732B2 (en) | Noise suppressing method and noise suppressing apparatus | |
EP1739657B1 (en) | Speech signal enhancement | |
EP1677088B1 (en) | Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof | |
KR101378696B1 (ko) | 협대역 신호로부터의 상위대역 신호의 결정 | |
US6996523B1 (en) | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system | |
US7013269B1 (en) | Voicing measure for a speech CODEC system | |
EP2416315B1 (en) | Noise suppression device | |
US20050108004A1 (en) | Voice activity detector based on spectral flatness of input signal | |
EP3336843A1 (en) | Speech coding method and speech coding apparatus | |
JPS63259696A (ja) | 音声予処理方法および装置 | |
JPH08272398A (ja) | 再生成位相情報を用いた音声合成 | |
EP0676744B1 (en) | Estimation of excitation parameters | |
EP1697927B1 (en) | Improved frequency-domain error concealment | |
US9530430B2 (en) | Voice emphasis device | |
EP2264700A1 (en) | Coding apparatus and decoding apparatus | |
US7917359B2 (en) | Noise suppressor for removing irregular noise | |
JP3191926B2 (ja) | 音響波形のコード化方式 | |
US8433562B2 (en) | Speech coder that determines pulsed parameters | |
KR20020057701A (ko) | 음성 신호에서의 유성화 확률 결정 장치 및 그 방법 | |
Webber et al. | Packet transmission of speech using variable‐quality coding and time‐interval modification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130115 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20140124 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20150116 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20160119 Year of fee payment: 12 |
|
LAPS | Lapse due to unpaid annual fee |