KR100474826B1 - 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 - Google Patents

음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 Download PDF

Info

Publication number
KR100474826B1
KR100474826B1 KR1019980016629A KR19980016629A KR100474826B1 KR 100474826 B1 KR100474826 B1 KR 100474826B1 KR 1019980016629 A KR1019980016629 A KR 1019980016629A KR 19980016629 A KR19980016629 A KR 19980016629A KR 100474826 B1 KR100474826 B1 KR 100474826B1
Authority
KR
South Korea
Prior art keywords
subband
power spectrum
meteorization
degree
frequency
Prior art date
Application number
KR1019980016629A
Other languages
English (en)
Inventor
조용덕
김무영
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1019980016629A priority Critical patent/KR100474826B1/ko
Priority to US09/296,242 priority patent/US6233551B1/en
Priority to JP11127369A priority patent/JP2000003186A/ja
Application granted granted Critical
Publication of KR100474826B1 publication Critical patent/KR100474826B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • G10L2025/937Signal energy in various frequency bands

Abstract

본 발명은 음성 부호화기에서의 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법 및 그 장치를 개시한다. 음성 부호화기에서의 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법은, (a) 입력 음성신호에 대해 윈도우를 적용하고, 윈도윙된 신호를 푸리에 변환하여 얻은 음성 스펙트럼으로부터 파워 스펙트럼을 구하는 단계, (b) 파워 스펙트럼을 소정 개수의 부밴드로 분할한 후에, 각 부밴드에 대해 원점으로 주파수를 이동시키는 단계, (c) 원점으로 주파수 이동된 파워 스펙트럼을 역푸리에 변환하여 부밴드별로 자기 상관치를 구하는 단계 및 (d) 자기 상관치를 각각 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 단계를 구비하는 것을 특징으로 한다.

Description

음성 부호화기에서의 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법 및 그 장치{Method and apparatus for deteminating multiband voicing levels using frequency shifting method in voice coder}
본 발명은 음성 부호화기에서 사용되는 유성화도 측정방법에 관한 것으로서, 특히, 자기상관 방식에 근거하여 유성화도를 결정하는, 음성 부호화기에서의 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법 및 그 장치에 관한 것이다.
일반적으로, 저비트율의 음성 부호화기(또는 보코더(vocoder))에서는 음성을 피치(pitch), 유성화도 및 성도계수 등으로 나타내는데, 피치와 유성화도는 여기신호로, 성도계수는 전달함수로서 모델링한다. 여기서, 유성화도는 음성신호에 유성음이 포함되는 정도를 나타내며, 음성을 표현하는데 중요한 파라미터들중 하나로서, 음성 부호화기를 거친 음성의 음질을 결정하는데 상당한 부분을 차지한다. 따라서, 음성 부호화기에 사용되는 유성화도 측정방법은 많은 연구 대상이 되어왔다. 전통적으로 유성화도는 단순하게 전 대역에 대해 유성 또는 무성으로 결정하였다. 이는 LPC10:DoD 2.4 kbit/s 표준 음성 부호화기에 채택되었는데, 이와같이 이분적으로 유성화도를 결정하는 것은 음성 부호화기의 음질을 크게 저하시키는 원인이 되었다. 근래에는 음질을 상당히 많이 개선시킨 개선된 방법이 사용되고 있다. 예컨대, 다중 밴드 여기(MiltiBand Excitation, 이하 MBE라 칭함) 보코더에서는 음성의 주파수 대역에서 전 대역을 소정 개수의 부밴드(subband)로 분할하고, 각 부밴드에 대해 이분적으로 유성/무성(voice/unvoice)을 결정하는 방식을 채택한다. 또한, 정현파 변환 코더(Sinusoidal Transform Coder, 이하 STC라 칭함)에서는 분석신호의 주기적 강도를 측정하여 이를 0과 1 사이의 값으로 표현하고, 이 강도에 따라 저역 주파수의 밴드는 유성으로 하고, 고역 주파수의 강도는 무성으로 결정하는 방식을 채택한다.
부밴드별로 유성화도를 다르게 표현하는 방식은 공지의 기술로 널리 알려져 있으며, 다음과 같이 몇가지 방식으로 정리할 수 있다.
첫번째로, 전술한 MBE 보코더 방식이 있다. MBE 보코더에서는 전 밴드가 유성음이라는 가정하에 모델링을 통해 얻어진 합성한 스펙트럼과 원 스펙트럼간의 차의 자승을 해당 밴드에서 합한 값을 정규화한 후에, 미리 설정된 임계치들과 비교하여 해당 밴드가 유성/무성인지를 결정한다. 두번째로, STC 방식이 있다. MBE 보코더 방식이 스펙트럼상에서 유성화도를 결정하는데 반해, STC 방식에서는 시간축 신호에서 피치 간격의 합성된 주기신호와 원 신호간의 차의 자승의 합을 정규화하여 구한 후에, 미리 설정된 임계치들과 비교하여 유성/무성의 차단 주파수를 결정한다. 차단 주파수 미만의 스펙트럴 밴드는 유성이고, 그 이상은 무성으로 판단된다. 위의 두가지 방식은 주파수 또는 시간축에서 원 신호(또는 스펙트럼)와 합성 신호(또는 스펙트럼)간의 차의 값을 임계치와 비교하여 부밴드별로 유성화도를 결정하는 것을 특징으로 한다.
세번째로, 시간 포락선(Time envelope) 신호의 자기상관 방식이 있다. 이 방식은 고주파수 부밴드에서 견고한 자기 상관치 계산을 위해 음성 신호를 밴드패스 필터링하고, 필터링된 신호의 시간 포락선을 추정하고, 추정된 신호로부터 정규화된 자기 상관치를 계산한다. 이 자기 상관치에 근거하여 각 스펙트럴 부밴드의 유성화도를 결정한다. 네번째로, 업샘플링(upsampling) 신호의 자기상관 방식이 있다. 이 방식은 마찬가지로 음성 신호를 부밴드별로 분할하고, 고주파수 밴드에 대해서는 업샘플링을 함으로써 시간 분해능을 보상한다. 이와같이 업샘블링된 신호로부터 정규화된 자기 상관치를 구하고, 이 값에 근거하여 유성화도를 결정한다.
위의 두가지 방식은 특히, 자기상관법(autocorrelation)에 근거하여 부밴드별로 유성화도를 결정하는 것을 특징으로 한다. 이는 즉, 음성의 유성화도가 높을 수록 자기 상관치가 크다는 점에 근거한다. 여기서, 특히 자기 상관치를 계산하는데 에러가 많이 발생하는 고주파수 부밴드에서 자기 상관치를 어떻게 계산할 것인가는 중요한 관건이 된다.
본 발명이 이루고자하는 기술적 과제는, 주파수 이동법을 이용한 자기상관 방식에 근거하여, 부밴드별로 주파수를 원점으로 이동시킨 후에 자기 상관치를 구함으로써, 특히 고주파수 부밴드에서 효과적으로 자기 상관치를 구하며, 유성화도를 보다 견고하고 효율적으로 결정하는, 음성 부호화기에서의 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법을 제공하는데 있다.
본 발명이 이루고자하는 다른 기술적 과제는, 상기 방법을 수행하는 다중 밴드의 유성화도 결정장치를 제공하는데 있다.
상기 과제를 이루기 위하여, 음성 부호화기에서의 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법은,
(a) 입력 음성신호에 대해 윈도우를 적용하고, 윈도윙된 신호를 푸리에 변환하여 얻은 음성 스펙트럼으로부터 파워 스펙트럼을 구하는 단계, (b) 파워 스펙트럼을 소정 개수의 부밴드로 분할한 후에, 각 부밴드에 대해 원점으로 주파수를 이동시키는 단계, (c) 원점으로 주파수 이동된 파워 스펙트럼을 역푸리에 변환하여 부밴드별로 자기 상관치를 구하는 단계 및 (d) 자기 상관치를 각각 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 단계를 구비하는 것을 특징으로 한다.
상기 다른 과제를 이루기 위하여, 음성 부호화기에서의 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정장치는,
입력 음성신호에 대한 음성 스펙트럼으로부터 구해진 파워 스펙트럼을 소정 개수의 부밴드로 분할하는 밴드 분할부, 분할된 각 부밴드에 대해 원점으로 주파수를 이동시키는 주파수 이동부, 원점으로 주파수 이동된 파워 스펙트럼을 개선된 게젤의 역푸리에 방식으로 역푸리에 변환하여 부밴드별 자기 상관치를 구하는 역푸리에 변환부 및 자기 상관치를 각각 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 유성화도 결정부를 구비하는 것을 특징으로 한다.
이하, 본 발명에 의한 음성 부호화기에서의 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법 및 그 장치의 구성 및 동작을 첨부한 도면을 참조하여 다음과 같이 설명한다.
도 1은 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법을 설명하기 위한 플로우챠트이다.
도 2는 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정장치의 바람직한 실시예의 블럭도로서, 윈도잉부(200), 푸리에 변환부(210), 파워 스펙트럼 계산부(220), 밴드 분할부(230), 주파수 이동부(240 ~ 20B-1), 역푸리에 변환부(250 ~ 25B-1) 및 유성화도 결정부(260 ~ 26B-1)로 구성된다.
본 발명은 음성 부호화기 예컨대, 정현파 보코더에서 다중 밴드의 각 부밴드별로 유성/무성을 결정하고자 할때, 자기상관법에 근거하는데 고주파수의 밴드를 원점으로 이동한 후에 자기 상관치를 계산하므로, 고주파수 대역에 대해서도 효율적으로 유성화도를 결정하게 된다.
도 1 및 도 2를 참조하여 구체적으로 설명하면, 먼저 입력 음성신호에 대해 윈도우를 적용하고, 윈도윙된 신호를 푸리에 변환하여 얻은 음성 스펙트럼으로부터 파워 스펙트럼을 구한다(제100단계).
입력 음성신호(s(n), n=0,1,...N-1)를 주파수축에서 분석하기 위해 먼저, 윈도우(w(n))가 적용된다. 바람직하게, 윈도우는 해밍(Hamming) 윈도우(w(n))가 사용된다. 도 2에서, 윈도윙부(200)는 입력단자 IN을 통해 입력된 음성신호(s(n))를 s(n)w(n)(n=0,1,...N-1)하여 윈도윙된 신호(sw(n))로 출력한다. 푸리에 변환부(210)는 윈도윙된 신호(sw(n))를 주파수축으로 변환하기 위해서 푸리에 변환을 한다. 여기서, 푸리에 변환방식으로서 계산의 효율을 위해 바람직하게, M-포인트 고속 푸리에 변환방식(Fast Fourier Transform)을 사용한다. 파워 스펙트럼 계산부(220)는 푸리에 변환에 의한 음성의 스펙트럼(S(ω))으로부터 파워 스펙트럼(P(ω))을 계산한다. 즉, P(ω)=|S(ω)|2(ω=0,1,...,M/2)가 된다.
제100단계 후에, 파워 스펙트럼을 소정 개수의 부밴드로 분할한 후에, 각 부밴드에 대해 원점으로 주파수를 이동시킨다(제110단계).
밴드 분할부(230)는 파워 스펙트럼 계산부(220)에서 계산된 파워 스펙트럼(P(ω))을 구하고자하는 B개(여기서, B는 자연수)의 부밴드(subband)로 분할(decomposition)한다. 분할 후에, b-번째(b = 0,1,...,B-1) 부밴드에 대해서 유성화도를 결정하기 위해 본 발명에서는 특징적으로 주파수 이동법을 이용한다. B개의 부밴드로 분할한 후에, 밴드0 ~ 밴드B-1는 각각에 해당하는 주파수 이동부(240 ~ 24B-1)에서 원점으로 주파수 이동된다. 원점으로 주파수 이동된 b-번째 파워 스펙트럼(Pb(ω))은 바람직하게 다음 수학식 1을 이용하여 계산될 수 있다.
여기서, T는 피치를 나타내고, M은 푸리에 변환부(210)에서 M-포인트 고속 푸리에 변환방식으로 푸리에 변환할때 그때의 M-포인트에 해당한다. 피치(T)는 공지된 방법을 이용하여 구할 수 있다. 실제로, 파워 스펙트럼부(220)로부터 출력된 파워 스펙트럼(P(ω))은 수학식 1에 의해 B개의 부밴드로 분할되면서 원점으로 주파수가 이동된다. 수학식 1에 따라서, 주파수축에서 부밴드는 단순히 일정 간격으로 분할되지 않고, 소정 구간에서 진폭의 정점을 찾아 그 점을 기준으로 분할되며, 만큼 원점으로의 이동량을 갖는다.
제110단계 후에, 원점으로 주파수 이동된 파워 스펙트럼을 바람직하게, 개선된 게젤 방식으로 역푸리에 변환하여 각 부밴드별로 자기 상관치를 구한다(제120단계).
일반적으로, 파워 스펙트럼을 역푸리에 변환하면 자기 상관치가 된다. 그러나, 실상 역푸리에 변환으로부터 필요한 값은 래그(lag)가 0인 경우의 자기 상관치와, 래그가 피치(T)인 경우의 자기 상관치이다. 일반적인 푸리에 변환(예컨대, DFT,FFT)을 하면, 전 래그에 대해 값이 구해지므로, 역푸리에 변환시에 계산량이 많아지는 문제점이 있다. 게젤(Goertzel)의 역푸리에 변환은 주어진 한개의 포인트에 대해서 푸리에 변환을 할때 적은 계산량으로 구할 수 있는 이점이 있다. 본 발명에서는 이러한 게젤의 역푸리에 변환을 더욱 개선하여 보다 효율적으로 계산량을 줄이고자한다.
게젤의 방식으로 역푸리에 변환을 할때, 본 발명에서 자기 상관치를 구하고자하는 경우는 파워 스펙트럼에 대해서 적용되는 경우이며, 파워 스펙트럼은 허수부(imaginary part)가 0이고, 실수부(real part)가 대칭적인(symmetric) 특징이 있다. 이러한 특징으로부터, 래그가 피치(T)인 경우에 자기 상관치(Rb(T))는 바람직하게 다음 수학식 2와 같이 개선된 게젤의 역푸리에 변환방식을 이용하여 계산될 수 있다.
여기서, T는 피치를 나타내고, M은 푸리에 변환부(210)에서 M-포인트 고속 푸리에 변환방식으로 푸리에 변환할때 그때의 M-포인트에 해당한다. Rb(T) 이하의 수식들은 게젤의 역푸리에 변환 방식에 따른 수식들을 나타낸다. 한편, 래그가 0인 경우의 자기 상관치(Rb(0))는 파시발(Parseval)의 정리에 의해서 다음 수학식 3과 같이 계산될 수 있다.
도 2에서, 각 부밴드에 대해 역푸리에 변환부(250 ~ 25B-1)는 각각의 파워 스펙트럼(P0(ω) ~ PB-1(ω))을 개선된 게젤 방식으로 역푸리에 변환하여 부밴드별로 래그가 피치(T)인 경우의 자기 상관치(R0(T) ~ RB-1(T))와, 래그가 0인 경우의 자기 상관치(R0(0) ~ RB-1(0))를 각각 구한다.
제120단계후에, 자기 상관치를 각각 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정한다(제130단계).
음의 무한대에서 양의 무한대 사이에 존재할 수 있는 b-번째 부밴드의 자기 상관치(Rb(T))를 -1과 1사이에 분포시키기 위해, 제120단계에서 구해진 자기 상관치들(Rb(T), Rb(0))로부터 정규화된 자기 상관치(Rb'(T))를 각 스펙트럴 부밴드에 대하여 구한다. 이때, 다음 수학식 4를 이용하여 계산될 수 있다.
정규화된 자기 상관치(Rb'(T))로부터 b-번째 부밴드의 유성화도(Vb)를 결정한다. 유성화(Vb)는 다음 수학식 5와 같이 나타낼 수 있다.
여기서, TH1, TH2는 실험을 통해 미리 정해진 0 과 1 사이의 임계치들로서, TH1은 상한 임계치를, TH2는 하한 임계치를 나타낸다. 이에 따라, Vb = 1 일때, b-번째 부밴드는 완전히 유성음임을 나타내고, Vb = 0 일때, 완전히 무성음임을 나타내고, 그렇지않은 경우에는 유성/무성 성분이 혼합되어 있는 것으로 판단하고, 그때의 값은 위의 식에서 나타낸 바와 같다. 도 2에서, 유성화도 결정부(260 ~ 26B-1)는 각 부밴드에 대해 자기 상관치들(R0(T) ~ RB-1(T), R0(0) ~ RB-1(0))로부터 정규화된 자기 상관치를 각각 구하고, 이 값에 근거하여 부밴드별 유성화도(V0 ~ VB-1)를 결정하여 출력단자 OUT0 ~ OUTB-1을 통해 각각 출력한다.
도 3 (a)~(d)는 본 발명과 종래의 방법을 비교하기 위한 시뮬레이션 결과를 나타내는 도면들이다.
본 발명에 대한 성능 실험을 도 3 (a)~(d)를 참조하여 설명한다. 도 3 (a)는 시간축의 원 음성신호를 나타내며, 이때의 샘플링 주파수는 8000Hz이다. 도 3 (b)는 고속 푸리에 변환한 파워 스펙트럼을 나타낸다. 이에 대해, 도 3 (c)는 밴드패스 필터링(밴드 : 2000 ~ 3000Hz)한 신호의 종래의 자기 상관치를 나타낸다. 여기서, "A"로 마크한 부분은 피치(T)에서의 자기 상관치를 나타내고, “*”로 마크한 부분은 피치(T)가 1만큼 틀리게 구해졌을 때, 자기 상관치의 변화가 매우 큼을 나타내고 있다. 도 3 (d)는 본 발명에 의해 얻어지는 자기 상관치를 나타낸다. 본 발명을 사용할 때, 원 피치("B"로 마크한 부분)에 대해 피치("*"로 마크한 부분)가 1 만큼 오류가 발생하더라도 자기 상관치의 변화가 매우 미미함을 확인할 수 있다. 즉, 만약 음성에 잡음이 섞여있을 때, 특히 고주파 대역에서는 피치가 국소적으로 틀린 값으로 구해질 수 있는데, 본 발명을 사용하면 잡음 환경하에서도 견고하게 자기 상관치를 구할 수 있음을 확인할 수 있다.
본 발명에 의한 유성화도 결정방법 및 장치에 따라 음질 성능이 개선된 음성 부호화기는 다음과 같은 분야에서 널리 적용될 수 있다. 디지탈 셀룰러폰용 음성 통신용 보코더, 개인 통신 시스템(PCS)용 음성 통신용 보코더, 음성 페이저에서 음성 메시지 전달용 음성 부호화기, 위성 통신용 보코더, 음성 사서함 시스템(VMS)용 보코더 및 음성 이메일(e-mail)용 보코더 등이 있으며, 이 밖에도 산업상으로 이용가능한 분야는 상당히 넓다.
이상에서 설명한 바와 같이, 본 발명에 의한 주파수 이동법을 이용한 유성화도 결정방법 및 그 장치는, 고주파수 부밴드에서 효과적으로 자기 상관치를 구하며, 유성화도를 보다 견고하고 효율적으로 결정하며, 또한 잡음 환경에서도 견고하게 자기 상관치를 구하는 이점이 있다.
도 1은 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정방법을 설명하기 위한 플로우챠트이다.
도 2는 본 발명에 의한 주파수 이동법을 이용한 다중 밴드의 유성화도 결정장치의 바람직한 실시예의 블럭도이다.
도 3 (a)~(d)는 본 발명과 종래의 방법을 비교하기 위한 시뮬레이션 결과를 나타내는 도면들이다.

Claims (5)

  1. 음성 부호화기에서의 주파수 이동법을 이용한 유성화도 결정방법에 있어서,
    (a) 입력 음성신호에 대해 윈도우를 적용하고, 윈도윙된 신호를 푸리에 변환하여 얻은 음성 스펙트럼으로부터 파워 스펙트럼을 구하는 단계;
    (b) 상기 파워 스펙트럼을 소정 개수의 부밴드로 분할한 후에, 분할된 각 부밴드에 대한 파워 스펙트럼의 주파수를 원점으로 이동시키는 단계;
    (c) 원점으로 주파수 이동된 파워 스펙트럼을 역푸리에 변환하여 부밴드별로 자기 상관치를 구하는 단계; 및
    (d) 상기 부밴드별로 구하여진 상기 자기 상관치를 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 단계를 구비하는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정방법.
  2. 제1항에 있어서, 상기 (b) 단계에서, 상기 파워 스펙트럼(P(ω))을 B개(여기서, B는 자연수)의 부밴드로 분할한 후에, 원점으로 주파수 이동시킨 b-번째(b = 0 내지 B-1) 파워 스펙트럼(Pb(ω))은 다음 수학식 1을 이용하여 계산되며,
    여기서, T는 피치를 나타내고, M은 상기 (a) 단계에서 M-포인트 고속 푸리에 변환방식으로 푸리에 변환할 때 M-포인트에 해당하는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정방법.
    [수학식 1]
  3. 제1항에 있어서, 상기 (c) 단계에서, B개의 분할된 부밴드에 대해, 원점으로 주파수 이동된 b-번째 파워 스펙트럼(Pb(ω))의 상기 자기 상관치(Rb(T))는 다음 수학식 2와 같이 변형된 게젤의 역푸리에 변환 방식을 이용하여 계산되며,
    여기서, T는 피치를 나타내고, M은 상기 (a) 단계에서 M-포인트 고속 푸리에 변환방식으로 푸리에 변환할때 M-포인트에 해당하는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정방법.
    [수학식 2]
  4. 제3항에 있어서, 상기 (c) 단계에서 래그가 피치(T)인 경우의 자기 상관치(Rb(T))와 함께, 래그가 0인 경우의 자기 상관치(Rb(0))가 계산되며,
    상기 (d) 단계에서, 상기 자기 상관치들(Rb(T),Rb(0))로부터 정규화된 자기 상관치(Rb'(T))는 미리 정해진 상한 임계치보다 크면 유성음으로, 하한 임계치보다 작으면 무성음으로, 그렇지않은 경우에는 유성/무성 성분의 혼합으로 판단되어 각 부밴드별로 유성화도가 결정되는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정방법.
  5. 음성 부호화기에서의 주파수 이동법을 이용한 유성화도 결정장치에 있어서,
    입력 음성신호에 대한 음성 스펙트럼으로부터 구해진 파워 스펙트럼을 소정 개수의 부밴드로 분할하는 밴드 분할부;
    분할된 각 부밴드에 대한 파워 스펙트럼의 주파수를 원점으로 이동시키는 주파수 이동부;
    원점으로 주파수 이동된 파워 스펙트럼을 개선된 게젤의 역푸리에 방식으로 역푸리에 변환하여 부밴드별 자기 상관치를 구하는 역푸리에 변환부; 및
    상기 부밴드별로 구하여진 자기 상관치를 정규화하고, 정규화된 자기 상관치로부터 부밴드별 유성화도를 결정하는 유성화도 결정부를 구비하는 것을 특징으로 하는 주파수 이동법을 이용한 유성화도 결정장치.
KR1019980016629A 1998-05-09 1998-05-09 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 KR100474826B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1019980016629A KR100474826B1 (ko) 1998-05-09 1998-05-09 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치
US09/296,242 US6233551B1 (en) 1998-05-09 1999-04-22 Method and apparatus for determining multiband voicing levels using frequency shifting method in vocoder
JP11127369A JP2000003186A (ja) 1998-05-09 1999-05-07 音声符号化器における周波数移動法を用いた多重バンドの有声化度決定方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980016629A KR100474826B1 (ko) 1998-05-09 1998-05-09 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치

Publications (1)

Publication Number Publication Date
KR100474826B1 true KR100474826B1 (ko) 2005-05-16

Family

ID=19537176

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980016629A KR100474826B1 (ko) 1998-05-09 1998-05-09 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치

Country Status (3)

Country Link
US (1) US6233551B1 (ko)
JP (1) JP2000003186A (ko)
KR (1) KR100474826B1 (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US7246058B2 (en) * 2001-05-30 2007-07-17 Aliph, Inc. Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors
US20070233479A1 (en) * 2002-05-30 2007-10-04 Burnett Gregory C Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors
US8280072B2 (en) 2003-03-27 2012-10-02 Aliphcom, Inc. Microphone array with rear venting
US8019091B2 (en) 2000-07-19 2011-09-13 Aliphcom, Inc. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US7469206B2 (en) 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US9066186B2 (en) 2003-01-30 2015-06-23 Aliphcom Light-based detection for acoustic applications
KR100527002B1 (ko) * 2003-02-26 2005-11-08 한국전자통신연구원 음성 신호의 에너지 분포 특성을 고려한 쉐이핑 장치 및 방법
US9099094B2 (en) 2003-03-27 2015-08-04 Aliphcom Microphone array with rear venting
US8489392B2 (en) * 2006-11-06 2013-07-16 Nokia Corporation System and method for modeling speech spectra
US8503686B2 (en) 2007-05-25 2013-08-06 Aliphcom Vibration sensor and acoustic voice activity detection system (VADS) for use with electronic systems
US8494177B2 (en) 2007-06-13 2013-07-23 Aliphcom Virtual microphone array systems using dual omindirectional microphone array (DOMA)
US8180634B2 (en) * 2008-02-21 2012-05-15 QNX Software Systems, Limited System that detects and identifies periodic interference

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960030558A (ko) * 1995-01-27 1996-08-17 김광호 음성신호 부호화 및 복호화 방법
KR960032295A (ko) * 1995-02-28 1996-09-17 김광호 부프레임별 유/무성 대역 정보를 이용한 음성합성 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5216747A (en) * 1990-09-20 1993-06-01 Digital Voice Systems, Inc. Voiced/unvoiced estimation of an acoustic signal
DE4316297C1 (de) * 1993-05-14 1994-04-07 Fraunhofer Ges Forschung Frequenzanalyseverfahren
AU696092B2 (en) * 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
GB2297465B (en) * 1995-01-25 1999-04-28 Dragon Syst Uk Ltd Methods and apparatus for detecting harmonic structure in a waveform
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JP3687181B2 (ja) * 1996-04-15 2005-08-24 ソニー株式会社 有声音/無声音判定方法及び装置、並びに音声符号化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960030558A (ko) * 1995-01-27 1996-08-17 김광호 음성신호 부호화 및 복호화 방법
KR960032295A (ko) * 1995-02-28 1996-09-17 김광호 부프레임별 유/무성 대역 정보를 이용한 음성합성 방법

Also Published As

Publication number Publication date
JP2000003186A (ja) 2000-01-07
US6233551B1 (en) 2001-05-15

Similar Documents

Publication Publication Date Title
KR100474826B1 (ko) 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치
EP0566131B1 (en) Method and device for discriminating voiced and unvoiced sounds
EP2352145B1 (en) Transient speech signal encoding method and device, decoding method and device, processing system and computer-readable storage medium
US8160732B2 (en) Noise suppressing method and noise suppressing apparatus
EP1739657B1 (en) Speech signal enhancement
EP1677088B1 (en) Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
KR101378696B1 (ko) 협대역 신호로부터의 상위대역 신호의 결정
US6996523B1 (en) Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
US7013269B1 (en) Voicing measure for a speech CODEC system
EP2416315B1 (en) Noise suppression device
US20050108004A1 (en) Voice activity detector based on spectral flatness of input signal
EP3336843A1 (en) Speech coding method and speech coding apparatus
JPS63259696A (ja) 音声予処理方法および装置
JPH08272398A (ja) 再生成位相情報を用いた音声合成
EP0676744B1 (en) Estimation of excitation parameters
EP1697927B1 (en) Improved frequency-domain error concealment
US9530430B2 (en) Voice emphasis device
EP2264700A1 (en) Coding apparatus and decoding apparatus
US7917359B2 (en) Noise suppressor for removing irregular noise
JP3191926B2 (ja) 音響波形のコード化方式
US8433562B2 (en) Speech coder that determines pulsed parameters
KR20020057701A (ko) 음성 신호에서의 유성화 확률 결정 장치 및 그 방법
Webber et al. Packet transmission of speech using variable‐quality coding and time‐interval modification

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130115

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140124

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20150116

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20160119

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee