Claims (4)
음성 신호를 유음 구간과 무음 구간으로 구분하고 유음 구간에 대해서만 신호대 잡음비를 평가하는 방법에 있어서, 입력된 원래의 음성 신호 혹은 처리된 음성 신호를 15-20ms의 길이를 갖는 프레임들로 분할하는 블록화 과정; 상기 블록화 과정에서 블록화된 프레임을 입력하여 묵음 구간 여부를 검출하는 유음 구간 검출과정; 상기 유음 구간 검출 과정에서 묵음 구간이 아닌 것으로 판별된 프레임에 대하여 프레임 기반의 신호대 잡음비를 계산하는 프레임 기반 신호대 잡음비 계산 과정; 및 상기 프레임 기반 신호대 잡음비 계산 과정에서 계산된 유음 구간의 신호대 잡음비를 종합하여 전체 신호의 신호대 잡음비를 계산하는 전체 신호대 잡음비 계산 과정을 포함하는 전체 신호대 잡음비 평가 방법.A method of dividing a speech signal into a sounding section and a silent section and evaluating a signal-to-noise ratio only for the sounding section, the partitioning process of dividing an input original speech signal or a processed speech signal into frames having a length of 15-20 ms ; A sounding section detecting step of detecting whether a silent section is input by inputting a block framed in the blocking process; A frame-based signal-to-noise ratio calculation process of calculating a frame-based signal-to-noise ratio for a frame determined as not being a silent section in the sound section; And a total signal-to-noise ratio calculation process of calculating the signal-to-noise ratio of the entire signal by combining the signal-to-noise ratios of the noise period calculated in the frame-based signal-to-noise ratio calculation process.
제1항에 있어서, 상기 프레임 기반 신호대 잡음비 계산 과정은 하기의 식에 의해 SNRvad(m')을 계산하고,The method of claim 1, wherein the frame-based signal to noise ratio calculation process calculates SNR vad (m ') by the following equation,
상기 전체 신호대 잡음비 계산 과정은 하기의 식에 의해 SNRvad-seg을 계산함을 특징으로 하는 신호대 잡음비 평가 방법.The overall signal-to-noise ratio calculation process calculates the SNR vad-seg by the following equation.
여기서, M'는 유음 구간 프레임의 총 개수.Here, M 'is the total number of noise interval frames.
프레임 단위로 블록화된 음성의 유음 여부를 평가하는 방법에 있어서, 프레임의 평균 에너지를 산출하는 평균 에너지 산출 과정; 상기 평균 에너지 산출 과정에서 산출된 평균 에너지에 기초하여 이전 프레임과 현재 프레임 사이의 평균 에너지의 변화량을 산출하는 프레임간 에너지 변화량 산출 과정; 현재 프레임의 주기성 여부를 조사하는 주기성 검출 과정; 평균 에너지의 변화량에 따른 임계값 조성 과정; 상기 임계값 조성 과정의 결과에 따라 유음 구간 판별을 수행하는 유음 구간 판별 과정; 및 상기 유음 구간 판별 과정의 결과 낮은 레벨의 음성이 묵음으로 결정되는 것을 회피하기 위하여 행오버 처리를 행하는 행오버 처리 과정을 포함하는 음성 프레임의 유음 여부 판별 방법.Claims [1] A method of evaluating whether a voice blocked in a frame unit is sound, comprising: an average energy calculating step of calculating an average energy of a frame; An interframe energy change calculation step of calculating an amount of change in average energy between a previous frame and a current frame based on the average energy calculated in the average energy calculation step; A periodicity detection process of examining whether a current frame is periodical; A threshold composition process according to the change of average energy; A sound section determination step of performing a sound section section according to a result of the threshold value forming process; And a hangover process of performing a hangover process in order to avoid that the low level voice is determined to be silent as a result of the sound interval determination process.
제3항에 있어서, 상기 평균 에너지 산출 과정은 하기의 식에 의해 평균 에너지 Ecurrent을 산출하고,According to claim 3, The average energy calculation process is to calculate the average energy E current by the following formula,
상기 프레임간 에너지 변화량 산출 과정은 하기의 식에 따라 이전 프레임과 현재 프레임 사이의 평균 에너지의 변화량 Evar을 산출하고,The process of calculating the change amount of energy between frames calculates the change amount E var of the average energy between the previous frame and the current frame according to the following equation,
주기성 검출 과정은 하기의 과정에 따라 주기성 ptch을 검출하며, 1) 현재 프레임에 대해 교창 상관 P(j)을 최대치고 갖는 j를 구하고,The periodicity detection process detects periodicity ptch according to the following procedure, 1) obtains j having the maximum correlation correlation P (j) for the current frame,
2) 이전 프레임의 j와 비교하여 주기성 ptch을 하기의 조건에 따라 결정함.2) The periodic ptch is determined according to the following condition compared to j of the previous frame.
if {jprev×0.75≤j≤jprev×1.25} orif {j prev × 0.75≤j≤j prev × 1.25} or
{0.5jprev×0.75≤j≤0.5jprev×1.25} or{0.5j prev × 0.75≤j≤0.5j prev × 1.25} or
{2.0jprev×0.75≤j≤2.0jprev×1.25} or{2.0j prev × 0.75≤j≤2.0j prev × 1.25} or
then ptch = truethen ptch = true
상기 임계값 조정 과정은 하기의 식에 의해 프레임간 평균 에너지 변화량에 따른 임계값을 조정하고,The threshold adjustment process is to adjust the threshold value according to the average amount of energy change between frames by the following equation,
if(ptch=true) thenif (ptch = true) then
if |Evar|≤10.0 thvad = thvad;if | E var | ≤10.0 thvad = thvad;
else if |Evar|≤20.0 thvad = thvad*(1+0.005Evar);else if | E var | ≤20.0 thvad = thvad * (1 + 0.005E var );
else if |Evar|≤30.0 thvad = thvad*(1+0.003Evar);else if | E var | ≤30.0 thvad = thvad * (1 + 0.003E var );
endend
여기서, thvad는 유음 구간 판별을 위한 소정의 임계값.Here, thvad is a predetermined threshold value for determining the sound interval.
상기 유음 구간 판별 과정은 하기의 식에 의해 유음 구간 판별을 수행하며,The sound interval section determination process is performed by the following equation to determine the sound section,
if(Ecurrent〉thvad) then tvad=trueif (E current 〉 thvad) then tvad = true
else tvad=falseelse tvad = false
상기 행오버 처리 과정은 일정한 수의 구간이 유음 구간으로 결정되었으면 무조건 정해진 수만큼의 구간을 유음 구간으로 결정함을 특징으로 하는 음성 프레임의 유음 여부 판별 방법.In the hangover process, if a predetermined number of sections are determined as a sound section, a predetermined number of sections are determined as a sound section.
※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.※ Note: The disclosure is based on the initial application.