KR970050779A - Signal-to-Noise Ratio Evaluation Method of Speech Signals and Sounding Method of Speech Frames - Google Patents

Signal-to-Noise Ratio Evaluation Method of Speech Signals and Sounding Method of Speech Frames Download PDF

Info

Publication number
KR970050779A
KR970050779A KR1019950050670A KR19950050670A KR970050779A KR 970050779 A KR970050779 A KR 970050779A KR 1019950050670 A KR1019950050670 A KR 1019950050670A KR 19950050670 A KR19950050670 A KR 19950050670A KR 970050779 A KR970050779 A KR 970050779A
Authority
KR
South Korea
Prior art keywords
signal
section
noise ratio
frame
sound
Prior art date
Application number
KR1019950050670A
Other languages
Korean (ko)
Inventor
오기은
김흥국
김무영
Original Assignee
김광호
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김광호, 삼성전자 주식회사 filed Critical 김광호
Priority to KR1019950050670A priority Critical patent/KR970050779A/en
Publication of KR970050779A publication Critical patent/KR970050779A/en

Links

Landscapes

  • Time-Division Multiplex Systems (AREA)

Abstract

음성 신호를 묵음 구간과 유음 구간으로 나누고 유음 구간에 대해서만 신호대 잡음비를 계산하는 새로운 평가 방법 및 이에 적합한 음성 프레임 유음 여부 판별 방법이 개시된다.A new evaluation method for dividing a speech signal into a silent section and a sound section, and calculating a signal-to-noise ratio only for the sound section, and a method for determining whether a voice frame is sounded accordingly are disclosed.

음성 신호를 유음 구간과 무음 구간으로 구분하고 유음 구간에 대해서만 신호대 잡음비를 평가하는 방법에 있어서, 입력된 원래의 음성 신호 혹은 처리된 음성 신호를 15-20ms의 길이를 갖는 프레임들로 분할하는 블록화 과정; 상기 블록화 과정에서 블록화된 프레임을 입력하여 묵음 구간 여부를 결정하는 유음 구간 검출 과정; 상기 유음 구간 검출 과정에서 묵음 구간이 아닌 것으로 판별된 프레임에 대하여 프레임 기반의 신호대 잡음비를 계산하는 프레임 기반 신호대 잡음비 계산 과정; 및 상기 프레임 기반 신호대 잡음비 계산 과정에서 계산된 유음 구간의 신호대 잡음비를 종합하여 전체 신호의 신호대 잡음비를 계산하는 전체 신호대 잡음비 계산 과정을 포함함을 특징으로 한다.A method of dividing a speech signal into a sounding section and a silent section and evaluating a signal-to-noise ratio only for the sounding section, the partitioning process of dividing an input original speech signal or a processed speech signal into frames having a length of 15-20 ms ; A sounding section detection process of determining whether a silent section is input by inputting a block framed in the blocking process; A frame-based signal-to-noise ratio calculation process of calculating a frame-based signal-to-noise ratio for a frame determined as not being a silent section in the sound section; And a signal-to-noise ratio calculation process of calculating the signal-to-noise ratio of the entire signal by combining the signal-to-noise ratios of the sound-period section calculated in the frame-based signal-to-noise ratio calculation process.

본 발명에 따른 신호대 잡음비의 평가 방법은 음성 신호를 묵음 구간과 유음 구간으로 구분하고 유음 구간에 대해서만 신호대 잡음비를 계산하므로써 시간에 따라 변화하는 음성 신호의 특징을 정확하게 반영하는 평가 방법을 제공하는 효과가 있다.The method of evaluating the signal-to-noise ratio according to the present invention has the effect of providing an evaluation method that accurately reflects the characteristics of the voice signal that changes with time by dividing the speech signal into a silent section and a sound section and calculating the signal-to-noise ratio only for the sound section. have.

Description

음성 신호의 신호대 잡음비 평가 방법 및 이에 적합한 음성 프레임의 유음 여부 판별 방법Signal-to-Noise Ratio Evaluation Method of Speech Signals and Sounding Method of Speech Frames

본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음Since this is an open matter, no full text was included.

제1도는 본 발명에 따른 신호대 잡음비의 평가 방법을 보이는 흐름도이다.1 is a flowchart showing a method for evaluating a signal-to-noise ratio according to the present invention.

제2도는 제1도에 도시된 유음 구간 검출 방법을 보이는 흐름도이다.2 is a flowchart showing a method of detecting a sound section shown in FIG. 1.

Claims (4)

음성 신호를 유음 구간과 무음 구간으로 구분하고 유음 구간에 대해서만 신호대 잡음비를 평가하는 방법에 있어서, 입력된 원래의 음성 신호 혹은 처리된 음성 신호를 15-20ms의 길이를 갖는 프레임들로 분할하는 블록화 과정; 상기 블록화 과정에서 블록화된 프레임을 입력하여 묵음 구간 여부를 검출하는 유음 구간 검출과정; 상기 유음 구간 검출 과정에서 묵음 구간이 아닌 것으로 판별된 프레임에 대하여 프레임 기반의 신호대 잡음비를 계산하는 프레임 기반 신호대 잡음비 계산 과정; 및 상기 프레임 기반 신호대 잡음비 계산 과정에서 계산된 유음 구간의 신호대 잡음비를 종합하여 전체 신호의 신호대 잡음비를 계산하는 전체 신호대 잡음비 계산 과정을 포함하는 전체 신호대 잡음비 평가 방법.A method of dividing a speech signal into a sounding section and a silent section and evaluating a signal-to-noise ratio only for the sounding section, the partitioning process of dividing an input original speech signal or a processed speech signal into frames having a length of 15-20 ms ; A sounding section detecting step of detecting whether a silent section is input by inputting a block framed in the blocking process; A frame-based signal-to-noise ratio calculation process of calculating a frame-based signal-to-noise ratio for a frame determined as not being a silent section in the sound section; And a total signal-to-noise ratio calculation process of calculating the signal-to-noise ratio of the entire signal by combining the signal-to-noise ratios of the noise period calculated in the frame-based signal-to-noise ratio calculation process. 제1항에 있어서, 상기 프레임 기반 신호대 잡음비 계산 과정은 하기의 식에 의해 SNRvad(m')을 계산하고,The method of claim 1, wherein the frame-based signal to noise ratio calculation process calculates SNR vad (m ') by the following equation, 상기 전체 신호대 잡음비 계산 과정은 하기의 식에 의해 SNRvad-seg을 계산함을 특징으로 하는 신호대 잡음비 평가 방법.The overall signal-to-noise ratio calculation process calculates the SNR vad-seg by the following equation. 여기서, M'는 유음 구간 프레임의 총 개수.Here, M 'is the total number of noise interval frames. 프레임 단위로 블록화된 음성의 유음 여부를 평가하는 방법에 있어서, 프레임의 평균 에너지를 산출하는 평균 에너지 산출 과정; 상기 평균 에너지 산출 과정에서 산출된 평균 에너지에 기초하여 이전 프레임과 현재 프레임 사이의 평균 에너지의 변화량을 산출하는 프레임간 에너지 변화량 산출 과정; 현재 프레임의 주기성 여부를 조사하는 주기성 검출 과정; 평균 에너지의 변화량에 따른 임계값 조성 과정; 상기 임계값 조성 과정의 결과에 따라 유음 구간 판별을 수행하는 유음 구간 판별 과정; 및 상기 유음 구간 판별 과정의 결과 낮은 레벨의 음성이 묵음으로 결정되는 것을 회피하기 위하여 행오버 처리를 행하는 행오버 처리 과정을 포함하는 음성 프레임의 유음 여부 판별 방법.Claims [1] A method of evaluating whether a voice blocked in a frame unit is sound, comprising: an average energy calculating step of calculating an average energy of a frame; An interframe energy change calculation step of calculating an amount of change in average energy between a previous frame and a current frame based on the average energy calculated in the average energy calculation step; A periodicity detection process of examining whether a current frame is periodical; A threshold composition process according to the change of average energy; A sound section determination step of performing a sound section section according to a result of the threshold value forming process; And a hangover process of performing a hangover process in order to avoid that the low level voice is determined to be silent as a result of the sound interval determination process. 제3항에 있어서, 상기 평균 에너지 산출 과정은 하기의 식에 의해 평균 에너지 Ecurrent을 산출하고,According to claim 3, The average energy calculation process is to calculate the average energy E current by the following formula, 상기 프레임간 에너지 변화량 산출 과정은 하기의 식에 따라 이전 프레임과 현재 프레임 사이의 평균 에너지의 변화량 Evar을 산출하고,The process of calculating the change amount of energy between frames calculates the change amount E var of the average energy between the previous frame and the current frame according to the following equation, 주기성 검출 과정은 하기의 과정에 따라 주기성 ptch을 검출하며, 1) 현재 프레임에 대해 교창 상관 P(j)을 최대치고 갖는 j를 구하고,The periodicity detection process detects periodicity ptch according to the following procedure, 1) obtains j having the maximum correlation correlation P (j) for the current frame, 2) 이전 프레임의 j와 비교하여 주기성 ptch을 하기의 조건에 따라 결정함.2) The periodic ptch is determined according to the following condition compared to j of the previous frame. if {jprev×0.75≤j≤jprev×1.25} orif {j prev × 0.75≤j≤j prev × 1.25} or {0.5jprev×0.75≤j≤0.5jprev×1.25} or{0.5j prev × 0.75≤j≤0.5j prev × 1.25} or {2.0jprev×0.75≤j≤2.0jprev×1.25} or{2.0j prev × 0.75≤j≤2.0j prev × 1.25} or then ptch = truethen ptch = true 상기 임계값 조정 과정은 하기의 식에 의해 프레임간 평균 에너지 변화량에 따른 임계값을 조정하고,The threshold adjustment process is to adjust the threshold value according to the average amount of energy change between frames by the following equation, if(ptch=true) thenif (ptch = true) then if |Evar|≤10.0 thvad = thvad;if | E var | ≤10.0 thvad = thvad; else if |Evar|≤20.0 thvad = thvad*(1+0.005Evar);else if | E var | ≤20.0 thvad = thvad * (1 + 0.005E var ); else if |Evar|≤30.0 thvad = thvad*(1+0.003Evar);else if | E var | ≤30.0 thvad = thvad * (1 + 0.003E var ); endend 여기서, thvad는 유음 구간 판별을 위한 소정의 임계값.Here, thvad is a predetermined threshold value for determining the sound interval. 상기 유음 구간 판별 과정은 하기의 식에 의해 유음 구간 판별을 수행하며,The sound interval section determination process is performed by the following equation to determine the sound section, if(Ecurrent〉thvad) then tvad=trueif (E current 〉 thvad) then tvad = true else tvad=falseelse tvad = false 상기 행오버 처리 과정은 일정한 수의 구간이 유음 구간으로 결정되었으면 무조건 정해진 수만큼의 구간을 유음 구간으로 결정함을 특징으로 하는 음성 프레임의 유음 여부 판별 방법.In the hangover process, if a predetermined number of sections are determined as a sound section, a predetermined number of sections are determined as a sound section. ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.※ Note: The disclosure is based on the initial application.
KR1019950050670A 1995-12-15 1995-12-15 Signal-to-Noise Ratio Evaluation Method of Speech Signals and Sounding Method of Speech Frames KR970050779A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950050670A KR970050779A (en) 1995-12-15 1995-12-15 Signal-to-Noise Ratio Evaluation Method of Speech Signals and Sounding Method of Speech Frames

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950050670A KR970050779A (en) 1995-12-15 1995-12-15 Signal-to-Noise Ratio Evaluation Method of Speech Signals and Sounding Method of Speech Frames

Publications (1)

Publication Number Publication Date
KR970050779A true KR970050779A (en) 1997-07-29

Family

ID=66594191

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950050670A KR970050779A (en) 1995-12-15 1995-12-15 Signal-to-Noise Ratio Evaluation Method of Speech Signals and Sounding Method of Speech Frames

Country Status (1)

Country Link
KR (1) KR970050779A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100427053B1 (en) * 2003-01-29 2004-04-13 주식회사 텔레칩스 Effective section detecting method using the freqency domain energy, and the iterative playing method using the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100427053B1 (en) * 2003-01-29 2004-04-13 주식회사 텔레칩스 Effective section detecting method using the freqency domain energy, and the iterative playing method using the same

Similar Documents

Publication Publication Date Title
Haigh et al. Robust voice activity detection using cepstral features
JP5712220B2 (en) Method and background estimator for speech activity detection
US5991718A (en) System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments
KR100278423B1 (en) Identification of normal and abnormal signals
KR0161258B1 (en) Voice activity detection
JP2010537253A (en) System and method for noise activity detection
EP1521238B1 (en) Voice activity detection
CN103413547B (en) A kind of method that room reverberation is eliminated
KR940024660A (en) Voice recognition device
JPH09212195A (en) Device and method for voice activity detection and mobile station
KR100220377B1 (en) Discriminating between stationary and non-stationary signals
JP5293329B2 (en) Audio signal evaluation program, audio signal evaluation apparatus, and audio signal evaluation method
KR970050779A (en) Signal-to-Noise Ratio Evaluation Method of Speech Signals and Sounding Method of Speech Frames
Wu et al. A pitch-based method for the estimation of short reverberation time
JP4601970B2 (en) Sound / silence determination device and sound / silence determination method
Vahatalo et al. Voice activity detection for GSM adaptive multi-rate codec
JP3520430B2 (en) Left and right sound image direction extraction method
JPH08305388A (en) Voice range detection device
US20240013803A1 (en) Method enabling the detection of the speech signal activity regions
KR20010047038A (en) Detection apparatus and method for transitional region of speech and speech synthesis method for transitional region
KR100312334B1 (en) Voice activity detection method of voice signal processing coder using energy and LSP parameter
KR100399057B1 (en) Apparatus for Voice Activity Detection in Mobile Communication System and Method Thereof
JP2944098B2 (en) Voice section detection method
Park Signal Enhancement of a Variable Rate Vocoder with a Hybrid domain SNR Estimator
KR100361024B1 (en) The efficient G.723.1 Algorithm using the Voice Activity Detector

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination