RU99107842A - SPEECH ANALYSIS METHOD - Google Patents

SPEECH ANALYSIS METHOD

Info

Publication number
RU99107842A
RU99107842A RU99107842/09A RU99107842A RU99107842A RU 99107842 A RU99107842 A RU 99107842A RU 99107842/09 A RU99107842/09 A RU 99107842/09A RU 99107842 A RU99107842 A RU 99107842A RU 99107842 A RU99107842 A RU 99107842A
Authority
RU
Russia
Prior art keywords
signal
digital signal
samples
stored digital
detected
Prior art date
Application number
RU99107842/09A
Other languages
Russian (ru)
Inventor
Геннадий Дмитриевич Толстых
Эммануил Григорьевич Кнеллер
Валерий Владимирович Сборщиков
Сергей Валерьевич Суслов
Евгений Юрьевич Демин
Original Assignee
Закрытое акционерное общество "ИстраСофт"
Filing date
Publication date
Application filed by Закрытое акционерное общество "ИстраСофт" filed Critical Закрытое акционерное общество "ИстраСофт"
Publication of RU99107842A publication Critical patent/RU99107842A/en

Links

Claims (3)

1. Способ анализа речи, в котором осуществляют выборки из входного сигнала с заданной частотой дискретизации и с помощью аналого-цифрового преобразования формируют из них цифровой сигнал, запоминают цифровой сигнал на временном отрезке, длина которого по крайней мере вдвое превышает максимально допустимый период сигнала основного тона, обнаруживают в запомненном цифровом сигнале наличие речевого сигнала и/или паузы, при обнаружении паузы определяют ее длительность, при обнаружении сигнала основного тона и при наличии на указанном временном отрезке цифрового сигнала не менее двух периодов сигнала основного тона, разность между которыми не превышает заданный порог, принимают решение о наличии в речевом сигнале "гласной" и затем запомненный цифровой сигнал разбивают на кадры, длительность каждого из которых устанавливают равной Т отсчетам и периоду сигнала основного тона, в каждом кадре интерполируют Т отсчетов в N отсчетов, где N = 2n, n - целое число, полученный цифровой сигнал из N отсчетов подвергают N-точечному преобразованию Фурье, на основании которого выделяют и/или измеряют спектр сигнала, если в запомненном цифровом сигнале сигнал основного тона не обнаруживают, то измеряют изменения амплитуды запомненного цифрового сигнала, и, если изменения амплитуды запомненного цифрового сигнала находятся в заданном диапазоне, принимают решение о наличии "шипящей согласной" и затем из запомненного цифрового сигнала выбирают N отсчетов, нормируют их по действующему значению и подвергают N-точечному преобразованию Фурье, на основании которого измеряют энергии полученного спектра по критическим зонам слуха, если не обнаруживают "гласной" и "шипящей согласной", то принимают решение о наличии "взрывной согласной" и затем из запомненного цифрового сигнала выбирают N отсчетов, подвергают их N-точечному преобразованию Фурье, на основании которого выделяют и/или измеряют спектр сигнала.1. A method for analyzing speech, in which samples are taken from an input signal with a given sampling frequency and, using an analog-to-digital conversion, a digital signal is formed from them, a digital signal is stored on a time period whose length is at least twice the maximum allowable period of the fundamental signal , the presence of a speech signal and / or pause is detected in the stored digital signal, when a pause is detected, its duration is determined, when a pitch signal is detected and if there is a specified time In a given segment of a digital signal, at least two periods of the fundamental signal, the difference between which does not exceed a predetermined threshold, decide on the presence of a vowel in the speech signal and then the stored digital signal is divided into frames, the duration of each of which is set equal to T samples and the signal period fundamental tone, in each frame T samples are interpolated into N samples, where N = 2 n , n is an integer, the digital signal obtained from N samples is subjected to an N-point Fourier transform, based on which both / and the signal spectrum is measured if no fundamental signal is detected in the stored digital signal, then the amplitude changes of the stored digital signal are measured, and if the changes in the amplitude of the stored digital signal are in a predetermined range, a decision is made on the presence of an “hissing consonant” and then from the stored digital signal select N samples, normalize them according to the actual value and undergo the N-point Fourier transform, on the basis of which the energies of the obtained spectrum are measured over critical hearing zones, if and do not detect a "vowel" and "hissing consonant", then decide on the presence of an "explosive consonant" and then N samples are selected from the stored digital signal, subjected to N-point Fourier transform, based on which the signal spectrum is extracted and / or measured. 2. Способ по п.1, отличающийся тем, что при принятии решения о наличии "взрывной согласной" перед N-точечным преобразованием Фурье длительность кадра из N выборок уменьшают. 2. The method according to claim 1, characterized in that when deciding on the presence of an "explosive consonant" before the N-point Fourier transform, the frame duration of N samples is reduced. 3. Способ по п.2, отличающийся тем, что длительность кадра уменьшают не более чем на 5 - 15%. 3. The method according to claim 2, characterized in that the frame duration is reduced by no more than 5-15%.
RU99107842/09A 1999-04-14 SPEECH ANALYSIS METHOD RU99107842A (en)

Publications (1)

Publication Number Publication Date
RU99107842A true RU99107842A (en) 2001-03-10

Family

ID=

Similar Documents

Publication Publication Date Title
GB1533337A (en) Speech analysis and synthesis system
EP0054365B1 (en) Speech recognition systems
US9454976B2 (en) Efficient discrimination of voiced and unvoiced sounds
KR950034055A (en) Digitalized Speech Signal Analysis Method for Excitation Parameter Determination and Speech Encoding System
KR910015962A (en) Voice signal processing device
WO2007026436A1 (en) Vocal fry detecting device
EP0374941A3 (en) Communication system capable of improving a speech quality by effectively calculating excitation multipulses
US4219695A (en) Noise estimation system for use in speech analysis
EP0092612B1 (en) Speech analysis system
RU99107842A (en) SPEECH ANALYSIS METHOD
Indefrey et al. Design and evaluation of double-transform pitch determination algorithms with nonlinear distortion in the frequency domain-preliminary results
KR20030010898A (en) 2-phase pitch detection method and apparatus
Kim et al. Pitch detection with average magnitude difference function using adaptive threshold algorithm for estimating shimmer and jitter
US3381091A (en) Apparatus for determining the periodicity and aperiodicity of a complex wave
US5208861A (en) Pitch extraction apparatus for an acoustic signal waveform
KR960025317A (en) Pitch Detection Method by Spectral Harmonic Matching of Variable Length Dual Impulse with Different Polarities
WO2009055701A1 (en) Processing of a signal representing speech
CA1147071A (en) Method of and apparatus for detecting speech in a voice channel signal
JPH04115299A (en) Method and device for voiced/voiceless sound decision making
SU1597898A2 (en) Method and apparatus for detecting ends of words
KR0171004B1 (en) Basic frequency using samdf and ratio technique of the first format frequency
SU1781701A1 (en) Method of separation of speech and nonstationary noise signals
JPS6068000A (en) Pitch extractor
JP3423233B2 (en) Audio signal processing method and apparatus
KR100212453B1 (en) Method for detecting the pitch of voice signal using quantization error