RU2010354C1 - Device for measuring formant frequency of speech signal - Google Patents

Device for measuring formant frequency of speech signal Download PDF

Info

Publication number
RU2010354C1
RU2010354C1 SU5039431A RU2010354C1 RU 2010354 C1 RU2010354 C1 RU 2010354C1 SU 5039431 A SU5039431 A SU 5039431A RU 2010354 C1 RU2010354 C1 RU 2010354C1
Authority
RU
Russia
Prior art keywords
formant
frequency
output
speech
peak detector
Prior art date
Application number
Other languages
Russian (ru)
Inventor
Н.П. Дегтярев
В.И. Александровский
Е.С. Лукьянчиков
И.И. Парфенов
Мансур Осман
С.Е. Севастьянов
Е.С. Шаньгин
Original Assignee
Совместное предприятие Россия-Великобритания "Башкорт"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Совместное предприятие Россия-Великобритания "Башкорт" filed Critical Совместное предприятие Россия-Великобритания "Башкорт"
Priority to SU5039431 priority Critical patent/RU2010354C1/en
Application granted granted Critical
Publication of RU2010354C1 publication Critical patent/RU2010354C1/en

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

FIELD: analyze and recognition of speech. SUBSTANCE: device has speech signal receiver 1, amplifier 2, formant filter 3 and formant frequency estimating channel 4 which has signal level automatic regulating device 5 connected in series with differentiating unit 6, full-wave rectifier 7, lower frequency first filter 8, peak detector 9 and lower frequency second filter 10. EFFECT: improved precision of measurement of formant frequency. 1 dwg

Description

Изобретение относится к технике анализа и распознавания речи и может быть использовано для речевого управления автоматизированными системами, в системах обучения иностранной речи, в системах обучения правильной речи глухих и людей с нарушенной функцией речеобразования. The invention relates to techniques for the analysis and recognition of speech and can be used for voice control of automated systems, in foreign language learning systems, in systems for teaching the correct speech of the deaf and people with impaired speech function.

Известны устройства измерения формантной частоты отфильтрованного сигнала путем оценки частоты гармоники основного тона с небольшой амплитудой [1] . Полученные таким образом оценки формантной частоты зависят от изменений частоты основного тока на интервале звучания речевого сигнала. Таким образом, в получаемую оценку формантной частоты вносится неконтролируемая погрешность. Known devices for measuring the formant frequency of the filtered signal by estimating the frequency of the harmonic of the fundamental tone with a small amplitude [1]. The estimates of the formant frequency obtained in this way depend on the changes in the frequency of the main current in the interval of sounding of the speech signal. Thus, an uncontrolled error is introduced in the resulting estimate of the formant frequency.

Известны устройства измерения формантной частоты отфильтрованного сигнала независимо от изменений частоты основного тона путем измерения амплитуды производной нормированного сигнала с помощью пикового детектора [2] . Независимость от основного тона измеряемой частоты форманты достигается тем, что оценка частоты форманты производится внутри периода основного тона. Недостатком такого устройства является большая погрешность измерения частоты форманты при воздействии акустических импульсных помех. Данное устройство выбрано за прототип. Known devices for measuring the formant frequency of the filtered signal, regardless of changes in the frequency of the fundamental tone by measuring the amplitude of the derivative of the normalized signal using a peak detector [2]. Independence of the fundamental tone of the measured frequency of the formant is achieved by the fact that the frequency of the formant is estimated within the period of the fundamental tone. The disadvantage of this device is the large error in measuring the frequency of the formant when exposed to acoustic pulsed interference. This device is selected for the prototype.

Для повышения надежности и точности измерения формантной частоты при воздействии импульсных помех и изменениях частоты основного тона в устройство, содержащее источник речевого сигнала, усилитель, формантный фильтр и канал оценки частоты форманты, состоящий из устройства автоматической регулировки уровня сигнала, дифференцирующего устройства, двухполупериодного выпрямителя и пикового детектора, входящие в состав канала оценки частоты форманты дифференцирующее устройство, двухполупериодный выпрямитель и пиковый детектор включены последовательно и введены два фильтра нижних частот, причем первый фильтр нижних частот с постоянной времени больше периода измеряемой форманты, но меньше периода основного тона включен между выходом двухполупериодного выпрямителя и входом пикового детектора, а второй фильтр нижних частот с постоянной времени больше периода основного тона, но меньше длительности коротких звуков речи подключен к выходу пикового детектора. To increase the reliability and accuracy of measuring the formant frequency under the influence of pulsed noise and changes in the frequency of the fundamental tone into a device containing a speech signal source, an amplifier, a formant filter and a formant frequency estimation channel, consisting of an automatic signal level control device, a differentiating device, a half-wave rectifier, and a peak detectors, which are part of the formant frequency estimation channel, a differentiating device, a half-wave rectifier, and a peak detector are included two low-pass filters are sequentially introduced, the first low-pass filter with a time constant greater than the period of the measured formant but shorter than the fundamental period included between the output of a half-wave rectifier and the peak detector input, and the second low-pass filter with a time constant greater than the fundamental period, but shorter duration short speech sounds connected to the output of the peak detector.

Повышение точности оценки частоты форманты при изменении частоты основного тона достигается тем, что оценка частоты форманты производится внутри периода основного тона по максимумам функции интенсивности огибающей производной сигнала с помощью пикового детектора, а также сглаживанием функции формантной частоты вторым фильтром нижних частот. Повышение точности оценки формантной частоты при воздействии импульсных помех достигается сглаживанием функции модуля производной и функции формантной частоты первым и вторым фильтрами нижних частот. Improving the accuracy of estimating the frequency of the formant when changing the frequency of the fundamental tone is achieved by estimating the frequency of the formant inside the period of the fundamental tone using the maxima of the intensity function of the envelope of the derivative of the signal using a peak detector, as well as by smoothing the function of the formant frequency with a second low-pass filter. Improving the accuracy of estimation of the formant frequency under the influence of pulsed noise is achieved by smoothing the derivative module function and the formant frequency function by the first and second low-pass filters.

На чертеже дана структурная схема предлагаемого устройства для измерения формантной частоты речевого сигнала. The drawing shows a structural diagram of the proposed device for measuring the formant frequency of a speech signal.

Устройство содержит последовательно соединенные приемник 1 речевого сигнала, усилитель 2, формантный фильтр 3 и канал 4 оценки формантной частоты, состоящий из последовательно соединенных устройства 5 автоматического регулирования уровня сигнала, дифференцирующего устройства 6, двухполупериодного выпрямителя 7, первого фильтра 8 нижних частот, пикового детектора 9 и второго фильтра 10 нижних частот. The device contains a serially connected receiver 1 of a speech signal, an amplifier 2, a formant filter 3, and a channel 4 for evaluating a formant frequency, consisting of series-connected devices 5 for automatic signal level control, differentiating device 6, a half-wave rectifier 7, a first low-pass filter 8, a peak detector 9 and a second low pass filter 10.

Устройство работает следующим образом. The device operates as follows.

Речевой сигнал от приемника 1, например микрофона, поступает на усилитель 2 и затем на формантный фильтр 3, реализуемый, например, в виде полосового фильтра. На выходе формантного фильтра 3 получают сигнал отфильтрованного формантного колебания. Отфильтрованный сигнал формантного колебания поступает в канал 4 оценки частоты форманты на устройство 5 автоматического регулирования амплитуды сигнала, нормирующего амплитуду формантного колебания на каждом периоде основного тона. Эта операция позволяет устранить зависимость измеряемой частоты формантного колебания от изменений уровня речевого сигнала на входе устройства. Нормированный по амплитуде сигнал формантного колебания поступает на дифференцирующее устройство 6, на выходе которого амплитуда сигнала на периоде основного тона пропорциональна частоте формантного колебания. Однако эта зависимость справедлива лишь для сигнала, не подверженного воздействию импульсных помех. С учетом фактора помех необходимо измерять на амплитуду сигнала, а амплитуду его интенсивности на периоде основного тона. Эта операция осуществляется с помощью двухполупериодного выпрямителя 7, первого фильтра 8 нижних частот с постоянной времени больше периода формантного колебания, но меньше периода основного тона и пикового детектора 9. На выходе пикового детектора получают амплитудную огибающую интенсивности продифференцированного формантного колебания. Полученная амплитудная огибающая является функцией частоты формантного колебания. Однако полученная функция формантной частоты пульсирует с частотой основного тона. Для сглаживания этой пульсации полученный на выходе пикового детектора 9 сигнал пропускается через второй фильтр 10 нижних частот с постоянной времени больше периода основного тона, но меньше длительности коротких звуков речи. В результате на выходе второго фильтра нижних частот получают сигнал, величина которого пропорциональна формантной частоте, не зависит от изменений частоты основного тона и устойчива к воздействию импульсных помех. The speech signal from the receiver 1, for example a microphone, is fed to the amplifier 2 and then to the formant filter 3, implemented, for example, in the form of a band-pass filter. At the output of the formant filter 3, a filtered formant oscillation signal is obtained. The filtered formant oscillation signal enters the formant frequency estimation channel 4 to the device 5 for automatically adjusting the amplitude of the signal normalizing the amplitude of the formant oscillation for each period of the fundamental tone. This operation allows you to eliminate the dependence of the measured frequency of the formant oscillation from changes in the level of the speech signal at the input of the device. The amplitude-normalized signal of the formant oscillation is fed to a differentiating device 6, at the output of which the amplitude of the signal over the period of the fundamental tone is proportional to the frequency of the formant oscillation. However, this dependence is valid only for a signal that is not subject to pulsed interference. Given the interference factor, it is necessary to measure the amplitude of the signal, and the amplitude of its intensity over the period of the fundamental tone. This operation is carried out using a half-wave rectifier 7, the first low-pass filter 8 with a time constant greater than the period of the formant oscillation, but less than the period of the fundamental tone and peak detector 9. At the output of the peak detector, the amplitude envelope of the intensity of the differentiated formant oscillation is obtained. The resulting amplitude envelope is a function of the frequency of the formant oscillation. However, the obtained function of the formant frequency pulsates with the frequency of the fundamental tone. To smooth out this ripple, the signal received at the output of peak detector 9 is passed through a second low-pass filter 10 with a time constant greater than the period of the fundamental tone, but less than the duration of short speech sounds. As a result, at the output of the second low-pass filter, a signal is obtained, the value of which is proportional to the formant frequency, does not depend on changes in the frequency of the fundamental tone and is resistant to pulsed noise.

Анализатор необходимого для решения конкретной задачи числа формантных частот может быть построен путем использования соответствующего числа формантных фильтров 3 с каналами 4 оценки частоты форманты, подключенных к выходу усилителя 2. An analyzer of the number of formant frequencies necessary to solve a particular problem can be constructed by using the corresponding number of formant filters 3 with channels 4 for estimating the frequency of the formant connected to the output of amplifier 2.

Достигаемое в устройстве повышение точности измерения частоты форманты при воздействии импульсных помех позволяет повысить надежность распознавания речевых сигналов в системах речевого ввода информации и управления. Повышение точности измерения формантных частот при изменении частоты основного тона дает возможность реализовать режим обучения артикуляции звуков в составе требуемых звукосочетаний. Это важно также и для обучения иностранной речи. Следовательно, заявляемое устройство имеет более широкую сферу применения в системах, основанных на речевой технологии обработки информации, улучшает их потребительские характеристики и повышает социальную значимость. (56) 1. Патент США N 3548100, кл. G 01 L 1/00, 1970. Achieved in the device, improving the accuracy of measuring the frequency of the formant when exposed to pulsed noise improves the reliability of recognition of speech signals in speech input systems and control systems. Improving the accuracy of measuring formant frequencies when changing the frequency of the fundamental tone makes it possible to implement a training mode for articulating sounds as part of the required sound combinations. It is also important for teaching foreign speech. Therefore, the claimed device has a wider scope in systems based on speech technology of information processing, improves their consumer characteristics and increases social significance. (56) 1. U.S. Patent No. 3,548,100, cl. G 01 L 1/00, 1970.

2. Авторское свидетельство СССР N 585519, кл. G 01 L 1/02, 1977. 2. USSR author's certificate N 585519, cl. G 01 L 1/02, 1977.

Claims (1)

УСТРОЙСТВО ДЛЯ ИЗМЕРЕНИЯ ФОРМАНТНОЙ ЧАСТОТЫ РЕЧЕВОГО СИГНАЛА , содеpжащее последовательно соединенные пpиемник pечевого сигнала, усилитель, фоpмантный фильтp и канал оценки частоты, состоящий из пикового детектоpа и последовательно соединенных узла автоматического pегулиpования уpовня сигнала, диффеpенциpующего узла и двухполупеpиодного выпpямителя, отличающееся тем, что канал оценки частоты содеpжит пеpвый фильтp нижних частот с постоянной вpемени больше пеpиода измеpяемой фоpманты, но меньше пеpиода основного тока, вход котоpого соединен с выходом двухполупеpиодного выпpямителя, а выход соединен с входом пикового детектоpа, и втоpой фильтp нижних частот с постоянной вpемени больше пеpиода основного тока, но меньше длительности коpотких звуков pечи, выход котоpого является выходом устpойства, а вход соединен с выходом пикового детектоpа. DEVICE FOR MEASURING THE FORMANT SPEED OF A SPEECH SIGNAL, which contains a serially connected receiver of a speech signal, an amplifier, an in-line filter and a channel for frequency estimation, consisting of a peak detector and a series-connected unit for automatic control of the signal level, a differentiator of the It contains the first low-pass filter with a constant time greater than the period of the measured form, but less than the period of the main current, the input of which is connected to the output of a two-half-wave rectifier, and the output is connected to the input of the peak detector, and the second low-pass filter with constant time is longer than the main current period, but less than the duration of short speech sounds, the output of which is the output of the device, and the input is connected to the output of the peak detector.
SU5039431 1992-04-29 1992-04-29 Device for measuring formant frequency of speech signal RU2010354C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU5039431 RU2010354C1 (en) 1992-04-29 1992-04-29 Device for measuring formant frequency of speech signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU5039431 RU2010354C1 (en) 1992-04-29 1992-04-29 Device for measuring formant frequency of speech signal

Publications (1)

Publication Number Publication Date
RU2010354C1 true RU2010354C1 (en) 1994-03-30

Family

ID=21602845

Family Applications (1)

Application Number Title Priority Date Filing Date
SU5039431 RU2010354C1 (en) 1992-04-29 1992-04-29 Device for measuring formant frequency of speech signal

Country Status (1)

Country Link
RU (1) RU2010354C1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2546311C2 (en) * 2012-09-06 2015-04-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Воронежский государственный университет" (ФГБУ ВПО "ВГУ") Method of estimating base frequency of speech signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2546311C2 (en) * 2012-09-06 2015-04-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Воронежский государственный университет" (ФГБУ ВПО "ВГУ") Method of estimating base frequency of speech signal

Similar Documents

Publication Publication Date Title
US8428945B2 (en) Acoustic signal classification system
Murty et al. Characterization of glottal activity from speech signals
Tchorz et al. SNR estimation based on amplitude modulation analysis with applications to noise suppression
US5276765A (en) Voice activity detection
EP0548054B1 (en) Voice activity detector
US5381512A (en) Method and apparatus for speech feature recognition based on models of auditory signal processing
US3855416A (en) Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment
Brookes et al. A quantitative assessment of group delay methods for identifying glottal closures in voiced speech
Liu et al. Fundamental frequency estimation based on the joint time-frequency analysis of harmonic spectral structure
US4164626A (en) Pitch detector and method thereof
JPH10254476A (en) Voice interval detecting method
Fant et al. Formant‐amplitude measurements
JPS6060080B2 (en) voice recognition device
RU2010354C1 (en) Device for measuring formant frequency of speech signal
KR101621778B1 (en) Alcohol Analyzing Method, Recording Medium and Apparatus For Using the Same
Cheng et al. Some comparisons among several pitch detection algorithms
Traunmüller Perception of speaker sex, age, and vocal effort
Alku et al. Effects of bandwidth on glottal airflow waveforms estimated by inverse filtering
KR940009696A (en) Apparatus and method for measuring distortion of audio signal
Knorr Reliable voiced/unvoiced decision
Kodukula Significance of excitation source information for speech analysis
JP3520430B2 (en) Left and right sound image direction extraction method
Strik et al. Comparing methods for automatic extraction of voice source parameters from continuous speech.
Sood et al. A Robust Speaker Identification System for Natural and Whispered Speech
JP2001013977A (en) Formant stressing device of speech vector