RU2010354C1 - Device for measuring formant frequency of speech signal - Google Patents
Device for measuring formant frequency of speech signal Download PDFInfo
- Publication number
- RU2010354C1 RU2010354C1 SU5039431A RU2010354C1 RU 2010354 C1 RU2010354 C1 RU 2010354C1 SU 5039431 A SU5039431 A SU 5039431A RU 2010354 C1 RU2010354 C1 RU 2010354C1
- Authority
- RU
- Russia
- Prior art keywords
- formant
- frequency
- output
- speech
- peak detector
- Prior art date
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Description
Изобретение относится к технике анализа и распознавания речи и может быть использовано для речевого управления автоматизированными системами, в системах обучения иностранной речи, в системах обучения правильной речи глухих и людей с нарушенной функцией речеобразования. The invention relates to techniques for the analysis and recognition of speech and can be used for voice control of automated systems, in foreign language learning systems, in systems for teaching the correct speech of the deaf and people with impaired speech function.
Известны устройства измерения формантной частоты отфильтрованного сигнала путем оценки частоты гармоники основного тона с небольшой амплитудой [1] . Полученные таким образом оценки формантной частоты зависят от изменений частоты основного тока на интервале звучания речевого сигнала. Таким образом, в получаемую оценку формантной частоты вносится неконтролируемая погрешность. Known devices for measuring the formant frequency of the filtered signal by estimating the frequency of the harmonic of the fundamental tone with a small amplitude [1]. The estimates of the formant frequency obtained in this way depend on the changes in the frequency of the main current in the interval of sounding of the speech signal. Thus, an uncontrolled error is introduced in the resulting estimate of the formant frequency.
Известны устройства измерения формантной частоты отфильтрованного сигнала независимо от изменений частоты основного тона путем измерения амплитуды производной нормированного сигнала с помощью пикового детектора [2] . Независимость от основного тона измеряемой частоты форманты достигается тем, что оценка частоты форманты производится внутри периода основного тона. Недостатком такого устройства является большая погрешность измерения частоты форманты при воздействии акустических импульсных помех. Данное устройство выбрано за прототип. Known devices for measuring the formant frequency of the filtered signal, regardless of changes in the frequency of the fundamental tone by measuring the amplitude of the derivative of the normalized signal using a peak detector [2]. Independence of the fundamental tone of the measured frequency of the formant is achieved by the fact that the frequency of the formant is estimated within the period of the fundamental tone. The disadvantage of this device is the large error in measuring the frequency of the formant when exposed to acoustic pulsed interference. This device is selected for the prototype.
Для повышения надежности и точности измерения формантной частоты при воздействии импульсных помех и изменениях частоты основного тона в устройство, содержащее источник речевого сигнала, усилитель, формантный фильтр и канал оценки частоты форманты, состоящий из устройства автоматической регулировки уровня сигнала, дифференцирующего устройства, двухполупериодного выпрямителя и пикового детектора, входящие в состав канала оценки частоты форманты дифференцирующее устройство, двухполупериодный выпрямитель и пиковый детектор включены последовательно и введены два фильтра нижних частот, причем первый фильтр нижних частот с постоянной времени больше периода измеряемой форманты, но меньше периода основного тона включен между выходом двухполупериодного выпрямителя и входом пикового детектора, а второй фильтр нижних частот с постоянной времени больше периода основного тона, но меньше длительности коротких звуков речи подключен к выходу пикового детектора. To increase the reliability and accuracy of measuring the formant frequency under the influence of pulsed noise and changes in the frequency of the fundamental tone into a device containing a speech signal source, an amplifier, a formant filter and a formant frequency estimation channel, consisting of an automatic signal level control device, a differentiating device, a half-wave rectifier, and a peak detectors, which are part of the formant frequency estimation channel, a differentiating device, a half-wave rectifier, and a peak detector are included two low-pass filters are sequentially introduced, the first low-pass filter with a time constant greater than the period of the measured formant but shorter than the fundamental period included between the output of a half-wave rectifier and the peak detector input, and the second low-pass filter with a time constant greater than the fundamental period, but shorter duration short speech sounds connected to the output of the peak detector.
Повышение точности оценки частоты форманты при изменении частоты основного тона достигается тем, что оценка частоты форманты производится внутри периода основного тона по максимумам функции интенсивности огибающей производной сигнала с помощью пикового детектора, а также сглаживанием функции формантной частоты вторым фильтром нижних частот. Повышение точности оценки формантной частоты при воздействии импульсных помех достигается сглаживанием функции модуля производной и функции формантной частоты первым и вторым фильтрами нижних частот. Improving the accuracy of estimating the frequency of the formant when changing the frequency of the fundamental tone is achieved by estimating the frequency of the formant inside the period of the fundamental tone using the maxima of the intensity function of the envelope of the derivative of the signal using a peak detector, as well as by smoothing the function of the formant frequency with a second low-pass filter. Improving the accuracy of estimation of the formant frequency under the influence of pulsed noise is achieved by smoothing the derivative module function and the formant frequency function by the first and second low-pass filters.
На чертеже дана структурная схема предлагаемого устройства для измерения формантной частоты речевого сигнала. The drawing shows a structural diagram of the proposed device for measuring the formant frequency of a speech signal.
Устройство содержит последовательно соединенные приемник 1 речевого сигнала, усилитель 2, формантный фильтр 3 и канал 4 оценки формантной частоты, состоящий из последовательно соединенных устройства 5 автоматического регулирования уровня сигнала, дифференцирующего устройства 6, двухполупериодного выпрямителя 7, первого фильтра 8 нижних частот, пикового детектора 9 и второго фильтра 10 нижних частот. The device contains a serially connected receiver 1 of a speech signal, an amplifier 2, a formant filter 3, and a channel 4 for evaluating a formant frequency, consisting of series-connected devices 5 for automatic signal level control, differentiating device 6, a half-wave rectifier 7, a first low-pass filter 8, a peak detector 9 and a second low pass filter 10.
Устройство работает следующим образом. The device operates as follows.
Речевой сигнал от приемника 1, например микрофона, поступает на усилитель 2 и затем на формантный фильтр 3, реализуемый, например, в виде полосового фильтра. На выходе формантного фильтра 3 получают сигнал отфильтрованного формантного колебания. Отфильтрованный сигнал формантного колебания поступает в канал 4 оценки частоты форманты на устройство 5 автоматического регулирования амплитуды сигнала, нормирующего амплитуду формантного колебания на каждом периоде основного тона. Эта операция позволяет устранить зависимость измеряемой частоты формантного колебания от изменений уровня речевого сигнала на входе устройства. Нормированный по амплитуде сигнал формантного колебания поступает на дифференцирующее устройство 6, на выходе которого амплитуда сигнала на периоде основного тона пропорциональна частоте формантного колебания. Однако эта зависимость справедлива лишь для сигнала, не подверженного воздействию импульсных помех. С учетом фактора помех необходимо измерять на амплитуду сигнала, а амплитуду его интенсивности на периоде основного тона. Эта операция осуществляется с помощью двухполупериодного выпрямителя 7, первого фильтра 8 нижних частот с постоянной времени больше периода формантного колебания, но меньше периода основного тона и пикового детектора 9. На выходе пикового детектора получают амплитудную огибающую интенсивности продифференцированного формантного колебания. Полученная амплитудная огибающая является функцией частоты формантного колебания. Однако полученная функция формантной частоты пульсирует с частотой основного тона. Для сглаживания этой пульсации полученный на выходе пикового детектора 9 сигнал пропускается через второй фильтр 10 нижних частот с постоянной времени больше периода основного тона, но меньше длительности коротких звуков речи. В результате на выходе второго фильтра нижних частот получают сигнал, величина которого пропорциональна формантной частоте, не зависит от изменений частоты основного тона и устойчива к воздействию импульсных помех. The speech signal from the receiver 1, for example a microphone, is fed to the amplifier 2 and then to the formant filter 3, implemented, for example, in the form of a band-pass filter. At the output of the formant filter 3, a filtered formant oscillation signal is obtained. The filtered formant oscillation signal enters the formant frequency estimation channel 4 to the device 5 for automatically adjusting the amplitude of the signal normalizing the amplitude of the formant oscillation for each period of the fundamental tone. This operation allows you to eliminate the dependence of the measured frequency of the formant oscillation from changes in the level of the speech signal at the input of the device. The amplitude-normalized signal of the formant oscillation is fed to a differentiating device 6, at the output of which the amplitude of the signal over the period of the fundamental tone is proportional to the frequency of the formant oscillation. However, this dependence is valid only for a signal that is not subject to pulsed interference. Given the interference factor, it is necessary to measure the amplitude of the signal, and the amplitude of its intensity over the period of the fundamental tone. This operation is carried out using a half-wave rectifier 7, the first low-pass filter 8 with a time constant greater than the period of the formant oscillation, but less than the period of the fundamental tone and peak detector 9. At the output of the peak detector, the amplitude envelope of the intensity of the differentiated formant oscillation is obtained. The resulting amplitude envelope is a function of the frequency of the formant oscillation. However, the obtained function of the formant frequency pulsates with the frequency of the fundamental tone. To smooth out this ripple, the signal received at the output of peak detector 9 is passed through a second low-pass filter 10 with a time constant greater than the period of the fundamental tone, but less than the duration of short speech sounds. As a result, at the output of the second low-pass filter, a signal is obtained, the value of which is proportional to the formant frequency, does not depend on changes in the frequency of the fundamental tone and is resistant to pulsed noise.
Анализатор необходимого для решения конкретной задачи числа формантных частот может быть построен путем использования соответствующего числа формантных фильтров 3 с каналами 4 оценки частоты форманты, подключенных к выходу усилителя 2. An analyzer of the number of formant frequencies necessary to solve a particular problem can be constructed by using the corresponding number of formant filters 3 with channels 4 for estimating the frequency of the formant connected to the output of amplifier 2.
Достигаемое в устройстве повышение точности измерения частоты форманты при воздействии импульсных помех позволяет повысить надежность распознавания речевых сигналов в системах речевого ввода информации и управления. Повышение точности измерения формантных частот при изменении частоты основного тона дает возможность реализовать режим обучения артикуляции звуков в составе требуемых звукосочетаний. Это важно также и для обучения иностранной речи. Следовательно, заявляемое устройство имеет более широкую сферу применения в системах, основанных на речевой технологии обработки информации, улучшает их потребительские характеристики и повышает социальную значимость. (56) 1. Патент США N 3548100, кл. G 01 L 1/00, 1970. Achieved in the device, improving the accuracy of measuring the frequency of the formant when exposed to pulsed noise improves the reliability of recognition of speech signals in speech input systems and control systems. Improving the accuracy of measuring formant frequencies when changing the frequency of the fundamental tone makes it possible to implement a training mode for articulating sounds as part of the required sound combinations. It is also important for teaching foreign speech. Therefore, the claimed device has a wider scope in systems based on speech technology of information processing, improves their consumer characteristics and increases social significance. (56) 1. U.S. Patent No. 3,548,100, cl. G 01 L 1/00, 1970.
2. Авторское свидетельство СССР N 585519, кл. G 01 L 1/02, 1977. 2. USSR author's certificate N 585519, cl. G 01 L 1/02, 1977.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU5039431 RU2010354C1 (en) | 1992-04-29 | 1992-04-29 | Device for measuring formant frequency of speech signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU5039431 RU2010354C1 (en) | 1992-04-29 | 1992-04-29 | Device for measuring formant frequency of speech signal |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2010354C1 true RU2010354C1 (en) | 1994-03-30 |
Family
ID=21602845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SU5039431 RU2010354C1 (en) | 1992-04-29 | 1992-04-29 | Device for measuring formant frequency of speech signal |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2010354C1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2546311C2 (en) * | 2012-09-06 | 2015-04-10 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Воронежский государственный университет" (ФГБУ ВПО "ВГУ") | Method of estimating base frequency of speech signal |
-
1992
- 1992-04-29 RU SU5039431 patent/RU2010354C1/en active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2546311C2 (en) * | 2012-09-06 | 2015-04-10 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Воронежский государственный университет" (ФГБУ ВПО "ВГУ") | Method of estimating base frequency of speech signal |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8428945B2 (en) | Acoustic signal classification system | |
Murty et al. | Characterization of glottal activity from speech signals | |
Tchorz et al. | SNR estimation based on amplitude modulation analysis with applications to noise suppression | |
US5276765A (en) | Voice activity detection | |
EP0548054B1 (en) | Voice activity detector | |
US5381512A (en) | Method and apparatus for speech feature recognition based on models of auditory signal processing | |
US3855416A (en) | Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment | |
Brookes et al. | A quantitative assessment of group delay methods for identifying glottal closures in voiced speech | |
Liu et al. | Fundamental frequency estimation based on the joint time-frequency analysis of harmonic spectral structure | |
US4164626A (en) | Pitch detector and method thereof | |
JPH10254476A (en) | Voice interval detecting method | |
Fant et al. | Formant‐amplitude measurements | |
JPS6060080B2 (en) | voice recognition device | |
RU2010354C1 (en) | Device for measuring formant frequency of speech signal | |
KR101621778B1 (en) | Alcohol Analyzing Method, Recording Medium and Apparatus For Using the Same | |
Cheng et al. | Some comparisons among several pitch detection algorithms | |
Traunmüller | Perception of speaker sex, age, and vocal effort | |
Alku et al. | Effects of bandwidth on glottal airflow waveforms estimated by inverse filtering | |
KR940009696A (en) | Apparatus and method for measuring distortion of audio signal | |
Knorr | Reliable voiced/unvoiced decision | |
Kodukula | Significance of excitation source information for speech analysis | |
JP3520430B2 (en) | Left and right sound image direction extraction method | |
Strik et al. | Comparing methods for automatic extraction of voice source parameters from continuous speech. | |
Sood et al. | A Robust Speaker Identification System for Natural and Whispered Speech | |
JP2001013977A (en) | Formant stressing device of speech vector |