SU1781701A1 - Method of separation of speech and nonstationary noise signals - Google Patents

Method of separation of speech and nonstationary noise signals Download PDF

Info

Publication number
SU1781701A1
SU1781701A1 SU904870056A SU4870056A SU1781701A1 SU 1781701 A1 SU1781701 A1 SU 1781701A1 SU 904870056 A SU904870056 A SU 904870056A SU 4870056 A SU4870056 A SU 4870056A SU 1781701 A1 SU1781701 A1 SU 1781701A1
Authority
SU
USSR - Soviet Union
Prior art keywords
signal
speech
zero
signals
noise
Prior art date
Application number
SU904870056A
Other languages
Russian (ru)
Inventor
Aleksandr P Molchanov
Lyudmila N Babkina
Boris G Denison
Original Assignee
Le Nii Vektor
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Le Nii Vektor filed Critical Le Nii Vektor
Priority to SU904870056A priority Critical patent/SU1781701A1/en
Application granted granted Critical
Publication of SU1781701A1 publication Critical patent/SU1781701A1/en

Links

Description

Изобретение относится к измерительной технике и может быть использовано при создании устройств для анализа сигналов сложной формы, применяемых в технике связи, акустике, в системах распознавания речевых и иных сигналов.The invention relates to measuring technique and can be used to create devices for the analysis of complex waveforms used in communication technology, acoustics, in speech recognition systems and other signals.

Известен способ распознавания речевых сигналов в телефонной линии по оценке наличия в них пауз характерной длительности. Недостатком такого способа является необходимость использования достаточно длительной выборки анализируемого сигнала не менее нескольких десятков секунд для выявления и определения распределения длительностей, встречающихся в нем пауз.There is a method of recognizing speech signals in a telephone line by assessing the presence of pauses of characteristic duration in them. The disadvantage of this method is the need to use a sufficiently long sample of the analyzed signal for at least several tens of seconds to identify and determine the distribution of the durations of pauses encountered in it.

Наиболее близким к заявленному способу разделения сигналов на речевые и неречевые является известный способ классификации речевых сигналов, в котором предусматривается усиление анализируемого сигнала, фильтрация его через НЧ фильтр с частотой среза 3 кГц, ограничение по амплитуде и цифровое кодирование с последующим сравнением нулевых переходов в анализируемом сигнале с заданным значением, определенным для сигналов других типов. Для реализации способа создано устройство, содержащее последовательно соединенные усилитель, фильтр, ограничитель. АЦП с компараторами) Ограничитель описанного устройства выполнен на двух встречно включенных диодах.Closest to the claimed method of separating signals into speech and non-speech is a known method for classifying speech signals, which provides for the amplification of the analyzed signal, filtering it through an low-pass filter with a cutoff frequency of 3 kHz, amplitude limitation and digital coding, followed by comparison of zero transitions in the analyzed signal with a setpoint defined for other types of signals. To implement the method, a device is created that contains a series-connected amplifier, filter, limiter. ADC with comparators) The limiter of the described device is made on two on-board diodes.

Недостатком вышеописанного способа является его низкая помехоустойчивость по отношению к помехам типа белого шума.The disadvantage of the above method is its low noise immunity with respect to interference such as white noise.

Проведенные исследования показали, что разделение речевых сигналов и сигналов типа нестационарного шума с помощью описанного выше способа идет эффективно лишь в том случае, если отношение сигнал/ шум для речевого сигнала не менее 10.Studies have shown that the separation of speech signals and signals such as transient noise using the method described above is effective only if the signal-to-noise ratio for the speech signal is at least 10.

Уже при отношении сигнал/шум менее 8Already with a signal to noise ratio of less than 8

1781701 АТ наблюдается существенное ухудшение вероятности правильной классификации.1781701 AT there is a significant deterioration in the probability of correct classification.

Целью изобретения является повышение помехоустойчивости разделения речевых и нестационарных шумовых сигналов.The aim of the invention is to increase the noise immunity of the separation of speech and non-stationary noise signals.

Для достижения поставленной цели в способе разделения речевых и нестационарных шумовых сигналов, заключающемся. в усилений анализируемого сигнала, его низкочастотной фильтрации, определении значений чйСЙ'^’Тгуле.Зых переходов полученного сигна/Га с последующим сравнением их с.пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, после низкочастотной фильтрации анализируемого сигнала в его выборке выделяют участки с наибольшей интенсивностью, для которых определяют значение числа нулевых переходов, .... /To achieve this goal in the method of separation of speech and non-stationary noise signals, which consists in. in amplifications of the analyzed signal, its low-pass filtering, determination of the values of nCJ '^' Tgule. Of the transitions of the received signal / Ha with their subsequent comparison with the threshold value, the results of which identify speech and non-stationary noise signals, after low-frequency filtering of the analyzed signal in its sample areas with the highest intensity are distinguished, for which the value of the number of zero transitions is determined, .... /

Значение числа переходов анализируемого сигнала через ноль, определенное только для его участков с наибольшей энергией в случае речевого сигнала, в меньшей степени зависит от отношения сигнал/шум, чем значение числа переходов через ноль, определенное для всей выборки речевого сигнала.The value of the number of transitions of the analyzed signal through zero, determined only for its sections with the highest energy in the case of a speech signal, is less dependent on the signal-to-noise ratio than the value of the number of transitions through zero, determined for the entire sample of the speech signal.

В то же время для нестационарных шумовых сигналов значения числа’переходов через ноль как для всей выборки, так и для ее участков с наибольшей энергией близки друг к другу и мало зависят от отношения сигнал/шум. Таким образом, в предлагаемом способе отличие в значениях числа переходов разделяемых сигналов через ноль оказывается менее зависимым от отношения сигнал/шум, т.е. более помехоустойчивым, в чем и состоит полезность предлагаемого способа..At the same time, for non-stationary noise signals, the values of the number of transitions through zero for both the entire sample and for its sections with the highest energy are close to each other and depend little on the signal-to-noise ratio. Thus, in the proposed method, the difference in the values of the number of transitions of the shared signals through zero is less dependent on the signal-to-noise ratio, i.e. more noise-resistant, which is the usefulness of the proposed method ..

На фиг.1 изображена функциональная схема, реализующая предлагаемый способ раз/деления речевых и нестационарных шумовых сигналов: на фиг.2 - гистограммы значений чисел перехода речевых сигналов (пунктир) и нестационарных шумовых сигналов (сплошная линия) через ноль, определенных для всей выборки сигналов (а,б) и для наибольших элементов в выборках сигналов (в.г) при различных отношениях сигнал/шум: (а,в) - отношении сигнал/шум 10, (б,г) - сигнал/шум 5.Figure 1 shows a functional diagram that implements the proposed method for splitting speech and non-stationary noise signals: figure 2 is a histogram of the values of the transition numbers of speech signals (dashed line) and non-stationary noise signals (solid line) through zero, defined for the entire sample of signals (a, b) and for the largest elements in the signal samples (v.g) for various signal-to-noise ratios: (a, c) - signal-to-noise ratio 10, (b, d) - signal-to-noise 5.

На фиг.1 использованы следующие обозначения: 1 - источник сигналов: 2 усилитель: 3 - фильтр низких частот: 4 выделитель элементов выборки сигнала; 5 определитель числа переходов через ноль для элементов выборки сигналов; 6 - определитель энергии элементов выборки сигнала; 7 - блок запоминания значений числа переходов через ноль для элементов выборки сигнала и их энергией; 8 - выделитель элементов в выборках сигнала, имеющих наибольшую энергию (интенсивность); 9 определитель средней частоты переходов через ноль для выделенных элементов выборки сигнала; 10 - блок сравнения; 11 источник порогового значения.In Fig.1, the following notation is used: 1 - signal source: 2 amplifier: 3 - low-pass filter: 4 signal sampler selector; 5 determinant of the number of transitions through zero for the elements of the sample signals; 6 - the determinant of the energy of the elements of the sample signal; 7 - block storing the values of the number of transitions through zero for the elements of the sample signal and their energy; 8 - selector elements in the samples of the signal having the highest energy (intensity); 9 determinant of the average frequency of transitions through zero for the selected elements of the sample signal; 10 is a comparison unit; 11 source of the threshold value.

По предлагаемому способу сигнал после усиления и фильтрации делят на элементы, для каждого из которыхопределяют число переходов через ноль и энергию. Полученные данные запоминают для всех элементов, входящих в выборку анализируемого сигнала. После чего определяют среднюю частоту перехода через ноль для элементов, имеющих наибольшую энергию (например, превышающую от значения максимальной.энергии элемента в данной выборке). Полученное значение средней частоты перехода через ноль сравнивают с пороговым значением, на основании чего и производят разделение речевых и шумовых нестационарных сигналов.According to the proposed method, the signal after amplification and filtering is divided into elements, for each of which the number of transitions through zero and energy is determined. The obtained data is stored for all elements included in the sample of the analyzed signal. After that, the average transition frequency through zero is determined for the elements having the highest energy (for example, exceeding the value of the maximum energy of the element in this sample). The obtained value of the average frequency of crossing through zero is compared with a threshold value, on the basis of which the separation of speech and noise non-stationary signals is performed.

Функциональная схема на фиг.1, рвализующая предлагаемый способ, включает в себя источник сигнала 1, усилитель 2, . фильтр 3, выделитель элементов выборки сигнала 4, определитель числа переходов сигнала через ноль для элемента выборки сигнала 5. определитель энергии элемента выборки сигнала 6. Блок запоминания значений числа переходов через ноль и энергий элементов, входящих в выборку сигнала 7, выделитель элементов с наибольшей энергией 8, определитель значения средней частоты перехода через ноль для элементов с наибольшей энергией 9, схема сравнения 10, источник порогового значения 11. .The functional diagram of figure 1, which rolls the proposed method, includes a signal source 1, amplifier 2,. filter 3, selector of sample elements of signal 4, determinant of the number of transitions of the signal through zero for the element of sample of signal 5. determinant of energy of the element of sample of signal 6. Block for storing the values of the number of transitions through zero and energy of elements included in the sample of signal 7, selector of elements with the highest energy 8, determinant of the value of the average frequency of crossing through zero for the elements with the highest energy 9, comparison circuit 10, the source of the threshold value 11..

Выполнение описанных выше операций в функциональной схеме, изображенной на фиг.1, обеспечивается тем, что выход источника сигнала 1, соединен со входом усилителя 2, выход которого соединен со входом фильтра 3, выход которого соединен со входом выделителя элементов выборки сигнала 4, один из выходов которого соединен со входом определителя числа переходов через ноль для элемента выборки сигнала 5, выход которого соединен со входом блока запоминания 7, другой вход которого соединен с выходом определителя энергии элемента выборки сигнала 6, один вход которого соединен со вторым выходом выделителя элементов выборки сигнала 4, а второй вход соединен с выходом фильтра 3, причем’выход блока запоминания 7 соединен со входом выделителя элементов с наибольшей энергией (интенсивностью) 8,The execution of the above operations in the functional diagram shown in figure 1, is ensured by the fact that the output of the signal source 1 is connected to the input of the amplifier 2, the output of which is connected to the input of the filter 3, the output of which is connected to the input of the extractor of the sample elements of the signal 4, one of the outputs of which are connected to the input of the determinant of the number of transitions through zero for the sample element of signal 5, the output of which is connected to the input of the storage unit 7, the other input of which is connected to the output of the energy determinant of the sample element of signal 6, whose input is connected to the second output signal extractor sampling units 4, and a second input connected to the output of the filter 3, prichem'vyhod memory unit 7 is connected to the input of extractor elements with the highest energy (intensity) 8

1781701 6 выход которого соединен с определителем средней частоты перехода через ноль для выделенных элементов выборки сигнала 9, выход которого соединен со входом схемы сравнения 10, другой вход которой соедй- 5 нен с выходом источника порогового значения 11, а выход схемы сравнения 10 является выход всей схемы,1781701 6 whose output is connected to the determinant of the average frequency of crossing through zero for the selected elements of the signal 9, the output of which is connected to the input of the comparison circuit 10, the other input of which is connected to the output of the threshold value source 11, and the output of the comparison circuit 10 is the output of the whole schemes,

Практическая реализация узлов, входящих в функциональную схему, изображен- 10 ную на фиг.1, может быть выполнена на серийно выпускаемых элементах.The practical implementation of the nodes included in the functional diagram depicted in FIG. 1 can be performed on commercially available elements.

Так усилитель 2 и фильтр низких частот 3, выполняются на операционных усилителях по типовым схемам (например, на мик- 15 росхемах типа 140 IVD2A и 140 IVD4).So, amplifier 2 and low-pass filter 3 are performed on operational amplifiers according to standard schemes (for example, on microcircuits of type 140 IVD2A and 140 IVD4).

Выделитель элементов выборки сигнала 4 может быть реализован в соответствии со схемой сегментатора, описанной в авторском свидетельстве № 485565. 20The extractor of the elements of the sample signal 4 can be implemented in accordance with the segmentator circuit described in the copyright certificate No. 485565. 20

В простейшем случае в качестве выделителя элементов выборки сигнала 4 может использоваться ключевая схема, управляемая интегральным программируемым (например, 580 ВИ 53) или непрог- 25 раммируемым (например, 1006 ВИ1) таймером с периодом порядка 10 мс.In the simplest case, a key circuit controlled by an integrated programmable (for example, 580 VI 53) or non-programmable (for example, 1006 VI 1) timer with a period of about 10 ms can be used as a selector of sampling elements of signal 4.

Определитель числа переходов через ноль для элементов выборки сигналов 5 может быть реализован на интегральных ком- 30 параторе и счетчике (например, на микросхемах 597САЗА и 561 И ЕЮ). Определитель энергии элементов выборки сигнала 6 в простейшем случае может быть образован последовательно включенными двухполупе- 35 риодным измерительным выпрямителем, интегратором, схемой выборки хранения и аналого-цифровым преобразователем, управляемым узлом 4. Эти компоненты могут строиться на микросхемах 140УД20, 40' 544УД1А, 59ОКН12, 1100СК2Б. 1113ПВ1А и логических схемах малой интеграции.The determinant of the number of zero-crossings for the sample elements of signals 5 can be implemented on an integrated comparator and counter (for example, on 597CAZA and 561 ICs). In the simplest case, the energy determinant of signal sampling elements 6 can be formed by a bi-half-wave measuring rectifier, an integrator, a storage sampling circuit, and an analog-to-digital converter controlled by node 4. These components can be built on microcircuits 140UD20, 40 '544UD1A, 59OKN12, 1100SK2B. 1113PV1A and logic circuits of small integration.

Дальнейшую обработку целесообразно вести средствами микропроцессорного контроллера, имеющего оперативную память 45. достаточной емкости, выполняющей функции блока 7 запоминания значений числа переходов через ноль и энергии для элементов выборки сигнала.It is advisable to carry out further processing by means of a microprocessor controller having RAM 45. of sufficient capacity, which functions as a unit 7 for storing values of the number of transitions through zero and energy for signal sample elements.

Выделитель элементов с наибольшей 50 энергией 8 реализуется программно. Он осуществляет операцию выбора наиболь·: шего значения энергии (интенсивности) Ётах элемента из запомненных в блоке паМята и определяет номера тех элементов, 55The separator of elements with the largest 50 energy 8 is implemented in software. It carries out the operation of choosing the largest ·: of the energy (intensity) value Etot of the element from the memory memorized in the block and determines the numbers of those elements 55

В контроллере, выполняющем указанную операцию, может использоваться микропроцессорный комплект серии 580 с микросхемами памяти серии 537. Определитель средней частоты переходов через ноль для выделенных элементов выборки сигнала 9 выполняется с помощью того же контроллера.In the controller performing the indicated operation, the microprocessor kit of the 580 series with the memory chips of the 537 series can be used. The determinant of the average zero-crossing frequency for the selected signal sampling elements 9 is performed using the same controller.

Значения частот переходов через ноль для выделенных элементов складываются и полученная величина делится на число выделенных элементов.The values of the zero crossing frequencies for the selected elements are added up and the obtained value is divided by the number of selected elements.

Схема сравнения 10 реализуется программно средствами типового контроллера, выполняющего операцию вычитания двух чисел, занесенных в блок памяти.Comparison scheme 10 is implemented programmatically by means of a typical controller that performs the operation of subtracting two numbers entered in the memory block.

В качестве источника порогового значения 11, используется блок памяти, в заданной ячейке которого записано значение пороговой величины, определенное на основе анализа обучающих выборок разделяемых классов сигналов.As a source of threshold value 11, a memory block is used, in a given cell of which a threshold value is determined, which is determined based on the analysis of training samples of shared classes of signals.

В целом функции, выполняемые совокупностью узлов 7, 8, 9. 10, 11, могут быть полностью реализованы с помощью малых универсальных ЭВМ типа Электроника60М, СМ1425, ЕС1841 и т.п.In general, the functions performed by a set of nodes 7, 8, 9. 10, 11, can be fully implemented using small universal computers such as Electronics 60M, SM1425, EC1841, etc.

Для анализа причин, обуславливающих недостаточную помехоустойчивость существующих способов разделения речевых и нестационарных шумовых сигналов по частоте перехода через ноль, рассмотрим особенности временных структур разделяемых сигналов.To analyze the reasons for the lack of noise immunity of existing methods for separating speech and non-stationary noise signals by the frequency of transition through zero, we consider the features of the temporal structures of the shared signals.

Основной особенностью структуры речевых сигналов являются микропаузы.The main feature of the structure of speech signals are micropauses.

Наличие в речи микропауз обусловлено самой природой процесса формирования звуков речи. Так наличие прерываний во взрывных, фрикативных, дрожащих звуках создает микропаузы даже в намеренно непрерывной речи. К таким микропаузам прибавляются паузы между словами, интонационные паузы и т.п.The presence of micropause in speech is due to the very nature of the process of formation of speech sounds. So the presence of interruptions in explosive, fricative, trembling sounds creates micro-pauses even in intentionally continuous speech. Pauses between words, intonation pauses, etc. are added to such micro-pauses.

В целом вероятностное распределение пауз в непрерывной речи описывается распределением Вайбулла.In general, the probabilistic distribution of pauses in continuous speech is described by the Weibull distribution.

Таким образом, в выборке из речевого сигнала длительностью в 0,5 с суммарное . время пауз составит около 250 мс.Thus, in a sample of a speech signal with a duration of 0.5 s total. the pause time will be about 250 ms.

Частота перехода через ноль у чистого речевого сигнала в основном обусловлена частотой перехода на участках гласных звуков, которые занимают основное время в течении звучания речи. Характерные значезначения энергии интенсивности которых превышают величину —, где N - заранее заданная величина (например, 2).The frequency of zero crossing in a pure speech signal is mainly due to the frequency of transition in areas of vowels that take up most of the time during speech. Typical energy intensity values exceed the value -, where N is a predetermined value (for example, 2).

ния частоты перехода через ноль для гласных звуков гораздо ниже тактовых для нестационарного шума, что и позволяет по этому признаку разделять эти два класса сигналов.The transition frequency through zero for vowels is much lower than the clock frequencies for unsteady noise, which allows us to separate these two classes of signals by this criterion.

ΊΊ

В то же время появление шумовой помехи в речевом сигнале на участках гласных мало влияет на частоту перехода через ноль.At the same time, the appearance of noise interference in a speech signal in vowel sections has little effect on the frequency of transition through zero.

Однако на участках пауз шум обеспечивает резкое возрастание частоты переходов через ноль, что влияет на общее значение этого параметра, определенного по всей выборке анализируемого речевого сигнала.However, in the areas of pauses, noise provides a sharp increase in the frequency of transitions through zero, which affects the total value of this parameter, determined over the entire sample of the analyzed speech signal.

В то же время у шумового нестационарного сигнала паузы практически отсутствуют и, следовательно, наличие шумовой помехи у сигналов такого класса должно мало влиять на среднее Значение частоты перехода через, ноль. . .....'At the same time, there are practically no pauses for a non-stationary noise signal and, therefore, the presence of noise interference in signals of this class should have little effect on the average value of the transition frequency through, zero. . ..... '

Для проверки эффективности предлагаемого способа разделения речевых и нестацио'нарных шумовых сигналов был разработан и испытан макет, реализующий функциональную схему, изображенную на фиг.1.To verify the effectiveness of the proposed method for the separation of speech and non-stationary noise signals, a layout was developed and tested that implements the functional diagram shown in figure 1.

В качестве источника сигнала использовались: магнитофон Электроника-004 (для речевых сигналов) и генераторы Г2-57 SG 201 и ГЗ-101 (для шумовых сигналов).The following sources were used: Electronics-004 tape recorder (for speech signals) and generators G2-57 SG 201 and GZ-101 (for noise signals).

Формирование смеси сигнала с шумом осуществлялось сумматорами на операционных усилителях типа 140УД7.The signal-to-noise mixture was formed by adders on operational amplifiers of the 140UD7 type.

В качестве речевого сигнала использовалась повествовательная речь на различных языках. Длительность записей составляла не менее 3-х мин каждая. Всего было использовано при экспериментах 25 записей различных дикторов. При построении гистограмм использовалось не менее 100 выборок каждого сигнала. Длительность анализируемой выборки сигнала составляла менее 0,5 с. В качестве фильтра использовался активный PC фильтра Бесселя низких частот 10 порядка с частотой среза 4 кГц.As a speech signal, narrative speech in various languages was used. The duration of the recordings was at least 3 minutes each. In total, 25 recordings of various announcers were used in the experiments. When plotting the histograms, at least 100 samples of each signal were used. The duration of the analyzed signal sample was less than 0.5 s. An active PC Bessel filter of low order 10 frequencies with a cutoff frequency of 4 kHz was used as a filter.

Фильтр реализован на операционных усилителях 140УД7.The filter is implemented on operational amplifiers 140UD7.

Выделение элементов выборки сигнала осуществлялось с помощью тактового генератора (Г5-60), Длительность элемента составляла .10 мс. Всего в выборке использовалось 32 элемента.The selection of elements of the signal sample was carried out using a clock generator (G5-60), the duration of the element was .10 ms. A total of 32 elements were used in the sample.

Определитель энергии элемента сигнала реализовывался с помощью интегратора, собранного на операционном усилителе типа 544УД1А со схемой сброса на ключах 590КН5, срабатывающей от импульсов тактового генератора после задержки необходимой для записи сигнала интегратора схемой выборки-хранения 1100 СК2. Преобразование сигнала с выхода этой схемы в код производилось с помощью АЦП типа 1113ПВ1 А. Определитель частоты перехода через ноль для элемента сигнала реализо вывался с помощью микросхем типа 597САЗ и 133ИЕ5.The signal element energy determinant was implemented using an integrator assembled on an 544UD1A type operational amplifier with a 590KN5 key reset circuit, triggered by clock pulses after a delay of 1100 SK2 sample-storage circuit needed to record the integrator signal. The signal from the output of this circuit was converted to code using an 1113PV1 A type ADC. The zero-crossing frequency determiner for a signal element was implemented using 597CAZ and 133IE5 type microcircuits.

Код числа переходов через ноль и коде выхода АЦП в конце каждого элемента считывались через интерфейс ЭВМ по команде от тактового генератора.The code of the number of transitions through zero and the ADC output code at the end of each element were read through the computer interface by a command from the clock generator.

Блоки 7,8,9,10,11, а также алгоритмы управления экспериментом были реализованы средствами ЭВМ Электроника-60, программы управления считыванием данных. их накопления и предоставления результатов разрабатывались и отлаживались средствами операционной системы РАФОС на комплекс Электроника-В”, дополненном накопителем на гибких магнитных дисках Г МД-70.Blocks 7,8,9,10,11, as well as experiment control algorithms, were implemented by means of the Electronics-60 computer, data reading control programs. their accumulation and presentation of the results were developed and debugged by means of the RAFOS operating system for the Electronics-V complex, supplemented by the MD-70 floppy disk drive.

На фиг.2 представлены гистограммы, характеризующие эффективность существующего и предлагаемого способов разделения речевых и шумовых нестационарных сигналов.Figure 2 presents the histograms characterizing the effectiveness of the existing and proposed methods for the separation of speech and noise unsteady signals.

На фиг,2(а,б), представлены числа переходов через ноль, определенных по существующему способу, т.е. для всей выборки сигналов для речевых (пунктирная линия) и шумовых нестационарных сигналов (сплошная линия) при отсутствии помех (фиг.2а отношение сигнал/шум больше 10) и при их наличии (фиг.2б - отношение сигнал/шум равно 5).In Fig. 2 (a, b), the numbers of zero crossings determined by the existing method, i.e. for the entire sample of signals for speech (dashed line) and noise non-stationary signals (solid line) in the absence of interference (Fig.2a signal-to-noise ratio is greater than 10) and if any (Fig.2b - signal-to-noise ratio is 5).

Сопоставление гистограмм, изображенных на фиг.2(а и б), показывает, что в то время как для чистых сигналов оба класса по частоте переходов через ноль, определенной по существующему способу, хорошо разделяются, появление даже незначительной помехи резко ухудшает разделение сигналов. Так(Для отношения сигнал/шум, равного 5, вероятность ошибки разделения составляет 35%.A comparison of the histograms depicted in Fig. 2 (a and b) shows that while for pure signals both classes are well separated by the zero transition frequency determined by the existing method, the appearance of even a slight interference sharply worsens the signal separation. So (For a signal-to-noise ratio of 5, the probability of a separation error is 35%.

Характерно, что появление шумовой помехи мало влияет на характер гистограммы для нестационарного шума и ухудшение разделения сигналов идет за счет деформации шумовой помехой гистограмма для речевого сигнала.It is characteristic that the appearance of noise interference has little effect on the nature of the histogram for non-stationary noise and the deterioration of signal separation is due to the distortion of the histogram for the speech signal by noise interference.

Рассмотрение аналогичных гистограмм, приведенных на фиг.2в, 2г для значений частоты переходов через ноль, определенных по предлагаемому способу, показывает и значительно большую помехоустойчивость.Consideration of similar histograms shown in figv, 2d for the values of the frequency of transitions through zero, determined by the proposed method, shows a significantly greater noise immunity.

Из фиг.2(в, г) следует, что процесс разделения по предлагаемому способу для шумовых и речевых нестационарных сигналов при соотношении сигнал/шум, равном 5, происходит с вероятностью ошибки не хуже 6%.From figure 2 (c, d) it follows that the separation process according to the proposed method for noise and speech non-stationary signals with a signal to noise ratio of 5 occurs with an error probability of at least 6%.

Таким образом, экспериментально подтверждено. что предлагаемый способ обес9 печивает увеличение помехоустойчивости разделения речевых и шумовых нестационарных сигналов не менее, чем в 5 раз по сравнению с существующим способом, что и определяет его полезность.Thus, experimentally confirmed. that the proposed method provides an increase in the noise immunity of the separation of speech and noise non-stationary signals by at least 5 times compared with the existing method, which determines its usefulness.

Claims (3)

Формула изобретенияClaim Способ разделения речевых и нестационарных шумовых сигналов, заключающийся в усилении анализируемого сигнала, его низкочастотной фильтраций, определении значений числа нулевых переходов получен ного сигнала с последующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, о т л и ч а ю5 щийся тем, что, с целью повышения помехоустойчивости разделения, после низкочастотной фильтрации анализируемого сигнала в его выборке определяют участки с наибольшей интенсивностью, для 10 которых определяют значения числа нулевых переходов.A method for separating speech and non-stationary noise signals, which consists in amplifying the analyzed signal, its low-pass filtering, determining the number of zero transitions of the received signal, and then comparing them with a threshold value, which are used to identify speech and non-stationary noise signals, such as which, in order to increase the noise immunity of the separation, after low-frequency filtering of the analyzed signal, the sections with the highest intensity are determined in its sample, for 10 which determine the values of the number of zero crossings. J нПЗ-rJ NRP-r II ГТ Г I L J L JGT G I L J L J ГТGT II II II II II I нI n I » ti” <5> Си •«с ’U si I ”ti” <5> C • “c’ U si II S £·35 <о s>S £ 35 <o s> 5зо <0 «; о с5so <0 "; about with 2S tS i2S tS i X г.X g * (0 V О? £ Ч о* (0 V О? £ Ч о 4J г· w 4J g · w S'S ' 25 ·25 Число переходов через ноле фаг. 2The number of transitions through zero phage. 2
SU904870056A 1990-09-27 1990-09-27 Method of separation of speech and nonstationary noise signals SU1781701A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SU904870056A SU1781701A1 (en) 1990-09-27 1990-09-27 Method of separation of speech and nonstationary noise signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SU904870056A SU1781701A1 (en) 1990-09-27 1990-09-27 Method of separation of speech and nonstationary noise signals

Publications (1)

Publication Number Publication Date
SU1781701A1 true SU1781701A1 (en) 1992-12-15

Family

ID=21538220

Family Applications (1)

Application Number Title Priority Date Filing Date
SU904870056A SU1781701A1 (en) 1990-09-27 1990-09-27 Method of separation of speech and nonstationary noise signals

Country Status (1)

Country Link
SU (1) SU1781701A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2691603C1 (en) * 2018-08-22 2019-06-14 Акционерное общество "Концерн "Созвездие" Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2691603C1 (en) * 2018-08-22 2019-06-14 Акционерное общество "Концерн "Созвездие" Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture

Similar Documents

Publication Publication Date Title
EP0054365B1 (en) Speech recognition systems
US20070083365A1 (en) Neural network classifier for separating audio sources from a monophonic audio signal
JPH0121519B2 (en)
JP4652575B2 (en) Pure speech detection using valley percentage
KR101008022B1 (en) Voiced sound and unvoiced sound detection method and apparatus
JP4201204B2 (en) Audio information classification device
JPH0462398B2 (en)
SU1781701A1 (en) Method of separation of speech and nonstationary noise signals
JPH0462399B2 (en)
JPS63153598A (en) Voice spectrum analyzer
Nilsson et al. Human whistle detection and frequency estimation
Penttilä et al. A speech/music discriminator-based audio browser with a degree of certainty measure
Lukatela Pitch determination by adaptive autocorrelation method
JPH0114599B2 (en)
Sankar Pitch extraction algorithm for voice recognition applications
JPS59228300A (en) Voice section detecting system
KR950009329B1 (en) Apparatus for removing a surrounding noise in a camcorder
KR0180651B1 (en) Voice recognition device
JPS6335995B2 (en)
JPH04251299A (en) Speech section detecting means
JP2891259B2 (en) Voice section detection device
JP2557497B2 (en) How to identify male and female voices
JPS61233791A (en) Voice section detection system for voice recognition equipment
JPS61260299A (en) Voice recognition equipment
JP2591802B2 (en) Audible sound signal recognition method