RU2691603C1 - Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture - Google Patents

Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture Download PDF

Info

Publication number
RU2691603C1
RU2691603C1 RU2018130495A RU2018130495A RU2691603C1 RU 2691603 C1 RU2691603 C1 RU 2691603C1 RU 2018130495 A RU2018130495 A RU 2018130495A RU 2018130495 A RU2018130495 A RU 2018130495A RU 2691603 C1 RU2691603 C1 RU 2691603C1
Authority
RU
Russia
Prior art keywords
value
signal
interference
correlation function
sliding window
Prior art date
Application number
RU2018130495A
Other languages
Russian (ru)
Inventor
Владимир Александрович Белогуров
Владимир Алексеевич Золотарёв
Original Assignee
Акционерное общество "Концерн "Созвездие"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Акционерное общество "Концерн "Созвездие" filed Critical Акционерное общество "Концерн "Созвездие"
Priority to RU2018130495A priority Critical patent/RU2691603C1/en
Application granted granted Critical
Publication of RU2691603C1 publication Critical patent/RU2691603C1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Abstract

FIELD: radio engineering and communications.SUBSTANCE: invention relates to radio engineering and can be used in devices for transmitting voice information. Technical result is achieved by the fact that in this method three stages of comparison of values of interference correlation function or mixture of signal noise with threshold are used. At the first stage, for the interval, which contains only interference, the threshold value is determined from the correlation function of the interference. This value is specified during “sliding window“ movement. At the second stage detection of occurrence of a signal with low value of accuracy of determination of time of its occurrence and high value of probability of signal detection, determined by value of duration and value of displacement of "sliding window" is carried out. At the third stage, the signal position is refined, wherein the probability of the correct decision on the presence of the signal is not lower than a given level, which is achieved by using the corresponding values of duration and displacement of the "sliding window".EFFECT: high accuracy of determining the moment of occurrence of a speech signal in the presence of external acoustic interference.1 cl, 2 dwg, 2 tbl

Description

Изобретение относится к области техники передачи и трансляции речевой информации и может найти применение в устройствах связи и в устройствах громкоговорящей связи.The invention relates to the field of technology of transmission and transmission of speech information and may find application in communication devices and devices for loud-speaking communication.

Известно устройство для выделения акустических сигналов в каналах связи, описанное в патенте RU 2171549 H04Q 1/46. Изобретение относится к электросвязи, в частности к автоматическим средствам приема сигналов тональной сигнализации в системах многоканальной связи, и может использоваться, например, для обнаружения акустических сигналов (АС) в телефонных каналах. Функционирование основано на вычислении ряда решающих статистик, которые являются отличительными признаками при распознавании информационного АС от канальных шумов и паразитных речевых сигналов. В качестве решающих статистик используются оценка мощности сигнала в информационной полосе частот, распределение энергии входного сигнала по частотному диапазону и величина неравномерности огибающей отфильтрованного в полосовом фильтре входного сигнала. Для принятия окончательного решения о присутствии в канале связи АС используется вторичная обработка, которая основана на применении мажоритарного правила для последовательной серии первичных решений.A device for the selection of acoustic signals in communication channels, described in patent RU 2171549 H04Q 1/46, is known. The invention relates to telecommunications, in particular to automatic means of receiving signals of tone signaling in multi-channel communication systems, and can be used, for example, to detect acoustic signals (AU) in telephone channels. The operation is based on the calculation of a number of decisive statistics, which are distinguishing features in recognizing an information speaker from channel noise and spurious speech signals. The decisive statistics are the signal power estimate in the information frequency band, the energy distribution of the input signal over the frequency range, and the amount of non-uniformity of the envelope of the input signal filtered in the band-pass filter. To make a final decision on the presence in the communication channel of the AU, secondary processing is used, which is based on the application of a majority rule for a consecutive series of primary decisions.

Недостатком известного устройства является его невысокая эффективность при решении задачи разделения речи и пауз.A disadvantage of the known device is its low efficiency in solving the problem of separation of speech and pauses.

Известно устройство для выделения тональных сигналов в каналах связи по патенту RU 2214051, H04B 3/46, H04Q 1/457, H04M 1/50. Изобретение относится к области электросвязи, в частности к автоматическим средствам приема сигналов канальной сигнализации в системах многоканальной связи, и может использоваться для обнаружения акустических сигналов в телефонных каналах.A device for extracting tonal signals in communication channels according to patent RU 2214051, H04B 3/46, H04Q 1/457, H04M 1/50 is known. The invention relates to the field of telecommunications, in particular to automatic means of receiving channel signaling signals in multi-channel communication systems, and can be used to detect acoustic signals in telephone channels.

Известное техническое решение обладает недостаточно высокой эффективностью при решении задачи разделения речи и пауз.Known technical solution has not sufficiently high efficiency in solving the problem of separation of speech and pauses.

Наиболее близким аналогом по технической сущности к предлагаемому является способ разделения речи и пауз, описанный в книге «Цифровая обработка речевых сигналов. //Л.Р. Рабинер, Р.В. Шафер. Перевод с английского под редакцией М.В. Назарова и Ю.Н. Прохорова. Москва, «Радио и связь», 1981», стр. 123 - 126, принятый за прототип.The closest analogue to the technical nature of the proposed method is the separation of speech and pauses, described in the book "Digital processing of speech signals. //Л.Р. Rabiner, R.V. Best man. Translation from English edited by M.V. Nazarova and Yu.N. Prokhorov. Moscow, Radio and Communication, 1981, pp. 123 - 126, adopted as a prototype.

Способ-прототип заключается в следующем.The prototype method is as follows.

Сигнал, поступающий в систему, дискретизируется в течение интервала времени, установленного для его анализа, и заносится в память для последующей обработки. Обрабатываемый сигнал состоит из интервала, который содержит только помеху, длительность данного интервала составляет около 100 мс, и интервала, который содержит аддитивную смесь речевого сигнала и помехи (в дальнейшем – смесь сигнала и помехи).The signal entering the system is sampled during the time interval set for its analysis, and is stored in memory for further processing. The processed signal consists of an interval that contains only interference, the duration of this interval is about 100 ms, and an interval that contains an additive mixture of speech signal and interference (hereinafter - a mixture of signal and interference).

В качестве основных параметров используется число переходов через ноль в течение 10 мс и функция среднего значения, вычисленная с использованием окна длительностью 10 мс. По этим отсчетам вычисляются средние значения и дисперсии взвешенной суммы абсолютных значений амплитуд отсчетов и среднего числа переходов через ноль (статистические характеристики шума).The main parameters are the number of zero crossings over 10 ms and the mean value function calculated using a 10 ms window. From these samples, the average values and variances of the weighted sum of the absolute values of the amplitudes of the samples and the average number of zero crossings (statistical noise characteristics) are calculated.

С учетом значений этих характеристик и максимального среднего значения вычисляются пороги для среднего числа переходов через ноль (СЧПН) и энергии сигнала. Определяется фрагмент колебаний, на котором траектория среднего значения энергии сигнала (СЗЭС) превышает верхний порог. Предполагается, что начало и конец слова лежат вне этого фрагмента.Taking into account the values of these characteristics and the maximum average value, the thresholds are calculated for the average number of zero-crossing (ESS) and signal energy. The fragment of oscillations is determined, on which the trajectory of the mean value of the signal energy (SES) exceeds the upper threshold. It is assumed that the beginning and end of the word lie outside this fragment.

Затем, двигаясь в обратном направлении по оси времени от момента, где среднее значение энергии сигнала впервые превысило порог, определяют момент, в котором СЗЭС впервые оказалось меньше нижнего порога (точка N1). Этот момент выбирается в качестве предполагаемого начала. Таким же образом определяется и предполагаемое окончание слова (точка N2).Then, moving in the opposite direction along the time axis from the moment where the average value of the signal energy exceeded the threshold for the first time, determine the moment at which SZES for the first time turned out to be less than the lower threshold (point N 1 ). This moment is chosen as the expected start. In the same way is determined and the estimated end of the word (point N 2 ).

Следующий шаг состоит в перемещении влево от точки N1 (вправо от точки N2) и сравнении числа переходов через ноль с порогом, вычисленным по данным начального участка. Если число переходов через ноль превышает порог в 3 или более раз, начало слова переносится туда, где кривая числа переходов через ноль впервые превысила порог. В противном случае точка N1 считается началом слова. Аналогичный процесс осуществляется в отношении точки N2.The next step is to move to the left of point N 1 (to the right of point N 2 ) and compare the number of zero crossings with the threshold calculated from the initial segment data. If the number of zero crossings exceeds the threshold by 3 or more times, the beginning of the word is transferred to where the zero crossing curve has exceeded the threshold for the first time. Otherwise, the point N 1 is considered the beginning of the word. A similar process is carried out in relation to the point N 2 .

Недостатком способа-прототипа является невысокая точность решения задачи и высокая вероятность ошибочного решения о появлении сигнала в условиях наличия помех. The disadvantage of the prototype method is the low accuracy of the solution of the problem and the high probability of an erroneous decision about the appearance of a signal in the presence of interference.

Задача предлагаемого способа – повышение точности определения момента появления речевого сигнала и увеличение значения вероятности правильного решения о появлении речевого сигнала в условиях наличия акустического шума.The objective of the proposed method is to improve the accuracy of determining the moment of appearance of the speech signal and the increase in the probability value of the correct decision about the appearance of the speech signal in the presence of acoustic noise.

Для решения поставленной задачи в способе разделения речи и пауз, заключающемся в том, что на всем интервале анализа, состоящего из интервала, который не содержит речевой сигнал, и интервала, который содержит смесь речевого сигнала и помехи, помеху или смесь речевого сигнала и помехи, которые поступают в систему, дискретизируют и заносят в память для последующей обработки, согласно изобретению, для временного интервала, который содержит только помеху, рассчитывают значение корреляционной функции помехи для определенного заранее значения разности аргументов (τ), определяют пороговое значение для корреляционной функции путем умножения рассчитанного значения корреляционной функции на коэффициент, значение которого определяют заранее, формируют первое «скользящее окно» – интервал заданной длительности, смещают «скользящее окно» на величину шага смещения, значение которого определяют заранее, рассчитывают значение корреляционной функции сигнала для определенного заранее значения разности аргументов (τ) для этого положения «скользящего окна», значение корреляционной функции сравнивают с рассчитанным пороговым значением, если рассчитанное значение корреляционной функции превышает пороговое значение, то считают, что в «скользящем окне» присутствует речевой сигнал, в противном случае описанную процедуру повторяют до тех пор, пока не будет обнаружен речевой сигнал, при этом при определении порогового значения для корреляционной функции рассчитывают и используют ее среднее значение, которое рассчитывают в соответствии с принципом «первый пришел, первый ушел» с использованием ранее рассчитанных значений корреляционной функции и ее текущего значения, для определенного заранее количества значений корреляционной функции, в случае принятия решения о появлении речевого сигнала устанавливают возможное значение его левой границы равным значению левой границы «скользящего окна», уменьшенному на заранее заданную величину, формируют второе «скользящее окно», длительность которого определяют заранее, устанавливают его начальное положение, так, что значение его правой границы совпадает с установленным значением левой границы речевого сигнала, смещают «скользящее окно» на величину шага смещения, значение которого определяют в соответствии с заданной точностью определения положения сигнала, рассчитывают значение корреляционной функции сигнала, это значение сравнивают с рассчитанным на предыдущем шаге пороговым значением для корреляционной функции, если значение корреляционной функции превышает пороговое значение, то считают, что в «скользящем окне» присутствует сигнал, и процесс завершают, начало речевого сигнала считают равным значению положения правой границы «скользящего окна», уменьшенному на определенную заранее величину, в противном случае устанавливают значение начала речевого сигнала равным значению левой границы «скользящего окна», для которого было принято решение о наличии речевого сигнала на втором этапе процедуры определения факта появления речевого сигнала.To solve the problem in the method of separation of speech and pauses, which consists in the fact that the entire analysis interval, consisting of an interval that does not contain a speech signal, and an interval that contains a mixture of speech signal and interference, interference or a mixture of speech signal and interference, which enter the system, sampled and stored in memory for further processing, according to the invention, for a time interval that contains only interference, calculate the value of the correlation function of the interference for a predetermined value difference of arguments (τ), determine the threshold value for the correlation function by multiplying the calculated value of the correlation function by a factor whose value is determined in advance, form the first "sliding window" - the interval of a given duration, shift the "sliding window" by the offset step value, the value of which is determined in advance, calculate the value of the correlation function of the signal for the predetermined value of the difference of the arguments (τ) for this position of the "sliding window", the value of the correlation functions are compared with the calculated threshold value, if the calculated value of the correlation function exceeds the threshold value, then it is considered that there is a speech signal in the “sliding window”, otherwise the described procedure is repeated until a speech signal is detected, while determining the threshold values for the correlation function are calculated and their mean value is used, which is calculated in accordance with the “first come, first gone” principle using previously calculated values For the number of values of the correlation function determined in advance, if a speech signal is decided on, the possible value of its left border is set equal to the value of the left border of the “sliding window”, reduced by a predetermined amount, form the second “sliding window ", The duration of which is determined in advance, establish its initial position, so that the value of its right border coincides with the set value of the left border of the speech si drove the “sliding window” by an offset step value, the value of which is determined according to the specified accuracy of signal positioning, the correlation function of the signal is calculated, this value is compared with the threshold value for the correlation function calculated at the previous step if the correlation function exceeds the threshold value, it is considered that there is a signal in the “sliding window”, and the process is completed, the beginning of the speech signal is considered equal to the position value of the right border “with olzyaschego window ", reduced by a certain predetermined value, otherwise the value is set equal to the beginning of the speech signal value of the left border" sliding window "for which it was decided to presence of the speech signal at the second stage of the procedure determining the appearance of the speech signal.

Предлагаемый способ заключается в следующем.The proposed method is as follows.

Сигналы, поступающие с выхода электроакустического устройства (ЭАУ), прошедшие на выход фильтра низкой частоты (ФНЧ), усиленные в усилителе низкой частоты (УНЧ), дискретизируют с использованием аналого-цифрового преобразователя (АЦП) и заносят в память вычислительного устройства для последующей обработки.Signals from the output of an electroacoustic device (EIA), passed to the output of a low-frequency filter (LPF), amplified in a low-frequency amplifier (ULF), are sampled using an analog-to-digital converter (ADC) and stored in the memory of the computing device for further processing.

Обнаружение речевого сигнала и определение положения его начала осуществляется в несколько этапов.The detection of the speech signal and the determination of the position of its beginning is carried out in several stages.

Первый этап.First stage.

Для временного интервала, который содержит только помеху, рассчитывают известным образом значение корреляционной функции помехи для определенного заранее значения разности аргументов (τ), (в дальнейшем по тексту – КФ) (см., например, Е.С. Вентцель «Теория вероятностей», М. 1969, стр. 178, 179).For a time interval that contains only interference, the value of the correlation function of interference is calculated in a known way for the predetermined value of the difference of arguments (τ), (hereinafter referred to as KF) (see, for example, ES Venttsel "Probability Theory", M. 1969, p. 178, 179).

Длительность интервала, для которого считают, что он содержит только помеху, определяют на этапе разработки экспериментальным путем или методом математического моделирования.The duration of the interval for which it is considered that it contains only interference is determined at the design stage by experiment or by the method of mathematical modeling.

Определяют пороговое значение для КФ путем умножения рассчитанного значения КФ на коэффициент, значение которого определяют заранее. Значение коэффициента определяют на этапе разработки экспериментальным путем или методом математического моделирования, как значение, обеспечивающее среднее значение вероятности правильного решения о наличии речевого сигнала не менее заданного уровня.The threshold value for KF is determined by multiplying the calculated value of KF by a factor, the value of which is determined in advance. The value of the coefficient is determined at the stage of development experimentally or by the method of mathematical modeling, as the value providing the average value of the probability of a correct decision on the presence of a speech signal not less than a given level.

Второй этап – этап обнаружения речевого сигнала и грубое определение положения его начала.The second stage is the stage of detecting a speech signal and a rough determination of the position of its beginning.

Формируют первое «скользящее окно» – временной интервал заданной длительности (определенное количество отсчетов), значение которого выбирают исходя из условия, чтобы значение вероятности обнаружения речевого сигнала при его наличии (вероятность правильного обнаружения) было не ниже заданного уровня и, чтобы значение вероятности принятия решения о наличии речевого сигнала при его отсутствии (вероятность ложной тревоги) не превышала заданное значение.The first “sliding window” is formed - the time interval of a given duration (a certain number of samples), the value of which is chosen based on the condition that the probability value of detecting a speech signal if present (the probability of correct detection) is not lower than the specified level and that the probability value of making a decision about the presence of a speech signal in its absence (the probability of a false alarm) did not exceed the specified value.

Значение длительности «скользящего окна» определяют на этапе разработки экспериментальным путем или методом математического моделирования. Начальное значение длительности «скользящего окна» в оптимизационных процедурах может быть выбрано, например, равным минимальной длительности одной фонемы (20 мс).The duration of the "sliding window" is determined at the stage of development experimentally or by the method of mathematical modeling. The initial value of the “sliding window” duration in optimization procedures can be chosen, for example, equal to the minimum duration of one phoneme (20 ms).

Смещают «скользящее окно» на интервал, значение которого определяют заранее (текущее положение). Начальное значение длительности данного интервала в оптимизационных процедурах может быть выбрано, например, равным длительности интервала, обеспечивающей заданную точность определения начала речевого сигнала.Shift the "sliding window" on the interval, the value of which is determined in advance (the current position). The initial value of the duration of this interval in the optimization procedures can be chosen, for example, equal to the interval duration, which ensures the specified accuracy of determining the beginning of the speech signal.

Рассчитывают значения КФ сигнала для текущего положения «скользящего окна», значения КФ сравнивают с рассчитанным пороговым значением для корреляционной функции. Если рассчитанное значение КФ превышает пороговое значение, то считают, что сигнал присутствует. Calculate the values of KF signal for the current position of the "sliding window", the values of KF are compared with the calculated threshold value for the correlation function. If the calculated value of KF exceeds the threshold value, then consider that the signal is present.

Если не было принято решение о том, что сигнал присутствует, то описанную процедуру обнаружения сигнала повторяют. При этом, при определении порогового значения для корреляционной функции, рассчитывают и используют среднее значение КФ, которое рассчитывают с использованием рассчитанных значений КФ для предыдущих положений «скользящего окна» и его текущее значение с использованием принципа «первый пришел, первый ушел» (см., например, Роберт Круз. «Структуры данных и проектирования программ». – Бином. Лаборатория знаний. 2008). То есть из списка значений КФ, с использованием которых рассчитывают среднее значение КФ, вычеркивают первое значение и добавляют последнее рассчитанное значение. После чего значения КФ перенумеровывают, а именно, значению со вторым номером присваивают номер один, значению с третьим номером присваивают номер два, и т.д., последнему рассчитанному значению присваивают последний номер.If it was not decided that the signal is present, then the signal detection procedure described above is repeated. At the same time, when determining the threshold value for the correlation function, the mean value of KF is calculated and used, which is calculated using the calculated values of KF for the previous positions of the “sliding window” and its current value using the principle of “first come, first go” (see for example, Robert Cruise. “Data Structures and Program Designs.” - Binom. Laboratory of Knowledge (2008). That is, from the list of KF values, using which the mean KF value is calculated, delete the first value and add the last calculated value. Then the KF values are renumbered, namely, the value with the second number is assigned the number one, the value with the third number is assigned the number two, etc., the last calculated number is assigned to the last calculated value.

Число значений КФ сигнала, которое используют при расчете среднего значения КФ сигнала с использованием принципа «первый пришел, первый ушел» определяют на этапе разработки экспериментальным путем или методом математического моделирования. Процесс повторяют до тех пор, пока не будет принято решение о появлении речевого сигнала.The number of values of KF signal, which is used when calculating the average value of KF signal using the principle of "first come, first left" is determined at the development stage experimentally or by the method of mathematical modeling. The process is repeated until a decision is made about the appearance of a speech signal.

В случае принятия решения о наличии речевого сигнала устанавливают значение левой границы сигнала равным значению правой границы «скользящего окна», уменьшенному на заранее заданную величину.In the case of a decision on the presence of a speech signal, the value of the left border of the signal is set equal to the value of the right boundary of the “sliding window”, reduced by a predetermined amount.

Значение данной величины рассчитывается, например, по формулеThe value of this value is calculated, for example, by the formula

Tс= (Tшс+ Tтон)/2, (1)T with = (T bc + T tone ) / 2, (1)

Tшс – величина, на которую один раз смещают «скользящее окно» (мс);T bc - the amount by which the “sliding window” (ms) is shifted once;

Tтон – точность определения положения сигнала (мс).T tone - the accuracy of determining the position of the signal (ms).

Значение данной величины может уточняться на этапе разработки экспериментальным путем или методом математического моделирования.The value of this quantity can be specified at the development stage experimentally or by the method of mathematical modeling.

Третий этап – этап точного определения положения начала речевого сигнала.The third stage is the stage of precise determination of the position of the beginning of the speech signal.

Формируют второе «скользящее окно», длительность которого устанавливают исходя из условия, чтобы точность определения начала сигнала была не ниже заданного уровня. Положение данного «скользящего окна» устанавливают так, что значение его правой границы, равно установленному значению левой границы речевого сигнала. Смещают «скользящее окно» на величину шага смещения, значение которого определяют исходя из заданной точности определения положения сигнала.Form the second "sliding window", the duration of which is set on the basis of the condition that the accuracy of determining the beginning of the signal was not below a predetermined level. The position of this “sliding window” is set so that the value of its right border is equal to the set value of the left border of the speech signal. The “sliding window” is shifted by the size of the offset step, the value of which is determined on the basis of the specified accuracy of determining the position of the signal.

Рассчитывают значение корреляционной функции сигнала для определенного заранее значения разности аргументов (τ). Это значение сравнивают с рассчитанным ранее пороговым значением для корреляционной функции, которое определяют с использованием последнего рассчитанного среднего значения корреляционной функции сигнала, для которого было принято решение о наличии речевого сигнала. Если значение КФ превышает пороговое значение, то считают, что в «скользящем окне», присутствует сигнал. После чего процесс завершают. Время появления речевого сигнала считают равным значению положения правой границы «скользящего окна» уменьшенному на некоторую определенную заранее величину. Значение данной величины может быть установлено, например, равным шагу смещения интервала, и может уточняться на этапе разработки экспериментальным путем или методом математического моделирования.Calculate the value of the correlation function of the signal for a predetermined value of the difference of the arguments (τ). This value is compared with the previously calculated threshold value for the correlation function, which is determined using the last calculated average value of the correlation function of the signal for which the decision about the presence of the speech signal was made. If the KF value exceeds the threshold value, then it is considered that there is a signal in the “sliding window”. Then the process is completed. The time of appearance of the speech signal is considered equal to the value of the position of the right border of the “sliding window” reduced by some predetermined value. The value of this value can be set, for example, equal to the interval offset step, and can be refined at the stage of development experimentally or by the method of mathematical modeling.

Если значение корреляционной функции не превысило пороговое значение, то значение начала сигнала устанавливают равным значению левой границы «скользящего окна», для которого было принято решение о наличии речевого сигнала на втором этапе процедуры определения факта появления речевого сигнала.If the value of the correlation function does not exceed the threshold value, the value of the beginning of the signal is set equal to the value of the left boundary of the “sliding window”, for which a decision was made about the presence of a speech signal at the second stage of the procedure for determining whether a speech signal appears.

Иллюстративное пояснение работы способа приведено на фиг. 1.An illustrative explanation of the operation of the method is shown in FIG. one.

Ниже приведены результаты моделирования процесса принятия решения о наличии речевого сигнала в зависимости от отношения мощностей помехи и сигнала с использованием системы MATLAB.Below are the results of the simulation of the decision-making process on the presence of a speech signal depending on the power ratio of interference and signal using the MATLAB system.

Помеха при моделировании представлена в виде совокупности гармонических колебаний со случайными значениями амплитуд (Upi) и фаз (ϕpi), которые распределены по нормальному (амплитуды) и равномерному (фазы) законам (см., например, учебное пособие «Основы теории радиотехнических систем». Учебное пособие. //В.И. Борисов, В.М. Зинчук, А.Е. Лимарев, Н.П. Мухин. Под ред. В.И. Борисова. Воронежский научно-исследовательский институт связи, 2004., стр. 51)Interference in modeling is presented as a set of harmonic oscillations with random amplitudes (U pi ) and phases (ϕ pi ), which are distributed according to the normal (amplitude) and uniform (phase) laws (see, for example, the textbook "Fundamentals of the Theory of Radio Engineering Systems ". A textbook. // V. I. Borisov, V. M. Zinchuk, A. E. Limarev, N. P. Mukhin. Under the editorship of V. I. Borisov. Voronezh Research Institute of Communications, 2004., p. 51)

U=

Figure 00000001
, (2)U =
Figure 00000001
, (2)

где: ωpi – частота i-ой составляющей помехи;where: ω pi is the frequency of the i-th interference component;

φpi – фаза i-ой составляющей помехи;φ pi - phase of the i-th component of the interference;

Figure 00000002
– амплитуда i-ой составляющей помехи;
Figure 00000002
- amplitude of the i-th component of interference;

Nsp – число гармонических составляющих помехи, используемых для ее представления.N sp is the number of harmonic components of the interference used to represent it.

Частоты составляющих помехи моделировались как случайные величины, значения которых распределены по равномерному закону в полосе сигнала. Длительность гармонических составляющих помехи значительно (в десятки раз) превышает значение периода, соответствующего минимальной частоте речевого сигнала.The frequencies of the noise components were modeled as random variables whose values are distributed according to a uniform law in the signal band. The duration of the harmonic components of the interference significantly (dozens of times) exceeds the value of the period corresponding to the minimum frequency of the speech signal.

Сигнал представлен в виде совокупности гармонических колебаний со случайными значениями амплитуд (Usi) и фаз (ϕsi), которые распределены по нормальному (амплитуды) и равномерному (фазы) законам, причем начальные значения фаз для составляющих сигнала устанавливаются одинаковыми.The signal is presented as a set of harmonic oscillations with random amplitudes (U si ) and phases (ϕ si ), which are distributed according to the normal (amplitude) and uniform (phase) laws, with the initial phase values for the signal components being equal.

Значения частот сигнала устанавливают следующим образом.The signal frequency values are set as follows.

Значение первой гармоники берут как случайную величину, значения которой распределены по равномерному закону в некоторой заданной полосе частот. «Расстояние» по частоте между гармониками сигнала устанавливают одинаковыми, причем это значение берут как случайную величину, значение которой распределено по равномерному закону в некоторой заданной полосе частот.The value of the first harmonic is taken as a random variable, the values of which are distributed according to a uniform law in some given frequency band. The “distance” in frequency between the harmonics of the signal is set the same, and this value is taken as a random variable, the value of which is distributed according to a uniform law in some given frequency band.

При моделировании использовались следующие исходные данные:The following initial data were used in the simulation:

– число реализаций – 103;- the number of implementations - 10 3 ;

– частота взятия отсчетов – 64000 отсч./с;- sampling frequency - 64000 samples / s;

– число частотных составляющих сигнала – 8;- the number of frequency components of the signal - 8;

– значение разности аргументов (τ) – 1;- the value of the difference of the arguments (τ) - 1;

– длительность интервала, где присутствует только помеха – 50 мс; - the duration of the interval where there is only interference - 50 ms;

– длительность интервала, где присутствует только помеха для второго этапа – 300 мс;- the duration of the interval, where there is only a disturbance for the second stage - 300 ms;

– длительность первого и второго «скользящих окон» – 20 мс;- the duration of the first and second “sliding windows” - 20 ms;

– величина шага смещения «скользящих окон»:- step size offset "sliding windows":

для второго этапа – 10 мс;for the second stage - 10 ms;

для третьего этапа – 5 мс;for the third stage - 5 ms;

– количество положений «скользящего окна», используемого на третьем этапе – 4;- the number of positions of the "sliding window" used in the third stage - 4;

– длительность интервала, определяющего точность определения положения сигнала – 5 мс;- the duration of the interval determining the accuracy of determining the position of the signal - 5 ms;

– величина, на которую уменьшают значение правой границы «скользящего окна», при определении значения левой границы сигнала на втором этапе – 10 мс (рассчитана по ф. 1);- the value by which the value of the right border of the “sliding window” is reduced, when determining the value of the left border of the signal at the second stage - 10 ms (calculated from f. 1);

– величина, на которую уменьшают значение правой границы «скользящего окна» на третьем этапе – 5 мс;- the value by which the value of the right border of the “sliding window” is reduced in the third stage is 5 ms;

– величина, на которую уменьшают последнее значение правой границы «скользящего окна» (третий этап) – 10 мс;- the value by which the last value of the right border of the “sliding window” is reduced (third stage) is 10 ms;

– диапазон изменения значения нижней частоты спектра речевого сигнала – 300 … 1000 Гц;- the range of change of the value of the lower frequency spectrum of the speech signal - 300 ... 1000 Hz;

– диапазон изменения разницы между соседними частотами спектра речевого сигнала – 100 … 400 Гц.- the range of variation of the difference between adjacent frequencies of the speech signal spectrum is 100 ... 400 Hz.

При моделировании использовалось оптимальное в среднем значение коэффициента, используемого при расчете порогового значения для КФ. Усреднение осуществлялось по значениям мощности и числу частотных составляющих помехи и сигнала.The simulation used the optimal average coefficient used in the calculation of the threshold value for CF. Averaging was carried out over the values of power and the number of frequency components of the noise and signal.

В таблице 1 представлены результаты моделирования процесса определения вероятности правильного решения о наличии речевого сигнала, осуществляемого на втором этапе, в зависимости от числа частотных составляющих помехи и отношения мощностей помехи и сигнала. Table 1 presents the simulation results of the process of determining the probability of a correct decision on the presence of a speech signal, carried out at the second stage, depending on the number of frequency components of the interference and the power ratio of the interference and signal.

Таблица 1Table 1

Nfp N fp Обозначение параметровParameter designation Отношение мощностей помехи и сигналаRatio of interference and signal power 1,01.0 1,51.5 2,02.0 2,52.5 33 4four Pпр P pr 1one 0,99920.9992 0,9970.997 0,9930.993 0,970.97 Pлт Pt lt 0,0150.015 0,0160.016 0,0180,018 0,020.02 0,0220.022 1515 Pпр P pr 1one 0,99930.9993 0,9930.993 0,9920.992 0,980.98 Pлт Pt lt 0,0430.043 0,0450.045 0,050.05 0,060.06 0,0650.065 30thirty Pпр P pr 1one 0,99980.9998 0,99960.9996 0,9950.995 0,980.98 Pлт Pt lt 0,0150.015 0,030.03 0,0350.035 0,040.04 0,050.05

В таблице использованы следующие обозначения:The table uses the following notation:

Nfp – число частотных составляющих помехи;N fp is the number of frequency components of interference;

Pпр – вероятность правильного принятия решения о наличии речевого сигнала;P ol - the probability of a correct decision about the presence of the speech signal;

Pлт – вероятность принятия решения о наличии речевого сигнала при его отсутствии (вероятность ложной тревоги).P lt - the probability of making a decision about the presence of a speech signal in its absence (the probability of a false alarm).

Результаты моделирования процесса определения точности положения речевого сигнала в зависимости от числа частотных составляющих помехи и отношения мощностей помехи и сигнала, осуществляемого на третьем этапе, представлены в таблице 2.The results of modeling the process of determining the accuracy of the position of the speech signal, depending on the number of frequency components of the interference and the power ratio of the interference and signal carried out in the third stage, are presented in Table 2.

Таблица 2table 2

Nfp N fp Отношение мощностей помехи и сигналаRatio of interference and signal power Номер шага сдвига «скользящего окна»Sliding window shift step number Точность определения положения сигнала,
мс
Accuracy of signal positioning,
ms
1one 22 33 4four 4four 1,01.0 1*10-3 1 * 10 -3 0,9990.999 0,0010.001 00 ±2,5± 2.5 1,51.5 2*10-3 2 * 10 -3 0,9980.998 0,0020,002 00 ±2,51± 2.51 2,02.0 3*10-3 3 * 10 -3 0,9970.997 0,0030,003 00 ±2,515± 2,515 2,52.5 4*10-3 4 * 10 -3 0,9820.982 0,0060,006 0,0010.001 ±2,52± 2.52 33 5*10-3 5 * 10 -3 0,990.99 0,0070,007 0,0020,002 ±2,54± 2.54 1515 1,01.0 0,080.08 0,9990.999 0,0010.001 00 ±2,9± 2.9 1,51.5 0,080.08 0,9930.993 0,0040,004 0,0010.001 ±2,91± 2.91 2,02.0 0,080.08 0,9670.967 0,0320.032 0,0010.001 ±2,98± 2.98 2,52.5 0,090.09 0,920.92 0,0590.059 0,0110.011 ±3,13± 3.13 33 0,090.09 0,910.91 0,0640.064 0,0160.016 ±3,16± 3.16 30thirty 1,01.0 0,10.1 0,9980.998 0,0010.001 0,0010.001 ±3,01± 3.01 1,51.5 0,10.1 0,990.99 0,0080,008 0,0020,002 ±3,03± 3.03 2,02.0 0,10.1 0,950.95 0,0380.038 0,0110.011 ±3,15± 3.15 2,52.5 0,110.11 0,930.93 0,0550.055 0,0110.011 ±3,2± 3.2 33 0,120.12 0,850.85 0,0960.096 0,0350.035 ±3,46± 3.46

В таблице использованы следующие обозначения:The table uses the following notation:

Nfp – число частотных составляющих помехи.N fp is the number of frequency components of the interference.

Из анализа данных, приведенных в таблицах 1, 2, следует, что для значений отношения мощностей помехи и сигнала не превышающих 2,5 для любых значений числа частотных составляющих помехи, вероятность правильного принятия решения о наличии речевого сигнала принимает значение не менее 0,992 при этом значение вероятности ложной тревоги не превышает 0,06. При этом ошибка определения времени появления речевого сигнала не превышает ±3,2 мс.From the analysis of the data given in Tables 1, 2, it follows that for values of the power ratio of interference and signal not exceeding 2.5 for any values of the number of frequency components of interference, the probability of correct decision on the presence of a speech signal takes at least 0.992; the probability of a false alarm does not exceed 0.06. In this case, the error in determining the time of appearance of the speech signal does not exceed ± 3.2 ms.

Структурная схема устройства, реализующего предлагаемый способ, приведена на фиг. 2, где обозначено:The structural diagram of the device implementing the proposed method is shown in FIG. 2, where indicated:

1 – электроакустическое устройство (ЭАУ);1 - electroacoustic device (EAU);

2 – фильтр нижних частот (ФНЧ);2 - low pass filter (LPF);

3 – усилитель низкой частоты (УНЧ);3 - low frequency amplifier (ULF);

4 – аналого-цифровой преобразователь (АЦП);4 - analog-to-digital converter (ADC);

5 – вычислительное устройство (ВУ).5 - computing device (WU).

Устройство содержит последовательно соединенные ЭАУ 1, ФНЧ 2, УНЧ 3, АЦП 4, ВУ 5, выход которого является выходом заявляемого устройства, вход ЭАУ 1 является входом устройства.The device contains serially connected EAU 1, LPF 2, ULCH 3, ADC 4, WU 5, the output of which is the output of the inventive device, the input of EAA 1 is the device input.

Устройство работает следующим образом.The device works as follows.

Помеху или аддитивную смесь сигнала и помехи, которые поступают с выхода ЭАУ 1, фильтруют ФНЧ 2, полоса которого согласована с полосой речевого сигнала, затем помеху или аддитивную смесь сигнала и помехи усиливают в УНЧ 3 и подают на вход АЦП 4. Отсчеты помехи или смеси сигнала и помехи, образуемые в АЦП 4, в цифровом виде поступают на вход ВУ 5.Interference or additive mixture of the signal and interference that comes from the output of EAI 1, filter the low-pass filter 2, the band of which is matched to the speech signal band, then the interference or additive signal mix and interference is amplified in the ULF 3 and fed to the input of the ADC 4. Interference or mixture counts the signal and interference generated in the ADC 4, in digital form, is fed to the input of the VU 5.

В вычислительном устройстве 5 поступившие отсчеты помехи или смеси сигнала и помехи обрабатывают по алгоритму, приведенному выше.In computing device 5, the received interference samples or signal mixtures and interference are processed according to the algorithm given above.

Результат обработки – решение в цифровом виде о наличии или отсутствии речевого сигнала, например:The result of processing is the decision in digital form about the presence or absence of a speech signal, for example:

1 – сигнал присутствует;1 - the signal is present;

0 –сигнал отсутствует.0 - no signal.

На выход устройства поступает также значение времени появления речевого сигнала, в случае, когда принимают решение о наличии речевого сигнала. Методика определения времени появления речевого сигнала приведена выше.The output of the device also receives the value of the time of appearance of the speech signal, in the case when they decide on the presence of a speech signal. The method for determining the time of appearance of the speech signal is given above.

Результаты моделирования процесса обнаружения речевого сигнала и определения точности положения речевого сигнала в зависимости от числа частотных составляющих помехи и отношения мощностей помехи и сигнала, приведены в таблицах 1 и 2 соответственно.The results of modeling the process of detecting a speech signal and determining the accuracy of the position of a speech signal depending on the number of frequency components of interference and the power ratio of interference and signal are shown in Tables 1 and 2, respectively.

В качестве ЭАУ 1 могут использоваться, например, микрофоны или ларингофоны.As the EIA 1, for example, microphones or laryngophone can be used.

УНЧ 3 может быть реализован, например, на микросхеме OP467GS фирмы Analog Devices.ULF 3 can be implemented, for example, on the OP467GS chip of Analog Devices.

АЦП 4 может быть реализован, например, на микросхеме ADS8422 фирмы Texas Instruments.The ADC 4 can be implemented, for example, on an ADS8422 chip from Texas Instruments.

Вычислительное устройство 5 может быть выполнено в виде программируемой логической интегральной схемы (ПЛИС), и реализовано, например, на микросхеме XC2V3000-6FG676I фирмы Xilinx.Computing device 5 can be made in the form of a programmable logic integrated circuit (FPGA), and implemented, for example, on the XC2V3000-6FG676I chip from Xilinx.

Таким образом, заявляемый способ может быть реализован описанным устройством и позволяет с высокой эффективностью и точностью решить задачу разделения речи и пауз за счет обнаружения появления речевого сигнала путем сравнения значения его корреляционной функции с порогом.Thus, the inventive method can be implemented by the described device and allows with high efficiency and accuracy to solve the problem of separation of speech and pauses by detecting the appearance of a speech signal by comparing the value of its correlation function with the threshold.

Claims (1)

Способ разделения речи и пауз, заключающийся в том, что на всем интервале анализа, состоящего из интервала, который не содержит речевой сигнал, и интервала, который содержит смесь речевого сигнала и помехи, помеху или смесь речевого сигнала и помехи, которые поступают в систему, дискретизируют и заносят в память для последующей обработки, отличающийся тем, что для временного интервала, который содержит только помеху, рассчитывают значение корреляционной функции помехи для определенного заранее значения разности аргументов (τ), определяют пороговое значение для корреляционной функции путем умножения рассчитанного значения корреляционной функции на коэффициент, значение которого определяют заранее, формируют первое «скользящее окно» – интервал заданной длительности, смещают «скользящее окно» на величину шага смещения, значение которого определяют заранее, рассчитывают значение корреляционной функции сигнала для определенного заранее значения разности аргументов (τ) для этого положения «скользящего окна», значение корреляционной функции сравнивают с рассчитанным пороговым значением, если рассчитанное значение корреляционной функции превышает пороговое значение, то считают, что в «скользящем окне» присутствует речевой сигнал, в противном случае описанную процедуру повторяют до тех пор, пока не будет обнаружен речевой сигнал, при этом при определении порогового значения для корреляционной функции рассчитывают и используют ее среднее значение, которое рассчитывают в соответствии с принципом «первый пришел, первый ушел» с использованием ранее рассчитанных значений корреляционной функции и ее текущего значения, для определенного заранее количества значений корреляционной функции, в случае принятия решения о появлении речевого сигнала устанавливают возможное значение его левой границы равным значению правой границы «скользящего окна», уменьшенному на заранее заданную величину, формируют второе «скользящее окно», длительность которого определяют заранее, устанавливают его начальное положение так, что значение его правой границы совпадает с установленным значением левой границы речевого сигнала, смещают «скользящее окно» на величину шага смещения, значение которого определяют в соответствии с заданной точностью определения положения сигнала, рассчитывают значение корреляционной функции сигнала, это значение сравнивают с рассчитанным на предыдущем шаге пороговым значением для корреляционной функции, если значение корреляционной функции превышает пороговое значение, то считают, что в «скользящем окне» присутствует сигнал, и процесс завершают, начало речевого сигнала считают равным значению положения правой границы «скользящего окна», уменьшенному на определенную заранее величину, в противном случае устанавливают значение начала речевого сигнала равным значению левой границы «скользящего окна», для которого было принято решение о наличии речевого сигнала на втором этапе процедуры определения факта появления речевого сигнала. A method of separating speech and pauses, which consists in the fact that the entire analysis interval consisting of an interval that does not contain a speech signal and an interval that contains a mixture of speech signal and interference, interference or mixture of speech signal and interference that enters the system, sampled and stored in memory for further processing, characterized in that for a time interval that contains only interference, the value of the correlation function of the interference is calculated for a predetermined value of the difference of arguments (τ) the threshold value for the correlation function by multiplying the calculated value of the correlation function by a factor whose value is determined in advance, the first “sliding window” is formed - an interval of a given duration, the “sliding window” is shifted by the offset step value, the value of which is determined in advance, the correlation function value is calculated for a predetermined value of the difference of arguments (τ) for this position of the “sliding window”, the value of the correlation function is compared with the calculated n If the calculated value of the correlation function exceeds the threshold value, then it is considered that there is a speech signal in the “sliding window”, otherwise the described procedure is repeated until the speech signal is detected, while determining the threshold value for the correlation the functions calculate and use its average value, which is calculated in accordance with the principle of “first come, first go” using the previously calculated values of the correlation function and its tech For a predetermined number of values of the correlation function, in the case of a decision about the appearance of a speech signal, the possible value of its left border is set equal to the value of the right border of the “sliding window”, reduced by a predetermined amount, form the second “sliding window”, the duration of which is determined in advance, its initial position is set so that the value of its right boundary coincides with the established value of the left boundary of the speech signal, the “sliding window” is shifted the size of the offset step, the value of which is determined in accordance with a given accuracy of determining the position of the signal, the correlation function of the signal is calculated, this value is compared with the threshold value calculated for the previous step for the correlation function; if the value of the correlation function exceeds the threshold value, then the sliding window ”, the signal is present, and the process is completed, the beginning of the speech signal is considered equal to the position value of the right border of the“ sliding window ”, reduced by predetermined value, otherwise, set the value of the beginning of the speech signal equal to the value of the left border of the “sliding window”, for which a decision was made about the presence of a speech signal at the second stage of the procedure for determining whether a speech signal appears.
RU2018130495A 2018-08-22 2018-08-22 Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture RU2691603C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2018130495A RU2691603C1 (en) 2018-08-22 2018-08-22 Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2018130495A RU2691603C1 (en) 2018-08-22 2018-08-22 Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture

Publications (1)

Publication Number Publication Date
RU2691603C1 true RU2691603C1 (en) 2019-06-14

Family

ID=66947584

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018130495A RU2691603C1 (en) 2018-08-22 2018-08-22 Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture

Country Status (1)

Country Link
RU (1) RU2691603C1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2723301C1 (en) * 2019-11-20 2020-06-09 Акционерное общество "Концерн "Созвездие" Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components
CN112002343A (en) * 2020-08-18 2020-11-27 海尔优家智能科技(北京)有限公司 Speech purity recognition method and device, storage medium and electronic device
CN112576326A (en) * 2020-12-07 2021-03-30 润电能源科学技术有限公司 Sliding pressure optimal operation control method, device and equipment for thermal power generating unit
RU2814115C1 (en) * 2023-08-09 2024-02-22 Акционерное общество "Концерн "Созвездие" Method for separating speech and pauses by analyzing characteristics of spectral components of mixture of signal and noise

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4682361A (en) * 1982-11-23 1987-07-21 U.S. Philips Corporation Method of recognizing speech pauses
US4700394A (en) * 1982-11-23 1987-10-13 U.S. Philips Corporation Method of recognizing speech pauses
SU1583970A1 (en) * 1988-01-11 1990-08-07 Иркутский Вычислительный Центр Со Ан Ссср Method of adaptive separation of periods of speech signal
SU1781701A1 (en) * 1990-09-27 1992-12-15 Le Nii Vektor Method of separation of speech and nonstationary noise signals
US20070118374A1 (en) * 2005-11-23 2007-05-24 Wise Gerald B Method for generating closed captions
RU2317595C1 (en) * 2006-10-30 2008-02-20 ГОУ ВПО "Белгородский государственный университет" Method for detecting pauses in speech signals and device for its realization
RU2436173C1 (en) * 2010-06-15 2011-12-10 Государственное образовательное учреждение высшего профессионального образования "Рязанский государственный радиотехнический университет" Method of detecting pauses in speech signals and device for realising said method
RU2466468C1 (en) * 2011-06-30 2012-11-10 Даниил Александрович Кочаров System and method of speech recognition

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4682361A (en) * 1982-11-23 1987-07-21 U.S. Philips Corporation Method of recognizing speech pauses
US4700394A (en) * 1982-11-23 1987-10-13 U.S. Philips Corporation Method of recognizing speech pauses
SU1583970A1 (en) * 1988-01-11 1990-08-07 Иркутский Вычислительный Центр Со Ан Ссср Method of adaptive separation of periods of speech signal
SU1781701A1 (en) * 1990-09-27 1992-12-15 Le Nii Vektor Method of separation of speech and nonstationary noise signals
US20070118374A1 (en) * 2005-11-23 2007-05-24 Wise Gerald B Method for generating closed captions
RU2317595C1 (en) * 2006-10-30 2008-02-20 ГОУ ВПО "Белгородский государственный университет" Method for detecting pauses in speech signals and device for its realization
RU2436173C1 (en) * 2010-06-15 2011-12-10 Государственное образовательное учреждение высшего профессионального образования "Рязанский государственный радиотехнический университет" Method of detecting pauses in speech signals and device for realising said method
RU2466468C1 (en) * 2011-06-30 2012-11-10 Даниил Александрович Кочаров System and method of speech recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Л.Р. Рабинер и др., Цифровая обработка речевых сигналов, Л.Р. Рабинер и др., перевод с английского под редакцией М.В. Назарова и Ю.Н. Прохорова, Москва, Радио и связь, 1991, стр. 123-126. *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2723301C1 (en) * 2019-11-20 2020-06-09 Акционерное общество "Концерн "Созвездие" Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components
CN112002343A (en) * 2020-08-18 2020-11-27 海尔优家智能科技(北京)有限公司 Speech purity recognition method and device, storage medium and electronic device
CN112002343B (en) * 2020-08-18 2024-01-23 海尔优家智能科技(北京)有限公司 Speech purity recognition method and device, storage medium and electronic device
CN112576326A (en) * 2020-12-07 2021-03-30 润电能源科学技术有限公司 Sliding pressure optimal operation control method, device and equipment for thermal power generating unit
CN112576326B (en) * 2020-12-07 2023-10-13 润电能源科学技术有限公司 Sliding pressure optimal operation control method, device and equipment for thermal power generating unit
RU2814115C1 (en) * 2023-08-09 2024-02-22 Акционерное общество "Концерн "Созвездие" Method for separating speech and pauses by analyzing characteristics of spectral components of mixture of signal and noise

Similar Documents

Publication Publication Date Title
RU2691603C1 (en) Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture
US9524735B2 (en) Threshold adaptation in two-channel noise estimation and voice activity detection
KR20180063282A (en) Method, apparatus and storage medium for voice detection
CN105118522B (en) Noise detection method and device
KR101863097B1 (en) Apparatus and method for keyword recognition
US9997168B2 (en) Method and apparatus for signal extraction of audio signal
RU2700189C1 (en) Method of separating speech and speech-like noise by analyzing values of energy and phases of frequency components of signal and noise
US5353345A (en) Method and apparatus for DTMF detection
Yegnanarayana et al. Study of robustness of zero frequency resonator method for extraction of fundamental frequency
US3377428A (en) Voiced sound detector circuits and systems
RU2668407C1 (en) Method of separation of speech and pause by comparative analysis of interference power values and signal-interference mixture
RU2680735C1 (en) Method of separation of speech and pauses by analysis of the values of phases of frequency components of noise and signal
US20230186943A1 (en) Voice activity detection method and apparatus, and storage medium
US10389394B2 (en) Method and device for processing a signal
RU2807194C1 (en) Method for speech extraction by analysing amplitude values of interference and signal in two-channel speech signal processing system
CN110197666B (en) Voice recognition method and device based on neural network
CN113948088A (en) Voice recognition method and device based on waveform simulation
RU2519041C2 (en) Method for pulse interference control based on localisation thereof using min-max threshold in adaptive radio signal receiving systems
RU2763480C1 (en) Speech signal recovery device
RU2171549C1 (en) Device for discriminating acoustic signals in communication channels
RU165287U1 (en) NOISE SUPPRESSION HYDROACOUSTIC COMMUNICATION STATION
RU2214051C2 (en) Device for separating voice-frequency signals in communication channels
TW201514977A (en) Speech recognition system of joint time-frequency domain characteristics and method thereof
RU2723301C1 (en) Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components
CN110910899B (en) Real-time audio signal consistency comparison detection method