RU2723301C1 - Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components - Google Patents

Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components Download PDF

Info

Publication number
RU2723301C1
RU2723301C1 RU2019137135A RU2019137135A RU2723301C1 RU 2723301 C1 RU2723301 C1 RU 2723301C1 RU 2019137135 A RU2019137135 A RU 2019137135A RU 2019137135 A RU2019137135 A RU 2019137135A RU 2723301 C1 RU2723301 C1 RU 2723301C1
Authority
RU
Russia
Prior art keywords
signal
analysis
values
value
pass filter
Prior art date
Application number
RU2019137135A
Other languages
Russian (ru)
Inventor
Владимир Александрович Белогуров
Владимир Алексеевич Золотарев
Original Assignee
Акционерное общество "Концерн "Созвездие"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Акционерное общество "Концерн "Созвездие" filed Critical Акционерное общество "Концерн "Созвездие"
Priority to RU2019137135A priority Critical patent/RU2723301C1/en
Application granted granted Critical
Publication of RU2723301C1 publication Critical patent/RU2723301C1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)

Abstract

FIELD: communication devices.
SUBSTANCE: invention relates to transmission and broadcasting of voice information and can be used in communication devices. Spectrum analysis of noise or additive mixture of voice signal and noise for "sliding window", broken into two analysis intervals, each of which consists of several intervals of equal duration. Spectral analysis is carried out by analyzing multifrequency periodic signals represented by digital readings using compensation of combination components. Method includes finding the power values dispersion for analysis intervals for each harmonic, calculating the average power variance values of the first and second analysis intervals. Value of difference of average values of power variances is compared with threshold. It is considered that in the second analysis interval there is only noise if the value of the difference of the average values of the power dispersion does not exceed the threshold, otherwise it is considered that in the second analysis interval there is a signal or a mixture of the signal and noise. Slide is moved to preset number of intervals. Described procedure is repeated. When the method is used at signal power and interference ratio values close to 1, the probability of a correct decision on the appearance of a voice signal close to 0.998 is provided, wherein the probability of false alarm, i.e. decision on appearance of voice signal in its absence is equal to 0.05.
EFFECT: high efficiency of making the correct decision on the appearance of a voice signal in the presence of acoustic noise.
1 cl, 4 dwg

Description

Изобретение относится к области цифровой обработки речевых сигналов и может найти применение в устройствах связи.The invention relates to the field of digital processing of speech signals and may find application in communication devices.

Известен способ спектрального анализа электрических сигналов (патент РФ №2431853), в котором анализируемый электрический сигнал подают одновременно на гребенку фильтров, настроенных на различные частоты и измеряют сигналы на выходах этих фильтров, причем до проведения измерений диапазон контролируемых частот разбивают на элементы разрешения с шагом дискретизации, соответствующим желаемым точности и разрешению спектрального анализа. Недостатком данного способа является сложность технической реализации и недостаточно высокая эффективность подавления внешних акустических помех, при использовании данного способа для осуществления спектрального анализа.There is a method of spectral analysis of electrical signals (RF patent No. 2431853), in which the analyzed electrical signal is fed simultaneously to a comb of filters tuned to different frequencies and the signals are measured at the outputs of these filters, and before the measurements, the range of controlled frequencies is divided into resolution elements with a sampling step corresponding to the desired accuracy and resolution of the spectral analysis. The disadvantage of this method is the complexity of the technical implementation and the insufficiently high efficiency of suppressing external acoustic noise when using this method for spectral analysis.

Известен способ спектрального анализа сигналов (патент РФ №2127888), в котором при дискретизации и квантовании сигнала создают последовательности дискретных значений сигнала с различными частотами следования отсчетов в каждой из них. При этом дискретные значения этих последовательностей фильтруют с помощью цифровых полосовых фильтров и цифровых фильтров нижних частот. Сигналы с выходов цифровых полосовых фильтров подвергают обработке, связанной с определением амплитудных значений, а на их основе и остальных информативных параметров полосовых сигналов. Недостатком данного способа является то, что способ предназначен для проведения спектрального анализа сигналов с постоянной относительной разрешающей способностью по частоте, а также большая вычислительная сложность и, соответственно, трудность технической реализации в устройствах цифровой обработки речевых сигналов.There is a method of spectral analysis of signals (RF patent No. 2127888), in which, when sampling and quantizing a signal, sequences of discrete signal values are created with different sampling frequencies in each of them. Moreover, the discrete values of these sequences are filtered using digital band-pass filters and digital low-pass filters. The signals from the outputs of digital band-pass filters are subjected to processing associated with the determination of the amplitude values, and based on them, the remaining informative parameters of the band-pass signals. The disadvantage of this method is that the method is intended for spectral analysis of signals with a constant relative frequency resolution, as well as great computational complexity and, accordingly, the difficulty of technical implementation in digital speech processing devices.

Известен способ спектрального анализа многочастотных периодических сигналов, представленных цифровыми отсчетами (Функциональный контроль и диагностика электротехнических систем и устройств по цифровым отсчетам мгновенных значений тока и напряжения. /под редакцией Е.И. Гольдштейна - Томск: Изд. «Печатная мануфактура», 2003, с.92-94), недостатком которого является невозможность определения сигналом или помехой являются выделенные гармонические составляющие, а также большое время анализа.A known method of spectral analysis of multi-frequency periodic signals represented by digital samples (Functional control and diagnostics of electrical systems and devices by digital samples of instantaneous values of current and voltage. / Edited by EI Goldstein - Tomsk: Publishing House "Printing Manufactory", 2003, p .92-94), the disadvantage of which is the inability to determine the signal or interference are the selected harmonic components, as well as the long analysis time.

Известно устройство для выделения акустических сигналов в каналах связи, описанное в патенте RU 2171549, H04Q 1/46, недостатком которого является недостаточно высокая эффективность подавления внешних акустических помех.A device for separating acoustic signals in communication channels is described in patent RU 2171549, H04Q 1/46, the disadvantage of which is the insufficiently high efficiency of suppressing external acoustic noise.

Известно устройство для выделения тональных сигналов в каналах связи по патенту RU 2214051, H04B 3/46, H04Q 1/457, H04M 1/50. Изобретение относится к области электросвязи, в частности к автоматическим средствам приема сигналов канальной сигнализации в системах многоканальной связи, и может использоваться для обнаружения акустических сигналов в телефонных каналах. Известное техническое решение обладает недостаточно высокой эффективностью при решении задачи разделения речи и пауз в условиях наличия акустических помех.A device for the allocation of tonal signals in communication channels according to the patent RU 2214051, H04B 3/46, H04Q 1/457, H04M 1/50. The invention relates to the field of telecommunications, in particular to automatic means for receiving channel signaling signals in multi-channel communication systems, and can be used to detect acoustic signals in telephone channels. The known technical solution is not high enough in solving the problem of separation of speech and pauses in the presence of acoustic noise.

Известен способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала по патенту RU 2680735 G10L 21/0272, недостатком которого является недостаточно высокая эффективность при решении задачи разделения речи и пауз в условиях наличия акустических помех с большим числом составляющих.A known method of separating speech and pauses by analyzing the phase values of the frequency components of noise and signal according to patent RU 2680735 G10L 21/0272, the disadvantage of which is not high enough when solving the problem of separation of speech and pauses in the presence of acoustic noise with a large number of components.

Известен способ разделения речи и пауз путем анализа значений корреляционной функции помехи и смеси сигнала и помехи по патенту RU 2691603 G10L 15/00. Известное техническое решение обладает недостаточно высокой эффективностью при решении задачи разделения речи и пауз в условиях априорной неопределенности информации о присутствии в интервале анализа только помехи или смеси помехи и сигнала. A known method of separating speech and pauses by analyzing the values of the correlation function of noise and signal mixture and interference according to patent RU 2691603 G10L 15/00. The known technical solution is not sufficiently effective in solving the problem of separation of speech and pauses under conditions of a priori uncertainty of information about the presence in the analysis interval of only interference or a mixture of interference and signal.

Известен способ разделения речи и пауз, описанный в книге «Цифровая обработка речевых сигналов. //Л.Р. Рабинер, Р.В. Шафер. Перевод с английского под редакцией М.В. Назарова и Ю.Н. Прохорова. Москва, «Радио и связь», 1981», стр. 123 - 126. Недостатком данного способа являются недостаточно высокая точность решения задачи определения момента появления речевого сигнала и высокая вероятность ошибочного решения о появлении сигнала в условиях наличия акустического шум.A known method of separating speech and pauses, described in the book "Digital processing of speech signals. //L.R. Rabiner, R.V. Best man. Translation from English edited by M.V. Nazarova and Yu.N. Prokhorov. Moscow, “Radio and Communications, 1981”, pp. 123 - 126. The disadvantage of this method is the insufficiently high accuracy of solving the problem of determining the moment of occurrence of a speech signal and the high probability of an erroneous decision on the appearance of a signal in the presence of acoustic noise.

Наиболее близким аналогом по технической сущности к предлагаемому является способ разделения речи и пауз путем сравнительного анализа значений мощностей помехи и смеси сигнала и помехи по патенту RU 2668407 G10L 25/93.The closest analogue in technical essence to the proposed one is a method for separating speech and pauses by comparative analysis of the values of the interference power and a mixture of signal and interference according to patent RU 2668407 G10L 25/93.

Способ-прототип заключается в следующем.The prototype method is as follows.

На всем интервале анализа, состоящего из интервала, который не содержит речевой сигнал, и интервала, который содержит смесь сигнала и помехи, сигнал (помеха или смесь сигнала и помехи), поступающий в систему, возводят в квадрат, после возведения в квадрат сигнал разветвляют на две одинаковые составляющие, одну из них фильтруют фильтром нижних частот (ФНЧ), вторую составляющую фильтруют полосовым фильтром, сигналы с выходов фильтров дискретизируют и заносят в память для последующей обработки, формируют «скользящее окно», состоящее из двух интервалов одинаковой длительности (одинаковое количество отсчетов). Мощность для каждого интервала рассчитывают как разность сумм отсчетов, взятых на выходах ФНЧ и полосового фильтра в течение длительности соответствующего интервала, после чего разность значений мощностей, полученных для второго и для первого интервалов сравнивают с заранее определенным порогом, если разность полученных значений мощностей не превышает порог, то «скользящее окно» сдвигают на некоторое, заранее определенное количество отсчетов (K1), описанную процедуру повторяют до тех пор, пока порог не будет превышен, этот момент считают моментом возможного появления сигнала, значение этого момента определяют как значение положения правой границы первого интервала, входящего в «скользящее окно», данное значение запоминают, после чего заданное число раз осуществляют следующую процедуру, «скользящее окно» сдвигают на некоторое, заранее определенное количество отсчетов (K2), осуществляют расчет значений мощности для второго интервала, полученное значение сравнивают со значением мощности для первого интервала, которое было запомнено в момент формирования гипотезы о появлении сигнала. После завершения данной процедуры рассчитывают суммарное количество превышений значением мощности, полученным для второго интервала запомненного значения мощности, для первого интервала, если данное значение превышает заданный порог, то процесс завершают, рассчитывают время появления речевого сигнала как сумму значений запомненного момента превышения порога и половины одного временного интервала, входящего в «скользящее окно».Throughout the analysis interval, consisting of an interval that does not contain a speech signal, and an interval that contains a mixture of signal and interference, the signal (interference or a mixture of signal and interference) entering the system is squared, after squaring the signal is branched into two identical components, one of them is filtered by a low-pass filter (LPF), the second component is filtered by a band-pass filter, the signals from the outputs of the filters are sampled and stored in the memory for subsequent processing, form a “sliding window”, consisting of two intervals of the same duration (the same number of samples ) The power for each interval is calculated as the difference between the sums of samples taken at the outputs of the low-pass filter and the band-pass filter during the duration of the corresponding interval, after which the difference in the power values obtained for the second and the first intervals is compared with a predetermined threshold, if the difference in the received power values does not exceed the threshold then the “sliding window” is shifted by a certain, predetermined number of samples (K 1 ), the described procedure is repeated until the threshold is exceeded, this moment is considered the moment of the possible appearance of the signal, the value of this moment is determined as the value of the position of the right boundary of the first the interval included in the "sliding window", this value is remembered, after which the following number of times is carried out the following procedure, the "sliding window" is shifted by a predetermined number of samples (K 2 ), the power values for the second interval are calculated, the obtained value is compared with power value ty for the first interval, which was remembered at the time of the formation of the hypothesis of the appearance of the signal. After completion of this procedure, the total number of excesses is calculated by the power value obtained for the second interval of the stored power value, for the first interval, if this value exceeds a predetermined threshold, the process is completed, the time of appearance of the speech signal is calculated as the sum of the values of the stored time of exceeding the threshold and half of one time interval included in the "sliding window".

Недостатком способа-прототипа является его недостаточно высокая эффективность при решении задачи разделения речи и пауз в условиях априорной неопределенности информации о присутствии в интервале анализа только помехи или только речевого сигнала или смеси помехи и речевого сигнала.The disadvantage of the prototype method is its insufficiently high efficiency in solving the problem of separating speech and pauses under conditions of a priori uncertainty of information about the presence in the analysis interval of only interference or only a speech signal or a mixture of interference and speech signal.

Задачей предлагаемого способа является повышение эффективности принятия правильного решения о появлении речевого сигнала при наличии акустического шума в условиях неопределенности информации о присутствии в интервале анализа только помехи или только речевого сигнала или смеси помехи и речевого сигнала.The objective of the proposed method is to increase the efficiency of making the right decision about the appearance of a speech signal in the presence of acoustic noise under conditions of uncertainty about the presence in the analysis interval of only interference or only a speech signal or a mixture of interference and speech signal.

Для решения поставленной задачи в способе разделения речи и пауз по значениям дисперсий амплитуд спектральных составляющих, который заключается в том, что на всем интервале анализа, состоящего из интервала, который содержит шум или речевой сигнал или смесь речевого сигнала и шума, которые поступают в устройство (входной сигнал), сигнал разветвляют на две одинаковые составляющие, одну из них фильтруют фильтром нижних частот (ФНЧ), вторую составляющую фильтруют полосовым фильтром, сигналы, поступившие на выходы фильтров дискретизируют и заносят в память для последующей обработки, формируют «скользящее окно», состоящее из интервалов одинаковой длительности, «скользящее окно» сдвигают на некоторое, заранее определенное количество отсчетов, согласно изобретению, «скользящее окно» формируют так, что оно включает в себя два интервала анализа, каждый из которых состоит из нескольких интервалов одинаковой длительности, первое положение «скользящего окна» устанавливают так, что в первом интервале анализа присутствует только помеха, осуществляют спектральный анализ входного сигнала для каждого интервала следующим образом, каждый результат преобразования входного сигнала, который образуется после умножения входного сигнала на синус и косинус опорных частот, разветвляют на две одинаковые составляющие, первую составляющую фильтруют фильтром нижних частот (ФНЧ), полоса которого согласована с полосой анализируемого сигнала, одновременно вторую составляющую фильтруют полосовым фильтром, полоса пропускания которого выбирается так, что верхняя частота полосового фильтра соответствует верхней частоте анализируемого сигнала, нижнюю частоту полосового фильтра устанавливают равной некоторому заранее заданному значению, выбор ФНЧ и полосового фильтра осуществляют с идентичными в максимальной степени фазо-частотными характеристиками и так, что амплитудно-частотная характеристика (АЧХ) полосового фильтра в области частот близких к нулю имеет максимально-возможную крутизну, в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ и полосового фильтра становится меньше некоторой заранее заданной величины, обеспечивают идентичность их АЧХ в максимальной степени, сигналы, прошедшие ФНЧ и полосовой фильтр, вычитают один из другого, результаты вычитания преобразуют в цифровой вид, по данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют мгновенную спектральную плотность (МСП) для каждой опорной частоты и запоминают эти значения пропорциональные амплитуде сигналов, находят среднее значение МСП, определяют значение порога путем умножения найденного среднего значения МСП на коэффициент, значение которого устанавливают заранее, полученные значения МСП сравнивают с порогом, по результатам сравнения принимают решение о наличии или об отсутствии сигнала с соответствующей частотой, находят значения мощности каждого выделенного сигнала путем возведения в квадрат соответствующих значений МСП, находят для каждой гармоники дисперсию значений мощностей для первого и второго интервалов анализа, рассчитывают среднее значение дисперсий мощностей первого и второго интервалов, усреднение осуществляют по числу гармоник, определяют пороговое значение путем умножения среднего значения дисперсии значений мощностей первого интервала анализа, принадлежащего «скользящему окну», на коэффициент, значение которого определяют заранее, находят значение разности средних значений дисперсий мощностей, рассчитанных для первого и второго интервалов анализа, данное значение разности сравнивают с порогом, считают, что во втором интервале анализа присутствует только помеха, если значение разности среднее значение дисперсий значений мощностей не превышает порог, в противном случае считают, что во втором интервале анализа присутствует сигнал или смесь сигнала и помехи, сдвигают «скользящее окно» на заданное значение интервалов, описанную процедуру повторяют, для последующих шагов пороговое значение для разности средних значений дисперсии значений мощностей интервалов анализа определяют с использованием среднего значения средних значений дисперсии мощностей интервалов анализа, которое рассчитывают, применяя принцип «первый пришел, первый ушел», процесс продолжают до тех пор, пока не закончится время, отведенное для анализа входного сигнала.To solve the problem in a method for separating speech and pauses according to the variance of the amplitudes of the spectral components, which consists in the fact that the entire analysis interval consists of an interval that contains noise or a speech signal or a mixture of a speech signal and noise that enter the device ( input signal), the signal is branched into two identical components, one of them is filtered by a low-pass filter (low-pass filter), the second component is filtered by a band-pass filter, the signals received at the outputs of the filters are sampled and stored in the memory for subsequent processing, form a "sliding window", consisting of intervals of the same duration, the “sliding window” is shifted by a certain, predetermined number of samples, according to the invention, the “sliding window” is formed so that it includes two analysis intervals, each of which consists of several intervals of the same duration, the first position " sliding window ”is set so that in the first interval e analysis, there is only interference, spectral analysis of the input signal for each interval is performed as follows, each result of converting the input signal, which is formed after multiplying the input signal by the sine and cosine of the reference frequencies, is branched into two identical components, the first component is filtered by a low-pass filter (low-pass filter) ), the band of which is matched with the band of the analyzed signal, at the same time the second component is filtered by a band-pass filter, the pass-band of which is selected so that the upper frequency of the band-pass filter corresponds to the upper frequency of the analyzed signal, the lower frequency of the band-pass filter is set equal to some predetermined value, the choice of the low-pass filter and the band-pass filter carried out with identical maximum frequency-phase characteristics and so that the amplitude-frequency characteristic (AFC) of the band-pass filter in the frequency region close to zero has the maximum possible slope in the frequency region, starting from a value for which the difference between the frequency response of the low-pass filter and the band-pass filter becomes less than some predetermined value, they ensure that their frequency response is identical to the maximum, the signals that pass the low-pass filter and the band-pass filter are subtracted from one another, the subtraction results are converted to digital form, according to the values corresponding to the sine and cosine components of the same frequency, determine the instantaneous spectral density (MRI) for each reference frequency and store these values proportional to the amplitude of the signals, find the average value of the MRI, determine the threshold value by multiplying the found average value of the MRI by a coefficient whose value is set in advance , the obtained values of the MRF are compared with a threshold, according to the results of the comparison, a decision is made about the presence or absence of a signal with an appropriate frequency, the power values of each selected signal are found by squaring the corresponding values of the MRF, find the display for each harmonic the power values for the first and second intervals of analysis, calculate the average value of the power variances of the first and second intervals, averaging over the number of harmonics, determine the threshold value by multiplying the average value of the variance of the power values of the first analysis interval belonging to the “sliding window” by a coefficient, value which is determined in advance, the difference value of the average values of power variances calculated for the first and second analysis intervals is found, this difference value is compared with a threshold, it is believed that only interference is present in the second analysis interval if the average value of the variances of power values does not exceed the threshold, otherwise, consider that in the second analysis interval there is a signal or a mixture of signal and interference, shift the “sliding window” by a predetermined value of the intervals, repeat the described procedure, for the next steps the threshold value for the difference of the average dispersion values and the values of the power of the analysis intervals are determined using the average value of the average variance of the power of the intervals of the analysis, which is calculated using the principle of "first come, first go", the process continues until the time allotted for the analysis of the input signal is over.

Предлагаемый способ заключается в следующем.The proposed method is as follows.

«Скользящее окно» формируют так, что каждый из двух интервалов анализа, которые его образуют, состоит из нескольких интервалов одинаковой длительности (иллюстративный пример приведен на фиг. 2, 3).A "sliding window" is formed so that each of the two analysis intervals that form it consists of several intervals of the same duration (an illustrative example is shown in Figs. 2, 3).

Первое положение «скользящего окна» устанавливают так, что в первом интервале анализа присутствует только помеха.The first position of the "sliding window" is set so that only interference is present in the first analysis interval.

Осуществляют спектральный анализ входного сигнала для каждого интервала следующим образом.Carry out a spectral analysis of the input signal for each interval as follows.

Каждый результат преобразования входного сигнала, который образуется после умножения входного сигнала на синус и косинус опорных частот, разветвляют на две одинаковые составляющие.Each result of the conversion of the input signal, which is formed after multiplying the input signal by the sine and cosine of the reference frequencies, branch into two identical components.

Первую составляющую фильтруют фильтром нижних частот (ФНЧ), полоса которого согласована с полосой анализируемого сигнала. Одновременно вторую составляющую фильтруют полосовым фильтром, полоса пропускания которого выбирается так, что верхняя частота полосового фильтра соответствует верхней частоте анализируемого сигнала, нижнюю частоту полосового фильтра устанавливают равной некоторому заранее заданному значению. Выбор ФНЧ и полосового фильтра осуществляют с идентичными в максимальной степени фазо-частотными характеристиками и так, что амплитудно-частотная характеристика (АЧХ) полосового фильтра в области частот близких к нулю имеет максимально возможную крутизну в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ и полосового фильтра становится меньше некоторой заранее заданной величины, обеспечивают идентичность их АЧХ в максимальной степени (иллюстративный пример приведен на фиг. 1).The first component is filtered by a low-pass filter (low-pass filter), the band of which is consistent with the band of the analyzed signal. At the same time, the second component is filtered by a band-pass filter, the passband of which is selected so that the upper frequency of the band-pass filter corresponds to the upper frequency of the analyzed signal, the lower frequency of the band-pass filter is set to a certain predetermined value. The low-pass filter and the band-pass filter are selected with phase-frequency characteristics identical to the maximum and so that the amplitude-frequency characteristic (AFC) of the band-pass filter in the frequency domain close to zero has the maximum possible slope in the frequency domain, starting from a value for which the difference in values The frequency response of the low-pass filter and the band-pass filter becomes less than a certain predetermined value, ensure their frequency response is identical to the maximum extent (an illustrative example is shown in Fig. 1).

Сигналы, прошедшие ФНЧ и полосовой фильтр, преобразованные в цифровой вид, вычитают один из другого, по данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют значения мгновенной спектральной плотности (МСП) пропорциональные амплитуде сигналов для каждой опорной частоты по выражениям (см., например, «Функциональный контроль и диагностика электротехнических систем и устройств по цифровым отсчетам мгновенных значений тока и напряжения. /под редакцией Е.И. Гольдштейна - Томск: Изд. «Печатная мануфактура», 2003», с.92-94):The signals that have passed the low-pass filter and the band-pass filter, converted to a digital form, are subtracted from one another, according to the values corresponding to the sine and cosine components of the same frequency, the instantaneous spectral density (ICM) values proportional to the signal amplitude for each reference frequency are determined by the expressions (see , for example, “Functional control and diagnostics of electrical systems and devices by digital readings of instantaneous values of current and voltage. / Edited by EI Goldshtein - Tomsk: Publishing House“ Printing Manufactory ”, 2003, p. 92-94):

S(ωj)=

Figure 00000001
; (1)S (ω j ) =
Figure 00000001
; (1)

Figure 00000002
;
Figure 00000002
;

Figure 00000003
, (2)
Figure 00000003
, (2)

где S1j) и S2j) – синусная и косинусная составляющие МСП;where S 1j ) and S 2j ) are the sine and cosine components of the SME;

a(ti) – отсчеты мгновенных значений в моменты времени t1, t2, …, tj, …, tN;a (t i ) - readings of instantaneous values at time t 1 , t 2 , ..., t j , ..., t N ;

t2-t1=t3-t2=tN-tN-1=…=Δt;t 2 -t 1 = t 3 -t 2 = t N -t N-1 = ... = Δt;

Δt=Т/N,Δt = T / N,

где Δt - шаг дискретизации;where Δt is the sampling step;

N - количество точек за время T,N is the number of points in time T,

ω1, ω2, …, ωj, …, ωn – опорные частоты.ω 1 , ω 2 , ..., ω j , ..., ω n are reference frequencies.

Находят среднее значение МСП, определяют значение порога путем умножения найденного среднего значения МСП на коэффициент, значение которого устанавливают заранее. Значение данного коэффициента определяется путем математического моделирования или экспериментальным путем. Полученные значения МСП сравнивают с порогом, по результатам сравнения принимают решение о наличии или об отсутствии сигнала с соответствующей частотой.Find the average value of the SME, determine the threshold value by multiplying the found average value of the SME by a coefficient, the value of which is set in advance. The value of this coefficient is determined by mathematical modeling or experimentally. The obtained values of the MRF are compared with a threshold; according to the results of the comparison, a decision is made about the presence or absence of a signal with an appropriate frequency.

Находят значения мощности каждого выделенного сигнала путем возведения в квадрат соответствующих значений МСП.Find the power values of each selected signal by squaring the corresponding values of the ICP.

Рассчитывают известным способом дисперсию значений мощностей для первого и второго интервалов анализа для каждой гармоники, и среднее значение дисперсий мощностей первого и второго интервалов, усреднение осуществляют по числу гармоник.The dispersion of power values for the first and second analysis intervals for each harmonic is calculated in a known manner, and the average value of the power variances of the first and second intervals, averaging is performed over the number of harmonics.

Определяют пороговое значение путем умножения среднего значения дисперсии значений мощностей гармоник первого интервала анализа, принадлежащего «скользящему окну», на коэффициент, значение которого определяют заранее. Значение данного коэффициента определяется путем математического моделирования или экспериментальным путем.The threshold value is determined by multiplying the average variance of the harmonics power values of the first analysis interval belonging to the “sliding window” by a coefficient whose value is determined in advance. The value of this coefficient is determined by mathematical modeling or experimentally.

Находят значение разности средних значений дисперсий мощностей гармоник, рассчитанных для первого и второго интервалов анализа.Find the difference between the average values of the variances of the harmonics power calculated for the first and second intervals of the analysis.

Данное значение разности сравнивают с порогом. Если значение разности средних значений дисперсий значений мощностей не превышает порог, то считают, что во втором интервале анализа присутствует только помеха, в противном случае считают, что во втором интервале анализа присутствует сигнал или смесь сигнала и помехи.This difference value is compared with a threshold. If the value of the difference in the average values of the variances of the power values does not exceed the threshold, then it is considered that only interference is present in the second analysis interval, otherwise it is assumed that a signal or a mixture of signal and noise is present in the second analysis interval.

Сдвигают «скользящее окно» на заданное значение интервалов, описанную процедуру повторяют.The “sliding window” is shifted by the set value of the intervals, the described procedure is repeated.

Для последующих шагов пороговое значение для разности средних значений дисперсии значений мощностей гармоник определяют с использованием среднего значения средних значений дисперсии мощностей гармоник, которое рассчитывают, применяя принцип «первый пришел, первый ушел» (см., например, Роберт Круз. «Структуры данных и проектирования программ». – Бином. Лаборатория знаний. 2008). То есть из списка усредненных средних значений дисперсии мощностей гармоник (ДМГ), вычеркивают первое значение и добавляют последнее рассчитанное значение. После чего значения ДМГ перенумеровывают, а именно, значению со вторым номером присваивают номер один, значению с третьим номером присваивают номер два, и т.д., последнему рассчитанному значению присваивают последний номер.For the next steps, the threshold value for the difference between the average values of the variance of the harmonics power values is determined using the average values of the average values of the dispersion of the harmonics power, which is calculated using the principle of “first come, first leave” (see, for example, Robert Cruz. “Data and design structures programs. ”- Binom. Laboratory of knowledge. 2008). That is, from the list of averaged average values of the dispersion of the harmonics powers (DMG), delete the first value and add the last calculated value. After that, the DMG values are renumbered, namely, the value with the second number is assigned the number one, the value with the third number is assigned the number two, etc., the last calculated value is assigned the last number.

Количество средних значений дисперсии мощностей, используемое при расчете их средних значений с использованием принципа «первый пришел, первый ушел», определяют путем математического моделирования или экспериментальным путем.The number of average values of the power variance used in calculating their average values using the principle of "first come, first leave" is determined by mathematical modeling or experimentally.

Процесс продолжают до тех пор, пока не закончится время, отведенное для анализа входного сигнала.The process continues until the time allotted for the analysis of the input signal is over.

Ниже приведены результаты моделирования процесса определения вероятности правильного решения о появлении речевого сигнала при использовании предлагаемого способа.Below are the results of modeling the process of determining the probability of a correct decision about the appearance of a speech signal when using the proposed method.

Сумма гармонических сигналов при моделировании представлена в виде совокупности гармонических колебаний со случайными значениями амплитуд (Usi) и фаз (ϕsi), которые распределены по нормальному (амплитуды) и равномерному (фазы) законам, соответственноThe sum of harmonic signals during modeling is presented as a set of harmonic oscillations with random values of amplitudes (U si ) and phases (ϕ si ), which are distributed according to normal (amplitudes) and uniform (phases) laws, respectively

U=

Figure 00000004
, (3)U =
Figure 00000004
, (3)

где: ωsi φsi

Figure 00000005
– частота, фаза, амплитуда i-го гармонического сигнала;where: ω si φ si
Figure 00000005
- frequency, phase, amplitude of the i-th harmonic signal;

Ns – число гармонических сигналов.Ns is the number of harmonic signals.

При моделировании:When modeling:

– частоты гармоник помехи и сигнала формировались как случайные величины, значения которых распределены по равномерному закону в полосе сигнала;- the harmonic frequencies of the noise and signal were formed as random variables whose values are distributed uniformly in the signal band;

– фазы гармоник помехи и сигнал представлены как случайные величины, значения которых распределены по равномерному закону;- the phases of the noise harmonics and the signal are presented as random variables whose values are distributed according to a uniform law;

– амплитуды сигналов представлены как случайные величины, распределенные по равномерному закону в диапазоне от 1 до 2;- the amplitudes of the signals are presented as random variables distributed according to a uniform law in the range from 1 to 2;

– амплитуды гармоник помехи представлены как случайные величины, значения которых распределены по нормальному закону.- the amplitudes of the harmonics of the interference are presented as random variables whose values are distributed according to the normal law.

Моделирование проведено для следующих значений параметровThe simulation was carried out for the following parameter values

– диапазон изменения частот речевого сигнала: 300 Гц – 3400 Гц;- frequency range of the speech signal: 300 Hz - 3400 Hz;

– число реализаций – 300;- the number of implementations is 300;

– число гармоник сигнала – 8;- the number of harmonics of the signal is 8;

– число гармоник помехи – 20;- the number of harmonics of the interference - 20;

– число временных шагов – 50;- the number of time steps - 50;

– число интервалов, на которые осуществлялся сдвиг «скользящего окна» – 3;- the number of intervals by which the shift of the "sliding window" was carried out - 3;

– число опорных частот – 39;- the number of reference frequencies - 39;

– коэффициент, определяющий частоту дискретизации – 9000;- coefficient determining the sampling frequency - 9000;

– значение первой опорной частоты – 300 Гц;- the value of the first reference frequency is 300 Hz;

– коэффициент, определяющий шаг изменения опорной частоты составляет 1,05 для частот, значения которых не превышают 1000 Гц, и составляет 1,1 для частот, значения которых превышают 1000 Гц;- the coefficient determining the step of changing the reference frequency is 1.05 for frequencies whose values do not exceed 1000 Hz, and is 1.1 for frequencies whose values exceed 1000 Hz;

– значение порога для амплитуды гармоник – 0,1;- the threshold value for the harmonic amplitude is 0.1;

– значение полосы частот полосового фильтра с максимальной крутизной АЧХ – 200 Гц.- the value of the frequency band of the band-pass filter with a maximum slope of the frequency response - 200 Hz.

Результаты моделирования процесса разделения речи и пауз приведены в таблице.The simulation results of the process of separation of speech and pauses are given in the table.

Наименование параметраParameter Name Отношение мощностей сигнала и помехиThe ratio of signal power and interference 44 22 11 0,50.5 0,30.3 Число интервалов, образующих интервал анализа The number of intervals forming the analysis interval 22 Значение вероятности правильного решения о появлении речевого сигналаThe probability value of the correct decision about the appearance of a speech signal 0,70.7 0,510.51 0,420.42 0,40.4 0,350.35 Значение вероятности ложной тревогиFalse Alarm Probability Value 0,10.1 0,10.1 0,10.1 0,10.1 0,10.1 Число интервалов, образующих интервал анализаThe number of intervals forming the analysis interval 33 Значение вероятности правильного решения о появлении речевого сигналаThe probability value of the correct decision about the appearance of a speech signal 11 11 0,9980,998 0,9870.987 0,940.94 Значение вероятности ложной тревогиFalse Alarm Probability Value 0,050.05 0,050.05 0,050.05 0,050.05 0,050.05

На основе результатов анализа данных, приведенных в таблице, установлено, что при значениях отношения мощностей сигнала и помехи близких к 1 вероятность правильного решения о появлении речевого сигнала близка к 0,999 при этом значение вероятности ложной тревоги (принятие решения о появлении речевого сигнала при его отсутствии) равна 0,05.Based on the results of the analysis of the data given in the table, it was found that when the ratio of signal power and interference is close to 1, the probability of a correct decision about the appearance of a speech signal is close to 0.999, while the probability of false alarm (making a decision about the appearance of a speech signal in its absence) equal to 0.05.

Структурная схема устройства, реализующего предлагаемый способ, приведена на фиг. 4, где обозначено:The structural diagram of a device that implements the proposed method is shown in FIG. 4, where indicated:

1 – электроакустическое устройство (ЭАУ);1 - electro-acoustic device (EAU);

2 – усилитель низкой частоты (УНЧ);2 - low frequency amplifier (VLF);

3.1 – 3.n – блоки умножения с первого по n-й;3.1 - 3.n - multiplication blocks from the first to the nth;

4.1 – 4.n – фильтры нижних частот (ФНЧ) с первого по n-й;4.1 - 4.n - low-pass filters (low-pass filters) from the first to the n-th;

5.1 – 5.n – устройства вычитания с первого по n-й;5.1 - 5.n - subtraction devices from the first to the n-th;

6.1 – 6.n – аналого-цифровые преобразователи (АЦП) с первого по n-й;6.1 - 6.n - analog-to-digital converters (ADCs) from first to n-th;

7.1 – 7.n – полосовые фильтры с первого по n-й;7.1 - 7.n - band pass filters from the first to the n-th;

8 – вычислительное устройство (ВУ).8 - computing device (WU).

Устройство содержит последовательно соединенные ЭАУ 1 и УНЧ 2, вход ЭАУ 1 является входом устройства. Кроме того – n параллельных линеек, каждая из которых состоит из соответствующих последовательно соединенных блока умножения 3, ФНЧ 4, устройства вычитания 5 и АЦП 6, при этом полосовой фильтр 7 включен между выходом блока умножения 3 и вторым входом устройства вычитания 5. Входы n блоков умножения 3.1 – 3.n объединены и соединены с выходом УНЧ 2. Выходы с первого по n-й АЦП 6.1 – 6.n соединены с соответствующими входами с первого по n-й вычислительного устройства 8, выход которого является выходом устройства. Вторые входы блоков умножения 3.1 – 3.n являются входами для опорных сигналов.The device contains a series-connected EAU 1 and VLF 2, the input of the EAU 1 is the input of the device. In addition, there are n parallel rulers, each of which consists of a corresponding series-connected multiplication unit 3, low-pass filter 4, a subtraction device 5 and an ADC 6, while a band-pass filter 7 is connected between the output of the multiplication block 3 and the second input of the subtraction device 5. Inputs of n blocks multiplications 3.1 - 3.n are combined and connected to the output of VLF 2. The outputs from the first to the n-th ADCs 6.1 - 6.n are connected to the corresponding inputs from the first to the n-th computing device 8, the output of which is the output of the device. The second inputs of the multiplication blocks 3.1 - 3.n are inputs for the reference signals.

Устройство работает следующим образом.The device operates as follows.

Шум или аддитивную смесь сигнала и шума, которые поступают с выхода ЭАУ 1, усиливают в УНЧ 2 и подают на вход n параллельных линеек.The noise or additive mixture of signal and noise that comes from the output of the EAU 1 is amplified in the ULF 2 and fed to the input of n parallel rulers.

Для обработки одной поднесущей используют две линейки устройства. То есть, если используют k поднесущих, то число линеек равноTo process one subcarrier, two lines of the device are used. That is, if k subcarriers are used, then the number of bars is equal to

n =2*k.n = 2 * k.

Помеху или аддитивную смесь сигнала и помехи с выхода УНЧ 2 подают на первые входы блоков умножения 3.1-3.n, на вторые входы которых подают соответствующие опорные сигналы, например,The interference or additive mixture of signal and interference from the output of VLF 2 is fed to the first inputs of the multiplication blocks 3.1-3.n, the second inputs of which supply the corresponding reference signals, for example,

Uоп1=sin(x);U op1 = sin (x);

Uоп2=cos(x).U op2 = cos (x).

…....

Uоп(n-1)=sin(x);U op (n-1) = sin (x);

Uопn=cos(x).U opn = cos (x).

Результат умножения сигнала и помехи на опорные сигналы разветвляют на две одинаковые составляющие. Первую составляющую фильтруют ФНЧ 4.1 – 4.n, полоса каждого из которых согласована с полосой сигнала. Одновременно вторую составляющую фильтруют полосовыми фильтрами 7.1 – 7.n, полоса пропускания каждого из которых выбирается так, что верхняя частота полосовых фильтров 7.1 – 7.n соответствует верхней частоте сигнала, нижнюю частоту полосовых фильтров 7.1 – 7.n устанавливают согласованно со значениями разности между соседними опорными частотами.The result of multiplying the signal and interference by reference signals branch into two identical components. The first component is filtered by the low-pass filter 4.1 - 4.n, the band of each of which is consistent with the signal band. At the same time, the second component is filtered by band-pass filters 7.1 - 7.n, the passband of each of which is selected so that the upper frequency of the band-pass filters 7.1 - 7.n corresponds to the upper frequency of the signal, the lower frequency of the band-pass filters 7.1 - 7.n is set in accordance with the difference between adjacent reference frequencies.

Значение нижней частоты полосовых фильтров 7.1 – 7.n определяют на этапе разработки экспериментальным путем или методом математического моделирования как значение, обеспечивающее максимальную эффективность спектрального анализа.The value of the lower frequency of bandpass filters 7.1 - 7.n is determined at the development stage experimentally or by mathematical modeling as a value that ensures maximum spectral analysis efficiency.

Выбор ФНЧ 4.1 – 4.n и полосовых фильтров 7.1 – 7.n осуществляют с идентичными в максимальной степени фазо-частотными характеристиками и так, что АЧХ полосовых фильтров 7.1 – 7.n в области частот близких к нулю имеет максимально-возможную крутизну, в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ 4.1 – 4.n и полосовых фильтров 7.1 – 7.n становится меньше некоторой заранее заданной величины (Fр), обеспечивают идентичность их АЧХ в максимальной степени (иллюстративный пример приведен на фиг. 1).The choice of low-pass filters 4.1 - 4.n and band-pass filters 7.1 - 7.n is carried out with phase-frequency characteristics identical to the maximum and so that the frequency response of band-pass filters 7.1 - 7.n in the frequency region close to zero has the maximum possible slope, in frequency range, starting with a value for which the difference between the frequency response of the low-pass filter 4.1 - 4.n and the band-pass filters 7.1 - 7.n becomes less than some predetermined value (F p ), ensure that their frequency response is maximally identical (an illustrative example is shown in FIG. . 1).

Сигналы, прошедшие ФНЧ 4.1 – 4.n и полосовые фильтры 7.1 – 7.n, вычитают один из другого. То есть, из сигнала первого ФНЧ 4.1 вычитают сигнал первого полосового фильтра 7.1, из сигнала второго ФНЧ 4.2 вычитают сигнал второго полосового фильтра 7.2 и т.д.Signals that have passed through the LPF 4.1 - 4.n and bandpass filters 7.1 - 7.n subtract one from the other. That is, the signal of the first bandpass filter 7.1 is subtracted from the signal of the first LPF 4.1, the signal of the second bandpass filter 7.2 is subtracted from the signal of the second LPF 4.2, etc.

Полученные сигналы преобразуют в цифровой вид в соответствующих с первого по n-й АЦП 6.1 – 6.n. Данные сигналы в цифровом виде подают в ВУ 8.The received signals are converted to digital form in the corresponding from the first to the n-th ADC 6.1 - 6.n. These signals are digitally fed to WU 8.

В ВУ 8 по данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют мгновенную спектральную плотность (МСП) по ф. 1 и ф. 2 для каждой опорной частоты и запоминают эти значения, пропорциональные амплитуде сигналов.In WU 8 according to these values corresponding to the sine and cosine components of the same frequency, determine the instantaneous spectral density (MRF) by f. 1 and f. 2 for each reference frequency and remember these values proportional to the amplitude of the signals.

Из полученных значений находят МСП с максимальным значением. Определяют значение порога путем умножения найденного максимального значения МСП на коэффициент, значение которого устанавливают заранее.From the obtained values, the SMEs with the maximum value are found. The threshold value is determined by multiplying the found maximum value of the SME by a coefficient, the value of which is set in advance.

Полученные значения МСП сравнивают с рассчитанным значением порога. По результатам сравнения принимают решение о наличии или об отсутствии сигнала с соответствующей частотой.The obtained values of the MRP are compared with the calculated threshold value. Based on the results of the comparison, a decision is made about the presence or absence of a signal with an appropriate frequency.

Находят значения мощности каждого выделенного сигнала путем возведения в квадрат соответствующих значений МСП.Find the power values of each selected signal by squaring the corresponding values of the ICP.

Рассчитывают известным способом дисперсию значений мощностей для первого и второго интервалов анализа для каждой гармоники, и среднее значение дисперсий мощностей первого и второго интервалов, причем усреднение осуществляют по числу гармоник.The dispersion of power values for the first and second analysis intervals for each harmonic is calculated in a known manner, and the average value of the power variances of the first and second intervals, and averaging is performed over the number of harmonics.

Определяют пороговое значение путем умножения среднего значения дисперсии значений мощностей первого интервала анализа, принадлежащего «скользящему окну», на коэффициент, значение которого определяют заранее. Значение данного коэффициента определяется путем математического моделирования или экспериментальным путем.The threshold value is determined by multiplying the average dispersion value of the power values of the first analysis interval belonging to the “sliding window” by a coefficient whose value is determined in advance. The value of this coefficient is determined by mathematical modeling or experimentally.

Рассчитывают значение разности средних значений дисперсий мощностей, рассчитанных для первого и второго интервалов анализа.The value of the difference in the average values of the power variances calculated for the first and second analysis intervals is calculated.

Данное значение разности сравнивают с порогом. Считают, что во втором интервале анализа присутствует только помеха, если значение разности среднее значение дисперсий значений мощностей не превышает порог, в противном случае считают, что во втором интервале анализа присутствует сигнал или смесь сигнала и помехи.This difference value is compared with a threshold. It is believed that only interference is present in the second analysis interval, if the difference value, the average value of the variances of the power values does not exceed the threshold, otherwise, it is believed that in the second analysis interval there is a signal or a mixture of signal and interference.

Сдвигают «скользящее окно» на заданное значение интервалов, описанную процедуру повторяют.The “sliding window” is shifted by the set value of the intervals, the described procedure is repeated.

Для последующих шагов пороговое значение для разности средних значений дисперсии значений мощностей интервалов анализа определяют с использованием среднего значения средних значений дисперсии мощностей интервалов анализа, которое рассчитывают, применяя принцип «первый пришел, первый ушел».For the next steps, the threshold value for the difference between the average values of the variance of the power values of the analysis intervals is determined using the average value of the average values of the variance of the power of the analysis intervals, which is calculated using the principle of “first come, first leave”.

Процесс продолжают до тех пор, пока не закончится время, отведенное для анализа входного сигнала.The process continues until the time allotted for the analysis of the input signal is over.

Результаты моделирования процесса спектрального анализа приведены выше.The results of modeling the spectral analysis process are given above.

В качестве ЭАУ 1 могут использоваться, например, микрофоны или ларингофоны.As the EAU 1 can be used, for example, microphones or laryngophones.

УНЧ 2 может быть реализован, например, на микросхеме OP467GS фирмы Analog Devices.VLF 2 can be implemented, for example, on an OP467GS chip from Analog Devices.

Блоки умножения 3.1 – 3.n могут быть выполнены, например, в виде преобразователя частоты (смесителя), см., например, учебное пособие «Основы теории радиотехнических систем». Учебное пособие.//В.И. Борисов, В.М. Зинчук, А.Е. Лимарев, Н.П. Мухин. Под ред. В.И. Борисова. Воронежский научно-исследовательский институт связи, 2004», стр. 186 – 189.Multiplication blocks 3.1 - 3.n can be performed, for example, in the form of a frequency converter (mixer), see, for example, the training manual "Fundamentals of the theory of radio systems". Textbook.// V.I. Borisov, V.M. Zinchuk, A.E. Limarev, N.P. Mukhin. Ed. IN AND. Borisov. Voronezh Scientific Research Institute of Communications, 2004 ”, pp. 186 - 189.

АЦП 6.1 – 6.n могут быть выполнены, например, на микросхеме AD7495BR фирмы Analog Devices. ADC 6.1 - 6.n can be performed, for example, on the AD7495BR chip from Analog Devices.

Вычислительное устройство может быть выполнено, например, в виде единого микропроцессорного устройства с соответствующим программным обеспечением, например процессора серии TMS320VC5416 фирмы Texas Instruments, или в виде программируемой логической интегральной схемы (ПЛИС), с соответствующим программным обеспечением, например ПЛИС XCV400 фирмы Xilinx.The computing device can be, for example, in the form of a single microprocessor device with appropriate software, for example, a processor series TMS320VC5416 from Texas Instruments, or in the form of a programmable logic integrated circuit (FPGA), with appropriate software, for example, Xilinx FPGA from Xilinx.

Таким образом, заявляемый способ может быть реализован описанным устройством.Thus, the inventive method can be implemented by the described device.

Claims (1)

Способ разделения речи и пауз по значениям дисперсий амплитуд спектральных составляющих, заключающийся в том, что на всем интервале анализа, состоящего из интервала, который содержит шум или речевой сигнал, или смесь речевого сигнала и шума, которые поступают в устройство цифровой обработки речевых сигналов (входной сигнал), сигнал разветвляют на две одинаковые составляющие, одну из них фильтруют фильтром нижних частот (ФНЧ), вторую составляющую фильтруют полосовым фильтром, сигналы, поступившие на выходы фильтров, дискретизируют и заносят в память для последующей обработки, формируют «скользящее окно», состоящее из интервалов одинаковой длительности, «скользящее окно» сдвигают на некоторое заранее определенное количество отсчетов, отличающийся тем, что «скользящее окно» формируют так, что оно включает в себя два интервала анализа, каждый из которых состоит из нескольких интервалов одинаковой длительности, первое положение «скользящего окна» устанавливают так, что в первом интервале анализа присутствует только помеха, осуществляют спектральный анализ входного сигнала для каждого интервала следующим образом, каждый результат преобразования входного сигнала, который образуется после умножения входного сигнала на синус и косинус опорных частот, разветвляют на две одинаковые составляющие, первую составляющую фильтруют фильтром нижних частот (ФНЧ), полоса которого согласована с полосой анализируемого сигнала, одновременно вторую составляющую фильтруют полосовым фильтром, полоса пропускания которого выбирается так, что верхняя частота полосового фильтра соответствует верхней частоте анализируемого сигнала, нижнюю частоту полосового фильтра устанавливают равной некоторому заранее заданному значению, выбор ФНЧ и полосового фильтра осуществляют с идентичными в максимальной степени фазочастотными характеристиками и так, что амплитудно-частотная характеристика (АЧХ) полосового фильтра в области частот, близких к нулю, имеет максимально возможную крутизну, в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ и полосового фильтра становится меньше некоторой заранее заданной величины, обеспечивают идентичность их АЧХ в максимальной степени, сигналы, прошедшие ФНЧ и полосовой фильтр, вычитают один из другого, результаты вычитания преобразуют в цифровой вид, по данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют мгновенную спектральную плотность (МСП) для каждой опорной частоты и запоминают эти значения, пропорциональные амплитуде сигналов, находят среднее значение МСП, определяют значение порога путем умножения найденного среднего значения МСП на коэффициент, значение которого устанавливают заранее, полученные значения МСП сравнивают с порогом, по результатам сравнения принимают решение о наличии или об отсутствии сигнала с соответствующей частотой, находят значения мощности каждого выделенного сигнала путем возведения в квадрат соответствующих значений МСП, находят дисперсию значений мощностей для первого и второго интервалов анализа для каждой гармоники, рассчитывают среднее значение дисперсий мощностей первого и второго интервалов, усреднение осуществляют по числу гармоник, определяют пороговое значение путем умножения среднего значения дисперсии значений мощностей первого интервала анализа, принадлежащего «скользящему окну», на коэффициент, значение которого определяют заранее, находят значение разности средних значений дисперсий мощностей, рассчитанных для первого и второго интервалов анализа, данное значение разности сравнивают с порогом, если значение разности средних значений дисперсий мощностей не превышает порог, то считают, что во втором интервале анализа присутствует только помеха, в противном случае считают, что во втором интервале анализа присутствует сигнал или смесь сигнала и помехи, сдвигают «скользящее окно» на заданное значение интервалов, описанную процедуру повторяют для последующих шагов, пороговое значение для разности средних значений дисперсии значений мощностей интервалов анализа определяют с использованием усредненного значения средних значений дисперсии мощностей интервалов анализа, которое рассчитывают, применяя принцип «первый пришел, первый ушел», процесс продолжают до тех пор, пока не закончится время, отведенное для анализа входного сигнала.The method of separating speech and pauses according to the values of the variances of the amplitudes of the spectral components, which consists in the fact that for the entire analysis interval, consisting of an interval that contains noise or a speech signal, or a mixture of a speech signal and noise, which enter the device for digital processing of speech signals (input signal), the signal is branched into two identical components, one of them is filtered by a low-pass filter (low-pass filter), the second component is filtered by a band-pass filter, the signals received at the outputs of the filters are sampled and stored in memory for subsequent processing, forming a “sliding window” consisting of intervals of the same duration, the "sliding window" is shifted by a predetermined number of samples, characterized in that the "sliding window" is formed so that it includes two analysis intervals, each of which consists of several intervals of the same duration, the first position is sliding window "is set so that in the first interval only interference is present, spectral analysis of the input signal for each interval is performed as follows, each result of the conversion of the input signal, which is formed after multiplying the input signal by the sine and cosine of the reference frequencies, is branched into two identical components, the first component is filtered by a low-pass filter (LPF) , the band of which is consistent with the band of the analyzed signal, at the same time the second component is filtered by a band-pass filter, the pass-band of which is selected so that the upper frequency of the band-pass filter corresponds to the upper frequency of the analyzed signal, the lower frequency of the band-pass filter is set equal to some predetermined value, the low-pass filter and the band-pass filter are selected with phase-frequency characteristics identical to the maximum extent and so that the amplitude-frequency characteristic (AFC) of the band-pass filter in the region of frequencies close to zero has the maximum possible slope in the region of frequencies different from the value for which the difference between the frequency response of the low-pass filter and the band-pass filter becomes less than some predetermined value, ensure that their frequency response is identical to the maximum, the signals that pass the low-pass filter and the band-pass filter are subtracted from one another, the subtraction results are converted to digital form, according to the values corresponding to the sine and cosine components of the same frequency, determine the instantaneous spectral density (MRI) for each reference frequency and remember these values proportional to the amplitude of the signals, find the average value of the MRI, determine the threshold value by multiplying the found average value of the MRI by a coefficient whose value is set in advance, the obtained values of the MRF are compared with a threshold, according to the results of the comparison, a decision is made about the presence or absence of a signal with an appropriate frequency, the power values of each selected signal are found by squaring the corresponding MRF values, and the variance of the power values is found for the first and second analysis intervals for each harmonic, calculate the average value of the power variances of the first and second intervals, averaging over the number of harmonics, determine the threshold value by multiplying the average value of the variance of the power values of the first analysis interval belonging to the “sliding window” by a coefficient, value which is determined in advance, the difference value of the average power variance calculated for the first and second analysis intervals is found, this difference is compared with a threshold, if the difference value of the average power variance does not exceed the threshold, then it is believed that only interference is present in the second analysis interval, otherwise, consider that in the second analysis interval there is a signal or a mixture of signal and interference, shift the “sliding window” by a predetermined value of the intervals, repeat the described procedure for the next steps, the threshold value for the difference in the average variance values is power of the intervals of the analysis is determined using the average value of the average variance of the power of the intervals of the analysis, which is calculated using the principle of "first come, first go", the process continues until the time allotted for the analysis of the input signal ends.
RU2019137135A 2019-11-20 2019-11-20 Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components RU2723301C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2019137135A RU2723301C1 (en) 2019-11-20 2019-11-20 Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2019137135A RU2723301C1 (en) 2019-11-20 2019-11-20 Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components

Publications (1)

Publication Number Publication Date
RU2723301C1 true RU2723301C1 (en) 2020-06-09

Family

ID=71067368

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2019137135A RU2723301C1 (en) 2019-11-20 2019-11-20 Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components

Country Status (1)

Country Link
RU (1) RU2723301C1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2807194C1 (en) * 2022-11-14 2023-11-10 Акционерное общество "Созвездие" Method for speech extraction by analysing amplitude values of interference and signal in two-channel speech signal processing system

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03114100A (en) * 1989-09-28 1991-05-15 Matsushita Electric Ind Co Ltd Voice section detecting device
JPH10171487A (en) * 1996-12-11 1998-06-26 Mitsubishi Electric Corp Voice section discrimination device
JP2000066691A (en) * 1998-08-21 2000-03-03 Kdd Corp Audio information sorter
KR20000056399A (en) * 1999-02-20 2000-09-15 윤종용 Voice activity detecting device and method therof
RU2317595C1 (en) * 2006-10-30 2008-02-20 ГОУ ВПО "Белгородский государственный университет" Method for detecting pauses in speech signals and device for its realization
KR20080077717A (en) * 2007-02-21 2008-08-26 인하대학교 산학협력단 A method and a system for detecting voice activity based on ump test
RU77717U1 (en) * 2008-06-16 2008-10-27 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) SPEECH ACTIVITY DETECTOR
RU2436173C1 (en) * 2010-06-15 2011-12-10 Государственное образовательное учреждение высшего профессионального образования "Рязанский государственный радиотехнический университет" Method of detecting pauses in speech signals and device for realising said method
JP2016080767A (en) * 2014-10-10 2016-05-16 株式会社Nttドコモ Frequency component extraction device, frequency component extraction method and frequency component extraction program
RU2666474C2 (en) * 2014-07-28 2018-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Method of estimating noise in audio signal, noise estimating mean, audio encoder, audio decoder and audio transmission system
RU2668407C1 (en) * 2017-11-07 2018-09-28 Акционерное общество "Концерн "Созвездие" Method of separation of speech and pause by comparative analysis of interference power values and signal-interference mixture
RU2691603C1 (en) * 2018-08-22 2019-06-14 Акционерное общество "Концерн "Созвездие" Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture
RU2700189C1 (en) * 2019-01-16 2019-09-13 Акционерное общество "Концерн "Созвездие" Method of separating speech and speech-like noise by analyzing values of energy and phases of frequency components of signal and noise

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03114100A (en) * 1989-09-28 1991-05-15 Matsushita Electric Ind Co Ltd Voice section detecting device
JPH10171487A (en) * 1996-12-11 1998-06-26 Mitsubishi Electric Corp Voice section discrimination device
JP2000066691A (en) * 1998-08-21 2000-03-03 Kdd Corp Audio information sorter
KR20000056399A (en) * 1999-02-20 2000-09-15 윤종용 Voice activity detecting device and method therof
RU2317595C1 (en) * 2006-10-30 2008-02-20 ГОУ ВПО "Белгородский государственный университет" Method for detecting pauses in speech signals and device for its realization
KR20080077717A (en) * 2007-02-21 2008-08-26 인하대학교 산학협력단 A method and a system for detecting voice activity based on ump test
RU77717U1 (en) * 2008-06-16 2008-10-27 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) SPEECH ACTIVITY DETECTOR
RU2436173C1 (en) * 2010-06-15 2011-12-10 Государственное образовательное учреждение высшего профессионального образования "Рязанский государственный радиотехнический университет" Method of detecting pauses in speech signals and device for realising said method
RU2666474C2 (en) * 2014-07-28 2018-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Method of estimating noise in audio signal, noise estimating mean, audio encoder, audio decoder and audio transmission system
JP2016080767A (en) * 2014-10-10 2016-05-16 株式会社Nttドコモ Frequency component extraction device, frequency component extraction method and frequency component extraction program
RU2668407C1 (en) * 2017-11-07 2018-09-28 Акционерное общество "Концерн "Созвездие" Method of separation of speech and pause by comparative analysis of interference power values and signal-interference mixture
RU2691603C1 (en) * 2018-08-22 2019-06-14 Акционерное общество "Концерн "Созвездие" Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture
RU2700189C1 (en) * 2019-01-16 2019-09-13 Акционерное общество "Концерн "Созвездие" Method of separating speech and speech-like noise by analyzing values of energy and phases of frequency components of signal and noise

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2807194C1 (en) * 2022-11-14 2023-11-10 Акционерное общество "Созвездие" Method for speech extraction by analysing amplitude values of interference and signal in two-channel speech signal processing system
RU2811900C1 (en) * 2023-03-15 2024-01-18 Акционерное общество "Концерн "Созвездие" Method for energy detection of signal with compensation of combinational components under conditions of exposure to non-stationary interference
RU2811741C1 (en) * 2023-05-12 2024-01-16 Акционерное общество "Концерн "Созвездие" Method for separating speech and pauses by analyzing changes in values of frequency and time parameters of additive mixture of signal and noise
RU2814115C1 (en) * 2023-08-09 2024-02-22 Акционерное общество "Концерн "Созвездие" Method for separating speech and pauses by analyzing characteristics of spectral components of mixture of signal and noise

Similar Documents

Publication Publication Date Title
US20200011911A1 (en) High-precision frequency measuring system and method
EP2294832B1 (en) Multi-frequency tone detector
RU2608553C1 (en) Method of extracting signal under conditions of interference by compensation of interference due to approximation of values of its amplitude
CN111200569B (en) Broadband signal detection and identification method and device
CA1323656C (en) Method and meter for measuring the frequency of a periodical signal
RU2723301C1 (en) Method of dividing speech and pauses by values of dispersions of amplitudes of spectral components
RU2691603C1 (en) Method of separating speech and pauses by analyzing values of interference correlation function and signal and interference mixture
RU2683791C1 (en) Method for determining types of radar signals in autocorrelation receiver
RU2549207C2 (en) Device for detecting hydroacoustic noise signals based on quadrature receiver
RU2701059C1 (en) Digital multichannel correlator of phase-shift keyed signals
RU2675386C2 (en) Method and device for extracting signals in presence of interference
CA2464251C (en) Method and apparatus for spectrom analysis
EP0548438A1 (en) A method for detecting dual tone multi-frequency signals and device for implementing said method
RU2634382C2 (en) Digital detector of phase-animated signals
RU2811741C1 (en) Method for separating speech and pauses by analyzing changes in values of frequency and time parameters of additive mixture of signal and noise
RU2700189C1 (en) Method of separating speech and speech-like noise by analyzing values of energy and phases of frequency components of signal and noise
RU2814115C1 (en) Method for separating speech and pauses by analyzing characteristics of spectral components of mixture of signal and noise
Lin et al. Progressive decimation filter banks for variable resolution spectrum sensing in cognitive radios
RU2668407C1 (en) Method of separation of speech and pause by comparative analysis of interference power values and signal-interference mixture
RU2786547C1 (en) Method for isolating a speech signal using time-domain analysis of the spectrum of an additive mixture of a signal and acoustic interference
RU2700580C1 (en) Method for energy detection of a signal with compensation of combination signal components and interference in the main and compensation channels
RU2698579C1 (en) Method of processing linear-frequency-modulated signals with a multichannel autocorrelation receiver
RU2550757C1 (en) Device for detecting hydroacoustic noise signals based on quadrature receiver
RU2723300C1 (en) Method of signal separation with frequency shift modulation and compensation of combination components
RU2480897C1 (en) Method to dedicate useful signal from noise - "method of mirror noise images" and device for its realisation