RU2667462C1 - Method of recognizing low-speed speech coding protocols - Google Patents

Method of recognizing low-speed speech coding protocols Download PDF

Info

Publication number
RU2667462C1
RU2667462C1 RU2017137299A RU2017137299A RU2667462C1 RU 2667462 C1 RU2667462 C1 RU 2667462C1 RU 2017137299 A RU2017137299 A RU 2017137299A RU 2017137299 A RU2017137299 A RU 2017137299A RU 2667462 C1 RU2667462 C1 RU 2667462C1
Authority
RU
Russia
Prior art keywords
values
vector
information
nscr
matrix
Prior art date
Application number
RU2017137299A
Other languages
Russian (ru)
Inventor
Виктор Алексеевич Аладинский
Евгений Андреевич Вещунин
Сергей Владиславович Кузьминский
Павел Леонидович Смирнов
Original Assignee
федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации
Общество с ограниченной ответственностью "Специальный Технологический Центр"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации, Общество с ограниченной ответственностью "Специальный Технологический Центр" filed Critical федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации
Priority to RU2017137299A priority Critical patent/RU2667462C1/en
Application granted granted Critical
Publication of RU2667462C1 publication Critical patent/RU2667462C1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words

Abstract

FIELD: data processing.SUBSTANCE: invention is intended for recognition of low-speed speech coding (LSSC) protocols. Technical result is achieved by increasing the dimension of measured redundancy coefficient vector ϕup to ϕ, L = Z + 2 and taking into account the shift effect of the vector elements ϕby forming square reference matrix Φfor all J known LSSC protocols, j = 1, 2 …, J. To this end, a digital stream Y is received for a predetermined time interval ΔT. Rectangular information matrix Yis formed, the rows of which are information blocks placed successively under each other. Redundancy coefficient vector ϕis calculated, measured vector ϕis elementwise compared with strings ϕ(l) of all J square reference matrices Φ, deviation ΔP(l) between measured vector ϕand the rows of all J reference matrices Φ, is determined, it is decided in favor of the jLSSC protocol, for which minimum deviation ΔP(l)of measured vector ϕfrom the l-th row of j-th square reference matrix Φis provided.EFFECT: technical result is to increase the accuracy of the recognition of the LSSC protocols.1 cl, 6 dwg

Description

Изобретение относится к области техники связи, в частности к обработке цифровой информации, и может быть использовано в широком классе систем передачи данных для распознавания протоколов низкоскоростного кодирования речи (НСКР) и контроля корректности применения вокодеров в цифровых системах связи.The invention relates to the field of communication technology, in particular to the processing of digital information, and can be used in a wide class of data transmission systems for recognizing protocols for low-speed speech coding (NSCR) and verifying the correct use of vocoders in digital communication systems.

Заявленное техническое решение расширяет арсенал средств аналогичного назначения за счет возможности распознавания протоколов НСКР с более высокой точностью в условиях воздействия помех.The claimed technical solution expands the arsenal of means of a similar purpose due to the possibility of recognizing NSCR protocols with higher accuracy under the influence of interference.

Известен способ распознавания радиосигналов (см. Патент РФ 2551903 Способ распознавания радиосигналов авторов: Дворникова А.С., Дворникова С.В., опубликован 10.06.2015 г.), в котором на первом этапе из дискретизированных и квантованных отсчетов эталонных радиосигналов формируют матрицы распределения энергии на основе их фреймовых вейвлет-преобразований. Затем из них, начиная со второй строки, формируют векторы признаков путем построчной конкатенации всех вейвлет-коэффициентов. Далее элементы векторов признаков нормируют и вычисляют их параметры. При этом в качестве параметров определяют усредненную величину нормированных амплитудных значений элементов векторов признаков, а решение принимают по результатам вычисления разностей значений параметров распознаваемого радиосигнала и эталонных радиосигналов. Распознаваемый радиосигнал считают инцидентным эталонному радиосигналу, модуль разницы параметров векторов признаков с которым будет минимальным.A known method for recognizing radio signals (see RF Patent 2551903 Method for recognizing radio signals of the authors: Dvornikova A.S., Dvornikova S.V., published June 10, 2015), in which, at the first stage, distribution matrices are formed from sampled and quantized samples of reference radio signals energy based on their frame wavelet transforms. Then from them, starting from the second line, feature vectors are formed by row-wise concatenation of all wavelet coefficients. Next, the elements of the feature vectors are normalized and their parameters are calculated. In this case, the average value of the normalized amplitude values of the elements of the feature vectors is determined as parameters, and the decision is made based on the results of calculating the differences in the values of the parameters of the recognized radio signal and reference radio signals. The recognized radio signal is considered to be incident with the reference radio signal, the module of the difference in the parameters of the feature vectors with which will be minimal.

Недостатком способа является недостаточная точность распознавания протоколов НСКР.The disadvantage of this method is the lack of accuracy of recognition of the NSCR protocols.

Известен способ распознавания низкоскоростного кодирования (см. Патент РФ 2610285 Способ распознавания протоколов низкоскоростного кодирования авторов: Аладинского В.А., Кузьминского С.В., Смирнова П.Л., Чубатого Д.Н., опубликован 08.02.2016 г.), заключающийся в том, что принимают бинарный цифровой информационный поток Y в течение интервала времени ΔT, на основе принятого потока Y формируют нормированную автокорреляционную функцию А, по регулярным с равными интервалами Δτ экстремумам автокорреляционной функции А принимают решение о наличии блочной структуры в цифровом информационном потоке Y, по интервалам между экстремумами автокорреляционной функции А делят цифровой информационный поток Y на информационные блоки объемом Nб бит каждый, последовательно присваивают информационным блокам порядковые номера k=1,2,…, K, начиная с первого информационного блока, формируют прямоугольную информационную матрицу, YK×L, L=Nб, строками которой являются последовательно размещенные друг под другом информационные блоки в соответствии с их порядковыми номерами k=1,2,…, K, формируют последовательность прямоугольных матриц

Figure 00000001
, z=1,2,…, Z; Z=Nб-2, содержащих по три соседних столбца прямоугольной информационной матрицы YK×L, где текущий номер z прямоугольной матрицы
Figure 00000001
определяется номером столбца матрицы YK×L, являющимся первым столбцом матрицы
Figure 00000001
, по каждой из матриц
Figure 00000001
вычисляют коэффициент избыточности ϕz, размерности L, на основе полученного набора коэффициентов избыточности формируют измеренный вектор коэффициентов избыточности ϕz путем последовательного их размещения в соответствии с порядковыми номерами z, формируют эталонные вектора коэффициентов избыточности ϕzj эт размерности L известных протоколов НСКР, на основе эталонных векторов коэффициентов избыточности ϕLj эт формируют квадратные эталонные матрицы ФLj эт, j=1,2,…, J, поэлементно сравнивают измеренный вектор коэффициентов избыточности ϕL, со строками
Figure 00000002
, всех J квадратных эталонных матриц ФLj эт, определяют отклонения
Figure 00000003
между измеренным вектором коэффициентов избыточности ϕL, и строками всех J квадратных эталонных матриц ФLj эт, принимают решение в пользу j-го протокола НСКР, для которого обеспечивается минимальное и меньше заданного порога R отклонение
Figure 00000004
измеренного вектора ϕL от
Figure 00000005
-й строки j-й квадратной эталонной матрицы ФLj эт. A known method for recognizing low-speed coding (see RF Patent 2610285 Method for recognizing protocols for low-speed coding by authors: Aladinsky V.A., Kuzminsky S.V., Smirnova P.L., Chubaty D.N., published 08.02.2016), consisting in the fact that a binary digital information stream Y is received during the time interval ΔT, based on the received stream Y, a normalized autocorrelation function A is formed, and at regular intervals with equal intervals Δτ, the extrema of the autocorrelation function A decide on the presence of a block structures in the digital information stream Y, at intervals between the extrema of the autocorrelation function A, divide the digital information stream Y into information blocks of N b bits each, sequentially assign sequence numbers k = 1,2, ..., K to the information blocks, starting from the first information block, form a rectangular information matrix, Y K × L , L = N b , the rows of which are sequentially placed under each other information blocks in accordance with their serial numbers k = 1,2, ..., K, form a sequential rectangular matrices
Figure 00000001
, z = 1,2, ..., Z; Z = N b -2, containing three adjacent columns of a rectangular information matrix Y K × L , where the current number z of the rectangular matrix
Figure 00000001
determined by the column number of the matrix Y K × L , which is the first column of the matrix
Figure 00000001
, for each of the matrices
Figure 00000001
calculate the redundancy coefficient ϕ z , dimension L, on the basis of the obtained set of redundancy coefficients form the measured vector of redundancy coefficients ϕ z by sequentially placing them in accordance with serial numbers z, form the reference vectors of redundancy coefficients ϕ zj et dimension L of the known NSCR protocols, based on the reference the redundancy coefficient vectors ϕ Lj et form the square reference matrix Φ Lj et , j = 1,2, ..., J, compare the measured vector of redundancy coefficients ϕ L , with rows
Figure 00000002
, all J square reference matrices Φ Lj et , determine the deviations
Figure 00000003
between the measured vector of redundancy coefficients ϕ L , and the rows of all J square reference matrices Φ Lj et , decide in favor of the j-th NSCR protocol for which a minimum and less than a given threshold R deviation is provided
Figure 00000004
measured vector ϕ L from
Figure 00000005
ith row of the jth square reference matrix Φ Lj et.

Данный способ при отсутствии помех в цифровом информационном потоке Y обладает высокой вероятностью правильного распознавания протоколов НСКР. Недостатком прототипа является снижение вероятности правильного распознавания протоколов НСКР при появлении одиночных и групповых битовых ошибок в цифровом информационном потоке Y, которые характерны для каналов радиосвязи.This method, in the absence of interference in the digital information stream Y, has a high probability of correct recognition of the NSCR protocols. The disadvantage of the prototype is to reduce the likelihood of correct recognition of the NSCR protocols when single and group bit errors occur in the digital information stream Y, which are typical for radio channels.

Появление битовых ошибок в цифровом информационном потоке Y носит случайный характер. Поэтому влияние даже одной битовой ошибки в матрице YK×L на эффективность распознавания НСКР в способе-аналоге существенно. Очевидно, что имеющаяся одна битовая ошибка в z-м столбце матрицы YKxL появится в трех прямоугольных матрицах

Figure 00000006
, в которые входит z-й столбец, что приведет к искажениям соответствующих им вычисленных значений коэффициентов избыточности ϕz-2, ϕz-1, ϕz. Последнее приводит к троекратному учету одного и того же ошибочно принятого бита при формировании измеренного вектора ϕL, и, как следствие, к снижению вероятности распознавания протоколов НСКР. Кроме того, аналог требует значительных вычислительных затрат при своей реализации, что определяется троекратным использованием столбцов матрицы YKxL для вычисления признаков распознавания.The appearance of bit errors in the digital information stream Y is random. Therefore, the influence of even one bit error in the Y K × L matrix on the recognition efficiency of the NSCR in the analogue method is significant. Obviously, the existing one bit error in the zth column of the matrix Y KxL appears in three rectangular matrices
Figure 00000006
, which includes the z-th column, which will lead to distortions of the corresponding calculated values of the redundancy coefficients ϕ z-2 , ϕ z-1 , ϕ z . The latter leads to three-fold accounting of the same erroneously received bit during the formation of the measured vector ϕ L , and, as a result, to a decrease in the probability of recognition of NSCR protocols. In addition, the analogue requires significant computational costs in its implementation, which is determined by using the columns of the matrix Y KxL three times to calculate recognition features.

Наиболее близким по технической сущности к заявленному является способ декодирования циклического помехоустойчивого кода (см. Тимофеев Д.И., Тавалинский Д.А., Чубатый Д.Н. Анализ параметров низкоскоростных кодеров речи в условиях структурной и параметрической неопределенности // Наукоемкие технологии, №8, 2011. С. 4-9), заключающийся в том, что принимают цифровой информационный поток Y в течение интервала времени ΔТ, на основе Y формируют нормированную автокорреляционную функцию А, по регулярным с равными интервалами Δt экстремумам автокорреляционной функции А принимают решение о наличии блочной структуры в информационном потоке Y, по интервалам между экстремумами автокорреляционной функции А делят информационный поток Y на информационные блоки объемом Nб бит каждый, последовательно присваивают информационным блокам порядковые номера k=1,2,…, K, начиная с первого информационного блока, формируют прямоугольную информационную матрицу YK×L, L=Nб; строками которой являются последовательно размещенные друг под другом информационные блоки в соответствии с их порядковыми номерами k=1,2,…, K, формируют последовательность прямоугольных матриц

Figure 00000001
, z=1,2,…, Z; Z=Nб-2, содержащих по три соседних столбца прямоугольной информационной матрицы YK×L, где текущий номер z прямоугольной матрицы
Figure 00000001
определяется номером столбца матрицы YK×L, являющийся первым столбцом матрицы
Figure 00000001
, по каждой из матриц
Figure 00000001
вычисляют коэффициент избыточности ϕz, на основе полученного набора коэффициентов избыточности формируют вектор измеренных коэффициентов избыточности ϕz путем последовательного их размещения в соответствии с порядковыми номерами z, формируют эталонные векторы коэффициентов избыточности ϕzj эт известных протоколов НСКР, вектор измеренных коэффициентов избыточности ϕz сравнивают с эталонными векторами коэффициентов избыточности , ϕzj эт j=1,2,…, J, известных протоколов НСКР.The closest in technical essence to the claimed one is a method for decoding a cyclic noise-tolerant code (see Timofeev D.I., Tavalinsky D.A., Chubaty D.N. Analysis of parameters of low-speed speech encoders in the context of structural and parametric uncertainty // High-tech technologies, No. 8, 2011. P. 4-9), consisting in the fact that the digital information stream Y is received during the time interval ΔТ, based on Y, a normalized autocorrelation function A is formed, according to regular extrema of the autocorrel at equal intervals Δt function A make a decision about the presence of a block structure in the information stream Y, at intervals between the extrema of the autocorrelation function A, divide the information stream Y into information blocks of N b bits each, sequentially assign sequence numbers k = 1,2, ..., K to the information blocks, starting from the first information block, form a rectangular information matrix Y K × L , L = N b ; the rows of which are successively placed under each other information blocks in accordance with their serial numbers k = 1,2, ..., K, form a sequence of rectangular matrices
Figure 00000001
, z = 1,2, ..., Z; Z = N b -2, containing three adjacent columns of a rectangular information matrix Y K × L , where the current number z of the rectangular matrix
Figure 00000001
determined by the column number of the matrix Y K × L , which is the first column of the matrix
Figure 00000001
, for each of the matrices
Figure 00000001
calculate the redundancy coefficient ϕ z , on the basis of the obtained set of redundancy coefficients form a vector of measured redundancy factors ϕ z by sequentially placing them in accordance with serial numbers z, form reference vectors of redundancy coefficients ϕ zj et known NSCR protocols, compare the vector of measured redundancy coefficients ϕ z with reference vectors of redundancy coefficients, ϕ zj et j = 1,2, ..., J, of the well-known NSCR protocols.

Данный способ позволяет распознавать протоколы НСКР.This method allows you to recognize the NSCR protocols.

Однако, недостатком прототипа является относительно невысокая точность распознавания протоколов НСКР при отсутствии Nп символов в первом блоке цифрового информационного потока Y. Вероятность отсутствия символов в первом блоке цифрового информационного потока Y определяется выражением вида However, the disadvantage of the prototype is the relatively low recognition accuracy of the NSCR protocols in the absence of N p characters in the first block of the digital information stream Y. The probability of the absence of characters in the first block of the digital information stream Y is determined by an expression of the form

Figure 00000007
.
Figure 00000007
.

При выполнении условия 0≤Nп<Nб в информационной матрице YK×L наблюдается сдвиг столбцов влево на величину

Figure 00000008
, что вызывает сдвиг значений вектора коэффициентов избыточности ϕz на величину
Figure 00000009
. В этом случае в векторе ϕz будут отсутствовать значения коэффициента избыточности ϕz с номерами z=Nп, Nп+1, а также добавляются значения коэффициента избыточности ϕz с номерами z=Nб-1, Nб. Значения Nб цифровых потоков, формируемых вокодерами, которые разработаны для радиостанций диапазона ВЧ, могут составлять 45, 48, 54, 60, 64, 66, 81 или 96 бит. Таким образом, высока вероятность искажения значений в векторе коэффициентов избыточности ϕz, что приводит к ошибочным решениям в способе-прототипе. Дополнительно точностные характеристики прототипа снижаются из-за некорректного сокращения длины измеренного и эталонного векторов ϕz и ϕzj эт соответственно на два элемента. Последнее приводит к неполному использованию информации о структуре принятого сигнала, и как следствие, к снижению точности распознавания протоколов НСКР.When the condition 0≤N p <N b is fulfilled, in the information matrix Y K × L there is a shift of the columns to the left by the amount
Figure 00000008
, which causes a shift in the values of the vector of redundancy coefficients ϕ z by
Figure 00000009
. In this case, the redundancy coefficient ϕ z with numbers z = N p , N p +1 will be absent in the vector ϕ z , and the redundancy coefficient ϕ z with numbers z = N b -1, N b will be added. The values of N b digital streams generated by vocoders, which are designed for radio stations in the high frequency range, can be 45, 48, 54, 60, 64, 66, 81 or 96 bits. Thus, there is a high probability of distortion of values in the vector of redundancy coefficients ϕ z , which leads to erroneous decisions in the prototype method. Additionally, the accuracy characteristics of the prototype are reduced due to incorrect reduction in the length of the measured and reference vectors ϕ z and ϕ zj et respectively by two elements. The latter leads to the incomplete use of information about the structure of the received signal, and as a result, to a decrease in the recognition accuracy of the NSCR protocols.

Кроме того, реализация прототипа предполагает большой объем вычислений на формирование вектора измеренных коэффициентов избыточности, что снижает его быстродействия.In addition, the implementation of the prototype involves a large amount of computation on the formation of the vector of the measured redundancy coefficients, which reduces its performance.

Целью заявленного технического решения является разработка способа распознавания протоколов НСКР, обеспечивающего повышение точности распознавания в условиях воздействия помех и его быстродействие.The purpose of the claimed technical solution is to develop a method for recognizing NSCR protocols, which provides increased recognition accuracy under the influence of interference and its speed.

Поставленная цель достигается тем, что в известном способе распознавания протоколов НСКР, включающем прием цифрового информационного потока Y в течение интервала времени ΔT, формирование нормированной автокорреляционной функции А на основе принятого потока Y, принятие решения о наличии блочной структуры в цифровом информационном потоке Y по регулярным с равными интервалами Δτ экстремумам автокорреляционной функции А, по интервалам между экстремумами автокорреляционной функции А деление цифрового информационного потока Y на информационные блоки объемом Nб бит каждый, последовательное присвоение информационным блокам порядкового номера k=1,2,…, K, начиная с первого информационного блока, формирование прямоугольной информационной матрицы YK×L, L=Nб, строками которой являются последовательно размещенные друг под другом информационные блоки в соответствии с их порядковыми номерами k=1,2,…, K, поочередно выделяют столбцы

Figure 00000010
, из матрицы YKxL с номерами
Figure 00000011
, вычисляют значения математического ожидания
Figure 00000012
появления определенных импульсов по каждому столбцу
Figure 00000013
, информационной матрицы YKxL, формируют вектор измеренных значений математического ожидания
Figure 00000014
последовательным размещением полученных значений математического ожидания
Figure 00000015
в соответствии с их порядковыми номерами
Figure 00000016
, формируют набор М векторов m
Figure 00000017
значений математического ожидания
Figure 00000018
на основе сформированного вектора значений математического ожидания m(0) путем последовательного циркулярного сдвига его значений на величину
Figure 00000019
, формируют эталонные векторы значений математического ожидания mjэт, j=1,2,… J, по каждому цифровому информационному потоку Yjэт, соответствующем j-му известному протоколу НСКР, последовательно сравнивают каждый вектор значений математического ожидания
Figure 00000020
оцениваемого протокола НСКР с эталонными векторами значений математического ожидания mjэт, j=1,2,… J, вычисляют значения вероятности правильного распознавания
Figure 00000021
j-го протокола НСКР по каждому
Figure 00000016
-му вектору значений математического ожидания
Figure 00000020
, принимают решение в пользу j-го протокола НСКР, для которого обеспечивается максимальное значение вероятности правильного распознавания
Figure 00000022
This goal is achieved by the fact that in the known method for recognizing NSCR protocols, including receiving a digital information stream Y for a time interval ΔT, forming a normalized autocorrelation function A based on the received stream Y, deciding on the presence of a block structure in the digital information stream Y according to regular equal intervals Δτ to the extrema of the autocorrelation function A, according to the intervals between the extrema of the autocorrelation function A, the division of the digital information stream Y into information He blocks with a volume of N b bits each, sequential assignment of information numbers to the information blocks k = 1,2, ..., K, starting from the first information block, the formation of a rectangular information matrix Y K × L , L = N b , the rows of which are sequentially placed each under another information blocks in accordance with their serial numbers k = 1,2, ..., K, alternately highlight the columns
Figure 00000010
, from matrix Y KxL with numbers
Figure 00000011
calculate math values
Figure 00000012
the appearance of certain impulses for each column
Figure 00000013
, information matrix Y KxL , form a vector of measured values of mathematical expectation
Figure 00000014
sequential placement of the obtained values of the mathematical expectation
Figure 00000015
according to their serial numbers
Figure 00000016
form a set of M vectors m
Figure 00000017
expectation values
Figure 00000018
based on the generated vector of mathematical expectation values m (0) by successive circular shift of its values by
Figure 00000019
, form the standard vectors of values of mathematical expectation m jet , j = 1,2, ... J, for each digital information stream Y jet corresponding to the j-th known NSCR protocol, each vector of values of mathematical expectation is sequentially compared
Figure 00000020
of the evaluated NSCR protocol with reference vectors of the values of mathematical expectation m jet , j = 1,2, ... J, the values of the probability of correct recognition are calculated
Figure 00000021
j-th protocol of the NSCR for each
Figure 00000016
vector of mathematical expectation values
Figure 00000020
, decide in favor of the j-th NSCR protocol, for which the maximum value of the probability of correct recognition is provided
Figure 00000022

Благодаря новой совокупности существенных признаков в заявляемом способе повышение вероятности правильного распознавания протоколов НСКР достигается благодаря формированию вектора измеренных значений математического ожидания m(0), что исключило многократное влияние одной и той же битовой ошибки на результаты распознавания.Due to the new set of essential features in the claimed method, an increase in the probability of correct recognition of the NSCR protocols is achieved by forming a vector of measured values of the mathematical expectation m (0), which eliminated the repeated influence of the same bit error on the recognition results.

Уменьшение размерности исходных данных для формирования вектора измеренных значений математического ожидания позволило достигнуть повышение быстродействия предлагаемого способа.The reduction in the dimension of the source data for the formation of the vector of the measured values of the mathematical expectation allowed to achieve an increase in the speed of the proposed method.

Заявляемый способ поясняется чертежами, на которых:The inventive method is illustrated by drawings, in which:

на фиг. 1 - обобщенный алгоритм распознавания протоколов НСКР;in FIG. 1 - a generalized algorithm for recognizing NSCR protocols;

на фиг. 2 - внешний вид автокорреляционной функции информационного потока Y;in FIG. 2 - appearance of the autocorrelation function of the information flow Y;

на фиг. 3 - порядок формирования информационной матрицы YKxL;in FIG. 3 - the order of formation of the information matrix Y KxL ;

на фиг. 4 - порядок выделения столбцов

Figure 00000023
информационной матрицы YKxL;in FIG. 4 - column selection order
Figure 00000023
information matrix Y KxL ;

на фиг. 5 - результаты имитационного моделирования;in FIG. 5 - simulation results;

на фиг. 6 - обобщенная структурная схема устройства распознавания протоколов НСКР.in FIG. 6 is a generalized block diagram of an NSCR protocol recognition device.

Анализ использования современных низкоскоростных кодеров речи в системах связи свидетельствует о том, что, несмотря на стремление международного союза электросвязи перейти к использованию стандартных кодеров, зачастую разрабатывается новый алгоритм сжатия и соответствующий ему протокол НСКР, что приводит к многообразию низкоскоростных кодеков речи (см. Бондаренко М.Ф., Работягов А.В., Щепковский С.В. Современные методы кодирования речевого сигнала. - Харьков: ХНУРЭ Бионика интеллекта, №2 (69), 2008). В условиях структурной и параметрической неопределенности, в связи с ростом количества протоколов НСКР, усложняется задача их распознавания, решение которой необходимо для последующего декодирования речевых сигналов. Эта задача еще более усугубляется сложной сигнально-помеховой обстановкой в ВЧ-диапазоне.An analysis of the use of modern low-speed speech encoders in communication systems indicates that, despite the desire of the international telecommunication union to switch to the use of standard encoders, a new compression algorithm and the corresponding NSCR protocol are often developed, which leads to a variety of low-speed speech codecs (see Bondarenko M. .F., Rabotyagov AV, Schepkovsky SV Modern methods of encoding a speech signal. - Kharkov: KHNURE Bionics of intelligence, No. 2 (69), 2008). Under conditions of structural and parametric uncertainty, in connection with an increase in the number of NSCR protocols, the task of recognizing them becomes more complicated, the solution of which is necessary for subsequent decoding of speech signals. This task is further compounded by a complex signal-to-noise environment in the high-frequency range.

В силу того, что различные кодеры речевых сигналов формируют различающиеся структуры блоков цифровых потоков (ЦП), анализ последних состоит в определении количества бит в одном из них и выявлении структуры блока ЦП на основе анализа условных вероятностей переходов значений параметра от блока к блоку на всей длине окна линейного предсказания.Due to the fact that different encoders of speech signals form different structures of blocks of digital streams (CPUs), the analysis of the latter consists in determining the number of bits in one of them and identifying the structure of a block of CPUs based on an analysis of the conditional probabilities of transitions of parameter values from block to block over the entire length linear prediction windows.

В вокодерах, используемых в зарубежных радиостанциях диапазона ВЧ, реализованы - метод кодирования (МК) с десятью коэффициентами линейного предсказания (ЛП) LPC-10 (Linear Predictive Coding), МК с ЛП и смешанным возбуждением MELP (Mixed Excitation Linear Prediction), МК со смешанным многополосным возбуждением ММВБ (Mixed-Multiband Excitation). Основными параметрами ЦП являются: скорость Ввок ЦП (600, 800, 1200 или 2400 бит/с), количество Nб бит в одном информационном блоке (длина информационного блока) и длительность tб его передачи. Последнюю задают на этапе разработки вокодера (см. Быков С.Ф., Журавлев В.И., Шалимов И.А. Цифровая телефония. Учебное пособие для вузов. - М.: Радио и связь, 2003. - 144 с). Скорость Ввок выходных ЦП связана с параметрами Nб и tб выражением Bвок = Nб/tб, из которого следует Nб = Ввок⋅tб (см. Аладинский В.А., Кузьминский С.В. Анализ цифровых потоков на выходах вокодеров, применяемых на зарубежных линиях радиосвязи диапазона высоких частот.- М.: Успехи современной радиоэлектроники. №7, 2015. С.73-76.). Длительность одного речевого сообщения определяют по формуле ΔT = K⋅tб.In vocoders used in foreign radio stations of the HF range, implemented are the coding method (MK) with ten linear prediction coefficients (LP) LPC-10 (Linear Predictive Coding), MK with LP and mixed excitation MELP (Mixed Excitation Linear Prediction), MK with mixed multiband excitation MICEX (Mixed-Multiband Excitation). The main parameters of the CPU are: Speed Wok CPU (600, 800, 1200 or 2400 bps), the number of N b bits in one information block (the length of the information block) and the duration t b of its transmission. The latter is asked at the stage of vocoder development (see Bykov S.F., Zhuravlev V.I., Shalimov I.A. Digital telephony. Textbook for high schools. - M .: Radio and communications, 2003. - 144 p.). The speed V wok of the output CPU is related to the parameters N b and t b by the expression B wok = N b / t b , from which N b = V wok ⋅t b (see Aladinsky V.A., Kuzminsky S.V. Analysis of digital streams at the outputs of vocoders used on foreign radio lines of the high frequency range. - M .: Successes of modern radio electronics. No. 7, 2015. P.73-76.). The duration of one voice message is determined by the formula ΔT = K⋅t b .

Положительный эффект в предлагаемом способе достигается за счет уменьшения размерности исходных данных, используемых для формирования векторов измеренных и эталонных значений математического ожидания

Figure 00000020
и mjэт соответственно, и представляемых в виде последовательности столбцов
Figure 00000024
матрицы YKxL. В результате битовые ошибки оказывают влияние на результаты только по одному разу каждая. Влияние сдвига в строках информационной матрицы YKxL (из-за отсутствия Nп символов в первом блоке цифрового информационного потока Y) устраняется путем формирования набора измеренных векторов значений математического ожидания
Figure 00000025
последовательным циркулярным сдвигом значений вектора m(0) на величину
Figure 00000026
и сравнением всех элементов этого набора.A positive effect in the proposed method is achieved by reducing the dimension of the source data used to form the vectors of the measured and reference values of the mathematical expectation
Figure 00000020
and m jet, respectively, and represented as a sequence of columns
Figure 00000024
matrices Y KxL . As a result, bit errors affect the results only once each. The influence of the shift in the rows of the information matrix Y KxL (due to the absence of N p characters in the first block of the digital information stream Y) is eliminated by forming a set of measured vectors of mathematical expectation values
Figure 00000025
successive circular shift of the values of the vector m (0) by
Figure 00000026
and comparing all the elements in this set.

Реализация заявленного способа может быть осуществлена следующим образом (см. фиг. 1). На подготовительном этапе рассчитывают эталонные векторы значений математического ожидания mjэт. Для лучшего понимания данная операция рассмотрена после описания действия по формированию измеренного вектора математических ожиданий m(0).Implementation of the claimed method can be carried out as follows (see Fig. 1). At the preparatory stage, reference vectors of mathematical expectation values m jet are calculated . For a better understanding, this operation is considered after the description of the action to form the measured mathematical expectation vector m (0).

В процессе работы принимают бинарный цифровой информационный поток Y длиной Nцп бит, количество которых определяют на основе выраженияIn the process, take a binary digital information stream Y of length N cp bits, the number of which is determined based on the expression

Figure 00000027
Figure 00000027

После этого вычисляют нормированную автокорреляционную функцию А, которая характеризует линейную зависимость исходной последовательности Y от последовательности Y(τ), сдвинутой циркулярно на τ=1,2,…, Nцп-1 бит по отношению к Y. Нормированная автокорреляционная функция реального речевого сигнала, вид которой представлен на фиг. 2, имеет явно выраженные локальные максимумы, расположенные с периодичностью Δτ. Следовательно, Δτ соответствует длине информационного блока. Наличие локальных максимумов автокорреляционной функции, расположенных с периодом Δτ, объясняется следующим. Параметры речевого сигнала расположены внутри информационного блока строго в определенном месте. При сдвигах Δτ, кратных длине информационного блока, значение АКФ будет наибольшим. Искомой автокорреляционной функцией (см. фиг. 2) считают совокупность значений видаAfter that, the normalized autocorrelation function A is calculated, which characterizes the linear dependence of the original sequence Y on the sequence Y (τ), circularly shifted by τ = 1,2, ..., N cn -1 bits with respect to Y. The normalized autocorrelation function of a real speech signal, the view of which is shown in FIG. 2 has distinct local maxima located at periodic intervals Δτ. Therefore, Δτ corresponds to the length of the information block. The presence of local maxima of the autocorrelation function located with a period Δτ is explained as follows. The parameters of the speech signal are located inside the information block strictly in a certain place. At shifts Δτ, which are multiples of the length of the information block, the ACF value will be the largest. The desired autocorrelation function (see Fig. 2) is considered a set of values of the form

Figure 00000028
где α(τ)=c(τ)/D(Y) - коэффициент корреляции; с(τ) - коэффициент ковариации; D(Y) - дисперсия цифрового информационного потока Y.
Figure 00000028
where α (τ) = c (τ) / D (Y) is the correlation coefficient; c (τ) is the covariance coefficient; D (Y) is the dispersion of the digital information stream Y.

Результатом корреляционного анализа является обнаружение периодической составляющей в цифровом информационном потоке Y. При этом значение периодичности равно длине информационного блока речевого сигнала.The result of the correlation analysis is the detection of a periodic component in the digital information stream Y. In this case, the frequency value is equal to the length of the information block of the speech signal.

По регулярным с равными интервалами Δτ экстремумам нормированной автокорреляционной функции А принимают решение о наличии блочной структуры в информационном потоке Y. Отсутствие экстремумов нормированной автокорреляционной функции А с равными интервалами Δτ свидетельствует о том, что цифровой информационный поток Y не содержит речевое сообщение, а выполнение его анализа завершается.Using regular extrema of the normalized autocorrelation function A at equal intervals Δτ, they decide on the presence of a block structure in the information flow Y. The absence of extrema of the normalized autocorrelation function A with equal intervals Δτ indicates that the digital information flow Y does not contain a speech message, and its analysis ends.

При наличии экстремумов нормированной автокорреляционной функции А с равными интервалами Δτ вычисляют количество информационных блоков, содержащихся в цифровом информационном потоке Y следующим образом:If there are extrema of the normalized autocorrelation function A with equal intervals Δτ, the number of information blocks contained in the digital information stream Y is calculated as follows:

Figure 00000029
Figure 00000029

На следующем этапе по интервалам Δτ между экстремумами нормированной автокорреляционной функции А делят информационный поток Y на информационные блоки объемом Nб бит каждый (см. фиг. 3). Последовательно присваивают информационным блокам порядковые номера k=1,2,…, K, начиная с первого информационного блока. Формируют прямоугольную информационную матрицу YKxL, L=Nб, (см. фиг. 3), строками которой являются последовательно размещенные друг под другом информационные блоки в соответствии с их порядковыми номерами k=1,2,…, K.At the next stage, at intervals Δτ between the extrema of the normalized autocorrelation function A, the information stream Y is divided into information blocks of N b bits each (see Fig. 3). Sequentially assign information blocks to serial numbers k = 1,2, ..., K, starting from the first information block. A rectangular information matrix Y KxL , L = N b , is formed (see Fig. 3), the rows of which are information blocks sequentially placed under each other in accordance with their serial numbers k = 1,2, ..., K.

Далее поочередно выделяют столбцы

Figure 00000030
из информационной матрицы YKxL с номерами
Figure 00000031
(см. фиг. 4). По совокупности элементов каждого столбца
Figure 00000030
вычисляют математическое ожидание (МО) их появления.Next, the columns are selected in turn
Figure 00000030
from the information matrix Y KxL with numbers
Figure 00000031
(see Fig. 4). By the totality of the elements of each column
Figure 00000030
calculate the expected value (MO) of their appearance.

В общем виде МО

Figure 00000032
-го столбца
Figure 00000033
находят по известной формуле (см. Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения. - М: Наука, 1988. - 480 с. - ISBN 5-02-013748-0):In the general form of MO
Figure 00000032
column
Figure 00000033
find according to the well-known formula (see Ventzel E.S., Ovcharov L.A. Probability theory and its engineering applications. - M: Nauka, 1988. - 480 p. - ISBN 5-02-013748-0):

Figure 00000034
где
Figure 00000035
- вероятность появления i-го значения символа в
Figure 00000036
столбце
Figure 00000037
, i=1,2, …, I. В связи с тем, что цифровой поток Y является бинарным (т.е. I=2, а значения символов: 1 или 0), тогда из (4) имеем:
Figure 00000034
Where
Figure 00000035
is the probability of occurrence of the ith value of the symbol in
Figure 00000036
column
Figure 00000037
, i = 1,2, ..., I. Due to the fact that the digital stream Y is binary (i.e., I = 2, and the values of the characters are 1 or 0), then from (4) we have:

Figure 00000038
Figure 00000038

Вероятность появления значения 1 в

Figure 00000039
столбце
Figure 00000040
вычисляется по формуле:The probability of occurrence of a value of 1 in
Figure 00000039
column
Figure 00000040
calculated by the formula:

Figure 00000041
Figure 00000041

где

Figure 00000042
- количество символов со значением 1 в
Figure 00000043
столбце
Figure 00000044
.Where
Figure 00000042
- the number of characters with a value of 1 in
Figure 00000043
column
Figure 00000044
.

В свою очередь, при формировании эталонных векторов значений математического ожидания

Figure 00000045
Figure 00000046
элемент эталонного вектора mjэт j-ого класса определяют из выраженияIn turn, in the formation of the reference vectors of values of mathematical expectation
Figure 00000045
Figure 00000046
the element of the reference vector m jet of the j-th class is determined from the expression

Figure 00000047
Figure 00000047

где

Figure 00000048
-
Figure 00000049
элемент w-й реализации обучающей выборки j-го класса, w=1,2,…, W, w - порядковый номер реализации обучающей выборки; W - объем обучающей выборки.Where
Figure 00000048
-
Figure 00000049
element of the wth implementation of the training sample of the jth class, w = 1,2, ..., W, w - serial number of the implementation of the training sample; W is the size of the training sample.

На следующем этапе вычисляют значение вероятности правильного распознавания

Figure 00000050
j-го протокола НСКР по каждому
Figure 00000051
-вектору значений математического ожидания
Figure 00000052
Для рассматриваемого случая J>2 используют следующее выражение вероятности распознавания (см. Ту Дж., Гонсалес Р. Принципы распознавания образов / Пер. с англ. - М.: Мир, 1978, - 411 с.)In the next step, the probability of correct recognition is calculated
Figure 00000050
j-th protocol of the NSCR for each
Figure 00000051
vector of mean values
Figure 00000052
For the case under consideration, J> 2, use the following expression of the probability of recognition (see Tu J., Gonzalez R. Principles of pattern recognition / Transl. From English. - M .: Mir, 1978, - 411 pp.)

Figure 00000053
Figure 00000053

где рj

Figure 00000054
- плотность распределения j-класса. Обычно плотность
Figure 00000055
описывают нормальным законом распределения (ЗР). Выбор последнего является приемлемым допущением и единственным вариантом, при котором обеспечивается анализ многомерного ЗР. Нормальная плотность распределения, описываемая многомерным набором признаков
Figure 00000056
принадлежащая j-му классу, имеет вид (см. Ту Дж., Гонсалес Р. Принципы распознавания образов / Пер. с англ. - М.: Мир, 1978, - 411 с.)
Figure 00000057
where p j
Figure 00000054
is the distribution density of the j-class. Usually density
Figure 00000055
describe the normal distribution law (SP). The choice of the latter is an acceptable assumption and the only option in which the analysis of multidimensional SR is provided. Normal distribution density described by a multidimensional set of features
Figure 00000056
belonging to the j-th class, has the form (see Tu J., Gonzalez R. Principles of pattern recognition / Transl. from English. - M .: Mir, 1978, - 411 pp.)
Figure 00000057

где

Figure 00000058
- усредненная ковариационная матрица набора эталонных векторов значений математического ожидания mjэт; w=1,2,…, W, w - порядковый номер реализации обучающей выборки; W - объем обучающей выборки;
Figure 00000059
- матрица, обратная
Figure 00000060
- математическая операция транспонирования.Where
Figure 00000058
- averaged covariance matrix of a set of reference vectors of values of mathematical expectation m jet ; w = 1,2, ..., W, w - serial number of the implementation of the training sample; W is the volume of the training sample;
Figure 00000059
is the inverse matrix
Figure 00000060
- mathematical operation of transposition.

По полученной совокупности значений вероятностей распознавания

Figure 00000061
принимают решение в пользу j-го класса, для которого значение вероятности распознавания
Figure 00000062
является наибольшимAccording to the resulting set of recognition probability values
Figure 00000061
decide in favor of the j-th class for which the recognition probability value
Figure 00000062
is the largest

Figure 00000063
Figure 00000063

Кроме того, выражение (10) позволяет определить вероятность правильного распознавания протокола НСКР:

Figure 00000064
.In addition, expression (10) allows us to determine the probability of correct recognition of the NSCR protocol:
Figure 00000064
.

Имитационное моделирование с использованием цифровых информационных потоков, полученных от вокодеров LPC-10-2400 (STANAG 4197) и MELPe-2400 (STANAG 4591) показало следующее (см. фиг. 5). При отсутствии битовых ошибок в цифровом информационном потоке Y вероятности Рр правильного распознавания протоколов НСКР для заявленного способа распознавания и прототипа примерно равны (Рр ≈ 0,93). При увеличении количества ошибок в цифровом информационном потоке Y, определяемое вероятностью появления ошибки Рош, наблюдается сравнительно более высокое значение вероятности Рр правильного распознавания протоколов НСКР для предлагаемого технического решения (см. фиг. 5, кривая 2). Последнее свидетельствует о его более высокой помехоустойчивости по сравнению с прототипом при прочих равных условиях. В предельном случае, когда еще возможно восстановление речевого сообщения (Рош = 0,15), выигрыш по вероятности правильного распознавания протоколов НСКР Рр при использовании предлагаемого способа составляет ~ 0,14.Simulation using digital information streams received from vocoders LPC-10-2400 (STANAG 4197) and MELPe-2400 (STANAG 4591) showed the following (see Fig. 5). In the absence of bit errors in the digital information stream Y, the probabilities P r of the correct recognition of the NSCR protocols for the claimed recognition method and prototype are approximately equal (P p ≈ 0.93). When the number of errors in the digital information stream Y, determines the probability of an error P err, there is a relatively higher value of the probability P p of correct recognition NCIS protocols for the proposed technical solution (see. FIG. 5, curve 2). The latter indicates its higher noise immunity compared to the prototype, ceteris paribus. In the limiting case, when it is still possible to restore the voice message (P OS = 0.15), the gain in the probability of correct recognition of the NSCR protocols P p when using the proposed method is ~ 0.14.

Кроме того, предлагаемый способ обладает более высоким быстродействием благодаря уменьшению объема вычислений. В прототипе в качестве исходных данных используют коэффициенты избыточности ϕz, вычисляемые из дополнительно сформированных z=Nб-2 прямоугольных матриц. В предлагаемом способе в качестве исходных данных выступают столбцы информационной матрицы YKxL, на основе которых вычисляют МО. В результате достигается уменьшение объема рассчитываемых данных в три раза.In addition, the proposed method has a higher speed due to the reduction in the volume of calculations. In the prototype, the redundancy coefficients ϕ z calculated from the additionally generated z = N b −2 rectangular matrices are used as initial data. In the proposed method, the columns of the information matrix Y KxL act as the initial data, based on which the MOs are calculated. As a result, a threefold reduction in the volume of calculated data is achieved.

Предлагаемый способ распознавания протоколов НСКР может быть реализован с помощью устройства, обобщенная структурная схема которого приведена на фиг. 6. Устройство содержит последовательно соединенные входной селектор 4, предназначенный для регистрации (запоминания заданного объема входного цифрового информационного потока Y), первый вычислитель 5, предназначенный для вычисления нормированной автокорреляционной функции А в соответствии с (2) и на ее основе определения значений Nб и K (выражения (1) и (3) соответственно), первый формирователь 6, предназначенный для формирования информационной матрицы принятого сигнала YKxL, второй формирователь 7, предназначенный для формирования последовательности столбцов

Figure 00000065
, второй вычислитель 8, предназначенный для вычисления значений математического ожидания
Figure 00000066
, формирования набора М векторов измеренных значений МО
Figure 00000067
(выражения (4)-(6)), третий вычислитель 11, предназначенный для вычисления значений вероятности правильного распознавания
Figure 00000068
на основе поэлементного сравнения векторов
Figure 00000069
значений математического ожидания из набора М с эталонными значениями векторов математического ожидания mjэт J известных протоколов НСКР в соответствии с (8)-(10), и блок принятия решения 13, предназначенный для определения принадлежности анализируемого цифрового информационного потока Y к наиболее вероятному j-му протоколу НСКР. Кроме того, устройство содержит первый блок памяти 9 и генератор тактовых импульсов 10.The proposed method for recognizing NSCR protocols can be implemented using a device whose generalized structural diagram is shown in FIG. 6. The device contains a series-connected input selector 4, intended for registration (storing a predetermined volume of the input digital information stream Y), a first calculator 5, designed to calculate the normalized autocorrelation function A in accordance with (2) and based on it to determine the values of N b and K (expressions (1) and (3), respectively), the first driver 6, designed to generate the information matrix of the received signal Y KxL , the second driver 7, designed to generate the sequence column strengths
Figure 00000065
, the second calculator 8, designed to calculate the values of the mathematical expectation
Figure 00000066
forming a set of M vectors of measured MO values
Figure 00000067
(expressions (4) - (6)), the third calculator 11, designed to calculate the probability values of correct recognition
Figure 00000068
based on elementwise vector comparison
Figure 00000069
mathematical expectation values from set M with reference values of mathematical expectation vectors m jet J of known NSCR protocols in accordance with (8) - (10), and decision block 13, designed to determine whether the analyzed digital information stream Y belongs to the most probable jth NSCR protocol. In addition, the device comprises a first memory unit 9 and a clock generator 10.

На подготовительном этапе по первой установочной шине 1 задают необходимый минимальный и максимальный объемы выборки сигнала

Figure 00000070
и
Figure 00000071
. По второй установочной шине 2 поступают значения эталонных векторов математического ожидания mjэт для всех J известных протоколов НСКР, расчет которых осуществляют в соответствии с (7) на подготовительном этапе и далее хранят в блоке 9.At the preparatory stage, the first minimum and maximum signal sample volumes are set on the first installation bus 1
Figure 00000070
and
Figure 00000071
. The second installation bus 2 receives the values of the reference mathematical expectation vectors m jet for all J known NSCR protocols, which are calculated in accordance with (7) at the preparatory stage and then stored in block 9.

В процессе работы устройства (см. фиг. 6) по входной шине 3 на вход блока 4 поступает цифровой информационный поток Y. В функции блока 4 входит его запоминание в объеме

Figure 00000072
, но не менее чем
Figure 00000073
. Эти значения задаются по шине 1. В противном случае на второй группе его выходов (первой выходной шине устройства 12) формируется сигнал об окончании работы устройства и необходимости перейти к анализу другой информационной последовательности.In the process of operation of the device (see Fig. 6), the digital information stream Y enters the input of block 4 through the input bus 3. The functions of block 4 include its storage in volume
Figure 00000072
but not less than
Figure 00000073
. These values are set on bus 1. Otherwise, a signal is generated on the second group of its outputs (first output bus of device 12) about the end of the device and the need to proceed to the analysis of another information sequence.

Запомненная выборка цифрового информационного потока Y под воздействием тактовых импульсов блока 10 с выхода блока 4 поступает на группу информационных входов первого вычислителя 5. В функции блока 5 входит расчет нормированной автокорреляционной функции А, ее анализ с целью обнаружения регулярных с равными интервалами Δτ экстремумов автокорреляционной функции А, разбиение принятого цифрового информационного потока Y на информационные блоки по Nб бит каждый по их числу в интервалах между экстремумами нормированной автокорреляционной А. С первой группы информационных выходов блока 5 поблочно в Nб бит информационная последовательность Y поступает на группу информационных входов первого формирователя 6. В противном случае, когда в блоке 5 не обнаружены регулярные с равными интервалами Δτ экстремумы функции А, на второй группе его информационных выходов формируется сигнал о завершении анализа принятой информационной последовательности, который поступает на первую выходную шину 12 устройства.The memorized sample of the digital information stream Y under the influence of the clock pulses of block 10 from the output of block 4 goes to the group of information inputs of the first calculator 5. The functions of block 5 include the calculation of the normalized autocorrelation function A, its analysis to detect regular extrema of the autocorrelation function A at regular intervals Δτ , splitting the received digital information stream Y into information blocks of N b bits each according to their number in the intervals between the extrema of the normalized autocorrelation A . With the first group of information outputs of block 5 block at a N b bit information sequence Y is supplied to a group of information inputs of the first generator 6. Otherwise, when the unit 5 are detected regularly at equal intervals Δτ extrema of the function A, the second group of information outputs its a signal is generated about the completion of the analysis of the received information sequence, which is fed to the first output bus 12 of the device.

В блоке 6 осуществляют формирование информационной матрицы YKxL путем последовательной поблочной записи цифрового информационного потока Y в соответствии с фиг. 3. Значение информационной матрицы YKxL в параллельном коде далее поступает на группу информационных входов второго формирователя 7. В блоке 7 осуществляют последовательное деление информационной матрицы YKxL на последовательность из L столбцов

Figure 00000074
(см. фиг. 4).In block 6, the information matrix Y KxL is formed by sequential block recording of the digital information stream Y in accordance with FIG. 3. The value of the information matrix Y KxL in parallel code then goes to the group of information inputs of the second shaper 7. In block 7, the information matrix Y KxL is sequentially divided into a sequence of L columns
Figure 00000074
(see Fig. 4).

Полученные значения столбцов

Figure 00000075
последовательно поступают на группу информационных входов вычислителя 8.The resulting column values
Figure 00000075
sequentially arrive at the group of information inputs of the calculator 8.

В блоке 8, по мере поступления столбцов

Figure 00000075
, осуществляют расчет значений математического ожидания т, в соответствии с выражениями (4) - (6). Далее из полученных значений m
Figure 00000076
в блоке 8 формируют вектор значений МО m(0). После этого, благодаря последовательному циркулярному сдвигу его значений на величину
Figure 00000077
, формируют набор
Figure 00000078
векторов математических ожиданий анализируемого цифрового потока Y.In block 8, as the columns arrive
Figure 00000075
, calculate the values of the mathematical expectation m, in accordance with the expressions (4) - (6). Further, from the obtained values of m
Figure 00000076
in block 8 form a vector of values of MO m (0). After that, due to the sequential circular shift of its values by
Figure 00000077
form set
Figure 00000078
expectation vectors of the analyzed digital stream Y.

Найденные значения совокупности М векторов

Figure 00000079
поступают на вторую группу информационных входов третьего вычислителя 11. На вторую группу его информационных входов поступают значения эталонных векторов mjэт МО для всех J известных протоколов НСКР. Поступление
Figure 00000080
и mjэт на входы блока 11 синхронизируется импульсами блока 10. В функции блока 11 входит расчет значений вероятности правильного распознавания Рj
Figure 00000081
для всех J протоколов НСКР по каждому
Figure 00000082
вектору значений МО
Figure 00000083
в соответствии с выражениями (8)-(10).The found values of the set of M vectors
Figure 00000079
arrive at the second group of information inputs of the third computer 11. The second group of its information inputs receives the values of the reference vectors m j et MO for all J known NSCR protocols. Admission
Figure 00000080
and m jet to the inputs of block 11 is synchronized by pulses of block 10. The function of block 11 includes calculating the values of the probability of correct recognition of P j
Figure 00000081
for all J NSCR protocols for each
Figure 00000082
vector of values of MO
Figure 00000083
in accordance with expressions (8) - (10).

Полученные в блоке 11 значения

Figure 00000084
далее поступают на группу информационных входов блока принятия решения 13. В функции последнего входит поиск максимального значения max
Figure 00000085
из всей совокупности L×J полученных в блоке 11 значений вероятностей
Figure 00000086
. В качестве идентифицированного протокола НСКР принимают j-й протокол, соответствующий max
Figure 00000087
.The values obtained in block 11
Figure 00000084
then they go to the group of information inputs of the decision block 13. The function of the latter includes the search for the maximum value max
Figure 00000085
from the entire set of L × J probabilities obtained in block 11
Figure 00000086
. The j-th protocol corresponding to max
Figure 00000087
.

Реализация элементов устройства распознавания протоколов НСКР известна. Входной селектор 4, первый и второй формирователи 6 и 7 соответственно, блок памяти 9 могут быть реализованы на микросхемах памяти (см. Большие интегральные схемы запоминающих устройств: Справочник / А.Ю. Гордонов и др.: Под ред. А.Ю. Гордонова и Ю.Н. Дьяконова. - М.: Радио и связь. 1990, - 288 с.). Первый, второй и третий вычислители 5, 8 и 11 могут быть реализованы на микропроцессорах с достаточным быстродействием (см. Шевкопляс Б.В. Микропроцессорные структуры. Инженерные решения: Справочник. 2-е изд., перераб. и доп. - М.: Радио и связь. 1990, - 512 с.). Блок принятия решения 15 представляет из себя блок сравнения, который может быть реализован на элементарной логике микросхем ТТЛ.The implementation of the elements of the device recognition Protocol NSCR is known. The input selector 4, the first and second shapers 6 and 7, respectively, the memory unit 9 can be implemented on memory chips (see. Large integrated circuits of memory devices: Reference / A.Yu. Gordonov et al .: Edited by A.Yu. Gordonov and Yu.N. Dyakonov. - M .: Radio and communications. 1990, - 288 p.). The first, second and third computers 5, 8 and 11 can be implemented on microprocessors with sufficient speed (see Shevkoplyas B.V. Microprocessor structures. Engineering solutions: Handbook. 2nd ed., Revised and additional - M .: Radio and communications. 1990, - 512 p.). The decision block 15 is a comparison block, which can be implemented on the elementary logic of TTL chips.

Claims (1)

Способ распознавания протоколов низкоскоростного кодирования речи (НСКР), реализуемых в вокодерах, заключающийся в том, что принимают цифровой информационный поток Y в течение интервала времени ΔT, на основе принятого потока Y формируют нормированную автокорреляционную функцию А, по регулярным с равными интервалами Δτ экстремумам автокорреляционной функции А принимают решение о наличии блочной структуры в цифровом информационном потоке Y, по интервалам между экстремумами автокорреляционной функции А делят цифровой информационный поток Y на информационные блоки объемом Nб бит каждый, последовательно присваивают информационным блокам порядковые номера k=1, 2, …, K, начиная с первого информационного блока, формируют прямоугольную информационную матрицу YK×L, L=Nб, строками которой являются последовательно размещенные друг под другом информационные блоки в соответствии с их порядковыми номерами k=1, 2, …, K, отличающийся тем, что поочередно выделяют столбцы yl из матрицы YK×L с номерами l=1, 2, …, L, по каждому столбцу yl информационной матрицы YK×L вычисляют значение математического ожидания ml появления определенных импульсов, формируют вектор измеренных значений математического ожидания m(0)={m1, m2, …, ml, …, mL} последовательным размещением полученных значений математического ожидания ml в соответствии с их порядковыми номерами l, на основе сформированного вектора значений математического ожидания m(0) путем последовательного циркулярного сдвига его значений на величину l=0, 1, 2, …, L-1 формируют набор М векторов m(l) значений математического ожидания М={m(0), m(1), …, m(l), …, m(L-1)}, формируют эталонные векторы значений математического ожидания
Figure 00000088
, j=1, 2, …, J, по каждому цифровому информационному потоку
Figure 00000089
, соответствующему j-му известному протоколу НСКР, каждый вектор значений математического ожидания m(l) оцениваемого протокола НСКР последовательно сравнивают с эталонными векторами значений математического ожидания
Figure 00000088
, j=1, 2, …, J, вычисляют значение вероятности правильного распознавания Pj(l) j-го протокола НСКР по каждому l-му вектору значений математического ожидания m(l), принимают решение в пользу j-го протокола НСКР, для которого обеспечивается максимальное значение вероятности правильного распознавания Pj(l).
A method for recognizing low-speed speech coding (NSCR) protocols implemented in vocoders, which consists in receiving a digital information stream Y over a time interval ΔT, based on the received stream Y, they generate a normalized autocorrelation function A, according to regular extrema of the autocorrelation function at regular intervals Δτ And they decide on the presence of a block structure in the digital information stream Y, according to the intervals between the extrema of the autocorrelation function A, they divide the digital information flow to Y on information blocks in volume N b bits each, sequentially assigned information units sequence numbers k = 1, 2, ..., K, from the first information unit is formed rectangular information matrix Y K × L, L = N b, which rows are sequentially placed one under the other information blocks in accordance with their serial numbers k = 1, 2, ..., K, characterized in that the columns y l are sequentially distinguished from the matrix Y K × L with numbers l = 1, 2, ..., L, for each column y l information matrix Y K × L calculate the value of mathematical about the expectation m l of the appearance of certain pulses, form a vector of measured values of the mathematical expectation m (0) = {m 1 , m 2 , ..., m l , ..., m L } by sequentially placing the obtained values of the mathematical expectation m l in accordance with their serial numbers l, based on the generated vector of mathematical expectation values m (0) by successive circular shift of its values by the value l = 0, 1, 2, ..., L-1, a set of M vectors m (l) of mathematical expectation values M = {m ( 0), m (1), ..., m (l), ..., m (L-1)}, form reference vectors of mathematical values personal expectation
Figure 00000088
, j = 1, 2, ..., J, for each digital information stream
Figure 00000089
corresponding to the j-th known NSCR protocol, each vector of mathematical expectation values m (l) of the evaluated NSCR protocol is sequentially compared with the reference vectors of mathematical expectation values
Figure 00000088
, j = 1, 2, ..., J, calculate the probability of correct recognition Pj (l) of the j-th NSCR protocol for each l-th vector of mathematical expectation values m (l), decide in favor of the j-th NSCR protocol, for which provides the maximum value of the probability of correct recognition of P j (l).
RU2017137299A 2017-10-24 2017-10-24 Method of recognizing low-speed speech coding protocols RU2667462C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2017137299A RU2667462C1 (en) 2017-10-24 2017-10-24 Method of recognizing low-speed speech coding protocols

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2017137299A RU2667462C1 (en) 2017-10-24 2017-10-24 Method of recognizing low-speed speech coding protocols

Publications (1)

Publication Number Publication Date
RU2667462C1 true RU2667462C1 (en) 2018-09-19

Family

ID=63580368

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017137299A RU2667462C1 (en) 2017-10-24 2017-10-24 Method of recognizing low-speed speech coding protocols

Country Status (1)

Country Link
RU (1) RU2667462C1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2748935C1 (en) * 2020-09-03 2021-06-01 федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации Method of recognition of new low bit rate coding protocols
RU2757860C1 (en) * 2021-04-09 2021-10-21 Общество с ограниченной ответственностью "Специальный Технологический Центр" Method for automatically assessing the quality of speech signals with low-rate coding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040138888A1 (en) * 2003-01-14 2004-07-15 Tenkasi Ramabadran Method and apparatus for speech reconstruction within a distributed speech recognition system
RU2356064C2 (en) * 2007-04-24 2009-05-20 ВОЕННАЯ АКАДЕМИЯ СВЯЗИ имени С.М. Буденного Method of identifying radio signals
RU2423735C1 (en) * 2010-03-17 2011-07-10 Государственное образовательное учреждение высшего профессионального образования "Военная академия связи имени С.М. Буденного" Министерства обороны Российской Федерации Method of detecting radio signals
RU2551903C1 (en) * 2014-04-18 2015-06-10 Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства Обороны Российской Федерации (Минобороны России) Method of identifying radio signals
RU2565995C2 (en) * 2010-10-29 2015-10-20 Антон ИЕН Encoder and decoder for low-rate signals

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040138888A1 (en) * 2003-01-14 2004-07-15 Tenkasi Ramabadran Method and apparatus for speech reconstruction within a distributed speech recognition system
RU2356064C2 (en) * 2007-04-24 2009-05-20 ВОЕННАЯ АКАДЕМИЯ СВЯЗИ имени С.М. Буденного Method of identifying radio signals
RU2423735C1 (en) * 2010-03-17 2011-07-10 Государственное образовательное учреждение высшего профессионального образования "Военная академия связи имени С.М. Буденного" Министерства обороны Российской Федерации Method of detecting radio signals
RU2565995C2 (en) * 2010-10-29 2015-10-20 Антон ИЕН Encoder and decoder for low-rate signals
RU2551903C1 (en) * 2014-04-18 2015-06-10 Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства Обороны Российской Федерации (Минобороны России) Method of identifying radio signals

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2748935C1 (en) * 2020-09-03 2021-06-01 федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации Method of recognition of new low bit rate coding protocols
RU2757860C1 (en) * 2021-04-09 2021-10-21 Общество с ограниченной ответственностью "Специальный Технологический Центр" Method for automatically assessing the quality of speech signals with low-rate coding

Similar Documents

Publication Publication Date Title
US5091945A (en) Source dependent channel coding with error protection
US5729656A (en) Reduction of search space in speech recognition using phone boundaries and phone ranking
US8538752B2 (en) Method and apparatus for predicting word accuracy in automatic speech recognition systems
RU2667462C1 (en) Method of recognizing low-speed speech coding protocols
CN107147400B (en) IRA code open set blind identification method
JPH07261784A (en) Pattern recognition method, sound recognition method and sound recognition device
US7574354B2 (en) Transcoding between the indices of multipulse dictionaries used in compressive coding of digital signals
EP0784846B1 (en) A multi-pulse analysis speech processing system and method
CN113793591A (en) Speech synthesis method and related device, electronic equipment and storage medium
WO2011071560A1 (en) Compressing feature space transforms
CN107911124B (en) Non-recursive SC decoding part and determining method and device
RU2610285C1 (en) Method of detecting low-rate encoding protocols
CN111130567B (en) Polarization code belief propagation list decoding method added with noise disturbance and bit inversion
Vidal et al. Error bounds for decoding piecewise constant nanopore signals in DNA storage
EP0603824A2 (en) Method of and circuit for detecting synchronism in viterbi decoder
CN115132210B (en) Audio recognition method, training method, device and equipment of audio recognition model
CN115695564A (en) Efficient transmission method for data of Internet of things
CN112735392B (en) Voice processing method, device, equipment and storage medium
WO2009078665A1 (en) Method and apparatus for lexical decoding
RU2748935C1 (en) Method of recognition of new low bit rate coding protocols
Soudoplatoff Markov modeling of continuous parameters in speech recognition
JP3045197B2 (en) Codebook design method for vector quantizer
RU2701465C1 (en) Method of selecting digital streams
Isroil et al. Increasing the Reliability of Full Text Documents Based on the Use of Mechanisms for Extraction of Statistical and Semantic Links of Elements
RU162225U1 (en) DEVICE FOR ESTABLISHING CYCLE SYNCHRONIZATION BY DISTORTED CODE WORDS BASED ON THE CODE SPECTRUM

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20191025