RU2748935C1 - Method of recognition of new low bit rate coding protocols - Google Patents
Method of recognition of new low bit rate coding protocols Download PDFInfo
- Publication number
- RU2748935C1 RU2748935C1 RU2020129303A RU2020129303A RU2748935C1 RU 2748935 C1 RU2748935 C1 RU 2748935C1 RU 2020129303 A RU2020129303 A RU 2020129303A RU 2020129303 A RU2020129303 A RU 2020129303A RU 2748935 C1 RU2748935 C1 RU 2748935C1
- Authority
- RU
- Russia
- Prior art keywords
- values
- matrix
- nscr
- information
- vector
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000011159 matrix material Substances 0.000 claims abstract description 50
- 239000013598 vector Substances 0.000 claims abstract description 29
- 238000005311 autocorrelation function Methods 0.000 claims abstract description 20
- 239000011148 porous material Substances 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 abstract description 15
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000036039 immunity Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
- H03M13/03—Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
Description
Изобретение относится к области цифровой связи, а именно, к обработке цифровых потоков канального уровня эталонной модели взаимодействия открытых систем и может быть использовано в широком классе средств обработки цифровых сигналов для распознавания новых протоколов низкоскоростного кодирования речи (НСКР), используемых при передаче речевых сообщений по цифровым каналам связи.The invention relates to the field of digital communication, namely, to the processing of digital streams of the channel level of the reference model of the interaction of open systems and can be used in a wide class of digital signal processing tools for recognizing new low-speed speech coding (LSCR) protocols used in the transmission of speech messages over digital communication channels.
Заявленное техническое решение расширяет арсенал средств аналогичного назначения за счет возможности распознавания новых протоколов НСКР с меньшей вероятностью ложной тревоги.The claimed technical solution expands the arsenal of tools for a similar purpose due to the ability to recognize new NSCR protocols with a lesser likelihood of false alarms.
Известен способ распознавания протоколов НСКР (см. Патент РФ № RU 2610285 С1, МПК G10L 19/008 (2013.01), Н03М 13/03 (2006.01). Способ распознавания протоколов низкоскоростного кодирования. Аладинский В.А., Кузьминский С.В., Смирнов П.Л., Чубатый Д.Н., опубл. 08.02.2017), в котором на основе сравнения эталонных описаний, представленных наборами усредненных значений коэффициента избыточности (КИ), и исследуемого образа, представленного набором значений КИ столбцов прямоугольной матрицы, сформированной из входного цифрового информационного потока, определяют величины отклонения между измеренным набором значений КИ и наборами усредненных значений КИ, в полученной совокупности значений отклонения выбирают минимальное, сравнивают его с пороговой величиной, по результатам сравнения принимают решение о том, что исследуемый цифровой поток сформирован на основе одного из известных протоколов НСКР, в противном случае полагают, что для формирования анализируемого цифрового потока был применен новый (неизвестный ранее) протокол НСКР. Недостатком способа является низкая помехоустойчивость распознавания, что приводит к появлению большого числа ложных решений о применении на линиях радиосвязи новых протоколов НСКР при вероятности битовой ошибки Рош>0,03.A known method for recognizing NSCR protocols (see RF Patent No. RU 2610285 C1, IPC G10L 19/008 (2013.01),
Наиболее близким к заявленному является способ (прототип) распознавания протоколов низкоскоростного кодирования (см. Патент РФ № RU 2667462 С1, Способ распознавания протоколов низкоскоростного кодирования, МПК G10L 19/008 (2013.01), Н03М 13/03 (2006.01). Аладинский В.А., Вещунин Е.А., Кузьминский С.В., Смирнов П.Л. опубл. 19.09.2018), заключающийся в том, что принимают бинарный цифровой информационный поток у в течение интервала времени ΔT, формируют на основе у нормированную автокорреляционную функцию а, принимают решение о наличии блочной структуры в цифровом информационном потоке у по регулярным с равными интервалами Δτ экстремумам автокорреляционной функции а, делят цифровой информационный поток у на информационные блоки объемом Nб бит каждый с интервалами Δτ между экстремумами автокорреляционной функции а, последовательно присваивают информационным блокам порядковые номера k=1, 2, …, K, начиная с первого информационного блока, формируют прямоугольную информационную матрицу Y размеров K×L, L=Nб, строками которой являются последовательно размещенные друг под другом информационные блоки в соответствии с их порядковыми номерами k=1, 2, …, K, из матрицы Y выделяют столбцы yz, z=1, 2, …, L; вычисляют по каждому столбцу yz значение математического ожидания (МО) mz, на основе полученных значений mz формируют вектор значений МО m0=(m1, m2, …, mz, …, mL) путем последовательного их размещения в соответствии с порядковыми номерами z, на основе полученного вектора m0 формируют квадратную матрицу М значений МО размера L, строки ml, l=0, 1, 2, …, L-1, которой содержат значения вектора m0, последовательно циркулярно сдвинутые влево на величину l; формируют прямоугольные эталонные информационные матрицы на основе которыхClosest to the claimed is a method (prototype) for recognizing low-speed coding protocols (see RF Patent No. RU 2667462 C1, Method for recognizing low-speed coding protocols, IPC G10L 19/008 (2013.01),
вычисляют векторы эталонных значений МО mj эт, j=1, 2, …, J, и квадратные эталонные ковариационные матрицы {Cj эт}J, соответствующие J известным протоколам НСКР; вычисляют значения вероятности правильного распознавания Pjl j-то протокола НСКР, j=1, 2, …, J, по каждой l-й строке ml матрицы М, принимают решение в пользу того j-го протокола НСКР, для которого обеспечивается максимальное значение Pjl.calculate the vectors of reference values MO m j et , j = 1, 2, ..., J, and square reference covariance matrices {C j et } J corresponding to J known NSCR protocols; the values of the probability of correct recognition P jl of the jth NSCR protocol, j = 1, 2, ..., J, are calculated for each l-th row m l of the matrix M, a decision is made in favor of the j-th NSCR protocol for which the maximum value is provided P jl .
Способ-прототип обладает высокой точностью распознавания протоколов НСКР в условиях высокого уровня битовых ошибок в исследуемом цифровом информационном потоке у. Однако, недостатком прототипа является появление при вычислении вероятности правильного распознавания неопределенности вида Pjl=0/0 для всех j, l. Последняя возникает в случае подачи на вход цифровых информационных потоков, в том числе сформированных на основе новых протоколов НСКР, за исключением реализаций, для которых имеются эталонные описания. В результате имеет место увеличение вероятности ложной тревоги при распознавании новых протоколов НСКР в условиях уменьшения объема К входного цифрового информационного потока у, особенно при величине К<100. Следствием увеличения количества J эталонных описаний, формируемых за счет неправильно распознанных входных реализаций при обучении системы распознавания протоколов НСКР, является снижение вероятности правильного распознавания.The prototype method has a high accuracy of recognition of the NSCR protocols in conditions of a high level of bit errors in the investigated digital information stream y. However, the disadvantage of the prototype is the appearance when calculating the probability of correct recognition of the uncertainty of the form P jl = 0/0 for all j, l. The latter arises when digital information streams are fed to the input, including those formed on the basis of new NSCR protocols, with the exception of implementations for which there are reference descriptions. As a result, there is an increase in the probability of a false alarm when recognizing new NSCR protocols in conditions of a decrease in the volume K of the input digital information stream y, especially when K <100. The consequence of an increase in the number J of reference descriptions formed due to incorrectly recognized input realizations during training of the NSCR protocol recognition system is a decrease in the probability of correct recognition.
Целью заявленного технического решения является разработка способа, обеспечивающего снижение вероятности ложной тревоги и, как следствие, повышение достоверности распознавания (вероятности правильного распознавания) новых протоколов НСКР.The aim of the claimed technical solution is to develop a method that reduces the probability of false alarms and, as a consequence, increases the reliability of recognition (the probability of correct recognition) of new NSCR protocols.
Поставленная цель достигается тем, что в известном способе распознавания протоколов НСКР, включающем прием бинарного цифрового информационного потока у в течение интервала времени ΔТ, формирование на основе у нормированной автокорреляционной функции а, принятие решения о наличии блочной структуры в информационном потоке у по регулярным с равными интервалами Δτ экстремумам автокорреляционной функции а, деление цифрового информационного потока у на информационные блоки объемом Nб бит каждый по интервалам между экстремумами автокорреляционной функции а, последовательное присвоение информационным блокам порядковых номеров k=1, 2, …, K, начиная с первого информационного блока, формирование прямоугольной информационной матрицы Y размеров K×L, L=Nб, строками которой являются последовательно размещенные друг под другом информационные блоки в соответствии с их порядковыми номерами k=1, 2, …, K, выделение из матрицы Y столбцов yz, z=1, 2, …, L, определение значений МО mz по каждому столбцу yz, формирование вектора значений МО m0=(m1, m2, …, mz, …, mL) последовательным размещением значений МО mz, формирование квадратной матрицы значений МО М размером L×L, строки ml, l=0, 1, 2, …, L-1, которой содержат значения вектора то, последовательно циркулярно сдвинутые влево на величину l, формирование прямоугольных эталонных информационных матриц {Yj эт}J, вычисление на основе эталонных информационных матриц {Yj эт}J векторов эталонных значений МО mj эт, у=1, 2,…, J и квадратных эталонных ковариационных матриц {Cj эт}J, вычисление значения вероятности правильного распознавания Pjl для каждого j-го протокола НСКР, j=1, 2, …, J, по каждой 1-й строке ml матрицы М, принятие решения в пользу j-го протокола НСКР, для которого обеспечивается максимальное значение Pjl, при получении результата вычисления вероятности правильного распознавания в виде неопределенности Pjl=0/0 для всех j, l, формируют совокупность прямоугольных матриц {Yl}L, столбцы которых сдвинуты циркулярно на l=0, 1, 2, …, L-1 относительно столбцов прямоугольной информационной матрицы Y. Для каждой матрицы Yl вычисляют соответствующую ей квадратную ковариационную матрицу Cl.This goal is achieved by the fact that in the known method for recognizing NSCR protocols, which includes receiving a binary digital information stream y during the time interval ΔT, forming a normalized autocorrelation function a on the basis of y, making a decision on the presence of a block structure in the information stream y at regular intervals Δτ to the extrema of the autocorrelation function a, dividing the digital information flow y into information blocks of N b bits each according to the intervals between the extrema of the autocorrelation function a, sequentially assigning sequence numbers k = 1, 2, ..., K to the information blocks, starting from the first information block, forming a rectangular information matrix Y of sizes K × L, L = N b , the rows of which are information blocks sequentially placed under each other in accordance with their ordinal numbers k = 1, 2, ..., K, extraction of columns y z , z = from the
Определяют значение дивергенции vjl между образом входной реализации, представленной строками ml квадратной матрицы М значений МО и соответствующими ковариационными матрицами Cl, и каждым j-м эталонным образом, представленным вектором mj эт и соответствующей квадратной эталонной ковариационной матрицей Сj эт. на основе полученных значений vjl формируют вектор значений дивергенции vj=(vj0, vj1, …, vjl …, vj(L-1)) для каждого j-го эталонного образа. Составляют из J векторов vj матрицу значений дивергенции V размеров J×L.Determine the value of the divergence v jl between the image of the input implementation, represented by rows m l of the square matrix of M values of MO and the corresponding covariance matrices C l , and each j-th reference image represented by the vector m j et and the corresponding square reference covariance matrix C j et. on the basis of the obtained values of v jl , a vector of divergence values v j = (v j0 , v j1 , ..., v jl ..., v j (L-1) ) is formed for each j-th reference image. A matrix of values of divergence V of sizes J × L is composed of J vectors v j.
Принимают решение о обнаружении нового ранее неизвестного протокола НСКР и присваивают условный номер J=J+1 новому эталонному описанию, которое включает вектор математического ожидания m(J+1)эт=m0 и квадратную эталонную ковариационную матрицу С(J+1)эт=С0, если для всех элементов vjl матрицы значений дивергенции V выполняется условие vjl>vпop=2000 при любых j, l, где vпop - пороговая величина, или только для одного элемента vjl<300, а все остальные vjl>vпор, принимают решение, что входная реализация у сформирована по j-му известному протоколу НСКР и в информационном потоке у отсутствуют начальные l бит в первом k=1 информационном блоке. В случае 300≤vjl≤2000 принимают решение о том, что входная реализация у не распознана.A decision is made to detect a new previously unknown NSCR protocol and a conditional number J = J + 1 is assigned to a new reference description, which includes the mathematical expectation vector m (J + 1) fl = m 0 and a square reference covariance matrix C (J + 1) fl = С 0 , if for all elements v jl of the matrix of divergence values V the condition v jl > v pop = 2000 is satisfied for any j, l, where v pop is the threshold value, or only for one element v jl <300, and all the rest v jl > v then , it is decided that the input implementation y is formed according to the j-th known NSCR protocol and the information stream y has no initial l bits in the first k = 1 information block. In the case of 300≤v jl ≤2000, a decision is made that the input implementation y is not recognized.
Данному решению соответствует, например, ситуация, когда цифровой информационный поток у содержит менее 100 информационных блоков (т.е. K<100) или количество одиночных битовых ошибок составляет в нем более 10%.This solution corresponds, for example, to the situation when the digital information stream y contains less than 100 information blocks (i.e., K <100) or the number of single bit errors in it is more than 10%.
Благодаря новой совокупности существенных признаков в заявленном способе достигается повышение достоверности распознавания (вероятности правильного распознавания) новых протоколов НСКР за счет более полного описания образа входной реализации, представленного строками ml квадратной матрицы М значений МО и соответствующими ковариационными матрицами Cl, а также определения дивергенции vjl между этим образом и эталонными образами, представленных векторами mj эт и соответствующими эталонными ковариационными матрицами Cj эт..Thanks to the new set of essential features in the claimed method, an increase in the recognition reliability (the probability of correct recognition) of new NSCR protocols is achieved due to a more complete description of the input implementation image represented by rows m l of the square matrix M of MO values and the corresponding covariance matrices C l , as well as determining the divergence v jl between this image and the reference images represented by vectors m j et and the corresponding reference covariance matrices C j et. ...
Заявленный способ поясняется чертежами, на которых показаны:The claimed method is illustrated by drawings, which show:
на фиг. 1 - зависимость вероятности ложной тревоги Рлт от количества блоков K, содержащихся в цифровом информационном потоке у, при распознавании протоколов НСКР;in fig. 1 - the dependence of the probability of false alarm P lt on the number of blocks K contained in the digital information stream y, when recognizing the NSCR protocols;
на фиг. 2 - порядок формирования квадратной матрицы значений МО М размеров Z=L;in fig. 2 - the order of formation of a square matrix of values of MO M dimensions Z = L;
на фиг. 3 - алгоритм распознавания новых протоколов НСКР;in fig. 3 - an algorithm for recognizing new NSCR protocols;
на фиг. 4 - зависимости достоверности Dp принимаемого решения от количества блоков K, содержащихся в цифровом информационном потоке у при распознавании протоколов НСКР;in fig. 4 - dependences of the reliability D p of the decision taken on the number of blocks K contained in the digital information stream y when recognizing the NSCR protocols;
на фиг. 5 - зависимость вероятности ложной тревоги Рлт от вероятности битовой ошибки Рош в цифровом информационном потоке у, при распознавании протоколов НСКР.in fig. 5 - dependence of the probability of false alarm P lt on the probability of a bit error P osh in the digital information stream y, when recognizing the NSCR protocols.
Развитие цифровой телефонной радиосвязи ведется по многим направлениям, одним из которых является разработка аппаратно-программных средств НСКР, называемых вокодерами. Например, для применения на линиях радиосвязи диапазона высоких частот (ВЧ) к настоящему моменту разработаны не менее 20-ти различных типов вокодеров и соответствующих им протоколов НСКР (см. Аладинский В.А, Кузьминский С.В. Анализ цифровых потоков на выходах вокодеров, принимаемых на зарубежных линиях радиосвязи диапазона высоких волн // Успехи современной радиоэлектроники. - М.: Радиотехника, №7, 2015 г. - С. 73-76). Известные протоколы НСКР могут быть открытыми или закрытыми. Информация о закрытых протоколах является конфиденциальной. В технике радиосвязи диапазона ВЧ применяются открытые протоколы LPC-10-2400 (STANAG 4198) и MELPe-2400 (STANAG 4591), опубликованные в соответствующих стандартах НАТО. В тоже время применяется закрытый протокол MELPe-600 (STANAG 4591). Новые (неизвестные, не применявшиеся ранее) протоколы НСКР являются закрытыми.The development of digital telephone radio communication is carried out in many directions, one of which is the development of NSCR hardware and software, called vocoders. For example, to date, at least 20 different types of vocoders and their corresponding NSCR protocols have been developed for use on high-frequency (HF) radio communication lines (see Aladinsky V.A., Kuzminsky S.V. Analysis of digital streams at the outputs of vocoders, accepted on foreign lines of radio communication of the range of high waves // Successes of modern radio electronics. - M .: Radiotekhnika, No. 7, 2015 - P. 73-76). Known NSCR protocols can be open or closed. Information about closed protocols is confidential. In HF radio communication technology, the open protocols LPC-10-2400 (STANAG 4198) and MELPe-2400 (STANAG 4591), published in the relevant NATO standards, are used. At the same time, the closed protocol MELPe-600 (STANAG 4591) is used. New (unknown, not previously applied) NSCR protocols are closed.
Появление новых протоколов НСКР на линиях радиосвязи обусловлено стремлением фирм-производителей аппаратуры радиосвязи к повышению занимаемой доли рынка, коммерческой прибыли и защите своих компетенций, с одной стороны, а также к повышению качества связи за счет внедрения новых технических решений, в том числе модификации ранее известных протоколов, с другой стороны. Реализация новых протоколов НСКР в существующих средствах радиосвязи может быть выполнена на программном уровне или подключением внешнего вокодера с помощью имеющихся интерфейсов. Таким образом, применение новых протоколов НСКР при передаче речевых сообщений с помощью средств радиосвязи не является исключительным событием, что определяет необходимость решения этой технической задачи методами распознавания образов.The emergence of new NSCR protocols on radio communication lines is due to the desire of manufacturers of radio communication equipment to increase their market share, commercial profits and protect their competencies, on the one hand, as well as to improve the quality of communication through the introduction of new technical solutions, including modifications of previously known protocols on the other hand. The implementation of the new NSCR protocols in the existing radio communication facilities can be performed at the software level or by connecting an external vocoder using the existing interfaces. Thus, the use of new NSCR protocols when transmitting voice messages using radio communications is not an exceptional event, which determines the need to solve this technical problem using pattern recognition methods.
Использование способа-прототипа распознавания протоколов НСКР в условиях большого количества ошибок (более 10% от общего числа бит) в исследуемых цифровых потоках, полученных при кодировании речевых сообщений с помощью известных протоколов НСКР, вызывает появление результатов вычисления вероятности правильного распознавания в виде неопределенности Pji=0/0 для всех j, l. Аналогичные результаты имеют место и при меньшем количестве битовых ошибок, если К<100. Это свидетельствует о недостаточной помехоустойчивости прототипа при распознавании новых протоколов НСКР и недостаточной информативности используемого набора признаков для описания образа входной реализации при малом объеме исследуемого информационного потока у, представленного только вектором МО m0.The use of the prototype method for recognizing NSCR protocols under conditions of a large number of errors (more than 10% of the total number of bits) in the studied digital streams obtained by encoding speech messages using known NSCR protocols, causes the appearance of the results of calculating the probability of correct recognition in the form of uncertainty P ji = 0/0 for all j, l. Similar results take place with fewer bit errors if K <100. This indicates insufficient noise immunity of the prototype when recognizing new NSCR protocols and insufficient information content of the used set of features to describe the image of the input implementation with a small volume of the investigated information flow y, represented only by the vector MO m 0 .
Частным случаем является начало работы системы распознавания (начальный режим), при котором отмечается отсутствие эталонных описаний протоколов НСКР. Возникает необходимость в принятии решения о принадлежности входной реализации у к классу j=1 по результатам анализа параметров автокорреляционной функции а, формировании 1-го эталонного описания и дальнейшему сравнению с полученным эталонным описанием других входных реализаций.A special case is the beginning of the recognition system operation (initial mode), in which the absence of reference descriptions of the NSCR protocols is noted. There is a need to make a decision on whether the input realization y belongs to the class j = 1 based on the results of the analysis of the parameters of the autocorrelation function a, the formation of the 1st reference description and further comparison with the obtained reference description of other input implementations.
В общем случае (включающем режим обучения) факт применения нового протокола НСКР необходимо установить при отсутствии его эталонного описания и произвести обучение системы распознавания на основе одной полученной реализации бинарного цифрового информационного потока у, что автоматически выполняется при решении в пользу нового протокола НСКР.In the general case (including the training mode), the fact of using the new NSCR protocol must be established in the absence of its reference description and the recognition system must be trained on the basis of one obtained implementation of the binary digital information flow y, which is automatically performed when deciding in favor of the new NSCR protocol.
Положительный эффект в предлагаемом способе достигается за счет увеличения размерности данных для описания образа входной реализации, представляемых в виде квадратной матрицы М значений МО и соответствующих ковариационных матриц Сl, использованием более информативной меры различения, в качестве которой выступает дивергенция. Последняя позволяет сравнивать образ входной реализации увеличенной размерности с эталонными описаниями, в следствие чего обеспечивается повышение вероятности правильного распознавания новых протоколов НСКР. Кроме того, уменьшение влияния уровня битовых ошибок во входном цифровом информационном потоке у и значений его объема К на качество распознавания новых протоколов НСКР достигается введением дополнительной градации «Принадлежность реализации не установлена» в критерий принятия решения. В результате образы входных реализаций, имеющие по различным причинам существенные искажения, не признаются новыми, что существенно снижает вероятность ложной тревоги при распознавании новых протоколов НСКР.A positive effect in the proposed method is achieved by increasing the dimension of the data to describe the image of the input implementation, represented in the form of a square matrix M of MO values and the corresponding covariance matrices C1 , using a more informative measure of discrimination, which is divergence. The latter allows comparing the image of the input implementation of increased dimension with the reference descriptions, as a result of which the probability of correct recognition of new NSCR protocols is increased. In addition, a decrease in the influence of the level of bit errors in the input digital information stream y and the values of its volume K on the recognition quality of new NSCR protocols is achieved by introducing an additional gradation "Implementation ownership is not established" in the decision criterion. As a result, the images of input implementations, which for various reasons have significant distortions, are not recognized as new, which significantly reduces the probability of false alarms when recognizing new NSCR protocols.
Реализация заявленного способа может быть осуществлена следующим образом (см. Фиг. 3). На этапе ввода исходных данных целесообразно определить значения параметров ΔT, Nцп цифрового информационного потока у, длительность интервала анализа у и/или емкость анализируемого потока у соответственно, сформировать совокупность {Nб}, включающую все возможные значения этого параметра, в общем случае - ввести эталонные описания J известных протоколов НСКР, включающие совокупности {mj эт}J, {Cj эт}J, в частном случае - установить параметр J=0.The implementation of the claimed method can be carried out as follows (see Fig. 3). At the stage of inputting the initial data, it is advisable to determine the values of the parameters ΔT, N cp of the digital information stream y, the duration of the analysis interval y and / or the capacity of the analyzed stream y, respectively, to form a set {N b }, including all possible values of this parameter, in the general case - to enter reference descriptions J of known NSCR protocols, including the sets {m j et } J, {C j et } J , in a particular case - set the parameter J = 0.
После этого вычисляют нормированную автокорреляционную функцию а, которая характеризует линейную зависимость исходной последовательности у от последовательности у(τ), сдвинутой циркулярно на τ=1, 2, …, Nцп - 1 бит по отношению к у. Нормированная автокорреляционная функция а цифрового потока, содержащего речевое сообщение, имеет явно выраженные локальные максимумы, расположенные с периодичностью Δτ. Наличие локальных максимумов автокорреляционной функции, расположенных с периодом Δτ, объясняется тем, что информационные символы, описывающие параметры цифрового потока с речевым сообщением, расположены внутри информационного блока строго в определенных местах, на интервалах Δτ, кратных длине информационного блока. Параметры речевого сигнала обладают значительной линейной зависимостью, поэтому значение АКФ в этих точках будет наибольшим. Искомой автокорреляционной функцией считают совокупность значений видаAfter that, the normalized autocorrelation function a is calculated, which characterizes the linear dependence of the original sequence y on the sequence y (τ), shifted circularly by τ = 1, 2, ..., N cp - 1 bit with respect to y. The normalized autocorrelation function a of a digital stream containing a speech message has pronounced local maxima located with a periodicity of Δτ. The presence of local maxima of the autocorrelation function, located with a period of Δτ, is explained by the fact that information symbols describing the parameters of a digital stream with a voice message are located inside the information block strictly in certain places, at intervals Δτ, which are multiples of the length of the information block. The parameters of the speech signal have a significant linear relationship, so the ACF value at these points will be the largest. The sought autocorrelation function is considered to be a set of values of the form
где а(τ)=c(τ)/d(y) - коэффициент корреляции; с(τ) - коэффициент ковариации; d(y) - дисперсия цифрового информационного потока у.where a (τ) = c (τ) / d (y) is the correlation coefficient; с (τ) - covariance coefficient; d (y) is the variance of the digital information stream y.
По регулярным с равными интервалами Δτ=Nб экстремумам нормированной автокорреляционной функции а принимают решение о наличии блочной структуры в информационном потоке у. Отсутствие экстремумов нормированной автокорреляционной функции а с равными интервалами Δτ свидетельствует о том, что цифровой информационный поток у не содержит речевое сообщение, а выполнение его анализа завершается выводом результата о том, что входная реализация у не содержит речевое сообщение, а выполнение его анализа завершается выводом результата о том, что входная реализация у не содержит речевое сообщение.By regular with equal intervals Δτ = N b extrema of the normalized autocorrelation function a, a decision is made on the presence of a block structure in the information flow y. The absence of extrema of the normalized autocorrelation function a with equal intervals Δτ indicates that the digital information stream y does not contain a speech message, and its analysis ends with the output of a result that the input implementation y does not contain a speech message, and its analysis ends with the output of the result that the input implementation y does not contain a speech message.
При наличии экстремумов нормированной автокорреляционной функции а с равными интервалами Δτ вычисляют количество информационных блоков, содержащихся в цифровом информационном потоке у следующим образом:In the presence of extrema of the normalized autocorrelation function a with equal intervals Δτ, the number of information blocks contained in the digital information stream y is calculated as follows:
где - оператор округления величины до меньшего целого значения.Where - operator of rounding of a value to a smaller integer value.
Делят информационный поток у на информационные блоки объемом Nб бит каждый. Последовательно присваивают информационным блокам порядковые номера k=1, 2, …, K, начиная с первого информационного блока. Формируют прямоугольную информационную матрицу Y, строками которой являются последовательно размещенные друг под другом информационные блоки в соответствии с их порядковыми номерами k=1, 2, …, K.Divide the information flow from information blocks on a volume N b bits each. The information blocks are sequentially assigned sequence numbers k = 1, 2, ..., K, starting from the first information block. A rectangular information matrix Y is formed, the rows of which are information blocks sequentially placed one under the other in accordance with their ordinal numbers k = 1, 2, ..., K.
Из информационной матрицы Y выделяют столбцы yz. Проверяют условие J≥1 (т.е. наличие хотя бы одного эталонного описания), устанавливающее возможность введения режима обучения. Columns y z are separated from the information matrix Y. The condition J≥1 is checked (i.e., the presence of at least one reference description), which establishes the possibility of introducing the learning mode.
Если условие J≥1 не выполняется (это частный случай - начальный режим), то с помощью известных выражений (см. Аладинский В.А., Кузьминский С.В. Метод формирования признаков распознавания протоколов низкоскоростного кодирования речи / Наукоемкие технологии. - М.: Радиотехника. №12, 2015. - С. 20-25) определяют значения МО mz по столбцам yz. Из набора значений МО формируют вектор значений математического ожидания вида m0=(m1, m2, …, mz, …, mL) размера L. На основе прямоугольной информационной матрицы Y вычисляют квадратную ковариационную матрицу С0 (см. там же). Далее формируют эталонное описание, которому присваивают порядковый номер j=1, и в этом случае m0=m1 эт, С0=C1 эт.If the condition J≥1 is not met (this is a special case - the initial mode), then using well-known expressions (see Aladinsky V.A., Kuzminsky S.V. : Radio engineering. No. 12, 2015. - S. 20-25) determine the values of MO m z by the columns y z . From the set of MO values, a vector of values of the mathematical expectation of the form m 0 = (m 1 , m 2 , ..., m z , ..., m L ) of size L is formed. On the basis of a rectangular information matrix Y, a square covariance matrix C 0 is calculated (see ibid. ). Next, a reference description is formed, which is assigned a serial number j = 1, and in this case m 0 = m 1 floor , C 0 = C 1 floor .
При выполнении условия J≥1 также определяют значения МО mz, формируют вектор значений математического ожидания вида m0, квадратную матрицу М=(m0, m1, …, ml, …, mL-1) размеров L, содержащую строки ml, получаемые на основе циркулярного сдвига элементов вектора m0 (см. фиг. 2). Формируют совокупность прямоугольных матриц {Yl}L={Y0, Y1, …, Yl, …, YL-1}, у которых столбцы сдвинуты циркулярно на l=0, 1, 2, …, L-1 относительно столбцов прямоугольной информационной матрицы Y. По каждой матрице Yl из совокупности {Yl}z, вычисляют квадратные ковариационные матрицы Cl.When the condition J≥1 is fulfilled, the values of MO m z are also determined, a vector of values of the mathematical expectation of the form m 0 , a square matrix M = (m 0 , m 1 , ..., m l , ..., m L-1 ) of sizes L, containing rows m l obtained on the basis of the circular shift of the elements of the vector m 0 (see Fig. 2). A set of rectangular matrices {Y l } L = {Y 0 , Y 1 , ..., Y l , ..., Y L-1 } is formed, whose columns are shifted circularly by l = 0, 1, 2, ..., L-1 with respect to columns of the rectangular information matrix Y. For each matrix Y l from the collection {Y l } z, calculate the square covariance matrices C l .
Определяют значения дивергенции vjl между образом входной реализации, представляемым соответствующими векторами ml и квадратными ковариационными матрицами Cl, и j-м эталонным описанием. Последний представляется вектором mj эт и соответствующей эталонной ковариационной матрицей Cj эт. В общем случае выявление нового протокола предполагает выполнение условий ml≠mj и Cl≠Cj, то дивергенция, характеризующая разделяющую поверхность образа и эталонного описания, вычисляется по формуле вида (см. Ту Дж., Гонсалес Р. Принципы распознавания образов / Пер. с англ. - М.: Мир, 1978. - 411 с.)The values of the divergence v jl between the image of the input implementation, represented by the corresponding vectors m l and square covariance matrices C l , and the j-th reference description are determined. The latter is represented by the vector m j et and the corresponding reference covariance matrix C j et . In the general case, the identification of a new protocol assumes the fulfillment of the conditions m l ≠ m j and C l ≠ C j , then the divergence characterizing the separating surface of the image and the reference description is calculated using a formula of the form (see Tu J., Gonzalez R. Principles of pattern recognition / Per. From English .-- M .: Mir, 1978 .-- 411 p.)
где - след матрицы S размеров Z; - след матрицы В размеров Z; azz, bzz - элементы диагоналей матриц S и В соответственно;Where - trace of the matrix S of dimensions Z; - trace of the matrix B of dimensions Z; a zz , b zz are the elements of the diagonals of the matrices S and B, respectively;
Из полученного набора значений vjl для удобства дальнейшего анализа формируют матрицу значений дивергенции V размеров J×L. Сравнивают значение каждого элемента vjl матрицы V с пороговым значением vпор=2000.From the obtained set of values v jl, for the convenience of further analysis, a matrix of divergence values V of sizes J × L is formed. The value of each element v jl of the matrix V is compared with the threshold value v pore = 2000.
Если для всех элементов vjl матрицы V выполняется условие vjl>vпор, то принимают решение об обнаружении нового протокола НСКР и присваивают условный номер J-J+1 новому эталонному описанию, которое включает вектор математического ожидания m(j+1)эт=m0 и квадратную эталонную ковариационную матрицу С(J+1)эт=С0. Выводят сообщение «Новый J+1 протокол НСКР». При невыполнении данного условия и если выполняется условие vjl<300 только для одного элемента матрицы V, а остальные vjl>vпор=2000, то принимают решение, что входная реализация у сформирована по j-му известному протоколу НСКР и в информационном потоке у отсутствуют начальные l бит в первом k=1 информационном блоке. При необходимости проводят дообучение системы распознавания, осуществляют коррекцию j-го эталонного описания mj эт, Cj эт. Выводят сообщение «Неполный первый блок входных данных, j-й протокол НСКР».If all elements v jl matrix V satisfies the condition v jl> v then, a decision is made about the discovery of a new protocol NCIS and assigned identification number J-J + 1 new reference description that includes the expectation vector m (j + 1) fl = m 0 and a square reference covariance matrix C (J + 1) et = C 0 . The message "New J + 1 NSCR protocol" is displayed. If this condition is not met and if the condition v jl <300 is satisfied only for one element of the matrix V, and the remaining v jl > v pores = 2000, then it is decided that the input implementation y is formed according to the j-th known NSCR protocol and in the information flow y there are no initial l bits in the first k = 1 information block. If necessary, additional training of the recognition system is carried out, the j-th reference description is corrected m j et , C j et . The message "Incomplete first block of input data, j-th NSCR protocol" is displayed.
В других случаях, когда справедливо 300≤vjl≤2000 для всех элементов матрицы V, считают, что входная реализация у не может быть отнесена к какому-либо j-му известному протоколу НСКР или новому протоколу НСКР, выводят сообщение «Принадлежность входной реализации не установлена».In other cases, when 300≤v jl ≤2000 is true for all elements of the matrix V, it is considered that the input implementation y cannot be attributed to any j-th known NSCR protocol or the new NSCR protocol, the message “The input implementation does not belong to installed ".
Имитационное моделирование заявленного способа распознавания протоколов НСКР выполнено с использованием цифровых информационных потоков, сформированных на основе известных протоколов LPC-10-2400 (STANAG 4197), условный класс j=1, MELPe-2400 (STANAG 4591), j=2, применяемых на линиях радиосвязи диапазона высоких частот, и цифровых информационных потоков, сформированных программным способом вокодером вида MELP-240Q по протоколу НСКР с номером класса j=3, который рассматривается как новый, показало следующее. Принятое пороговое значение Dp=70% достигается на основе предлагаемого способа при значениях K=82, в то время как способ-прототип обеспечивает удовлетворение этого требования при K=124. Достоверность Dp распознавания предлагаемым способом при значениях K≥82 выше, чем при использовании прототипа на величину от (11 до 55)%, что подтверждает эффективность предлагаемых технических решений в условиях малого объема исследуемых цифровых информационных потоков.Simulation modeling of the claimed method for recognizing NSCR protocols is performed using digital information streams formed on the basis of the well-known protocols LPC-10-2400 (STANAG 4197), conditional class j = 1, MELPe-2400 (STANAG 4591), j = 2, used on the lines radio communications of the high frequency range, and digital information streams, generated by the software by the MELP-240Q vocoder according to the NSCR protocol with the class number j = 3, which is considered new, showed the following. The accepted threshold value D p = 70% is achieved on the basis of the proposed method at values of K = 82, while the prototype method ensures the satisfaction of this requirement at K = 124. The reliability D p of recognition by the proposed method at values of K≥82 is higher than when using the prototype by an amount from (11 to 55)%, which confirms the effectiveness of the proposed technical solutions in a small volume of the investigated digital information flows.
Сравнение помехозащищенности предлагаемого способа и способа-прототипа также выполнено на основе имитационного моделирования при K≥100, битовые ошибки в цифровые информационные потоки вносились по случайному закону с равномерной вероятностью появления ошибки, что соответствует современным условиям формирования дискретных сигналов передачи речевых сообщений, когда используется помехоустойчивое кодирование, перемежение и скремблирование цифровых информационных потоков до передачи сигнала в канал радиосвязи. Принятое максимальное значение вероятности Рош_мах=15% соответствует значению, при котором еще возможно восстановление речевого сигнала. В результате установлено, что разработанный способ распознавания новых протоколов НСКР обеспечивает меньшую вероятность ложной тревоги Рош при равном значении вероятности битовой ошибки Рош в цифровом информационном потоке у (см. Фиг. 5) на величину от (2 до 25) %, чем при использовании способа-прототипа, условие Рлт≤30%, являющееся граничным, для прототипа выполняется при Рош≤10%, в то же время для предлагаемого способа - при Рош≤14%, что свидетельствует о его лучшей помехозащищенности по сравнению с прототипом.Comparison of noise immunity of the proposed method and the prototype method is also made on the basis of simulation at K≥100, bit errors were introduced into digital information streams according to a random law with a uniform error probability, which corresponds to modern conditions for the formation of discrete signals for the transmission of speech messages when noise-immune coding is used , interleaving and scrambling of digital information streams prior to signal transmission to the radio communication channel. The accepted maximum value of the probability P osh_max = 15% corresponds to the value at which the recovery of the speech signal is still possible. As a result, it was found that the developed method for recognizing new NSCR protocols provides a lower probability of a false alarm P osh with an equal value of the probability of a bit error P osh in a digital information stream y (see Fig. 5) by an amount from (2 to 25)% than with using the prototype method, the condition P lt ≤30%, which is the boundary, is fulfilled for the prototype at P osh ≤10%, at the same time for the proposed method - at P osh ≤14%, which indicates its better noise immunity compared to the prototype ...
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2020129303A RU2748935C1 (en) | 2020-09-03 | 2020-09-03 | Method of recognition of new low bit rate coding protocols |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2020129303A RU2748935C1 (en) | 2020-09-03 | 2020-09-03 | Method of recognition of new low bit rate coding protocols |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2748935C1 true RU2748935C1 (en) | 2021-06-01 |
Family
ID=76301324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2020129303A RU2748935C1 (en) | 2020-09-03 | 2020-09-03 | Method of recognition of new low bit rate coding protocols |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2748935C1 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040138888A1 (en) * | 2003-01-14 | 2004-07-15 | Tenkasi Ramabadran | Method and apparatus for speech reconstruction within a distributed speech recognition system |
US20060262876A1 (en) * | 2004-08-26 | 2006-11-23 | Ladue Christoph K | Wave matrix mechanics method & apparatus |
US8588073B2 (en) * | 1999-09-20 | 2013-11-19 | Broadcom Corporation | Voice and data exchange over a packet based network |
RU2610285C1 (en) * | 2016-02-15 | 2017-02-08 | федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации | Method of detecting low-rate encoding protocols |
RU2667462C1 (en) * | 2017-10-24 | 2018-09-19 | федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации | Method of recognizing low-speed speech coding protocols |
-
2020
- 2020-09-03 RU RU2020129303A patent/RU2748935C1/en active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8588073B2 (en) * | 1999-09-20 | 2013-11-19 | Broadcom Corporation | Voice and data exchange over a packet based network |
US20040138888A1 (en) * | 2003-01-14 | 2004-07-15 | Tenkasi Ramabadran | Method and apparatus for speech reconstruction within a distributed speech recognition system |
US20060262876A1 (en) * | 2004-08-26 | 2006-11-23 | Ladue Christoph K | Wave matrix mechanics method & apparatus |
RU2610285C1 (en) * | 2016-02-15 | 2017-02-08 | федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации | Method of detecting low-rate encoding protocols |
RU2667462C1 (en) * | 2017-10-24 | 2018-09-19 | федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации | Method of recognizing low-speed speech coding protocols |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4081607A (en) | Keyword detection in continuous speech using continuous asynchronous correlation | |
US5182773A (en) | Speaker-independent label coding apparatus | |
US20130054236A1 (en) | Method for the detection of speech segments | |
CN112634875B (en) | Voice separation method, voice separation device, electronic device and storage medium | |
CN108305619B (en) | Voice data set training method and device | |
CN103400577A (en) | Acoustic model building method and device for multi-language voice identification | |
CN109525607B (en) | Anti-attack detection method and device and electronic equipment | |
CN110102051B (en) | Method and device for detecting game plug-in | |
CN110164454B (en) | Formant deviation-based audio identity discrimination method and device | |
CN113206808B (en) | Channel coding blind identification method based on one-dimensional multi-input convolutional neural network | |
US7996213B2 (en) | Method and apparatus for estimating degree of similarity between voices | |
RU2748935C1 (en) | Method of recognition of new low bit rate coding protocols | |
GB2600178A (en) | RF fingerprint signal processing device and rf fingerprint signal processing method | |
CN114143040A (en) | Confrontation signal detection method based on multi-channel feature reconstruction | |
CN111079559A (en) | Convolutional neural network-based mud pulse signal identification method | |
EP0690634A1 (en) | Detection of tones while minimizing incorrect identification | |
RU2667462C1 (en) | Method of recognizing low-speed speech coding protocols | |
US6674855B1 (en) | High performance multifrequency signal detection | |
EP1424684A1 (en) | Voice activity detection apparatus and method | |
CN116013362A (en) | Method and device for determining fault type, computer equipment and readable storage medium | |
CN112989106B (en) | Audio classification method, electronic device and storage medium | |
CN111081221B (en) | Training data selection method and device, electronic equipment and computer storage medium | |
RU2757860C1 (en) | Method for automatically assessing the quality of speech signals with low-rate coding | |
Li et al. | Advanced RawNet2 with Attention-based Channel Masking for Synthetic Speech Detection | |
CN110097893B (en) | Audio signal conversion method and device |