RU2780710C1 - Method, system, and apparatus for processing sample data - Google Patents
Method, system, and apparatus for processing sample data Download PDFInfo
- Publication number
- RU2780710C1 RU2780710C1 RU2021114965A RU2021114965A RU2780710C1 RU 2780710 C1 RU2780710 C1 RU 2780710C1 RU 2021114965 A RU2021114965 A RU 2021114965A RU 2021114965 A RU2021114965 A RU 2021114965A RU 2780710 C1 RU2780710 C1 RU 2780710C1
- Authority
- RU
- Russia
- Prior art keywords
- data
- vector
- matrix
- fault
- level
- Prior art date
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 145
- 230000000875 corresponding Effects 0.000 claims abstract description 17
- 238000006243 chemical reaction Methods 0.000 claims abstract description 6
- 238000010801 machine learning Methods 0.000 claims description 33
- 230000001131 transforming Effects 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000003745 diagnosis Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 230000003287 optical Effects 0.000 description 32
- 238000003672 processing method Methods 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 10
- 238000000034 method Methods 0.000 description 8
- 239000000203 mixture Substances 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 230000011664 signaling Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006011 modification reaction Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 210000004556 Brain Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000004059 degradation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 230000001537 neural Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003442 weekly Effects 0.000 description 1
Images
Abstract
Description
Область техникиTechnical field
Настоящее изобретение относится к области техники, представляющей собой связь, в частности к способу, системе и устройству для обработки выборочных данных.The present invention relates to the field of communication, in particular to a method, system and apparatus for processing sample data.
Уровень техникиState of the art
Если текущий показатель рабочих характеристик оборудования оптической сети превышает предельный уровень или если происходит ухудшение некоторых потенциальных рабочих характеристик, генерируется серия данных аварийной сигнализации, которые передаются на сетевую административную платформу. В случае неисправности оборудования оптической сети генерируются и передаются как данные аварийной сигнализации, так и данные о неисправности. В настоящее время специалисты по эксплуатации и техобслуживанию осуществляют локацию неисправности и реализуют стратегию устранения неисправности путем анализа данных аварийной сигнализации и данных о неисправностях посредством административной платформы и платформы управления и при необходимости активируют защитную коммутацию для обеспечения нормальной работы оптической сети.If the current performance of the optical network equipment exceeds the limit, or if some potential performance degradation occurs, a series of alarm data is generated and transmitted to the network management platform. In the event of a failure of the optical network equipment, both alarm data and fault data are generated and transmitted. At present, the operation and maintenance specialists are locating the fault and implementing the troubleshooting strategy by analyzing the alarm and fault data through the administration platform and the management platform, and if necessary, activate the protection switching to ensure the normal operation of the optical network.
С непрерывным ростом масштаба оптических сетей и увеличением количества оборудования оптических сетей растет объем данных аварийной сигнализации и данных о неисправностях, генерируемых оптическими сетями. Локация и устранение сетевых неисправностей становятся все более и более сложными и трудоемкими. Традиционный режим обработки неисправностей сопряжен с огромными проблемами и сложен с точки зрения удовлетворения текущих потребностей. В частности, в условиях быстрой разработки сервисов связи и непрерывного развития и изменения технологий связи, общей тенденцией становится переход от традиционного жесткого соединения и жесткой сетевой архитектуры к нежесткому соединению и гибкой сетевой архитектуре на основе облака. Нижний уровень облачной сети реализует продвижение данных посредством оборудования оптической сети, а средний и верхний уровни реализуют администрирование и управление ресурсами и сервисами посредством платформы управления, административной платформы и платформы оркестрации. Процесс эксплуатации и техобслуживания системы является более сложным, что необходимо для реализации представления объединения сетевых данных и эффективного извлечения операций над данными и их вычислений, чтобы решить проблему сложности быстрого восстановления облачной сети после возникновения неисправностей.With the continuous growth in the scale of optical networks and the increase in the number of optical network equipment, the amount of alarm data and fault data generated by optical networks is growing. Locating and troubleshooting network problems is becoming more and more complex and time consuming. The traditional fault handling mode is fraught with enormous challenges and is difficult to meet current needs. In particular, with the rapid development of communication services and the continuous development and change of communication technologies, the general trend is to move from the traditional hard connection and hard network architecture to the soft connection and flexible cloud-based network architecture. The lower layer of the cloud network implements data forwarding through the optical network equipment, and the middle and upper layers implement the administration and management of resources and services through the management platform, administrative platform, and orchestration platform. The operation and maintenance process of the system is more complex, which is necessary to realize the network data federation view and efficiently extract data operations and calculations, so as to solve the problem of the difficulty of quickly recovering the cloud network after a failure occurs.
Использование технологии искусственного интеллекта для анализа и устранения сетевых неисправностей является эффективным решением указанных проблем. Однако, с одной стороны, все из существующих данных аварийной сигнализации, данных о неисправностях и конфигурационных данных, ориентированных на специалистов по эксплуатации и техобслуживанию, содержат различные типы полей, такие как время начала аварийной сигнализации, тип сетевого элемента и количество ядер центрального процессора (central processing unit, CPU). Эти гетерогенные данные не могут непосредственно использоваться в качестве выборочных данных, ориентированных на машинное обучение; с другой стороны, вследствие огромного количества сетевых данных, различий между сетями различных типов и так далее, требуемые выборочные данные не могут быть гибко извлечены в соответствии с нуждами машинного обучения. Следовательно, существует насущная необходимость в гибких и эффективных способах обработки выборочных данных, чтобы удовлетворить потребности тестирования и анализа модели машинного обучения.The use of artificial intelligence technology to analyze and eliminate network faults is an effective solution to these problems. However, on the one hand, all of the existing alarm data, fault data, and configuration data targeted at O&M professionals contain different types of fields, such as alarm start time, network element type, and number of central processor cores (central processing unit, CPU). These heterogeneous data cannot be directly used as machine learning focused sample data; on the other hand, due to the huge amount of network data, differences between different types of networks, and so on, the required sample data cannot be flexibly extracted according to the needs of machine learning. Therefore, there is an urgent need for flexible and efficient ways to process sample data in order to meet the testing and analysis needs of a machine learning model.
Раскрытие сущности изобретенияDisclosure of the essence of the invention
Задача настоящего изобретения состоит в создании таких способа, системы и устройства для обработки выборочных данных, которые обеспечивали бы преобразование конфигурационных данных, данных аварийной сигнализации и данных о неисправностях, ориентированных на специалистов по эксплуатации и техобслуживанию, в выборочные данные, ориентированные на машинное обучение, повышали бы эффективность сохранения выборочных данных и обеспечивали бы достижение междоменного взаимодействия выборочных данных и обмена ими между разными производителями.The object of the present invention is to provide a sample data processing method, system and apparatus that converts configuration data, alarm data and fault data oriented to operations and maintenance specialists into machine learning oriented sample data, improves would be the efficiency of storing sample data and would ensure the achievement of cross-domain interaction of sample data and their exchange between different producers.
В первом аспекте, в варианте осуществления настоящего изобретения предложен способ обработки выборочных данных, включающий этапы, на которых:In a first aspect, in an embodiment of the present invention, a method for processing sample data is provided, comprising the steps of:
получают из базы данных данные аварийной сигнализации, данные о неисправностях и конфигурационные данные по меньшей мере одной целевой сети за множество моментов времени и соответственно преобразуют их в соответствующие векторы; иreceiving from the database alarm data, fault data and configuration data of at least one target network for a plurality of time points and accordingly convert them into the corresponding vectors; and
строят для по меньшей мере одной целевой сети многоуровневое многоразмерное пространство, содержащее уровень данных аварийной сигнализации, уровень данных о неисправностях и уровень конфигурационных данных каждой целевой сети, причем каждый уровень представляет собой двумерную матрицу, имеющую один и тот же размер, и выполнен с возможностью сохранения векторов, полученных в результате преобразования, в строках в соответствии последовательностью моментов времени.building for at least one target network a multi-level multi-dimensional space containing an alarm data level, a fault data level and a configuration data level of each target network, each level is a two-dimensional matrix having the same size, and is configured to save vectors obtained as a result of the transformation, in rows according to the sequence of time points.
В сочетании с первым аспектом, в первом альтернативном варианте осуществления способ дополнительно включает этап, на котором извлекают входной вектор модели машинного обучения из уровня данных аварийной сигнализации и уровня данных о неисправностях, и извлекают выходной вектор модели машинного обучения из уровня конфигурационных данных.In combination with the first aspect, in the first alternative embodiment, the method further includes extracting the machine learning model input vector from the alarm data layer and the fault data layer, and extracting the machine learning model output vector from the configuration data layer.
В первом альтернативном варианте осуществления по первому аспекту, последовательно выполняют развертывание режима и развертывание строкового вектора на уровне данных аварийной сигнализации и уровне данных о неисправностях для получения входного вектора; и последовательно выполняют развертывание режима и развертывание строкового вектора на уровне конфигурационных данных для получения выходного вектора.In the first alternative embodiment of the first aspect, sequentially performing mode expansion and string vector expansion on the alarm data layer and the fault data layer to obtain an input vector; and successively performing mode expansion and string vector expansion at the configuration data level to obtain an output vector.
Во втором альтернативном варианте осуществления по первому аспекту, извлекают подпространство, содержащее целевые данные, из многоуровневого многоразмерного пространства, причем указанное подпространство содержит по меньшей мере одну подматрицу уровня данных аварийной сигнализации, уровня данных о неисправностях и уровня конфигурационных данных; иIn a second alternative embodiment according to the first aspect, a subspace containing target data is extracted from a multi-level multi-dimensional space, said sub-space containing at least one sub-matrix of an alarm data level, a fault data level, and a configuration data level; and
последовательно выполняют развертывание режима и развертывание строкового вектора на указанном подпространстве для получения входного вектора и/или выходного вектора.sequentially performing mode expansion and string vector expansion on the specified subspace to obtain an input vector and/or an output vector.
В необязательном варианте осуществления получают указанное подпространство после сегментирования многоуровневого многоразмерного пространства посредством оператора подпространственного сегментирования;In an optional embodiment, the specified subspace is obtained after segmenting the multilevel multidimensional space by means of a subspace segmentation operator;
выполняют развертывание строкового вектора на матрице развертывания режима посредством первого оператора развертывания режима для получения входного вектора; и/или выполняют развертывание строкового вектора на матрице развертывания режима посредством второго оператора развертывания режима для получения выходного вектора.performing a string vector expansion on the mode expansion matrix by means of the first mode expansion operator to obtain an input vector; and/or performing a string vector expansion on the mode expansion matrix via the second mode expansion operator to obtain an output vector.
В сочетании с третьим альтернативным вариантом осуществления по первому аспекту, сохраняют векторы, полученные в результате преобразования, в строках двумерной пустой матрицы в соответствии с последовательностью указанных моментов времени так, чтобы получить матрицу аварийной сигнализации, матрицу неисправностей и конфигурационную матрицу каждой соответствующей целевой сети;In combination with the third alternative embodiment of the first aspect, storing the vectors resulting from the transformation in the rows of a two-dimensional empty matrix in accordance with the sequence of specified times so as to obtain an alarm matrix, a fault matrix and a configuration matrix of each respective target network;
соответственно сохраняют матрицу аварийной сигнализации, матрицу неисправностей и конфигурационную матрицу на уровне данных аварийной сигнализации, уровне данных о неисправностях и уровне конфигурационных данных многоуровневого многоразмерного пространства и заполняют матричные элементы, не имеющие сохраненных значений, на каждом уровне нулевыми значениями.respectively storing the alarm matrix, the fault matrix, and the configuration matrix in the alarm data layer, the fault data layer, and the configuration data layer of the multi-level multi-dimensional space, and filling the matrix elements having no stored values at each level with zero values.
В сочетании с четвертым альтернативным вариантом осуществления, вектор, полученный в результате преобразования, представляет собой адамарово произведение основного вектора и вектора размерного расширения, причем каждый элемент основного вектора представляет собой значение поля в данных аварийной сигнализации, данных о неисправностях или конфигурационных данных в некоторый момент времени, и каждый элемент вектора размерного расширения представляет собой результат кратного расширения или сжатия соответствующего элемента основного вектора.In combination with the fourth alternative, the vector resulting from the transformation is the Hadamard product of the main vector and the dimensional extension vector, with each element of the main vector representing the value of a field in the alarm data, fault data, or configuration data at some point in time. , and each element of the dimensional expansion vector is the result of a multiple expansion or contraction of the corresponding element of the main vector.
Во втором аспекте, в качестве варианта осуществления настоящего изобретения предложена система обработки выборочных данных, содержащая:In a second aspect, as an embodiment of the present invention, there is provided a sample data processing system comprising:
преобразовательный модуль, который выполнен с возможностью получения данных аварийной сигнализации, данных о неисправностях и конфигурационных данных по меньшей мере одной целевой сети за множество моментов времени из базы данных и их преобразования соответствующим образом в соответствующие векторы;a conversion module that is configured to receive alarm data, fault data, and configuration data of at least one target network over a plurality of time points from the database and convert them appropriately into appropriate vectors;
модуль построения пространства, который выполнен с возможностью построения, для по меньшей мере одной целевой сети, многоуровневого многоразмерного пространства, содержащего уровень данных аварийной сигнализации, уровень данных о неисправностях и уровень конфигурационных данных каждой целевой сети, причем каждый уровень представляет собой двумерную матрицу, имеющую один и тот же размер, и выполнен с возможностью сохранения векторов, полученных в результате преобразования, в строках в соответствии с последовательностью моментов времени.a space building module that is configured to build, for at least one target network, a multi-level multi-dimensional space containing an alarm data layer, a fault data layer, and a configuration data layer of each target network, each layer being a two-dimensional matrix having one and the same size, and is configured to store the vectors obtained as a result of the transformation in rows in accordance with the sequence of time points.
В сочетании со вторым аспектом, в первом альтернативном варианте осуществления система дополнительно содержит:In combination with the second aspect, in the first alternative embodiment, the system further comprises:
модуль извлечения, который выполнен с возможностью извлечения входного вектора модели машинного обучения из уровня данных аварийной сигнализации и уровня данных о неисправностях и извлечения выходного вектора модели машинного обучения из уровня конфигурационных данных.an extractor that is configured to extract the input vector of the machine learning model from the alarm data layer and the fault data layer, and extract the output vector of the machine learning model from the configuration data layer.
В первом альтернативном варианте осуществления по второму аспекту модуль извлечения содержит;In the first alternative embodiment according to the second aspect, the extraction module comprises;
блок подматричной обработки, который выполнен с возможностью извлечения подпространства, содержащего целевые данные, из многоуровневого многоразмерного пространства, причем указанное подпространство содержит по меньшей мере одну подматрицу уровня данных аварийной сигнализации, уровня данных о неисправностях и уровня конфигурационных данных;a sub-matrix processing unit that is configured to retrieve a sub-space containing target data from a multi-level multi-dimensional space, said sub-space containing at least one sub-matrix of an alarm data level, a fault data level, and a configuration data level;
блок матричных вычислений, который выполнен с возможностью последовательного выполнения развертывания режима и развертывания строкового вектора на уровне данных аварийной сигнализации и уровне данных о неисправностях для получения входного вектора; последовательного выполнения развертывания режима и развертывания строкового вектора на уровне конфигурационных данных для получения выходного вектора и последовательного выполнения развертывания режима и развертывания строкового вектора на указанном подпространстве для получения входного вектора и/или выходного вектора.a matrix calculation unit that is configured to sequentially perform mode expansion and string vector expansion at the alarm data layer and the fault data layer to obtain an input vector; sequentially performing mode expansion and string vector expansion at the configuration data level to obtain an output vector; and sequentially performing mode expansion and string vector expansion on the specified subspace to obtain an input vector and/or output vector.
В сочетании со вторым аспектом, во втором альтернативном варианте осуществления модуль построения содержит:In combination with the second aspect, in a second alternative embodiment, the build module comprises:
блок предварительной матричной обработки, который выполнен с возможностью сохранения векторов, полученных в результате преобразования, с одним и тем же источником данных в строках двумерной пустой матрицы в соответствии с указанной последовательностью моментов времени так, чтобы получить матрицу аварийной сигнализации, матрицу неисправностей и конфигурационную матрицу каждой целевой сети соответственно;a matrix pre-processing unit that is configured to store the vectors obtained as a result of the transformation with the same data source in the rows of a two-dimensional empty matrix in accordance with a specified sequence of time points so as to obtain an alarm matrix, a fault matrix and a configuration matrix of each target network respectively;
блок построения матрицы, который выполнен с возможностью сохранения соответственно матрицы аварийной сигнализации, матрицы неисправностей и конфигурационной матрицы на уровне данных аварийной сигнализации, уровне данных о неисправностях и уровне конфигурационных данных многоуровневого многоразмерного пространства и заполнения матричных элементов, не имеющих сохраненных значений, на каждом уровне нулевыми значениями.a matrix building unit that is configured to store an alarm matrix, a fault matrix, and a configuration matrix, respectively, at the alarm data level, the fault data level, and the configuration data level of the multi-level multi-dimensional space and fill the matrix elements that do not have stored values at each level with zeros values.
В третьем аспекте, в варианте осуществления настоящего изобретения предложено устройство для обработки сетевых неисправностей, основанное на модели машинного обучения и содержащее систему диагностики неисправностей и систему обработки выборочных данных, описанные во втором аспекте;In a third aspect, an embodiment of the present invention provides a network fault processing apparatus based on a machine learning model, comprising a fault diagnosis system and a sample data processing system described in the second aspect;
указанная система диагностики неисправностей содержит модуль построения модели и модуль управления вводом-выводом; модуль построения модели выполнен с возможностью получения входного вектора и выходного вектора из системы обработки для построения модели машинного обучения, причем входной вектор извлекается из уровня данных аварийной сигнализации и уровня данных о неисправностях, а выходной вектор извлекается из уровня конфигурационных данных; иsaid troubleshooting system comprises a model building module and an I/O control module; the model building module is configured to obtain an input vector and an output vector from the processing system for building a machine learning model, wherein the input vector is extracted from the alarm data layer and the fault data layer, and the output vector is extracted from the configuration data layer; and
модуль управления вводом-выводом выполнен с возможностью получения данных аварийной сигнализации и данных о неисправностях целевой сети, их преобразования соответствующим образом в соответствующие векторы, ввода этих векторов в модуль построения модели и передачи выходного вектора модуля построения модели на целевую сеть.the input/output control module is configured to receive alarm data and fault data of the target network, convert them appropriately into appropriate vectors, input these vectors to the model building module, and transmit the output vector of the model building module to the target network.
По сравнению с известным уровнем техники, в варианте осуществления настоящего изобретения получают данные аварийной сигнализации, данные о неисправностях и конфигурационные данные по меньшей мере одной целевой сети за множество моментов времени из базы данных, соответственно преобразуют их в соответствующие векторы и строят многоуровневое многоразмерное пространство для по меньшей мере одной целевой сети, в результате чего обеспечивают выборочные данные для модели машинного обучения для обработки неисправностей оптической сети и преобразования конфигурационных данных, данных аварийной сигнализации и данных о неисправностях, ориентированных на специалистов по эксплуатации и техобслуживанию, в выборочные данные, ориентированные на машинное обучение, повышают эффективность сохранения выборочных данных и обеспечивают достижение междоменного взаимодействия данных и обмена ими между разными производителями.Compared with the prior art, in an embodiment of the present invention, alarm data, fault data, and configuration data of at least one target network at a plurality of time points are obtained from a database, respectively converted into corresponding vectors, and a layered multi-dimensional space is constructed for of at least one target network, thereby providing sample data for a machine learning model for processing optical network faults and converting configuration data, alarm data, and fault data oriented to operations and maintenance specialists into sample data oriented to machine learning , improve the efficiency of saving sample data and ensure the achievement of cross-domain interaction and data exchange between different producers.
Описание чертежейDescription of drawings
Чтобы лучше проиллюстрировать техническое решение в вариантах осуществления настоящего изобретения, ниже схематически представлены чертежи, необходимые для описания вариантов осуществления, и для специалистов в данной области техники очевидно, что чертежи в последующем описании относятся лишь к некоторым вариантам осуществления настоящего изобретения, и на основе этих чертежей могут также быть получены другие чертежи без какой-либо творческой работы.In order to better illustrate the technical solution in the embodiments of the present invention, the following schematically presents the drawings necessary to describe the embodiments, and it will be obvious to those skilled in the art that the drawings in the following description relate only to some embodiments of the present invention, and based on these drawings other drawings can also be obtained without any creative work.
На Фиг. 1 показан схематический чертеж облачной сетевой архитектуры;On FIG. 1 is a schematic drawing of a cloud network architecture;
на Фиг. 2 показана блок-схема способа обработки выборочных данных в варианте осуществления настоящего изобретения;in FIG. 2 is a flowchart of a sample data processing method in an embodiment of the present invention;
на Фиг. 3 показан схематический чертеж процесса получения данных из базы данных и выполнения векторизации и матрицирования на них;in FIG. 3 is a schematic diagram of a process for getting data from a database and performing vectorization and matrixing on it;
на Фиг. 4 показана блок-схема способа обработки выборочных данных еще в одном варианте осуществления настоящего изобретения;in FIG. 4 is a flowchart of a method for processing sample data in yet another embodiment of the present invention;
на Фиг. 5 показан вариант осуществления многоуровневого многоразмерного пространства;in FIG. 5 shows an embodiment of a multi-level multi-dimensional space;
на Фиг. 6 показан схематический чертеж выполнения развертывания режима и развертывания строкового вектора на многоуровневом многоразмерном пространстве согласно способу обработки выборочных данных еще в одном варианте осуществления настоящего изобретения;in FIG. 6 is a schematic diagram of performing mode expansion and string vector expansion on a multi-level multi-dimensional space according to a sample data processing method in yet another embodiment of the present invention;
на Фиг. 7 показана блок-схема выполнения развертывания режима и развертывания строкового вектора на подпространстве многоуровневого многоразмерного пространства согласно способу обработки выборочных данных еще в одном варианте осуществления настоящего изобретения;in FIG. 7 is a flowchart showing the execution of mode expansion and string vector expansion on a subspace of a layered multidimensional space according to a sample data processing method in yet another embodiment of the present invention;
на Фиг. 8 показан схематический чертеж вариантов осуществления подпространственной сегментации на многоуровневом многоразмерном пространстве;in FIG. 8 is a schematic drawing of embodiments of subspace segmentation in a multi-level multi-dimensional space;
на Фиг. 9 показан схематический чертеж еще одного варианта осуществления подпространственной сегментации на многоуровневом многоразмерном пространстве;in FIG. 9 is a schematic drawing of yet another embodiment of subspace segmentation on a multi-level multi-dimensional space;
на Фиг. 10 показан схематический чертеж выполнения развертывания режима и развертывания строкового вектора на подпространстве;in FIG. 10 is a schematic drawing of performing mode expansion and string vector expansion on subspace;
на Фиг. 11 показана блок-схема развертывания режима и подпространственной сегментации многоуровневого многоразмерного пространства;in FIG. 11 is a block diagram of mode deployment and sub-space segmentation of a multi-level multi-dimensional space;
на Фиг. 12 показан схематический чертеж системы обработки выборочных данных в варианте осуществления настоящего изобретения; иin FIG. 12 is a schematic drawing of a sample data processing system in an embodiment of the present invention; and
на Фиг. 13 показан схематический чертеж устройства для обработки сетевых неисправностей в варианте осуществления настоящего изобретения.in FIG. 13 is a schematic drawing of a network fault processing apparatus in an embodiment of the present invention.
Осуществление изобретенияImplementation of the invention
Технические решения по настоящему изобретению будут доходчиво и в полном объеме описаны со ссылкой на сопроводительные чертежи вариантов осуществления настоящего изобретения, причем очевидно, что описанные варианты осуществления представляют собой лишь часть вариантов осуществления настоящего изобретения, а не все варианты осуществления. Все другие варианты осуществления настоящего изобретения, полученные специалистами в данной области техники на основе вышеуказанных вариантов осуществления без применения творческой работы, должны попадать в объем защиты настоящего изобретения.The technical solutions of the present invention will be clearly and fully described with reference to the accompanying drawings of the embodiments of the present invention, and it is clear that the described embodiments are only a part of the embodiments of the present invention, and not all of the embodiments. All other embodiments of the present invention, obtained by those skilled in the art based on the above embodiments without the use of creative work, should fall within the protection scope of the present invention.
В варианте осуществления настоящего изобретения предложен способ обработки выборочных данных, согласно которому обеспечивают выборочные данные для модели машинного обучения для обработки неисправности оптической сети, преобразуют конфигурационные данные, данные аварийной сигнализации и данные о неисправностях оптической сети, ориентированные на специалистов по эксплуатации и техобслуживанию, в выборочные данные, ориентированные на машинное обучение, и таким образом повышают эффективность сохранения выборочных данных, облегчают извлечение и сравнение выборочных данных и другие операции и содействуют эффективному построению модели машинного обучения.An embodiment of the present invention provides a sample data processing method that provides sample data for a machine learning model for optical network fault processing, converts configuration data, alarm data, and optical network fault data targeting O&M personnel into sample data. machine learning-oriented data, and thus improve the efficiency of sample data storage, facilitate sample data extraction and comparison, and other operations, and facilitate efficient machine learning model building.
Оптические сети, упоминаемые в вариантах осуществления настоящего изобретения, могут представлять собой не только обычные оптические сети передачи данных, такие как оптические транспортные сети (optical transport network, OTN), пакетные транспортные сети (packet transport network, PTN) и пакетные оптические транспортные сети (packet optical transport network, POTN), но они также могут представлять собой облачные сети.The optical networks referred to in the embodiments of the present invention may be not only conventional optical data networks such as optical transport networks (optical transport network, OTN), packet transport networks (packet transport network, PTN) and packet optical transport networks ( packet optical transport network, POTN), but they can also be cloud networks.
В качестве примера на Фиг. 1 показан схематический чертеж облачной сетевой архитектуры. В нижней левой части Фиг. 1 показана базовая станция облачной сети, содержащая активный антенный блок (active antenna unit, AAU), централизованный блок (centralized unit, CU) и распределенный блок (distributed unit, DU). Из них CU поддерживает высокоуровневый беспроводной протокол не в реальном времени и часть функций стока данных в основной сети и функций пограничного оборудования, а DU поддерживает функции физического уровня и функции в реальном времени. В нижней части Фиг. 1 показано кольцо доступа облачной сети, кольцо конвергенции и основное кольцо. Данные аварийной сигнализации, данные о неисправностях и конфигурационные данные по сетевому оборудованию в этих кольцевых сетях соответственно передаются на пограничный центр сбора и обработки данных, региональный центр сбора и обработки данных и основной центр сбора и обработки данных в верхней части Фиг. 1 посредством сетевой административной платформы или платформы управления. Данные аварийной сигнализации, данные о неисправностях и конфигурационные данные по базовой станции и пограничному оборудованию передаются на пограничный центр сбора и обработки данных посредством локальной платформы. Функции основной сети 5G подразделяются на функции плоскости пользователя (user plane, UP) и функции плоскости управления (control plane, CP). С одной стороны, эти центры сбора и обработки данных выполняют функции администрирования, маршрутизации и управления облачной сетью; с другой стороны, эти центры сбора и обработки данных развертывают интеллектуальную платформу облачной сети, строят базу знаний об эксплуатации облачной сети и управлении техобслуживанием на основе больших объемов сетевых данных и высоких вычислительных возможностей и служат в качестве мозга облачной сети.As an example, in FIG. 1 is a schematic drawing of a cloud network architecture. At the bottom left of Fig. 1 shows a cloud network base station containing an active antenna unit (AAU), a centralized unit (CU), and a distributed unit (DU). Of these, the CU supports the non-real-time high-level wireless protocol and part of the core network data sink functions and edge equipment functions, and the DU supports the physical layer functions and real-time functions. At the bottom of Fig. 1 shows the cloud network access ring, convergence ring, and main ring. The alarm data, fault data, and configuration data of the network equipment in these ring networks are respectively transmitted to the border data center, the regional data center, and the main data center at the top of FIG. 1 through a network administration platform or a management platform. The alarm data, fault data and configuration data of the base station and border equipment are transmitted to the border data center through the local platform. The 5G core network functions are divided into user plane (UP) functions and control plane (CP) functions. On the one hand, these data collection and processing centers perform the functions of administration, routing and management of the cloud network; on the other hand, these data centers deploy an intelligent cloud network platform, build a knowledge base of cloud network operation and maintenance management based on large amounts of network data and high computing power, and serve as the brain of the cloud network.
В варианте осуществления настоящего изобретения каждая целевая сеть может представлять собой кольцо доступа, кольцо конвергенции или основное кольцо по Фиг. 1, однако она не ограничена этим. В других вариантах осуществления каждая целевая сеть может также представлять собой сеть доступа, сеть конвергенции или основную сеть в обычных оптических сетях (OTN, PTN или POTN).In an embodiment of the present invention, each target network may be an access ring, a convergence ring, or the main ring of FIG. 1, however, it is not limited to this. In other embodiments, each target network may also be an access network, a convergence network, or a core network in conventional optical networks (OTN, PTN, or POTN).
В варианте осуществления настоящего изобретения оборудование оптической сети передает данные аварийной сигнализации и соответствующие данные о неисправностях на платформу администрирования сети, а также передает их на центр сбора и обработки данных посредством сетевой административной платформы. Тревожная сигнализация, генерируемая оборудованием оптической сети, включает сигнализацию об основных причинах и производную сигнализацию, и имеет место корреляция между сигнализацией об основных причинах и производной сигнализацией. В случае неисправности оборудования оптической сети генерируются и передаются как данные аварийной сигнализации, так и данные о неисправности, и неисправность должна быть устранена с использованием распределенных конфигурационных данных.In an embodiment of the present invention, the optical network equipment transmits alarm data and corresponding fault data to the network administration platform, and also transmits them to the data collection and processing center through the network administration platform. The alarm signaling generated by the optical network equipment includes root cause signaling and derived signaling, and there is a correlation between root cause signaling and derived signaling. In the event of a failure of the optical network equipment, both alarm data and fault data are generated and transmitted, and the fault must be resolved using distributed configuration data.
Поскольку в массиве данных аварийной сигнализации для оптической сети содержится большое количество повторных, избыточных, неполных и противоречивых данных, центр сбора и обработки данных сначала производит очистку данных, удаляет повторные, избыточные и низкокачественные данные для получения высококачественных множеств данных аварийной сигнализации, множеств данных о неисправностях и множеств конфигурационных данных и соответственно сохраняет эти множества данных в базе данных.Since the optical network alarm dataset contains a large amount of duplicate, redundant, incomplete, and inconsistent data, the data center first cleans the data, removes duplicate, redundant, and low-quality data to obtain high-quality alarm data sets, fault data sets and configuration data sets and stores these data sets in the database accordingly.
На Фиг. 2 показана блок-схема способа обработки выборочных данных в варианте осуществления по настоящему изобретению, включающего нижеследующие этапы:On FIG. 2 shows a flowchart of a sample data processing method in an embodiment of the present invention, including the following steps:
S110: получают из базы данных данные аварийной сигнализации, данные о неисправностях и конфигурационные данные по меньшей мере одной целевой сети за множество моментов времени и соответствующим образом преобразуют их в соответствующие векторы.S110: Receive alarm data, fault data and configuration data of at least one target network for a plurality of time points from the database and convert them into corresponding vectors accordingly.
S120: строят для по меньшей мере целевой сети многоуровневое многоразмерное пространство, каждый уровень которого представляет собой двумерную матрицу, имеющую один и тот же размер, и выполнен с возможностью сохранения векторов, полученных в результате преобразования, в строках в соответствии с последовательностью моментов времени так, чтобы соответственно получить уровень данных аварийной сигнализации, уровень данных о неисправностях и уровень конфигурационных данных каждой целевой сети.S120: for at least the target network, a multi-level multi-dimensional space is built, each level of which is a two-dimensional matrix having the same size, and is configured to store the vectors obtained as a result of the transformation in rows in accordance with the sequence of time points so, to respectively obtain the alarm data level, fault data level and configuration data level of each target network.
На этапе S110 на основе корреляции между временем, генерируемым с использованием данных аварийной сигнализации, данных о неисправностях и конфигурационных данных, все из данных аварийной сигнализации, данных о неисправностях и конфигурационных данных могут быть получены в пределах установленного периода времени из базы данных, или все из данных аварийной сигнализации, данных о неисправностях и конфигурационных данных могут быть получены из базы данных периодически посуточно, понедельно или помесячно. Установленный период времени или цикл содержит данные аварийной сигнализации за множество моментов времени, данные о неисправностях за множество моментов времени и конфигурационные данные за множество моментов времени.In step S110, based on the correlation between the time generated using the alarm data, fault data, and configuration data, all of the alarm data, fault data, and configuration data can be obtained within a set time period from the database, or all of alarm data, fault data and configuration data can be retrieved from the database periodically on a daily, weekly or monthly basis. The set period of time or cycle comprises alarm data for a plurality of time points, fault data for a plurality of time points, and configuration data for a plurality of time points.
Данные аварийной сигнализации, данные о неисправностях и конфигурационные данные представляют собой не только гетерогенные данные, и эти данные включают поля различных типов, причем разные поля имеют разные размеры. Способ векторного представления гетерогенных данных с разными размерами включает нижеследующие этапы:Alarm data, fault data, and configuration data are not only heterogeneous data, and these data include fields of various types, with different fields having different sizes. The method of vector representation of heterogeneous data with different sizes includes the following steps:
Сначала каждый фрагмент данных аварийной сигнализации, данных о неисправностях и конфигурационных данных преобразуют в основной вектор , где каждый элемент основного вектора представляет собой значение поля в каждом блоке данных аварийной сигнализации, данных о неисправностях или конфигурационных данных.First, each piece of alarm data, fault data, and configuration data is converted into a main vector , where each element of the main vector represents the field value in each block of alarm data, fault data, or configuration data.
Например, множество выборочных данных, состоящее из всех полученных данных аварийной сигнализации, содержит Ma блоков данных аварийной сигнализации, из которых данные аварийной сигнализации, сгенерированные в некоторый момент времени, могут представлять собой один или более блоков, и каждый блок данных аварийной сигнализации содержит Na полей.For example, the sample data set consisting of all received alarm data contains M a blocks of alarm data, of which the alarm data generated at a point in time may be one or more blocks, and each block of alarm data contains N a fields.
Например, блок данных аварийной сигнализации, показанных на Фиг. 3, содержит восемь полей, а именно: порядковый номер (Seq.No.), адрес (Addr.), номер строки (Line), тип аварийной сигнализации (AlarmType), время начала аварийной сигнализации (BeginTime), время окончания аварийной сигнализации (EndTime), тип платы (BoardType) и тип сетевого элемента (NetType) данных аварийной сигнализации, причем BeginTime и и EndTime указаны с точностью до секунд, AlarmType представляет собой ряды символов, и NetType представляет собой целочисленное значение.For example, the alarm data block shown in FIG. 3 contains eight fields, namely: sequence number (Seq.No.), address (Addr.), line number (Line), alarm type (AlarmType), alarm start time (BeginTime), alarm end time ( EndTime), board type (BoardType), and NE type (NetType) of the alarm data, with BeginTime and EndTime specified in seconds, AlarmType is a string of characters, and NetType is an integer value.
Значения всех полей данных аварийной сигнализации, показанных на Фиг. 3, преобразуются в действительные числа и таким образом выражаются в виде элементов вектора. В процессе векторизации данных аварийной сигнализации целочисленные значения этих полей представляются в векторе в качестве значений элементов. Минимальное значение всех полей BeginTime и EndTime может быть поставлено в соответствие значению 1, и количество секунд между другими моментами времени и минимальным временем может быть добавлено к значению 1, чтобы соответственно получить соответствующие значения полей BeginTime и EndTime. Например, если BeginTime составляет на 10 секунд больше, чем минимальное время, то BeginTime соответствует значению 11, и в этом случае два этих поля располагаются в лексикографическом порядке и затем нумеруются, начиная с 1, для преобразования строки в значения в качестве элементов вектора.The meanings of all alarm data fields shown in FIG. 3 are converted to real numbers and thus expressed as elements of a vector. During the vectorization of the alarm data, the integer values of these fields are represented in the vector as element values. The minimum value of all the BeginTime and EndTime fields may be mapped to a value of 1, and the number of seconds between other times and the minimum time may be added to the value of 1 to obtain the respective values of the BeginTime and EndTime fields, respectively. For example, if BeginTime is 10 seconds longer than the minimum time, then BeginTime corresponds to the value 11, in which case these two fields are arranged in lexicographic order and then numbered starting from 1 to convert the string to values as vector elements.
Затем на основном векторе выполняют преобразование по размерам, и полученный в результате преобразования вектор будет представлять собой адамарово произведение основного вектора и вектора размерного расширения, то есть . Элемент вектора размерного расширения представляет собой результат кратного расширения или сжатия соответствующего элемента основного вектора ; например, при расширении десятичной кратной единицы ширины полосы с мега (М) до гига (G) элемент вектора размерного расширения будет равен 1024.Then on the main vector perform a size transformation, and the resulting vector will be the Hadamard product of the main vector and vector dimensional expansion, that is . vector element dimensional expansion is the result of a multiple expansion or contraction of the corresponding element of the main vector ; for example, when expanding a decimal multiple of a unit of bandwidth from mega (M) to giga (G), the vector element dimensional expansion will be equal to 1024.
Согласно требованиям тренинга модели машинного обучения, соответствующий элемент основного вектора может быть умножен на соответствующий элемент вектора размерного расширения для генерирования выборочных данных, подходящих для требований тренинга. Аналогичным образом, конфигурационные данные в нижней левой части Фиг. 3 также преобразуются в соответствующие векторы. Конфигурационные данные содержат Num_CPUs: 4, то есть количество ядер центрального процессора. Например, векторная группа в нижней части Фиг. 3 показывает два вектора, которые получены в результате преобразования с использованием данных аварийной сигнализации и конфигурационных данных соответственно.According to the training requirements of the machine learning model, the corresponding element of the main vector can be multiplied by the corresponding element of the dimensional expansion vector to generate sample data suitable for the training requirements. Similarly, the configuration data at the bottom left of FIG. 3 are also converted to the corresponding vectors. The configuration data contains Num_CPUs: 4, which is the number of CPU cores. For example, the vector group at the bottom of FIG. 3 shows two vectors that are converted using alarm data and configuration data, respectively.
В случае данных о неисправностях и конфигурационных данных, сохраненных в частично структурированном XML-документе в оптической сети, вышеуказанный способ может также использоваться для построения вектора базы данных и вектора размерного расширения, причем количество пар ключ/значение (Key/Value) в XML соответствует размеру вектора, а значение векторного элемента соответствует значению в XML-документе.In the case of fault data and configuration data stored in a partially structured XML document in an optical network, the above method can also be used to construct a database vector and a dimensional extension vector, with the number of key/value pairs (Key/Value) in the XML corresponding to the size vector, and the value of the vector element corresponds to the value in the XML document.
На этапе S110 строят для целевой сети три пары векторных групп, которые соответственно представляют собой векторную группу данных аварийной сигнализации и векторную группу размерного расширения; векторную группу данных о неисправностях и векторную группу размерного расширения; и векторную группу конфигурационных данных и векторную группу размерного расширения. Полученная векторная группа данных аварийной сигнализации содержит Ma векторов данных аварийной сигнализации, полученных в результате преобразования из Ma блоков данных аварийной сигнализации, и каждый вектор данных аварийной сигнализации имеет Na элементов. Векторная группа данных о неисправностях содержит Mf векторов данных о неисправностях, полученных в результате преобразования из Mf блоков данных о неисправностях, и каждый вектор данных о неисправностях имеет Nf элементов. Векторая группа конфигурационных данных содержит Mc векторов конфигурационных данных, полученных в результате преобразования из Mc блоков конфигурационных данных, и каждый вектор конфигурационных данных имеет Nc элементов.In step S110, three vector group pairs are built for the target network, which are respectively an alarm data vector group and a dimensional extension vector group; a fault data vector group and a dimensional expansion vector group; and a configuration data vector group and a dimension extension vector group. The resulting alarm data vector group contains M a alarm data vectors resulting from conversion from M a alarm data blocks, and each alarm data vector has N a elements. The fault data vector group contains M f fault data vectors resulting from the conversion from the M f fault data blocks, and each fault data vector has N f elements. The configuration data vector group contains M c configuration data vectors resulting from the transformation from M c configuration data blocks, and each configuration data vector has N c elements.
После выполнения векторного представления на гетерогенных данных с разными размерами, на этапе S120 выполняют матричное представление. Количество строк двумерной матрицы в многоуровневом многоразмерном пространстве представляет собой максимальное из значений общего количества векторов векторной группы данных аварийной сигнализации, векторной группы данных о неисправностях и векторной группы конфигурационных данных, то есть максимальное значение из Ma, Mf and Mc. Количество столбцов двумерной матрицы в многоуровневом многоразмерном пространстве представляет собой максимальное из значений общего количества векторных элементов векторной группы данных аварийной сигнализации, векторной группы данных о неисправностях и векторной группы конфигурационных данных, то есть максимальное значение из Na, Nf и Nc.After performing vector representation on heterogeneous data with different sizes, in step S120, matrix representation is performed. The number of rows of the two-dimensional matrix in the multi-level multi-dimensional space is the maximum of the total number of vectors of the alarm data vector group, the fault data vector group, and the configuration data vector group, that is, the maximum value of M a , M f and M c . The number of columns of the two-dimensional matrix in the multi-level multi-dimensional space is the maximum of the total number of vector elements of the vector alarm data group, the vector fault data group, and the vector configuration data group, that is, the maximum value of N a , N f and N c .
В соответствии с последовательностью моментов времени Ma векторов данных аварийной сигнализации, сохраняют группы векторов данных аварийной сигнализации в строках на первом уровне многоуровневого многоразмерного пространства для получения уровня данных аварийной сигнализации. Аналогичным образом могут быть получены уровень данных о неисправностях и уровень конфигурационных данных.According to the time sequence M a of the alarm data vectors, the groups of alarm data vectors are stored in rows in the first layer of the multi-level multidimensional space to obtain the alarm data layer. Similarly, a fault data layer and a configuration data layer can be obtained.
Многоуровневое многоразмерное пространство представлено как D = R (I1, I2, I3), где R представляет значение многоуровневого многоразмерного пространства в поле вещественных чисел, I1 представляет количество уровней, I2 представляет количество строк матрицы уровней, и I3 представляет количество столбцов матрицы уровней. Например, R(I1, :, :) представляет матричный элемент на уровне I1, R(I1, I2, :) представляет все элементы векторов на уровне I1 и в строке I2, R(2, :, :) представляет матричный элемент на уровне 2, и R(2, 3, :) представляет собой все элементы векторов на уровне 2 и в строке 3.The multilevel multidimensional space is represented as D=R(I 1 , I 2 , I 3 ), where R represents the value of the multilevel multidimensional space in the field of real numbers, I 1 represents the number of levels, I 2 represents the number of rows of the level matrix, and I 3 represents the number columns of the level matrix. For example, R(I 1 , :, :) represents the matrix element at level I 1 , R(I 1 , I 2 , :) represents all elements of the vectors at level I 1 and in row I 2 , R(2, :, : ) represents the matrix element at level 2, and R(2, 3, :) represents all elements of the vectors at level 2 and in
В варианте осуществления настоящего изобретения определяют количество уровней, строк и столбцов многоуровневого многоразмерного пространства, то есть определяют значения I1, I2 и I3 в D=R(I1, I2, I3) и местоположение матриц, векторов и элементов. При последующем построении и анализе модели машинного обучения удобно вычислять пересекающиеся и разностные множества данных аварийной сигнализации, данных о неисправностях и конфигурационных данных и выполнять операции, такие как корреляционный анализ и обработка.In an embodiment of the present invention, the number of levels, rows and columns of a multi-level multi-dimensional space is determined, that is, the values of I 1 , I 2 and I 3 in D=R(I 1 , I 2 , I 3 ) and the location of matrices, vectors and elements are determined. In the subsequent construction and analysis of the machine learning model, it is convenient to calculate the intersection and difference sets of alarm data, fault data, and configuration data, and perform operations such as correlation analysis and processing.
Еще один вариант осуществления этапа S110 вышеуказанного способа обработки выборочных данных показан в виде этапа S110’.Another embodiment of step S110 of the above sample data processing method is shown as step S110'.
На этапе S110’ возможно также сохранение векторов, полученных в результате преобразования, в строках двумерной пустой матрицы в соответствии с последовательностью моментов времени так, чтобы получить матрицу аварийной сигнализации, матрицу неисправностей и конфигурационную матрицу каждой целевой сети. Использование матрицы для сохранения вектора, полученного в результате преобразования, обеспечивает возможность экономии пространства для сохранения с помощью классического способа сохранения на основе разреженной матрицы. Например, данные в матрице могут быть сохранены на основе способа сохранения со сжатием строк (compressed row storage, CRS), чтобы сэкономить пространство для сохранения.In step S110', it is also possible to store the vectors resulting from the transformation in the rows of a two-dimensional empty matrix according to the sequence of times so as to obtain an alarm matrix, a fault matrix, and a configuration matrix of each target network. The use of a matrix to store the vector resulting from the transformation allows saving storage space using the classic sparse matrix storage method. For example, data in a matrix can be stored based on a compressed row storage (CRS) storage method to save storage space.
Более конкретно, векторы всех данных аварийной сигнализации преобразуют таким же образом, что и на вышеуказанном этапе S110, и сохраняют в двумерной пустой матрице, такой как двумерная матрица в нижней правой части Фиг. 3. При наличии Ma=7000 блоков данных аварийной сигнализации формируют матрицу аварийной сигнализации с 7000 строками и 8 столбцами. Аналогичным образом могут также быть построены матрица неисправностей и конфигурационная матрица.More specifically, the vectors of all alarm data are converted in the same manner as in the above step S110 and stored in a two-dimensional empty matrix such as the two-dimensional matrix in the lower right of FIG. 3. With M a =7000 alarm data blocks, an alarm matrix is formed with 7000 rows and 8 columns. Similarly, a fault matrix and a configuration matrix can also be constructed.
Еще один вариант осуществления этапа S120 показан в виде этапа S120’, на котором получают максимальное количество строк и столбцов матрицы аварийной сигнализации, матрицы неисправностей и конфигурационной матрицы, причем это максимальное количество строк и столбцов определяют как количество строк и столбцов каждого уровня в многоуровневой многоразмерной модели.Another embodiment of step S120 is shown as step S120', in which the maximum number of rows and columns of the alarm matrix, the fault matrix and the configuration matrix are obtained, and this maximum number of rows and columns is determined as the number of rows and columns of each level in a multi-level multi-dimensional model .
Затем матрицу аварийной сигнализации, матрицу неисправностей и конфигурационную матрицу сохраняют на уровне данных аварийной сигнализации, уровне данных о неисправностях и уровне конфигурационных данных многоуровневого многоразмерного пространства, а матричные элементы, не имеющие сохраненных значений, на каждом уровне заполняют нулевыми значениями.Then, the alarm matrix, the fault matrix, and the configuration matrix are stored in the alarm data layer, the fault data layer, and the configuration data layer of the multi-level multidimensional space, and the matrix elements having no stored values are filled with zero values at each level.
После получения многоуровневого многоразмерного пространства обеспечивается возможность экономии пространства для сохранения с помощью классического способа сохранения на основе разреженной матрицы. Например, многоуровневое многоразмерное пространство может быть сохранено на основе способа CRS.After obtaining a multi-level multi-dimensional space, it is possible to save storage space using the classic sparse matrix storage method. For example, a multi-level multi-dimensional space may be stored based on the CRS method.
Многоуровневое многоразмерное пространство используют для однородного представления данных аварийной сигнализации, данных о неисправностях и конфигурационных данных, что облегчает последующее построение входной и выходной переменных модели нейронной сети глубокого обучения. Входные и выходные данные модели нейронной сети глубокого обучения представляют в виде векторов. Многоуровневое многоразмерное пространство, построенное на основе варианта осуществления настоящего изобретения, обеспечивает возможность удобного и точного преобразования уровня данных аварийной сигнализации и уровня данных о неисправностях во входные векторы, благодаря чему осуществляют тренинг нейронной сети глубокого обучения и определяют закон корреляции между данными аварийной сигнализации, данными о неисправностях и конфигурационными данными.A layered multidimensional space is used to uniformly represent alarm data, fault data, and configuration data, which facilitates subsequent construction of the input and output variables of a deep learning neural network model. The input and output data of a deep learning neural network model are represented as vectors. The multi-level multi-dimensional space built on the basis of an embodiment of the present invention allows convenient and accurate transformation of the alarm data level and the fault data level into input vectors, thereby training a deep learning neural network and determining the correlation law between alarm data, alarm data faults and configuration data.
В целом, моменты времени данных аварийной сигнализации, данных о неисправностях и конфигурационных данных по оптической сети являются различными. В других вариантах осуществления все из уровня данных аварийной сигнализации, уровня данных о неисправностях и уровня конфигурационных данных могут содержать один и тот же момент времени. Для каждого уровня, если имеет место векторная группа в определенный момент времени, то будет сохранен соответствующий строковый вектор данного уровня; если же данные в определенный момент времени отсутствуют, то соответствующий строковый вектор будет заполнен нулевыми значениями.In general, the timing of alarm data, fault data, and configuration data over the optical network are different. In other embodiments, the alarm data layer, the fault data layer, and the configuration data layer may all contain the same point in time. For each level, if there is a vector group at a particular point in time, then the corresponding string vector of that level will be stored; if there is no data at a certain point in time, then the corresponding string vector will be filled with zero values.
Как упоминалось выше, оптическая сеть содержит множество целевых сетей, таких как кольцо доступа, кольцо конвергенции и основное кольцо по Фиг. 1, которые соответственно используют исходный домен и целевой домен для представления сети доступа, сети конвергенции и сети центра сбора и обработки данных. Например, возможно определение сети доступа как исходного домена, а сети конвергенции - как целевого домена, или основной сети - как исходного домена, а сети центра сбора и обработки данных - как целевого домена, без ограничения.As mentioned above, the optical network contains a plurality of target networks such as the access ring, the convergence ring, and the main ring of FIG. 1, which respectively use a source domain and a target domain to represent an access network, a convergence network, and a data center network. For example, it is possible to define the access network as the source domain and the convergence network as the target domain, or the core network as the source domain and the data center network as the target domain, without limitation.
Еще в одном варианте осуществления строят многоуровневое многоразмерное пространство для исходного домена и целевого домена, как показано на Фиг. 4, и способ обработки выборочных данных включает нижеследующие этапы:In yet another embodiment, a multi-level, multi-dimensional space is built for a source domain and a target domain, as shown in FIG. 4, and the sample data processing method includes the following steps:
S200: осуществляют получение и предварительную обработку данных. Более конкретно, это включает нижеследующие этапы:S200: Data acquisition and pre-processing are carried out. More specifically, this includes the following steps:
S201: осуществляют загрузку данных аварийной сигнализации, данных о неисправностях и конфигурационных данных оптической сети в центры трех типов для сбора и обработки данных с помощью сетевой административной платформы или платформы управления.S201: Upload alarm data, fault data, and optical network configuration data to three types of data collection and processing centers with a network administration platform or a management platform.
S202: вследствие наличия большого объема повторных, избыточных, неполных и противоречивых данных в данных аварийной сигнализации, данных о неисправностях и конфигурационных данных по обширной сети, сначала выполняют очистку указанных данных с помощью указанных центров трех типов для сбора и обработки данных для удаления указанных повторных, избыточных, неполных и низкокачественных данных и получения высококачественных множеств данных аварийной сигнализации, данных о неисправностях и конфигурационных данных и затем соответственно сохраняют их в базе данных исходного домена и базе данных целевого домена.S202: due to the presence of a large amount of repeated, redundant, incomplete and inconsistent data in the alarm data, fault data and configuration data over a wide network, first perform the cleaning of these data using the specified three types of data collection and processing centers to delete the specified duplicate, redundant, incomplete, and poor quality data, and obtaining high quality sets of alarm data, fault data, and configuration data, and then storing them in a source domain database and a target domain database, respectively.
S210: затем используют способы векторного и матричного представления гетерогенных данных с разными размерами, соответственно осуществляя преобразование данных аварийной сигнализации, данных о неисправностях и конфигурационных данных в исходном домене и целевом домене в одномерный вектор, и затем представляют их в виде соответствующей двумерной матрицы. Более конкретно, это включает нижеследующие этапы:S210: Then, methods of vector and matrix representation of heterogeneous data with different sizes are used, respectively, converting the alarm data, fault data, and configuration data in the source domain and the target domain into a one-dimensional vector, and then present them as a corresponding two-dimensional matrix. More specifically, this includes the following steps:
S211: выполняют процесс построения одномерного вектора.S211: One-dimensional vector construction process is carried out.
S212: выполняют процесс построения двумерной матрицы.S212: executing a two-dimensional matrix building process.
Более конкретно, соответственно строят двумерную матрицу аварийной сигнализации, двумерную матрицу неисправностей и двумерную конфигурационную матрицу в соответствии с данными аварийной сигнализации, данными о неисправностях и конфигурационными данными исходного домена, и соответственно строят двумерную матрицу аварийной сигнализации, двумерную матрицу неисправностей и двумерную конфигурационную матрицу в соответствии с данными аварийной сигнализации, данными о неисправностях и конфигурационными данными целевого домена. Способ построения одномерного вектора и двумерной матрицы схож с вышеуказаным вариантом осуществления и не будет повторно изложен в данном документе.More specifically, a 2D alarm matrix, a 2D fault matrix, and a 2D configuration matrix are respectively constructed according to the alarm data, fault data, and source domain configuration data, and a 2D alarm matrix, a 2D fault matrix, and a 2D configuration matrix are respectively constructed according to with alarm data, fault data, and configuration data of the target domain. The method for constructing a one-dimensional vector and a two-dimensional matrix is similar to the above embodiment and will not be re-examined in this document.
S220: строят многоуровневое многоразмерное пространство для реализации унифицированного представления данных аварийной сигнализации, данных о неисправностях и конфигурационных данных в исходном домене и целевом домене. Количество строк и столбцов матрицы, полученной на этапе S212, может быть различным, например, если предположить, что количество строк и столбцов двумерной матрицы, полученной после матричного представления данных аварийной сигнализации, данных о неисправностях и конфигурационных данных, в исходном домене и целевом домене является таким, как показано в Таблице 1.S220: A multi-level multi-dimensional space is built to implement a unified view of alarm data, fault data, and configuration data in a source domain and a target domain. The number of rows and columns of the matrix obtained in step S212 may be different, for example, assuming that the number of rows and columns of the two-dimensional matrix obtained after the matrix representation of the alarm data, fault data, and configuration data in the source domain and the target domain is as shown in Table 1.
Таблица 1. Примеры количества строк и столбцов двумерной матрицы в исходном домене и целевом домене Table 1. Examples of the number of rows and columns of a two-dimensional matrix in the source domain and target domain
Вычисляют максимальное количество строк и максимальное количество столбцов по всем матрицам аварийной сигнализации, матрицам неисправностей и конфигурационным матрицам и определяют максимальное количество строк и максимальное количество столбцов как количество строк и столбцов каждого уровня двумерной матрицы в многоуровневом многоразмерном пространстве. Например, в Таблице 1 количество строк и столбцов каждого уровня двумерной матрицы в многоуровневом многоразмерном пространстве равно 7000 и 35 соответственно. Из них количество строк, равное 7000, означает, что максимальное количество строк в шести матрицах представляет собой количество строк в матрице неисправностей исходного домена, и количество столбцов, равное 35, означает, что максимальное количество столбцов в шести матрицах представляет собой количество столбцов в конфигурационной матрице целевого домена.Calculate the maximum number of rows and the maximum number of columns for all alarm matrices, fault matrices and configuration matrices and determine the maximum number of rows and the maximum number of columns as the number of rows and columns of each level of a two-dimensional matrix in a multi-level multi-dimensional space. For example, in Table 1, the number of rows and columns of each level of a two-dimensional matrix in a multi-level multi-dimensional space is 7000 and 35, respectively. Of these, the number of rows of 7000 means that the maximum number of rows in the six matrices is the number of rows in the source domain fault matrix, and the number of columns of 35 means that the maximum number of columns in the six matrices is the number of columns in the configuration matrix target domain.
После получения максимального количества строк, равного 7000, и максимального количества столбцов, равного 35, строят модель представления шестиуровневого многоразмерного пространства на основе шести матриц в приведенной выше Таблице 1, генерируют шесть матриц с 7000 строками и 35 столбцами, затем копируют данные в этих шести матрицах во вновь сгенерированные пустые матрицы и заполняют матричные элементы, не имеющие сохраненных данных, нулевыми элементами.After obtaining the maximum number of rows of 7000 and the maximum number of columns of 35, build a six-level multidimensional space representation model based on the six matrices in Table 1 above, generate six matrices with 7000 rows and 35 columns, and then copy the data in these six matrices into newly generated empty matrices and fill matrix elements with no stored data with null elements.
На Фиг. 5 конкретно показано многоуровневое многоразмерное пространство, построенное для исходного домена и целевого домена, то есть шестиуровневое многоразмерное пространство D=R (K1, K2, K3). Уровни с первого по третий соответственно представляют собой уровень данных аварийной сигнализации, уровень данных о неисправностях и уровень конфигурационных данных в исходном домене, соответствующие матрице аварийной сигнализации, матрице неисправностей и конфигурационной матрице в исходном домене, а уровни с четвертого по шестой соответственно представляют собой уровень данных аварийной сигнализации, уровень данных о неисправностях и уровень конфигурационных данных в целевом домене, соответствующие матрице аварийной сигнализации, матрице неисправностей и конфигурационной матрице в целевом домене. Трехуровневое многоразмерное пространство в исходном домене может также быть выражено через Ds=R (I1, I2, I3), и трехуровневое многоразмерное пространство в целевом домене может также быть выражено через Dt=R (J1, J2, J3).On FIG. 5 specifically shows the multi-level multi-dimensional space constructed for the source domain and the target domain, that is, the six-level multi-dimensional space D=R(K 1 , K 2 , K 3 ). The first to third levels respectively represent the alarm data layer, the fault data layer, and the configuration data layer in the source domain corresponding to the alarm matrix, the fault matrix, and the configuration matrix in the source domain, and the fourth to sixth levels respectively represent the data layer alarm, fault data layer, and configuration data layer in the target domain corresponding to the alarm matrix, fault matrix, and configuration matrix in the target domain. The three-level multidimensional space in the source domain can also be expressed in terms of D s =R (I 1 , I 2 , I 3 ), and the three-level multidimensional space in the target domain can also be expressed in terms of D t =R (J 1 , J 2 , J 3 ).
Согласно способу по вышеуказанному варианту осуществления, многоуровневое многоразмерное пространство может также быть построено для множества целевых сетей, таких как сеть доступа, сеть конвергенции, основная сеть и сеть центра сбора и обработки данных, без ограничений.According to the method of the above embodiment, a multi-layered multi-dimensional space can also be built for a plurality of target networks such as an access network, a convergence network, a core network, and a data center network without limitation.
Благодаря данному варианту осуществления настоящего изобретения, с помощью способов векторного и матричного представления гетерогенных данных с разными размерами обеспечивается возможность преобразования структурированных и частично структурированных данных с разными размерами, относящихся к оптической сети, в векторы и матрицы, и благодаря заполнению большим количеством нулевых элементов и тому факту, что многоуровневое многоразмерное пространство представляет собой разреженную матрицу, обеспечивается возможность использования классического способа сохранения на основе разреженной матрицы таким образом, чтобы сэкономить пространство для сохранения во время процесса сохранения. В то же самое время, построение многоуровневого многоразмерного пространства не только обеспечивает достижение унифицированного представления выборочных данных в исходном домене и целевом домене, но также и обеспечивает возможность междоменного взаимодействия выборочных данных и обмена ими между разными производителями, а также устраняет препятствие в виде информационного острова для последующего машинного обучения.With this embodiment of the present invention, using methods for vector and matrix representation of heterogeneous data with different sizes, it is possible to transform structured and semi-structured data with different sizes related to the optical network into vectors and matrices, and due to the filling of a large number of zero elements and the fact the fact that the multilevel multidimensional space is a sparse matrix, it is possible to use the classic sparse matrix storage method so as to save storage space during the storage process. At the same time, the construction of a multi-level multi-dimensional space not only achieves a unified representation of sample data in the source domain and the target domain, but also provides the possibility of cross-domain interaction of sample data and their exchange between different manufacturers, and also removes the obstacle in the form of an information island for subsequent machine learning.
На основе вышеуказанного варианта осуществления, еще в одном варианте осуществления способ обработки выборочных данных дополнительно включает этап, на котором извлекают входной вектор модели машинного обучения из уровня данных аварийной сигнализации и уровня данных о неисправностях, и извлекают выходной вектор модели машинного обучения из уровня конфигурационных данных.Based on the above embodiment, in yet another embodiment, the sample data processing method further includes extracting a machine learning model input vector from the alarm data layer and the fault data layer, and extracting a machine learning model output vector from the configuration data layer.
В одном варианте осуществления, на уровне данных аварийной сигнализации и уровне данных о неисправностях последовательно выполняют развертывание режима и развертывание строкового вектора для получения входного вектора, и на уровне конфигурационных данных последовательно выполняют развертывание режима и развертывание строкового вектора для получения выходного вектора.In one embodiment, the alarm data layer and the fault data layer sequentially perform mode expansion and string vector expansion to obtain an input vector, and the configuration data layer sequentially perform mode expansion and string vector expansion to obtain an output vector.
Как показано на Фиг. 6, способ обработки выборочных данных включает нижеследующие этапы.As shown in FIG. 6, the sample data processing method includes the following steps.
S310: выполняют развертывание режима на многоуровневом многоразмерном пространстве для получения матрицы развертывания режима.S310: Perform mode deployment on the multi-level multi-dimensional space to obtain a mode deployment matrix.
S320: выполняют развертывание строкового вектора на матрице развертывания режима для получения выходного вектора.S320: perform string vector expansion on the mode expansion matrix to obtain an output vector.
Для многоуровневого многоразмерного пространства (которое может представлять собой целевую сеть или множество целевых сетей) в вышеуказанном варианте осуществления, например многоуровневого многоразмерного пространства D=R(K1, K2, K3), показанного на Фиг. 5, используют оператор развертывания режима для развертывания каждого уровня пространства D=R(K1, K2, K3) сверху вниз. Верхний, Н-й уровень многоуровневого многоразмерного пространства размещают в крайнем левом положении, а нижний, первый уровень размещают в крайнем правом положении, чтобы сформировать матрицу развертывания режима по Фиг. 6, и затем на матрице развертывания режима выполняют развертывание строкового вектора для получения входного вектора/выходного вектора в правой части Фиг. 6. Первый строковый вектор матрицы Н-го уровня размещают на первом месте, затем размещают второй строковый вектор матрицы Н-го уровня, и в завершение размещают последний строковый вектор первого уровня.For the layered multidimensional space (which may be a target network or a plurality of target networks) in the above embodiment, such as the layered multidimensional space D=R(K 1 , K 2 , K 3 ) shown in FIG. 5 use a mode expansion operator to expand each level of space D=R(K 1 , K 2 , K 3 ) from top to bottom. The top, H-th level of the multi-level multi-dimensional space is placed at the leftmost position, and the bottom, first level is placed at the rightmost position, to form the mode deployment matrix of FIG. 6, and then string vector expansion is performed on the mode expansion matrix to obtain an input vector/output vector on the right side of FIG. 6. The first row vector of the H-level matrix is placed in the first place, then the second row vector of the H-level matrix is placed, and finally the last row vector of the first level is placed.
Например, для многоуровневого многоразмерного пространства Ds=R (I1, I2, I3) в исходном домене, используют первый оператор fsi: Ds→Vysi развертывания режима для преобразования уровня данных аварийной сигнализации и уровня данных о неисправностях в многоуровневом многоразмерном пространстве Ds=R(I1, I2, I3) исходного домена во входной вектор Vysi. Второй оператор fso: Ds→Vyso развертывания режима используют для преобразования уровня конфигурационных данных в многоуровневом многоразмерном пространстве Ds=R(I1, I2, I3) в выходной вектор Vyso.For example, for a multi-level multi-dimensional space D s =R (I 1 , I 2 , I 3 ) in the source domain, use the first operator f si : D s →V ysi of the mode expansion to transform the alarm data layer and the fault data layer in the multilayer multidimensional space D s =R(I 1 , I 2 , I 3 ) of the original domain into the input vector V ysi . The second mode deployment operator f so : D s →V yso is used to convert the level of configuration data in the layered multidimensional space D s =R(I 1 , I 2 , I 3 ) into an output vector V yso .
Еще в одном варианте осуществления извлекают входной вектор и/или выходной вектор из подпространства многоуровневого многоразмерного пространства, как показано на Фиг. 7, и способ обработки выборочных данных включает нижеследующие этапы.In yet another embodiment, an input vector and/or an output vector is extracted from a subspace of a multilevel multidimensional space, as shown in FIG. 7, and the sample data processing method includes the following steps.
S410: извлекают подпространство, содержащее целевые данные, из многоуровневого многоразмерного пространства, причем указанное подпространство содержит по меньшей мере одну подматрицу уровня данных аварийной сигнализации, уровня данных о неисправностях и уровня конфигурационных данных.S410: extracting a subspace containing target data from a multilevel multidimensional space, said subspace containing at least one submatrix of an alarm data level, a fault data level, and a configuration data level.
Подматрица может представлять собой подматрицу на одном уровне многоуровневого многоразмерного пространства; и подматрица может также представлять собой два или более уровней многоуровневого многоразмерного пространства, где каждый уровень подматрицы представляет собой подматрицу одного уровня в многоуровневом многоразмерном пространстве.The sub-matrix may be a sub-matrix at one level of the multi-level multi-dimensional space; and the submatrix may also be two or more levels of the multilevel multidimensional space, where each level of the submatrix is a submatrix of one level in the multilevel multidimensional space.
S420: Выполняют развертывание режима на указанном подпространстве для получения матрицы развертывания, и выполняют развертывание строкового вектора на матрице развертывания режима для получения входного вектора и/или выходного вектора.S420: Mode expansion is performed on the specified subspace to obtain the expansion matrix, and string vector expansion is performed on the mode expansion matrix to obtain an input vector and/or an output vector.
На Фиг. 8 показан схематический чертеж вариантов осуществления для получения подпространства из многоуровневого многоразмерного пространства, причем в левой части Фиг. 8 показано имеющее Н уровней многоуровневое многоразмерное пространство, построенное в вышеуказанном варианте осуществления (как показано на Фиг. 5).On FIG. 8 is a schematic drawing of embodiments for deriving a subspace from a multi-level multi-dimensional space, with the left side of FIG. 8 shows an H-level multi-level multidimensional space built in the above embodiment (as shown in FIG. 5).
В первом вариант осуществления, который может быть таким, как показано штрихпунктирными линиями на Фиг. 8, соответственно извлекают подматрицу из первого уровня и Н-го уровня многоуровневого многоразмерного пространства. Аналогичным образом, извлекают подматрицу из второго уровня (для простоты, штрихпунктирная линия извлечения подматрицы из второго уровня не показана на Фиг. 8) для получения подпространства в показанной с помощью штрихпунктирной линии рамке в правой части Фиг. 8. Это подпространство содержит три подматрицы, по меньшей мере одна из которых содержит целевые данные.In the first embodiment, which may be as shown in phantom lines in FIG. 8, a sub-matrix is extracted from the first level and the H-th level of the multi-level multi-dimensional space, respectively. Similarly, a submatrix is extracted from the second level (for simplicity, the submatrix extraction from the second level is not shown in FIG. 8) to obtain a subspace in the box shown with a dashed line on the right side of FIG. 8. This subspace contains three submatrices, at least one of which contains the target data.
Второй вариант осуществления может быть таким, как показано штриховыми линиями на Фиг. 8. Сначала извлекают первый уровень и второй уровень из многоуровневого многоразмерного пространства и затем извлекают одну подматрицу соответственно из первого уровня и второго уровня для получения подпространства в показанной штриховыми линиями рамке в правой части Фиг. 8. Это подпространство содержит две подматрицы, и по меньшей мере одна из этих подматриц содержит целевые данные. Аналогичным образом, подматрица также может быть извлечена из Н-го уровня для получения еще одного подпространства.The second embodiment may be as shown in dashed lines in FIG. 8. First, the first level and the second level are extracted from the multi-level multi-dimensional space, and then one sub-matrix is extracted from the first level and the second level, respectively, to obtain a sub-space in the box shown in dashed lines on the right side of FIG. 8. This subspace contains two submatrices, and at least one of these submatrices contains the target data. Similarly, the submatrix can also be extracted from the H-th level to obtain another subspace.
Два вышеуказанных варианта осуществления обеспечивают возможность извлечения подматрицы из любого места каждого уровня многоуровневого многоразмерного пространства, и оба варианта осуществления могут произвольным образом комбинироваться для получения подпространства, содержащего целевые данные.The two above embodiments provide the ability to extract a sub-array from anywhere in each level of a multi-level multi-dimensional space, and both embodiments can be arbitrarily combined to obtain a sub-space containing the target data.
В третьем варианте осуществления, показанном на Фиг. 9, получают подпространство после извлечения подматрицы из одного и того же места намеченного уровня в многоуровневом многоразмерном пространстве. Намеченный уровень может представлять собой один уровень или два или более уровней, без ограничения.In the third embodiment shown in FIG. 9, a subspace is obtained after extracting a submatrix from the same target level location in a multilevel multidimensional space. The target level may be one level, or two or more levels, without limitation.
Операция оператора подпространственной сегментации, определяемого как g: D→D′, состоит в извлечении данных в многоуровневом многоразмерном пространстве и построении подпространства D′.The operation of the subspace segmentation operator, defined as g: D→D′, is to extract data in a multilevel multidimensional space and construct a subspace D′.
Если взять в качестве примера многоуровневое многоразмерное пространство, показанное на Фиг. 5, то многоуровневое многоразмерное пространство в целевом домене представляет собой Ds=R(I1, I2, I3), и оператор подпространственной сегментации, определяемый как gs: Ds→Ds′, извлекает данные в многоуровневом многоразмерном пространстве исходного домена и строит подпространство Ds'=R(I1′, I2′, I3′). Многоуровневое многоразмерное пространство в целевом домене представляет собой Dt=R(J1, J2, J3), и оператор подпространственной сегментации, определяемый как gt: Dt→Dt′, извлекает данные в многоуровневом многоразмерном пространстве целевого домена и строит подпространство Dt′=R(J1′, J2′, J3′).Taking as an example the multi-level multi-dimensional space shown in FIG. 5, then the multilevel multidimensional space in the target domain is D s =R(I 1 , I 2 , I 3 ), and the subspace segmentation operator, defined as g s : D s →D s ′, extracts data in the multilevel multidimensional space of the source domain and builds a subspace D s '=R(I 1 ′, I 2 ′, I 3 ′). The multilevel multidimensional space in the target domain is D t =R(J 1 , J 2 , J 3 ), and the subspace segmentation operator, defined as g t : D t →D t ′, retrieves data in the multilevel multidimensional space of the target domain and constructs subspace D t ′=R(J 1 ′, J 2 ′, J 3 ′).
После получения матрицы развертывания режима выполняют развертывание строкового вектора на этой матрице развертывания режима посредством первого оператора развертывания режима для получения входного вектора и/или выполняют на указанной матрице развертывания режима развертывание строкового вектора посредством второго оператора развертывания режима для получения выходного вектора.After obtaining the mode expansion matrix, the string vector is expanded on this mode expansion matrix by the first mode expansion operator to obtain the input vector and/or the string vector is expanded on the specified mode expansion matrix by the second mode expansion operator to obtain the output vector.
В качестве примера на Фиг. 10 показан схематический чертеж выполнения развертывания режима и развертывания строкового вектора на подпространстве. В левой части Фиг. 10 показано подпространство, полученное из многоуровневого многоразмерного пространства исходного домена. Указанное подпространство может быть выражено через Ds′=R(I1′=2, I2′=3, I3′=3), что является моделью представления с двумя уровнями, тремя строками и тремя столбцами, где R(1, :, :) представляет подматрицу на уровне данных аварийной сигнализации исходного домена, R(2, :, :) представляет подматрицу на уровне данных о неисправностях исходного домена, R(1, 1, :) представляет первый строковый вектор подматрицы уровня данных аварийной сигнализации, и R(1, 1, :)=(6, 5, 13). Аналогичным образом, R(2, :, 3) представляет третий столбцовый вектор подматрицы уровня данных о неисправностях, и R(2, :, 3)=(12, 7B, 6). На Фиг. 10 каждый элемент в указанном подпространстве может быть точно охарактеризован по местоположению посредством указания координат каждой строки и каждого столбца каждого уровня. Например, R(1, 1, 3) представляет значение элемента в первой строке и третьем столбце первого уровня, равное 13, а R(2, 3, 2) представляет значение элемента в третьей строке и втором столбце первого уровня, равное 21.As an example, in FIG. 10 is a schematic drawing of performing mode expansion and string vector expansion on subspace. On the left side of Fig. 10 shows a subspace derived from the multilevel multidimensional space of the original domain. This subspace can be expressed in terms of D s ′=R(I 1 ′=2, I 2 ′=3, I 3 ′=3), which is a representation model with two levels, three rows and three columns, where R(1, :, :) represents the submatrix in the alarm data layer of the source domain, R(2, :, :) represents the submatrix in the fault data layer of the source domain, R(1, 1, :) represents the first row vector of the alarm data layer submatrix, and R(1, 1, :)=(6, 5, 13). Similarly, R(2, :, 3) represents the third column vector of the fault data layer submatrix, and R(2, :, 3)=(12, 7B, 6). On FIG. 10, each element in the specified subspace can be accurately characterized in terms of location by specifying the coordinates of each row and each column of each level. For example, R(1, 1, 3) represents the value of the element in the first row and third column of the first level, which is 13, and R(2, 3, 2) represents the value of the element in the third row and second column of the first level, which is 21.
Выполняют развертывание режима на указанном подпространстве, размещают верхнюю подматрицу уровня данных о неисправностях слева, и размещают нижнюю подматрицу уровня данных аварийной сигнализации справа, чтобы получить матрицу развертывания режима, показанную вверху справа на Фиг. 10.Mode deployment is performed on the specified sub-space, the top fault data level sub-matrix is placed on the left, and the alarm data level bottom sub-matrix is placed on the right to obtain the mode deployment matrix shown at the top right in FIG. ten.
Выполняют развертывание строкового вектора на матрице развертывания режима посредством первого оператора развертывания режима для получения входного вектора, то есть содержащего 18 элементов одномерного вектора внизу справа на Фиг. 10, причем первый строковый вектор верхней левой матрицы по Фиг. 10 размещают с крайней левой стороны входного вектора, затем размещают первый строковый вектор верхней правой матрицы по Фиг. 10 и в завершение размещают третий строковый вектор верхней правой матрицы.The string vector is expanded on the mode expansion matrix by the first mode expansion operator to obtain an input vector, that is, containing 18 elements of a one-dimensional vector at the bottom right of FIG. 10, with the first row vector of the top left matrix of FIG. 10 is placed on the leftmost side of the input vector, then the first row vector of the top right matrix of FIG. 10 and finally place the third row vector of the upper right matrix.
На Фиг. 6 показано выполнение развертывания режима на многоуровневом многоразмерном пространстве посредством оператора развертывания режима для получения матрицы развертывания режима, и выполнение развертывания строкового вектора на матрице развертывания режима для получения входного вектора и выходного вектора. На Фиг. 10 показано выполнение развертывания режима на указанном подпространстве многоуровневого многоразмерного пространства посредством оператора развертывания режима для получения матрицы развертывания режима, и выполнение развертывания строкового вектора на матрице развертывания режима для получения входного вектора и выходного вектора.On FIG. 6 shows performing mode expansion on a layered multidimensional space by means of a mode expansion operator to obtain a mode expansion matrix, and performing string vector expansion on a mode expansion matrix to obtain an input vector and an output vector. On FIG. 10 shows performing a mode expansion on a specified subspace of a layered multidimensional space by means of a mode expansion operator to obtain a mode expansion matrix, and performing a string vector expansion on the mode expansion matrix to obtain an input vector and an output vector.
Использование новых технологий, таких как трансферное обучение, для реализации интеллектуального корреляционного анализа сетевой аварийной сигнализации, а также автоматической локации и автоматического устранения неисправностей оказалось в центре внимания текущих исследований для операторов и производителей. Ключевая операция трансферного обучения самоустранению неисправностей оптической сети состоит в формальном описании данных в исходном домене и данных в целевом домене, чтобы осуществлять преобразование данных аварийной сигнализации, данных о неисправностях и конфигурационных данных по оптической сети, ориентированных на специалистов по эксплуатации и техобслуживанию, в выборочные данные, ориентированные на машинное обучение, и гибкое манипулирование указанными выборочными данными, что включает в себя определение пересекающихся и разностных множеств выборочных данных в исходном домене и целевом домене и точное извлечение части выборочных данных для тестирования и анализа. Способ обработки выборочных данных в варианте осуществления настоящего изобретения обеспечивает возможность построения более эффективной модели выборочных данных и облегчения операций, таких как извлечение и сравнение выборочных данных, и способствует эффективному построению модели трансферного обучения.The use of new technologies such as transfer learning to implement intelligent correlation analysis of network alarms and automatic location and automatic troubleshooting has become the focus of ongoing research for operators and manufacturers. The key operation of the optical network self-recovery transfer learning is to formally describe the data in the source domain and the data in the target domain in order to convert alarm data, fault data, and configuration data over the optical network targeted at O&M personnel into sample data. oriented to machine learning and flexible manipulation of the specified sample data, which includes the definition of intersecting and difference sets of sample data in the source domain and the target domain and the exact extraction of a part of the sample data for testing and analysis. The sample data processing method in the embodiment of the present invention enables a more efficient sample data model to be built and facilitates operations such as sample data extraction and comparison, and facilitates efficient transfer learning model building.
В качестве примера на Фиг. 11 показана блок-схема подпространственной сегментации, развертывания режима и развертывания строкового вектора многоуровневого многоразмерного пространства для трансферного обучения.As an example, in FIG. 11 shows a block diagram of subspace segmentation, mode expansion, and string vector expansion of a layered multidimensional space for transfer learning.
В левой части Фиг. 11 показано многоуровневое многоразмерное пространство Ds исходного домена. Строят входной вектор и выходной вектор исходного домена соответственно с помощью первого оператора fsi развертывания режима и второго оператора fso развертывания режима и строят подпространство Ds′ исходного домена посредством первого оператора gs подпространственной сегментации.On the left side of Fig. 11 shows the multi-level multi-dimensional space D s of the original domain. An input vector and an output vector of the source domain are constructed, respectively, using the first mode deployment operator f si and the second mode deployment operator f so , and the source domain subspace D s ′ is constructed using the first subspace segmentation operator g s .
В правой части Фиг. 11 показано многоуровневое многоразмерное пространство целевого домена. Строят входной вектор трансферного обучения и выходной вектор целевого домена соответственно посредством третьего оператора fti развертывания режима и четвертого оператора fto развертывания режима и строят подпространство целевого домена Dt′ посредством второго оператора gt подпространственной сегментации.On the right side of Fig. 11 shows the multi-level multi-dimensional space of the target domain. The transfer learning input vector and the target domain output vector are constructed respectively by means of the third mode deployment operator f ti and the fourth mode deployment operator f to , and the target domain subspace D t ′ is constructed by the second subspace segmentation operator g t .
Входной вектор Vysi исходного домена и входной вектор Vyti целевого домена вместе образуют входной вектор трансферного обучения для интеллектуального самоустранения неисправностей оптической сети. Выходной вектор Vyso исходного домена и выходной вектор Vyto целевого домена вместе образуют выходной вектор трансферного обучения для интеллектуального самоустранения неисправностей оптической сети.The input vector V ysi of the source domain and the input vector V yti of the target domain together form the input transfer learning vector for intelligent self-troubleshooting of the optical network. The output vector V yso of the source domain and the output vector V yto of the target domain together form a transfer learning output vector for intelligent self-troubleshooting of the optical network.
В процессе обработки выборочных данных, согласно конкретным фактическим сценариям применения сначала извлекают подпространство, содержащее наиболее критичные атрибутивные данные в качестве целевых данных, из многоуровневой многоразмерной модели и затем строят входной вектор и выходной вектор на основе указанного подпространства. Используют сложную функцию fsiogsi: Ds→Vysi для построения входного вектора исходного домена, где операционный символ о показывает, что сначала выполняется операция gsi, а затем операция fsi. Используют сложную функцию fsoogso: Ds→Vyso для построения выходного вектора исходного домена. Для данных целевого домена при неисправности оптической сети, в варианте осуществления настоящего изобретения используют сложную функцию ftiogti: Dt→Vyti для построения входного вектора целевого домена, и используют сложную функцию ftoogto: Dy→Vyto для построения выходного вектора целевого домена.In the process of sample data processing, according to specific actual application scenarios, first extract the subspace containing the most critical attribute data as target data from the multi-level multidimensional model, and then build an input vector and an output vector based on the specified subspace. The complex function f si og si : D s →V ysi is used to construct the input vector of the initial domain, where the operational symbol o indicates that the operation g si is performed first, and then the operation f si . The complex function f so og so : D s →V yso is used to construct the output vector of the initial domain. For target domain data at optical network failure, the embodiment of the present invention uses the complex function f ti og ti : D t →V yti to construct the target domain input vector, and uses the complex function f to og to : D y →V yto to construct the output vector of the target domain.
Как показано на Фиг. 12, в варианте осуществления согласно настоящему изобретению дополнительно предложена система обработки выборочных данных, которая выполнена с возможностью реализации способов по вышеуказанным вариантам осуществления. Система обработки выборочных данных содержит преобразовательный модуль 101 и модуль 102 построения пространства.As shown in FIG. 12, in an embodiment according to the present invention, a sample data processing system is further provided that is capable of implementing the methods of the above embodiments. The sample data processing system includes a
Модуль 101 построения пространства выполнен с возможностью получения данных аварийной сигнализации, данных о неисправностях и конфигурационных данных по меньшей мере одной целевой сети за множество моментов времени из базы данных и соответствующего их преобразования в соответствующие векторы.The
Модуль 102 построения пространства выполнен с возможностью построения, для по меньшей мере одной целевой сети, многоуровневого многоразмерного пространства, содержащего уровень данных аварийной сигнализации, уровень данных о неисправностях и уровень конфигурационных данных каждой целевой сети, причем каждый уровень представляет собой двумерную матрицу, имеющую один и тот же размер, и выполнен с возможностью сохранения векторов, полученных в результате преобразования, в соответствии с последовательностью моментов времени.The
В других вариантах осуществления система обработки выборочных данных дополнительно содержит модуль 103 извлечения, который выполнен с возможностью извлечения входного вектора модели машинного обучения из уровня данных аварийной сигнализации и уровня данных о неисправностях и извлечения выходного вектора модели машинного обучения из уровня конфигурационных данных.In other embodiments, the sample data processing system further comprises an
Более конкретно, модуль 103 содержит блок 1031 подматричной обработки и блок 1032 вычисления матрицы.More specifically,
Блок 1031 подматричной обработки выполнен с возможностью извлечения подпространства, содержащего целевые данные, из многоуровневого многоразмерного пространства, причем указанное подпространств содержит по меньшей мере одну подматрицу уровня данных аварийной сигнализации, уровня данных о неисправностях и уровня конфигурационных данных.The sub-matrix processing unit 1031 is configured to extract a sub-space containing target data from a multi-level multi-dimensional space, said sub-space containing at least one sub-matrix of an alarm data level, a fault data level, and a configuration data level.
Блок 1032 вычисления матрицы выполнен с возможностью последовательного выполнения развертывания режима и развертывания строкового вектора на уровне данных аварийной сигнализации и уровне данных о неисправностях для получения входного вектора; последовательного выполнения развертывания режима и развертывания строкового вектора на уровне конфигурационных данных для получения выходного вектора и последовательного выполнения развертывания режима и развертывания строкового вектора на указанном подпространстве для получения входного вектора и/или выходного вектора.The matrix calculator 1032 is configured to sequentially perform mode expansion and string vector expansion at the alarm data layer and the fault data layer to obtain an input vector; sequentially performing mode expansion and string vector expansion at the configuration data level to obtain an output vector; and sequentially performing mode expansion and string vector expansion on the specified subspace to obtain an input vector and/or output vector.
Более конкретно, модуль 102 построения пространства содержит блок 1021 предварительной матричной обработки и блок 1022 построения матрицы.More specifically, the
Блок 1021 предварительной матричной обработки выполнен с возможностью сохранения векторов, полученных в результате преобразования, с одним и тем же источником данных в строках двумерной пустой матрицы в соответствии с последовательностью моментов времени так, чтобы получить матрицу аварийной сигнализации, матрицу неисправностей и конфигурационную матрицу каждой целевой сети соответственно.The matrix pre-processing unit 1021 is configured to store the vectors resulting from the transformation with the same data source in the rows of a two-dimensional empty matrix according to the sequence of time points so as to obtain an alarm matrix, a fault matrix, and a configuration matrix of each target network. respectively.
Блок 1022 построения матрицы выполнен с возможностью соответствующего сохранения матрицы аварийной сигнализации, матрицы неисправностей и конфигурационной матрицы на уровне данных аварийной сигнализации, уровне данных о неисправностях и уровне конфигурационных данных многоуровневого многоразмерного пространства и заполнения матричных элементов, не имеющих сохраненных значений, на каждом уровне нулевыми значениями.The matrix builder 1022 is configured to appropriately store the alarm matrix, the fault matrix, and the configuration matrix in the alarm data layer, the fault data layer, and the configuration data layer of the multi-level multi-dimensional space, and populate the matrix elements having no stored values at each level with zero values. .
Как показано на Фиг. 13, в варианте осуществления согласно настоящему изобретению дополнительно предложено устройство для обработки сетевых неисправностей, основанное на модели машинного обучения. Устройство для обработки сетевых неисправностей содержит систему 200 диагностики неисправностей и систему 100 обработки выборочных данных по вышеуказанным вариантам осуществления.As shown in FIG. 13, in an embodiment according to the present invention, a network fault handling apparatus based on a machine learning model is further provided. The network fault processing apparatus includes the
Система 200 диагностики неисправностей содержит модуль 201 построения модели и модуль 202 управления вводом-выводом. Модуль 201 построения модели выполнен с возможностью получения входного вектора и выходного вектора от системы обработки для построения модели машинного обучения, причем входной вектор извлекается из уровня данных аварийной сигнализации и уровня данных о неисправностях, а выходной вектор извлекается из уровня конфигурационных данных.The
Модуль 202 управления вводом-выводом выполнен с возможностью получения данных аварийной сигнализации и данных о неисправностях целевой сети, их соответствующего преобразования в соответствующие векторы, ввода этих векторов в модуль 201 построения модели и передачи выходного вектора модуля 201 построения модели на целевую сеть.The I/
В вышеуказанных вариантах осуществления это может быть реализовано полностью или частично посредством программного обеспечения, аппаратных средств, программно-аппаратных средств или любой их комбинации. В случае реализации посредством программного обеспечения, это может быть реализовано полностью или частично в виде компьютерного программного продукта. Компьютерный программный продукт содержит одну или более компьютерных инструкций. При загрузке в компьютер и исполнении на нем компьютерных программных инструкций, полностью или частично генерируются процессы или функции согласно вариантам осуществления настоящего изобретения. Компьютер может представлять собой компьютер общего назначения, специализированный компьютер, компьютерную сеть или другие программируемые устройства. Компьютерные инструкции могут храниться на машиночитаемом носителе для хранения данных или переданы с одного машиночитаемого носителя для хранения данных на другой машиночитаемый носитель для хранения данных. Например, компьютерные инструкции могут быть переданы с одного веб-сайта, компьютера, сервера или центра сбора и обработки данных на другой веб-сайт, компьютер, сервер или центр сбора и обработки данных с помощью проводных средств (например, коаксиального кабеля, оптического волокна, цифровой абонентской линии связи (digital subscriber line, DSL)) или беспроводных средств (например, инфракрасного излучения, СВЧ-излучения и так далее). Машиночитаемый носитель для хранения данных может представлять собой любой доступный носитель, который может считываться компьютером или устройством хранения данных, таким как сервер или центр сбора и обработки данных, объединенный с одним или более доступными носителями. Доступный носитель может представлять собой магнитный носитель (например, гибкий диск, жесткий диск, магнитную ленту), оптический носитель (например, цифровой видеодиск (digital video disc, DVD)) или полупроводниковый носитель (например, твердотельный диск (solid-state disk, SSD)), и так далее.In the above embodiments, this may be implemented in whole or in part by software, hardware, firmware, or any combination thereof. If implemented by software, it may be implemented in whole or in part as a computer program product. The computer program product contains one or more computer instructions. By downloading and executing computer program instructions to a computer, processes or functions are generated in whole or in part in accordance with embodiments of the present invention. The computer may be a general purpose computer, a specialized computer, a computer network, or other programmable devices. The computer instructions may be stored on a computer-readable storage medium or transferred from one computer-readable storage medium to another computer-readable storage medium. For example, computer instructions may be transmitted from one website, computer, server, or data center to another website, computer, server, or data center using wired means (e.g., coaxial cable, optical fiber, digital subscriber line (DSL) or wireless media (eg infrared, microwave, etc.). Computer-readable storage media can be any available media that can be read by a computer or storage device, such as a server or data center, combined with one or more available media. The available media can be magnetic media (e.g., floppy disk, hard disk, magnetic tape), optical media (e.g., digital video disc (DVD)) or semiconductor media (e.g., solid-state disk (SSD). )), and so on.
Настоящее изобретение не ограничивается вышеуказанными вариантами осуществления. Специалисты в данной области техники могут создавать различные улучшения и модификации без отклонения от принципов настоящего изобретения, и эти улучшения и модификации также считаются находящимися в пределах объема защиты настоящего изобретения. Содержание, которое не описано подробно в настоящем описании, относится к предшествующему уровню техники, хорошо известному специалистам в данной области техники.The present invention is not limited to the above embodiments. Various improvements and modifications can be made by those skilled in the art without deviating from the principles of the present invention, and these improvements and modifications are also considered to be within the protection scope of the present invention. The content that is not described in detail in the present description, refers to the prior art, well known to experts in this field of technology.
Claims (18)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910128534.5 | 2019-02-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2780710C1 true RU2780710C1 (en) | 2022-09-29 |
Family
ID=
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050146426A1 (en) * | 2003-09-30 | 2005-07-07 | Goncalo Pereira | Method and apparatus for identifying faults in a network that has generated a plurality of fault alarms |
RU2330387C2 (en) * | 2002-04-30 | 2008-07-27 | Квэлкомм Инкорпорейтед | Switching communication channels in inactive mode with channel substitution according to list of neighbours |
US20160370797A1 (en) * | 2015-06-16 | 2016-12-22 | Kla-Tencor Corporation | System and Method for Monitoring Parameters of a Semiconductor Factory Automation System |
CN106844161A (en) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | Abnormal monitoring and Forecasting Methodology and system in a kind of carrier state stream calculation system |
US20180253015A1 (en) * | 2013-10-02 | 2018-09-06 | Asml Netherlands B.V. | Methods and apparatus for obtaining diagnostic information relating to an industrial process |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2330387C2 (en) * | 2002-04-30 | 2008-07-27 | Квэлкомм Инкорпорейтед | Switching communication channels in inactive mode with channel substitution according to list of neighbours |
US20050146426A1 (en) * | 2003-09-30 | 2005-07-07 | Goncalo Pereira | Method and apparatus for identifying faults in a network that has generated a plurality of fault alarms |
US20180253015A1 (en) * | 2013-10-02 | 2018-09-06 | Asml Netherlands B.V. | Methods and apparatus for obtaining diagnostic information relating to an industrial process |
US20160370797A1 (en) * | 2015-06-16 | 2016-12-22 | Kla-Tencor Corporation | System and Method for Monitoring Parameters of a Semiconductor Factory Automation System |
CN106844161A (en) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | Abnormal monitoring and Forecasting Methodology and system in a kind of carrier state stream calculation system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | A study of deep learning networks on mobile traffic forecasting | |
CN113033811B (en) | Processing method and device for two-quantum bit logic gate | |
CN106503106B (en) | A kind of image hash index construction method based on deep learning | |
WO2019109771A1 (en) | Power artificial-intelligence visual-analysis system on basis of multi-core heterogeneous parallel computing | |
CN111600735B (en) | Sample data processing method, system and device | |
CN106209989A (en) | Spatial data concurrent computational system based on spark platform and method thereof | |
JP2017199149A (en) | Learning device, learning method, and learning program | |
WO2021047021A1 (en) | Information mining method and apparatus, device, and storage medium | |
CN111639230B (en) | Similar video screening method, device, equipment and storage medium | |
TW202201285A (en) | Neural network training method, video recognition method, computer equipment and readable storage medium | |
CN104820700B (en) | Processing method of unstructured data of transformer substation | |
CN105468770A (en) | Data processing method and system | |
CN111600734B (en) | Network fault processing model construction method, fault processing method and system | |
RU2780710C1 (en) | Method, system, and apparatus for processing sample data | |
CN117453937B (en) | Automatic generation method and device for power grid graph data model | |
CN115544029A (en) | Data processing method and related device | |
CN111538772B (en) | Data exchange processing method and device, electronic equipment and storage medium | |
Riaz et al. | Filtering the big data based on volume, variety and velocity by using Kalman filter recursive approach | |
CN112905571A (en) | Train rail transit sensor data management method and device | |
CN115277704B (en) | Cloud playing system based on distributed preloading | |
CN116503420A (en) | Image segmentation method based on federal learning and related equipment | |
CN109861846A (en) | Using call relation acquisition methods, system and storage medium | |
CN114968992A (en) | Data identification cleaning and compensation method and device, electronic equipment and storage medium | |
EP3246900B1 (en) | Matrix and key generation device, matrix and key generation system, matrix coupling device, matrix and key generation method, and program | |
De Silva et al. | The “higher” status language does not always win: The fall of English in India and the rise of Hindi |