RU2749969C1 - Digital platform for classifying initial data and methods of its work - Google Patents

Digital platform for classifying initial data and methods of its work Download PDF

Info

Publication number
RU2749969C1
RU2749969C1 RU2019145127A RU2019145127A RU2749969C1 RU 2749969 C1 RU2749969 C1 RU 2749969C1 RU 2019145127 A RU2019145127 A RU 2019145127A RU 2019145127 A RU2019145127 A RU 2019145127A RU 2749969 C1 RU2749969 C1 RU 2749969C1
Authority
RU
Russia
Prior art keywords
data
generalized
nomenclature
database
digital
Prior art date
Application number
RU2019145127A
Other languages
Russian (ru)
Inventor
Александр Владимирович Царёв
Original Assignee
Александр Владимирович Царёв
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Александр Владимирович Царёв filed Critical Александр Владимирович Царёв
Priority to RU2019145127A priority Critical patent/RU2749969C1/en
Application granted granted Critical
Publication of RU2749969C1 publication Critical patent/RU2749969C1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Abstract

FIELD: information technology.
SUBSTANCE: invention relates to a digital platform for classifying initial data. The digital platform for classifying the source data has the first element and the second element, the first element being configured to receive, process the source data and create generalized data after processing them, and the second element is configured to access the generalized data. The first element contains the third element, made with the possibility of forming the nomenclature list to a tree-like nested form based on the received data, and the fourth element made with the possibility of converting the set of selected characteristics into all possible realistic combinations. The third and fourth elements are made with the possibility of processing the initial data in parallel to each other. The first element contains the fifth element configured to store generalized data after processing.
EFFECT: increasing the efficiency of generalization of initial data by clarifying the accuracy of their identification in a single information space by creating a classifier with the assignment of a digital code and fixing the description of the initial data in the form of a standard.
6 cl, 11 dwg

Description

Область техникиTechnology area

Группа изобретений относится к средствам управления данными, в частности к устройствам классификации исходных данных, а именно к цифровой платформе, которая классифицирует информацию с использованием любых сведений, создает номенклатуру виртуальных образов обобщенных данных с присвоением цифрового кода и закрепления описания обобщенных данных в виде эталона. Кроме того, заявленная группа изобретений обеспечивает абсолютную идентификацию обобщенных данных в системе с существующими данными при онлайн кодировании и декодировании исходных данных.The group of inventions relates to data management tools, in particular to devices for classifying initial data, namely, a digital platform that classifies information using any information, creates a nomenclature of virtual images of generalized data with the assignment of a digital code and fixing the description of generalized data in the form of a standard. In addition, the claimed group of inventions provides absolute identification of generalized data in the system with existing data during online encoding and decoding of the original data.

Автоматизированная система классификации исходных данных может быть использована в различных отраслях промышленности, экономики, медицины, науки, других сферах деятельности человека, а также при автоматизации бизнес-процессов на производстве и/или создании/наполнении баз данных.The automated system for the classification of initial data can be used in various industries, economics, medicine, science, and other areas of human activity, as well as in the automation of business processes in production and / or the creation / filling of databases.

Уровень техникиState of the art

Количество данных, управляемых и обрабатываемых в системах обмена данными предприятия, ведомства огромное и быстро увеличивается. Большая часть этих данных активно управляется и содержится в структурированном виде в общих каталогах или хранится в специализированных базах данных.The amount of data managed and processed in enterprise data exchange systems, departments is enormous and is growing rapidly. Most of this data is actively managed and contained in a structured form in public catalogs or stored in specialized databases.

Известен патент RU 172742 на полезную модель «Автоматизированная система ведения нормативно-справочной информации», опубл. 21.07.2017.Known patent RU 172742 for a useful model "Automated system for maintaining reference information", publ. 21.07.2017.

Полезная модель относится к вычислительной технике, в частности, к автоматизированной системе ведения нормативно-справочной информации системы 112. Техническим результатом является повышение быстродействия системы путем локализации адресов учетных записей базы данных классификаторов по их идентификаторам. Подобный анализ позволяет выбрать модели ведения нормативно-справочной информации по всем функциональным направлениям. Недостатком системы является фиксированный набор характеристик для идентификации.The utility model relates to computer technology, in particular, to an automated system for maintaining the normative and reference information of the system 112. The technical result is to increase the speed of the system by localizing the addresses of the accounts of the classifier database by their identifiers. Such an analysis allows you to choose a model for maintaining regulatory and reference information in all functional areas. The disadvantage of the system is a fixed set of characteristics for identification.

Известен патент RU 2544752 на изобретение «Конвейер классификации данных, включающий в себя правила автоматической классификации», опубл. 20.03.2015. Изобретение относится к средствам управления данными. Технический результат заключается в уменьшении времени обработки элементов данных. Обнаруживают элемент данных. Классифицируют элемент данных с использованием одного или более свойств, связанных с элементом данных, для формирования, связанного с ним набора свойств классификации, причем эти одно или более свойств включают в себя имеющиеся свойства классификации, связанные с элементом данных, при этом элемент данных классифицируется одним или более компонентами классификации. Агрегируют наборы свойств классификации, когда элемент данных классифицируется двумя или более компонентами классификации. Применяют политику к элементу данных на основе, по меньшей мере одного из набора свойств классификации и агрегированных наборов свойств классификации. Недостатком технического решения является отсутствие связей между свойствами (одно свойство может ограничивать допустимые значения другого свойства), нет общего рубрикатора, по сути есть одна единственная рубрика с набором классификаторов - тип файл.Known patent RU 2544752 for the invention "Conveyor of data classification, including the rules of automatic classification", publ. 03/20/2015. The invention relates to data management tools. The technical result is to reduce the processing time of data items. Find the item. The data item is classified using one or more properties associated with the data item to generate an associated set of classification properties, the one or more properties including existing classification properties associated with the data item, wherein the data item is classified by one or more components of the classification. Sets of classification properties are aggregated when a data item is classified by two or more classification components. A policy is applied to a data item based on at least one of a set of classification properties and aggregated sets of classification properties. The disadvantage of the technical solution is the absence of links between properties (one property can restrict the permissible values of another property), there is no general rubricator, in fact there is one single rubric with a set of classifiers - the file type.

Известен ОКПД 2 - Общероссийский классификатор продукции по видам экономической деятельности (см. Интернет: https://classifikators.ru/okpd). Объектами классификации в ОКПД 2 является продукция (услуги, работы).Known OKPD 2 - All-Russian classifier of products by type of economic activity (see Internet: https://classifikators.ru/okpd). The objects of classification in OKPD 2 are products (services, works).

ОКПД 2 построен на основе гармонизации со Статистической классификацией продукции по видам деятельности в Европейском экономическом сообществе (КПЕС 2008) - Statistical Classification of Products by Activity in the European Economic Community, 2008 version (CPA 2008) путем сохранения без изменения в ОКПД 2 из КПЕС 2008 кодов (до шести знаков включительно) и объемов понятий соответствующих позиций. При этом имеются случаи, для которых национальные особенности отражаются путем изменения группировок CPA 2008 с 2 - 6-разрядными кодами. Особенности, отражающие потребности российской экономики по детализации продукции, учитываются в группировках ОКПД 2 с 7-9-разрядными кодами. Объектами классификации в ОКПД 2 является продукция (услуги, работы).OKPD 2 is built on the basis of harmonization with the Statistical Classification of Products by Activity in the European Economic Community, 2008 version (CPA 2008) by keeping unchanged in OKPD 2 from CPA 2008 codes (up to six characters inclusive) and the scope of concepts of the corresponding positions. At the same time, there are cases for which national characteristics are reflected by changing the CPA 2008 groupings with 2 - 6-digit codes. Features that reflect the needs of the Russian economy for product detailing are taken into account in the OKPD 2 groups with 7-9-bit codes. The objects of classification in OKPD 2 are products (services, works).

Классификатор ОК 034-2014 КПЕС 2008 представляет собой древовидную структуру кодов ОКПД 2 продукции, построенных по иерархическому принципу. Классификатор ОКПД2 используется для решения проблем каталогизации при сертификации однородных групп продукции, построенных на основе группировок кодов ОКПД 2. Каждый код ОКПД2 содержит 2-9 цифр вида ХХ.ХХ.ХХ.ХХХ Классификатор ОК 034-2014 имеет восьмиступенчатую иерархическую классификацию. Первую ступень кода ОКПД 2 составляют разделы классификатора КПЕС 2008 имеющие буквенное обозначение (А, В и т.д.), затем идут классы классификатора ОКПД 2 XX, далее подклассы ХХ.Х, группы ХХ.ХХ, подгруппы кода ОКПД ХХ.ХХ.Х, виды ХХ.ХХ.ХХ, категории ХХ.ХХ.ХХ.ХХ0 и, наконец, подкатегории ХХ.ХХ.ХХ.ХХХ Соответствие кодовых обозначений ОКПД 2 и КПЕС 2008 между вторым и третьим, четвертым и пятым знаками кода ОКПД 2 обеспечивается разделителем - точкой. Дополнительные уровни ОКПД 2 по сравнению с КПЕС 2008 разделяются точкой между шестым и седьмым знаками кода ОКПД. В случаях отсутствия деление вида на категории, 7-9 знаки кода ОКПД 2 имеют нулевое значение.Classifier OK 034-2014 CPA 2008 is a tree-like structure of OKPD 2 codes of products, built according to a hierarchical principle. The OKPD2 classifier is used to solve cataloging problems in the certification of homogeneous product groups, built on the basis of the OKPD2 code groupings. Each OKPD2 code contains 2-9 digits of the form XX.XX.XX.XXX. OKPD2 classifier 034-2014 has an eight-step hierarchical classification. The first stage of the OKPD 2 code is made up of sections of the KPES 2008 classifier with a letter designation (A, B, etc.), then the classes of the OKPD 2 XX classifier, then subclasses XX.X, groups XX.XX, subgroups of the OKPD code XX.XX. X, types XX.XX.XX, categories XX.XX.XX.XX0 and, finally, subcategories XX.XX.XX.XXX The correspondence of OKPD 2 code designations and CPA 2008 between the second and third, fourth and fifth characters of OKPD 2 code is ensured the separator is a period. Additional levels of OKPD 2 in comparison with CPA 2008 are separated by a dot between the sixth and seventh characters of the OKPD code. In the absence of the division of the species into categories, 7-9 characters of the OKPD 2 code have zero value.

К недостатку классификатора можно отнести следующее: в классификаторе детализация классификационного деления прекращается на уровне подкатегорий продукции (товаров, работ, услуг), что не позволяет идентифицировать продукцию как товарные единицы.The disadvantage of the classifier can be attributed to the following: in the classifier, the detailing of the classification division stops at the level of product subcategories (goods, works, services), which does not allow identifying products as commodity units.

Известен КТРУ - Каталог товаров, работ, услуг для обеспечения государственных и муниципальных нужд (см. Интернет: http://zakupki.gov.ru/epz/ktru/start/startPage.html). Под КТРУ понимается систематизированный перечень товаров, работ, услуг, закупаемых для обеспечения государственных и муниципальных нужд (далее - каталог), сформированный на основе Общероссийского классификатора продукции по видам экономической деятельности (ОКПД2) ОК 034-2014. Код позиции каталога формируется на каждую позицию каталога и представляет собой уникальный цифровой код на основе кода ОКПД2.Known KTRU - Catalog of goods, works, services to meet state and municipal needs (see the Internet: http://zakupki.gov.ru/epz/ktru/start/startPage.html). KTRU is understood as a systematized list of goods, works, services purchased to meet state and municipal needs (hereinafter referred to as the catalog), formed on the basis of the All-Russian Classifier of Products by Types of Economic Activity (OKPD2) OK 034-2014. The catalog item code is generated for each catalog item and is a unique digital code based on the OKPD2 code.

Принцип описания характеристик КТРУ ЕИС, носит экспертно-директивный характер. Однако в КТРУ отсутствует запись уникальных характеристик виртуального образа товарной единицы, т.к. не используется автоматизированный алгоритм генерации и описания всех вариантов характеристик товаров, включенных в соответствующую позицию каталога. Часть КТРУ некоторых характеристик имеет диапазоны в описании эталона. Эта причина исключает возможность использования КТРУ в качестве цифрового символа.The principle of describing the characteristics of the UIS KTRU is of an expert-directive nature. However, the KTRU does not contain a record of the unique characteristics of the virtual image of a commodity item, since an automated algorithm for generating and describing all variants of the characteristics of goods included in the corresponding catalog item is not used. Some of the KTRU of some characteristics have ranges in the description of the standard. This reason excludes the possibility of using KTRU as a digital symbol.

В заявленной группе изобретений представлено устройство классификации исходных данных (цифровая платформа) и способ его работы в системе обмена данными, в основе которой лежит принцип полной идентификации номенклатуры с реальными данными (например, товарами при онлайн кодировании и декодировании товаров) и также представлен способ формирования кода цифрового стандарта номенклатуры (ЦСН).In the claimed group of inventions, a device for classifying initial data (digital platform) and a method for its operation in a data exchange system is presented, which is based on the principle of complete identification of the nomenclature with real data (for example, goods for online coding and decoding of goods) and also a method for generating a code digital nomenclature standard (TsSN).

Раскрытие изобретенияDisclosure of invention

Целью заявленной группы изобретений является создание единой информационной среды - цифровой платформы классификации исходных данных (в том числе - для участников бизнес-процессов в рамках отраслевых и межотраслевых взаимодействий), способа работы указанной цифровой платформы, а также способа формирования кода цифрового стандарта номенклатуры.The aim of the claimed group of inventions is to create a unified information environment - a digital platform for the classification of initial data (including for participants in business processes within industry and cross-industry interactions), the way the specified digital platform works, as well as the way to generate a digital nomenclature standard code.

Техническим результатом является повышение эффективности обобщения исходных данных за счет уточнения точности их идентификации в едином информационном пространстве путем создания классификатора с присвоением цифрового кода и закреплением описания исходных данных в виде эталона. Повышение точности идентификации исходных данных при их онлайн кодировании и декодировании в автоматизированной системе осуществляется, в том числе, за счет создания номенклатуры виртуальных образов исходных данных. Исходными данными также могут являться различные товары, работы, услуги (далее - ТРУ), любые информационные ресурсы, например, ГОСТы, данные научных исследований, архивы и др.The technical result is to increase the efficiency of generalization of the initial data by clarifying the accuracy of their identification in a single information space by creating a classifier with the assignment of a digital code and fixing the description of the initial data in the form of a standard. An increase in the accuracy of identification of initial data during their online encoding and decoding in an automated system is carried out, inter alia, by creating a nomenclature of virtual images of initial data. The initial data can also be various goods, works, services (hereinafter referred to as TRU), any information resources, for example, GOSTs, scientific research data, archives, etc.

Указанный технический результат достигается на основе обобщения (совмещения, сопоставления) иерархического и фасетного методов классификации и создания принципиально новой идентификации любой единицы информации, основанной на обобщении исходных данных, с присвоением указанной единице информации персонального кода цифрового стандарта номенклатуры.The specified technical result is achieved on the basis of generalization (combination, comparison) of the hierarchical and faceted classification methods and the creation of a fundamentally new identification of any unit of information based on the generalization of the initial data, with the assignment of a personal code of a digital nomenclature standard to the specified unit of information.

Указанный технический результат достигается тем, что разработана цифровая платформа классификации исходных данных, содержащая первый элемент, представляющий собой первое устройство для хранения и обработки информации, имеющее в своем составе по меньшей мере один первый сервер, второй элемент, представляющий собой второе устройство для хранения и обработки информации, имеющее в своем составе по меньшей мере один второй сервер, и при этом первый элемент выполнен с возможностью приема, обработки исходных данных и создания обобщенных данных после их обработки, а второй элемент выполнен с возможностью обращения к обобщенным данным, созданным первым элементом, для осуществления идентификации исходных данных, при этом первый элемент выполнен с возможностью осуществления функции классификатора исходных данных с присвоением им кода цифрового стандарта номенклатуры и закреплением описания исходных данных в виде эталона, при этом функция классификатора реализована посредством параллельного осуществления классификации исходных данных по иерархическому и фасетному методам классификации, причем для обеспечения возможности классификации по иерархическому методу по меньшей мере один первый сервер содержит последовательно установленные третий элемент формирования номенклатурного списка к древовидному вложенному виду на основе полученных исходных данных, седьмой элемент создания структурированных данных из данных, полученных от третьего элемента формирования номенклатурного списка, выполненный с возможностью приведения полученных данных в вид, пригодный для импорта в базу данных, восьмой элемент передачи структурированных данных, выполненный с возможностью приема данных от седьмого элемента создания структурированных данных и передачи их в базу данных, а для обеспечения возможности классификации по фасетному методу по меньшей мере один первый сервер содержит последовательно установленные четвертый элемент преобразования выделенных характеристик исходных данных, выполненный с возможностью выделения множества характеристик исходных данных и преобразования их в реалистичные сочетания характеристик исходных данных, девятый элемент создания структурированных данных из данных, полученных от четвертого элемента преобразования выделенных характеристик исходных данных, выполненный с возможностью приведения полученных данных в вид, пригодный для импорта в базу данных, десятый элемент передачи структурированных данных, выполненный с возможностью приема данных от девятого элемента создания структурированных данных и передачи их в базу данных, при этом первый элемент дополнительно содержит шестой элемент создания обобщенных данных, выполненный с возможностью приема структурированных данных через восьмой и десятый элементы передачи структурированных данных от третьего элемента формирования номенклатурного списка и четвертого элемента преобразования выделенных характеристик исходных данных, создания логических связей между данными, полученными по иерархическому и фасетному методам классификации, и присвоения созданным логическим связям кода цифрового стандарта номенклатуры, и пятый элемент хранения обобщенных данных, включающий базу данных для хранения обобщенных данных, выполненную с возможностью идентификации кода цифрового стандарта номенклатуры обобщенных данных с исходными данными, а второй элемент соединен с пятым элементом хранения обобщенных данных, и выполнен с возможностью обращения к обобщенным данным, хранящимся в пятом элементе хранения обобщенных данных, посредством внешних запросов либо использования веб-интерфейса для обслуживания обобщенных данных, при этом второй элемент выполнен с возможностью при обращении к обобщенным данным идентифицировать их с исходными данными посредством кода цифрового стандарта номенклатуры, и, при наличии идентификации, осуществлять генерацию реестра кодов артикула исходных данных, а при отсутствии идентификации - осуществлять регистрацию образа исходных данных в базе данных.The specified technical result is achieved by the fact that a digital platform for classifying initial data has been developed, comprising a first element representing a first device for storing and processing information, including at least one first server, a second element representing a second device for storing and processing information containing at least one second server, and the first element is configured to receive, process the initial data and create generalized data after processing, and the second element is configured to access the generalized data created by the first element, for identification of the initial data, while the first element is configured to perform the function of the classifier of the initial data with the assignment of a digital nomenclature standard code to them and fixing the description of the initial data in the form of a standard, while the function of the classifier is implemented by means of a parallel implementation the classification of the initial data according to the hierarchical and faceted classification methods, and to provide the possibility of classification according to the hierarchical method, at least one first server contains sequentially installed third element of forming the nomenclature list to a tree-like nested view based on the received initial data, the seventh element of creating structured data from the data , received from the third element of the formation of the nomenclature list, made with the possibility of bringing the received data into a form suitable for import into the database, the eighth element for transmitting structured data, made with the possibility of receiving data from the seventh element for creating structured data and transferring them to the database, and to ensure the possibility of classification by the facet method, at least one first server contains sequentially installed fourth element of transformation of the selected characteristics of the initial data, performed with possibly by isolating a set of characteristics of the original data and transforming them into realistic combinations of characteristics of the original data, the ninth element of creating structured data from the data obtained from the fourth element of transforming the selected characteristics of the original data, made with the ability to bring the obtained data into a form suitable for import into a database, the tenth element for transmitting structured data, configured to receive data from the ninth element for creating structured data and transfer it to the database, while the first element further comprises a sixth element for creating generalized data, configured to receive structured data through the eighth and tenth elements for transmitting structured data from the third element of the formation of the nomenclature list and the fourth element of the transformation of the selected characteristics of the source data, the creation of logical links between the data obtained by the hierarchical and faceted method classifications, and assigning to the created logical links a digital nomenclature standard code, and a fifth element for storing generalized data, including a database for storing generalized data, configured to identify a digital nomenclature standard code for generalized data with the original data, and the second element is connected to the fifth storage element generalized data, and is configured to access the generalized data stored in the fifth generalized data storage element through external requests or use the web interface to serve the generalized data, while the second element is configured to identify them with the original data when accessing the generalized data by means of a digital nomenclature standard code, and, if identification is available, generate a register of source data article codes, and in the absence of identification, register the source data image in the database.

Также указанный технический результат достигается тем, что первый и второй элементы выполнены с возможностью автономной работы друг относительно друга.Also, the specified technical result is achieved in that the first and second elements are made with the possibility of autonomous operation relative to each other.

Также указанный технический результат достигается тем, что седьмой и девятый элементы создания структурированных данных выполнены с возможностью приведения полученных данных в табличный вид либо в вид списка.Also, the specified technical result is achieved by the fact that the seventh and ninth elements for creating structured data are made with the ability to bring the received data into a tabular form or a list.

Также указанный технический результат достигается тем, что обобщенные данные могут представлять собой структуру базы данных.Also, the specified technical result is achieved by the fact that the generalized data can be a database structure.

Также указанный технический результат достигается тем, что реестр кодов артикула исходных данных, с возможностью генерации которого выполнен второй элемент, может включать в себя данные информации пользователя для дополнительной идентификации исходных данных.Also, the specified technical result is achieved in that the register of codes of the article of the initial data, with the possibility of generating which the second element is made, can include user information data for additional identification of the initial data.

Указанный технический результат также достигается способом работы цифровой платформы классификации исходных данных, который содержит следующие этапы: прием, обработку исходных данных, классификацию исходных данных с присвоением им кода цифрового стандарта номенклатуры и закреплением описания исходных данных в виде эталона, создание обобщенных данных посредством первого элемента, представляющего собой первое устройство для хранения и обработки информации, имеющее в своем составе по меньшей мере один первый сервер, предоставление доступа первым элементом для работы с обобщенными данными второму элементу, представляющему собой второе устройство для хранения и обработки информации, имеющее в своем составе по меньшей мере один второй сервер, при этом классификацию исходных данных осуществляют по меньшей мере одним первым сервером параллельно по иерархическому и фасетному методам классификации, причем при проведении иерархического метода классификации последовательно осуществляют: формирование номенклатурного списка к древовидному вложенному виду посредством третьего элемента формирования номенклатурного списка, приведение данных, полученных от третьего элемента формирования номенклатурного списка, в вид, пригодный для импорта в базу данных посредством седьмого элемента создания структурированных данных, передачу в базу данных структурированных данных, принятых восьмым элементом передачи структурированных данных от седьмого элемента создания структурированных данных, при проведении иерархического метода классификации последовательно осуществляют: выделение множества характеристик исходных данных и преобразование их в реалистичные сочетания характеристик исходных данных посредством четвертого элемента преобразования выделенных характеристик исходных данных, создание структурированных данных посредством приведения данных, полученных от четвертого элемента преобразования выделенных характеристик исходных данных, в вид, пригодный для импорта в базу данных посредством девятого элемента создания структурированных данных, передачу в базу данных структурированных данных, принятых десятым элементом передачи структурированных данных от девятого элемента создания структурированных данных, создание обобщенных данных осуществляют посредством шестого элемента создания обобщенных данных, выполняя прием структурированных данных через восьмой и десятый элементы передачи структурированных данных от третьего элемента формирования номенклатурного списка и четвертого элемента преобразования выделенных характеристик исходных данных, создание логических связей между данными, полученными по иерархическому и фасетному методам классификации, и присвоение созданным логическим связям кода цифрового стандарта номенклатуры,The specified technical result is also achieved by the method of operation of the digital platform for the classification of source data, which contains the following stages: reception, processing of source data, classification of source data with the assignment of a digital nomenclature standard code to them and fixing the description of the source data in the form of a standard, creation of generalized data by means of the first element, representing the first device for storing and processing information, including at least one first server, providing access by the first element for working with generalized data to the second element, which is a second device for storing and processing information, including at least one second server, while the classification of the initial data is carried out by at least one first server in parallel according to the hierarchical and faceted classification methods, and when the hierarchical classification method is carried out sequentially: formed naming the nomenclature list to a tree-like nested form by means of the third element of forming the nomenclature list, bringing the data received from the third element of forming the nomenclature list into a form suitable for import into the database by means of the seventh element of creating structured data, transferring structured data received by the eighth to the database element of transmission of structured data from the seventh element of creation of structured data, when carrying out the hierarchical method of classification, the following is carried out sequentially: the selection of a set of characteristics of the original data and their transformation into realistic combinations of characteristics of the original data by means of the fourth element of transformation of the selected characteristics of the original data, the creation of structured data by means of bringing the data from the fourth element of transformation of the selected characteristics of the source data into a form suitable for import into the database by means of the ninth element of creation of structured data, transfer to the database of structured data received by the tenth element of transmission of structured data from the ninth element of creation of structured data, creation of generalized data is carried out by means of the sixth element of creation of generalized data, performing reception of structured data through the eighth and tenth elements of transmission of structured data from the third the element for forming the nomenclature list and the fourth element for transforming the selected characteristics of the source data, creating logical links between the data obtained by the hierarchical and faceted classification methods, and assigning the code of the digital standard for the nomenclature to the created logical links,

- после чего обобщенные данные передают в пятый элемент хранения обобщенных данных и записывают в базу данных для хранения обобщенных данных, выполненную с возможностью присвоения кода цифрового стандарта номенклатуры для идентификации обобщенных данных с исходными данными,- after which the generalized data is transferred to the fifth storage element of the generalized data and recorded in the database for storing the generalized data, configured to assign a digital nomenclature standard code to identify the generalized data with the original data,

- при этом предоставление доступа первым элементом для работы с обобщенными данными второму элементу осуществляют посредством обращения через внешние запросы либо по веб-интерфейсу к обобщенным данным, хранящимся в пятом элементе хранения обобщенных данных,- in this case, the provision of access by the first element for working with generalized data to the second element is carried out by accessing through external requests or via the web interface to the generalized data stored in the fifth element of storage of generalized data,

- а идентификацию обобщенных данных с исходными данными проводят посредством присвоенного кода цифрового стандарта номенклатуры, и, при наличии идентификации, осуществляют генерацию реестра кодов артикула исходных данных, а при отсутствии идентификации осуществляют регистрацию образа исходных данных в базе данных.- and the identification of the generalized data with the initial data is carried out by means of the assigned code of the digital nomenclature standard, and, if identification is available, the register of the initial data article codes is generated, and in the absence of identification, the initial data image is registered in the database.

Сущность заявленной группы изобретений поясняется чертежами, где на фиг. 1 приведено схематичное изображение заявленного устройства, на фиг. 2 структурно показан способ работы цифровой платформы, на фиг. 3 показана структурная схема генерации способа формирования кода цифрового стандарта номенклатуры (КЦСН), фиг. 4-9 поясняют работу фиг. 1-3.The essence of the claimed group of inventions is illustrated by drawings, where in FIG. 1 shows a schematic representation of the claimed device, FIG. 2 structurally shows a method of operation of a digital platform, FIG. 3 shows a block diagram of generating a method for generating a code of a digital nomenclature standard (KCSN), FIG. 4-9 explain the operation of FIG. 1-3.

Осуществление изобретенияImplementation of the invention

Согласно фиг. 1 цифровая платформа классификации исходных данных содержит первый элемент 1 и второй элемент 2, которые представляют собой любое, широко известное из уровня техники, устройство хранения и обработки информации, например, это может быть сервер. Первый элемент 1 представляет собой по меньшей мере одно устройство хранения и обработки информации.As shown in FIG. 1, the digital platform for classifying the original data contains the first element 1 and the second element 2, which are any information storage and processing device widely known from the prior art, for example, it can be a server. The first element 1 represents at least one information storage and processing device.

Второй элемент 2 представляет собой по меньшей мере одно устройство хранения и обработки информации. При этом указанные первый и второй элементы 1, 2 работают автономно друг от друга и взаимонезаменяемы, при этом серверы внутри элемента 1 могут быть взаимозаменяемыми, серверы внутри элемента 2 также могут быть взаимозаменямыми. Первый элемент 1 выполнен с возможностью хранения обобщенных данных. Указанные обобщенные данные могут быть выполнены в виде структуры, могут представлять собой базу данных, либо могут быть выполнены в любом другом удобном для потребителя виде. Потребителем обобщенных данных может быть пользователь ПК, компьютерная программа, либо любое другое лицо или устройство, способное к их анализу. Количество устройств первого и второго элементов зависит от объема хранящейся и обрабатываемой на них информации.The second element 2 represents at least one information storage and processing device. In this case, the specified first and second elements 1, 2 operate independently of each other and are interchangeable, while the servers inside the element 1 can be interchangeable, the servers inside the element 2 can also be interchangeable. The first element 1 is configured to store generalized data. The specified generalized data can be executed in the form of a structure, can be a database, or can be performed in any other convenient form for the consumer. The consumer of the aggregated data can be a PC user, a computer program, or any other person or device capable of analyzing them. The number of devices of the first and second elements depends on the amount of information stored and processed on them.

Первый элемент имеет возможность параллельно и в один и тот же момент времени осуществлять классификацию по иерархическому и фасетному методам классификации. Иерархический метод представляет собой, так называемую, «подготовку ветвей дерева» и состоит из третьего, седьмого и восьмого элементов конструкции заявленного устройства. Третий элемент 3 выполнен с возможностью формирования номенклатурного списка к древовидному вложенному виду. Седьмой элемент 7 выполнен с возможностью взаимодействия с элементом 3 и осуществляет приведение информации элемента 3 к табличному виду или в вид списка, применимому для импорта в базу данных, т.е. создания обобщенных данных по итогам их обработки элементом 3. Восьмой элемент 8 выполнен с возможностью импорта подготовленных данных элементом 7 в базу данных.The first element has the ability to simultaneously and at the same time to carry out the classification according to the hierarchical and faceted classification methods. The hierarchical method is the so-called "preparation of tree branches" and consists of the third, seventh and eighth structural elements of the claimed device. The third element 3 is made with the possibility of forming a nomenclature list to a tree-like nested form. The seventh element 7 is configured to interact with the element 3 and converts the information of the element 3 to a tabular form or to a list view applicable for import into a database, i.e. creating generalized data based on the results of their processing by element 3. The eighth element 8 is configured to import prepared data by element 7 into the database.

Фасетный метод представляет собой, так называемую, «подготовку массива характеристик» и состоит из четвертого, девятого, десятого элементов конструкции заявленного устройства. Четвертый элемент 4 выполнен с возможностью преобразования множества выделенных характеристик во все возможные реалистичные сочетания. Под «всеми возможными реалистичными сочетаниями» подразумеваются сочетания характеристик исходных данных, направленных на идентификацию конкретного ТРУ или идентификацию любой другой запрошенной информации. Девятый элемент 9 выполнен с возможностью взаимодействия с элементом 4 и осуществляет приведение информации элемента 4 к табличному виду или в вид списка, применимому для импорта в базу данных, т.е. создания обобщенных данных по итогам их обработки элементом 4. Десятый элемент 10 выполнен с возможностью импорта подготовленных данных элементом 9 в базу данных.The facet method is a so-called "preparation of an array of characteristics" and consists of the fourth, ninth, tenth structural elements of the claimed device. The fourth element 4 is configured to convert a plurality of selected characteristics into all possible realistic combinations. By “all possible realistic combinations” are meant combinations of characteristics of the original data aimed at identifying a specific GWS or identifying any other requested information. The ninth element 9 is configured to interact with the element 4 and converts the information of the element 4 to a tabular form or to a list view applicable for import into a database, i.e. creating generalized data based on the results of their processing by element 4. The tenth element 10 is configured to import the prepared data by element 9 into the database.

Подготовка «ветвей дерева» и подготовка «массива характеристик» может быть осуществлена посредством ввода запрашиваемых потребителем данных как в ручном режиме (оператором ПК, либо экспертом по работе с внешними данными нужной области знаний), так и посредством компьютерного программного обеспечения, нейросетей, либо любыми другими средствами, способными обрабатывать информацию.The preparation of the "tree branches" and the preparation of the "array of characteristics" can be carried out by entering the data requested by the consumer both in manual mode (by a PC operator, or by an expert on working with external data of the required area of knowledge), and by means of computer software, neural networks, or any other means capable of processing information.

Элемент 1 также включает в себя шестой элемент 6, который выполнен с возможностью создания логических связей между иерархическим и фасетным методами, т.е. между «деревом» и «характеристиками». Элемент 6 расположен перед пятым элементом 5 и после элемента 8 и элемента 10, выполнен с возможностью передачи данных от элементов 8, 10 элементу 5. Импорт данных от элементов 8, 10 элементу 6 осуществляется параллельно и одновременно и передается для хранения элементу 5 только посредством элемента 6.Item 1 also includes a sixth item 6 that is configured to create logical relationships between hierarchical and faceted methods, i. E. between "tree" and "characteristics". Element 6 is located in front of the fifth element 5 and after element 8 and element 10, is configured to transfer data from elements 8, 10 to element 5. Import of data from elements 8, 10 to element 6 is carried out in parallel and simultaneously and is transmitted for storage to element 5 only by means of element 6.

Предпочтительно, но не обязательно, создание логических связей элемента 6 представлено с помощью дополнительных списковт Пример создания логических связей элемента 6 приведен ниже в виде примера.Preferably, but not necessarily, the creation of logical links of item 6 is represented using additional lists. An example of creating logical links of item 6 is given below by way of example.

Элементы 3-10 могут быть любыми элементами, широко известными из уровня техники, имеющиеми способность выполнения функций обработки, передачи и хранения данных, и входящими в конструкцию сервера (элемента 1).Elements 3-10 can be any elements widely known from the prior art, having the ability to perform functions of processing, transmitting and storing data, and are included in the design of the server (element 1).

Второй элемент 2 (см. фиг. 1) выполнен с возможностью взаимодействия с элементом 5 конструкции заявленного устройства, а также имеет возможность обработки внешних запросов от пользователей и потребителей обобщенных данных. Взаимодействие элемента 2 и элемента 5 осуществляется посредством создания запросов на языках программирования, широко известных из уровня техники (например, SQL), а также посредством поддержания веб-интерфейса для обслуживания обобщенных исходных данных (базы данных) на элементе 5.The second element 2 (see Fig. 1) is designed to interact with the design element 5 of the claimed device, and also has the ability to process external requests from users and consumers of generalized data. The interaction of element 2 and element 5 is carried out by creating queries in programming languages widely known from the prior art (for example, SQL), as well as by maintaining a web interface for serving generalized source data (database) on element 5.

Эля ускорения работы элемента 2 может использоваться система MemCache. Также для взаимодействия с элементом 5 элемент 2 выполнен с возможностью обновления характеристик номенклатурного дерева, а также создания API интерфейса для работы с данными.To speed up the work of element 2, the MemCache system can be used. Also, to interact with element 5, element 2 is configured to update the characteristics of the nomenclature tree, as well as create an API interface for working with data.

Согласно фиг. 2 способ характеризует работу заявленной цифровой платформы и включает в себя следующие этапы. Происходит прием и работа оператора с внешними данными (могут быть, например, ГОСТ или любая другая информация). Далее происходит анализ указанных данных посредством иерархического и фасетного способов. Иерархический способ включает в себя формирование номенклатурного списка к древовидному вложенному виду, далее приведение его к табличному виду, применимому для импорта в базу данных, после этого осуществляют импорт подготовленных данных в базу данных.As shown in FIG. Method 2 characterizes the operation of the claimed digital platform and includes the following steps. The operator receives and works with external data (for example, GOST or any other information). Next, the analysis of the specified data takes place by means of hierarchical and faceted methods. The hierarchical method includes the formation of the nomenclature list to a tree-like nested form, then bringing it to a tabular form applicable for import into a database, after which the prepared data is imported into the database.

Одновременно с этим происходит анализ данных фасетным способом.At the same time, the data is analyzed in a faceted manner.

Указанный способ включает преобразование множества выделенных характеристик во все возможные реалистичные сочетания, после этого происходит приведение полученных данных к табличному виду, применимому для импорта в базу данных, далее осуществляют импорт подготовленных данных в базу данных. Импорт подготовленных данных, полученный по итогам применения двух способов классификации, осуществляется в базу данных через этап создания логических связей с помощью дополнительных таблиц между указанными способами. После этого предоставляется доступ к базе данных посредством обработки внешних запросов. Создание логических связей с помощью дополнительных таблиц осуществляется программным способом посредством известных языков программирования, тогда как подготовка «ветвей дерева» и «массива характеристик» (иерархический и фасетный способы) может быть осуществлено как вручную, либо с использованием любых других способов обработки исходных данных. После получения виртуальных данных (например, идентификация ТРУ) происходит присвоение этим данным персонального кода, с помощью которого будет возможно в дальнейшем безошибочно находить указанную информацию. Код может быть выражен символом. Обновление обобщенных данных происходит при обновлении исходных данных (например, изменился ГОСТ). API интерфейс описан на РНР и широко известен в уровне техники. Для обслуживания базы данных используется Web интерфейс, описанный на РНР.This method includes converting a set of selected characteristics into all possible realistic combinations, after which the obtained data is reduced to a tabular form applicable for import into a database, then the prepared data is imported into the database. The import of the prepared data, obtained as a result of the application of the two classification methods, is carried out into the database through the stage of creating logical links using additional tables between the indicated methods. After that, access to the database is provided by processing external requests. Creation of logical connections using additional tables is carried out programmatically using well-known programming languages, while the preparation of "tree branches" and "array of characteristics" (hierarchical and faceted methods) can be carried out either manually or using any other methods of processing the initial data. After receiving virtual data (for example, identification of TRU), this data is assigned a personal code, with the help of which it will be possible in the future to accurately find the specified information. The code can be expressed by a symbol. The generalized data is updated when the initial data is updated (for example, the GOST has changed). The API is described in PHP and is widely known in the art. To service the database, the Web interface described in PHP is used.

На фиг. 3 представлен способ формирования кода цифрового стандарта номенклатуры, который разделен на блоки. Сплошная линия на фиг. 3 обозначает основные процессы формирования кода цифрового стандарта номенклатуры, пунктирная линия обозначает дополнительные процессы.FIG. 3 shows a method for generating a code for a digital nomenclature standard, which is divided into blocks. The solid line in FIG. 3 denotes the main processes for generating the digital nomenclature standard code, the dashed line denotes additional processes.

Блок 1 отображает генерацию и обновление кода цифрового стандарта номенклатуры (КЦСН). При работе блока 1 задействованы 1, 3-10 элементы цифровой платформы. Указанный блок 1 объединяет в себя прием и обработку исходных данных, создание обобщенных данных, предоставление доступа для работы с обобщенными данными. При этом для генерации и обновления кода цифрового стандарта номенклатуры осуществляют одновременную обработку исходных данных путем классификации по иерархическому и фасетному методам, объединяют результаты указанных методов путем создания логических связей с помощью дополнительных списков между деревом и характеристиками, импортируют полученные данные для создания обобщенных данных. При этом создание обобщенных данных может представлять собой базу данных. Блок 2 отображает идентификацию КЦСН с фактическими исходными данными (которые могут быть, в том числе, товарами, работами, услугами - ТРУ) и включает в себя 2 элемент цифровой платформы. При наличии идентификации с фактическими исходными данными осуществляют генерацию реестра кодов артикула исходных данных, при отсутствии идентификации с фактическими исходными данными осуществляют регистрацию образа исходных данных в базе данных. Блок 3 представляет собой генерацию (формирование) реестра кодов артикула исходных данных (для наглядности «исходные данные» на фиг. 3 обозначены ТРУ). При этом генерация реестра кодов артикула исходных данных может включать в себя данные информации пользователя для дополнительной идентификации исходных данных, например ИНН производителя, поставщика, иные идентифицирующие сведения. Блок 2 и блок 3 предоставляют возможность доступа для работы с обобщенными данными и их дальнейшего использования пользователями, однако блок 3 имеет возможность дополнительной идентификации исходных данных за счет включения данных информации пользователя.Block 1 displays the generation and updating of the digital nomenclature standard (KCSN) code. During the operation of block 1, 1, 3-10 elements of the digital platform are involved. The specified block 1 combines the reception and processing of initial data, the creation of generalized data, providing access to work with generalized data. At the same time, to generate and update the code of the digital nomenclature standard, the initial data are processed simultaneously by classification according to hierarchical and facet methods, the results of these methods are combined by creating logical links using additional lists between the tree and characteristics, and the obtained data is imported to create generalized data. In this case, the creation of generalized data can be a database. Block 2 displays the KTSSN identification with the actual initial data (which can be, among other things, goods, works, services - TRU) and includes 2 elements of the digital platform. In the presence of identification with the actual initial data, the register of the article codes of the initial data is generated, in the absence of identification with the actual initial data, the image of the initial data is registered in the database. Block 3 represents the generation (formation) of the register of the article codes of the initial data (for clarity, the "initial data" in Fig. 3 are designated TRU). In this case, the generation of the register of the source data article codes may include user information data for additional identification of the source data, for example, the TIN of the manufacturer, supplier, and other identifying information. Block 2 and block 3 provide the ability to access for working with generalized data and their further use by users, however, block 3 has the ability to further identify the original data by including user information data.

Принцип работы заявленной цифровой платформы классификации исходных данных осуществляется следующим образом (показано на работе блоков 1-3).The principle of operation of the claimed digital platform for the classification of initial data is carried out as follows (shown at the work of blocks 1-3).

На фиг. 4 представлена реализация работы блока 1. За исходные данные приняты Национальные Стандарты РФ. Фиг. 4 иллюстрирует регистрацию в системе нового нормативного документа: идентифицируется образ исходных данных (Национальный стандарт РФ, для наглядности обозначен как ТРУ) в базе данных, если образ ТРУ есть, то происходит «Идентификация нормативного документа в соответствие с алгоритмом формирования Кода Цифрового Стандарта Номенклатуры - КЦСН», если образа ТРУ нет, то происходит «Регистрация образа ТРУ в Базе данных (Межотраслевая Цифровая Платформа №2019670008)». После регистрации образа ТРУ в базе данных происходит его идентификация в соответствии с алгоритмом формирования КЦСН и далее происходит регистрация ссылок на нормативный документ для характеристик, значений и взаимосвязей, после этого происходит генерация КЦСН исходных данных (ТРУ). Следует отметить, что регистрация ссылок на нормативный документ дает возможность вносить изменения на уровне: характеристик, значений, взаимосвязей, а также возможность анализировать КЦСН в разрезе образа ТРУ или нормативного документа.FIG. 4 shows the implementation of the work of block 1. The National Standards of the Russian Federation are taken as the initial data. FIG. 4 illustrates the registration of a new regulatory document in the system: the image of the initial data (National Standard of the Russian Federation, for clarity is designated as TRU) in the database is identified, if there is an image of the TRU, then there is "Identification of the regulatory document in accordance with the algorithm for generating the Code of the Digital Standard of the Nomenclature - KCSN ", If there is no TRU image, then there is" Registration of the TRU image in the Database (Interindustry Digital Platform №2019670008) ". After registering the image of the TRU in the database, it is identified in accordance with the algorithm for forming the KTSN and then the links to the regulatory document for the characteristics, values and relationships are registered, after which the KTSN of the initial data (TRU) is generated. It should be noted that the registration of references to a regulatory document makes it possible to make changes at the level of: characteristics, values, relationships, as well as the ability to analyze KTSSN in the context of the image of the TRU or regulatory document.

Генерацию КЦСН, как модель, можно разложить на следующие шаги: нормативный документ Национальных Стандартов РФ (исходные данные), их идентификация, создание образа ТРУ, анализ полученной информации, получение на основе анализа характеристик, значений, свойств, взаимосвязей (т.е. данных нормативных документов), получение регистрации и, как результат, ссылки на нормативный документ, далее происходит генерация данных и получение КЦСН. Здесь следует отметить, что ссылки на нормативный документ и регистрация новых версий позволили автоматизировать процесс внесения изменений в форму описания Цифрового Стандарта Номенклатуры. Указанная модель генерации КЦСН представлена на фиг. 5.The generation of KTSN, as a model, can be decomposed into the following steps: the regulatory document of the National Standards of the Russian Federation (initial data), their identification, the creation of an image of the GSS, the analysis of the information received, the analysis of the characteristics, values, properties, relationships (i.e. data normative documents), obtaining registration and, as a result, links to the normative document, then data is generated and the KTSSN is received. It should be noted here that the links to the regulatory document and the registration of new versions made it possible to automate the process of making changes to the form for describing the Digital Nomenclature Standard. The specified model for the generation of KTsSN is shown in Fig. five.

На фиг. 6 представлен процесс обновления КЦСН, показана регистрация в системе новых редакций зарегистрированного нормативного документа. При обновлении исходных данных (например, появилась новая версия нормативного документа из внешних источников), происходит анализ изменений и дополнений новой версии нормативного документа, после этого осуществляется регистрация изменений и дополнений новой версии нормативного документа в системе в соответствии со ссылками на нормативный документ, определенными при его регистрации. После этого осуществляется регистрация истории внесений изменений, а также фиксирование версий нормативного документа, после чего происходит регистрация изменений КЦСН на основе новой версии нормативного документа.FIG. 6 shows the process of updating the KCSN, shows the registration in the system of new editions of a registered normative document. When updating the initial data (for example, a new version of a regulatory document has appeared from external sources), the analysis of changes and additions to the new version of the regulatory document takes place, after which the changes and additions of the new version of the regulatory document are registered in the system in accordance with the references to the regulatory document determined during its registration. After that, the history of changes is registered, as well as the versions of the regulatory document are recorded, after which the changes to the KTSSN are registered based on the new version of the regulatory document.

При обновлении КЦСН:When updating KTSN:

- КЦСН не изменится при регистрации новой версии нормативного документа;- KCSN will not change when registering a new version of a regulatory document;

- произойдет добавление новых КЦСН при регистрации новой версии нормативного документа;- new KTSSN will be added when registering a new version of the normative document;

- КЦСН изменится при регистрации новой версии нормативного документа.- KCSN will change when registering a new version of the regulatory document.

Обновление КЦСН, как модель, можно разложить на следующие шаги: новая версия нормативного документа из внешних источников (исходные данные), анализ данных, создание новой версии нормативного документа, его идентификация, создание ссылки на нормативный документ, получение регистрации, результат истории изменений - создание новой версии нормативного документа, получение регистрации, получение изменений КЦСН. Следует отметить, что ссылки на нормативный документ и регистрация новых версий позволяют автоматизировать процесс внесения изменений в форму описания Цифрового Стандарта Номенклатуры. Для наглядности данная модель представлена на фиг. 7.Updating KCSN, as a model, can be decomposed into the following steps: a new version of a regulatory document from external sources (initial data), data analysis, creating a new version of a regulatory document, identifying it, creating a link to a regulatory document, obtaining registration, the result of a change history is creating new version of the normative document, obtaining registration, receiving changes to the KTsSN. It should be noted that references to a regulatory document and registration of new versions allow automating the process of making changes to the form for describing the Digital Nomenclature Standard. For clarity, this model is shown in Fig. 7.

Фигуры 4-7 демонстрировали работу блока 1.Figures 4-7 show how block 1 works.

Фиг. 8 показывает работу блока 2, а именно идентификацию КЦСН с фактическими исходными данными (ТРУ). При поступлении фактических ТРУ происходит деление последовательное разделение работы на 2 шага. На шаге 1 происходит определение образа ТРУ: фактическое ТРУ идентифицируется с образом ТРУ на основании нормативного документа, используемого при изготовлении (создании) ТРУ. На шаге 2 происходит идентификация значений характеристик фактического ТРУ со значениями характеристик, необходимых для идентификации ТРУ с КЦСН. При этом, здесь следует учесть, что «необходимая характеристика» - это та характеристика, при выборе значений которой, определяются значений характеристик, связанных с данной характеристикой. После шага 2 фактический ТРУ идентифицирован с КЦСН. Таким образом, для фактического ТРУ определен КЦСН и определено стандартизированное описание, основанное на соответствующем нормативном документе (исходных данных).FIG. 8 shows the operation of block 2, namely the identification of the KTSN with the actual initial data (TRU). Upon receipt of the actual TRU, a sequential division of work into 2 steps occurs. At step 1, the image of the GWU is determined: the actual GWU is identified with the image of the GWU on the basis of the regulatory document used in the manufacture (creation) of the GWU. At step 2, the values of the characteristics of the actual TRU are identified with the values of the characteristics required to identify the TRU with KTsSN. At the same time, here it should be taken into account that the "required characteristic" is that characteristic, when choosing the values of which, the values of the characteristics associated with this characteristic are determined. After step 2, the actual TRU is identified with the MCC. Thus, for the actual GWS, the KTsSN is defined and a standardized description is determined based on the corresponding regulatory document (initial data).

На фиг. 9 представлена генерация реестра Кодов Артикула ТРУ на базе КЦСН.FIG. 9 shows the generation of the register of the TRU Article Codes on the basis of KTSSN.

Следует отметить, что реестр Кодов Артикула ТРУ формируется программным способом. Код Артикула ТРУ включает в себя идентифицированный КЦСН и ИНН владельца фактического ТРУ (производитель, импортер и т.п.), что показано стрелками на приведенной схеме.It should be noted that the register of TRU Article Codes is generated by software. The TRU article code includes the identified KCSN and TIN of the owner of the actual TRU (manufacturer, importer, etc.), which is shown by arrows in the diagram below.

Ниже представлен пример реализации заявленной группы изобретений.Below is an example of the implementation of the claimed group of inventions.

Пример. Алгоритм формирования Кода Цифрового Стандарта Номенклатуры (КЦСН)Example. Algorithm for the formation of the Code of the Digital Nomenclature Standard (KCSN)

Систематизация данных ГОСТов для формирования образа товара.Systematization of GOST data to form the image of the product.

Например, образ товара - шприц однократного применения (с определенной конечной конструкцией).For example, the product image is a single-use syringe (with a certain final design).

Figure 00000001
Figure 00000001

Этап 1. Определение образа ТРУ.Stage 1. Determination of the image of TRU.

Образ ТРУ представляет собой конечный продукт, используемый в экономической системе, описывается нормативными документами. Выявлены два вида описания:The image of TRU is the final product used in the economic system, described by regulatory documents. Revealed two types of description:

1. ТРУ описывается отдельным нормативным документом.1. TRU is described in a separate regulatory document.

Например,For example,

• ШПРИЦЫ ИНЪЕКЦИОННЫЕ ОДНОКРАТНОГО ПРИМЕНЕНИЯ СТЕРИЛЬНЫЕ С ИГЛОЙ ИЛИ БЕЗ ИГЛЫ ДЛЯ ИНСУЛИНА, ГОСТ ISO 8537-2011);• SINGLE APPLICATION INJECTION SYRINGES, STERILE WITH A NEEDLE OR WITHOUT A NEEDLE FOR INSULIN, GOST ISO 8537-2011);

2. Один нормативный документ описывает все возможные варианты ТРУ.2. One regulatory document describes all possible options for TRU.

Например,For example,

• ШПРИЦЫ ИНЪЕКЦИОННЫЕ ОДНОКРАТНОГО ПРИМЕНЕНИЯ СТЕРИЛЬНЫЕ. Шприцы для ручного использования, ГОСТ Р ИСО 7886-1;• SINGLE APPLICATION INJECTION SYRINGES STERILE. Syringes for manual use, GOST R ISO 7886-1;

• ШПРИЦЫ ИНЪЕКЦИОННЫЕ ОДНОКРАТНОГО ПРИМЕНЕНИЯ СТЕРИЛЬНЫЕ. Шприцы для использования с автоматическими насосами инфузионными шприцевыми, ГОСТ Р ИСО 7886-2;• SINGLE APPLICATION INJECTION SYRINGES STERILE. Syringes for use with automatic infusion syringe pumps, GOST R ISO 7886-2;

• ШПРИЦЫ ИНЪЕКЦИОННЫЕ ОДНОКРАТНОГО ПРИМЕНЕНИЯ СТЕРИЛЬНЫЕ. Шприцы для иммунизации фиксированной дозой, автоматически приходящие в негодность после применения, ГОСТ Р ИСО 7886-3;• SINGLE APPLICATION INJECTION SYRINGES STERILE. Syringes for immunization with a fixed dose, automatically becoming unusable after use, GOST R ISO 7886-3;

• ШПРИЦЫ ИНЪЕКЦИОННЫЕ ОДНОКРАТНОГО ПРИМЕНЕНИЯ СТЕРИЛЬНЫЕ. Шприцы с устройством, препятствующим их повторному применению, ГОСТ Р ИСО 7886-4.• SINGLE APPLICATION INJECTION SYRINGES STERILE. Syringes with a device preventing their reuse, GOST R ISO 7886-4.

Основой эталонного описания ЦСН является нормативный документ.The basis for the reference description of the CSN is a normative document.

Этап 2. Анализ нормативных документов, соответствующих данному образу ТРУ.Stage 2. Analysis of normative documents corresponding to this type of TRU.

Шаг 1. Создание единой структуры характеристик для данного образа товара на основании структуризации нормативного документа.Step 1. Creation of a unified structure of characteristics for a given image of the product based on the structuring of the regulatory document.

Содержание нормативного документа преобразовывается в единую структуру характеристик по схеме их взаимосвязи.The content of the normative document is transformed into a single structure of characteristics according to the scheme of their relationship.

Figure 00000002
Figure 00000002

Шаг 2. Выявление диапазонов значений характеристик, а также их свойств на основании нормативных документовStep 2. Identification of ranges of values of characteristics, as well as their properties on the basis of regulatory documents

Для каждой характеристики прописываются все возможные наборы значений, определенные нормативным документом.For each characteristic, all possible sets of values determined by the regulatory document are prescribed.

Шаг 3. Выявление взаимосвязи характеристик на основании соответствующих нормативных документовStep 3. Revealing the relationship of characteristics on the basis of the relevant regulatory documents

Выявление взаимосвязей характеристик производится в следующей последовательности:Revealing the relationship of characteristics is carried out in the following sequence:

1. Выявляются все взаимосвязи характеристик, определенные нормативным документом;1. All interconnections of characteristics, defined by the normative document, are revealed;

2. Для каждой взаимосвязи определяется ее тип и ссылка на нормативный документ.2. For each relationship, its type and reference to the normative document are determined.

Figure 00000003
Figure 00000003

Этап 3. Формирование вариантов КЦСНStage 3. Formation of KTsSN options

Варианты КЦСН формируются программным способом на основании двух списков базы данных:KTSSN variants are generated programmatically based on two lists of the database:

1. Список характеристик и его значений, структурированных по «схеме взаимосвязи характеристик нормативного документа»;1. List of characteristics and its values, structured according to the "scheme of interrelation of the characteristics of the normative document";

2. Список взаимосвязей характеристик, в котором определен тип взаимосвязей.2. A list of relationships of characteristics, which defines the type of relationships.

Формирование КЦСН проводится программным способом в следующей последовательности:The formation of KTSSN is carried out programmatically in the following sequence:

1. Определяются варианты взаимосвязанных значений внутри набора характеристик, составляющих «Вид характеристики»;1. Variants of interrelated values are determined within the set of characteristics that make up the "Type of characteristic";

2. Определяются варианты взаимосвязанных значений между «Видами характеристик» внутри одной «Группы характеристик». Если взаимосвязи не найдены, проводится перебор всех возможных значений между «Видами характеристик» внутри одной «Группы характеристик».2. Variants of interrelated values between "Types of characteristics" within one "Group of characteristics" are determined. If no relationships are found, then all possible values are searched between the "Types of characteristics" within one "Group of characteristics".

3. Определяются варианты взаимосвязанных значений между «Группами характеристик» по данному образу ТРУ. Если взаимосвязи не найдены, проводится перебор и фиксация всех возможных значений между «Группами характеристик» по данному образу ТРУ.3. Variants of interrelated values between the "Groups of characteristics" are determined for this image of TRU. If the relationship is not found, enumeration and fixation of all possible values between the "Groups of characteristics" for the given TRU image is carried out.

В результате формируется конечное количество всех возможных вариантов ЦСН. Определяется код ЦСН и структурированное описание, полностью соответствующее нормативному документу.As a result, a finite number of all possible variants of the PSC is formed. A CSN code and a structured description are defined that fully comply with the normative document.

Благодаря этому результату возникает возможность использования кода классификатора в качестве цифрового стандарта - разрядной единицы, необходимой для цифровизации экономики.Thanks to this result, it becomes possible to use the classifier code as a digital standard - a bit unit necessary for the digitalization of the economy.

Применение заявленного технического решения снимает проблему технического характера, связанную с трудностями полной идентификации исходных данных (в том числе ТРУ) у существующих классификаторов.The application of the claimed technical solution removes the problem of a technical nature associated with the difficulties of complete identification of the initial data (including TRU) in existing classifiers.

Следовательно, предложенное изобретение является эффективным и удобным, позволяя оперировать обработанными данными на уровне бизнес-процессов отдельной группы субъектов экономики и в межотраслевом формате в целом в рамках одной информационной системы.Consequently, the proposed invention is effective and convenient, allowing you to operate with the processed data at the level of business processes of a separate group of economic entities and in an intersectoral format as a whole within one information system.

Claims (39)

1. Цифровая платформа классификации исходных данных, содержащая1. Digital platform for the classification of source data, containing - первый элемент, представляющий собой первое устройство для хранения и обработки информации, имеющее в своем составе по меньшей мере один первый сервер,- the first element, which is a first device for storing and processing information, including at least one first server, - второй элемент, представляющий собой второе устройство для хранения и обработки информации, имеющее в своем составе по меньшей мере один второй сервер, и- the second element, which is a second device for storing and processing information, including at least one second server, and - при этом первый элемент выполнен с возможностью приема, обработки исходных данных и создания обобщенных данных после их обработки,- in this case, the first element is configured to receive, process initial data and create generalized data after processing, - а второй элемент выполнен с возможностью обращения к обобщенным данным, созданным первым элементом, для осуществления идентификации исходных данных,- and the second element is configured to refer to the generalized data created by the first element in order to identify the initial data, - при этом первый элемент выполнен с возможностью осуществления функции классификатора исходных данных с присвоением им кода цифрового стандарта номенклатуры и закреплением описания исходных данных в виде эталона, при этом функция классификатора реализована посредством параллельного осуществления классификации исходных данных по иерархическому и фасетному методам классификации,- in this case, the first element is configured to perform the function of the classifier of the initial data with the assignment of a digital nomenclature standard code to them and fixing the description of the initial data in the form of a standard, while the function of the classifier is implemented through the parallel implementation of the classification of the initial data by hierarchical and faceted classification methods, - причем для обеспечения возможности классификации по иерархическому методу по меньшей мере один первый сервер содержит последовательно установленные:- moreover, to ensure the possibility of classification according to the hierarchical method, at least one first server contains sequentially installed: - третий элемент формирования номенклатурного списка к древовидному вложенному виду на основе полученных исходных данных,- the third element of the formation of the nomenclature list to a tree-like nested view based on the received initial data, - седьмой элемент создания структурированных данных из данных, полученных от третьего элемента формирования номенклатурного списка, выполненный с возможностью приведения полученных данных в вид, пригодный для импорта в базу данных,- the seventh element for creating structured data from the data received from the third element for forming the nomenclature list, made with the ability to bring the received data into a form suitable for import into a database, - восьмой элемент передачи структурированных данных, выполненный с возможностью приема данных от седьмого элемента создания структурированных данных и передачи их в базу данных,- the eighth structured data transmission element, configured to receive data from the seventh structured data creation element and transfer them to the database, - а для обеспечения возможности классификации по фасетному методу по меньшей мере один первый сервер содержит последовательно установленные:- and to ensure the possibility of classification by the facet method, at least one first server contains sequentially installed: - четвертый элемент преобразования выделенных характеристик исходных данных, выполненный с возможностью выделения множества характеристик исходных данных и преобразования их в реалистичные сочетания характеристик исходных данных,- the fourth element of transformation of the selected characteristics of the original data, made with the ability to select a set of characteristics of the original data and transform them into realistic combinations of the characteristics of the original data, - девятый элемент создания структурированных данных из данных, полученных от четвертого элемента преобразования выделенных характеристик исходных данных, выполненный с возможностью приведения полученных данных в вид, пригодный для импорта в базу данных,- the ninth element for creating structured data from the data received from the fourth element for transforming the selected characteristics of the original data, made with the ability to bring the received data into a form suitable for import into a database, - десятый элемент передачи структурированных данных, выполненный с возможностью приема данных от девятого элемента создания структурированных данных и передачи их в базу данных,- the tenth structured data transmission element, configured to receive data from the ninth structured data creation element and transfer them to the database, - при этом первый элемент дополнительно содержит:- the first element additionally contains: - шестой элемент создания обобщенных данных, выполненный с возможностью приема структурированных данных через восьмой и десятый элементы передачи структурированных данных от третьего элемента формирования номенклатурного списка и четвертого элемента преобразования выделенных характеристик исходных данных, создания логических связей между данными, полученными по иерархическому и фасетному методам классификации, и присвоения созданным логическим связям кода цифрового стандарта номенклатуры,- the sixth element for creating generalized data, made with the ability to receive structured data through the eighth and tenth elements for transmitting structured data from the third element for forming the nomenclature list and the fourth element for transforming the selected characteristics of the source data, creating logical links between data obtained by hierarchical and faceted classification methods, and assigning to the created logical links a digital nomenclature standard code, - пятый элемент хранения обобщенных данных, включающий базу данных для хранения обобщенных данных, выполненную с возможностью идентификации кода цифрового стандарта номенклатуры обобщенных данных с исходными данными,- the fifth element of storage of generalized data, including a database for storing generalized data, made with the possibility of identifying the code of the digital standard of the nomenclature of generalized data with the initial data, - а второй элемент соединен с пятым элементом хранения обобщенных данных и выполнен с возможностью обращения к обобщенным данным, хранящимся в пятом элементе хранения обобщенных данных, посредством внешних запросов либо использования веб-интерфейса для обслуживания обобщенных данных,- and the second element is connected to the fifth generalized data storage element and is configured to access the generalized data stored in the fifth generalized data storage element through external requests or use a web interface to serve the generalized data, - при этом второй элемент выполнен с возможностью при обращении к обобщенным данным идентифицировать их с исходными данными посредством кода цифрового стандарта номенклатуры и при наличии идентификации осуществлять генерацию реестра кодов артикула исходных данных, а при отсутствии идентификации осуществлять регистрацию образа исходных данных в базе данных.- in this case, the second element is made with the ability, when accessing the generalized data, to identify them with the initial data by means of the digital nomenclature standard code and, if identification is available, to generate a register of the initial data article codes, and in the absence of identification, to register the image of the initial data in the database. 2. Цифровая платформа по п. 1, отличающаяся тем, что первый и второй элементы выполнены с возможностью автономной работы друг относительно друга.2. The digital platform of claim. 1, characterized in that the first and second elements are made with the possibility of autonomous operation relative to each other. 3. Цифровая платформа по п. 1, отличающаяся тем, что седьмой и девятый элементы создания структурированных данных выполнены с возможностью приведения полученных данных в табличный вид либо в вид списка.3. The digital platform according to claim 1, characterized in that the seventh and ninth elements for creating structured data are made with the ability to bring the received data into a tabular form or a list. 4. Цифровая платформа по п. 1, отличающаяся тем, что обобщенные данные могут представлять собой структуру базы данных.4. The digital platform of claim. 1, characterized in that the generalized data can be a database structure. 5. Цифровая платформа по п. 1, отличающаяся тем, что реестр кодов артикула исходных данных, с возможностью генерации которого выполнен второй элемент, может включать в себя данные информации пользователя для дополнительной идентификации исходных данных.5. The digital platform according to claim. 1, characterized in that the register of codes of the article of the initial data, with the possibility of generating which the second element is made, may include data of user information for additional identification of the initial data. 6. Способ работы цифровой платформы классификации исходных данных по п. 1, содержащий следующие этапы:6. The method of operation of the digital platform for the classification of source data according to claim 1, containing the following steps: - прием, обработку исходных данных, классификацию исходных данных с присвоением им кода цифрового стандарта номенклатуры и закреплением описания исходных данных в виде эталона, создание обобщенных данных посредством первого элемента, представляющего собой первое устройство для хранения и обработки информации, имеющее в своем составе по меньшей мере один первый сервер,- reception, processing of initial data, classification of initial data with the assignment of a digital nomenclature standard code to them and fixing the description of the initial data in the form of a standard, creation of generalized data by means of the first element, which is a first device for storing and processing information, having at least one first server, - предоставление доступа первым элементом для работы с обобщенными данными второму элементу, представляющему собой второе устройство для хранения и обработки информации, имеющее в своем составе по меньшей мере один второй сервер,- granting access by the first element for working with generalized data to the second element, which is a second device for storing and processing information, including at least one second server, - при этом классификацию исходных данных осуществляют по меньшей мере одним первым сервером параллельно по иерархическому и фасетному методам классификации,- while the classification of the initial data is carried out by at least one first server in parallel according to the hierarchical and faceted classification methods, причем при проведении иерархического метода классификации последовательно осуществляют:moreover, when carrying out the hierarchical classification method, the following are sequentially carried out: - формирование номенклатурного списка к древовидному вложенному виду посредством третьего элемента формирования номенклатурного списка,- formation of the nomenclature list to a tree-like nested view by means of the third element of the formation of the nomenclature list, - приведение данных, полученных от третьего элемента формирования номенклатурного списка, в вид, пригодный для импорта в базу данных посредством седьмого элемента создания структурированных данных,- bringing the data received from the third element of the formation of the nomenclature list into a form suitable for import into the database by means of the seventh element of the creation of structured data, - передачу в базу данных структурированных данных, принятых восьмым элементом передачи структурированных данных от седьмого элемента создания структурированных данных,- transfer to the database of structured data received by the eighth element of the transfer of structured data from the seventh element of the creation of structured data, - а при проведении иерархического метода классификации последовательно осуществляют:- and when carrying out the hierarchical method of classification, they sequentially carry out: - выделение множества характеристик исходных данных и преобразование их в реалистичные сочетания характеристик исходных данных посредством четвертого элемента преобразования выделенных характеристик исходных данных,- selection of a set of characteristics of the original data and their transformation into realistic combinations of characteristics of the original data by means of the fourth transformation element of the selected characteristics of the original data, - создание структурированных данных посредством приведения данных, полученных от четвертого элемента преобразования выделенных характеристик исходных данных, в вид, пригодный для импорта в базу данных посредством девятого элемента создания структурированных данных,- creation of structured data by bringing the data obtained from the fourth element of transformation of the selected characteristics of the original data into a form suitable for import into a database by means of the ninth element of creating structured data, - передачу в базу данных структурированных данных, принятых десятым элементом передачи структурированных данных от девятого элемента создания структурированных данных,- transfer to the database of structured data received by the tenth element of the transfer of structured data from the ninth element of the creation of structured data, - создание обобщенных данных осуществляют посредством шестого элемента создания обобщенных данных, выполняя прием структурированных данных через восьмой и десятый элементы передачи структурированных данных от третьего элемента формирования номенклатурного списка и четвертого элемента преобразования выделенных характеристик исходных данных, создание логических связей между данными, полученными по иерархическому и фасетному методам классификации, и присвоение созданным логическим связям кода цифрового стандарта номенклатуры,- the creation of generalized data is carried out through the sixth element of the creation of generalized data, performing the reception of structured data through the eighth and tenth elements of the transmission of structured data from the third element of the formation of the nomenclature list and the fourth element of transformation of the selected characteristics of the initial data, the creation of logical links between the data obtained by the hierarchical and faceted classification methods, and assignment of the created logical links code to the digital standard of the nomenclature, - после чего обобщенные данные передают в пятый элемент хранения обобщенных данных и записывают в базу данных для хранения обобщенных данных, выполненную с возможностью присвоения кода цифрового стандарта номенклатуры для идентификации обобщенных данных с исходными данными,- after which the generalized data is transferred to the fifth storage element of the generalized data and recorded in the database for storing the generalized data, configured to assign a digital nomenclature standard code to identify the generalized data with the original data, - при этом предоставление доступа первым элементом для работы с обобщенными данными второму элементу осуществляют посредством обращения через внешние запросы либо по веб-интерфейсу к обобщенным данным, хранящимся в пятом элементе хранения обобщенных данных,- in this case, the provision of access by the first element for working with generalized data to the second element is carried out by accessing through external requests or via the web interface to the generalized data stored in the fifth element of storage of generalized data, - а идентификацию обобщенных данных с исходными данными проводят посредством присвоенного кода цифрового стандарта номенклатуры, и при наличии идентификации осуществляют генерацию реестра кодов артикула исходных данных, а при отсутствии идентификации осуществляют регистрацию образа исходных данных в базе данных.- and the identification of the generalized data with the initial data is carried out by means of the assigned code of the digital standard of the nomenclature, and if identification is available, the register of the article codes of the initial data is generated, and in the absence of identification, the image of the initial data is registered in the database.
RU2019145127A 2019-12-30 2019-12-30 Digital platform for classifying initial data and methods of its work RU2749969C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2019145127A RU2749969C1 (en) 2019-12-30 2019-12-30 Digital platform for classifying initial data and methods of its work

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2019145127A RU2749969C1 (en) 2019-12-30 2019-12-30 Digital platform for classifying initial data and methods of its work

Publications (1)

Publication Number Publication Date
RU2749969C1 true RU2749969C1 (en) 2021-06-21

Family

ID=76504721

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2019145127A RU2749969C1 (en) 2019-12-30 2019-12-30 Digital platform for classifying initial data and methods of its work

Country Status (1)

Country Link
RU (1) RU2749969C1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103119596A (en) * 2011-09-15 2013-05-22 株式会社东芝 Apparatus, method and program for document classification
RU2544752C2 (en) * 2009-04-22 2015-03-20 Майкрософт Корпорейшн Data classification conveyor including automatic classification rule
CN106354799A (en) * 2016-08-26 2017-01-25 河海大学 Subject data set multi-layer facet filtration method and system based on data quality
US20170140044A1 (en) * 2008-08-29 2017-05-18 Primal Fusion Inc. Systems and methods for semantic concept definition and semantic concept relationship synthesis utilizing existing domain definitions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170140044A1 (en) * 2008-08-29 2017-05-18 Primal Fusion Inc. Systems and methods for semantic concept definition and semantic concept relationship synthesis utilizing existing domain definitions
RU2544752C2 (en) * 2009-04-22 2015-03-20 Майкрософт Корпорейшн Data classification conveyor including automatic classification rule
CN103119596A (en) * 2011-09-15 2013-05-22 株式会社东芝 Apparatus, method and program for document classification
CN106354799A (en) * 2016-08-26 2017-01-25 河海大学 Subject data set multi-layer facet filtration method and system based on data quality

Similar Documents

Publication Publication Date Title
US11379755B2 (en) Feature processing tradeoff management
CN106663038B (en) Feature processing recipe for machine learning
CN106575246B (en) Machine learning service
US11232365B2 (en) Digital assistant platform
US10318882B2 (en) Optimized training of linear machine learning models
WO2010045331A2 (en) Method and apparatus for gathering and organizing information pertaining to an entity
SG175300A1 (en) Artificial intelligence-assisted medical reference system and method
CN107451280B (en) Data communication method and device and electronic equipment
Ananieva et al. Algorithmization of search operations in multiagent information-analytical systems
CN111913954A (en) Intelligent data standard catalog generation method and device
EP2506162A1 (en) Finding a data item of a plurality of data items stored in a digital data storage
CN113850075A (en) Method, system, device and medium for standardizing medical information data project names
Presser et al. FoodCASE: A system to manage food composition, consumption and TDS data
RU2749969C1 (en) Digital platform for classifying initial data and methods of its work
JP4287464B2 (en) System infrastructure configuration development support system and support method
Putman et al. The Monarch Initiative in 2024: an analytic platform integrating phenotypes, genes and diseases across species
Atukorala et al. Situation-oriented evaluation and prioritization of requirements
Alhgaish et al. Preserve quality medical drug data toward meaningful data lake by cluster
US10152556B1 (en) Semantic modeling platform
RU2696295C1 (en) Method of forming and structuring an electronic database
CN110689395B (en) Method and device for pushing information
CN116993091A (en) Technological achievement conversion method, device, equipment and storage medium
CN116541411A (en) SQL sentence acquisition method, report generation device, computer equipment and storage medium
CN111581514A (en) Information distribution method and device
CN114090832A (en) Method, device, equipment and storage medium for enquiring data of middle station