RU2393536C2 - Method of unified semantic processing of information, which provides for, within limits of single formal model, presentation, control of semantic accuracy, search and identification of objects description - Google Patents

Method of unified semantic processing of information, which provides for, within limits of single formal model, presentation, control of semantic accuracy, search and identification of objects description

Info

Publication number
RU2393536C2
RU2393536C2 RU2008111851/09A RU2008111851A RU2393536C2 RU 2393536 C2 RU2393536 C2 RU 2393536C2 RU 2008111851/09 A RU2008111851/09 A RU 2008111851/09A RU 2008111851 A RU2008111851 A RU 2008111851A RU 2393536 C2 RU2393536 C2 RU 2393536C2
Authority
RU
Russia
Prior art keywords
descriptions
description
values
search
objects
Prior art date
Application number
RU2008111851/09A
Other languages
Russian (ru)
Other versions
RU2008111851A (en
Inventor
Андрей Иосипович Монтиле (RU)
Андрей Иосипович Монтиле
Валерий Владимирович Фомин (RU)
Валерий Владимирович Фомин
Original Assignee
Общество с ограниченной ответственностью "Передовые сервисы и технологии"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Передовые сервисы и технологии" filed Critical Общество с ограниченной ответственностью "Передовые сервисы и технологии"
Priority to RU2008111851/09A priority Critical patent/RU2393536C2/en
Publication of RU2008111851A publication Critical patent/RU2008111851A/en
Application granted granted Critical
Publication of RU2393536C2 publication Critical patent/RU2393536C2/en

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

FIELD: information technologies.
SUBSTANCE: method combines several processes of processing: searching, identification of descriptions, replenishment of descriptions with values of criteria, expansion of criteria multitude used for description, changing sets of descriptions themselves, detection and diagnostics of false synonymy and homonymy errors and combination of above-listed actions. At the same time data is used depending on current condition and for searching-identification and for replenishment and for detection and diagnostics of errors. For processed sets of descriptions they use simple or composite keys intended to increase speed of comparison, a set of criteria used to describe objects and to compare them is dynamically replenished.
EFFECT: increased efficiency of information processing.
3 cl

Description

Изобретение относится к вычислительной технике и может использоваться как для поиска и идентификации объектов по их описаниям, так и для пополнения описаний отдельных объектов, а также для пополнения самого набора описаний объектов.The invention relates to computer technology and can be used both for searching and identifying objects according to their descriptions, and for replenishing descriptions of individual objects, as well as for replenishing the set of descriptions of objects.

Способ обеспечивает сопоставление наборов описаний объектов или ситуаций, ориентированный на работу в многопользовательских и распределенных информационных системах. Одна из областей применения - системы мониторинга, характеризующиеся, с одной стороны, разнообразием технических устройств, обеспечивающих поступление входной информации и вывод результатов, а с другой, различными методами семантического агрегирования первичных данных, определяемых проблемной и предметной спецификой решаемых с помощью системы задач. В общем случае сопоставляются два набора описаний объектов, например хранящиеся в двух различных базах данных. В частных случаях сопоставление производится между набором описаний - база и отдельным (текущим) описанием, в качестве которого рассматривается, например, набор оцифрованных сигналов известных типов, поступающий от системы датчиков или отдельного устройства, или последовательность значений признаков, вводимая пользователем посредством устройства ввода. Сами сигналы или значения могут быть как числовыми (оцифрованными), так и символьными (слова текста, лексемы) или псевдочисловыми (шкалированными).The method provides a comparison of sets of descriptions of objects or situations, oriented to work in multi-user and distributed information systems. One of the areas of application is monitoring systems, which are characterized, on the one hand, by a variety of technical devices that provide input information and output results, and, on the other hand, by various methods of semantic aggregation of primary data determined by the problematic and subject specifics of the tasks being solved using the system. In general, two sets of object descriptions are mapped, for example, stored in two different databases. In special cases, a comparison is made between a set of descriptions - the base and a separate (current) description, which is considered, for example, a set of digitized signals of known types coming from a sensor system or a separate device, or a sequence of characteristic values entered by the user through an input device. The signals or values themselves can be either numerical (digitized), or symbolic (text words, tokens) or pseudo-numeric (scaled).

В настоящее время существуют различные способы поиска-идентификации объектов по их текстовым описаниям, которые заключаются в том, что тексты, написанные на естественных языках в определенных предметных и проблемных областях, преобразуются в сигналы, пригодные для машинной обработки. Они позволяют сравнивать выборки ключевых слов, полученные при формировании запроса с тезаурусами текстов, хранящихся в базе данных (см. патенты РФ №2107942, 2167450 (на момент подачи заявки прекратил действие), 2236699, 2305314, патент США №6460034).Currently, there are various ways of searching and identifying objects by their textual descriptions, which include the fact that texts written in natural languages in certain subject and problem areas are converted into signals suitable for machine processing. They allow you to compare the samples of keywords obtained during the formation of the request with thesauri of texts stored in the database (see RF patents No. 2107942, 2167450 (at the time of application filing has expired), 2236699, 2305314, US patent No. 6460034).

В известных способах организации хранения, поиска и идентификации объектов и документов не учитываются следующие существенные особенности взаимодействия между набором описаний объектов, который можно назвать базой данных, и некоторым текущим описанием какого-то объекта, не обязательно зафиксированного в базе.Known methods for organizing the storage, search and identification of objects and documents do not take into account the following essential features of the interaction between a set of descriptions of objects, which can be called a database, and some current description of an object that is not necessarily recorded in the database.

1. Априорная неопределенность относительно принадлежности любого фрагмента текущего описания к поисковому образу либо к пополняющей информации. Во всех аналогах явно декларируется либо неявно предполагается предварительное отнесение каждой вводимой (поступающей) порций данных к поисковому образу либо пополняющей информации. В рассматриваемых областях применения вся информация может оказаться пополняющей, если в рассмотрение вводится новый объект. Другим крайним случаем является повторение уже известной (например, введенной другим пользователем) информации, либо по незнанию, либо с целью дальнейшего использования найденного описания (актуализация или смена контекста). Типичным для непрерывного взаимодействия является текущее описание, часть значений признаков в котором (никак специально не выделяемая) содержит отсылку к ранее упоминавшемуся объекту, а другая часть сообщает (по крайней мере - потенциально) новую информацию. Причем для указания на объект используются значения как действительно уникальных дескрипторов - простых либо составных ключей, так и признаков, уникальных только в контексте реализуемого кванта взаимодействия.1. A priori uncertainty as to whether any fragment of the current description belongs to the search image or to the replenishing information. In all analogs, a preliminary classification of each input (incoming) chunk of data as a search image or replenishing information is explicitly declared or implicitly assumed. In the areas of application under consideration, all information can be replenishing if a new object is introduced into consideration. Another extreme case is the repetition of information already known (for example, entered by another user), either out of ignorance or with the aim of further using the description found (updating or changing the context). Typical for continuous interaction is the current description, part of the values of the features in which (not specifically highlighted in any way) contain a reference to the previously mentioned object, and the other part reports (at least potentially) new information. Moreover, to indicate an object, the values of truly unique descriptors are used - simple or composite keys, and attributes that are unique only in the context of the interaction quantum being implemented.

Так как учет данной особенности представляется наиболее существенным, опишем еще ряд ситуаций, с неизбежностью возникающих при работе систем, относящихся к области применения заявляемого способа и требующих ее учета. При поступлении порции данных, сопоставляемой отдельному объекту (ситуации, явлению) в общем случае решается комплексная задача - найти описание этого объекта, а если такового нет, то создать его и пополнить значениями признаков. Решение задачи не может быть реализовано как последовательное решение двух отдельных задач: поиска-идентификации и пополнения найденного описания данными. Основная причина такой невозможности - система датчиков, выдавая сигнал; система технического зрения, передавая данные о выделенном объекте; пользователь многопользовательской системы, формируя запрос, принципиально не знает, что именно известно системе, так как она работает еще и с другими источниками данных и пользователями, а также, при использовании любого способа обработки данных, осуществляет по формальным правилам преобразования всего набора имеющихся описаний. Следовательно, значение любого признака в текущем описании может являться (относительно сформированного к моменту его поступления набора описаний) либо элементом поискового образа, либо пополняющей информацией, и эта «двойственность» принципиально неустранима.Since the consideration of this feature seems to be the most significant, we will describe a number of situations that inevitably arise during the operation of systems related to the field of application of the proposed method and requiring its consideration. When a portion of data is assigned that is mapped to an individual object (situation, phenomenon), in the general case, the complex task is solved - to find a description of this object, and if there is none, then create it and replenish the values of the attributes. The solution of the problem cannot be realized as a sequential solution of two separate tasks: search-identification and replenishment of the found description with data. The main reason for this impossibility is the sensor system, giving out a signal; vision system, transmitting data about the selected object; When creating a request, a user of a multi-user system does not fundamentally know what the system knows, since it also works with other data sources and users, and also, using any method of data processing, carries out formal rules for converting the entire set of available descriptions. Therefore, the value of any feature in the current description can be (relative to the set of descriptions formed at the time of its receipt) either an element of the search image or replenishing information, and this "duality" is fundamentally unremovable.

В качестве примера опишем очевидный предельный случай - описание идентифицируемого объекта, ситуации, явления уже имеется в наборе, но в текущем описании не содержится значений ни для одного из признаков, означенных в описании, то есть все данные являются пополняющими. Если интерпретировать текущее описание как поисковый образ, то ни одного описания найдено не будет. Если, например, на основании результатов поиска, интерпретировать его как данные для пополнения, то будет сформировано новое описание якобы другого объекта. Последнее объясняет, в частности, неизбежность порождения ошибки ложной синонимии при отсутствии признаков, однозначно идентифицирующих объекты, ситуации, явления.As an example, we describe an obvious limiting case - a description of an identifiable object, situation, phenomenon is already in the set, but the current description does not contain values for any of the signs indicated in the description, that is, all data is replenishing. If you interpret the current description as a search image, then no description will be found. If, for example, on the basis of the search results, it is interpreted as data for replenishment, a new description of an allegedly different object will be generated. The latter explains, in particular, the inevitability of generating an error of false synonymy in the absence of signs that uniquely identify objects, situations, and phenomena.

2. Необязательное, но возможное присутствие простых или составных дескрипторов, однозначно идентифицирующих объект и необязательность задания значений по ключевым признакам, даже если они есть, усугубляемые несовпадениями наборов дескрипторов и неоднозначностью используемых множеств их значений. Пример практической ситуации: необходимость идентификации семей - отсутствие однозначно понимаемых ключей; необходимость идентификации граждан при необязательном наличии паспортных данных - ключ есть, но значение отсутствует. Способ поиска-идентификации должен не только осуществлять поиск при отсутствии ключей, что свойственно, по крайней мере, некоторым системам обработки текстов, но и повышать эффективность поиска (сокращение времени, уменьшение выборки), если они есть.2. Optional, but possible presence of simple or compound descriptors that uniquely identify the object and the optionalness of setting values by key attributes, even if they exist, exacerbated by mismatches of descriptor sets and the ambiguity of the sets of their values used. An example of a practical situation: the need to identify families - the lack of clearly understood keys; the need to identify citizens with optional passport data - there is a key, but no value. The search-identification method should not only search in the absence of keys, which is characteristic of at least some word processing systems, but also increase the search efficiency (reduce time, reduce selection), if any.

3. Невозможность гарантировать семантическую целостность, понимаемую как непротиворечивость и полноту набора описаний объектов в любой момент его жизненного цикла, усугубляемая ошибками в поступающих данных. Наиболее значимыми в рассматриваемых областях применения представляются ошибки ложной синонимии (сопоставление двум и более описаниям из набора одного объекта) и омонимии (сопоставление одному описанию из набора двух и более объектов).3. The inability to guarantee semantic integrity, understood as the consistency and completeness of the set of descriptions of objects at any moment of its life cycle, exacerbated by errors in the incoming data. Errors of false synonymy (matching two or more descriptions from a set of one object) and homonymy (matching one description from a set of two or more objects) appear to be the most significant in the considered areas of application.

4. Ограниченная, с точки зрения рассматриваемых, в частности, самими аналогами, областей применения интерпретация понятия одинаковости (похожести). Во-первых, задача рассматривается как одноуровневая (за исключением патентов РФ №2107942, 2167450), то есть при определении одинаковости обязательно учитываются и являются единственно определяющими совпадения значений признаков. При этом связь признак-значение фиксируется явно либо опосредованно - иерархической системой тезаурусов. В то же время для ряда задач одинаковыми можно считать объекты, при описании которых используются совпадающие наборы признаков, вообще игнорируя сами значения признаков (этот крайний случай не соответствует способам, описанным в патентах РФ №2107942, 2167450). Во-вторых, одинаковыми объектами считаются объекты, для которых совпали значения всех признаков, либо в случае совпадения значений части признаков вводится некоторая, как правило, статистически определяемая количественная мера, величина которой относительно некоторого порога предопределяет вывод о соответствии либо несоответствии описания объекта поисковому образу. Использование такого способа исключает из дальнейшей обработки описания объектов, которые потенциально могут быть идентифицированы при поступлении новых данных, и снижает эффективность работы, так как процесс поиска с необходимостью повторяется по всей совокупности данных.4. Limited, from the point of view of the areas of application considered, in particular, by the analogues themselves, the interpretation of the concept of similarity (similarity). Firstly, the task is considered as a single-level (with the exception of RF patents №2107942, 2167450), that is, when determining the sameness must be taken into account and are the only determining coincidence of the values of the attributes. Moreover, the sign-value relationship is fixed explicitly or indirectly - by the hierarchical system of thesauruses. At the same time, for a number of tasks, objects can be considered identical, in the description of which matching sets of features are used, generally ignoring the values of the features themselves (this extreme case does not correspond to the methods described in RF patents No. 2107942, 2167450). Secondly, objects are considered to be identical objects for which the values of all the characteristics coincided, or in case of coincidence of the values of a part of the attributes, some, as a rule, statistically determined quantitative measure is introduced, the value of which relative to a certain threshold determines the conclusion about the correspondence or non-compliance of the object description with the search image. Using this method excludes from further processing descriptions of objects that could potentially be identified when new data arrives, and reduces work efficiency, since the search process is necessarily repeated throughout the entire data set.

Наиболее близким аналогом, принятым за прототип, является способ поиска и выборки информации из различных баз данных, описанный в патенте RU 2305314, в соответствии с которым осуществляют: поиск и выборку информации из различных баз данных, включая формирование пользователем на пользовательском компьютере, по меньшей мере, одного поискового запроса, передачу сформированного пользователем запроса через телекоммуникационные средства связи в поисковую систему сервера, обработку поисковой системой сформированных пользователем поисковых запросов путем выбора документов из различных баз данных, дополнительно поисковая система объединяет все выбранные документы по тематикам, формирует папки, каждая из которых содержит упомянутые документы, отсортированные по одной тематике, для каждой папки определяет параметры оценки релевантности, для каждого отсортированного документа каждой папки, выделяет признаки, характеризующие каждый документ, внутри каждой папки определяет рейтинг каждого признака, содержащегося в каждом отсортированном документе, определяет окончательный рейтинг каждого выбранного документа с учетом рейтинга каждого признака документа и параметра оценки релевантности папки, снова сортирует упомянутые отсортированные документы с учетом окончательного рейтинга, осуществляет структурную обработку выбранного количества документов для подготовки итогового отчета, формирует график, показывающий зависимости количества отсортированных в соответствии с окончательным рейтингом документов от текущего времени, передает на пользовательский терминал через телекоммуникационные средства связи итоговый отчет и сформированный график.The closest analogue adopted for the prototype is the method of searching and retrieving information from various databases described in patent RU 2305314, in accordance with which carry out: search and retrieval of information from various databases, including the formation of a user on a user computer, at least , one search query, transmitting a user-generated request via telecommunication means to the server’s search engine, processing the search engine’s search queries generated by the user Osov by selecting documents from various databases, in addition, the search system combines all selected documents by subject, creates folders, each of which contains the mentioned documents, sorted by one subject, determines the relevancy rating parameters for each folder, selects each folder for each sorted document, selects features that characterize each document, within each folder determines the rating of each feature contained in each sorted document, determines the final re the ting of each selected document, taking into account the rating of each document attribute and the folder relevance rating parameter, sorts the mentioned sorted documents again taking into account the final rating, carries out structural processing of the selected number of documents to prepare the final report, forms a graph showing the dependencies of the number of documents sorted in accordance with the final rating of the documents from the current time, transmits to the user terminal via telecommunications AkzoNobel Report and shaped graph.

Недостатком прототипа является ограничение функциональных возможностей только поиском информации. Кроме того, неявное определение набора признаков (формирование результатов поиска в виде структурированного набора папок, каждая из которых неявно соответствует определенному набору признаков), решающее в принципе проблему модификации наборов, не позволяет в полной мере реализовать различные интерпретации одинаковости, поскольку документы заносятся в папку (считаются найденными) при наличии в них значения каждого признака поискового образа (пересечение), а внутри папок ранжируются с помощью линейной свертки в соответствии с важностью отдельных признаков, задаваемой конкретным пользователем. Поэтому способ, описанный в прототипе, не учитывает в полной мере существенные особенности обработки входной информации, свойственные вышеперечисленным областям применения.The disadvantage of the prototype is the limitation of functionality only by the search for information. In addition, the implicit definition of a set of features (the formation of search results in the form of a structured set of folders, each of which implicitly corresponds to a specific set of features), which in principle solves the problem of modifying sets, does not allow to fully implement different interpretations of the same, as documents are stored in a folder ( considered found) if they contain the values of each attribute of the search image (intersection), and inside the folders are ranked using linear convolution in accordance with the importance individual features defined by a particular user. Therefore, the method described in the prototype does not fully take into account the essential features of the processing of input information inherent in the above areas of application.

В заявленном изобретении предложен такой способ сопоставления описаний объектов, который свободен от указанных недостатков, дополнительно учитывает вышеперечисленные особенности задач, возникающие в рассматриваемых областях применения, и, тем самым, имеет более широкие возможности применения, чем рассматриваемые аналоги.The claimed invention proposed such a method for comparing object descriptions that is free from these drawbacks, additionally takes into account the above features of the problems that arise in the considered areas of application, and, thus, has wider application possibilities than the considered analogues.

Поясним используемый нами термин «сопоставление». Способ совмещает несколько процессов, обеспечивающих решение задач, которые на настоящем уровне развития техники рассматриваются как автономные, а именно: поиска-идентификации описаний, пополнение описаний значениями признаков, расширение множества признаков, используемых для описания, изменения самих наборов описаний, обнаружение и диагностика ошибок ложной синонимии и омонимии и любой комбинации перечисленных выше действий. Данное совмещение может рассматриваться как основной признак изобретения. Термином «сопоставление» называется объединенное в рамках одного процесса решение всей совокупности вышеперечисленных задач.Let us explain the term “comparison” used by us. The method combines several processes that provide solutions to problems that are considered autonomous at the current level of technology development, namely: search-identification of descriptions, replenishment of descriptions with values of attributes, expansion of the set of signs used to describe, changes to the sets of descriptions themselves, detection and diagnosis of false errors synonymy and homonymy and any combination of the above actions. This combination can be considered as the main feature of the invention. The term “comparison” is a solution to the entire set of the above tasks combined in a single process.

Техническим результатом заявленного изобретения является обеспечение сопоставления наборов описаний объектов, ситуаций или явлений, то есть расширение функциональных возможностей путем совмещения в одном способе различных процессов обработки данных, рассматриваемых в аналогах и прототипе, как независимые; и проведения анализа получаемых результатов с расширенной относительно аналогов и прототипа интерпретацией одинаковости. Поясним последнее подробней - достижение технического результата обеспечивается совмещением двух стратегий, а именно: выбора похожих описаний и отсева заведомо неподходящих (обычно рассматриваемых как альтернативные), кроме того, в качестве сопоставляемых в каждый момент обработки рассматривают наборы описаний, в каждый момент времени их идентичность текущему описанию определяется количественной мерой оценки совпадающих значений всех, либо некоторых признаков текущего описания. Способ реализуется как циклическое выполнение в определенном порядке действий (операций) по обработке набора описаний объектов и поступающей по одному из каналов связи от одного из входных устройств последовательности сигналов текущего описания.The technical result of the claimed invention is the provision of matching sets of descriptions of objects, situations or phenomena, that is, expanding functionality by combining in one way the various data processing processes considered in the analogues and prototype as independent; and analysis of the results with an expanded interpretation of the sameness relative to analogues and prototype. Let us explain the last in more detail - the achievement of the technical result is ensured by combining two strategies, namely: the selection of similar descriptions and the elimination of obviously inappropriate (usually considered as alternative), in addition, sets of descriptions are considered as comparable at each moment of processing, at each moment of time they are identical to the current the description is determined by a quantitative measure for evaluating the coinciding values of all, or some signs of the current description. The method is implemented as a cyclic execution in a certain order of actions (operations) for processing a set of descriptions of objects and a sequence of signals of the current description received through one of the communication channels from one of the input devices.

Особенностью данного способа является то, что любые данные из описания используются в зависимости от текущего состояния для поиска-идентификации, пополнения, обнаружения и диагностики ошибок, а также для всех других действий. Другой его особенностью является то, что в нем, с одной стороны, не предполагается наличие простых или составных ключей или необходимость задания их значений, с другой стороны, наличие ключей или их значений повышает эффективность согласования, в первую очередь, с точки зрения быстродействия системы. Поскольку значения простого (один признак) или составного (несколько признаков) ключа однозначно идентифицируют описания, наличие совпадающих значений ключа, во-первых, однозначно свидетельствуют об ошибке, и, во-вторых, наличие значений в ключевых признаках текущего описания сокращает количество циклов при обработке описания, так как обработка ключа на очередном цикле, по определению, обеспечивает сопоставление текущего описания - единственному (нужное описание найдено) либо однозначному выводу об отсутствии в наборе данных описания, которое может быть сопоставлено текущему. Обе эти ситуации обеспечивают выполнение условии окончания сопоставления, и процесс завершается, хотя ряд признаков описаний остаются необработанными. Третьей особенностью является динамическое пополнение набора признаков, с помощью которых дается описание объектов и на основании которого осуществляется сопоставление. Другими словами, отсутствует и, как следствие, не используется каким либо образом фиксируемый перечень признаков, которые должны иметь значения в любых описаниях.A feature of this method is that any data from the description is used depending on the current state for search-identification, replenishment, detection and diagnosis of errors, as well as for all other actions. Another feature of it is that it, on the one hand, does not imply the presence of simple or composite keys or the need to specify their values, on the other hand, the presence of keys or their values increases the efficiency of coordination, primarily in terms of system performance. Since the values of a simple (one characteristic) or composite (several characteristics) key uniquely identify descriptions, the presence of matching key values, firstly, unambiguously indicate an error, and secondly, the presence of values in key features of the current description reduces the number of cycles during processing descriptions, since key processing on the next cycle, by definition, provides a comparison of the current description - the only (the desired description is found) or the unequivocal conclusion that there is no description in the data set, Otori can be compared to the current. Both of these situations ensure that the matching condition is completed, and the process ends, although a number of features of the descriptions remain unprocessed. The third feature is the dynamic replenishment of a set of features, with the help of which a description of objects is given and on the basis of which a comparison is made. In other words, there is no and, as a result, is not used in any way a fixed list of features that should have meaning in any descriptions.

Обозначим базовые операции D и K.Denote the basic operations D and K.

Результатом операции D является подмножество описаний из набора описаний, такое, что значение, по крайней мере, одного признака для любого вошедшего в результирующее подмножество описания совпадает со значением признака текущего описания. Другие признаки описаний могут содержать значения, не совпадающие с заданными в текущем описании.The result of operation D is a subset of descriptions from the set of descriptions, such that the value of at least one attribute for any part of the resulting subset of the description matches the attribute value of the current description. Other features of descriptions may contain values that do not match those specified in the current description.

Результатом операции K является подмножество описаний из набора описаний, такое, что для любого описания, вошедшего в него, значения всех имеющих значения признаков совпадают с заданными в текущем описании. В результирующее подмножество, в частности, входят все описания, для которых все признаки, имеющие значение в текущем описании, не имеют значений (но значение, по крайней мере, одного, не означенного в текущем описании признака определено).The result of operation K is a subset of the descriptions from the set of descriptions, such that for any description included in it, the values of all relevant values of the attributes coincide with those specified in the current description. The resulting subset, in particular, includes all descriptions for which all the attributes that are significant in the current description have no values (but the value of at least one attribute not defined in the current description is defined).

Производные (реализуются на основе базовых операций) операции обозначим И, П и Н.Derivatives (implemented on the basis of basic operations) operations are denoted by And, P and N.

И - операция выделения идентифицируемых описаний. Результатом операции И является подмножество описаний из набора описаний, такое, что для любого вошедшего в него описания, значения некоторых (по крайней мере, одного) признаков, означенных в текущем описании, совпадают со значениями, заданными в текущем описании, а остальные не означены. Сформулированное для операции И условие осуществляет совмещение выбора похожих описаний (совпадают значения одноименных признаков) и отсева заведомо непохожих описаний (несовпадение значений одноименных признаков).And - the operation of identifying identifiable descriptions. The result of the operation AND is a subset of descriptions from the set of descriptions, such that for any description included in it, the values of some (at least one) of the attributes indicated in the current description coincide with the values specified in the current description, and the rest are not indicated. Formulated for the AND operation, the condition combines the selection of similar descriptions (the values of the same-named signs coincide) and the screening of obviously dissimilar descriptions (the mismatch of the values of the same characteristics).

П - операция выделения подмножества описаний, противоречащих текущему. Результатом операции П является подмножество описаний из набора, такое, что для любого вошедшего в него описания значение по крайней мере одного признака, означенного в текущем описании, совпадает с заданным и, по крайней мере, одного не совпадает.P - the operation of selecting a subset of descriptions that contradict the current. The result of operation P is a subset of the descriptions from the set, such that for any description included in it, the value of at least one attribute indicated in the current description matches the specified one and at least one does not match.

Н - операция выделения нейтрального подмножества. Результатом операции Н является подмножество описаний из набора описаний, такое, что для любого описания, вошедшего в него, все признаки, имеющие значение в текущем описании, не имеют значений, однако, по крайней мере, по одному признаку в каждом описании означено. Результаты действия Н могут быть интерпретированы как множество описаний, которые не противоречат текущему, но и не совпадают с любым поисковым образом, который может быть сформирован на его основе.H is the operation of selecting a neutral subset. The result of operation H is a subset of the descriptions from the set of descriptions, such that for any description included in it, all the signs that are significant in the current description do not have values, however, at least one sign in each description is indicated. The results of the action H can be interpreted as a set of descriptions that do not contradict the current, but do not coincide with any search image that can be formed on its basis.

Последовательность выполнения операций определяется (тактируется) поступлением очередного фрагмента текущего описания (в предельном случае - одного значения одного признака).The sequence of operations is determined (tacted) by the arrival of the next fragment of the current description (in the extreme case, one value of one attribute).

На первом шаге выполняются операции К и И, операндами каждой из которых являются исходный набор описаний объектов и признаки первого фрагмента текущего описания.At the first step, operations K and I are performed, the operands of each of which are the initial set of object descriptions and signs of the first fragment of the current description.

После чего при обработке очередного фрагмента текущего описания:Then, when processing the next fragment of the current description:

а) выполняется операция К, операндами которой являются результат ее выполнения на предыдущем шаге и признаки очередного обрабатываемого фрагмента текущего описания;a) operation K is performed, the operands of which are the result of its execution at the previous step and the signs of the next processed fragment of the current description;

б) выполняется операция И, операндами которой являются результат выполнения операции К на предыдущем шаге и признаки очередного обрабатываемого фрагмента текущего описания;b) operation AND is performed, the operands of which are the result of operation K at the previous step and the signs of the next processed fragment of the current description;

в) выполняется операция К, операндами которой являются объединенный набор описаний, полученный при обработке предыдущего фрагмента текущего описания (шаг г), и очередной фрагмент текущего описания;c) operation K is performed, the operands of which are the combined set of descriptions obtained by processing the previous fragment of the current description (step g), and the next fragment of the current description;

г) выполняется объединение (слияние) наборов описаний, полученных на шагах б и в.d) the combination (merging) of the sets of descriptions obtained in steps b and c is performed.

Обработка заканчивается, если в результате выполнения шага а не будет найдено ни одного описания объекта или закончится текущее описание. Необходимо отметить, что отсутствие описаний, выделяемых на шаге б, не может быть использовано в качестве условия окончания, поскольку в общем случае множество «кандидатов» на идентификацию может пополняться за счет описаний, выделяемых с помощью операции Н, автономное использование которой с точки зрения сути предлагаемого способа не является обязательным (входящие в выделяемый операцией Н описания не исключаются из процесса обработки при вышеописанной организации, а включаются в результат выполнения операции К).Processing ends if, as a result of step a, no description of the object is found or the current description ends. It should be noted that the absence of descriptions highlighted in step b cannot be used as a termination condition, since in the general case, the set of “candidates” for identification can be replenished by descriptions allocated using operation H, the autonomous use of which from the point of view of essence the proposed method is not mandatory (the descriptions included in the operation H are not excluded from the processing process with the above organization, but are included in the result of the operation K).

Операция П выполняется однократно в момент окончания базового процесса. Если в результате ее выполнения не найдено ни одного описания, то процесс идентификации считается полностью завершенным. В противоположном случае оказывается нарушенным условие различимости, причиной чего может быть либо ошибка в значениях признаков (текущих или введенных ранее), либо ложное сопоставление одного описания различным объектам - ложная омонимия. Для устранения противоречия необходимо получение значений автоматически определяемых пар признаков. После их получения противоречие устраняется. В частности, вместо одного описания генерируются два, по которым разносятся имеющиеся значения признаков.Operation P is performed once at the end of the base process. If as a result of its implementation not a single description is found, then the identification process is considered to be fully completed. In the opposite case, the condition of distinguishability is violated, the reason for which may be either an error in the values of the attributes (current or entered earlier), or a false comparison of one description to different objects - false homonymy. To eliminate the contradiction, it is necessary to obtain the values of automatically determined pairs of features. After receiving them, the contradiction is eliminated. In particular, instead of one description, two are generated by which the available characteristic values are posted.

Приведем пример использования заявляемого способа для одного, достаточно часто встречающегося на практике, вида систем обработки данных, а именно - для систем, в которых используются априорно определенные ключи идентификации (набор переменных, совокупность значений которых точно идентифицирует объект), но не предполагается их обязательное использование.Here is an example of using the proposed method for one type of data processing system that is quite common in practice, namely, for systems that use a priori certain identification keys (a set of variables whose set of values exactly identifies an object), but their mandatory use is not supposed .

Результатами реализации описанного способа для данных систем являются:The results of the implementation of the described method for these systems are:

набор описаний объектов - результат финального выполнения шага г;a set of descriptions of objects - the result of the final execution of step g;

набор описаний объектов - результат выполнения операции П;a set of descriptions of objects - the result of the operation P;

набор признаков, имеющих значения в текущем описании;a set of features that are relevant in the current description;

наборы признаков, имеющих значения в результирующих наборах описаний.sets of features that are relevant in the resulting sets of descriptions.

По окончании обработки текущего описания определяется одна из нижеперечисленных ситуаций.At the end of processing the current description, one of the following situations is determined.

1. Если набор описаний объектов - результат финального выполнения шага г содержит одно описание и совпадают значения ключей, то описание найдено точно. Значения признаков текущего описания, не имеющих значений в найденном описании, могут быть зафиксированы в нем. Признаки, содержащиеся в текущем описании, но не содержащиеся в найденном, пополняют набор признаков, входящих в описания всех объектов исходного набора, в найденное описание переносятся значения этих признаков из текущего описания.1. If the set of descriptions of objects - the result of the final execution of step r contains one description and the values of the keys coincide, then the description is found exactly. Values of signs of the current description that do not have values in the found description can be fixed in it. The attributes contained in the current description, but not contained in the found one, replenish the set of attributes included in the descriptions of all objects of the original set; the values of these attributes from the current description are transferred to the found description.

2. Если набор описаний объектов - результат финального выполнения шага г содержит одно описание, но значения ключевых признаков в текущем описании отсутствуют, то описание найдено предположительно, то есть при поступлении новых текущих описаний возможно обнаружение ложной омонимии. Значения признаков текущего описания, не имеющих значений в найденном описании, могут быть зафиксированы в нем. Признаки, содержащиеся в текущем описании, но не содержащиеся в найденном, пополняют набор признаков, входящих в описания всех объектов исходного набора, в найденное описание переносятся значения этих признаков из текущего описания. Дополнительно можно отметить, что если в системе реализована обратная связь, например, система подразумевает диалог с пользователем, то может быть выдан запрос значений ключевых признаков конкретно для данного объекта, так как определены значения других его признаков. Последнее обеспечивает сведение ситуации 2 к ситуации 1.2. If the set of descriptions of the objects - the result of the final execution of step g contains one description, but the values of the key features are not present in the current description, then the description is presumably found, that is, when new current descriptions arrive, false homonymy can be detected. Values of signs of the current description that do not have values in the found description can be fixed in it. The attributes contained in the current description, but not contained in the found one, replenish the set of attributes included in the descriptions of all objects of the original set; the values of these attributes from the current description are transferred to the found description. Additionally, it can be noted that if feedback is implemented in the system, for example, the system implies a dialogue with the user, then a request for the values of key features specifically for this object can be issued, since the values of its other features are determined. The latter provides a reduction of situation 2 to situation 1.

3. Если набор описаний объектов - результат финального выполнения шага г не содержит ни одного описания и текущее описание содержит значения ключевых признаков, то введено описание нового объекта, в качестве такового оно и заносится, при этом, как и в п.1, может быть пополнен набор признаков.3. If the set of descriptions of the objects - the result of the final execution of step d does not contain any descriptions and the current description contains the values of key features, then a description of the new object is entered, as such it is entered, and, as in paragraph 1, it can be replenished a set of signs.

4. Если набор описаний объектов - результат финального выполнения шага г не содержит ни одного описания, но текущее описание не содержит значения ключевых признаков, то предположительно введено описание нового объекта, в качестве такового оно и заносится, при этом, как и в п.1, может быть пополнен набор признаков. При обработке последующих текущих описаний возможно обнаружение ложной синонимии. Если в системе реализована обратная связь, то ситуация может быть сведена к п.3.4. If the set of descriptions of the objects is the result of the final execution of step g does not contain any descriptions, but the current description does not contain the value of key features, then a description of the new object is presumably entered, as such it is entered, and, as in paragraph 1 , can be replenished a set of signs. When processing subsequent current descriptions, it is possible to detect false synonymy. If feedback is implemented in the system, the situation can be reduced to clause 3.

5. Если набор описаний объектов - результат финального выполнения шага г содержит несколько описаний и текущее описание содержит значения ключевых символов, то обнаружена ложная синонимия, описания объединяются, возможно, с пополнением набора переменных.5. If the set of descriptions of objects is the result of the final execution of step g contains several descriptions and the current description contains the meanings of key characters, then false synonyms are found, descriptions are combined, possibly with the completion of a set of variables.

6. Если набор описаний объектов - результат финального выполнения шага г содержит несколько описаний и текущее описание не содержит значения ключевых символов, то предположительно обнаружена ложная синонимия, описания объединяются, возможно, с пополнением набора переменных. При поступлении новых текущих описаний возможно обнаружение ложной омонимии. Если в системе реализована обратная связь, то ситуация может быть сведена к п.5.6. If the set of descriptions of objects - the result of the final execution of step g contains several descriptions and the current description does not contain the meaning of key characters, then false synonyms are presumably found, the descriptions are combined, possibly with replenishment of the set of variables. Upon receipt of new current descriptions, it is possible to detect false homonymy. If feedback is implemented in the system, then the situation can be reduced to paragraph 5.

7. Если набор описаний объектов - результат выполнения операции П содержит одно описание (наличие не более одного описания обеспечивается при реализации способа автоматически), отсутствие ошибки в текущем описании исключено (например, техническое квитирование или повторный ввод), и описания содержат значения ключевых переменных, то имеет место ложная омонимия. Текущее описание пополняет набор описаний, одновременно, как и в п.1, может быть пополнен набор признаков.7. If the set of object descriptions - the result of the operation П contains one description (the presence of no more than one description is provided automatically when the method is implemented), the absence of an error in the current description is excluded (for example, technical acknowledgment or re-entry), and the descriptions contain the values of key variables, then there is false homonymy. The current description replenishes the set of descriptions, at the same time, as in item 1, the set of signs can be replenished.

8. Если набор описаний объектов - результат выполнения операции П содержит одно описание (наличие не более одного описания обеспечивается при реализации способа автоматически) и одно или оба описания не содержат значения ключевых переменных, то ложная омонимия имеет место предположительно. Осуществление тех же действий, что и в п.9, может повлечь за собой в дальнейшем обнаружение ложной синонимии. Наличие обратной связи сводит ситуацию к предыдущей.8. If the set of descriptions of objects - the result of the operation P contains one description (the presence of no more than one description is provided automatically when the method is implemented) and one or both descriptions do not contain the values of key variables, then false homonymy is assumed. The implementation of the same actions as in paragraph 9, may entail the further discovery of false synonymy. The presence of feedback reduces the situation to the previous one.

Предложенный способ реализуется системой, которая может состоять из любого набора цифровых измерительных устройств или аналоговых измерительных устройств, снабженных аналого-цифровыми преобразователями, которые подключены к компьютеру, коммуникатору или мобильному телефону, В качестве входных и выходных могут быть использованы одни и те же устройства. Средством реализации предложенного способа является компьютер с Системой Управления Базой Данных (СУБД) или компьютер с программой, написанной на любом из языков программирования высокого уровня (например: Си, Java, Паскаль), которая реализует предложенный способ, или специализированное цифровое вычислительное устройство, которое реализует предложенный способ на аппаратном уровне. Методом реализации являются: в первом случае - написание на языке структурированных запросов (SQL) запросов, реализующих базовые и производные операции, обрабатываемых в вышеописанной последовательности; во втором случае - написание программы в виде оператора цикла по всем обрабатываемым описаниям и входящим в их состав признакам, тело которого содержит условные операторы, с условиями базовых и производных операций; в третьем случае - изготовление печатной платы в случае использования существующей микроэлементной базы, либо изготовление микросхемы, полностью реализующей способ на аппаратном уровне.The proposed method is implemented by a system that can consist of any set of digital measuring devices or analog measuring devices equipped with analog-to-digital converters that are connected to a computer, communicator or mobile phone. The same devices can be used as input and output devices. A means of implementing the proposed method is a computer with a Database Management System (DBMS) or a computer with a program written in any of the high-level programming languages (for example: C, Java, Pascal) that implements the proposed method, or a specialized digital computing device that implements the proposed method at the hardware level. The implementation method is: in the first case - writing in the language of structured queries (SQL) queries that implement basic and derivative operations processed in the above sequence; in the second case, writing a program in the form of a cycle operator for all processed descriptions and the attributes included in their composition, the body of which contains conditional operators, with the conditions of basic and derivative operations; in the third case, the manufacture of a printed circuit board in the case of using the existing microelement base, or the manufacture of a microcircuit that fully implements the method at the hardware level.

Поясним способы реализации, поскольку три вышеперечисленные средства используют для описания своего функционирования различную терминологию.Let us explain the implementation methods, since the three above-mentioned tools use different terminology to describe their functioning.

Обобщенная терминология - ОПИСАНИЕ состоит из набора ПРИЗНАКОВ, имеющих конкретные ЗНАЧЕНИЯ либо не имеющих значения. Сам признак - это его название, например признак описания человека - ПОЛ. Значением признака ПОЛ может быть: мужской, либо женский, либо пол может быть не указан.Generalized terminology - DESCRIPTION consists of a set of SIGNS that have specific VALUES or do not matter. The sign itself is its name, for example, the sign of a person’s description is GENDER. The value of the gender attribute may be: male, female, or gender may not be specified.

ОПИСАНИЮ при использовании в качестве средства СУБД соответствует кортеж отношения (строка таблицы), ПРИЗНАКУ- атрибут отношения (название столбца). ЗНАЧЕНИЮ - значение данного атрибута (значение, записанное в клетку таблицы, клетка может быть не заполнена - отсутствие значения обозначается NUL).A DESCRIPTION when used as a DBMS means a relationship tuple (row of a table), SIGN — attribute of a relationship (column name). VALUE - the value of this attribute (the value recorded in the table cell, the cell may not be filled - the absence of a value is indicated by NUL).

ОПИСАНИЮ при использовании в качестве средства программы соответствует набор переменных, может быть структурированный (строка, столбец), ПРИЗНАКУ - идентификатор переменной, ЗНАЧЕНИЮ - значение, которое присваивается переменной (отсутствие значения обозначается NUL).DESCRIPTION when used as a program tool corresponds to a set of variables, it can be structured (row, column), SIGN - the identifier of the variable, VALUE - the value that is assigned to the variable (the absence of a value is denoted by NUL).

ОПИСАНИЮ при реализации на аппаратном уровне соответствует набор ячеек памяти (регистр), ПРИЗНАКУ- идентифицируемая, например, номером ячейка памяти, ЗНАЧЕНИЮ - то, что в данной ячейке записано.DESCRIPTION when implemented at the hardware level corresponds to a set of memory cells (register), SIGN - identified, for example, by the number of memory cells, VALUE - what is written in this cell.

Реализация способа заключается в повторном выполнении в вышеописанной последовательности ранее определенных операций, каждая из которых сравнивает между собой два описания, одно используется в качестве образца, второе извлекается из базы данных (в произвольном порядке, например по номеру). Каждая из операций выбирает в качестве результата либо отсеивает описание из базы данных, при выполнении либо нарушении условия, специфического для данной операции (формулировки на естественном языке приведены выше), и формирует перечни признаков, которые содержатся в одном описании и не содержатся в другом; значения которых совпали и значения которых не совпали; имеющих значения в одном описании и не имеющих значений в другом. Проверка условия предполагает наличие в средстве реализации возможности осуществления трех логических операций: конъюнкции, дизъюнкции и отрицания и проверки равенства значений атрибутов, переменных, содержимого ячеек памяти. Соответствующие возможности обеспечиваются как на аппаратном уровне, так и в любой среде программирования, а также в любой версии СУБД (Брукшир Дж. Информатика и вычислительная техника. 7-е изд. - СПб.: Питер, 2004. - 620 с.). Формирование набора описаний, отобранных в качестве результата всего процесса обработки, называется сопоставлением. Конкретный вид ранее определенных условий операций и выполнение их в вышеописанной последовательности обеспечивают совмещение в одном процессе сопоставления, решение задач поиска, идентификации, пополнения, обнаружения и диагностики ошибок. Каждая из этих задач в настоящее время традиционно рассматривается как самостоятельная и, в отличие от предлагаемого способа, решение любой из них предполагает использование своего, специфического способа решения.The implementation of the method consists in the repeated execution in the above sequence of previously defined operations, each of which compares two descriptions with each other, one is used as a sample, the second is retrieved from the database (in random order, for example, by number). Each of the operations selects as a result or eliminates the description from the database, when fulfilling or violating a condition specific to the operation (wording in the natural language is given above), and generates lists of signs that are contained in one description and not contained in another; whose values coincided and whose values did not coincide; meaning in one description and meaningless in another. Verification of the condition assumes that the implementation tool has the possibility of performing three logical operations: conjunction, disjunction and negation, and verification of the equality of attribute values, variables, and contents of memory cells. The corresponding capabilities are provided both at the hardware level and in any programming environment, as well as in any version of the DBMS (Brookshire J. Computer Science and Computer Engineering. 7th ed. - St. Petersburg: Peter, 2004. - 620 p.). The formation of a set of descriptions selected as the result of the entire processing process is called matching. A specific form of previously defined conditions of operations and their execution in the above sequence provide the combination in one process of matching, solving problems of search, identification, replenishment, detection and diagnosis of errors. Each of these tasks is now traditionally regarded as independent and, unlike the proposed method, the solution to any of them involves the use of its own, specific method of solution.

Формируемые отдельными операциями наборы описаний и перечни, фиксирующие не совпадающие по различным (вышеописанным) основаниям признаки, используются соответственно для пополнения (добавления к ранее, до сопоставления сформированному) набора описаний, набора признаков и занесения в признаки их значений либо служат признаком наличия ошибки (обнаружение ошибок) и используются для их конкретизации (диагностика). Конкретизация действия: пополнения либо обнаружение и диагностика ошибки определятся, как это было описано ранее, наличием либо отсутствием требования уникальности значения конкретного признака в разных описаниях и отсутствием либо наличием этого признака в сформированных перечнях.The sets of descriptions and lists formed by separate operations that record characteristics that do not coincide on different (described above) grounds are used respectively to replenish (add to the earlier, prior to matching the generated) set of descriptions, set of signs and enter their values into signs or serve as a sign of an error (detection errors) and are used to specify them (diagnostics). Concretization of the action: replenishment or detection and diagnosis of errors will be determined, as described previously, by the presence or absence of the requirement of uniqueness of the value of a particular attribute in different descriptions and the absence or presence of this attribute in the generated lists.

Пополнение осуществляется в вышеуказанных средах:Replenishment is carried out in the above environments:

- для набора ОПИСАНИЙ, в СУБД добавлением кортежа в отношение, возможно с новыми атрибутами и их значениями, в программе - формированием нового набора переменных, возможно пополненного новыми переменными, с их значениями, на аппаратном уровне - подключением нового регистра, возможно с дополнительными ячейками памяти, и записью в них;- for a set of DESCRIPTIONS, in a DBMS by adding a tuple to a relation, possibly with new attributes and their values, in a program - by creating a new set of variables, possibly replenished with new variables, with their values, at the hardware level - by connecting a new register, possibly with additional memory cells , and a record in them;

- для набора ПРИЗНАКОВ, в СУБД добавлением новых атрибутов, в программе - определением новых переменных, на аппаратном уровне - подключением к регистрам дополнительных ячеек памяти;- for a set of SIGNS, in the DBMS by adding new attributes, in the program - by defining new variables, at the hardware level - by connecting additional memory cells to the registers;

- для набора ЗНАЧЕНИЙ, в СУБД записью значений атрибутов кортежей, в программе - присваиванием значений переменным, на аппаратном уровне - записью в ячейки памяти.- for a set of VALUES, in the DBMS by writing the values of the attributes of tuples, in the program - by assigning values to variables, at the hardware level - by writing to memory cells.

Обнаружение ошибок осуществляется обнаружением частичного несовпадения значений некоторых одноименных признаков при совпадении других одноименных признаков в двух и более описаниях. Диагностика осуществляется точным определением описаний, признаков и значений признаков, в которых ошибка обнаружена, с выделением конкретных признаков с совпавшими и несовпавшими значениями.Error detection is carried out by detecting a partial discrepancy in the values of some of the same-named signs when other similar-named signs coincide in two or more descriptions. Diagnostics is carried out by accurately determining descriptions, signs and values of signs in which an error is detected, with the allocation of specific signs with matching and mismatching values.

Обнаружение и диагностика семантических ошибок ложной омонимии и синонимии (контроль семантической правильности) осуществляется использованием в определенном для способа порядке ранее описанных операций, средства и методы осуществления которых приведены выше, и не требуют реализации никаких дополнительных относительно способа операций обработки данных.Detection and diagnosis of semantic errors of false homonymy and synonymy (control of semantic correctness) is carried out using the operations described previously for the method defined for the method, the means and methods of which are described above, and do not require any additional data processing methods.

Расширяется относительно используемых в настоящее время интерпретация понятия одинаковости. Реализованный с помощью вышеописанных средств и методов способ, помимо используемых в настоящее время интерпретаций, связанных с полным (конъюнкция) либо частичным (дизъюнкция) равенством значений одноименных признаков различных описаний, фиксирует совпадение либо несовпадение самих признаков, используемых для описания объектов. Например, одинаковыми могут считаться объекты, в описаниях которых используются одни и те же признаки, даже если значения всех этих признаков не совпадают.The interpretation of the concept of sameness is being expanded with respect to the currently used ones. The method implemented using the above-described means and methods, in addition to the currently used interpretations associated with complete (conjunction) or partial (disjunction) equality of the values of the same signs of different descriptions, fixes the coincidence or mismatch of the signs themselves used to describe objects. For example, objects can be considered identical if the descriptions of them use the same characteristics, even if the values of all these signs do not coincide.

Результаты обработки с помощью заявленного способа могут быть выданы на экран компьютера, коммуникатора или мобильного телефона, распечатаны на бумаге с помощью принтера или факсимильного аппарата, отображены на бумаге с помощью графопостроителя, сохранены на магнитных носителях, CD- и DVD-дисках и электронных картах памяти.The processing results using the inventive method can be displayed on a computer screen, communicator or mobile phone, printed on paper using a printer or fax machine, displayed on paper using a plotter, stored on magnetic media, CD and DVD discs and electronic memory cards .

Дополнительной особенностью данного способа является то, что сигналы из описанных выше устройств, а также сигналы преобразованных текстов, могут передаваться по электронным каналам связи. При этом электронные каналы связи выбирают из группы, состоящей, по меньшей мере, из телефонных, телетайпных, факсимильных, радио- и телевизионных, оптико-волоконных и электрических каналов связи.An additional feature of this method is that the signals from the above devices, as well as the signals of the converted texts, can be transmitted through electronic communication channels. In this case, electronic communication channels are selected from the group consisting of at least telephone, teletype, facsimile, radio and television, fiber-optic and electrical communication channels.

Из существующего уровня техники не выявлены объекты, которые содержали бы совокупность указанных выше существенных признаков. Это позволяет считать заявленный способ новым.From the current level of technology, objects that would contain a combination of the above essential features have not been identified. This allows us to consider the claimed method as new.

Из существующего уровня техники не известна также совокупность признаков, отличных от признаков упомянутого выше наиболее близкого аналога. Это позволяет считать заявленный способ обладающим изобретательским уровнем.From the existing level of technology is also not known a set of features other than the features of the aforementioned closest analogue. This allows us to consider the claimed method with an inventive step.

Приведенные примеры реализации настоящего изобретения служат лишь в качестве иллюстраций и никоим образом не ограничивают объема патентных притязаний, определяемого формулой изобретения.The examples of implementation of the present invention serve only as illustrations and in no way limit the scope of patent claims defined by the claims.

Claims (3)

1. Способ унифицированной семантической обработки информации, обеспечивающий в рамках одной формальной модели представление, контроль семантической правильности, поиск и идентификацию описаний объектов, заключающийся в том, что преобразуют последовательности данных, чисел, в частности слов или лексем или, по меньшей мере, одну последовательность, представляющую собой описание некоторого объекта, ситуации, процесса или явления, в частности поисковый запрос, сформированный на пользовательском компьютере, коммуникаторе или мобильном телефоне, в сигналы, пригодные для машинной обработки, используют сигналы цифровых измерительных устройств или аналоговых измерительных устройств, снабженных аналого-цифровыми преобразователями, которые подключены к компьютеру, коммуникатору или мобильному телефону, формируют описание объекта, ситуации, процесса или явления для обращения к базе данных в системе хранения и обработки информации, производят сопоставление наборов описаний объектов или текущего описания с набором описаний, совмещающее различные процессы обработки данных: поиск, идентификация, пополнение, обнаружение и диагностика ошибок, проводят анализ получаемых результатов с расширенной интерпретацией одинаковости, производят поиск-идентификацию объектов путем совмещения выбора похожих описаний и отсева заведомо неподходящих, рассматривают наборы описаний, в каждый момент времени их идентичность текущему описанию определяется количественной мерой оценки совпадающих значений всех либо некоторых признаков текущего описания, реализуют поиск-идентификацию объектов, пополнение наборов их описаний, пополнение набора признаков, обнаружение и диагностику ошибок как циклическое выполнение в определенном порядке действий по обработке набора описаний объектов и поступающей по одному из каналов связи от одного из входных устройств последовательности сигналов - текущего описания, используют данные из описания в зависимости от текущего состояния для поиска-идентификации, пополнения, обнаружения и диагностики ошибок, используют для обрабатываемых наборов описаний простые или составные ключи, предназначенные для повышения скорости сопоставления, динамически пополняют набор признаков, с помощью которых дается описание объектов, и на основании которого осуществляют сопоставление.1. A method of unified semantic information processing, providing, within the framework of one formal model, representation, control of semantic correctness, search and identification of descriptions of objects, which consists in converting sequences of data, numbers, in particular words or tokens, or at least one sequence representing a description of an object, situation, process or phenomenon, in particular a search query generated on a user computer, communicator or mobile phone efon, in signals suitable for machine processing, use the signals of digital measuring devices or analog measuring devices equipped with analog-to-digital converters that are connected to a computer, communicator or mobile phone, form a description of the object, situation, process or phenomenon to access the database in the information storage and processing system, the sets of descriptions of objects or the current description are compared with a set of descriptions, combining various data processing processes: search, identification, replenishment, detection and diagnosis of errors, analyze the obtained results with an extended interpretation of the sameness, search for and identify objects by combining the selection of similar descriptions and eliminating obviously inappropriate ones, consider sets of descriptions, at each moment of time their identity to the current description is determined by a quantitative measure assessing the coincident values of all or some of the features of the current description, implement search-identification of objects, replenishment of sets of their descriptions, replenishment of the set of signs, detection and diagnosis of errors as a cyclic execution in a certain order of actions for processing a set of descriptions of objects and a signal sequence arriving through one of the communication channels from one of the input devices — the current description, use the data from the description depending on the current state to search- identification, replenishment, detection and diagnosis of errors, use simple or compound keys for processed sets of descriptions, designed to increase the speed of representation, dynamically swell set of features by which describes objects, and based on which comparison is performed. 2. Способ по п.1, отличающийся тем, что циклически выполняют операции, осуществляющие следующие действия: выделение подмножества описаний из набора описаний такое, что для любого описания, вошедшего в него, значения всех имеющих значения признаков совпадают с заданными в текущем описании; выделение подмножества описаний из набора описаний такое, что для любого вошедшего в него описания, значения некоторых (по крайней мере, одного) признаков, означенных в текущем описании, совпадают со значениями, заданными в текущем описании, а остальные значений не имеют; объединение результатов выполнения двух вышеописанных действий, с последующей передачей результата объединения для повторной обработки совместно со следующим фрагментом текущего описания.2. The method according to claim 1, characterized in that they cyclically perform operations that perform the following actions: extracting a subset of the descriptions from the set of descriptions such that for any description included in it, the values of all the relevant values are the same as those specified in the current description; the selection of a subset of descriptions from the set of descriptions is such that for any description included in it, the values of some (at least one) features indicated in the current description coincide with the values specified in the current description, and the rest do not; combining the results of the two above-described actions, followed by the transfer of the result of combining for reprocessing together with the next fragment of the current description. 3. Способ по пп.1 и 2, отличающийся тем, что после окончания циклической обработки набора описаний и текущего описания или в каждом цикле выполняют выделение подмножества описаний из набора такое, что для любого вошедшего в него описания значение, по крайней мере, одного признака, означенного в текущем описании, совпадает с заданным и, по крайней мере, одного не совпадает, результаты которого используют для обнаружения, диагностики и исправления ошибки ложной омонимии. 3. The method according to claims 1 and 2, characterized in that after the cyclic processing of the set of descriptions and the current description or in each cycle, a subset of the descriptions is selected from the set such that for any description included in it, the value of at least one attribute , indicated in the current description, coincides with the specified and at least one does not match, the results of which are used to detect, diagnose and correct errors of false homonymy.
RU2008111851/09A 2008-03-21 2008-03-21 Method of unified semantic processing of information, which provides for, within limits of single formal model, presentation, control of semantic accuracy, search and identification of objects description RU2393536C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2008111851/09A RU2393536C2 (en) 2008-03-21 2008-03-21 Method of unified semantic processing of information, which provides for, within limits of single formal model, presentation, control of semantic accuracy, search and identification of objects description

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2008111851/09A RU2393536C2 (en) 2008-03-21 2008-03-21 Method of unified semantic processing of information, which provides for, within limits of single formal model, presentation, control of semantic accuracy, search and identification of objects description

Publications (2)

Publication Number Publication Date
RU2008111851A RU2008111851A (en) 2009-09-27
RU2393536C2 true RU2393536C2 (en) 2010-06-27

Family

ID=41169193

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008111851/09A RU2393536C2 (en) 2008-03-21 2008-03-21 Method of unified semantic processing of information, which provides for, within limits of single formal model, presentation, control of semantic accuracy, search and identification of objects description

Country Status (1)

Country Link
RU (1) RU2393536C2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2473119C1 (en) * 2011-08-05 2013-01-20 Учреждение Российской академии наук Институт Системного Анализа РАН (ИСА РАН) Method and system for semantic search of electronic documents
RU2685965C1 (en) * 2017-12-18 2019-04-23 Общество с ограниченной ответственностью "ТриниДата" Method of generating rule for obtaining inference
RU2704873C1 (en) * 2018-12-27 2019-10-31 Общество с ограниченной ответственностью "ПЛЮСКОМ" System and method of managing databases (dbms)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2591175C1 (en) * 2015-03-19 2016-07-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Method and system for global identification in collection of documents

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2473119C1 (en) * 2011-08-05 2013-01-20 Учреждение Российской академии наук Институт Системного Анализа РАН (ИСА РАН) Method and system for semantic search of electronic documents
RU2685965C1 (en) * 2017-12-18 2019-04-23 Общество с ограниченной ответственностью "ТриниДата" Method of generating rule for obtaining inference
RU2704873C1 (en) * 2018-12-27 2019-10-31 Общество с ограниченной ответственностью "ПЛЮСКОМ" System and method of managing databases (dbms)

Also Published As

Publication number Publication date
RU2008111851A (en) 2009-09-27

Similar Documents

Publication Publication Date Title
US10572817B2 (en) Graph-based organization entity resolution
US8108367B2 (en) Constraints with hidden rows in a database
US10726018B2 (en) Semantic matching and annotation of attributes
WO2017076263A1 (en) Method and device for integrating knowledge bases, knowledge base management system and storage medium
WO2021213314A1 (en) Data processing method and device, and computer readable storage medium
EP1708099A1 (en) Schema matching
CN112035599B (en) Query method and device based on vertical search, computer equipment and storage medium
CN110659282B (en) Data route construction method, device, computer equipment and storage medium
EP3732587B1 (en) Systems and methods for context-independent database search paths
US8352511B2 (en) Systems and methods for providing a confidence-based ranking algorithm
CN110795526B (en) Mathematical formula index creating method and system for retrieval system
US20200257731A1 (en) Disambiguation of massive graph databases
CN111198898B (en) Big data query method and big data query device
RU2393536C2 (en) Method of unified semantic processing of information, which provides for, within limits of single formal model, presentation, control of semantic accuracy, search and identification of objects description
KR20220031522A (en) Process to combine semantic descriptions of digital twins with knowledge graphs
CN114625748A (en) SQL query statement generation method and device, electronic equipment and readable storage medium
Berko et al. Knowledge-based Big Data cleanup method
Kimelfeld et al. Transducing markov sequences
CN114547083A (en) Data processing method and device and electronic equipment
US20150286700A1 (en) Recording medium having stored thereon database access control program, method for controlling database access, and information processing apparatus
CN112965998A (en) Compound database establishing and searching method and system
CN112988986A (en) Man-machine interaction method, device and equipment
Feki An automatic data warehouse conceptual design approach
CN112639786B (en) Intelligent landmark
Krutikhina et al. The fuzzy objects recognition in scientific and technical papers by means of natural languages processing technologies

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20180322