WO2021091432A1 - Method for the conversion of a structured data array - Google Patents

Method for the conversion of a structured data array Download PDF

Info

Publication number
WO2021091432A1
WO2021091432A1 PCT/RU2020/050319 RU2020050319W WO2021091432A1 WO 2021091432 A1 WO2021091432 A1 WO 2021091432A1 RU 2020050319 W RU2020050319 W RU 2020050319W WO 2021091432 A1 WO2021091432 A1 WO 2021091432A1
Authority
WO
WIPO (PCT)
Prior art keywords
linguistic
elements
judgments
components
computer device
Prior art date
Application number
PCT/RU2020/050319
Other languages
French (fr)
Russian (ru)
Inventor
Игорь Петрович РОГАЧЕВ
Original Assignee
Игорь Петрович РОГАЧЕВ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from RU2019135990A external-priority patent/RU2714899C1/en
Priority claimed from RU2019135992A external-priority patent/RU2717719C1/en
Priority claimed from RU2019135989A external-priority patent/RU2717718C1/en
Priority claimed from RU2019135993A external-priority patent/RU2713568C1/en
Application filed by Игорь Петрович РОГАЧЕВ filed Critical Игорь Петрович РОГАЧЕВ
Publication of WO2021091432A1 publication Critical patent/WO2021091432A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data

Definitions

  • the group of inventions relates to solutions in the field of processing data arrays, in particular, to solutions in the field of processing structured data arrays containing text in a natural language, in particular, linguistic sentences, and can be used for preliminary transformation of a structured data array to provide its subsequent processing.
  • D1 From the patent of the Russian Federation 2399959 (JSC "AVICOMP SERVICE”), published on 05/10/2010 (D1), a method of automatic indexing of texts in natural languages is known.
  • the method known from D1 is that the text is segmented in electronic form into elementary units, stable phrases are identified, sentences are formed, semantically significant objects and semantically significant relationships between them are identified, for each semantically significant relationship a set of triads is formed, in which the only triad of the first type corresponds to the relationship established by a semantically significant relationship between two semantically significant objects, while each of the triads of the second type corresponds to the value of a specific attribute of one of these semantically significant objects, each of the triads of the third type corresponds to the value of a specific attribute of the semantically significant relationship itself, then indexed on the set of the formed triads, all semantically significant objects connected by semantically significant relations separately, store the formed triads and the resulting indices in the database together with a link to the source
  • the method known from D1 does not have sufficient accuracy of indexing elements of a text in a natural language, which, in turn, affects the accuracy of the subsequent processing of a text in a natural language and the accuracy of a search in a text in a natural language. This is mainly due to insufficiently efficient pre-processing of natural language text, which, accordingly, does not allow indexing with sufficient accuracy.
  • the method known from D1 can be adopted as the closest analogue.
  • the technical result achieved when implementing the claimed invention is to eliminate the shortcomings of the closest analogue and thus to increase the efficiency of processing text in natural language, as well as to increase the efficiency of its indexing, processing and search in such text.
  • Another technical result is the expansion of the arsenal of technical means - methods of processing structured data arrays containing text in natural language.
  • a method for transforming a structured data array (MDS) containing linguistic sentences (LP), which is executed by a processor or processors of a computer device which consists in: performing stage 101 of forming the first data structure (SD), on which form the first SD SDM containing the elements of the said first SD, and the mentioned elements of the first SD are text elements (TE) of a linguistic sentence, as well as identification data of TE, which are, by way of example, but not limitation: TE values and serial numbers of TE in the linguistic proposal; performing stage 102 of the formation of a database of linguistic and logical signs (BDLLP), on which, based on the information contained in the first SD, linguistic and logical signs of TE of a linguistic sentence are identified, from which a database is formed, which is a database of linguistic and logical signs of text elements linguistic proposal; performing the stage 103 of the formation of the second SD, on which, based on the information contained in the
  • FIG. 1 by way of example and not limitation, an exemplary general diagram of the steps of the claimed method 100 is shown.
  • FIG. 2 by way of example and not limitation, an exemplary general flow diagram of the steps of step 101 is depicted.
  • FIG. 3 depicts the general structure of the original data structure containing linguistic sentences.
  • FIG. 4 by way of example and not limitation, the general structure of the generated first data structure is shown.
  • FIG. 5 by way of example and not limitation, a general flow diagram of the steps of step 102 is shown.
  • FIG. 6, by way of example, but not limitation, shows the general structure of the generated database of linguo-logical features.
  • FIG. 7 by way of example and not limitation, a general flow diagram of the steps of step 103 is shown.
  • FIG. 8 shows the general structure of the generated second data structure.
  • FIG. 9 by way of example and not limitation, a general flow diagram of the steps of step 104 is shown.
  • FIG. 10 by way of example and not limitation, the general structure of the generated third data structure is shown.
  • FIG. 11 illustrates by way of example and not limitation, an exemplary general flow diagram of the steps of the claimed method 200.
  • FIG. 12 by way of example and not limitation, a general flow diagram of step 201 is shown.
  • FIG. 13 depicts the general structure of a first data structure for method 200 containing simple judgment components.
  • FIG. 14 depicts the general structure of a second data structure for method 200 containing simple judgments.
  • FIG. 15 depicts the general structure of a database of linguo-logical characteristics.
  • FIG. 16 illustrates, by way of example and not limitation, a general flow diagram of the steps of step 105.
  • FIG. 17 by way of example, but not limitation, shows the general structure of the generated ontological database of system and semantic relationships.
  • FIG. 18, depicts an exemplary general flowchart of steps of the claimed method 300.
  • FIG. 19 by way of example and not limitation, a general flow diagram of step 301 is shown.
  • FIG. 20 depicts the general structure of the original data structure for method 300, containing simple judgments.
  • FIG. 21 by way of example and not limitation, depicts the general structure of an ontological database of systemic and semantic relationships.
  • FIG. 22 by way of example and not limitation, a general flow diagram of the steps of step 106 is shown.
  • FIG. 23 by way of example and not limitation, the general structure of the generated relationship map is shown.
  • FIG. 24 illustrates, by way of example and not limitation, the general structure of the generated relationship database.
  • FIG. 25 by way of example and not limitation, a general flow diagram of the steps of step 107 is shown.
  • FIG. 26 by way of example and not limitation, depicts the general structure of the generated fourth data structure (final SD).
  • FIG. 27 depicts an exemplary general diagram of a system for transforming a structured data set.
  • Embodiments of the present invention relate to methods, devices, systems, and computer-readable storage media for providing enhanced efficiency in processing natural language text for indexing, processing, and retrieval.
  • FIG. 1 by way of example and not limitation, an exemplary general flow diagram of the steps of a method 100 for transforming a structured array is shown.
  • data SMD
  • FIG. 1 an exemplary general flow diagram of the steps of a method 100 for transforming a structured array is shown.
  • data SMD
  • the claimed method 100 executed by the processor or processors of the computer device consists in: performing the step 101 of the formation of the first data structure (SD), on which the first SD SD is formed, containing the elements of the said first SD, and the mentioned elements of the first SD are text elements (TE) of the linguistic sentence (LP), as well as TE identification data, which are, as an example, but not limitation: TE values and TE serial numbers in a linguistic sentence; performing stage 102 of the formation of a database of linguistic and logical signs (BDLL P), on which, based on the information contained in the first SD, the linguistic and logical signs of TE of a linguistic sentence are identified, from which a database is formed, which is a database of linguistic and logical signs of text elements linguistic proposal; performing the stage 103 of the formation of the second SD, on which, based on the information contained in the BDLLP, the first SD, as well as on the basis of a formalized model of a simple judgment, a second SD SD is formed containing elements of the
  • Step 101 is characterized by: performing step 1011 of identifying the original MDS data structure, which identifies the elements 11 of the original MDS data structure, which are linguistic sentences 11 (LP 11); performing the step 1012 of identifying the elements 21 of the first data structure of the MDS, which identifies the elements 21 of the first data structure of the MDS, which are text elements (TE 21) of the linguistic sentence 11, as well as the identification data of the TE 21, which are, by way of example, but not limitation of the values 211 TE 21 and serial numbers 212 TE 21 in the linguistic sentence 11, and form the first data structure of the SMD.
  • FIG. 3 shows the general structure of the original data structure (ISD 1), from which the first MDS data structure is formed.
  • the initial data is an LMD containing elements 11 of the original data structure, which are linguistic sentences (LP).
  • LP linguistic sentences
  • Such an array of data is a set of 11 linguistic proposals related to any field of activity and any purpose, including the texts of legal acts.
  • Elements 11 do not have unique names (UN) that characterize them and have practical use.
  • elements 11 as an example, but not limitation, may be referred to as "LP 1", “LP 2", "LP n", where n> 1 is the ordinal number of the element in the array of linguistic sentences.
  • a linguistic sentence is a grammatically organized combination of words (a set of syntactically related words) that has semantic and logical completeness.
  • LP contains the following objects: words, numbers (numbers), punctuation marks and indices (constructions of letters, numbers and signs, including formulas (a set of letters, numbers and signs without spaces, in which special characters are used (for example, but not limited to , asterisk, plus, minus, equal, greater than, less, integral and the like, characterizing the essence of the formula)). All the above objects are separated from each other in a sentence by a space, with the exception of punctuation (they are attached to words, numbers and indices ) and formulas, and are called elements of LP 11.
  • LP 11 in the original data structure are separate elements prepared in advance and placed in the original data structure not in the form of a linguistic text, but in the form of a structured array (list, list, etc.) of individual LP Such preparatory actions can be carried out in any way known from the prior art and, accordingly, are not further described.
  • Identification of elements 11 of the original structure is given in the framework of stage 1011 is reduced to ensuring the classification of the elements that make up the original data structure, and highlighting such elements as linguistic sentences (LP 11).
  • the original data structure is thus a plurality of elements 11 identified in step 1011.
  • FIG. 4 by way of example and not limitation, the general structure of the generated first data structure is shown.
  • the first data structure is an SMD containing elements 21 of the first data structure, which are text elements (TE 21) of linguistic sentence 11 and identification data of TE 21.
  • Text elements 21 of linguistic sentence 11 do not have unique names (UN) that characterize them, which have practical using.
  • elements 21 as an example, but not a limitation, can be referred to as "TE 1", “TE 2", “TE V""TEn", where n> 1 is the ordinal number of the element in the linguistic sentence 11.
  • TE 21 of the linguistic sentences are text elements of the LP, then as an example, but not limitation, text elements can be TE of the primary type, namely words, numbers (numbers), punctuation marks or indices (constructions of letters, numbers and signs) contained in LP and separated from each other by a space, except for punctuation marks.
  • Text elements of a different kind can be, as an example, but not limitation, word forms, that is, groups of words that differ from the primary TE topics, which are not a formally separate word of a sentence (that is, a letter or a set of letters separated by a space from other words), but a group of words, which, from a linguistic point of view, is one morphological and syntactic object.
  • Such a group of words is called a "complex word form”.
  • the words “in”, “correspondence” and “c” seem to represent several TEs, although in fact they are one complex text element "in accordance with”, which is revealed at step 1012 as one TE 21.
  • Text elements 21 of linguistic sentence 11 have identification data TE 21, by way of example, but not limitation: value 211 TE and number 212 TE.
  • the value of TE 211 is a set of letters, numbers, signs that make up TE 21.
  • TE number 212 is the serial number of TE 21 in linguistic sentence 11.
  • Identification and formation of text elements 21 of the first data structure during stage 1012 is performed by analyzing the text and revealing ( highlighting) individual text elements according to their type and description, which should be known in advance. For example, but not limited to, such analysis can be performed by highlighting words, numbers or indices in a sentence, separated from each other by a space, as well as punctuation marks that are attached to said words, numbers and indices. In this case, it is preferable that the last punctuation mark in the sentence is not taken into account and is not considered as the text element 21 of the linguistic sentence 11. Such an analysis can be performed in any way known from the prior art and, accordingly, will not be described in detail further.
  • such analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor. Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using various machine learning systems, including a statistical processor or a neural network.
  • the identification of the value 211 of the text element 21 of the first data structure during step 1012 is performed by registering the symbols (letters, numbers, signs) that make up the text element 21.
  • the identification of the number 212 of the text element 21 of the first data structure during step 1012 is performed by calculating the location of the TE 21 in linguistic sentence 11.
  • the first text element 21 in linguistic sentence 11 receives the number 1, and all subsequent TEs receive a number greater by 1 than the number of the previous TE 21.
  • the formation of the first SDM data structure during stage 1012 is performed by combining in one data structure elements 21 of the first data structure of the MDS, as well as their identification data according to known from the prior art principles and methods, which, respectively, are not further described in detail.
  • FIG. 5 shows a general flow diagram of the steps of step 102 of generating a database of linguo-logical features, which is a database of linguistic and logical features of text elements 21 of sentence 11 after step 102.
  • Step 102 is characterized by the execution of step 1021.
  • FIG. 6, depicts the general structure of the generated database of linguistic and logical features (BDLLP), which is the BDLLP of text elements 21 of a linguistic sentence 11 after performing stage 102.
  • the first part of linguistic and logical features 213 of text elements 21 of a linguistic sentence 11 may contain linguistic characteristics (morphological, syntactic and semantic characteristics).
  • the set of values of all linguistic characteristics of a text element is for each TE 21 linguistic sentence 11 its distinctive (unique) linguistic feature in linguistic sentence 11.
  • Morphological characteristics preferably indicate morphological features of TE 21 of linguistic sentence 11, which can be classified, by way of example, but not limitation, by the level of nesting (genus-species-subspecies).
  • the morphological kinds of TE 21 of the linguistic sentence 11 are preferably word, number, punctuation marks, and other signs; morphological types - part of speech (for words), type of number (Arabic, Roman), type of punctuation mark (point, comma, etc.), type of another sign, type of index (formula, complex numbering, etc.); morphological subspecies - gender, number, case of parts of speech and the like for words, as well as number, binary code, index, and the like for numbers.
  • Syntactic characteristics preferably indicate a variety of syntactic features of TE 21 of a linguistic sentence 11, among which, as an example, but not limitation, the following syntactic features of TE 21 of a linguistic sentence 11 can be distinguished: syntactic role (predicate, subject, etc.); syntactic parent (syntactically main word); syntactic descendants (syntactically subordinate words); syntactic compositional connection (the presence of a different TE that has the same syntactic role and the same syntactic parent).
  • Semantic characteristics preferably indicate the semantic features of TE 21 of linguistic sentence 11, among which, as an example, but not limitation, the following semantic characteristics of TE 21 of linguistic sentence 11 can be distinguished: semantic group (a group of words that can be attributed to one class, genus, the type or subspecies of objects or actions of the surrounding world when the signs of the mentioned classes, genera, species or subspecies coincide), semantic status (the semantic meaning of a word or a group of words within a phrase that refers to a certain imaginable image (object or action) - for example, but not limited to , the imaginable image "the absence of the seller at the location of the consumer" consists of two top-level elements (terms): the first - "the absence of the seller", and the second - "the location of the consumer”, which have the following semantic statuses: the first has the main (defines meaning of the term), the second - additional (clarifies the definition previously divided meaning of the main term)).
  • semantic group a group of words that can be
  • the second part of the linguo-logical characteristics 214 of the text elements 21 of the linguistic sentence 11 contains logical characteristics.
  • the set of values of all logical characteristics of a text element is for each TE 21 of a linguistic sentence 11 its distinctive (unique) logical feature in a linguistic sentence 11.
  • Logical characteristics preferably indicate the logical features of TE 21 of a linguistic sentence 11, among which, as an example, but not a limitation, the following logical characteristics of TE 21 of linguistic sentence 11: logical roles of each word, which is TE 21, in linguistic sentence 11.
  • the logical role of a word is understood as the logical position of a word in logical entities (logical objects) of a sentence, among which it is possible to single out, as an example, but not restrictions, the following logical entities (logical objects): a concept, a feature of a concept, a term (part of an image), an image (an element of a simple judgment), a simple judgment, a complex judgment. Revealing the logical role of a word in the simplest logical objects (concept and feature of a concept) does not depend on the formalized logical model of a sentence, and is a label (index) that indicates what a given word is in these simple logical objects.
  • the word “law” is always the logical object “concept”
  • the word “federal” is the logical object “attribute of the concept”. Revealing the logical role of a word in more complex (composite) logical objects (for example, a term and an image) depends on the formalized logical model of the sentence, in relation to the elements of which the logical role of the word will be established.
  • the formation of the first part of the linguistic and logical characteristics - the linguistic characteristics 21B and their values 2131 for the text elements 21 of the linguistic sentence 11 - is preferably carried out at step 1021 by the first comprehensive linguistic analysis of each text element 21 of the linguistic sentence 11, which is an analysis of the TE 21, as an example , but not limitations, for example, analysis based on the location of TE in the structure of a sentence, its meaning, type, classification of its imaginable image and analysis of its connections with other text elements in the sentence.
  • one of the linguistic characteristics 213 may be "syntactic role "TE 21, with the meaning of this linguistic characteristic -" subject ".
  • Such an analysis can be performed by any method known from the prior art and, accordingly, in detail. not further described.
  • such analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor.
  • machine learning systems including a statistical processor or a neural network.
  • the formation of the second part of the linguistic-logical characteristics - logical characteristics 214 and their values 2141 for the text elements 21 of the linguistic sentence 11 - is preferably performed at step 1021 by a second complex linguistic analysis of each primary text element 21 of the linguistic sentence 11, which is an example but not a limitation analysis of TE 21 based on the location of TE 21 in the structure of the sentence, its meaning, type, classification of its imaginable image and analysis of its connections with other text elements in the sentence, as well as analysis of the identified linguistic characteristics 213 and their values 2131 TE 21.
  • logical characteristics 214 it is preferable to generate logical characteristics 214 and enter them at step 1023 into the DB / 1 / 1P in the form of a list of logical characteristics 214 with the values of these characteristics 2141.
  • one of the logical characteristics 214 can be "logical p ol "TE 21, with the value of this logical characteristic -" a sign of a concept. "
  • Such an analysis can be performed by any method known from the prior art and, accordingly, is not further described in detail. For example, but not limited to, such analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor.
  • a database of linguistic and logical characteristics is formed, which is BDL / 1P of text elements 21 of linguistic sentence 11, created after performing stage 102.
  • the first part of the linguistic and logical characteristics of 213 text elements 21 of linguistic sentence 11 and their values 2131 form unique linguistic features of TE 21 of linguistic sentence 11, and the second part of linguistic -
  • Stage 103 is characterized by: the execution of stage 1031, the formation of elements of the second SD, on which, based on the information contained in the BDL / 1P, the first SD, as well as on the basis of a formalized model of a simple judgment, the elements of the second SD are identified and formed, which are components of a simple judgment (KPS ), as well as the identification data of the KPS; performing step 1032 of generating the second LED, which generates the second LED from the identified CPS and their identification data.
  • KPS simple judgment
  • FIG. 8 by way of example and not limitation, the general structure of the generated second MDS data structure is shown.
  • the second SD is an MDS containing elements 31 of a second data structure that are components of simple judgments (CPC 31) of a linguistic sentence 11 and identification data of CPC 31.
  • the identification data of CPC is by way of example and not limitation of the values 311 of elements 31 of the second structure data SMD and serial numbers 312 TE 21 of the linguistic sentence 11, constituting the elements 31.
  • the components of simple judgments of the KPS 31 represent various syntactic units of the linguistic sentence 11, for example, as an example, but not limitation: words (word forms); various phrases that are "concepts with a feature", “a group of concepts with features” (terms), "a group of terms” (an image or element of a simple judgment), and the like.
  • the types of components that need to be identified when forming the second data structure of the MDS depends on the formalized model of a simple judgment and the detailing of the formalized model of a simple judgment, that is, the selection of individual components in the structure of the formalized model of a simple judgment.
  • the components of a simple judgment 31 can be of at least two types - the first components of the CPS 31.1 (the smallest components that are the initial elements from which all the other, larger components are formed) and the second components of the CPS 31.2 (the largest components that represent the original "blocks ", From which simple judgments are formed, and called” elements of simple judgments ") with this, KPS 31 at least contain the first KPS 31.1 and the second KPS 31.2.
  • the KPS 31 can be other types of components 31.x, contained in the formalized model of a simple judgment.
  • the index x> 3 corresponds to the ordinal number of the component 31 of a different kind, which is in the formalized model of a simple judgment between the components 31.1. and 31.2).
  • a different kind of component for the listed first and second CSC 31 may be a term component.
  • Such components are the building blocks of which the second component of the CPS 31 “element of simple judgment” is composed. That is, depending on the text of the proposal, the second KPS 31 may consist of one, two or more KPS 31 of the "term” type.
  • the first component (PC) can be such components that are called “concept” and "feature”.
  • VK The second component (VK), by way of example and not limitation, is one that is referred to as a “simple judgment element”.
  • VK KPS 31.2
  • VK KPS 31.2
  • the "subject” is the subject that is discussed in the judgment, the subject of which something is asserted or refuted, and the "predicate” is what is specifically asserted or refuted about the subject of the judgment.
  • Another component (IC) is a component that is neither PC (KPS 31.1) nor VC (KPS 31.2), but is contained in a formalized model of a simple judgment.
  • IC is a component that is neither PC (KPS 31.1) nor VC (KPS 31.2), but is contained in a formalized model of a simple judgment.
  • KPS 31.1 PC-VC
  • Such a component is a structurally larger object than the PC (as an example, but not a limitation - "federal law", consisting of two PCs: “federal” and “law”).
  • PC Korean Patent Application Laid Generation
  • linguistic sentence 11 which are separate word forms, there are no unique names (UN) characterizing them that have practical use.
  • KPS 31 as an example, but not restrictions, may be referred to as "KPS 1.1", “KPS 2.1", “KPS 3.1””ITE item 1", where the first number (1; 2; 3 and so on) - the serial number of the PC in the linguistic sentence 11; the second number “1" (after the dot) indicates that this is a KPS of the first type; n> 1 is the ordinal number of the element in the linguistic sentence 11.
  • KPS 31 which are elements of simple judgment by way of example and not limitation, may be referred to as "KPS
  • the elements of the PS 12 can be named as established in a formalized model of a simple judgment, for example: "subject”, “object”, “action”, “condition” and the like.
  • IC components of a simple judgment
  • KPS 31.x of a linguistic sentence 11 the presence of unique names (UN) characterizing them that have practical use depends on the accepted formalized model of a simple judgment.
  • KPS 31 such KPS 31 as an example, but not restrictions, may be referred to as "KPS 1.x", “KPS 2.x”, “KPS 3.x”"KPSp.x", where the first number (1; 2 ; 3, etc.) - the serial number of the IC in the linguistic sentence 11; the second number "x" (after the dot) indicates the serial number of the KPS of a different type, starting with 3 and further; n> 1 - the ordinal number of the element in the linguistic sentence 11.
  • KPS 31 of the linguistic sentence 11, consisting of components of at least two types 31.1 and 31.2 - have the KPS identification data: as an example, but not limitation: values 311 KPS, consisting of the values 311.1 and 311.2 of components of at least two types 31.1 and 31.2, and numbers 312 of the CPS, consisting of numbers 312.1 and 312.2 of components of at least two types 31.1 and 31.2.
  • the values of 311 KPS are sets of words (TE 21), of which at least KPS 311.1 and KPS 311.2 consist.
  • the numbers 312 KPS are the serial numbers KPS 312.1 and KPS 312.2 words (word forms) PK 21, of which at least KPS 31.1 and KPS 31.2 in the linguistic sentence 11 consist.
  • KPS 31 KPS 31.1, KPS 31.2, KPS 31 .x
  • the second data structure during block 1031 is produced by complex linguo-logical analysis of the elements of the first data structure of the SMD-text elements of TE 21 and their identification data.
  • Such a comprehensive analysis of TE 21 is performed using information about TE 21 and using information from the generated DB / 1 / 1P of primary text elements 21, as well as on the basis of the idea of a formalized model of a simple judgment and taking into account the already formed smaller components of a simple judgment (then there is a CPS 31.1, or components with a lower index x than that of the generated one (for example, without limitation, when forming the CPS 31.2, it is necessary to take into account the previously formed CPS 31.1, and when forming the CPS 31.12, it is necessary to take into account the previously formed CPS 31.11 and CPS 31.1)).
  • the formalized model of a simple judgment contains at least two types of components - the first component (PC), as the first type of KPS 31, and the second component (VC), as the second type of KPS 31.
  • a formalized model of a simple judgment is considered to be such a system for describing a simple judgment, which has at least two of the mentioned components.
  • the purpose of the above-mentioned complex analysis is to identify in a linguistic sentence all the components of a simple judgment established in a formalized model of a simple judgment.
  • the identification and formation of the CPS 31 of the second data structure during step 1031 is performed step by step.
  • the number of steps in step 1031 depends on the formalized simple judgment model used.
  • a simple judgment model contains a fixed number of kinds of components of a simple judgment.
  • the number of steps of step 1031 is determined, since at one step only one type of component can be identified and generated.
  • a formalized model of a simple judgment can at least contain at least two components, the minimum number of steps will also be equal to two.
  • an example of identification and formation of the first (KPS 31.1) and second (KPS 31.2) components of a simple judgment KPS 31 is given.
  • KPS 31.1 a linguistic analysis of TE 21 sentences 11 is performed As an example, but not limitation, the following sentence is considered: "The goods are transferred in accordance with the contract.” Based on the morphological and syntactic features (characteristics) of each TE 21, identified during the formation of the first data structure of the SMD, it was established that this sentence contains the following first components (KPS 31.1), which are word forms (Table 1): Table 1
  • TE 21 and KPS 31.1 Based on the data of the correlation table (table 3) TE 21 and KPS 31.1, identify the value 311.1 KPS 31.1 as a word or set of words corresponding to a specific component of KPS 31.1, and also identify the numbers 312.1 KPS 31.1 as serial numbers of TE 21 from which the KPS 31.1 is formed.
  • identification and shaping can be performed by any method known from the prior art and, accordingly, is not further described in detail. For example, but not limited to, such identification and shaping can be performed conventionally by a linguist or by using a linguistic (syntactic) processor software algorithm.
  • the formation of the second data structure of the MDS during step 1032 is performed by combining in one data structure of the elements 31 (CPS) of the second data structure of the MDS, as well as their identification data according to known from the prior art principles and methods, which, accordingly, are not further described in detail.
  • CPS data structure of the elements 31
  • Stage 104 is characterized by: the execution of stage 1041 of the formation of elements of the third SD, at which, based on the information contained in the DB / 1 / 1P and the second SD, from the generated CPS in accordance with the formalized component model of a simple judgment form the elements of the third SD, which are simple judgments (PS ), as well as the identification data of the PS, which are, as an example, but not limitation, the values of the PS and the serial numbers of the TE in the linguistic sentence that make up the PS; performing step 1042 of generating the third SD, which generates the third SD from the generated PS and their identification data.
  • PS simple judgments
  • FIG. 10 by way of example and not limitation, the general structure of the generated third MDS data structure is shown.
  • the third data structure is an SMD containing elements 1B, which are simple judgments (PS 13) of linguistic sentence 11 and identification data of PS 12.
  • Elements 13 of linguistic sentence 11 have unique names (UN) that characterize them and have practical use.
  • elements 13, as an example, but not limitation, can be referred to as "PS 1", “PS 2", “PS 3", "PS n", ", where n> 1 is the ordinal number of the element in the linguistic sentence 11.
  • PS 13 simple judgments of the PS 13 can be referred to as "disposition”, “sanction”, “hypothesis” in the legal subject area and the like in other subject areas. From a linguistic point of view, PS 13 are simple sentences.
  • simple sentences various options for simple sentences are possible, which can be considered simple judgments 13, for example, but not limited to this example, the following types of simple sentences can be cited: 1) simple sentences in their original, unconverted form; 2) simple sentences in a transformed form, for example: a) without participial or participial phrases: b) without homogeneities (non-homogeneous, without rows of homogeneous members); c) no inserts (no text in brackets); d) no conditional names (no text in quotes); e) without circumstances (conditions); and the like, including combinations of the aforementioned and unspecified types.
  • a simple judgment of PS 12 from a logical point of view is a statement or refutation about the subject of the judgment.
  • a simple judgment is a primary logical construction of thinking with the help of which the idea is formed and transmitted that something (a predicate of a judgment) is affirmed or refuted about the subject of judgment (a subject of judgment).
  • PS 13 from the point of view of individual subject areas is a construction described by a formalized model of a simple judgment.
  • the largest elements of this construction are the second components of a simple judgment (KPS 31.2).
  • KPS 31.2 of a simple proposition 13 from a linguistic point of view represent a syntactic unit of the form "initial syntactic object" or "syntactic construction".
  • a simple judgment PS 13 is a statement, or a negation, in which something, respectively, is affirmed or refuted about the subject of the judgment.
  • the KPS 31.2 of a simple judgment 13 is a generalized thinkable (semantic) image of an element of a simple judgment.
  • a simple judgment can be correlated with a part of a legal norm, namely, as an example, but not limitation, with a "disposition” (a rule that must be observed), a "sanction” (a rule that determines the degree of responsibility for violation of the rules) or "hypothesis” (conditionality of the rule reflecting any preliminary action, situation or state).
  • Simple propositions 13 of linguistic sentence 11 have identification data, by way of example and not limitation: value 131 PS and number 132 PS.
  • the value of 131 PS is a set of values of the final text elements (KPS 31.1) that make up a simple judgment 13 of sentence 11.
  • Number 132 PS is the serial numbers of TE 21, from which all the values 212 are formed that make up a simple judgment 13 of sentence 11.
  • Formation of simple judgments PS 13 of the third data structures during step 1041 are produced on the basis of information about the formalized model of a simple judgment, as well as taking into account the previously formed array of components 31 of a simple judgment 13 by combining the components 31 simple judgment according to the formalized model of simple judgment and taking into account information from the database 1 1P text elements (TE 21) about the presence of syntactic links between TE 21 included in various components 31 of a simple judgment 13 of a linguistic sentence 11.
  • Identification of the value 131 of a simple judgment 13 of the third data structure during step 1041 it is performed by identifying the value 121 of the simple proposition 12 with the values 311.2 of all the components of the simple proposition 31.2 that form this simple proposition PS 13.
  • the identification of the numbers 132 of the simple proposition 13 of the third data structure during step 1041 is performed by identifying the numbers 132 of the simple proposition 13 with the numbers 312.2 of all the components of the simple proposition 31.2 forming this simple proposition of the PS 13.
  • identification and generation can be performed in any way known from the prior art and, accordingly, are not further described in detail.
  • identification and shaping can be performed conventionally by a linguist, or by using a linguistic (syntactic) processor software algorithm.
  • the formation of the third data structure of the MDS during step 1042 is carried out by combining in one data structure the elements 12 of the third data structure of the MDS and their identification data according to known from the prior art principles and methods, which, accordingly, are not further described in detail.
  • step 104 in order to improve the accuracy of the subsequent search in the structured data set containing at least simple judgments (PS) of the linguistic sentence and their identification data, it becomes possible to carry out further structuring and classification of the SD SD containing at least the components of a simple judgment (CPS) of a linguistic sentence and their identification data.
  • PS simple judgments
  • CPS simple judgment
  • FIG. 11 depicts a general diagram of the steps of the claimed method 200 of forming an ontological database of a structured data array (DMD).
  • the claimed method 200 of forming an ontological database of a structured data array (DMD) consists in: performing stage 201 of identifying the second SD (which is the first SD for the considered method 200), identifying the third SD (which is the second SD for the considered method 200) and identifying the lingual database.
  • the identified BDLLP contains information about the linguistic and logical features of text elements (LLPTE), and the mentioned LLPTE are linguistic and logical signs of text elements (TE) and their meanings; performing stage 105 of forming an ontological database of system and semantic relationships in the third SD (which is the second SD for the considered method 200), on which, based on the information contained in the BDLLP, the second SD and the third SD, as well as based on the search criteria for system and semantic homogeneities , identify and register the systemic and semantic links between the components of the PS, from which they form the ontological database of the system and semantic relationships of the components of the PS in the third SD (OBD).
  • OBD logical signs
  • the mentioned first SD for the considered method 200 is any SD suitable for the implementation of the method 200, containing the mentioned components of simple judgments.
  • such an LED is the second LED described previously with reference to method 100, or any LED known in the art, including in the future, containing the aforementioned simple proposition components.
  • the mentioned second LED for the considered method 200 is any SD suitable for the implementation of the method 200, containing the mentioned simple judgments.
  • such a CD is the third CD, previously described with reference to the method 100, or any CD known in the art, including in the future, containing the aforementioned simple judgments.
  • the mentioned BDLLP is any database containing information about LLPTE, representing the linguistic or logical signs of TE and their meanings.
  • a database can be described previously with reference to the BDL 1P method 100, or any database known from the prior art, including in the future, containing information about LLPTE, representing linguistic or logical features TE and their meanings.
  • FIG. 12 depicts a general flow diagram of the step 201 for identifying a first data structure (first LED for method 200), a second LED for method 200, and a linguistic-logical signature database (LMDB); wherein the first SD for the method 200 contains components of simple judgments (CPC); wherein the second DM for method 200 contains simple judgments (PS); at the same time BDLLP, contains information about the linguistic and logical features of text elements (LLPTE), and the mentioned LLPTE are linguistic and logical signs of text elements (TE) and their meanings.
  • first LED for method 200 contains components of simple judgments (CPC)
  • PS simple judgments
  • BDLLP contains information about the linguistic and logical features of text elements (LLPTE), and the mentioned LLPTE are linguistic and logical signs of text elements (TE) and their meanings.
  • LLPTE linguistic and logical signs of text elements
  • Step 201 is characterized by performing the identification of a HBS-capable data structure containing simple judgment components (SJCs), which identifies the elements 31 of a HBS-capable data structure containing simple judgment components (SJCs), as well as identification data of the elements 31, which are for of each element 31, as an example, but not limitation, the value 311 of the element 31 of a data structure suitable for the formation of the HBS, and the ordinal (ordinal) number (s) 312 of the KPS of the linguistic sentence 11, which are TE 21, constituting element 31, as well as the implementation identification of a data structure suitable for the formation of a HBS containing simple judgments (PS), on which the elements 13 of a data structure suitable for the formation of a HBS containing simple judgments (PS) are identified, as well as the identification data of the elements 13, which are for each element 13, as example, but not limitation, value 1 31 of the elements 13 of a data structure suitable for the formation of the HBS, containing the PS and the ordinal (ordinal) number (
  • FIG. 13 depicts a first data structure for method 200, which is the first raw data structure for present method 200, which is a HBS usable data structure containing simple proposition components (RPCs).
  • RPCs simple proposition components
  • such an LED is the second LED previously described with reference to method 100, which is thus not further described.
  • FIG. 14 depicts a second data structure for method 200, which is the second original data structure for the present method 200, which is a data structure suitable for HBS generation containing simple judgments (PS).
  • PS simple judgments
  • an LED is the third LED previously described with reference to method 100, which is thus not further described.
  • FIG. 15 depicts a database of linguistic and logical features of TE, which is a database suitable for the formation of a HBS containing linguistic and logical characteristics and the values of these characteristics.
  • a database of linguistic and logical features of TE which is a database suitable for the formation of a HBS containing linguistic and logical characteristics and the values of these characteristics.
  • OBD / 1 / 1P is previously described with reference to method 100 of BDLLP, which is thus not further described.
  • FIG. 16 shows a general flow diagram of the steps of step 105 (202) of forming an ontological database of systemic and semantic links in a third SD (OBD).
  • Step 105 (202) is characterized by performing step 1051 (2021) of identifying system connections between the CPS based on the information contained in the BDLLP, the second SD and the third SD (respectively, the first and second SD for the considered method 200), as well as based on the search criteria for system homogeneity, and registration of the identified links as system ontological features (SOP) and values of SOP; performing stage 1052 (2022) of identifying semantic links between the CPS based on the information contained in the BDL / 1P, the second SD and the third SD (respectively, the first and second SD for the considered method 200), as well as based on the search criteria for semantic homogeneities and registration of the identified relationships as semantic ontological features (SOM) and SOM values; performing stage 1053 (2023) of forming an ontological database of system and
  • FIG. 17, shows the general structure of the formed ontological database of system and semantic relations in the third SD (second SD for method 200), which is the HBS of components 31 of simple judgments 13 in the third data structure (second SD for method 200) after step 105 (202).
  • the ontological database of systemic and semantic relationships in the third SD (second SD for method 200) is an organized structure created in accordance with certain rules and intended for storing, changing and processing said data.
  • WBS is such a database in which the elements of the base contain information about various relationships with other elements of this base.
  • the elements of the HBS are all components 31 of simple judgments 13 in the third SD (second SD for method 200).
  • connection means the presence of a systemic and semantic connection between two components 31 or between the values 311 of the components 31.
  • Semantic connection is the presence of any semantic homogeneity between the two meanings 311 of the components 31, indicating any ratio of the semantic volumes of these components (the ratio of conceivable objects or actions that express these components in meaning).
  • identity is a complete coincidence of words of two meanings 311 components 31 (for example, but not limited to: "law” and "law”).
  • Equivalence is the equivalence of the semantic volumes of two values of 31 components 31, provided that there is no complete coincidence of words for these values of 311 components 31, or there is no coincidence of words for two values of 311 components 31 at all (for example, but not limited to: “Russian law” and “Law of Russia”) Intersection is such a ratio of the semantic volumes of two values of 311 components 31, in which the semantic volumes of these values of 311 components 31 coincide only partially (for example, but not limited to: “student” and “student”).
  • Absorption is a ratio of the semantic volumes of two values 311 of components 31, in which the semantic volume of the first value 311 of component 31 completely absorbs the semantic volume of the second value 311 of component 31, but the semantic volume of the second value 311 of component 31 is only a part of the semantic volume of the first value 311 component 31 (for example, but not limited to: “student” and "first grader”).
  • submission is such a ratio of the semantic volumes of the two values 311 of the components 31, in which the semantic volume of the first value 311 of the component 31 is fully included in the semantic volume of the second value 311 of the component 31, but does not cover the semantic volume of the second value 311 of the component 31 completely (for example, but not limited to : “First grader” and “student”).
  • a contradiction is such a ratio of the semantic volumes of two meanings 311 components 31, in which the semantic volumes of two meanings 311 components 31 within one generic concept contain signs of this concept mutually exclusive of each other (for example, but not limited to: “white color” and “non-white color ").
  • the opposite is such a ratio of the semantic volumes of two meanings of 311 components 31, in which the semantic volumes of two meanings of 311 components 31 within one generic concept contain mismatched features of this concept, indicating the exceptional properties of these images (for example, but not limited to: "federal law” and "regional law”).
  • a systemic relationship is the presence of any systemic homogeneities between two components 31 or the values 311 of the components 31, indicating the presence of any ratios of the systemic signs of these components 31 or the values 311 of the components 31.
  • the systemic relationship of two components 31, or two values 311 of components 31 is everything that is not a semantic connection between the two meanings 311 of the components 31.
  • the systemic connection of the components 31 is the presence of homogeneities (some characteristics that unite them) between two components that (homogeneity) have a systemic or classification, but not semantic (semantic) character.
  • Example 1 components 31 within one simple proposition 13 (for example, but not limited to: for the third SD (second SD for method 200) of four PS 13):
  • Example 1 shows that it is possible to identify and register a system relationship based on the simple fact of the presence of component values: there are three system relationships in nCN ° l (Action-Subject; Object-Subject and Action-Object); in PS1 ⁇ 1 ° 2 there is only one such systemic connection (Action-Subject); in PSN ° 3 - six similar system connections (Action-Subject; Action-Object; Action-Circumstance; Subject-Object; Subject-Circumstance; Object-Circumstance), in PSN ° 4 - four similar system connections (Action-Subject; Action -Circumstance; Subject-Circumstance; Object-Circumstance).
  • Example 2 The same kinds of components 31 of simple judgments 13 in the third data structure (eg, but not limited to: for the third SD (second SD for method 200) of the four PS13 mentioned in the above example): Table 9
  • Example 2 shows that it is possible to identify and register a systemic connection based on the coincidence in four analyzed simple judgments (PS) of the types of components that have a value: according to the "subject" component, there are six systemic connections between four PS13 (PS1 ⁇ 1 ° 1 -PS1 ⁇ 1 ° 2; PS1 ⁇ 1 ° 1-PS1 ⁇ 1 ° 3; PS1 ⁇ 1 ° 1-PS1 ⁇ 1 ° 4; PS1 ⁇ 1 ° 2-PS1 ⁇ 1 ° 3; PS1 ⁇ 1 ° 2-PS1 ⁇ 1 ° 4; PS1 ⁇ 1 ° 3-PS1 ⁇ 1 ° 4); on the “action” component, there are six systemic connections between four PS13 (PS1 ⁇ 1 ° 1-PS1 ⁇ 1 ° 2; PS1 ⁇ 1 ° 1-PS1 ⁇ 1 ° 3; PS1 ⁇ 1 ° 1-PS1 ⁇ 1 ° 4; PS1 ⁇ 1 ° 2-PS1 ⁇ 1 ° 3
  • Example 3 parts of speech of the syntactically main word of a component (element of a simple judgment) of the values 311 of the components 31 within one simple judgment 13 (for example, but not limited to: for PS No. earlier examples: IB Table
  • Example 3 shows that it is possible to identify and register a system communication based on the coincidence of parts of speech of the main word (syntactic vertex) within one simple proposition 13: coincidence of part of speech of the main word only between the following components: Subject-Object.
  • Example 4 the same parts of speech of the values 311 of the components 31 within the framework of simple judgments 13 of the third SD (for example, but not limited to: for the third SD (second SD for method 200) of the four PSs 13 indicated in the previous examples:
  • Example 4 shows that it is possible to identify and register a system communication based on the coincidence of parts of speech of the main word (syntactic vertex) within several (within the example, four) simple propositions 13: parts of speech of the main word only between the following components: Cl -01; C1-03; Cl-OBZ; C1-064; 01-03; 01-063; 01-064; S2-01; S2-03; C2-063; C2-064; SZ-01; NW-OZ; SZ-ObZ; SZ-064; 03-01; 03-063; 03-064; S4-01; S4-03; C4-063; C4-064; 04-064.
  • the identification of system links between the PCC 31 of the simple judgments 13 of the third DS is preferably performed at step 1051 (2021) by setting the criteria for searching for system homogeneities between the components 31 of the simple judgments 13 and implementing such a search.
  • To identify system connections between KPS 31 simple judgments 13 of the third SD use information from BDL / 1P text elements, as well as information about a formalized model of a simple judgment, information about an array of simple judgments (third SD (second SD for method 200)) and information about an array of components simple judgments (second SD (first SD for method 200)).
  • systemic homogeneities are established depending on the specific goals of applied problems in the subject area, solved by identifying systemic connections KPS 31 simple judgments 13.
  • Systemic homogeneities can be internal and external. Internal systemic homogeneities refer to the type of homogeneities that occur between the components 31 within individual simple judgments 13, and external systemic homogeneities refer to the type of homogeneities that occur between the components 31 of different simple judgments 13 of the third SD (second SD for method 200).
  • second SD for method 200 As an example, but not limitation, one can cite the method of searching for systemic homogeneity according to the following criterion (similar to the mentioned example 1): components 31 of the form "elements of a simple judgment" are in one simple judgment 13.
  • the identification of system connections between KPS 31 of the form "elements simple judgment ”of simple judgments 13 will be made in each simple judgment 13 on the basis of a formalized model of simple judgment, which establishes the elements of a simple judgment, as well as on the criterion of the actual presence of values 311 in these components 31 within the individual elements of the formalized model of simple judgment. If there are 311 values of the component 31 of the specified type, the first and second components 31 will record the connection between these components 31 in those simple judgments in which they will be identified as a result of the search for systemic homogeneities according to the established criterion.
  • the first and second components 31 will record the connection between these components 31 in those simple judgments in which they will be identified as a result of the search for systemic homogeneities according to the established criterion.
  • Such an analysis can be performed by any method known from the prior art and, accordingly, is not further described in detail. For example, but not limited to, such analysis can be performed traditionally by a specialist in the subject area, within which system homogeneities are searched, or with the help of software.
  • the identification of semantic links between the CSS 31 of simple judgments 13 of the third DS is preferably performed at step 1052 (2022) by setting the criteria for searching for semantic homogeneities between the CSS 31 of simple judgments 13 and implementing such a search.
  • Types of semantic relationships are established depending on the specific goals of applied problems in the subject area, solved by identifying semantic relationships KPS 31 simple judgments 13.
  • Semantic homogeneities can be internal and external. Internal semantic homogeneities refer to the type of homogeneities that occur between the components 31 within individual simple judgments 13, and external semantic homogeneities refer to the type of homogeneities that occur between the components 31 of different simple judgments 13 of the third SD (second SD for method 200).
  • both KPS 31 will have the desired semantic relationship between these components 31 in those simple judgments 13 in which they will be identified as a result of the search for semantic homogeneities according to the established criterion.
  • such components may be components 31 with the following values 311: "student of school” and "student".
  • Such an analysis can be performed by any method known from the prior art and, accordingly, is not further described in detail.
  • such an analysis can be performed by a specialist linguist, taking into account the knowledge of the special terminology of the subject area, within which the search for semantic homogeneities is performed, or with the help of software.
  • step 105 in order to improve the accuracy of the subsequent search in the structured data set containing at least simple judgments (PS) of the linguistic sentence and their identification data, it becomes possible to carry out the final systematization of the data structures of the MDS, containing at least the components of a simple proposition (CPS) of a linguistic sentence and their identification data.
  • PS simple judgments
  • CPS simple proposition
  • FIG. 18, shows a general diagram of the steps of the claimed method 300 for transforming a structured data array (SDM) containing simple judgments (PS), which consists in: performing the step 301 of identifying the original data structure for the method 300 (hereinafter referred to as the initial SD) and ontological database (OBD);
  • the original SD is a SD containing elements of the SD, which are simple judgments (PS) of a linguistic sentence and identification data of the PS, and the PS contains components;
  • the OBD contains information about the system and semantic links in the source SD, and the mentioned information is the system and semantic links between the components of the PS in the source SD; performing stage 106 of forming a database of relations in the source SD, on which, based on the information contained in the HBS, as well as on the basis of the search criteria for the sought judgments, the components of the PS are compared, and also the types of relations between the compared components of the PS are classified and recorded, from which the base
  • the mentioned initial SD for the considered method 300 is any SD that is suitable for the implementation of the method 300, containing the mentioned simple judgments.
  • a CD is the third CD, previously described with reference to the method 100, or any CD known in the art, including in the future, containing the aforementioned simple judgments.
  • the mentioned HBS is any ontological database suitable for implementing the method 300, including, but not limited to, described earlier with reference to the HBS method 200, containing the mentioned information about system and semantic relationships in the third SD, which is source for the considered method 300.
  • FIG. 19 depicts a general flow diagram of the step 301 of identifying a transformable MDS containing an MS, a data structure containing simple judgments (for example, but not limited to, a third LED), which is the initial data structure for the considered method 300 ( further - the original SD), as well as a database containing information about system and semantic relationships in the original SD (OBD).
  • a transformable MDS containing an MS for example, but not limited to, a third LED
  • OBD original SD
  • Step 301 is characterized by performing the identification of a transformable MDM containing PS, a data structure containing simple judgments (PS), which identifies elements 13 of a transformable MDM containing PS, a data structure containing simple judgments (PS), as well as identification data elements 13, representing for each element 13, by way of example, but not limitation, the value 131 of element 13 suitable for transformation MDS containing PS, data structures, and ordinal (ordinal) number (s) 132 PS of linguistic sentence 11, representing TE 21, constituting element 13, as well as the identification of a database suitable for transformation containing PS, containing information about system and semantic relationships in the third SD, on which an ontological database (OBD) is identified, containing information about system and semantic relationships in the third SD, suitable for converting an SDS containing PS, a database containing data on system connections between KPS 31 of simple judgments PS 13 of the third SD (which is the initial one for the considered method 300), which are system ontological signs 313 KPS 31 of simple judgments 13, and about their values 3131,
  • FIG. 20 illustrates, by way of example and not limitation, an exemplary raw data structure for the present method 300, which is a transformable MD containing PS to a data structure containing simple judgments (PS).
  • an LED may be the third LED previously described with reference to method 100, which is thus not further described.
  • FIG. 21 by way of example, but not limitation, depicts an exemplary ontological database, which is a database suitable for transformation of an MDS containing an MS, containing information about system and semantic relationships in a third SD.
  • an ATS may be described previously with reference to the ATS method 200, which is thus not further described.
  • Step 106 (302) is characterized by: performing step 1061 (3021) of generating a map of KPS relations in the third SD (which is the initial one for the considered method 300) based on the search criteria for the desired judgments; performing stage 1062 (3022) classification based on the information contained in the HBS, and registering the types of relations between the compared CPSs of such an initial SD and registering the corresponding types of relations as conclusions based on the results of comparing system and semantic ontological information about the compared KPS; performing stage 1063 (3023) of forming a database of relations in such an initial SD, on which the BDO of the components of simple judgments of such an initial SD is formed by combining all classified and registered relations between the compared CPS of the third SD.
  • FIG. 2B shows the general structure of the generated relationship map of components 31 of simple judgments 13.
  • the term "relationship map” refers to a table of comparison of systemic as well as semantic ontological information about the compared components 31.
  • the relationship map is intended for comparison not all components of 31 simple judgments of the third SD, but only those that are controlled (checked) in accordance with the search criteria for the sought judgments, which will be mentioned below.
  • the following types of relationships 316 between the components 31 established in the relationship map can be cited: identity; equivalence; intersection; absorption; subordination.
  • the types of relations themselves partially coincide with the types of relations mentioned in the ontological database.
  • the types of relations identified for the BDO in the map of component relationships 31 are based not only on semantic, but also on systemic features of the compared components 31, i.e. types of relations are aggregate hybrid system-semantic features.
  • the process of determining the type of relations which takes into account both the system and semantic features of the components 31 and determines the type of relations between the compared components 31, is formed depending on the specific applied problem of finding simple judgments 13 in the third SD in a specific subject area.
  • Identity is a complete coincidence of the system-semantic features of the two components 31, provided that the system-semantic features of the components 31 are fully correlated and the requirements for the system-semantic features of the compared components 31 in the relationship map.
  • Equivalence is an incomplete coincidence, but the equivalence of the system-semantic features of the two components 31, provided that the incomplete correlation of the system-semantic features of the components 31 and the requirements for the system-semantic features are ignored. semantic features of the compared components 31 in the relationship map.
  • the intersection is an incomplete coincidence of the system-semantic features of the two components 31, provided that the incomplete correlation of the system-semantic features of the components 31 and the requirements for the system-semantic features of the compared components 31 in the relationship map are recognized.
  • Absorption is such a ratio of system-semantic features of two components 31, in which the volume of system-semantic features of the first component 31 completely absorbs the volume of system-semantic features of the second component 31, but the volume of system-semantic features of the second component 31 is only a part of the volume of systemic - semantic features of the first component 31, subject to the correlation of the system-semantic features of the components 31 and the requirements for the system-semantic features for the compared components 31 in the relationship map.
  • FIG. 24, shows the general structure of the generated database of relations in the third SD (which is the source for the considered method 300), which is the BDO of the components 31 of simple judgments 13 in the third SD after the execution of step 106 (302).
  • BDO is an organized structure created in accordance with certain rules and intended for storing, changing and processing the mentioned data.
  • BDO data are components of 31 simple judgments of the third SD, their identification data (value 311 and numbers 312), as well as types of relationships 316 between the compared components of 31 simple judgments 13 of the third SD.
  • BDO is actually the second part of the ontological database (OBD), since new data on the form of relations of component 31 with another component 31 is simply added to the already existing data of the OBD for component 31, which are obtained by comparing the system, as well as semantic ontological information about the compared components 31 (about the links between the components 31) contained in the HBS.
  • BDO is such a database in which the elements of the database contain information about various types of relations with other elements of this base.
  • the elements of the BDO are such components 31 of simple judgments 13 of the third SD, which are installed in the map of the relationship of components 31 of simple judgments 13 in the third SD.
  • Formation of the relationship map of the components 31 of simple judgments 13 is preferably performed at step 1061 (3021) by performing an analysis of the search criteria for the desired judgments.
  • the search criteria for the desired judgments are formed in connection and within the framework of solving a specific applied problem of finding simple judgments 13 in the third SD in a specific subject area. These criteria are formed at the stage of searching for simple judgments in accordance with the requirements of the search task on the basis of a formalized model of a simple judgment (that is, on a known list of all components 31 of a formalized model of a simple judgment) and on the indication of the controlled components 31.
  • the search criteria for the sought judgments should describe the controlled parameters 315 controlled components 31 and their controlled values 3151, as well as conditions (that is, a combination of controlled values 3151 of the mentioned parameters 315 for the compared controlled components 31), under which it can be concluded that there are certain types of relationships 316 between the compared components 31 that are relevant for solving an applied search task, during which a comparison of simple judgments is made 13.
  • a relationship map is formed, in which the identified during the said analysis are registered: controlled components 31; controlled system and logical features (parameters) 315 of these components 31; monitored values 3151 of these parameters 315; types of ratios 316 of the compared components 31 at the established combinations of values 3151 of the monitored parameters 315 of the compared components 31.
  • Such an analysis can be performed by any method known from the prior art and, accordingly, is not further described in detail.
  • such an analysis can be performed by a specialist linguist, taking into account the knowledge of the special terminology of the subject area, within which the search for the sought-for simple judgments is carried out, or with the help of software.
  • Classification of the kind of relationship between compared components 31 simple judgments 13 of the third SD and registration of this type is preferably carried out at step 1062 (3022) by performing an analysis of the data of the compared components 31 contained in the HBS, taking into account information from the map of the relationship of components 31 of simple judgments 13. During the classification, all combinations of components are sequentially selected 31, which are indicated in the relationship map (that is, combinations of controlled components 31).
  • the HBS is requested for the selected components 31 and all the actual system ontological features 313 and their values 3131 are obtained, as well as all the actual semantic ontological features 314 and from the value 3141.
  • the values obtained in this way are 3131 features 313 and the values 3141 features 314 components 31 are used in the above-mentioned process of determining the type of relations to identify the type of relations of the compared components 31 of simple judgments 13 of the third SD.
  • the thus classified types of relations between the components 31 of the simple judgments 13 of the third DA are recorded as the result of step 1062 (3022).
  • the identification data of the compared components 31 (value 311 and numbers 312) is obtained as a result of the mentioned request in the HBS together with the system 313 and semantic 314 ontological features.
  • a database of relations is formed in the third SD containing the compared components 31 of a simple judgment 13, the types of relations 316 to be compared components 31 of simple judgments 13 of the third SD, which (components) are indicated in the map of the relationship of components 31 and are actual controlled components 31 for solving an applied search problem, during which simple judgments 13 are compared, as well as identification data 311 and 312 of the compared components 31.
  • FIG. 25, by way of example and not limitation, a general flowchart of the steps of step 107 (303) of generating the fourth data structure (which is the final SD for the considered method 300) of the MD is shown.
  • Step 107 (303) is characterized by: performing step 1071 (3031) of forming a sequence of actions for solving a search task (AP), during which, based on predetermined search criteria for the sought judgments, the mentioned PD; performing stage 1072 (3032) of identification and formation of the first and second elements of the final SD, on which, based on the information contained in the BDO, the elements of the final SD are identified and formed, which are the required judgments (IS), as well as the identification data of the IS; performing stage 107B (3033) of generating the final SD, at which the final SD is formed from the generated IS and their identification data.
  • AP search task
  • stage 1072 performing stage 1072 (3032) of identification and formation of the first and second elements of the final SD, on which, based on the information contained in the BDO, the elements
  • FIG. 26, by way of example, but not limitation, depicts the general structure of the formed fourth data structure, which is the final SD for the considered method 300.
  • a fourth (final) data structure is an SDS containing elements 14 that represent the desired judgments (IS 14) and their identification data.
  • the IS identification data is by way of example, and not limitation, the values 141 of elements 14 of the fourth data structure of the SMD and the sequence numbers 142 of the TE of the linguistic sentence 11 constituting elements 14.
  • the elements 14 of the fourth data structure are subdivided into first elements 14 and second elements 14.
  • the result of solving the search problem can be: the first elements 14, or the second elements 14, or the first elements 14 and the second elements 14 of the fourth SD.
  • the result of solving the search problem can be: the first elements 14, or the second elements 14, or the first elements 14 and the second elements 14 of the fourth SD.
  • an applied problem is demonstrated to find all parts (hypotheses, dispositions and sanctions) of prescription norms (rules, principles, definitions contained in the text of provisions of legal acts), within which the first elements 14 and the second elements 14 of the fourth SD, that is, two consecutive search actions of the PD are implemented.
  • the first search action of the PD can be realized by searching for the first elements 14, which will be simple judgments, which are dispositions or sanctions of a norm-prescription.
  • the second search action of the PD can be realized by searching for the second elements 14 which will be simple judgments, which are conditionality of the rules (external conditions - disposition hypotheses or sanction hypotheses under which the found rules are considered valid) found during the previous search operation of the PD.
  • the first search action of the PD can be realized by searching for the first elements 14, which will be simple judgments, which are disposition rules.
  • the second search action of the PD can be realized by searching for the second elements 14, which will be simple judgments, which are rules-sanctions (rules that establish the measure of responsibility for violation of already found rules-dispositions).
  • the third search action AP can be realized by searching also for the second elements 14, which will be simple judgments - hypotheses (conditions for already found dispositions and conditions for already found sanctions). Based on the above examples, but not limitation, you can imagine the difference between the first elements 14 and the second elements 14 of the fourth LED.
  • the first elements 14 of the fourth data structure are the sought judgments obtained as a result of the first (in order) search action of the PD in the array of simple judgments (third SD).
  • the peculiarity of the first search action of the PD is that the first search action of the PD is technically limited to the controlled data contained in the search criteria for the required judgments. No other controlled data for the PD is present in the PD at the first search action.
  • the second elements 14 of the fourth data structure are the required judgments obtained as a result of the second, third and all subsequent search actions of the PD, which consists of the PD, formed on the basis of the search criteria for the sought judgments.
  • the mentioned second, third and subsequent search actions of the PD differ from the mentioned first search action of the PD in that in such search tasks they use not only controlled data contained in the search criteria for the desired judgments, but also additional controlled data (additional data contained in the already formed arrays of the sought judgments of the fourth SD).
  • the unique numbers of the first elements 14 and / or already identified second elements 14 as additional controlled data, that is, the sought-for judgments already found (for example, but not limited to, the unique numbers of simple judgments-dispositions) in order to find simple judgments related to the simple judgments already found during the first search action of the AP in the array of simple judgments (third SD) during the second search action of the AP (for example, but not limited to, find simple judgments-hypotheses for already found simple judgments-dispositions based on the known unique numbers of already found simple judgments-dispositions).
  • the sought-for judgments already found for example, but not limited to, the unique numbers of simple judgments-dispositions
  • a search task is any task associated with the analysis of textual material in the format of text in natural language, presented for analysis in the form of a text document or a textual data array.
  • the result of such an analysis can be any individual component of a formalized model of a simple judgment, or several specified components, or simple judgments, or a group of simple judgments, which is described in detail in the mentioned search criteria.
  • Individual elements 14 (first element 14 or second element 14) of the fourth SD have unique names (UN) that characterize them and have practical use.
  • elements 14, by way of example, but not limitation, may be referred to as "IC 1", “IC 2", “IC B”, “IC p", where n> 1 is the ordinal number of the element in the fourth LED.
  • the sought judgments 13 can be referred to as "disposition”, “sanction”, “hypothesis” for a legal subject area, and the like for other subject areas.
  • Groups of elements 14 of the fourth SD (for example, but not limited to the first and second elements 14) have unique names (UN) that characterize them and have practical use.
  • such groups of elements 14 can be referred to as "GIS 1", “GIS 2", “GIS 3", “GIS p”, where "GIS” is the group of the sought judgments, an> 1 - the serial number of the element in the fourth CD.
  • the sought judgments 14 IP groups 14
  • IP groups 14 can be referred to as "norm-prescription", "legal norm” for a legal subject area, and the like for other subject areas. From a linguistic point of view, elements 14 (the required judgment, regardless of the type - the first or the second) is a simple sentence.
  • simple sentences various options for simple sentences are possible, which can be considered simple judgments, for example, but not limited to this example, the following types of simple sentences can be cited: 1) simple sentences in their original, unconverted form; 2) simple sentences in a transformed form, for example: a) without participial or participial phrases: b) without homogeneities (non-homogeneous, without rows of homogeneous members); c) no inserts (no text in brackets); d) no conditional names (no text in quotes); e) without circumstances (conditions) and the like, including combinations of the above and unspecified types.
  • simple sentences in their original, unconverted form 2) simple sentences in a transformed form, for example: a) without participial or participial phrases: b) without homogeneities (non-homogeneous, without rows of homogeneous members); c) no inserts (no text in brackets); d) no conditional names (no text in quotes); e) without circumstances
  • IS 14 from a logical point of view is a simple judgment, that is, a statement (simple statement) or refutation about the subject of judgment.
  • the sought judgment being a simple judgment, is the primary logical structure of thinking with the help of which is formed and the idea is conveyed that something (the predicate of the judgment) is affirmed or refuted about the subject of the judgment (the subject of the judgment).
  • IS 14 (regardless of the type - the first or the second), as a simple judgment, from the point of view of individual subject areas, is a construction described by a formalized model of a simple judgment.
  • the sought judgments 14 of the fourth data structure have identification data, by way of example and not limitation: IC value 141 and IC number 142.
  • the value 141 IS is a set of values of the final text elements (components of a simple judgment) that make up the sought judgment 14 of the fourth SD.
  • Number 142 IS are serial numbers TE 21, from which the values 142 are formed, making up the final judgment 14 of the fourth SD.
  • the sequence of actions for solving the search problem (PD) is formed on the basis of the search criteria for the required judgments for solving a specific applied problem in a specific subject area.
  • the PD contains information about the search actions that must be carried out to obtain the desired judgments, and also contains controlled data (indicators and their values) that must be used for the search actions of the PD.
  • the identification of the elements 14 (sought judgments) of the fourth data structure of the MDS is performed during step 1072 (3032) by performing search actions in accordance with the AP.
  • the execution of step 1072 (3032), in which the first elements 14 of the fourth data structure are identified is a mandatory identification action
  • the execution of step 1072 (3032), in which the second elements 14 of the fourth data structure are identified are additional actions, the presence and number of which is determined by the content of the PD.
  • the identification of the elements 14 (sought judgments) of the fourth data structure of the SMD is carried out according to two main scenarios depending on the content of the PD, namely, on the presence of a comparison (comparison, correlation) operation of simple judgments.
  • the first scenario for identifying elements 14 (required judgments) of the fourth data structure of the MDS, which does not contain the operation of comparing simple judgments, is performed at step 1072 (3032) by searching for the values of the indicators of the monitored data (specified in the PD) in the array of simple judgments (third SD). If there are simple judgments in the array (for example, in the third SD, which is the source for the considered method 300), the required data that correspond to the established values of the indicators of the controlled data, such simple judgments are identified as the sought judgments.
  • the second scenario for identifying elements 14 (sought judgments) of the fourth data structure of the MDS, containing operations for comparing simple judgments, is performed at step 1072 (3032) by searching for the values of the indicators of the controlled data (specified in the PD) in the array of simple judgments (third SD) and in the HBS, taking into account information from the BDO about the presence of relations of a certain type between the components of simple judgments. In the presence of the required data in the array of simple judgments and in the HBS, which correspond to the established values of the indicators of the controlled data, such simple judgments are identified as preliminary sought judgments.
  • the application of the second search script will allow to identify dispositions not only for the “buyer” subject, but also simultaneously (within the framework of one search action of the PD) also dispositions for subjects named in a different way, but in fact are the same subject, for example, but not limited to: “Consumer”, “person who buys goods”, “person who buys the service”, “service recipient”, “recipient of the service”, “recipient”, “recipient of the service”, “customer”.
  • the formation of elements 14 (required judgments) of the fourth data structure of the MDS is performed by registering the identified elements 14 of the fourth data structure, identified during the analysis of elements 13 (simple judgments) of the third data structure at step 1072.
  • identification and shaping can be performed conventionally by a linguist, or by a linguistic (syntactic) processor.
  • a linguistic (syntactic) processor e.g., a linguistic (syntactic) processor.
  • the formation of the fourth data structure of the MDS during step 1073 (3033) is performed by combining in one data structure the elements 14 of the fourth data structure of the MDS and their identification data according to known from the prior art principles and methods, which, accordingly, are not further described in detail.
  • FIG. 27 illustrates, by way of example and not limitation, an exemplary diagram of a structured data conversion system 400, which in a preferred embodiment comprises at least one or more structured data conversion computing devices 401 comprising at least one or more processors 4011 and memory 4012.
  • Said structured data conversion devices 401 may be, but are not limited to: personal computer, laptop, tablet computer, pocket computer, smartphone, phablet, and the like.
  • the memory (computer-readable medium) 4012 of the structured data conversion apparatus 401 contains program code that, when executed, causes said one or more processors 4011 of said device 401 to perform the actions of the previously described structured data conversion methods.
  • the computing device 401 may be a server computing device associated with a user computing device configured to send commands or commands to the server computing device 401 causing the processor or processors 4011 of the server computing device to execute program code that, when executed by the processor or processors of the server computing device.
  • the computing device 4011 causes the processor or processors 4011 of the server computing device to perform any of the previously described methods transformation of a structured data array.
  • the user computing device 402 may be, but is not limited to: a personal computer, a laptop computer, a tablet computer, a handheld computer, a smartphone, a phablet, a thin client, and the like.
  • the user computing device 402 may communicate with the server computing device 401 via a wired or wireless connection.
  • Said memory 4012 of the computer device 401 contains one or more structured data arrays to be converted containing at least a linguistic sentence, and may also contain any of the previously described data structures for any of the previously described conversion methods. structured data array. Moreover, the one or more structured data sets to be converted can be downloadable and stored, in particular, in the database 403 of the structured data set conversion system.
  • a computer-readable storage medium may include random access memory (RAM); read only memory (ROM); Electrically Erasable Programmable Read Only Memory (EEPROM); flash memory or other memory technologies; CDROM, digital versatile disk (DVD), or other optical or holographic storage media; magnetic cassettes, magnetic tape, magnetic disk storage or other magnetic storage devices, carrier waves, or other storage medium that can be used to encode desired information and can be accessed by device 401.
  • Memory includes storage medium based on computer storage in the form of volatile or nonvolatile memory, or a combination thereof.
  • Exemplary hardware devices include solid state memory, hard drives, optical drives, and so on.
  • the memory stores an exemplary environment in which, using computer instructions or codes stored in the memory of the device, a structured data set transformation procedure can be performed.
  • the device contains one or more processors 4011, which are designed to execute computer instructions or codes stored in the memory of the device in order to perform the procedure for transforming the structured data array.
  • Computer commands or codes stored in memory are designed to performing transformation of a structured data array.
  • System 400 may also include a database (DB) 403.
  • DB 403 may be, but is not limited to: hierarchical DB, network DB, relational DB, object DB, object-oriented DB, object-relational DB, spatial DB, combination listed two or more databases, and the like.
  • the OBD 403 stores data in memory, which may be, but is not limited to: read only memory (ROM), electrically erasable programmable read only memory (EEPROM), flash memory, CDROM, digital versatile disk (DVD) or other optical or holographic data carriers; magnetic cassettes, magnetic tape, magnetic disk storage or other magnetic storage devices, waveforms, or other storage medium that can be used to store desired information and can be accessed by structured data converter 401.
  • ROM read only memory
  • EEPROM electrically erasable programmable read only memory
  • flash memory CDROM, digital versatile disk (DVD) or other optical or holographic data carriers
  • the DB 403 serves to store data representing at least instructions for performing the steps of the previously described methods for transforming a structured data array; to be converted one or more structured data arrays containing at least a linguistic sentence, or one of the previously described initial data structures for any method of transformation, which can be loaded into the memory 4012 of the device 401 transformation of the structured data array; and other data necessary for the functioning of the system.
  • the exemplary structured data conversion system 400 may further comprise a server computing device 401 that, in addition to the previously described functions, stores and facilitates the manipulation of computer instructions or codes previously described herein, which, accordingly, are not further described.
  • the server computer device 401 in addition to the previously described functions, can provide regulation of data exchange in the structured data conversion system 400, and also provides data processing provided that one or more user computer devices 402 are connected to it. In this case, all the computing power, necessary to ensure the execution of the procedure for transforming the structured data array are located on the server computer device 401.
  • System 400 may also contain one or more transmission networks 404 data.
  • Data networks 404 may include, but are not limited to, one or more local area networks (LANs) and / or wide area networks (WANs), or may be the Internet, or an Intranet, or virtual private network (VPN). , or a combination thereof, and the like.
  • the server computing device 401 also has the ability to provide a virtual computing environment (Virtual Machine) for providing interaction between the user computing device 402 and the database 403.
  • the network 404 serves to provide communication between the computing device 401, the database 403, and the user computing device 402 of the structured transformation system 400. data array.
  • the user computing device 402 can be directly connected to the server computing device 401 using wired and wireless communication methods known from the prior art, which, accordingly, are not further described in detail.
  • the said devices 401, 402 by way of example and not limitation, may be equipped with input / output (i / o) devices suitable for providing a user with the results of performing certain previously described steps of any of the claimed methods 100, 200, or 300 ...

Abstract

The group of inventions relates to solutions in the field of processing data arrays, particularly to solutions in the field of processing structured data arrays containing natural language text, particularly linguistic sentences, and can be used for the preliminary conversion of a structured data array to allow the subsequent processing of same. The technical result achieved by carrying out the claimed invention is that of addressing the deficiencies of the closest prior art and thereby improving the efficiency of natural language text processing, as well as improving the efficiency of indexing, processing and searching within such a text. A further technical result is that of expanding the range of technical means and methods for processing structured data arrays containing natural language text.

Description

СПОСОБ ПРЕОБРАЗОВАНИЯ СТРУКТУРИРОВАННОГО МАССИВА ДАННЫХ METHOD FOR CONVERSION OF STRUCTURED DATA
[0001] ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ [0001] FIELD OF THE INVENTION
[0002] Группа изобретений относится к решениям в области обработки массивов данных, в частности, к решениям в области обработки структурированных массивов данных, содержащих текст на естественном языке, в частности, лингвистические предложения, и может быть использована для предварительного преобразования структурированного массива данных для обеспечения его последующей обработки. [0002] The group of inventions relates to solutions in the field of processing data arrays, in particular, to solutions in the field of processing structured data arrays containing text in a natural language, in particular, linguistic sentences, and can be used for preliminary transformation of a structured data array to provide its subsequent processing.
[0003] ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ [0003] BACKGROUND ART
[0004] Из патента РФ 2399959 (ЗАО «АВИКОМП СЕРВИСЕЗ»), опубликованного 10.05.2010 (Д1) известен способ автоматической индексации текстов на естественных языках. Известный из Д1 способ заключается в том, что текст сегментируют в электронной форме на элементарные единицы, выявляют устойчивые словосочетания, формируют предложения, выявляют семантически значимые объекты и семантически значимые отношения между ними, формируют для каждого семантически значимого отношения множество триад, в которых единственная триада первого типа соответствует связи, устанавливаемой семантически значимым отношением между двумя семантически значимыми объектами, при этом каждая из триад второго типа соответствует значению конкретного атрибута одного из этих семантически значимых объектов, каждая из триад третьего типа соответствует значению конкретного атрибута самого семантически значимого отношения, затем индексируют на множестве сформированных триад все связанные семантически значимыми отношениями семантически значимые объекты по отдельности, запоминают в базе данных сформированные триады и полученные индексы вместе со ссылкой на исходный текст, из которого сформированы эти триады. [0004] From the patent of the Russian Federation 2399959 (JSC "AVICOMP SERVICE"), published on 05/10/2010 (D1), a method of automatic indexing of texts in natural languages is known. The method known from D1 is that the text is segmented in electronic form into elementary units, stable phrases are identified, sentences are formed, semantically significant objects and semantically significant relationships between them are identified, for each semantically significant relationship a set of triads is formed, in which the only triad of the first type corresponds to the relationship established by a semantically significant relationship between two semantically significant objects, while each of the triads of the second type corresponds to the value of a specific attribute of one of these semantically significant objects, each of the triads of the third type corresponds to the value of a specific attribute of the semantically significant relationship itself, then indexed on the set of the formed triads, all semantically significant objects connected by semantically significant relations separately, store the formed triads and the resulting indices in the database together with a link to the source text from which the These triads are ovans.
[0005] Однако известный из Д1 способ не обладает достаточной точностью индексации элементов текста на естественном языке, что, в свою очередь, сказывается на точности последующей обработки текста на естественном языке и точности поиска в тексте на естественном языке. Главным образом, это происходит из-за недостаточно эффективной предварительной обработки текста на естественном языке, что, соответственно, не позволяет осуществить индексацию с достаточной точностью. Известный из Д1 способ может быть принят в качестве ближайшего аналога. [0005] However, the method known from D1 does not have sufficient accuracy of indexing elements of a text in a natural language, which, in turn, affects the accuracy of the subsequent processing of a text in a natural language and the accuracy of a search in a text in a natural language. This is mainly due to insufficiently efficient pre-processing of natural language text, which, accordingly, does not allow indexing with sufficient accuracy. The method known from D1 can be adopted as the closest analogue.
[0006] РАСКРЫТИЕ ИЗОБРЕТЕНИЯ [0007] Технической проблемой, решаемой заявленным изобретением, является создание изобретений, не обладающих недостатками ближайшего аналога и таким образом обладающих повышенной эффективностью обработки текста на естественном языке для его последующей индексации, обработки и поиска. [0006] DISCLOSURE OF THE INVENTION [0007] The technical problem solved by the claimed invention is the creation of inventions that do not have the disadvantages of the closest analogue and thus have increased efficiency of processing text in natural language for its subsequent indexing, processing and search.
[0008] Техническим результатом, достигаемым при реализации заявленного изобретения, является устранение недостатков ближайшего аналога и таким образом повышение эффективности обработки текста на естественном языке, а также повышение эффективности его индексации, обработки и поиска в таком тексте. Другим техническим результатом является расширение арсенала технических средств - способов обработки структурированных массивов данных, содержащих текст на естественном языке. [0008] The technical result achieved when implementing the claimed invention is to eliminate the shortcomings of the closest analogue and thus to increase the efficiency of processing text in natural language, as well as to increase the efficiency of its indexing, processing and search in such text. Another technical result is the expansion of the arsenal of technical means - methods of processing structured data arrays containing text in natural language.
[0009] Технический результат достигается за счет того, что обеспечивается исполняемый процессором или процессорами компьютерного устройства способ преобразования структурированного массива данных (СМД), содержащего лингвистические предложения (ЛП), заключающийся в: выполнении этапа 101 формирования первой структуры данных (СД), на котором формируют первую СД СМД, содержащую элементы упомянутой первой СД, причем упомянутые элементы первой СД представляют собой текстовые элементы (ТЭ) лингвистического предложения, а также идентификационные данные ТЭ, представляющие собой в качестве примера, но не ограничения: значения ТЭ и порядковые номера ТЭ в лингвистическом предложении; выполнении этапа 102 формирования базы данных лингво-логических признаков (БДЛЛП), на котором на основании сведений, содержащихся в первой СД, выявляют лингвистические и логические признаки ТЭ лингвистического предложения, из которых формируют базу данных, представляющую собой базу данных лингвистических и логических признаков текстовых элементов лингвистического предложения; выполнении этапа 103 формирования второй СД, на котором на основании сведений, содержащихся в БДЛЛП, первой СД, а также на основании формализованной модели простого суждения, формируют вторую СД СМД, содержащую элементы упомянутой второй СД, причем упомянутые элементы второй СД представляют собой компоненты простых суждений (КПС), а также идентификационные данные КПС, представляющие собой в качестве примера, но не ограничения: значения КПС и порядковые номера ТЭ лингвистического предложения, составляющих КПС; выполнении этапа 104 формирования третьей СД, на котором на основании сведений, содержащихся в БДЛЛП, второй СД, а также на основании формализованной модели простого суждения, формируют третью СД СМД, содержащую элементы упомянутой третьей СД, причем упомянутые элементы третьей СД представляют собой простые суждения (ПС) лингвистического предложения, а также идентификационные данные ПС, представляющие собой в качестве примера, но не ограничения: значения ПС и порядковые номера ТЭ лингвистического предложения, составляющих ПС; выполнении этапа 105 формирования онтологической базы данных системных и семантических связей в третьей СД, на котором на основании сведений, содержащихся в БД 1 1П, второй СД и третьей СД, а также на основании критериев поиска системных и семантических однородностей, выявляют и регистрируют системные и семантические связи между компонентами ПС, из которых формируют онтологическую базу данных системных и семантических связей компонентов ПС в третьей СД (ОБД); выполнении этапа 106 формирования базы данных отношений в третьей СД, на котором на основании сведений, содержащихся в ОБД, а также на основании критериев поиска искомых суждений, сравнивают компоненты ПС, а также классифицируют и регистрируют виды отношений между сравниваемыми компонентами ПС, из которых формируют базу данных отношений компонентов ПС в третьей СД (БДО); выполнении этапа 107 формирования итоговой СД, на котором на основании сведений, содержащихся в БДО, третьей СД, а также на основании упомянутых критериев поиска искомых суждений, формируют итоговую СД, содержащую элементы итоговой СД, причем упомянутые элементы итоговой СД представляют собой искомые суждения (ИС), а также идентификационные данные ИС, представляющие собой в качестве примера, но не ограничения: значения ИС и порядковые номера первичных текстовых элементов (ПТЭ) лингвистического предложения, составляющих ИС. [0009] The technical result is achieved due to the fact that a method for transforming a structured data array (MDS) containing linguistic sentences (LP), which is executed by a processor or processors of a computer device, is provided, which consists in: performing stage 101 of forming the first data structure (SD), on which form the first SD SDM containing the elements of the said first SD, and the mentioned elements of the first SD are text elements (TE) of a linguistic sentence, as well as identification data of TE, which are, by way of example, but not limitation: TE values and serial numbers of TE in the linguistic proposal; performing stage 102 of the formation of a database of linguistic and logical signs (BDLLP), on which, based on the information contained in the first SD, linguistic and logical signs of TE of a linguistic sentence are identified, from which a database is formed, which is a database of linguistic and logical signs of text elements linguistic proposal; performing the stage 103 of the formation of the second SD, on which, based on the information contained in the BDLLP, the first SD, as well as on the basis of a formalized model of a simple judgment, a second SD SD is formed containing elements of the said second SD, and the mentioned elements of the second SD are components of simple judgments (KPS), as well as the identification data of the KPS, which are, by way of example, but not limitation: the values of the KPS and the serial numbers of the TE of the linguistic sentence that make up the KPS; performing stage 104 of the formation of the third SD, on which, based on the information contained in the BDLLP, the second SD, as well as on the basis of a formalized model of a simple judgment, form the third SD of the SD, containing the elements of the mentioned third SD, and the mentioned elements of the third SD are simple judgments (PS) of the linguistic sentence, as well as identification data of the PS, which are, by way of example, but not limitation: the values of the PS and the serial numbers of the TE of the linguistic sentence that make up the PS; performing stage 105 of the formation of an ontological database of system and semantic relations in the third SD, on which, based on the information contained in the database 1 1P, the second SD and the third SD, as well as based on the search criteria for system and semantic homogeneities, system and semantic links between the components of the SS, from which they form an ontological database of system and semantic links of the components of the SS in the third SD (OBD); performing stage 106 of forming a database of relations in the third SD, on which, based on the information contained in the HBS, as well as on the basis of the search criteria for the sought judgments, the components of the PS are compared, and also the types of relations between the compared components of the PS are classified and recorded, from which the base is formed data of the relations of the components of the PS in the third SD (BDO); performing stage 107 of the formation of the final SD, on which, based on the information contained in the BDO, the third SD, and also on the basis of the mentioned search criteria for the sought judgments, the final SD is formed containing the elements of the final SD, and the mentioned elements of the final SD are the sought judgments (IS ), as well as the identification data of the IS, which are, by way of example, but not limitation: the values of the IS and the ordinal numbers of the primary text elements (PTE) of the linguistic sentence that make up the IS.
[0010] КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ [0010] BRIEF DESCRIPTION OF THE DRAWINGS
[ООН] Иллюстративные варианты осуществления настоящего изобретения описываются далее подробно со ссылкой на прилагаемые чертежи, которые включены в данный документ посредством ссылки, и на которых: [UN] Illustrative embodiments of the present invention are described in detail below with reference to the accompanying drawings, which are incorporated herein by reference, and in which:
[0012] На фиг. 1, в качестве примера, но не ограничения, изображена примерная общая схема выполнения этапов заявленного способа 100. [0012] FIG. 1, by way of example and not limitation, an exemplary general diagram of the steps of the claimed method 100 is shown.
[0013] На фиг. 2, в качестве примера, но не ограничения, изображена примерная общая схема выполнения этапов этапа 101. [0013] FIG. 2, by way of example and not limitation, an exemplary general flow diagram of the steps of step 101 is depicted.
[0014] На фиг. 3, в качестве примера, но не ограничения, изображена общая структура исходной структуры данных, содержащей лингвистические предложения. [0014] FIG. 3, by way of example and not limitation, depicts the general structure of the original data structure containing linguistic sentences.
В [0015] На фиг. 4, в качестве примера, но не ограничения, изображена общая структура сформированной первой структуры данных. IN [0015] FIG. 4, by way of example and not limitation, the general structure of the generated first data structure is shown.
[0016] На фиг. 5, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 102. [0016] FIG. 5, by way of example and not limitation, a general flow diagram of the steps of step 102 is shown.
[0017] На фиг. 6, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных лингво-логических признаков. [0017] FIG. 6, by way of example, but not limitation, shows the general structure of the generated database of linguo-logical features.
[0018] На фиг. 7, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 103. [0018] FIG. 7, by way of example and not limitation, a general flow diagram of the steps of step 103 is shown.
[0019] На фиг. 8, в качестве примера, но не ограничения, изображена общая структура сформированной второй структуры данных. [0019] FIG. 8, by way of example and not limitation, shows the general structure of the generated second data structure.
[0020] На фиг. 9, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 104. [0020] FIG. 9, by way of example and not limitation, a general flow diagram of the steps of step 104 is shown.
[0021] На фиг. 10, в качестве примера, но не ограничения, изображена общая структура сформированной третьей структуры данных. [0021] FIG. 10, by way of example and not limitation, the general structure of the generated third data structure is shown.
[0022] [0023] На фиг. 11 в качестве примера, но не ограничения, изображена примерная общая схема выполнения этапов заявленного способа 200. [0022] [0023] FIG. 11 illustrates by way of example and not limitation, an exemplary general flow diagram of the steps of the claimed method 200.
[0023] На фиг. 12, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 201. [0023] FIG. 12, by way of example and not limitation, a general flow diagram of step 201 is shown.
[0024] На фиг. 13, в качестве примера, но не ограничения, изображена общая структура первой структуры данных для способа 200, содержащей компоненты простого суждения. [0024] FIG. 13, by way of example and not limitation, depicts the general structure of a first data structure for method 200 containing simple judgment components.
[0025] На фиг. 14, в качестве примера, но не ограничения, изображена общая структура второй структуры данных для способа 200, содержащей простые суждения. [0025] FIG. 14, by way of example and not limitation, depicts the general structure of a second data structure for method 200 containing simple judgments.
[0026] На фиг. 15, в качестве примера, но не ограничения, изображена общая структура базы данных лингво-логических признаков. [0026] FIG. 15, by way of example and not limitation, depicts the general structure of a database of linguo-logical characteristics.
[0027] На фиг. 16, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 105. [0027] FIG. 16 illustrates, by way of example and not limitation, a general flow diagram of the steps of step 105.
[0028] На фиг. 17, в качестве примера, но не ограничения, изображена общая структура сформированной онтологической базы данных системных и семантических связей. [0028] FIG. 17, by way of example, but not limitation, shows the general structure of the generated ontological database of system and semantic relationships.
[0029] На фиг. 18, в качестве примера, но не ограничения, изображена примерная общая схема выполнения этапов заявленного способа 300. [0030] На фиг. 19, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 301. [0029] FIG. 18, by way of example and not limitation, depicts an exemplary general flowchart of steps of the claimed method 300. [0030] FIG. 19, by way of example and not limitation, a general flow diagram of step 301 is shown.
[0031] На фиг. 20, в качестве примера, но не ограничения, изображена общая структура исходной структуры данных для способа 300, содержащей простые суждения. [0031] FIG. 20, by way of example and not limitation, depicts the general structure of the original data structure for method 300, containing simple judgments.
[0032] На фиг. 21, в качестве примера, но не ограничения, изображена общая структура онтологической базы данных системных и семантических связей. [0032] FIG. 21, by way of example and not limitation, depicts the general structure of an ontological database of systemic and semantic relationships.
[0033] На фиг. 22, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 106. [0033] FIG. 22, by way of example and not limitation, a general flow diagram of the steps of step 106 is shown.
[0034] На фиг. 23, в качестве примера, но не ограничения, изображена общая структура сформированной карты отношений. [0034] FIG. 23, by way of example and not limitation, the general structure of the generated relationship map is shown.
[0035] На фиг. 24, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных отношений. [0035] FIG. 24 illustrates, by way of example and not limitation, the general structure of the generated relationship database.
[0036] На фиг. 25, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 107. [0036] FIG. 25, by way of example and not limitation, a general flow diagram of the steps of step 107 is shown.
[0037] На фиг. 26, в качестве примера, но не ограничения, изображена общая структура сформированной четвертой структуры данных (итоговой СД). [0037] FIG. 26, by way of example and not limitation, depicts the general structure of the generated fourth data structure (final SD).
[0038] На фиг. 27, в качестве примера, но не ограничения, изображена примерная общая схема системы для преобразования структурированного массива данных. [0038] FIG. 27, by way of example and not limitation, depicts an exemplary general diagram of a system for transforming a structured data set.
[0039] ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ [0039] MODES FOR CARRYING OUT THE INVENTION
[0040] Описанные в данном разделе возможные осуществления вариантов настоящего изобретения представлены на неограничивающих объем правовой охраны примерах, применительно к конкретным вариантам осуществления настоящего изобретения, которые во всех их аспектах предполагаются иллюстративными и не накладывающими ограничения. Альтернативные варианты реализации настоящего изобретения, не выходящие за пределы объема его правовой охраны, являются очевидными специалистам в данной области, имеющим обычную квалификацию, на которых это изобретение рассчитано. [0040] The exemplary embodiments of the present invention described in this section are presented by non-limiting examples in relation to specific embodiments of the present invention, which in all their aspects are intended to be illustrative and non-limiting. Alternative embodiments of the present invention, without departing from the scope of its legal protection, will be obvious to those skilled in the art with ordinary skill on which this invention is designed.
[0041] Варианты осуществления настоящего изобретения относятся к способам, устройствам, системам и машиночитаемым носителям данных для обеспечения повышенной эффективности обработки текста на естественном языке для его последующей индексации, обработки и поиска. [0041] Embodiments of the present invention relate to methods, devices, systems, and computer-readable storage media for providing enhanced efficiency in processing natural language text for indexing, processing, and retrieval.
[0042] На фиг. 1, в качестве примера, но не ограничения, изображена примерная общая схема выполнения этапов способа 100 преобразования структурированного массива данных (СМД). В результате реализации тех или иных этапов способа 100 могут быть получены различные структуры данных, пригодные для дальнейшего анализа и использования. Заявленный исполняемый процессором или процессорами компьютерного устройства способ 100 заключается в: выполнении этапа 101 формирования первой структуры данных (СД), на котором формируют первую СД СМД, содержащую элементы упомянутой первой СД, причем упомянутые элементы первой СД представляют собой текстовые элементы (ТЭ) лингвистического предложения (ЛП), а также идентификационные данные ТЭ, представляющие собой в качестве примера, но не ограничения: значения ТЭ и порядковые номера ТЭ в лингвистическом предложении; выполнении этапа 102 формирования базы данных лингво-логических признаков (БДЛЛ П), на котором на основании сведений, содержащихся в первой СД, выявляютлингвистические и логические признаки ТЭ лингвистического предложения, из которых формируют базу данных, представляющую собой базу данных лингвистических и логических признаков текстовых элементов лингвистического предложения; выполнении этапа 103 формирования второй СД, на котором на основании сведений, содержащихся в БДЛЛП, первой СД, а также на основании формализованной модели простого суждения, формируют вторую СД СМД, содержащую элементы упомянутой второй СД, причем упомянутые элементы второй СД представляют собой компоненты простых суждений (КПС), а также идентификационные данные КПС, представляющие собой в качестве примера, но не ограничения: значения КПС и порядковые номера ТЭ лингвистического предложения, составляющих КПС; выполнении этапа 104 формирования третьей СД, на котором на основании сведений, содержащихся в БДЛЛП, второй СД, а также на основании формализованной модели простого суждения, формируют третью СД СМД, содержащую элементы упомянутой третьей СД, причем упомянутые элементы третьей СД представляют собой простые суждения (ПС) лингвистического предложения, а также идентификационные данные ПС, представляющие собой в качестве примера, но не ограничения: значения ПС и порядковые номера ТЭ лингвистического предложения, составляющих ПС; выполнении этапа 105 формирования онтологической базы данных системных и семантических связей в третьей СД, на котором на основании сведений, содержащихся в БДЛЛП, второй СД, третьей СД, а также на основании критериев поиска системных и семантических однородностей, выявляют и регистрируют системные и семантические связи между компонентами ПС, из которых формируют онтологическую базу данных системных и семантических связей компонентов ПС в третьей СД (ОБД); б выполнении этапа 106 формирования базы данных отношений в третьей СД, на котором на основании сведений, содержащихся в ОБД, а также на основании критериев поиска искомых суждений, сравнивают компоненты ПС, а также классифицируют и регистрируют виды отношений между сравниваемыми компонентами ПС, из которых формируют базу данных отношений компонентов ПС в третьей СД (БДО); выполнении этапа 107 формирования четвертой СД, на котором на основании сведений, содержащихся в БДО, третьей СД, а также на основании упомянутых критериев поиска искомых суждений, формируют четвертую СД, содержащую элементы четвертой СД, причем упомянутые элементы четвертой СД представляют собой искомые суждения (ИС), а также идентификационные данные ИС, представляющие собой в качестве примера, но не ограничения: значения ИС и порядковые номера текстовых элементов (ТЭ) лингвистического предложения, составляющих ИС. [0042] FIG. 1, by way of example and not limitation, an exemplary general flow diagram of the steps of a method 100 for transforming a structured array is shown. data (SMD). As a result of the implementation of certain steps of the method 100, various data structures can be obtained that are suitable for further analysis and use. The claimed method 100 executed by the processor or processors of the computer device consists in: performing the step 101 of the formation of the first data structure (SD), on which the first SD SD is formed, containing the elements of the said first SD, and the mentioned elements of the first SD are text elements (TE) of the linguistic sentence (LP), as well as TE identification data, which are, as an example, but not limitation: TE values and TE serial numbers in a linguistic sentence; performing stage 102 of the formation of a database of linguistic and logical signs (BDLL P), on which, based on the information contained in the first SD, the linguistic and logical signs of TE of a linguistic sentence are identified, from which a database is formed, which is a database of linguistic and logical signs of text elements linguistic proposal; performing the stage 103 of the formation of the second SD, on which, based on the information contained in the BDLLP, the first SD, as well as on the basis of a formalized model of a simple judgment, a second SD SD is formed containing elements of the said second SD, and the mentioned elements of the second SD are components of simple judgments (KPS), as well as the identification data of the KPS, which are, by way of example, but not limitation: the values of the KPS and the serial numbers of the TE of the linguistic sentence that make up the KPS; performing the stage 104 of the formation of the third SD, on which, based on the information contained in the BDLLP, the second SD, as well as on the basis of a formalized model of a simple judgment, form the third SD of the SD, containing elements of the mentioned third SD, and the mentioned elements of the third SD are simple judgments ( PS) of the linguistic sentence, as well as the identification data of the PS, which are, as an example, but not limitation: the values of the PS and the serial numbers of the TE of the linguistic sentence that make up the PS; performing stage 105 of the formation of an ontological database of system and semantic relations in the third SD, on which, based on the information contained in the BDLLP, the second SD, the third SD, as well as on the basis of the search criteria for system and semantic homogeneities, the system and semantic connections between SS components, from which they form an ontological database of system and semantic links of SS components in the third SD (OBD); b performing stage 106 of forming a database of relations in the third SD, on which, based on the information contained in the HBS, as well as on the basis of the search criteria for the sought judgments, the components of the PS are compared, and also the types of relations between the compared components of the PS are classified and recorded, from which the base is formed data of the relations of the components of the PS in the third SD (BDO); performing stage 107 of the formation of the fourth SD, on which, on the basis of the information contained in the BDO, the third SD, and also on the basis of the mentioned search criteria for the sought judgments, the fourth SD is formed, containing the elements of the fourth SD, and the mentioned elements of the fourth SD are the sought judgments (IS ), as well as the identification data of the IS, which are, by way of example, but not limitation: the values of the IS and the ordinal numbers of the text elements (TE) of the linguistic sentence that make up the IS.
[004В] На фиг. 2, в качестве примера, но не ограничения, изображена примерная общая схема выполнения этапов этапа 101 формирования первой структуры данных. Этап 101 характеризуется: выполнением этапа 1011 идентификации исходной структуры данных СМД на котором идентифицируют элементы 11 исходной структуры данных СМД, являющиеся лингвистическими предложениями 11 (ЛП 11); выполнением этапа 1012 идентификации элементов 21 первой структуры данных СМД, на котором идентифицируют элементы 21 первой структуры данных СМД, являющиеся текстовыми элементами (ТЭ 21) лингвистического предложения 11, а также идентификационные данные ТЭ 21, представляющие собой в качестве примера, но не ограничения значения 211 ТЭ 21 и порядковые номера 212 ТЭ 21 в лингвистическом предложении 11, и формируют первую структуру данных СМД. [004B] FIG. 2, by way of example and not limitation, an exemplary general flowchart of the steps of step 101 of generating a first data structure is shown. Step 101 is characterized by: performing step 1011 of identifying the original MDS data structure, which identifies the elements 11 of the original MDS data structure, which are linguistic sentences 11 (LP 11); performing the step 1012 of identifying the elements 21 of the first data structure of the MDS, which identifies the elements 21 of the first data structure of the MDS, which are text elements (TE 21) of the linguistic sentence 11, as well as the identification data of the TE 21, which are, by way of example, but not limitation of the values 211 TE 21 and serial numbers 212 TE 21 in the linguistic sentence 11, and form the first data structure of the SMD.
[0044] На фиг. 3, в качестве примера, но не ограничения, изображена общая структура исходной структуры данных (ИСД 1), из которой формируется первая структура данных СМД. Исходные данные представляют собой СМД, содержащий элементы 11 исходной структуры данных, представляющие собой лингвистические предложения (ЛП). Такой массив данных представляет собой множество лингвистических предложений 11, относящихся к любой области деятельности и любого назначения, в том числе и тексты правовых актов. У элементов 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 11 в качестве примера, но не ограничения могут именоваться как «ЛП 1», «ЛП 2», «ЛП п», где n > 1 - порядковый номер элемента в массиве лингвистических предложений. Лингвистическое предложение - это грамматически организованное соединение слов (множество синтаксически связанных слов), обладающее смысловой и логической завершенностью. ЛП содержит следующие объекты: слова, цифры (числа), знаки препинания и индексы (конструкции из букв, цифр и знаков, в том числе формулы (набор букв, цифр и знаков без пробелов, в котором используются специальные символы (например, но не ограничиваясь, звездочка, плюс, минус, равно, больше, меньше, интеграл и тому подобное, характеризующие суть формулы)). Все перечисленные выше объекты, отделены друг от друга в предложении пробелом, за исключением знаков препинания (они присоединены к словам, цифрам и индексам) и формул, и именуются элементами ЛП 11. ЛП 11 в исходной структуре данных представляют собой отдельные элементы, заранее подготовленные и помещенные в исходную структуру данных не в виде лингвистического текста, а в виде структурированного массива (списка, перечня и тому подобного) отдельных ЛП. Такие подготовительные действия могут осуществляться любым известным из уровня техники способом и, соответственно, далее не описываются. Идентификация элементов 11 исходной структуры данных в рамках этапа 1011 сводится к обеспечению классификации элементов, из которых состоит исходная структура данных, и выделению таких элементов как лингвистических предложений (ЛП 11). Исходная структура данных представляет собой таким образом множество элементов 11, идентифицированных на этапе 1011. [0044] FIG. 3, by way of example and not limitation, shows the general structure of the original data structure (ISD 1), from which the first MDS data structure is formed. The initial data is an LMD containing elements 11 of the original data structure, which are linguistic sentences (LP). Such an array of data is a set of 11 linguistic proposals related to any field of activity and any purpose, including the texts of legal acts. Elements 11 do not have unique names (UN) that characterize them and have practical use. In the data structure, elements 11 as an example, but not limitation, may be referred to as "LP 1", "LP 2", "LP n", where n> 1 is the ordinal number of the element in the array of linguistic sentences. A linguistic sentence is a grammatically organized combination of words (a set of syntactically related words) that has semantic and logical completeness. LP contains the following objects: words, numbers (numbers), punctuation marks and indices (constructions of letters, numbers and signs, including formulas (a set of letters, numbers and signs without spaces, in which special characters are used (for example, but not limited to , asterisk, plus, minus, equal, greater than, less, integral and the like, characterizing the essence of the formula)). All the above objects are separated from each other in a sentence by a space, with the exception of punctuation (they are attached to words, numbers and indices ) and formulas, and are called elements of LP 11. LP 11 in the original data structure are separate elements prepared in advance and placed in the original data structure not in the form of a linguistic text, but in the form of a structured array (list, list, etc.) of individual LP Such preparatory actions can be carried out in any way known from the prior art and, accordingly, are not further described. Identification of elements 11 of the original structure is given in the framework of stage 1011 is reduced to ensuring the classification of the elements that make up the original data structure, and highlighting such elements as linguistic sentences (LP 11). The original data structure is thus a plurality of elements 11 identified in step 1011.
[0045] На фиг. 4, в качестве примера, но не ограничения, изображена общая структура сформированной первой структуры данных. Первая структура данных представляет собой СМД, содержащий элементы 21 первой структуры данных, которые представляют собой текстовые элементы (ТЭ 21) лингвистического предложения 11 и идентификационные данные ТЭ 21. У текстовых элементов 21 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 21 в качестве примера, но не ограничения могут именоваться как «ТЭ 1», «ТЭ 2», «ТЭ В» «ТЭ п», где n > 1 - порядковый номер элемента в лингвистическом предложении 11. ТЭ 21 лингвистического предложения (ЛП 11) являются текстовыми элементами ЛП, то в качестве примера, но не ограничения текстовыми элементами могут быть ТЭ первичного вида, а именно словами, цифрами (числами), знаками препинания или индексами (конструкциями из букв, цифр и знаков), содержащимися в ЛП и отделенными друг от друга пробелом, за исключением знаков препинания. Текстовыми элементами иного вида могут быть, в качестве примера, но не ограничения, словоформы, то есть группы слов, отличающиеся от первичных ТЭ тем, что представляют собой не формально отдельное слово предложения (то есть букву или набор букв, отделенных пробелом от других слов), а группу слов, которая с лингвистической точки зрения является одним морфологическим и синтаксическим объектом. Такая группа слов именуется «сложной словоформой». Например, слова «в», «соответствие» и «с» представляют собой, как кажется, несколько ТЭ, хотя на самом деле являются одним сложным текстовым элементом «в соответствии с», который и выявляется на этапе 1012 как один ТЭ 21. Текстовые элементы 21 лингвистического предложения 11 имеют идентификационные данные ТЭ 21, в качестве примера, но не ограничения: значение 211 ТЭ и номер 212 ТЭ. Значением 211 ТЭ является набор букв, цифр, знаков, из которых состоит ТЭ 21. Номером 212 ТЭ является порядковый номер ТЭ 21 в лингвистическом предложении 11. Идентификацию и формирование текстовых элементов 21 первой структуры данных в ходе этапа 1012 производят путем анализа текста и выявления (выделения) отдельных текстовых элементов согласно их вида и описания, которое должно быть известно заранее. Например, но не ограничиваясь, такой анализ может производиться путем выделения в предложении слов, чисел или индексов, разделенных друг от друга пробелом, а также знаков препинания, которые присоединены к упомянутым словам, числам и индексам. При этом предпочтительно, чтобы последний знак препинания в предложении не учитывался и не рассматривался в качестве текстового элемента 21 лингвистического предложения 11. Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью различных систем машинного обучения, в том числе статистического процессора или нейросети. Идентификацию значения 211 текстового элемента 21 первой структуры данных в ходе этапа 1012 производят путём регистрации символов (букв, цифр, знаков), из которых состоит текстовый элемент 21. Идентификацию номера 212 текстового элемента 21 первой структуры данных в ходе этапа 1012 производят путём расчета местоположения ТЭ 21 в лингвистическом предложении 11. При этом первый текстовый элемент 21 в лингвистическом предложении 11 получает номер 1, а все последующие ТЭ получают номер больше на 1, чем номер предыдущего ТЭ 21. Формирование первой структуры данных СМД в ходе этапа 1012 производят путем объединения в одной структуре данных элементов 21 первой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. [0045] FIG. 4, by way of example and not limitation, the general structure of the generated first data structure is shown. The first data structure is an SMD containing elements 21 of the first data structure, which are text elements (TE 21) of linguistic sentence 11 and identification data of TE 21. Text elements 21 of linguistic sentence 11 do not have unique names (UN) that characterize them, which have practical using. In the data structure, elements 21 as an example, but not a limitation, can be referred to as "TE 1", "TE 2", "TE V""TEn", where n> 1 is the ordinal number of the element in the linguistic sentence 11. TE 21 of the linguistic sentences (LP 11) are text elements of the LP, then as an example, but not limitation, text elements can be TE of the primary type, namely words, numbers (numbers), punctuation marks or indices (constructions of letters, numbers and signs) contained in LP and separated from each other by a space, except for punctuation marks. Text elements of a different kind can be, as an example, but not limitation, word forms, that is, groups of words that differ from the primary TE topics, which are not a formally separate word of a sentence (that is, a letter or a set of letters separated by a space from other words), but a group of words, which, from a linguistic point of view, is one morphological and syntactic object. Such a group of words is called a "complex word form". For example, the words "in", "correspondence" and "c" seem to represent several TEs, although in fact they are one complex text element "in accordance with", which is revealed at step 1012 as one TE 21. Text elements 21 of linguistic sentence 11 have identification data TE 21, by way of example, but not limitation: value 211 TE and number 212 TE. The value of TE 211 is a set of letters, numbers, signs that make up TE 21. TE number 212 is the serial number of TE 21 in linguistic sentence 11. Identification and formation of text elements 21 of the first data structure during stage 1012 is performed by analyzing the text and revealing ( highlighting) individual text elements according to their type and description, which should be known in advance. For example, but not limited to, such analysis can be performed by highlighting words, numbers or indices in a sentence, separated from each other by a space, as well as punctuation marks that are attached to said words, numbers and indices. In this case, it is preferable that the last punctuation mark in the sentence is not taken into account and is not considered as the text element 21 of the linguistic sentence 11. Such an analysis can be performed in any way known from the prior art and, accordingly, will not be described in detail further. For example, but not limited to, such analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor. Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using various machine learning systems, including a statistical processor or a neural network. The identification of the value 211 of the text element 21 of the first data structure during step 1012 is performed by registering the symbols (letters, numbers, signs) that make up the text element 21. The identification of the number 212 of the text element 21 of the first data structure during step 1012 is performed by calculating the location of the TE 21 in linguistic sentence 11. In this case, the first text element 21 in linguistic sentence 11 receives the number 1, and all subsequent TEs receive a number greater by 1 than the number of the previous TE 21. The formation of the first SDM data structure during stage 1012 is performed by combining in one data structure elements 21 of the first data structure of the MDS, as well as their identification data according to known from the prior art principles and methods, which, respectively, are not further described in detail.
[0046] На фиг. 5, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 102 формирования базы данных лингво-логических признаков, представляющей собой базу данных лингвистических и логических признаков текстовых элементов 21 предложения 11 после выполнения этапа 102. Этап 102 характеризуется выполнением этапа 1021 формирования первой части лингво-логических признаков ТЭ лингвистического предложения, на котором для лингвистического анализа ТЭ, содержащихся в первой СД и классифицированных как слово, предоставляют идентификационные данные ТЭ и получают лингвистические характеристики ТЭ, а также значения упомянутых лингвистических характеристик; выполнением этапа 1022 формирования второй части лингво-логических признаков ТЭ лингвистического предложения, на котором для логического анализа ТЭ, содержащихся в первой СД и классифицированных как слово, предоставляют идентификационные данные ТЭ, а также лингвистические характеристики ТЭ лингвистического предложения вместе с упомянутыми значениями лингвистических характеристик, и получают логические характеристики ТЭ лингвистического предложения, а также значения упомянутых логических характеристик; выполнением этапа 1023 формирования базы данных лингво-логических признаков (БДЛ/1П), на котором формируют БДЛЛП первичных текстовых элементов лингвистического предложения, при этом лингво-логическими признаками ТЭ являются все полученные по соответствующему ТЭ в ходе этапов 1021 и 1022 упомянутые лингвистические характеристики и упомянутые логические характеристики, обладающие соответствующими упомянутыми значениями лингвистических характеристик и упомянутыми значениями логических характеристик. [0046] FIG. 5, by way of example and not limitation, shows a general flow diagram of the steps of step 102 of generating a database of linguo-logical features, which is a database of linguistic and logical features of text elements 21 of sentence 11 after step 102. Step 102 is characterized by the execution of step 1021. the first part of the linguistic and logical features of the TE of a linguistic sentence, on which, for linguistic analysis, TEs contained in the first SD and classified as a word, provide TE identification data and obtain the linguistic characteristics of TEs, as well as the values of the mentioned linguistic characteristics; performing stage 1022 of the formation of the second part of the linguistic-logical features of the TE of the linguistic sentence, in which, for the logical analysis of the TEs contained in the first SD and classified as a word, the TE identification data, as well as the linguistic characteristics of the TE of the linguistic sentence together with the mentioned values of the linguistic characteristics, are provided, and get the logical characteristics of the TE of the linguistic sentence, as well as the values of the mentioned logical characteristics; the execution of stage 1023 of the formation of a database of linguistic and logical signs (BDL / 1P), on which the BDLP of the primary text elements of a linguistic sentence is formed, while the linguistic and logical signs of TE are all the above-mentioned linguistic characteristics obtained by the corresponding TE during steps 1021 and 1022 and the mentioned logical characteristics having corresponding said linguistic characteristic values and said logical characteristic values.
[0047] На фиг. 6, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных лингво-логических признаков (БДЛЛП), являющейся БДЛЛП текстовых элементов 21 лингвистического предложения 11 после выполнения этапа 102. Первая часть лингво-логических признаков 213 текстовых элементов 21 лингвистического предложения 11 может содержать лингвистические характеристики (морфологические, синтаксические и семантические характеристики). При этом совокупность значений всех лингвистических характеристик текстового элемента является для каждого ТЭ 21 лингвистического предложения 11 его отличительным (уникальным) лингвистическим признаком в лингвистическом предложении 11. Морфологические характеристики предпочтительно указывают на морфологические признаки ТЭ 21 лингвистического предложения 11, которые могут быть классифицированы, в качестве примера, но не ограничения, по уровню вложенности (род-вид-подвид). При этом морфологическими родами ТЭ 21 лингвистического предложения 11 предпочтительно являются слово, цифра, знаки препинания, иные знаки; морфологическими видами - часть речи (для слов), вид цифры (арабская, римская), вид знака препинания (точка, запятая и тому подобное), вид иного знака, вид индекса (формула, сложная нумерация и тому подобное); морфологическими подвидами - род, число, падеж частей речи и тому подобное для слов, а также число, двоичный код, индекс и тому подобное для цифр. Синтаксические характеристики предпочтительно указывают на множество синтаксических признаков ТЭ 21 лингвистического предложения 11, среди которых можно выделить, в качестве примера, но не ограничения, следующие синтаксические признаки ТЭ 21 лингвистического предложения 11: синтаксическая роль (сказуемое, подлежащее и тому подобное); синтаксический родитель (синтаксически главное слово); синтаксические потомки (синтаксически подчиненные слова); синтаксическая сочинительная связь (наличие иного ТЭ, имеющего ту же синтаксическую роль и того же синтаксического родителя). Семантические характеристики предпочтительно указывают на семантические признаки ТЭ 21 лингвистического предложения 11, среди которых можно выделить, в качестве примера, но не ограничения, следующие семантические характеристики ТЭ 21 лингвистического предложения 11: семантическая группа (группа слов, которые можно отнести к одному классу, роду, виду или подвиду предметов или действий окружающего мира при совпадении признаков упомянутых классов, родов, видов или подвидов), семантический статус (смысловое значение слова или группы слов в рамках словосочетания, которым называется некий мыслимый образ (предмет или действие) - например, но не ограничиваясь, мыслимый образ «отсутствие продавца в месте нахождения потребителя» состоит из двух элементов верхнего уровня (терминов): первого - «отсутствие продавца», и второго - «месте нахождения потребителя», у которых имеются следующие семантические статусы: у первого - главный (определяет смысл термина), у второго - дополнительный (уточняет определенный ранее смысл главного термина)). Вторая часть лингво-логических характеристик 214 текстовых элементов 21 лингвистического предложения 11 содержит логические характеристики. При этом совокупность значений всех логических характеристик текстового элемента является для каждого ТЭ 21 лингвистического предложения 11 его отличительным (уникальным) логическим признаком в лингвистическом предложении 11. Логические характеристики предпочтительно указывают на логические признаки ТЭ 21 лингвистического предложения 11, среди которых можно выделить, в качестве примера, но не ограничения, следующие логические характеристики ТЭ 21 лингвистического предложения 11: логические роли каждого слова, являющегося ТЭ 21, в лингвистическом предложении 11. Под логической ролью слова понимается логическая позиция слова в логических сущностях (логических объектах) предложения, среди которых можно выделить, в качестве примера, но не ограничения, следующие логические сущности (логические объекты): понятие, признак понятия, термин (часть образа), образ (элемент простого суждения), простое суждение, сложное суждение. Выявление логической роли слова в самых простых логических объектах (понятие и признак понятия) не зависит от формализованной логической модели предложения, и представляет собой метку (индекс), который указывает на то, чем является данное слово в указанных простых логических объектах. Например, слово «закон» всегда есть логический объект «понятие», а слово «федеральный» есть логический объект «признак понятия». Выявление логической роли слова в более сложных (составных) логических объектах (например, термин и образ) зависит от формализованной логической модели предложения, в привязке к элементам которой и будет установлена логическая роль слова. Формирование первой части лингво-логических характеристик - лингвистических характеристик 21В и их значений 2131 для текстовых элементов 21 лингвистического предложения 11 - предпочтительно производят на этапе 1021 путем первого комплексного лингвистического анализа каждого текстового элемента 21 лингвистического предложения 11, представляющего собой анализ ТЭ 21, в качестве примера, но не ограничения например, анализ на основе местонахождения ТЭ в структуре предложения, его значения, вида, классификации его мыслимого образа и анализа его связей с другими текстовыми элементами в предложении. По результатам первого комплексного анализа предпочтительно производится формирование лингвистических характеристик 213 и их внесение на этапе 1023 в БД/1/1П в виде перечня лингвистических характеристик 213 со значениями этих характеристик 2131. Например, но не ограничиваясь, одной из лингвистических характеристик 213 может быть «синтаксическая роль»ТЭ 21, со значением данной лингвистической характеристики - «подлежащее». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью различных систем машинного обучения, в том числе статистического процессора или нейросети. Формирование второй части лингво-логических характеристик - логических характеристик 214 и их значений 2141 для текстовых элементов 21 лингвистического предложения 11 - предпочтительно производят на этапе 1021 путем второго комплексного лингвистического анализа каждого первичного текстового элемента 21 лингвистического предложения 11, представляющего в качестве примера, но не ограничения анализ ТЭ 21 на основе местонахождения ТЭ 21 в структуре предложения, его значения, вида, классификации его мыслимого образа и анализа его связей с другими текстовыми элементами в предложении, а также анализа выявленных лингвистических характеристик 213 и их значений 2131 ТЭ 21. По результатам второго комплексного анализа предпочтительно производится формирование логических характеристик 214 и их внесение на этапе 1023 в БД/1/1П в виде перечня логических характеристик 214 со значениями этих характеристик 2141. Например, но не ограничиваясь, одной из логических характеристик 214 может быть «логическая роль» ТЭ 21, со значением данной логической характеристики - «признак понятия». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью различных систем машинного обучения, в том числе статистического процессора или нейросети. На основании выявленных первой части лингво-логических характеристик 213 текстовых элементов 21 лингвистического предложения 11 и их значений 2131, а также второй части лингво-логических характеристик 214 текстовых элементов 21 лингвистического предложения 11 и их значений 2141 в итоге формируют базу данных лингво-логических признаков, являющуюся БДЛ/1П текстовых элементов 21 лингвистического предложения 11, созданной после выполнения этапа 102. При этом первая часть лингво-логических характеристик 213 текстовых элементов 21 лингвистического предложения 11 и их значения 2131 формируют уникальные лингвистические признаки ТЭ 21 лингвистического предложения 11, а вторая часть лингво-[0047] FIG. 6, as an example, but not limitation, depicts the general structure of the generated database of linguistic and logical features (BDLLP), which is the BDLLP of text elements 21 of a linguistic sentence 11 after performing stage 102. The first part of linguistic and logical features 213 of text elements 21 of a linguistic sentence 11 may contain linguistic characteristics (morphological, syntactic and semantic characteristics). In this case, the set of values of all linguistic characteristics of a text element is for each TE 21 linguistic sentence 11 its distinctive (unique) linguistic feature in linguistic sentence 11. Morphological characteristics preferably indicate morphological features of TE 21 of linguistic sentence 11, which can be classified, by way of example, but not limitation, by the level of nesting (genus-species-subspecies). In this case, the morphological kinds of TE 21 of the linguistic sentence 11 are preferably word, number, punctuation marks, and other signs; morphological types - part of speech (for words), type of number (Arabic, Roman), type of punctuation mark (point, comma, etc.), type of another sign, type of index (formula, complex numbering, etc.); morphological subspecies - gender, number, case of parts of speech and the like for words, as well as number, binary code, index, and the like for numbers. Syntactic characteristics preferably indicate a variety of syntactic features of TE 21 of a linguistic sentence 11, among which, as an example, but not limitation, the following syntactic features of TE 21 of a linguistic sentence 11 can be distinguished: syntactic role (predicate, subject, etc.); syntactic parent (syntactically main word); syntactic descendants (syntactically subordinate words); syntactic compositional connection (the presence of a different TE that has the same syntactic role and the same syntactic parent). Semantic characteristics preferably indicate the semantic features of TE 21 of linguistic sentence 11, among which, as an example, but not limitation, the following semantic characteristics of TE 21 of linguistic sentence 11 can be distinguished: semantic group (a group of words that can be attributed to one class, genus, the type or subspecies of objects or actions of the surrounding world when the signs of the mentioned classes, genera, species or subspecies coincide), semantic status (the semantic meaning of a word or a group of words within a phrase that refers to a certain imaginable image (object or action) - for example, but not limited to , the imaginable image "the absence of the seller at the location of the consumer" consists of two top-level elements (terms): the first - "the absence of the seller", and the second - "the location of the consumer", which have the following semantic statuses: the first has the main (defines meaning of the term), the second - additional (clarifies the definition previously divided meaning of the main term)). The second part of the linguo-logical characteristics 214 of the text elements 21 of the linguistic sentence 11 contains logical characteristics. In this case, the set of values of all logical characteristics of a text element is for each TE 21 of a linguistic sentence 11 its distinctive (unique) logical feature in a linguistic sentence 11. Logical characteristics preferably indicate the logical features of TE 21 of a linguistic sentence 11, among which, as an example, but not a limitation, the following logical characteristics of TE 21 of linguistic sentence 11: logical roles of each word, which is TE 21, in linguistic sentence 11. The logical role of a word is understood as the logical position of a word in logical entities (logical objects) of a sentence, among which it is possible to single out, as an example, but not restrictions, the following logical entities (logical objects): a concept, a feature of a concept, a term (part of an image), an image (an element of a simple judgment), a simple judgment, a complex judgment. Revealing the logical role of a word in the simplest logical objects (concept and feature of a concept) does not depend on the formalized logical model of a sentence, and is a label (index) that indicates what a given word is in these simple logical objects. For example, the word “law” is always the logical object “concept”, and the word “federal” is the logical object “attribute of the concept”. Revealing the logical role of a word in more complex (composite) logical objects (for example, a term and an image) depends on the formalized logical model of the sentence, in relation to the elements of which the logical role of the word will be established. The formation of the first part of the linguistic and logical characteristics - the linguistic characteristics 21B and their values 2131 for the text elements 21 of the linguistic sentence 11 - is preferably carried out at step 1021 by the first comprehensive linguistic analysis of each text element 21 of the linguistic sentence 11, which is an analysis of the TE 21, as an example , but not limitations, for example, analysis based on the location of TE in the structure of a sentence, its meaning, type, classification of its imaginable image and analysis of its connections with other text elements in the sentence. According to the results of the first complex analysis, it is preferable to form linguistic characteristics 213 and enter them at step 1023 into DB / 1 / 1P in the form of a list of linguistic characteristics 213 with the values of these characteristics 2131. For example, but not limited to, one of the linguistic characteristics 213 may be "syntactic role "TE 21, with the meaning of this linguistic characteristic -" subject ". Such an analysis can be performed by any method known from the prior art and, accordingly, in detail. not further described. For example, but not limited to, such analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor. Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using various machine learning systems, including a statistical processor or a neural network. The formation of the second part of the linguistic-logical characteristics - logical characteristics 214 and their values 2141 for the text elements 21 of the linguistic sentence 11 - is preferably performed at step 1021 by a second complex linguistic analysis of each primary text element 21 of the linguistic sentence 11, which is an example but not a limitation analysis of TE 21 based on the location of TE 21 in the structure of the sentence, its meaning, type, classification of its imaginable image and analysis of its connections with other text elements in the sentence, as well as analysis of the identified linguistic characteristics 213 and their values 2131 TE 21. According to the results of the second complex analysis, it is preferable to generate logical characteristics 214 and enter them at step 1023 into the DB / 1 / 1P in the form of a list of logical characteristics 214 with the values of these characteristics 2141. For example, but not limited to, one of the logical characteristics 214 can be "logical p ol "TE 21, with the value of this logical characteristic -" a sign of a concept. " Such an analysis can be performed by any method known from the prior art and, accordingly, is not further described in detail. For example, but not limited to, such analysis can be performed traditionally by a linguist, or using a software algorithm of a linguistic (syntactic) processor. Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using various machine learning systems, including a statistical processor or a neural network. Based on the identified first part of the linguistic and logical characteristics of 213 text elements 21 of the linguistic sentence 11 and their values 2131, as well as the second part of the linguistic and logical characteristics of 214 text elements 21 of the linguistic sentence 11 and their values 2141, as a result, a database of linguistic and logical characteristics is formed, which is BDL / 1P of text elements 21 of linguistic sentence 11, created after performing stage 102. In this case, the first part of the linguistic and logical characteristics of 213 text elements 21 of linguistic sentence 11 and their values 2131 form unique linguistic features of TE 21 of linguistic sentence 11, and the second part of linguistic -
IB логических характеристик 214 текстовых элементов 21 лингвистического предложения 11 и их значения 2141 формируют уникальные логические признаки ТЭ 21 лингвистического предложения 11. IB the logical characteristics 214 of the text elements 21 of the linguistic sentence 11 and their values 2141 form unique logical features of the TE 21 of the linguistic sentence 11.
[0048] На фиг. 7, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 103 формирования второй структуры данных СМД. Этап 103 характеризуется: выполнением этапа 1031, формирования элементов второй СД, на котором на основании сведений, содержащихся в БДЛ/1П, первой СД, а также на основании формализованной модели простого суждения, идентифицируют и формируют элементы второй СД, являющиеся компонентами простого суждения (КПС), а также идентификационные данные КПС; выполнением этапа 1032 формирования второй СД, на котором формируют вторую СД из идентифицированных КПС и их идентификационных данных. [0048] FIG. 7, by way of example and not limitation, a general flow diagram of the steps of step 103 of generating a second MDS data structure is shown. Stage 103 is characterized by: the execution of stage 1031, the formation of elements of the second SD, on which, based on the information contained in the BDL / 1P, the first SD, as well as on the basis of a formalized model of a simple judgment, the elements of the second SD are identified and formed, which are components of a simple judgment (KPS ), as well as the identification data of the KPS; performing step 1032 of generating the second LED, which generates the second LED from the identified CPS and their identification data.
[0049] На фиг. 8, в качестве примера, но не ограничения, изображена общая структура сформированной второй структуры данных СМД. Вторая СД представляет собой СМД, содержащий элементы 31 второй структуры данных, которые представляют собой компоненты простых суждений (КПС 31) лингвистического предложения 11 и идентификационные данные КПС 31. Идентификационные данные КПС представляют собой в качестве примера, но не ограничения значения 311 элементов 31 второй структуры данных СМД и порядковые номера 312 ТЭ 21 лингвистического предложения 11, составляющих элементы 31. Компоненты простых суждений КПС 31 представляют собой различные синтаксические единицы лингвистического предложения 11, например, в качестве примера, но не ограничения: слова (словоформы); различные словосочетания, являющиеся «понятиями с признаком», «группой понятий с признаками» (терминами), «группой терминов» (образом или элементом простого суждения) и тому подобное. Виды компонентов, которые требуется идентифицировать при формировании второй структуры данных СМД зависит от формализованной модели простого суждения и детализации формализованной модели простого суждения, то есть выделения в структуре формализованной модели простого суждения отдельных компонентов. Компоненты простого суждения 31 могут быть как минимум двух видов - первые компоненты КПС 31.1 (самые мелкие компоненты, представляющие собой исходные элементы, из которых формируются все остальные, более крупные компоненты) и вторые компоненты КПС 31.2 (самые крупные компоненты, представляющие собой исходные «блоки», из которых формируются простые суждения, и именуемые «элементами простых суждений») В связи с этим, КПС 31, как минимум, содержат первый КПС 31.1 и второй КПС 31.2. При этом КПС 31 могут быть и иные виды компонентов 31.x, содержащиеся в формализованной модели простого суждения. При этом индекс х > 3, соответствует порядковому номеру компонента 31 иного вида, находящемуся в формализованной модели простого суждения между компонентами 31.1. и 31.2). Например, но не ограничиваясь, компонентом иного вида для перечисленных первых и вторых КПС 31 может быть компонент «термин». Такие компоненты представляют собой структурные элементы, из которых состоит второй компонент КПС 31 «элемент простого суждения». То есть, в зависимости от текста предложения, второй КПС 31 может состоять из одного, двух или более КПС 31 вида «термин». Например, но не ограничиваясь, при значении 311 второго КПС 31 - «права потребителей в сфере торговли» можно идентифицировать в нем два отдельных КПС 31 иного вида (вида «термин») - «права потребителей» и «в сфере торговли». Первым компонентом (ПК), в качестве примера, но не ограничения, могут являться такие компоненты, которые именуются «понятие» и «признак». Понятием являются объекты или действия, выделенные и обобщенные в рамках некой классификации по их существенным признакам. Признаком является характеристика объекта или действия, указывающая на наличие или отсутствие у него того или иного свойства, состояния или отношения. Понятия и признаки выражаются в словах (словоформах). Вторым компонентом (ВК), в качестве примера, но не ограничения является такой компонент, который именуется «элементом простого суждения». ВК (КПС 31.2) представляет собой то, из чего состоят простые суждения, например, в качестве примера, но не ограничения, можно привести академическую модель простого суждения, в которой существуют два основных элемента «субъект» и «предикат». В такой формализованной модели «субъект» - это предмет о котором идет речь в суждении, предмет о котором что-либо утверждается или опровергается, а «предикат» - это то, что конкретно утверждается или опровергается о предмете суждения. Иным компонентом (ИК), в качестве примера, но не ограничения является такой компонент, который не является ни ПК (КПС 31.1), ни ВК (КПС 31.2), но при этом содержится в формализованной модели простого суждения. В качества примера, но не ограничения, можно привести такой компонент ИК как «понятие с признаком», представляющий собой несколько ПК (КПС 31.1), имеющих прямую синтаксическую подчинительную связь. Такой компонент является структурно более крупным объектом, чем ПК (в качестве примера, но не ограничения - «федеральный закон», состоящий из двух ПК: «федеральный» и «закон») У ПК (КПС 31.1) лингвистического предложения 11, которые являются отдельными словоформами, отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных КПС 31 в качестве примера, но не ограничения могут именоваться как «КПС 1.1», «КПС 2.1», «КПС 3.1» «ИТЭ п.1», где первое число (1; 2; 3 и так далее) - порядковый номер ПК в лингвистическом предложении 11; второе число «1» (после точки) указывает на то, что это КПС первого вида; n > 1 - порядковый номер элемента в лингвистическом предложении 11. У ВК (КПС 31.2) лингвистического предложения 11, которые являются элементами простого суждения, имеются характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных КПС 31, которые являются элементами простого суждения в качестве примера, но не ограничения, могут именоваться как «КПС[0049] FIG. 8, by way of example and not limitation, the general structure of the generated second MDS data structure is shown. The second SD is an MDS containing elements 31 of a second data structure that are components of simple judgments (CPC 31) of a linguistic sentence 11 and identification data of CPC 31. The identification data of CPC is by way of example and not limitation of the values 311 of elements 31 of the second structure data SMD and serial numbers 312 TE 21 of the linguistic sentence 11, constituting the elements 31. The components of simple judgments of the KPS 31 represent various syntactic units of the linguistic sentence 11, for example, as an example, but not limitation: words (word forms); various phrases that are "concepts with a feature", "a group of concepts with features" (terms), "a group of terms" (an image or element of a simple judgment), and the like. The types of components that need to be identified when forming the second data structure of the MDS depends on the formalized model of a simple judgment and the detailing of the formalized model of a simple judgment, that is, the selection of individual components in the structure of the formalized model of a simple judgment. The components of a simple judgment 31 can be of at least two types - the first components of the CPS 31.1 (the smallest components that are the initial elements from which all the other, larger components are formed) and the second components of the CPS 31.2 (the largest components that represent the original "blocks ", From which simple judgments are formed, and called" elements of simple judgments ") with this, KPS 31 at least contain the first KPS 31.1 and the second KPS 31.2. In this case, the KPS 31 can be other types of components 31.x, contained in the formalized model of a simple judgment. In this case, the index x> 3, corresponds to the ordinal number of the component 31 of a different kind, which is in the formalized model of a simple judgment between the components 31.1. and 31.2). For example, but not limited to, a different kind of component for the listed first and second CSC 31 may be a term component. Such components are the building blocks of which the second component of the CPS 31 “element of simple judgment” is composed. That is, depending on the text of the proposal, the second KPS 31 may consist of one, two or more KPS 31 of the "term" type. For example, but not limited to, with the value 311 of the second KPS 31 - "consumer rights in the field of trade", it is possible to identify in it two separate KPS 31 of a different type (of the type "term") - "consumer rights" and "in the field of trade". The first component (PC), by way of example and not limitation, can be such components that are called "concept" and "feature". The concept is objects or actions, isolated and generalized within the framework of a certain classification according to their essential characteristics. A feature is a characteristic of an object or action, indicating the presence or absence of this or that property, state or relationship. Concepts and signs are expressed in words (word forms). The second component (VK), by way of example and not limitation, is one that is referred to as a “simple judgment element”. VK (KPS 31.2) is what simple judgments are made of, for example, as an example, but not a limitation, you can give an academic model of a simple judgment, in which there are two main elements "subject" and "predicate". In such a formalized model, the "subject" is the subject that is discussed in the judgment, the subject of which something is asserted or refuted, and the "predicate" is what is specifically asserted or refuted about the subject of the judgment. Another component (IC), as an example, but not a limitation, is a component that is neither PC (KPS 31.1) nor VC (KPS 31.2), but is contained in a formalized model of a simple judgment. As an example, but not a limitation, one can cite such a component of the IC as a "concept with a feature", which is several PCs (KPS 31.1) with a direct syntactic subordinate relationship. Such a component is a structurally larger object than the PC (as an example, but not a limitation - "federal law", consisting of two PCs: "federal" and "law"). At the PC (KPS 31.1) linguistic sentence 11, which are separate word forms, there are no unique names (UN) characterizing them that have practical use. In the data structure, KPS 31 as an example, but not restrictions, may be referred to as "KPS 1.1", "KPS 2.1", "KPS 3.1""ITE item 1", where the first number (1; 2; 3 and so on) - the serial number of the PC in the linguistic sentence 11; the second number "1" (after the dot) indicates that this is a KPS of the first type; n> 1 is the ordinal number of the element in the linguistic sentence 11. VK (KPS 31.2) of the linguistic sentence 11, which are elements of a simple judgment, have unique names (UN) that characterize them and have practical use. In the data structure, KPS 31, which are elements of simple judgment by way of example and not limitation, may be referred to as "KPS
I.2», «КПС 2.2», «КПС 3.2», «КПС п.2»„ где первое число (1; 2; 3 и т.д.) - порядковый номер ВК в лингвистическом предложении 11; второе число «2» (после точки) указывает на то, что это КПС второго вида; n > 1 - порядковый номер элемента в лингвистическом предложенииI.2 "," KPS 2.2 "," KPS 3.2 "," KPS p.2 "" where the first number (1; 2; 3, etc.) is the ordinal number of VK in linguistic sentence 11; the second number "2" (after the dot) indicates that this is a KPS of the second type; n> 1 - the ordinal number of the element in the linguistic sentence
II. При этом, в качестве примера, но не ограничения элементы ПС 12 могут именоваться так, как установлено в формализованной модели простого суждения, например: «субъект», «объект», «действие», «условие» и тому подобное. У иных компонентов (ИК) простого суждения КПС 31.x лингвистического предложения 11 наличие характеризующих их уникальных наименований (УН), имеющих практическое использование, зависит от принятой формализованной модели простого суждения. В структуре данных такие КПС 31 в качестве примера, но не ограничения могут именоваться как «КПС 1.x», «КПС 2.x», «КПС 3.x» «КПС п.х», где первое число (1; 2; 3 и т.д.) - порядковый номер ИК в лингвистическом предложении 11; второе число «х» (после точки) указывает на порядковый номер КПС иного вида, начиная с 3 и далее; n > 1 - порядковый номер элемента в лингвистическом предложении 11. КПС 31 лингвистического предложения 11, состоящие из компонентов минимум двух видов 31.1 и 31.2 - имеют идентификационные данные КПС: в качестве примера, но не ограничения: значения 311 КПС, состоящие из значений 311.1 и 311.2 компонентов минимум двух видов 31.1 и 31.2, и номера 312 КПС, состоящие из номеров 312.1 и 312.2 компонентов минимум двух видов 31.1 и 31.2. Значениями 311 КПС являются наборы слов (ТЭ 21), из которых состоят как минимум КПС 311.1 и КПС 311.2. Номерами 312 КПС являются порядковые номера КПС 312.1 и КПС 312.2 слов (словоформ) ПК 21, из которых состоят как минимум КПС 31.1 и КПС 31.2 в лингвистическом предложении 11. Идентификация и формирование компонентов простого суждения КПС 31(КПС 31.1, КПС 31.2, КПС 31.x) второй структуры данных в ходе этапа 1031 производят путем комплексного лингво-логического анализа элементов первой структуры данных СМД -текстовых элементов ТЭ 21 и их идентификационных данных. Такой комплексный анализа ТЭ 21 производится с помощью сведений о ТЭ 21 и с помощью сведений из сформированной БД/1/1П первичных текстовых элементов 21, а также на основании представления о формализованной модели простого суждения и с учетом уже сформированных более мелких компонентов простого суждения (то есть КПС 31.1, либо компонентов с меньшим индексом х, чем у формируемого (например, не ограничиваясь, при формировании КПС 31.2 необходимо учитывать сформированные ранее КПС 31.1, а при формировании КПС 31.12 необходимо учитывать сформированные ранее КПС 31.11 и КПС 31.1)). При этом формализованная модель простого суждения содержит минимум два вида компонентов - первый компонент (ПК), как первый вид КПС 31, и второй компонент (ВК), как второй вид КПС 31. Таким образом формализованной моделью простого суждения считается такая система описания простого суждения, которая имеет не менее чем два упомянутых компонента. Целью упомянутого комплексного анализа является выявление в лингвистическом предложении всех компонентов простого суждения, установленных в формализованной модели простого суждения. Идентификация и формирование КПС 31 второй структуры данных в ходе этапа 1031 производится пошагово. Количество шагов этапа 1031 зависит от используемой формализованной модели простого суждения. Модель простого суждения содержит установленное число видов компонентов простого суждения. В соответствии с этим количеством видов компонентов и определяется количество шагов этапа 1031, поскольку на одном шаге возможны идентификация и формирование только одного вида компонента. При этом, поскольку формализованная модель простого суждения минимально может содержать не менее двух компонентов, минимальное число шагов также будет равняться двум. В качестве примера, но не ограничения, приведен пример идентификации и формирования первого (КПС 31.1) и второго (КПС 31.2) компонентов простого суждения КПС 31. Для идентификации первого компонента КПС 31.1 - например, «словоформ», производят лингвистический анализ ТЭ 21 предложения 11. В качестве примера, но не ограничения, рассмотрено следующее предложение: «Товар передается в соответствии с договором». На основании морфологических и синтаксических признаков (характеристик) каждого ТЭ 21, выявленного в ходе формирования первой структуры данных СМД, установлено, что данное предложение содержит следующие первые компоненты (КПС 31.1), являющиеся словоформами (таблица 1): Таблица 1
Figure imgf000019_0001
II. In this case, as an example, but not limitation, the elements of the PS 12 can be named as established in a formalized model of a simple judgment, for example: "subject", "object", "action", "condition" and the like. For other components (IC) of a simple judgment KPS 31.x of a linguistic sentence 11, the presence of unique names (UN) characterizing them that have practical use depends on the accepted formalized model of a simple judgment. In the data structure, such KPS 31 as an example, but not restrictions, may be referred to as "KPS 1.x", "KPS 2.x", "KPS 3.x""KPSp.x", where the first number (1; 2 ; 3, etc.) - the serial number of the IC in the linguistic sentence 11; the second number "x" (after the dot) indicates the serial number of the KPS of a different type, starting with 3 and further; n> 1 - the ordinal number of the element in the linguistic sentence 11. KPS 31 of the linguistic sentence 11, consisting of components of at least two types 31.1 and 31.2 - have the KPS identification data: as an example, but not limitation: values 311 KPS, consisting of the values 311.1 and 311.2 of components of at least two types 31.1 and 31.2, and numbers 312 of the CPS, consisting of numbers 312.1 and 312.2 of components of at least two types 31.1 and 31.2. The values of 311 KPS are sets of words (TE 21), of which at least KPS 311.1 and KPS 311.2 consist. The numbers 312 KPS are the serial numbers KPS 312.1 and KPS 312.2 words (word forms) PK 21, of which at least KPS 31.1 and KPS 31.2 in the linguistic sentence 11 consist. Identification and formation of components of a simple judgment KPS 31 (KPS 31.1, KPS 31.2, KPS 31 .x) the second data structure during block 1031 is produced by complex linguo-logical analysis of the elements of the first data structure of the SMD-text elements of TE 21 and their identification data. Such a comprehensive analysis of TE 21 is performed using information about TE 21 and using information from the generated DB / 1 / 1P of primary text elements 21, as well as on the basis of the idea of a formalized model of a simple judgment and taking into account the already formed smaller components of a simple judgment (then there is a CPS 31.1, or components with a lower index x than that of the generated one (for example, without limitation, when forming the CPS 31.2, it is necessary to take into account the previously formed CPS 31.1, and when forming the CPS 31.12, it is necessary to take into account the previously formed CPS 31.11 and CPS 31.1)). In this case, the formalized model of a simple judgment contains at least two types of components - the first component (PC), as the first type of KPS 31, and the second component (VC), as the second type of KPS 31. Thus, a formalized model of a simple judgment is considered to be such a system for describing a simple judgment, which has at least two of the mentioned components. The purpose of the above-mentioned complex analysis is to identify in a linguistic sentence all the components of a simple judgment established in a formalized model of a simple judgment. The identification and formation of the CPS 31 of the second data structure during step 1031 is performed step by step. The number of steps in step 1031 depends on the formalized simple judgment model used. A simple judgment model contains a fixed number of kinds of components of a simple judgment. In accordance with this number of component types, the number of steps of step 1031 is determined, since at one step only one type of component can be identified and generated. Moreover, since a formalized model of a simple judgment can at least contain at least two components, the minimum number of steps will also be equal to two. As an example, but not limitation, an example of identification and formation of the first (KPS 31.1) and second (KPS 31.2) components of a simple judgment KPS 31 is given. To identify the first component of KPS 31.1 - for example, "word forms", a linguistic analysis of TE 21 sentences 11 is performed As an example, but not limitation, the following sentence is considered: "The goods are transferred in accordance with the contract." Based on the morphological and syntactic features (characteristics) of each TE 21, identified during the formation of the first data structure of the SMD, it was established that this sentence contains the following first components (KPS 31.1), which are word forms (Table 1): Table 1
Figure imgf000019_0001
[0050] Для идентификации второго компонента КПС 31.2 - например, «элементов простого суждения», производят лингвистический анализ ТЭ 21 предложения 11, а также первых компонентов КПС 31.1, уже сформированных на предыдущем шаге (в данном примере - это ПК, указанные в таблице 1). В качестве примера, но не ограничения рассматривается то же предложение: «Товар передается в соответствии с договором». На основании морфологических и синтаксических признаков (характеристик) каждого первичного текстового элемента (ТЭ 21), выявленного в ходе формирования первой структуры данных СМД, а также с учетом ранее сформированных первых компонентов КПС 31.1 и формализованной модели простого суждения, устанавливается, что данное предложение содержит следующие «элементы простого суждения» (КПС 31.2), являющиеся словоформами, либо словосочетаниями (таблица 2): [0050] To identify the second component of the CPS 31.2 - for example, “elements of a simple judgment”, a linguistic analysis of TE 21 of sentence 11 is performed, as well as the first components of the CPS 31.1 already formed in the previous step (in this example, these are the PCs indicated in Table 1 ). As an example, but not limitation, the same sentence is considered: "The goods are transferred in accordance with the contract." Based on the morphological and syntactic features (characteristics) of each primary text element (TE 21), identified during the formation of the first data structure of the SDM, as well as taking into account the previously formed first components of the CPS 31.1 and the formalized model of a simple judgment, it is established that this sentence contains the following "Elements of simple judgment" (KPS 31.2), which are word forms, or phrases (table 2):
Таблица 2
Figure imgf000019_0002
table 2
Figure imgf000019_0002
[0051] В качестве примера, но не ограничения, приводится пример идентификации и формирования значений 311.1 для КПС 31.1 вида ПК в том же предложении «Товар передается в соответствии с договором». Значением для КПС 31.1. будут являться полученные в ходе идентификации словоформ. Упомянутый анализ производят путем корреляции текстовых элементов 21 и компонента КПС 31 анализируемого вида (в данном примере - словоформ). В ходе такой корреляции формируется таблица соответствия первичных текстовых элементов ТЭ 21 и словоформ (КПС 31.1). В качестве примера, но не ограничения продемонстрирован пример такой таблицы корреляции (таблица 3): Таблица 3
Figure imgf000020_0001
[0051] As an example, but not limitation, an example of identification and formation of values 311.1 for KPS 31.1 of the PC type is given in the same sentence "The goods are transferred in accordance with the contract." The value for KPS is 31.1. will be the word forms obtained in the course of identification. The above analysis is carried out by correlating the text elements 21 and the component of the CPS 31 of the analyzed type (in this example, word forms). In the course of such a correlation, a table of correspondence between the primary text elements of TE 21 and word forms (KPS 31.1) is formed. As an example, but not limitation, an example of such a correlation table is shown (Table 3): Table 3
Figure imgf000020_0001
[0052] В результате, исходя из данных таблицы корреляции (таблицы 3) ТЭ 21 и КПС 31.1, идентифицируют значение 311.1 КПС 31.1 как слово или набор слов, соответствующие конкретному компоненту КПС 31.1, а также идентифицируют номера 312.1 КПС 31.1 как порядковые номера ТЭ 21, из которых сформированы КПС 31.1. Такая идентификация и формирование могут быть выполнены любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такая идентификация и формирование могут быть выполнены традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такой идентификации и формирование с помощью различных систем машинного обучения, в том числе статистического процессора или нейросети. Формирование второй структуры данных СМД в ходе этапа 1032 производят путем объединения в одной структуре данных элементов 31 (КПС) второй структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. [0052] As a result, based on the data of the correlation table (table 3) TE 21 and KPS 31.1, identify the value 311.1 KPS 31.1 as a word or set of words corresponding to a specific component of KPS 31.1, and also identify the numbers 312.1 KPS 31.1 as serial numbers of TE 21 from which the KPS 31.1 is formed. Such identification and shaping can be performed by any method known from the prior art and, accordingly, is not further described in detail. For example, but not limited to, such identification and shaping can be performed conventionally by a linguist or by using a linguistic (syntactic) processor software algorithm. Moreover, in the presence of a sufficient number of examples, it is possible to perform such identification and formation using various machine learning systems, including a statistical processor or a neural network. The formation of the second data structure of the MDS during step 1032 is performed by combining in one data structure of the elements 31 (CPS) of the second data structure of the MDS, as well as their identification data according to known from the prior art principles and methods, which, accordingly, are not further described in detail.
[0053] На фиг. 9, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 104 формирования третьей структуры данных СМД. Этап 104 характеризуется: выполнением этапа 1041 формирования элементов третьей СД, на котором на основании сведений, содержащихся в БД/1/1П и второй СД, из сформированных КПС в соответствии с формализованной компонентной моделью простого суждения формируют элементы третьей СД, являющиеся простыми суждениями (ПС), а также идентификационные данные ПС, представляющие собой в качестве примера, но не ограничения значения ПС и порядковые номера ТЭ в лингвистическом предложении, составляющих ПС; выполнением этапа 1042 формирования третьей СД, на котором формируют третью СД из сформированных ПС и их идентификационных данных. [0054] На фиг. 10, в качестве примера, но не ограничения, изображена общая структура сформированной третьей структуры данных СМД. Третья структура данных представляет собой СМД, содержащий элементы 1В, которые представляют собой простые суждения (ПС 13) лингвистического предложения 11 и идентификационные данные ПС 12. У элементов 13 лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 13 в качестве примера, но не ограничения могут именоваться как «ПС 1», «ПС 2», «ПС 3», «ПС п», », где n > 1 - порядковый номер элемента в лингвистическом предложении 11. При этом, в качестве примера, но не ограничения, простые суждения ПС 13 могут именоваться как «диспозиция», «санкция», «гипотеза» в юридической предметной области и тому подобное в иных предметных областях. С лингвистической точки зрения ПС 13 это простые предложения. При этом возможны различные варианты простых предложений, которые могут считаться простыми суждениями 13, например, но не ограничиваясь данным примером, можно привести следующие виды простых предложений: 1) простые предложения в изначальном, непреобразованном виде; 2) простые предложения в преобразованном виде, например: а) без причастных или деепричастных оборотов: б) без однородностей (обезоднородненные, без рядов однородных членов); в) без вставок (без текста в скобках); г) без условных именований (без текста в кавычках); д) без обстоятельств (условий); и тому подобные, включая сочетания вышеуказанных и неуказанных видов. Простое суждение ПС 12 с логической точки зрения - это утверждение или опровержение о субъекте суждения. Простое суждение представляет собой первичную логическую конструкцию мышления с помощью которой формируется и передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). ПС 13 с точки зрения отдельных предметных областей - это конструкция, описанная формализованной моделью простого суждения. Самыми крупными элементами данной конструкции (формализованной модели простого суждения) являются вторые компоненты простого суждения (КПС 31.2). КПС 31.2 простого суждения 13 с лингвистической точки зрения представляют собой синтаксическую единицу вида «исходный синтаксический объект», либо «синтаксическая конструкция». В зависимости оттого, что сообщает простое суждение (насколько отдельные КПС 31.2 являются развернутыми, раскрытыми образами), компоненты простого суждения могут быть выражены как отдельными словами («исходный синтаксический объект»), так и словосочетаниями («синтаксическая конструкция» - набор синтаксически связанных слов). В качестве примера, но не ограничения, можно привести различные варианты значений 311.2 КПС 31.2, с помощью которых передается один и тот же образ: «старый человек» = «старик» = «человек преклонных лет» и тому подобное. Указанные варианты значений 311.2 КПС 31.2 выражаются как одним словом, так и словосочетаниями. В качестве примера, но не ограничения, можно привести пример КПС 31.2, который не может быть передан с помощью одного слова - «права потребителей». С логической точки зрения простое суждение ПС 13 представляет собой утверждение, либо отрицание, в котором что-либо, соответственно, утверждается или опровергается о предмете суждения. С семантической точки зрения КПС 31.2 простого суждения 13 представляет собой обобщенный мыслимый (семантический) образ элемента простого суждения. Например, не ограничиваясь, для предметной области «право» простое суждение может быть соотнесено с частью правовой нормы, а именно в качестве примера, но не ограничения, с «диспозицией» (правило, которое необходимо соблюдать), «санкцией» (правило, которое определяет меру ответственности за нарушение правил) или «гипотезой» (обусловленностью правила, отражающего какое-либо предварительное действие, ситуацию или состояние). Данные правовые сущности содержаться в простых предложениях правовых актов. Для формализации простого суждения в предметной области права необходимо создать формализованную модель правовой нормы. В рамках профессиональной дискуссии может быть сформулировано некоторое количество различных формализованных моделей правовой нормы. При этом, специалистам в данной области техники очевидна жесткая связь между логическим «простым суждением» и частью правовой нормы (гипотезой, диспозицией, санкцией), что в качестве примера, но не ограничения продемонстрировано в следующих примерах в рамках некой формализованной модели упомянутых частей правовой нормы (таблица 4): [0053] FIG. 9, by way of example and not limitation, a general flow diagram of the steps of step 104 of generating a third MDS data structure is shown. Stage 104 is characterized by: the execution of stage 1041 of the formation of elements of the third SD, at which, based on the information contained in the DB / 1 / 1P and the second SD, from the generated CPS in accordance with the formalized component model of a simple judgment form the elements of the third SD, which are simple judgments (PS ), as well as the identification data of the PS, which are, as an example, but not limitation, the values of the PS and the serial numbers of the TE in the linguistic sentence that make up the PS; performing step 1042 of generating the third SD, which generates the third SD from the generated PS and their identification data. [0054] FIG. 10, by way of example and not limitation, the general structure of the generated third MDS data structure is shown. The third data structure is an SMD containing elements 1B, which are simple judgments (PS 13) of linguistic sentence 11 and identification data of PS 12. Elements 13 of linguistic sentence 11 have unique names (UN) that characterize them and have practical use. In the data structure, elements 13, as an example, but not limitation, can be referred to as "PS 1", "PS 2", "PS 3", "PS n", ", where n> 1 is the ordinal number of the element in the linguistic sentence 11. In this case, as an example, but not limitation, simple judgments of the PS 13 can be referred to as "disposition", "sanction", "hypothesis" in the legal subject area and the like in other subject areas. From a linguistic point of view, PS 13 are simple sentences. In this case, various options for simple sentences are possible, which can be considered simple judgments 13, for example, but not limited to this example, the following types of simple sentences can be cited: 1) simple sentences in their original, unconverted form; 2) simple sentences in a transformed form, for example: a) without participial or participial phrases: b) without homogeneities (non-homogeneous, without rows of homogeneous members); c) no inserts (no text in brackets); d) no conditional names (no text in quotes); e) without circumstances (conditions); and the like, including combinations of the aforementioned and unspecified types. A simple judgment of PS 12 from a logical point of view is a statement or refutation about the subject of the judgment. A simple judgment is a primary logical construction of thinking with the help of which the idea is formed and transmitted that something (a predicate of a judgment) is affirmed or refuted about the subject of judgment (a subject of judgment). PS 13 from the point of view of individual subject areas is a construction described by a formalized model of a simple judgment. The largest elements of this construction (formalized model of a simple judgment) are the second components of a simple judgment (KPS 31.2). KPS 31.2 of a simple proposition 13 from a linguistic point of view represent a syntactic unit of the form "initial syntactic object" or "syntactic construction". Depending on what the simple judgment communicates (to what extent the individual KPS 31.2 are expanded, open images), the components of a simple judgment can be expressed both in separate words ("the original syntactic object"), and phrases ("syntactic construction" is a set of syntactically related words). As an example, but not limitation, we can give different variants of the values of 311.2 KPS 31.2, with the help of which the same image is transmitted: "old man" = "old man" = "old man" and the like. The indicated options for the meanings of 311.2 KPS 31.2 are expressed both in one word and in phrases. By way of example, but not limitation, the example of KPS 31.2, which cannot be conveyed with a single word - “consumer rights”. From a logical point of view, a simple judgment PS 13 is a statement, or a negation, in which something, respectively, is affirmed or refuted about the subject of the judgment. From a semantic point of view, the KPS 31.2 of a simple judgment 13 is a generalized thinkable (semantic) image of an element of a simple judgment. For example, without limitation, for the subject area "law", a simple judgment can be correlated with a part of a legal norm, namely, as an example, but not limitation, with a "disposition" (a rule that must be observed), a "sanction" (a rule that determines the degree of responsibility for violation of the rules) or "hypothesis" (conditionality of the rule reflecting any preliminary action, situation or state). These legal entities are contained in simple sentences of legal acts. To formalize a simple judgment in the subject area of law, it is necessary to create a formalized model of a legal norm. Within the framework of a professional discussion, a number of different formalized models of a legal norm can be formulated. At the same time, it is obvious to those skilled in the art that there is a strong connection between a logical "simple judgment" and a part of a legal norm (hypothesis, disposition, sanction), which is demonstrated by way of example, but not limitation, in the following examples within the framework of a certain formalized model of the mentioned parts of a legal norm. (table 4):
Таблица 4
Figure imgf000023_0001
Table 4
Figure imgf000023_0001
[0055] В данном примере формализации простого суждения использованы следующие КПС 31.2. формализованной модели простого суждения: «субъект» - это предмет суждения, то о чем идет речь в суждении, «объект» - это предмет на который направлено действие (часть предиката суждения), «комплемент субъекта» - это иное именование субъекта, выраженное с помощью действия, «действие» - это способ описания сути утверждения о субъекте (либо в рамках его взаимодействия с объектом, его комплементом, либо в отношении него самого), «контр-субъект» - это второй (иной) субъект, с которым взаимодействует субъект в рамках простого суждения, «условие» - некие обстоятельства на фоне которых (при условии наличия которых) утверждение о субъекте является актуальным. Простые суждения 13 лингвистического предложения 11 имеют идентификационные данные, в качестве примера, но не ограничения: значение 131 ПС и номер 132 ПС. Значением 131 ПС является набор значений итоговых текстовых элементов (КПС 31.1), составляющих простое суждение 13 предложения 11. Номером 132 ПС являются порядковые номера ТЭ 21, из которых сформированы все значения 212, составляющие простое суждение 13 предложения 11. Формирование простых суждений ПС 13 третьей структуры данных в ходе этапа 1041 производят на основании сведений о формализованной модели простого суждения, а также с учетом сформированного ранее массива компонентов 31 простого суждения 13 путем объединения компонентов 31 простого суждения согласно формализованной модели простого суждения и с учетом сведений из БД 1 1П текстовых элементов (ТЭ 21) о наличии синтаксических связей между ТЭ 21, входящими в различные компоненты 31 простого суждения 13 лингвистического предложения 11. Идентификацию значения 131 простого суждения 13 третьей структуры данных в ходе этапа 1041 производят путем отождествления значения 121 простого суждения 12 со значениями 311.2 всех компонентов простого суждения 31.2, формирующих данное простое суждение ПС 13. Идентификацию номеров 132 простого суждения 13 третьей структуры данных в ходе этапа 1041 производят путём отождествления номеров 132 простого суждения 13 с номерами 312.2 всех компонентов простого суждения 31.2, формирующих данное простое суждение ПС 13. Такие идентификация и формирование могут быть выполнены любым известным из уровня техники способом и, соответственно, подробно далее не описываются. Например, не ограничиваясь, такие идентификация и формирование могут быть выполнены традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение таких идентификации и формирования с помощью различных систем машинного обучения, в том числе статистического процессора или нейросети. Формирование третьей структуры данных СМД в ходе этапа 1042 производят путем объединения в одной структуре данных элементов 12 третьей структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. [0055] In this example of formalization of a simple judgment, the following KPS 31.2 are used. formalized model of a simple judgment: “subject” is the subject of judgment, what is discussed in the judgment, “object” is the object to which the action is directed (part of the predicate of the judgment), “complement of the subject” is another name for the subject, expressed with the help of actions, "action" is a way of describing the essence of the statement about the subject (either within the framework of its interaction with the object, its complement, or in relation to itself), the "counter-subject" is the second (different) subject with which the subject interacts in within a simple judgment, "condition" - certain circumstances against which (subject to the presence of which) the statement about the subject is relevant. Simple propositions 13 of linguistic sentence 11 have identification data, by way of example and not limitation: value 131 PS and number 132 PS. The value of 131 PS is a set of values of the final text elements (KPS 31.1) that make up a simple judgment 13 of sentence 11. Number 132 PS is the serial numbers of TE 21, from which all the values 212 are formed that make up a simple judgment 13 of sentence 11. Formation of simple judgments PS 13 of the third data structures during step 1041 are produced on the basis of information about the formalized model of a simple judgment, as well as taking into account the previously formed array of components 31 of a simple judgment 13 by combining the components 31 simple judgment according to the formalized model of simple judgment and taking into account information from the database 1 1P text elements (TE 21) about the presence of syntactic links between TE 21 included in various components 31 of a simple judgment 13 of a linguistic sentence 11. Identification of the value 131 of a simple judgment 13 of the third data structure during step 1041, it is performed by identifying the value 121 of the simple proposition 12 with the values 311.2 of all the components of the simple proposition 31.2 that form this simple proposition PS 13. The identification of the numbers 132 of the simple proposition 13 of the third data structure during step 1041 is performed by identifying the numbers 132 of the simple proposition 13 with the numbers 312.2 of all the components of the simple proposition 31.2 forming this simple proposition of the PS 13. Such identification and generation can be performed in any way known from the prior art and, accordingly, are not further described in detail. For example, but not limited to, such identification and shaping can be performed conventionally by a linguist, or by using a linguistic (syntactic) processor software algorithm. Moreover, in the presence of a sufficient number of examples, it is possible to perform such identification and formation using various machine learning systems, including a statistical processor or a neural network. The formation of the third data structure of the MDS during step 1042 is carried out by combining in one data structure the elements 12 of the third data structure of the MDS and their identification data according to known from the prior art principles and methods, which, accordingly, are not further described in detail.
[0056] Далее, после завершения описанного ранее этапа 104, в целях повышения точности последующего поиска в структурированном массиве данных, содержащем, по меньшей мере, простые суждения (ПС) лингвистического предложения и их идентификационные данные, становится возможным осуществить дальнейшее структурирование и классифицирование СД СМД, содержащих, по меньшей мере, компоненты простого суждения (КПС) лингвистического предложения и их идентификационные данные. Специалисту в данной области техники должно быть очевидно, что посредством получаемой в результате реализации этапа 104 третьей СД становится возможным использовать ее для различных необязательных процессов и способов, которые тем не менее, могут иметь практическое значение в контексте рассматриваемого изобретения. Такие необязательные процессы в качестве примера, но не ограничения, описанный далее со ссылками на фиг. 11-26, а также со ссылками на способы 200, BOO, как таковые, и со ссылками на этапы 105-107 способа 100. [0056] Further, after the completion of the previously described step 104, in order to improve the accuracy of the subsequent search in the structured data set containing at least simple judgments (PS) of the linguistic sentence and their identification data, it becomes possible to carry out further structuring and classification of the SD SD containing at least the components of a simple judgment (CPS) of a linguistic sentence and their identification data. It will be apparent to those skilled in the art that through the third SD resulting from the implementation of step 104, it becomes possible to use it for various optional processes and methods, which may nevertheless be of practical value in the context of the invention under consideration. Such optional processes are exemplary, but not the limitation described later with reference to FIG. 11-26, as well as with reference to methods 200, BOO, as such, and with reference to steps 105-107 of method 100.
[0057] На фиг. 11, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 200 формирования онтологической базы данных структурированного массива данных (СМД). Заявленный способ 200 формирования онтологической базы данных структурированного массива данных (СМД) заключается в: выполнении этапа 201 идентификации второй СД (являющейся первой СД для рассматриваемого способа 200), идентификации третьей СД (являющейся второй СД для рассматриваемого способа 200) и идентификации базы данных лингво-логических признаков (БДЛ/1П); при этом идентифицированная вторая СД содержит компоненты простых суждений (КПС); при этом идентифицированная третья СД содержит простые суждения (ПС); при этом идентифицированная БДЛЛП, содержит сведения о лингвистических и логических признаках текстовых элементов (ЛЛПТЭ), причем упомянутые ЛЛПТЭ представляют собой лингвистические и логические признаки текстовых элементов (ТЭ) и их значения; выполнении этапа 105 формирования онтологической базы данных системных и семантических связей в третьей СД (являющейся второй СД для рассматриваемого способа 200), на котором на основании сведений, содержащихся в БДЛЛП, второй СД и третьей СД, а также на основании критериев поиска системных и семантических однородностей, выявляют и регистрируют системные и семантические связи между компонентами ПС, из которых формируют онтологическую базу данных системных и семантических связей компонентов ПС в третьей СД (ОБД). При этом, как указано ранее, упомянутой первой СД для рассматриваемого способа 200 (первой СД для способа 200) является любая пригодная для реализации способа 200 СД, содержащая упомянутые компоненты простых суждений. В качестве примера, но не ограничения, такой СД является описанная ранее со ссылкой на способ 100 вторая СД, или любая известная из уровня техники, в том числе в будущем, СД, содержащая упомянутые компоненты простых суждений. При этом, как указано ранее, упомянутой второй СД для рассматриваемого способа 200 (вторая СД для способа 200) является любая пригодная для реализации способа 200 СД, содержащая упомянутые простые суждения. В качестве примера, но не ограничения, такой СД является описанная ранее со ссылкой на способ 100 третья СД, или любая известная из уровня техники, в том числе в будущем, СД, содержащая упомянутые простые суждения. При этом, как указано ранее, упомянутой БДЛЛП является любая база данных, содержащая сведения о ЛЛПТЭ, представляющие собой лингвистические или логические признаки ТЭ и их значения. В качестве примера, но не ограничения, такой базой данных может быть описанная ранее со ссылкой на способ 100 БДЛ 1П, или любая известная из уровня техники, в том числе в будущем, база данных, содержащая сведения о ЛЛПТЭ, представляющие собой лингвистические или логические признаки ТЭ и их значения. [0057] FIG. 11, by way of example, but not limitation, depicts a general diagram of the steps of the claimed method 200 of forming an ontological database of a structured data array (DMD). The claimed method 200 of forming an ontological database of a structured data array (DMD) consists in: performing stage 201 of identifying the second SD (which is the first SD for the considered method 200), identifying the third SD (which is the second SD for the considered method 200) and identifying the lingual database. logical signs (BDL / 1P); while the identified second SD contains components of simple judgments (CPS); in this case, the identified third SD contains simple judgments (PS); at the same time, the identified BDLLP contains information about the linguistic and logical features of text elements (LLPTE), and the mentioned LLPTE are linguistic and logical signs of text elements (TE) and their meanings; performing stage 105 of forming an ontological database of system and semantic relationships in the third SD (which is the second SD for the considered method 200), on which, based on the information contained in the BDLLP, the second SD and the third SD, as well as based on the search criteria for system and semantic homogeneities , identify and register the systemic and semantic links between the components of the PS, from which they form the ontological database of the system and semantic relationships of the components of the PS in the third SD (OBD). In this case, as indicated earlier, the mentioned first SD for the considered method 200 (the first SD for the method 200) is any SD suitable for the implementation of the method 200, containing the mentioned components of simple judgments. By way of example, and not limitation, such an LED is the second LED described previously with reference to method 100, or any LED known in the art, including in the future, containing the aforementioned simple proposition components. In this case, as indicated earlier, the mentioned second LED for the considered method 200 (the second LED for the method 200) is any SD suitable for the implementation of the method 200, containing the mentioned simple judgments. By way of example, and not limitation, such a CD is the third CD, previously described with reference to the method 100, or any CD known in the art, including in the future, containing the aforementioned simple judgments. At the same time, as indicated earlier, the mentioned BDLLP is any database containing information about LLPTE, representing the linguistic or logical signs of TE and their meanings. By way of example, but not limitation, such a database can be described previously with reference to the BDL 1P method 100, or any database known from the prior art, including in the future, containing information about LLPTE, representing linguistic or logical features TE and their meanings.
[0058] На фиг. 12, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 201 идентификации первой структуры данных (первой СД для способа 200), второй СД для способа 200, и базы данных лингво-логических признаков (БДЛЛП); при этом первая СД для способа 200 содержит компоненты простых суждений (КПС); при этом вторая СД для способа 200 содержит простые суждения (ПС); при этом БДЛЛП, содержит сведения о лингвистических и логических признаках текстовых элементов (ЛЛПТЭ), причем упомянутые ЛЛПТЭ представляют собой лингвистические и логические признаки текстовых элементов (ТЭ) и их значения. Этап 201 характеризуется выполнением идентификации пригодной для формирования ОБД структуры данных, содержащей компоненты простых суждений (КПС), на котором идентифицируют элементы 31 пригодной для формирования ОБД структуры данных, содержащей компоненты простых суждений (КПС), а также идентификационные данные элементов 31, представляющие собой для каждого элемента 31, в качестве примера, но не ограничения, значение 311 элемента 31 пригодной для формирования ОБД структуры данных, и порядковый (порядковые) номер (номера) 312 КПС лингвистического предложения 11, представляющие собой ТЭ 21, составляющие элемент 31, а также выполнением идентификации пригодной для формирования ОБД структуры данных, содержащей простые суждения (ПС), на котором идентифицируют элементы 13 пригодной для формирования ОБД структуры данных, содержащей простые суждений (ПС), а также идентификационные данные элементов 13, представляющие собой для каждого элемента 13, в качестве примера, но не ограничения, значение 131 элемента 13 пригодной для формирования ОБД структуры данных, содержащей ПС и порядковый (порядковые) номер (номера) 132 ПС лингвистического предложения 11, представляющие собой ТЭ 21, составляющие элемент 13, а также выполнением идентификации пригодной для формирования ОБД базы данных, содержащей сведения о лингвистических и логических признаках текстовых элементов (ТЭ), на котором идентифицируют лингво-логические признаки текстовых элементов 21 пригодной для формирования ОБД базы данных, содержащей лингвистические характеристики 213 текстовых элементов 21, пригодной для формирования ОБД базы данных, и значения лингвистических характеристик 2131 ТЭ, а также логические характеристики 214 текстовых элементов 21, пригодной для формирования ОБД базы данных, и значения логических характеристик 2141 ТЭ, а также сами текстовые элементы 21, пригодной для формирования ОБД базы данных, их значения 211 и их порядковые номера 212 в лингвистическом предложении 11. При этом упомянутые процессы идентификации могут происходить в любом пригодном порядке, в том числе, не ограничиваясь, одновременно и/или параллельно, в том числе частично параллельно. [0058] FIG. 12, by way of example and not limitation, depicts a general flow diagram of the step 201 for identifying a first data structure (first LED for method 200), a second LED for method 200, and a linguistic-logical signature database (LMDB); wherein the first SD for the method 200 contains components of simple judgments (CPC); wherein the second DM for method 200 contains simple judgments (PS); at the same time BDLLP, contains information about the linguistic and logical features of text elements (LLPTE), and the mentioned LLPTE are linguistic and logical signs of text elements (TE) and their meanings. Step 201 is characterized by performing the identification of a HBS-capable data structure containing simple judgment components (SJCs), which identifies the elements 31 of a HBS-capable data structure containing simple judgment components (SJCs), as well as identification data of the elements 31, which are for of each element 31, as an example, but not limitation, the value 311 of the element 31 of a data structure suitable for the formation of the HBS, and the ordinal (ordinal) number (s) 312 of the KPS of the linguistic sentence 11, which are TE 21, constituting element 31, as well as the implementation identification of a data structure suitable for the formation of a HBS containing simple judgments (PS), on which the elements 13 of a data structure suitable for the formation of a HBS containing simple judgments (PS) are identified, as well as the identification data of the elements 13, which are for each element 13, as example, but not limitation, value 1 31 of the elements 13 of a data structure suitable for the formation of the HBS, containing the PS and the ordinal (ordinal) number (numbers) 132 PS of the linguistic sentence 11, which are TE 21, constituting element 13, as well as the identification of a database suitable for the formation of the HBS containing information about linguistic and logical features of text elements (TE), which identifies the linguistic and logical features of text elements 21 suitable for the formation of a HBS database containing the linguistic characteristics 213 of text elements 21 suitable for the formation of the OBD database, and the values of the linguistic characteristics of 2131 TE, as well as the logical characteristics of 214 text elements 21, suitable for the formation of the OBD database, and the values of the logical characteristics of 2141 TE, as well as the text elements themselves 21, suitable for the formation of the OBD database, their the values 211 and their serial numbers 212 in the linguistic sentence 11. Moreover, the mentioned identification processes can occur in any suitable order, including, but not limited to, simultaneously and / or in parallel, including partially in parallel.
[0059] На фиг. 13, в качестве примера, но не ограничения, изображена первая структура данных для способа 200, являющаяся первой исходной структурой данных для настоящего способа 200, представляющая собой пригодную для формирования ОБД структуру данных, содержащую компоненты простых суждений (КПС). В качестве примера, но не ограничения такой СД является описанная ранее со ссылкой на способ 100 вторая СД, которая таким образом дополнительно не описывается. [0059] FIG. 13, by way of example and not limitation, depicts a first data structure for method 200, which is the first raw data structure for present method 200, which is a HBS usable data structure containing simple proposition components (RPCs). By way of example, and not limitation, such an LED is the second LED previously described with reference to method 100, which is thus not further described.
[0060] На фиг. 14, в качестве примера, но не ограничения, изображена вторая структура данных для способа 200, являющаяся второй исходной структурой данных для настоящего способа 200, представляющая собой пригодную для формирования ОБД структуру данных, содержащую простые суждения (ПС). В качестве примера, но не ограничения такой СД является описанная ранее со ссылкой на способ 100 третья СД, которая таким образом дополнительно не описывается. [0060] FIG. 14, by way of example and not limitation, depicts a second data structure for method 200, which is the second original data structure for the present method 200, which is a data structure suitable for HBS generation containing simple judgments (PS). By way of example, and not limitation, such an LED is the third LED previously described with reference to method 100, which is thus not further described.
[0061] На фиг. 15, в качестве примера, но не ограничения, изображена база данных лингво-логических признаков ТЭ, представляющая собой пригодную для формирования ОБД базу данных, содержащую лингвистические и логические характеристики и значения этих характеристик. В качестве примера, но не ограничения такой БД/1/1П является описанная ранее со ссылкой на способ 100 БДЛЛП, которая таким образом дополнительно не описывается. [0061] FIG. 15, by way of example, but not limitation, depicts a database of linguistic and logical features of TE, which is a database suitable for the formation of a HBS containing linguistic and logical characteristics and the values of these characteristics. By way of example, and not limitation, such an OBD / 1 / 1P is previously described with reference to method 100 of BDLLP, which is thus not further described.
[0062] На фиг. 16, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 105 (202) формирования онтологической базы данных системных и семантических связей в третьей СД (ОБД). Этап 105 (202) характеризуется выполнением этапа 1051 (2021) идентификации системных связей между КПС на основании сведений, содержащихся в БДЛЛП, второй СД и третьей СД (соответственно, первой и второй СД для рассматриваемого способа 200), а также на основании критериев поиска системных однородностей, и регистрации выявленных связей в качестве системных онтологических признаков (СсОП) и значений СсОП; выполнением этапа 1052 (2022) идентификации семантических связей между КПС на основании сведений, содержащихся в БДЛ/1П, второй СД и третьей СД (соответственно, первой и второй СД для рассматриваемого способа 200), а также на основании критериев поиска семантических однородностей и регистрации выявленных связей в качестве семантических онтологических признаков (СмОП) и значений СмОП; выполнением этапа 1053 (2023) формирования онтологической базы данных системных и семантических связей в третьей СД (второй СД для способа 200), на котором формируют ОБД путем объединения всех выявленных онтологических признаков (СсОП и СмОП) компонентов простых суждений в третьей СД (второй СД для способа 200), при этом СсОП и СмОП являются всеми идентифицированными и зарегистрированными по каждому соответствующему компоненту простого суждения онтологическими признаками (СсОП и СмОП), обладающие соответствующими значениями СсОП и СмОП. [0062] FIG. 16, by way of example and not limitation, shows a general flow diagram of the steps of step 105 (202) of forming an ontological database of systemic and semantic links in a third SD (OBD). Step 105 (202) is characterized by performing step 1051 (2021) of identifying system connections between the CPS based on the information contained in the BDLLP, the second SD and the third SD (respectively, the first and second SD for the considered method 200), as well as based on the search criteria for system homogeneity, and registration of the identified links as system ontological features (SOP) and values of SOP; performing stage 1052 (2022) of identifying semantic links between the CPS based on the information contained in the BDL / 1P, the second SD and the third SD (respectively, the first and second SD for the considered method 200), as well as based on the search criteria for semantic homogeneities and registration of the identified relationships as semantic ontological features (SOM) and SOM values; performing stage 1053 (2023) of forming an ontological database of system and semantic relationships in the third SD (second SD for method 200), at which the OBD is formed by combining all the identified ontological features (SSOP and SMOP) of the components of simple judgments in the third SD (second SD for method 200), while the CsOP and SOMP are all identified and registered for each corresponding component of a simple judgment ontological features (SsOP and SOMP), having the corresponding values of SsOP and SOMP.
[0063] На фиг. 17, в качестве примера, но не ограничения, изображена общая структура сформированной онтологической базы данных системных и семантических связей в третьей СД (второй СД для способа 200), являющейся ОБД компонентов 31 простых суждений 13 в третьей структуре данных (второй СД для способа 200) после выполнения этапа 105 (202). Онтологическая база данных системных и семантических связей в третьей СД (второй СД для способа 200) представляет собой организованную структуру, созданную в соответствии с определенными правилами, и предназначенную для хранения, изменения и обработки упомянутых данных. ОБД является такая база данных, в которой элементы базы содержат информацию о различных связях с другими элементами этой базы. При этом элементами ОБД являются все компоненты 31 простых суждений 13 в третьей СД (второй СД для способа 200). Под термином «связь» понимается наличие системной и семантической связи между двумя компонентами 31 или между значениями 311 компонентов 31. Семантическая связь - это наличие каких- либо смысловых однородностей между двумя значениями 311 компонентов 31, указывающих на какое-либо соотношение смысловых объемов этих компонентов (соотношение мыслимых предметов или действий, которые выражают эти компоненты по смыслу). В качестве примера, но не ограничения можно привести следующие смысловые однородности между смысловыми объемами значений 311 компонентов 31: идентичность; эквивалентность; пересечение; поглощение; подчинение; противоречие; противоположность. Идентичность - это полное совпадение слов двух значений 311 компонентов 31 (например, но не ограничиваясь: «закон» и «закон»). Эквивалентность - это равнозначность смысловых объемов двух значений 31 компонентов 31, при условии, что нет полного совпадения слов у этих значений 311 компонентов 31, либо совпадения слов у двух значений 311 компонентов 31 нет вообще (например, но не ограничиваясь: «российский закон» и «закон России») Пересечение - это такое соотношение смысловых объемов двух значений 311 компонентов 31, при котором смысловые объемы этих значений 311 компонентов 31 совпадают лишь частично (например, но не ограничиваясь: «учащийся» и «студент»). Поглощение - это такое соотношение смысловых объемов двух значений 311 компонентов 31, при котором смысловой объем первого значения 311 компонента 31 полностью поглощает смысловой объем второго значения 311 компонента 31, но при этом смысловой объем второго значения 311 компонента 31 является лишь частью смыслового объема первого значения 311 компонента 31 (например, но не ограничиваясь: «ученик» и «первоклассник»). Подчинение - это такое соотношение смысловых объемов двух значений 311 компонентов 31, при котором смысловой объем первого значения 311 компонента 31 полностью входит в смысловой объем второго значения 311 компонента 31, но не покрывает смысловой объем второго значения 311 компонента 31 полностью (например, но не ограничиваясь: «первоклассник» и «ученик»). Противоречие - это такое соотношение смысловых объемов двух значений 311 компонентов 31, при котором смысловые объемы двух значений 311 компонентов 31 в рамках одного родового понятия содержат признаки этого понятия, взаимоисключающие друг друга (например, но не ограничиваясь: «белый цвет» и «небелый цвет»). Противоположность - это такое соотношение смысловых объемов двух значений 311 компонентов 31, при котором смысловые объемы двух значений 311 компонентов 31 в рамках одного родового понятия содержат несовпадающие признаки этого понятия, указывающие на исключительные свойства этих образов (например, но не ограничиваясь: «федеральный закон» и «региональный закон»). Системная связь - это наличие каких- либо системных однородностей между двумя компонентами 31 или значениями 311 компонентов 31, указывающих на наличие каких-либо соотношений системных признаков этих компонентов 31 или значений 311 компонентов 31. Системной связью двух компонентов 31, либо двух значений 311 компонентов 31 является все то, что не является семантической связью двух значений 311 компонентов 31. Системная связь компонентов 31 - это наличие однородностей (неких характеристик их объединяющих) между двумя компонентами, которые (однородности) имеют системный или классификационный, но не смысловой (семантический) характер. В качестве примера, но не ограничения, можно привести следующие примеры системной связи двух значений 311 компонентов 31 (компонентов, являющихся элементами простого суждения согласно формализованной модели простого суждения) (таблицы 5-8, 9-12): [0063] FIG. 17, by way of example, but not limitation, shows the general structure of the formed ontological database of system and semantic relations in the third SD (second SD for method 200), which is the HBS of components 31 of simple judgments 13 in the third data structure (second SD for method 200) after step 105 (202). The ontological database of systemic and semantic relationships in the third SD (second SD for method 200) is an organized structure created in accordance with certain rules and intended for storing, changing and processing said data. WBS is such a database in which the elements of the base contain information about various relationships with other elements of this base. In this case, the elements of the HBS are all components 31 of simple judgments 13 in the third SD (second SD for method 200). The term "connection" means the presence of a systemic and semantic connection between two components 31 or between the values 311 of the components 31. Semantic connection is the presence of any semantic homogeneity between the two meanings 311 of the components 31, indicating any ratio of the semantic volumes of these components ( the ratio of conceivable objects or actions that express these components in meaning). As an example, but not limitation, the following semantic homogeneities between semantic volumes of meanings 311 of components 31 can be cited: identity; equivalence; intersection; absorption; subordination; contradiction; opposite. Identity is a complete coincidence of words of two meanings 311 components 31 (for example, but not limited to: "law" and "law"). Equivalence is the equivalence of the semantic volumes of two values of 31 components 31, provided that there is no complete coincidence of words for these values of 311 components 31, or there is no coincidence of words for two values of 311 components 31 at all (for example, but not limited to: "Russian law" and “Law of Russia”) Intersection is such a ratio of the semantic volumes of two values of 311 components 31, in which the semantic volumes of these values of 311 components 31 coincide only partially (for example, but not limited to: “student” and “student”). Absorption is a ratio of the semantic volumes of two values 311 of components 31, in which the semantic volume of the first value 311 of component 31 completely absorbs the semantic volume of the second value 311 of component 31, but the semantic volume of the second value 311 of component 31 is only a part of the semantic volume of the first value 311 component 31 (for example, but not limited to: "student" and "first grader"). Submission is such a ratio of the semantic volumes of the two values 311 of the components 31, in which the semantic volume of the first value 311 of the component 31 is fully included in the semantic volume of the second value 311 of the component 31, but does not cover the semantic volume of the second value 311 of the component 31 completely (for example, but not limited to : "First grader" and "student"). A contradiction is such a ratio of the semantic volumes of two meanings 311 components 31, in which the semantic volumes of two meanings 311 components 31 within one generic concept contain signs of this concept mutually exclusive of each other (for example, but not limited to: "white color" and "non-white color "). The opposite is such a ratio of the semantic volumes of two meanings of 311 components 31, in which the semantic volumes of two meanings of 311 components 31 within one generic concept contain mismatched features of this concept, indicating the exceptional properties of these images (for example, but not limited to: "federal law" and "regional law"). A systemic relationship is the presence of any systemic homogeneities between two components 31 or the values 311 of the components 31, indicating the presence of any ratios of the systemic signs of these components 31 or the values 311 of the components 31. The systemic relationship of two components 31, or two values 311 of components 31 is everything that is not a semantic connection between the two meanings 311 of the components 31. The systemic connection of the components 31 is the presence of homogeneities (some characteristics that unite them) between two components that (homogeneity) have a systemic or classification, but not semantic (semantic) character. As an example, but not limitation, the following examples of a systemic relationship between two values 311 of components 31 (components that are elements of a simple judgment according to a formalized model of a simple judgment) can be cited (Tables 5-8, 9-12):
[0064] Пример 1: компоненты 31 в рамках одного простого суждения 13 (например, но не ограничиваясь: для третьей СД (второй СД для способа 200) из четырех ПС 13): [0064] Example 1: components 31 within one simple proposition 13 (for example, but not limited to: for the third SD (second SD for method 200) of four PS 13):
Таблица 5
Figure imgf000030_0001
Table 5
Figure imgf000030_0001
Таблица б
Figure imgf000030_0002
Table b
Figure imgf000030_0002
Таблица 7
Figure imgf000030_0003
Table 7
Figure imgf000030_0003
Таблица 8
Figure imgf000030_0004
Table 8
Figure imgf000030_0004
[0065] Пример 1 показывает, что возможна идентификация и регистрация системной связи, основанной на простом факте наличия значений компонентов: в nCN°l имеется три системные связи (Действие-Субъект; Объект-Субъект и Действие-Объект); в ПС1\1°2 имеется только одна подобная системная связь (Действие-Субъект); в ПСЫ°3 - шесть подобных системных связей (Действие-Субъект; Действие-Объект; Действие- Обстоятельство; Субъект-Объект; Субъект-Обстоятельство; Объект-Обстоятельство), в ПСЫ°4 - четыре подобные системные связи (Действие-Субъект; Действие-Обстоятельство; Субъект-Обстоятельство; Объект-Обстоятельство). [0065] Example 1 shows that it is possible to identify and register a system relationship based on the simple fact of the presence of component values: there are three system relationships in nCN ° l (Action-Subject; Object-Subject and Action-Object); in PS1 \ 1 ° 2 there is only one such systemic connection (Action-Subject); in PSN ° 3 - six similar system connections (Action-Subject; Action-Object; Action-Circumstance; Subject-Object; Subject-Circumstance; Object-Circumstance), in PSN ° 4 - four similar system connections (Action-Subject; Action -Circumstance; Subject-Circumstance; Object-Circumstance).
[0066] Пример 2: одинаковые виды компонентов 31 простых суждений 13 в третьей структуре данных (например, но не ограничиваясь: для третьей СД (второй СД для способа 200) из четырех ПС13, указанных в вышеописанном примере): Таблица 9
Figure imgf000031_0001
[0066] Example 2: The same kinds of components 31 of simple judgments 13 in the third data structure (eg, but not limited to: for the third SD (second SD for method 200) of the four PS13 mentioned in the above example): Table 9
Figure imgf000031_0001
Таблица 10
Figure imgf000031_0002
Table 10
Figure imgf000031_0002
Таблица 11
Figure imgf000031_0003
Table 11
Figure imgf000031_0003
Таблица 12
Figure imgf000031_0004
Table 12
Figure imgf000031_0004
[0067] Пример 2 показывает, что возможна идентификация и регистрация системной связи, основанной на совпадении в четырех анализируемых простых суждениях (ПС) видов компонентов, имеющих значение: по компоненту «субъект» имеется шесть системных связей между четырьмя ПС13 ( ПС1\1°1-ПС1\1°2; ПС1\1°1-ПС1\1°3; ПС1\1°1-ПС1\1°4; ПС1\1°2-ПС1\1°3; ПС1\1°2-ПС1\1°4; ПС1\1°3-ПС1\1°4); по компоненту «действие» имеется шесть системных связей между четырьмя ПС13 ( ПС1\1°1-ПС1\1°2; ПС1\1°1-ПС1\1°3; ПС1\1°1-ПС1\1°4; ПС1\1°2-ПС1\1°3; ПС1\1°2-ПС1\1°4; ПС1\1°3-ПС1\1°4); по компоненту «объект» имеется одна системная связей между двумя ПС12 (ПС1\1°1-ПС1\1°3); по компоненту «обстоятельство» имеется одна системная связь между двумя ПС13 (ПС1\1°3-ПС1\1°4). [0067] Example 2 shows that it is possible to identify and register a systemic connection based on the coincidence in four analyzed simple judgments (PS) of the types of components that have a value: according to the "subject" component, there are six systemic connections between four PS13 (PS1 \ 1 ° 1 -PS1 \ 1 ° 2; PS1 \ 1 ° 1-PS1 \ 1 ° 3; PS1 \ 1 ° 1-PS1 \ 1 ° 4; PS1 \ 1 ° 2-PS1 \ 1 ° 3; PS1 \ 1 ° 2-PS1 \ 1 ° 4; PS1 \ 1 ° 3-PS1 \ 1 ° 4); on the “action” component, there are six systemic connections between four PS13 (PS1 \ 1 ° 1-PS1 \ 1 ° 2; PS1 \ 1 ° 1-PS1 \ 1 ° 3; PS1 \ 1 ° 1-PS1 \ 1 ° 4; PS1 \ 1 ° 2-PS1 \ 1 ° 3; PS1 \ 1 ° 2-PS1 \ 1 ° 4; PS1 \ 1 ° 3-PS1 \ 1 ° 4); on the “object” component, there is one systemic relationship between two PS12 (PS1 \ 1 ° 1-PS1 \ 1 ° 3); according to the “circumstance” component, there is one systemic connection between two PS13 (PS1 \ 1 ° 3-PS1 \ 1 ° 4).
[0068] Также, в качестве примера, но не ограничения, можно привести следующие примеры системной связи двух значений 311 компонентов 31 (таблицы 13, 14): [0068] Also, as an example, but not limitation, you can give the following examples of the system connection of two values 311 of the components 31 (tables 13, 14):
[0069] Пример 3: части речи синтаксически главного слова компонента (элемента простого суждения) значений 311 компонентов 31 в рамках одного простого суждения 13 (например, но не ограничиваясь: для ПС N°1 третьей СД (второй СД для способа 200) из указанных ранее примеров: Таблица IB
Figure imgf000032_0001
[0069] Example 3: parts of speech of the syntactically main word of a component (element of a simple judgment) of the values 311 of the components 31 within one simple judgment 13 (for example, but not limited to: for PS No. earlier examples: IB Table
Figure imgf000032_0001
[0070] Пример 3 показывает, что возможна идентификация и регистрация системной связи, основанной на совпадении частей речи главного слова (синтаксической вершины) в рамках одного простого суждения 13: совпадение части речи главного слова только между следующими компонентами: Субъект-Объект. [0070] Example 3 shows that it is possible to identify and register a system communication based on the coincidence of parts of speech of the main word (syntactic vertex) within one simple proposition 13: coincidence of part of speech of the main word only between the following components: Subject-Object.
[0071] Пример 4: одинаковые части речи значений 311 компонентов 31 в рамках простых суждений 13 третьей СД (например, но не ограничиваясь: для третьей СД (второй СД для способа 200) из четырех ПС 13, указанных приведенных ранее примерах: [0071] Example 4: the same parts of speech of the values 311 of the components 31 within the framework of simple judgments 13 of the third SD (for example, but not limited to: for the third SD (second SD for method 200) of the four PSs 13 indicated in the previous examples:
Таблица 14
Figure imgf000032_0002
где: «Сущ.» - существительное; «С» - субъект; «Д» - действие; «О» - объект; «Об» - обстоятельство; цифры «1», «2», «3», «4» - номера простых суждений в третьей СД.
Table 14
Figure imgf000032_0002
where: "Ex." - noun; "C" - subject; "D" - action; "O" - object; "About" - a circumstance; the numbers "1", "2", "3", "4" are the numbers of simple judgments in the third CD.
[0072] Пример 4 показывает, что возможна идентификация и регистрация системной связи, основанной на совпадении частей речи главного слова (синтаксической вершины) в рамках нескольких (в рамках примера -четырех) простого суждения 13: части речи главного слова только между следующими компонентами: Cl-01; С1-03; Cl-ОбЗ; С1- 064; 01-03; 01-063; 01-064; С2-01; С2-03; С2-063; С2-064; СЗ-01; СЗ-ОЗ; СЗ-ОбЗ; СЗ-064; 03-01; 03-063; 03-064; С4-01; С4-03; С4-063; С4-064; 04-064. [0072] Example 4 shows that it is possible to identify and register a system communication based on the coincidence of parts of speech of the main word (syntactic vertex) within several (within the example, four) simple propositions 13: parts of speech of the main word only between the following components: Cl -01; C1-03; Cl-OBZ; C1-064; 01-03; 01-063; 01-064; S2-01; S2-03; C2-063; C2-064; SZ-01; NW-OZ; SZ-ObZ; SZ-064; 03-01; 03-063; 03-064; S4-01; S4-03; C4-063; C4-064; 04-064.
[0073] Идентификация системных связей между КПС 31 простых суждений 13 третьей СД предпочтительно производят на этапе 1051 (2021) путем установки критериев поиска системных однородностей между компонентами 31 простых суждений 13 и реализации такого поиска. Для идентификации системных связей между КПС 31 простых суждений 13 третьей СД (второй СД для способа 200) используют сведения из БДЛ/1П текстовых элементов, а также сведения о формализованной модели простого суждения, сведения о массиве простых суждений (третьей СД (второй СД для способа 200)) и сведения о массиве компонентов простых суждений (второй СД (первой СД для способа 200)). Виды системных однородностей устанавливаются в зависимости от конкретных целей прикладных задач в предметной области, решаемых с помощью выявления системных связей КПС 31 простых суждений 13. Системные однородности могут быть внутренними и внешними. Внутренние системные однородности относятся к виду однородностей, которые имеют место между компонентами 31 внутри отдельных простых суждений 13, а внешние системные однородности относятся к виду однородностей, которые имеют место между компонентами 31 разных простых суждений 13 третьей СД (второй СД для способа 200). В качестве примера, но не ограничения можно привести способ поиска системной однородности по следующему критерию (аналогичный упомянутому примеру 1): компоненты 31 вида «элементы простого суждения» находятся в одном простом суждении 13. В данном примере идентификация системных связей между КПС 31 вида «элементы простого суждения» простых суждений 13 будет производится в каждом простом суждении 13 на основании формализованной модели простого суждения, которая устанавливает элементы простого суждения, а также по критерию фактического наличия значений 311 у указанных компонентов 31 в рамках отдельных элементов формализованной модели простого суждения. При наличии значений 311 компонента 31 указанного вида у первого и у второго компонентов 31 будет зафиксирована связь между этими компонентами 31 в тех простых суждениях, в которых они будут выявлены в результате поиска системных однородностей по установленному критерию. При наличии значений 311 компонента 31 указанного вида у первого и у второго компонентов 31 будет зафиксирована связь между этими компонентами 31 в тех простых суждениях, в которых они будут выявлены в результате поиска системных однородностей по установленному критерию. Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом предметной области, в рамках которой производится поиск системных однородностей или же с помощью программного обеспечения. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью различных систем машинного обучения, в том числе статистического процессора или нейросети. Идентификация семантических связей между КПС 31 простых суждений 13 третьей СД (второй СД для способа 200) предпочтительно производят на этапе 1052 (2022) путем установки критериев поиска семантических однородностей между КПС 31 простых суждений 13 и реализации такого поиска. Виды семантических связей устанавливаются в зависимости от конкретных целей прикладных задач в предметной области, решаемых с помощью выявления семантических связей КПС 31 простых суждений 13. Семантические однородности могут быть внутренними и внешними. Внутренние семантические однородности относятся к виду однородностей, которые имеют место между компонентами 31 внутри отдельных простых суждений 13, а внешние семантические однородности относятся к виду однородностей, которые имеют место между компонентами 31 разных простых суждений 13 третьей СД (второй СД для способа 200). В качестве примера, но не ограничения, можно привести способ поиска семантических однородностей по следующему критерию: значения 311 КПС 31 вида «элемент простого суждения» должны быть эквивалентны. В данном примере идентификация семантических связей между КПС 31 вида «элемент простого суждения» простых суждений 13 будет производится в каждом простом суждении 13 по критерию равнозначности смысловых объемов двух значений 311 компонентов 31 при условии, что нет полного совпадения слов у этих значений 311 компонентов 31, либо совпадения слов у двух значений 311 компонентов 31 нет вообще. При наличии признаков эквивалентности смысловых объемов значений 311 у обоих КПС 31 будет зафиксирована искомая семантическая связь между этими компонентами 31 в тех простых суждениях 13, в которых они будут выявлены в результате поиска семантических однородностей по установленному критерию. Например, но не ограничиваясь, такими компонентами могут быть компоненты 31 со следующими значениями 311: «ученик школы» и «школьник». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен специалистом-лингвистом с учетом знания специальной терминологии предметной области, в рамках которой производится поиск семантических однородностей или же с помощью программного обеспечения. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью различных систем машинного обучения, в том числе, статистического процессора или нейросети. На основании идентифицированных системных связей между КПС 31 простых суждений 13 третьей СД (второй СД для способа 200) формируют данные о системных связях между КПС 31 простых суждений ПС 13 третьей СД (второй СД для способа 200), являющихся системными онтологическими признаками 313 КПС 31 простых суждений 13, а также об их значениях 3131, сформированных после выполнения этапа 1051 (2021). На основании идентифицированных семантических связей между КПС 31 простых суждений 13 третьей СД (второй СД для способа 200)формируют данные о семантических связях между КПС 31 простых суждений 13 третьей СД (второй СД для способа 200), являющихся семантическими онтологическими признаками 314 КПС 31 простых суждений 13, а также об их значениях 3141, сформированных после выполнения этапа 1052 (2022). На основании сформированных на этапах 1051 (2021) и 1052 (2022) данных о системных и семантических связях между КПС 31 простых суждений 13 третьей СД (второй СД для способа 200) на этапе 1053 (2023) формируют ОБД. [0073] The identification of system links between the PCC 31 of the simple judgments 13 of the third DS is preferably performed at step 1051 (2021) by setting the criteria for searching for system homogeneities between the components 31 of the simple judgments 13 and implementing such a search. To identify system connections between KPS 31 simple judgments 13 of the third SD (second SD for method 200) use information from BDL / 1P text elements, as well as information about a formalized model of a simple judgment, information about an array of simple judgments (third SD (second SD for method 200)) and information about an array of components simple judgments (second SD (first SD for method 200)). The types of systemic homogeneities are established depending on the specific goals of applied problems in the subject area, solved by identifying systemic connections KPS 31 simple judgments 13. Systemic homogeneities can be internal and external. Internal systemic homogeneities refer to the type of homogeneities that occur between the components 31 within individual simple judgments 13, and external systemic homogeneities refer to the type of homogeneities that occur between the components 31 of different simple judgments 13 of the third SD (second SD for method 200). As an example, but not limitation, one can cite the method of searching for systemic homogeneity according to the following criterion (similar to the mentioned example 1): components 31 of the form "elements of a simple judgment" are in one simple judgment 13. In this example, the identification of system connections between KPS 31 of the form "elements simple judgment ”of simple judgments 13 will be made in each simple judgment 13 on the basis of a formalized model of simple judgment, which establishes the elements of a simple judgment, as well as on the criterion of the actual presence of values 311 in these components 31 within the individual elements of the formalized model of simple judgment. If there are 311 values of the component 31 of the specified type, the first and second components 31 will record the connection between these components 31 in those simple judgments in which they will be identified as a result of the search for systemic homogeneities according to the established criterion. If there are 311 values of the component 31 of the specified type, the first and second components 31 will record the connection between these components 31 in those simple judgments in which they will be identified as a result of the search for systemic homogeneities according to the established criterion. Such an analysis can be performed by any method known from the prior art and, accordingly, is not further described in detail. For example, but not limited to, such analysis can be performed traditionally by a specialist in the subject area, within which system homogeneities are searched, or with the help of software. Moreover, in the presence of a sufficient number of examples, it is possible to perform such an analysis using various machine learning systems, including statistical processor or neural network. The identification of semantic links between the CSS 31 of simple judgments 13 of the third DS (second DS for the method 200) is preferably performed at step 1052 (2022) by setting the criteria for searching for semantic homogeneities between the CSS 31 of simple judgments 13 and implementing such a search. Types of semantic relationships are established depending on the specific goals of applied problems in the subject area, solved by identifying semantic relationships KPS 31 simple judgments 13. Semantic homogeneities can be internal and external. Internal semantic homogeneities refer to the type of homogeneities that occur between the components 31 within individual simple judgments 13, and external semantic homogeneities refer to the type of homogeneities that occur between the components 31 of different simple judgments 13 of the third SD (second SD for method 200). As an example, but not limitation, we can give a method of searching for semantic homogeneities according to the following criterion: the values 311 KPS 31 of the form “element of simple judgment” must be equivalent. In this example, the identification of semantic links between KPS 31 of the form "element of simple judgment" of simple judgments 13 will be performed in each simple judgment 13 according to the criterion of equivalence of semantic volumes of two values 311 of components 31, provided that there is no complete coincidence of words in these values 311 of components 31, or there is no word coincidence for the two meanings 311 of the components 31 at all. If there are signs of equivalence of semantic volumes of values 311, both KPS 31 will have the desired semantic relationship between these components 31 in those simple judgments 13 in which they will be identified as a result of the search for semantic homogeneities according to the established criterion. For example, but not limited to, such components may be components 31 with the following values 311: "student of school" and "student". Such an analysis can be performed by any method known from the prior art and, accordingly, is not further described in detail. For example, but not limited to, such an analysis can be performed by a specialist linguist, taking into account the knowledge of the special terminology of the subject area, within which the search for semantic homogeneities is performed, or with the help of software. Moreover, if there is a sufficient number of examples, it is possible to perform such an analysis using various machine learning systems, including a statistical processor or a neural network. Based on the identified system connections between the CPS 31 of simple judgments 13 of the third SD (the second SD for the method 200), data on the system the connections between the KPS 31 of simple judgments PS 13 of the third SD (the second SD for the method 200), which are system ontological signs 313 of the KPS 31 of simple judgments 13, as well as their values 3131, formed after the execution of step 1051 (2021). Based on the identified semantic links between the CPS 31 simple judgments 13 of the third SD (second SD for method 200) form data on semantic relationships between the CPS 31 simple judgments 13 of the third SD (second SD for method 200), which are semantic ontological features 314 CPS 31 simple judgments 13, as well as their values 3141 generated after step 1052 (2022). Based on the data generated at steps 1051 (2021) and 1052 (2022) about the system and semantic relationships between the SPS 31 of simple judgments 13 of the third DS (the second DS for the method 200), at step 1053 (2023), an OBD is generated.
[0074] Далее, после завершения описанного ранее этапа 105, в целях повышения точности последующего поиска в структурированном массиве данных, содержащем, по меньшей мере, простые суждения (ПС) лингвистического предложения и их идентификационные данные, становится возможным осуществить финальную систематизацию структур данных СМД, содержащих, по меньшей мере, компоненты простого суждения (КПС) лингвистического предложения и их идентификационные данные. [0074] Further, after completing the previously described step 105, in order to improve the accuracy of the subsequent search in the structured data set containing at least simple judgments (PS) of the linguistic sentence and their identification data, it becomes possible to carry out the final systematization of the data structures of the MDS, containing at least the components of a simple proposition (CPS) of a linguistic sentence and their identification data.
[0075] На фиг. 18, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 300 преобразования структурированного массива данных (СМД), содержащего простые суждения (ПС), заключающегося в: выполнении этапа 301 идентификации исходной структуры данных для способа 300 (далее - исходной СД) и онтологической базы данных (ОБД); при этом исходной СД является СД, содержащая элементы СД, являющиеся простыми суждениями (ПС) лингвистического предложения и идентификационные данные ПС, причем ПС содержат компоненты; при этом ОБД, содержит сведения о системных и семантических связях в исходной СД, причем упомянутые сведения представляют собой системные и семантические связи между компонентами ПС в исходной СД; выполнении этапа 106 формирования базы данных отношений в исходной СД, на котором на основании сведений, содержащихся в ОБД, а также на основании критериев поиска искомых суждений, сравнивают компоненты ПС, а также классифицируют и регистрируют виды отношений между сравниваемыми компонентами ПС, из которых формируют базу данных отношений компонентов ПС в исходной СД (БДО); выполнении этапа 107 формирования четвертой (итоговой) СД, на котором на основании сведений, содержащихся в БДО, исходной СД , а также на основании упомянутых критериев поиска искомых суждений, формируют итоговую СД, содержащую элементы итоговой СД, причем упомянутые элементы итоговой СД представляют собой искомые суждения (ИС), а также идентификационные данные ИС, представляющие собой в качестве примера, но не ограничения: значения ИС и порядковые номера текстовых элементов (ТЭ) лингвистического предложения, составляющих ИС. При этом, как указано ранее, упомянутой исходной СД для рассматриваемого способа 300 является любая пригодная для реализации способа 300 СД, содержащая упомянутые простые суждения. В качестве примера, но не ограничения, такой СД является описанная ранее со ссылкой на способ 100 третья СД, или любая известная из уровня техники, в том числе в будущем, СД, содержащая упомянутые простые суждения. При этом, как указано ранее, упомянутой ОБД является любая онтологическая база данных, пригодная для реализации способа 300, в том числе, не ограничиваясь, описанная ранее со ссылкой на способ 200 ОБД, содержащая упомянутые сведения о системных и семантических связях в третьей СД, являющейся исходной для рассматриваемого способа 300. [0075] FIG. 18, by way of example, but not limitation, shows a general diagram of the steps of the claimed method 300 for transforming a structured data array (SDM) containing simple judgments (PS), which consists in: performing the step 301 of identifying the original data structure for the method 300 (hereinafter referred to as the initial SD) and ontological database (OBD); in this case, the original SD is a SD containing elements of the SD, which are simple judgments (PS) of a linguistic sentence and identification data of the PS, and the PS contains components; in this case, the OBD contains information about the system and semantic links in the source SD, and the mentioned information is the system and semantic links between the components of the PS in the source SD; performing stage 106 of forming a database of relations in the source SD, on which, based on the information contained in the HBS, as well as on the basis of the search criteria for the sought judgments, the components of the PS are compared, and also the types of relations between the compared components of the PS are classified and recorded, from which the base is formed data of the relations of the components of the PS in the original SD (BDO); performing stage 107 of the formation of the fourth (final) SD, at which, based on the information contained in the BDO, the original SD, and also on the basis of the mentioned search criteria for the sought judgments, the final SD is formed containing the elements of the final SD, and the mentioned elements of the final SD are the sought judgments (IS), as well as the identification data of the IS, which are, by way of example, but not limitation: the values of the IS and the ordinal numbers of the text elements (TE) of the linguistic sentence that make up the IS. In this case, as indicated earlier, the mentioned initial SD for the considered method 300 is any SD that is suitable for the implementation of the method 300, containing the mentioned simple judgments. By way of example, and not limitation, such a CD is the third CD, previously described with reference to the method 100, or any CD known in the art, including in the future, containing the aforementioned simple judgments. In this case, as indicated earlier, the mentioned HBS is any ontological database suitable for implementing the method 300, including, but not limited to, described earlier with reference to the HBS method 200, containing the mentioned information about system and semantic relationships in the third SD, which is source for the considered method 300.
[0076] На фиг. 19, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 301 идентификации пригодной для преобразования СМД, содержащего ПС, структуры данных, содержащей простые суждения (например, не ограничиваясь, третьей СД), являющейся исходной структурой данных для рассматриваемого способа 300 (далее - исходная СД), а также базы данных, содержащей сведения о системных и семантических связях в исходной СД (ОБД). Этап 301 характеризуется выполнением идентификации пригодной для преобразования СМД, содержащего ПС, структуры данных, содержащей простые суждения (ПС), на котором идентифицируют элементы 13 пригодной для преобразования СМД, содержащего ПС, структуры данных, содержащей простые суждения (ПС), а также идентификационные данные элементов 13, представляющие собой для каждого элемента 13, в качестве примера, но не ограничения, значение 131 элемента 13 пригодной для преобразования СМД, содержащего ПС, структуры данных, и порядковый (порядковые) номер (номера) 132 ПС лингвистического предложения 11, представляющие собой ТЭ 21, составляющие элемент 13, а также выполнением идентификации пригодной для преобразования СМД, содержащего ПС, базы данных, содержащей сведения о системных и семантических связях в третьей СД, на котором идентифицируют онтологическую базу данных (ОБД), содержащую сведения о системных и семантических связях в третьей СД, пригодной для преобразования СМД, содержащего ПС, базы данных, содержащей данные о системных связях между КПС 31 простых суждений ПС 13 третьей СД (являющейся исходной для рассматриваемого способа 300), являющихся системными онтологическими признаками 313 КПС 31 простых суждений 13, и об их значениях 3131, пригодной для преобразования СМД, содержащего ПС, а также данные о семантических связях между КПС 31 простых суждений ПС 13 третьей СД, являющихся семантическими онтологическими признаками 314 КПС 31 простых суждений 13, и об их значениях 3141, пригодной для преобразования СМД, содержащего ПС, а также сами простые суждения 31, пригодной для преобразования СМД, содержащего ПС, базы данных, их значения 311 и их порядковые номера 312 в лингвистическом предложении 11. При этом упомянутые процессы идентификации могут происходить в любом пригодном порядке, в том числе, не ограничиваясь, одновременно и/или параллельно, в том числе частично параллельно. [0076] FIG. 19, by way of example and not limitation, depicts a general flow diagram of the step 301 of identifying a transformable MDS containing an MS, a data structure containing simple judgments (for example, but not limited to, a third LED), which is the initial data structure for the considered method 300 ( further - the original SD), as well as a database containing information about system and semantic relationships in the original SD (OBD). Step 301 is characterized by performing the identification of a transformable MDM containing PS, a data structure containing simple judgments (PS), which identifies elements 13 of a transformable MDM containing PS, a data structure containing simple judgments (PS), as well as identification data elements 13, representing for each element 13, by way of example, but not limitation, the value 131 of element 13 suitable for transformation MDS containing PS, data structures, and ordinal (ordinal) number (s) 132 PS of linguistic sentence 11, representing TE 21, constituting element 13, as well as the identification of a database suitable for transformation containing PS, containing information about system and semantic relationships in the third SD, on which an ontological database (OBD) is identified, containing information about system and semantic relationships in the third SD, suitable for converting an SDS containing PS, a database containing data on system connections between KPS 31 of simple judgments PS 13 of the third SD (which is the initial one for the considered method 300), which are system ontological signs 313 KPS 31 of simple judgments 13, and about their values 3131, suitable for transforming the SMD, containing PS, as well as data on the semantic connections between KPS 31 simple judgments PS 13 of the third SD, which are semantic ontological features 314 KPS 31 simple judgments 13, and about their meanings 3141, suitable for transforming the MSS containing PS, as well as the simple judgments themselves 31 , suitable for converting an MDS containing a PS, a database, their values 311 and their serial numbers 312 in the linguistic sentence 11. In this case, the mentioned identification processes can occur in any suitable order, including, but not limited to, simultaneously and / or in parallel, including partially in parallel.
[0077] На фиг. 20, в качестве примера, но не ограничения, изображена примерная исходная структура данных для настоящего способа 300, представляющая собой пригодную для преобразования СМД, содержащего ПС, структуру данных, содержащую простые суждения (ПС). В качестве примера, но не ограничения, такой СД может быть описанная ранее со ссылкой на способ 100 третья СД, которая таким образом дополнительно не описывается. [0077] FIG. 20 illustrates, by way of example and not limitation, an exemplary raw data structure for the present method 300, which is a transformable MD containing PS to a data structure containing simple judgments (PS). By way of example, and not limitation, such an LED may be the third LED previously described with reference to method 100, which is thus not further described.
[0078] На фиг. 21, в качестве примера, но не ограничения, изображена примерная онтологическая база данных, представляющая собой пригодную для преобразования СМД, содержащего ПС, базу данных, содержащую сведения о системных и семантических связях в третьей СД. В качестве примера, но не ограничения, такой ОВД может быть описанная ранее со ссылкой на способ 200 ОВД, которая таким образом дополнительно не описывается. [0078] FIG. 21, by way of example, but not limitation, depicts an exemplary ontological database, which is a database suitable for transformation of an MDS containing an MS, containing information about system and semantic relationships in a third SD. By way of example and not limitation, such an ATS may be described previously with reference to the ATS method 200, which is thus not further described.
[0079] На фиг. 22, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 106 (302) формирования базы данных отношений в третьей СД (БДО). Этап 106 (302) характеризуется: выполнением этапа 1061 (3021) формирования карты отношений КПС в третьей СД (являющейся исходной для рассматриваемого способа 300) на основании критериев поиска искомых суждений; выполнением этапа 1062 (3022) классификации на основании сведений, содержащихся в ОБД, и регистрации видов отношений между сравниваемыми КПС такой исходной СД и регистрации соответствующих видов отношений в качестве выводов по результатам сопоставления системных и семантических онтологических сведений о сравниваемых КПС; выполнением этапа 1063 (3023) формирования базы данных отношений в такой исходной СД, на котором формируют БДО компонентов простых суждений такой исходной СД путем объединения всех классифицированных и зарегистрированных отношений между сравниваемыми КПС третьей СД. [0079] FIG. 22, by way of example and not limitation, a general flowchart of the steps of step 106 (302) of generating a relationship database in a third AN (BDO) is shown. Step 106 (302) is characterized by: performing step 1061 (3021) of generating a map of KPS relations in the third SD (which is the initial one for the considered method 300) based on the search criteria for the desired judgments; performing stage 1062 (3022) classification based on the information contained in the HBS, and registering the types of relations between the compared CPSs of such an initial SD and registering the corresponding types of relations as conclusions based on the results of comparing system and semantic ontological information about the compared KPS; performing stage 1063 (3023) of forming a database of relations in such an initial SD, on which the BDO of the components of simple judgments of such an initial SD is formed by combining all classified and registered relations between the compared CPS of the third SD.
[0080] На фиг. 2В, в качестве примера, но не ограничения, изображена общая структура сформированной карты отношений компонентов 31 простых суждений 13. Под термином «карта отношений» понимается таблица сопоставления системных, а также семантических онтологических сведений о сравниваемых компонентах 31. При этом карта отношений предназначена для сравнения не всех компонентов 31 простых суждений третьей СД, а только тех, которые контролируются (проверяются) в соответствии с критериями поиска искомых суждений, о которых будет упомянуто далее. В качестве примера, но не ограничения, можно привести следующие виды отношений 316 между компонентами 31, установленными в карте отношений: идентичность; эквивалентность; пересечение; поглощение; подчинение. При этом сами виды отношений частично совпадают с упомянутыми в онтологической базе данных видами связей. Это является допустимым, поскольку сами виды отношений установлены в теории логики и применяются для определения соотносимости различных сущностей. При этом, в отличие от видов семантических однородностей компонентов 31 при соотнесении смысловых объемов значений 311 компонентов 31 при формировании семантических онтологических признаков, виды отношений, идентифицируемые для БДО в карте отношений компонентов 31, основаны не только на семантических, но и на системных признаках сравниваемых компонентов 31, т.е. виды отношений представляют собой совокупные гибридные системно-семантические признаки. Причем процесс определения вида отношений, который учитывает одновременно системные и семантические признаки компонентов 31 и определяет вид отношений между сравниваемыми компонентами 31, формируется в зависимости от конкретной прикладной задачи поиска простых суждений 13 в третьей СД в конкретной предметной области. Идентичность - это полное совпадение системно-семантических признаков двух компонентов 31 при условии полной корреляции системно-семантических признаков компонентов 31 и требований к системно-семантическим признакам сравниваемых компонентов 31 в карте отношений. Эквивалентность - это неполное совпадение, но равнозначность системно-семантические признаков двух компонентов 31 при условии игнорирования неполной корреляции системно-семантических признаков компонентов 31 и требований к системно- семантическим признакам сравниваемых компонентов 31 в карте отношений. Пересечение - это неполное совпадение системно-семантических признаков двух компонентов 31 при условии признания неполной корреляции системно-семантических признаков компонентов 31 и требований к системно-семантическим признакам сравниваемых компонентов 31 в карте отношений. Поглощение - это такое соотношение системно-семантических признаков двух компонентов 31, при котором объем системно- семантических признаков первого компонента 31 полностью поглощает объем системно- семантических признаков второго компонента 31, но при этом объем системно- семантических признаков второго компонента 31 является лишь частью объема системно- семантических признаков первого компонента 31 при условии корреляции системно- семантических признаков компонентов 31 и требований к системно-семантических признакам к сравниваемым компонентам 31 в карте отношений. Подчинение - это такое соотношение системно-семантических признаков двух компонентов 31, при котором объем системно-семантических признаков первого компонента 31 полностью входит в объем системно-семантических признаков второго компонента 31, но при этом объем системно-семантических признаков второго компонента 31 не покрывает объем системно-семантических признаков первого компонента 31 при условии корреляции системно-семантических признаков компонентов 31 и требований к системно- семантическим признакам к сравниваемым компонентам 31 в карте отношений. [0080] FIG. 2B, by way of example, but not limitation, shows the general structure of the generated relationship map of components 31 of simple judgments 13. The term "relationship map" refers to a table of comparison of systemic as well as semantic ontological information about the compared components 31. In this case, the relationship map is intended for comparison not all components of 31 simple judgments of the third SD, but only those that are controlled (checked) in accordance with the search criteria for the sought judgments, which will be mentioned below. By way of example, and not limitation, the following types of relationships 316 between the components 31 established in the relationship map can be cited: identity; equivalence; intersection; absorption; subordination. At the same time, the types of relations themselves partially coincide with the types of relations mentioned in the ontological database. This is permissible, since the types of relations themselves are established in the theory of logic and are used to determine the correlation of various entities. At the same time, in contrast to the types of semantic homogeneities of components 31 when correlating the semantic volumes of the values of 311 components 31 during the formation of semantic ontological features, the types of relations identified for the BDO in the map of component relationships 31 are based not only on semantic, but also on systemic features of the compared components 31, i.e. types of relations are aggregate hybrid system-semantic features. Moreover, the process of determining the type of relations, which takes into account both the system and semantic features of the components 31 and determines the type of relations between the compared components 31, is formed depending on the specific applied problem of finding simple judgments 13 in the third SD in a specific subject area. Identity is a complete coincidence of the system-semantic features of the two components 31, provided that the system-semantic features of the components 31 are fully correlated and the requirements for the system-semantic features of the compared components 31 in the relationship map. Equivalence is an incomplete coincidence, but the equivalence of the system-semantic features of the two components 31, provided that the incomplete correlation of the system-semantic features of the components 31 and the requirements for the system-semantic features are ignored. semantic features of the compared components 31 in the relationship map. The intersection is an incomplete coincidence of the system-semantic features of the two components 31, provided that the incomplete correlation of the system-semantic features of the components 31 and the requirements for the system-semantic features of the compared components 31 in the relationship map are recognized. Absorption is such a ratio of system-semantic features of two components 31, in which the volume of system-semantic features of the first component 31 completely absorbs the volume of system-semantic features of the second component 31, but the volume of system-semantic features of the second component 31 is only a part of the volume of systemic - semantic features of the first component 31, subject to the correlation of the system-semantic features of the components 31 and the requirements for the system-semantic features for the compared components 31 in the relationship map. Submission is such a ratio of the system-semantic features of the two components 31, in which the volume of the system-semantic features of the first component 31 is fully included in the volume of the system-semantic features of the second component 31, but the volume of the system-semantic features of the second component 31 does not cover the volume of systemic - semantic features of the first component 31, subject to the correlation of the system-semantic features of the components 31 and the requirements for the system-semantic features for the compared components 31 in the relationship map.
[0081] На фиг. 24, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных отношений в третьей СД (являющейся исходной для рассматриваемого способа 300), являющейся БДО компонентов 31 простых суждений 13 в третьей СД после выполнения этапа 106 (302). БДО представляет собой организованную структуру, созданную в соответствии с определёнными правилами, и предназначенную для хранения, изменения и обработки упомянутых данных. Данными БДО являются компоненты 31 простых суждений третьей СД, их идентификационные данные (значение 311 и номера 312), а также виды отношений 316 между сравниваемыми компонентами 31 простых суждений 13 третьей СД. БДО фактически является второй частью онтологической базы данных (ОБД), поскольку к уже существующим данным ОБД для компонента 31 просто добавляют новые данные о виде отношений компонента 31 с другим компонентом 31, которые получают путем сопоставления системных, а также семантических онтологических сведений о сравниваемых компонентах 31 (о связях между компонентами 31), содержащихся в ОБД. Таким образом, БДО является такая база данных, в которой элементы БД содержат информацию о различных видах отношений с другими элементами этой базы. При этом элементами БДО являются такие компоненты 31 простых суждений 13 третьей СД, которые установлены в карте отношений компонентов 31 простых суждений 13 в третьей СД. Формирование карты отношений компонентов 31 простых суждений 13 предпочтительно производят на этапе 1061 (3021) путем выполнения анализа критериев поиска искомых суждений. Критерии поиска искомых суждений формируют в связи и в рамках решения конкретной прикладной задачи поиска простых суждений 13 в третьей СД в конкретной предметной области. Эти критерии формируют на этапе поиска простых суждений в соответствии с требованиями поисковой задачи на основании формализованной модели простого суждения (то есть на известном перечне всех компонентов 31 формализованной модели простого суждения) и на указании контролируемых компонентов 31. Критерии поиска искомых суждений должны описывать контролируемые параметры 315 контролируемых компонентов 31 и их контролируемые значения 3151, а также условия (то есть сочетание контролируемых значений 3151 упомянутых параметров 315 у сравниваемых контролируемых компонентов 31), при которых можно сделать вывод о наличии тех или иных видов отношений 316 между сравниваемыми компонентами 31, актуальных для решения прикладной поисковой задачи, в ходе которой производится сравнение простых суждений 13. В результате такого анализа критериев поиска искомых суждений формируют карту отношений, в которой регистрируют выявленные в ходе упомянутого анализа: контролируемые компоненты 31; контролируемые системные и логические признаки (параметры) 315 этих компонентов 31; контролируемые значения 3151 этих параметров 315; виды отношений 316 сравниваемых компонентов 31 при установленных сочетаниях значений 3151 контролируемых параметров 315 сравниваемых компонентов 31. Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен специалистом-лингвистом с учетом знания специальной терминологии предметной области, в рамках которой производится поиск искомых простых суждений или же с помощью программного обеспечения. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью различных систем машинного обучения, в ом числе статистического процессора или нейросети. Классификацию вида отношений между сравниваемыми компонентами 31 простых суждений 13 третьей СД и регистрацию этого вида предпочтительно производят на этапе 1062 (3022) путем выполнения анализа данных сравниваемых компонентов 31, содержащихся в ОБД с учетом сведений из карты отношений компонентов 31 простых суждений 13. В ходе выполнения классификации последовательно выбирают все сочетания компонентов 31, которые указаны в карте отношений (то есть сочетания контролируемых компонентов 31). В соответствии с контролируемыми параметрами 315 и значениями 3151 указанных параметров, запрашивают в ОБД по выбранным компонентам 31 и получают все актуальные системные онтологические признаки 313 и их значения 3131, а также все актуальные семантические онтологические признаки 314 и из значения 3141. Полученные таким образом значения 3131 признаков 313 и значения 3141 признаков 314 компонентов 31 применяют в упомянутом процессе определения вида отношений для выявления вида отношений сравниваемых компонентов 31 простых суждений 13 третьей СД. Классифицированные таким образом виды отношений между компонентами 31 простых суждений 13 третьей СД регистрируют в качестве результата выполнения этапа 1062 (3022). Идентификационные данные сравниваемых компонентов 31 (значение 311 и номера 312) получают в результате упомянутого запроса в ОБД вместе с системными 313 и семантическими 314 онтологическими признаками. На основании произведенных на этапе 1062 (3022) классификации и регистрации вида отношений 316 между сравниваемыми компонентами 31 простых суждений 13 третьей СД на этапе 1063 (3023) формируют базу данных отношений в третьей СД, содержащей сравниваемые компоненты 31 простого суждения 13, виды отношений 316 сравниваемых компонентов 31 простых суждений 13 третьей СД, которые (компоненты) указаны в карте отношений компонентов 31 и являются актуальными контролируемыми компонентами 31 для решения прикладной поисковой задачи, в ходе которой производится сравнение простых суждений 13, а также идентификационные данные 311 и 312 сравниваемых компонентов 31. [0081] FIG. 24, by way of example, but not limitation, shows the general structure of the generated database of relations in the third SD (which is the source for the considered method 300), which is the BDO of the components 31 of simple judgments 13 in the third SD after the execution of step 106 (302). BDO is an organized structure created in accordance with certain rules and intended for storing, changing and processing the mentioned data. BDO data are components of 31 simple judgments of the third SD, their identification data (value 311 and numbers 312), as well as types of relationships 316 between the compared components of 31 simple judgments 13 of the third SD. BDO is actually the second part of the ontological database (OBD), since new data on the form of relations of component 31 with another component 31 is simply added to the already existing data of the OBD for component 31, which are obtained by comparing the system, as well as semantic ontological information about the compared components 31 (about the links between the components 31) contained in the HBS. Thus, BDO is such a database in which the elements of the database contain information about various types of relations with other elements of this base. In this case, the elements of the BDO are such components 31 of simple judgments 13 of the third SD, which are installed in the map of the relationship of components 31 of simple judgments 13 in the third SD. Formation of the relationship map of the components 31 of simple judgments 13 is preferably performed at step 1061 (3021) by performing an analysis of the search criteria for the desired judgments. The search criteria for the desired judgments are formed in connection and within the framework of solving a specific applied problem of finding simple judgments 13 in the third SD in a specific subject area. These criteria are formed at the stage of searching for simple judgments in accordance with the requirements of the search task on the basis of a formalized model of a simple judgment (that is, on a known list of all components 31 of a formalized model of a simple judgment) and on the indication of the controlled components 31. The search criteria for the sought judgments should describe the controlled parameters 315 controlled components 31 and their controlled values 3151, as well as conditions (that is, a combination of controlled values 3151 of the mentioned parameters 315 for the compared controlled components 31), under which it can be concluded that there are certain types of relationships 316 between the compared components 31 that are relevant for solving an applied search task, during which a comparison of simple judgments is made 13. As a result of such an analysis of the search criteria for the sought judgments, a relationship map is formed, in which the identified during the said analysis are registered: controlled components 31; controlled system and logical features (parameters) 315 of these components 31; monitored values 3151 of these parameters 315; types of ratios 316 of the compared components 31 at the established combinations of values 3151 of the monitored parameters 315 of the compared components 31. Such an analysis can be performed by any method known from the prior art and, accordingly, is not further described in detail. For example, but not limited to, such an analysis can be performed by a specialist linguist, taking into account the knowledge of the special terminology of the subject area, within which the search for the sought-for simple judgments is carried out, or with the help of software. Moreover, in the presence of a sufficient number of examples, it is possible to perform such an analysis using various machine learning systems, including a statistical processor or a neural network. Classification of the kind of relationship between compared components 31 simple judgments 13 of the third SD and registration of this type is preferably carried out at step 1062 (3022) by performing an analysis of the data of the compared components 31 contained in the HBS, taking into account information from the map of the relationship of components 31 of simple judgments 13. During the classification, all combinations of components are sequentially selected 31, which are indicated in the relationship map (that is, combinations of controlled components 31). In accordance with the monitored parameters 315 and the values 3151 of the specified parameters, the HBS is requested for the selected components 31 and all the actual system ontological features 313 and their values 3131 are obtained, as well as all the actual semantic ontological features 314 and from the value 3141. The values obtained in this way are 3131 features 313 and the values 3141 features 314 components 31 are used in the above-mentioned process of determining the type of relations to identify the type of relations of the compared components 31 of simple judgments 13 of the third SD. The thus classified types of relations between the components 31 of the simple judgments 13 of the third DA are recorded as the result of step 1062 (3022). The identification data of the compared components 31 (value 311 and numbers 312) is obtained as a result of the mentioned request in the HBS together with the system 313 and semantic 314 ontological features. Based on the classification and registration of the type of relations 316 between the compared components 31 of simple judgments 13 of the third SD, performed at step 1062 (3022), at step 1063 (3023), a database of relations is formed in the third SD containing the compared components 31 of a simple judgment 13, the types of relations 316 to be compared components 31 of simple judgments 13 of the third SD, which (components) are indicated in the map of the relationship of components 31 and are actual controlled components 31 for solving an applied search problem, during which simple judgments 13 are compared, as well as identification data 311 and 312 of the compared components 31.
[0082] На фиг. 25, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 107 (303) формирования четвертой структуры данных (являющейся итоговой СД для рассматриваемого способа 300) СМД. Этап 107 (303) характеризуется: выполнением этапа 1071 (3031) формирования последовательности действий для решения поисковой задачи (ПД), в ходе которого на основании предварительно заданных критериев поиска искомых суждений формируют упомянутую ПД; выполнением этапа 1072 (3032) идентификации и формирования первых и вторых элементов итоговой СД, на котором на основании сведений, содержащихся в БДО, идентифицируют и формируют элементы итоговой СД, являющиеся искомыми суждениями (ИС), а также идентификационные данные ИС; выполнением этапа 107В (3033) формирования итоговой СД, на котором формируют итоговую СД из сформированных ИС и их идентификационных данных. [0082] FIG. 25, by way of example and not limitation, a general flowchart of the steps of step 107 (303) of generating the fourth data structure (which is the final SD for the considered method 300) of the MD is shown. Step 107 (303) is characterized by: performing step 1071 (3031) of forming a sequence of actions for solving a search task (AP), during which, based on predetermined search criteria for the sought judgments, the mentioned PD; performing stage 1072 (3032) of identification and formation of the first and second elements of the final SD, on which, based on the information contained in the BDO, the elements of the final SD are identified and formed, which are the required judgments (IS), as well as the identification data of the IS; performing stage 107B (3033) of generating the final SD, at which the final SD is formed from the generated IS and their identification data.
[0083] На фиг. 26, в качестве примера, но не ограничения, изображена общая структура сформированной четвертой структуры данных, являющейся итоговой СД для рассматриваемого способа 300. Такая четвертая (итоговая) структура данных представляет собой СМД, содержащий элементы 14, которые представляют собой искомые суждения (ИС 14) и их идентификационные данные. Идентификационные данные ИС представляют собой в качестве примера, но не ограничения, значения 141 элементов 14 четвертой структуры данных СМД и порядковые номера 142 ТЭ лингвистического предложения 11, составляющих элементы 14. Элементы 14 четвертой структуры данных подразделяются на первые элементы 14 и вторые элементы 14. В зависимости от конкретной прикладной задачи поиска искомых суждений 14 в третьей СД в конкретной предметной области результатом решения поисковой задачи могут быть: первые элементы 14, либо вторые элементы 14, либо первые элементы 14 и вторые элементы 14 четвертой СД. Например, но не ограничиваясь, при решении прикладной задачи по поиску перечня правил (диспозиций правового акта, регулирующих что-либо), регулирующих поведение субъекта правоотношений, достаточно произвести только одно поисковое действие, чтобы найти первый элемент 14. Таким образом в ходе одной поисковой операции можно получить перечень простых суждений - правил, с помощью которых регулируется поведение данного субъекта. В качестве другого примера, но не ограничения, демонстрируется прикладная задача по поиску всех частей (гипотезы, диспозиции и санкции) норм-предписаний (правил, принципов, определений, содержащихся в тексте положений правовых актов), в рамках которой будут найдены первые элементы 14 и вторые элементы 14 четвертой СД, то есть реализованы два последовательных поисковых действия ПД. Первое поисковое действие ПД может быть реализовано путем поиска первых элементов 14, которые будут простыми суждениями, являющимися диспозициями или санкциями нормы-предписания. Второе поисковое действие ПД может быть реализовано путем поиска вторых элементов 14 которые будут простыми суждениями, являющимися обусловленностями правил (внешними условиями - гипотезами диспозиции или гипотезами санкции, при которых найденные правила считаются действующими), найденных в ходе предшествующей поисковой операции ПД. При этом, никакой связи между найденными диспозициями (с гипотезами) и санкциями (с гипотезами) может не быть, поскольку такая задача по поиску связей между найденными диспозициями и найденными санкциями не была поставлена. В качестве третьего примера, но не ограничения, демонстрируется похожая прикладная задача, в рамках которой будут найдены также первые элементы 14 и вторые элементы 14 четвертой СД. Однако в этом примере, в отличии от предыдущего примера, искомые правила (диспозиции и санкции) будут связаны друг с другом, т.е. отдельной диспозиции будет соответствовать отдельная санкции или санкции. Для такого поиска необходимо использовать три последовательных поисковых действия ПД (например, но не ограничиваясь, задача по поиску регулятивно-охранительных правовых норм). Первое поисковое действие ПД может быть реализовано путем поиска первых элементов 14, которые будут простыми суждениями, являющимися правилами-диспозициями. Второе поисковое действие ПД может быть реализовано путем поиска вторых элементов 14, которые будут простыми суждениями, являющимися правилами-санкциями (правилами, устанавливающими меру ответственности за нарушение уже найденных правил- диспозиций). Третье поисковое действие ПД может быть реализовано путем поиска также вторых элементов 14, которые будут простыми суждениями - гипотезами (обусловленностями для уже найденных диспозиций и обусловленностями для уже найденных санкций). На основании приведенных примеров, но не ограничений, можно представить разницу между первыми элементами 14 и вторыми элементами 14 четвертой СД. Первые элементы 14 четвертой структуры данных - это искомые суждения, полученные в результате первого (по порядку) поискового действия ПД в массиве простых суждений (третьей СД). Особенностью первого поискового действия ПД является то, что первое поисковое действие ПД технически ограничено контролируемыми данными, содержащимися в критериях поиска искомых суждений. Никакие иные контролируемые данные для ПД не присутствуют в ПД при первом поисковом действии. Вторые элементы 14 четвертой структуры данных - это искомые суждения, полученные в результате второго, третьего и всех последующих поисковых действий ПД, из которых состоит ПД, сформированный на основании критериев поиска искомых суждений. Упомянутые вторые, третьи и последующие поисковые действия ПД отличаются от упомянутого первого поискового действия ПД тем, что в таких задачах поиска используются не только контролируемые данные, содержащиеся в критериях поиска искомых суждений, но и дополнительные контролируемые данные (дополнительные данные, содержащихся в уже сформированных массивах искомых суждений четвертой СД). Например, но не ограничиваясь, при реализации второго поискового действия ПД технически возможно в качестве дополнительных контролируемых данных использовать уникальные номера первых элементов 14 и/или уже выявленных вторых элементов 14, то есть уже найденных искомых суждений (например, но не ограничиваясь, уникальные номера простых суждений-диспозиций), чтобы в ходе второго поискового действия ПД в массиве простых суждений (третьей СД) найти простые суждения, связанные с уже найденными простыми суждениями в ходе первого поискового действия ПД (например, но не ограничиваясь, найти простые суждения-гипотезы для уже найденных простых суждений-диспозиций на основании известных уникальных номеров уже найденных простых суждений- диспозиций). При этом, поисковой задачей является любая задача, связанная с анализом текстового материала в формате текста на естественном языке, представленного для анализа в форме текстового документа или текстового массива данных. Результатом такого анализа может быть любой отдельный компонент формализованной модели простого суждения, либо несколько указанных компонентов, либо простые суждения, либо группы простых суждений, что подробно описывается в упомянутых критериях поиска. В юридической предметной области в качестве примера, но не ограничения, можно привести следующие кейсы (ситуации, взятые из практики) поисковых задач: а) поиск норм-предписаний (правовых норм) для известного субъекта/ объекта правоотношений; б) поиск норм-предписаний (правовых норм) для известной (формально описанной) ситуации; в) поиск норм-предписаний (правовых норм) для известного субъекта/ объекта правоотношений в известной ситуации; г) поиск регулятивно-охранительных правовых норм (логических правовых норм) для известного субъекта/ объекта правоотношений; д) поиск регулятивно-охранительных правовых норм (логических правовых норм) для известного субъекта/ объекта правоотношений в известной ситуации; е) поиск норм-предписаний (правовых норм) по отдельному документу, части документа, группе документов; ж) поиск регулятивно-охранительных правовых норм (логических правовых норм) по отдельному документу, части документа, группе документов; з) поиск противоречий между нормами-предписаний (правовыми нормами); и) поиск противоречий в регулятивно-охранительных правовых нормах (логических правовых нормах); к) поиск противоречий между регулятивно- охранительными правовыми нормами (логическими правовыми нормами); л) поиск правовых пробелов для субъектов правоотношений; м) поиск правовых пробелов для объектов правоотношений; н) поиск норм-дефиниций по отдельному документу, части документа, группе документов; о) поиск норм-дефиниций указанного субъекта/объекта правоотношений, и тому подобные кейсы. У отдельных элементов 14 (первый элемент 14 или второй элемент 14) четвертой СД имеются характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 14 в качестве примера, но не ограничения могут именоваться как «ИС 1», «ИС 2», «ИС В», «ИС п», где n > 1 - порядковый номер элемента в четвертой СД. При этом, в качестве примера, но не ограничения искомые суждения 13 могут именоваться как «диспозиция», «санкция», «гипотеза» для юридической предметной области, и тому подобное для иных предметных областей. У групп элементов 14 четвертой СД (например, но не ограничиваясь, первый и второй элементы 14) имеются характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных такие группы элементов 14 в качестве примера, но не ограничения могут именоваться как «ГИС 1», «ГИС 2», «ГИС 3», «ГИС п», где «ГИС» - группа искомых суждения, a n > 1 - порядковый номер элемента в четвертой СД. При этом, в качестве примера, но не ограничения искомые суждения 14 (группы ИС 14) могут именоваться как «норма-предписание», «правовая норма» для юридической предметной области, и тому подобное для иных предметных областей. С лингвистической точки зрения элементы 14 (искомое суждение, вне зависимости от вида - первое или второе) это простое предложение. При этом возможны различные варианты простых предложений, которые могут считаться простыми суждениями, например, но не ограничиваясь данным примером, можно привести следующие виды простых предложений: 1) простые предложения в изначальном, непреобразованном виде; 2) простые предложения в преобразованном виде, например: а) без причастных или деепричастных оборотов: б) без однородностей (обезоднородненные, без рядов однородных членов); в) без вставок (без текста в скобках); г) без условных именований (без текста в кавычках); д) без обстоятельств (условий) и тому подобные, включая сочетания вышеуказанных и неуказанных видов. ИС 14 с логической точки зрения (вне зависимости от вида - первое или второе) - это простое суждение, то есть утверждение (простое утверждение) или опровержение о субъекте суждения. Искомое суждение, являясь простым суждением, представляет собой первичную логическую конструкцию мышления с помощью которой формируется и передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). ИС 14 (вне зависимости от вида - первое или второе), как простое суждение, с точки зрения отдельных предметных областей - это конструкция, описанная формализованной моделью простого суждения. Искомые суждения 14 четвертой структуры данных имеют идентификационные данные, в качестве примера, но не ограничения: значение 141 ИС и номер 142 ИС. Значением 141 ИС является набор значений итоговых текстовых элементов (компонентов простого суждения), составляющих искомое суждение 14 четвертой СД. Номером 142 ИС являются порядковые номера ТЭ 21, из которых сформированы значения 142, составляющие итоговое суждение 14 четвертой СД. Последовательность действий для решения поисковой задачи (ПД) формируется на основании критериев поиска искомых суждений для решения конкретной прикладной задачи в конкретной предметной области. ПД содержит сведения о поисковых действиях, которые необходимо провести для получения искомых суждений, а также содержит контролируемые данные (показатели и их значения), которые необходимо использовать для поисковых действий ПД. Идентификацию элементов 14 (искомых суждений) четвертой структуры данных СМД производят в ходе этапа 1072 (3032) путем выполнения поисковых действий в соответствии с ПД. При этом выполнение этапа 1072 (3032), на котором идентифицируют первые элементы 14 четвертой структуры данных, является обязательным действием по идентификации, а выполнение этапа 1072 (3032), на котором идентифицируют вторые элементы 14 четвертой структуры данных является дополнительными действиями, наличие и количество которых определяется содержанием ПД. Выполнение идентификации элементов 14 (искомых суждений) четвертой структуры данных СМД производят по двум основным сценариям в зависимости от содержания ПД, а именно от наличия операции сравнения (сопоставления, корреляции) простых суждений. Первый сценарий идентификации элементов 14 (искомых суждений) четвертой структуры данных СМД, не содержащий операции сравнения простых суждений, выполняется на этапе 1072 (3032) путем поиска значений показателей контролируемых данных (заданных в ПД) в массиве простых суждений (третьей СД). При наличии в массиве простых суждений (например, в третьей СД, являющейся исходной для рассматриваемого способа 300) искомых данных, которые соответствуют установленным значениям показателей контролируемых данных, происходит идентификация таких простых суждений как искомых суждений. Второй сценарий идентификации элементов 14 (искомых суждений) четвертой структуры данных СМД, содержащий операции сравнения простых суждений, выполняется на этапе 1072 (3032) путем поиска значений показателей контролируемых данных (заданных в ПД) в массиве простых суждений (третьей СД) и в ОБД с учетом сведений из БДО о наличии отношений определенного вида между компонентами простых суждений. При наличии в массиве простых суждений и в ОБД искомых данных, которые соответствуют установленным значениям показателей контролируемых данных, происходит идентификация таких простых суждений как предварительных искомых суждений. При этом, учитывая сведения полученные из БДО о наличии отношений определенного вида между компонентами простых суждений корректируют результат поиска путем сокращения числа предварительных искомых суждений, либо расширения числа предварительных искомых суждений за счет новых простых суждений, которые в соответствии со сведениями из БДО также могут считаться искомыми суждениями на основании наличия отношений соответствующего вида с предварительными искомыми суждениями. В качестве примера, но не ограничения, в качестве второго сценария идентификации элементов 14 (искомых суждений) четвертой структуры данных СМД можно привести пример интеллектуального поиска диспозиций (правил, устанавливающих права, обязанности, запреты и требования) для такого субъекта правоотношений как «покупатель». Применение второго сценария поиска позволит выявить диспозиции не только для субъекта «покупатель», но и одновременно (в рамках одного поискового действия ПД) также диспозиции для субъектов, поименованных иным образом, но фактически являющимися одним и тем же субъектом, например, но не ограничиваясь: «потребитель», «лицо, покупающее товар», «лицо, покупающее услугу», «услугополучатель», «получатель услуги», «товарополучатель», «получатель услуги», «заказчик». Формирование элементов 14 (искомых суждений) четвертой структуры данных СМД производят путем регистрации идентифицированных элементов 14 четвертой структуры данных, выявленных в ходе анализа элементов 13 (простых суждений) третьей структуры данных на этапе 1072. Идентификацию значения 141 элемента 4(искомого суждения) четвертой структуры данных в ходе этапа 1072 (3032) производят путем отождествления значения 141 элемента 14 (искомого суждения) четвертой структуры данных со значением 131 простого суждения 13 третьей структуры данных, с которым идентифицировано искомое суждение 14. Идентификацию номеров 142 элемента 14 (искомого суждения) четвертой структуры данных в ходе этапа 1072 (3032) производят путём отождествления номеров 142 элемента 14 (искомого суждения) четвертой структуры данных с номерами 132 простого суждения 1В третьей структуры данных, с которым идентифицировано искомое суждение 14. Такие идентификация и формирование могут быть выполнены любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такие идентификация и формирование могут быть выполнены традиционно специалистом- лингвистом, или же с помощью лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение таких идентификации и формирования с помощью различных систем машинного обучения, в том числе статистического процессора или нейросети. Формирование четвертой структуры данных СМД в ходе этапа 1073 (3033) производят путем объединения в одной структуре данных элементов 14 четвертой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. [0083] FIG. 26, by way of example, but not limitation, depicts the general structure of the formed fourth data structure, which is the final SD for the considered method 300. Such a fourth (final) data structure is an SDS containing elements 14 that represent the desired judgments (IS 14) and their identification data. The IS identification data is by way of example, and not limitation, the values 141 of elements 14 of the fourth data structure of the SMD and the sequence numbers 142 of the TE of the linguistic sentence 11 constituting elements 14. The elements 14 of the fourth data structure are subdivided into first elements 14 and second elements 14. B Depending on the specific applied problem of searching for the required judgments 14 in the third SD in a particular subject area, the result of solving the search problem can be: the first elements 14, or the second elements 14, or the first elements 14 and the second elements 14 of the fourth SD. For example, but not limited to, when solving an applied problem of finding a list of rules (dispositions of a legal act that regulate something) governing the behavior of the subject of legal relations, it is enough to perform only one search action to find the first element 14. Thus, in the course of one search operation you can get a list of simple judgments - the rules by which the behavior of a given subject is regulated. As another example, but not a limitation, an applied problem is demonstrated to find all parts (hypotheses, dispositions and sanctions) of prescription norms (rules, principles, definitions contained in the text of provisions of legal acts), within which the first elements 14 and the second elements 14 of the fourth SD, that is, two consecutive search actions of the PD are implemented. The first search action of the PD can be realized by searching for the first elements 14, which will be simple judgments, which are dispositions or sanctions of a norm-prescription. The second search action of the PD can be realized by searching for the second elements 14 which will be simple judgments, which are conditionality of the rules (external conditions - disposition hypotheses or sanction hypotheses under which the found rules are considered valid) found during the previous search operation of the PD. At the same time, there may be no connection between the found dispositions (with hypotheses) and sanctions (with hypotheses), since such a task of finding connections between the found dispositions and the found sanctions was not set. As a third example, but not limitation, a similar application is shown in which the first elements 14 and the second elements 14 of the fourth SD will also be found. However, in this example, in contrast to the previous example, the sought rules (dispositions and sanctions) will be related to each other, i.e. a separate disposition will have a separate sanction or sanction. For such a search, it is necessary to use three consecutive search actions of the PD (for example, but not limited to the task of finding regulatory and protective legal norms). The first search action of the PD can be realized by searching for the first elements 14, which will be simple judgments, which are disposition rules. The second search action of the PD can be realized by searching for the second elements 14, which will be simple judgments, which are rules-sanctions (rules that establish the measure of responsibility for violation of already found rules-dispositions). The third search action AP can be realized by searching also for the second elements 14, which will be simple judgments - hypotheses (conditions for already found dispositions and conditions for already found sanctions). Based on the above examples, but not limitation, you can imagine the difference between the first elements 14 and the second elements 14 of the fourth LED. The first elements 14 of the fourth data structure are the sought judgments obtained as a result of the first (in order) search action of the PD in the array of simple judgments (third SD). The peculiarity of the first search action of the PD is that the first search action of the PD is technically limited to the controlled data contained in the search criteria for the required judgments. No other controlled data for the PD is present in the PD at the first search action. The second elements 14 of the fourth data structure are the required judgments obtained as a result of the second, third and all subsequent search actions of the PD, which consists of the PD, formed on the basis of the search criteria for the sought judgments. The mentioned second, third and subsequent search actions of the PD differ from the mentioned first search action of the PD in that in such search tasks they use not only controlled data contained in the search criteria for the desired judgments, but also additional controlled data (additional data contained in the already formed arrays of the sought judgments of the fourth SD). For example, but not limited to, when implementing the second search action of PD, it is technically possible to use the unique numbers of the first elements 14 and / or already identified second elements 14 as additional controlled data, that is, the sought-for judgments already found (for example, but not limited to, the unique numbers of simple judgments-dispositions) in order to find simple judgments related to the simple judgments already found during the first search action of the AP in the array of simple judgments (third SD) during the second search action of the AP (for example, but not limited to, find simple judgments-hypotheses for already found simple judgments-dispositions based on the known unique numbers of already found simple judgments-dispositions). At the same time, a search task is any task associated with the analysis of textual material in the format of text in natural language, presented for analysis in the form of a text document or a textual data array. The result of such an analysis can be any individual component of a formalized model of a simple judgment, or several specified components, or simple judgments, or a group of simple judgments, which is described in detail in the mentioned search criteria. In the legal subject area, as an example, but not a limitation, the following cases (situations taken from practice) of search tasks can be cited: a) search for norms-prescriptions (legal norms) for a known subject / object of legal relations; b) search for norms-prescriptions (legal norms) for a known (formally described) situation; c) search for norms-prescriptions (legal norms) for a known subject / object of legal relations in a known situation; d) search for regulatory and protective legal norms (logical legal norms) for a known subject / object of legal relations; e) search for regulatory and protective legal norms (logical legal norms) for a known subject / object of legal relations in a known situation; f) search for norms-prescriptions (legal norms) for a separate document, part of a document, a group of documents; g) search for regulatory and protective legal norms (logical legal norms) for a separate document, part of a document, a group of documents; h) search for contradictions between prescription norms (legal norms); i) search for contradictions in regulatory and protective legal norms (logical legal norms); j) the search for contradictions between the regulatory protective legal norms (logical legal norms); k) search for legal gaps for the subjects of legal relations; l) search for legal gaps for objects of legal relations; m) search for norms-definitions for a separate document, part of a document, a group of documents; o) search for norms-definitions of the specified subject / object of legal relations, and similar cases. Individual elements 14 (first element 14 or second element 14) of the fourth SD have unique names (UN) that characterize them and have practical use. In the data structure, elements 14, by way of example, but not limitation, may be referred to as "IC 1", "IC 2", "IC B", "IC p", where n> 1 is the ordinal number of the element in the fourth LED. In this case, as an example, but not limitation, the sought judgments 13 can be referred to as "disposition", "sanction", "hypothesis" for a legal subject area, and the like for other subject areas. Groups of elements 14 of the fourth SD (for example, but not limited to the first and second elements 14) have unique names (UN) that characterize them and have practical use. In the data structure, such groups of elements 14 as an example, but not restrictions, can be referred to as "GIS 1", "GIS 2", "GIS 3", "GIS p", where "GIS" is the group of the sought judgments, an> 1 - the serial number of the element in the fourth CD. In this case, as an example, but not limitation, the sought judgments 14 (IP groups 14) can be referred to as "norm-prescription", "legal norm" for a legal subject area, and the like for other subject areas. From a linguistic point of view, elements 14 (the required judgment, regardless of the type - the first or the second) is a simple sentence. In this case, various options for simple sentences are possible, which can be considered simple judgments, for example, but not limited to this example, the following types of simple sentences can be cited: 1) simple sentences in their original, unconverted form; 2) simple sentences in a transformed form, for example: a) without participial or participial phrases: b) without homogeneities (non-homogeneous, without rows of homogeneous members); c) no inserts (no text in brackets); d) no conditional names (no text in quotes); e) without circumstances (conditions) and the like, including combinations of the above and unspecified types. IS 14 from a logical point of view (regardless of the type - the first or the second) is a simple judgment, that is, a statement (simple statement) or refutation about the subject of judgment. The sought judgment, being a simple judgment, is the primary logical structure of thinking with the help of which is formed and the idea is conveyed that something (the predicate of the judgment) is affirmed or refuted about the subject of the judgment (the subject of the judgment). IS 14 (regardless of the type - the first or the second), as a simple judgment, from the point of view of individual subject areas, is a construction described by a formalized model of a simple judgment. The sought judgments 14 of the fourth data structure have identification data, by way of example and not limitation: IC value 141 and IC number 142. The value 141 IS is a set of values of the final text elements (components of a simple judgment) that make up the sought judgment 14 of the fourth SD. Number 142 IS are serial numbers TE 21, from which the values 142 are formed, making up the final judgment 14 of the fourth SD. The sequence of actions for solving the search problem (PD) is formed on the basis of the search criteria for the required judgments for solving a specific applied problem in a specific subject area. The PD contains information about the search actions that must be carried out to obtain the desired judgments, and also contains controlled data (indicators and their values) that must be used for the search actions of the PD. The identification of the elements 14 (sought judgments) of the fourth data structure of the MDS is performed during step 1072 (3032) by performing search actions in accordance with the AP. In this case, the execution of step 1072 (3032), in which the first elements 14 of the fourth data structure are identified, is a mandatory identification action, and the execution of step 1072 (3032), in which the second elements 14 of the fourth data structure are identified, are additional actions, the presence and number of which is determined by the content of the PD. The identification of the elements 14 (sought judgments) of the fourth data structure of the SMD is carried out according to two main scenarios depending on the content of the PD, namely, on the presence of a comparison (comparison, correlation) operation of simple judgments. The first scenario for identifying elements 14 (required judgments) of the fourth data structure of the MDS, which does not contain the operation of comparing simple judgments, is performed at step 1072 (3032) by searching for the values of the indicators of the monitored data (specified in the PD) in the array of simple judgments (third SD). If there are simple judgments in the array (for example, in the third SD, which is the source for the considered method 300), the required data that correspond to the established values of the indicators of the controlled data, such simple judgments are identified as the sought judgments. The second scenario for identifying elements 14 (sought judgments) of the fourth data structure of the MDS, containing operations for comparing simple judgments, is performed at step 1072 (3032) by searching for the values of the indicators of the controlled data (specified in the PD) in the array of simple judgments (third SD) and in the HBS, taking into account information from the BDO about the presence of relations of a certain type between the components of simple judgments. In the presence of the required data in the array of simple judgments and in the HBS, which correspond to the established values of the indicators of the controlled data, such simple judgments are identified as preliminary sought judgments. At the same time, taking into account the information obtained from the BDO about the presence of relations of a certain type between the components of simple judgments, they correct the search result by reducing the number of preliminary sought judgments, or expanding the number of preliminary sought judgments due to new simple judgments, which, in accordance with information from the BDO, can also be considered the desired ones. judgments based on the existence of a relationship of the appropriate type with the preliminary sought judgments. As an example, but not limitation, as a second scenario for identifying elements 14 (sought judgments) of the fourth data structure of the MDS, we can give an example of an intelligent search for dispositions (rules establishing rights, obligations, prohibitions and requirements) for such a subject of legal relations as a "buyer". The application of the second search script will allow to identify dispositions not only for the “buyer” subject, but also simultaneously (within the framework of one search action of the PD) also dispositions for subjects named in a different way, but in fact are the same subject, for example, but not limited to: “Consumer”, “person who buys goods”, “person who buys the service”, “service recipient”, “recipient of the service”, “recipient”, “recipient of the service”, “customer”. The formation of elements 14 (required judgments) of the fourth data structure of the MDS is performed by registering the identified elements 14 of the fourth data structure, identified during the analysis of elements 13 (simple judgments) of the third data structure at step 1072. Identification of the value 141 of element 4 (required judgment) of the fourth data structure during step 1072 (3032) produced by identifying the value 141 of the element 14 (the required judgment) of the fourth data structure with the value 131 of the simple judgment 13 of the third data structure with which the sought judgment 14 is identified. Identification of the numbers 142 of the element 14 (the required judgment) of the fourth data structure during stage 1072 (3032) produced by identifying the numbers 142 of element 14 (the required judgment) of the fourth data structure with numbers 132 of the simple judgment 1B of the third data structure with which the sought judgment 14 is identified. Such identification and generation can be performed by any method known from the prior art and, accordingly, will not be described in detail hereinafter. For example, but not limited to, such identification and shaping can be performed conventionally by a linguist, or by a linguistic (syntactic) processor. Moreover, in the presence of a sufficient number of examples, it is possible to perform such identification and formation using various machine learning systems, including a statistical processor or a neural network. The formation of the fourth data structure of the MDS during step 1073 (3033) is performed by combining in one data structure the elements 14 of the fourth data structure of the MDS and their identification data according to known from the prior art principles and methods, which, accordingly, are not further described in detail.
[0084] На фиг. 27, в качестве примера, но не ограничения, проиллюстрирована примерная схема системы 400 преобразования структурированного массива данных, которая в предпочтительном варианте реализации содержит, по меньшей мере, одно или более компьютерных устройств 401 преобразования структурированного массива данных, содержащих, по меньшей мере, один или более процессоров 4011 и память 4012. Упомянутые устройства 401 преобразования структурированного массива данных могут представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет и тому подобное. Память (машиночитаемый носитель данных) 4012 устройства 401 преобразования структурированного массива данных, содержит код программы, который при выполнении побуждает упомянутые один или более процессоры 4011 упомянутого устройства 401 выполнять действия описанных ранее способов преобразования структурированного массива данных. В некоторых случаях компьютерное устройство 401 может представлять собой серверное компьютерное устройство, связанное с пользовательским компьютерным устройством, выполненным с возможностью передачи серверному компьютерному устройству 401 команды или команд, побуждающих процессор или процессоры 4011 серверного компьютерного устройства выполнять код программы, который при выполнении процессором или процессорами серверного компьютерного устройства 4011 побуждает процессор или процессоры 4011 серверного компьютерного устройства выполнять действия какого-либо из описанных ранее способов преобразования структурированного массива данных. Пользовательское компьютерное устройство 402 может представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет, тонкий клиент и тому подобное. Пользовательское компьютерное устройство 402 может быть связано с серверным компьютерным устройством 401 посредством проводного или беспроводного соединения. Упомянутая память 4012 компьютерного устройства 401 (серверного компьютерного устройства 401) содержит подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, а также может содержать любую из описанных ранее структур данных для какого-либо из описанных ранее способов преобразования структурированного массива данных. Более того, подлежащие преобразованию один или несколько структурированных массивов данных могут являться загружаемыми и храниться, в частности, в базе данных 403 системы преобразования структурированного массива данных. В качестве примера, но не ограничения, машиночитаемый носитель данных (память 4012) может включать в себя оперативную память (RAM); постоянное запоминающее устройство (ROM); электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM); флэш-память или другие технологии памяти; CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для кодирования требуемой информации, и к которому может быть осуществлен доступ посредством устройства 401. Память включает в себя носитель данных на основе запоминающего устройства компьютера в форме энергозависимой или энергонезависимой памяти, или их комбинации. Примерные аппаратные устройства включают в себя твердотельную память, накопители на жестких дисках, накопители на оптических дисках и так далее. В памяти хранится примерная среда, в которой при помощи компьютерных команд или кодов, хранящихся в памяти устройства, может быть осуществлена процедура преобразования структурированного массива данных. Устройство содержит один или более процессоров 4011, которые предназначены для выполнения компьютерных команд или кодов, хранящихся в памяти устройства с целью обеспечения выполнения процедуры преобразования структурированного массива данных. Компьютерные команды или коды, хранящиеся в памяти, предназначены для выполнения преобразования структурированного массива данных. Система 400 также может включать в себя базу данных (БД) 403. БД 403 может представлять собой, но не ограничиваясь: иерархическую БД, сетевую БД, реляционную БД, объектную БД, объектно-ориентированную БД, объектно-реляционную БД, пространственную БД, комбинацию перечисленных двух и более БД, и тому подобное. БД 403 хранит данные в памяти, которая может представлять собой, но не ограничиваясь: постоянное запоминающее устройство (ROM), электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для хранения требуемой информации, и к которому может быть осуществлен доступ посредством устройства 401 преобразования структурированного массива данных. БД 403 служит для хранения данных, представляющих собой, по меньшей мере, команды для выполнения этапов описанных ранее способов преобразования структурированного массива данных; подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, или одну из описанных ранее исходных для какого-либо способа преобразования структур данных, которые могут быть загружены в память 4012 устройства 401 преобразования структурированного массива данных; и других данных, необходимых для функционирования системы. Примерная система 400 преобразования структурированного массива данных дополнительно может содержать серверное компьютерное устройство 401, которое помимо описанных ранее функций, сохраняет и содействует манипуляции компьютерными командами или кодами, ранее описанными в данном документе, которые, соответственно, дополнительно не описываются. Серверное компьютерное устройство 401, помимо описанных ранее функций, может обеспечивает регулирование обменом данных в системе 400 преобразования структурированного массива данных, а также обеспечивает обработку данных при условии подключения к нему одного или более чем одного пользовательских компьютерных устройств 402. В этом случае все вычислительные мощности, необходимые для обеспечения выполнения процедуры преобразования структурированного массива данных, расположены на серверном компьютерном устройстве 401. Система 400 так же может содержать одну или более сетей 404 передачи данных. Сети 404 передачи данных могут включать в себя, но не ограничиваться, одну или более локальных сетей (LAN) и/или глобальных сетей (WAN), или могут представлять собой информационно-телекоммуникационную сеть Интернет, или Интранет, или виртуальную частную сеть (VPN), или их комбинацию, и тому подобное. Серверное компьютерное устройство 401 также имеет возможность обеспечивать виртуальную вычислительную среду (Virtual Machine) для обеспечения взаимодействия между пользовательским компьютерным устройством 402 и БД 403. Сеть 404 служит для обеспечения взаимодействия между компьютерным устройством 401, базой данных 403 и пользовательским компьютерным устройством 402 системы 400 преобразования структурированного массива данных. При этом пользовательское компьютерное устройство 402 может быть связано с серверным компьютерным устройством 401 напрямую, используя известные из уровня техники проводные и беспроводные способы и методы связи, которые, соответственно, далее не подробно не описываются. Упомянутые устройства 401, 402, в качестве примера, но не ограничения, могут быть снабжены устройствами ввода-вывода (i/o), пригодными для предоставления пользователю результатов выполнения тех или иных описанных ранее этапов какого-либо из заявленных способов 100, 200 или 300. [0084] FIG. 27 illustrates, by way of example and not limitation, an exemplary diagram of a structured data conversion system 400, which in a preferred embodiment comprises at least one or more structured data conversion computing devices 401 comprising at least one or more processors 4011 and memory 4012. Said structured data conversion devices 401 may be, but are not limited to: personal computer, laptop, tablet computer, pocket computer, smartphone, phablet, and the like. The memory (computer-readable medium) 4012 of the structured data conversion apparatus 401 contains program code that, when executed, causes said one or more processors 4011 of said device 401 to perform the actions of the previously described structured data conversion methods. In some cases, the computing device 401 may be a server computing device associated with a user computing device configured to send commands or commands to the server computing device 401 causing the processor or processors 4011 of the server computing device to execute program code that, when executed by the processor or processors of the server computing device. the computing device 4011 causes the processor or processors 4011 of the server computing device to perform any of the previously described methods transformation of a structured data array. The user computing device 402 may be, but is not limited to: a personal computer, a laptop computer, a tablet computer, a handheld computer, a smartphone, a phablet, a thin client, and the like. The user computing device 402 may communicate with the server computing device 401 via a wired or wireless connection. Said memory 4012 of the computer device 401 (server computer device 401) contains one or more structured data arrays to be converted containing at least a linguistic sentence, and may also contain any of the previously described data structures for any of the previously described conversion methods. structured data array. Moreover, the one or more structured data sets to be converted can be downloadable and stored, in particular, in the database 403 of the structured data set conversion system. By way of example, and not limitation, a computer-readable storage medium (memory 4012) may include random access memory (RAM); read only memory (ROM); Electrically Erasable Programmable Read Only Memory (EEPROM); flash memory or other memory technologies; CDROM, digital versatile disk (DVD), or other optical or holographic storage media; magnetic cassettes, magnetic tape, magnetic disk storage or other magnetic storage devices, carrier waves, or other storage medium that can be used to encode desired information and can be accessed by device 401. Memory includes storage medium based on computer storage in the form of volatile or nonvolatile memory, or a combination thereof. Exemplary hardware devices include solid state memory, hard drives, optical drives, and so on. The memory stores an exemplary environment in which, using computer instructions or codes stored in the memory of the device, a structured data set transformation procedure can be performed. The device contains one or more processors 4011, which are designed to execute computer instructions or codes stored in the memory of the device in order to perform the procedure for transforming the structured data array. Computer commands or codes stored in memory are designed to performing transformation of a structured data array. System 400 may also include a database (DB) 403. DB 403 may be, but is not limited to: hierarchical DB, network DB, relational DB, object DB, object-oriented DB, object-relational DB, spatial DB, combination listed two or more databases, and the like. The OBD 403 stores data in memory, which may be, but is not limited to: read only memory (ROM), electrically erasable programmable read only memory (EEPROM), flash memory, CDROM, digital versatile disk (DVD) or other optical or holographic data carriers; magnetic cassettes, magnetic tape, magnetic disk storage or other magnetic storage devices, waveforms, or other storage medium that can be used to store desired information and can be accessed by structured data converter 401. The DB 403 serves to store data representing at least instructions for performing the steps of the previously described methods for transforming a structured data array; to be converted one or more structured data arrays containing at least a linguistic sentence, or one of the previously described initial data structures for any method of transformation, which can be loaded into the memory 4012 of the device 401 transformation of the structured data array; and other data necessary for the functioning of the system. The exemplary structured data conversion system 400 may further comprise a server computing device 401 that, in addition to the previously described functions, stores and facilitates the manipulation of computer instructions or codes previously described herein, which, accordingly, are not further described. The server computer device 401, in addition to the previously described functions, can provide regulation of data exchange in the structured data conversion system 400, and also provides data processing provided that one or more user computer devices 402 are connected to it. In this case, all the computing power, necessary to ensure the execution of the procedure for transforming the structured data array are located on the server computer device 401. System 400 may also contain one or more transmission networks 404 data. Data networks 404 may include, but are not limited to, one or more local area networks (LANs) and / or wide area networks (WANs), or may be the Internet, or an Intranet, or virtual private network (VPN). , or a combination thereof, and the like. The server computing device 401 also has the ability to provide a virtual computing environment (Virtual Machine) for providing interaction between the user computing device 402 and the database 403. The network 404 serves to provide communication between the computing device 401, the database 403, and the user computing device 402 of the structured transformation system 400. data array. In this case, the user computing device 402 can be directly connected to the server computing device 401 using wired and wireless communication methods known from the prior art, which, accordingly, are not further described in detail. The said devices 401, 402, by way of example and not limitation, may be equipped with input / output (i / o) devices suitable for providing a user with the results of performing certain previously described steps of any of the claimed methods 100, 200, or 300 ...
[0085] Настоящее описание осуществления заявленного изобретения демонстрирует лишь частные варианты осуществления и не ограничивает иные варианты реализации заявленного изобретения, поскольку возможные иные альтернативные варианты осуществления заявленного изобретения, не выходящие за пределы объема информации, изложенной в настоящей заявке, должны быть очевидными для специалиста в данной области техники, имеющим обычную квалификацию, на которого рассчитано заявленное изобретение. [0085] The present description of the implementation of the claimed invention demonstrates only particular embodiments and does not limit other embodiments of the claimed invention, since possible other alternative embodiments of the claimed invention, which do not go beyond the scope of information set forth in this application, should be obvious to a person skilled in this technical field of ordinary skill for which the claimed invention is designed.

Claims

Формула изобретения Claim
1. Исполняемый процессором или процессорами компьютерного устройства способ преобразования структурированного массива данных (СМД), содержащего лингвистические предложения (ЛП), заключающийся в: выполнении этапа 101 формирования первой структуры данных (СД), на котором формируют первую СД СМД, содержащую элементы упомянутой первой СД, причем упомянутые элементы первой СД представляют собой текстовые элементы (ТЭ) лингвистического предложения, а также идентификационные данные ТЭ, представляющие собой в качестве примера, но не ограничения: значения ТЭ и порядковые номера ТЭ в лингвистическом предложении; выполнении этапа 102 формирования базы данных лингво-логических признаков (БДЛЛП), на котором на основании сведений, содержащихся в первой СД, выявляют лингвистические и логические признаки ТЭ лингвистического предложения, из которых формируют базу данных, представляющую собой базу данных лингвистических и логических признаков текстовых элементов лингвистического предложения; выполнении этапа 103 формирования второй СД, на котором на основании сведений, содержащихся в БДЛЛП, первой СД, а также на основании формализованной модели простого суждения, формируют вторую СД СМД, содержащую элементы упомянутой второй СД, причем упомянутые элементы второй СД представляют собой компоненты простых суждений (КПС), а также идентификационные данные КПС, представляющие собой в качестве примера, но не ограничения: значения КПС и порядковые номера ТЭ лингвистического предложения, составляющих КПС; выполнении этапа 104 формирования третьей СД, на котором на основании сведений, содержащихся в БДЛЛП, второй СД, а также на основании формализованной модели простого суждения, формируют третью СД СМД, содержащую элементы упомянутой третьей СД, причем упомянутые элементы третьей СД представляют собой простые суждения (ПС) лингвистического предложения, а также идентификационные данные ПС, представляющие собой в качестве примера, но не ограничения: значения ПС и порядковые номера ТЭ лингвистического предложения, составляющих ПС. выполнении этапа 105 формирования онтологической базы данных системных и семантических связей в третьей СД, на котором на основании сведений, содержащихся в БДЛЛП, второй СД и третьей СД, а также на основании критериев поиска системных и семантических однородностей, выявляют и регистрируют системные и семантические связи между компонентами ПС, из которых формируют онтологическую базу данных системных и семантических связей компонентов ПС в третьей СД (ОБД); выполнении этапа 106 формирования базы данных отношений в третьей СД, на котором на основании сведений, содержащихся в ОБД, а также на основании критериев поиска искомых суждений, сравнивают компоненты ПС, а также классифицируют и регистрируют виды отношений между сравниваемыми компонентами ПС, из которых формируют базу данных отношений компонентов ПС в третьей СД (БДО); выполнении этапа 107 формирования итоговой СД, на котором на основании сведений, содержащихся в БДО, третьей СД, а также на основании упомянутых критериев поиска искомых суждений, формируют итоговую СД, содержащую элементы итоговой СД, причем упомянутые элементы итоговой СД представляют собой искомые суждения (ИС), а также идентификационные данные ИС, представляющие собой в качестве примера, но не ограничения: значения ИС и порядковые номера первичных текстовых элементов (ПТЭ) лингвистического предложения, составляющих ИС. 1. Executed by a processor or processors of a computer device, a method for transforming a structured data array (MDS) containing linguistic sentences (LP), which consists in: performing stage 101 of the formation of the first data structure (SD), on which the first SD SD is formed, containing elements of the said first SD , and the mentioned elements of the first SD are text elements (TE) of a linguistic sentence, as well as identification data of TE, which are, by way of example, but not limitation: TE values and serial numbers of TE in a linguistic sentence; performing stage 102 of the formation of a database of linguistic and logical signs (BDLLP), on which, based on the information contained in the first SD, linguistic and logical signs of TE of a linguistic sentence are identified, from which a database is formed, which is a database of linguistic and logical signs of text elements linguistic proposal; performing the stage 103 of the formation of the second SD, on which, based on the information contained in the BDLLP, the first SD, as well as on the basis of a formalized model of a simple judgment, a second SD SD is formed containing elements of the said second SD, and the mentioned elements of the second SD are components of simple judgments (KPS), as well as the identification data of the KPS, which are, by way of example, but not limitation: the values of the KPS and the serial numbers of the TE of the linguistic sentence that make up the KPS; performing stage 104 of the formation of the third SD, on which, based on the information contained in the BDLLP, the second SD, as well as on the basis of a formalized model of a simple judgment, form a third SD SD, containing elements of the said third SD, and the mentioned elements of the third SD are simple judgments ( PS) of the linguistic sentence, as well as the identification data of the PS, which are, as an example, but not limitation: the values of the PS and the serial numbers of the TE of the linguistic sentence that make up the PS. performing stage 105 of the formation of an ontological database of system and semantic links in the third SD, on which, based on the information contained in the BDLLP, the second SD and the third SD, as well as on the basis of the search criteria for system and semantic homogeneities, identify and register the systemic and semantic links between the components of the PS, from which they form an ontological database of the system and semantic relationships of the components of the PS in the third SD (OBD); performing stage 106 of forming a database of relations in the third SD, on which, based on the information contained in the HBS, as well as on the basis of the search criteria for the sought judgments, the components of the PS are compared, and also the types of relations between the compared components of the PS are classified and recorded, from which the base is formed data of the relations of the components of the PS in the third SD (BDO); performing stage 107 of the formation of the final SD, on which, based on the information contained in the BDO, the third SD, and also on the basis of the mentioned search criteria for the sought judgments, the final SD is formed containing the elements of the final SD, and the mentioned elements of the final SD are the sought judgments (IS ), as well as the identification data of the IS, which are, by way of example, but not limitation: the values of the IS and the ordinal numbers of the primary text elements (PTE) of the linguistic sentence that make up the IS.
2. Способ по п. 1, характеризующийся тем, что этап 101 характеризуется: выполнением этапа 1011 идентификации исходной структуры данных СМД, на котором идентифицируют элементы исходной структуры данных СМД, являющиеся лингвистическими предложениями (ЛП); выполнением этапа 1012 идентификации элементов первой структуры данных СМД, на котором идентифицируют элементы первой структуры данных СМД, являющиеся первичными текстовыми элементами (ПТЭ) лингвистического предложения, а также идентификационные данные ПТЭ, представляющие собой в качестве примера, но не ограничения значения ПТЭ и порядковые номера ПТЭ в лингвистическом предложении, и формируют первую структуру данных СМД. 2. The method according to claim 1, characterized in that step 101 is characterized by: performing step 1011 of identifying the original data structure of the MDS, which identifies the elements of the original data structure of the MDS, which are linguistic sentences (LP); performing step 1012 of identifying the elements of the first data structure of the MDS, which identifies the elements of the first data structure of the MDS, which are the primary text elements (PTE) of the linguistic sentence, as well as the identification data of the PTE, which are, as an example, but not limitation, the values of PTE and the serial numbers of the PTE in a linguistic sentence, and form the first data structure of the MDS.
В. Способ по п. 1, характеризующийся тем, что этап 102 характеризуется: выполнением этапа 1021 формирования первой части лингво-логических признаков ПТЭ лингвистического предложения, на котором для лингвистического анализа ПТЭ, содержащихся в первой СД и классифицированных как слово, предоставляют идентификационные данные ПТЭ и получают лингвистические характеристики ПТЭ, а также значения упомянутых лингвистических характеристик; выполнением этапа 1022 формирования второй части лингво-логических признаков ПТЭ лингвистического предложения, на котором для логического анализа ПТЭ, содержащихся в первой СД и классифицированных как слово, предоставляют идентификационные данные ПТЭ, а также лингвистические характеристики ПТЭ лингвистического предложения вместе с упомянутыми значениями лингвистических характеристик, и получают логические характеристики ПТЭ лингвистического предложения, а также значения упомянутых логических характеристик; выполнением этапа 1023 формирования базы данных лингво-логических признаков (БД 1 1П), на котором формируют БДЛЛП первичных текстовых элементов лингвистического предложения, при этом лингво-логическими признаками ПТЭ являются все полученные по соответствующему ПТЭ в ходе этапов 1021 и 1022 упомянутые лингвистические характеристики и упомянутые логические характеристики, обладающие соответствующими упомянутыми значениями лингвистических характеристик и упомянутыми значениями логических характеристик. B. The method according to claim 1, characterized in that step 102 is characterized by: performing step 1021 of the formation of the first part of the linguo-logical features of the PTE of the linguistic sentence, in which the identification data of the PTE is provided for linguistic analysis of the PTE contained in the first SD and classified as a word and get the linguistic characteristics of the PTE, as well as the values of the said linguistic characteristics; performing stage 1022 of the formation of the second part of the linguo-logical features of the PTE of the linguistic sentence, in which, for the logical analysis of the PTE, contained in the first CD and classified as a word, provide the identification data of the PTE, as well as the linguistic characteristics of the PTE of the linguistic sentence together with the mentioned values of the linguistic characteristics, and obtain the logical characteristics of the PTE of the linguistic sentence, as well as the values of the said logical characteristics; the execution of stage 1023 of the formation of a database of linguistic and logical signs (DB 1 1P), on which the BDLP of the primary text elements of the linguistic sentence are formed, while the linguistic and logical signs of the TER are all the above-mentioned linguistic characteristics and the mentioned logical characteristics having corresponding said linguistic characteristic values and said logical characteristic values.
4. Способ по п. 1, характеризующийся тем, что этап 103 характеризуется: выполнением этапа 1031, формирования элементов второй СД, на котором на основании сведений, содержащихся в БДЛЛП, первой СД, а также на основании формализованной модели простого суждения, идентифицируют и формируют элементы второй СД, являющиеся КПС, а также идентификационные данные КПС, представляющие собой в качестве примера, но не ограничения значения КПС и порядковые номера ПТЭ в лингвистическом предложении, составляющих КПС; выполнением этапа 1032 формирования второй СД, на котором формируют вторую СД из идентифицированных КПС и их идентификационных данных. 4. The method according to claim 1, characterized in that step 103 is characterized by: performing step 1031, forming the elements of the second SD, on which, based on the information contained in the BDLLP, the first SD, as well as on the basis of a formalized model of a simple judgment, identify and form elements of the second SD, which are the KPS, as well as the identification data of the KPS, which are, as an example, but not a limitation of the meaning of the KPS and the serial numbers of the PTE in the linguistic sentence that make up the KPS; performing step 1032 of generating the second LED, which generates the second LED from the identified CPS and their identification data.
5. Способ по п. 1, характеризующийся тем, что этап 104 характеризуется: выполнением этапа 1041 формирования элементов третьей СД, на котором на основании сведений, содержащихся в БДЛЛП и второй СД, из сформированных КПС в соответствии с формализованной компонентной моделью простого суждения формируют элементы третьей СД, являющиеся простыми суждениями (ПС), а также идентификационные данные ПС, представляющие собой в качестве примера, но не ограничения значения ПС и порядковые номера ПТЭ в лингвистическом предложении, составляющих ПС; выполнением этапа 1042 формирования третьей СД, на котором формируют третью СД из сформированных ПС и их идентификационных данных 5. The method according to claim 1, characterized in that step 104 is characterized by: performing step 1041 of forming the elements of the third SD, on which, based on the information contained in the BDLLP and the second SD, the elements are formed from the generated CPS in accordance with the formalized component model of a simple judgment. the third SD, which are simple judgments (PS), as well as the identification data of the PS, which are, as an example, but not limitation, the values of the PS and the serial numbers of the PTE in the linguistic sentence that make up the PS; performing the step 1042 of the formation of the third SD, at which the third SD is formed from the generated PS and their identification data
6. Способ по п. 1, характеризующийся тем, что этап 105 характеризуется: выполнением этапа 1051 идентификации системных связей между КПС на основании сведений, содержащихся в БДЛ/1П, второй СД и третьей СД, а также на основании критериев поиска системных однородностей, и регистрации выявленных связей в качестве системных онтологических признаков (СсОП) и значений СсОП; выполнением этапа 1052 идентификации семантических связей между КПС на основании сведений, содержащихся в БДЛЛП, второй СД и третьей СД, а также на основании критериев поиска семантических однородностей и регистрации выявленных связей в качестве семантических онтологических признаков (СмОП) и значений СмОП; выполнением этапа 1053 формирования онтологической базы данных системных и семантических связей в третьей СД, на котором формируют ОБД путем объединения всех выявленных онтологических признаков (СсОП и СмОП) компонентов простых суждений в третьей СД, при этом СсОП и СмОП являются всеми идентифицированными и зарегистрированными по каждому соответствующему компоненту простого суждения онтологическими признаками (СсОП и СмОП), обладающими соответствующими значениями СсОП и СмОП 6. The method according to claim 1, characterized in that step 105 is characterized by: performing stage 1051 identifying system links between the CPS based on the information contained in the BDL / 1P, the second SD and the third SD, as well as based on the search criteria for system homogeneities, and registering the identified links as system ontological features (SOS) and SOS values; performing stage 1052 of identifying semantic links between the CPS based on the information contained in the BDLLP, the second SD and the third SD, as well as based on the search criteria for semantic homogeneities and registration of the identified links as semantic ontological features (SOM) and SOM values; performing stage 1053 of forming an ontological database of system and semantic links in the third SD, on which the OBD is formed by combining all the identified ontological features (SSOP and SMOP) of the components of simple judgments in the third SD, while the SSOP and SMOP are all identified and registered for each corresponding the component of simple judgment with ontological features (SOP and SOP), which have the corresponding values of SOC and SOM
7. Способ по п. 1, характеризующийся тем, что этап 106 характеризуется: выполнением этапа 1061 формирования карты отношений компонентов простых суждений (КПС) в третьей СД на основании упомянутых критериев поиска искомых суждений; выполнением этапа 1062 классификации на основании сведений, содержащихся в ОБД, и регистрации видов отношений между сравниваемыми КПС третьей СД и регистрации соответствующих видов отношений в качестве выводов по результатам сопоставления системных и семантических онтологических сведений о сравниваемых КПС; выполнением этапа 1063 формирования базы данных отношений в третьей СД, на котором формируют БДО компонентов простых суждений исходной СД путем объединения всех классифицированных и зарегистрированных отношений между сравниваемыми КПС третьей СД. 7. The method according to claim 1, characterized in that step 106 is characterized in that step 106 is characterized by: performing step 1061 of generating a map of relations of components of simple judgments (CPS) in the third SD based on said search criteria for sought judgments; performing stage 1062 classification based on the information contained in the HBS, and registering the types of relations between the compared CPS of the third SD and registering the corresponding types of relations as conclusions based on the results of comparing the system and semantic ontological information about the compared CPS; performing stage 1063 of forming a database of relations in the third SD, at which the BDO of the components of simple judgments of the original SD is formed by combining all classified and registered relations between the compared CPS of the third SD.
8. Способ по п. 1, характеризующийся тем, что этап 107 характеризуется: выполнением этапа 1071 формирования последовательности действий для решения поисковой задачи (ПД), в ходе которого на основании предварительно заданных критериев поиска искомых суждений формируют упомянутую ПД; выполнением этапа 1072 идентификации и формирования первых и вторых элементов итоговой СД, на котором на основании сведений, содержащихся в БДО, идентифицируют и формируют элементы итоговой СД, являющиеся искомыми суждениями (ИС), а также идентификационные данные ИС, представляющие собой в качестве примера, но не ограничения значения ИС и порядковые номера ПТЭ лингвистического предложения, составляющих ИС; выполнением этапа 1073 формирования итоговой СД, на котором формируют итоговую СД из сформированных ИС и их идентификационных данных. 8. The method according to claim 1, characterized in that step 107 is characterized by: performing step 1071 of generating a sequence of actions for solving a search problem (PD), during which, based on predetermined search criteria for the sought judgments, said PD is generated; performing stage 1072 of identification and formation of the first and second elements of the final SD, on which, based on the information contained in the BDO, the elements of the final SD are identified and formed, which are the required judgments (IS), as well as the identification data of the IS, which are an example, but not limiting the value of the IS and the serial numbers of the PTE of the linguistic sentence that make up the IS; performing stage 1073 of the formation of the final SD, at which the final SD is formed from the generated IS and their identification data.
9. Компьютерное устройство для преобразования структурированного массива данных (СМД), содержащего лингвистические предложения (ЛП), содержащее, по меньшей мере: процессор компьютерного устройства, и память, содержащую код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 1-8. 9. A computer device for transforming a structured data array (SDM) containing linguistic sentences (LP) containing at least: a processor of a computer device, and a memory containing a program code, which, when executed by a processor of a computer device, causes the processor of a computer device to perform the actions of the method according to any one of paragraphs. 1-8.
10. Система для преобразования структурированного массива данных (СМД), содержащего лингвистические предложения ( П), содержащая, по меньшей мере: серверное компьютерное устройство, являющееся компьютерным устройством по п. 9, и пользовательское компьютерное устройство, выполненное с возможностью передачи серверному компьютерному устройству команды или команд, побуждающих процессор серверного компьютерного устройства выполнять код программы, который при выполнении процессором серверного компьютерного устройства побуждает процессор серверного компьютерного устройства выполнять действия способа по любому из п.п. 1-8. 10. A system for transforming a structured data array (SDM) containing linguistic sentences (P), containing at least: a server computer device, which is a computer device according to claim 9, and a user computer device configured to transmit commands to the server computer device or commands that cause the processor of the server computer device to execute program code that, when executed by the processor of the server computer device, causes the processor of the server computer device to perform the method of any one of claims. 1-8.
11. Машиночитаемый носитель данных, содержащий код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 1-8. 11. A computer-readable storage medium containing program code that, when executed by a processor of a computer device, causes the processor of a computer device to perform the actions of the method according to any one of claims. 1-8.
12. Исполняемый процессором или процессорами компьютерного устройства способ формирования структуры данных, содержащей простые суждения, для использования в способе по любому из п.п. 1-8, заключающийся в: выполнении этапа 101 формирования первой структуры данных (СД), на котором формируют первую СД СМД, содержащую элементы упомянутой первой СД, причем упомянутые элементы первой СД представляют собой текстовые элементы (ТЭ) лингвистического предложения, а также идентификационные данные ТЭ, представляющие собой в качестве примера, но не ограничения: значения ТЭ и порядковые номера ТЭ в лингвистическом предложении; выполнении этапа 102 формирования базы данных лингво-логических признаков (БДЛ 1П), на котором на основании сведений, содержащихся в первой СД, выявляют лингвистические и логические признаки ТЭ лингвистического предложения, из которых формируют базу данных, представляющую собой базу данных лингвистических и логических признаков текстовых элементов лингвистического предложения; выполнении этапа 103 формирования второй СД, на котором на основании сведений, содержащихся в БДЛЛП, первой СД, а также на основании формализованной модели простого суждения, формируют вторую СД СМД, содержащую элементы упомянутой второй СД, причем упомянутые элементы второй СД представляют собой компоненты простых суждений (КПС), а также идентификационные данные КПС, представляющие собой в качестве примера, но не ограничения: значения КПС и порядковые номера ТЭ лингвистического предложения, составляющих КПС; выполнении этапа 104 формирования третьей СД, на котором на основании сведений, содержащихся в БДЛЛП, второй СД, а также на основании формализованной модели простого суждения, формируют третью СД СМД, содержащую элементы упомянутой третьей СД, причем упомянутые элементы третьей СД представляют собой простые суждения (ПС) лингвистического предложения, а также идентификационные данные ПС, представляющие собой в качестве примера, но не ограничения: значения ПС и порядковые номера ТЭ лингвистического предложения, составляющих ПС. 12. A method executed by a processor or processors of a computer device for forming a data structure containing simple judgments for use in a method according to any one of claims. 1-8, which consists in: performing the step 101 of the formation of the first data structure (SD), in which the first SD of the SD is formed, containing the elements of the said first SD, and the mentioned elements of the first SD are text elements (TE) of a linguistic sentence, as well as identification data of TE, which are, by way of example, but not limitation: TE values and serial numbers of TE in a linguistic sentence; performing stage 102 of the formation of a database of linguistic and logical signs (BDL 1P), on which, based on the information contained in the first SD, linguistic and logical signs of TE of a linguistic sentence are identified, from which a database is formed, which is a database of linguistic and logical signs of text elements of a linguistic sentence; performing the stage 103 of the formation of the second SD, on which, based on the information contained in the BDLLP, the first SD, as well as on the basis of a formalized model of a simple judgment, a second SD SD is formed containing elements of the said second SD, and the mentioned elements of the second SD are components of simple judgments (KPS), as well as the identification data of the KPS, which are, by way of example, but not limitation: the values of the KPS and the serial numbers of the TE of the linguistic sentence that make up the KPS; performing stage 104 of the formation of the third SD, on which, based on the information contained in the BDLLP, the second SD, as well as on the basis of a formalized model of a simple judgment, form a third SD SD, containing elements of the said third SD, and the mentioned elements of the third SD are simple judgments ( PS) of the linguistic sentence, as well as the identification data of the PS, which are, as an example, but not limitation: the values of the PS and the serial numbers of the TE of the linguistic sentence that make up the PS.
13. Способ по п. 12, характеризующийся тем, что этап 101 характеризуется: выполнением этапа 1011 идентификации исходной структуры данных СМД, на котором идентифицируют элементы исходной структуры данных СМД, являющиеся лингвистическими предложениями (ЛП); выполнением этапа 1012 идентификации элементов первой структуры данных СМД, на котором идентифицируют элементы первой структуры данных СМД, являющиеся первичными текстовыми элементами (ПТЭ) лингвистического предложения, а также идентификационные данные ПТЭ, представляющие собой в качестве примера, но не ограничения значения ПТЭ и порядковые номера ПТЭ в лингвистическом предложении, и формируют первую структуру данных СМД. 13. The method according to claim 12, characterized in that step 101 is characterized in that step 101 is characterized by: performing step 1011 of identifying the original data structure of the MDS, which identifies the elements of the original data structure of the MDS, which are linguistic sentences (LP); performing the step 1012 of identifying the elements of the first data structure of the MDS, which identifies the elements of the first data structure of the MDS, which are the primary text elements (PTE) of the linguistic sentence, as well as the identification data of the PTE, which are, as an example, but not limitation, the values of the PTE and the serial numbers of the PTE in a linguistic sentence, and form the first data structure of the MDS.
14. Способ по п. 12, характеризующийся тем, что этап 102 характеризуется: выполнением этапа 1021 формирования первой части лингво-логических признаков14. The method according to claim 12, characterized in that step 102 is characterized by: performing step 1021 of generating the first part of the linguo-logical features
ПТЭ лингвистического предложения, на котором для лингвистического анализа ПТЭ, содержащихся в первой СД и классифицированных как слово, предоставляют идентификационные данные ПТЭ и получают лингвистические характеристики ПТЭ, а также значения упомянутых лингвистических характеристик; выполнением этапа 1022 формирования второй части лингво-логических признаков ПТЭ лингвистического предложения, на котором для логического анализа ПТЭ, содержащихся в первой СД и классифицированных как слово, предоставляют идентификационные данные ПТЭ, а также лингвистические характеристики ПТЭ лингвистического предложения вместе с упомянутыми значениями лингвистических характеристик, и получают логические характеристики ПТЭ лингвистического предложения, а также значения упомянутых логических характеристик; выполнением этапа 1023 формирования базы данных лингво-логических признаков (БД/1/1П), на котором формируют БДЛЛП первичныхтекстовых элементов лингвистического предложения, при этом лингво-логическими признаками ПТЭ являются все полученные по соответствующему ПТЭ в ходе этапов 1021 и 1022 упомянутые лингвистические характеристики и упомянутые логические характеристики, обладающие соответствующими упомянутыми значениями лингвистических характеристик и упомянутыми значениями логических характеристик. PTE of a linguistic sentence, on which, for linguistic analysis, PTEs contained in the first SD and classified as a word, provide the identification data of the PTE and obtain the linguistic characteristics of the PTE, as well as the values of the said linguistic characteristics; performing the step 1022 of forming the second part of the linguistic and logical features of the PTE of the linguistic sentence, in which for the logical analysis of the PTE contained in the first SD and classified as a word, the identification data of the PTE, as well as the linguistic characteristics of the PTE of the linguistic sentence, together with the mentioned values of the linguistic characteristics are provided, and get the logical characteristics of the PTE of the linguistic sentence, as well as the values of the mentioned logical characteristics; the execution of stage 1023 of the formation of a database of linguistic and logical signs (BD / 1 / 1P), on which the BDLLP of the primary text elements of the linguistic sentence are formed, while the linguistic and logical signs of the PTE are all the mentioned linguistic characteristics obtained according to the corresponding PTE during steps 1021 and 1022, and said logical characteristics having corresponding said linguistic characteristic values and said logical characteristic values.
15. Способ по п. 12, характеризующийся тем, что этап 103 характеризуется: выполнением этапа 1031, формирования элементов второй СД, на котором на основании сведений, содержащихся в БДЛЛП, первой СД, а также на основании формализованной модели простого суждения, идентифицируют и формируют элементы второй СД, являющиеся КПС, а также идентификационные данные КПС, представляющие собой в качестве примера, но не ограничения значения КПС и порядковые номера ПТЭ в лингвистическом предложении, составляющих КПС; выполнением этапа 1032 формирования второй СД, на котором формируют вторую СД из идентифицированных КПС и их идентификационных данных. 15. The method according to claim 12, characterized in that step 103 is characterized by: performing step 1031, generating elements of the second SD, on which, based on the information contained in the BDLLP, the first SD, as well as on the basis of a formalized model of a simple judgment, identify and form elements of the second SD, which are the KPS, as well as the identification data of the KPS, which are, as an example, but not a limitation of the meaning of the KPS and the serial numbers of the PTE in the linguistic sentence that make up the KPS; performing step 1032 of generating the second LED, which generates the second LED from the identified CPS and their identification data.
16. Способ по п. 12, характеризующийся тем, что этап 104 характеризуется: выполнением этапа 1041 формирования элементов третьей СД, на котором на основании сведений, содержащихся в БДЛЛП и второй СД, из сформированных КПС в соответствии с формализованной компонентной моделью простого суждения формируют элементы третьей СД, являющиеся простыми суждениями (ПС), а также идентификационные данные ПС, представляющие собой в качестве примера, но не ограничения значения ПС и порядковые номера ПТЭ в лингвистическом предложении, составляющих ПС; выполнением этапа 1042 формирования третьей СД, на котором формируют третью СД из сформированных ПС и их идентификационных данных. 16. The method according to claim 12, characterized in that step 104 is characterized by: performing step 1041 of forming the elements of the third SD, on which, based on the information contained in the BDLLP and the second SD, from the generated CPS in accordance with the formalized component model of a simple judgment, elements of the third SD, which are simple judgments (PS), as well as identification data of the PS, which are, as an example, but not limitation, the values of PS and the serial numbers of the PTE in the linguistic sentence that make up the PS; performing step 1042 of generating the third SD, which generates the third SD from the generated PS and their identification data.
17. Компьютерное устройство для преобразования структурированного массива данных (СМД), содержащего лингвистические предложения (ЛП), содержащее, по меньшей мере: процессор компьютерного устройства, и память, содержащую код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 12-16. 17. A computer device for transforming a structured data array (SDM) containing linguistic sentences (LP), containing at least: a processor of a computer device, and a memory containing a program code, which, when executed by a processor of a computer device, causes the processor of a computer device to perform the actions of the method according to any one of paragraphs. 12-16.
18. Система для преобразования структурированного массива данных (СМД), содержащего лингвистические предложения (ЛП), содержащая, по меньшей мере: серверное компьютерное устройство, являющееся компьютерным устройством по п. 17, и пользовательское компьютерное устройство, выполненное с возможностью передачи серверному компьютерному устройству команды или команд, побуждающих процессор серверного компьютерного устройства выполнять код программы, который при выполнении процессором серверного компьютерного устройства побуждает процессор серверного компьютерного устройства выполнять действия способа по любому из п.п. 12- 16. 18. A system for transforming a structured data array (SDM) containing linguistic sentences (LP), containing at least: a server computer device, which is a computer device according to claim 17, and a user computer device configured to transmit a command to the server computer device or commands that cause the processor of the server computer device to execute program code that, when executed by the processor of the server computer device, causes the processor of the server computer device to perform the method of any one of claims. 12-16.
19. Машиночитаемый носитель данных, содержащий код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 12-16. 19. A computer-readable storage medium containing program code that, when executed by a processor of a computer device, causes the processor of the computer device to perform the actions of the method according to any one of claims. 12-16.
20. Исполняемый процессором или процессорами компьютерного устройства способ формирования онтологической базы данных структурированного массива данных (СМД) для способа по любому из п.п. 1-8, заключающийся в: выполнении этапа 201 идентификации первой структуры данных (СД), второй СД, и базы данных лингво-логических признаков (БДЛЛП); при этом первая СД содержит компоненты простых суждений (КПС); при этом вторая СД содержит простые суждения (ПС); при этом БДЛЛП, содержит сведения о лингвистических и логических признаках текстовых элементов (Л 1ПТЭ), причем упомянутые ЛЛПТЭ представляют собой лингвистические и логические признаки текстовых элементов (ТЭ) и их значения; выполнении этапа 105 формирования онтологической базы данных системных и семантических связей во второй СД, на котором на основании сведений, содержащихся в БДЛЛП, первой СД и второй СД, а также на основании критериев поиска системных и семантических однородностей, выявляют и регистрируют системные и семантические связи между компонентами ПС, из которых формируют онтологическую базу данных системных и семантических связей компонентов ПС во второй СД (ОБД). 20. Executed by a processor or processors of a computer device, a method for forming an ontological database of a structured data array (DMD) for a method according to any one of claims. 1-8, which consists in: performing step 201 of identifying the first data structure (SD), the second SD, and the database of linguistic and logical signs (BDLLP); the first SD contains the components of simple judgments (CPS); while the second SD contains simple judgments (PS); at the same time, BDLLP, contains information about linguistic and logical signs text elements (L 1PTE), and the mentioned LLPTE are linguistic and logical signs of text elements (TE) and their meanings; performing stage 105 of the formation of an ontological database of system and semantic links in the second SD, on which, based on the information contained in the BDLLP, the first SD and the second SD, as well as on the basis of the search criteria for system and semantic homogeneities, the system and semantic links between SS components, from which they form an ontological database of system and semantic links of SS components in the second SD (OBD).
21. Способ по п. 1, характеризующийся тем, что этап 105 характеризуется: выполнением этапа 1051 идентификации системных связей между КПС на основании сведений, содержащихся в БДЛЛП, первой СД и второй СД, а также на основании критериев поиска системных однородностей, и регистрации выявленных связей в качестве системных онтологических признаков (СсОП) и значений СсОП; выполнением этапа 1052 идентификации семантических связей между КПС на основании сведений, содержащихся в БДЛЛП, первой СД и второй СД, а также на основании критериев поиска семантических однородностей и регистрации выявленных связей в качестве семантических онтологических признаков (СмОП) и значений СмОП; выполнением этапа 1053 формирования онтологической базы данных системных и семантических связей во второй СД, на котором формируют ОБД путем объединения всех выявленных онтологических признаков (СсОП и СмОП) компонентов простых суждений во второй СД, при этом СсОП и СмОП являются всеми идентифицированными и зарегистрированными по каждому соответствующему компоненту простого суждения онтологическими признаками (СсОП и СмОП), обладающие соответствующими значениями СсОП и СмОП. 21. The method according to claim 1, characterized in that step 105 is characterized in that step 105 is characterized by: performing step 1051 of identifying system connections between the CPS based on the information contained in the BDLLP, the first SD and the second SD, as well as based on the search criteria for system homogeneities, and registration of the identified links as system ontological features (SOP) and SOP values; performing stage 1052 of identifying semantic links between the CPS based on the information contained in the BDLLP, the first SD and the second SD, as well as based on the search criteria for semantic homogeneities and registration of the identified links as semantic ontological features (SOM) and SOM values; performing stage 1053 of forming an ontological database of system and semantic links in the second SD, on which the OBD is formed by combining all the identified ontological features (SSOP and SMOP) of the components of simple judgments in the second SD, while the SSOP and SMOP are all identified and registered for each corresponding component of a simple judgment with ontological features (SOP and SOP), which have the corresponding values of SOC and SOM.
22. Компьютерное устройство для преобразования структурированного массива данных (СМД), содержащего лингвистические предложения (ЛП), содержащее, по меньшей мере: процессор компьютерного устройства, и память, содержащую код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 20-21. 22. A computer device for transforming a structured data array (SDM) containing linguistic sentences (LP), containing at least: a processor of a computer device, and a memory containing a program code, which, when executed by a processor of a computer device, causes the processor of a computer device to perform the actions of the method according to any one of paragraphs. 20-21.
23. Система для преобразования структурированного массива данных (СМД), содержащего лингвистические предложения (ЛП), содержащая, по меньшей мере: серверное компьютерное устройство, являющееся компьютерным устройством по п. 22, и пользовательское компьютерное устройство, выполненное с возможностью передачи серверному компьютерному устройству команды или команд, побуждающих процессор серверного компьютерного устройства выполнять код программы, который при выполнении процессором серверного компьютерного устройства побуждает процессор серверного компьютерного устройства выполнять действия способа по любому из п.п. 20- 21. 23. A system for transforming a structured data array (SDM) containing linguistic sentences (LP), containing at least: a server computing device that is a computing device according to claim 22, and a user computing device configured to transmit commands or commands to the server computing device causing the processor of the server computing device to execute program code that, when executed by the processor of the server computing device, causes the processor of the server computing device to execute actions of the method according to any one of paragraphs. 20-21.
24. Машиночитаемый носитель данных, содержащий код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 20-21. 24. A computer-readable storage medium containing program code that, when executed by a processor of a computer device, causes the processor of the computer device to perform the actions of the method according to any one of claims. 20-21.
25. Исполняемый процессором или процессорами компьютерного устройства способ преобразования структурированного массива данных (СМД), содержащего простые суждения (ПС), для способа по любому из п.п. 1-8, заключающийся в: выполнении этапа 301 идентификации исходной структуры данных (СД) и онтологической базы данных (ОБД); при этом исходной СД является СД, содержащая элементы СД, являющиеся ПС лингвистического предложения и идентификационные данные ПС, причем ПС содержат компоненты; при этом ОБД, содержит сведения о системных и семантических связях в исходной СД, причем упомянутые сведения представляют собой системные и семантические связи между компонентами ПС в исходной СД; выполнении этапа 106 формирования базы данных отношений в исходной СД, на котором на основании сведений, содержащихся в ОБД, а также на основании критериев поиска искомых суждений, сравнивают компоненты ПС, а также классифицируют и регистрируют виды отношений между сравниваемыми компонентами ПС, из которых формируют базу данных отношений компонентов ПС в исходной СД (БДО); выполнении этапа 107 формирования итоговой СД, на котором на основании сведений, содержащихся в БДО, исходной СД, а также на основании упомянутых критериев поиска искомых суждений, формируют итоговую СД, содержащую элементы итоговой СД, причем упомянутые элементы итоговой СД представляют собой искомые суждения (ИС), а также идентификационные данные ИС, представляющие собой в качестве примера, но не ограничения: значения ИС и порядковые номера первичных текстовых элементов (ПТЭ) лингвистического предложения, составляющих ИС. 25. Executed by a processor or processors of a computer device, a method for converting a structured data array (SDM) containing simple judgments (PS) for a method according to any one of claims. 1-8, which consists in: performing step 301 identifying the original data structure (SD) and the ontological database (OBD); in this case, the original SD is a SD containing elements of the SD, which are the PS of the linguistic sentence and the identification data of the PS, and the PS contains components; in this case, the OBD contains information about the system and semantic links in the source SD, and the mentioned information is the system and semantic links between the components of the PS in the source SD; performing stage 106 of forming a database of relations in the source SD, on which, based on the information contained in the HBS, as well as on the basis of the search criteria for the sought judgments, the components of the PS are compared, and also the types of relations between the compared components of the PS are classified and recorded, from which the base is formed data of the relations of the components of the PS in the original SD (BDO); performing stage 107 of the formation of the final SD, on which, on the basis of the information contained in the BDO, the original SD, and also on the basis of the mentioned search criteria for the sought judgments, the final SD is formed containing the elements of the final SD, and the mentioned elements of the final SD are the sought judgments (IS ), as well as the identification data of the IS, which are, by way of example, but not limitation: the values of the IS and the serial numbers of the primary text elements (PTE) of the linguistic sentence that make up the IS.
26. Способ по п. 25, характеризующийся тем, что этап 106 характеризуется: выполнением этапа 1061 формирования карты отношений компонентов простых суждений (КПС) в исходной СД на основании упомянутых критериев поиска искомых суждений; выполнением этапа 1062 классификации на основании сведений, содержащихся в ОБД, и регистрации видов отношений между сравниваемыми КПС исходной СД и регистрации соответствующих видов отношений в качестве выводов по результатам сопоставления системных и семантических онтологических сведений о сравниваемых КПС; выполнением этапа 1063 формирования базы данных отношений в исходной СД, на котором формируют БДО компонентов простых суждений исходной СД путем объединения всех классифицированных и зарегистрированных отношений между сравниваемыми КПС исходной СД. 26. The method according to claim 25, characterized in that step 106 is characterized in that step 106 is characterized by: performing step 1061 of generating a map of relations of components of simple judgments (CPS) in the original SD based on the mentioned search criteria for the sought judgments; performing the stage 1062 classification based on the information contained in the HBS, and registering the types of relations between the compared CPSs of the original SD and registering the corresponding types of relations as conclusions based on the results of comparing the system and semantic ontological information about the compared CPSs; performing stage 1063 of forming a database of relations in the source SD, at which the BDO of the components of simple judgments of the source SD is formed by combining all classified and registered relations between the compared CPSs of the source SD.
27. Способ по п. 25, характеризующийся тем, что этап 107 характеризуется: выполнением этапа 1071 формирования последовательности действий для решения поисковой задачи (ПД), в ходе которого на основании предварительно заданных критериев поиска искомых суждений формируют упомянутую ПД; выполнением этапа 1072 идентификации и формирования первых и вторых элементов итоговой СД, на котором на основании сведений, содержащихся в БДО, идентифицируют и формируют элементы итоговой СД, являющиеся искомыми суждениями (ИС), а также идентификационные данные ИС, представляющие собой в качестве примера, но не ограничения значения ИС и порядковые номера ПТЭ лингвистического предложения, составляющих ИС; выполнением этапа 1073 формирования итоговой СД, на котором формируют итоговую СД из сформированных ИС и их идентификационных данных. 27. The method according to claim 25, characterized in that step 107 is characterized in that step 107 is characterized by: performing step 1071 of generating a sequence of actions for solving a search task (AP), during which, based on predetermined search criteria for sought judgments, said AP is formed; performing stage 1072 of identification and formation of the first and second elements of the final SD, on which, based on the information contained in the BDO, the elements of the final SD are identified and formed, which are the required judgments (IS), as well as the identification data of the IS, which are an example, but not limiting the value of the IS and the serial numbers of the PTE of the linguistic sentence that make up the IS; performing stage 1073 of the formation of the final SD, at which the final SD is formed from the generated IS and their identification data.
28. Компьютерное устройство для преобразования структурированного массива данных (СМД), содержащего лингвистические предложения (ЛП), содержащее, по меньшей мере: процессор компьютерного устройства, и память, содержащую код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 25-27. 28. A computer device for transforming a structured data array (DMD) containing linguistic sentences (LP) containing at least: a processor of a computer device and a memory containing a program code, which, when executed by a processor of a computer device, causes the processor of a computer device to perform the actions of the method according to any one of paragraphs. 25-27.
29. Система для преобразования структурированного массива данных (СМД), содержащего лингвистические предложения (ЛП), содержащая, по меньшей мере: серверное компьютерное устройство, являющееся компьютерным устройством по п. 28, и пользовательское компьютерное устройство, выполненное с возможностью передачи серверному компьютерному устройству команды или команд, побуждающих процессор серверного компьютерного устройства выполнять код программы, который при выполнении процессором серверного компьютерного устройства побуждает процессор серверного компьютерного устройства выполнять действия способа по любому из п.п. 25- 27. 29. A system for transforming a structured data array (SDM) containing linguistic sentences (LP), containing at least: a server computing device that is a computing device according to claim 28, and a user computing device configured to send a command or commands to the server computing device causing the processor of the server computing device to execute program code that, when executed by the processor of the server computing device, prompts the processor of the server computing device to execute the actions of the method according to any one of paragraphs. 25-27.
ВО. Машиночитаемый носитель данных, содержащий код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 25-27. IN. A computer-readable storage medium containing program code that, when executed by a processor of a computer device, causes the processor of the computer device to perform the actions of the method according to any one of claims. 25-27.
PCT/RU2020/050319 2019-11-10 2020-11-10 Method for the conversion of a structured data array WO2021091432A1 (en)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
RU2019135990A RU2714899C1 (en) 2019-11-10 2019-11-10 Method of forming an ontological database of a structured data array
RU2019135992 2019-11-10
RU2019135992A RU2717719C1 (en) 2019-11-10 2019-11-10 Method of forming a data structure containing simple judgments
RU2019135989A RU2717718C1 (en) 2019-11-10 2019-11-10 Method of transforming a structured data array containing simple judgments
RU2019135990 2019-11-10
RU2019135989 2019-11-10
RU2019135993 2019-11-10
RU2019135993A RU2713568C1 (en) 2019-11-10 2019-11-10 Method of transforming structured data array

Publications (1)

Publication Number Publication Date
WO2021091432A1 true WO2021091432A1 (en) 2021-05-14

Family

ID=75848639

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2020/050319 WO2021091432A1 (en) 2019-11-10 2020-11-10 Method for the conversion of a structured data array

Country Status (1)

Country Link
WO (1) WO2021091432A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008048090A2 (en) * 2006-10-18 2008-04-24 Calculemus B.V. Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language.
WO2010105216A2 (en) * 2009-03-13 2010-09-16 Invention Machine Corporation System and method for automatic semantic labeling of natural language texts
US20120109640A1 (en) * 2006-10-10 2012-05-03 Konstantin Anisimovich Method and system for analyzing and translating various languages with use of semantic hierarchy
RU2685966C1 (en) * 2018-06-07 2019-04-23 Игорь Петрович Рогачев Method for lingual-logical transformation of a structured data array containing a linguistic sentence
RU2691836C1 (en) * 2018-06-07 2019-06-18 Игорь Петрович Рогачев Method of transforming a structured data array comprising main linguistic-logic entities

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120109640A1 (en) * 2006-10-10 2012-05-03 Konstantin Anisimovich Method and system for analyzing and translating various languages with use of semantic hierarchy
WO2008048090A2 (en) * 2006-10-18 2008-04-24 Calculemus B.V. Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language.
WO2010105216A2 (en) * 2009-03-13 2010-09-16 Invention Machine Corporation System and method for automatic semantic labeling of natural language texts
RU2685966C1 (en) * 2018-06-07 2019-04-23 Игорь Петрович Рогачев Method for lingual-logical transformation of a structured data array containing a linguistic sentence
RU2691836C1 (en) * 2018-06-07 2019-06-18 Игорь Петрович Рогачев Method of transforming a structured data array comprising main linguistic-logic entities

Similar Documents

Publication Publication Date Title
US10303683B2 (en) Translation of natural language questions and requests to a structured query format
CN111813802B (en) Method for generating structured query statement based on natural language
CN108763510B (en) Intention recognition method, device, equipment and storage medium
US10262062B2 (en) Natural language system question classifier, semantic representations, and logical form templates
CN111159385B (en) Template-free general intelligent question-answering method based on dynamic knowledge graph
US10157177B2 (en) System and method for extracting entities in electronic documents
US10754886B2 (en) Using multiple natural language classifier to associate a generic query with a structured question type
WO2021109690A1 (en) Multi-type question smart answering method, system and device, and readable storage medium
CN111145052A (en) Structured analysis method and system of judicial documents
JPWO2007138875A1 (en) Word dictionary / language model creation system, method, program, and speech recognition system for speech recognition
JP2006244262A (en) Retrieval system, method and program for answer to question
US10410622B2 (en) Systems and methods for automatic repair of speech recognition engine output using a sliding window mechanism
US20220391690A1 (en) Techniques for improving standardized data accuracy
US7657495B2 (en) Method and system for creating hierarchical classifiers of software components to identify meaning for words with multiple meanings
US8577924B2 (en) Determining base attributes for terms
RU2685966C1 (en) Method for lingual-logical transformation of a structured data array containing a linguistic sentence
WO2021091432A1 (en) Method for the conversion of a structured data array
US11573968B2 (en) Systems and methods of creating and using a transparent, computable contractual natural language
RU2713568C1 (en) Method of transforming structured data array
RU2717718C1 (en) Method of transforming a structured data array containing simple judgments
RU2717719C1 (en) Method of forming a data structure containing simple judgments
RU2714899C1 (en) Method of forming an ontological database of a structured data array
CN115146073A (en) Test question knowledge point marking method for cross-space semantic knowledge injection and application
RU2685960C1 (en) Method of converting structured data array, containing syntactic units
RU2691836C1 (en) Method of transforming a structured data array comprising main linguistic-logic entities

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20883750

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20883750

Country of ref document: EP

Kind code of ref document: A1