WO2019235975A1 - Conversion of a structured data array containing a linguistic sentence - Google Patents

Conversion of a structured data array containing a linguistic sentence Download PDF

Info

Publication number
WO2019235975A1
WO2019235975A1 PCT/RU2019/050078 RU2019050078W WO2019235975A1 WO 2019235975 A1 WO2019235975 A1 WO 2019235975A1 RU 2019050078 W RU2019050078 W RU 2019050078W WO 2019235975 A1 WO2019235975 A1 WO 2019235975A1
Authority
WO
WIPO (PCT)
Prior art keywords
linguistic
elements
data structure
syntactic
sentence
Prior art date
Application number
PCT/RU2019/050078
Other languages
French (fr)
Russian (ru)
Inventor
Игорь Петрович РОГАЧЕВ
Original Assignee
Rogachev Igor Petrovich
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rogachev Igor Petrovich filed Critical Rogachev Igor Petrovich
Priority to EA202092988A priority Critical patent/EA202092988A1/en
Publication of WO2019235975A1 publication Critical patent/WO2019235975A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Definitions

  • the group of inventions relates to solutions in the field of processing data arrays, in particular, to solutions in the field of processing
  • structured data arrays containing natural language text, in particular, linguistic sentences, and can be used for preliminary transformation of a structured data array to ensure its subsequent processing.
  • D1 published on May 10, 2010 (D1), a method for automatically indexing texts in natural languages is known.
  • the method known from D1 is that the text is segmented in electronic form into elementary units, identifies stable phrases, form sentences, identifies semantically significant objects and semantically significant relationships between them, form many triads for each semantically significant relationship, in which the only triad of the first type corresponds to the relationship established by the semantically significant relationship between the two
  • each of the triads of the second type corresponding to the value of a specific attribute of one of these semantically significant objects
  • each of the triads of the third type corresponding to the value of a specific attribute of the semantically significant relation
  • the method known from D1 does not have sufficient accuracy of indexing text elements in natural language, which, in turn, affects the accuracy of subsequent processing of the text in natural language and the accuracy of the search in the text in natural language. This is mainly happening due to insufficiently effective preliminary processing of text in a natural language, which, accordingly, does not allow indexing with sufficient accuracy.
  • a technical problem solved by the present invention is the creation of a method and devices that implement the method and / or systems with increased efficiency of preprocessing natural language text for its subsequent indexation and processing.
  • the technical result achieved by the implementation of the present invention is to increase the efficiency and accuracy of preprocessing natural language text for its subsequent indexation and processing.
  • the claimed method of converting a structured data array (SMD) performed by a processor of a computer device containing at least a linguistic sentence is characterized by the following steps: A] forming the first data structure on which the first structure is formed SMD data containing elements of said first data structure, said elements of the first data structure being text elements (TE) of a linguistic pre dix, and
  • identification data of text elements (identification data of TE), representing for each TE, at least: value of a text element (value of TE) and serial number of a text element (serial number of TE] in a linguistic sentence; B] formation of a database of linguistic features (BDLP ], on which linguistic signs of text elements (linguistic signs of TE) of a linguistic sentence are revealed, from which a database is formed, which is a BDLP of text elements of linguis B] the formation of the second data structure, on which the second SMD data structure is formed containing the elements of the second data structure, said elements of the second data structure being the syntactic units (CE) of the linguistic sentence, formed on the basis of information from the BDLP of the textual elements of the linguistic sentences, and also represent identification data of syntactic units (identification CE data), representing for each CE at least: the value of the syntactic unit (CE value) and the serial (serial) number
  • Embodiments of the present invention relate to methods, devices, systems, and computer-readable storage media for ensuring the efficiency and accuracy of preprocessing natural language text for subsequent indexing and processing.
  • FIG. 1 shows an exemplary general flowchart for the steps of the claimed method 100 for converting a structured data array containing at least a linguistic sentence that is the original data structure for the method 100 in question.
  • FIG. 2 shows an exemplary general flowchart of the steps of step 101 of generating the first data structure.
  • FIG. 3 shows an exemplary general structure of an initial data structure from which a first data structure of a structured data array is formed.
  • FIG. 4 shows an exemplary general structure of the generated first data structure.
  • FIG. 5 shows an exemplary general flowchart for the steps of step 102 of forming a database of linguistic features
  • FIG. 6 shows an exemplary general structure of the generated database of linguistic features (BDLP), which is BDLP of text elements 21 of the linguistic sentence 11.
  • BDLP generated database of linguistic features
  • FIG. 7 depicts an exemplary general flowchart of the steps of step 103 of generating a second SMD data structure.
  • FIG. 8 depicts an exemplary general structure of a generated second data structure of a structured data array.
  • FIG. 9 shows an exemplary general flowchart step 104 of forming a third data structure of the structured data array.
  • FIG. 10 shows an exemplary general structure of the generated third data structure of a structured data array.
  • FIG. 11 shows an exemplary general flowchart of step 105 of generating a fourth data structure of a structured data array.
  • FIG. 12 depicts an exemplary general structure of the generated fourth data structure of a structured data array.
  • FIG. 13 shows an exemplary general flowchart of the inventive method 200 for converting a structured data array containing at least syntactic units of a linguistic sentence and identification data of syntactic units, which is the initial data structure for the method 200 in question.
  • FIG. 14 depicts an example general flowchart of an identification step 201 of a transformable data structure containing syntactic units that is the original data structure for
  • FIG. 15 shows an exemplary general data structure
  • FIG. 16 shows an exemplary general flowchart for the steps of step 202 of generating a fifth data structure of a structured data array, which is the first data structure for the method 200 in question.
  • FIG. 17 depicts an exemplary general structure of a database of linguistic features (BDLP) generated in step 2021, which is a BDLP of text elements 21 of a linguistic sentence 11 contained in elements 22 suitable for transforming a data structure containing syntactic units.
  • BDLP linguistic features
  • FIG. 18 depicts an exemplary general structure of the database of linguistic features [BDLP] generated in step 2022, which is the BDLP of the text elements 21 of the linguistic sentence 11 contained in the elements 22 suitable for converting the data structure containing CE.
  • Ha of FIG. 19 shows an exemplary general structure of the generated fifth data structure of the structured data array, which is the first for the present conversion method 200.
  • FIG. 20 depicts an exemplary general flowchart of step 203 of generating the sixth data structure of a structured data array, which is the second data structure for the method 200 in question.
  • FIG. 21 shows an exemplary general structure of the database of linguistic features (BDLP) generated as part of step 2031, which is the BDLP of text elements 21 of the linguistic sentence 11 contained in the elements 61 of the fifth data structure of the structured data array.
  • BDLP linguistic features
  • FIG. 22 shows an exemplary general structure of the sixth data structure of the structured data array generated, which is the second data structure for the present conversion method 200.
  • FIG. 23 shows an exemplary general flowchart of steps 204 of generating a seventh data structure of a structured data array, which is the third data structure for the method 200 in question.
  • FIG. 24 shows an exemplary general structure of the generated seventh data structure of the structured data array, which is the third data structure for the present conversion method 200.
  • FIG. 25 shows an exemplary general flowchart of the inventive method 300 for converting a structured data array containing at least basic linguistic-logical objects (LLL) of a linguistic sentence and LLL identification data,
  • LLL basic linguistic-logical objects
  • FIG. 26 depicts an exemplary general flowchart for identifying a transformable data structure comprising basic linguistic logic objects [OLLO], which is the original data structure for the method 300 in question, that is capable of being converted.
  • OLLO basic linguistic logic objects
  • FIG. 27 depicts an exemplary general data structure that is the starting point for the transform method 300, which is a transformable data structure containing basic linguistic objects [OLLO].
  • FIG. 28 shows an exemplary general flowchart step 302 of forming the eighth data structure of the structured data array, which is the first data structure for the method 300 in question.
  • FIG. 29 depicts an exemplary general structure of a linguistic feature database (LIB) formed within block 3021, which is a LLLB of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing ALLO.
  • LIB linguistic feature database
  • FIG. 30 shows an exemplary general structure of the generated eighth SMD data structure, which is the first SMD data structure for the present conversion method 300.
  • FIG. 31 shows an exemplary general flowchart of the steps of step 303 of generating the ninth SMD data structure, which is the second data structure for the method 300 in question.
  • FIG. 32 depicts an exemplary general structure of the generated ninth DMD data structure, which is the second SMD data structure for the present conversion method 300.
  • FIG. 33 depicts an example general flowchart of the steps of step 304 of generating the tenth SMD data structure, which is the third data structure for the method 300 in question.
  • FIG. 34 depicts an exemplary general structure of a database of linguistic features [BDLP] generated as part of step 3041, which is a BDLP of text elements 21 of sentence 11 contained in elements 13 of the ninth data structure of the DMD.
  • BDLP linguistic features
  • FIG. 35 depicts an exemplary general structure of the tenth SMD data structure generated, which is the third SMD data structure for the present conversion method 300.
  • FIG. 36 shows an exemplary general flowchart for the steps of step 305 of generating the eleventh SMD data structure, which is the third SMD data structure for the method 300 in question.
  • FIG. 37 illustrates an exemplary general structure of the generated eleventh SMD data structure, which is the fourth SMD data structure for the present conversion method 300.
  • FIG. 38 depicts an exemplary general flowchart of the inventive method 400 for converting an SMD comprising at least main linguistic-logical objects (LLLF) of the linguistic sentence and LLLF identification data, which is the initial data structure for the method 400 under consideration.
  • LLLF main linguistic-logical objects
  • FIG. 39 depicts an example general flowchart of the steps of step 402 of generating the twelfth SMD data structure, which is the first data structure for the method 400 in question.
  • FIG. 40 shows an exemplary general structure of a database of linguistic features (BDLP) generated as part of step 4021, which is BDLP of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing ALLO,
  • BDLP database of linguistic features
  • FIG. 41 shows an exemplary general structure of the generated twelfth SMD data structure, which is the first for the present conversion method 400.
  • FIG. 42 depicts an example general flowchart of the steps of step 403 of generating the thirteenth SMD data structure, which is the second data structure for the method 400 in question.
  • FIG. 43 depicts an exemplary general structure of a database of linguistic features [BDLP] generated as part of step 4031, which is BDLP of text elements 21 of sentence 11 contained in elements 17 of the twelfth data structure of the DMD.
  • BDLP linguistic features
  • FIG. 44 shows an exemplary general structure of the generated thirteenth SMD data structure, which is the second SMD data structure for the present conversion method 400.
  • FIG. 45 shows an exemplary general system diagram for
  • FIG. 1 depicts a General diagram of the steps of the claimed method 100 conversion
  • a structured data array containing at least a linguistic sentence (LP), which is the original data structure for the method 100 under consideration.
  • the claimed method 100 of converting an SMD containing at least a linguistic sentence is characterized by: performing the first step 101 of generating the first data structures on which the first SMD data structure is formed containing the elements of said first data structure, said elements of the first data structure being textual linguistic elements (TE)
  • TE identification data representing for each TE, as an example, but not limitation: the value of the text element (TE value) and the serial number of the text element (TE serial number) in
  • linguistic attributes of text elements (linguistic attributes of TE) of a linguistic sentence from which a database is formed
  • identification data of syntactic units representing for each CE, as an example, but not limitation: the value of the syntactic unit (CE value) and the serial number (s) of the TE of the linguistic sentence constituting CE; the execution of step 104 of the formation of the third data structure, which form the third data structure of the SMD containing the elements of said third data structure, said elements of the third structure data represent linguistic objects (LO) of the linguistic sentence, formed by identifying them with the above
  • syntactic units or resulting from the conversion of the mentioned syntactic units, and also represent
  • identification data of linguistic objects representing for each LO, as an example, but not limitation: the value of the linguistic object (value of LO) and the serial (serial) number (numbers) of the TE of the linguistic sentence constituting (components) LO; the execution of the step 105 of the formation of the fourth data structure, which forms the fourth data structure of the SMD containing the elements of the said fourth data structure, moreover,
  • the elements of the fourth data structure are logical objects (LogO) of a linguistic sentence, formed by correlating linguistic and logical objects and identified with the aforementioned linguistic objects, and also represent the identification data of logical objects (LogO identification data),
  • FIG. 2 by way of example, but not limitation, a general flowchart of the steps of step 101 of generating the first data structure is shown.
  • Step 101 is characterized by: performing step 1011 of identifying the source
  • SMD data structures on which elements 11 of the initial SMD data structure are identified which are linguistic sentences 11 (LP 11); by performing step 1012 of identifying elements 21 of the first SMD data structure, at which elements 21 of the first SMD data structure are identified, which are text elements (TE) of the linguistic sentence 11, as well as identification data of elements 21, which are for each TE, as an example, but not restrictions: the value 211 of the element 21 of the first SMD data structure and the serial number 212 of the element 21 of the first SMD data structure, and form the first SMD data structure.
  • TE text elements
  • FIG. 3 by way of example, but not limitation, the general structure of the original data structure from which the first SMD data structure is formed is shown.
  • the source data is a SMD containing elements 11 the original data structure, which is a linguistic sentence (LP).
  • LP linguistic sentence
  • the PL can contain the following objects: numbers (numbers), punctuation marks and indices (constructions of letters, numbers and signs). All of the above objects are components of LP 11 (components of LP) and in the original data structure are separate elements prepared in advance and placed in the original data structure not in the form of linguistic text, but in the form of a structured array (list, list and the like) of individual LP. Such preparatory steps may be carried out by any method known in the art and, accordingly, are not further described.
  • the identification of the elements 11 of the original data structure in step 1011 is reduced to providing a classification of the elements that make up the original data structure as linguistic sentences (LP 11).
  • the components of the drug are all numbers (numbers), punctuation marks and indices (constructions of letters, numbers and signs) contained in the drug and separated by a space.
  • the original data structure is the result of a plurality of elements 11 identified in step 1011.
  • FIG. 4 by way of example, but not limitation, the general structure of the generated first data structure is shown.
  • the first data structure is a DMD containing the elements 21 of the first data structure, which are the text elements (TE 21) of the linguistic sentence 11 and the TE identification data.
  • the text elements 21 of the linguistic sentence 11 lack their unique names characterizing their practical use.
  • elements 21, as an example, but not limitation, may be referred to as “TE”, “TE2”, “TEZ”, “TEP”, where n> 1 is the serial number of the element in the linguistic sentence 11.
  • TE 21 of the linguistic sentence are components of the PL, that is, words, numbers, punctuation marks or indices (constructions of letters, numbers and signs) contained in LP 11 and separated by a space.
  • the text elements 21 of the linguistic sentence 11 have TE identification data, such as, by way of example, but not limitation: TE value 211 and TE number number 212.
  • TEQs The value of 211 TEQs is, as an example, but not limitation, the set of letters, numbers, and / or punctuation marks that make up TEQs.
  • Serial number 212 of the TE is the serial number of TE 21 in the linguistic sentence 11.
  • the formation of the text elements 21 of the first data structure during step 1012 is performed by identifying individual words or groups of words, numbers (numbers) or indices, the numbers (numbers) or indices not separated by a space, as well as punctuation marks. Moreover, it is preferable that the last punctuation mark in linguistic sentence 11 is not taken into account and not
  • the identification of the value 211 of the text element 21 of the first data structure during step 1012 is carried out by registering the characters (letters, numbers and / or punctuation marks) that make up the text element 21. Identification of the serial number 212 of the text element 21 of the first
  • step 1012 data structures during step 1012 are produced by calculating the location of the TE 21 in the linguistic sentence 11.
  • the first text element 21 in the linguistic sentence 11 receives the serial number “1”, and all
  • FIG. 5 depicts a General diagram of the steps of step 102 of the formation of the database of linguistic features, which is a database of linguistic features text elements 21 of sentence 11.
  • Step 102 is characterized by: performing step 1021 of forming linguistic features of text elements 21 of sentence 11, in which for the linguistic analysis of the text element provide identification data of element 21 (value 211 and serial number 212 TE) and get the linguistic characteristics of 213 text elements 21 linguistic sentences 11, as well as the meanings of the mentioned linguistic characteristics 2131; performing step 1022 of creating a database of linguistic features (BDLP), on which form BDLP of text elements 21 of the linguistic sentence 11.
  • BDLP database of linguistic features
  • the linguistic feature of the text element 21 will be all linguistic characteristics 213 obtained for the text element 21 during the step 1021, having linguistic characteristics 2131.
  • FIG. 6, by way of example, but not limitation, the general structure of the generated database of linguistic features (BDLP) is shown, which is the BDLP of text elements 21 of the linguistic sentence 11.
  • the first part (main) of linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11 may contain morphological, syntactic and semantic characteristics.
  • the totality of the values of all the linguistic characteristics of the text element is for each TE 21 of the linguistic sentence 11 its distinctive (unique) linguistic feature in the linguistic sentence.
  • Morphological characteristics preferably indicate the morphological characteristics of TE 21 of the linguistic sentence 11, which can be classified, as an example, but not limited, by the level of nesting (genus-species-subspecies).
  • the morphological genera of TE 21 of the linguistic sentence 11 are preferably a word, a number, punctuation marks, other signs;
  • morphological species - part of speech for words, type of number (Arabic, Roman), type of punctuation mark (dot, comma, etc.), type of other sign;
  • morphological subspecies gender, number, case of parts of speech and the like (for words), number, binary code, index and the like (for numbers).
  • the syntactic characteristics preferably indicate the many syntactic features of TE 21 of the linguistic sentence 11, among which, by way of example, but not limited to, the following syntactic characteristics of TE 21 of linguistic sentence 11:
  • syntactic role predicate, subject, and the like.
  • syntactic parent syntactically main word
  • syntactic descendants syntactically subordinate words
  • syntactic compositional connection the presence of another TE having the same syntactic role and the same syntactic parent.
  • the semantic characteristics preferably indicate the semantic features of TE 21 of the linguistic sentence 11, among which
  • semantic group a group of words that can be attributed to one class, gender, type or subspecies of objects or actions of the world when the signs coincide
  • linguistic sentences 11 are preferably produced at step 1021 by a comprehensive linguistic analysis of each text element 21 of the linguistic sentences 11, representing, by way of example, but not limitation, TE analysis based on the TE location in the sentence structure, its meaning, type, classification of its conceivable image and analysis of its relationships with other textual elements in the sentence. Based on the results of a comprehensive analysis, it is preferable to formulate the main linguistic characteristics 213 and enter them at step 1022 into the BDLP in the form of a list of the first part of linguistic characteristics 213 with the values of these characteristics 2131. For example, but not limited to, one of the linguistic characteristics 213 may be a “syntactic role” , with a value of 2131 of this linguistic characteristic “subject”.
  • Such an analysis can be performed by any a method known from the prior art and, accordingly, is not described in further detail below.
  • such an analysis can be performed traditionally by a specialist linguist, or using a software algorithm of a linguistic (syntactic) processor.
  • a statistical processor neural network
  • neural network training technology it is possible to perform such an analysis using a statistical processor (neural network) through the use of neural network training technology.
  • a database of linguistic features is formed, which is the BDLP of the text elements 21 of the linguistic sentence 11. Moreover, the first part of the linguistic characteristics of 213 text elements 21 linguistic sentences 11 and their meanings 2131 forms unique linguistic features of the textual elements of 21 linguistic
  • FIG. 7 depicts a General diagram of the steps of step 103 of the formation of the second data structure SMD.
  • Step 103 is characterized by: performing step 1031 of identifying and
  • the identification data of the elements 32 which for each element 32 is, by way of example, but not limitation, the value 321 of the elements 32 of the second SMD data structure and the sequence numbers 322 of the TE of the linguistic sentence 11 constituting the elements 32 (the value and the sequence numbers of the TE of the elements 32); performing step 1033 of forming a second SMD data structure, in which a second SMD data structure is formed by combining the identified elements 31 and 32 and their identification data (values 311, 321 and serial numbers 312, 322 TE).
  • FIG. 8 by way of example, but not limitation, the general structure of the generated second SMD data structure is shown.
  • the second SMD data structure is a SMD containing elements 31 and (or) elements 32, which are the syntactic units (CE) of the linguistic sentence 11 and the CE identification data, representing for each CE, as an example, but not limitation, the value 311 element 31 and (or) value 321 of element 32, as well as serial (ordinal) number (s) 312 and (or) 322 TE 21 of the linguistic sentence constituting
  • CE syntactic units
  • the syntactic units (CE) of sentence 11 are preferably single words and groups of words connected by syntactic link.
  • the CE of the linguistic proposal 11 has their unique names characterizing them (UN CE), which have practical use, as an example, but not limitation:
  • elements 31 and 32 are referred to as unique names and, as an example, but not limited to, may be referred to as “UN CE p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN CE, not previously met in a linguistic sentence.
  • UN CE p the determination of the ordinal index of the UN CE can be demonstrated as follows.
  • CEs can consist of one word or several words.
  • a single-word CE (one text element 21 of sentence 11) is always element 31, which is the original syntactic object (ISO), that is, a sentence member established as a result of parsing.
  • ISO syntactic object
  • element 31 of the second data structure which is ISO
  • ISO it means the ISO.
  • the ISO list is not a predefined list, but a variable list, depending on predefined parameters.
  • the same word (text element 21 of sentence 11) in sentence 11 may be
  • ISO 31 will be assigned to one unique name of the syntactic units of ISO 31
  • Syntactic units of several words are sometimes ISO (element 31), and sometimes
  • predicate For example, but not limited to, the ISO “predicate” - “could be done” - consists of three text elements 21 of sentence 11 due to the linguistic features of the formation of the predicate, which, in addition to the verb “completed”, can have the auxiliary verb “to be” and modality
  • Syntactic construct 32 always consists of several words (text elements 21 of sentence 11) and is a construct of syntactically related ISOs (elements 31), as an example, but not limitation, the syntactic construction (UN SC) is
  • the identification or formation of the first element 31 of the second SMD data structure in step 1031 is performed by a comprehensive analysis of the values of 2131 linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11.
  • Elements 31 of the second SMD data structure, which are ISO are identifiable (if they consist of one TE ) or formed (if they consist of several fuel cells) within the framework of step 1031, in fact, are identified with relevant ISO.
  • Relevant ISOs are an actual list of ISOs with current linguistic characteristics, pre-installed and recorded in the first user database (first PBB), which is thus a database of current syntactic units (CE) containing relevant ISO and current SK.
  • the identification and formation (if required) of ISO elements 31 is performed by comparing the values 2131 of the linguistic characteristics 213 of the text elements registered in the database of linguistic features (BDLP) 21
  • characteristics of relevant ISO identified text element identify and, if necessary, carry out its formation as the corresponding ISO (element 31).
  • a comprehensive analysis can be performed by any method known in the art and, accordingly, will not be described in further detail below.
  • a comprehensive analysis can be performed traditionally by a specialist linguist, or using a software algorithm of a linguistic (syntactic) processor.
  • a statistical processor neural network
  • the formation of the second element 32 of the second SMD data structure within the framework of step 1032 is carried out by a comprehensive analysis of the values of 2131 linguistic characteristics of 213 text elements that are ISO (elements 31).
  • the SC Upon revealing the linguistic characteristics of the text elements that make up the ISO that correspond to the description of the syntactic structure (SC) contained in the database of relevant CEs, the SC (elements 32) are formed from the two or more ISOs mentioned (elements 31).
  • SC syntactic structure
  • (text) element (s) 21 of the linguistic sentence 11 constituting the (component) element 31 is identified as the value 311 of element 31 (ISO), and the serial number (numbers) 212 of the mentioned (mentioned) text (text) element (s) ) 21 of the linguistic sentence 11 constituting the (component) element 31, is identified as the serial number of the text element (s) constituting the (element) element 31 (ISO).
  • the identification of the value and sequence numbers of the TE of element 32 (SC) of the second SMD data structure in step 1032 is performed as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting element 32 are identified as the value 321 of element 32 (SK), and the sequence numbers 212 the said text elements 21 of the linguistic sentence 11 constituting the element 32 are identified as the serial numbers of the text elements 322 constituting the element 32 (SK).
  • Necessities are made by organizing a request to the BDLP, which is formed as part of step 102, consisting of the identification data of the TEs that make up ISO 31, and obtaining the values of 2131 linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11 of which element 31 (ISO) consists.
  • Identification of the linguistic characteristics of TEs that make up the elements 32 (SC) of the second SMD data structure and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 102, which consists of identification data of TEs that make up SC 32 and obtaining values 2131 of linguistic characteristics 213 text elements 21 of the linguistic sentence 11, of which the element 32 (SC) consists.
  • the linguistic features of the elements 31 (ISO) and 32 (SC) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 31 (ISO) and 32 (SC) are composed.
  • FIG. 9, depicts a General diagram of the steps of step 104 of the formation of the third data structure SMD.
  • Step 104 is characterized by: performing step 1041 of identifying a first element of a third DMD data structure, in which elements 41 of a third SMD data structure are identified or formed, and
  • the identification data of the elements 41 which, for each element 41, is, by way of example, but not limitation, the value 411 of the element 41 of the third SMD data structure and the serial number (s) 412 of the TE of the linguistic sentence 11 constituting the (component) element 41; performing step 1042 of forming the second element of the third SMD data structure, on which the elements 42 of the third SMD data structure are formed, as well as the identification data of the elements 42, which for each element 42, as an example, but not limitation, the value 421 of the element 42 of the third SMD data structure and serial number (numbers) 422 TE of linguistic sentence 11, constituting
  • step 1043 of the formation of the third SMD data structure in which the third SMD data structure is formed by combining the identified elements 41 and 42 and their
  • FIG. 10 by way of example, but not limitation, the general structure of the generated third SMD data structure is shown.
  • the third SMD data structure is a SMD containing elements 41 and / or elements 42, which are linguistic objects (LO) of the linguistic sentence 11 and the identification data of the LO, representing for each LO, as an example, but not limitation, the value 411 element 41 and (or) the value 421 of element 42 (the value of elements 41 and (or) 42), as well as the serial number (numbers) 412 and (or) 422 text elements 21 of the linguistic sentence constituting the (component) element 41 and (or) element 42 (orders numbered TE numbers of elements 41 and (or) 42).
  • LO linguistic objects
  • a linguistic object (LO) is a special syntactic unit (ELE).
  • the LO of the linguistic sentence 11 has their unique names characterizing them (UN LO), which have practical use as an example, but not limitation, is: "a simple sentence without homogeneous members and turns", "the first phrase” and the like.
  • elements 41 and 42 are referred to by unique names, as an example, but not limitation, can be referred to as “UN LO p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LO, not previously met in
  • LO is preliminarily formed as part of a linguological transformation, the result of which is the correlation of linguistic and logical objects and the transformation
  • the linguistic-logical transformation mechanism allows, on the basis of a previously known idea of the logical model of the sentence (the logical structure of a simple uncomplicated sentence, identical to a simple proposition) to establish a correlation (relationship) between the logical objects of the sentence and syntactic units of a sentence.
  • a table of interconnected (linguistic and logical) objects in each individual case, such EFs are formed that are the desired linguistic objects (the sought-after LO) that can be identified with the sought-after logical objects (the sought-after LogO).
  • the sought-for LO thus formed can be completely identical to one or several CEs (such a sought LO will generate the first linguistic object (the first LO), which is an element of 41 linguistic sentences 11), or it can be a derived syntactic object obtained by converting one or more CEs to an object that will be an object that is identical to the desired LO (such a sought LO will generate a second linguistic object (second LO), which is an element of 42
  • Searched LogOs can be individual logical objects or groups of logical objects that are
  • judgments (that which is affirmed or denied about the subject of judgment).
  • other logical entities can be formed that reflect the needs of the current applied problem and are used as part of the linguistic-logical transformation.
  • a predicate of a judgment separate more functionally homogeneous logical entities can be distinguished than the predicate of a proposition itself, namely, “the action of a predicate of a proposition”, “an object of a predicate of a proposition” and “circumstances of a predicate of a proposition”.
  • the identification of element 41 (first L O) of the third SMD data structure in step 1041 is performed by analyzing the composition of the desired LO.
  • the composition of the required LOs is preliminarily set in the form of a CE of a unique name (UN CE) or a list of CE of unique names with an indication of the method
  • LO which, without being limited to, can be one of the following methods: identification with the installed (several installed) CE or conversion of the installed (installed) CE according to the previously described method.
  • the aforementioned composition of the desired LO and methods of forming the LO form This is the second user database (the second PBB), which is thus the database of the sought-after LOs, which contains, among other things, the linguistic characteristics of the text elements from which the sought-after LOs are formed.
  • the analyzed LO consists of identifiable CEs (elements 31 or elements 32), then such LOs are identified (if identical to one CE) or formed (if identical to several CEs) as element 41 of the third SMD data structure.
  • the syntactic units (elements 31 or elements 32) of the second SMD data structure identified in the analysis of the composition of linguistic objects in accordance with predefined parameters
  • element 41 of the third SMD data structure contained in the description of the desired linguistic objects is identified with the first LO (first linguistic object (element 41 of the third SMD data structure)), whereby element 41 of the third SMD data structure is formed.
  • An additional part of the element 41 of the third SMD data structure can be service parts of speech (prepositions, conjunctions, particles) and punctuation marks located between syntactic units combined under the element 41 of the third SMD data structure in accordance with the method
  • the formation of the first LO set by the user. If, as a result of the analysis of the composition of a particular LO, it is established that the analyzed LO consists of converted CEs, then such a linguistic object will belong to the elements 42 of the third SMD data structure (second LO) and will be formed as part of step 1042. Formation of element 42 of the third SMD data structure ( the second LO) in the framework of step 1042 is produced by converting CE,
  • Converting CE to elements 42 of the third SMD data structure is an optional step for the present conversion method.
  • the present method of transforming a structured data array can be implemented with sufficient efficiency and accuracy even if only element 41 of the third SMD data structure is identified, provided that all the required LRs generate only the first LR that is an element 41 of linguistic sentence 11.
  • Identification of the value and serial number (numbers) of the fuel cell, element 41 (first LO) of the third DMD data structure within the framework of step 1041 is performed as follows: the value (s) of 311 or 321 elements (elements) 31 or 32 of the linguistic sentence 11,
  • serial number (s) 312 or 322 TE of the element (s) 31 or 32 of the linguistic sentence 11 identified (identified) with element 41 (first LO) is identified as the serial (serial) number (numbers) of 412 text (text) elements ( elements) constituting
  • element 41 (constituent) element 41 (first LO). If the formation of element 41 is carried out according to the requirements of the second PDU by combining several CEs, then the values and serial numbers of TE of service parts of speech are added to the values and numbers of TE of element 41 (first LO) of the third data structure of SMD
  • the identification of the value and serial (ordinal) numbers of the TE of element 42 (second LO) of the third SMD data structure within the framework of step 1042 is carried out as follows: the value (values) of the converted CE (from element (s) 31 and (or) 32 of the linguistic sentence 11), identified (identified) with element 42 (second LO),
  • element 42 (identified) with element 42 (second LO) is identified as the serial number (s) 422 of the text (text) element (s) constituting (making up) element 42 (second LO).
  • the formation of the third SMD data structure during step 1043 is performed by combining in one data structure the elements 41 of the third SMD data structure and the elements 42 of the third SMD data structure, as well as their identification data according to the principles and methods known from the prior art, which, respectively further not described in detail.
  • Identification of the linguistic characteristics of TEs that make up the elements 41 (first LO) of the third SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP, which is formed as part of step 102, consisting of TE identification data constituting the first LO 41, and obtaining the values 2131 of the linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11, of which the element 41 (the first LO) consists.
  • Identification of the linguistic characteristics of TEs that make up the elements 42 (second LO) of the third SMD data structure and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 102, which consists of identification data of TEs that make up the second LO 42 and obtaining 2131 linguistic values characteristics 213 of the text elements 21 of the linguistic sentence 11 of which element 42 (the second LO) consists.
  • the linguistic features of elements 41 (first LO) and 42 (second LO) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 41 (first LO) and 42 (second LO).
  • Step 105 is characterized by the formation of the element of the fourth data structure, in which the elements 51 of the fourth data structure of the DMD are formed, as well as the identification data of the elements 51, which for each element 51, as an example, but not limitation, the value 511 of the element 51 of the fourth data structure of the DMD and serial number (s) 512 TE of linguistic sentence 11 constituting the element 51.
  • FIG. 12 by way of example, but not limitation, the general structure of the generated fourth SMD data structure is shown.
  • the fourth SMD data structure is a SMD containing the elements 51 of the fourth SMD data structure, which are logical entities (LogO) of the linguistic sentence 11 and the LogO identification data, which for each LogO, as an example, but not limitation, the value 511 of the element 51 Fourth SMD Data Structure
  • Logical objects are logical entities and
  • the LogO of the linguistic sentence 11 has unique names characterizing them (UN LogO), which have practical use, as an example, but not restrictions - “concept”, “judgment”, “subject of judgment” (that which is affirmed or denied in the judgment), “predicate of judgment” (that
  • elements 51 are referred to by unique names, as an example, but not limitation, can be referred to as “UN LogO p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LogO previously not found in the linguistic sentence of the element in the linguistic sentence.
  • LogO as an element of the fourth data structure or element 51 of the fourth data structure, we mean the UNO LogO.
  • An array of logical objects of a sentence is a different, non-linguistic way of registering the meaning of what is being discussed in a linguistic sentence.
  • an array of logical objects allows storing the same information without loss of meaning in a divided form, in many independent places of information storage (as an array of logical objects).
  • formation of an array of logical objects allows not only to divide the single information into parts, but also to systematically structure these parts for any transformed within the framework of this method
  • search and analysis of information can technically be carried out not in a single volume of source information (linguistic sentence), but only in certain logical parts of this information, the characteristics and requirements of which correspond to the logical essence and logical subject of the search or analysis.
  • this method of storing information significantly reduces the volume (zone) of search and analysis, which leads to a decrease in time and an increase in the quality (relevance, accuracy) of search and analysis.
  • step 105 The formation of the element 51 (LogO) of the fourth SMD data structure in step 105 is performed using the third SMD data structure containing linguistic objects (LO) and a correlation database
  • third PBB third user database
  • the third PBB is formed previously for linguistic-logical conversion.
  • the third PBB is a list of the necessary logical objects that can be highlighted in a linguistic sentence and into which it can eventually be divided.
  • the third PBB contains a list of linguistic objects
  • a separate LO (from the list of LOs) is selected in the third data structure and, using the third PBB, a logical object (UNLOGO) correlated with UNLO is detected, as an example, but not limitation , choose “the first phrase” (the phrase consisting of a simple sentence without homogeneous members and turns (for example, subject) and all words dependent on it) from the third LO data structure with a unique name (UN LO))) and send this UN LO as a request to the third DBB to search for the selected UN LO in the list of unique names of LOs there.
  • the first phrase the phrase consisting of a simple sentence without homogeneous members and turns (for example, subject) and all words dependent on it
  • VL LO is detected (for example, “the first phrase”)
  • a VL of the logical object identified with it is obtained (in the given example, VL LogO is the “subject of judgment”).
  • VL LogO is the “subject of judgment”.
  • the value (s) 211 of the text element (s) 21 of the linguistic sentence 11 constituting (the components) element 41 or 42 correlated with element 51 are identified as the value 511 of element 51 (LogO), and the serial (ordinal) number (numbers) 212 of the said (mentioned) textual element (s) 21 of the linguistic sentence 11 constituting
  • element 41 or 42 correlated with element 51 is identified as ordinal (ordinal) number (s) of the text (text) element (s) 512 constituting the (component) element 51 (LogO).
  • step 105 The formation of the fourth SMD data structure during step 105 is performed by combining in one data structure the elements 51 of the fourth SMD data structure, as well as their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
  • Identification of the linguistic characteristics of TEs constituting the elements 51 (LogO) of the fourth SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP generated in step 102, consisting of TE identification data constituting LogO 51, and obtaining values 2131 linguistic characteristics of 213 text elements 21 of the linguistic sentence 11, of which consists of element 51 (LogO). Moreover, as previously described by linguistic
  • signs of elements 51 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 51 (LogO) are composed.
  • CE syntactic units
  • FIG. 13 by way of example, but not limitation, a general flow chart of the steps of the inventive SMD conversion method 200 is shown, comprising at least the syntactic units (CE) of the linguistic sentence and the identity of the CE being the source
  • the claimed method 200 for converting an SMD containing at least a linguistic sentence CE and CE identification data is characterized by: performing an identification step 201 of a transformable data structure containing a CE, in which an SMD data structure containing elements of said transformable data structure containing CE, which is the original data structure of the DMD within
  • said elements being suitable for data structure transformations are syntactic units (CE) of a linguistic sentence and CE identification data;
  • LLE identification data representing for each LLE, as an example, but not limitation: LLE value and serial (ordinal) number (s) of the Linguistic TE proposal constituting
  • elements of the said sixth structure of the SMD are groups of linguistic logical units (LLE groups) of a linguistic sentence
  • the step 204 of forming the seventh SMD data structure which forms the seventh SMD data structure, which is the final SMD data structure for the method 200 under consideration, containing elements of the seventh SMD data structure, said elements of the seventh SMD data structure being the main linguistic-logical objects ( OLLO) a linguistic sentence formed from LLE groups by eliminating homogeneities in LLE groups, and also represent the identification data of the LLLE, representing amounts to the each OLLO, as an example, but not limited to: the value of OLLO and serial (serial) number (s) TE linguistic offer amounts to the each OLLO, as an example, but not limited to: the value of OLLO and serial (serial) number (s) TE linguistic offer amounts
  • FIG. 14 by way of example, but not limitation, a general flowchart is shown for performing a transformable data structure containing syntactic unit (CE) data structure 201 that is the original data structure for the method 200 in question.
  • 201 is a process for identifying a data structure suitable for conversion containing CE, on which the elements 22 of the data structure suitable for transformation containing CE are identified, as well as the identification data of the elements 22, which are for of each element 22, by way of example, but not limitation, the value 221 of element 22 is suitable for converting a data structure containing CE and serial number (s) 222 of the TE of the linguistic sentence 11 constituting (constituting) element 22.
  • the original data structure is a DMD containing elements 22 of a transformable data structure containing CE,
  • CE syntactic units
  • CE identification data representing for each CE
  • the value 221 of element 22 is suitable for converting a data structure containing CE and serial number (s) 222 of the linguistic proposals constituting (constituting) the CE, which, by way of example, but not limitation, have been described previously with reference to FIG. 8 of the method 100.
  • Elements 22 of the linguistic sentence 11 have their unique names characterizing them, having practical use, as an example, but not limitation: “subject”,
  • CE Predicate, "direct complement” and the like.
  • elements 22 are referred to by unique names and, as an example, but not limited to, may be referred to as “UN CE p”, where n> 1 is the index number of the unique name element in the linguistic sentence, starting with “1” for each new CE not previously seen in a linguistic sentence.
  • CE can be of two types: source syntactic objects (ISO), that is, syntactic units - members suggestions identified by parsing, and
  • Elements 22 of a transformable data structure containing CE are a plurality of ISO
  • ISO 22 in a transformable data structure containing CEs are separate elements prepared in advance and placed in a convertible data structure containing CE in the form of a structured array (list, list, etc.) ) individual ISO.
  • a structured array list, list, etc.
  • the identification of the elements 22 of the transformable data structure containing the CE during step 201 is reduced to the classification of the elements of which the transformable data structure containing the CE consists of the original syntax objects (ISO 22).
  • ISO 22 original syntax objects
  • individual ISO 22s have a value of 221 and a serial (serial) number
  • the value 221 of ISO 22 is one or more text elements (TE 21) of proposal 11 of which ISO is composed.
  • ISOs consist of one TE 21, with the exception of some ISOs.
  • the ISO “predicate” may consist of three TE 21 - “could be completed.”
  • the ISO “predicate” consists of three text elements due to the linguistic features of the formation of the predicate, which, in addition to the verb “completed”, can have the auxiliary verb “to be” and modality
  • the identification of the value 221 of the element 22 (ISO) suitable for converting the data structure containing the CE during step 201 is performed by registering the character set of the TE 21 of proposal 11 constituting
  • (constituent) element of ISO 22 The identification of the ordinal (ordinal) number (s) of 222TE, constituting (constituent) element 22 (ISO) of a suitable data structure containing CE during step 201 is performed by registering the ordinal (ordinal) number (s) mentioned TE in accordance with its (their) location in the linguistic sentence, provided that the first TE in the linguistic sentence has a serial number of "1", and all subsequent TE have a serial number greater by one than the serial number of the previous TE.
  • a transformable data structure containing CE that is the starting point for the present conversion method 200 is the result of a plurality of elements 22, their values 221 and sequence numbers 222 of the FCs constituting the elements 22 identified in step 201.
  • Identification of the linguistic characteristics of TEs constituting elements 22 (ISO) of a data structure suitable for transforming CE and their values, if necessary, is carried out by organizing a request in BDLP generated in step 102, which consists of identification data of TEs that comprise ISO 22, and obtaining the values 2131 of the linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11 of which the element 22 (ISO) consists. Moreover, as described previously,
  • the linguistic features of elements 22 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11 of which the elements 22 (ISO) are composed.
  • FIG. 16 by way of example, but not limitation, a general flowchart is shown of the steps of forming the fifth SMD data structure 202, which is the first data structure for the method 200 under consideration.
  • Step 202 is characterized by: performing step 2021 of generating values 2141 of the second part of linguistic characteristics 214 of text elements 21 constituting elements 22 of a transformable data structure containing CE on which values 2141 of the second part are formed
  • step 2021 by performing step 2022 of generating values 2231 of the third part of the linguistic characteristics 223 of the text elements 21 constituting the elements 22 of a transformable data structure containing CE on which the types of element 22 are identified suitable for transformation of a data structure containing CE for which it is necessary to change some values of linguistic characteristics, the mentioned values of 2231 of the third part of linguistic
  • FIG. 17 by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated in step 2021 is shown, which is BDLP of the text elements 21 of the linguistic sentence 11 contained in the elements 22 suitable for transforming a data structure containing CE.
  • the BDLP generated in step 2021 differs from the BDLP generated in step 102 in the presence of values 2141 of the second part of the linguistic characteristics 214, indicating
  • the syntactic role of ISO 22 is the function of a word in a sentence, which is defined as part of the interconnections of words in a sentence.
  • the syntactic role of ISO 22 determines which member of the sentence is a word, and in what syntactic relations it consists of other words. One and the same form of a word can fulfill different functions, that is, be different members of a sentence.
  • the logical role of ISO 22 is a syntactic role identified with the logical function of a word in a simple proposition. View
  • a simple proposition is a logical entity, which is the primary logical construction of thinking, necessarily containing elements of a simple proposition - the subject of the proposition
  • the predicate of judgment (that which is affirmed or refuted about the subject of judgment).
  • the subject of judgment is one object of the world
  • the predicate of judgment consists usually of an action and many objects that are in a certain relationship with each other, which ultimately performs the function of a predicate of judgment, that is, it explains what is affirmed or disproved about the subject of judgment. Therefore, the predicate of judgment can be divided into logical functionally homogeneous parts (logical objects), as an example, but not restrictions, such as an action, an object, and
  • the formation of the second part of the linguistic characteristics 214 and their values 2141 for the text elements 21 of the linguistic sentence 11 contained in the elements 22 in order to identify the syntactic-logical identity of ISO 22 at step 2021 is performed by checking the ISO 22 for the identity of the syntactic and logical roles in the linguistic Proposition 11.
  • the check is a comparison of the values 2131 of the first part of the linguistic characteristics 213 of the text elements 21 constituting the elements 22 with the predefined values of the predefined linguistic characteristics of the text elements 21 constituting the ISO 22.
  • Conditions are predefined for the verification, such as, as example but not
  • ISO 22 with matching syntactic and logical roles SL-identical ISO 22, that is, syntactically logical identical ISO.
  • ISO 22 which do not pass the test because their roles do not match, are identified as ISO 22 with mismatched syntactic and logical roles (SL non-identical ISO 22, i.e. syntactically logical non-identical ISOs).
  • SL non-identical ISO 22 i.e. syntactically logical non-identical ISOs
  • the ISO in the form of a verb has a syntactic role - the "predicate”, and the ISO in the form of participle - the syntactic role of the "agreed definition".
  • both the ISO and the other are syntactically the main words in the same element of a simple proposition “the action of the predicate of proposition”, that is, they have the same logical role.
  • the ISO in the form of a verb passes the verification of the identity of the syntactic and logical roles, since the “verb” is what expresses the action.
  • ISO in the form of a verb passes the verification of the identity of the syntactic and logical roles, since the “verb” is what expresses the action.
  • BDLP database of linguistic features
  • SL-identical ISO 22 can be mutable and unchanged, that is, such SL-non-identical ISO 22, for which, in accordance with a predetermined the condition must be changed 2131 values of some linguistic characteristics 213 or not changed.
  • SL-non-identical ISO 22 can be mutable and unchanged, that is, such SL-non-identical ISO 22, for which, in accordance with a predetermined the condition must be changed 2131 values of some linguistic characteristics 213 or not changed.
  • the first type of ISO 22 (SL-identical) retains all of their original values 221 and numbers of text elements 222, as well as their linguistic characteristics 213 and 214 with values of 2131 and 2141. In this regard, the values of 2231 linguistic characteristics 213 for such ISO 22 are absent.
  • ISO 22 (SL-non-identical variable), their original value 221 and the numbers of text elements 222, as well as the second part of their linguistic characteristics 214 with values of 2141, remain unchanged, but the values of 2131 of some linguistic characteristics 213 of the first part are changed.
  • the values 2231 of the linguistic characteristic 223 instead of the variable values 2131 of some linguistic characteristics 213 of such ISO 22 are indicated as established in the fourth PBB.
  • the third type of ISO 22 (SL non-identical unchanging) retains all their original values 221 and text element numbers 222, as well as their linguistic characteristics 213 and 214 with values 2111 and 2141.
  • transformations of the data structure containing CE are introduced into the BDLP of the text elements 21 of the linguistic sentence 11, which is formed as part of the step 2021, thus forming the BDLP of the text elements 21 of the linguistic sentence 11, which is formed as part of the step 2022. Moreover, all three parts (213, 214 and 223) linguistic characteristics of text elements 21
  • FIG. 19 by way of example, but not limitation, the general structure of the generated fifth SMD data structure is shown, which is the first for the present conversion method 200.
  • the fifth SMD data structure is shown, which is the first for the present conversion method 200.
  • linguistic sentence 11 and LLE 61 identification data representing for each LLE, as an example, but not limitation, the value 611 of element 61 of the fifth data structure and the serial number (s) of 612 TEs representing (constituent) LLE 61.
  • U LLE 61 of the linguistic sentence 11 there are unique names characterizing them (UN LLE), which have practical use as an example, but not restrictions: “subject”, “predicate”, “direct complement” and the like.
  • elements 61 are referred to by unique names, and, as an example, but not limitation, can be referred to as “UNLLE p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LLE, not previously seen in a linguistic sentence.
  • a linguistic-logical unit (LLE 61) is a syntactic unit of the ISO type, by which a check is made for the identity of its syntactic and logical roles in a linguistic sentence. There can be two types of LLE 61: the first type is
  • the second type of LLE 61 corresponds to all ISO 22 suitable for transformation of the structure data containing CE.
  • the second type of LLE 61 corresponds to those of ISO 22 suitable for the conversion of the data structure containing CE, which are assigned to the fourth type (duplicate of SL-identical identical unchanged ISOs), indicated in the value 2231 of the third part of the linguistic characteristics 223.
  • the identification and generation of elements 61 of the fifth DMD data structure during step 2023 is based on the results of step 2022 to identify the types of elements 22 suitable for converting the data structure containing CE.
  • the identification of the elements 61 (LLE) of the first type at step 2023 is carried out by identifying them with the elements 22 (ISO) of the first, second and third types.
  • ISO 22 identified at step 2022 as the fourth type form new elements - elements 61 of the second type of the fifth data structure of the DMD.
  • the formation of the elements 61 (LLE) of the second type at step 2023 is carried out by identifying them with the elements 22 (ISO) of the fourth type.
  • identified with the first type of ISO 22 is carried out in step 2023 by identifying the value 611 of element 61 with the value 221 of element 22 of the first type, and the serial number (s) of 612 FCs that make up the element 61 by identifying with the ordinal ( serial) number (numbers) 222 TE, constituting (constituent) element 22 of the first type.
  • the identification of the value and serial number of the TE element 61 of the first type of the fifth SMD data structure, identified with the second type of ISO 22, is carried out in step 2023 by identifying the value 611 of the element 61 with the value 221 of the element 22 of the second type, and
  • the identification of the value and the ordinal number (s) of the TE element 61 of the first type of the fifth SMD data structure identified with the third type of ISO 22 is performed as part of step 2023 by identifying the value 611 of the element 61 with the value 221 of the element 22 of the third kind, and the ordinal ( serial) numbers (numbers) of 612 text elements 21 constituting element 61, with serial (ordinal) number (numbers) 222 of TEs constituting (constituting) element 22 of the third kind.
  • Identification values and serial (serial) numbers (numbers) of TE element 61 of the second type of the fifth data structure of the SMD, identified with the fourth type of ISO 22, is performed as part of step 2023 by identifying the value 611 of element 61 with the value 221 of element 22 of the third type, and the ordinal (ordinal ) numbers (numbers) 612 ⁇ of the component (constituent) element 61, with serial (ordinal) number (numbers) 222 of the TE, constituting (constituent) element 22 of the third kind.
  • the formation of the fifth SMD data structure during step 2023 is performed by combining in one data structure the elements 61 of the first and second types of the fifth SMD data structure and their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
  • Identification of the linguistic characteristics of TEs that make up the first or second elements 61 (LLE) of the fifth SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP generated in step 2022, consisting of TE identification data constituting the first or second element 61 (LLE), and obtaining values (2131, 2141, 2231) of all parts of the linguistic characteristics (213, 214, 223) of the text elements 21 of the linguistic sentence 11 of which the first or second element 61 (LLE) consists.
  • the linguistic features of the first and second elements 61 (LLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 61 (LLE) are composed.
  • Step 203 is characterized by: performing step 2031 of generating values 2151 of the fourth part of the linguistic characteristics of 215 text elements 21 constituting elements 61 of the fifth SMD data structure, on which values 2151 of the fourth part of the linguistic characteristics 215 of the text elements 21 constituting the elements 61 are generated and the results obtained from SIC BDLP in the text linguistic elements 21 Proposition 11 that is generated in phase in 2022, forming eventually BDLP text elements 21 linguistic sentence 11 formed in the framework of step 2031; performing step 2032 of forming elements of the sixth SMD data structure, on which the elements of the sixth SMD data structure are formed, as well as the identification data of the elements 71, which for each element 71, as an example, but not limitation, the value 711 of the element of the sixth SMD data structure and serial number (s)
  • BDLP database of linguistic features
  • step 2031 is the BDLP of text elements 21 of the linguistic sentence 11 contained in elements 61 of the fifth data structure of the SMD.
  • BDLP generated in step 2031 differs from BDLP generated in step 2022 in the presence of values 2151 of the fourth part of linguistic characteristics 215, indicating the level of syntactic significance of element 61 (LLE).
  • the level of syntactic significance of element 61 (LLE) characterizes the location of LLE in the syntactic tree of the linguistic sentence 11.
  • the syntactic tree is the syntactic relationship diagram of sentence 11, in which a subordinate is established between individual words (LLE)
  • the syntax tree may contain an indefinite amount
  • the syntax tree used in the present method contains elements (LLE) of at least three levels of syntactic significance (HSS).
  • LLE elements of at least three levels of syntactic significance (HSS).
  • HSS syntactic significance
  • the second HSS includes LLEs, which are direct syntactic descendants of syntactic vertices.
  • the third HSS includes all other LLE linguistic
  • a syntactic vertex is a syntactic unit (LLE) having the syntactic role of “predicate”.
  • a feature of LLE “predicate” is that it can consist of three words.
  • a direct syntactic descendant of a syntactic vertex is a syntactic unit (LLE), which has a direct subordinate relationship with the word of a LLE group of the first level. Establishing the syntactic level of LLE is the syntactic structuring of LLE.
  • characteristics of 215 elements 21 constituting elements 61 of the fifth SMD data structure are entered into the BDLP of the text elements 21 of the linguistic
  • the general structure of the sixth SMD data structure generated is shown, which is the second data structure for the present conversion method 200.
  • the sixth SMD data structure is a SMD containing elements 71, which are structured groups of linguo logical units (LLE groups) of the linguistic sentence 11 and the identification data of LLE groups, representing for each LLE group, as an example, but not limitation, the value 711 of element 71 of the sixth string data structures and
  • LLE groups 71 of the linguistic sentence 11 do not have unique names characterizing them (CN LLE groups) that have practical use.
  • elements 71 by way of example, but not limitation, can be referred to as “LLE group 1”, “LLE group 2”, “LLE group 3”, “LLE group n”, where n> 1 is the element serial number in linguistic sentence.
  • LLE Linguistic Proposal Group 11 these are syntactic units of the “syntactic construction” form, which are formed from linguo-logical units (elements 61 of the fifth SMD data structure) of different levels of LLE syntactic significance.
  • the first LLE group (first elements 71 of the sixth SMD data structure) includes the main LLEs of the first LLE group, which are the mentioned syntactic vertices (LLE of the first HSS), and other LLEs of the first LLE group (LLE groups 1), which are successively subordinate LLEs, the first of which it has a direct subordinate relationship with the LLE of the first HSS, up to the LLE, which is the main LLE of the second group of LLE.
  • the second LLE group (second elements 71 of the sixth SMD data structure) is referred to as the main LLE of the second LLE group, which are mentioned by the LLE of the second HSS, provided that such LLE has the syntactic role of the subject or any secondary member of the sentence, except for the definition (excluding definitions in the form
  • LLEs of the second LLE group which are successively subordinate to LLEs, the first of which is LLE of the third HSS, which have a direct subordinate connection with the mentioned main LLE of the second LLE group, up to the last LLEs in the LLE chain with continuous subordinate communication.
  • identification of the main LLE of the first and second LLE groups as well as identification of other LLE of the first and second LLE groups.
  • To identify the main LLEs of the first LLE groups it is necessary to identify all the LLE “predicate” (including all parts of each LLE “predicate”) of the analyzed sentence.
  • To identify the main LLEs of the second LLE groups it is necessary to identify all LLEs that have a direct syntactic connection with any part of the LLE “predicate” and which at the same time have the syntactic role of the subject or any secondary member of the sentence, except for the definition (excluding definitions in the form
  • first elements 71 of the sixth SMD data structure is performed by combining the identified main LLE of the first group LLE and other LLEs for this main LLE.
  • the formation of the second elements 71 of the sixth SM data structure is performed by combining the identified main LLE of the second LLE group and other LLEs for this main LLE.
  • Identification of the value and serial number (s) of the TE of the first element 71 (first group of LLEs) of the sixth SMD data structure as part of step 2032 is performed as follows: the value (values) 211 of TE 21 of the linguistic sentence 11 constituting (components) element (s) 61 of which (of) the first element 71 consists,
  • the identification of the value and serial number of the TE of the second element 71 (second group of LLEs) of the sixth SMD data structure as part of step 2032 is carried out as follows: the value (values) 211 of TE 21 of the linguistic sentence 11 constituting the element (s) ) 61, of which (of which) the second element 71 consists,
  • Identification of the linguistic characteristics of TE comprising the first or second elements 71 (the first or second group of LLEs) of the sixth SMD data structure and their values, if necessary, by organizing a request in the BDLP generated in step 2031, consisting of the identification data of the FCs constituting the first or second element 71 (the first or the second group LLE), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the first or second element 71 consists (the first or second group LLE )
  • the linguistic features of the first and second elements 71 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 71 (LLE groups) are composed.
  • Step 204 is characterized by: performing step 2041 of identifying the types of elements 71 of the sixth SMD data structure indicating the presence in element 71 of the complications of the linguistic sentence, on which
  • SMD data structures and their identification data representing for each non-transformed element 81, as an example, but not limitation, the value 811 of the non-transformed element 81 of the seventh SMD data structure and the serial number (s) of 812 TE linguistic sentences 11 constituting ( constituents) the unreformed element 81 (the value and serial numbers of the TE of the unreformed element 81);
  • the identification data of the transformed elements 81 which for each transformed element 81, is, by way of example, but not limitation, the value 811 of the transformed element 81 of the seventh SMD data structure and the serial number (s) of the 812 TE linguistic sentence 11 constituting (components) transformed item 81 (the value and serial numbers of the TE of the converted element 81); the execution of step 2043 of the formation of the seventh data structure of the SMD, which forms the seventh data structure of the SMD from the converted elements 81 and non-converted elements 81 of the seventh data structure of the SMD.
  • the seventh SMD data structure is a SMD containing untransformed elements 81 and transformed elements 81, which are basic linguistic-logical objects (LLL) of the linguistic sentence 11.
  • LLL basic linguistic-logical objects
  • the LLLL of the linguistic sentence 11 has their unique names characterizing them (UNOLLO), which have practical and use, as an example, but not limitation: "subject of judgment", "predicate of judgment” and the like.
  • elements 81 are referred to by unique names, and, as an example, but not limitation, can be referred to as “UNOLLO p,” where n> 1 is the index number of a unique name element in a linguistic sentence, starting with “1” for each new UN OLLO, not previously seen in a linguistic sentence. Further, at
  • OLLO as an element of the seventh data structure means UN OLLO.
  • the main linguistic and logical objects of a sentence are a borderline entity with signs of both linguistic and logical objects.
  • An entity is an object in a computer system that contains a set of critical rules.
  • the main linguistic-logical object is a syntactic unit of the form “syntactic construction”, which can be formed from a structured LLE group by heterogenizing the LLE group.
  • the heterogenization of the LLE group is the elimination of homogeneities in the syntactic structure by identifying the syntactic compositional connection in it and transforming the syntactic structure with
  • a compound link is a link between syntactically equal units of a sentence (in this case, between LLEs) that have the same syntactically main word (main LLE) and the same syntactic role (syntactic role of LLE). LLE between which identified
  • OLLOs are logical entities (objects) that are elements of simple judgment, with the help of which they form and convey the idea that something (a predicate of judgment) is affirmed or
  • the predicate of judgment can be divided into three logically separable logical entities (objects) - the action of the predicate of judgment, the object of the predicate of judgment and the circumstances of the predicate of judgment.
  • objects logically separable logical entities
  • the elements of simple proposition mentioned above for example can be
  • ALLOs are a generalized conceivable (semantic) image of an element of simple judgment.
  • the identification of elements 71 of the first or second type of the sixth SMD data structure in step 2041 is performed by analyzing the linguistic characteristics of the text elements of the sixth SMD data structure constituting element 71 (LLE group), with the aim of identifying syntactic compositional links in the LLE group 71.
  • the composing link between text elements (words, LLE) in the LLE 71 group is identified if the same LLE (words) have the same syntactic parent (the syntactically main word that has a direct syntactic subordinate link to such LLE (words)).
  • Additional conditions may be the presence of the same syntactic role for such LLEs (words), as well as the presence of a sign of a relationship between such LLEs (words), namely a comma or a compound union.
  • Comparative unions are divided by value into connectives (“and”, “yes” in the meaning of “and”, “neither ... nor”, “also”, “too”, “both ... and”), separation (“ or “,” or ... or “,” either “,” either ... or “,” then ... then “,” either ... or “,” not that ... not that “ ) and opposing (“a”, “but”, “however”, “yes” in the meaning of “but”), including comparative ones (“not only ... but also”, “not only ...
  • the identified first type of element 71 of the sixth SMD data structure is identified with the non-transformed element 81 of the seventh SMD data structure.
  • the generation of the transformed elements of the seventh SMD data structure (the transformed elements 81 obtained from the second kind of elements 71) at step 2042 is performed based on the syntactic writing link identified at step 2041 and homogeneous members by converting the identified elements 71 of the second type of the sixth SMD data structure.
  • the meaning of the transformation of the second type element 71 at step 2042 is to heterogenize the LLE group, that is, eliminate syntactic homogeneities in the LLE group by forming from the second type element 71 many new LLE groups identical in uniformity to the first type element 71. Moreover, each new LLE group of the said set can contain only one of the mentioned homogeneous members (if the element 71 of the second type contains one row of homogeneous members) or only one unique combination of the said homogeneous members of different rows of homogeneous members (if the element 71 of the second type contains several rows of homogeneous members). Many LLE groups formed from an element 71 of the second type are heterogeneous OLLO (transformed elements 81), that is, formed from one group of LLE 71 of the second type by its heterogeneous transformation
  • heterogenization The heterogenization process of elements of the second type 71 can be carried out, as an example, but not limited, as follows: at the first stage, rows of homogeneous members in the analyzed element 71 of the second type are revealed; in the course of identifying rows of homogeneous members, the rows of homogeneous members themselves and serial numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member (LLE-OCH) are revealed; at the second stage, chains of homogeneous members are revealed for each identified LLE-OCH element 71 of the second type; in this case, chains of homogeneous members (chains of OCh) are LLE-OCH and a dependent chain of OCH (a chain of syntactically related LLEs, starting from the first syntax descendant of LLE-OCH (syntactically dependent word) and continuing along the chain of syntactic dependence (according to syntactic subordinate relationship) to another LLE-OCH or to the last LLE
  • LLE syntax descendant in dependent chain 04 which is not included in dependent chain 04; those chains 04 that have dependent chains 04 without a syntactic descendant outside dependent chain 04 are considered extreme chains of homogeneous members (extreme chains 04), and those chains 04 that have dependent chains 04 with syntactic descendant outside dependent chain 04 are considered internal chains of homogeneous members (internal chains 04);
  • the LLE of an element 71 of the second type is detected that are not included in the chains of homogeneous members (LLE outside the chains 04);
  • replaceable dependent chains (replaceable LC) of the element 71 of the second type are formed; at the same time, a replaceable LC is the basis of the transformed elements 81, consisting of one extreme chain 04 and internal chains 04, if such internal chains 04 along a chain of continuous syntactic subordinate communication exist between the extreme chain 04 and LLE outside chains 04;
  • heterogeneous basic linguistic-logical objects (ALLO) are formed; at the same time, heterogeneous basic linguistic-logical objects (
  • the identification of the types of elements 71 of the sixth SMD data structure in step 2041 does not change the value 711 of element 71 and does not change the sequence numbers of the text elements 21 of the linguistic sentence 11 constituting element 71 (LLE group).
  • the identification of the value and the ordinal number (s) of the TE of the non-transformed element 81 (OLLL) of the seventh SMD data structure as part of step 2041 is performed as follows: the value (values) 211 of the TE 21 of the linguistic sentence 11 constituting the element 71 of the first kind of the sixth
  • the SMD data structures are identified as the value 811 of the non-transformed element 81 (OLLL), and the serial number (s) 712 of the TE 21 of the linguistic sentence 11 constituting the (element) element 71 of which the non-transform
  • This element 81 is identified as ordinal (ordinal) number (s) 812 of the fuel cell constituting the (s) non-transformed element 81 (OLLO).
  • subordinate remote LLE-OCH composing unions or punctuation marks are identified as the value 811 of the transformed element 81 (ALLO), and the serial number (s) 212 TE 21 linguistic
  • LLE-OCH separate (s) part (s) of the element 71 of the second type (LLE-OCH), which (which) was (were) deleted (deleted) during heterogenization, and signs of communication of the deleted LLE-OCH (syntactically subordinate to the remote LLE-OCH joint unions or punctuation marks) are identified as the serial number (s) of 812 TEs that make up the transformed element 81 (heterogeneous OLLO).
  • the first of the combined elements of the seventh SMD data structure is the element identified in step 2041 as an element of the first kind 71, which is an unreformed element 81, that is, ALLO 81, which coincides with the group LLE 71 without syntactic juxtaposition.
  • the second of the combined elements of the seventh SMD data structure are transformed elements 81, formed in step 2042 as a set of transformed elements 81, which are heterogeneous OLLO, formed from an element 71 of the second kind (LLE groups with syntactic co-linking) by heterogenizing LLE groups of the second kind.
  • the linguistic features of elements 81 (ALLO) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which elements 81 (ALLO) consist.
  • FIG. 25 depicts a General diagram of the steps of the claimed method 300 for converting SMD containing at least the main linguistic-logical objects (LLL) of a linguistic sentence and LLL identification data,
  • the LLLO of the linguistic sentence and the identification data of the LLLF is characterized by: performing the identification step 301 of a suitable data structure containing the LLLF, on which
  • identifying the SMD data structure containing elements of said transformable data structure containing OLLO which is the original SMD data structure within the framework of the method 300 in question, said elements of the transformable data structure being the main linguistic-logical objects (OLLL) Linguistic Suggestions and Identity OLLO; performing the step 302 of forming the eighth data structure of the SMD, which forms the eighth data structure of the SMD, which is the first data structure of the SMD for the method 300 under consideration, containing elements of the said eighth data structure of the SMD, the elements of the eighth data structure of the SMD being the original simple linguistic logical constructions (IP LLK) linguistic sentences,
  • IP LLK simple linguistic logical constructions
  • the identification data of the IP LLK representing, for each IP, LLK, as an example, but not limitation: the value of the IP LLK and serial numbers of TE linguistic sentences that make up the IP LLK; performing step 303 of generating the ninth SMD data structure, which forms the ninth SMD data structure, which is the second SMD data structure for the method 300 under consideration, containing elements of the ninth SMD data structure, said elements of the ninth SMD data structure being simple linguistic-logical constructions (PLCK ) linguistic sentences formed from IP LLK by eliminating homogeneities in IP LLK, and also represent PLCK identification data,
  • PLCK simple linguistic-logical constructions
  • the eleventh DMD data structure in which the eleventh SMD data structure is formed, which is the final SMD data structure for of the method 300 under consideration, containing elements of the eleventh SMD data structure, said elements of the eleventh SMD data structure being complex linguistic-logical constructions (SLLC) of a linguistic sentence formed from the SLC information system by eliminating uniformities in the SLC information system, as well as the SLC data identification data representing, for each SLLK, as an example, but not limitation: the value of SLLK and serial numbers of TE linguistic
  • FIG. 26 by way of example, but not limitation, a general flowchart of an identification step 301 suitable for
  • Step 301 is characterized by identifying suitable for the conversion of the data structure containing LLLO, on which
  • 911 element 91 is suitable for converting a data structure containing OLLO and serial number (s) 912 TE
  • FIG. 27 depicts the General data structure that is the source for the present method
  • transform 300 which is a transformable data structure containing basic linguistic logic objects (LLLO).
  • the original data structure is a DMD containing elements 91 of a transformable data structure containing OLO,
  • OLLO identification data representing, for each OLLO, as an example, but not limitation, the value of 911 element 91 is suitable for converting the data structure containing OLLO and serial number (s) 912 TE linguistic sentences constituting
  • (constituent) OLLO which, by way of example, but not limitation, have been described previously with reference to FIG. 24 ways 200.
  • Element 91 of the linguistic sentence 11 has unique names that characterize them (CN OLLO), having practical use as an example, but not limitation: “subject of judgment”, “action of predicate of judgment” and the like. Elements 91 are called unique in the data structure.
  • OLLOs are syntactic unit of the form “syntactic construction”, which can be formed from structured LLE groups; logically, OLLOs are elements of simple judgment, with the help of which something is affirmed or refuted about the subject of judgment; from a semantic point of view, OLLOs are a generalized conceivable (semantic) image of an element of simple judgment.
  • Elements 91 of a transformable data structure containing ALLO constitute a plurality of LLLOs of unique names (UNOLLO) of linguistic sentence 11.
  • ALLO 91 in a transformable data structure containing ALLO are separate elements prepared in advance and placed in a transformable data structure containing OLLO in the form of a structured array (list, list, etc.) of individual OLLOs.
  • a structured array list, list, etc.
  • Proposals 11 of which OLLO is composed are composed.
  • the specified entity can be linguistically expressed through one, two or three TE.
  • Proposals 11, of which the OLLL 91 is composed are composed.
  • the identification of the serial number (s) of 912 TEs of which (of which) the element 91 (OLLL) is suitable for transforming the data structure containing the OLLL, during step 301, is performed by registering the ordinal ( serial) numbers (numbers) of the mentioned TE in accordance with their location in the linguistic sentence, provided that the first TE in the linguistic sentence has the number "1", and all subsequent TEs have a sequence number greater than one by a sequence number, previous present TE.
  • a convertible data structure comprising
  • OLLO which is the source for the present method of conversion 300 is a result of a multitude of elements 91, their values 911 and
  • sequence numbers 912 TE constituting the elements 22 identified at step 301.
  • Identification of the linguistic characteristics of TEs comprising elements 91 (ALLO) suitable for transforming the data structure containing ALLO, and their values, if necessary, is carried out by organizing a request into the BDLP generated in step 2031, consisting of the identification data of TEs constituting element 91 (ALLO), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the element 91 (ALLO) consists. Moreover, as described previously,
  • the linguistic features of elements 91 are at least the morphological, syntactic, and semantic characteristics of textual elements 21 of the linguistic sentence 11 of which elements 91 ( ⁇ LLO) are composed.
  • FIG. 28 by way of example, but not limitation, a general flowchart is shown of the steps of step 302 of generating the eighth SMD data structure, which is the first data structure of the method 300 in question.
  • Step 302 is characterized by: performing step 3021 of generating values 2161 of the fifth part of the linguistic characteristics of 216 elements 21, constituent elements 91 suitable for transforming a data structure containing OLLL which form values 2161 of the fifth
  • step 3022 of forming the elements of the eighth data structure of the SMD on which the elements 12 of the eighth data structure of the SMD are formed, as well as the identification data of the elements 12, which for each element 12, as an example, but not limitation, the value 121 of the element 12 of the eighth data structure of the SMD and serial numbers 122 TE of the linguistic sentence 11 constituting the elements 12, and form the eighth data structure of the DMD.
  • BDLP database of linguistic features
  • FIG. 29 by way of example, but not limitation, the general structure of the database of linguistic features [BDLP] generated in step 3021 is shown, which is BDLP of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing OLL.
  • the BDLP generated in step 3021 differs from the BDLP generated in step 2031 in the presence of values 2161 of the fifth
  • OLLO is a syntactic construct, it is natural that in one sentence some syntactic constructs relative to other syntactic constructs, if there is a syntactic subordinate relationship between them, are syntactically main or syntactically dependent. According to this principle, some OLLOs can be syntactically main (main OLLOs), while others can be syntactically dependent (dependent OLLOs). the linguistic characteristics of 216 text elements 21 of the linguistic sentence 11 that make up OLLL 91 and their meanings 2161 is reduced to
  • the syntactic role of OLLO is identified with the syntactic role of the main LLE in OLLO 91. Using the value 2161 of the fifth part of the linguistic characteristics of the 216 elements 21 that make up OLLO 91, all OLLO 91 are divided into main OLLO 91 and dependent OLLO 91.
  • 216 and their values 2161 during step 3021 are produced by analyzing the existing linguistic features of element 91.
  • the following actions can be performed: at the first stage, in all OLLO 91, the main LLE is syntactically identified; at the second stage, among the linguistic features of the main LLEs of the mentioned OLLL 91, the linguistic characteristic responsible for the syntactic role is identified
  • the eighth SMD data structure is a SMD containing elements 12 of the eighth SMD data structure, which are the original simple linguistic-logical constructions (IP LLK 12) of the linguistic sentence 11 and identification data of the IP LLK, representing for each IP LLK, as an example, but not limitation, the value121 element 12 of the eighth data structure and the sequence numbers of the text elements 122 constituting the LC LLK (the value and sequence numbers of the TE element 12).
  • IP LLK 12 the original simple linguistic-logical constructions
  • IP LLK-1 IP LLK-2
  • IP LLK-3 IP LLK-n
  • IP LLK is a syntactic unit of the form “syntactic construction”, formed from ALLO by combining ALLO on the basis of the presence of direct syntactic subordinate or composing connection between ALLO.
  • IP LLK is a separate initial simple sentence or an initial simple sentence as part of the initial complex sentence.
  • the initial simple sentence in the IP LLK may contain homogeneous members, that is, words between which there is a syntactic compositional connection.
  • IP LLK is a logical entity that expresses a simple proposition (non-quantifier proposition), which is the primary
  • the predicate of judgment can be divided into three logically separable entities - the action of the predicate of judgment, the object of the predicate of judgment, and the circumstances of the predicate of judgment.
  • the elements of simple judgment mentioned for an example can be identified with individual UNOLLO (unique name OLLLO), from which the IP LLK is formed.
  • the quantity of a simple judgment is determined by its "quantitative characteristic", that is, the presence or absence of unambiguity in a simple proposition.
  • Unambiguous simple judgments are quantified simple propositions in which the quantifier index is always defined and equal to unity, that is, each element of a simple proposition has no variability, is always unambiguous.
  • the unambiguity of a simple judgment is manifested through the presence in the composition of a simple judgment of the elements of a simple judgment of one unique denomination (UN) in
  • a single quantity for example, not limited to, one subject of a judgment, an object of a judgment predicate, an action of a judgment predicate, or one
  • An example of an unambiguous simple judgment is the following proposition: “The goods must be transferred to the buyer by the seller”. This simple judgment does not allow any ambiguity - only “goods”, only “must be transferred”, only
  • ambiguous The ambiguity of a simple proposition is manifested by the fact that a simple proposition contains several elements of a simple proposition of one unique denomination (UN) (for example, but not limited to, several subjects of the proposition and (or) objects of the predicate of the proposition and (or) the actions of the predicate of the proposition and (or) several similar circumstances judgment predicate).
  • UN unique denomination
  • An example of an ambiguous simple judgment can be the following proposition: “The goods must be transferred to the buyer by the seller or manager of the company.” This simple judgment is ambiguous due to the presence in it of two elements of a simple judgment with the same CN - the subjects of judgment are “seller” and “company manager”, to each of which You can apply the predicate of the judgment "must transfer the goods to the buyer.” If simple judgments in a certain array of simple judgments (a separate, separate group of simple judgments) have the same quantitative characteristic (the quantifier is equal to one or more than one), then regardless of the type of quantifier of a simple proposition (unambiguous or ambiguous) simple judgments of such an array are “quantifier”. If simple judgments in a certain array of simple judgments (a separate, separate group of simple judgments) do not have the same quantitative characteristic (the quantifier of simple judgments can be either equal to one or greater than unity), then simple judgments of such an array are called
  • IP LLK formed from the OLLL of the original sentence, between which there is a syntactic coherent connection, can only be classified as a “non-quantitative” simple proposition, since it does not guarantee the existence of the same quantitative characteristic of all simple judgments directly (without any additional processing) formed from an arbitrary initial linguistic sentence.
  • the element 12 of the eighth SMD data structure it is necessary to carry out the following actions: at the first stage, the main OLLO 91 is selected; at the second stage, all dependent dependent ALLO 91 subordinate to him are identified using the values 2161 of the fifth part of the linguistic characteristics 216 of the elements 21 making up the ALLO 91; at the third stage, among the identified dependent OLLO 91, such OLLO 91 are identified that have a direct subordinate relationship with the previously selected main OLLO 91; at the fourth stage, a preliminary element 12 of the eighth SMD data structure is formed, which is the initial simple linguological structure (IP LLK) by combining the selected “main OLLO” 91 and all identified “dependent OLLOs” 91 having direct subordinate connections with the selected main OLLO 91 ; at the fifth stage identify compiled by OLLO among the already identified dependent OLLOs 91 using the values 2131 of the first part of the linguistic characteristics of 213 elements 21 constituting OLLO 91.
  • IP LLK initial
  • a request is made to the BDLP generated in step 3021 to check for signs of communication between the combined OLLOs, and, in the presence of such signs, they receive a text element (text elements) identified (identified) as one of (or several of, or a combination of): a punctuation mark, a union or a union word, is located s between the combining OLLO.
  • a text element text elements identified (identified) as one of (or several of, or a combination of): a punctuation mark, a union or a union word, is located s between the combining OLLO.
  • the formation of the eighth SMD data structure during step 3022 is performed by combining in one data structure the elements 12 of the eighth SMD data structure and their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
  • IP LLK the linguistic characteristics of TEs that comprise elements 12
  • IP LLK the linguistic features of elements 12
  • IP LLK are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic Proposals 11, of which the elements 12 consist (IP LLK).
  • FIG. 31 by way of example, but not limitation, a general flowchart is shown of the steps of step 303 of generating the ninth SMD data structure, which is the second data structure for the method 300 under consideration.
  • Step 303 is characterized by: performing step 3031 of identifying the types of elements 12 of the eighth SMD data structure indicating the presence in the IP LLK composed by ALLO, on which the first and second types of elements are identified
  • the non-transformed elements 13 of the ninth SMD data structure and their identification data, which is, for example, but not limited to, the value of the 131 non-transformed element 13 of the ninth SMD data structure and ordinal 132 numbers TE of the linguistic sentence 11 constituting element 13 (meaning and serial numbers of TE of the unreformed element 13); performing the step 3032 of generating the converted elements 13 of the ninth SMD data structure, on which the converted elements 13 of the ninth SMD data structure are formed from the second type elements 12, as well as the identification data of the converted elements 13, which is an example, but not for each converted element 13 restrictions, value 131 of the transformed element
  • FIG. 32 by way of example, but not limitation, the general structure of the generated ninth SMD data structure is shown, which is the second SMD data structure for the present conversion method 300.
  • the ninth SMD data structure is a SMD containing elements 13, which are simple linguistic logical constructions (PLCC) of the linguistic sentence 11, and PLCC identification data, representing for each PLCC, as an example, but not limitation, the value of 131 element 13 of the ninth data structure and order stems rooms 132 text elements constituting PLLK.
  • Elements of the ninth structure SMD data are divided according to the principle of their formation into
  • PLCC 13 of the linguistic sentence 11 lacks unique names characterizing them, having practical use.
  • elements 13, by way of example, but not limitation, can be referred to as “PLCK1”, “PLCK2”, “PLCKZ”, “PLLKp”, where n> 1 is the serial number of the element in the linguistic sentence.
  • PLCC of Linguistic Proposal 11 is a boundary entity between linguistics and logic. From a linguistic point of view, PLLC is a syntactic unit of the form “syntactic construction”, formed from IP LLK by heterogenization of IP LLK.
  • PLCC is a single simple sentence or a simple sentence in the original complex sentence, which does not contain homogeneous members (words between which there is a syntactic juxtaposition).
  • PLLC is a logical entity that expresses a simple proposition (quantifier proposition), which is the primary logical construction of thinking, with the help of which the idea is formed and transmitted that something (a predicate of proposition) is affirmed or disproved about the subject of judgment (the subject of the proposition ) Moreover, something (that which is affirmed or disproved about the subject of judgment) can be additionally logically structured.
  • the predicate of judgment can be divided into three logically separable entities - the action of the predicate of judgment, the object of the predicate of judgment and the circumstances of the predicate of judgment.
  • the elements of simple judgment mentioned for example can be identified with
  • PLCC cannot contain several elements of a simple judgment of one unique name (UN). For example, but not limited to, a PLCC may not include several subjects of judgment, and (or) objects of a judgment predicate, and (or) actions of a judgment predicate, and (or) homogeneous circumstances of a judgment predicate.
  • the Identification of the types of elements 12 of the eighth data structure of the SMD in the framework of step 3031 is performed by analyzing the linguistic characteristics of the text elements 12 (IP LLK) in order to identify syntactic compositional links in the IP LLK 12.
  • the composer link between OLLO (element 91) in LL LLP 12 is identified if the syntaxically important LLLEs have such OLLLs with the same syntactic parent (the syntactically main word that has such a LLL has a direct syntactic subordinate link). Additional conditions may include the presence of the same syntactic role in the main LLLEs of such OLLLs, as well as the presence of a sign of a connection between such LLLEs, namely, a comma or a compound union.
  • IL LLK second type of element 12
  • the identified first type of element 12 of the eighth data structure of the SMD is identified with the non-transformed element 13 of the ninth data structure of the SMD.
  • the formation of the transformed elements of the ninth SMD data structure (transformed elements 13 obtained from the second type of elements 12) at step 3032 is performed based on the syntactic writing connection between the elements 91 ( ⁇ ) of the element 12 ( ⁇ ⁇ ) identified by the step 3031 by converting the second type element 12 .
  • the meaning of the conversion of the element 12 of the second type at step 3032 is to heterogenize the IP LLK 12, that is, to eliminate syntactic homogeneities in the IP LLK 12 by
  • each new PLLC of the said set can contain only one of the mentioned OLLL 91 with homogeneous members (if the element 12 of the second type contains one row of homogeneous members) or only one unique combination of the mentioned OLLL 91 with homogeneous members of different rows of homogeneous members (if element 12 of the second species contains several rows of OLLO 91 with homogeneous members).
  • PLCA elements 13 formed from the element 12 of the second kind are heterogeneous PLCA, that is, formed from one PI LLK 12 the second type by its heterogeneous transformation (heterogenization).
  • the heterogenization process of PI LLK 12 of the second type can be carried out, as an example, but not limited, as follows: at the first stage, rows of homogeneous members in the element 12 of the second type are revealed; during the identification of the ranks
  • homogeneous members reveal the very rows of homogeneous members and serial numbers of homogeneous members in a row, as well as signs of communication of each homogeneous member; at the second stage, chains of homogeneous members are revealed for each identified ALLO containing LLE-OCH (0LL0-04) element 12 of the second type; the chain of homogeneous members (chain 04) is the OLLO-OCH and the dependent chain of homogeneous members (the chain of syntactically related OLLLs, starting from the first syntactic descendant of homogeneous members (syntactically dependent OLLL) and continuing along the chain of syntactic dependence (syntactically
  • identified chains 04 are classified by the fact of the presence of a syntactic descendant LLE in the dependent chain 04, which is not included in the dependent chain 04; those chains 04 that have dependent chains 04 without a syntactic descendant outside the dependent chain of homogeneous members are considered extreme chains of homogeneous members (extreme CSCs), and those chains 04 that have dependent chains 04 with syntactic descendant outside the dependent chain 04 are considered internal chains of homogeneous members (internal chains 04); at the third stage, the OLLO of the element 12 of the second type is detected, which are not included in the chains 04 (OLLO outside the chains 04); at the fourth stage, replaceable dependent chains (replaceable LCs) of element 12 of the second kind are formed; a replaceable SC is the basis of the transformed elements 13, consisting of one extreme chain 04 and internal chains 04, if such internal chains 04 along a chain of continuous syntactic subordinate communication exist
  • the Identification of the types of elements 12 of the eighth data structure of the DMD in the framework of step 3031 does not change the value 121 of the element 12 and does not change serial numbers of the text elements 21 of the linguistic sentence 11 constituting the element 12 (IP LLK).
  • the value and serial numbers of the TE of the unreformed element 13 (PLC) of the ninth SMD data structure are identified as part of step 3031 as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting the element 12 of the first type of the eighth SMD data structure are identified as the value 131 of the unreformed element 13 ( PLCK), and the serial numbers 212 of the text elements 21 of the linguistic sentence 11 constituting the element 12 of which the unreformed element 13 consists are identified as oryadkovye number 132 text elements, components
  • Proposals 11, constituting separate parts of element 12 of the second type ( ⁇ -04), which were removed during heterogenization, and signs of communication of remote ⁇ - ⁇ (syntactic subordinate compound unions or punctuation marks synthesized by the main LLL to remote ⁇ ) are identified as the value 131 of the transformed element 13 (PLCK), and serial numbers 212 of the text elements 21 of the linguistic sentence 11 constituting the element 12 of the second type of the eighth data structure of the SMD, with the exception of serial numbers 212 of the text elements 21 of the linguistic sentences 11, which are separate parts of element 12 of the second type ( ⁇ - ⁇ ), which were removed during heterogenization, and signs of communication of remote ⁇ - ⁇ (syntactic subordinate compound unions or punctuation marks synthesized by the main LLL to remote ⁇ ) are identified as 132 serial numbers elements making up the transformed element 13 (heterogeneous PLCK).
  • the formation of the ninth SMD data structure in step 3033 is performed by combining elements 13 of the ninth SMD data structure and their identification data previously identified in steps 3031 and 3032 using the principles and methods known from the prior art, which respectively further not described in detail.
  • the first of the combined elements of the ninth SMD data structure is the element of the first type identified at step 3031, which is the non-transformed element 13, that is, PLCK 13, which coincides with the IP of the LLK 12 without syntactic coupling.
  • the second of the combined elements of the ninth DMD data structure are
  • the transformed elements 13 formed in step 3032 as a plurality of transformed elements 13, which are heterogeneous PLCC 13,
  • IP LLK with syntactic co-linking IP LLK with syntactic co-linking
  • untransformed or transformed element 13 PLCK or heterogeneous PLCK.
  • linguistic features of unreformed and transformed elements 13 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 13 (PLCC and heterogeneous PLCC) are composed.
  • FIG. 33 by way of example, but not limitation, a general flowchart is shown of the steps of step 304 of generating the tenth SMD data structure, which is the third data structure for the method 300 under consideration.
  • Step 304 is characterized by: step 3041 of generating values 2171 of the sixth of the linguistic characteristics of 217 elements 21 constituting elements 13 of the ninth SMD data structure, on which values 2171 of the sixth of the linguistic characteristics of 217 elements 21 are generated,
  • step 3042 identification of types of elements 13 of the ninth SMD data structure indicating the presence of composed PLCs, on which the first and subsequent types of elements 13 of the ninth SMD data structure are identified; by performing step 3043 of identifying elements 14 as constituent parts of element 15 of the tenth SMD data structure, which identifies elements 14 of the tenth data structure of the SMD, as well as the identification data of the elements 14, which for each element 14, as an example, but not limitation, the value 141 element 14 of the tenth SMD data structure and serial numbers 142 TE of the linguistic sentence 11 constituting element 14; and form the tenth SMD data structure by combining the elements 14 as components of a single element 15 of the tenth SMD data structure.
  • FIG. 34 by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated as part of step 3041 is shown, which is BDLP of text elements 21 of sentence 11 contained in elements 13 of the ninth data structure of the DMD.
  • the BDLP generated in step 3041 differs from the BDLP generated in step 3021 in the presence of a sixth of the linguistic characteristics 217 and their values of 2171 text elements 21 contained in elements 13, which establishes the syntactic role of PLCs (elements 13 of the ninth data structure of the DMD).
  • the syntactic role of PLCA may have meanings: the main PLC or dependent PLC. Since, from a linguistic point of view, PLCC is a syntactic construction, it is natural that in one sentence some syntactic constructs relative to other syntactic constructs, if there is a syntactic subordinate relationship between them, are syntactically main or syntactically dependent. According to this principle, some PLCs can be syntactically main (main PLCs), while others can be syntactically dependent (dependent PLCs).
  • FIG. 35 by way of example, but not limitation, the general structure of the tenth SMD data structure generated is shown, which is the third SMD data structure for the present conversion method 300.
  • the tenth SMD data structure is a SMD containing element 15, which is the original complex linguistic-logical design (IS LLK) linguistic sentence 11, and the identification data of element 15, which, by way of example, but not limitation, are the value 151 of element 15 of the tenth data structure and the serial numbers 152 of the text elements making up element 15.
  • the original complex LLK 15 is the original complex linguistic-logical design
  • LLK IS is a syntactic unit of the “syntactic construction” form, formed from PLCK by combining PLCK based on the presence of direct syntactic subordinate and composing links between PLCK.
  • IS LLK consists of the number of PLCs that are identified in the original sentence.
  • the mentioned direct syntactic subordinate link means the presence between the elements of different PLCCs (between LLE of different PLCCs) of syntactic subordinate linkage.
  • IP LLK is a transformed source sentence without distorting its meaning.
  • the essence of the transformation of the original linguistic sentence is that all applied linguistic techniques (complications) aimed at simplifying the linguistic forms and structures of statements (negatives) imagined by the author in the text of the linguistic sentence (for example, without limitation, the use of homogeneous members, participles (participles) of turns ) cancel. Instead of the original
  • the original sentence thus transformed is subject to the use of the above techniques in the original linguistic sentence), in fact, a complex sentence consisting of converted simple sentences in an amount exceeding the number of initial simple sentences in the original linguistic sentence.
  • all converted simple sentences in the LC LLK are unambiguous simple judgments (conceivable statements or denials).
  • the registration of element 15 (IS LLK) in the form of a data structure allows you to identify the multi-level syntactic structure of element 15 (IS LLK) and the relationship between the elements of this structure.
  • the levels of the LLC IC reflect the structure of the syntactic subordinate connection between the structured PLCs (SPLC) as the constituent parts of the PLC IC and are determined by the identified syntactic links between the constituent parts of the element 15 (elements 14 of the linguistic sentence 11.)
  • the element 15 (the PLC LLC) is formed from the mentioned structured PLCs (SPLC) ) - elements 14.
  • Mandatory IS LLK contains only element 14 (SPLK) of the first level (elements 13 of the first kind).
  • SPLC structured PLCs
  • the first level SPLCK (elements 13 of the first kind) include PLCK, which are not subordinate simple sentences.
  • the second level SPLCK (elements 13 of the second type) include PLCK, which are subordinate simple sentences, provided that the main one is the first level SPLC.
  • the third level SPLCK (elements 13 of the third type) include PLCKs, which are subordinate simple sentences, provided that the main ones are second level SPLCs.
  • the syntactic structure of the IC LLK 15, in addition to syntactically subordinate SPLCK, may also contain syntactically composed SPLCK.
  • all first-level PLCS (elements 13 of the first kind) are necessarily composed of PLCC with each other.
  • the one level SPLCK may or may not have syntactic composing connections with each other.
  • the syntactic compositional link between the SLCL in the LLC IC is identified if the syntactically main words (LLEs) have the syntactically main OLLOs of these SLCLs of the same syntactic parent (the syntactically main word that has a direct syntactic subordinate link to such a word (LLE)). Additional conditions may be the presence of the same syntactic role in the main words (LLE) of such SPLCs, as well as the presence of a sign of connection between such words (LLE), namely, a comma or a compound union.
  • LS LLK 15 is a logical entity that expresses a complex judgment (non-quantifier proposition), which is a logical construction, the elements of which are simple judgments.
  • the quantity of a complex judgment is determined by its
  • Unambiguous complex judgments are quantified complex judgments in which the quantifier index is always defined and equal to unity, that is, each element of a complex proposition has no variability, is always unambiguous.
  • the unambiguity of a complex judgment is manifested by finding elements in a complex judgment that are not able to be interpreted as variants of statements or negations, or as variants of conditionality of the same statement or negation.
  • An example of an unambiguous complex judgment is the following proposition: “If the buyer paid for the goods, then the goods should be transferred to the buyer by the seller”. This complex proposition does not allow any variation - the simple proposition “the goods must be transferred to the buyer by the seller” is due to the only simple proposition “if the buyer paid for the goods”.
  • Ambiguous complex judgments are quantified complex judgments in which the quantifier index is always determined and always greater than unity, that is, at least one element of a complex proposition has variability.
  • the ambiguity of a complex judgment is manifested by finding elements in the composition of a complex judgment that can be interpreted as variants of statements or negations, or as variants of conditionality of one and the same statement or denial.
  • An example of an ambiguous complex judgment is the following proposition: “If the buyer paid for the goods, the goods must be transferred to the buyer by the seller or the goods must be transferred to the buyer by another official
  • IS LLK is a complex proposition with an indefinite quantitative characteristic (the quantifier index can be either equal to one or be greater than unity), and such a complex proposition is "non-quantifier”.
  • the IP LLK is an information-filled scheme that clarifies the logical construction of a sentence (logical connections between individual simple judgments inherent in the original linguistic sentence).
  • the IP LLK is preferably not shown in a linguistic textual form (in the form of a complex sentence consisting of many simple sentences without an inventive connection and participial (active participles) turns, in which there can be either a subordinate or an inventive connection between the mentioned simple sentences) , but in tabular or schematic form.
  • the mentioned tabular or schematic form of the demonstration allows you to quickly and accurately understand and analyze all the used basic logical entities (SPLC) and all logical connections between SPLC.
  • SPLC basic logical entities
  • the identification of the types of elements 13 of the ninth SMD data structure during step 3042 is based on the results of identifying the values of 2171 of the sixth of the linguistic characteristics of 217 text elements 21 constituting PLCC 13.
  • PLCK 13 connective connections between elements 13 (PLCK).
  • PLCK 13 in which there is no syntactic subordinate connection, but a syntactic compositional link is identified, is assigned to the same form as PLCK 13 with which it is composed.
  • the identification of elements 14 (component parts of element 15) of the tenth data structure of the DMD during step 3043 is performed by
  • elements 13 identified at block 3042 as certain types of element 13. Moreover, elements 13 of the first kind
  • elements 13 of the second type are identified as element 14 of the second level
  • elements 13 of the third and subsequent types are identified as element 14 of the third and, respectively, subsequent levels.
  • the Identification of the types of elements 13 of the ninth data structure of the DMD in the framework of step 3042 does not change the value 131 of the element 13 and does not change
  • serial numbers of text elements 21 of the linguistic sentence 11 constituting element 13 (PLCK).
  • the identification of the value and serial numbers of the TE element 14 (LFLC) of the tenth SMD data structure within the framework of step 3043 is carried out as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting element 13 are identified as the value 141 of element 14 (FLCC), and serial numbers) 212 of the text elements 21 of the linguistic sentence 11 constituting element 13 are identified as serial numbers 142 of the text elements constituting element 14 (CPLC).
  • the identification of the value and serial numbers of the TE element 15 (LC LLK) of the tenth SMD data structure within the framework of step 3043 is carried out as follows: the values of 211 text elements 21 of the linguistic sentence 11, which make up all the elements 14,
  • the formation of the tenth SMD data structure during step 3043 is performed by combining elements of the tenth SMD data structure 14 as well as their identification data in one data structure. Moreover, the elements 14 combined in one data structure, being the constituent parts of the element 15, thus form the element 15, which is the main element of the tenth data structure of the SMD.
  • the combination of the mentioned elements and their identification data in one data structure is carried out according to the principles and methods known from the prior art, which, accordingly, are not further described in detail.
  • the tenth data structure of the SMD is an array (list) of structured PLCs (SPLC) - elements 14 of the first and subsequent levels located in the list of SPLC, taking into account the increasing level of element 14 (and indicating this level), as well as taking into account the increasing serial number of the text element of the sign of communication element 14 (and indicating this serial number), as well as the sequence number of the text element of the syntax parent of element 14 (and indicating this serial number).
  • the first part of the IP LLK and the first serial number in the above list of structured PLCs will be SPLK 14 without a syntactic parent and without a sign of communication.
  • Elements 14 of the tenth SMD data structure are used to construct a diagram or table of logical connections that visually displays the logical construction of the original linguistic sentence (logical connections between individual simple judgments embedded in the original linguistic sentence).
  • a detailed and at the same time structured representation of the original linguistic sentence allows us to increase the efficiency of processing the linguistic sentence 11 by machine tools because instead of one processed sentence with complex structure gives you the opportunity to process many simple sentences with
  • Necessities are made by organizing a request to the BDLP, which is formed as part of step 3041, consisting of the identification data of the fuel cells that make up element 15 (IS LLK), and obtaining the values (2131, 2141, 2231, 2151, 2161, 2171) of all parts of the linguistic characteristics (213 , 214, 223, 215, 216, 217) of the textual elements 21 of the linguistic sentence 11, of which the element 15 (EC LLK) consists.
  • the linguistic features of element 15 (IS LLK) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which element 15 (IS LLK) consist.
  • Step 305 is characterized by: performing step 3051 of identifying views of the element 15 of the tenth SMD data structure indicating for the presence in the LLC IC of composed PLCs, on which the first and second types of element 15 of the tenth structure of the SMD data are identified, as well as identification
  • untransformed element 16 by way of example, but not limitation, the value 161 of the non-transformed element 16 of the eleventh SMD data structure and serial numbers 162 of the TE of the linguistic sentence 11 constituting the non-transformed element 16; performing step 3052 of generating the transformed elements 16 of the eleventh SMD data structure, on which the converted elements 16 of the eleventh SMD data structure are formed from the second type elements 15, as well as identification data
  • the transformed element 16 by way of example, but not limitation, the value 161 of the transformed element 16 of the eleventh SMD data structure and the sequence numbers 162 of the TE of the linguistic sentence 11 constituting the transformed elements 16; the execution of step 3053 formation
  • FIG. 37 by way of example, but not limitation, the general structure of the generated eleventh SMD data structure is shown, which is the fourth SMD data structure for the present conversion method 300.
  • the eleventh SMD data structure is a SMD containing elements 16 of the eleventh SMD data structure, which are complex linguistic-logical constructions (LLLC) of the linguistic sentence 11 and the logo identification data, representing for each element 16, as an example, but not limitation, beginning 161 of element 16 of the eleventh data structure of the DMD and serial numbers 162 of the text elements making up element 16.
  • the LLLC of the linguistic sentence 11 does not have any unique names characterizing it that have practical use.
  • elements 16, as an example, but not limitation, can be referred to as “SLLK1”, “SLLK2”, “SLLKZ”, “SLLKp”, where n> 1 is the serial number of the element in the linguistic sentence.
  • the SLCC of Linguistic Proposal 11 is a boundary entity between linguistics and logic. From a linguistic point of view, SLLK is a syntactic unit of the form “syntactic construction”, formed from IS LLK by heterogenization of IS LLK.
  • SLLK is a separate simple sentence (if the original linguistic sentence is a simple sentence without syntactic complications (homogeneous members, revolutions, etc.)) or a complex sentence that does not contain homogeneous members (words between which there is a syntactic writing connection).
  • SLLK is a logical entity that expresses a complex proposition (quantifier proposition), which is a complete logical construction of thinking, with the help of which
  • the type identification of the LLK 15 information system within step 3051 is performed by analyzing the linguistic characteristics of the text elements that make up the LLK 15 system, in order to identify the syntactic compositional links between the SPLK 14 in the LLK 15 IP.
  • the syntactic compositional link between the SPLK 14 is identified if any the syntaxically important LLEs of the syntactically principal LLLOs of such LLLFs of the same syntactic parent (the syntactically major LLLEs of different LLLFs, which have the direct syntax with the word (LLEs) in the compiled LLLFs eskaya subordinate connection).
  • Additional conditions may include the presence of the same syntactic role in the main LLLOs of the main OLLLs composed of SPLCs, as well as the presence of a sign of connection between the aforementioned composed LLLEs, namely, a comma or a writing union.
  • a link between the main LLEs of the main OLLO of two or more SPLKs such an LLK IS is identified as the second type of element 15.
  • IS LLK 15, in which no syntactic linkage is identified from the main LLE of the main OLLO in SPLC is identified as the first type of element 15.
  • the identified first type of element 15 of the tenth SMD data structure is identified with the non-transformed element 16 of the eleventh SMD data structure.
  • the generation of the transformed elements of the eleventh SMD data structure (the transformed elements 16 obtained from the second type elements 15) at step 3052 is performed based on the syntactic writing connection between the SPLK identified at step 3051 by converting the LLK IC of the second kind.
  • the meaning of the conversion of the LLK IC of the second kind at step 3052 is to heterogenize the LLK IC, that is, to eliminate syntactic homogeneities in the LLK IC by forming from the element 15 of the second kind a multitude of new LL LLP identical in uniformity to the element 15 of the first kind.
  • each new LLLC IS of the said set can contain only one of the mentioned LLDCs with homogeneous members (if the LLLC IL of the second type contains one row of homogeneous members) or only one unique combination of the said LLDC with homogeneous members of different series of homogeneous members (if the LLLC IS of the second type contains several rows of SPLC with homogeneous members).
  • a plurality of LLK ICs formed from LLK IC (element 15) of the second kind are
  • heterogeneous SLCK transformed elements 16
  • heterogenization of LC LLK (element 15) of the second type can be carried out, as an example, but not limitation, as follows: at the first stage, rows of homogeneous members in the element 15 of the second type are revealed; in the course of identifying rows of homogeneous members, the rows themselves of homogeneous members and the serial numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member are revealed; at the second stage, chains of homogeneous members are revealed for each identified SPLCK containing LLE-OCH (SPLLK-OCH) element 15 of the second type; a chain of homogeneous members (a chain of PF) is a DFLC-PF and a dependent chain of homogeneous members (a chain of
  • syntactically related SPLCKs starting from the first syntactic descendant of homogeneous members (syntactically dependent SPLCK) and continuing along the chain of syntactic dependence (according to syntactic subordination) to another SPLCK-OCh or to the last PLCK in element 15 of the second kind;
  • identified chains 04 are classified based on availability
  • the Identification of the types of elements 15 of the tenth data structure of the DMD in the framework of step 3051 does not change the value 151 of the element 15 and does not change
  • serial numbers of text elements 21 of the linguistic sentence 11 constituting element 15 IP LLK.
  • the value and sequence numbers of the TE of the unreformed element 16 (SLC) of the eleventh SMD data structure are identified as part of step 3051 as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting the element 15 of the first type of the tenth SMD data structure are identified as the value 161 of the unreformed element 16 (SLLK), and serial numbers 152 of the mentioned text elements 21 of the linguistic sentence 11, constituting the element 15 of the first kind of which the non-transformed element 16 consists, identify as serial numbers 162 of the text elements constituting the non-transformed element 16 (SLLK).
  • the value and serial numbers of the TE of the transformed element 16 (heterogeneous SLCK) of the eleventh SMD data structure are identified as part of step 3052 as follows: values of 211 text elements 21 of the linguistic sentence 11 constituting element 15 of the second type of the tenth SMD data structure, with the exception of the values of 211 text elements 21 linguistic sentences 11 constituting separate parts of element 15 of the second kind
  • SPLCK-OCH which were removed during heterogenization, and signs of communication of remote SPLCK-OCH (syntactically subordinate compound unions or punctuation marks syntactically subordinate to the remote SPLC-OCH), are identified as the value 161 of the transformed element 16 (SLCK), and the serial numbers are 212 text elements 21 linguistic sentences 11 constituting element 15 of the second type of the sixth SMD data structure, with the exception of serial numbers 212 of text elements 21 of linguistic sentences 11 constituting separate parts of element 15 of the second type (SPLC-OCH), which were removed during heterogenization, and signs of communication of remote SPLLK-OCH (syntactic subordinate compound unions or punctuation marks syntactically subordinate to remote SPLLK-OCH) are identified as serial numbers 162 of the text elements making up the transformed element 16 (heterogeneous SLCK).
  • step 3053 The formation of the eleventh SMD data structure in step 3053 is performed by combining in a single data structure
  • the first of the combined elements of the eleventh SMD data structure is the first type of element 15 identified in step 3051, which is an untransformed element 16, that is, SLCK 16,
  • the second of the combined elements of the eleventh SMD data structure are transformed elements 16, formed at block 3052 as a plurality of transformed elements 16, which are heterogeneous SLL,
  • Identification of the linguistic characteristics of TEs constituting element 16 (SLLK) of the eleventh SMD data structure and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 3041, consisting of identification data of TEs constituting element 16 (SLLK), and obtaining the values (2131, 2141, 2231, 2151, 2161, 2171) of all parts of the linguistic characteristics (213, 214, 223, 215, 216, 217) of the text elements 21 of the linguistic sentence 11 of which element 16 consists (SLLK).
  • the linguistic features of element 16 (SLLK) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, which make up the element 16 (SLLK).
  • FIG. 38 depicts a General diagram of the steps of the claimed method 400 for converting SMD containing at least the main linguistic-logical objects (LLL) of a linguistic sentence and LLL identification data,
  • the LLLO of the linguistic sentence and their identification data is characterized by: performing the identification step 301 of a data structure suitable for transforming containing the LLLF, on which
  • ALLE main linguistic
  • ALLE formed by dividing ALLE into semantic parts of ALLE and forming the initial elements from them, and also represent
  • ILLE identification data representing for each ILLE, as an example, but not limitation: the meaning of ILLE and the serial number (s) of the TE of the linguistic sentence constituting
  • SMD data structure identification step 301 which identifies the SMD data structure, which is the original data structure for the method 400 in question, whose elements 91 are the OLLO of the linguistic sentence 11, as well as identification the data of elements 91, representing, for each element 91, as an example, but not limitation, the value of 911 element91 and the serial number (s) of 912 TE linguistic sentences 1 1 constituting the element (s) 91. Described in this way with reference to FIG. 26, the process is not further described in detail. Based on the results of step 301, a data structure is identified,
  • FIG. 27 the composition of which is described with reference to FIG. 27, respectively, is not further described in detail.
  • FIG. 39 depicts a General diagram of the steps of step 402 of the formation of the twelfth data structure SMD, which is the first data structure for the method 400 under consideration.
  • Step 402 is characterized by: performing step 4021 of generating values of 2181 of the seventh of the linguistic characteristics of 218 elements 21 constituting elements of 91 suitable for transforming a data structure containing ALLO which generates values of 2181 of the seventh of the linguistic
  • BDLP database of linguistic features
  • the BDLP generated in step 4021 differs from the BDLP generated in step 3021 in the presence of values 2181 of the seventh of the linguistic characteristics 218 indicating the main word of the semantic part of element 91 (ALLO).
  • ALLO main word of the semantic part of element 91
  • step 4021 The formation of the seventh of the linguistic characteristics 218 and their values 2181 during step 4021 is carried out on the basis of a comprehensive analysis of the values of the linguistic characteristics of the text elements 21 included in the elements 91. During this analysis, all text elements 21 constituting the element 91 check for the presence of a characteristic the main word
  • a sign of the main word of the semantic part of element 91 can be, as an example, but not limitation, the presence of the following values of linguistic characteristics of a text element (TE):
  • TE is the main word of OLLO or TE has a dependent TE in the form of an excuse.
  • Other own criteria for identifying the syntactic part of the OLLO can be preliminarily set. For example, but not limited to, a list of parts of speech that indicate the main word of the syntactic part of the OLLO can be refined. If TE has the indicated values of linguistic characteristics, the corresponding values of 2181 of the seventh part of linguistic characteristics 218 are formed - “the main word of the semantic part of OLLO”.
  • the values 2181 (the main word of the semantic part of element 91) of the seventh part of the linguistic characteristics 218 of the elements 21 constituting the OLLO 91 suitable for transforming the data structure containing the OLLO are entered into the BDLP of the text elements 21 of the linguistic sentence 11 generated within the framework of step 4021 of step 2031, forming as a result BDLP of the text elements 21 of the linguistic sentence 11, formed as part of step 4021.
  • all parts (211, 214, 232, 215, 216 and 218) of the linguistic characteristics of the text elements 21 of the linguistic Proposals 11 and their meanings (2111, 2141, 2321, 2151, 2161 and 2181) form unique linguistic features of elements 91 for alternative ways to improve search accuracy in a structured data array.
  • FIG. 41 by way of example, but not limitation, the general structure of the generated twelfth SMD data structure is shown, which is the first for the present conversion method 400.
  • the twelfth SMD data structure is a SMD containing elements 17 of the twelfth SMD data structure, which are the main linguistic logical elements (ALLE) of the linguistic sentence 11 and the ALLE identification data, which are, by way of example, but not limitation, the values of 171 elements 17 of the twelfth data structure and oryadkovye number 172 text elements constituting OLLE.
  • ALLE main linguistic logical elements
  • OLLE 12 of the linguistic sentence 11 lacks unique names characterizing them, which have practical use.
  • elements 12, as an example, but not limitation, can be referred to as “ALLE pt,” where n> 1 indicates the serial number of the ALLO in the linguistic sentence, am> 1) indicates the syntactic level of ALLE in the ALLO, starting from the first.
  • the OLLE of Proposition 11 is a boundary entity between linguistics and logic. From a linguistic point of view, ALLE is a syntactic unit of the form
  • the main words mentioned in the syntactic part of ALLO 91 are such parts of speech as a noun, pronoun or verb (in any grammatical form), which are either syntactically the main word of OLLO 91, or contain a direct syntactic descendant (a word with which there is a direct syntactic subordinate relationship) with a syntactic role "Pretext".
  • Other criteria for identifying the syntactic part of OLLO 91 can be preliminarily set. For example, not
  • ALL 17 are words and special phrases inside ALLO 91.
  • ALLO 91 can be distinguished in it one or more ALLE 17.
  • ALLE 17 is a logical entity that is a logically separable part of an element of simple judgment.
  • the semantic parts of the image of ALLO 91 is that not every image of ALLO 91 can be linguistically implemented using only one composite element (a group of words without a preposition between words).
  • the imaginary image of OLLO 91 about the right to something cannot be realized with one constituent element (one group of words without an excuse between words)).
  • only two constituent elements - the first - “consumer right”, and the second - “return of goods” - form a conceivable image of an element of simple judgment.
  • the constituent element of ALLO 91 (the semantic part of ALLO) is referred to as the term ALLO 91.
  • the main terms ALLO 91 have a maximum semantic role, that is, they are the terms ALLO 91 of the first semantic part.
  • the term OLLO 91 of the first semantic part defines the semantic vector OLLO 91.
  • the semantic essence of the OLLO 91 image is formed by the constituent element “consumer right” rather than the constituent element “return of goods”.
  • the terms OLLO of the second and subsequent semantic parts are syntactically dependent terms OLLO 91, and their presence in OLLO 91 is necessary only to clarify the imaginary image of OLLO 91. The more complex the imaginary image of OLLO 91 is, the more terms OLLO 91 may require to clarify its imaginary image.
  • OLLO 91 Structuring the terms OLLO 91 as the semantic parts of OLLO allows you to correctly perceive the semantic roles of individual terms in OLLO 91. Separating in this way OLLO 91 allows you to intelligently search for information with increased accuracy, since if there is a more structured (by the logical role of words) data array, a more accurate description of the desired objects. As a result of machine processing of such an array of data, the accuracy of the search is increased and the search time is reduced,
  • the formation of the parts (semantic parts) of the elements 91 suitable for transforming the data structure containing OLLO, at step 4022, is performed by performing the following steps: at the first stage, from the identified main word of the semantic part of the ALLO 91 identify all syntactically subordinate words, up to the word, which itself is the main word of the semantic part of OLLO 91, but not including this word; at the second stage, the main word of the semantic part of ALLO 91 and all the syntactically subordinate words mentioned, including successively subordinate, form the semantic part of ALLO 91.
  • the serial number of the semantic part in ALLO indicates its semantic role in ALLO and is formed in accordance with the serial number of the text element (TE) of the main word of the semantic part of OLLO 91.
  • the semantic part of OLLO 91 with the lowest sequence number TE of the main word is the first
  • the TE number closest to it of the main word of the semantic part is the second semantic part of OLLO 91, and so on.
  • the serial number of ALLE is indicated in the name of ALLE, for example, but not limited to - "ALLE 1.2".
  • Such a name for element 17 suggests that it is the second semantic part in the first OLLO (according to the syntactic level “.2”).
  • the identification of elements 17 of the twelfth SMD data structure during step 4023 is carried out on the basis of step 4022 of forming the semantic parts of elements 91 of a transformable data structure containing OLLO suitable for transformation. All the formed semantic parts of elements 91 are identified with elements 17 of the twelfth data structure of the DMD.
  • Identification of the value and serial numbers of the TE of element 17 of the twelfth SMD data structure is performed as part of step 4023 by identifying the value 171 of element 17 with the values of 911
  • Identification of the linguistic characteristics of FCs constituting the elements 17 (ALLE) of the twelfth structure of the SMD data and their values for Necessities are made by organizing a request to the BDLP, which is formed as part of step 4021, consisting of the identification data of the fuel cells that make up element 17 (ALLE), and obtaining the values (2131, 2141, 2231; 2151, 2161, 2181) of all parts of the linguistic characteristics (213, 214, 223, 215, 216,218) of text elements 21 of the linguistic sentence 11 of which element 17 (ALLE) consists.
  • the linguistic features of the elements 17 (ALLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 17 (ALLE) consist.
  • Step 403 is characterized by: performing step 4031 of generating values of 2191 of the eighth of the linguistic characteristics of 219 elements 21, constituent elements 17 of the twelfth structure of the SMD data, on which the values of 2191 of the eighth of the linguistic characteristics of the 219 elements 21 constituting the elements 91 are formed and the resulting information is introduced I BDLP text elements 21 linguistic Proposition 11, formed in 4021 under the stage, forming eventually BDLP text elements 21
  • the identification data of the elements 18, which, by way of example, but not limitation, represent the values of 181 elements 18 of the thirteenth SMD data structure, serial numbers 182 of the TE of the linguistic sentence 11 constituting the elements 18, and also identify the first and second types of elements 18 of the thirteenth SMD data structure and form the thirteenth SMD data structure.
  • FIG. 43 by way of example, but not limitation, the general structure of the linguistic database formed as part of step 4031 is depicted attributes (BDLP), which is BDLP of text elements 21 of sentence 11 contained in elements 17 of the twelfth data structure of the DMD.
  • BDLP BDLP of text elements 21 of sentence 11 contained in elements 17 of the twelfth data structure of the DMD.
  • the BDLP generated in step 4031 differs from the BDLP formed in step 4021 in the presence of 2191 values of the eighth of the linguistic
  • ALLE main word of the semantic part of element 17
  • the reason for revealing the main word of the semantic part of ALLE is that, using the identified main word of the semantic part of ALLE and the previously syntactic links between words (LLE) in ALLE, it is possible to divide ALLE into separate semantic parts.
  • the semantic parts of ALLE clarify the semantic structure of ALLE, in which the individual parts fulfill their limited semantic roles in ALLE.
  • the semantic parts in ALLE allow us to distinguish in ALLE integrated into it the dominant and clarifying entities of the surrounding world (objects and actions) for the correct identification of their semantic roles and, as a result, the meaning of ALLE.
  • the allocation of individual semantic parts in ALLE allows you to establish their unique logical roles in ALLE, which allows you to store these parts separately without losing their semantic logical role in the sentence. This separate storage allows
  • step 4031 The formation of the eighth of the linguistic characteristics 219 and their values 2191 during step 4031 is carried out on the basis of a comprehensive analysis of the values of the linguistic characteristics of the text elements 21 included in elements 17. During this analysis, all text elements 21 constituting element 17 check for the presence of a characteristic the main word
  • a sign of the main word of the semantic part of the element 17 may be, as an example, but not limitation, the presence of a text element (TE) the following values of linguistic characteristics:
  • TE is the main word of ALLE or TE has the form of a noun, pronoun or verb (in any grammatical form).
  • Other own criteria for identifying the syntactic part of ALLE can be preliminarily set. For example, without limitation, the list of parts of speech that indicate the main word of the syntactic part of ALLE can be clarified. If the TE indicated values of linguistic characteristics are formed the corresponding values of 2191 of the eighth of the linguistic characteristics 219 are “the main word of the semantic part of ALLE”.
  • the values 2191 (the main word of the semantic part of element 17) of the eighth part of the linguistic characteristics 219 of the elements 21 constituting the OLLE 17 of the twelfth data structure of the SMD are generated in the LLLB of the text elements 21 of the linguistic sentence 11 generated in step 4021, forming as a result, the BDLP of the text elements 21 of the linguistic sentence 11, formed in the framework of step 4031.
  • all parts (211, 214, 232, 215, 216, 218, 219) of the linguistic characteristics of the text elements 21 of the linguistic sentence 11 and and values (2111, 2141, 2321, 2151, 2161, 2181, 2191) form features unique linguistic elements 17 for an alternative method of increasing search accuracy in a structured dataset.
  • FIG. 44 by way of example, but not limitation, the general structure of the generated thirteenth SMD data structure is shown, which is the second SMD data structure for the present conversion method 400.
  • the thirteenth SMD data structure is a SMD containing elements 18 of the first and second types of the thirteenth SMD data structure, which are the original linguistic logic elements (ILE)
  • ILLE 18 of the linguistic sentence 11 does not have unique names describing them that have practical use.
  • elements 18, by way of example, but not limitation, can be referred to as "ILLE nmk", where n> 1 indicates the sequence number of the ALLO in the linguistic sentence, am> 1 indicates the syntactic level of ALLE in the ALLO, starting from the first, ak> 1 indicates the syntactic level of ILLE in ALLE, starting with the first.
  • ILLE 18 of Proposition 11 is a boundary entity between linguistics and logic. From a linguistic point of view, ILLE 18 is the primary syntactic unit that is a word.
  • ILLE 18 is a logical entity that is a logically separable part of the term element of a simple judgments (the term ⁇ LLO). Moreover, such logically separable parts in their structure and logical role are no different from ALLE 17 for the reason that, like ALLE 17, they represent a conceivable (semantic) image of a certain object or action of the surrounding world). The reason for the existence of the syntactic parts of ALLE 17 is that not every conceivable image of ALLE 17 can be represented using only one “source element” (a word,
  • semantic parts determine the semantic vector of the term ALLO (ALLE 17).
  • ALLO the essence of the image of the term ALLO (ALLE 17) is precisely “rights” and not “consumer”.
  • PT OLLO of the second and subsequent semantic parts (syntactically dependent PT OLLO) in the term OLLO (ALLE 17) are necessary to clarify the meaning of the term ALLO (ALLE 17).
  • ALLE 17 the more complex the conceivable image of the term ALLO (ALLE 17), the more PT OLLO (ILLE 18) it may require.
  • syntactic parts based on the presence of the main words of the syntactic parts of OLLE 17 and the subsequent structuring of text elements of the syntactic part.
  • one or more syntactic parts can be distinguished in it (ILLE 18).
  • the syntactic part (ILLE 18) OLLE 17 can be only one main word or several syntactically related words
  • the main word of the syntactic part (ILLE 18) OLLE 17 is identified with element 18 of the first kind, and all words syntactically dependent on it (significant parts of speech), if any, are identified with element 18 of the second kind.
  • the initial linguistic elements (elements 18) of the first kind are “concepts” - that is, objects or actions of the surrounding world
  • elements 18 of the second kind are “signs of a concept”, that is, some semantic characteristics of the mentioned objects and actions.
  • the formation of the parts (semantic parts) of the elements 17 of the twelfth SMD data structure is performed at 4032 by performing the following steps: at the first stage, all syntactically subordinate words are identified from the identified main word of the element 17 (ALL), up to the word which itself is the main word of the semantic part of element 17 (ALLE), but not including this word; at the second stage, the main word of the semantic part of element 17 (ALL) and all the mentioned syntactically subordinate words, including successively subordinate ones, form the semantic part of element 17 (ALL).
  • the serial number of the semantic part in ALLE indicates its semantic role in ALLE, and it is formed in
  • the semantic part of ALL 17 with the lowest TE number of the main word is the first semantic part of element 17 (ALL).
  • the semantic part is the second semantic part of ALLE 17, and so on.
  • the serial number of ILLE is indicated in the name of ALLE, for example, but not limited to - "ILLE 1.2.1.” This name of the element 18 suggests that it is the first semantic part in the second ALLE of the first ALLO.
  • the formation of elements 18 of the thirteenth SMD data structure during step 4033 is based on the results of step 4032 of forming the semantic parts of elements 17 of the twelfth SMD data structure as follows: at the first stage, all significant parts of speech in the semantic parts of elements 17 are identified with elements 18 of the thirteenth SMD data structure; at the second stage, the identified identified main words of the semantic parts of elements 17 are identified with elements 18 of the first kind; in the third stage, all other elements 18 of this semantic part, except for element 18 of the first kind, are identified with elements 18 of the second kind.
  • Identification of the value and serial number (s) of the TE of element 18 of the twelfth SMD data structure is performed as part of step 4033 by identifying the value 181 of element 18 with the value (s) of 211 textual (text) element (s) 21
  • the identification of the types of elements 18 of the twelfth data structure of the DMD within the framework of step 4031 does not change the value 181 of element 18 and does not change the serial number (s) of the TE 21 of the linguistic sentence 11,
  • the formation of the thirteenth SMD data structure during step 4033 is performed by combining in one data structure the elements 18 of the first and second types of the thirteenth SMD data structure, as well as their identification data according to the principles and methods known from the prior art, which, accordingly, are not described in further detail below. are described.
  • Identification of the linguistic characteristics of TEs constituting the elements 18 (LLE) of the thirteenth SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP generated in step 4031, which consists of the identification data of the TEs constituting the element 18 (LLE), and obtaining the values (2131, 2141, 2231; 2151, 2161, 2181, 2191) of all parts of the linguistic characteristics (213, 214, 223, 215, 216, 218, 219) of the text elements 21 of the linguistic sentence 11 of which element 18 consists (ILLE ) Moreover, as described previously
  • the linguistic features of elements 18 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 18 (ILLE) are composed.
  • FIG. 45 by way of example, but not limitation,
  • a structured data array which in a preferred embodiment comprises at least one or more computer devices 501 converting a structured data array containing at least one or more processors 5011 and memory 5012.
  • Said devices 501 converting a structured data array may include, but are not limited to: a personal computer,
  • the memory (computer-readable storage medium) 5012 of the structured data array conversion device 501 contains a program code that, when executed, causes said one or more processors 5011 of the said device 501 to perform the actions of the previously described methods for converting a structured data array.
  • the computer device 501 may be a server computer device associated with a user
  • a computer device configured to transmit to the server computer device 501 commands or instructions causing the processor or processors 5011 of the server computer device to execute code
  • the user computer device 502 may include, but is not limited to: a personal computer, a laptop computer, a tablet computer, a PDA, a smartphone, a phablet, a thin client, and the like.
  • the user computer device 502 may be connected to the server computer device 501 via a wired or wireless connection. Mentioned memory 5012 of the computer device 501 (server computer device 501) contains subject
  • one or more structured data arrays containing at least a linguistic sentence may also contain any of the previously described source data structures for any of the previously described methods for converting a structured data array.
  • one or more to be converted may also contain any of the previously described source data structures for any of the previously described methods for converting a structured data array.
  • structured data arrays can be downloaded and stored, in particular, in the database 503 of the structured data array conversion system.
  • computer-readable the storage medium may include a random access memory (RAM); read-only memory device (ROM); Electrically Erasable Programmable Read-Only Memory (EEPROM); flash memory or other memory technologies; CDROM, digital versatile disc (DVD) or other optical or holographic storage media; magnetic cassettes, magnetic tape, magnetic disk storage device or other magnetic storage devices, carrier waves or other storage medium that can be used to encode the desired
  • the memory includes a storage medium based on
  • non-volatile memory any non-volatile memory, or combinations thereof.
  • Exemplary hardware devices include solid state memory, hard disk drives, optical disk drives, and so on. Stored in memory
  • the device contains one or more processors 5011, which are designed to perform
  • System 500 may also include a database (DB) 503.
  • Database 503 may
  • the database 503 stores data in memory, which may be, but not limited to: read-only memory (ROM), electrically erasable programmable read-only memory (EEPROM), flash memory, CDROM, digital versatile disk (DVD) or other optical or holographic data carriers; magnetic cassettes, magnetic tape, magnetic disk storage device or other magnetic storage devices, wave carriers or other storage medium that can be used to store the required information, and which can be accessed by device 501 converting a structured data array.
  • ROM read-only memory
  • EEPROM electrically erasable programmable read-only memory
  • flash memory CDROM, digital versatile disk (DVD) or other optical or holographic data carriers
  • the database 503 is used to store data representing at least commands for performing the steps of the previously described methods for converting a structured data array; one or more structured data arrays to be converted containing at least a linguistic sentence, or one of the data structures that can be loaded into the memory 5012 of the device 501 of the conversion of a structured data array described previously for any conversion method; and other data
  • transforming a structured data array may further comprise a server computer device 501, which, in addition to the functions described previously, saves and facilitates the manipulation of computer instructions or codes previously described in this document, which, accordingly, are not further described.
  • the server computer device 501 in addition to the functions described above, can provide data exchange control in the structured data array conversion system 500, and also provides data processing provided that one or more than one user computer devices 502 are connected to it. In this case, all computing power, necessary to ensure the implementation of the procedure for converting a structured data array, located on the server computer device 501.
  • the system 500 can also This may include one or more data networks 504.
  • 5 data networks 204 may include, but are not limited to, one or more local area networks (LANs) and / or wide area networks (WANs), or may be an information telecommunication network Internet, or an Intranet, or a virtual private network (VPN) , or a combination thereof, and the like.
  • Server computer device 501 also has the ability to provide virtual
  • the network 504 serves to provide interaction between the computer device 501, the database 503 and the user computer device 502 of the structured data array conversion system 500.
  • the user computer device 502 may be associated with a server computer device 501 directly, using wire and wireless communication methods and methods known from the prior art, which, respectively, are not described in further detail below.

Abstract

The group of inventions relates to solutions in the field of processing data arrays, particularly to solutions in the field of processing structured data arrays containing natural language text, particularly linguistic sentences, and can be used for the preliminary conversion of a structured data array to allow the subsequent processing of same. The technical result achieved by carrying out the present invention consists in the more efficient and precise preliminary processing of a natural language text in order to subsequently index and process same.

Description

ПРЕОБРАЗОВАНИЕ СТРУКТУРИРОВАННОГО МАССИВА ДАННЫХ, СОДЕРЖАЩЕГО ЛИНГВИСТИЧЕСКОЕ ПРЕДЛОЖЕНИЕ  TRANSFORMING A STRUCTURED DATA ARRAY CONTAINING A LINGUISTIC PROPOSAL
[0001]ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ [0001] FIELD OF THE INVENTION
[0002] Группа изобретений относится к решениям в области обработки массивов данных, в частности, к решениям в области обработки  [0002] The group of inventions relates to solutions in the field of processing data arrays, in particular, to solutions in the field of processing
структурированных массивов данных, содержащих текст на естественном языке, в частности, лингвистические предложения, и может быть использована для предварительного преобразования структурированного массива данных для обеспечения его последующей обработки. structured data arrays containing natural language text, in particular, linguistic sentences, and can be used for preliminary transformation of a structured data array to ensure its subsequent processing.
[0003] ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ  [0003] BACKGROUND OF THE INVENTION
[0004] Из патента РФ 2399959 (ЗАО «АВИКОМП СЕРВИСЕЗ»),  [0004] From the patent of the Russian Federation 2399959 (CJSC "AVIKOMP SERVICEZ"),
опубликованного 10.05.2010 (Д1) известен способ автоматической индексации текстов на естественных языках. Известный из Д1 способ заключается в том, что текст сегментируют в электронной форме на элементарные единицы, выявляют устойчивые словосочетания, формируют предложения, выявляют семантически значимые объекты и семантически значимые отношения между ними, формируют для каждого семантически значимого отношения множество триад, в которых единственная триада первого типа соответствует связи, устанавливаемой семантически значимым отношением между двумя published on May 10, 2010 (D1), a method for automatically indexing texts in natural languages is known. The method known from D1 is that the text is segmented in electronic form into elementary units, identifies stable phrases, form sentences, identifies semantically significant objects and semantically significant relationships between them, form many triads for each semantically significant relationship, in which the only triad of the first type corresponds to the relationship established by the semantically significant relationship between the two
семантически значимыми объектами, при этом каждая из триад второго типа соответствует значению конкретного атрибута одного из этих семантически значимых объектов, каждая из триад третьего типа соответствует значению конкретного атрибута самого семантически значимого отношения, затем индексируют на множестве сформированных триад все связанные semantically significant objects, with each of the triads of the second type corresponding to the value of a specific attribute of one of these semantically significant objects, each of the triads of the third type corresponding to the value of a specific attribute of the semantically significant relation, then all related triangles are indexed
семантически значимыми отношениями семантически значимые объекты по отдельности, запоминают в базе данных сформированные триады и semantically significant relationships, semantically significant objects individually, remember the formed triads in the database and
полученные индексы вместе со ссылкой на исходный текст, из которого сформированы эти триады. the resulting indices, together with a link to the source text from which these triads are formed.
[0005] Однако известный из Д1 способ не обладает достаточной точностью индексации элементов текста на естественном языке, что, в свою очередь, сказывается на точности последующей обработки текста на естественном языке и точности поиска в тексте на естественном языке. Главным образом, это происходит из-за недостаточно эффективной предварительной обработки текста на естественном языке, что, соответственно, не позволяет осуществить индексацию с достаточной точностью. [0005] However, the method known from D1 does not have sufficient accuracy of indexing text elements in natural language, which, in turn, affects the accuracy of subsequent processing of the text in natural language and the accuracy of the search in the text in natural language. This is mainly happening due to insufficiently effective preliminary processing of text in a natural language, which, accordingly, does not allow indexing with sufficient accuracy.
[0006] РАСКРЫТИЕ ИЗОБРЕТЕНИЯ  [0006] SUMMARY OF THE INVENTION
[0007] Исходя из этого, технической проблемой, решаемой настоящим изобретением, является создание способа и реализующих способ устройств и/или систем, обладающих повышенной эффективностью предварительной обработки текста на естественном языке для его последующей индексации и обработки.  [0007] Based on this, a technical problem solved by the present invention is the creation of a method and devices that implement the method and / or systems with increased efficiency of preprocessing natural language text for its subsequent indexation and processing.
[0008] Соответственно, техническим результатом, достигаемым при реализации настоящего изобретения, является повышение эффективности и точности предварительной обработки текста на естественном языке для его последующей индексации и обработки.  [0008] Accordingly, the technical result achieved by the implementation of the present invention is to increase the efficiency and accuracy of preprocessing natural language text for its subsequent indexation and processing.
[0009]Технический результат достигается за счет того, что заявленный выполняемый процессором компьютерного устройства способ преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, лингвистическое предложение, характеризуется выполнением этапов: А] формирования первой структуры данных, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных представляют собой текстовые элементы (ТЭ) лингвистического предложения, а также  [0009] The technical result is achieved due to the fact that the claimed method of converting a structured data array (SMD) performed by a processor of a computer device containing at least a linguistic sentence is characterized by the following steps: A] forming the first data structure on which the first structure is formed SMD data containing elements of said first data structure, said elements of the first data structure being text elements (TE) of a linguistic pre dix, and
идентификационные данные текстовых элементов (идентификационные данные ТЭ], представляющие собой для каждого ТЭ, по меньшей мере: значение текстового элемента (значение ТЭ] и порядковый номер текстового элемента (порядковый номер ТЭ] в лингвистическом предложении; Б] формирования базы данных лингвистических признаков (БДЛП], на котором выявляют лингвистические признаки текстовых элементов (лингвистические признаки ТЭ] лингвистического предложения, из которых формируют базу данных, представляющую собой БДЛП текстовых элементов лингвистического предложения; В] формирования второй структуры данных, на котором формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой синтаксические единицы (СЕ] лингвистического предложения, сформированные на основании сведений из БДЛП текстовых элементов лингвистического предложения, а также представляют собой идентификационные данные синтаксических единиц (идентификационные данные СЕ), представляющие собой для каждой СЕ, по меньшей мере: значение синтаксической единицы (значение СЕ) и порядковый (порядковые) номер identification data of text elements (identification data of TE), representing for each TE, at least: value of a text element (value of TE) and serial number of a text element (serial number of TE] in a linguistic sentence; B] formation of a database of linguistic features (BDLP ], on which linguistic signs of text elements (linguistic signs of TE) of a linguistic sentence are revealed, from which a database is formed, which is a BDLP of text elements of linguis B] the formation of the second data structure, on which the second SMD data structure is formed containing the elements of the second data structure, said elements of the second data structure being the syntactic units (CE) of the linguistic sentence, formed on the basis of information from the BDLP of the textual elements of the linguistic sentences, and also represent identification data of syntactic units (identification CE data), representing for each CE at least: the value of the syntactic unit (CE value) and the serial (serial) number
(номера) ТЭ лингвистического предложения, составляющих СЕ. (numbers) TE linguistic sentences constituting the CE.
[0010] Варианты осуществления настоящего изобретения относятся к способам, устройствам, системам и машиночитаемым носителям данных для обеспечения эффективности и точности предварительной обработки текста на естественном языке для его последующей индексации и обработки.  [0010] Embodiments of the present invention relate to methods, devices, systems, and computer-readable storage media for ensuring the efficiency and accuracy of preprocessing natural language text for subsequent indexing and processing.
[0011]КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ  [0011] A BRIEF DESCRIPTION OF THE DRAWINGS
[0012]Иллюстративные варианты осуществления настоящего изобретения описываются далее подробно со ссылкой на прилагаемые чертежи, которые включены в данный документ посредством ссылки, и на которых:  [0012] Illustrative embodiments of the present invention are described below in detail with reference to the accompanying drawings, which are incorporated herein by reference, and in which:
[0013]На фиг. 1 изображена примерная общая схема выполнения этапов заявленного способа 100 преобразования структурированного массива данных, содержащего, по меньшей мере, лингвистическое предложение, являющегося исходной структурой данных для рассматриваемого способа 100.  [0013] FIG. 1 shows an exemplary general flowchart for the steps of the claimed method 100 for converting a structured data array containing at least a linguistic sentence that is the original data structure for the method 100 in question.
[0014]На фиг. 2 изображена примерная общая схема выполнения этапов этапа 101 формирования первой структуры данных.  [0014] FIG. 2 shows an exemplary general flowchart of the steps of step 101 of generating the first data structure.
[0015] На фиг. 3 изображена примерная общая структура исходной структуры данных, из которой формируется первая структура данных структурированного массива данных.  [0015] FIG. 3 shows an exemplary general structure of an initial data structure from which a first data structure of a structured data array is formed.
[0016]На фиг. 4 изображена примерная общая структура сформированной первой структуры данных.  [0016] FIG. 4 shows an exemplary general structure of the generated first data structure.
[0017]На фиг. 5 изображена примерная общая схема выполнения этапов этапа 102 формирования базы данных лингвистических признаков,  [0017] FIG. 5 shows an exemplary general flowchart for the steps of step 102 of forming a database of linguistic features,
представляющей собой базу данных лингвистических признаков текстовых элементов 21 предложения 11. representing a database of linguistic features of text elements 21 sentences 11.
[0018]На фиг. 6 изображена примерная общая структура сформированной базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11.  [0018] FIG. 6 shows an exemplary general structure of the generated database of linguistic features (BDLP), which is BDLP of text elements 21 of the linguistic sentence 11.
[0019]На фиг. 7 изображена примерная общая схема выполнения этапов этапа 103 формирования второй структуры данных СМД.  [0019] FIG. 7 depicts an exemplary general flowchart of the steps of step 103 of generating a second SMD data structure.
[0020] На фиг. 8 изображена примерная общая структура сформированной второй структуры данных структурированного массива данных.  [0020] FIG. 8 depicts an exemplary general structure of a generated second data structure of a structured data array.
[0021]На фиг. 9 изображена примерная общая схема выполнения этапов этапа 104 формирования третьей структуры данных структурированного массива данных. [0021] FIG. 9 shows an exemplary general flowchart step 104 of forming a third data structure of the structured data array.
[0022] На фиг. 10 изображена примерная общая структура сформированной третьей структуры данных структурированного массива данных.  [0022] FIG. 10 shows an exemplary general structure of the generated third data structure of a structured data array.
[0023]На фиг. 11 изображена примерная общая схема выполнения этапа 105 формирования четвертой структуры данных структурированного массива данных.  [0023] FIG. 11 shows an exemplary general flowchart of step 105 of generating a fourth data structure of a structured data array.
[0024] На фиг. 12 изображена примерная общая структура сформированной четвертой структуры данных структурированного массива данных.  [0024] FIG. 12 depicts an exemplary general structure of the generated fourth data structure of a structured data array.
[0025] На фиг. 13 изображена примерная общая схема выполнения этапов заявленного способа 200 преобразования структурированного массива данных, содержащего, по меньшей мере, синтаксические единицы лингвистического предложения и идентификационные данные синтаксических единиц, являющегося исходной структурой данных для рассматриваемого способа 200.  [0025] FIG. 13 shows an exemplary general flowchart of the inventive method 200 for converting a structured data array containing at least syntactic units of a linguistic sentence and identification data of syntactic units, which is the initial data structure for the method 200 in question.
[0026]На фиг. 14 изображена примерная общая схема выполнения этапа 201 идентификации пригодной для преобразования структуры данных, содержащей синтаксические единицы, являющейся исходной структурой данных для  [0026] FIG. 14 depicts an example general flowchart of an identification step 201 of a transformable data structure containing syntactic units that is the original data structure for
рассматриваемого способа 200. the method in question 200.
[0027] На фиг. 15 изображена примерная общая структура данных,  [0027] FIG. 15 shows an exemplary general data structure,
являющаяся исходной структурой данных для способа преобразования 200, представляющая собой пригодную для преобразования структуру данных, содержащую синтаксические единицы. which is the original data structure for the conversion method 200, which is a transformable data structure containing syntactic units.
[0028] На фиг. 16 изображена примерная общая схема выполнения этапов этапа 202 формирования пятой структуры данных структурированного массива данных, являющейся первой структурой данных для рассматриваемого способа 200.  [0028] In FIG. 16 shows an exemplary general flowchart for the steps of step 202 of generating a fifth data structure of a structured data array, which is the first data structure for the method 200 in question.
[0029] На фиг. 17 изображена примерная общая структура сформированной в рамках этапа 2021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей синтаксические единицы.  [0029] FIG. 17 depicts an exemplary general structure of a database of linguistic features (BDLP) generated in step 2021, which is a BDLP of text elements 21 of a linguistic sentence 11 contained in elements 22 suitable for transforming a data structure containing syntactic units.
[0030] На фиг. 18 изображена примерная общая структура сформированной в рамках этапа 2022 базы данных лингвистических признаков [БДЛП], являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей СЕ. [0031]Ha фиг. 19 изображена примерная общая структура сформированной пятой структуры данных структурированного массива данных, являющейся первой для настоящего способа преобразования 200. [0030] FIG. 18 depicts an exemplary general structure of the database of linguistic features [BDLP] generated in step 2022, which is the BDLP of the text elements 21 of the linguistic sentence 11 contained in the elements 22 suitable for converting the data structure containing CE. [0031] Ha of FIG. 19 shows an exemplary general structure of the generated fifth data structure of the structured data array, which is the first for the present conversion method 200.
[0032] На фиг. 20 изображена примерная общая схема выполнения этапа 203 формирования шестой структуры данных структурированного массива данных, являющейся второй структурой данных для рассматриваемого способа 200.  [0032] FIG. 20 depicts an exemplary general flowchart of step 203 of generating the sixth data structure of a structured data array, which is the second data structure for the method 200 in question.
[0033] На фиг. 21 изображена примерная общая структура сформированной в рамках этапа 2031 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 61 пятой структуры данных структурированного массива данных.  [0033] FIG. 21 shows an exemplary general structure of the database of linguistic features (BDLP) generated as part of step 2031, which is the BDLP of text elements 21 of the linguistic sentence 11 contained in the elements 61 of the fifth data structure of the structured data array.
[0034] На фиг. 22 изображена примерная общая структура сформированной шестой структуры данных структурированного массива данных, являющаяся второй структурой данных для настоящего способа преобразования 200.  [0034] FIG. 22 shows an exemplary general structure of the sixth data structure of the structured data array generated, which is the second data structure for the present conversion method 200.
[0035]На фиг. 23 изображена примерная общая схема выполнения этапов этапа 204 формирования седьмой структуры данных структурированного массива данных, являющейся третьей структурой данных для рассматриваемого способа 200.  [0035] FIG. 23 shows an exemplary general flowchart of steps 204 of generating a seventh data structure of a structured data array, which is the third data structure for the method 200 in question.
[0036] На фиг. 24 изображена примерная общая структура сформированной седьмой структуры данных структурированного массива данных, являющейся третьей структурой данных для настоящего способа преобразования 200.  [0036] FIG. 24 shows an exemplary general structure of the generated seventh data structure of the structured data array, which is the third data structure for the present conversion method 200.
[0037]На фиг. 25 изображена примерная общая схема выполнения этапов заявленного способа 300 преобразования структурированного массива данных, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО,  [0037] FIG. 25 shows an exemplary general flowchart of the inventive method 300 for converting a structured data array containing at least basic linguistic-logical objects (LLL) of a linguistic sentence and LLL identification data,
являющегося исходной структурой данных для рассматриваемого способа 300. which is the original data structure for the method 300 in question.
[0038]На фиг. 26 изображена примерная общая схема выполнения этапа 301 идентификации пригодной для преобразования структуры данных, содержащей основные лингво-логические объекты [ОЛЛО], являющейся исходной структурой данных для рассматриваемого способа 300.  [0038] FIG. 26 depicts an exemplary general flowchart for identifying a transformable data structure comprising basic linguistic logic objects [OLLO], which is the original data structure for the method 300 in question, that is capable of being converted.
[0039]На фиг. 27 изображена примерная общая структура данных, являющаяся исходной для способа преобразования 300, представляющая собой пригодную для преобразования структуру данных, содержащую основные лингво- логические объекты [ОЛЛО].  [0039] FIG. 27 depicts an exemplary general data structure that is the starting point for the transform method 300, which is a transformable data structure containing basic linguistic objects [OLLO].
[0040] На фиг. 28 изображена примерная общая схема выполнения этапов этапа 302 формирования восьмой структуры данных структурированного массива данных, являющейся первой структурой данных для рассматриваемого способа 300. [0040] FIG. 28 shows an exemplary general flowchart step 302 of forming the eighth data structure of the structured data array, which is the first data structure for the method 300 in question.
[0041] На фиг. 29 изображена примерная общая структура формируемой в рамках этапа 3021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО.  [0041] FIG. 29 depicts an exemplary general structure of a linguistic feature database (LIB) formed within block 3021, which is a LLLB of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing ALLO.
[0042] На фиг. 30 изображена примерная общая структура сформированной восьмой структуры данных СМД, являющейся первой структурой данных СМД для настоящего способа преобразования 300.  [0042] FIG. 30 shows an exemplary general structure of the generated eighth SMD data structure, which is the first SMD data structure for the present conversion method 300.
[0043] На фиг. 31 изображена примерная общая схема выполнения этапов этапа 303 формирования девятой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 300.  [0043] FIG. 31 shows an exemplary general flowchart of the steps of step 303 of generating the ninth SMD data structure, which is the second data structure for the method 300 in question.
[0044] На фиг. 32 изображена примерная общая структура сформированной девятой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 300.  [0044] FIG. 32 depicts an exemplary general structure of the generated ninth DMD data structure, which is the second SMD data structure for the present conversion method 300.
[0045]На фиг. 33 изображена примерная общая схема выполнения этапов этапа 304 формирования десятой структуры данных СМД являющейся третьей структурой данных для рассматриваемого способа 300.  [0045] FIG. 33 depicts an example general flowchart of the steps of step 304 of generating the tenth SMD data structure, which is the third data structure for the method 300 in question.
[0046] На фиг. 34 изображена примерная общая структура формируемой в рамках этапа 3041 базы данных лингвистических признаков [БДЛП], являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 13 девятой структуры данных СМД.  [0046] FIG. 34 depicts an exemplary general structure of a database of linguistic features [BDLP] generated as part of step 3041, which is a BDLP of text elements 21 of sentence 11 contained in elements 13 of the ninth data structure of the DMD.
[0047]На фиг. 35 изображена примерная общая структура сформированной десятой структуры данных СМД, являющейся третьей структурой данных СМД для настоящего способа преобразования 300.  [0047] FIG. 35 depicts an exemplary general structure of the tenth SMD data structure generated, which is the third SMD data structure for the present conversion method 300.
[0048] На фиг. 36 изображена примерная общая схема выполнения этапов этапа 305 формирования одиннадцатой структуры данных СМД, являющейся третьей структурой данных СМД для рассматриваемого способа 300.  [0048] FIG. 36 shows an exemplary general flowchart for the steps of step 305 of generating the eleventh SMD data structure, which is the third SMD data structure for the method 300 in question.
[0049]На фиг. 37 изображена примерная общая структура сформированной одиннадцатой структуры данных СМД, являющейся четвертой структурой данных СМД для настоящего способа преобразования 300.  [0049] FIG. 37 illustrates an exemplary general structure of the generated eleventh SMD data structure, which is the fourth SMD data structure for the present conversion method 300.
[0050] На фиг. 38 изображена примерная общая схема выполнения этапов заявленного способа 400 преобразования СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО, являющегося исходной структурой данных для рассматриваемого способа 400. [0050] FIG. 38 depicts an exemplary general flowchart of the inventive method 400 for converting an SMD comprising at least main linguistic-logical objects (LLLF) of the linguistic sentence and LLLF identification data, which is the initial data structure for the method 400 under consideration.
[0051] На фиг. 39 изображена примерная общая схема выполнения этапов этапа 402 формирования двенадцатой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 400.  [0051] FIG. 39 depicts an example general flowchart of the steps of step 402 of generating the twelfth SMD data structure, which is the first data structure for the method 400 in question.
[0052] На фиг. 40 изображена примерная общая структура формируемой в рамках этапа 4021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО,  [0052] FIG. 40 shows an exemplary general structure of a database of linguistic features (BDLP) generated as part of step 4021, which is BDLP of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing ALLO,
формируемой в рамках этапа 4021. generated in step 4021.
[0053] На фиг. 41 изображена примерная общая структура сформированной двенадцатой структуры данных СМД являющаяся первой для настоящего способа преобразования 400.  [0053] FIG. 41 shows an exemplary general structure of the generated twelfth SMD data structure, which is the first for the present conversion method 400.
[0054] На фиг. 42 изображена примерная общая схема выполнения этапов этапа 403 формирования тринадцатой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 400.  [0054] FIG. 42 depicts an example general flowchart of the steps of step 403 of generating the thirteenth SMD data structure, which is the second data structure for the method 400 in question.
[0055] На фиг. 43 изображена примерная общая структура формируемой в рамках этапа 4031 базы данных лингвистических признаков [БДЛП], являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 17 двенадцатой структуры данных СМД.  [0055] In FIG. 43 depicts an exemplary general structure of a database of linguistic features [BDLP] generated as part of step 4031, which is BDLP of text elements 21 of sentence 11 contained in elements 17 of the twelfth data structure of the DMD.
[0056] На фиг. 44 изображена примерная общая структура сформированной тринадцатой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 400.  [0056] FIG. 44 shows an exemplary general structure of the generated thirteenth SMD data structure, which is the second SMD data structure for the present conversion method 400.
[0057] На фиг. 45 изображена примерная общая схема системы для  [0057] FIG. 45 shows an exemplary general system diagram for
преобразования структурированного массива данных. transformations of a structured data array.
[0058] ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ  [0058] EMBODIMENTS FOR CARRYING OUT THE INVENTION
[0059] Описанные в данном разделе возможные осуществления вариантов настоящего изобретения представлены на неограничивающих объем правовой охраны примерах, применительно к конкретным вариантам осуществления настоящего изобретения, которые во всех их аспектах предполагаются  [0059] The possible implementations of the embodiments of the present invention described in this section are presented in non-limiting legal examples, with reference to specific embodiments of the present invention, which are assumed in all their aspects
иллюстративными и не накладывающими ограничения. Альтернативные варианты реализации настоящего изобретения, не выходящие за пределы объема его правовой охраны, являются очевидными специалистам в данной области, имеющим обычную квалификацию, на которых это изобретение рассчитано. illustrative and not limiting. Alternative embodiments of the present invention, not beyond the scope of its legal protection, are obvious to experts in this field, with the usual qualifications on which this invention is intended.
[0060] На фиг. 1, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 100 преобразования  [0060] FIG. 1, as an example, but not limitation, depicts a General diagram of the steps of the claimed method 100 conversion
структурированного массива данных (СМД), содержащего, по меньшей мере, лингвистическое предложение (ЛП), являющегося исходной структурой данных для рассматриваемого способа 100. Заявленный способ 100 преобразования СМД, содержащего, по меньшей мере, лингвистическое предложение, характеризуется: выполнением этапа 101 формирования первой структуры данных, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных представляют собой текстовые элементы (ТЭ) лингвистического a structured data array (DMD) containing at least a linguistic sentence (LP), which is the original data structure for the method 100 under consideration. The claimed method 100 of converting an SMD containing at least a linguistic sentence is characterized by: performing the first step 101 of generating the first data structures on which the first SMD data structure is formed containing the elements of said first data structure, said elements of the first data structure being textual linguistic elements (TE)
предложения, а также идентификационные данные текстовых элементов sentences as well as identification of text elements
(идентификационные данные ТЭ), представляющие собой для каждого ТЭ, в качестве примера, но не ограничения: значение текстового элемента (значение ТЭ) и порядковый номер текстового элемента (порядковый номер ТЭ) в (TE identification data), representing for each TE, as an example, but not limitation: the value of the text element (TE value) and the serial number of the text element (TE serial number) in
лингвистическом предложении; выполнением этапа 102 формирования базы данных лингвистических признаков (БДЛП), на котором выявляют linguistic sentence; the implementation of step 102 of the formation of a database of linguistic features (BDLP), which reveal
лингвистические признаки текстовых элементов (лингвистические признаки ТЭ) лингвистического предложения, из которых формируют базу данных linguistic attributes of text elements (linguistic attributes of TE) of a linguistic sentence from which a database is formed
представляющую собой базу данных лингвистических признаков текстовых элементов лингвистического предложения (БДЛП ТЭ лингвистического which is a database of linguistic features of text elements of a linguistic sentence (BDLP TE linguistic
предложения); выполнением этапа 103 формирования второй структуры данных, на котором формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой синтаксические единицы (СЕ) offers); performing step 103 of generating a second data structure, wherein a second SMD data structure is formed comprising elements of said second data structure, said elements of the second data structure being syntactic units (CEs)
лингвистического предложения, сформированные на основании сведений из БДЛП ТЭ лингвистического предложения, а также представляют собой linguistic sentences, formed on the basis of information from BDLP TE linguistic sentences, and also represent
идентификационные данные синтаксических единиц (идентификационные данные СЕ), представляющие собой для каждой СЕ, в качестве примера, но не ограничения: значение синтаксической единицы (значение СЕ) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих СЕ; выполнением этапа 104 формирования третьей структуры данных, на котором формируют третью структуру данных СМД, содержащую элементы упомянутой третьей структуры данных, причем упомянутые элементы третьей структуры данных представляют собой лингвистические объекты (ЛО) лингвистического предложения, сформированные путем их отождествления с упомянутыми identification data of syntactic units (CE identification data), representing for each CE, as an example, but not limitation: the value of the syntactic unit (CE value) and the serial number (s) of the TE of the linguistic sentence constituting CE; the execution of step 104 of the formation of the third data structure, which form the third data structure of the SMD containing the elements of said third data structure, said elements of the third structure data represent linguistic objects (LO) of the linguistic sentence, formed by identifying them with the above
синтаксическими единицами, либо полученные в результате преобразования упомянутых синтаксических единиц, а также представляют собой syntactic units, or resulting from the conversion of the mentioned syntactic units, and also represent
идентификационные данные лингвистических объектов (идентификационные данные ЛО), представляющие собой для каждого ЛО, в качестве примера, но не ограничения: значение лингвистического объекта (значение ЛО) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ЛО; выполнением этапа 105 формирования четвертой структуры данных, на котором формируют четвертую структуру данных СМД, содержащую элементы упомянутой четвертой структуры данных, причем упомянутые identification data of linguistic objects (identification data of LO), representing for each LO, as an example, but not limitation: the value of the linguistic object (value of LO) and the serial (serial) number (numbers) of the TE of the linguistic sentence constituting (components) LO; the execution of the step 105 of the formation of the fourth data structure, which forms the fourth data structure of the SMD containing the elements of the said fourth data structure, moreover,
элементы четвертой структуры данных представляют собой логические объекты (ЛогО) лингвистического предложения, сформированные посредством корреляции лингвистических и логических объектов и отождествленные с упомянутыми лингвистическими объектами, а также представляют собой идентификационные данные логических объектов (идентификационные данные ЛогО), the elements of the fourth data structure are logical objects (LogO) of a linguistic sentence, formed by correlating linguistic and logical objects and identified with the aforementioned linguistic objects, and also represent the identification data of logical objects (LogO identification data),
представляющие собой для каждого ЛогО, в качестве примера, но не ограничения: значение логического объекта (значение ЛогО) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ЛогО. representing for each LogO, as an example, but not limitation: the value of the logical object (the value of LogO) and the serial (ordinal) number (s) of the TE of the linguistic sentence that makes up (the components of) the LogO.
[0061] На фиг. 2, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 101 формирования первой структуры данных. Этап 101 характеризуется: выполнением этапа 1011 идентификации исходной  [0061] FIG. 2, by way of example, but not limitation, a general flowchart of the steps of step 101 of generating the first data structure is shown. Step 101 is characterized by: performing step 1011 of identifying the source
структуры данных СМД на котором идентифицируют элементы 11 исходной структуры данных СМД, являющиеся лингвистическими предложениями 11 (ЛП 11); выполнением этапа 1012 идентификации элементов 21 первой структуры данных СМД, на котором идентифицируют элементы 21 первой структуры данных СМД, являющиеся текстовыми элементами (ТЭ) лингвистического предложения 11, а также идентификационные данные элементов 21, представляющие собой для каждого ТЭ, в качестве примера, но не ограничения: значение 211 элемента 21 первой структуры данных СМД и порядковый номер 212 элемента 21 первой структуры данных СМД, и формируют первую структуру данных СМД. SMD data structures on which elements 11 of the initial SMD data structure are identified, which are linguistic sentences 11 (LP 11); by performing step 1012 of identifying elements 21 of the first SMD data structure, at which elements 21 of the first SMD data structure are identified, which are text elements (TE) of the linguistic sentence 11, as well as identification data of elements 21, which are for each TE, as an example, but not restrictions: the value 211 of the element 21 of the first SMD data structure and the serial number 212 of the element 21 of the first SMD data structure, and form the first SMD data structure.
[0062] На фиг. 3, в качестве примера, но не ограничения, изображена общая структура исходной структуры данных, из которой формируется первая структура данных СМД. Исходные данные представляют собой СМД, содержащий элементы 11 исходной структуры данных, представляющие собой лингвистические предложения (ЛП). Такой массив данных представляет собой множество [0062] FIG. 3, by way of example, but not limitation, the general structure of the original data structure from which the first SMD data structure is formed is shown. The source data is a SMD containing elements 11 the original data structure, which is a linguistic sentence (LP). Such an array of data is a multitude of
лингвистических предложений 11, относящихся к любой области деятельности и любого назначения. У элементов 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В исходной структуре данных элементы 11, в качестве примера, но не ограничения, могут именоваться как «ЛП1», «ЛП2», «ЛПЗ», «ЛПп», где n > 1 - порядковый номер элемента в лингвистическом предложении. Лингвистическое предложение - это linguistic sentences 11 related to any field of activity and any purpose. Elements 11 lack their unique names characterizing their practical use. In the original data structure, elements 11, as an example, but not limitation, can be referred to as “LP1”, “LP2”, “LPZ”, “LPP”, where n> 1 is the serial number of the element in the linguistic sentence. Linguistic sentence is
грамматически организованное соединение слов (множество синтаксически связанных слов), обладающее смысловой и логической завершенностью. Кроме слов ЛП может содержать следующие объекты: цифры (числа), знаки препинания и индексы (конструкции из букв, цифр и знаков). Все перечисленные выше объекты являются компонентами ЛП 11 (компонентами ЛП) и в исходной структуре данных представляют собой отдельные элементы, заранее подготовленные и помещенные в исходную структуру данных не в виде лингвистического текста, а в виде структурированного массива (списка, перечня и тому подобного) отдельных ЛП. Такие подготовительные действия могут осуществляться любым известным из уровня техники способом и, соответственно, далее не описываются. a grammatically organized combination of words (many syntactically related words) with semantic and logical completeness. In addition to words, the PL can contain the following objects: numbers (numbers), punctuation marks and indices (constructions of letters, numbers and signs). All of the above objects are components of LP 11 (components of LP) and in the original data structure are separate elements prepared in advance and placed in the original data structure not in the form of linguistic text, but in the form of a structured array (list, list and the like) of individual LP. Such preparatory steps may be carried out by any method known in the art and, accordingly, are not further described.
[0063] Идентификация элементов 11 исходной структуры данных в рамках этапа 1011 сводится к обеспечению классификации элементов, из которых состоит исходная структура данных, как лингвистических предложений (ЛП 11). При этом компонентами ЛП являются все цифры (числа), знаки препинания и индексы (конструкции из букв, цифр и знаков), содержащиеся в ЛП и отделенные друг от друга пробелом.  [0063] The identification of the elements 11 of the original data structure in step 1011 is reduced to providing a classification of the elements that make up the original data structure as linguistic sentences (LP 11). In this case, the components of the drug are all numbers (numbers), punctuation marks and indices (constructions of letters, numbers and signs) contained in the drug and separated by a space.
[0064] Исходная структура данных представляет собой в итоге множество элементов 11, идентифицированных на этапе 1011.  [0064] The original data structure is the result of a plurality of elements 11 identified in step 1011.
[0065] На фиг. 4, в качестве примера, но не ограничения, изображена общая структура сформированной первой структуры данных. Первая структура данных представляет собой СМД, содержащий элементы 21 первой структуры данных, которые представляют собой текстовые элементы (ТЭ 21) лингвистического предложения 11 и идентификационные данные ТЭ. У текстовых элементов 21 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 21, в качестве примера, но не ограничения, могут именоваться как «ТЭ», «ТЭ2», «ТЭЗ», «ТЭп», где n > 1 - порядковый номер элемента в лингвистическом предложении 11. ТЭ 21 лингвистического предложения (ЛП 11) являются компонентами ЛП, то есть словами, цифрами (числами), знаками препинания или индексами (конструкциями из букв, цифр и знаков), содержащимися в ЛП 11 и отделенными друг от друга пробелом. Текстовые элементы 21 лингвистического предложения 11 имеют идентификационные данные ТЭ, такие как, в качестве примера, но не ограничения: значение 211 ТЭ и порядковый номер 212 ТЭ. [0065] FIG. 4, by way of example, but not limitation, the general structure of the generated first data structure is shown. The first data structure is a DMD containing the elements 21 of the first data structure, which are the text elements (TE 21) of the linguistic sentence 11 and the TE identification data. The text elements 21 of the linguistic sentence 11 lack their unique names characterizing their practical use. In the data structure, elements 21, as an example, but not limitation, may be referred to as “TE”, “TE2”, “TEZ”, “TEP”, where n> 1 is the serial number of the element in the linguistic sentence 11. TE 21 of the linguistic sentence (PL 11) are components of the PL, that is, words, numbers, punctuation marks or indices (constructions of letters, numbers and signs) contained in LP 11 and separated by a space. The text elements 21 of the linguistic sentence 11 have TE identification data, such as, by way of example, but not limitation: TE value 211 and TE number number 212.
Значением 211 ТЭ являются, в качестве примера, но не ограничения, набор букв, цифр и(или) знаков препинания, из которых состоит ТЭ. Порядковым номером 212 ТЭ является порядковый номер ТЭ 21 в лингвистическом предложении 11. The value of 211 TEQs is, as an example, but not limitation, the set of letters, numbers, and / or punctuation marks that make up TEQs. Serial number 212 of the TE is the serial number of TE 21 in the linguistic sentence 11.
[0066] Формирование текстовых элементов 21 первой структуры данных в ходе этапа 1012 производят путем выявления отдельных слов или групп слов, цифр (чисел) или индексов, причем цифры (числа) или индексы не разделены пробелом, а также знаков препинания. При этом предпочтительно, чтобы последний знак препинания в лингвистическом предложении 11 не учитывался и не  [0066] The formation of the text elements 21 of the first data structure during step 1012 is performed by identifying individual words or groups of words, numbers (numbers) or indices, the numbers (numbers) or indices not separated by a space, as well as punctuation marks. Moreover, it is preferable that the last punctuation mark in linguistic sentence 11 is not taken into account and not
рассматривался в качестве текстового элемента 21 лингвистического предложения 11. was considered as a text element 21 of the linguistic sentence 11.
[0067] Идентификацию значения 211 текстового элемента 21 первой структуры данных в ходе этапа 1012 производят путем регистрации символов (букв, цифр и(или) знаков препинания), из которых состоит текстовый элемент 21. Идентификацию порядкового номера 212 текстового элемента 21 первой  [0067] The identification of the value 211 of the text element 21 of the first data structure during step 1012 is carried out by registering the characters (letters, numbers and / or punctuation marks) that make up the text element 21. Identification of the serial number 212 of the text element 21 of the first
структуры данных в ходе этапа 1012 производят путем расчета местоположения ТЭ 21 в лингвистическом предложении 11. При этом первый текстовый элемент 21 в лингвистическом предложении 11 получает порядковый номер «1», а все data structures during step 1012 are produced by calculating the location of the TE 21 in the linguistic sentence 11. In this case, the first text element 21 in the linguistic sentence 11 receives the serial number “1”, and all
последующие ТЭ получают порядковый номер, больший на единицу чем subsequent fuel cells receive a serial number greater than one
порядковый номер предыдущего ТЭ 21. serial number of the previous TE 21.
[0068] Формирование первой структуры данных СМД в ходе этапа [0068] Generating a first SMD data structure during step
1012 производят путем объединения в одной структуре данных элементов 21 первой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. 1012 are produced by combining in one data structure the elements 21 of the first SMD data structure, as well as their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
[0069] На фиг. 5, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 102 формирования базы данных лингвистических признаков, представляющей собой базу данных лингвистических признаков текстовых элементов 21 предложения 11. Этап 102 характеризуется: выполнением этапа 1021 формирования лингвистических признаков текстовых элементов 21 предложения 11, на котором для лингвистического анализа текстового элемента предоставляют идентификационные данные элемента 21 (значение 211 и порядковый номер 212 ТЭ) и получают лингвистические характеристики 213 текстовых элементов 21 лингвистического предложения 11, а также значения упомянутых лингвистических характеристик 2131; выполнением этапа 1022 формирования базы данных лингвистических признаков (БДЛП), на котором формируют БДЛП текстовых элементов 21 лингвистического предложения 11. При этом лингвистическим признаком текстового элемента 21 будут являться все полученные для текстового элемента 21 в ходе этапа 1021 лингвистические характеристики 213, обладающие значениями лингвистических характеристик 2131. [0069] FIG. 5, as an example, but not limitation, depicts a General diagram of the steps of step 102 of the formation of the database of linguistic features, which is a database of linguistic features text elements 21 of sentence 11. Step 102 is characterized by: performing step 1021 of forming linguistic features of text elements 21 of sentence 11, in which for the linguistic analysis of the text element provide identification data of element 21 (value 211 and serial number 212 TE) and get the linguistic characteristics of 213 text elements 21 linguistic sentences 11, as well as the meanings of the mentioned linguistic characteristics 2131; performing step 1022 of creating a database of linguistic features (BDLP), on which form BDLP of text elements 21 of the linguistic sentence 11. In this case, the linguistic feature of the text element 21 will be all linguistic characteristics 213 obtained for the text element 21 during the step 1021, having linguistic characteristics 2131.
[0070] На фиг. 6, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11. Первая часть (основная) лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 может содержать морфологические, синтаксические и семантические характеристики. При этом совокупность значений всех лингвистических характеристик текстового элемента является для каждого ТЭ 21 лингвистического предложения 11 его отличительным (уникальным) лингвистическим признаком в лингвистическом предложении. Морфологические характеристики предпочтительно указывают на морфологические признаки ТЭ 21 лингвистического предложения 11, которые могут быть классифицированы, в качестве примера, но не ограничения, по уровню вложенности (род-вид-подвид). При этом морфологическими родами ТЭ 21 лингвистического предложения 11 предпочтительно являются слово, цифра, знаки препинания, иные знаки;  [0070] FIG. 6, by way of example, but not limitation, the general structure of the generated database of linguistic features (BDLP) is shown, which is the BDLP of text elements 21 of the linguistic sentence 11. The first part (main) of linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11 may contain morphological, syntactic and semantic characteristics. Moreover, the totality of the values of all the linguistic characteristics of the text element is for each TE 21 of the linguistic sentence 11 its distinctive (unique) linguistic feature in the linguistic sentence. Morphological characteristics preferably indicate the morphological characteristics of TE 21 of the linguistic sentence 11, which can be classified, as an example, but not limited, by the level of nesting (genus-species-subspecies). Moreover, the morphological genera of TE 21 of the linguistic sentence 11 are preferably a word, a number, punctuation marks, other signs;
морфологическими видами - часть речи (для слов), вид цифры (арабская, римская), вид знака препинания (точка, запятая и тому подобное), вид иного знака; morphological species - part of speech (for words), type of number (Arabic, Roman), type of punctuation mark (dot, comma, etc.), type of other sign;
морфологическими подвидами - род, число, падеж частей речи и тому подобное (для слов), число, двоичный код, индекс и тому подобное (для цифр). morphological subspecies - gender, number, case of parts of speech and the like (for words), number, binary code, index and the like (for numbers).
Синтаксические характеристики предпочтительно указывают на множество синтаксических признаков ТЭ 21 лингвистического предложения 11, среди которых можно выделить, в качестве примера, но не ограничения, следующие синтаксические характеристики ТЭ 21 лингвистического предложения 11: The syntactic characteristics preferably indicate the many syntactic features of TE 21 of the linguistic sentence 11, among which, by way of example, but not limited to, the following syntactic characteristics of TE 21 of linguistic sentence 11:
синтаксическая роль (сказуемое, подлежащее и тому подобное.); синтаксический родитель (синтаксически главное слово); синтаксические потомки (синтаксически подчиненные слова); синтаксическая сочинительная связь (наличие иного ТЭ, имеющего ту же синтаксическую роль и того же синтаксического родителя). syntactic role (predicate, subject, and the like.); syntactic parent (syntactically main word); syntactic descendants (syntactically subordinate words); syntactic compositional connection (the presence of another TE having the same syntactic role and the same syntactic parent).
Семантические характеристики предпочтительно указывают на семантические признаки ТЭ 21 лингвистического предложения 11, среди которых можно The semantic characteristics preferably indicate the semantic features of TE 21 of the linguistic sentence 11, among which
выделить, в качестве примера, но не ограничения, следующие семантические характеристики ТЭ 21 лингвистического предложения 11: семантическая группа (группа слов, которые можно отнести к одному классу, роду, виду или подвиду предметов или действий окружающего мира при совпадении признаков to highlight, as an example, but not limitation, the following semantic characteristics of TE 21 of linguistic sentence 11: a semantic group (a group of words that can be attributed to one class, gender, type or subspecies of objects or actions of the world when the signs coincide
упомянутых классов, родов, видов или подвидов), семантический статус mentioned classes, genera, species or subspecies), semantic status
(смысловое значение слова или группы слов в рамках словосочетания, которым называется некий мыслимый образ (предмет или действие). Например, но не ограничиваясь, мыслимый образ «отсутствие продавца в месте нахождения потребителя» состоит из двух элементов верхнего уровня вложенности (the semantic meaning of a word or a group of words within the framework of a phrase that refers to a certain conceivable image (object or action). For example, but not limited to, the conceivable image “absence of a seller at the location of the consumer” consists of two elements of the upper level of nesting
(терминов): первого - «отсутствие продавца», и второго - «месте нахождения потребителя», у которых имеются следующие семантические статусы: у первого - главный (определяет смысл термина), у второго - дополнительный (уточняет определенный ранее смысл главного термина)). (terms): the first is “the absence of the seller”, and the second is the “location of the consumer”, which have the following semantic statuses: the first has the main one (defines the meaning of the term), the second has the additional one (clarifies the meaning of the main term defined earlier)) .
[0071]Формирование первой части (основной) лингвистических  [0071] The formation of the first part of the (main) linguistic
характеристик 213 и их значений 2131 для текстовых элементов 21 characteristics 213 and their values 2131 for text elements 21
лингвистического предложения 11 предпочтительно производят на этапе 1021 путем комплексного лингвистического анализа каждого текстового элемента 21 лингвистического предложения 11, представляющего, в качестве примера, но не ограничения, анализ ТЭ на основе местонахождения ТЭ в структуре предложения, его значения, вида, классификации его мыслимого образа и анализа его связей с другими текстовыми элементами в предложении. По результатам комплексного анализа предпочтительно производится формирование основных лингвистические характеристик 213 и их внесение на этапе 1022 в БДЛП в виде перечня первой части лингвистических характеристик 213 со значениями этих характеристик 2131. Например, но не ограничиваясь, одной из лингвистических характеристик 213 может быть «синтаксическая роль», со значением 2131 данной лингвистической характеристики «подлежащее». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети) посредством применения технологии обучения нейросети. linguistic sentences 11 are preferably produced at step 1021 by a comprehensive linguistic analysis of each text element 21 of the linguistic sentences 11, representing, by way of example, but not limitation, TE analysis based on the TE location in the sentence structure, its meaning, type, classification of its conceivable image and analysis of its relationships with other textual elements in the sentence. Based on the results of a comprehensive analysis, it is preferable to formulate the main linguistic characteristics 213 and enter them at step 1022 into the BDLP in the form of a list of the first part of linguistic characteristics 213 with the values of these characteristics 2131. For example, but not limited to, one of the linguistic characteristics 213 may be a “syntactic role” , with a value of 2131 of this linguistic characteristic “subject”. Such an analysis can be performed by any a method known from the prior art and, accordingly, is not described in further detail below. For example, without limitation, such an analysis can be performed traditionally by a specialist linguist, or using a software algorithm of a linguistic (syntactic) processor. Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using a statistical processor (neural network) through the use of neural network training technology.
[0072] На основании выявленной первой части (основной) лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 и их значений 2131 в итоге формируют базу данных лингвистических признаков, являющуюся БДЛП текстовых элементов 21 лингвистического предложения 11. При этом первая часть лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 и их значения 2131 формирует уникальные лингвистические признаки текстовых элементов 21 лингвистического  [0072] Based on the revealed first part of the (main) linguistic characteristics of 213 text elements 21 of the linguistic sentence 11 and their meanings 2131, a database of linguistic features is formed, which is the BDLP of the text elements 21 of the linguistic sentence 11. Moreover, the first part of the linguistic characteristics of 213 text elements 21 linguistic sentences 11 and their meanings 2131 forms unique linguistic features of the textual elements of 21 linguistic
предложения 11. Proposals 11.
[0073] На фиг. 7, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 103 формирования второй структуры данных СМД. Этап 103 характеризуется: выполнением этапа 1031 идентификации и  [0073] FIG. 7, as an example, but not limitation, depicts a General diagram of the steps of step 103 of the formation of the second data structure SMD. Step 103 is characterized by: performing step 1031 of identifying and
формирования первых элементов второй структуры данных СМД, на котором идентифицируют и формируют элементы 31 второй структуры данных СМД, а также идентификационные данные элементов 31, представляющие собой для каждого элемента 31, в качестве примера, но не ограничения, значение 311 элемента 31 второй структуры данных СМД и порядковый (порядковые) номер (номера) 312 ТЭ лингвистического предложения 11, составляющих элемент 31 (значение и порядковые номера ТЭ элементов 31); выполнением этапа 1032 формирования вторых элементов второй структуры данных СМД, на котором формируют элементы 32 второй структуры данных СМД, а также the formation of the first elements of the second SMD data structure, on which the elements 31 of the second SMD data are identified and formed, as well as the identification data of the elements 31, which for each element 31, as an example, but not limitation, the value 311 of the element 31 of the second SMD data structure and serial (serial) number (s) 312 of the TE of the linguistic sentence 11 constituting element 31 (meaning and serial numbers of TE of the elements 31); performing step 1032 of generating the second elements of the second SMD data structure, on which the elements 32 of the second SMD data structure are formed, and
идентификационные данные элементов 32, представляющие собой для каждого элемента 32, в качестве примера, но не ограничения, значение 321 элементов 32 второй структуры данных СМД и порядковые номера 322 ТЭ лингвистического предложения 11, составляющих элементы 32 (значение и порядковые номера ТЭ элементов 32); выполнением этапа 1033 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД путем объединения идентифицированных элементов 31 и 32 и их идентификационных данных (значений 311, 321 и порядковых номеров 312, 322 ТЭ). the identification data of the elements 32, which for each element 32 is, by way of example, but not limitation, the value 321 of the elements 32 of the second SMD data structure and the sequence numbers 322 of the TE of the linguistic sentence 11 constituting the elements 32 (the value and the sequence numbers of the TE of the elements 32); performing step 1033 of forming a second SMD data structure, in which a second SMD data structure is formed by combining the identified elements 31 and 32 and their identification data (values 311, 321 and serial numbers 312, 322 TE).
[0074] На фиг. 8, в качестве примера, но не ограничения, изображена общая структура сформированной второй структуры данных СМД. Вторая структура данных СМД представляет собой СМД, содержащий элементы 31 и (или) элементы 32, которые представляют собой синтаксические единицы (СЕ) лингвистического предложения 11 и идентификационные данные СЕ, представляющие собой для каждого СЕ, в качестве примера, но не ограничения, значение 311 элемента 31 и (или) значение 321 элемента 32, а также порядковый (порядковые) номер (номера) 312 и (или) 322 ТЭ 21 лингвистического предложения, составляющего  [0074] FIG. 8, by way of example, but not limitation, the general structure of the generated second SMD data structure is shown. The second SMD data structure is a SMD containing elements 31 and (or) elements 32, which are the syntactic units (CE) of the linguistic sentence 11 and the CE identification data, representing for each CE, as an example, but not limitation, the value 311 element 31 and (or) value 321 of element 32, as well as serial (ordinal) number (s) 312 and (or) 322 TE 21 of the linguistic sentence constituting
(составляющих) элементы 31 и (или) элементы 32. Синтаксическими единицами (СЕ) предложения 11 предпочтительно являются отдельные слова и группы слов, связанные синтаксической связью. У СЕ лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН СЕ), имеющие практическое использование, в качестве примера, но не ограничения: (constituent) elements 31 and / or elements 32. The syntactic units (CE) of sentence 11 are preferably single words and groups of words connected by syntactic link. The CE of the linguistic proposal 11 has their unique names characterizing them (UN CE), which have practical use, as an example, but not limitation:
«подлежащее», «сказуемое», «прямое дополнение» и тому подобное. В структуре данных элементы 31 и 32 именуются уникальными наименованиями и, в качестве примера, но не ограничения, могут именоваться как «УН СЕ п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН СЕ, ранее не встречавшегося в лингвистическом предложении. В качестве примера, но не ограничения для пояснения определения порядковых индексов элементов структуры данных, имеющих уникальное наименование (СЕ и иных, указанных далее) определение порядкового индекса УН СЕ может быть продемонстрировано следующим образом. В предложении: «Покупатель обязан оплатить и забрать оплаченные товар, тару и упаковку» имеются семь СЕ четырех уникальных наименований: «подлежащее» - одна СЕ, «сказуемое» - две СЕ, «определение» - одна СЕ и «дополнение» - три СЕ. В структуре данных будет содержаться один элемент «подлежащее», который будет иметь индекс «1», а также два элемента «сказуемое», которые будут иметь соответствующие индексы «1» и «2», причем индекс «1» будет иметь то “Subject”, “predicate”, “direct complement” and the like. In the data structure, elements 31 and 32 are referred to as unique names and, as an example, but not limited to, may be referred to as “UN CE p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN CE, not previously met in a linguistic sentence. By way of example, but not limitation, to clarify the determination of the ordinal indices of data structure elements having a unique name (CE and others specified below), the determination of the ordinal index of the UN CE can be demonstrated as follows. In the sentence: “The buyer is obliged to pay and pick up the paid goods, containers and packaging” there are seven CEs of four unique names: “subject” - one CE, “predicate” - two CEs, “definition” - one CE and “addition” - three CEs . The data structure will contain one element “subject”, which will have the index “1”, as well as two elements “predicate”, which will have the corresponding indexes “1” and “2”, and the index “1” will have that
«сказуемое», которое имеет меньший порядковый номер ТЭ, а также один элемент «определение», который будет иметь индекс «1», а также три элемента “Predicate”, which has a lower serial number of the fuel cell, as well as one element “definition”, which will have the index “1”, as well as three elements
«дополнение», которые будут иметь соответствующие индексы «1», «2» и «3», причем индекс «1» будет иметь то «дополнение», которое имеет меньший порядковый номер ТЭ. В дальнейшем, при упоминании СЕ как элемента второй структуры данных имеется ввиду УН СЕ. По своей структуре СЕ могут состоять из одного слова или из нескольких слов. СЕ из одного слова (одного текстового элемента 21 предложения 11) - это всегда элемент 31, являющийся исходным синтаксическим объектом (ИСО), то есть членом предложения, установленным в результате синтаксического анализа. В дальнейшем, при упоминании элемента 31 второй структуры данных, являющегося ИСО, имеется ввиду УН ИСО. При этом у членов предложения можно выделить множество характеристик, которые на практике могут породить перечень уточненных членов предложения. Таким образом список ИСО - это не заранее установленный список, а варьируемый, зависящий от предварительно заданных параметров список. Одно и тоже слово (текстовый элемент 21 предложения 11) в предложении 11 может быть "Addition", which will have the corresponding indices "1", "2" and "3", and the index "1" will have that "addition", which has a lower serial number of the fuel cell. In the future, when mentioning CE as an element of the second data structure refers to UN CE. By their structure, CEs can consist of one word or several words. A single-word CE (one text element 21 of sentence 11) is always element 31, which is the original syntactic object (ISO), that is, a sentence member established as a result of parsing. In the future, when mentioning element 31 of the second data structure, which is ISO, it means the ISO. Moreover, among the members of the proposal, there are many characteristics that can in practice give rise to a list of specified members of the proposal. Thus, the ISO list is not a predefined list, but a variable list, depending on predefined parameters. The same word (text element 21 of sentence 11) in sentence 11 may be
поименовано разной синтаксической единицей 31, в зависимости от наличия у данного текстового элемента 21 предложения 11 различных лингвистических характеристик 213 и их значений 2131, а также актуальности отдельных named by different syntactic unit 31, depending on the presence of a given text element 21 of sentence 11 of various linguistic characteristics 213 and their meanings 2131, as well as the relevance of individual
лингвистических характеристик. Например, но не ограничиваясь, при linguistic characteristics. For example, but not limited to, when
идентификации ИСО «дополнение», в котором не актуальны некоторые identification of ISO "supplement" in which some
лингвистические характеристики 213 данного ИСО, к одному уникальному названию синтаксических единиц ИСО 31 будут отнесены и ИСО «прямое linguistic characteristics 213 of this ISO, ISO 31 will be assigned to one unique name of the syntactic units of ISO 31
дополнение», и ИСО «косвенное дополнение». При актуализации всех addition ", and ISO" indirect addition ". When updating all
лингвистических характеристик 213 ИСО как отдельных синтаксических единиц 31 будут идентифицированы ИСО «прямое дополнение» и ИСО «косвенное linguistic characteristics of 213 ISO as separate syntactic units 31 will be identified by ISO "direct complement" and ISO "indirect
дополнение». Синтаксические единицы из нескольких слов (нескольких текстовых элементов 21 предложения 11) - это иногда ИСО (элемент 31), а иногда addition". Syntactic units of several words (several text elements 21 of sentence 11) are sometimes ISO (element 31), and sometimes
синтаксические конструкции (элемент 32). ИСО (элемент 31) из нескольких слов (текстовых элементов 21 предложения 11) встречаются, в частности, в ИСО syntax constructs (element 32). ISO (element 31) of several words (text elements 21 of sentence 11) are found, in particular, in ISO
«сказуемое». Например, но не ограничиваясь, ИСО «сказуемое» - «мог быть выполнен», - состоит из трех текстовых элементов 21 предложения 11 ввиду лингвистической особенности формирования сказуемого, которое, помимо глагола «выполнен» может иметь вспомогательный глагол «быть» и модальность "predicate". For example, but not limited to, the ISO “predicate” - “could be done” - consists of three text elements 21 of sentence 11 due to the linguistic features of the formation of the predicate, which, in addition to the verb “completed”, can have the auxiliary verb “to be” and modality
(модальный глагол) «мог». Синтаксическая конструкция 32 всегда состоит из нескольких слов (текстовых элементов 21 предложения 11) и представляет собой конструкцию из синтаксически связанных ИСО (элементов 31), в качестве примера, но не ограничения, синтаксической конструкцией (УН СК) является (modal verb) "could." Syntactic construct 32 always consists of several words (text elements 21 of sentence 11) and is a construct of syntactically related ISOs (elements 31), as an example, but not limitation, the syntactic construction (UN SC) is
«словосочетание», «синтаксический оборот» (причастный, деепричастный), «простое предложение», «сложное предложение» и т.д. В дальнейшем, при упоминании элемента 32 второй структуры данных, являющегося синтаксической конструкцией (СК), имеется ввиду УН СК. На практике, в целях решения “Phrase”, “syntactic turnover” (participial, participial), “Simple sentence”, “complex sentence”, etc. In the future, when mentioning element 32 of the second data structure, which is a syntactic structure (SC), we mean the UN SC. In practice, in order to solve
прикладных задач, возможно формирование самых различных синтаксических конструкций, при этом перечень и описание синтаксических конструкций могут быть заданы предварительно. Перечень СЕ 31 (ИСО) и СЕ 32 (СК), которые подлежат идентификации в предложении 11, предпочтительно задается applied tasks, the formation of a variety of syntactic structures is possible, while the list and description of syntactic structures can be predefined. The list of CE 31 (ISO) and CE 32 (SC) to be identified in Proposition 11 is preferably given
предварительно. preliminary.
[0075]Идентификацию или формирование первого элемента 31 второй структуры данных СМД в рамках этапа 1031 производят путем комплексного анализа значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11. Элементы 31 второй структуры данных СМД, являющиеся ИСО, идентифицируемые (если состоят из одного ТЭ) или формируемые (если состоят из нескольких ТЭ) в рамках этапа 1031, фактически отождествляют с актуальными ИСО. Актуальные ИСО - это актуальный перечень ИСО с актуальными лингвистическими характеристиками, установленный предварительно и записанный в первую пользовательскую базу данных (первую ПБД), являющуюся таким образом базой данных актуальных синтаксических единиц (СЕ), содержащей актуальные ИСО и актуальные СК. Идентификацию и формирование (если требуется) элементов 31 ИСО производят путем сравнения зарегистрированных в базе данных лингвистических признаков (БДЛП) значений 2131 лингвистических характеристик 213 текстовых элементов 21  [0075] The identification or formation of the first element 31 of the second SMD data structure in step 1031 is performed by a comprehensive analysis of the values of 2131 linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11. Elements 31 of the second SMD data structure, which are ISO, are identifiable (if they consist of one TE ) or formed (if they consist of several fuel cells) within the framework of step 1031, in fact, are identified with relevant ISO. Relevant ISOs are an actual list of ISOs with current linguistic characteristics, pre-installed and recorded in the first user database (first PBB), which is thus a database of current syntactic units (CE) containing relevant ISO and current SK. The identification and formation (if required) of ISO elements 31 is performed by comparing the values 2131 of the linguistic characteristics 213 of the text elements registered in the database of linguistic features (BDLP) 21
лингвистического предложения 11 с предварительно заданными значениями лингвистических характеристик актуальных ИСО. При совпадении значений 2131 лингвистических характеристик 213 текстового элемента 21 лингвистического предложения 11 и предварительно заданных значений лингвистических linguistic sentences 11 with predefined values of the linguistic characteristics of relevant ISO. With the coincidence of the values of 2131 linguistic characteristics 213 of the text element 21 of the linguistic sentence 11 and the predefined values of the linguistic
характеристик актуальных ИСО выявленный текстовый элемент идентифицируют и при необходимости осуществляют его формирование как соответствующего ИСО (элемент 31). Такой комплексный анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети) посредством применения технологии обучения нейросети. Формирование второго элемента 32 второй структуры данных СМД в рамках этапа 1032 производят путем комплексного анализа значений 2131 лингвистических характеристик 213 текстовых элементов, являющихся ИСО (элементов 31). При выявлении лингвистических характеристик текстовых элементов, составляющих ИСО, которые соответствуют описанию синтаксической конструкции (СК), содержащемуся в базе данных актуальных СЕ, формируют СК (элементы 32) из упомянутых двух или более ИСО (элементов 31). Такой комплексный анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма characteristics of relevant ISO identified text element identify and, if necessary, carry out its formation as the corresponding ISO (element 31). Such a comprehensive analysis can be performed by any method known in the art and, accordingly, will not be described in further detail below. For example, without limitation, such a comprehensive analysis can be performed traditionally by a specialist linguist, or using a software algorithm of a linguistic (syntactic) processor. Moreover, if there are enough examples, it is possible to perform such an analysis. using a statistical processor (neural network) through the application of neural network training technology. The formation of the second element 32 of the second SMD data structure within the framework of step 1032 is carried out by a comprehensive analysis of the values of 2131 linguistic characteristics of 213 text elements that are ISO (elements 31). Upon revealing the linguistic characteristics of the text elements that make up the ISO that correspond to the description of the syntactic structure (SC) contained in the database of relevant CEs, the SC (elements 32) are formed from the two or more ISOs mentioned (elements 31). Such a comprehensive analysis can be performed by any method known in the art and, accordingly, will not be described in further detail below. For example, without limitation, such a comprehensive analysis can be performed traditionally by a specialist linguist, or using a software algorithm
лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети) посредством применения технологии обучения нейросети. linguistic (syntactic) processor. Moreover, if there are a sufficient number of examples, it is possible to perform such an analysis using a statistical processor (neural network) through the use of neural network training technology.
[0076] Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 31 (ИСО) второй структуры данных СМД в рамках этапа 1032 производят следующим образом: значение (значения) 211 текстового  [0076] Identification of the value and serial number (numbers) of the TE of element 31 (ISO) of the second SMD data structure under step 1032 is performed as follows: value (s) 211 text
(текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) элемент 31, идентифицируют как значение 311 элемента 31 (ИСО), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) элемент 31, идентифицируют как порядковый (порядковые) номер (номера) 312 текстового (текстовых) элемента (элементов), составляющего (составляющих) элемент 31 (ИСО). Идентификацию значения и порядковых номеров ТЭ элемента 32 (СК) второй структуры данных СМД в рамках этапа 1032 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 32, идентифицируют как значение 321 элемента 32 (СК), а порядковые номера 212 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 32 идентифицируют как порядковые номера текстовых элементов 322, составляющих элемент 32 (СК). (text) element (s) 21 of the linguistic sentence 11 constituting the (component) element 31 is identified as the value 311 of element 31 (ISO), and the serial number (numbers) 212 of the mentioned (mentioned) text (text) element (s) ) 21 of the linguistic sentence 11 constituting the (component) element 31, is identified as the serial number of the text element (s) constituting the (element) element 31 (ISO). The identification of the value and sequence numbers of the TE of element 32 (SC) of the second SMD data structure in step 1032 is performed as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting element 32 are identified as the value 321 of element 32 (SK), and the sequence numbers 212 the said text elements 21 of the linguistic sentence 11 constituting the element 32 are identified as the serial numbers of the text elements 322 constituting the element 32 (SK).
[0077] Формирование второй структуры данных СМД в ходе этапа 1033 производят путем объединения в одной структуре данных элементов 31 второй структуры данных СМД и элементов 32 второй структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. [0077] Generating a second SMD data structure during step 1033 produced by combining in one data structure elements 31 of the second SMD data structure and elements 32 of the second SMD data structure, as well as their identification data according to the principles and methods known from the prior art, which, accordingly, are not described in further detail below.
[0078] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 31 (ИСО) второй структуры данных СМД и их значений при  [0078] Identification of the linguistic characteristics of FCs constituting the elements 31 (ISO) of the second SMD data structure and their values at
необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих ИСО 31, и получения значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 31 (ИСО). Идентификация лингвистических характеристик ТЭ, составляющих элементы 32 (СК) второй структуры данных СМД и их значений при необходимости производится путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих СК 32, и получения значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 32 (СК). При этом, как было описано ранее, лингвистическими признаками элементов 31 (ИСО) и 32 (СК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 31 (ИСО) и 32 (СК). Necessities are made by organizing a request to the BDLP, which is formed as part of step 102, consisting of the identification data of the TEs that make up ISO 31, and obtaining the values of 2131 linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11 of which element 31 (ISO) consists. Identification of the linguistic characteristics of TEs that make up the elements 32 (SC) of the second SMD data structure and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 102, which consists of identification data of TEs that make up SC 32 and obtaining values 2131 of linguistic characteristics 213 text elements 21 of the linguistic sentence 11, of which the element 32 (SC) consists. Moreover, as described previously, the linguistic features of the elements 31 (ISO) and 32 (SC) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 31 (ISO) and 32 (SC) are composed.
[0079] На фиг. 9, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 104 формирования третьей структуры данных СМД. Этап 104 характеризуется: выполнением этапа 1041 идентификации первого элемента третьей структуры данных СМД, на котором идентифицируют или формируют элементы 41 третьей структуры данных СМД, а также  [0079] FIG. 9, as an example, but not limitation, depicts a General diagram of the steps of step 104 of the formation of the third data structure SMD. Step 104 is characterized by: performing step 1041 of identifying a first element of a third DMD data structure, in which elements 41 of a third SMD data structure are identified or formed, and
идентификационные данные элементов 41, представляющие собой для каждого элемента 41, в качестве примера, но не ограничения, значение 411 элемента 41 третьей структуры данных СМД и порядковый (порядковые) номер (номера) 412 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 41; выполнением этапа 1042 формирования второго элемента третьей структуры данных СМД, на котором формируют элементы 42 третьей структуры данных СМД а также идентификационные данные элементов 42, представляющие собой для каждого элемента 42, в качестве примера, но не ограничения, значение 421 элемента 42 третьей структуры данных СМД и порядковый (порядковые) номер (номера) 422 ТЭ лингвистического предложения 11, составляющего the identification data of the elements 41, which, for each element 41, is, by way of example, but not limitation, the value 411 of the element 41 of the third SMD data structure and the serial number (s) 412 of the TE of the linguistic sentence 11 constituting the (component) element 41; performing step 1042 of forming the second element of the third SMD data structure, on which the elements 42 of the third SMD data structure are formed, as well as the identification data of the elements 42, which for each element 42, as an example, but not limitation, the value 421 of the element 42 of the third SMD data structure and serial number (numbers) 422 TE of linguistic sentence 11, constituting
(составляющих) элемент 42; выполнением этапа 1043 формирования третьей структуры данных СМД, на котором формируют третью структуру данных СМД путем объединения идентифицированных элементов 41 и 42 и их (constituent) element 42; performing step 1043 of the formation of the third SMD data structure, in which the third SMD data structure is formed by combining the identified elements 41 and 42 and their
идентификационных данных. identification data.
[0080] На фиг. 10, в качестве примера, но не ограничения, изображена общая структура сформированной третьей структуры данных СМД. Третья структура данных СМД представляет собой СМД, содержащий элементы 41 и (или) элементы 42, которые представляют собой лингвистические объекты (ЛО) лингвистического предложения 11 и идентификационные данные ЛО, представляющие собой для каждого ЛО, в качестве примера, но не ограничения, значение 411 элемента 41 и (или) значение 421 элемента 42 (значение элементов 41 и (или) 42), а также порядковый (порядковые) номер (номера) 412 и (или) 422 текстовых элементов 21 лингвистического предложения, составляющего (составляющих) элемент 41 и (или) элемент 42 (порядковые номера ТЭ элементов 41 и (или) 42).  [0080] FIG. 10, by way of example, but not limitation, the general structure of the generated third SMD data structure is shown. The third SMD data structure is a SMD containing elements 41 and / or elements 42, which are linguistic objects (LO) of the linguistic sentence 11 and the identification data of the LO, representing for each LO, as an example, but not limitation, the value 411 element 41 and (or) the value 421 of element 42 (the value of elements 41 and (or) 42), as well as the serial number (numbers) 412 and (or) 422 text elements 21 of the linguistic sentence constituting the (component) element 41 and (or) element 42 (orders numbered TE numbers of elements 41 and (or) 42).
Лингвистическим объектом (ЛО) является особая синтаксическая единица (ОСЕ). У ЛО лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ЛО), имеющие практическое использование в качестве примера, но не ограничения, представляет собой: «простое предложение без однородных членов и оборотов», «первое словосочетание» и тому подобное. В структуре данных элементы 41 и 42 именуются уникальными наименованиями, в качестве примера, но не ограничения, могут именоваться как «УН ЛО п», где n > 1 - порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ЛО, ранее не встречавшегося в A linguistic object (LO) is a special syntactic unit (ELE). The LO of the linguistic sentence 11 has their unique names characterizing them (UN LO), which have practical use as an example, but not limitation, is: "a simple sentence without homogeneous members and turns", "the first phrase" and the like. In the data structure, elements 41 and 42 are referred to by unique names, as an example, but not limitation, can be referred to as “UN LO p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LO, not previously met in
лингвистическом предложении. В дальнейшем, при упоминании ЛО как элемента третьей структуры данных или элементов 41 и 42 третьей структуры данных имеется ввиду УН ЛО. ОСЕ предварительно формируют в рамках лингво- логического преобразования, результатом которого является выполнение корреляции лингвистических и логических объектов и преобразование linguistic sentence. In the future, when referring to LO as an element of the third data structure or elements 41 and 42 of the third data structure, we mean UN LO. OSE is preliminarily formed as part of a linguological transformation, the result of which is the correlation of linguistic and logical objects and the transformation
синтаксических единиц предложения в массив логических объектов. Механизм лингво-логического преобразования позволяет на основании заранее известного представления о логической модели предложения (логической структуре простого неосложненного предложения, идентичного простому суждению) установить корреляцию (взаимосвязь) между логическими объектами предложения и синтаксическими единицами предложения. В ходе формирования таблицы взаимосвязанных (лингвистических и логических) объектов в каждом отдельном случае формируются такие ОСЕ, являющиеся искомыми лингвистическими объектами (искомые ЛО), которые могут быть отождествлены с искомыми логическими объектами (искомыми ЛогО). Сформированный таким образом искомый ЛО может быть полностью тождественен одному или нескольким СЕ (такой искомый ЛО будет порождать первый лингвистический объект (первый ЛО), являющийся элементом 41 лингвистического предложения 11), либо представлять собой производный синтаксический объект, полученный путем преобразования одного или нескольких СЕ в объект, который будет являться объектом, тождественным искомому ЛО (такой искомый ЛО будет порождать второй лингвистический объект (второй ЛО), являющийся элементом 42 syntactic units of sentences in an array of logical objects. The linguistic-logical transformation mechanism allows, on the basis of a previously known idea of the logical model of the sentence (the logical structure of a simple uncomplicated sentence, identical to a simple proposition) to establish a correlation (relationship) between the logical objects of the sentence and syntactic units of a sentence. In the course of forming a table of interconnected (linguistic and logical) objects, in each individual case, such EFs are formed that are the desired linguistic objects (the sought-after LO) that can be identified with the sought-after logical objects (the sought-after LogO). The sought-for LO thus formed can be completely identical to one or several CEs (such a sought LO will generate the first linguistic object (the first LO), which is an element of 41 linguistic sentences 11), or it can be a derived syntactic object obtained by converting one or more CEs to an object that will be an object that is identical to the desired LO (such a sought LO will generate a second linguistic object (second LO), which is an element of 42
лингвистического предложения 11). Искомыми ЛогО могут быть отдельные логические объекты или группы логических объектов, которые являются linguistic sentences 11). Searched LogOs can be individual logical objects or groups of logical objects that are
логическими сущностями и сформированы по законам логики (науке о мышлении). При этом существуют базовые академические логические сущности, в качестве примера, но не ограничения, такие как «понятие», «суждение», «субъект суждения» (то, о чем что-либо утверждается или отрицается в суждении), «предикат logical entities and formed according to the laws of logic (the science of thinking). At the same time, there are basic academic logical entities, as an example, but not restrictions, such as “concept”, “judgment”, “subject of judgment” (something that is affirmed or denied in the judgment), “predicate
суждения» (то, что утверждается или отрицается о субъекте суждения). Вместе с тем, в практических целях могут быть сформированы и иные логические сущности, отражающие потребности текущей прикладной задачи и используемые в рамках лингво-логического преобразования. Например, не ограничиваясь, в предикате суждения могут быть выделены отдельные более функционально однородные логические сущности, нежели сам предикат суждения, а именно - «действие предиката суждения», «объект предиката суждения» и «обстоятельства предиката суждения». judgments ”(that which is affirmed or denied about the subject of judgment). At the same time, for practical purposes, other logical entities can be formed that reflect the needs of the current applied problem and are used as part of the linguistic-logical transformation. For example, without limitation, in a predicate of a judgment, separate more functionally homogeneous logical entities can be distinguished than the predicate of a proposition itself, namely, “the action of a predicate of a proposition”, “an object of a predicate of a proposition” and “circumstances of a predicate of a proposition”.
[0081] Идентификацию элемента 41 (первый Л О) третьей структуры данных СМД в рамках этапа 1041 производят путем анализа состава искомых ЛО. При этом состав искомых ЛО предварительно задают в виде СЕ уникального наименования (УН СЕ) или списка СЕ уникальных наименований с указанием способа  [0081] The identification of element 41 (first L O) of the third SMD data structure in step 1041 is performed by analyzing the composition of the desired LO. In this case, the composition of the required LOs is preliminarily set in the form of a CE of a unique name (UN CE) or a list of CE of unique names with an indication of the method
формирования ЛО, которым, не ограничиваясь, может быть один из следующих способов: отождествление с установленным (несколькими установленными) СЕ или преобразование установленного (установленных) СЕ по описанному ранее способу. Упомянутые состав искомых ЛО и способы формирования ЛО формируют собой вторую пользовательскую базу данных (вторую ПБД), являющуюся таким образом базой данных искомых ЛО, содержащую, в том числе, и лингвистические характеристики текстовых элементов, из которых формируются искомые ЛО. Если в результате анализа состава конкретного ЛО будет установлено, что the formation of LO, which, without being limited to, can be one of the following methods: identification with the installed (several installed) CE or conversion of the installed (installed) CE according to the previously described method. The aforementioned composition of the desired LO and methods of forming the LO form This is the second user database (the second PBB), which is thus the database of the sought-after LOs, which contains, among other things, the linguistic characteristics of the text elements from which the sought-after LOs are formed. If as a result of the analysis of the composition of a particular LO it is established that
анализируемый Л О состоит из отождествляемых СЕ (элементов 31 или элементов 32), то такой ЛО идентифицируют (если тождественен одному СЕ) или формируют (если тождественен нескольким СЕ) как элемент 41 третьей структуры данных СМД. Идентифицированные в рамках анализа состава лингвистических объектов синтаксические единицы (элементы 31 или элементы 32) второй структуры данных СМД в соответствии с предварительно заданными параметрами the analyzed LO consists of identifiable CEs (elements 31 or elements 32), then such LOs are identified (if identical to one CE) or formed (if identical to several CEs) as element 41 of the third SMD data structure. The syntactic units (elements 31 or elements 32) of the second SMD data structure identified in the analysis of the composition of linguistic objects in accordance with predefined parameters
идентификации или формирования элементов 41 третьей структуры данных СМД содержащиеся в описании искомых лингвистических объектов, отождествляют с первым ЛО (первым лингвистическим объектом (элементом 41 третьей структуры данных СМД)), благодаря чему формируют элемент 41 третьей структуры данных СМД. Дополнительной частью элемента 41 третьей структуры данных СМД могут быть служебные части речи (предлоги, союзы, частицы) и знаки препинания, находящиеся между объединяемыми в рамках элемента 41 третьей структуры данных СМД синтаксическими единицами в соответствии со способом the identification or formation of elements 41 of the third SMD data structure contained in the description of the desired linguistic objects is identified with the first LO (first linguistic object (element 41 of the third SMD data structure)), whereby element 41 of the third SMD data structure is formed. An additional part of the element 41 of the third SMD data structure can be service parts of speech (prepositions, conjunctions, particles) and punctuation marks located between syntactic units combined under the element 41 of the third SMD data structure in accordance with the method
формирования первого ЛО, установленным пользователем. Если в результате анализа состава конкретного ЛО будет установлено, что анализируемый ЛО состоит из преобразуемых СЕ, то такой лингвистический объект будет относиться к элементам 42 третьей структуры данных СМД (вторым ЛО) и формироваться в рамках этапа 1042. Формирование элемента 42 третьей структуры данных СМД (второго ЛО) в рамках этапа 1042 производят путем преобразования СЕ, the formation of the first LO, set by the user. If, as a result of the analysis of the composition of a particular LO, it is established that the analyzed LO consists of converted CEs, then such a linguistic object will belong to the elements 42 of the third SMD data structure (second LO) and will be formed as part of step 1042. Formation of element 42 of the third SMD data structure ( the second LO) in the framework of step 1042 is produced by converting CE,
предварительно заданных в описании искомых ЛО вида «второй ЛО» по predefined in the description of the desired LO of the form "second LO" by
предварительно заданному способу преобразования во второй ПБД. a predefined conversion method to the second PBB.
Преобразование СЕ в элементы 42 третьей структуры данных СМД является необязательным действием для настоящего способа преобразования Converting CE to elements 42 of the third SMD data structure is an optional step for the present conversion method.
структурированного массива данных. Настоящий способ преобразования структурированного массива данных может быть с достаточной эффективностью и точностью реализован даже при осуществлении лишь идентификации элемента 41 третьей структуры данных СМД при условии, что все искомые ЛО порождают только первый ЛО, являющийся элементом 41 лингвистического предложения 11. structured data array. The present method of transforming a structured data array can be implemented with sufficient efficiency and accuracy even if only element 41 of the third SMD data structure is identified, provided that all the required LRs generate only the first LR that is an element 41 of linguistic sentence 11.
[0082] Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ, элемента 41 (первый ЛО) третьей структуры данных СМД в рамках этапа 1041 производят следующим образом: значение (значения) 311 или 321 элемента (элементов) 31 или 32 лингвистического предложения 11, [0082] Identification of the value and serial number (numbers) of the fuel cell, element 41 (first LO) of the third DMD data structure within the framework of step 1041 is performed as follows: the value (s) of 311 or 321 elements (elements) 31 or 32 of the linguistic sentence 11,
отождествленного (отождествленных) с элементом 41 (первый ЛО), identified (identified) with element 41 (first LO),
идентифицируют как значение 411 элемента 41 (первый ЛО), а порядковый identify as the value 411 of element 41 (first LO), and ordinal
(порядковые) номер (номера) 312 или 322 ТЭ элемента (элементов) 31 или 32 лингвистического предложения 11, отождествленного (отождествленных) с элементом 41 (первый ЛО) идентифицируют как порядковый (порядковые) номер (номера) 412 текстового (текстовых) элемента (элементов), составляющего (serial) number (s) 312 or 322 TE of the element (s) 31 or 32 of the linguistic sentence 11 identified (identified) with element 41 (first LO) is identified as the serial (serial) number (numbers) of 412 text (text) elements ( elements) constituting
(составляющих) элемент 41 (первый ЛО). Если формирование элемента 41 производят согласно требованиям второй ПБД путем объединения нескольких СЕ, то к значениям и номерам ТЭ элемента 41 (первый ЛО) третьей структуры данных СМД добавляют значения и порядковые номера ТЭ служебных частей речи (constituent) element 41 (first LO). If the formation of element 41 is carried out according to the requirements of the second PDU by combining several CEs, then the values and serial numbers of TE of service parts of speech are added to the values and numbers of TE of element 41 (first LO) of the third data structure of SMD
(предлоги, союзы, частицы) и знаки препинания, находящиеся между (prepositions, conjunctions, particles) and punctuation marks between
объединяемыми СЕ. Идентификацию значения и порядкового (порядковых) номеров ТЭ элемента 42 (второй ЛО) третьей структуры данных СМД в рамках этапа 1042 производят следующим образом: значение (значения) преобразованных СЕ (из элемента (элементов) 31 и (или) 32 лингвистического предложения 11), отождествленного (отождествленных) с элементом 42 (второй ЛО), unified CE. The identification of the value and serial (ordinal) numbers of the TE of element 42 (second LO) of the third SMD data structure within the framework of step 1042 is carried out as follows: the value (values) of the converted CE (from element (s) 31 and (or) 32 of the linguistic sentence 11), identified (identified) with element 42 (second LO),
идентифицируют как значение 421 элемента 42 (второй Л О), а порядковый identify as the value 421 of element 42 (second L O), and the ordinal
(порядковые) номер (номера) преобразованных СЕ (из элемента (элементов) 31 и (или) 32 лингвистического предложения 11), отождествленного (serial) number (s) of transformed CE (from element (s) 31 and (or) 32 of linguistic sentence 11), identified
(отождествленных) с элементом 42 (второй ЛО) идентифицируют как порядковый (порядковые) номер (номера) 422 текстового (текстовых) элемента (элементов), составляющего (составляющих) элемент 42 (второй ЛО). (identified) with element 42 (second LO) is identified as the serial number (s) 422 of the text (text) element (s) constituting (making up) element 42 (second LO).
[0083] Формирование третьей структуры данных СМД в ходе этапа 1043 производят путем объединения в одной структуре данных элементов 41 третьей структуры данных СМД и элементов 42 третьей структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.  [0083] The formation of the third SMD data structure during step 1043 is performed by combining in one data structure the elements 41 of the third SMD data structure and the elements 42 of the third SMD data structure, as well as their identification data according to the principles and methods known from the prior art, which, respectively further not described in detail.
[0084] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 41 (первый ЛО) третьей структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих первый ЛО 41, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 41 (первый ЛО). Идентификацию лингвистических характеристик ТЭ, составляющих элементы 42 (второй ЛО) третьей структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих второй ЛО 42, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 42 (второй ЛО). При этом, как было описано ранее лингвистическими признаками элементов 41 (первый ЛО) и 42 (второй ЛО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 41 (первый ЛО) и 42 (второй ЛО). [0084] Identification of the linguistic characteristics of TEs that make up the elements 41 (first LO) of the third SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP, which is formed as part of step 102, consisting of TE identification data constituting the first LO 41, and obtaining the values 2131 of the linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11, of which the element 41 (the first LO) consists. Identification of the linguistic characteristics of TEs that make up the elements 42 (second LO) of the third SMD data structure and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 102, which consists of identification data of TEs that make up the second LO 42 and obtaining 2131 linguistic values characteristics 213 of the text elements 21 of the linguistic sentence 11 of which element 42 (the second LO) consists. Moreover, as previously described, the linguistic features of elements 41 (first LO) and 42 (second LO) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 41 (first LO) and 42 (second LO).
[0085]На фиг. 11, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 105 формирования четвертой структуры данных СМД. Этап 105 характеризуется формированием элемента четвертой структуры данных, при котором формируют элементы 51 четвертой структуры данных СМД, а также идентификационные данные элементов 51, представляющие собой для каждого элемента 51, в качестве примера, но не ограничения, значение 511 элемента 51 четвертой структуры данных СМД и порядковый (порядковые) номер (номера) 512 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 51.  [0085] FIG. 11, as an example, but not limitation, depicts a General diagram of the execution stage 105 of the formation of the fourth data structure SMD. Step 105 is characterized by the formation of the element of the fourth data structure, in which the elements 51 of the fourth data structure of the DMD are formed, as well as the identification data of the elements 51, which for each element 51, as an example, but not limitation, the value 511 of the element 51 of the fourth data structure of the DMD and serial number (s) 512 TE of linguistic sentence 11 constituting the element 51.
[0086] На фиг. 12, в качестве примера, но не ограничения, изображена общая структура сформированной четвертой структуры данных СМД. Четвертая структура данных СМД представляет собой СМД, содержащий элементы 51 четвертой структуры данных СМД, которые представляют собой логические объекты (ЛогО) лингвистического предложения 11 и идентификационные данные ЛогО, представляющие собой для каждого ЛогО, в качестве примера, но не ограничения, значение 511 элемента 51 четвертой структуры данных СМД  [0086] FIG. 12, by way of example, but not limitation, the general structure of the generated fourth SMD data structure is shown. The fourth SMD data structure is a SMD containing the elements 51 of the fourth SMD data structure, which are logical entities (LogO) of the linguistic sentence 11 and the LogO identification data, which for each LogO, as an example, but not limitation, the value 511 of the element 51 Fourth SMD Data Structure
(значение элемента 51) и порядковый (порядковые) номер (номера) 512 ТЭ, составляющего (составляющих) элемент 51 (порядковые номера 512 ТЭ элемента 51). Логические объекты (ЛогО) являются логическими сущностями и (value of element 51) and serial (serial) number (s) of 512 TEs that make up (components) element 51 (serial numbers 512 TEs of element 51). Logical objects (LogO) are logical entities and
сформированы по законам логики (науки о мышлении). У ЛогО лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ЛогО), имеющие практическое использование, в качестве примера, но не ограничения, - «понятие», «суждение», «субъект суждения» (то, о чем что-либо утверждается или отрицается в суждении), «предикат суждения» (то, что formed according to the laws of logic (science of thinking). The LogO of the linguistic sentence 11 has unique names characterizing them (UN LogO), which have practical use, as an example, but not restrictions - “concept”, “judgment”, “subject of judgment” (that which is affirmed or denied in the judgment), “predicate of judgment” (that
утверждается или отрицается о субъекте суждения и тому подобное. В структуре данных элементы 51 именуются уникальными наименованиями, в качестве примера, но не ограничения, могут именоваться как «УН ЛогО п», где n > 1 - порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ЛогО, ранее не встречавшегося в лингвистическом предложении элемента в лингвистическом предложении. В дальнейшем, при упоминании ЛогО как элемента четвертой структуры данных или элемента 51 четвертой структуры данных имеется ввиду УН ЛогО. Массив логических объектов предложения представляет собой иной, нелингвистический способ регистрации смысла того, о чем идет речь в лингвистическом предложении. В отличии от лингвистического предложения, смысл которого может быть сохранен только при условии регистрации всех текстовых элементов предложения в одном месте (в виде одной единицы информации), массив логических объектов позволяет хранить туже информацию без потери смысла в разделенном виде, во множестве независимых мест хранения информации (в виде массива логических объектов). При этом формирование массива логических объектов позволяет не просто разделить единую информацию на части, но и системно структурировать эти части для любых преобразуемых в рамках настоящего способа affirmed or denied about the subject of judgment and the like. In the data structure, elements 51 are referred to by unique names, as an example, but not limitation, can be referred to as “UN LogO p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LogO previously not found in the linguistic sentence of the element in the linguistic sentence. In the future, when mentioning LogO as an element of the fourth data structure or element 51 of the fourth data structure, we mean the UNO LogO. An array of logical objects of a sentence is a different, non-linguistic way of registering the meaning of what is being discussed in a linguistic sentence. Unlike a linguistic sentence, the meaning of which can be saved only if all the text elements of the sentence are registered in one place (as a single unit of information), an array of logical objects allows storing the same information without loss of meaning in a divided form, in many independent places of information storage (as an array of logical objects). Moreover, the formation of an array of logical objects allows not only to divide the single information into parts, but also to systematically structure these parts for any transformed within the framework of this method
лингвистических предложений. Возможность регистрации и хранения логически и системно структурированной информации по частям открывает новые linguistic sentences. The ability to register and store logically and systemically structured information in parts opens up new
возможности для высокоточной обработки такой информации, поскольку в этом случае поиск и анализ информации технически может проводиться не в едином объеме исходной информации (лингвистическом предложении), а только в определенных логических частях этой информации, характеристики и требования к которым соответствуют логической сути и логическому предмету поиска или анализа. В результате такой способ хранения информации существенно уменьшает объем (зону) поиска и анализа, что приводит к уменьшению времени и повышению качества (релевантности, точности) поиска и анализа. opportunities for high-precision processing of such information, since in this case the search and analysis of information can technically be carried out not in a single volume of source information (linguistic sentence), but only in certain logical parts of this information, the characteristics and requirements of which correspond to the logical essence and logical subject of the search or analysis. As a result, this method of storing information significantly reduces the volume (zone) of search and analysis, which leads to a decrease in time and an increase in the quality (relevance, accuracy) of search and analysis.
[0087]Формирование элемента 51 (ЛогО) четвертой структуры данных СМД в рамках этапа 105 производят с помощью третьей структуры данных СМД, содержащей лингвистические объекты (ЛО) и базы данных корреляции  [0087] The formation of the element 51 (LogO) of the fourth SMD data structure in step 105 is performed using the third SMD data structure containing linguistic objects (LO) and a correlation database
лингвистических и логических объектов, представляющей собой таким образом третью пользовательскую базу данных (третью ПБД). Третью ПБД формируют для лингво-логического преобразования предварительно. Третья ПБД представляет собой перечень необходимых логических объектов, которые могут быть выделены в лингвистическом предложении и на которые оно может быть в итоге разделено. Кроме этого, третья ПБД содержит перечень лингвистических объектов linguistic and logical objects, representing in this way third user database (third PBB). The third PBB is formed previously for linguistic-logical conversion. The third PBB is a list of the necessary logical objects that can be highlighted in a linguistic sentence and into which it can eventually be divided. In addition, the third PBB contains a list of linguistic objects
уникальных наименований (УН ЛО) и описаний лингвистических объектов, которые предполагают тождественными искомым логическим объектам unique names (UN LO) and descriptions of linguistic objects that are supposed to be identical to the desired logical objects
уникальных наименований (УН ЛогО) при указанных условиях (указанном составе УН ЛО (перечень СЕ) и (или) указанном способе преобразования СЕ, а также указанных лингвистических характеристиках упомянутых СЕ). Для формирования логического объекта 51, коррелированного с выбранным лингвистическим объектом 41 или 42 в третьей структуре данных выбирают отдельный ЛО (из перечня ЛО) и с помощью третьей ПБД выявляют коррелированный с УН ЛО логический объект (УН ЛогО), в качестве примера, но не ограничения, выбирают из третьей структуры данных ЛО с уникальным наименованием (УН ЛО) «первое словосочетание» (словосочетание состоящее из простого предложения без однородных членов и оборотов (например, подлежащее) и все зависимые от него слова)) и направляют этот УН ЛО в качестве запроса в третью ПБД для поиска выбранного УН ЛО в перечне уникальных наименований имеющихся там ЛО. При обнаружении такого УН ЛО (например, «первое словосочетание») в соответствии с третьей ПБД получают отождествленное с ним УН логического объекта (в приведенном примере УН ЛогО - «субъект суждения»). Таким образом формируют логический объект (элемент 51 четвертой структуры данных СМД) для unique names (UN LogO) under the specified conditions (the specified composition of the UN LO (CE list) and (or) the specified CE conversion method, as well as the indicated linguistic characteristics of the mentioned CEs). To form a logical object 51 correlated with the selected linguistic object 41 or 42, a separate LO (from the list of LOs) is selected in the third data structure and, using the third PBB, a logical object (UNLOGO) correlated with UNLO is detected, as an example, but not limitation , choose “the first phrase” (the phrase consisting of a simple sentence without homogeneous members and turns (for example, subject) and all words dependent on it) from the third LO data structure with a unique name (UN LO))) and send this UN LO as a request to the third DBB to search for the selected UN LO in the list of unique names of LOs there. If such a VL LO is detected (for example, “the first phrase”), in accordance with the third PBB, a VL of the logical object identified with it is obtained (in the given example, VL LogO is the “subject of judgment”). In this way, a logical object is formed (element 51 of the fourth SMD data structure) for
выбранного лингвистического объекта 41 или 42. Результатом формирования элемента 51 является выявленное УН ЛогО. the selected linguistic object 41 or 42. The result of the formation of element 51 is the identified UNLOGO.
[0088] Идентификацию значения и порядковых номеров ТЭ элемента 51 (ЛогО) четвертой структуры данных СМД в рамках этапа 105 производят  [0088] The identification of the values and sequence numbers of the TE element 51 (LogO) of the fourth SMD data structure within the framework of step 105 is performed
следующим образом: значение (значения) 211 текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) коррелированный с элементом 51 элемент 41 или 42, идентифицируют как значение 511 элемента 51 (ЛогО), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) as follows: the value (s) 211 of the text element (s) 21 of the linguistic sentence 11 constituting (the components) element 41 or 42 correlated with element 51 are identified as the value 511 of element 51 (LogO), and the serial (ordinal) number (numbers) 212 of the said (mentioned) textual element (s) 21 of the linguistic sentence 11 constituting
коррелированный с элементом 51 элемент 41 или 42 идентифицируют как порядковый (порядковые) номер (номера) текстового (текстовых) элемента (элементов) 512, составляющего (составляющих) элемент 51 (ЛогО). element 41 or 42 correlated with element 51 is identified as ordinal (ordinal) number (s) of the text (text) element (s) 512 constituting the (component) element 51 (LogO).
[0089] Формирование четвертой структуры данных СМД в ходе этапа 105 производят путем объединения в одной структуре данных элементов 51 четвертой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.  [0089] The formation of the fourth SMD data structure during step 105 is performed by combining in one data structure the elements 51 of the fourth SMD data structure, as well as their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
[0090] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 51 (ЛогО) четвертой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих ЛогО 51, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 51 (ЛогО). При этом, как было описано ранее лингвистическими  [0090] Identification of the linguistic characteristics of TEs constituting the elements 51 (LogO) of the fourth SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP generated in step 102, consisting of TE identification data constituting LogO 51, and obtaining values 2131 linguistic characteristics of 213 text elements 21 of the linguistic sentence 11, of which consists of element 51 (LogO). Moreover, as previously described by linguistic
признаками элементов 51 (ЛогО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 51 (ЛогО). signs of elements 51 (LogO) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 51 (LogO) are composed.
[0091]Далее, после завершения описанного ранее этапа 103, в целях повышения точности последующего поиска в структурированном массиве данных становится возможным осуществить дальнейшее преобразование СМД,  [0091] Further, after completing the previously described step 103, in order to improve the accuracy of the subsequent search in the structured data array, it becomes possible to further transform the SMD,
содержащего, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и их идентификационные данные. containing at least the syntactic units (CE) of the linguistic sentence and their identification data.
[0092] На фиг. 13, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 200 преобразования СМД, содержащего, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и идентификационные данные СЕ, являющегося исходной  [0092] FIG. 13, by way of example, but not limitation, a general flow chart of the steps of the inventive SMD conversion method 200 is shown, comprising at least the syntactic units (CE) of the linguistic sentence and the identity of the CE being the source
структурой данных для рассматриваемого способа 200. Заявленный способ 200 преобразования СМД, содержащего, по меньшей мере, СЕ лингвистического предложения и идентификационные данные СЕ, характеризуется: выполнением этапа 201 идентификации пригодной для преобразования структуры данных, содержащей СЕ, на котором идентифицируют структуру данных СМД, содержащую элементы упомянутой пригодной для преобразования структуры данных, содержащей СЕ, являющейся исходной структурой данных СМД в рамках the data structure for the method 200 in question. The claimed method 200 for converting an SMD containing at least a linguistic sentence CE and CE identification data is characterized by: performing an identification step 201 of a transformable data structure containing a CE, in which an SMD data structure containing elements of said transformable data structure containing CE, which is the original data structure of the DMD within
рассматриваемого способа 200, причем упомянутые элементы пригодной для преобразования структуры данных представляют собой синтаксические единицы (СЕ) лингвистического предложения и идентификационные данные СЕ; the method 200 in question, said elements being suitable for data structure transformations are syntactic units (CE) of a linguistic sentence and CE identification data;
выполнением этапа 202 формирования пятой структуры данных СМД, на котором формируют пятую структуру данных СМД, являющуюся первой структурой данных СМД в рамках рассматриваемого способа 200, содержащую элементы упомянутой пятой структуры данных СМД, причем упомянутые элементы пятой структуры данных СМД представляют собой лингво-логические единицы (ЛЛЕ) performing step 202 of the formation of the fifth SMD data structure, in which the fifth SMD data structure is formed, which is the first SMD data structure in the framework of the method 200 under consideration, containing elements of said fifth SMD data structure, said elements of the fifth SMD data structure being linguistic logical units ( LLE)
лингвистического предложения, идентифицированные и сформированные по итогам лингво-логического анализа синтаксических единиц, а также представляют собой идентификационные данные ЛЛЕ, представляющие собой для каждого ЛЛЕ, в качестве примера, но не ограничения: значение ЛЛЕ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего linguistic sentences identified and generated by the results of linguo-logical analysis of syntactic units, and also represent LLE identification data, representing for each LLE, as an example, but not limitation: LLE value and serial (ordinal) number (s) of the Linguistic TE proposal constituting
(составляющих) ЛЛЕ; выполнением этапа 203 формирования шестой структуры данных СМД, на котором формируют шестую структуру данных СМД, являющуюся второй структурой данных СМД в рамках рассматриваемого способа 200, (constituents) LLE; the execution of step 203 of the formation of the sixth SMD data structure, which forms the sixth SMD data structure, which is the second SMD data structure in the framework of the method 200,
содержащую элементы упомянутой шестой структуры СМД, причем упомянутые элементы шестой структуры данных СМД представляют собой группы лингво - логических единиц (группы ЛЛЕ) лингвистического предложения containing elements of the said sixth structure of the SMD, and the mentioned elements of the sixth data structure of the SMD are groups of linguistic logical units (LLE groups) of a linguistic sentence
сформированные на основании схемы синтаксических связей ЛЛЕ в простом предложении исходного лингвистического предложения, а также представляют собой идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, в качестве примера, но не ограничения: значение группы ЛЛЕ и порядковые номера ТЭ лингвистического предложения, составляющих группу ЛЛЕ; выполнением этапа 204 формирования седьмой структуры данных СМД, на котором формируют седьмую структуру данных СМД, являющуюся итоговой структурой данных СМД для рассматриваемого способа 200, содержащую элементы упомянутой седьмой структуры данных СМД, причем упомянутые элементы седьмой структуры данных СМД представляют собой основные лингво -логические объекты (ОЛЛО) лингвистического предложения сформированные из групп ЛЛЕ путем устранения однородностей в группах ЛЛЕ, а также представляют собой идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, в качестве примера, но не ограничения: значение ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего formed on the basis of the LLE syntactic links scheme in a simple sentence of the original linguistic sentence, and also represent the identification data of the LLE groups, representing for each LLE group, as an example, but not limitation: the value of the LLE group and the sequence numbers of the TE linguistic sentences that make up the group LLE; the execution of the step 204 of forming the seventh SMD data structure, which forms the seventh SMD data structure, which is the final SMD data structure for the method 200 under consideration, containing elements of the seventh SMD data structure, said elements of the seventh SMD data structure being the main linguistic-logical objects ( OLLO) a linguistic sentence formed from LLE groups by eliminating homogeneities in LLE groups, and also represent the identification data of the LLLE, representing amounts to the each OLLO, as an example, but not limited to: the value of OLLO and serial (serial) number (s) TE linguistic offer amounts
(составляющих) ОЛЛО. [0093] На фиг. 14, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 201 идентификации пригодной для преобразования структуры данных, содержащей синтаксические единицы (СЕ), являющейся исходной структурой данных для рассматриваемого способа 200. Этап 201 характеризуется выполнением идентификации пригодной для преобразования структуры данных содержащей СЕ, на котором идентифицируют элементы 22 пригодной для преобразования структуры данных содержащей СЕ, а также идентификационные данные элементов 22, представляющие собой для каждого элемента 22, в качестве примера, но не ограничения, значение 221 элемента 22 пригодной для преобразования структуры данных, содержащей СЕ и порядковый (порядковые) номер (номера) 222 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 22. (constituents) OLLLO. [0093] FIG. 14, by way of example, but not limitation, a general flowchart is shown for performing a transformable data structure containing syntactic unit (CE) data structure 201 that is the original data structure for the method 200 in question. 201 is a process for identifying a data structure suitable for conversion containing CE, on which the elements 22 of the data structure suitable for transformation containing CE are identified, as well as the identification data of the elements 22, which are for of each element 22, by way of example, but not limitation, the value 221 of element 22 is suitable for converting a data structure containing CE and serial number (s) 222 of the TE of the linguistic sentence 11 constituting (constituting) element 22.
[0094] На фиг. 15, в качестве примера, но не ограничения, изображена общая структура данных, являющаяся исходной структурой данных для настоящего способа преобразования 200, представляющая собой пригодную для  [0094] FIG. 15, as an example, but not limitation, depicts a General data structure, which is the original data structure for the present conversion method 200, which is suitable for
преобразования структуру данных, содержащую синтаксические единицы. transform data structure containing syntactic units.
Исходная структура данных представляет собой СМД, содержащий элементы 22 пригодной для преобразования структуры данных, содержащей СЕ, The original data structure is a DMD containing elements 22 of a transformable data structure containing CE,
представляющие собой синтаксические единицы (СЕ) и идентификационные данные СЕ, представляющие собой для каждой СЕ, в качестве примера, но не ограничения, значение 221 элемента 22 пригодной для преобразования структуры данных, содержащей СЕ и порядковый (порядковые) номер (номера) 222 ТЭ лингвистического предложения, составляющего (составляющих) СЕ, которые, в качестве примера, но не ограничения, были описаны ранее со ссылкой на фиг. 8 способа 100. У элементов 22 лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН), имеющие практическое использование, в качестве примера, но не ограничения: «подлежащее», representing syntactic units (CE) and CE identification data, representing for each CE, as an example, but not limitation, the value 221 of element 22 is suitable for converting a data structure containing CE and serial number (s) 222 of the linguistic proposals constituting (constituting) the CE, which, by way of example, but not limitation, have been described previously with reference to FIG. 8 of the method 100. Elements 22 of the linguistic sentence 11 have their unique names characterizing them, having practical use, as an example, but not limitation: “subject”,
«сказуемое», «прямое дополнение» и тому подобное. В структуре данных элементы 22 именуются уникальными наименованиями и, в качестве примера, но не ограничения, могут именоваться как «УН СЕ п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН СЕ, ранее не встречавшегося в лингвистическом предложении. Как было сказано ранее, СЕ могут быть двух видов: исходные синтаксические объекты (ИСО), то есть синтаксические единицы - члены предложения, выявленные в результате синтаксического анализа, и "Predicate", "direct complement" and the like. In the data structure, elements 22 are referred to by unique names and, as an example, but not limited to, may be referred to as “UN CE p”, where n> 1 is the index number of the unique name element in the linguistic sentence, starting with “1” for each new CE not previously seen in a linguistic sentence. As mentioned earlier, CE can be of two types: source syntactic objects (ISO), that is, syntactic units - members suggestions identified by parsing, and
синтаксические конструкции представляющие собой конструкцию из syntactic constructions representing a construction from
синтаксически связанных ИСО. Элементы 22 пригодной для преобразования структуры данных, содержащей СЕ представляют собой множество ИСО syntactically related ISOs. Elements 22 of a transformable data structure containing CE are a plurality of ISO
уникальных наименований (УН ИСО) лингвистического предложения 11. ИСО 22 в пригодной для преобразования структуре данных, содержащей СЕ представляют собой отдельные элементы, заранее подготовленные и помещенные в пригодную для преобразования структуру данных, содержащую СЕ в виде структурированного массива (списка, перечня и тому подобного) отдельных ИСО. Такие unique names (UN ISO) of the linguistic sentence 11. ISO 22 in a transformable data structure containing CEs are separate elements prepared in advance and placed in a convertible data structure containing CE in the form of a structured array (list, list, etc.) ) individual ISO. Such
подготовительные действия могут осуществляться указанным любым известным из уровня техники способом или неизвестным из уровня техники способом, таким, как способ, указанный при описании способа 100, и, соответственно, далее не описываются. preparatory actions can be carried out by any method known in the art or unknown by the method, such as the method specified in the description of method 100, and, accordingly, are not further described.
[0095] Идентификация элементов 22 пригодной для преобразования структуры данных, содержащей СЕ в ходе этапа 201, сводится к классификации элементов, из которых состоит пригодная для преобразования структура данных, содержащая СЕ, как исходных синтаксических объектов (ИСО 22). При этом отдельные ИСО 22 имеют значение 221 и порядковый (порядковые) номер  [0095] The identification of the elements 22 of the transformable data structure containing the CE during step 201 is reduced to the classification of the elements of which the transformable data structure containing the CE consists of the original syntax objects (ISO 22). In this case, individual ISO 22s have a value of 221 and a serial (serial) number
(номера) 222 ТЭ лингвистического предложения, составляющего (составляющих) синтаксические единицы. Значение 221 ИСО 22 представляет собой один или несколько текстовых элементов (ТЭ 21) предложения 11, из которых состоят ИСО. Как правило ИСО состоят из одного ТЭ 21, за исключением некоторых ИСО. (numbers) 222 TE of the linguistic sentence constituting the syntactic units. The value 221 of ISO 22 is one or more text elements (TE 21) of proposal 11 of which ISO is composed. As a rule, ISOs consist of one TE 21, with the exception of some ISOs.
Например, но не ограничиваясь, ИСО «сказуемое» может состоять из трех ТЭ 21 - «мог быть выполнен». ИСО «сказуемое» состоит из трех текстовых элементов ввиду лингвистической особенности формирования сказуемого, которое, помимо глагола «выполнен», может иметь вспомогательный глагол «быть» и модальность For example, but not limited to, the ISO "predicate" may consist of three TE 21 - "could be completed." The ISO “predicate” consists of three text elements due to the linguistic features of the formation of the predicate, which, in addition to the verb “completed”, can have the auxiliary verb “to be” and modality
(модальный глагол) «мог». (modal verb) "could."
[0096] Идентификацию значения 221 элемента 22 (ИСО) пригодной для преобразования структуры данных, содержащей СЕ в ходе этапа 201 производят путем регистрации набора знаков ТЭ 21 предложения 11, составляющего  [0096] The identification of the value 221 of the element 22 (ISO) suitable for converting the data structure containing the CE during step 201 is performed by registering the character set of the TE 21 of proposal 11 constituting
(составляющих) элемент ИСО 22. Идентификацию порядкового (порядковых) номера (номеров) 222ТЭ, составляющего (составляющих) элемент 22 (ИСО) пригодной для преобразования структуры данных, содержащей СЕ в ходе этапа 201 производят путем регистрации порядкового (порядковых) номера (номеров) упомянутых ТЭ в соответствии с его (их) расположением в лингвистическом предложении, при условии, что первый ТЭ в лингвистическом предложении имеет порядковый номер «1», а все последующие ТЭ имеют порядковый номер, больший на единицу чем порядковый номер предыдущего ТЭ. (constituent) element of ISO 22. The identification of the ordinal (ordinal) number (s) of 222TE, constituting (constituent) element 22 (ISO) of a suitable data structure containing CE during step 201 is performed by registering the ordinal (ordinal) number (s) mentioned TE in accordance with its (their) location in the linguistic sentence, provided that the first TE in the linguistic sentence has a serial number of "1", and all subsequent TE have a serial number greater by one than the serial number of the previous TE.
[0097] Пригодная для преобразования структура данных, содержащая СЕ, являющаяся исходной для настоящего способа преобразования 200 представляет собой в итоге множество элементов 22, их значений 221 и порядковых номеров 222 ТЭ, составляющих элементы 22, идентифицированных на этапе 201.  [0097] A transformable data structure containing CE that is the starting point for the present conversion method 200 is the result of a plurality of elements 22, their values 221 and sequence numbers 222 of the FCs constituting the elements 22 identified in step 201.
[0098] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 22 (ИСО) пригодной для преобразования структуры данных, содержащей СЕ и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих ИСО 22, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 22 (ИСО). При этом, как было описано ранее,  [0098] Identification of the linguistic characteristics of TEs constituting elements 22 (ISO) of a data structure suitable for transforming CE and their values, if necessary, is carried out by organizing a request in BDLP generated in step 102, which consists of identification data of TEs that comprise ISO 22, and obtaining the values 2131 of the linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11 of which the element 22 (ISO) consists. Moreover, as described previously,
лингвистическими признаками элементов 22 (ИСО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 22 (ИСО). the linguistic features of elements 22 (ISO) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11 of which the elements 22 (ISO) are composed.
[0099] На фиг. 16, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 202 формирования пятой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 200. Этап 202 характеризуется: выполнением этапа 2021 формирования значений 2141 второй части лингвистических характеристик 214 текстовых элементов 21, составляющих элементы 22 пригодной для преобразования структуры данных, содержащей СЕ, на котором формируют значения 2141 второй части  [0099] FIG. 16, by way of example, but not limitation, a general flowchart is shown of the steps of forming the fifth SMD data structure 202, which is the first data structure for the method 200 under consideration. Step 202 is characterized by: performing step 2021 of generating values 2141 of the second part of linguistic characteristics 214 of text elements 21 constituting elements 22 of a transformable data structure containing CE on which values 2141 of the second part are formed
лингвистических характеристик 214 текстовых элементов 21, составляющих элементы 22 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 102, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021; выполнением этапа 2022 формирования значений 2231 третьей части лингвистических характеристик 223 текстовых элементов 21, составляющих элементы 22 пригодной для преобразования структуры данных, содержащей СЕ на котором идентифицируют виды элемента 22 пригодной для преобразования структуры данных, содержащей СЕ для которых необходимо изменить некоторые значения лингвистических характеристик, формируют упомянутые значения 2231 третьей части лингвистических the linguistic characteristics of the 214 text elements 21 constituting the elements 22 and enter the received information into the BDLP of the text elements 21 of the linguistic sentence 11 formed in step 102, forming as a result the BDLP of the text elements 21 of the linguistic sentence 11 formed in the frame of step 2021; by performing step 2022 of generating values 2231 of the third part of the linguistic characteristics 223 of the text elements 21 constituting the elements 22 of a transformable data structure containing CE on which the types of element 22 are identified suitable for transformation of a data structure containing CE for which it is necessary to change some values of linguistic characteristics, the mentioned values of 2231 of the third part of linguistic
характеристик 223 текстовых элементов 21, составляющих элементы 22 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2022; выполнением этапа 2023 идентификации элементов 61 пятой структуры данных СМД, на котором идентифицируют и формируют элементы 61, пятой структуры данных СМД, а также идентификационные данные элементов 61, представляющие собой для каждого элемента 61, в качестве примера, но не ограничения, значение 611 элемента 61 пятой структуры данных СМД и characteristics 223 of the text elements 21 constituting the elements 22 and inputting the received information into the BDLP of the text elements 21 of the linguistic sentence 11 generated in step 2021, forming as a result the BDLP of the text elements 21 of the linguistic sentence 11 formed in the framework of step 2022; by performing step 2023 of identifying elements 61 of the fifth DMD data structure, on which elements 61, of the fifth SMD data structure, and identifying elements 61, representing for each element 61, are identified and formed, as an example, but not limitation, the value 611 of element 61 fifth SMD data structure and
порядковый (порядковые) номер (номера) 612 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 61, и формируют пятую структуру данных СМД. serial number (s) 612 TE of the linguistic sentence 11 constituting the component 61 and form the fifth data structure of the SMD.
[0100]На фиг. 17, в качестве примера, но не ограничения, изображена общая структура сформированной в рамках этапа 2021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей СЕ. БДЛП, сформированная в рамках этапа 2021, отличается от БДЛП, сформированной в рамках этапа 102, наличием значений 2141 второй части лингвистических характеристик 214, указывающих на  [0100] FIG. 17, by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated in step 2021 is shown, which is BDLP of the text elements 21 of the linguistic sentence 11 contained in the elements 22 suitable for transforming a data structure containing CE. The BDLP generated in step 2021 differs from the BDLP generated in step 102 in the presence of values 2141 of the second part of the linguistic characteristics 214, indicating
синтаксическо-логическую идентичность элемента 22 (ИСО). Для идентификации лингво-логических единиц (ЛЛЕ) лингвистического предложения необходимо по всем синтаксическим единицам вида ИСО (элемент 22) провести проверку на идентичность их синтаксической и логической ролей в лингвистическом syntactic-logical identity of element 22 (ISO). To identify linguistic logical units (LLE) of a linguistic sentence, it is necessary to check for all syntactic units of the ISO type (element 22) that their syntactic and logical roles are identical in the linguistic
предложении 11. В результате упомянутой проверки синтаксических единиц ИСО 22 на их синтаксическо-логическую идентичность должны быть установлены наличие или отсутствие идентичности ИСО 22. ИСО 22 будет считаться Proposition 11. As a result of the above verification of the syntactic units of ISO 22 for their syntactic-logical identity, the presence or absence of the identity of ISO 22 should be established. ISO 22 will be considered
синтаксическо-логическо идентичным, если его синтаксическая и логическая роли совпадут, и будет считаться синтаксическо-логическо неидентичным, если упомянутые роли не совпадут. Синтаксическая роль ИСО 22 - это функция слова в предложении, которая определяется в рамках взаимосвязей слов в предложении. Синтаксическая роль ИСО 22 определяет, каким членом предложения является слово, и в каких оно синтаксических отношениях состоит с другими словами. Одна и та же форма слова может выполнять различные функции, то есть быть разными членами предложения. Логическая роль ИСО 22 - это синтаксическая роль, отождествленная с логической функцией слова в простом суждении. Вид syntactically logical identical if its syntactic and logical roles coincide, and it will be considered syntactically logical non-identical if the mentioned roles do not match. The syntactic role of ISO 22 is the function of a word in a sentence, which is defined as part of the interconnections of words in a sentence. The syntactic role of ISO 22 determines which member of the sentence is a word, and in what syntactic relations it consists of other words. One and the same form of a word can fulfill different functions, that is, be different members of a sentence. The logical role of ISO 22 is a syntactic role identified with the logical function of a word in a simple proposition. View
логической функции в простом суждении связан с уникальным наименованием логического объекта (УН ЛО), являющегося элементом простого суждения, к которому относится ИСО 22. Простое суждение - это логическая сущность, представляющая собой первичную логическую конструкцию мышления, обязательно содержащую элементы простого суждения - субъект суждения logical function in a simple proposition is associated with the unique name of a logical object (UN LO), which is an element of a simple proposition, which refers to ISO 22. A simple proposition is a logical entity, which is the primary logical construction of thinking, necessarily containing elements of a simple proposition - the subject of the proposition
(предмет окружающего мира, о котором идет речь) и предикат суждения (то, что утверждается или опровергается о предмете суждения). При этом субъект суждения представляет собой один предмет окружающего мира, а предикат суждения состоит как правило из действия и множества предметов, которые находятся в определенной взаимосвязи друг с другом, что в конечном итоге и выполняет функцию предиката суждения, то есть поясняет то, что утверждается или опровергается о предмете суждения. Поэтому предикат суждения может быть разделен на логические функционально-однородные части (логические объекты), в качестве примера, но не ограничения, такие как действие, объект и (the subject of the surrounding world), and the predicate of judgment (that which is affirmed or refuted about the subject of judgment). In this case, the subject of judgment is one object of the world, and the predicate of judgment consists usually of an action and many objects that are in a certain relationship with each other, which ultimately performs the function of a predicate of judgment, that is, it explains what is affirmed or disproved about the subject of judgment. Therefore, the predicate of judgment can be divided into logical functionally homogeneous parts (logical objects), as an example, but not restrictions, such as an action, an object, and
обстоятельства предиката суждения. Упомянутые ранее субъект суждения, а также действие, объект и обстоятельства предиката суждения могут являться judgment predicate circumstances. The previously mentioned subject of judgment, as well as the action, object and circumstances of the predicate of judgment may be
уникальными наименованиями логического объекта (УН ЛО), являющегося элементом простого суждения. В соответствии с использованным словом (ИСО 22) посредством которого выражены элементы простого суждения, эти слова (ИСО 22) будут иметь определенную логическую функцию, которая в соответствии с предварительно заданными условиями может отождествляться или не unique names of the logical object (UN LO), which is an element of simple judgment. In accordance with the word used (ISO 22) by which elements of simple judgment are expressed, these words (ISO 22) will have a certain logical function, which, in accordance with predefined conditions, can be identified or not
отождествляться с определенной синтаксической ролью. Таким образом identify with a particular syntactic role. Thus
становится возможным провести проверку на идентичность синтаксической и логической ролей отдельных ИСО 22 лингвистического предложения 11 и преобразовать ИСО 22 в лингво-логические единицы (ЛЛЕ). it becomes possible to check the identity of the syntactic and logical roles of individual ISO 22 linguistic sentences 11 and convert ISO 22 into linguistic logical units (LLE).
[0101]Формирование второй части лингвистических характеристик 214 и их значений 2141 для текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 с целью идентификации синтаксическо-логической идентичности ИСО 22 на этапе 2021 производят путем проверки ИСО 22 на идентичность синтаксической и логической ролей в лингвистическом предложении 11. Проверка представляет собой сравнение значений 2131 первой части лингвистических характеристик 213 текстовых элементов 21, составляющих элементы 22, с заранее заданными значениями заранее заданных лингвистических признаков текстовых элементов 21, составляющих ИСО 22. Для проведения проверки заранее задаются условия, такие как, в качестве примера, но не [0101] The formation of the second part of the linguistic characteristics 214 and their values 2141 for the text elements 21 of the linguistic sentence 11 contained in the elements 22 in order to identify the syntactic-logical identity of ISO 22 at step 2021 is performed by checking the ISO 22 for the identity of the syntactic and logical roles in the linguistic Proposition 11. The check is a comparison of the values 2131 of the first part of the linguistic characteristics 213 of the text elements 21 constituting the elements 22 with the predefined values of the predefined linguistic characteristics of the text elements 21 constituting the ISO 22. Conditions are predefined for the verification, such as, as example but not
ограничения: перечни пар ИСО 22, у которых синтаксическая и логическая роли могут не совпадать, а также признаки несовпадения синтаксической и логической ролей (некоторые значения лингвистических характеристик указанных ИСО 22, при наличии которых ИСО 22 идентифицируется как ИСО 22 с несовпадением синтаксических и логических ролей). ИСО 22, которые успешно проходят restrictions: lists of pairs of ISO 22 for which the syntactic and logical roles may not coincide, as well as signs of a mismatch of the syntactic and logical roles (some values of the linguistic characteristics of these ISO 22, in the presence of which ISO 22 is identified as ISO 22 with a mismatch of syntactic and logical roles) . ISO 22, which successfully pass
упомянутую проверку идентифицируют как ИСО 22 с совпадением синтаксических и логических ролей (СЛ-идентичные ИСО 22, то есть синтаксическо-логическо идентичные ИСО). ИСО 22, которые не проходят упомянутую проверку по причине того, что их упомянутые роли не совпадают, идентифицируют как ИСО 22 с несовпадением синтаксических и логических ролей (СЛ-неидентичные ИСО 22, то есть синтаксическо-логическо неидентичные ИСО). Например, но не said verification is identified as ISO 22 with matching syntactic and logical roles (SL-identical ISO 22, that is, syntactically logical identical ISO). ISO 22, which do not pass the test because their roles do not match, are identified as ISO 22 with mismatched syntactic and logical roles (SL non-identical ISO 22, i.e. syntactically logical non-identical ISOs). For example, but not
ограничиваясь, ИСО в форме глагола имеет синтаксическую роль - «сказуемое», а ИСО в форме причастия - синтаксическую роль «согласованное определение». Несмотря на то, что синтаксические роли глагола и причастия не совпадают, с логической точки зрения и тот и другой ИСО являются синтаксически главными словами в одном и том же элементе простого суждения «действие предиката суждения», то есть имеют одну и ту же логическую роль. В итоге ИСО в форме глагола проходит проверку идентичности синтаксической и логической ролей, так как «глагол» и есть то, что выражает действие. При этом ИСО в форме limiting itself, the ISO in the form of a verb has a syntactic role - the "predicate", and the ISO in the form of participle - the syntactic role of the "agreed definition". Despite the fact that the syntactic roles of the verb and the participle do not coincide, from the logical point of view, both the ISO and the other are syntactically the main words in the same element of a simple proposition “the action of the predicate of proposition”, that is, they have the same logical role. As a result, the ISO in the form of a verb passes the verification of the identity of the syntactic and logical roles, since the “verb” is what expresses the action. In this case, ISO in the form
согласованного определения не проходит проверку, так как «определение» - это признак, а не действие. По этой причине, а также при дополнительном условии, что причастие является распространенным (имеет зависимые слова - значимые части речи) считается, что ИСО «согласованное определение» в форме причастия не проходят упомянутую проверку и являются СЛ-неидентичным ИСО 22. Упомянутые условия, используемые для проведения проверки идентичности синтаксической и логической ролей ИСО 22 предварительно записывают в четвертую an agreed definition does not pass the test, since a “definition” is a sign, not an action. For this reason, and also under the additional condition that the participle is common (it has dependent words - significant parts of speech), it is considered that the ISO “agreed definition” in the form of participle does not pass the mentioned test and are SL-non-identical to ISO 22. Mentioned conditions used to verify the identity of the syntactic and logical roles, ISO 22 is pre-written in the fourth
пользовательскую базу данных (четвертую ПБД). user database (fourth PBB).
[0102]Сформированные в результате выполнения этапа 2021 значения 2141 (синтаксическо-логическая идентичность ИСО 22) второй части лингвистических характеристик 214 элементов 21, составляющих ИСО 22 пригодной для преобразования структуры данных, содержащей СЕ вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 102, формируя таким образом БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021. При этом обе части (213 и 214) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2131 и 2141) формируют уникальные [0102] The values 2141 (syntactic-logical identity of ISO 22) of the second part of the linguistic values generated as a result of step 2021 characteristics of 214 elements 21 constituting ISO 22 of a data structure suitable for converting CE are introduced into the BDLP of the text elements 21 of the linguistic sentence 11 formed in step 102, thereby forming the BDLP of the text elements 21 of the linguistic sentence 11 formed in step 2021. When this, both parts (213 and 214) of the linguistic characteristics of the text elements 21 of the linguistic sentence 11 and their meanings (2131 and 2141) form unique
лингвистические признаки элементов 22. linguistic attributes of the elements 22.
[0103]На фиг. 18, в качестве примера, но не ограничения, изображена общая структура сформированной в рамках этапа 2022 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей СЕ. БДЛП, формируемая в рамках этапа 2022, отличается от БДЛП, формируемой в рамках этапа 2021, наличием значений 2231 третьей части лингвистических характеристик 223, указывающих вид элемента 22 (ИСО) и актуальные значения некоторых лингвистических характеристик 213 текстовых элементов, составляющих элемент 22 (ИСО). Для идентификации лингво-логических единиц (ЛЛЕ) лингвистического 11 необходимо по всем синтаксическим единицам ИСО 22, по которым была проведена проверка на идентичность их синтаксической и логической ролей дополнительно провести идентификацию видов ИСО 22 по признаку внесения изменений в значения их лингвистических характеристик 213 в соответствии с их значением 2141  [0103] In FIG. 18, by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated in step 2022 is shown, which is BDLP of the text elements 21 of the linguistic sentence 11 contained in the elements 22 suitable for transforming a data structure containing CE. BDLP formed in step 2022 differs from BDLP formed in step 2021 in the presence of values 2231 of the third part of linguistic characteristics 223 indicating the type of element 22 (ISO) and actual values of some linguistic characteristics of 213 text elements making up element 22 (ISO) . In order to identify linguistic-logical units (LLE) of linguistic 11, it is necessary for all syntactic units of ISO 22, by which the identity of their syntactic and logical roles was checked, additionally identify types of ISO 22 by the basis of making changes to the values of their linguistic characteristics 213 in accordance with their value is 2141
синтаксическо-логической идентичности 214. В результате проведенной на этапе 2021 проверки на синтаксическо-логическую идентичность ИСО 22 было syntactic-logical identity 214. As a result of a check on step 2021 for syntactic-logical identity, ISO 22 was
установлено, что все ИСО 22 разделяются по этому признаку на СЛ-идентичные и СЛ-неидентичные ИСО 22. При этом СЛ-неидентичные ИСО 22 могут быть изменяемыми и неизменяемыми, то есть такие СЛ-неидентичные ИСО 22, у которых в соответствии с заранее заданным условием должны быть изменены значения 2131 некоторых лингвистических характеристик 213 или не изменены. Кроме этого, в некоторых случаях, в заранее установленных условиях возможно наличие требования о создании дубликата СЛ-неидентичного ИСО 22, у которого не изменяются лингвистические характеристики. Упомянутые условия и it was found that all ISO 22 are divided according to this criterion into SL-identical and SL-identical ISO 22. Moreover, SL-identical ISO 22 can be mutable and unchanged, that is, such SL-non-identical ISO 22, for which, in accordance with a predetermined the condition must be changed 2131 values of some linguistic characteristics 213 or not changed. In addition, in some cases, under predetermined conditions, there may be a requirement to create a duplicate of a SL-non-identical ISO 22, in which the linguistic characteristics do not change. Mentioned conditions and
требования устанавливаются в четвертой ПБД. requirements are established in the fourth PBB.
[0104]Формирование третьей части лингвистических характеристик 223 и их значений 2231 для текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 производят на этапе 2022 с целью идентификации различных видов ИСО 22 по признаку синтаксическо-логической идентичности (СЛ-идентичности) и формирования дубликата СЛ-неидентичного ИСО 22 путем комплексного анализа условий, установленных в четвертой ПБД, и на основании итогов проверки ИСО 22 на СЛ-идентичность. В результате упомянутого анализа для каждого ИСО 22 устанавливают определенный вид - первый, второй или третий вид. Если в условиях, установленных в четвертой ПБД, имеется требование о создании дубликата СЛ-неидентичных ИСО 22, то такие ИСО 22 относят к четвертому виду ИСО 22. В соответствии с установленным видом ИСО 22 [0104] The formation of the third part of the linguistic characteristics 223 and their values 2231 for the text elements 21 of the linguistic sentence 11 contained in the elements 22 are produced at step 2022 in order to identify various types of ISO 22 based on syntactic-logical identity (SL-identity) and to duplicate the SL-non-identical ISO 22 by a complex analysis of conditions, established in the fourth PBB, and based on the results of the verification of ISO 22 for SL identity. As a result of the above analysis, a specific view is established for each ISO 22 — the first, second or third view. If, under the conditions established in the fourth PBB, there is a requirement to create a duplicate of SL-non-identical ISO 22, then such ISO 22 is classified as the fourth type of ISO 22. In accordance with the established type of ISO 22
формируют значения 2231 третьей части лингвистических характеристик 223 текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22. У первого вида ИСО 22 (СЛ-идентичные) остаются все их исходные значения 221 и номера текстовых элементов 222, а также их лингвистические характеристики 213 и 214 со значениями 2131 и 2141. В связи с этим значения 2231 лингвистических характеристик 213 для такого ИСО 22 отсутствуют. У второго вида ИСО 22 (СЛ-неидентичные изменяемые) остается неизменным исходное их значение 221 и номера текстовых элементов 222, а также вторая часть их лингвистических характеристик 214 со значениями 2141, но при этом значения 2131 некоторых лингвистических характеристик 213 первой части изменяют. В связи с этим значения 2231 лингвистической характеристики 223 вместо изменяемых значений 2131 некоторых лингвистических характеристик 213 такого ИСО 22 указывается таким, как это установлено в четвертой ПБД. У третьего вида ИСО 22 (СЛ-неидентичные неизменяемые) остаются все их исходные значения 221 и номера текстовых элементов 222, а также их лингвистические характеристики 213 и 214 со значениями 2111 и 2141. В связи с этим значения 2231 form values 2231 of the third part of the linguistic characteristics of 223 text elements 21 of the linguistic sentence 11 contained in elements 22. The first type of ISO 22 (SL-identical) retains all of their original values 221 and numbers of text elements 222, as well as their linguistic characteristics 213 and 214 with values of 2131 and 2141. In this regard, the values of 2231 linguistic characteristics 213 for such ISO 22 are absent. In the second type, ISO 22 (SL-non-identical variable), their original value 221 and the numbers of text elements 222, as well as the second part of their linguistic characteristics 214 with values of 2141, remain unchanged, but the values of 2131 of some linguistic characteristics 213 of the first part are changed. In this regard, the values 2231 of the linguistic characteristic 223 instead of the variable values 2131 of some linguistic characteristics 213 of such ISO 22 are indicated as established in the fourth PBB. The third type of ISO 22 (SL non-identical unchanging) retains all their original values 221 and text element numbers 222, as well as their linguistic characteristics 213 and 214 with values 2111 and 2141. In this regard, values 2231
лингвистических характеристик 213 для такого ИСО 22 отсутствуют. У четвертого вида ИСО 22 (дубликат СЛ-неидентичных неизменяемых ИСО) остается there are no linguistic characteristics 213 for such ISO 22. The fourth type of ISO 22 (a duplicate of SL-non-identical unchanged ISOs) remains
неизменным исходное их значение 221 и номера текстовых элементов 222, а также вторая часть их лингвистических характеристик 214 со значениями 2141, но при этом значения 2131 некоторых лингвистических характеристик 213 первой части изменяют. В связи с этим значения 2231 лингвистической характеристики 223 вместо изменяемых значений 2131 некоторых лингвистических характеристик 213 такого ИСО 22 указывают таким, как это установлено в четвертой ПБД. [0105]Сформированные по итогам этапа 2022 значения 2231 (измененные значения лингвистических характеристик ИСО 22) третьей части лингвистических характеристик 223 элементов 21, составляющих ИСО 22 пригодной для their original value 221 and the numbers of text elements 222, as well as the second part of their linguistic characteristics 214 with values 2141, remain unchanged, but the values 2131 of some linguistic characteristics 213 of the first part are changed. In this regard, the values 2231 of the linguistic characteristic 223, instead of the variable values 2131 of some linguistic characteristics 213 of such ISO 22, are indicated as established in the fourth PBB. [0105] The values 2231 generated by the results of step 2022 (modified values of the linguistic characteristics of ISO 22) of the third part of the linguistic characteristics of 223 elements 21 constituting ISO 22 are suitable for
преобразования структуры данных, содержащей СЕ, вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021, формируя таким образом БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2022. При этом все три части (213, 214 и 223) лингвистических характеристик текстовых элементов 21 transformations of the data structure containing CE are introduced into the BDLP of the text elements 21 of the linguistic sentence 11, which is formed as part of the step 2021, thus forming the BDLP of the text elements 21 of the linguistic sentence 11, which is formed as part of the step 2022. Moreover, all three parts (213, 214 and 223) linguistic characteristics of text elements 21
лингвистического предложения 11 и их значения (2131, 2141 и 2231) формируют уникальные лингвистические признаки элемента 22. linguistic sentences 11 and their meanings (2131, 2141 and 2231) form unique linguistic features of element 22.
[0106]На фиг. 19, в качестве примера, но не ограничения, изображена общая структура сформированной пятой структуры данных СМД, являющейся первой для настоящего способа преобразования 200. Пятая структура данных СМД  [0106] In FIG. 19, by way of example, but not limitation, the general structure of the generated fifth SMD data structure is shown, which is the first for the present conversion method 200. The fifth SMD data structure
представляет собой СМД, содержащий элементы 61 пятой структуры данных СМД, которые представляют собой лингво-логические единицы (ЛЛЕ 61) represents the SMD containing elements 61 of the fifth data structure of the SMD, which are linguistic logical units (LLE 61)
лингвистического предложения 11 и идентификационные данные ЛЛЕ 61, представляющие собой для каждой ЛЛЕ, в качестве примера, но не ограничения, значение 611 элемента 61 пятой структуры данных и порядковый (порядковые) номер (номера) 612 ТЭ, составляющего (составляющих) ЛЛЕ 61. У ЛЛЕ 61 лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ЛЛЕ), имеющие практическое использование в качестве примера, но не ограничения: «подлежащее», «сказуемое», «прямое дополнение» и тому подобное. В структуре данных элементы 61 именуются уникальными наименованиями, и, в качестве примера, но не ограничения, могут именоваться как «УН ЛЛЕ п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ЛЛЕ, ранее не встречавшегося в лингвистическом предложении. Лингво-логическая единица (ЛЛЕ 61) - это синтаксическая единица вида ИСО, по которой проведена проверка на идентичность ее синтаксической и логической ролей в лингвистическом предложении. При этом может быть два вида ЛЛЕ 61: первый вид - это linguistic sentence 11 and LLE 61 identification data, representing for each LLE, as an example, but not limitation, the value 611 of element 61 of the fifth data structure and the serial number (s) of 612 TEs representing (constituent) LLE 61. U LLE 61 of the linguistic sentence 11 there are unique names characterizing them (UN LLE), which have practical use as an example, but not restrictions: “subject”, “predicate”, “direct complement” and the like. In the data structure, elements 61 are referred to by unique names, and, as an example, but not limitation, can be referred to as “UNLLE p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LLE, not previously seen in a linguistic sentence. A linguistic-logical unit (LLE 61) is a syntactic unit of the ISO type, by which a check is made for the identity of its syntactic and logical roles in a linguistic sentence. There can be two types of LLE 61: the first type is
оригинальный ИСО 22, прошедший упомянутую проверку, который содержался в пригодной для преобразования структуре данных, содержащей СЕ, а второй вид - это дубликат ИСО 22, которого не было в упомянутой структуре данных. Первому виду ЛЛЕ 61 соответствуют все ИСО 22 пригодной для преобразования структуры данных, содержащей СЕ. Второму виду ЛЛЕ 61 соответствуют те ИСО 22 пригодной для преобразования структуры данных, содержащей СЕ, которые отнесены к четвертому виду (дубликат СЛ-неидентичных неизменяемых ИСО), указанному в значении 2231 третьей части лингвистических характеристик 223. the original ISO 22 that passed the mentioned test, which was contained in a transformable data structure containing CE, and the second type is a duplicate of ISO 22, which was not in the mentioned data structure. The first type of LLE 61 corresponds to all ISO 22 suitable for transformation of the structure data containing CE. The second type of LLE 61 corresponds to those of ISO 22 suitable for the conversion of the data structure containing CE, which are assigned to the fourth type (duplicate of SL-identical identical unchanged ISOs), indicated in the value 2231 of the third part of the linguistic characteristics 223.
[0107] Идентификацию и формирование элементов 61 пятой структуры данных СМД в ходе этапа 2023 производят на основе результатов этапа 2022 по идентификации видов элементов 22 пригодной для преобразования структуры данных, содержащей СЕ. Идентификацию элементов 61 (ЛЛЕ) первого вида на этапе 2023 производят путем их отождествления с элементами 22 (ИСО) первого, второго и третьего видов. ИСО 22, идентифицированные на этапе 2022 как четвертый вид, формируют новые элементы - элементы 61 второго вида пятой структуры данных СМД. Формирование элементов 61 (ЛЛЕ) второго вида на этапе 2023 производится путем их отождествления с элементами 22 (ИСО) четвертого вида.  [0107] The identification and generation of elements 61 of the fifth DMD data structure during step 2023 is based on the results of step 2022 to identify the types of elements 22 suitable for converting the data structure containing CE. The identification of the elements 61 (LLE) of the first type at step 2023 is carried out by identifying them with the elements 22 (ISO) of the first, second and third types. ISO 22, identified at step 2022 as the fourth type, form new elements - elements 61 of the second type of the fifth data structure of the DMD. The formation of the elements 61 (LLE) of the second type at step 2023 is carried out by identifying them with the elements 22 (ISO) of the fourth type.
[0108]Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 первого вида пятой структуры данных СМД,  [0108] the Identification of the values and serial (serial) numbers (numbers) of the TE element 61 of the first type of the fifth data structure SMD,
отождествленного с первым видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 первого вида, а порядкового (порядковых) номера (номеров) 612 ТЭ, составляющего (составляющих) элемент 61, путем отождествления с порядковым (порядковыми) номером (номерами) 222 ТЭ, составляющего (составляющих) элемент 22 первого вида. Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 первого вида пятой структуры данных СМД, отождествленного со вторым видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 второго вида, а identified with the first type of ISO 22, is carried out in step 2023 by identifying the value 611 of element 61 with the value 221 of element 22 of the first type, and the serial number (s) of 612 FCs that make up the element 61 by identifying with the ordinal ( serial) number (numbers) 222 TE, constituting (constituent) element 22 of the first type. The identification of the value and serial number of the TE element 61 of the first type of the fifth SMD data structure, identified with the second type of ISO 22, is carried out in step 2023 by identifying the value 611 of the element 61 with the value 221 of the element 22 of the second type, and
порядкового (порядковых) номера (номеров) 612ТЭ, составляющих элемент 61, с порядковым (порядковыми) номерами 222 ТЭ, составляющего (составляющих) элемент 22 второго вида. Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 первого вида пятой структуры данных СМД, отождествленного с третьим видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 третьего вида, а порядкового (порядковых) номера (номеров) 612 текстовых элементов 21, составляющих элемент 61, с порядковым (порядковыми) номером (номерами) 222 ТЭ, составляющего (составляющих) элемент 22 третьего вида. Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 второго вида пятой структуры данных СМД, отождествленного с четвертым видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 третьего вида, а порядкового (порядковых) номера (номеров) 612ТЭ, составляющего (составляющих) элемент 61, с порядковым (порядковыми) номером (номерами) 222 ТЭ, составляющего (составляющих) элемент 22 третьего вида. ordinal (ordinal) numbers (numbers) 612ТЭ, constituting element 61, with ordinal (ordinal) numbers 222 ТЭ, constituting (constituting) element 22 of the second kind. The identification of the value and the ordinal number (s) of the TE element 61 of the first type of the fifth SMD data structure identified with the third type of ISO 22 is performed as part of step 2023 by identifying the value 611 of the element 61 with the value 221 of the element 22 of the third kind, and the ordinal ( serial) numbers (numbers) of 612 text elements 21 constituting element 61, with serial (ordinal) number (numbers) 222 of TEs constituting (constituting) element 22 of the third kind. Identification values and serial (serial) numbers (numbers) of TE element 61 of the second type of the fifth data structure of the SMD, identified with the fourth type of ISO 22, is performed as part of step 2023 by identifying the value 611 of element 61 with the value 221 of element 22 of the third type, and the ordinal (ordinal ) numbers (numbers) 612ТЭ of the component (constituent) element 61, with serial (ordinal) number (numbers) 222 of the TE, constituting (constituent) element 22 of the third kind.
[0109]Формирование пятой структуры данных СМД в ходе этапа 2023 производят путем объединения в одной структуре данных элементов 61 первого и второго видов пятой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.  [0109] The formation of the fifth SMD data structure during step 2023 is performed by combining in one data structure the elements 61 of the first and second types of the fifth SMD data structure and their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
[0110] Идентификацию лингвистических характеристик ТЭ, составляющих первые или вторые элементы 61 (ЛЛЕ) пятой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2022, состоящего из идентификационных данных ТЭ, составляющих первый или второй элемент 61 (ЛЛЕ), и получении значений (2131, 2141, 2231) всех частей лингвистических характеристик (213, 214, 223) текстовых элементов 21 лингвистического предложения 11, из которых состоит первый или второй элемент 61 (ЛЛЕ). При этом, как было описано ранее лингвистическими признаками первых и вторых элементов 61 (ЛЛЕ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 61 (ЛЛЕ).  [0110] Identification of the linguistic characteristics of TEs that make up the first or second elements 61 (LLE) of the fifth SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP generated in step 2022, consisting of TE identification data constituting the first or second element 61 (LLE), and obtaining values (2131, 2141, 2231) of all parts of the linguistic characteristics (213, 214, 223) of the text elements 21 of the linguistic sentence 11 of which the first or second element 61 (LLE) consists. Moreover, as previously described by the linguistic features of the first and second elements 61 (LLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 61 (LLE) are composed.
[0111]На фиг. 20 в качестве примера, но не ограничения, изображена общая схема выполнения этапа 203 формирования шестой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 200. Этап 203 характеризуется: выполнением этапа 2031 формирования значений 2151 четвертой части лингвистических характеристик 215 текстовых элементов 21, составляющих элементы 61 пятой структуры данных СМД, на котором формируют значения 2151 четвертой части лингвистических характеристик 215 текстовых элементов 21, составляющих элементы 61, и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2022, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031; выполнением этапа 2032 формирования элементов шестой структуры данных СМД, на котором формируют элементы 71 шестой структуры данных СМД, а также идентификационные данные элементов 71, представляющие собой для каждого элемента 71, в качестве примера, но не ограничения, значение 711 элемента 71 шестой структуры данных СМД и порядковый (порядковые) номер (номера) 712 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 71; и формируют шестую структуру данных СМД. [0111] In FIG. 20, by way of example, but not limitation, a general flowchart is shown for performing step 203 of creating the sixth SMD data structure, which is the second data structure for the method 200 under consideration. Step 203 is characterized by: performing step 2031 of generating values 2151 of the fourth part of the linguistic characteristics of 215 text elements 21 constituting elements 61 of the fifth SMD data structure, on which values 2151 of the fourth part of the linguistic characteristics 215 of the text elements 21 constituting the elements 61 are generated and the results obtained from SIC BDLP in the text linguistic elements 21 Proposition 11 that is generated in phase in 2022, forming eventually BDLP text elements 21 linguistic sentence 11 formed in the framework of step 2031; performing step 2032 of forming elements of the sixth SMD data structure, on which the elements of the sixth SMD data structure are formed, as well as the identification data of the elements 71, which for each element 71, as an example, but not limitation, the value 711 of the element of the sixth SMD data structure and serial number (s) 712 TE of the linguistic sentence 11 constituting the element 71; and form a sixth SMD data structure.
[0112]На фиг. 21, в качестве примера, но не ограничения, изображена общая структура сформированной в рамках этапа 2031 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 61 пятой структуры данных СМД. БДЛП, формируемая в рамках этапа 2031 отличается от БДЛП, формируемой в рамках этапа 2022, наличием значений 2151 четвертой части лингвистических характеристик 215, указывающих на уровень синтаксической значимости элемента 61 (ЛЛЕ). Уровень синтаксической значимости элемента 61 (ЛЛЕ) характеризует местоположение ЛЛЕ в синтаксическом дереве лингвистического предложения 11. Синтаксическим деревом является схема синтаксических связей предложения 11, в которой между отдельными словами (ЛЛЕ) установлена подчинительная  [0112] In FIG. 21, by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated in step 2031 is shown, which is the BDLP of text elements 21 of the linguistic sentence 11 contained in elements 61 of the fifth data structure of the SMD. BDLP generated in step 2031 differs from BDLP generated in step 2022 in the presence of values 2151 of the fourth part of linguistic characteristics 215, indicating the level of syntactic significance of element 61 (LLE). The level of syntactic significance of element 61 (LLE) characterizes the location of LLE in the syntactic tree of the linguistic sentence 11. The syntactic tree is the syntactic relationship diagram of sentence 11, in which a subordinate is established between individual words (LLE)
синтаксическая связь. В зависимости от состава и строения предложения syntactic link. Depending on the composition and structure of the proposal
синтаксическое дерево может содержать неопределенное количество the syntax tree may contain an indefinite amount
синтаксических уровней и частей предложения, в которых содержатся основные логические элементы (субъект и предикат суждения). Синтаксическое дерево, используемое в настоящем способе, содержит элементы (ЛЛЕ) как минимум трех уровней синтаксической значимости (УСЗ). К первому УСЗ относят ЛЛЕ, syntactic levels and parts of the sentence, which contain the basic logical elements (subject and predicate of judgment). The syntax tree used in the present method contains elements (LLE) of at least three levels of syntactic significance (HSS). The first HSS includes LLE,
находящиеся на синтаксической вершине синтаксического дерева. Ко второму УСЗ относят ЛЛЕ, являющиеся прямыми синтаксическими потомками синтаксических вершин. К третьему УСЗ относят все остальные ЛЛЕ лингвистического located at the top of the syntax tree. The second HSS includes LLEs, which are direct syntactic descendants of syntactic vertices. The third HSS includes all other LLE linguistic
предложения. Синтаксическая вершина - это синтаксическая единица (ЛЛЕ), имеющая синтаксическую роль «сказуемое». Особенностью ЛЛЕ «сказуемое» является то, что оно может состоять из трех слов. Прямой синтаксический потомок синтаксической вершины - это синтаксическая единица (ЛЛЕ), имеющая прямую подчинительную связь со словом группы ЛЛЕ первого уровня. Установление синтаксического уровня ЛЛЕ является синтаксическим структурированием ЛЛЕ. [0113]Формирование четвертой части лингвистических характеристик 215 и их значений 2151 для текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 61, с целью установления уровня синтаксической значимости элементов 61 пятой структуры данных СМД в ходе этапа 2031 производят на основании комплексного анализа значений лингвистических характеристик всех ЛЛЕ 61 лингвистического предложения, на основе которого формируют синтаксическое дерево лингвистического предложения. В результате выяснения положения каждого ЛЛЕ в синтаксическом дереве предложения определяют уровень синтаксической значимости каждого ЛЛЕ 61. offers. A syntactic vertex is a syntactic unit (LLE) having the syntactic role of “predicate”. A feature of LLE “predicate” is that it can consist of three words. A direct syntactic descendant of a syntactic vertex is a syntactic unit (LLE), which has a direct subordinate relationship with the word of a LLE group of the first level. Establishing the syntactic level of LLE is the syntactic structuring of LLE. [0113] The formation of the fourth part of the linguistic characteristics 215 and their values 2151 for the text elements 21 of the linguistic sentence 11 contained in the elements 61, in order to establish the level of syntactic significance of the elements 61 of the fifth data structure of the SMD during step 2031 is carried out on the basis of a comprehensive analysis of the values of linguistic characteristics all LLE 61 linguistic sentences, on the basis of which the syntactic tree of the linguistic sentence is formed. As a result of ascertaining the position of each LLE in the syntax tree, sentences determine the level of syntactic significance of each LLE 61.
[0114]Сформированные по итогам этапа 2031 значения 2151 (уровень синтаксической значимости ЛЛЕ 61) четвертой части лингвистических  [0114] The values 2151 (level of syntactic significance of LLE 61) of the fourth part of the linguistic
характеристик 215 элементов 21, составляющих элементы 61 пятой структуры данных СМД, вносят в БДЛП текстовых элементов 21 лингвистического characteristics of 215 elements 21 constituting elements 61 of the fifth SMD data structure are entered into the BDLP of the text elements 21 of the linguistic
предложенияН, формируемую в рамках этапа 2022, формируя таким образом БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031. При этом все части (211, 214, 223, 215) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2231, 2151) формируют уникальные лингвистические признаки элементов 61. sentencesN generated in the framework of step 2022, thus forming the BDLP of the text elements 21 of the linguistic sentence 11, formed in the framework of the step 2031. Moreover, all parts (211, 214, 223, 215) of the linguistic characteristics of the text elements 21 of the linguistic sentence 11 and their meanings ( 2111, 2141, 2231, 2151) form unique linguistic features of elements 61.
[0115]На фиг. 22, в качестве примера, но не ограничения, изображена общая структура сформированной шестой структуры данных СМД, являющаяся второй структурой данных для настоящего способа преобразования 200. Шестая структура данных СМД представляет собой СМД, содержащий элементы 71, которые представляют собой структурированные группы лингво-логических единиц (группы ЛЛЕ) лингвистического предложения 11 и идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, в качестве примера, но не ограничения, значение 711 элемента 71 шестой структуры данных и  [0115] In FIG. 22, by way of example, but not limitation, the general structure of the sixth SMD data structure generated is shown, which is the second data structure for the present conversion method 200. The sixth SMD data structure is a SMD containing elements 71, which are structured groups of linguo logical units (LLE groups) of the linguistic sentence 11 and the identification data of LLE groups, representing for each LLE group, as an example, but not limitation, the value 711 of element 71 of the sixth string data structures and
порядковый (порядковые) номер (номера) 712 ТЭ, составляющего (составляющих) группу ЛЛЕ. У групп ЛЛЕ 71 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН групп ЛЛЕ), имеющие практическое использование. В структуре данных элементы 71, в качестве примера, но не ограничения, могут именоваться как «группа ЛЛЕ 1», «группа ЛЛЕ 2», «группа ЛЛЕ 3», «группа ЛЛЕ п», где n > 1 - порядковый номер элемента в лингвистическом предложении. Группа ЛЛЕ лингвистического предложения 11 - это синтаксические единицы вида «синтаксическая конструкция», которые формируются из лингво-логических единиц (элементов 61 пятой структуры данных СМД) разных уровней синтаксической значимости ЛЛЕ. К первой группе ЛЛЕ (первые элементы 71 шестой структуры данных СМД) относят как главные ЛЛЕ первой группы ЛЛЕ, являющиеся упомянутыми синтаксическими вершинами (ЛЛЕ первого УСЗ), так и прочие ЛЛЕ первой группы ЛЛЕ (группы 1 ЛЛЕ), являющиеся последовательно подчиненными ЛЛЕ, первая из которых имеет прямую подчинительную связь с ЛЛЕ первого УСЗ, вплоть до ЛЛЕ, которая является главной ЛЛЕ второй группы ЛЛЕ. Ко второй группе ЛЛЕ (вторые элементы 71 шестой структуры данных СМД) относят как главные ЛЛЕ второй группы ЛЛЕ, являющиеся упомянутыми ЛЛЕ второго УСЗ при условии, что, такой ЛЛЕ имеет синтаксическую роль подлежащего или любого второстепенного члена предложения, кроме определения (исключая определения в форме serial (serial) number (s) of 712 TEs constituting (constituting) the LLE group. LLE groups 71 of the linguistic sentence 11 do not have unique names characterizing them (CN LLE groups) that have practical use. In the data structure, elements 71, by way of example, but not limitation, can be referred to as “LLE group 1”, “LLE group 2”, “LLE group 3”, “LLE group n”, where n> 1 is the element serial number in linguistic sentence. LLE Linguistic Proposal Group 11 - these are syntactic units of the “syntactic construction” form, which are formed from linguo-logical units (elements 61 of the fifth SMD data structure) of different levels of LLE syntactic significance. The first LLE group (first elements 71 of the sixth SMD data structure) includes the main LLEs of the first LLE group, which are the mentioned syntactic vertices (LLE of the first HSS), and other LLEs of the first LLE group (LLE groups 1), which are successively subordinate LLEs, the first of which it has a direct subordinate relationship with the LLE of the first HSS, up to the LLE, which is the main LLE of the second group of LLE. The second LLE group (second elements 71 of the sixth SMD data structure) is referred to as the main LLE of the second LLE group, which are mentioned by the LLE of the second HSS, provided that such LLE has the syntactic role of the subject or any secondary member of the sentence, except for the definition (excluding definitions in the form
распространенного причастия или деепричастия), так и прочие ЛЛЕ второй группы ЛЛЕ, являющиеся последовательно подчиненными ЛЛЕ, первая из которых является ЛЛЕ третьего УСЗ, которые имеют прямую подчинительную связь с упомянутым главным ЛЛЕ второй группы ЛЛЕ, вплоть до последних ЛЛЕ в цепочке ЛЛЕ с непрерывной подчинительной связью. common participles or germs), as well as other LLEs of the second LLE group, which are successively subordinate to LLEs, the first of which is LLE of the third HSS, which have a direct subordinate connection with the mentioned main LLE of the second LLE group, up to the last LLEs in the LLE chain with continuous subordinate communication.
[0116]Идентификацию элементов 71 (первых и вторых элементов 71) шестой структуры данных СМ в ходе этапа 2032 производят посредством  [0116] The identification of elements 71 (first and second elements 71) of the sixth data structure CM during step 2032 is performed by
идентификации главных ЛЛЕ первых и вторых групп ЛЛЕ, а также идентификации прочих ЛЛЕ первых и вторых групп ЛЛЕ. Для идентификации главных ЛЛЕ первых групп ЛЛЕ необходимо выявить все ЛЛЕ «сказуемое» (в том числе, все части каждого ЛЛЕ «сказуемое») анализируемого предложения. Для идентификации главных ЛЛЕ вторых групп ЛЛЕ необходимо выявить все ЛЛЕ, которые имеют прямую синтаксическую связь с любой частью ЛЛЕ «сказуемое» и которые при этом имеют синтаксическую роль подлежащего или любого второстепенного члена предложения, кроме определения (исключая определения в форме identification of the main LLE of the first and second LLE groups, as well as identification of other LLE of the first and second LLE groups. To identify the main LLEs of the first LLE groups, it is necessary to identify all the LLE “predicate” (including all parts of each LLE “predicate”) of the analyzed sentence. To identify the main LLEs of the second LLE groups, it is necessary to identify all LLEs that have a direct syntactic connection with any part of the LLE “predicate” and which at the same time have the syntactic role of the subject or any secondary member of the sentence, except for the definition (excluding definitions in the form
распространенного причастия или деепричастия). Для идентификации прочих ЛЛЕ первой или второй группы ЛЛЕ необходимо идентифицировать все ЛЛЕ, которые имеют непрерывную синтаксическую подчинительную связь, начиная от главного ЛЛЕ первой или второй группы ЛЛЕ и вплоть до другого идентифицированного главного ЛЛЕ первой или второй группы ЛЛЕ, или до последнего ЛЛЕ в цепочке непрерывной синтаксической подчинительной связи от главного ЛЛЕ первой или второй группы ЛЛЕ. Формирование первых элементов 71 шестой структуры данных СМД производят путем объединения идентифицированных главной ЛЛЕ первой группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ. Формирование вторых элементов 71 шестой структуры данных СМ производят путем объединения идентифицированных главной ЛЛЕ второй группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ. common participle or gerimony). To identify other LLEs of the first or second LLE group, it is necessary to identify all LLEs that have continuous syntactic subordination, starting from the main LLE of the first or second LLE group and up to another identified main LLE of the first or second LLE group, or to the last LLE in the continuous chain syntactic subordinate link from the main LLE first or second group LLE. The formation of the first elements 71 of the sixth SMD data structure is performed by combining the identified main LLE of the first group LLE and other LLEs for this main LLE. The formation of the second elements 71 of the sixth SM data structure is performed by combining the identified main LLE of the second LLE group and other LLEs for this main LLE.
[0117] Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ первого элемента 71 (первой группы ЛЛЕ) шестой структуры данных СМД в рамках этапа 2032 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент (элементы) 61, из которого (которых) состоит первый элемент 71,  [0117] Identification of the value and serial number (s) of the TE of the first element 71 (first group of LLEs) of the sixth SMD data structure as part of step 2032 is performed as follows: the value (values) 211 of TE 21 of the linguistic sentence 11 constituting (components) element (s) 61 of which (of) the first element 71 consists,
идентифицируют как значение 711 первого элемента 71 (первая группа ЛЛЕ), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент (элементы) 61, из которого (которых) состоит первый элемент 71, identify as the value 711 of the first element 71 (the first group of LLEs), and the serial number (s) 212 of the mentioned (mentioned) TE 21 of the linguistic sentence 11 constituting the element (s) 61 of which the first element 71,
идентифицируют как порядковый (порядковые) номер (номера) 712 ТЭ, identify as serial number (s) 712 TE,
составляющего(составляющих) первый элемент 71 (первая группа ЛЛЕ). component (s) of the first element 71 (first group LLE).
Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ второго элемента 71 (второй группы ЛЛЕ) шестой структуры данных СМД в рамках этапа 2032 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент (элементы) 61, из которого (которых) состоит второй элемент 71, The identification of the value and serial number of the TE of the second element 71 (second group of LLEs) of the sixth SMD data structure as part of step 2032 is carried out as follows: the value (values) 211 of TE 21 of the linguistic sentence 11 constituting the element (s) ) 61, of which (of which) the second element 71 consists,
идентифицируют как значение 711 второго элемента 71 (вторая группа ЛЛЕ), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 61, из которого (которых) состоит второй элемент 71, идентифицируют как порядковый (порядковые) номер (номера) 712 ТЭ, составляющего(составляющих) второй элемент 71 (вторая группа ЛЛЕ). identify as the value 711 of the second element 71 (the second group of LLEs), and the serial number (s) 212 of the mentioned (mentioned) TE 21 of the linguistic sentence 11 constituting the (element) element 61 of which (the) second element 71 consists, identify as the serial number (s) 712 TE, constituting (constituent) the second element 71 (second group LLE).
[0118] Формирование шестой структуры данных СМД в ходе этапа [0118] Generating a sixth SMD data structure during the step
2032 производят путем объединения в одной структуре данных первых и вторых элементов 71 шестой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. 2032 is produced by combining in one data structure the first and second elements 71 of the sixth SMD data structure, as well as their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
[0119] Идентификацию лингвистических характеристик ТЭ, составляющих первые или вторые элементы 71 (первую или вторую группу ЛЛЕ) шестой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2031, состоящего из идентификационных данных ТЭ, составляющих первый или второй элемент 71 (первая или вторая группа ЛЛЕ), и получении значений (2131, 2141, 2231, 2151) всех частей лингвистических характеристик (213, 214, 223, 215) текстовых элементов 21 лингвистического предложения 11, из которых состоит первый или второй элемент 71 (первая или вторая группа ЛЛЕ). При этом, как было описано ранее лингвистическими признаками первых и вторых элементов 71 (первой и второй группы ЛЛЕ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 71 (группы ЛЛЕ). [0119] Identification of the linguistic characteristics of TE, comprising the first or second elements 71 (the first or second group of LLEs) of the sixth SMD data structure and their values, if necessary, by organizing a request in the BDLP generated in step 2031, consisting of the identification data of the FCs constituting the first or second element 71 (the first or the second group LLE), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the first or second element 71 consists (the first or second group LLE ) Moreover, as previously described, the linguistic features of the first and second elements 71 (the first and second groups of LLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 71 (LLE groups) are composed.
[0120] На фиг. 23, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 204 формирования седьмой структуры данных СМД, являющейся третьей структурой данных для рассматриваемого способа 200. Этап 204 характеризуется: выполнением этапа 2041 идентификации видов элементов 71 шестой структуры данных СМД, указывающих на наличие в элементе 71 осложнений лингвистического предложения, на котором  [0120] In FIG. 23, by way of example, but not limitation, a general flowchart is shown of the steps of step 204 of generating the seventh SMD data structure, which is the third data structure for the method 200 in question. Step 204 is characterized by: performing step 2041 of identifying the types of elements 71 of the sixth SMD data structure indicating the presence in element 71 of the complications of the linguistic sentence, on which
идентифицируют первые и вторые виды элементов 71 шестой структуры данных СМД, а также идентификации непреобразованных элементов 81 седьмой identify the first and second types of elements 71 of the sixth structure of the SMD data, as well as the identification of the unconverted elements of the seventh
структуры данных СМД и их идентификационных данных, представляющих собой для каждого непреобразованного элемента 81, в качестве примера, но не ограничения, значение 811 непреобразованного элемента 81 седьмой структуры данных СМД и порядковый (порядковые) номер (номера) 812 ТЭ лингвистического предложения 11, составляющего (составляющих) непреобразованный элемент 81 (значение и порядковые номера ТЭ непреобразованного элемента 81); SMD data structures and their identification data, representing for each non-transformed element 81, as an example, but not limitation, the value 811 of the non-transformed element 81 of the seventh SMD data structure and the serial number (s) of 812 TE linguistic sentences 11 constituting ( constituents) the unreformed element 81 (the value and serial numbers of the TE of the unreformed element 81);
выполнением этапа 2042 формирования преобразованных элементов 81 седьмой структуры данных СМД, на котором формируют преобразованные элементы седьмой структуры данных СМД из элементов 71 второго вида, а также performing step 2042 of generating the transformed elements 81 of the seventh SMD data structure, on which the converted elements of the seventh SMD data structure are formed from the second type elements 71, and
идентификационные данные преобразованных элементов 81, представляющие собой для каждого преобразованного элемента 81, в качестве примера, но не ограничения, значение 811 преобразованного элемента 81 седьмой структуры данных СМД и порядковый (порядковые) номер (номера) 812 ТЭ лингвистического предложения 11, составляющего (составляющих) преобразованный элемент 81(значение и порядковые номера ТЭ преобразованного элемента 81); выполнением этапа 2043 формирования седьмой структуры данных СМД, на котором формируют седьмую структуру данных СМД из преобразованных элементов 81 и непреобразованных элементов 81 седьмой структуры данных СМД. the identification data of the transformed elements 81, which for each transformed element 81, is, by way of example, but not limitation, the value 811 of the transformed element 81 of the seventh SMD data structure and the serial number (s) of the 812 TE linguistic sentence 11 constituting (components) transformed item 81 (the value and serial numbers of the TE of the converted element 81); the execution of step 2043 of the formation of the seventh data structure of the SMD, which forms the seventh data structure of the SMD from the converted elements 81 and non-converted elements 81 of the seventh data structure of the SMD.
[0121] На фиг. 24, в качестве примера, но не ограничения, изображена общая структура сформированной седьмой структуры данных СМД, являющейся третьей структурой данных для настоящего способа преобразования 200. Седьмая структура данных СМД представляет собой СМД, содержащий непреобразованные элементы 81 и преобразованные элементы 81, которые представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения 11. У ОЛЛО лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ОЛЛО), имеющие практическое использование, в качестве примера, но не ограничения: «субъект суждения», «предикат суждения» и тому подобное. В структуре данных элементы 81 именуются уникальными наименованиями, и, в качестве примера, но не ограничения, могут именоваться как «УН ОЛЛО п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ОЛЛО, ранее не встречавшегося в лингвистическом предложении. В дальнейшем, при  [0121] In FIG. 24, by way of example, but not limitation, the general structure of the generated seventh SMD data structure is shown, which is the third data structure for the present conversion method 200. The seventh SMD data structure is a SMD containing untransformed elements 81 and transformed elements 81, which are basic linguistic-logical objects (LLL) of the linguistic sentence 11. The LLLL of the linguistic sentence 11 has their unique names characterizing them (UNOLLO), which have practical and use, as an example, but not limitation: "subject of judgment", "predicate of judgment" and the like. In the data structure, elements 81 are referred to by unique names, and, as an example, but not limitation, can be referred to as “UNOLLO p,” where n> 1 is the index number of a unique name element in a linguistic sentence, starting with “1” for each new UN OLLO, not previously seen in a linguistic sentence. Further, at
упоминании ОЛЛО как элемента седьмой структуры данных имеется ввиду УН ОЛЛО. Основные лингво-логические объекты предложения - это пограничная сущность с признаками как лингвистического, так и логического объектов. The mention of OLLO as an element of the seventh data structure means UN OLLO. The main linguistic and logical objects of a sentence are a borderline entity with signs of both linguistic and logical objects.
Сущность - это объект в компьютерной системе, содержащий набор критических правил. С лингвистической точки зрения, основной лингво-логический объект - это синтаксическая единица вида «синтаксическая конструкция», которая может быть сформирована из структурированной группы ЛЛЕ путем гетерогенизации группы ЛЛЕ. Гетерогенизация группы ЛЛЕ - это устранение однородностей в синтаксической конструкции путем идентификации в ней синтаксической сочинительной связи и преобразования синтаксической конструкции с An entity is an object in a computer system that contains a set of critical rules. From a linguistic point of view, the main linguistic-logical object is a syntactic unit of the form “syntactic construction”, which can be formed from a structured LLE group by heterogenizing the LLE group. The heterogenization of the LLE group is the elimination of homogeneities in the syntactic structure by identifying the syntactic compositional connection in it and transforming the syntactic structure with
однородностями в несколько синтаксических конструкций без однородностей. Сочинительная связь - это связь между синтаксически равноправными единицами предложения (в данном случае между ЛЛЕ), у которых имеется одно и то же синтаксически главное слово (главная ЛЛЕ) и одна и та же синтаксическая роль (синтаксическая роль ЛЛЕ). ЛЛЕ, между которыми идентифицирована homogeneities into several syntactic constructions without homogeneities. A compound link is a link between syntactically equal units of a sentence (in this case, between LLEs) that have the same syntactically main word (main LLE) and the same syntactic role (syntactic role of LLE). LLE between which identified
синтаксическая сочинительная связь, считаются «однородными членами» (ЛЛЕ- 04). С логической точки зрения ОЛЛО - это логические сущности (объекты), являющиеся элементами простого суждения, с помощью которых формируют и передают мысль о том, что нечто (предикат суждения) утверждается или syntactic compositional connection, are considered “homogeneous members” (LLE- 04). From a logical point of view, OLLOs are logical entities (objects) that are elements of simple judgment, with the help of which they form and convey the idea that something (a predicate of judgment) is affirmed or
опровергается о предмете суждения (субъекте суждения). При этом нечто (то, что утверждается или опровергается о предмете суждения) может быть refutes the subject of judgment (subject of judgment). Moreover, something (that is affirmed or refuted about the subject of judgment) may be
дополнительно логически структурирован. Например, но не ограничиваясь, предикат суждения может быть разделен на три логически отделимые логические сущности (объекта) - действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения. Упомянутые выше для примера элементы простого суждения (субъект суждения, действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения) могут быть additionally logically structured. For example, but not limited to, the predicate of judgment can be divided into three logically separable logical entities (objects) - the action of the predicate of judgment, the object of the predicate of judgment and the circumstances of the predicate of judgment. The elements of simple proposition mentioned above for example (the subject of the proposition, the action of the proposition predicate, the object of the proposition predicate, and the circumstances of the proposition predicate) can be
отождествлены с отдельными УН ОЛЛО, как с отдельными синтаксическими конструкциями лингвистического предложения 11. С семантической точки зрения ОЛЛО представляют собой обобщенный мыслимый (семантический) образ элемента простого суждения. are identified with individual UNOLLOs as separate syntactic constructions of linguistic sentence 11. From a semantic point of view, ALLOs are a generalized conceivable (semantic) image of an element of simple judgment.
[0122] Идентификацию элементов 71 первого или второго вида шестой структуры данных СМД в рамках этапа 2041 производят путем анализа значений лингвистических характеристик текстовых элементов шестой структуры данных СМД, составляющих элемент 71 (группу ЛЛЕ), с целью идентификации синтаксических сочинительных связей в группе ЛЛЕ 71. Синтаксическая  [0122] The identification of elements 71 of the first or second type of the sixth SMD data structure in step 2041 is performed by analyzing the linguistic characteristics of the text elements of the sixth SMD data structure constituting element 71 (LLE group), with the aim of identifying syntactic compositional links in the LLE group 71. Syntactic
сочинительная связь между текстовыми элементами (словами, ЛЛЕ) в группе ЛЛЕ 71 идентифицируют в случае наличия у таких ЛЛЕ (слов) одного и того же синтаксического родителя (синтаксически главного слова, у которого с такими ЛЛЕ (словами) имеется прямая синтаксическая подчинительная связь). the composing link between text elements (words, LLE) in the LLE 71 group is identified if the same LLE (words) have the same syntactic parent (the syntactically main word that has a direct syntactic subordinate link to such LLE (words)).
Дополнительными условиями может быть наличие у таких ЛЛЕ (слов) одной и той же синтаксической роли, а также наличие признака связи между такими ЛЛЕ (словами), а именно запятой или сочинительного союза. Сочинительные союзы делятся по значению на соединительные («и», «да» в значении «и», «ни... ни», «также», «тоже», «как... так и»), разделительные («или», «или... или», «либо», «либо... либо», «то... то», «то ли... то ли», «не то... не то») и противительные («а», «но», «однако», «да» в значении «но»), в том числе сопоставительные («не только... но и», «не только... а и», «не только не... но», «не столько... сколько»). Предварительно могут быть заданы иные собственные критерии идентификации сочинительной связи или, например, не ограничиваясь, может быть задано игнорирование какого- либо дополнительного условия, например, не ограничиваясь, условия о наличии признака связи. При идентификации синтаксической сочинительной связи в группе ЛЛЕ такие группы ЛЛЕ с однородными членами идентифицируются как второй вид элемента 71 шестой структуры данных СМД. Все иные группы ЛЛЕ, в которых не идентифицируется синтаксическая сочинительная связь Additional conditions may be the presence of the same syntactic role for such LLEs (words), as well as the presence of a sign of a relationship between such LLEs (words), namely a comma or a compound union. Comparative unions are divided by value into connectives (“and”, “yes” in the meaning of “and”, “neither ... nor”, “also”, “too”, “both ... and”), separation (“ or "," or ... or "," either "," either ... or "," then ... then "," either ... or "," not that ... not that " ) and opposing (“a”, “but”, “however”, “yes” in the meaning of “but”), including comparative ones (“not only ... but also”, “not only ... but and” , "Not only not ... but", "not so much ... how much"). Other own criteria for identifying a compositional connection may be preliminarily set, or, for example, without limitation, ignoring some or an additional condition, for example, not limited to, conditions on the presence of a sign of communication. When identifying the syntactic compositional connection in the LLE group, such LLE groups with homogeneous members are identified as the second type of element 71 of the sixth SMD data structure. All other LLE groups in which the syntactic compositional relationship is not identified
идентифицируются как первый вид элемента 71 шестой структуры данных СМД. При этом идентифицированный первый вид элемента 71 шестой структуры данных СМД отождествляют с непреобразованным элементом 81 седьмой структуры данных СМД. Формирование преобразованных элементов седьмой структуры данных СМД (преобразованных элементов 81, полученных из элементов 71 второго вида) на этапе 2042 производят на основании идентифицированной на этапе 2041 синтаксической сочинительной связи и однородных членов путем преобразования идентифицированных элементов 71 второго вида шестой структуры данных СМД. Смысл преобразования элемента 71 второго вида на этапе 2042 состоит в гетерогенизации группы ЛЛЕ, то есть в устранении синтаксических однородностей в группе ЛЛЕ путем формирования из элемента 71 второго вида множества новых групп ЛЛЕ, идентичных по однородностям элементу 71 первого вида. При этом каждая новая группа ЛЛЕ упомянутого множества может содержать только один из упомянутых однородных членов (если элемент 71 второго вида содержит один ряд однородных членов) или только одно уникальное сочетание упомянутых однородных членов разных рядов однородных членов (если элемент 71 второго вида содержит несколько рядов однородных членов). Множество групп ЛЛЕ, сформированных из элемента 71 второго вида, являются гетерогенными ОЛЛО (преобразованными элементами 81), то есть сформированными из одной группы ЛЛЕ 71 второго вида путем ее гетерогенного преобразования identified as the first type of element 71 of the sixth data structure SMD. In this case, the identified first type of element 71 of the sixth SMD data structure is identified with the non-transformed element 81 of the seventh SMD data structure. The generation of the transformed elements of the seventh SMD data structure (the transformed elements 81 obtained from the second kind of elements 71) at step 2042 is performed based on the syntactic writing link identified at step 2041 and homogeneous members by converting the identified elements 71 of the second type of the sixth SMD data structure. The meaning of the transformation of the second type element 71 at step 2042 is to heterogenize the LLE group, that is, eliminate syntactic homogeneities in the LLE group by forming from the second type element 71 many new LLE groups identical in uniformity to the first type element 71. Moreover, each new LLE group of the said set can contain only one of the mentioned homogeneous members (if the element 71 of the second type contains one row of homogeneous members) or only one unique combination of the said homogeneous members of different rows of homogeneous members (if the element 71 of the second type contains several rows of homogeneous members). Many LLE groups formed from an element 71 of the second type are heterogeneous OLLO (transformed elements 81), that is, formed from one group of LLE 71 of the second type by its heterogeneous transformation
(гетерогенизации). Процесс гетерогенизации элементов 71 второго вида может быть проведен, в качестве примера, но не ограничения, следующим образом: на первом этапе выявляют ряды однородных членов в анализируемом элементе 71 второго вида; в ходе выявления рядов однородных членов выявляются сами ряды однородных членов и порядковые номера однородных членов в ряду, а также признаки связи каждого однородного члена (ЛЛЕ-ОЧ); на втором этапе выявляют цепочки однородных членов для каждого выявленного ЛЛЕ-ОЧ элемента 71 второго вида; при этом цепочки однородных членов (цепочки ОЧ) - это ЛЛЕ-ОЧ и зависимая цепочка ОЧ (цепочка синтаксически связанных ЛЛЕ, начиная от первого синтаксического потомка ЛЛЕ-ОЧ (синтаксически зависимого слова) и продолжая по цепочке синтаксической зависимости (по синтаксической подчинительной связи) до другого ЛЛЕ-ОЧ или до последней ЛЛЕ в элементе 71 второго вида; (heterogenization). The heterogenization process of elements of the second type 71 can be carried out, as an example, but not limited, as follows: at the first stage, rows of homogeneous members in the analyzed element 71 of the second type are revealed; in the course of identifying rows of homogeneous members, the rows of homogeneous members themselves and serial numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member (LLE-OCH) are revealed; at the second stage, chains of homogeneous members are revealed for each identified LLE-OCH element 71 of the second type; in this case, chains of homogeneous members (chains of OCh) are LLE-OCH and a dependent chain of OCH (a chain of syntactically related LLEs, starting from the first syntax descendant of LLE-OCH (syntactically dependent word) and continuing along the chain of syntactic dependence (according to syntactic subordinate relationship) to another LLE-OCH or to the last LLE in element 71 of the second kind;
идентифицированные цепочки ОЧ классифицируются по факту наличия identified PF chains are classified based on availability
синтаксического потомка ЛЛЕ в зависимой цепочке 04, который не входит в зависимую цепочку 04; те цепочки 04, которые имеют зависимые цепочки 04 без синтаксического потомка за рамками зависимой цепочки 04 считаются крайними цепочками однородных членов (крайними цепочками 04), а те цепочки 04, которые имеют зависимые цепочки 04 с синтаксическим потомком за рамками зависимой цепочки 04 считаются внутренними цепочками однородных членов (внутренними цепочками 04); на третьем этапе выявляют ЛЛЕ элемента 71 второго вида, не входящие в цепочки однородных членов (ЛЛЕ вне цепочек 04); на четвертом этапе формируют сменные зависимые цепочки (сменные ЗЦ) элемента 71 второго вида; при этом сменная ЗЦ - это основа преобразованных элементов 81, состоящая из одной крайней цепочки 04 и внутренних цепочек 04, если такие внутренние цепочки 04 по цепочке непрерывной синтаксической подчинительной связи имеются между крайней цепочкой 04 и ЛЛЕ вне цепочек 04; на пятом этапе формируют гетерогенные основные лингво-логические объекты (ОЛЛО); при этом гетерогенный ОЛЛО формируется из одной сменной ЗЦ и ЛЛЕ вне цепочки 04 (если такие ЛЛЕ есть); количество сменных ЗЦ элемента 71 второго вида определяет количество гетерогенных ОЛЛО, сформированных от одного элемента 71 второго вида. LLE syntax descendant in dependent chain 04, which is not included in dependent chain 04; those chains 04 that have dependent chains 04 without a syntactic descendant outside dependent chain 04 are considered extreme chains of homogeneous members (extreme chains 04), and those chains 04 that have dependent chains 04 with syntactic descendant outside dependent chain 04 are considered internal chains of homogeneous members (internal chains 04); at the third stage, the LLE of an element 71 of the second type is detected that are not included in the chains of homogeneous members (LLE outside the chains 04); at the fourth stage, replaceable dependent chains (replaceable LC) of the element 71 of the second type are formed; at the same time, a replaceable LC is the basis of the transformed elements 81, consisting of one extreme chain 04 and internal chains 04, if such internal chains 04 along a chain of continuous syntactic subordinate communication exist between the extreme chain 04 and LLE outside chains 04; at the fifth stage, heterogeneous basic linguistic-logical objects (ALLO) are formed; at the same time, heterogeneous ALLO is formed from one replaceable LC and LLE outside chain 04 (if there are such LLEs); the number of removable LC elements of the second type 71 determines the number of heterogeneous OLLOs formed from one element 71 of the second type.
[0123] Идентификация видов элементов 71 шестой структуры данных СМД в рамках этапа 2041 не изменяет значение 711 элемента 71 и не изменяет порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 71 (группу ЛЛЕ). Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ непреобразованного элемента 81 (ОЛЛО) седьмой структуры данных СМД в рамках этапа 2041 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 первого вида шестой структуры данных СМД идентифицируют как значение 811 непреобразованного элемента 81 (ОЛЛО), а порядковый (порядковые) номер (номера) 712 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 из которого состоит непреобразованный элемент 81 идентифицируют как порядковый (порядковые) номер (номера) 812 ТЭ, составляющего (составляющих) непреобразованный элемент 81 (ОЛЛО). Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ преобразованного элемента 81 (гетерогенного ОЛЛО) седьмой структуры данных СМД в рамках этапа 2042 производят следующим образом: [0123] The identification of the types of elements 71 of the sixth SMD data structure in step 2041 does not change the value 711 of element 71 and does not change the sequence numbers of the text elements 21 of the linguistic sentence 11 constituting element 71 (LLE group). The identification of the value and the ordinal number (s) of the TE of the non-transformed element 81 (OLLL) of the seventh SMD data structure as part of step 2041 is performed as follows: the value (values) 211 of the TE 21 of the linguistic sentence 11 constituting the element 71 of the first kind of the sixth The SMD data structures are identified as the value 811 of the non-transformed element 81 (OLLL), and the serial number (s) 712 of the TE 21 of the linguistic sentence 11 constituting the (element) element 71 of which the non-transform This element 81 is identified as ordinal (ordinal) number (s) 812 of the fuel cell constituting the (s) non-transformed element 81 (OLLO). The identification of the value and serial number of the TE of the transformed element 81 (heterogeneous OLLO) of the seventh SMD data structure within the framework of step 2042 is performed as follows:
значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 второго вида шестой структуры данных СМД, за исключением значения (значений) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) отдельную (отдельные) часть (части) элемента 71 второго вида (ЛЛЕ-ОЧ), которая (которые) была (были) удалена (удалены) при гетерогенизации, и признаков связи удаленных ЛЛЕ-ОЧ (синтаксически the value (s) of 211 TE 21 of the linguistic sentence 11 constituting (constituent) element 71 of the second type of the sixth SMD data structure, with the exception of the value (s) of 211 TE 21 of the linguistic sentence 11 constituting (constituting) a separate part of the element 71 of the second type (LLE-OCH), which (which) was (were) removed (deleted) during heterogenization, and signs of communication of the deleted LLE-OCH (syntactically
подчиненные удаленным ЛЛЕ-ОЧ сочинительные союзы или знаки препинания) идентифицируют как значение 811 преобразованного элемента 81 (ОЛЛО), а порядковый (порядковые) номер (номера) 212 ТЭ 21 лингвистического subordinate remote LLE-OCH composing unions or punctuation marks) are identified as the value 811 of the transformed element 81 (ALLO), and the serial number (s) 212 TE 21 linguistic
предложения 11, составляющего (составляющих) элемент 71 второго вида шестой структуры данных СМД, за исключением порядкового (порядковых) номера Proposals 11 constituting (constituting) element 71 of the second type of the sixth structure of the SMD data, excluding the serial number
(номеров) 212 ТЭ 21 лингвистического предложения 11, составляющего (rooms) 212 TE 21 of the linguistic sentence 11 constituting
(составляющих) отдельную (отдельные) часть (части) элемента 71 второго вида (ЛЛЕ-ОЧ), которая (которые) была (были) удалена (удалены) при гетерогенизации, и признаков связи удаленных ЛЛЕ-ОЧ (синтаксически подчиненные удаленным ЛЛЕ-ОЧ сочинительные союзы или знаки препинания) идентифицируют как порядковый (порядковые) номер (номера) 812 ТЭ, составляющего (составляющих) преобразованный элемент 81 (гетерогенный ОЛЛО). (components) the separate (s) part (s) of the element 71 of the second type (LLE-OCH), which (which) was (were) deleted (deleted) during heterogenization, and signs of communication of the deleted LLE-OCH (syntactically subordinate to the remote LLE-OCH joint unions or punctuation marks) are identified as the serial number (s) of 812 TEs that make up the transformed element 81 (heterogeneous OLLO).
[0124] Формирование седьмой структуры данных СМД в рамках этапа [0124] Formation of a seventh SMD data structure as part of the step
2043 производят путем объединения в одной структуре данных 2043 is produced by combining in one data structure
идентифицированных на этапе 2041 и сформированных на этапе 2042 элементов 81 седьмой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. Первым из объединяемых элементов седьмой структуры данных СМД является элемент, идентифицированный на этапе 2041 как элемент 71 первого вида, являющийся непреобразованным элементом 81, то есть ОЛЛО 81, совпадающий с группой ЛЛЕ 71 без синтаксической сочинительной связи. Вторым из объединяемых элементов седьмой структуры данных СМД являются преобразованные элементы 81, сформированные на этапе 2042 как множество преобразованных элементов 81, являющихся гетерогенными ОЛЛО, сформированными из элемента 71 второго вида (групп ЛЛЕ с синтаксической сочинительной связью) путем гетерогенизации групп ЛЛЕ второго вида. elements 81 of the seventh SMD data structure identified in step 2041 and formed in step 2042, as well as their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below. The first of the combined elements of the seventh SMD data structure is the element identified in step 2041 as an element of the first kind 71, which is an unreformed element 81, that is, ALLO 81, which coincides with the group LLE 71 without syntactic juxtaposition. The second of the combined elements of the seventh SMD data structure are transformed elements 81, formed in step 2042 as a set of transformed elements 81, which are heterogeneous OLLO, formed from an element 71 of the second kind (LLE groups with syntactic co-linking) by heterogenizing LLE groups of the second kind.
[0125] Идентификацию лингвистических характеристик ТЭ,  [0125] Identification of the linguistic characteristics of TE;
составляющих первые или вторые элементы 81 (ОЛЛО) седьмой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2031, состоящего из идентификационных данных ТЭ, составляющих первый или второй элемент 81 (ОЛЛО), и получении значений (2131, 2141, 2231, 2151) всех частей лингвистических характеристик (213, 214, 223, 215) текстовых элементов 21 лингвистического предложения 11, из которых состоит первый или второй элемент 81 (ОЛЛО). При этом, как было описано ранее лингвистическими признаками элементов 81 (ОЛЛО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 81 (ОЛЛО). constituting the first or second elements 81 (ALLO) of the seventh structure of the SMD data and their values, if necessary, by organizing a request to the BDLP generated in step 2031, consisting of TE identification data constituting the first or second element 81 (ALLO), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the first or second element 81 (OLLO) consists. Moreover, as previously described, the linguistic features of elements 81 (ALLO) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which elements 81 (ALLO) consist.
[0126] Далее, после завершения описанного ранее этапа 204, в целях еще большего повышения точности последующего поиска в структурированном массиве данных (СМД), становится возможным осуществить дальнейшее  [0126] Further, after completing the previously described step 204, in order to further improve the accuracy of the subsequent search in the structured data array (SMD), it becomes possible to further
преобразование СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и их идентификационные данные. transformation of the SMD containing at least the main linguistic-logical objects (LLL) of the linguistic sentence and their identification data.
[0127] На фиг. 25, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 300 преобразования СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО,  [0127] In FIG. 25, as an example, but not limitation, depicts a General diagram of the steps of the claimed method 300 for converting SMD containing at least the main linguistic-logical objects (LLL) of a linguistic sentence and LLL identification data,
являющегося исходной структурой данных для рассматриваемого способа 300. Заявленный способ 300 преобразования СМД, содержащего, по меньшей мере,which is the original data structure for the considered method 300. The claimed method 300 for converting SMD containing at least
ОЛЛО лингвистического предложения и идентификационные данные ОЛЛО, характеризуется: выполнением этапа 301 идентификации пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором The LLLO of the linguistic sentence and the identification data of the LLLF is characterized by: performing the identification step 301 of a suitable data structure containing the LLLF, on which
идентифицируют структуру данных СМД, содержащую элементы упомянутой пригодной для преобразования структуры данных, содержащей ОЛЛО, являющейся исходной структурой данных СМД в рамках рассматриваемого способа 300, причем упомянутые элементы пригодной для преобразования структуры данных представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО; выполнением этапа 302 формирования восьмой структуры данных СМД, на котором формируют восьмую структуру данных СМД, являющуюся первой структурой данных СМД для рассматриваемого способа 300, содержащую элементы упомянутой восьмой структуры данных СМД, причем упомянутые элементы восьмой структуры данных СМД представляют собой исходные простые лингво - логические конструкции (ИП ЛЛК) лингвистического предложения, identifying the SMD data structure containing elements of said transformable data structure containing OLLO, which is the original SMD data structure within the framework of the method 300 in question, said elements of the transformable data structure being the main linguistic-logical objects (OLLL) Linguistic Suggestions and Identity OLLO; performing the step 302 of forming the eighth data structure of the SMD, which forms the eighth data structure of the SMD, which is the first data structure of the SMD for the method 300 under consideration, containing elements of the said eighth data structure of the SMD, the elements of the eighth data structure of the SMD being the original simple linguistic logical constructions (IP LLK) linguistic sentences,
сформированные из синтаксически связанных ОЛЛО простого предложения исходного лингвистического предложения, а также представляют собой formed from syntactically related OLLL simple sentences of the original linguistic sentence, and also represent
идентификационные данные ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, в качестве примера, но не ограничения: значение ИП ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИП ЛЛК; выполнением этапа 303 формирования девятой структуры данных СМД, на котором формируют девятую структуру данных СМД, являющуюся второй структурой данных СМД для рассматриваемого способа 300, содержащую элементы девятой структуры данных СМД, причем упомянутые элементы девятой структуры данных СМД представляют собой простые лингво-логические конструкции (ПЛЛК) лингвистического предложения, сформированные из ИП ЛЛК путем устранения однородностей в ИП ЛЛК, а также представляют собой идентификационные данные ПЛЛК, the identification data of the IP LLK, representing, for each IP, LLK, as an example, but not limitation: the value of the IP LLK and serial numbers of TE linguistic sentences that make up the IP LLK; performing step 303 of generating the ninth SMD data structure, which forms the ninth SMD data structure, which is the second SMD data structure for the method 300 under consideration, containing elements of the ninth SMD data structure, said elements of the ninth SMD data structure being simple linguistic-logical constructions (PLCK ) linguistic sentences formed from IP LLK by eliminating homogeneities in IP LLK, and also represent PLCK identification data,
представляющие собой для каждой ПЛЛК, в качестве примера, но не ограничения: значение ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ПЛЛК; выполнением этапа 304 формирования десятой структуры данных СМД, на котором формируют десятую структуру данных СМД, являющуюся третьей структурой данных СМД для рассматриваемого способа 300, содержащую элемент упомянутой десятой структуры данных СМД, причем упомянутый элемент десятой структуры данных СМД представляет собой исходную сложную лингво - логическую конструкцию (ИС ЛЛК) лингвистического предложения, representing for each PLCC, as an example, but not limitation: the meaning of PLCC and serial numbers of TE of the linguistic sentence that make up PLCC; performing the step 304 of forming the tenth SMD data structure, on which the tenth SMD data structure is formed, which is the third SMD data structure for the method 300 under consideration, containing an element of the tenth SMD data structure, said element of the tenth SMD data structure being the initial complex linguistic-logical construction (IP LLK) linguistic sentences,
сформированную путем объединения всех ПЛЛК с учетом синтаксических связей ПЛЛК в исходном лингвистическом предложении, а также представляет собой идентификационные данные ИС ЛЛК, представляющие собой, в качестве примера, но не ограничения: значение ИС ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИС ЛЛК; выполнением этапа 305 формирования одиннадцатой структуры данных СМД, на котором формируют одиннадцатую структуру данных СМД, являющуюся итоговой структурой данных СМД для рассматриваемого способа 300, содержащую элементы упомянутой одиннадцатой структуры данных СМД, причем упомянутые элементы одиннадцатой структуры данных СМД представляют собой сложные лингво-логические конструкции (СЛЛК) лингвистического предложения, сформированные из ИС ЛЛК путем устранения однородностей в ИС ЛЛК, а также представляют собой идентификационные данные СЛЛК, представляющие собой для каждой СЛЛК, в качестве примера, но не ограничения: значение СЛЛК и порядковые номера ТЭ лингвистического formed by combining all PLCs taking into account the syntactic links of PLCC in the original linguistic sentence, and also represents the identification information of the LLK IC, which, as an example, but not limitation: the value of the LLK IC and serial numbers of the TE linguistic sentences that make up the LLK IS; performing step 305 of generating the eleventh DMD data structure, in which the eleventh SMD data structure is formed, which is the final SMD data structure for of the method 300 under consideration, containing elements of the eleventh SMD data structure, said elements of the eleventh SMD data structure being complex linguistic-logical constructions (SLLC) of a linguistic sentence formed from the SLC information system by eliminating uniformities in the SLC information system, as well as the SLC data identification data representing, for each SLLK, as an example, but not limitation: the value of SLLK and serial numbers of TE linguistic
предложения, составляющих СЛЛК. proposals making up the SLLK.
[0128] На фиг. 26, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 301 идентификации пригодной для  [0128] In FIG. 26, by way of example, but not limitation, a general flowchart of an identification step 301 suitable for
преобразования структуры данных, содержащей основные лингво-логические объекты (ОЛЛО), являющейся исходной структурой данных для рассматриваемого способа 300. Этап 301 характеризуется выполнением идентификации пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором transforming the data structure containing the main linguistic-logical objects (LLLO), which is the initial data structure for the considered method 300. Step 301 is characterized by identifying suitable for the conversion of the data structure containing LLLO, on which
идентифицируют элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, а также идентификационные данные элементов 91, identifying elements 91 of a transformable data structure containing OLLL as well as identifying elements 91,
представляющие собой для каждого ОЛЛО, в качестве примера, но не ограничения, значение 911 элемента 91 пригодной для преобразования структуры данных, содержащей ОЛЛО и порядковый (порядковые) номер (номера) 912 ТЭ representing, for each OLLO, as an example, but not limitation, the value of 911 element 91 is suitable for converting a data structure containing OLLO and serial number (s) 912 TE
лингвистического предложения 11, составляющего (составляющих) элемент 91. linguistic sentences 11 constituting (constituent) element 91.
[0129] На фиг. 27, в качестве примера, но не ограничения, изображена общая структура данных, являющаяся исходной для настоящего способа  [0129] In FIG. 27, as an example, but not limitation, depicts the General data structure that is the source for the present method
преобразования 300, представляющая собой пригодную для преобразования структуру данных, содержащую основные лингво-логические объекты (ОЛЛО). Исходная структура данных представляет собой СМД, содержащий элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, transform 300, which is a transformable data structure containing basic linguistic logic objects (LLLO). The original data structure is a DMD containing elements 91 of a transformable data structure containing OLO,
представляющие собой основные лингво-логические объекты (ОЛЛО) и representing the main linguistic-logical objects (OLLL) and
идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, в качестве примера, но не ограничения, значение 911 элемента 91 пригодной для преобразования структуры данных содержащей ОЛЛО и порядковый (порядковые) номер (номера) 912 ТЭ лингвистического предложения, составляющего OLLO identification data, representing, for each OLLO, as an example, but not limitation, the value of 911 element 91 is suitable for converting the data structure containing OLLO and serial number (s) 912 TE linguistic sentences constituting
(составляющих) ОЛЛО, которые, в качестве примера, но не ограничения, были описаны ранее со ссылкой на фиг. 24 способа 200. У элемента 91 лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ОЛЛО), имеющие практическое использование в качестве примера, но не ограничения: «субъект суждения», «действие предиката суждения» и тому подобное. В структуре данных элементы 91 именуются уникальными (constituent) OLLO, which, by way of example, but not limitation, have been described previously with reference to FIG. 24 ways 200. Element 91 of the linguistic sentence 11 has unique names that characterize them (CN OLLO), having practical use as an example, but not limitation: “subject of judgment”, “action of predicate of judgment” and the like. Elements 91 are called unique in the data structure.
наименованиями, в качестве примера, но не ограничения, могут именоваться как «УН ОЛЛО п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ОЛЛО, ранее не встречавшегося в лингвистическом предложении. Как было сказано ранее, с лингвистической точки зрения ОЛЛО представляют собой синтаксическую единицу вида «синтаксическая конструкция», которая может быть сформирована из структурированных групп ЛЛЕ; с логической точки зрения ОЛЛО представляют собой элементы простого суждения, с помощью которых нечто утверждается или опровергается о предмете суждения; с семантической точки зрения ОЛЛО представляют собой обобщенный мыслимый (семантический) образ элемента простого суждения. Элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО представляют собой множество ОЛЛО уникальных наименований (УН ОЛЛО) лингвистического предложения 11. ОЛЛО 91 в пригодной для преобразования структуре данных, содержащей ОЛЛО представляют собой отдельные элементы, заранее подготовленные и помещенные в пригодную для преобразования структуру данных, содержащую ОЛЛО в виде структурированного массива (списка, перечня и тому подобного) отдельных ОЛЛО. Такие names, as an example, but not limitation, can be referred to as “UNOLLO p,” where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UNOLLO not previously encountered in the linguistic sentence . As mentioned earlier, from a linguistic point of view, OLLOs are a syntactic unit of the form “syntactic construction”, which can be formed from structured LLE groups; logically, OLLOs are elements of simple judgment, with the help of which something is affirmed or refuted about the subject of judgment; from a semantic point of view, OLLOs are a generalized conceivable (semantic) image of an element of simple judgment. Elements 91 of a transformable data structure containing ALLO constitute a plurality of LLLOs of unique names (UNOLLO) of linguistic sentence 11. ALLO 91 in a transformable data structure containing ALLO are separate elements prepared in advance and placed in a transformable data structure containing OLLO in the form of a structured array (list, list, etc.) of individual OLLOs. Such
подготовительные действия могут осуществляться любым известным из уровня техники способом или неизвестным из уровня техники способом, таким, как способ, указанный при описании способа 200, и, соответственно, далее не описываются. preparatory actions can be carried out by any method known in the art or unknown by the prior art, such as the method indicated in the description of method 200, and accordingly are not further described.
[0130] Идентификация элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО в ходе этапа 301 сводится к классификации элементов, из которых состоит пригодная для преобразования структура данных, содержащая ОЛЛО, как основных лингво-логических объектов (ОЛЛО 91). При этом все ОЛЛО 91 имеют значения 911 и порядковые номера текстовых элементов 912 лингвистического предложения, составляющие ОЛЛО. Значения 911 ОЛЛО 91 представляют собой один или несколько текстовых элементов (ТЭ 21)  [0130] The identification of the elements 91 of the transformable data structure containing the ALLO during step 301 is reduced to the classification of the elements of which the transformable data structure containing the ALLO consists of the main linguistic-logical objects (ALLO 91). Moreover, all OLLO 91 have values of 911 and the serial numbers of the text elements 912 of the linguistic sentence that make up the OLLO. Values 911 OLLO 91 represent one or more text elements (TE 21)
предложения 11, из которых состоят ОЛЛО. Количество ТЭ, из которых состоит ОЛЛО связано с технической возможностью языка при описании объекта, действия или их признаков, либо с потребностью автора описания сущностей окружающего мира (объектов, действий или их признаков) использовать определенный способ лингвистического описания, в качестве примера, но не ограничения, можно привести различные следующие способы лингвистического описания одной и той же сущности: «старый человек» = «старик» = «человек преклонных лет» и тому подобное. Указанная сущность может быть лингвистически выражена через один, два или три ТЭ. При этом, например, не ограничиваясь, сущность «права Proposals 11 of which OLLO is composed. The number of TEs that OLLO consists of is associated with the technical ability of the language to describe the object, action or their attributes, or with the need for the author to describe the entities of the environment of the world (objects, actions or their signs) to use a certain method of linguistic description, as an example, but not a limitation, one can cite various following methods of linguistic description of one and the same entity: "old man" = "old man" = "old man" etc. The specified entity can be linguistically expressed through one, two or three TE. Moreover, for example, not limited to, the essence of "right
потребителей» не может быть лингвистически выражена в русском языке одним ТЭ. consumers ”cannot be linguistically expressed in Russian by one TE.
[0131] Идентификацию значения 911 элемента 91 (ОЛЛО) пригодной для преобразования структуры данных, содержащей ОЛЛО в ходе этапа 301 производят путем регистрации набора знаков текстовых элементов 21  [0131] The identification of the value 911 of the element 91 (ALLO) suitable for converting the data structure containing the ALLO during step 301 is performed by registering the character set of the text elements 21
предложения 11, из которых состоит ОЛЛО 91. Идентификацию порядкового (порядковых) номера (номеров) 912 ТЭ, из которого (которых) состоит элемент 91 (ОЛЛО) пригодной для преобразования структуры данных, содержащей ОЛЛО, в ходе этапа 301 производят путем регистрации порядкового (порядковых) номера (номеров) упомянутых ТЭ в соответствии с их расположением в лингвистическом предложении, при условии, что первый ТЭ в лингвистическом предложении имеет номер «1», а все последующие ТЭ имеют порядковый номер, больший на единицу, чем порядковый номер, предыдущего ТЭ. Proposals 11, of which the OLLL 91 is composed. The identification of the serial number (s) of 912 TEs of which (of which) the element 91 (OLLL) is suitable for transforming the data structure containing the OLLL, during step 301, is performed by registering the ordinal ( serial) numbers (numbers) of the mentioned TE in accordance with their location in the linguistic sentence, provided that the first TE in the linguistic sentence has the number "1", and all subsequent TEs have a sequence number greater than one by a sequence number, previous present TE.
[0132] Пригодная для преобразования структура данных, содержащая [0132] A convertible data structure comprising
ОЛЛО, являющаяся исходной для настоящего способа преобразования 300 представляет собой в итоге множество элементов 91, их значений 911 и OLLO, which is the source for the present method of conversion 300 is a result of a multitude of elements 91, their values 911 and
порядковых номеров 912 ТЭ, составляющих элементы 22, идентифицированных на этапе 301. sequence numbers 912 TE, constituting the elements 22 identified at step 301.
[0133] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 91 (ОЛЛО) пригодной для преобразования структуры данных, содержащей ОЛЛО, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2031, состоящего из идентификационных данных ТЭ, составляющих элемент 91 (ОЛЛО), и получении значений (2131, 2141, 2231, 2151) всех частей лингвистических характеристик (213, 214, 223, 215) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 91 (ОЛЛО). При этом, как было описано ранее  [0133] Identification of the linguistic characteristics of TEs comprising elements 91 (ALLO) suitable for transforming the data structure containing ALLO, and their values, if necessary, is carried out by organizing a request into the BDLP generated in step 2031, consisting of the identification data of TEs constituting element 91 (ALLO), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the element 91 (ALLO) consists. Moreover, as described previously
лингвистическими признаками элементов 91 (ОЛЛО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 91 (ОЛЛО]. the linguistic features of elements 91 (OLLL) are at least the morphological, syntactic, and semantic characteristics of textual elements 21 of the linguistic sentence 11 of which elements 91 (ОLLO) are composed.
[0134] На фиг. 28, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 302 формирования восьмой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 300. Этап 302 характеризуется: выполнением этапа 3021 формирования значений 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО на котором формируют значения 2161 пятой части  [0134] FIG. 28, by way of example, but not limitation, a general flowchart is shown of the steps of step 302 of generating the eighth SMD data structure, which is the first data structure of the method 300 in question. Step 302 is characterized by: performing step 3021 of generating values 2161 of the fifth part of the linguistic characteristics of 216 elements 21, constituent elements 91 suitable for transforming a data structure containing OLLL which form values 2161 of the fifth
лингвистических характеристик 216 элементов 21, составляющих элементы 91 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3021; выполнением этапа 3022 формирования элементов восьмой структуры данных СМД на котором формируют элементы 12 восьмой структуры данных СМД, а также идентификационные данные элементов 12, представляющие собой для каждого элемента 12, в качестве примера, но не ограничения, значение 121 элемента 12 восьмой структуры данных СМД и порядковые номера 122 ТЭ лингвистического предложения 11, составляющих элементы 12, и формируют восьмую структуру данных СМД. the linguistic characteristics of the 216 elements 21 constituting the elements 91 and inputting the received information into the BDLP of the text elements 21 of the linguistic sentence 11 formed in step 2031, resulting in the BDLP of the text elements 21 of the linguistic sentence 11 formed in the frame of step 3021; performing step 3022 of forming the elements of the eighth data structure of the SMD on which the elements 12 of the eighth data structure of the SMD are formed, as well as the identification data of the elements 12, which for each element 12, as an example, but not limitation, the value 121 of the element 12 of the eighth data structure of the SMD and serial numbers 122 TE of the linguistic sentence 11 constituting the elements 12, and form the eighth data structure of the DMD.
[0135] На фиг. 29, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 3021 базы данных лингвистических признаков [БДЛП], являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО. БДЛП, формируемая в рамках этапа 3021, отличается от БДЛП, формируемой в рамках этапа 2031, наличием значений 2161 пятой части  [0135] In FIG. 29, by way of example, but not limitation, the general structure of the database of linguistic features [BDLP] generated in step 3021 is shown, which is BDLP of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing OLL. The BDLP generated in step 3021 differs from the BDLP generated in step 2031 in the presence of values 2161 of the fifth
лингвистических характеристик 216, указывающих на синтаксическую роль элемента 91 [ОЛЛО]. Поскольку с лингвистической точки зрения ОЛЛО - синтаксическая конструкция, то естественно, что в одном предложении одни синтаксические конструкции относительно других синтаксических конструкций при наличии между ними синтаксической подчинительной связи являются синтаксически главными или синтаксически зависимыми. По этому принципу одни ОЛЛО могут быть синтаксически главными (главными ОЛЛО], а другие - синтаксически зависимыми (зависимыми ОЛЛО]. Выявление пятой части лингвистических характеристик 216 текстовых элементов 21 лингвистического предложения 11, составляющих ОЛЛО 91 и их значений 2161 сводится к linguistic characteristics 216, indicating the syntactic role of element 91 [OLLLO]. Since, from a linguistic point of view, OLLO is a syntactic construct, it is natural that in one sentence some syntactic constructs relative to other syntactic constructs, if there is a syntactic subordinate relationship between them, are syntactically main or syntactically dependent. According to this principle, some OLLOs can be syntactically main (main OLLOs), while others can be syntactically dependent (dependent OLLOs). the linguistic characteristics of 216 text elements 21 of the linguistic sentence 11 that make up OLLL 91 and their meanings 2161 is reduced to
классификации ОЛЛО 91 по их синтаксической роли. Синтаксическую роль ОЛЛО отождествляют с синтаксической ролью главной ЛЛЕ в ОЛЛО 91. С помощью значения 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91, все ОЛЛО 91 разделяют на главные ОЛЛО 91 и зависимые ОЛЛО 91. classifications of ALLO 91 according to their syntactic role. The syntactic role of OLLO is identified with the syntactic role of the main LLE in OLLO 91. Using the value 2161 of the fifth part of the linguistic characteristics of the 216 elements 21 that make up OLLO 91, all OLLO 91 are divided into main OLLO 91 and dependent OLLO 91.
[0136] Формирование пятой части лингвистических характеристик [0136] the Formation of the fifth part of the linguistic characteristics
216 и их значений 2161 в ходе этапа 3021 производят путем анализа существующих лингвистических признаков элемента 91. В ходе такого анализа для примера, но не ограничения, могут производиться следующие действия: на первом этапе во всех ОЛЛО 91 идентифицируют синтаксически главную ЛЛЕ; на втором этапе среди лингвистических признаков главных ЛЛЕ упомянутых ОЛЛО 91 идентифицируют лингвистическую характеристику, отвечающую за синтаксическую роль 216 and their values 2161 during step 3021 are produced by analyzing the existing linguistic features of element 91. During this analysis, for example, but not limitation, the following actions can be performed: at the first stage, in all OLLO 91, the main LLE is syntactically identified; at the second stage, among the linguistic features of the main LLEs of the mentioned OLLL 91, the linguistic characteristic responsible for the syntactic role is identified
синтаксически главной ЛЛЕ элемента 91; на третьем этапе проверяют значение идентифицированной лингвистической характеристики, отвечающей за syntactically the main LLE element 91; at the third stage, the value of the identified linguistic characteristic responsible for
синтаксическую роль синтаксически главной ЛЛЕ; если значение (синтаксическая роль синтаксически главной ЛЛЕ элемента 91) является «сказуемым», то такой ОЛЛО 91 (синтаксически главной ЛЛЕ элемента 91) получает значение 2161 пятой части лингвистических характеристик 216 - «главный ОЛЛО»; если значение не является «сказуемым», то такой ОЛЛО 91 (синтаксически главной ЛЛЕ элемента 91) получает значение 2161 пятой части лингвистических характеристик 216 - «зависимый ОЛЛО». В итоге формируют значения 2161 пятой части the syntactic role of the syntactically main LLE; if the meaning (the syntactic role of the syntactically main LLE of the element 91) is “predicable”, then such OLLL 91 (the syntactically main LLE of the element 91) gets the value 2161 of the fifth part of the linguistic characteristics 216 - “the main OLLL”; if the meaning is not "predictable", then such an OLLL 91 (syntactically the main LLE of element 91) receives the value 2161 of the fifth part of the linguistic characteristics 216 - "dependent OLLL". As a result, the values of 2161 of the fifth part are formed
лингвистических характеристик 216 для всех элементов 91 (ОЛЛО). linguistic characteristics 216 for all elements of 91 (OLLL).
[0137]Сформированные по итогам этапа 3021 значения 2161  [0137] Formed according to the results of stage 3021 values 2161
(синтаксическая роль синтаксически главной ЛЛЕ элемента 91) пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91, пригодной для преобразования структуры данных, содержащей ОЛЛО, вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031, формируя в итоге БДЛП текстовых элементов 21 (the syntactic role of the syntactically main LLE element 91) of the fifth part of the linguistic characteristics 216 of the elements 21 constituting the OLLO 91, suitable for transforming the data structure containing the OLLO, are introduced into the BDLP of the text elements 21 of the linguistic sentence 11 formed in step 2031, resulting in the BDLP text elements 21
лингвистического предложения 11, формируемую в рамках этапа 3021. При этом все части (211, 214, 232, 215 и 216) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2321, 2151 и 2161) формируют уникальные лингвистические признаки элементов 91. [0138]Ha фиг. 30, в качестве примера, но не ограничения, изображена общая структура сформированной восьмой структуры данных СМД, являющейся первой структурой данных СМД для настоящего способа преобразования 300. Восьмая структура данных СМД представляет собой СМД, содержащий элементы 12 восьмой структуры данных СМД, которые представляют собой исходные простые лингво - логические конструкции (ИП ЛЛК 12) лингвистического предложения 11 и идентификационные данные ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, в качестве примера, но не ограничения, значение121 элемента 12 восьмой структуры данных и порядковые номера текстовых элементов 122, составляющих ИП ЛЛК (значение и порядковые номера ТЭ элемента 12). У ИП ЛЛК 12 linguistic sentences 11 formed within the framework of step 3021. Moreover, all parts (211, 214, 232, 215 and 216) of the linguistic characteristics of the text elements 21 of the linguistic sentences 11 and their meanings (2111, 2141, 2321, 2151 and 2161) form unique linguistic signs of the elements 91. [0138] Ha of FIG. 30, by way of example, but not limitation, the general structure of the generated eighth SMD data structure is shown, which is the first SMD data structure for the present conversion method 300. The eighth SMD data structure is a SMD containing elements 12 of the eighth SMD data structure, which are the original simple linguistic-logical constructions (IP LLK 12) of the linguistic sentence 11 and identification data of the IP LLK, representing for each IP LLK, as an example, but not limitation, the value121 element 12 of the eighth data structure and the sequence numbers of the text elements 122 constituting the LC LLK (the value and sequence numbers of the TE element 12). U IP LLK 12
лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 12, в качестве примера, но не ограничения, могут именоваться как «ИП ЛЛК-1», «ИП ЛЛК-2», «ИП ЛЛК-3», «ИП ЛЛК-n», где n > 1 - порядковый номер элемента в лингвистическом предложении. ИП ЛЛК предложения - это linguistic sentences 11 there are no unique names characterizing them, having practical use. In the data structure, elements 12, as an example, but not limitation, can be referred to as “IP LLK-1”, “IP LLK-2”, “IP LLK-3”, “IP LLK-n”, where n> 1 - serial number of the element in the linguistic sentence. IP LLK offers are
пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения ИП ЛЛК - это синтаксическая единица вида «синтаксическая конструкция», сформированная из ОЛЛО путем объединения ОЛЛО по признаку наличия между ОЛЛО прямой синтаксической подчинительной или сочинительной связи. borderline essence between linguistics and logic. From a linguistic point of view, IP LLK is a syntactic unit of the form “syntactic construction”, formed from ALLO by combining ALLO on the basis of the presence of direct syntactic subordinate or composing connection between ALLO.
Упомянутая прямая синтаксическая подчинительная или сочинительная связь означает наличие между элементами различных ОЛЛО (между ЛЛЕ различных ОЛЛО) синтаксической подчинительной или сочинительной связи. С точки зрения синтаксиса ИП ЛЛК - это отдельное исходное простое предложение или исходное простое предложение в составе исходного сложного предложения. При этом исходное простое предложение в ИП ЛЛК может содержать однородные члены, то есть слова, между которыми имеется синтаксическая сочинительная связь. С логической точки зрения ИП ЛЛК - это логическая сущность, выражающая простое суждение (некванторное суждение), представляющее собой первичную The mentioned direct syntactic subordinate or composing link means the presence between the elements of different OLLO (between LLE of various OLLO) syntactic subordinate or composing link. From the point of view of syntax, IP LLK is a separate initial simple sentence or an initial simple sentence as part of the initial complex sentence. In this case, the initial simple sentence in the IP LLK may contain homogeneous members, that is, words between which there is a syntactic compositional connection. From a logical point of view, IP LLK is a logical entity that expresses a simple proposition (non-quantifier proposition), which is the primary
логическую конструкцию мышления, с помощью которой формируется и logical construction of thinking, with the help of which
передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). При этом нечто (то, что утверждается или опровергается о предмете суждения) может быть the idea that something (the predicate of judgment) is affirmed or refuted about the subject of the judgment (the subject of the judgment) is conveyed. Moreover, something (that is affirmed or refuted about the subject of judgment) may be
дополнительно логически структурировано. Например, не ограничиваясь, предикат суждения может быть разделен на три логически отделимые сущности - действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения. Упомянутые для примера элементы простого суждения могут быть отождествлены с отдельными УН ОЛЛО (ОЛЛО уникального наименования), из которых и формируется ИП ЛЛК. Кванторность простого суждения определяется его «количественной характеристикой», то есть наличием или отсутствием однозначности в простом суждении. По количественной характеристике additionally logically structured. For example, without limitation, the predicate of judgment can be divided into three logically separable entities - the action of the predicate of judgment, the object of the predicate of judgment, and the circumstances of the predicate of judgment. The elements of simple judgment mentioned for an example can be identified with individual UNOLLO (unique name OLLLO), from which the IP LLK is formed. The quantity of a simple judgment is determined by its "quantitative characteristic", that is, the presence or absence of unambiguity in a simple proposition. By quantitative characteristic
(кванторности) все простые суждения можно разделить на две категории: (quantifier) all simple judgments can be divided into two categories:
однозначные простые суждения и неоднозначные простые суждения. Однозначные простые суждения - это кванторные простые суждения, в которых показатель кванторности всегда определен и равен единице, то есть каждый элемент простого суждения не имеет вариативности, всегда однозначен. Однозначность простого суждения проявляется посредством нахождения в составе простого суждения элементов простого суждения одного уникального наименования (УН) в unambiguous simple judgments and ambiguous simple judgments. Unambiguous simple judgments are quantified simple propositions in which the quantifier index is always defined and equal to unity, that is, each element of a simple proposition has no variability, is always unambiguous. The unambiguity of a simple judgment is manifested through the presence in the composition of a simple judgment of the elements of a simple judgment of one unique denomination (UN) in
единичном количестве (например, не ограничиваясь, одного субъекта суждения, объекта предиката суждения, действия предиката суждения или одного a single quantity (for example, not limited to, one subject of a judgment, an object of a judgment predicate, an action of a judgment predicate, or one
однородного обстоятельства предиката суждения). Примером однозначного простого суждения может быть следующее суждение: «Товар должен быть передан покупателю продавцом». Данное простое суждение не допускает никакой неоднозначности - только «товар», только «должен быть передан», только homogeneous circumstances of the predicate of judgment). An example of an unambiguous simple judgment is the following proposition: “The goods must be transferred to the buyer by the seller”. This simple judgment does not allow any ambiguity - only “goods”, only “must be transferred”, only
«покупателю» и только «продавцом». Неоднозначные простые суждения - это кванторные простые суждения, в которых показатель кванторности как минимум у одного элемента простого суждения уникального наименования (УН) всегда определен и всегда больше единицы, то есть элемент простого суждения в неоднозначном простом суждении всегда имеет вариативности, всегда "Buyer" and only "seller". Ambiguous simple judgments are quantified simple propositions in which the quantifier index of at least one element of a simple proposition of a unique name (UN) is always defined and always greater than unity, that is, the element of a simple proposition in an ambiguous simple proposition always has variations, always
неоднозначен. Неоднозначность простого суждения проявляется посредством нахождения в составе простого суждения нескольких элементов простого суждения одного уникального наименования (УН) (например, не ограничиваясь, нескольких субъектов суждения и(или) объектов предиката суждения и(или) действий предиката суждения и(или) нескольких однородных обстоятельств предиката суждения). Примером неоднозначного простого суждения может быть следующее суждение: «Товар должен быть передан покупателю продавцом или менеджером компании». Данное простое суждение допускает неоднозначность ввиду наличия в нем двух элементов простого суждения с одинаковыми УН - субъектов суждения «продавец» и «менеджер компании», к каждому из которых можно применить предикат суждения «должны передать товар покупателю». Если простые суждения, находящиеся в некоем массиве простых суждений (отдельной, обособленной группе простых суждений), имеют гарантировано одну и ту же количественную характеристику (показатель кванторности равен единице или больше единицы), то вне зависимости от вида кванторности простого суждения (однозначное или неоднозначное) простые суждения такого массива являются «кванторными». Если простые суждения, находящиеся в некоем массиве простых суждений (отдельной, обособленной группе простых суждений), не имеют гарантировано одну и туже количественную характеристику (показатель кванторности простых суждений может быть как равен единице, так и быть большим единицы), то простые суждения такого массива именуются ambiguous. The ambiguity of a simple proposition is manifested by the fact that a simple proposition contains several elements of a simple proposition of one unique denomination (UN) (for example, but not limited to, several subjects of the proposition and (or) objects of the predicate of the proposition and (or) the actions of the predicate of the proposition and (or) several similar circumstances judgment predicate). An example of an ambiguous simple judgment can be the following proposition: “The goods must be transferred to the buyer by the seller or manager of the company.” This simple judgment is ambiguous due to the presence in it of two elements of a simple judgment with the same CN - the subjects of judgment are “seller” and “company manager”, to each of which You can apply the predicate of the judgment "must transfer the goods to the buyer." If simple judgments in a certain array of simple judgments (a separate, separate group of simple judgments) have the same quantitative characteristic (the quantifier is equal to one or more than one), then regardless of the type of quantifier of a simple proposition (unambiguous or ambiguous) simple judgments of such an array are “quantifier”. If simple judgments in a certain array of simple judgments (a separate, separate group of simple judgments) do not have the same quantitative characteristic (the quantifier of simple judgments can be either equal to one or greater than unity), then simple judgments of such an array are called
«некванторными» (без определенной кванторности). В связи с вышеизложенным ИП ЛЛК, формируемая из ОЛЛО исходного предложения, между которыми имеется синтаксическая сочинительная связь, может быть классифицирована только как «некванторное» простое суждение, поскольку ничем не гарантируется наличие одной и той же количественной характеристики у всех простых суждений, напрямую (без какой-либо дополнительной обработки) формируемых из произвольного исходного лингвистического предложения. "Non-quantifier" (without a certain quantifier). In connection with the foregoing, IP LLK, formed from the OLLL of the original sentence, between which there is a syntactic coherent connection, can only be classified as a “non-quantitative” simple proposition, since it does not guarantee the existence of the same quantitative characteristic of all simple judgments directly (without any additional processing) formed from an arbitrary initial linguistic sentence.
[0139]Формирование элементов 12 восьмой структуры данных СМД, представляющих собой исходные простые лингво-логические конструкции (ИП ЛЛК) в ходе этапа 3022 производят на основе результатов идентификации значений 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91. Для формирования элемента 12 восьмой структуры данных СМД необходимо осуществить следующие действия: на первом этапе выбирают главный ОЛЛО 91; на втором этапе идентифицируют все подчиненные ему зависимые ОЛЛО 91 с помощью значений 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91; на третьем этапе среди идентифицированных зависимых ОЛЛО 91 идентифицируют такие ОЛЛО 91, которые имеют с выбранным ранее главным ОЛЛО 91 прямую подчинительную связь; на четвертом этапе формируют предварительный элемент 12 восьмой структуры данных СМД, являющийся исходной простой лингво-логической конструкцией (ИП ЛЛК), путем объединения выбранного «главного ОЛЛО» 91 и всех идентифицированных «зависимых ОЛЛО» 91, имеющих с выбранным главным ОЛЛО 91 прямые подчинительные связи; на пятом этапе идентифицируют сочиненные ОЛЛО среди уже идентифицированных зависимых ОЛЛО 91 с помощью значений 2131 первой части лингвистических характеристик 213 элементов 21, составляющих ОЛЛО 91. Для завершения формирования элемента 12 формируют запрос в БДЛП, формируемую в рамках этапа 3021 для проверки наличия признаков связи между объединяемыми ОЛЛО, и, при наличии таких признаков, получают текстовый элемент (текстовые элементы), идентифицированный (идентифицированные) как одно из (или несколько из, или комбинация из): знак препинания, союз или союзное слово, расположенные между объединяемыми ОЛЛО. [0139] The formation of the elements 12 of the eighth data structure of the SMD, representing the initial simple linguological constructions (IP LLK) during step 3022, is based on the results of the identification of the values of 2161 of the fifth part of the linguistic characteristics of the 216 elements 21 constituting the ALLO 91. To form the element 12 of the eighth SMD data structure, it is necessary to carry out the following actions: at the first stage, the main OLLO 91 is selected; at the second stage, all dependent dependent ALLO 91 subordinate to him are identified using the values 2161 of the fifth part of the linguistic characteristics 216 of the elements 21 making up the ALLO 91; at the third stage, among the identified dependent OLLO 91, such OLLO 91 are identified that have a direct subordinate relationship with the previously selected main OLLO 91; at the fourth stage, a preliminary element 12 of the eighth SMD data structure is formed, which is the initial simple linguological structure (IP LLK) by combining the selected “main OLLO” 91 and all identified “dependent OLLOs” 91 having direct subordinate connections with the selected main OLLO 91 ; at the fifth stage identify compiled by OLLO among the already identified dependent OLLOs 91 using the values 2131 of the first part of the linguistic characteristics of 213 elements 21 constituting OLLO 91. To complete the formation of element 12, a request is made to the BDLP generated in step 3021 to check for signs of communication between the combined OLLOs, and, in the presence of such signs, they receive a text element (text elements) identified (identified) as one of (or several of, or a combination of): a punctuation mark, a union or a union word, is located s between the combining OLLO.
[0140]Идентификацию значения и порядковых номеров ТЭ элемента 12 восьмой структуры данных СМД, производят в рамках этапа 3022 путем  [0140] the Identification of the values and sequence numbers of the TE element 12 of the eighth data structure SMD, produced in the framework of step 3022 by
отождествления значения 121 элемента 12 со значениями 911 объединяемых элементов 91 и значениями 211 текстовых элементов, являющихся признаками связи согласно своим уникальным лингвистическим признакам, identifying the value 121 of the element 12 with the values 911 of the combined elements 91 and the values of 211 text elements, which are signs of communication according to their unique linguistic characteristics,
идентифицированных между объединяемыми элементами 91, а порядковых номеров 122 текстовых элементов 21, составляющих элемент 12 с порядковыми номерами 912 текстовых элементов, составляющих объединяемые элементы 91 и порядковыми номерами 21 текстовых элементов, являющихся признаками связи, идентифицированных между объединяемыми элементами 91. identified between the elements to be joined 91, and the sequence numbers 122 of the text elements 21 constituting the element 12 with the sequence numbers 912 of the text elements constituting the elements to be combined 91 and the sequence numbers 21 of the text elements that are signs of communication identified between the elements to be combined 91.
[0141]Формирование восьмой структуры данных СМД в ходе этапа 3022 производят путем объединения в одной структуре данных элементов 12 восьмой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.  [0141] The formation of the eighth SMD data structure during step 3022 is performed by combining in one data structure the elements 12 of the eighth SMD data structure and their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
[0142] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 12 (ИП ЛЛК) восьмой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3021, состоящего из идентификационных данных ТЭ, составляющих элемент 12 (ИП ЛЛК), и получении значений (2131, 2141, 2231, 2151, 2161) всех частей лингвистических характеристик (213, 214, 223, 215, 216) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 12 (ИП ЛЛК). При этом, как было описано ранее, лингвистическими признаками элементов 12 (ИП ЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 12 (ИП ЛЛК). [0142] Identification of the linguistic characteristics of TEs that comprise elements 12 (IP LLK) of the eighth SMD data structure, and their values, if necessary, is carried out by organizing a request to the BDLP, which is generated as part of step 3021, consisting of identification data of TEs that comprise element 12 (IE LLK ), and obtaining the values (2131, 2141, 2231, 2151, 2161) of all parts of the linguistic characteristics (213, 214, 223, 215, 216) of the text elements 21 of the linguistic sentence 11, which make up element 12 (IP LLK). Moreover, as described earlier, the linguistic features of elements 12 (IP LLK) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic Proposals 11, of which the elements 12 consist (IP LLK).
[0143]На фиг. 31, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 303 формирования девятой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 300. Этап 303 характеризуется: выполнением этапа 3031 идентификации видов элементов 12 восьмой структуры данных СМД, указывающих на наличие в ИП ЛЛК сочиненных ОЛЛО, на котором идентифицируют первые и вторые виды элементов [0143] FIG. 31, by way of example, but not limitation, a general flowchart is shown of the steps of step 303 of generating the ninth SMD data structure, which is the second data structure for the method 300 under consideration. Step 303 is characterized by: performing step 3031 of identifying the types of elements 12 of the eighth SMD data structure indicating the presence in the IP LLK composed by ALLO, on which the first and second types of elements are identified
12 восьмой структуры данных СМД, а также идентифицируют непреобразованные элементы 13 девятой структуры данных СМД и их идентификационные данные, представляющие собой для каждого непреобразованного элемента 13, в качестве примера, но не ограничения, значение 131 непреобразованного элемента 13 девятой структуры данных СМД и порядковые 132 номера ТЭ лингвистического предложения 11, составляющих элемент 13 (значение и порядковые номера ТЭ непреобразованного элемента 13); выполнением этапа 3032 формирования преобразованных элементов 13 девятой структуры данных СМД, на котором формируют преобразованные элементы 13 девятой структуры данных СМД из элементов 12 второго вида, а также идентификационные данные преобразованных элементов 13, представляющие собой для каждого преобразованного элемента 13, в качестве примера, но не ограничения, значение 131 преобразованного элемента12 of the eighth SMD data structure, and also identify the non-transformed elements 13 of the ninth SMD data structure and their identification data, which is, for example, but not limited to, the value of the 131 non-transformed element 13 of the ninth SMD data structure and ordinal 132 numbers TE of the linguistic sentence 11 constituting element 13 (meaning and serial numbers of TE of the unreformed element 13); performing the step 3032 of generating the converted elements 13 of the ninth SMD data structure, on which the converted elements 13 of the ninth SMD data structure are formed from the second type elements 12, as well as the identification data of the converted elements 13, which is an example, but not for each converted element 13 restrictions, value 131 of the transformed element
13 девятой структуры данных СМД и порядковые 132 номера ТЭ лингвистического предложения 11, составляющих элемент 13 (значение и порядковые номера ТЭ преобразованного элемента 13); выполнением этапа 3033 формирования девятой структуры данных СМД, на котором формируют девятую структуру данных СМД из преобразованных элементов 13 и непреобразованных элементов 13 девятой структуры данных СМД. 13 of the ninth SMD data structure and serial numbers 132 of the TE of the linguistic sentence 11 constituting element 13 (meaning and serial numbers of the TE of the converted element 13); performing step 3033 of generating the ninth SMD data structure, wherein the ninth SMD data structure is formed from the converted elements 13 and non-converted elements 13 of the ninth SMD data structure.
[0144]На фиг. 32, в качестве примера, но не ограничения, изображена общая структура сформированной девятой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 300. Девятая структура данных СМД представляет собой СМД, содержащий элементы 13, которые представляют собой простые лингво-логические конструкции (ПЛЛК) лингвистического предложения 11, и идентификационные данные ПЛЛК, представляющие собой для каждой ПЛЛК, в качестве примера, но не ограничения, значение 131 элемента 13 девятой структуры данных и порядковые номера 132 текстовых элементов, составляющих ПЛЛК. Элементы 13 девятой структуры данных СМД подразделяются по принципу их формирования на [0144] FIG. 32, by way of example, but not limitation, the general structure of the generated ninth SMD data structure is shown, which is the second SMD data structure for the present conversion method 300. The ninth SMD data structure is a SMD containing elements 13, which are simple linguistic logical constructions (PLCC) of the linguistic sentence 11, and PLCC identification data, representing for each PLCC, as an example, but not limitation, the value of 131 element 13 of the ninth data structure and order stems rooms 132 text elements constituting PLLK. Elements of the ninth structure SMD data are divided according to the principle of their formation into
непреобразованные элементы 13 и преобразованные элементы 13. У ПЛЛК 13 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 13, в качестве примера, но не ограничения, могут именоваться как «ПЛЛК1», «ПЛЛК2», «ПЛЛКЗ», «ПЛЛКп», где n > 1 - порядковый номер элемента в лингвистическом предложении. ПЛЛК лингвистического предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, ПЛЛК - это синтаксическая единица вида «синтаксическая конструкция», сформированная из ИП ЛЛК путем гетерогенизации ИП ЛЛК. С точки зрения синтаксиса ПЛЛК - это отдельное простое предложение или простое предложение в составе исходного сложного предложения, которое не содержит однородных членов (слов между которыми имеется синтаксическая сочинительная связь). С логической точки зрения ПЛЛК - это логическая сущность, выражающая простое суждение (кванторное суждение), представляющее собой первичную логическую конструкцию мышления, с помощью которой формируется и передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). При этом нечто (то, что утверждается или опровергается о предмете суждения) может быть дополнительно логически структурировано. Например, не ограничиваясь, предикат суждения может быть разделен на три логически отделимые сущности - действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения. Упомянутые для примера элементы простого суждения могут быть отождествлены с non-transformed elements 13 and transformed elements 13. PLCC 13 of the linguistic sentence 11 lacks unique names characterizing them, having practical use. In the data structure, elements 13, by way of example, but not limitation, can be referred to as “PLCK1”, “PLCK2”, “PLCKZ”, “PLLKp”, where n> 1 is the serial number of the element in the linguistic sentence. PLCC of Linguistic Proposal 11 is a boundary entity between linguistics and logic. From a linguistic point of view, PLLC is a syntactic unit of the form “syntactic construction”, formed from IP LLK by heterogenization of IP LLK. From the point of view of syntax, PLCC is a single simple sentence or a simple sentence in the original complex sentence, which does not contain homogeneous members (words between which there is a syntactic juxtaposition). From a logical point of view, PLLC is a logical entity that expresses a simple proposition (quantifier proposition), which is the primary logical construction of thinking, with the help of which the idea is formed and transmitted that something (a predicate of proposition) is affirmed or disproved about the subject of judgment (the subject of the proposition ) Moreover, something (that which is affirmed or disproved about the subject of judgment) can be additionally logically structured. For example, without limitation, the predicate of judgment can be divided into three logically separable entities - the action of the predicate of judgment, the object of the predicate of judgment and the circumstances of the predicate of judgment. The elements of simple judgment mentioned for example can be identified with
отдельными видами ОЛЛО, из которых и формируется ПЛЛК. Отличие ПЛЛК от ИП ЛЛК в кванторности простого суждения. Если ИП ЛЛК допускает возможность наличия неоднозначности в простом суждении, то ПЛЛК имеет показатель кванторности равный единице, что полностью отождествляет ПЛЛК с абсолютно однозначным простым суждением. В составе ПЛЛК не может быть нескольких элементов простого суждения одного уникального наименования (УН). Например, не ограничиваясь, в составе ПЛЛК не может быть нескольких субъектов суждения, и (или) объектов предиката суждения, и (или) действий предиката суждения, и (или) однородных обстоятельств предиката суждения. В ПЛЛК не может быть никакой неоднозначности ни в субъекте суждения, ни в предикате суждения, вне зависимости от состава и конструкции исходного лингвистического предложения. [0145] Идентификацию видов элементов 12 восьмой структуры данных СМД в рамках этапа 3031 производят путем анализа значений лингвистических характеристик текстовых элементов 12 (ИП ЛЛК) с целью идентификации синтаксических сочинительных связей в ИП ЛЛК 12. Синтаксическую certain types of OLLO, from which PLLK is formed. The difference between PLLC and IP LLK in the quantity of simple judgment. If IP LLK admits the possibility of ambiguity in a simple proposition, then PLCC has a quantifier value of unity, which completely identifies PLCC with an absolutely unambiguous simple proposition. PLCC cannot contain several elements of a simple judgment of one unique name (UN). For example, but not limited to, a PLCC may not include several subjects of judgment, and (or) objects of a judgment predicate, and (or) actions of a judgment predicate, and (or) homogeneous circumstances of a judgment predicate. In PLCC, there can be no ambiguity either in the subject of judgment or in the predicate of judgment, regardless of the composition and design of the original linguistic sentence. [0145] the Identification of the types of elements 12 of the eighth data structure of the SMD in the framework of step 3031 is performed by analyzing the linguistic characteristics of the text elements 12 (IP LLK) in order to identify syntactic compositional links in the IP LLK 12. Syntactic
сочинительную связь между ОЛЛО (элемент 91) в ИП ЛЛК 12 идентифицируют в случае наличия у синтаксически главных ЛЛЕ таких ОЛЛО одного и того же синтаксического родителя (синтаксически главного слова, у которого с такой ЛЛЕ имеется прямая синтаксическая подчинительная связь). Дополнительными условиями может быть наличие у главных ЛЛЕ таких ОЛЛО одной и той же синтаксической роли, а также наличие признака связи между такими ЛЛЕ, а именно - запятой или сочинительного союза. При идентификации синтаксической сочинительной связи между главными ЛЛЕ двух или более ОЛЛО такие ИП ЛЛК идентифицируют как второй вид элемента 12 (ИП ЛЛК) восьмой структуры данных СМД. Все иные элементы 12 (ИП ЛЛК) в которых не идентифицирована синтаксическая сочинительная связь у главной ЛЛЕ идентифицируют как первый вид элемента 12 (ИП ЛЛК) восьмой структуры данных СМД. При этом the composer link between OLLO (element 91) in LL LLP 12 is identified if the syntaxically important LLLEs have such OLLLs with the same syntactic parent (the syntactically main word that has such a LLL has a direct syntactic subordinate link). Additional conditions may include the presence of the same syntactic role in the main LLLEs of such OLLLs, as well as the presence of a sign of a connection between such LLLEs, namely, a comma or a compound union. When identifying the syntactic compositional link between the main LLEs of two or more OLLLs, such LL LLs are identified as the second type of element 12 (IL LLK) of the eighth data structure of the SMD. All other elements 12 (IP LLK) in which the syntactic compositional link at the main LLE is not identified as the first type of element 12 (IP LLK) of the eighth data structure of the SMD. Wherein
идентифицированный первый вид элемента 12 восьмой структуры данных СМД отождествляют с непреобразованным элементом 13 девятой структуры данных СМД. Формирование преобразованных элементов девятой структуры данных СМД (преобразованных элементов 13, полученных из элементов 12 второго вида) на этапе 3032 производят на основании идентифицированной на этапе 3031 синтаксической сочинительной связи между элементами 91 (ОЛЛО) элемента 12 (ИП ЛЛК) путем преобразования элемента 12 второго вида. Смысл преобразования элемента 12 второго вида на этапе 3032 состоит в гетерогенизации ИП ЛЛК 12, то есть в устранении синтаксических однородностей в ИП ЛЛК 12 путем the identified first type of element 12 of the eighth data structure of the SMD is identified with the non-transformed element 13 of the ninth data structure of the SMD. The formation of the transformed elements of the ninth SMD data structure (transformed elements 13 obtained from the second type of elements 12) at step 3032 is performed based on the syntactic writing connection between the elements 91 (ОЛО) of the element 12 (ЛЛК ИП) identified by the step 3031 by converting the second type element 12 . The meaning of the conversion of the element 12 of the second type at step 3032 is to heterogenize the IP LLK 12, that is, to eliminate syntactic homogeneities in the IP LLK 12 by
формирования из элемента 12 второго вида множества новых ПЛЛК, идентичных по однородностям элементу 12 первого вида. При этом каждая новая ПЛЛК упомянутого множества может содержать только один из упомянутых ОЛЛО 91 с однородными членами (если элемент 12 второго вида содержит один ряд однородных членов) или только одно уникальное сочетание упомянутых ОЛЛО 91 с однородными членами разных рядов однородных членов (если элемент 12 второго вида содержит несколько рядов ОЛЛО 91 с однородными членами). the formation of the element 12 of the second type of many new PLCA, identical in uniformity to the element 12 of the first type. Moreover, each new PLLC of the said set can contain only one of the mentioned OLLL 91 with homogeneous members (if the element 12 of the second type contains one row of homogeneous members) or only one unique combination of the mentioned OLLL 91 with homogeneous members of different rows of homogeneous members (if element 12 of the second species contains several rows of OLLO 91 with homogeneous members).
Множество ПЛЛК (элементов 13), сформированных из элемента 12 второго вида являются гетерогенными ПЛЛК, то есть сформированными из одной ИП ЛЛК 12 второго вида путем ее гетерогенного преобразования (гетерогенизации). Процесс гетерогенизации ИП ЛЛК 12 второго вида может быть проведен, в качестве примера, но не ограничения, следующим образом: на первом этапе выявляют ряды однородных членов в элементе 12 второго вида; в ходе выявления рядов Many PLCA (elements 13) formed from the element 12 of the second kind are heterogeneous PLCA, that is, formed from one PI LLK 12 the second type by its heterogeneous transformation (heterogenization). The heterogenization process of PI LLK 12 of the second type can be carried out, as an example, but not limited, as follows: at the first stage, rows of homogeneous members in the element 12 of the second type are revealed; during the identification of the ranks
однородных членов выявляют сами ряды однородных членов и порядковые номера однородных членов в ряду, а также признаки связи каждого однородного члена; на втором этапе выявляют цепочки однородных членов для каждого выявленного ОЛЛО, содержащего ЛЛЕ-ОЧ (0ЛЛ0-04) элемента 12 второго вида; цепочка однородных членов (цепочка 04) - это ОЛЛО-ОЧ и зависимая цепочка однородных членов (цепочка синтаксически связанных ОЛЛО, начиная от первого синтаксического потомка однородных членов (синтаксически зависимого ОЛЛО) и продолжая по цепочке синтаксической зависимости (по синтаксической homogeneous members reveal the very rows of homogeneous members and serial numbers of homogeneous members in a row, as well as signs of communication of each homogeneous member; at the second stage, chains of homogeneous members are revealed for each identified ALLO containing LLE-OCH (0LL0-04) element 12 of the second type; the chain of homogeneous members (chain 04) is the OLLO-OCH and the dependent chain of homogeneous members (the chain of syntactically related OLLLs, starting from the first syntactic descendant of homogeneous members (syntactically dependent OLLL) and continuing along the chain of syntactic dependence (syntactically
подчинительной связи) до другого ОЛЛО-ОЧ или до последнего ОЛЛО в элементе 12 второго вида; идентифицированные цепочки 04 классифицируют по факту наличия синтаксического потомка ЛЛЕ в зависимой цепочке 04, который не входит в зависимую цепочку 04; те цепочки 04, которые имеют зависимые цепочки 04 без синтаксического потомка за рамками зависимой цепочки однородных членов считаются крайними цепочками однородных членов (крайними ЦОЧ), а те цепочки 04, которые имеют зависимые цепочки 04 с синтаксическим потомком за рамками зависимой цепочки 04 считаются внутренними цепочками однородных членов (внутренними цепочками 04); на третьем этапе выявляют ОЛЛО элемента 12 второго вида, не входящие в цепочки 04 (ОЛЛО вне цепочек 04); на четвертом этапе формируют сменные зависимые цепочки (сменные ЗЦ) элемента 12 второго вида; сменная ЗЦ - это основа преобразованных элементов 13, состоящая из одной крайней цепочки 04 и внутренних цепочек 04, если такие внутренние цепочки 04 по цепочке непрерывной синтаксической подчинительной связи имеются между крайней цепочкой 04 и ОЛЛО вне цепочек 04; на пятом этапе формируют гетерогенные ПЛЛК (преобразованные элементы 13); гетерогенная ПЛЛК формируется из одной сменной ЗЦ и ОЛЛО вне цепочки 04 (если такие ОЛЛО есть); количество сменных ЗЦ элемента 12 второго вида определяет количество гетерогенных ПЛЛК (преобразованных элементов 13), сформированных от одного элемента 12 второго вида. subordinate connection) to another OLLO-OCH or to the last OLLO in element 12 of the second type; identified chains 04 are classified by the fact of the presence of a syntactic descendant LLE in the dependent chain 04, which is not included in the dependent chain 04; those chains 04 that have dependent chains 04 without a syntactic descendant outside the dependent chain of homogeneous members are considered extreme chains of homogeneous members (extreme CSCs), and those chains 04 that have dependent chains 04 with syntactic descendant outside the dependent chain 04 are considered internal chains of homogeneous members (internal chains 04); at the third stage, the OLLO of the element 12 of the second type is detected, which are not included in the chains 04 (OLLO outside the chains 04); at the fourth stage, replaceable dependent chains (replaceable LCs) of element 12 of the second kind are formed; a replaceable SC is the basis of the transformed elements 13, consisting of one extreme chain 04 and internal chains 04, if such internal chains 04 along a chain of continuous syntactic subordinate communication exist between the extreme chain 04 and ALLO outside chains 04; at the fifth stage, heterogeneous PLCs are formed (transformed elements 13); heterogeneous PLLC is formed from one replaceable SC and OLLO outside chain 04 (if there are such OLLOs); the number of replaceable LC elements of the second type 12 determines the number of heterogeneous PLCs (converted elements 13) formed from one element 12 of the second type.
[0146] Идентификация видов элементов 12 восьмой структуры данных СМД в рамках этапа 3031 не изменяет значение 121 элемента 12 и не изменяет порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 (ИП ЛЛК). Идентификацию значения и порядковых номеров ТЭ непреобразованного элемента 13 (ПЛЛК) девятой структуры данных СМД в рамках этапа 3031 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 первого вида восьмой структуры данных СМД идентифицируют как значение 131 непреобразованного элемента 13 (ПЛЛК), а порядковые номера 212 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 из которого состоит непреобразованный элемент 13 идентифицируют как порядковые номера 132 текстовых элементов, составляющих [0146] the Identification of the types of elements 12 of the eighth data structure of the DMD in the framework of step 3031 does not change the value 121 of the element 12 and does not change serial numbers of the text elements 21 of the linguistic sentence 11 constituting the element 12 (IP LLK). The value and serial numbers of the TE of the unreformed element 13 (PLC) of the ninth SMD data structure are identified as part of step 3031 as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting the element 12 of the first type of the eighth SMD data structure are identified as the value 131 of the unreformed element 13 ( PLCK), and the serial numbers 212 of the text elements 21 of the linguistic sentence 11 constituting the element 12 of which the unreformed element 13 consists are identified as oryadkovye number 132 text elements, components
непреобразованный элемент 13 (ПЛЛК). Идентификацию значения и порядковых номеров ТЭ преобразованного элемента 13 (гетерогенный ПЛЛК) девятой структуры данных СМД в рамках этапа 3032 производят следующим образом: untransformed element 13 (PLCK). The identification of the values and sequence numbers of the TE of the transformed element 13 (heterogeneous PLC) of the ninth SMD data structure as part of step 3032 is performed as follows:
значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 второго вида восьмой структуры данных СМД, за исключением значений 211 текстовых элементов 21 лингвистического the values of 211 text elements 21 of the linguistic sentence 11 constituting the element 12 of the second type of the eighth data structure of the SMD, with the exception of the values of 211 text elements 21 of the linguistic
предложения 11, составляющих отдельные части элемента 12 второго вида (ОЛЛО- 04), которые были удалены при гетерогенизации, и признаков связи удаленных ОЛЛО-ОЧ (синтаксически подчиненные главным ЛЛЕ удаленным ОЛЛО-ОЧ сочинительные союзы или знаки препинания) идентифицируют как значение 131 преобразованного элемента 13 (ПЛЛК), а порядковые номера 212 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 второго вида восьмой структуры данных СМД, за исключением порядковых номеров 212 текстовых элементов 21 лингвистического предложения 11, составляющих отдельные части элемента 12 второго вида (ОЛЛО-ОЧ), которые были удалены при гетерогенизации, и признаков связи удаленных ОЛЛО-ОЧ (синтаксически подчиненные главным ЛЛЕ удаленным ОЛЛО-ОЧ сочинительные союзы или знаки препинания) идентифицируют как порядковые номера 132 текстовых элементов, составляющих преобразованный элемент 13 (гетерогенный ПЛЛК). Proposals 11, constituting separate parts of element 12 of the second type (ОЛО-04), which were removed during heterogenization, and signs of communication of remote ОЛО-ОЧ (syntactic subordinate compound unions or punctuation marks synthesized by the main LLL to remote ОЛООЧ) are identified as the value 131 of the transformed element 13 (PLCK), and serial numbers 212 of the text elements 21 of the linguistic sentence 11 constituting the element 12 of the second type of the eighth data structure of the SMD, with the exception of serial numbers 212 of the text elements 21 of the linguistic sentences 11, which are separate parts of element 12 of the second type (ОЛО-ОЧ), which were removed during heterogenization, and signs of communication of remote ОЛО-ОЧ (syntactic subordinate compound unions or punctuation marks synthesized by the main LLL to remote ОЛООЧ) are identified as 132 serial numbers elements making up the transformed element 13 (heterogeneous PLCK).
[0147]Формирование девятой структуры данных СМД в рамках этапа 3033 производят путем объединения ранее идентифицированных на этапах 3031 и 3032 элементов 13 девятой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. Первым из объединяемых элементов девятой структуры данных СМД является идентифицированный на этапе 3031 элемент 12 первого вида, являющийся непреобразованным элементом 13, то есть ПЛЛК 13, совпадающий с ИП ЛЛК 12 без синтаксической сочинительной связи. Вторыми из объединяемых элементов девятой структуры данных СМД являются [0147] The formation of the ninth SMD data structure in step 3033 is performed by combining elements 13 of the ninth SMD data structure and their identification data previously identified in steps 3031 and 3032 using the principles and methods known from the prior art, which respectively further not described in detail. The first of the combined elements of the ninth SMD data structure is the element of the first type identified at step 3031, which is the non-transformed element 13, that is, PLCK 13, which coincides with the IP of the LLK 12 without syntactic coupling. The second of the combined elements of the ninth DMD data structure are
преобразованные элементы 13, сформированные на этапе 3032 как множество преобразованных элементов 13, являющихся гетерогенными ПЛЛК 13, the transformed elements 13 formed in step 3032 as a plurality of transformed elements 13, which are heterogeneous PLCC 13,
сформированными из элемента 12 второго вида (ИП ЛЛК с синтаксической сочинительной связью) путем гетерогенизации ИП ЛЛК второго вида. formed from the element 12 of the second type (IP LLK with syntactic co-linking) by heterogenization of the IP LLK of the second type.
[0148] Идентификацию лингвистических характеристик ТЭ, составляющих непреобразованные или преобразованные элементы 13 (ПЛЛК) девятой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3021, состоящего из  [0148] The linguistic characteristics of TEs constituting the unreformed or transformed elements 13 (PLCC) of the ninth SMD data structure and their values are identified, if necessary, by organizing a request in the BDLP generated in step 3021, consisting of
идентификационных данных ТЭ, составляющих непреобразованный или TE identification data constituting unreformed or
преобразованный элемент 13, и получении значений (2131, 2141, 2231, 2151, 2161) всех частей лингвистических характеристик (213, 214, 223, 215, 216) текстовых элементов 21 лингвистического предложения 11, из которых состоит transformed element 13, and obtaining the values (2131, 2141, 2231, 2151, 2161) of all parts of the linguistic characteristics (213, 214, 223, 215, 216) of the text elements 21 of the linguistic sentence 11 of which
непреобразованный или преобразованный элемент 13 (ПЛЛК или гетерогенная ПЛЛК). При этом, как было описано ранее лингвистическими признаками непреобразованных и преобразованных элементов 13 (ПЛЛК или гетерогенная ПЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 13 (ПЛЛК и гетерогенные ПЛЛК). untransformed or transformed element 13 (PLCK or heterogeneous PLCK). Moreover, as previously described by the linguistic features of unreformed and transformed elements 13 (PLCC or heterogeneous PLCC) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 13 (PLCC and heterogeneous PLCC) are composed.
[0149]На фиг. 33, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 304 формирования десятой структуры данных СМД являющейся третьей структурой данных для рассматриваемого способа 300. Этап 304 характеризуется: выполнением этапа 3041 формирования значений 2171 шестой части лингвистических характеристик 217 элементов 21, составляющих элементы 13 девятой структуры данных СМД, на котором формируют значения 2171 шестой части лингвистических характеристик 217 элементов 21,  [0149] FIG. 33, by way of example, but not limitation, a general flowchart is shown of the steps of step 304 of generating the tenth SMD data structure, which is the third data structure for the method 300 under consideration. Step 304 is characterized by: step 3041 of generating values 2171 of the sixth of the linguistic characteristics of 217 elements 21 constituting elements 13 of the ninth SMD data structure, on which values 2171 of the sixth of the linguistic characteristics of 217 elements 21 are generated,
составляющих элементы 13, и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3041; выполнением этапа 3042 идентификации видов элементов 13 девятой структуры данных СМД, указывающих на наличие сочиненных ПЛЛК, на котором идентифицируют первые и последующие виды элементов 13 девятой структуры данных СМД; выполнением этапа 3043 идентификации элементов 14 как составных частей элемента 15 десятой структуры данных СМД, на котором идентифицируют элементы 14 десятой структуры данных СМД, а также идентификационные данные элементов 14, представляющие собой для каждого элемента 14, в качестве примера, но не ограничения, значение 141 элемента 14 десятой структуры данных СМД и порядковые номера 142 ТЭ лингвистического предложения 11, составляющих элемент 14; и формируют десятую структуру данных СМД путем объединения элементов 14 как составных частей единственного элемента 15 десятой структуры данных СМД. constituting the elements 13, and inputting the received information into the BDLP of the text elements 21 of the linguistic sentence 11, formed in step 3021, forming as a result the BDLP of the text elements 21 of the linguistic sentence 11, formed in the framework of step 3041; performing step 3042 identification of types of elements 13 of the ninth SMD data structure indicating the presence of composed PLCs, on which the first and subsequent types of elements 13 of the ninth SMD data structure are identified; by performing step 3043 of identifying elements 14 as constituent parts of element 15 of the tenth SMD data structure, which identifies elements 14 of the tenth data structure of the SMD, as well as the identification data of the elements 14, which for each element 14, as an example, but not limitation, the value 141 element 14 of the tenth SMD data structure and serial numbers 142 TE of the linguistic sentence 11 constituting element 14; and form the tenth SMD data structure by combining the elements 14 as components of a single element 15 of the tenth SMD data structure.
[0150]На фиг. 34, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 3041 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 13 девятой структуры данных СМД. БДЛП, формируемая в рамках этапа 3041, отличается от БДЛП, формируемой в рамках этапа 3021, наличием шестой части лингвистических характеристик 217 и их значений 2171 текстовых элементов 21, содержащихся в элементах 13, устанавливающей синтаксическую роль ПЛЛК (элементов 13 девятой структуры данных СМД).  [0150] FIG. 34, by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated as part of step 3041 is shown, which is BDLP of text elements 21 of sentence 11 contained in elements 13 of the ninth data structure of the DMD. The BDLP generated in step 3041 differs from the BDLP generated in step 3021 in the presence of a sixth of the linguistic characteristics 217 and their values of 2171 text elements 21 contained in elements 13, which establishes the syntactic role of PLCs (elements 13 of the ninth data structure of the DMD).
Синтаксическая роль ПЛЛК может иметь значения: главная ПЛЛК или зависимая ПЛЛК. Поскольку с лингвистической точки зрения ПЛЛК - синтаксическая конструкция, то естественно, что в одном предложении одни синтаксические конструкции относительно других синтаксических конструкций при наличии между ними синтаксической подчинительной связи являются синтаксически главными или синтаксически зависимыми. По этому принципу одни ПЛЛК могут быть синтаксически главными (главными ПЛЛК), а другие - синтаксически зависимыми (зависимыми ПЛЛК). The syntactic role of PLCA may have meanings: the main PLC or dependent PLC. Since, from a linguistic point of view, PLCC is a syntactic construction, it is natural that in one sentence some syntactic constructs relative to other syntactic constructs, if there is a syntactic subordinate relationship between them, are syntactically main or syntactically dependent. According to this principle, some PLCs can be syntactically main (main PLCs), while others can be syntactically dependent (dependent PLCs).
[0151]Формирование шестой части лингвистических характеристик 217 и их значений 2171 для текстовых элементов 21 лингвистического предложения 11, составляющих ПЛЛК 13 производят путем классификации ПЛЛК 13 по их синтаксической роли в ходе этапа 3041. Синтаксическую роль ПЛЛК  [0151] The formation of the sixth part of the linguistic characteristics 217 and their values 2171 for the text elements 21 of the linguistic sentence 11 constituting PLCC 13 is performed by classifying PLCC 13 according to their syntactic role during step 3041. The syntactic role of PLCC
отождествляют с синтаксической ролью главного ЛЛЕ в главном ОЛЛО 91 в ПЛЛК 13. В соответствии со значением 2171 шестой части лингвистических характеристик 217 элементов 21, составляющих ПЛЛК 13, подразделяют все ПЛЛК 13 на главные ПЛЛК 13 и зависимые ПЛЛК 13. Формирование шестой части лингвистических характеристик 217 и их значений 2171 производят путем анализа существующих лингвистических признаков элементов 21, составляющих ПЛЛК 13. В ходе такого анализа, в качестве примера, но не ограничения, могут производят следующие действия: на первом этапе во всех ПЛЛК 13 идентифицируют identified with the syntactic role of the main LLE in the main OLLO 91 in PLCK 13. In accordance with the value 2171 of the sixth of the linguistic characteristics of the 217 elements 21 constituting PLCC 13, subdivide all PLCC 13 into main PLCC 13 and dependent PLCC 13. The formation of the sixth part of the linguistic characteristics 217 and their values 2171 is performed by analyzing the existing linguistic features of the elements 21 constituting PLCC 13. In the course of such analysis, as an example, but not limitation, the following actions can be performed: at the first stage, all PLCs 13 are identified
синтаксически главную ЛЛЕ синтаксически главной ОЛЛО 91; на втором этапе среди лингвистических признаков упомянутых главных ЛЛЕ упомянутого ПЛЛК 13 идентифицируют лингвистическую характеристику, отвечающую за syntactically main LLE syntactically main OLLO 91; at the second stage, among the linguistic features of the mentioned main LLEs of the said PLCC 13, the linguistic characteristic responsible for
синтаксическую роль упомянутой синтаксически главной ЛЛЕ элемента 13; на третьем этапе проверяют значение идентифицированной лингвистической характеристики, отвечающей за синтаксическую роль упомянутой синтаксически главной ЛЛЕ; если значение (синтаксическая роль упомянутой синтаксически главной ЛЛЕ элемента 13) является «сказуемым», то такой ПЛЛК 13 the syntactic role of the syntactically main LLE element 13; at the third stage, the value of the identified linguistic characteristic responsible for the syntactic role of the syntactically main LLE is checked; if the meaning (the syntactic role of the syntactically important LLE of element 13) is “predicate”, then such a PLCK 13
(синтаксически главная ЛЛЕ синтаксически главного элемента 91) предоставляют значение 2171 шестой части лингвистических характеристик 217- «главная ПЛЛК»; если значение не является «сказуемым», то такой ПЛЛК 13 предоставляют значение 2171 шестой части лингвистических характеристик 217 - «зависимая ПЛЛК». В итоге формируют значения 2171 шестой части лингвистических характеристик 217 для всех элементов ПЛЛК 13. (syntactically the main LLE of the syntactically main element 91) provide the value 2171 of the sixth of the linguistic characteristics 217- "main PLCK"; if the meaning is not “predictable,” then such PLCC 13 provides a value of 2171 of the sixth of the linguistic characteristics 217 - “dependent PLC”. As a result, values 2171 of the sixth part of the linguistic characteristics 217 are formed for all elements of the PLCC 13.
[0152]Сформированные по итогам этапа 3041 значения 2171  [0152] The values 2171 generated as a result of step 3041
(синтаксическая роль синтаксически главной ЛЛЕ синтаксически главного ОЛЛО элемента 13) шестой части лингвистических характеристик 217 элементов 21, составляющих ПЛЛК 13 девятой структуры данных СМД вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3041. При этом все части (211, 214, 232, 215, 216 и 217) лингвистических (the syntactic role of the syntactically main LLE of the syntactically main OLLO element 13) of the sixth part of the linguistic characteristics 217 of the elements 21 constituting the PLCC 13 of the ninth data structure of the DMD is entered into the LLL of the text elements 21 of the linguistic sentence 11, which is formed as part of step 3041. In this case, all parts (211, 214, 232, 215, 216 and 217) linguistic
характеристик текстовых элементов 21 лингвистического предложения 11, входящих в ПЛЛК 13 и их значения (2111, 2141, 2321, 2151, 2161 и 2171) characteristics of the text elements 21 of the linguistic sentence 11 included in the PLCC 13 and their meanings (2111, 2141, 2321, 2151, 2161 and 2171)
формируют уникальные лингвистические признаки элементов 13. form unique linguistic features of elements 13.
[0153]На фиг. 35, в качестве примера, но не ограничения, изображена общая структура сформированной десятой структуры данных СМД, являющейся третьей структурой данных СМД для настоящего способа преобразования 300. Десятая структура данных СМД представляет собой СМД, содержащий элемент 15, который представляет собой исходную сложную лингво-логическую конструкцию (ИС ЛЛК) лингвистического предложения 11, и идентификационные данные элемента 15, представляющие собой, в качестве примера, но не ограничения, значение 151 элемента 15 десятой структуры данных и порядковые номера 152 текстовых элементов, составляющих элемент 15. У исходной сложной ЛЛК 15 [0153] FIG. 35, by way of example, but not limitation, the general structure of the tenth SMD data structure generated is shown, which is the third SMD data structure for the present conversion method 300. The tenth SMD data structure is a SMD containing element 15, which is the original complex linguistic-logical design (IS LLK) linguistic sentence 11, and the identification data of element 15, which, by way of example, but not limitation, are the value 151 of element 15 of the tenth data structure and the serial numbers 152 of the text elements making up element 15. The original complex LLK 15
лингвистического предложения 11 отсутствует характеризующее ее уникальное наименование (УН), имеющее практическое использование. ИС ЛЛК предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, ИС ЛЛК - это синтаксическая единица вида «синтаксическая конструкция», сформированная из ПЛЛК путем объединения ПЛЛК по признаку наличия между ПЛЛК прямой синтаксической подчинительной и сочинительной связей. ИС ЛЛК состоит из того количества ПЛЛК, которое идентифицировано в исходном предложении. Упомянутая прямая синтаксическая подчинительная связь означает наличие между элементами различных ПЛЛК (между ЛЛЕ различных ПЛЛК) синтаксической подчинительной связи. Прямая синтаксическая linguistic sentence 11 is missing characterizing its unique name (UN), having practical use. The IP LLK of Proposition 11 is a borderline entity between linguistics and logic. From a linguistic point of view, LLK IS is a syntactic unit of the “syntactic construction” form, formed from PLCK by combining PLCK based on the presence of direct syntactic subordinate and composing links between PLCK. IS LLK consists of the number of PLCs that are identified in the original sentence. The mentioned direct syntactic subordinate link means the presence between the elements of different PLCCs (between LLE of different PLCCs) of syntactic subordinate linkage. Direct syntax
сочинительная связь означает наличие между элементами различных ПЛЛК (между ЛЛЕ различных ПЛЛК) синтаксической сочинительной связи. С точки зрения синтаксиса ИС ЛЛК - это преобразованное исходное предложение без искажения его смысла. Суть преобразования исходного лингвистического предложения состоит в том, что все примененные лингвистические приемы (осложнения), направленные на упрощение лингвистических форм и структур мыслимых автором утверждений (отрицаний) в тексте лингвистического предложения (например, не ограничиваясь, использование однородных членов, причастных (деепричастных) оборотов) отменяют. Вместо исходного composing means the presence of syntactic composing between elements of different PLCCs (between LLE of different PLCCs). In terms of syntax, IP LLK is a transformed source sentence without distorting its meaning. The essence of the transformation of the original linguistic sentence is that all applied linguistic techniques (complications) aimed at simplifying the linguistic forms and structures of statements (negatives) imagined by the author in the text of the linguistic sentence (for example, without limitation, the use of homogeneous members, participles (participles) of turns ) cancel. Instead of the original
лингвистического предложения формируют массив простых предложений, которые синтаксически и логически связаны друг с другом. Упомянутые связи проясняют, а затем тем или иным образом регистрируют. Потребность такого преобразования актуальна потому, что одновременно с упрощением linguistic sentences form an array of simple sentences that are syntactically and logically related to each other. The mentioned connections are clarified and then registered in one way or another. The need for such a transformation is relevant because, at the same time as simplification
лингвистических форм и структуры лингвистического предложения применение упомянутых лингвистических приемов приводит к сложности и неоднозначности логической структуры исходного лингвистического предложения, к сложности и неоднозначности восприятия смысла исходного предложения пользователем, а также к большой технической сложности корректного интеллектуального машинного анализа содержания исходного лингвистического предложения. the use of the aforementioned linguistic techniques leads to the complexity and ambiguity of the logical structure of the original linguistic sentence, to the complexity and ambiguity of the perception of the meaning of the original sentence by the user, as well as to the great technical complexity of the correct intelligent machine analysis of the contents of the original linguistic sentence.
Преобразованное таким образом исходное предложение представляет собой (при условии применения в исходном лингвистическом предложении упомянутых приемов), по сути, сложное предложение, состоящее из преобразованных простых предложений в количестве, превышающем количество исходных простых предложений в исходном лингвистическом предложении. Однако в отличие от исходного лингвистического предложения все преобразованные простые предложения в ИС ЛЛК представляют собой однозначные простые суждения (мыслимые утверждения или отрицания). Регистрация элемента 15 (ИС ЛЛК) в форме структуры данных (массива преобразованных ПЛЛК (элементов 14)) позволяет выявить многоуровневую синтаксическую структуру элемента 15 (ИС ЛЛК) и связи между элементами этой структуры. Уровни ИС ЛЛК отражают структуру синтаксической подчинительной связи между структурированными ПЛЛК (СПЛЛК) как составными частями ИС ЛЛК и обусловлены выявленными синтаксическими связями между составными частями элемента 15 (элементами 14 лингвистического предложения 11.) Элемент 15 (ИС ЛЛК) формируется из упомянутых структурированных ПЛЛК (СПЛЛК) - элементов 14. В обязательном порядке ИС ЛЛК содержит только элемент 14 (СПЛЛК) первого уровня (элементы 13 первого вида). Наличие иных элементов 14 (СПЛЛК) второго и последующих уровней (элементов 13 второго и последующих видов) обусловлено The original sentence thus transformed is subject to the use of the above techniques in the original linguistic sentence), in fact, a complex sentence consisting of converted simple sentences in an amount exceeding the number of initial simple sentences in the original linguistic sentence. However, unlike the original linguistic sentence, all converted simple sentences in the LC LLK are unambiguous simple judgments (conceivable statements or denials). The registration of element 15 (IS LLK) in the form of a data structure (an array of converted PLCs (elements 14)) allows you to identify the multi-level syntactic structure of element 15 (IS LLK) and the relationship between the elements of this structure. The levels of the LLC IC reflect the structure of the syntactic subordinate connection between the structured PLCs (SPLC) as the constituent parts of the PLC IC and are determined by the identified syntactic links between the constituent parts of the element 15 (elements 14 of the linguistic sentence 11.) The element 15 (the PLC LLC) is formed from the mentioned structured PLCs (SPLC) ) - elements 14. Mandatory IS LLK contains only element 14 (SPLK) of the first level (elements 13 of the first kind). The presence of other elements 14 (SPLC) of the second and subsequent levels (elements 13 of the second and subsequent types) is due to
лингвистическими осложнениями исходного лингвистического предложения. К СПЛЛК первого уровня (элементам 13 первого вида) относят ПЛЛК, которые не являются подчиненными простыми предложениями. К СПЛЛК второго уровня (элементам 13 второго вида) относят ПЛЛК, которые являются подчиненными простыми предложениями, при условии, что главными для них являются СПЛЛК первого уровня. К СПЛЛК третьего уровня (элементам 13 третьего вида) относят ПЛЛК, которые являются подчиненными простыми предложениями при условии, что главными для них являются СПЛЛК второго уровня. Эти утверждения таким образом справедливы и для СПЛЛК последующих уровней (четвертого, пятого, шестого и так далее), и для специалиста в данной области техники должна быть очевидна возможность существования таких последующих уровней. linguistic complications of the original linguistic sentence. The first level SPLCK (elements 13 of the first kind) include PLCK, which are not subordinate simple sentences. The second level SPLCK (elements 13 of the second type) include PLCK, which are subordinate simple sentences, provided that the main one is the first level SPLC. The third level SPLCK (elements 13 of the third type) include PLCKs, which are subordinate simple sentences, provided that the main ones are second level SPLCs. These statements are thus valid for the next level SPLCC (fourth, fifth, sixth, and so on), and the possibility of the existence of such subsequent levels should be obvious to a person skilled in the art.
Синтаксическая структура ИС ЛЛК 15, кроме синтаксически подчиненных СПЛЛК, может содержать и синтаксические сочиненные СПЛЛК. При этом все СПЛЛК первого уровня (элементы 13 первого вида) обязательно являются сочиненными друг с другом ПЛЛК. Начиная со СПЛЛК второго уровня (элементов 13 второго и последующих видов), СПЛЛК одного уровня могут как иметь, так и не иметь синтаксических сочинительных связей друг с другом. Синтаксическую сочинительную связь между СПЛЛК в ИС ЛЛК идентифицируют в случае наличия у синтаксически главных слов (ЛЛЕ) синтаксически главных ОЛЛО таких СПЛЛК одного и того же синтаксического родителя (синтаксически главного слова, у которого с таким словом (ЛЛЕ) имеется прямая синтаксическая подчинительная связь). Дополнительными условиями может быть наличие у главных слов (ЛЛЕ) таких СПЛЛК одной и той же синтаксической роли, а также наличие признака связи между такими словами (ЛЛЕ), а именно - запятой или сочинительного союза. ИС ЛЛК 15 в отличие от упомянутых ранее ИП ЛЛК 12 и ПЛЛК 13 может быть только в единственном числе - из одного исходного лингвистического предложения можно сформировать только одну ИС ЛЛК 15. С логической точки зрения, ИС ЛЛК 15 - это логическая сущность, выражающая сложное суждение (некванторное суждение), представляющая собой логическую конструкцию, элементами которой являются простые суждения. Кванторность сложного суждения определяется его The syntactic structure of the IC LLK 15, in addition to syntactically subordinate SPLCK, may also contain syntactically composed SPLCK. At the same time, all first-level PLCS (elements 13 of the first kind) are necessarily composed of PLCC with each other. Starting from the second level SPLCK (elements 13 of the second and subsequent types), the one level SPLCK may or may not have syntactic composing connections with each other. The syntactic compositional link between the SLCL in the LLC IC is identified if the syntactically main words (LLEs) have the syntactically main OLLOs of these SLCLs of the same syntactic parent (the syntactically main word that has a direct syntactic subordinate link to such a word (LLE)). Additional conditions may be the presence of the same syntactic role in the main words (LLE) of such SPLCs, as well as the presence of a sign of connection between such words (LLE), namely, a comma or a compound union. IS LLK 15, in contrast to the previously mentioned FE LLK 12 and PLLC 13, can only be singular - from one initial linguistic sentence it is possible to form only one LS LLK 15. From a logical point of view, LS LLK 15 is a logical entity that expresses a complex judgment (non-quantifier proposition), which is a logical construction, the elements of which are simple judgments. The quantity of a complex judgment is determined by its
количественной характеристикой, то есть наличием или отсутствием quantitative characteristic, i.e. presence or absence
однозначности в сложном суждении. По количественной характеристике ambiguity in a complex judgment. By quantitative characteristics
(кванторности) все сложные суждения можно разделить на две категории: (quantifier) all complex judgments can be divided into two categories:
однозначные сложные суждения и неоднозначные сложные суждения. unambiguous complex judgments and ambiguous complex judgments.
Однозначные сложные суждения - это кванторные сложные суждения, в которых показатель кванторности всегда определен и равен единице, то есть каждый элемент сложного суждения не имеет вариативности, всегда однозначен. Unambiguous complex judgments are quantified complex judgments in which the quantifier index is always defined and equal to unity, that is, each element of a complex proposition has no variability, is always unambiguous.
Однозначность сложного суждения проявляется посредством нахождения в составе сложного суждения элементов, не имеющих возможность быть истолкованными как варианты утверждений или отрицаний, либо как варианты обусловленности одного и того же утверждения или отрицания. Примером однозначного сложного суждения может быть следующее суждение: «Если покупатель оплатил товар, то товар должен быть передан покупателю продавцом». Данное сложное суждение не допускает никакой вариативности - простое суждение «товар должен быть передан покупателю продавцом» обусловлено единственным простым суждением «если покупатель оплатил товар». Неоднозначные сложные суждения - это кванторные сложные суждения, в которых показатель кванторности всегда определен и всегда больше единицы, то есть, как минимум, один элемент сложного суждения имеет вариативность. Неоднозначность сложного суждения проявляется посредством нахождения в составе сложного суждения элементов, имеющих возможность быть истолкованными как варианты утверждений или отрицаний, либо как варианты обусловленности одного и того же утверждения или отрицания. Примером неоднозначного сложного суждения может быть следующее суждение: «Если покупатель оплатил товар, то товар должен быть передан покупателю продавцом или товар должен быть передан покупателю иным должностным лицом The unambiguity of a complex judgment is manifested by finding elements in a complex judgment that are not able to be interpreted as variants of statements or negations, or as variants of conditionality of the same statement or negation. An example of an unambiguous complex judgment is the following proposition: “If the buyer paid for the goods, then the goods should be transferred to the buyer by the seller”. This complex proposition does not allow any variation - the simple proposition “the goods must be transferred to the buyer by the seller” is due to the only simple proposition “if the buyer paid for the goods”. Ambiguous complex judgments are quantified complex judgments in which the quantifier index is always determined and always greater than unity, that is, at least one element of a complex proposition has variability. The ambiguity of a complex judgment is manifested by finding elements in the composition of a complex judgment that can be interpreted as variants of statements or negations, or as variants of conditionality of one and the same statement or denial. An example of an ambiguous complex judgment is the following proposition: “If the buyer paid for the goods, the goods must be transferred to the buyer by the seller or the goods must be transferred to the buyer by another official
компании». Данное сложное суждение допускает вариативность утверждения - или «товар должен быть передан покупателю продавцом», или «товар должен быть передан покупателю иным должностным лицом компании». Сложное суждение состоит из простых суждений, имеющих исходные (установленные в исходном лингвистическом предложении) синтаксические связи между собой. В связи с тем, что такими связями могут быть как синтаксические подчинительные связи, так и синтаксические сочинительные связи, нельзя гарантировать отсутствие в сложном суждении вариативности утверждений или отрицаний, либо вариативности обусловленностей утверждений (отрицаний). В связи с вышеизложенным ИС ЛЛК является сложным суждением с неопределенной количественной характеристикой (показатель кванторности может быть как равен единице, так и быть больше единицы), и такое сложное суждение является «некванторным». С аналитической точки зрения ИС ЛЛК - это информационно наполненная схема, проясняющая логическую конструкцию предложения (логические связи между отдельными простыми суждениями, заложенными в исходном лингвистическом предложении). В связи с этим ИС ЛЛК предпочтительно демонстрируется не в лингвистической текстовой формы (в виде сложного предложения, состоящего из множества простых предложений без сочинительной связи и причастных (деепричастных) оборотов, в котором может имеется как подчинительная, так и сочинительная связь между упомянутыми простыми предложениями), а в табличной или схематичной форме. Упомянутая табличная или схематичная форма демонстрации позволяет быстро и точно уяснить и проанализировать все используемые основные логические сущности (СПЛЛК) и все логические связи между company ". This complex judgment allows for a varied statement - either "the goods must be transferred to the buyer by the seller", or "the goods must be transferred to the buyer by another company official." A complex proposition consists of simple propositions that have the original (established in the original linguistic sentence) syntactic relations between themselves. Due to the fact that such relations can be both syntactic subordinate connections and syntactic composing connections, it is impossible to guarantee the absence in the complex judgment of the variability of statements or negations, or the variability of conditionals of statements (negations). In connection with the foregoing, IS LLK is a complex proposition with an indefinite quantitative characteristic (the quantifier index can be either equal to one or be greater than unity), and such a complex proposition is "non-quantifier". From an analytical point of view, the IP LLK is an information-filled scheme that clarifies the logical construction of a sentence (logical connections between individual simple judgments inherent in the original linguistic sentence). In this regard, the IP LLK is preferably not shown in a linguistic textual form (in the form of a complex sentence consisting of many simple sentences without an inventive connection and participial (active participles) turns, in which there can be either a subordinate or an inventive connection between the mentioned simple sentences) , but in tabular or schematic form. The mentioned tabular or schematic form of the demonstration allows you to quickly and accurately understand and analyze all the used basic logical entities (SPLC) and all logical connections between
упомянутыми логическими сущностями исходного лингвистического the mentioned logical entities of the original linguistic
предложения. В частности, не ограничиваясь, такое развернутое и одновременно структурированное представление исходного лингвистического предложения (логически связанное множество простых предложений без однородностей) позволяет повысить эффективность обработки лингвистического предложения 11 машинными средствами поскольку вместо одного обрабатываемого предложения со сложной структурой появляется возможность обрабатывать множество простых предложений с идентифицированной логической связью между элементами этого множества. offers. In particular, not limited to, such a detailed and at the same time structured representation of the original linguistic sentence (a logically connected set of simple sentences without homogeneities) allows to increase the efficiency of processing a linguistic sentence 11 by machine tools since instead of one processed sentence with a complex structure, it becomes possible to process many simple sentences with an identified logical connection between the elements of this set.
[0154]Идентификацию видов элементов 13 девятой структуры данных СМД в ходе этапа 3042 производят на основе результатов идентификации значений 2171 шестой части лингвистических характеристик 217 текстовых элементов 21, составляющих ПЛЛК 13. Для идентификации видов ПЛЛК 13 необходимо, в качестве примера, но не ограничения, осуществить следующие действия: на первом этапе из всех ПЛЛК 13 выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО элемента 13 (ПЛЛК) не имеет синтаксического родителя; такая ПЛЛК будет являться элементом 13 первого вида - обязательным элементом десятой структуры данных СМД; на втором этапе из оставшихся ПЛЛК 13, вид которых еще не идентифицирован, выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО элемента 13 (ПЛЛК) имеет синтаксического родителя в ПЛЛК идентифицированной как элемент 13 первого вида; такая ПЛЛК будет являться элементом 13 второго вида - не обязательным элементом десятой структуры данных СМД; на третьем и последующих этапах из оставшихся ПЛЛК 13, вид которых еще не идентифицирован, выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО элемента 13 (ПЛЛК) имеет синтаксического родителя в ПЛЛК, идентифицированной как элемент 13 второго или последующих видов; такая ПЛЛК будет являться элементом 13 третьего или последующих видов - не обязательным элементом десятой структуры данных СМД. Наличие таких ПЛЛК обусловлено только синтаксической сложностью исходного лингвистического предложения. При этом дополнительно проводят этап идентификации  [0154] The identification of the types of elements 13 of the ninth SMD data structure during step 3042 is based on the results of identifying the values of 2171 of the sixth of the linguistic characteristics of 217 text elements 21 constituting PLCC 13. To identify the types of PLCC 13, it is necessary, as an example, but not limitation, to carry out the following actions: at the first stage, from all PLCs 13, select PLCs in which the main LLE of the main OLLO element 13 (PLCC) does not have a syntactic parent; such a PLC will be an element 13 of the first type - an indispensable element of the tenth data structure of the DMD; at the second stage, from the remaining PLCC 13, the form of which has not yet been identified, select such PLCs in which the main LLE of the main OLLO element 13 (PLCC) has a syntactic parent in the PLCC identified as element 13 of the first type; such a PLC will be an element 13 of the second type - an optional element of the tenth data structure of the DMD; at the third and subsequent stages, from the remaining PLCC 13, the form of which has not yet been identified, select such PLCs in which the main LLE of the main OLLO element 13 (PLCC) has a syntactic parent in the PLCC identified as element 13 of the second or subsequent types; such a PLC will be an element 13 of the third or subsequent types - an optional element of the tenth data structure of the DMD. The presence of such PLCC is due only to the syntactic complexity of the original linguistic sentence. In addition, an identification step is carried out
сочинительных связей между элементами 13 (ПЛЛК). ПЛЛК 13, у которых отсутствует синтаксическая подчинительная связь, но идентифицирована синтаксическая сочинительная связь, относят к тому же виду, что и ПЛЛК 13, с которым она сочинена. Идентификацию элементов 14 (составных частей элемента 15) десятой структуры данных СМД в ходе этапа 3043 производят путем connective connections between elements 13 (PLCK). PLCK 13, in which there is no syntactic subordinate connection, but a syntactic compositional link is identified, is assigned to the same form as PLCK 13 with which it is composed. The identification of elements 14 (component parts of element 15) of the tenth data structure of the DMD during step 3043 is performed by
отождествления с элементами 13, идентифицированными на этапе 3042 как определенные виды элемента 13. При этом элементы 13 первого вида identifications with elements 13 identified at block 3042 as certain types of element 13. Moreover, elements 13 of the first kind
идентифицируют как элемент 14 первого уровня, элементы 13 второго вида идентифицируют как элемент 14 второго уровня и так далее, элементы 13 третьего и последующих видов идентифицируют как элемент 14 третьего и, соответственно, последующих уровней. identify as element 14 of the first level, elements 13 of the second type are identified as element 14 of the second level, and so on, elements 13 of the third and subsequent types are identified as element 14 of the third and, respectively, subsequent levels.
[0155]Идентификация видов элементов 13 девятой структуры данных СМД в рамках этапа 3042 не изменяет значение 131 элемента 13 и не изменяет  [0155] the Identification of the types of elements 13 of the ninth data structure of the DMD in the framework of step 3042 does not change the value 131 of the element 13 and does not change
порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 13 (ПЛЛК). Идентификацию значения и порядковых номеров ТЭ элемента 14 (СПЛЛК) десятой структуры данных СМД в рамках этапа 3043 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 13, идентифицируют как значение 141 элемента 14 (СПЛЛК), а порядковые номера) 212 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 13, идентифицируют как порядковые номера 142 текстовых элементов, составляющих элемент 14 (СПЛЛК). Идентификацию значения и порядковых номеров ТЭ элемента 15 (ИС ЛЛК) десятой структуры данных СМД в рамках этапа 3043 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих все элементы 14, serial numbers of text elements 21 of the linguistic sentence 11 constituting element 13 (PLCK). The identification of the value and serial numbers of the TE element 14 (LFLC) of the tenth SMD data structure within the framework of step 3043 is carried out as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting element 13 are identified as the value 141 of element 14 (FLCC), and serial numbers) 212 of the text elements 21 of the linguistic sentence 11 constituting element 13 are identified as serial numbers 142 of the text elements constituting element 14 (CPLC). The identification of the value and serial numbers of the TE element 15 (LC LLK) of the tenth SMD data structure within the framework of step 3043 is carried out as follows: the values of 211 text elements 21 of the linguistic sentence 11, which make up all the elements 14,
идентифицируют как значение 151 элемента 15 (ИС ЛЛК), а порядковые номера 212 (упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих все элементы 14, идентифицируют как порядковые номера 152 текстовых элементов, составляющих элемент 15 (ИС ЛЛК). identified as the value 151 of element 15 (LC LLK), and serial numbers 212 (of the mentioned text elements 21 of the linguistic sentence 11, constituting all elements 14, identified as serial numbers 152 of text elements constituting element 15 (LC LC).
[0156]Формирование десятой структуры данных СМД в ходе этапа 3043 производят путем объединения в одной структуре данных элементов 14 десятой структуры данных СМД, а также их идентификационных данных. При этом объединяемые в одной структуре данных элементы 14, являясь составными частями элемента 15, формируют таким образом элемент 15, который является основным элементом десятой структуры данных СМД. Объединение в одной структуре данных упомянутых элементов и их идентификационных данных производится по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. В итоге десятая структура данных СМД представляет собой массив (перечень) структурированных ПЛЛК (СПЛЛК) - элементов 14 первого и последующих уровней, расположенных в перечне СПЛЛК с учетом возрастания уровня элемента 14 (и указанием этого уровня), а также с учетом возрастания порядкового номера текстового элемента признака связи элемента 14 (и указанием этого порядкового номера), а также порядкового номера текстового элемента синтаксического родителя элемента 14 (и указанием этого порядкового номера). При этом первой частью ИС ЛЛК и первым порядковым номером в упомянутом перечне структурированных ПЛЛК будет СПЛЛК 14 без синтаксического родителя и без признака связи. Элементы 14 десятой структуры данных СМД используют для построения схемы или таблицы логических связей, визуально отображающей логическую конструкцию исходного лингвистического предложения (логические связи между отдельными простыми суждениями, заложенными в исходном лингвистическом предложении). В частности, не ограничиваясь, как это было указано ранее со ссылкой на элементы 15, такое развернутое и одновременно структурированное представление исходного лингвистического предложения (логически связанное множество простых предложений без однородностей) позволяет повысить эффективность обработки лингвистического предложения 11 машинными средствами поскольку вместо одного обрабатываемого предложения со сложной структурой появляется возможность обрабатывать множество простых предложений с [0156] The formation of the tenth SMD data structure during step 3043 is performed by combining elements of the tenth SMD data structure 14 as well as their identification data in one data structure. Moreover, the elements 14 combined in one data structure, being the constituent parts of the element 15, thus form the element 15, which is the main element of the tenth data structure of the SMD. The combination of the mentioned elements and their identification data in one data structure is carried out according to the principles and methods known from the prior art, which, accordingly, are not further described in detail. As a result, the tenth data structure of the SMD is an array (list) of structured PLCs (SPLC) - elements 14 of the first and subsequent levels located in the list of SPLC, taking into account the increasing level of element 14 (and indicating this level), as well as taking into account the increasing serial number of the text element of the sign of communication element 14 (and indicating this serial number), as well as the sequence number of the text element of the syntax parent of element 14 (and indicating this serial number). In this case, the first part of the IP LLK and the first serial number in the above list of structured PLCs will be SPLK 14 without a syntactic parent and without a sign of communication. Elements 14 of the tenth SMD data structure are used to construct a diagram or table of logical connections that visually displays the logical construction of the original linguistic sentence (logical connections between individual simple judgments embedded in the original linguistic sentence). In particular, without limiting, as was indicated above with reference to elements 15, such a detailed and at the same time structured representation of the original linguistic sentence (a logically connected set of simple sentences without homogeneities) allows us to increase the efficiency of processing the linguistic sentence 11 by machine tools because instead of one processed sentence with complex structure gives you the opportunity to process many simple sentences with
идентифицированной логической связью между элементами этого множества. identified logical connection between the elements of this set.
[0157] Идентификацию лингвистических характеристик ТЭ, составляющих элемент 15 (ИС ЛЛК) десятой структуры данных СМД, и их значений при  [0157] Identification of the linguistic characteristics of TEs constituting element 15 (IS LLK) of the tenth data structure of SMD, and their values for
необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3041, состоящего из идентификационных данных ТЭ, составляющих элемент 15 (ИС ЛЛК), и получении значений (2131, 2141, 2231, 2151, 2161, 2171) всех частей лингвистических характеристик (213, 214, 223, 215, 216, 217) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 15 (ИС ЛЛК). При этом, как было описано ранее лингвистическими признаками элемента 15 (ИС ЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элемент 15 (ИС ЛЛК). Necessities are made by organizing a request to the BDLP, which is formed as part of step 3041, consisting of the identification data of the fuel cells that make up element 15 (IS LLK), and obtaining the values (2131, 2141, 2231, 2151, 2161, 2171) of all parts of the linguistic characteristics (213 , 214, 223, 215, 216, 217) of the textual elements 21 of the linguistic sentence 11, of which the element 15 (EC LLK) consists. Moreover, as previously described, the linguistic features of element 15 (IS LLK) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which element 15 (IS LLK) consist.
[0158]На фиг. 36, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 305 формирования одиннадцатой структуры данных СМД, являющейся третьей структурой данных СМД для рассматриваемого способа 300. Этап 305 характеризуется: выполнением этапа 3051 идентификации видов элемента 15 десятой структуры данных СМД, указывающих на наличие в ИС ЛЛК сочиненных ПЛЛК, на котором идентифицируют первый и второй виды элемента 15 десятой структуры данных СМД, а также идентификации  [0158] In FIG. 36, by way of example, but not limitation, a general flowchart is shown of the steps of step 305 of generating the eleventh SMD data structure, which is the third SMD data structure for the method 300 under consideration. Step 305 is characterized by: performing step 3051 of identifying views of the element 15 of the tenth SMD data structure indicating for the presence in the LLC IC of composed PLCs, on which the first and second types of element 15 of the tenth structure of the SMD data are identified, as well as identification
непреобразованных элементов 16 одиннадцатой структуры данных СМД и их идентификационных данных, представляющих собой для каждого untransformed elements 16 of the eleventh data structure of the SMD and their identification data representing for each
непреобразованного элемента 16, в качестве примера, но не ограничения, значение 161 непреобразованного элемента 16 одиннадцатой структуры данных СМД и порядковые номера 162 ТЭ лингвистического предложения 11, составляющих непреобразованный элемент 16; выполнением этапа 3052 формирования преобразованных элементов 16 одиннадцатой структуры данных СМД, на котором формируют преобразованные элементы 16 одиннадцатой структуры данных СМД из элементов 15 второго вида, а также идентификационные данные untransformed element 16, by way of example, but not limitation, the value 161 of the non-transformed element 16 of the eleventh SMD data structure and serial numbers 162 of the TE of the linguistic sentence 11 constituting the non-transformed element 16; performing step 3052 of generating the transformed elements 16 of the eleventh SMD data structure, on which the converted elements 16 of the eleventh SMD data structure are formed from the second type elements 15, as well as identification data
преобразованных элементов 16, представляющие собой для каждого transformed elements 16, representing for each
преобразованного элемента 16, в качестве примера, но не ограничения, значение 161 преобразованного элемента 16 одиннадцатой структуры данных СМД и порядковые номера 162 ТЭ лингвистического предложения 11, составляющих преобразованные элементы 16; выполнением этапа 3053 формирования the transformed element 16, by way of example, but not limitation, the value 161 of the transformed element 16 of the eleventh SMD data structure and the sequence numbers 162 of the TE of the linguistic sentence 11 constituting the transformed elements 16; the execution of step 3053 formation
одиннадцатой структуры данных СМД, на котором формируют одиннадцатую структуру данных СМД из преобразованных элементов 16 одиннадцатой of the eleventh SMD data structure, on which the eleventh SMD data structure is formed from the transformed elements 16 of the eleventh
структуры данных СМД или из непреобразованного элемента 16 одиннадцатой структуры данных СМД. SMD data structures or from an untransformed element 16 of the eleventh SMD data structure.
[0159]На фиг. 37, в качестве примера, но не ограничения, изображена общая структура сформированной одиннадцатой структуры данных СМД, являющейся четвертой структурой данных СМД для настоящего способа преобразования 300. Одиннадцатая структура данных СМД представляет собой СМД, содержащий элементы 16 одиннадцатой структуры данных СМД, которые представляют собой сложные лингво-логические конструкции (СЛЛК) лингвистического предложения 11 и идентификационные данные ЛогО, представляющие собой для каждого элемента 16, в качестве примера, но не ограничения, значение 161 элемента 16 одиннадцатой структуры данных СМД и порядковые номера 162 текстовых элементов, составляющих элемент 16. У СЛЛК лингвистического предложения 11 отсутствуют какие-либо характеризующие ее уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 16, в качестве примера, но не ограничения, могут именоваться как «СЛЛК1», «СЛЛК2», «СЛЛКЗ», «СЛЛКп», где n > 1 - порядковый номер элемента в лингвистическом предложении. СЛЛК лингвистического предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, СЛЛК - это синтаксическая единица вида «синтаксическая конструкция», сформированная из ИС ЛЛК путем гетерогенизации ИС ЛЛК. С точки зрения синтаксиса СЛЛК - это отдельное простое предложение (если исходное лингвистическое предложение является простым предложением без синтаксических осложнений (однородных членов, оборотов и так далее)) или сложноподчиненное предложение, которое не содержит однородных членов (слов между которыми имеется синтаксическая сочинительная связь). С логической точки зрения, СЛЛК - это логическая сущность, выражающая сложное суждение (кванторное суждение), представляющее собой завершенную логическую конструкцию мышления, с помощью которой [0159] FIG. 37, by way of example, but not limitation, the general structure of the generated eleventh SMD data structure is shown, which is the fourth SMD data structure for the present conversion method 300. The eleventh SMD data structure is a SMD containing elements 16 of the eleventh SMD data structure, which are complex linguistic-logical constructions (LLLC) of the linguistic sentence 11 and the logo identification data, representing for each element 16, as an example, but not limitation, beginning 161 of element 16 of the eleventh data structure of the DMD and serial numbers 162 of the text elements making up element 16. The LLLC of the linguistic sentence 11 does not have any unique names characterizing it that have practical use. In the data structure, elements 16, as an example, but not limitation, can be referred to as “SLLK1”, “SLLK2”, “SLLKZ”, “SLLKp”, where n> 1 is the serial number of the element in the linguistic sentence. The SLCC of Linguistic Proposal 11 is a boundary entity between linguistics and logic. From a linguistic point of view, SLLK is a syntactic unit of the form “syntactic construction”, formed from IS LLK by heterogenization of IS LLK. From the point of view of syntax, SLLK is a separate simple sentence (if the original linguistic sentence is a simple sentence without syntactic complications (homogeneous members, revolutions, etc.)) or a complex sentence that does not contain homogeneous members (words between which there is a syntactic writing connection). From a logical point of view, SLLK is a logical entity that expresses a complex proposition (quantifier proposition), which is a complete logical construction of thinking, with the help of which
формируется и передается мысль о том, что нечто (предикат суждения) the idea is formed and transmitted that something (predicate of judgment)
утверждается или опровергается о предмете суждения (субъект суждения). affirmed or disproved about the subject of judgment (subject of judgment).
Отличие СЛЛК от ИС ЛЛК в кванторности сложного суждения. Если ИС ЛЛК допускает возможность наличия неоднозначности в сложном суждении, то СЛЛК (имеющая показатель кванторности, равный единице) является абсолютно однозначным сложным суждением. В составе СЛЛК не может быть нескольких однородных (сочиненных) простых суждений. В СЛЛК не может быть никакой неоднозначности ни при утверждении (опровержении) чего-либо, ни при  The difference between SLCK and IS SLC in the quantity of complex judgments. If the IC LLK admits the possibility of ambiguity in a complex proposition, then the LLLC (having a quantifier index equal to one) is an absolutely unambiguous complex proposition. In the composition of SLLK there cannot be several homogeneous (composed) simple judgments. In SLLC, there can be no ambiguity in either affirming (refuting) anything or
обусловленности утверждения (опровержения), ни при обусловленности conditionality of the statement (refutation), nor with conditionality
элементов утверждения (опровержения), вне зависимости от состава и elements of approval (refutation), regardless of the composition and
конструкции исходного лингвистического предложения. constructions of the original linguistic sentence.
[0160]Идентификацию вида ИС ЛЛК 15 в рамках этапа 3051 производят путем анализа значений лингвистических характеристик текстовых элементов, составляющих ИС ЛЛК 15, с целью идентификации синтаксических сочинительных связей между СПЛЛК 14 в ИС ЛЛК 15. Синтаксическую сочинительную связь между СПЛЛК 14 идентифицируют в случае наличия у синтаксически главных ЛЛЕ синтаксически главных ОЛЛО таких СПЛЛК одного и того же синтаксического родителя (синтаксически главной ЛЛЕ другой СПЛЛК, у которой со словом (ЛЛЕ) в сочиненных СПЛЛК имеется прямая синтаксическая подчинительная связь).  [0160] The type identification of the LLK 15 information system within step 3051 is performed by analyzing the linguistic characteristics of the text elements that make up the LLK 15 system, in order to identify the syntactic compositional links between the SPLK 14 in the LLK 15 IP. The syntactic compositional link between the SPLK 14 is identified if any the syntaxically important LLEs of the syntactically principal LLLOs of such LLLFs of the same syntactic parent (the syntactically major LLLEs of different LLLFs, which have the direct syntax with the word (LLEs) in the compiled LLLFs eskaya subordinate connection).
Дополнительными условиями может быть наличие у главных ЛЛЕ главных ОЛЛО упомянутых сочиненных СПЛЛК одной и той же синтаксической роли, а также наличие признака связи между упомянутыми сочиненными ЛЛЕ, а именно - запятой или сочинительного союза. При идентификации синтаксической Additional conditions may include the presence of the same syntactic role in the main LLLOs of the main OLLLs composed of SPLCs, as well as the presence of a sign of connection between the aforementioned composed LLLEs, namely, a comma or a writing union. When identifying syntactic
сочинительной связи между главными ЛЛЕ главных ОЛЛО двух или более СПЛЛК такую ИС ЛЛК идентифицируют как второй вид элемента 15. ИС ЛЛК 15, в которой не идентифицируют синтаксической сочинительной связи у главного ЛЛЕ главного ОЛЛО в СПЛЛК идентифицируют как первый вид элемента 15. При этом идентифицированный первый вид элемента 15 десятой структуры данных СМД отождествляют с непреобразованным элементом 16 одиннадцатой структуры данных СМД. Формирование преобразованных элементов одиннадцатой структуры данных СМД (преобразованных элементов 16, полученных из элементов 15 второго вида) на этапе 3052 производят на основании идентифицированной на этапе 3051 синтаксической сочинительной связи между СПЛЛК путем преобразования ИС ЛЛК второго вида. Смысл преобразования ИС ЛЛК второго вида на этапе 3052 состоит в гетерогенизации ИС ЛЛК, то есть в устранении синтаксических однородностей в ИС ЛЛК путем формирования из элемента 15 второго вида множества новых ИС ЛЛК, идентичных по однородностям элементу 15 первого вида. При этом каждая новая ИС ЛЛК упомянутого множества может содержать только одну из упомянутых СПЛЛК с однородными членами (если ИС ЛЛК второго вида содержит один ряд однородных членов) или только одно уникальное сочетание упомянутых СПЛЛК с однородными членами разных рядов однородных членов (если ИС ЛЛК второго вида содержит несколько рядов СПЛЛК с однородными членами). Множество ИС ЛЛК, сформированных из ИС ЛЛК (элемент 15) второго вида являются a link between the main LLEs of the main OLLO of two or more SPLKs such an LLK IS is identified as the second type of element 15. IS LLK 15, in which no syntactic linkage is identified from the main LLE of the main OLLO in SPLC is identified as the first type of element 15. Moreover, the identified first type of element 15 of the tenth SMD data structure is identified with the non-transformed element 16 of the eleventh SMD data structure. The generation of the transformed elements of the eleventh SMD data structure (the transformed elements 16 obtained from the second type elements 15) at step 3052 is performed based on the syntactic writing connection between the SPLK identified at step 3051 by converting the LLK IC of the second kind. The meaning of the conversion of the LLK IC of the second kind at step 3052 is to heterogenize the LLK IC, that is, to eliminate syntactic homogeneities in the LLK IC by forming from the element 15 of the second kind a multitude of new LL LLP identical in uniformity to the element 15 of the first kind. Moreover, each new LLLC IS of the said set can contain only one of the mentioned LLDCs with homogeneous members (if the LLLC IL of the second type contains one row of homogeneous members) or only one unique combination of the said LLDC with homogeneous members of different series of homogeneous members (if the LLLC IS of the second type contains several rows of SPLC with homogeneous members). A plurality of LLK ICs formed from LLK IC (element 15) of the second kind are
гетерогенными СЛЛК (преобразованными элементами 16), то есть heterogeneous SLCK (transformed elements 16), i.e.
сформированными из одной ИС ЛЛК второго вида путем ее гетерогенного преобразования (гетерогенизации). Процесс гетерогенизации ИС ЛЛК (элемента 15) второго вида может быть проведен, в качестве примера, но не ограничения, следующим образом: на первом этапе выявляют ряды однородных членов в элементе 15 второго вида; в ходе выявления рядов однородных членов выявляют сами ряды однородных членов и порядковые номера однородных членов в ряду, а также признаки связи каждого однородного члена; на втором этапе выявляют цепочки однородных членов для каждого выявленного СПЛЛК, содержащего ЛЛЕ- ОЧ (СПЛЛК-ОЧ) элемента 15 второго вида; цепочка однородных членов (цепочка ОЧ) - это СПЛЛК-ОЧ и зависимая цепочка однородных членов (цепочка formed from a single IC LLK of the second type by its heterogeneous transformation (heterogenization). The process of heterogenization of LC LLK (element 15) of the second type can be carried out, as an example, but not limitation, as follows: at the first stage, rows of homogeneous members in the element 15 of the second type are revealed; in the course of identifying rows of homogeneous members, the rows themselves of homogeneous members and the serial numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member are revealed; at the second stage, chains of homogeneous members are revealed for each identified SPLCK containing LLE-OCH (SPLLK-OCH) element 15 of the second type; a chain of homogeneous members (a chain of PF) is a DFLC-PF and a dependent chain of homogeneous members (a chain of
синтаксически связанных СПЛЛК, начиная от первого синтаксического потомка однородных членов (синтаксически зависимой СПЛЛК) и продолжая по цепочке синтаксической зависимости (по синтаксической подчинительной связи) до другой СПЛЛК-ОЧ или до последней ПЛЛК в элементе 15 второго вида; syntactically related SPLCKs, starting from the first syntactic descendant of homogeneous members (syntactically dependent SPLCK) and continuing along the chain of syntactic dependence (according to syntactic subordination) to another SPLCK-OCh or to the last PLCK in element 15 of the second kind;
идентифицированные цепочки 04 классифицируются по факту наличия identified chains 04 are classified based on availability
синтаксического потомка ЛЛЕ в зависимой цепочке 04, который не входит в зависимую цепочку 04; те цепочки 04, которые имеют зависимые цепочки 04 без синтаксического потомка за рамками зависимой цепочки однородных членов считаются крайними цепочками однородных членов (крайними цепочками 04), а те цепочки 04, которые имеют зависимые цепочки 04 с синтаксическим потомком за рамками зависимой цепочки 04 считаются внутренними цепочками однородных членов (внутренними цепочками 04); на третьем этапе выявляют ПЛЛК элемента 15 второго вида, не входящие в цепочки однородных членов (ПЛЛК вне цепочек 04); на четвертом этапе формируют сменные зависимые цепочки (сменные ЗЦ) элемента 15 второго вида; сменная ЗЦ - это основа преобразованных элементов 16, состоящая из одной крайней цепочки 04 и внутренних цепочек 04, если такие внутренние цепочки 04 по цепочке непрерывной синтаксической подчинительной связи имеются между крайней цепочкой 04 и ПЛЛК вне цепочек 04; на пятом этапе формируют гетерогенные СЛЛК (элементы 16); гетерогенная СЛЛК формируется из одной сменной ЗЦ и ПЛЛК вне цепочки 04 (если такие ПЛЛК есть); количество сменных ЗЦ элемента 15 второго вида определяет количество гетерогенных СЛЛК, сформированных от одного элемента 15 второго вида. LLE syntax descendant in dependent chain 04 that is not part of dependent chain 04; those chains 04 that have dependent chains 04 without a syntactic descendant outside the dependent chain of homogeneous members are considered extreme chains of homogeneous members (extreme chains 04), and those chains 04 that have dependent chains 04 with a syntactic descendant outside dependent chain 04 are considered internal chains homogeneous members (inner chains 04); at the third stage, the PLLC of element 15 of the second type is detected that are not included in the chains of homogeneous members (PLCC outside chains 04); at the fourth stage, replaceable dependent chains (replaceable LC) of the element 15 of the second type are formed; interchangeable SC is the basis of the transformed elements 16, consisting of one extreme chain 04 and internal chains 04, if such internal chains 04 along a chain of continuous syntactic subordinate communication are between the extreme chain 04 and PLCC outside chains 04; at the fifth stage, heterogeneous SLLK is formed (elements 16); heterogeneous SLLK is formed from one replaceable SC and PLLC outside chain 04 (if there are such PLCs); the number of replaceable LC elements of the second type 15 determines the number of heterogeneous SLLK formed from one element 15 of the second type.
[0161] Идентификация видов элементов 15 десятой структуры данных СМД в рамках этапа 3051 не изменяет значение 151 элемента 15 и не изменяет  [0161] the Identification of the types of elements 15 of the tenth data structure of the DMD in the framework of step 3051 does not change the value 151 of the element 15 and does not change
порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 (ИС ЛЛК). Идентификацию значения и порядковых номеров ТЭ непреобразованного элемента 16 (СЛЛК) одиннадцатой структуры данных СМД в рамках этапа 3051 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 первого вида десятой структуры данных СМД, идентифицируют как значение 161 непреобразованного элемента 16 (СЛЛК), а порядковые номера 152 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 первого вида, из которого состоит непреобразованный элемент 16, идентифицируют как порядковые номера 162 текстовых элементов, составляющих непреобразованный элемент 16 (СЛЛК). Идентификацию значения и порядковых номеров ТЭ преобразованного элемента 16 (гетерогенной СЛЛК) одиннадцатой структуры данных СМД в рамках этапа 3052 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 второго вида десятой структуры данных СМД, за исключением значений 211 текстовых элементов 21 лингвистического предложения 11, составляющих отдельные части элемента 15 второго вида serial numbers of text elements 21 of the linguistic sentence 11 constituting element 15 (IP LLK). The value and sequence numbers of the TE of the unreformed element 16 (SLC) of the eleventh SMD data structure are identified as part of step 3051 as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting the element 15 of the first type of the tenth SMD data structure are identified as the value 161 of the unreformed element 16 (SLLK), and serial numbers 152 of the mentioned text elements 21 of the linguistic sentence 11, constituting the element 15 of the first kind of which the non-transformed element 16 consists, identify as serial numbers 162 of the text elements constituting the non-transformed element 16 (SLLK). The value and serial numbers of the TE of the transformed element 16 (heterogeneous SLCK) of the eleventh SMD data structure are identified as part of step 3052 as follows: values of 211 text elements 21 of the linguistic sentence 11 constituting element 15 of the second type of the tenth SMD data structure, with the exception of the values of 211 text elements 21 linguistic sentences 11 constituting separate parts of element 15 of the second kind
(СПЛЛК-ОЧ), которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК-ОЧ (синтаксически подчиненные удаленным СПЛЛК-ОЧ сочинительные союзы или знаки препинания), идентифицируют как значение 161 преобразованного элемента 16 (СЛЛК), а порядковые номера 212 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 второго вида шестой структуры данных СМД, за исключением порядковых номеров 212 текстовых элементов 21 лингвистического предложения 11, составляющих отдельные части элемента 15 второго вида (СПЛЛК-ОЧ), которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК-ОЧ (синтаксически подчиненные удаленным СПЛЛК-ОЧ сочинительные союзы или знаки препинания) идентифицируют как порядковые номера 162 текстовых элементов, составляющих преобразованный элемент 16 (гетерогенная СЛЛК). (SPLCK-OCH), which were removed during heterogenization, and signs of communication of remote SPLCK-OCH (syntactically subordinate compound unions or punctuation marks syntactically subordinate to the remote SPLC-OCH), are identified as the value 161 of the transformed element 16 (SLCK), and the serial numbers are 212 text elements 21 linguistic sentences 11 constituting element 15 of the second type of the sixth SMD data structure, with the exception of serial numbers 212 of text elements 21 of linguistic sentences 11 constituting separate parts of element 15 of the second type (SPLC-OCH), which were removed during heterogenization, and signs of communication of remote SPLLK-OCH (syntactic subordinate compound unions or punctuation marks syntactically subordinate to remote SPLLK-OCH) are identified as serial numbers 162 of the text elements making up the transformed element 16 (heterogeneous SLCK).
[0162] Формирование одиннадцатой структуры данных СМД в рамках этапа 3053 производят путем объединения в одной структуре данных,  [0162] The formation of the eleventh SMD data structure in step 3053 is performed by combining in a single data structure,
идентифицированных на этапах 3051 и 3052 элементов 16 одиннадцатой identified in steps 3051 and 3052 elements 16 of the eleventh
структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. Первым из объединяемых элементов одиннадцатой структуры данных СМД является идентифицированный на этапе 3051 элемент 15 первого вида, являющийся непреобразованным элементом 16, то есть СЛЛК 16, SMD data structures, as well as their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below. The first of the combined elements of the eleventh SMD data structure is the first type of element 15 identified in step 3051, which is an untransformed element 16, that is, SLCK 16,
совпадающей с ИС ЛЛК 15 без синтаксической сочинительной связи. Вторым из объединяемых элементов одиннадцатой структуры данных СМД являются преобразованные элементы 16, сформированные на этапе 3052 как множество преобразованных элементов 16, являющихся гетерогенными СЛЛК, coinciding with the IP LLK 15 without syntactic writing connection. The second of the combined elements of the eleventh SMD data structure are transformed elements 16, formed at block 3052 as a plurality of transformed elements 16, which are heterogeneous SLL,
сформированными из элемента 15 второго вида (ИС ЛЛК с синтаксической сочинительной связью) путем гетерогенизации ИС ЛЛК второго вида. formed from an element 15 of the second type (IC LLK with syntactic co-linking) by heterogenization of the IC LLK of the second type.
[0163] Идентификацию лингвистических характеристик ТЭ, составляющих элемент 16 (СЛЛК) одиннадцатой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3041, состоящего из идентификационных данных ТЭ, составляющих элемент 16 (СЛЛК), и получении значений (2131, 2141, 2231, 2151, 2161, 2171) всех частей лингвистических характеристик (213, 214, 223, 215, 216, 217) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 16 (СЛЛК). При этом, как было описано ранее лингвистическими признаками элемента 16 (СЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элемент 16 (СЛЛК). [0163] Identification of the linguistic characteristics of TEs constituting element 16 (SLLK) of the eleventh SMD data structure and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 3041, consisting of identification data of TEs constituting element 16 (SLLK), and obtaining the values (2131, 2141, 2231, 2151, 2161, 2171) of all parts of the linguistic characteristics (213, 214, 223, 215, 216, 217) of the text elements 21 of the linguistic sentence 11 of which element 16 consists (SLLK). Moreover, as previously described, the linguistic features of element 16 (SLLK) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, which make up the element 16 (SLLK).
[0164]Вместе с тем, после завершения описанного ранее этапа 301, в целях обеспечения альтернативного повышения точности последующего поиска в структурированном массиве данных (СМД), альтернативно становится возможным осуществить дальнейшее преобразование СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и их идентификационные данные. При этом специалисту в данной области техники должно быть очевидно, что описанные далее принципы и способы по завершении описанного ранее этапа 301 способа 300 могут осуществляться как одновременно (параллельно) с описанными ранее этапами 301-305 способа 300, так и не одновременно (альтернативно или последовательно, в том числе вне зависимости от порядка следования), а также, что отдельные принципы и способы отдельных описываемых далее этапов могут реализовываться аналогичным образом.  [0164] However, after completing the previously described step 301, in order to provide an alternative increase in the accuracy of the subsequent search in a structured data array (SMD), it is alternatively possible to further transform the SMD containing at least basic linguistic-logical objects ( OLLO) linguistic sentences and their identification data. Moreover, it should be obvious to a person skilled in the art that the principles and methods described below, upon completion of the previously described steps 301 of the method 300, can be carried out both simultaneously (in parallel) with the previously described steps 301-305 of the method 300 and not simultaneously (alternatively or sequentially , including regardless of the order), and also that individual principles and methods of the individual steps described below can be implemented in a similar way.
[0165]На фиг. 38, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 400 преобразования СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО,  [0165] FIG. 38, as an example, but not limitation, depicts a General diagram of the steps of the claimed method 400 for converting SMD containing at least the main linguistic-logical objects (LLL) of a linguistic sentence and LLL identification data,
являющегося исходной структурой данных для рассматриваемого способа 400. Заявленный способ 400 преобразования СМД, содержащего, по меньшей мере,which is the original data structure for the considered method 400. The claimed method 400 for converting SMD containing at least
ОЛЛО лингвистического предложения и их идентификационные данные, характеризуется: выполнением этапа 301 идентификации пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором The LLLO of the linguistic sentence and their identification data is characterized by: performing the identification step 301 of a data structure suitable for transforming containing the LLLF, on which
идентифицируют структуру данных СМД, содержащую элементы упомянутой пригодной для преобразования структуры данных, содержащей ОЛЛО, являющейся исходной структурой данных СМД в рамках рассматриваемого способа 400, причем упомянутые элементы пригодной для преобразования структуры данных представляют собой основные лингво-логические объекты (ОЛЛО) identifying the SMD data structure containing elements of said transformable data structure containing OLLO, which is the original SMD data structure within the framework of the method 400 in question, said elements of the transformable data structure being the main linguistic-logical objects (OLLL)
лингвистического предложения и идентификационные данные ОЛЛО; Linguistic Suggestions and Identity OLLO;
выполнением этапа 402 формирования двенадцатой структуры данных СМД, на котором формируют двенадцатую структуру данных СМД, являющуюся первой структурой данных СМД для рассматриваемого способа 400, содержащую элементы упомянутой двенадцатой структуры данных СМД, причем упомянутые элементы двенадцатой структуры данных СМД представляют собой основные лингво - логические элементы (ОЛЛЭ) лингвистического предложения сформированные путем разделения ОЛЛО на семантические части ОЛЛО, а также представляют собой идентификационные данные ОЛЛЭ, представляющие собой для каждого ОЛЛЭ, в качестве примера, но не ограничения: значение ОЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих ОЛЛЭ; выполнением этапа 403 формирования тринадцатой структуры данных СМД, на котором формируют тринадцатую структуру данных СМД, являющуюся итоговой структурой данных СМД для рассматриваемого способа 400, содержащую элементы упомянутой тринадцатой структуры данных СМД, причем упомянутые элементы тринадцатой структуры данных СМД представляют собой исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения, the execution of step 402 of the formation of the twelfth data structure of the DMD, which forms the twelfth data structure of the SMD, which is the first data structure of the SMD for the method 400 under consideration, containing elements said twelfth SMD data structure, wherein said elements of the twelfth SMD data structure are the main linguistic logical elements (ALLE) of the linguistic sentence formed by dividing the ALLO into the semantic parts of ALLO, and also represent the ALLE identification data, representing for each ALLE, as an example, but not limitation: the meaning of ALLE and the ordinal (ordinal) number (s) of TE of the linguistic sentence that make up ALLE; performing step 403 of generating the thirteenth SMD data structure, which forms the thirteenth SMD data structure, which is the final SMD data structure for the method 400 under consideration, containing elements of the thirteenth SMD data structure, said elements of the thirteenth SMD data structure being the original linguistic-logical elements ( ILLE) linguistic sentences,
сформированные путем разделения ОЛЛЭ на семантические части ОЛЛЭ и формирования из них исходных элементов, а также представляют собой formed by dividing ALLE into semantic parts of ALLE and forming the initial elements from them, and also represent
идентификационные данные ИЛЛЭ, представляющие собой для каждого ИЛЛЭ, в качестве примера, но не ограничения: значение ИЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего ILLE identification data, representing for each ILLE, as an example, but not limitation: the meaning of ILLE and the serial number (s) of the TE of the linguistic sentence constituting
(составляющих) ИЛЛЭ. (constituents) ILLE.
[0166] Как было указано ранее со ссылкой на фиг. 26, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 301 идентификации структуры данных СМД, на котором идентифицируют структуру данных СМД, являющуюся исходной структурой данных для рассматриваемого способа 400, элементы 91 которого представляют собой ОЛЛО лингвистического предложения 11, а также идентификационные данные элементов 91, представляющие собой для каждого элемента 91, в качестве примера, но не ограничения, значение 911 элемента91 и порядковый (порядковые) номер (номера) 912 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 91. Описанный таким образом со ссылкой на фиг. 26 процесс далее подробно не описывается. По результатам выполнения этапа 301 идентифицируют структуру данных,  [0166] As indicated previously with reference to FIG. 26, by way of example, but not limitation, a general flowchart is shown for performing the SMD data structure identification step 301, which identifies the SMD data structure, which is the original data structure for the method 400 in question, whose elements 91 are the OLLO of the linguistic sentence 11, as well as identification the data of elements 91, representing, for each element 91, as an example, but not limitation, the value of 911 element91 and the serial number (s) of 912 TE linguistic sentences 1 1 constituting the element (s) 91. Described in this way with reference to FIG. 26, the process is not further described in detail. Based on the results of step 301, a data structure is identified,
показанную на фиг. 27, состав которой, описанный со ссылкой на фиг. 27, соответственно далее подробно не описывается. shown in FIG. 27, the composition of which is described with reference to FIG. 27, respectively, is not further described in detail.
[0167]На фиг. 39, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 402 формирования двенадцатой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 400. Этап 402 характеризуется: выполнением этапа 4021 формирования значений 2181 седьмой части лингвистических характеристик 218 элементов 21, составляющих элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО на котором формирует значения 2181 седьмой части лингвистических [0167] FIG. 39, as an example, but not limitation, depicts a General diagram of the steps of step 402 of the formation of the twelfth data structure SMD, which is the first data structure for the method 400 under consideration. Step 402 is characterized by: performing step 4021 of generating values of 2181 of the seventh of the linguistic characteristics of 218 elements 21 constituting elements of 91 suitable for transforming a data structure containing ALLO which generates values of 2181 of the seventh of the linguistic
характеристик 218 элементов 21, составляющих элементы 91 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3041, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021; characteristics 218 of the elements 21 constituting the elements 91 and inputting the received information into the BDLP of the text elements 21 of the linguistic sentence 11 formed in step 3041, forming as a result the BDLP of the text elements 21 of the linguistic sentence 11 formed in the step 4021;
выполнением этапа 4022 формирования семантических частей элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором формируют первую и последующие (вторую, третью и так далее по порядку) семантические части ОЛЛО, проясняющие смысловую структуру ОЛЛО; performing step 4022 of forming the semantic parts of the elements 91 of a transformable data structure containing ALLO, on which the first and subsequent (second, third, and so on) semantic parts of ALLO are formed, clarifying the semantic structure of ALLO;
выполнением этапа 4023 формирования двенадцатой структуры данных СМД на котором идентифицируют элементы 17 двенадцатой структуры данных СМД, а также идентификационные данные элементов 17, представляющие собой для каждого элемента 17, в качестве примера, но не ограничения, значение 171 элемента 17 двенадцатой структуры данных СМД и порядковый (порядковые) номер (номера) 172 ТЭ лингвистического предложения 11, составляющего performing step 4023 of generating the twelfth data structure of the DMD on which the elements 17 of the twelfth data structure of the SMD are identified, as well as the identification data of the elements 17, which for each element 17, by way of example, but not limitation, the value 171 of the element 17 of the twelfth data structure of the SMD and ordinal (ordinal) number (s) 172 TE of linguistic sentence 11 constituting
(составляющих) элемент 17, и формируют двенадцатую структуру данных СМД. (component) element 17, and form the twelfth data structure of the SMD.
[0168]На фиг. 40, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 4021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, формируемой в рамках этапа 4021. БДЛП, формируемая в рамках этапа 4021, отличается от БДЛП, формируемой в рамках этапа 3021, наличием значений 2181 седьмой части лингвистических характеристик 218, указывающих главное слово семантической части элемента 91 (ОЛЛО). Причина выявления главного слова семантической части ОЛЛО состоит в том, что, используя выявленное главное слово семантической части ОЛЛО и  [0168] In FIG. 40, by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated as part of step 4021 is shown, which is BDLP of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing OLL formed within step 4021. The BDLP generated in step 4021 differs from the BDLP generated in step 3021 in the presence of values 2181 of the seventh of the linguistic characteristics 218 indicating the main word of the semantic part of element 91 (ALLO). The reason for revealing the main word of the semantic part of ALLO is that, using the identified main word of the semantic part of ALLO and
идентифицированные ранее синтаксические связи между словами (ЛЛЕ) в ОЛЛО, можно разделить ОЛЛО на отдельные семантические части. Семантические части ОЛЛО проясняют смысловую структуру ОЛЛО, в которой отдельные части выполняют свои ограниченные смысловые роли в ОЛЛО. Семантические части в ОЛЛО позволяют выделить в ОЛЛО интегрированные в нем доминирующую и уточняющие сущности окружающего мира (объекты и действия) для корректной идентификации их смысловых ролей и, как следствие, смысла ОЛЛО. Выделение отдельных семантических частей в ОЛЛО позволяет установить их уникальные логические роли в ОЛЛО, что позволяет хранить эти части раздельно без потери их смысловой логической роли в предложении. Такое раздельное хранение позволяет осуществлять быстрый и точный поиск семантических частей ОЛЛО, а также отдельно от других частей лингвистического предложения производить разного рода их анализ и обработку. previously identified syntactic relationships between words (LLE) in OLLL, you can divide OLLL into separate semantic parts. The semantic parts of OLLO clarify the semantic structure of OLLO, in which individual parts fulfill their limited semantic roles in OLLO. Semantic parts in OLLO make it possible to distinguish in OLLO integrated in it the dominant and clarifying entities of the surrounding world (objects and actions) for the correct identification of their semantic roles and, as a consequence, the meaning of OLLO. The allocation of individual semantic parts in OLLO allows you to establish their unique logical roles in OLLO, which allows you to store these parts separately without losing their semantic logical role in the sentence. Such separate storage allows you to quickly and accurately search for the semantic parts of OLLO, as well as separately from other parts of the linguistic sentence, to analyze and process them differently.
[0169]Формирование седьмой части лингвистических характеристик 218 и их значений 2181 в ходе этапа 4021 производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов 21, входящих в элементы 91. В ходе такого анализа у всех текстовых элементов 21, составляющих элемент 91 проверяют наличие признака главного слова  [0169] The formation of the seventh of the linguistic characteristics 218 and their values 2181 during step 4021 is carried out on the basis of a comprehensive analysis of the values of the linguistic characteristics of the text elements 21 included in the elements 91. During this analysis, all text elements 21 constituting the element 91 check for the presence of a characteristic the main word
семантической части элемента 91. Признаком главного слова семантической части элемента 91 может быть, в качестве примера, но не ограничения, наличие у текстового элемента (ТЭ) следующих значений лингвистических характеристик:the semantic part of element 91. A sign of the main word of the semantic part of element 91 can be, as an example, but not limitation, the presence of the following values of linguistic characteristics of a text element (TE):
ТЭ является главным словом ОЛЛО или ТЭ имеет зависимый ТЭ в форме предлога. Предварительно могут быть заданы иные собственные критерии идентификации синтаксической части ОЛЛО. Например, не ограничиваясь, может быть уточнен перечень частей речи, которые указывают на главное слово синтаксической части ОЛЛО. При наличии у ТЭ указанных значений лингвистических характеристик формируют соответствующие значения 2181 седьмой части лингвистических характеристик 218 - «главное слово семантической части ОЛЛО». TE is the main word of OLLO or TE has a dependent TE in the form of an excuse. Other own criteria for identifying the syntactic part of the OLLO can be preliminarily set. For example, but not limited to, a list of parts of speech that indicate the main word of the syntactic part of the OLLO can be refined. If TE has the indicated values of linguistic characteristics, the corresponding values of 2181 of the seventh part of linguistic characteristics 218 are formed - “the main word of the semantic part of OLLO”.
[0170]Сформированные по итогам этапа 4021 значения 2181 (главное слово семантической части элемента 91) седьмой части лингвистических характеристик 218 элементов 21, составляющих ОЛЛО 91 пригодной для преобразования структуры данных, содержащей ОЛЛО вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021. При этом все части (211, 214, 232, 215, 216 и 218) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2321, 2151, 2161 и 2181) формируют уникальные лингвистические признаки элементов 91 для альтернативного способа повышения точности поиска в структурированном массиве данных. [0170] The values 2181 (the main word of the semantic part of element 91) of the seventh part of the linguistic characteristics 218 of the elements 21 constituting the OLLO 91 suitable for transforming the data structure containing the OLLO are entered into the BDLP of the text elements 21 of the linguistic sentence 11 generated within the framework of step 4021 of step 2031, forming as a result BDLP of the text elements 21 of the linguistic sentence 11, formed as part of step 4021. Moreover, all parts (211, 214, 232, 215, 216 and 218) of the linguistic characteristics of the text elements 21 of the linguistic Proposals 11 and their meanings (2111, 2141, 2321, 2151, 2161 and 2181) form unique linguistic features of elements 91 for alternative ways to improve search accuracy in a structured data array.
[0171]На фиг. 41, в качестве примера, но не ограничения, изображена общая структура сформированной двенадцатой структуры данных СМД являющаяся первой для настоящего способа преобразования 400. Двенадцатая структура данных СМД представляет собой СМД, содержащий элементы 17 двенадцатой структуры данных СМД, которые представляют собой основные лингво-логические элементы (ОЛЛЭ) лингвистического предложения 11 и идентификационные данные ОЛЛЭ, представляющие собой, в качестве примера, но не ограничения, значения 171 элементов 17 двенадцатой структуры данных и порядковые номера 172 текстовых элементов, составляющих ОЛЛЭ. У ОЛЛЭ 12 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 12, в качестве примера, но не ограничения, могут именоваться как «ОЛЛЭ п.т», где n > 1 указывает на порядковый номер ОЛЛО в лингвистическом предложении, a m > 1) указывает на синтаксический уровень ОЛЛЭ в ОЛЛО, начиная с первого. ОЛЛЭ предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, ОЛЛЭ - это синтаксическая единица вида  [0171] FIG. 41, by way of example, but not limitation, the general structure of the generated twelfth SMD data structure is shown, which is the first for the present conversion method 400. The twelfth SMD data structure is a SMD containing elements 17 of the twelfth SMD data structure, which are the main linguistic logical elements (ALLE) of the linguistic sentence 11 and the ALLE identification data, which are, by way of example, but not limitation, the values of 171 elements 17 of the twelfth data structure and oryadkovye number 172 text elements constituting OLLE. OLLE 12 of the linguistic sentence 11 lacks unique names characterizing them, which have practical use. In the data structure, elements 12, as an example, but not limitation, can be referred to as “ALLE pt,” where n> 1 indicates the serial number of the ALLO in the linguistic sentence, am> 1) indicates the syntactic level of ALLE in the ALLO, starting from the first. The OLLE of Proposition 11 is a boundary entity between linguistics and logic. From a linguistic point of view, ALLE is a syntactic unit of the form
«синтаксическая конструкция», сформированная из ОЛЛО 91 путем выделения в ОЛЛО 91 отдельных синтаксических частей по признаку наличия главных слов синтаксических частей в ОЛЛО 91. Упомянутые главные слова синтаксической части ОЛЛО 91 представляют собой такие части речи как существительное, местоимение или глагол (в любой грамматической форме), которые либо являются синтаксически главным словом ОЛЛО 91, либо содержат прямого синтаксического потомка (слово, с которым имеется прямая синтаксическая подчинительная связь) с синтаксической ролью «предлог». Предварительно могут быть заданы иные критерии идентификации синтаксической части ОЛЛО 91. Например, не A “syntactic structure” formed from ALLO 91 by highlighting in OLO 91 individual syntactic parts based on the presence of the main words of the syntactic parts in ALLO 91. The main words mentioned in the syntactic part of ALLO 91 are such parts of speech as a noun, pronoun or verb (in any grammatical form), which are either syntactically the main word of OLLO 91, or contain a direct syntactic descendant (a word with which there is a direct syntactic subordinate relationship) with a syntactic role "Pretext". Other criteria for identifying the syntactic part of OLLO 91 can be preliminarily set. For example, not
ограничиваясь, возможно задать критерии в виде конкретного перечня предлогов, наличие которых указывают на главное слово синтаксической части ОЛЛО 91. С точки зрения синтаксиса ОЛЛЭ 17 - это слова и особые словосочетания внутри ОЛЛО 91. В зависимости от сложности лингвистической структуры ОЛЛО 91 в нем можно выделить один или несколько ОЛЛЭ 17. С логической точки зрения, ОЛЛЭ 17 - это логическая сущность, являющаяся логически отделимой частью элемента простого суждения. При этом такие логически отделимые части по своей структуре и логической роли ничем не отличаются от ОЛЛО 91 по той причине, что, так же, как и ОЛЛО 91, они представляют мыслимый (семантический) образ некого предмета или действия окружающего мира). Причина существования By limiting ourselves, it is possible to set criteria in the form of a specific list of prepositions, the presence of which indicates the main word of the syntactic part of ALLO 91. From the point of view of syntax, ALL 17 are words and special phrases inside ALLO 91. Depending on the complexity of the linguistic structure, ALLO 91 can be distinguished in it one or more ALLE 17. From a logical point of view, ALLE 17 is a logical entity that is a logically separable part of an element of simple judgment. Moreover, such logically separable parts in their structure and logical role are no different from OLLO 91 for the reason that, in the same way, like OLLO 91, they represent a conceivable (semantic) image of a certain object or action of the surrounding world). Reason for existence
семантических частей образа ОЛЛО 91 в том, что не всякий образ ОЛЛО 91 можно лингвистически реализовать, используя лишь один составной элемент (группу слов без предлога между словами). Например, не ограничиваясь, мыслимый образ ОЛЛО 91 о праве на что-либо (например, не ограничиваясь, «право потребителя на возврат товара») невозможно реализовать одним составным элементом (одной группой слов без предлога между словами)). В упомянутом примере лишь два составных элемента - первый - «право потребителя», и второй - «возврат товара», - формируют мыслимый образ элемента простого суждения. Составной элемент ОЛЛО 91 (семантическая часть ОЛЛО) именуется термином ОЛЛО 91. С The semantic parts of the image of ALLO 91 is that not every image of ALLO 91 can be linguistically implemented using only one composite element (a group of words without a preposition between words). For example, without limitation, the imaginary image of OLLO 91 about the right to something (for example, without limitation, “the consumer's right to return the goods”) cannot be realized with one constituent element (one group of words without an excuse between words)). In the mentioned example, only two constituent elements - the first - “consumer right”, and the second - “return of goods” - form a conceivable image of an element of simple judgment. The constituent element of ALLO 91 (the semantic part of ALLO) is referred to as the term ALLO 91. C
семантической точки зрения термины ОЛЛО 91, формирующие ОЛЛО 91 the semantic point of view the terms OLLO 91, forming OLLO 91
неодинаковы, то есть имеют различные семантические роли. Синтаксически главные термины ОЛЛО 91 имеют максимальную семантическую роль, то есть являются терминами ОЛЛО 91 первой семантической части. Термин ОЛЛО 91 первой семантической части определяет смысловой вектор ОЛЛО 91. Например, не ограничиваясь, в примере «право потребителя на возврат товара» смысловую суть образа ОЛЛО 91 формирует именно составной элемент «право потребителя», а не составной элемент «возврат товара». Термины ОЛЛО второй и последующих семантических частей, являются синтаксически зависимыми терминами ОЛЛО 91, и их присутствие в ОЛЛО 91 необходимо только для уточнения мыслимого образа ОЛЛО 91. Чем сложнее мыслимый образ ОЛЛО 91, тем большего количества терминов ОЛЛО 91 может потребовать уточнение его мыслимого образа. are not the same, that is, they have different semantic roles. Syntactically, the main terms ALLO 91 have a maximum semantic role, that is, they are the terms ALLO 91 of the first semantic part. The term OLLO 91 of the first semantic part defines the semantic vector OLLO 91. For example, without limitation, in the example “consumer right to return the goods”, the semantic essence of the OLLO 91 image is formed by the constituent element “consumer right” rather than the constituent element “return of goods”. The terms OLLO of the second and subsequent semantic parts are syntactically dependent terms OLLO 91, and their presence in OLLO 91 is necessary only to clarify the imaginary image of OLLO 91. The more complex the imaginary image of OLLO 91 is, the more terms OLLO 91 may require to clarify its imaginary image.
Структурирование терминов ОЛЛО 91 как семантических частей ОЛЛО позволяет правильно воспринимать семантические роли отдельных терминов в ОЛЛО 91. Разделение таким образом ОЛЛО 91 позволяет производить интеллектуальный поиск информации с повышенной точностью, так как при наличии более структурированного (по логической роли слов) массива данных возможно более точное описание искомых объектов. В результате машинной обработки такого массива данных повышается точность поиска и сокращается время поиска, Structuring the terms OLLO 91 as the semantic parts of OLLO allows you to correctly perceive the semantic roles of individual terms in OLLO 91. Separating in this way OLLO 91 allows you to intelligently search for information with increased accuracy, since if there is a more structured (by the logical role of words) data array, a more accurate description of the desired objects. As a result of machine processing of such an array of data, the accuracy of the search is increased and the search time is reduced,
[0172] Формирование частей (семантических частей) элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, на этапе 4022 производят путем выполнения следующих действий: на первом этапе от идентифицированного главного слова семантической части ОЛЛО 91 идентифицируют все синтаксически подчиненные слова, вплоть до слова, которое само является главным словом семантической части ОЛЛО 91, но не включая данное слово; на втором этапе главное слово семантической части ОЛЛО 91 и все упомянутые синтаксически подчиненные слова, в том числе последовательно подчиненные, формируют семантическую часть ОЛЛО 91. Порядковый номер семантической части в ОЛЛО, указывает на ее семантическую роль в ОЛЛО и формируется в соответствии с порядковым номером текстового элемента (ТЭ) главного слова семантической части ОЛЛО 91. Семантическая часть ОЛЛО 91 с наименьшим порядковым номером ТЭ главного слова является первой [0172] The formation of the parts (semantic parts) of the elements 91 suitable for transforming the data structure containing OLLO, at step 4022, is performed by performing the following steps: at the first stage, from the identified main word of the semantic part of the ALLO 91 identify all syntactically subordinate words, up to the word, which itself is the main word of the semantic part of OLLO 91, but not including this word; at the second stage, the main word of the semantic part of ALLO 91 and all the syntactically subordinate words mentioned, including successively subordinate, form the semantic part of ALLO 91. The serial number of the semantic part in ALLO indicates its semantic role in ALLO and is formed in accordance with the serial number of the text element (TE) of the main word of the semantic part of OLLO 91. The semantic part of OLLO 91 with the lowest sequence number TE of the main word is the first
семантической частью ОЛЛО 91. Семантическая часть ОЛЛО 91, имеющая the semantic part of OLLO 91. The semantic part of OLLO 91, having
ближайший к нему номер ТЭ главного слова семантической части является второй семантической частью ОЛЛО 91, и так далее. Порядковый номер ОЛЛЭ указывается в наименовании ОЛЛЭ, например, но не ограничиваясь - «ОЛЛЭ 1.2». Такое наименование элемента 17 говорит о том, что он является второй семантической частью в первом ОЛЛО (по синтаксическому уровню «.2»). Идентификацию элементов 17 двенадцатой структуры данных СМД в ходе этапа 4023 производят на основе этапа 4022 формирования семантических частей элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО. Все сформированные семантические части элементов 91 отождествляют с элементами 17 двенадцатой структуры данных СМД. the TE number closest to it of the main word of the semantic part is the second semantic part of OLLO 91, and so on. The serial number of ALLE is indicated in the name of ALLE, for example, but not limited to - "ALLE 1.2". Such a name for element 17 suggests that it is the second semantic part in the first OLLO (according to the syntactic level “.2”). The identification of elements 17 of the twelfth SMD data structure during step 4023 is carried out on the basis of step 4022 of forming the semantic parts of elements 91 of a transformable data structure containing OLLO suitable for transformation. All the formed semantic parts of elements 91 are identified with elements 17 of the twelfth data structure of the DMD.
[0173]Идентификацию значения и порядковых номеров ТЭ элемента 17 двенадцатой структуры данных СМД, производят в рамках этапа 4023 путем отождествления значения 171 элемента 17 со значениями 911  [0173] Identification of the value and serial numbers of the TE of element 17 of the twelfth SMD data structure is performed as part of step 4023 by identifying the value 171 of element 17 with the values of 911
идентифицированной семантической части элемента 91, а порядковых номеров 172 текстовых элементов 21, составляющих элемент 17 путем отождествления с порядковыми номерами 912 текстовых элементов, составляющих the identified semantic part of element 91, and serial numbers 172 of text elements 21 constituting element 17 by identification with serial numbers 912 of text elements constituting
идентифицированную семантическую часть элемента 91. identified semantic part of element 91.
[0174]Формирование двенадцатой структуры данных СМД в ходе этапа 4023 производят путем объединения в одной структуре данных элементов 17  [0174] The formation of the twelfth SMD data structure during step 4023 is performed by combining the elements 17 in one data structure
двенадцатой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. the twelfth data structure of the DMD and their identification data according to the principles and methods known from the prior art, which, respectively, are not described in further detail below.
[0175]Идентификацию лингвистических характеристик ТЭ, составляющих элементы 17 (ОЛЛЭ) двенадцатой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 4021, состоящего из идентификационных данных ТЭ, составляющих элемент 17 (ОЛЛЭ), и получении значений (2131, 2141, 2231; 2151, 2161, 2181) всех частей лингвистических характеристик (213, 214, 223, 215, 216,218) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 17 (ОЛЛЭ). При этом, как было описано ранее лингвистическими признаками элементов 17 (ОЛЛЭ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 17 (ОЛЛЭ). [0175] Identification of the linguistic characteristics of FCs constituting the elements 17 (ALLE) of the twelfth structure of the SMD data and their values for Necessities are made by organizing a request to the BDLP, which is formed as part of step 4021, consisting of the identification data of the fuel cells that make up element 17 (ALLE), and obtaining the values (2131, 2141, 2231; 2151, 2161, 2181) of all parts of the linguistic characteristics (213, 214, 223, 215, 216,218) of text elements 21 of the linguistic sentence 11 of which element 17 (ALLE) consists. Moreover, as previously described, the linguistic features of the elements 17 (ALLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 17 (ALLE) consist.
[0176]На фиг. 42, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 403 формирования тринадцатой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 400. Этап 403 характеризуется: выполнением этапа 4031 формирования значений 2191 восьмой части лингвистических характеристик 219 элементов 21, составляющих элементы 17 двенадцатой структуры данных СМД, на котором формируют значения 2191 восьмой части лингвистических характеристик 219 элементов 21, составляющих элементы 91, и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021, формируя в итоге БДЛП текстовых элементов 21  [0176] In FIG. 42, by way of example, but not limitation, a general flowchart of the steps of generating the thirteenth SMD data structure 403 is shown, which is the second data structure for the method 400 under consideration. Step 403 is characterized by: performing step 4031 of generating values of 2191 of the eighth of the linguistic characteristics of 219 elements 21, constituent elements 17 of the twelfth structure of the SMD data, on which the values of 2191 of the eighth of the linguistic characteristics of the 219 elements 21 constituting the elements 91 are formed and the resulting information is introduced I BDLP text elements 21 linguistic Proposition 11, formed in 4021 under the stage, forming eventually BDLP text elements 21
лингвистического предложения 11, формируемую в рамках этапа 4031; linguistic sentence 11, formed in the framework of step 4031;
выполнением этапа 4032 формирования семантических частей элементов 17 двенадцатой структуры данных СМД, на котором формируют первую и performing step 4032 of the formation of the semantic parts of the elements 17 of the twelfth data structure of the DMD, on which the first and
последующие (вторую, третью и так далее по порядку) семантические части ОЛЛЭ, проясняющие смысловую структуру ОЛЛЭ; выполнением этапа 4033 subsequent (second, third, and so on, in order) semantic parts of ALLE, clarifying the semantic structure of ALLE; step 4033
формирования элементов 18 тринадцатой структуры данных СМД, на котором формируют элементы 18 тринадцатой структуры данных СМД и the formation of elements 18 of the thirteenth data structure of the SMD, on which form the elements 18 of the thirteenth data structure of the SMD and
идентификационные данные элементов 18, представляющие собой, в качестве примера, но не ограничения, значения 181 элементов 18 тринадцатой структуры данных СМД, порядковые номера 182 ТЭ лингвистического предложения 11, составляющих элементы 18, а также идентифицируют первые и вторые виды элементов 18 тринадцатой структуры данных СМД и формируют тринадцатую структуру данных СМД. the identification data of the elements 18, which, by way of example, but not limitation, represent the values of 181 elements 18 of the thirteenth SMD data structure, serial numbers 182 of the TE of the linguistic sentence 11 constituting the elements 18, and also identify the first and second types of elements 18 of the thirteenth SMD data structure and form the thirteenth SMD data structure.
[0177]На фиг. 43, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 4031 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 17 двенадцатой структуры данных СМД. БДЛП, формируемая в рамках этапа 4031, отличается от БДЛП, формируемой в рамках этапа 4021, наличием значений 2191 восьмой части лингвистических [0177] FIG. 43, by way of example, but not limitation, the general structure of the linguistic database formed as part of step 4031 is depicted attributes (BDLP), which is BDLP of text elements 21 of sentence 11 contained in elements 17 of the twelfth data structure of the DMD. The BDLP generated in step 4031 differs from the BDLP formed in step 4021 in the presence of 2191 values of the eighth of the linguistic
характеристик 219, указывающих главное слово семантической части элемента 17 (ОЛЛЭ). Причина выявления главного слова семантической части ОЛЛЭ состоит в том, что, используя выявленное главное слово семантической части ОЛЛЭ и идентифицированные ранее синтаксические связи между словами (ЛЛЕ) в ОЛЛЭ можно разделить ОЛЛЭ на отдельные семантические части. Семантические части ОЛЛЭ проясняют смысловую структуру ОЛЛЭ, в которой отдельные части выполняют свои ограниченные смысловые роли в ОЛЛЭ. Семантические части в ОЛЛЭ позволяют выделить в ОЛЛЭ интегрированные в нем доминирующую и уточняющие сущности окружающего мира (объекты и действия) для корректной идентификации их смысловых ролей и в итоге смысла ОЛЛЭ. Выделение отдельных семантических частей в ОЛЛЭ позволяет установить их уникальные логические роли в ОЛЛЭ, что позволяет хранить эти части раздельно без потери их смысловой логической роли в предложении. Такое раздельное хранение позволяет characteristics 219 indicating the main word of the semantic part of element 17 (ALLE). The reason for revealing the main word of the semantic part of ALLE is that, using the identified main word of the semantic part of ALLE and the previously syntactic links between words (LLE) in ALLE, it is possible to divide ALLE into separate semantic parts. The semantic parts of ALLE clarify the semantic structure of ALLE, in which the individual parts fulfill their limited semantic roles in ALLE. The semantic parts in ALLE allow us to distinguish in ALLE integrated into it the dominant and clarifying entities of the surrounding world (objects and actions) for the correct identification of their semantic roles and, as a result, the meaning of ALLE. The allocation of individual semantic parts in ALLE allows you to establish their unique logical roles in ALLE, which allows you to store these parts separately without losing their semantic logical role in the sentence. This separate storage allows
осуществлять быстрый и точный поиск семантических частей ОЛЛЭ, а также отдельно от других частей лингвистического предложения производить разного рода их анализ и обработку. carry out a quick and accurate search for the semantic parts of ALLE, as well as separately from other parts of the linguistic sentence, to carry out their various analysis and processing.
[0178]Формирование восьмой части лингвистических характеристик 219 и их значений 2191 в ходе этапа 4031 производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов 21, входящих в элементы 17. В ходе такого анализа у всех текстовых элементов 21, составляющих элемент 17 проверяют наличие признака главного слова  [0178] The formation of the eighth of the linguistic characteristics 219 and their values 2191 during step 4031 is carried out on the basis of a comprehensive analysis of the values of the linguistic characteristics of the text elements 21 included in elements 17. During this analysis, all text elements 21 constituting element 17 check for the presence of a characteristic the main word
семантической части элемента 17. Признаком главного слова семантической части элемента 17 может быть, в качестве примера, но не ограничения, наличие у текстового элемента (ТЭ) следующих значений лингвистических характеристик:the semantic part of the element 17. A sign of the main word of the semantic part of the element 17 may be, as an example, but not limitation, the presence of a text element (TE) the following values of linguistic characteristics:
ТЭ является главным словом ОЛЛЭ или ТЭ имеет форму существительного, местоимения или глагола (в любой грамматической форме). Предварительно могут быть заданы иные собственные критерии идентификации синтаксической части ОЛЛЭ. Например, не ограничиваясь, может быть уточнен перечень частей речи, которые указывают на главное слово синтаксической части ОЛЛЭ. При наличии у ТЭ указанных значений лингвистических характеристик формируют соответствующие значения 2191 восьмой части лингвистических характеристик 219 - «главное слово семантической части ОЛЛЭ». TE is the main word of ALLE or TE has the form of a noun, pronoun or verb (in any grammatical form). Other own criteria for identifying the syntactic part of ALLE can be preliminarily set. For example, without limitation, the list of parts of speech that indicate the main word of the syntactic part of ALLE can be clarified. If the TE indicated values of linguistic characteristics are formed the corresponding values of 2191 of the eighth of the linguistic characteristics 219 are “the main word of the semantic part of ALLE”.
[0179]Сформированные по итогам этапа 4031 значения 2191 (главное слово семантической части элемента 17) восьмой части лингвистических характеристик 219 элементов 21, составляющих ОЛЛЭ 17 двенадцатой структуры данных СМД вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4031. При этом все части (211, 214, 232, 215, 216, 218, 219) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2321, 2151, 2161, 2181, 2191) формируют уникальные лингвистические признаки элементов 17 для альтернативного способа повышения точности поиска в структурированном массиве данных.  [0179] The values 2191 (the main word of the semantic part of element 17) of the eighth part of the linguistic characteristics 219 of the elements 21 constituting the OLLE 17 of the twelfth data structure of the SMD are generated in the LLLB of the text elements 21 of the linguistic sentence 11 generated in step 4021, forming as a result, the BDLP of the text elements 21 of the linguistic sentence 11, formed in the framework of step 4031. Moreover, all parts (211, 214, 232, 215, 216, 218, 219) of the linguistic characteristics of the text elements 21 of the linguistic sentence 11 and and values (2111, 2141, 2321, 2151, 2161, 2181, 2191) form features unique linguistic elements 17 for an alternative method of increasing search accuracy in a structured dataset.
[0180]На фиг. 44, в качестве примера, но не ограничения, изображена общая структура сформированной тринадцатой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 400. Тринадцатая структура данных СМД представляет собой СМД, содержащий элементы 18 первого и второго вида тринадцатой структуры данных СМД, которые представляют собой исходные лингво-логические элементы (ИЛЛЭ)  [0180] FIG. 44, by way of example, but not limitation, the general structure of the generated thirteenth SMD data structure is shown, which is the second SMD data structure for the present conversion method 400. The thirteenth SMD data structure is a SMD containing elements 18 of the first and second types of the thirteenth SMD data structure, which are the original linguistic logic elements (ILE)
лингвистического предложения 11 и идентификационные данные ИЛЛЭ, представляющие собой для каждого ИЛЛЭ, в качестве примера, но не ограничения: значение 181 элемента 18 шестой структуры данных СМД, порядковый linguistic sentence 11 and the ILLE identification data, which are for each ILLE, as an example, but not limitation: the value of 181 element 18 of the sixth SMD data structure, ordinal
(порядковые) номер (номера) 182 ТЭ лингвистического предложения 11, составляющих элементы 18. У ИЛЛЭ 18 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 18, в качестве примера, но не ограничения, могут именоваться как «ИЛЛЭ n.m.k», где n > 1 указывает на порядковый номер ОЛЛО в лингвистическом предложении, a m > 1 указывает на синтаксический уровень ОЛЛЭ в ОЛЛО, начиная с первого, a k > 1 указывает на синтаксический уровень ИЛЛЭ в ОЛЛЭ, начиная с первого. ИЛЛЭ 18 предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения ИЛЛЭ 18 - это первичная синтаксическая единица, являющаяся словом. С логической точки зрения ИЛЛЭ 18 - это логическая сущность, являющаяся логически отделимой частью термина элемента простого суждения (термина ОЛЛО). При этом такие логически отделимые части по своей структуре и логической роли ничем не отличаются от ОЛЛЭ 17 по той причине, что так же, как и ОЛЛЭ 17 они представляют собой мыслимый (семантический) образ о некоем предмете или действии окружающего мира). Причина существования синтаксических частей ОЛЛЭ 17 в том, что не всякий мыслимый образ ОЛЛЭ 17 можно представить, используя лишь один «исходный элемент» (слово, (serial) number (s) 182 TE of the linguistic sentence 11 constituting the elements 18. ILLE 18 of the linguistic sentence 11 does not have unique names describing them that have practical use. In the data structure, elements 18, by way of example, but not limitation, can be referred to as "ILLE nmk", where n> 1 indicates the sequence number of the ALLO in the linguistic sentence, am> 1 indicates the syntactic level of ALLE in the ALLO, starting from the first, ak> 1 indicates the syntactic level of ILLE in ALLE, starting with the first. ILLE 18 of Proposition 11 is a boundary entity between linguistics and logic. From a linguistic point of view, ILLE 18 is the primary syntactic unit that is a word. From a logical point of view, ILLE 18 is a logical entity that is a logically separable part of the term element of a simple judgments (the term ЛОLLO). Moreover, such logically separable parts in their structure and logical role are no different from ALLE 17 for the reason that, like ALLE 17, they represent a conceivable (semantic) image of a certain object or action of the surrounding world). The reason for the existence of the syntactic parts of ALLE 17 is that not every conceivable image of ALLE 17 can be represented using only one “source element” (a word,
выражающее объект или действие). Например, не ограничиваясь, мыслимый образ ОЛЛЭ 17 о правах кого-либо, например, не ограничиваясь, «права потребителя», невозможно реализовать одним исходным элементом. В упомянутом примере лишь два исходных элемента - первый - «права», и второй - «потребителя», - формируют мыслимый образ термина элемента простого суждения (термина ОЛЛО). Исходный элемент ОЛЛЭ 17 именуется понятием термина ОЛЛО (ПТ ОЛЛО) или элементов 18 (ИЛЛЭ). С семантической точки зрения ПТ ОЛЛО (ИЛЛЭ 18), формирующие термин ОЛЛО (ОЛЛЭ 17) неравнозначны, то есть имеют различные семантические роли. Синтаксически главные ПТ ОЛЛО имеют максимальную семантическую роль, то есть являются ПТ ОЛЛО первой семантической части. ПТ ОЛЛО первой expressing an object or action). For example, without limitation, the conceivable image of OLLE 17 about the rights of someone, for example, without limitation, “consumer rights”, cannot be realized with one initial element. In the mentioned example, only two initial elements - the first one is “rights” and the second one is “consumer” form an imaginable image of the term of an element of simple judgment (the term OLLO). The original element ALLE 17 is referred to as the concept of the term ALLO (PT OLLO) or elements 18 (ILLE). From the semantic point of view, PT OLLO (ILLE 18), forming the term OLLO (ALLE 17) are not equivalent, that is, they have different semantic roles. Syntactically, the main PT OLLOs have the maximum semantic role, that is, the PT OLLOs of the first semantic part. PT OLLO first
семантической части определяют смысловой вектор термина ОЛЛО (ОЛЛЭ 17). Например, в упомянутом примере «права потребителя» суть образа термина ОЛЛО (ОЛЛЭ 17) - именно «права», а не «потребитель». ПТ ОЛЛО второй и последующих семантических частей (синтаксически зависимые ПТ ОЛЛО) в термине ОЛЛО (ОЛЛЭ 17) необходимы для уточнения смысла термина ОЛЛО (ОЛЛЭ 17). Чем сложнее мыслимый образ термина ОЛЛО (ОЛЛЭ 17), тем большего количества ПТ ОЛЛО (ИЛЛЭ 18) он может потребовать. Структурирование ПТ ОЛЛО (ИЛЛЭ 18) как семантических частей ОЛЛЭ 17 позволяет правильно воспринимать семантические роли отдельных ПТ ОЛЛО (ИЛЛЭ 18) в терминах ОЛЛО (ОЛЛЭ 17). Элемент 18 (ИЛЛЭ) формируют из ОЛЛЭ 17 путем выделения в ОЛЛЭ 17 отдельных semantic parts determine the semantic vector of the term ALLO (ALLE 17). For example, in the mentioned example of “consumer rights”, the essence of the image of the term ALLO (ALLE 17) is precisely “rights” and not “consumer”. PT OLLO of the second and subsequent semantic parts (syntactically dependent PT OLLO) in the term OLLO (ALLE 17) are necessary to clarify the meaning of the term ALLO (ALLE 17). The more complex the conceivable image of the term ALLO (ALLE 17), the more PT OLLO (ILLE 18) it may require. Structuring PT OLLO (ILLE 18) as the semantic parts of ALLE 17 allows us to correctly perceive the semantic roles of individual PT ALLO (ILLE 18) in terms of ALLO (ALLE 17). Element 18 (ILLE) is formed from ALLE 17 by isolating individual
синтаксических частей по признаку наличия главных слов синтаксических частей ОЛЛЭ 17 и последующего структурирования текстовых элементов синтаксической части. В зависимости от сложности лингвистической структуры ОЛЛЭ 17 в нем можно выделить одну или несколько синтаксических частей (ИЛЛЭ 18). syntactic parts based on the presence of the main words of the syntactic parts of OLLE 17 and the subsequent structuring of text elements of the syntactic part. Depending on the complexity of the linguistic structure of OLLE 17, one or more syntactic parts can be distinguished in it (ILLE 18).
Синтаксическая часть (ИЛЛЭ 18) ОЛЛЭ 17 может представлять собой только одно упомянутое главное слово или несколько синтаксически связанных слов The syntactic part (ILLE 18) OLLE 17 can be only one main word or several syntactically related words
(значимых частей речи), синтаксически главным из которых является упомянутое главное слово. Таким образом главное слово синтаксической части (ИЛЛЭ 18) ОЛЛЭ 17 отождествляется с элементом 18 первого вида, а все синтаксически зависимые от него слова (значимые части речи), если такие имеются, отождествляются с элементом 18 второго вида. С логической точки зрения исходные лингво- логические элементы (элементы 18) первого вида являются «понятиями» - то есть объектами или действиями окружающего мира, а элементы 18 второго вида - «признаками понятия», то есть некими семантическими характеристиками упомянутых объектов и действий. (significant parts of speech), of which the main word is syntactically the main one. Thus the main word of the syntactic part (ILLE 18) OLLE 17 is identified with element 18 of the first kind, and all words syntactically dependent on it (significant parts of speech), if any, are identified with element 18 of the second kind. From a logical point of view, the initial linguistic elements (elements 18) of the first kind are “concepts” - that is, objects or actions of the surrounding world, and elements 18 of the second kind are “signs of a concept”, that is, some semantic characteristics of the mentioned objects and actions.
[0181]Формирование частей (семантических частей) элементов 17 двенадцатой структуры данных СМД, на этапе 4032 производят путем выполнения следующих действий: на первом этапе от идентифицированного главного слова элемента 17 (ОЛЛЭ) идентифицируют все синтаксически подчиненные слова, вплоть до слова, которое само является главным словом семантической части элемента 17 (ОЛЛЭ), но не включая данное слово; на втором этапе главное слово семантической части элемента 17 (ОЛЛЭ) и все упомянутые синтаксически подчиненные слова, в том числе последовательно подчиненные, формируют семантическую часть элемента 17 (ОЛЛЭ). Порядковый номер семантической части в ОЛЛЭ, указывает на ее семантическую роль в ОЛЛЭ, и его формируют в  [0181] The formation of the parts (semantic parts) of the elements 17 of the twelfth SMD data structure is performed at 4032 by performing the following steps: at the first stage, all syntactically subordinate words are identified from the identified main word of the element 17 (ALL), up to the word which itself is the main word of the semantic part of element 17 (ALLE), but not including this word; at the second stage, the main word of the semantic part of element 17 (ALL) and all the mentioned syntactically subordinate words, including successively subordinate ones, form the semantic part of element 17 (ALL). The serial number of the semantic part in ALLE indicates its semantic role in ALLE, and it is formed in
соответствии с номером текстового элемента (ТЭ) главного слова семантической части ОЛЛЭ 17. Семантическая часть ОЛЛЭ 17 с наименьшим номером ТЭ главного слова является первой семантической частью элемента 17 (ОЛЛЭ). Семантическая часть ОЛЛЭ 17, имеющая ближайший к нему номер ТЭ главного слова in accordance with the number of the text element (TE) of the main word of the semantic part of ALLE 17. The semantic part of ALL 17 with the lowest TE number of the main word is the first semantic part of element 17 (ALL). The semantic part of OLLE 17, having the number of the main word TE closest to it
семантической части является второй семантической частью ОЛЛЭ 17, и так далее. Порядковый номер ИЛЛЭ указывает в наименовании ОЛЛЭ, например, но не ограничиваясь - «ИЛЛЭ 1.2.1». Такое наименование элемента 18 говорит о том, что он является первой семантической частью во втором ОЛЛЭ первого ОЛЛО. the semantic part is the second semantic part of ALLE 17, and so on. The serial number of ILLE is indicated in the name of ALLE, for example, but not limited to - "ILLE 1.2.1." This name of the element 18 suggests that it is the first semantic part in the second ALLE of the first ALLO.
Формирование элементов 18 тринадцатой структуры данных СМД в ходе этапа 4033 производят на основе результатов этапа 4032 формирования семантических частей элементов 17 двенадцатой структуры данных СМД следующим образом: на первом этапе все значимые части речи в семантических частях элементов 17 отождествляют с элементами 18 тринадцатой структуры данных СМД; на втором этапе упомянутые идентифицированные главные слова семантических частей элементов 17 отождествляют с элементами 18 первого вида; на третьем этапе все остальные элементы 18 данной семантической части, кроме элемента 18 первого вида отождествляют с элементами 18 второго вида. [0182]Идентификация значения и порядкового (порядковых) номера (номеров) ТЭ элемента 18 двенадцатой структуры данных СМД, производится в рамках этапа 4033 путем отождествления значения 181 элемента 18 со значением (значениями) 211 текстового (текстовых) элемента (элементов) 21 The formation of elements 18 of the thirteenth SMD data structure during step 4033 is based on the results of step 4032 of forming the semantic parts of elements 17 of the twelfth SMD data structure as follows: at the first stage, all significant parts of speech in the semantic parts of elements 17 are identified with elements 18 of the thirteenth SMD data structure; at the second stage, the identified identified main words of the semantic parts of elements 17 are identified with elements 18 of the first kind; in the third stage, all other elements 18 of this semantic part, except for element 18 of the first kind, are identified with elements 18 of the second kind. [0182] Identification of the value and serial number (s) of the TE of element 18 of the twelfth SMD data structure is performed as part of step 4033 by identifying the value 181 of element 18 with the value (s) of 211 textual (text) element (s) 21
лингвистического предложения 11, составляющего (составляющих) элемент 18, а порядковый (порядковые) номер (номера) 182 текстового (текстовых) элемента (элементов) 21, составляющего (составляющих) элемент 18 путем отождествления с порядковым (порядковыми) номером (номерами) 212 текстового (текстовых) элемента (элементов) 21, составляющего (составляющих) элемент 18. linguistic sentence 11 constituting (constituent) element 18, and serial (ordinal) number (s) 182 of textual (text) element (s) 21 constituting (constituting) element 18 by identifying with ordinal (ordinal) number (s) 212 text (text) element (s) 21 constituting the (component) element 18.
Идентификация видов элементов 18 двенадцатой структуры данных СМД в рамках этапа 4031 не изменяет значение 181 элемента 18 и не изменяет порядковый (порядковые) номер (номера) ТЭ 21 лингвистического предложения 11, The identification of the types of elements 18 of the twelfth data structure of the DMD within the framework of step 4031 does not change the value 181 of element 18 and does not change the serial number (s) of the TE 21 of the linguistic sentence 11,
составляющего (составляющих) элемент 18 (ИЛЛЭ). component (s) element 18 (ILLE).
[0183] Формирование тринадцатой структуры данных СМД в ходе этапа 4033 производят путем объединения в одной структуре данных элементов 18 первого и второго вида тринадцатой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.  [0183] The formation of the thirteenth SMD data structure during step 4033 is performed by combining in one data structure the elements 18 of the first and second types of the thirteenth SMD data structure, as well as their identification data according to the principles and methods known from the prior art, which, accordingly, are not described in further detail below. are described.
[0184] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 18 (ИЛЛЭ) тринадцатой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 4031, состоящего из идентификационных данных ТЭ, составляющих элемент 18 (ИЛЛЭ), и получении значений (2131, 2141, 2231; 2151, 2161, 2181, 2191) всех частей лингвистических характеристик (213, 214, 223, 215, 216, 218, 219) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 18 (ИЛЛЭ). При этом, как было описано ранее  [0184] Identification of the linguistic characteristics of TEs constituting the elements 18 (LLE) of the thirteenth SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP generated in step 4031, which consists of the identification data of the TEs constituting the element 18 (LLE), and obtaining the values (2131, 2141, 2231; 2151, 2161, 2181, 2191) of all parts of the linguistic characteristics (213, 214, 223, 215, 216, 218, 219) of the text elements 21 of the linguistic sentence 11 of which element 18 consists (ILLE ) Moreover, as described previously
лингвистическими признаками элементов 18 (ИЛЛЭ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 18 (ИЛЛЭ). the linguistic features of elements 18 (ILLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 18 (ILLE) are composed.
[0185]На фиг. 45, в качестве примера, но не ограничения,  [0185] FIG. 45, by way of example, but not limitation,
проиллюстрирована примерная схема системы 500 преобразования illustrated is an exemplary diagram of a conversion system 500
структурированного массива данных, которая в предпочтительном варианте реализации содержит, по меньшей мере, одно или более компьютерных устройств 501 преобразования структурированного массива данных, содержащих, по меньшей мере, один или более процессоров 5011 и память 5012. Упомянутые устройства 501 преобразования структурированного массива данных могут представлять собой, но не ограничиваться: персональный компьютер, a structured data array, which in a preferred embodiment comprises at least one or more computer devices 501 converting a structured data array containing at least one or more processors 5011 and memory 5012. Said devices 501 converting a structured data array may include, but are not limited to: a personal computer,
портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет и тому подобное. Память (машиночитаемый носитель данных) 5012 устройства 501 преобразования структурированного массива данных, содержит код программы, который при выполнении побуждает упомянутые один или более процессоры 5011 упомянутого устройства 501 выполнять действия описанных ранее способов преобразования структурированного массива данных. В некоторых случаях компьютерное устройство 501 может представлять собой серверное компьютерное устройство, связанное с пользовательским laptop computer, tablet computer, PDA, smartphone, phablet and the like. The memory (computer-readable storage medium) 5012 of the structured data array conversion device 501 contains a program code that, when executed, causes said one or more processors 5011 of the said device 501 to perform the actions of the previously described methods for converting a structured data array. In some cases, the computer device 501 may be a server computer device associated with a user
компьютерным устройством, выполненным с возможностью передачи серверному компьютерному устройству 501 команды или команд, побуждающих процессор или процессоры 5011 серверного компьютерного устройства выполнять код a computer device configured to transmit to the server computer device 501 commands or instructions causing the processor or processors 5011 of the server computer device to execute code
программы, который при выполнении процессором или процессорами серверного компьютерного устройства 5011 побуждает процессор или процессоры 5011 серверного компьютерного устройства выполнять действия какого-либо из описанных ранее способов преобразования структурированного массива данных. Пользовательское компьютерное устройство 502 может представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет, тонкий клиент и тому подобное. Пользовательское компьютерное устройство 502 может быть связано с серверным компьютерным устройством 501 посредством проводного или беспроводного соединения. Упомянутая память 5012 компьютерного устройства 501 (серверного компьютерного устройства 501) содержит подлежащие a program that, when executed by the processor or processors of the server computer device 5011, causes the processor or processors 5011 of the server computer device to perform the actions of any of the previously described methods for converting a structured data array. The user computer device 502 may include, but is not limited to: a personal computer, a laptop computer, a tablet computer, a PDA, a smartphone, a phablet, a thin client, and the like. The user computer device 502 may be connected to the server computer device 501 via a wired or wireless connection. Mentioned memory 5012 of the computer device 501 (server computer device 501) contains subject
преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, а также может содержать любую из описанных ранее исходных структур данных для какого-либо из описанных ранее способов преобразования структурированного массива данных. Более того, подлежащие преобразованию один или несколько transforming one or more structured data arrays containing at least a linguistic sentence, and may also contain any of the previously described source data structures for any of the previously described methods for converting a structured data array. Moreover, one or more to be converted
структурированных массивов данных могут являться загружаемыми и храниться, в частности, в базе данных 503 системы преобразования структурированного массива данных. В качестве примера, но не ограничения, машиночитаемый носитель данных (память 5012) может включать в себя оперативную память (RAM); постоянное запоминающее устройство (ROM); электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM); флэш-память или другие технологии памяти; CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для кодирования требуемой structured data arrays can be downloaded and stored, in particular, in the database 503 of the structured data array conversion system. As an example, but not limitation, computer-readable the storage medium (memory 5012) may include a random access memory (RAM); read-only memory device (ROM); Electrically Erasable Programmable Read-Only Memory (EEPROM); flash memory or other memory technologies; CDROM, digital versatile disc (DVD) or other optical or holographic storage media; magnetic cassettes, magnetic tape, magnetic disk storage device or other magnetic storage devices, carrier waves or other storage medium that can be used to encode the desired
информации, и к которому может быть осуществлен доступ посредством information and which can be accessed through
устройства 501. Память включает в себя носитель данных на основе devices 501. The memory includes a storage medium based on
запоминающего устройства компьютера в форме энергозависимой или a computer storage device in the form of volatile or
энергонезависимой памяти, или их комбинации. Примерные аппаратные устройства включают в себя твердотельную память, накопители на жестких дисках, накопители на оптических дисках и так далее. В памяти хранится non-volatile memory, or combinations thereof. Exemplary hardware devices include solid state memory, hard disk drives, optical disk drives, and so on. Stored in memory
примерная среда, в которой при помощи компьютерных команд или кодов, хранящихся в памяти устройства, может быть осуществлена процедура an exemplary environment in which, using computer instructions or codes stored in the device’s memory, a procedure can be performed
преобразования структурированного массива данных. Устройство содержит один или более процессоров 5011, которые предназначены для выполнения transformations of a structured data array. The device contains one or more processors 5011, which are designed to perform
компьютерных команд или кодов, хранящихся в памяти устройства с целью обеспечения выполнения процедуры преобразования структурированного массива данных. Компьютерные команды или коды, хранящиеся в памяти, предназначены для выполнения преобразования структурированного массива данных. Система 500 также может включать в себя базу данных (БД) 503. БД 503 может computer instructions or codes stored in the device’s memory in order to ensure the implementation of the procedure for converting a structured data array. Computer instructions or codes stored in memory are designed to perform the conversion of a structured data array. System 500 may also include a database (DB) 503. Database 503 may
представлять собой, но не ограничиваясь: иерархическую БД, сетевую БД, реляционную БД, объектную БД, объектно-ориентированную БД, объектно- реляционную БД, пространственную БД, комбинацию перечисленных двух и более БД, и тому подобное. БД 503 хранит данные в памяти, которая может представлять собой, но не ограничиваясь: постоянное запоминающее устройство (ROM), электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для хранения требуемой информации, и к которому может быть осуществлен доступ посредством устройства 501 преобразования структурированного массива данных. БД 503 служит для хранения данных, представляющих собой, по меньшей мере, команды для выполнения этапов описанных ранее способов преобразования структурированного массива данных; подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, или одну из описанных ранее исходных для какого-либо способа преобразования структур данных, которые могут быть загружены в память 5012 устройства 501 преобразования структурированного массива данных; и других данных, represent, but not limited to: a hierarchical database, a network database, a relational database, an object database, an object-oriented database, an object-relational database, a spatial database, a combination of these two or more databases, and the like. The database 503 stores data in memory, which may be, but not limited to: read-only memory (ROM), electrically erasable programmable read-only memory (EEPROM), flash memory, CDROM, digital versatile disk (DVD) or other optical or holographic data carriers; magnetic cassettes, magnetic tape, magnetic disk storage device or other magnetic storage devices, wave carriers or other storage medium that can be used to store the required information, and which can be accessed by device 501 converting a structured data array. The database 503 is used to store data representing at least commands for performing the steps of the previously described methods for converting a structured data array; one or more structured data arrays to be converted containing at least a linguistic sentence, or one of the data structures that can be loaded into the memory 5012 of the device 501 of the conversion of a structured data array described previously for any conversion method; and other data
необходимых для функционирования системы. Примерная система 500 necessary for the functioning of the system. Sample System 500
преобразования структурированного массива данных дополнительно может содержать серверное компьютерное устройство 501, которое помимо описанных ранее функций, сохраняет и содействует манипуляции компьютерными командами или кодами, ранее описанными в данном документе, которые, соответственно, дополнительно не описываются. Серверное компьютерное устройство 501, помимо описанных ранее функций, может обеспечивает регулирование обменом данных в системе 500 преобразования структурированного массива данных, а также обеспечивает обработку данных при условии подключения к нему одного или более чем одного пользовательских компьютерных устройств 502. В этом случае все вычислительные мощности, необходимые для обеспечения выполнения процедуры преобразования структурированного массива данных, расположены на серверном компьютерном устройстве 501. Система 500 так же может содержать одну или более сетей 504 передачи данных. 5ети 204 передачи данных могут включать в себя, но не ограничиваться, одну или более локальных сетей (LAN) и/или глобальных сетей (WAN), или могут представлять собой информационно- телекоммуникационную сеть Интернет, или Интранет, или виртуальную частную сеть (VPN), или их комбинацию, и тому подобное. Серверное компьютерное устройство 501 также имеет возможность обеспечивать виртуальную transforming a structured data array may further comprise a server computer device 501, which, in addition to the functions described previously, saves and facilitates the manipulation of computer instructions or codes previously described in this document, which, accordingly, are not further described. The server computer device 501, in addition to the functions described above, can provide data exchange control in the structured data array conversion system 500, and also provides data processing provided that one or more than one user computer devices 502 are connected to it. In this case, all computing power, necessary to ensure the implementation of the procedure for converting a structured data array, located on the server computer device 501. The system 500 can also This may include one or more data networks 504. 5 data networks 204 may include, but are not limited to, one or more local area networks (LANs) and / or wide area networks (WANs), or may be an information telecommunication network Internet, or an Intranet, or a virtual private network (VPN) , or a combination thereof, and the like. Server computer device 501 also has the ability to provide virtual
вычислительную среду (Virtual Machine) для обеспечения взаимодействия между пользовательским компьютерным устройством 502 и БД 503. Сеть 504 служит для обеспечения взаимодействия между компьютерным устройством 501, базой данных 503 и пользовательским компьютерным устройством 502 системы 500 преобразования структурированного массива данных. При этом пользовательское компьютерное устройство 502 может быть связано с серверным компьютерным устройством 501 напрямую, используя известные из уровня техники проводные и беспроводные способы и методы связи, которые, соответственно, далее не подробно не описываются. a computing environment (Virtual Machine) for providing interaction between the user computer device 502 and the database 503. The network 504 serves to provide interaction between the computer device 501, the database 503 and the user computer device 502 of the structured data array conversion system 500. In this case, the user computer device 502 may be associated with a server computer device 501 directly, using wire and wireless communication methods and methods known from the prior art, which, respectively, are not described in further detail below.

Claims

Формула изобретения Claim
1. Выполняемый процессором компьютерного устройства способ 1. Performed by the processor of the computer device
преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, лингвистическое предложение, характеризующийся выполнением этапов: transforming a structured data array (SMD) containing at least a linguistic sentence characterized by the following steps:
A) формирования первой структуры данных, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных представляют собой текстовые элементы (ТЭ) лингвистического предложения, а также  A) the formation of the first data structure, which form the first data structure of the SMD containing the elements of the aforementioned first data structure, and said elements of the first data structure are text elements (TE) of the linguistic sentence, and
идентификационные данные текстовых элементов (идентификационные данные ТЭ), представляющие собой для каждого ТЭ, по меньшей мере: значение текстового элемента (значение ТЭ) и порядковый номер текстового элемента (порядковый номер ТЭ) в лингвистическом предложении; identification data of text elements (identification data of TE), representing for each TE, at least: value of a text element (value of TE) and serial number of a text element (serial number of TE) in a linguistic sentence;
Б) формирования базы данных лингвистических признаков (БДЛП), на котором выявляют лингвистические признаки текстовых элементов  B) the formation of a database of linguistic features (BDLP), which reveal the linguistic features of text elements
(лингвистические признаки ТЭ) лингвистического предложения, из которых формируют базу данных, представляющую собой БДЛП текстовых элементов лингвистического предложения; (linguistic features of TE) of a linguistic sentence, from which a database is formed, which is a BDLP of text elements of a linguistic sentence;
B) формирования второй структуры данных, на котором формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой синтаксические единицы (СЕ) лингвистического предложения,  B) forming a second data structure on which the second SMD data structure is formed containing the elements of said second data structure, said elements of the second data structure being the syntactic units (CE) of the linguistic sentence,
сформированные на основании сведений из БДЛП текстовых элементов formed on the basis of information from BDLP text elements
лингвистического предложения, а также представляют собой идентификационные данные синтаксических единиц (идентификационные данные СЕ), linguistic sentences, and also represent the identification data of the syntactic units (identification data CE),
представляющие собой для каждой СЕ, по меньшей мере: значение синтаксической единицы (значение СЕ) и порядковый (порядковые) номер (номера) ТЭ representing for each CE at least: the value of the syntactic unit (CE value) and the serial (serial) number (s) of the TE
лингвистического предложения, составляющих СЕ. linguistic sentences constituting CE.
2. Способ по п. 1, характеризующийся тем, что в рамках этапа А) выполняют способ, характеризующийся выполнением этапов:  2. The method according to p. 1, characterized in that, in the framework of step A), a method is performed characterized by the steps:
А1) идентификации исходной структуры данных СМД на котором  A1) identification of the initial SMD data structure on which
идентифицируют элементы исходной структуры данных СМД, являющиеся лингвистическими предложениями; identify elements of the original SMD data structure that are linguistic sentences;
98 98
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) A2) идентификации элементов первой структуры данных СМД, на котором идентифицируют элементы первой структуры данных СМД, являющиеся текстовыми элементами (ТЭ) лингвистического предложения, а также SUBSTITUTE SHEET (RULE 26) A2) identifying the elements of the first SMD data structure, on which the elements of the first SMD data structure are identified, which are text elements (TE) of the linguistic sentence, and
идентификационные данные ТЭ, представляющие собой для каждого ТЭ, по меньшей мере: значение ТЭ и порядковый номер ТЭ, и формируют первую структуру данных СМД. TE identification data, representing for each TE, at least: the value of the TE and the serial number of the TE, and form the first data structure of the SMD.
3. Способ по п. 2, характеризующийся тем, что в рамках этапа А1)  3. The method according to p. 2, characterized in that in the framework of step A1)
обеспечивают классификацию элементов, из которых состоит исходная структура данных, как лингвистических предложений. provide a classification of the elements that make up the original data structure as linguistic sentences.
4. Способ по п. 2, характеризующийся тем, что в рамках этапа А2)  4. The method according to p. 2, characterized in that in the framework of step A2)
идентифицируют элементы первой структуры данных СМД, являющиеся текстовыми элементами (ТЭ) лингвистического предложения, путем выявления отдельных слов или групп слов, цифр (чисел) или индексов, причем цифры (числа) или индексы не разделены пробелом, а также знаков препинания. identify the elements of the first SMD data structure, which are text elements (TE) of the linguistic sentence, by identifying individual words or groups of words, numbers (numbers) or indices, and the numbers (numbers) or indices are not separated by a space, as well as punctuation marks.
5. Способ по п. 4, характеризующийся тем, что последний знак препинания в лингвистическом предложении не учитывается при идентификации и не рассматривается в качестве текстового элемента лингвистического предложения.  5. The method according to claim 4, characterized in that the last punctuation mark in the linguistic sentence is not taken into account during identification and is not considered as a text element of the linguistic sentence.
6. Способ по п. 2, характеризующийся тем, что в рамках этапа А2)  6. The method according to p. 2, characterized in that in the framework of step A2)
идентификацию значения текстового элемента производят путем регистрации символов (букв, цифр и(или) знаков препинания), из которых состоит текстовый элемент, а идентификацию порядкового номера текстового элемента производят путем расчета местоположения текстового элемента в лингвистическом the value of the text element is identified by registering the characters (letters, numbers and (or) punctuation marks) that make up the text element, and the sequence number of the text element is identified by calculating the location of the text element in the linguistic
предложении. offer.
7. Способ по п. 6, характеризующийся тем, что первый текстовый элемент в лингвистическом предложении получает порядковый номер «1», а все  7. The method according to p. 6, characterized in that the first text element in the linguistic sentence receives the serial number "1", and all
последующие текстовые элементы получают порядковый номер, больший на единицу чем порядковый номер предыдущего текстового элемента. subsequent text elements receive a sequence number that is one greater than the sequence number of the previous text element.
8. Способ по п. 1, характеризующийся тем, что этап Б) характеризуется выполнением этапов:  8. The method according to p. 1, characterized in that stage B) is characterized by the implementation of the steps:
Б1) формирования лингвистических признаков текстовых элементов лингвистического предложения, на котором для лингвистического анализа текстового элемента предоставляют идентификационные данные элемента (значение и порядковый номер текстового элемента) и получают лингвистические характеристики текстовых элементов лингвистического предложения, а также  B1) the formation of the linguistic characteristics of the text elements of the linguistic sentence, on which for the linguistic analysis of the text element provide the identification data of the element (value and serial number of the text element) and get the linguistic characteristics of the text elements of the linguistic sentence, as well
99 99
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) значения упомянутых лингвистических характеристик 2131; SUBSTITUTE SHEET (RULE 26) the meanings of said linguistic characteristics 2131;
Б2) формирования базы данных лингвистических признаков (БДЛП), на котором формируют БДЛП текстовых элементов лингвистического предложения; причем лингвистическим признаком текстового элемента являются все полученные для текстового элемента в ходе выполнения этапа Б1)  B2) the formation of a database of linguistic features (BDLP), on which form BDLP text elements of a linguistic sentence; moreover, the linguistic feature of the text element is all received for the text element in the course of stage B1)
лингвистические характеристики, обладающие значениями лингвистических характеристик. linguistic characteristics possessing values of linguistic characteristics.
9. Способ по и. 8, характеризующийся тем, что в рамках этапа Б1)  9. The method according to and. 8, characterized in that in the framework of stage B1)
лингвистические характеристики и их значения формируют путем комплексного лингвистического анализа каждого текстового элемента лингвистического предложения, представляющего, в качестве примера, но не ограничения комплексный анализ текстового элемента на основе местонахождения текстового элемента в структуре лингвистического предложения, его значения, вида, классификации его мыслимого образа и анализа его связей с другими текстовыми элементами в лингвистическом предложении, после чего производят linguistic characteristics and their meanings are formed by a complex linguistic analysis of each text element of a linguistic sentence, which, by way of example, but not limited to, provides a comprehensive analysis of a text element based on the location of a text element in the structure of a linguistic sentence, its meaning, type, classification of its conceivable image and analysis its connections with other textual elements in a linguistic sentence, after which they produce
формирование основных лингвистические характеристик the formation of basic linguistic characteristics
10. Способ по и. 8, характеризующийся тем, что формирование БДЛП осуществляют путем внесения сформированных в рамках этапа Б1)  10. The method according to and. 8, characterized in that the formation of BDLP is carried out by making formed in the framework of stage B1)
лингвистических характеристик и их значений в БДЛП в виде перечня первой части лингвистических характеристик со значениями этих характеристик. linguistic characteristics and their values in the BDLP in the form of a list of the first part of linguistic characteristics with the values of these characteristics.
11. Способ по и. 1, характеризующийся тем, что этап В) характеризуется выполнением этапов:  11. The method according to and. 1, characterized in that stage B) is characterized by the implementation of the steps:
В1) идентификации и формирования первых элементов второй структуры данных СМД, на котором идентифицируют и формируют первые элементы второй структуры данных СМД, являющиеся первыми синтаксическими единицами, а также идентификационные данные первых синтаксических единиц,  B1) identification and formation of the first elements of the second SMD data structure, on which the first elements of the second SMD data structure are identified and formed, which are the first syntactic units, as well as the identification data of the first syntactic units,
представляющие собой для каждой первой синтаксической единицы, по меньшей мере, значение первой синтаксической единицы и порядковый (порядковые) номер (номера) текстового элемента или текстовых элементов лингвистического предложения, составляющих первую синтаксическую единицу; representing for each first syntactic unit at least the value of the first syntactic unit and the serial number of the text element or text elements of the linguistic sentence constituting the first syntactic unit;
В2) формирования вторых элементов второй структуры данных СМД, на котором формируют вторые элементы второй структуры данных СМД,  B2) the formation of the second elements of the second SMD data structure, on which the second elements of the second SMD data structure are formed,
являющиеся вторыми синтаксическими единицами, а также идентификационные данные вторых синтаксических единиц, представляющие собой для каждой такой being the second syntactic units, as well as the identification data of the second syntactic units, representing for each such
100 one hundred
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) синтаксической единицы, по меньшей мере, значение второй синтаксической единицы и порядковые номера текстовых элементов лингвистического SUBSTITUTE SHEET (RULE 26) syntactic unit, at least the meaning of the second syntactic unit and serial numbers of textual elements of the linguistic
предложения, составляющих вторую синтаксическую единицу; sentences that make up the second syntactic unit;
ВЗ) формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД путем объединения первых синтаксических единиц, вторых синтаксических единиц и их идентификационных данных.  OT) the formation of the second SMD data structure, on which the second SMD data structure is formed by combining the first syntactic units, the second syntactic units and their identification data.
12. Способ по п. 11, характеризующийся тем, что в рамках этапа В1) идентификацию или формирование первых синтаксических единиц производят путем комплексного анализа значений лингвистических характеристик текстовых элементов лингвистического предложения, причем идентификации подвергаются первые синтаксические единицы, состоящие из одного текстового элемента, а формированию подвергаются первые синтаксические единицы, состоящие из нескольких текстовых элементов, при этом идентификация или формирование осуществляется путем отождествления первых синтаксических единиц с  12. The method according to claim 11, characterized in that, as part of step B1), the first syntactic units are identified or formed by a comprehensive analysis of the linguistic characteristics of the text elements of the linguistic sentence, the first syntactic units consisting of one text element being identified, and the formation the first syntactic units consisting of several text elements are exposed, while identification or formation is carried out by identifying Ia first syntactic units
актуальными исходными синтаксическими объектами, представляющими собой перечень исходных синтаксических объектов, предварительно устанавливаемый и записываемый в первую пользовательскую базу данных. relevant source syntax objects, representing a list of source syntactic objects, pre-installed and recorded in the first user database.
13. Способ по п. 11, характеризующийся тем, что в рамках этапа В2) формирование вторых синтаксических единиц из двух и более первых  13. The method according to p. 11, characterized in that, as part of step B2) the formation of the second syntactic units of two or more first
синтаксических единиц производят путем комплексного анализа значений лингвистических характеристик текстовых элементов, являющихся первыми синтаксическими единицами, при выявлении лингвистических характеристик текстовых элементов, составляющих первые синтаксические единицы, которые соответствуют описанию синтаксической конструкции, содержащемуся в первой пользовательской базе данных. syntactic units are produced by a complex analysis of the values of the linguistic characteristics of the text elements, which are the first syntactic units, when identifying the linguistic characteristics of the text elements that make up the first syntactic units that correspond to the description of the syntactic structure contained in the first user database.
14. Способ по п. 11, характеризующийся тем, что в рамках этапа В1) идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ первых синтаксических единиц производят следующим образом: значение  14. The method according to p. 11, characterized in that, in the framework of step B1), the identification of the value and serial (ordinal) numbers (numbers) of the TE of the first syntactic units is performed as follows: value
(значения) текстового (текстовых) элемента (элементов) лингвистического предложения, составляющего (составляющих) первую синтаксическую единицу, идентифицируют как значение элемента первой синтаксической единицы, а порядковый (порядковые) номер (номера) упомянутого (упомянутых) текстового (текстовых) элемента (элементов) лингвистического предложения, составляющего (составляющих) первую синтаксическую единицу, идентифицируют как (values) of the text (s) element (s) of the linguistic sentence constituting (making up) the first syntactic unit, is identified as the value of the element of the first syntactic unit, and the serial (serial) number (s) of the mentioned (mentioned) text (text) element (s) ) of a linguistic sentence constituting (constituting) the first syntactic unit, is identified as
101 101
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) порядковый (порядковые) номер (номера) текстового (текстовых) элемента (элементов) 312, составляющего (составляющих) первую синтаксическую единицу. SUBSTITUTE SHEET (RULE 26) the ordinal number of the text element (s) 312 constituting the first syntactic unit.
15. Способ по п. 11, характеризующийся тем, что в рамках этапа В2) идентификацию значения и порядковых номеров ТЭ вторых синтаксических единиц производят следующим образом: значения текстовых элементов  15. The method according to p. 11, characterized in that, as part of step B2), the identification of the values and sequence numbers of the TE of the second syntactic units is performed as follows: the values of text elements
лингвистического предложения, составляющих вторую синтаксическую единицу, идентифицируют как значение второй синтаксической единицы, а порядковые номера упомянутых текстовых элементов лингвистического предложения, составляющих вторую синтаксическую единицу, идентифицируют как порядковые номера текстовых элементов, составляющих вторую синтаксическую единицу. the linguistic sentences constituting the second syntactic unit are identified as the value of the second syntactic unit, and the serial numbers of the text elements of the linguistic sentences constituting the second syntactic unit are identified as the ordinal numbers of text elements constituting the second syntactic unit.
16. Способ по п. 11, характеризующийся тем, что в рамках этапа ВЗ) формирование второй структуры данных СМД производят путем объединения в одной структуре данных первых синтаксических единиц и вторых синтаксических единиц.  16. The method according to p. 11, characterized in that, as part of the OT stage), the formation of a second SMD data structure is performed by combining the first syntactic units and second syntactic units in one data structure.
17. Способ по п. 12, характеризующийся тем, что в рамках этапа В1) идентификацию лингвистических характеристик ТЭ, составляющих первые синтаксические единицы и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа Б), состоящего из идентификационных данных ТЭ, составляющих первую синтаксическую единицу, и получения значений лингвистических характеристик текстовых элементов лингвистического предложения, из которых состоит первая синтаксическая единица.  17. The method according to p. 12, characterized in that, in the framework of stage B1), the linguistic characteristics of TEs that make up the first syntactic units and their values are identified, if necessary, by organizing a request to the BDL formed in stage B), consisting of TE identification data constituting the first syntactic unit, and obtaining the values of the linguistic characteristics of the text elements of the linguistic sentence that make up the first syntactic unit.
18. Способ по п. 13, характеризующийся тем, что в рамках этапа В2) идентификацию лингвистических характеристик ТЭ, составляющих вторые синтаксические единицы и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа Б), состоящего из идентификационных данных ТЭ, составляющих вторую синтаксическую единицу, и получения значений лингвистических характеристик текстовых элементов лингвистического предложения, из которых состоит вторая синтаксическая единица.  18. The method according to p. 13, characterized in that, as part of step B2), the linguistic characteristics of TEs that make up the second syntactic units and their values are identified, if necessary, by organizing a request to the BDL formed in the framework of step B), consisting of TE identification data constituting the second syntactic unit, and obtaining the values of the linguistic characteristics of the text elements of the linguistic sentence that make up the second syntactic unit.
19. Компьютерное устройство для преобразования структурированного массива данных, содержащего, по меньшей мере, лингвистическое предложение, содержащее, по меньшей мере:  19. A computer device for converting a structured data array containing at least a linguistic sentence containing at least:
процессор компьютерного устройства, и  a computer device processor, and
102 102
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) память, содержащую код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 1-18. SUBSTITUTE SHEET (RULE 26) a memory containing program code, which, when executed by the processor of a computer device, causes the processor of the computer device to perform the actions of the method according to any one of paragraphs. 1-18.
20. Система для преобразования структурированного массива данных, содержащего, по меньшей мере, лингвистическое предложение, содержащая, по меньшей мере:  20. A system for converting a structured data array containing at least a linguistic sentence containing at least:
серверное компьютерное устройство, являющееся компьютерным  server computer device being a computer
устройством по п. 19, и the device according to claim 19, and
пользовательское компьютерное устройство, выполненное с возможностью передачи серверному компьютерному устройству команды или команд,  a user computer device configured to transmit commands or commands to the server computer device,
побуждающих процессор серверного компьютерного устройства выполнять код программы, который при выполнении процессором серверного компьютерного устройства побуждает процессор серверного компьютерного устройства выполнять действия способа по любому из п.п. 1-18. causing the processor of the server computer device to execute program code, which, when executed by the processor of the server computer device, causes the processor of the server computer device to perform the actions of the method according to any one of paragraphs. 1-18.
21. Машиночитаемый носитель данных, содержащий код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 1-18.  21. A computer-readable storage medium containing program code, which, when executed by a processor of a computer device, causes the processor of the computer device to perform the actions of the method according to any one of paragraphs. 1-18.
103 103
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26)  SUBSTITUTE SHEET (RULE 26)
PCT/RU2019/050078 2018-06-07 2019-06-07 Conversion of a structured data array containing a linguistic sentence WO2019235975A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EA202092988A EA202092988A1 (en) 2018-06-07 2019-06-07 METHOD FOR PRELIMINARY CONVERSION OF A STRUCTURED DATA ARRAY CONTAINING A LINGUISTIC PROPOSAL

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2018121132 2018-06-07
RU2018121132A RU2685967C1 (en) 2018-06-07 2018-06-07 Method of preliminary transformation of a structured data array containing a linguistic sentence

Publications (1)

Publication Number Publication Date
WO2019235975A1 true WO2019235975A1 (en) 2019-12-12

Family

ID=66314607

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2019/050078 WO2019235975A1 (en) 2018-06-07 2019-06-07 Conversion of a structured data array containing a linguistic sentence

Country Status (3)

Country Link
EA (1) EA202092988A1 (en)
RU (1) RU2685967C1 (en)
WO (1) WO2019235975A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120109640A1 (en) * 2006-10-10 2012-05-03 Konstantin Anisimovich Method and system for analyzing and translating various languages with use of semantic hierarchy
US20130024186A1 (en) * 2006-10-10 2013-01-24 Abbyy Software Ltd. Deep Model Statistics Method for Machine Translation
RU2544739C1 (en) * 2014-03-25 2015-03-20 Игорь Петрович Рогачев Method to transform structured data array
RU2571405C1 (en) * 2014-06-27 2015-12-20 Игорь Петрович Рогачев Method for preliminary conversion of structured data array
US20170083508A1 (en) * 2015-09-18 2017-03-23 Mcafee, Inc. Systems and Methods for Multilingual Document Filtering

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110161067A1 (en) * 2009-12-29 2011-06-30 Dynavox Systems, Llc System and method of using pos tagging for symbol assignment
RU2630427C2 (en) * 2016-08-12 2017-09-07 Дмитрий Владимирович Мительков Method and system of semantic processing text documents

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120109640A1 (en) * 2006-10-10 2012-05-03 Konstantin Anisimovich Method and system for analyzing and translating various languages with use of semantic hierarchy
US20130024186A1 (en) * 2006-10-10 2013-01-24 Abbyy Software Ltd. Deep Model Statistics Method for Machine Translation
RU2544739C1 (en) * 2014-03-25 2015-03-20 Игорь Петрович Рогачев Method to transform structured data array
RU2571405C1 (en) * 2014-06-27 2015-12-20 Игорь Петрович Рогачев Method for preliminary conversion of structured data array
US20170083508A1 (en) * 2015-09-18 2017-03-23 Mcafee, Inc. Systems and Methods for Multilingual Document Filtering

Also Published As

Publication number Publication date
RU2685967C1 (en) 2019-04-23
EA202092988A1 (en) 2021-03-18

Similar Documents

Publication Publication Date Title
RU2596599C2 (en) System and method of creating and using user ontology-based patterns for processing user text in natural language
US9588960B2 (en) Automatic extraction of named entities from texts
RU2564629C1 (en) Method of clustering of search results depending on semantics
US9727553B2 (en) System and method for generating and using user semantic dictionaries for natural language processing of user-provided text
Sawyer et al. Shallow knowledge as an aid to deep understanding in early phase requirements engineering
RU2592396C1 (en) Method and system for machine extraction and interpretation of text information
CN104252533A (en) Search method and search device
US20190392035A1 (en) Information object extraction using combination of classifiers analyzing local and non-local features
Krishna et al. A dataset for sanskrit word segmentation
Korobkin et al. Extraction of physical effects practical applications from patent database
RU2685966C1 (en) Method for lingual-logical transformation of a structured data array containing a linguistic sentence
Szwed Concepts extraction from unstructured Polish texts: A rule based approach
RU2685960C1 (en) Method of converting structured data array, containing syntactic units
RU2691836C1 (en) Method of transforming a structured data array comprising main linguistic-logic entities
Gürbüz et al. From organizational guidelines to business process models: Exploratory case for an ontology based methodology
WO2019235975A1 (en) Conversion of a structured data array containing a linguistic sentence
RU2685968C1 (en) Method of transforming a structured data array comprising main lingvo-logical objects (ollo)
WO2019235976A1 (en) Method for the linguistic-logical conversion of a structured data array
Haj et al. Automated generation of terminological dictionary from textual business rules
US11017172B2 (en) Proposition identification in natural language and usage thereof for search and retrieval
Dimitriadis et al. How to integrate databases without starting a typology war: The Typological Database System
Moran et al. Lemon-aid: using lemon to aid quantitative historical linguistic analysis
Kurc et al. Automatic acquisition of wordnet relations by the morpho-syntactic patterns extracted from the corpora in Polish
Bellström et al. Towards the automation of modeling language independent schema integration
Boese et al. Semantic document networks to support concept retrieval

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19815000

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19815000

Country of ref document: EP

Kind code of ref document: A1