WO2019235976A1 - Способ лингво-логического преобразования структурированного массива данных - Google Patents

Способ лингво-логического преобразования структурированного массива данных Download PDF

Info

Publication number
WO2019235976A1
WO2019235976A1 PCT/RU2019/050079 RU2019050079W WO2019235976A1 WO 2019235976 A1 WO2019235976 A1 WO 2019235976A1 RU 2019050079 W RU2019050079 W RU 2019050079W WO 2019235976 A1 WO2019235976 A1 WO 2019235976A1
Authority
WO
WIPO (PCT)
Prior art keywords
linguistic
data structure
lle
smd
identified
Prior art date
Application number
PCT/RU2019/050079
Other languages
English (en)
French (fr)
Inventor
Игорь Петрович РОГАЧЕВ
Original Assignee
Rogachev Igor Petrovich
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from RU2018121116A external-priority patent/RU2685966C1/ru
Priority claimed from RU2018121134A external-priority patent/RU2685960C1/ru
Priority claimed from RU2018121142A external-priority patent/RU2685968C1/ru
Priority claimed from RU2018121139A external-priority patent/RU2691836C1/ru
Application filed by Rogachev Igor Petrovich filed Critical Rogachev Igor Petrovich
Priority to EA202092989A priority Critical patent/EA202092989A1/ru
Publication of WO2019235976A1 publication Critical patent/WO2019235976A1/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Definitions

  • the group of inventions relates to solutions in the field of processing data arrays, in particular, to solutions in the field of processing
  • structured data arrays containing natural language text, in particular, linguistic sentences, and can be used for preliminary transformation of a structured data array to ensure its subsequent processing.
  • D1 published on May 10, 2010 (D1), a method for automatically indexing texts in natural languages is known.
  • the method known from D1 is that the text is segmented in electronic form into elementary units, identifies stable phrases, form sentences, identifies semantically significant objects and semantically significant relationships between them, form many triads for each semantically significant relationship, in which the only triad of the first type corresponds to the relationship established by the semantically significant relationship between the two
  • each of the triads of the second type corresponding to the value of a specific attribute of one of these semantically significant objects
  • each of the triads of the third type corresponding to the value of a specific attribute of the semantically significant relation
  • the method known from D1 does not have sufficient accuracy of indexing text elements in natural language, which, in turn, affects the accuracy of subsequent processing of the text in natural language and the accuracy of the search in the text in natural language. This is mainly due to insufficiently effective preprocessing of text on natural language, which, accordingly, does not allow indexing with sufficient accuracy.
  • a technical problem solved by the present invention is the creation of a method and devices that implement the method and / or systems with increased efficiency of preprocessing natural language text for its subsequent indexation and processing.
  • the technical result achieved by the implementation of the present invention is to increase the efficiency and accuracy of preprocessing natural language text for its subsequent indexation and processing.
  • the CE identity of the linguistic sentence is characterized by the following steps: step 201 of identifying the initial data structure containing the CE, in which the SMD data structure containing the CE and the CE identification data is identified; step 104 of the formation of the next data structure, which form the next data structure of the SMD containing the elements of the aforementioned next data structure, said elements of the third data structure being
  • linguistic objects (LO) of the linguistic sentence formed by identifying them with the mentioned syntactic units, or obtained as a result of the conversion of the mentioned syntactic units, and also represent the identification data of linguistic objects (identification data of the LO], representing for each LO, at least: the value of the linguistic object (the value of the LO] and the serial (ordinal) number (s) of the TE of the linguistic sentence constituting (the components of) the LO; stage and 105 the formation of the final data structure, which form the final data structure of the SMD containing the elements of the said final data structure, and the said elements of the final data structure are logical objects (LogO) of the linguistic sentence, formed by correlating linguistic and logical objects and identified with the aforementioned linguistic objects, and also represent the identification data of logical objects (identification data LogO), representing for each LogO, at least: the value of the logical object (value LogO) and ordinal (ordinal) the number (s) of the TE of the linguistic
  • Embodiments of the present invention relate to methods, devices, systems, and computer-readable storage media for ensuring the efficiency and accuracy of preprocessing natural language text for subsequent indexing and processing.
  • FIG. 1 depicts an exemplary general flowchart for the method 100 of transforming a structured data array containing at least a linguistic sentence that is the original data structure for method 100.
  • FIG. 2 shows an exemplary general flowchart of the steps of step 101 of generating the first data structure.
  • FIG. 3 shows an exemplary general structure of an initial data structure from which a first data structure of a structured data array is formed.
  • FIG. 4 shows an exemplary general structure of the generated first data structure.
  • FIG. 5 shows an exemplary general flowchart for the steps of step 102 of forming a database of linguistic features
  • FIG. 6 shows an exemplary general structure of the generated database of linguistic features (BDLP), which is BDLP of text elements 21 of the linguistic sentence 11.
  • BDLP generated database of linguistic features
  • FIG. 7 shows an exemplary general flowchart stage 103 of the formation of the second data structure SMD.
  • FIG. 8 depicts an exemplary general structure of a generated second data structure of a structured data array.
  • FIG. 9 shows an exemplary general flowchart of the steps of step 104 of generating a third (next for the claimed method) data structure of a structured data array.
  • FIG. 10 shows an exemplary general structure of the generated third data structure of a structured data array.
  • FIG. 11 shows an exemplary general flowchart of step 105 of generating a fourth (final for the claimed method) data structure of a structured data array.
  • FIG. 12 depicts an exemplary general structure of the generated fourth data structure of a structured data array.
  • FIG. 13 shows an exemplary general flowchart of the inventive method 200 for converting a structured data array containing at least syntactic units of a linguistic sentence and identification data of syntactic units, which is the initial data structure for the method 200 in question.
  • FIG. 14 depicts an example general flowchart of an identification step 201 of a transformable data structure containing syntactic units that is the original data structure for
  • FIG. 15 depicts an exemplary general data structure, which is the original data structure for the transform method 200, which is a transformable data structure containing syntactic units.
  • FIG. 16 shows an exemplary general flowchart for the steps of step 202 of generating a fifth data structure of a structured data array, which is the first data structure for the method 200 in question.
  • FIG. 17 shows an exemplary general structure of the database of linguistic features (BDLP) generated as part of step 2021, which is BDLP of text elements 21 of the linguistic sentence 11 contained in elements 22 suitable for transforming a data structure containing syntactic units.
  • BDLP linguistic features
  • FIG. 18 depicts an exemplary general structure of a database of linguistic features (BDLP) generated in step 2022, which is a BDLP of text elements 21 of a linguistic sentence 11 contained in elements 22 suitable for transforming a data structure containing CE.
  • BDLP linguistic features
  • FIG. 19 shows an exemplary general structure of the generated fifth data structure of the structured data array, which is the first for the present conversion method 200.
  • FIG. 20 depicts an exemplary general flowchart of step 203 of generating the sixth data structure of a structured data array, which is the second data structure for the method 200 in question.
  • FIG. 21 depicts an exemplary general structure of a database of linguistic features [BDLP] generated in step 2031, which is a BDLP of text elements 21 of a linguistic sentence 11 contained in elements 61 of a fifth data structure of a structured data array.
  • BDLP linguistic features
  • FIG. 22 shows an exemplary general structure of the sixth data structure of the structured data array generated, which is the second data structure for the present conversion method 200.
  • FIG. 23 shows an exemplary general flowchart of steps 204 of generating a seventh data structure of a structured data array, which is the third data structure for the method 200 in question.
  • FIG. 24 shows an exemplary general structure of the generated seventh data structure of the structured data array, which is the third data structure for the present conversion method 200.
  • FIG. 25 shows an exemplary general flowchart of the inventive method 300 for converting a structured data array containing at least basic linguistic-logical objects (LLL) of a linguistic sentence and LLL identification data,
  • LLL basic linguistic-logical objects
  • FIG. 26 depicts an exemplary general flowchart for identifying a transformable data structure comprising basic linguistic logic objects [OLLO], which is the original data structure for the method 300 in question, that is capable of conversion.
  • Ha of FIG. 27 depicts an exemplary general data structure that is the starting point for the transform method 300, which is a transformable data structure containing basic linguistic objects (LLL).
  • FIG. 28 depicts an exemplary general flowchart of steps 302 of generating the eighth data structure of a structured data array, which is the first data structure for the method 300 in question.
  • FIG. 29 depicts an exemplary general structure of a linguistic feature database (LIB) formed within block 3021, which is a LLLB of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing ALLO.
  • LIB linguistic feature database
  • FIG. 30 shows an exemplary general structure of the generated eighth SMD data structure, which is the first SMD data structure for the present conversion method 300.
  • FIG. 31 shows an exemplary general flowchart of the steps of step 303 of generating the ninth SMD data structure, which is the second data structure for the method 300 in question.
  • FIG. 32 depicts an exemplary general structure of the generated ninth DMD data structure, which is the second SMD data structure for the present conversion method 300.
  • FIG. 33 depicts an example general flowchart of the steps of step 304 of generating the tenth SMD data structure, which is the third data structure for the method 300 in question.
  • FIG. 34 depicts an exemplary general structure of a database of linguistic features [BDLP] generated as part of step 3041, which is a BDLP of text elements 21 of sentence 11 contained in elements 13 of the ninth data structure of the DMD.
  • BDLP linguistic features
  • FIG. 35 depicts an exemplary general structure of the tenth SMD data structure generated, which is the third SMD data structure for the present conversion method 300.
  • FIG. 36 shows an exemplary general flowchart for the steps of step 305 of generating the eleventh SMD data structure, which is the third SMD data structure for the method 300 in question.
  • Ha of FIG. 37 illustrates an exemplary general structure of the generated eleventh SMD data structure, which is the fourth SMD data structure for the present conversion method 300.
  • FIG. 38 depicts an exemplary general flowchart of the claimed method 400 for converting SMDs containing at least basic linguistic entities (LLL) of a linguistic sentence and identification data of LLL, which is the initial data structure for the method 400 in question.
  • LLL basic linguistic entities
  • FIG. 39 depicts an example general flowchart of the steps of step 402 of generating the twelfth SMD data structure, which is the first data structure for the method 400 in question.
  • FIG. 40 shows an exemplary general structure of a database of linguistic features (BDLP) generated as part of step 4021, which is BDLP of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing ALLO,
  • BDLP database of linguistic features
  • FIG. 41 shows an exemplary general structure of the generated twelfth SMD data structure, which is the first for the present conversion method 400.
  • FIG. 42 depicts an example general flowchart of the steps of step 403 of generating the thirteenth SMD data structure, which is the second data structure for the method 400 in question.
  • FIG. 43 depicts an exemplary general structure of a database of linguistic features [BDLP] generated as part of step 4031, which is BDLP of text elements 21 of sentence 11 contained in elements 17 of the twelfth data structure of the DMD.
  • BDLP linguistic features
  • FIG. 44 shows an exemplary general structure of the generated thirteenth SMD data structure, which is the second SMD data structure for the present conversion method 400.
  • FIG. 45 shows an exemplary general system diagram for
  • FIG. 1 by way of example, but not limitation, a general flowchart of the steps of a method 100 for transforming a structured data array (SMD) containing at least a linguistic
  • the claimed method 100 for transforming the DMD containing at least a linguistic sentence characterized by: performing step 101 of the formation of the first data structure, which form the first data structure of the SMD containing the elements of the first data structures, wherein said elements of the first data structure are text elements (TE) of a linguistic sentence, and
  • identification data of text elements (identification data of TE), representing for each TE, as an example, but not
  • CE syntactic units
  • identification data of syntactic units representing for each CE, as an example, but not limitation: the value of the syntactic unit (CE value) and ordinal (ordinal) number (s) of TE of linguistic sentences that make up CE; the execution of step 104 of the formation of the third (next for the claimed method) data structure, which form the third data structure of the SMD containing elements of the said third data structure,
  • linguistic objects (LO) of the linguistic sentence formed by identifying them with the mentioned syntactic units, or obtained as a result of the conversion of the mentioned syntactic units, and also represent the identification data of linguistic objects (identification data of the LO), representing for each LO, as an example, but not limitation: the value of the linguistic object (the value of LO) and the serial (ordinal) number (s) of the TE of the linguistic sentence, constituting ( components) LO; performing step 105 of forming a fourth (final for the claimed method) data structure, on which a fourth SMD data structure is formed containing elements of said fourth data structure, said
  • the elements of the fourth data structure are logical objects (LogO) of a linguistic sentence, formed by correlating linguistic and logical objects and identified with the aforementioned linguistic objects, and also represent the identification data of logical objects (LogO identification data),
  • FIG. 2 by way of example, but not limitation, a general flowchart of the steps of step 101 of generating the first data structure is shown.
  • Step 101 is characterized by: performing step 1011 of identifying the source
  • SMD data structures on which elements 11 of the initial SMD data structure are identified which are linguistic sentences 11 (LP 11); by performing step 1012 of identifying the elements 21 of the first SMD data structure, at which the elements 21 of the first SMD data structure are identified, which are text elements (TE) of the linguistic sentence 11, as well as the identification data of the elements 21, which are for each TE, as an example, but not restrictions: element value 211 21 the first data structure SMD and serial number 212 of the element 21 of the first data structure SMD, and form the first data structure SMD.
  • TE text elements
  • FIG. 3 by way of example, but not limitation, the general structure of the original data structure from which the first SMD data structure is formed is shown.
  • the source data is a SMD containing elements 11 of the original data structure, which are linguistic
  • elements 11 relate to any field of activity and any purpose. Elements 11 lack their unique names characterizing their practical use.
  • elements 11, as an example, but not limitation, can be referred to as “LP1”, “LP2”, “LPZ”, “LPP”, where n> 1 is the serial number of the element in
  • Linguistic sentence is
  • the PL can contain the following objects: numbers (numbers), punctuation marks and indices (constructions of letters, numbers and signs). All of the above objects are components of LP 11 (components of LP) and in the original data structure are separate elements prepared in advance and placed in the original data structure not in the form of linguistic text, but in the form of a structured array (list, list and the like) of individual LP. Such preparatory steps may be carried out by any method known in the art and, accordingly, are not further described.
  • the identification of the elements 11 of the original data structure in step 1011 is reduced to providing a classification of the elements that make up the original data structure as linguistic sentences (LP 11).
  • the components of the drug are all numbers (numbers), punctuation marks and indices (constructions of letters, numbers and signs) contained in the drug and separated by a space.
  • the original data structure is the result of a plurality of elements 11 identified in step 1011.
  • FIG. 4 by way of example, but not limitation, the general structure of the generated first data structure is shown.
  • the first data structure is an SMD containing elements 21 of the first data structure, which are the text elements (TE 21) of the linguistic sentence 11 and the TE identity.
  • the text elements 21 of the linguistic sentence 11 lack their unique names characterizing their practical use.
  • elements 21, as an example, but not limitation, can be referred to as "TE", “TE2", “TEZ”, “TEP", where n> 1 is the serial number of the element in the linguistic sentence 11.
  • TE 21 of the linguistic sentence are components of the PL, that is, words, numbers (numbers), punctuation marks or indices (constructions of letters, numbers and signs) contained in PL 11 and separated by a space.
  • the text elements 21 of the linguistic sentence 11 have TE identification data, such as, by way of example, but not limitation: TE value 211 and TE number number 212.
  • TEQs The value of 211 TEQs is, as an example, but not limitation, the set of letters, numbers, and / or punctuation marks that make up TEQs.
  • Serial number 212 of the TE is the serial number of TE 21 in the linguistic sentence 11.
  • the formation of the text elements 21 of the first data structure during step 1012 is performed by identifying individual words or groups of words, numbers (numbers) or indices, the numbers (numbers) or indices not separated by a space, as well as punctuation marks. Moreover, it is preferable that the last punctuation mark in linguistic sentence 11 is not taken into account and not
  • the identification of the value 211 of the text element 21 of the first data structure during step 1012 is carried out by registering the characters (letters, numbers and / or punctuation marks) that make up the text element 21. Identification of the serial number 212 of the text element 21 of the first
  • step 1012 data structures during step 1012 are produced by calculating the location of the TE 21 in the linguistic sentence 11.
  • the first text element 21 in the linguistic sentence 11 receives the serial number “1”, and all
  • FIG. 5 by way of example, but not limitation, a general flowchart of the steps of step 102 of forming a database of linguistic features, which is a database of linguistic features of text elements 21 of sentence 11, is shown.
  • Step 102 is characterized by: step 1021 of forming linguistic features of text elements 21 of sentence 11 , on which for the linguistic analysis of the text element provide the identification data of the element 21 (value 211 and serial number 212 TE) and get linguistic ha characteristics 213 of the text elements 21 of the linguistic sentence 11, as well as the meanings of said linguistic characteristics 2131; performing step 1022 of creating a database of linguistic features (BDLP), on which form BDLP of text elements 21 of the linguistic sentence 11.
  • BDLP database of linguistic features
  • the linguistic feature of the text element 21 will be all the linguistic characteristics 213 obtained for the text element 21 during the step 1021, having linguistic characteristics 2131.
  • FIG. 6, by way of example, but not limitation, the general structure of the generated database of linguistic features (BDLP) is shown, which is BDLP of text elements 21 of linguistic sentence 11.
  • the first part (main) of linguistic characteristics 213 of text elements 21 of linguistic sentence 11 may contain morphological, syntactic and semantic characteristics, while the totality of the values of all the linguistic characteristics of the text element is for each TE 21 of the linguistic sentence 11 of it a distinctive (unique) linguistic feature in the linguistic sentence.
  • Morphological characteristics preferably indicate the morphological characteristics of TE 21 of the linguistic sentence 11, which can be classified, as an example, but not limited, by the level of nesting (genus-species-subspecies).
  • the kinds of TE 21 of the linguistic sentence 11 are preferably a word, a number, punctuation marks, other signs;
  • morphological species - part of speech for words], type of number (Arabic, Roman], type of punctuation mark (dot, comma, etc.), type of other sign; morphological subspecies - gender, number, case of parts of speech and the like (for words), number, binary code, index and the like (for numbers).
  • the syntactic characteristics preferably indicate many syntactic features of TE 21 of the linguistic sentence 11, among which, by way of example, but not limitation, the following syntactic characteristics of TE 21 of the linguistic sentence 11 can be highlighted:
  • syntactic role predicate, subject, and the like.
  • syntactic parent syntactically main word
  • syntactic descendants syntactically subordinate words
  • syntactic compositional connection the presence of another TE having the same syntactic role and the same syntactic parent.
  • the semantic characteristics preferably indicate the semantic characteristics of TE 21 of the linguistic sentence 11, among which, by way of example, but not limitation, the following semantic characteristics of TE 21 of the linguistic sentence 11 can be distinguished: semantic group (a group of words that can be attributed to one class, gender, type or subspecies of objects or actions of the surrounding world with coincidence of signs
  • linguistic sentences 11 are preferably produced at step 1021 by a comprehensive linguistic analysis of each text element 21 of the linguistic sentences 11, representing, by way of example, but not limitation, TE analysis based on the TE location in the sentence structure, its meaning, type, classification of its conceivable image and analysis of its relationships with other textual elements in the sentence.
  • a comprehensive analysis preferably the formation of the main linguistic characteristics 213 and their entry at 1022 into the BDLP as a list of the first part of the linguistic characteristics 213 with the values of these characteristics 2131.
  • one of the linguistic characteristics 213 may be a “syntactic role”, with the value 2131 of this linguistic characteristic “subject ".
  • Such an analysis can be performed by any method known in the art and, accordingly, is not described in further detail below.
  • such an analysis can be performed traditionally by a specialist linguist, or using a software algorithm of a linguistic (syntactic) processor.
  • a statistical processor neural network
  • a database of linguistic features is formed, which is a BDLP of the text elements 21 of the linguistic sentence 11.
  • the first part of the linguistic characteristics of 213 text elements 21 of the linguistic sentence 11 and their meaning 2131 forms unique linguistic features of the text elements 21 of the linguistic
  • FIG. 7 depicts a General diagram of the steps of step 103 of the formation of the second data structure SMD.
  • Step 103 is characterized by: performing step 1031 of identifying and
  • FIG. 8 by way of example, but not limitation, the general structure of the generated second SMD data structure is shown.
  • the second SMD data structure is a SMD containing elements 31 and (or) elements 32, which are the syntactic units (CE) of the linguistic sentence 11 and the CE identification data, representing for each CE, as an example, but not limitation, the value 311 element 31 and (or) value 321 of element 32, as well as serial (ordinal) number (s) 312 and (or) 322 TE 21 of the linguistic sentence constituting
  • CE syntactic units
  • the syntactic units (CE) of sentence 11 are preferably single words and groups of words connected by syntactic link.
  • the CE of the linguistic proposal 11 has their unique names characterizing them (UN CE), which have practical use, as an example, but not limitation:
  • elements 31 and 32 are referred to as unique names and, as an example, but not limited to, may be referred to as “UN CE p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN CE, not previously met in a linguistic sentence.
  • n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN CE, not previously met in a linguistic sentence.
  • CEs of four unique names: “subject” - one CE, “predicate” - two CEs, “definition” - one CE and “addition” - three CEs .
  • the data structure will contain one element “subject”, which will have the index “1”, as well as two elements “predicate”, which will have the corresponding indexes “1” and “2”, and the index “1” will have that “Predicate”, which has a lower serial number of the fuel cell, as well as one element “definition”, which will have the index “1”, as well as three elements
  • CEs can consist of one word or several words.
  • a single-word CE (one text element 21 of sentence 11) is always element 31, which is the original syntactic object (ISO), that is, a sentence member established as a result of parsing.
  • ISO syntactic object
  • element 31 of the second data structure which is ISO
  • ISO it means the ISO.
  • the ISO list is not a predefined list, but a variable list that depends on predefined parameters.
  • the same word (text element 21 of sentence 11) in sentence 11 may be
  • ISO 31 will be assigned to one unique name of the syntactic units of ISO 31
  • Syntactic units of several words are sometimes ISO (element 31), and sometimes
  • the ISO “predicate” - “could be fulfilled” - consists of three text elements 21 of sentence 11 due to the linguistic features of the formation of the predicate, which, in addition to the verb “completed”, can have the auxiliary verb “to be” and modality (modal verb) "could.”
  • Syntactic construct 32 always consists of several words (text elements 21 of sentence 11) and is a construct of syntactically related ISOs (elements 31), as an example, but not limitation, the syntactic construction (UN SC) is
  • the identification or formation of the first element 31 of the second SMD data structure in step 1031 is performed by a comprehensive analysis of the values of 2131 linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11.
  • Elements 31 of the second SMD data structure, which are ISO are identifiable (if they consist of one TE ) or formed (if they consist of several fuel cells) within the framework of step 1031, in fact, are identified with relevant ISO.
  • Relevant ISOs are an actual list of ISOs with current linguistic characteristics, pre-installed and recorded in the first user database (first PBB), which is thus a database of current syntactic units (CE) containing relevant ISO and current SK.
  • the identification and formation (if required) of ISO elements 31 is performed by comparing the values 2131 of the linguistic characteristics 213 of the text elements registered in the database of linguistic features (BDLP) 21
  • characteristics of relevant ISO identified text element identify and, if necessary, carry out its formation as the corresponding ISO (element 31).
  • a comprehensive analysis can be performed by any known from the prior art by the method and, accordingly, is not further described in detail.
  • a comprehensive analysis can be performed traditionally by a specialist linguist, or using a software algorithm of a linguistic (syntactic) processor.
  • a statistical processor neural network
  • the formation of the second element 32 of the second SMD data structure within the framework of step 1032 is carried out by a comprehensive analysis of the values of 2131 linguistic characteristics of 213 text elements that are ISO (elements 31). Upon revealing the linguistic characteristics of the text elements that make up the ISO that correspond to the description of the syntactic structure (SC) contained in the database of relevant CEs, the SC (elements 32) are formed from the two or more ISOs mentioned (elements 31).
  • a comprehensive analysis can be performed by any method known in the art and, accordingly, will not be described in further detail below. For example, without limitation, such a comprehensive analysis can be performed traditionally by a specialist linguist, or using a software algorithm
  • (text) element (s) 21 of the linguistic sentence 11 constituting the (component) element 31 is identified as the value 311 of element 31 (ISO), and the serial number (numbers) 212 of the mentioned (mentioned) text (text) element (s) ) 21 of the linguistic sentence 11 constituting the (component) element 31 is identified as the serial number of the text element (s) constituting the (element) element 31 (ISO).
  • the identification of the value and serial numbers of the TE element 32 (SC) of the second SMD data structure within the framework of step 1032 is carried out as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting element 32, identified as the value 321 of the element 32 (SK), and the serial numbers 212 of the text elements 21 of the linguistic sentence 11 constituting the element 32 are identified as the serial numbers of the text elements 322 constituting the element 32 (SK).
  • the formation of the second SMD data structure during step 1033 is performed by combining in one data structure the elements 31 of the second SMD data structure and the elements 32 of the second SMD data structure, as well as their identification data according to the principles and methods known from the prior art, which, respectively further not described in detail.
  • Necessities are made by organizing a request to the BDLP, which is formed as part of step 102, consisting of the identification data of the TEs that make up ISO 31, and obtaining the values of 2131 linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11 of which element 31 (ISO) consists.
  • Identification of the linguistic characteristics of TEs that make up the elements 32 (SC) of the second SMD data structure and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 102, which consists of identification data of TEs that make up SC 32 and obtaining values 2131 of linguistic characteristics 213 text elements 21 of the linguistic sentence 11, of which the element 32 (SC) consists.
  • the linguistic features of the elements 31 (ISO) and 32 (SC) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 31 (ISO) and 32 (SC) are composed.
  • an SMD is formed containing at least the syntactic units (CE) of the linguistic sentence and the identification data CE of the linguistic sentence. Such SMD may subsequently be
  • such an array of data can contain both CEs as such and particular variants of CEs, such as, but not limited to: basic linguistic-logical objects (ALLO)
  • IP LLK simple linguistic-logical constructions
  • PLCK simple linguological constructions
  • IP LLK initial complex linguistic constructions
  • SLLC complex linguistic-logical constructions
  • ALLE main linguistic-logical elements
  • ILLE original linguistic-logical elements
  • FIG. 9, depicts a General diagram of the steps of step 104 of the formation of the third (next for the claimed method) data structure SMD.
  • Step 104 is characterized by:
  • step 1041 by performing step 1041 of identifying the first element of the third SMD data structure, on which the elements 41 of the third SMD data structure are identified or also the identification data of the elements 41, representing for each element 41, as an example, but not limitation, the value 411 of the third element 41 SMD data structures and serial number (s) 412 TE of the linguistic sentence 11 constituting the component 41; performing step 1042
  • the identification data of the elements 42 which, for each element 42, is, by way of example, but not limitation, the value 421 of the element 42 of the third SMD data structure and the serial number (s) 422 of the TE of the linguistic sentence 11 constituting the (component) element 42; the execution of step 1043 of the formation of the third SMD data structure, in which the third SMD data structure is formed by combining
  • FIG. 10 by way of example, but not limitation, the general structure of the generated third SMD data structure is shown.
  • the third SMD data structure is a SMD containing elements 41 and / or elements 42, which are linguistic objects (LO) of the linguistic sentence 11 and the identification data of the LO, representing for each LO, as an example, but not limitation, the value 411 element 41 and / or value 421 of element 42 (value of elements 41 and (or) 42), as well as serial (ordinal) number (s) of 412 and (or) 422 text elements 21 linguistic sentences constituting (constituting) element 41 and (or) element 42 (serial numbers of TE elements 41 and (or) 42).
  • LO linguistic objects
  • a linguistic object (LO) is a special syntactic unit (ELE).
  • the LO of the linguistic sentence 11 has their unique names characterizing them (UN LO), which have practical use as an example, but not limitation, is: "a simple sentence without homogeneous members and turns", "the first phrase” and the like.
  • elements 41 and 42 are referred to by unique names, as an example, but not limitation, can be referred to as “UN LO p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LO, not previously met in
  • LO is preliminarily formed as part of a linguological transformation, the result of which is the correlation of linguistic and logical objects and the transformation
  • the linguistic-logical transformation mechanism allows, on the basis of a previously known idea of the logical model of the sentence (the logical structure of a simple uncomplicated sentence identical to a simple proposition), to establish a correlation (relationship) between the logical objects of the sentence and the syntactic units of the sentence.
  • a table of interconnected (linguistic and logical) objects in each individual case, such EEs are formed, which are the desired linguistic objects (the sought-after LO) that can be identified with the desired logical objects (the sought LogO).
  • the sought-after LO formed in this way can be completely identical to one or several CEs (such a sought LO will generate the first linguistic object (the first LO), which is an element of 41 linguistic sentences 11), or it can be a derived syntactic object obtained by converting one or more CEs to an object that will be an object identical to the desired LO (such a sought LO will generate a second linguistic object (second LO), which is an element of 42
  • Searched LogO can be separate logical entities or groups of logical entities that are
  • judgments (that which is affirmed or denied about the subject of judgment).
  • other logical entities can be formed that reflect the needs of the current applied problem and are used as part of the linguistic-logical transformation.
  • a predicate of a judgment separate more functionally homogeneous logical entities can be distinguished than the predicate of a proposition itself, namely, “the action of a predicate of a proposition”, “an object of a predicate of a proposition” and “circumstances of a predicate of a proposition”.
  • the identification of element 41 (first LO) of the third SMD data structure in step 1041 is performed by analyzing the composition of the desired LO.
  • the composition of the required LOs is preliminarily set in the form of a CE of a unique name (UN CE) or a list of CE of unique names with an indication of the method
  • LO which, without being limited to, can be one of the following methods: identification with the installed (several installed) CE or conversion of the installed (installed) CE according to the previously described method.
  • the aforementioned composition of the required LOs and methods of forming the LOs form a second user database (the second PBB), which is thus the database of the desired LOs, which contains, inter alia, the linguistic characteristics of the text elements from which the desired LOs are formed.
  • the analyzed LO consists of identifiable CEs (elements 31 or elements 32), then such LOs are identified (if identical to one CE) or formed (if identical to several CEs) as element 41 of the third SMD data structure.
  • the syntactic units (elements 31 or elements 32) of the second SMD data structure identified in the analysis of the composition of linguistic objects in accordance with predefined parameters
  • element 41 of the third SMD data structure contained in the description of the desired linguistic objects are identified with the first LO (first linguistic object (element 41 of the third structure SMD data)), due to which an element 41 of the third SMD data structure is formed.
  • An additional part of element 41 of the third SMD data structure can be service parts of speech (prepositions, conjunctions, particles) and punctuation marks located between syntactic units combined under element 41 of the third SMD data structure in accordance with the method
  • the formation of the first LO set by the user. If, as a result of the analysis of the composition of a particular LO, it is established that the analyzed LO consists of converted CEs, then such a linguistic object will belong to the elements 42 of the third SMD data structure (second LO) and will be formed as part of step 1042. Formation of element 42 of the third SMD data structure ( the second LO) in the framework of step 1042 is produced by converting CE,
  • Converting CE to elements 42 of the third SMD data structure is an optional step for the present conversion method.
  • the present method of converting a structured data array can be implemented with sufficient efficiency and accuracy even if only element 41 of the third SMD data structure is identified, provided that all the required LOs generate only the first LO, which is an element 41 of linguistic sentence 11.
  • Identification of the value and serial number (s) of the TE, element 41 (first LO) of the third SMD data structure within step 1041 is performed as follows: value (values) 311 or 321 of the element (s) 31 or 32 of the linguistic sentence eleven,
  • identified (identified) with element 41 (first LO) are identified as ordinal ( ordinal) number (s) 412 of the text (text) element (s) constituting (making) the element 41 (first LO). If the formation of element 41 is carried out according to the requirements of the second PDU by combining several CEs, then the values and serial numbers of TE of service parts of speech are added to the values and numbers of TE of element 41 (first LO) of the third data structure of SMD (prepositions, conjunctions, particles) and punctuation marks between the combined CEs.
  • the identification of the value and serial (serial) numbers of the TE of element 42 (second LO) of the third SMD data structure within the framework of step 1042 is performed as follows: the value (values) of the converted CE (from element (elements) 31 and (or) 32 of the linguistic sentence 11), identified (identified) with element 42 (second LO),
  • element 42 (identified) with element 42 (second LO) is identified as the serial number (s) 422 of the text (text) element (s) constituting (making up) element 42 (second LO).
  • the formation of the third SMD data structure during step 1043 is performed by combining in one data structure the elements 41 of the third SMD data structure and the elements 42 of the third SMD data structure, as well as their identification data according to the principles and methods known from the prior art, which, respectively further not described in detail.
  • Identification of the linguistic characteristics of TEs comprising the elements 41 (first LO) of the third SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP generated in step 102, consisting of TE identification data constituting the first LO 41 and receiving values 2131 of the linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11, of which the element 41 (the first LO) consists.
  • Identification of the linguistic characteristics of TEs that make up the elements 42 (second LO) of the third SMD data structure and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 102, which consists of identification data of TEs that make up the second LO 42 and obtaining 2131 linguistic values characteristics 213 of the text elements 21 of the linguistic sentence 11 of which element 42 (the second LO) consists.
  • the linguistic features of elements 41 (first LO) and 42 (second LO) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 41 (first LO) and 42 (second LO).
  • the formation of the element of the fourth (final for the claimed method) data structure in which the elements 51 of the fourth data structure of the DMD are formed, as well as the identification data of the elements 51, which for each element 51, as an example, but not limitation, the value 511 of the element 51 of the fourth structure SMD data and serial (serial) number (s) 512 TE of linguistic sentence 11, constituting
  • FIG. 12 by way of example, but not limitation, the general structure of the generated fourth SMD data structure is shown.
  • the fourth SMD data structure is a SMD containing the elements 51 of the fourth SMD data structure, which are logical entities (LogO) of the linguistic sentence 11 and the LogO identification data, which for each LogO, as an example, but not limitation, the value 511 of the element 51 Fourth SMD Data Structure
  • Logical objects are logical entities and
  • data elements 51 are referred to by unique names, as an example, but not limitation, can be referred to as “UN LogO p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LogO, earlier not found in a linguistic sentence ent in a linguistic sentence. Further, when mentioning LogO as an element of the fourth data structure or element 51 of the fourth data structure, it means the UN LogO.
  • the array of logical objects of the proposal is a different, non-linguistic a way of registering the meaning of what is being discussed in a linguistic sentence. Unlike a linguistic sentence, the meaning of which can be preserved only if all the text elements of the sentence are registered in one place (as a single unit of information), an array of logical objects allows storing the same information without loss of meaning in a divided form, in many independent places of information storage (as an array of logical objects). Moreover, the formation of an array of logical objects allows not only to divide the single information into parts, but also to systematically structure these parts for any transformed within the framework of this method
  • search and analysis of information can technically be carried out not in a single volume of source information (linguistic sentence), but only in certain logical parts of this information, the characteristics and requirements of which correspond to the logical essence and logical subject of the search or analysis.
  • this method of storing information significantly reduces the volume (zone) of search and analysis, which leads to a decrease in time and an increase in the quality (relevance, accuracy) of search and analysis.
  • step 105 The formation of the element 51 (LogO) of the fourth SMD data structure in step 105 is performed using the third SMD data structure containing linguistic objects (LO) and a correlation database
  • the third PBB is formed for linguistic-logical conversion previously.
  • the third PBB is a list of the necessary logical entities that can be highlighted in a linguistic sentence and into which it can ultimately be divided.
  • the third PBB contains a list of linguistic objects
  • a logical object 51 correlated with the selected linguistic an object 41 or 42 in the third data structure selects a separate LO (from the list of LOs) and using the third PBB, a logical object (UNLOGO) correlated with UNLO is detected, as an example, but not limitation, it is selected from the third data structure of the LO with a unique name (UN LO) “the first phrase” (a phrase consisting of a simple sentence without homogeneous members and turns (for example, subject) and all words dependent on it)) and send this UN LO as a query to the third PBB to search for the selected UN LO in the list unique aimenovany available there LO.
  • VL LO is detected (for example, “the first phrase”)
  • a VL of the logical object identified with it is obtained (in the given example, VL LogO is the “subject of judgment”).
  • VL LogO is the “subject of judgment”.
  • the value (s) 211 of the text element (s) 21 of the linguistic sentence 11 constituting (the components) element 41 or 42 correlated with element 51 are identified as the value 511 of element 51 (LogO), and the serial (ordinal) number (numbers) 212 of the said (mentioned) textual element (s) 21 of the linguistic sentence 11 constituting
  • element 41 or 42 correlated with element 51 is identified as the serial number (s) of the text (text) element (s) 512 constituting the element 51 (LogO).
  • step 105 The formation of the fourth SMD data structure during step 105 is performed by combining in one data structure the elements 51 of the fourth SMD data structure, as well as their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
  • Needs are made by organizing a request to the BDLP, which is formed as part of step 102, consisting of the identification data of the fuel cells, constituting LogO 51, and obtaining values 2131 of the linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11, of which the element 51 (LogO) consists. Moreover, as previously described by linguistic
  • signs of elements 51 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 51 (LogO) are composed.
  • CE syntactic units
  • FIG. 13 by way of example, but not limitation, a general flow chart of the steps of the inventive SMD conversion method 200 is shown, comprising at least the syntactic units (CE) of the linguistic sentence and the identity of the CE being the source
  • the claimed method 200 for converting an SMD containing at least a linguistic sentence CE and CE identification data is characterized by: performing an identification step 201 of a transformable data structure containing a CE, in which an SMD data structure containing elements of said transformable data structure containing CE, which is the original data structure of the DMD within
  • said elements of a data structure suitable for conversion being syntactic units (CE) of a linguistic sentence and CE identification data;
  • LLE identification data representing for each LLE, as an example, but not limitation: the meaning of LLE and ordinal (ordinal) number (s) of the TE of the linguistic proposal constituting
  • elements of the said sixth structure of the SMD are groups of linguistic logical units (LLE groups) of a linguistic sentence
  • the step 204 of forming the seventh SMD data structure which forms the seventh SMD data structure, which is the final SMD data structure for the method 200 under consideration, containing elements of the seventh SMD data structure, said elements of the seventh SMD data structure being the main linguistic-logical objects ( OLLO) a linguistic sentence formed from LLE groups by eliminating homogeneities in LLE groups, and also represent the identification data of the LLLE, representing amounts to the each OLLO, as an example, but not limited to: the value of OLLO and serial (serial) number (s) TE linguistic offer amounts to the each OLLO, as an example, but not limited to: the value of OLLO and serial (serial) number (s) TE linguistic offer amounts
  • FIG. 14 by way of example, but not limitation, a general flowchart is shown for performing a transformable data structure containing syntactic unit (CE) data structure 201 that is the original data structure for the method 200 in question.
  • 201 is a process for identifying a data structure suitable for conversion containing CE, on which the elements 22 of the data structure suitable for transformation containing CE are identified, as well as the identification data of the elements 22, which are for of each element 22, as an example, but not limitation, the value 221 of element 22 is suitable for converting a data structure containing CE and serial number (s) 222 TE of linguistic sentence 11, constituent element (s) 22.
  • the original data structure is a DMD containing elements 22 of a transformable data structure containing CE,
  • CE syntactic units
  • CE identification data representing for each CE
  • the value 221 of element 22 is suitable for converting a data structure containing CE and serial number (s) 222 of the linguistic proposals constituting (constituting) the CE, which, by way of example, but not limitation, have been described previously with reference to FIG. 8 ways 100.
  • Elements 22 of the linguistic sentence 11 have
  • elements 22 are referred to by unique names and, as an example, but not limited to, may be referred to as “UN CE p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN CE not previously seen in a linguistic sentence.
  • CE can be of two types: source syntactic objects (ISO), that is, syntactic units - members
  • Elements 22 of a transformable data structure containing CE are a plurality of ISO
  • ISO 22 in a transformable data structure containing CEs are separate elements prepared in advance and placed in a convertible data structure containing CE in the form of a structured array (list, list, etc.) ) individual ISO.
  • a structured array list, list, etc.
  • the value 221 of ISO 22 is one or more text elements (TE 21) of proposal 11 of which ISO is composed.
  • ISOs consist of one TE 21, with the exception of some ISOs.
  • the ISO “predicate” may consist of three TE 21 - “could be completed.”
  • the ISO “predicate” consists of three text elements due to the linguistic features of the formation of the predicate, which, in addition to the verb “completed”, can have the auxiliary verb “to be” and modality
  • the identification of the value 221 of the element 22 (ISO) suitable for converting the data structure containing the CE during step 201 is performed by registering the character set of the TE 21 of proposal 11, constituting
  • identification of the ordinal (ordinal) number (s) of 222TE, constituting (constituent) element 22 (ISO) of a suitable data structure containing CE during step 201 is performed by registering the ordinal (ordinal) number (s) mentioned TE in accordance with its (their) location in the linguistic sentence, provided that the first TE in the linguistic sentence has a serial number of "1", and all subsequent TE have a serial number greater by one than the previous sequence number its TE.
  • a transformable data structure containing CE that is the starting point for the present transform method 200 is the result of a plurality of elements 22, their values 221 and sequence numbers 222 of the FCs constituting the elements 22 identified in step 201.
  • the identification of the linguistic characteristics of TEs comprising the elements 22 (ISO) suitable for converting a data structure containing CE and their values, if necessary, is carried out by organizing a request in BDLP, formed in the framework of step 102, consisting of the identification data of TEs that make up ISO 22, and obtaining the values of 2131 linguistic characteristics of 213 text elements 21 of the linguistic sentence 11, which consists of element 22 (ISO). Moreover, as described previously,
  • the linguistic features of elements 22 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11 of which the elements 22 (ISO) are composed.
  • Step 202 is characterized by: performing step 2021 of generating values 2141 of the second part of linguistic characteristics 214 of text elements 21 constituting elements 22 of a transformable data structure containing CE on which values 2141 of the second part are formed
  • step 2021 by performing step 2022 of generating values 2231 of the third part of the linguistic characteristics of 223 text elements 21 constituting elements 22 of a transformable data structure containing CE on which the types of element 22 of a transformable data structure containing CE are identified for which some values of linguistic characteristics need to be changed, form the mentioned values of 2231 of the third part of the linguistic
  • BDLP database of linguistic features
  • the syntactic role of ISO 22 is the function of a word in a sentence, which is defined as part of the interconnections of words in a sentence.
  • the syntactic role of ISO 22 determines which member of a sentence a word is and in which syntactic relations it consists of other words. One and the same form of a word can perform different functions, that is, be different members of a sentence.
  • the logical role of ISO 22 is a syntactic role identified with the logical function of a word in a simple proposition. View
  • a simple proposition is a logical entity, which is the primary logical construction of thinking, necessarily containing elements of a simple proposition - the subject of the proposition
  • the subject judgments is one object of the world
  • the predicate of judgment consists usually of an action and many objects that are in a certain relationship with each other, which ultimately serves as a predicate of judgment, that is, it explains what is affirmed or disproved about the object judgments. Therefore, the predicate of judgment can be divided into logical functionally homogeneous parts (logical objects), as an example, but not restrictions, such as an action, an object, and
  • the check is a comparison of the values 2131 of the first part of the linguistic characteristics 213 of the text elements 21 constituting the elements 22 with the predefined values of the predefined linguistic characteristics of the text elements 21 constituting the ISO 22.
  • Conditions are predefined for the verification, such as, as an example, but not limitation: lists of ISO 22 pairs for which the syntactic and logical roles may not coincide, as well as signs of a mismatch of the syntactic and logical roles (some values linguistic characteristics of the specified ISO 22, in the presence of which ISO 22 is identified as ISO 22 with a mismatch of syntactic and logical roles).
  • ISO 22 which successfully pass
  • ISO 22 syntax matching and logical roles SL-identical to ISO 22, that is, syntactically logical identical to ISO.
  • ISO 22 which do not pass the test due to the fact that their mentioned roles do not match, is identified as ISO 22 with a mismatch of syntactic and logical roles (SL non-identical ISO 22, i.e. syntactically logical non-identical ISOs).
  • SL non-identical ISO 22 i.e. syntactically logical non-identical ISOs
  • the ISO in the form of a verb has a syntactic role - the "predicate”, and the ISO in the form of participle - the syntactic role of the "agreed definition".
  • both the ISO and the other are syntactically the main words in the same element of a simple proposition “the action of the predicate of proposition”, that is, they have the same logical role.
  • the ISO in the form of a verb passes the verification of the identity of the syntactic and logical roles, since the “verb” is what expresses the action.
  • BDLP database of linguistic features
  • FIG. 18 by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated in step 2022 is shown, which is the BDLP of text elements 21 of the linguistic Proposals 11 contained in elements 22 of a transformable data structure containing CE.
  • BDLP generated in step 2022 differs from BDLP formed in step 2021 in the presence of values 2231 of the third part of linguistic characteristics 223 indicating the type of element 22 (ISO) and the actual values of some linguistic characteristics of 213 text elements making up element 22 (ISO) .
  • SL-non-identical ISO 22 can be mutable and unchanged, that is, such SL-non-identical ISO 22, for which values 2131 must be changed in accordance with a predetermined condition some linguistic characteristics 213 or not changed.
  • a predetermined condition some linguistic characteristics 213 or not changed.
  • the mentioned conditions and requirements are established in the fourth PBB.
  • the formation of the third part of the linguistic characteristics 223 and their values 2231 for the text elements 21 of the linguistic sentence 11 contained in the elements 22 is carried out at step 2022 in order to identify various types of ISO 22 based on syntactic-logical identity (SL-identity) and the formation of a duplicate SL-non-identical ISO 22 by a comprehensive analysis of the conditions established in the fourth PBB, and based on the results of the verification of ISO 22 on SL-identity.
  • SL-identity syntactic-logical identity
  • the first type of ISO 22 (SL-identical) has all of their original values 221 and the numbers of text elements 222, as well as their linguistic characteristics 213 and 214 with values 2131 and 2141. In connection with this, the values of 2231 linguistic characteristics 213 for such ISO 22 are absent.
  • the second type of ISO 22 (SL-non-identical variable) their original value 221 and the number of text elements 222, as well as the second part of their linguistic characteristics 214 with values of 2141, remain unchanged, but the values of 2131 of some linguistic characteristics 213 of the first part are changed.
  • the values 2231 of the linguistic characteristics 223 instead of the variable values 2131 of some linguistic characteristics 213 of such ISO 22 are indicated as set in the fourth PBB.
  • the third type of ISO 22 (SL-non-identical unchanging) retains all their original values 221 and the numbers of text elements 222, as well as their linguistic characteristics
  • transformations of the data structure containing CE are introduced into the BDLP of the text elements 21 of the linguistic sentence 11 formed in step 2021, thereby forming the BDLP of the text elements 21 of the linguistic sentence 11 formed in the step of 2022. Moreover, all three parts (213,
  • FIG. 19 by way of example, but not limitation, depicts a general the structure of the fifth SMD data structure generated, which is the first for the present conversion method 200.
  • the fifth SMD data structure is the first for the present conversion method 200.
  • linguistic sentence 11 and LLE 61 identification data representing for each LLE, as an example, but not limitation, the value 611 of element 61 of the fifth data structure and the serial number (s) of 612 TEs representing (constituent) LLE 61.
  • U LLE 61 of the linguistic sentence 11 there are unique names characterizing them (UN LLE), which have practical use as an example, but not restrictions: “subject”, “predicate”, “direct complement” and the like.
  • elements 61 are referred to by unique names, and, as an example, but not limitation, can be referred to as “UNLLE p”, where n> 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LLE, not previously seen in a linguistic sentence.
  • a linguistic-logical unit (LLE 61) is a syntactic unit of the ISO type, by which a check is made for the identity of its syntactic and logical roles in a linguistic sentence. There can be two types of LLE 61: the first type is
  • the second type of LLE 61 corresponds to all ISO 22 suitable for converting data structures containing CE.
  • the second type of LLE 61 corresponds to those of ISO 22 suitable for conversion of the data structure containing CE, which are assigned to the fourth type (duplicate of SL-identical identical unchanged ISOs), indicated in the value 2231 of the third part of the linguistic characteristics 223.
  • the identification and generation of elements 61 of the fifth SMD data structure during step 2023 is performed based on the results of step 2022 to identify the types of elements 22 suitable for converting the data structure containing CE.
  • the identification of the elements 61 (LLE) of the first type at step 2023 is carried out by identifying them with the elements 22 (ISO) of the first, second and third types.
  • ISO 22 identified at step 2022 as the fourth species, form new elements - elements 61 of the second type of the fifth SMD data structures.
  • the formation of the elements 61 (LLE) of the second type at step 2023 is carried out by identifying them with the elements 22 (ISO) of the fourth type.
  • identified with the first type of ISO 22 is carried out in step 2023 by identifying the value 611 of element 61 with the value 221 of element 22 of the first type, and the serial number (s) of 612 FCs that make up the element 61 by identifying with the ordinal ( serial) number (numbers) 222 TE, constituting (constituent) element 22 of the first type.
  • the identification of the value and serial number of the TE element 61 of the first type of the fifth SMD data structure, identified with the second type of ISO 22, is carried out in step 2023 by identifying the value 611 of the element 61 with the value 221 of the element 22 of the second type, and
  • the identification of the value and the ordinal (ordinal) number (s) of the TE element 61 of the first type of the fifth SMD data structure, identified with the third type of ISO 22, is carried out in step 2023 by identifying the value 611 of the element 61 with the value 221 of the element 22 of the third kind, and the ordinal ( serial) numbers (numbers) of 612 text elements 21 constituting element 61, with serial (ordinal) number (numbers) 222 of TEs constituting (constituting) element 22 of the third kind.
  • the identification of the value and the ordinal number of the TE element 61 of the second type of the fifth SMD data structure, identified with the fourth type of ISO 22, is performed in step 2023 by identifying the value 611 of the element 61 with the value 221 of the element 22 of the third kind, and the ordinal ( serial) numbers (numbers) of 612TE, constituting (constituent) element 61, with serial (ordinal) number (numbers) 222 of TE constituting (constituting) element 22 of the third kind.
  • the formation of the fifth SMD data structure during step 2023 is carried out by combining in one data structure the elements 61 of the first and second types of the fifth SMD data structure and their identification data according to the principles and methods known from the prior art, which, respectively further not described in detail.
  • Identification of the linguistic characteristics of TEs constituting the first or second elements 61 (LLE) of the fifth SMD data structure and their values, if necessary, is carried out by organizing a request to the BDL generated in step 2022, consisting of TE identification data constituting the first or second element 61 (LLE), and obtaining the values (2131, 2141, 2231) of all parts of the linguistic characteristics (213, 214, 223) of the text elements 21 of the linguistic sentence 11 of which the first or second element 61 (LLE) consists.
  • the linguistic features of the first and second elements 61 (LLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 61 (LLE) are composed.
  • Step 203 is characterized by: performing step 2031 of generating values 2151 of the fourth part of the linguistic characteristics of 215 text elements 21 constituting elements 61 of the fifth SMD data structure, on which values 2151 of the fourth part of the linguistic characteristics 215 of the text elements 21 constituting the elements 61 are generated and the results obtained from SIC BDLP in the text linguistic elements 21 Proposition 11 that is generated in phase in 2022, forming eventually BDLP text elements 21
  • BDLP database of linguistic features
  • BDLP generated in step 2031 differs from BDLP formed in step 2022 in the presence of values 2151 of the fourth part of linguistic characteristics 215, indicating the level of syntactic significance of element 61 (LLE).
  • the level of syntactic significance of element 61 (LLE) characterizes the location of LLE in the syntax tree of the linguistic sentence 11.
  • the syntactic tree is the syntactic diagram of the sentence 11, in which a subordinate is established between individual words (LLE)
  • the syntax tree may contain an indefinite amount
  • the syntax tree used in the present method contains elements (LLE) of at least three levels of syntactic significance (HSS).
  • LLE elements of at least three levels of syntactic significance (HSS).
  • HSS syntactic significance
  • the second HSS includes LLEs, which are direct syntactic descendants of syntactic vertices.
  • the third HSS includes all other LLE linguistic
  • a syntactic vertex is a syntactic unit (LLE) that has the syntactic role of “predicate”.
  • a feature of LLE “predicate” is that it can consist of three words.
  • a direct syntactic descendant of a syntactic vertex is a syntactic unit (LLE), which has a direct subordinate relationship with the word of a LLE group of the first level. Establishing the syntactic level of LLE is the syntactic structuring of LLE.
  • the general structure of the sixth SMD data structure generated is shown, which is the second data structure for the present conversion method 200.
  • the sixth SMD data structure is a SMD containing elements 71, which are structured groups of linguo logical units (LLE groups) of the linguistic sentence 11 and the identification data of LLE groups, representing for each LLE group, as an example, but not limitation, the value 711 of element 71 of the sixth string data structures and
  • LLE groups 71 of the linguistic sentence 11 do not have unique names characterizing them (CN LLE groups) that have practical use.
  • elements 71 by way of example, but not limitation, can be referred to as “LLE group 1”, “LLE group 2”, “LLE group 3”, “LLE group n”, where n> 1 is the element serial number in linguistic sentence.
  • the LLE group of linguistic sentences 11 are syntactic units of the form “syntactic construction”, which are formed from linguistic units (elements 61 of the fifth SMD data structure) of different levels of LLE syntactic significance.
  • the first LLE group (first elements 71 of the sixth SMD data structure) includes the main LLEs of the first LLE group, which are the mentioned syntactic vertices (LLE of the first HSS), and other LLEs of the first LLE group (LLE groups 1), which are successively subordinate LLEs, the first of which it has a direct subordinate relationship with the LLE of the first HSS, up to the LLE, which is the main LLE of the second group of LLE.
  • the second LLE group (second elements 71 of the sixth SMD data structure) is classified as the main LLE of the second LLE group, which are mentioned by the LLE of the second HSS, provided that, such LLE has the syntactic role of the subject or any minor member of the sentence, except for the definition (excluding definitions in the form
  • LLEs of the second LLE group which are successively subordinate to LLEs, the first of which is LLE of the third HSS, which have a direct subordinate connection with the mentioned main LLE of the second LLE group, up to the last LLEs in the LLE chain with continuous subordinate communication.
  • identification of the main LLE of the first and second LLE groups as well as identification of other LLE of the first and second LLE groups.
  • To identify the main LLEs of the first LLE groups it is necessary to identify all the LLE “predicate” (including all parts of each LLE “predicate”) of the analyzed sentence.
  • To identify the main LLEs of the second LLE groups it is necessary to identify all LLEs that have a direct syntactic connection with any part of the LLE “predicate” and which at the same time have the syntactic role of the subject or any secondary member of the sentence, except for the definition (excluding definitions in the form
  • first elements 71 of the sixth SMD data structure is performed by combining the identified main LLE of the first group LLE and other LLEs for this main LLE.
  • the formation of the second elements 71 of the sixth SM data structure is performed by combining the identified main LLE of the second LLE group and other LLEs for this main LLE.
  • Identification of the value and serial number (s) of the TE of the first element 71 (first group of LLEs) of the sixth SMD data structure within step 2032 is as follows: value (values) 211 TE 21 of the linguistic sentence 11 constituting (components) element (s) 61 of which (of) the first element 71 consists, identify as the value 711 of the first element 71 (the first group of LLEs), and the serial number (s) 212 of the mentioned (mentioned) TE 21 of the linguistic sentence 11 constituting the (element) element (s) 61 of which the first consists element 71,
  • the identification of the value and serial number of the TE of the second element 71 (second group of LLEs) of the sixth SMD data structure as part of step 2032 is carried out as follows: the value (values) 211 of TE 21 of the linguistic sentence 11 constituting the element (s) ) 61, of which (of which) the second element 71 consists,
  • Identification of the linguistic characteristics of TEs comprising the first or second elements 71 (first or second group of LLEs) of the sixth SMD data structure and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 2031, consisting of TE identification data constituting the first or second element 71 (the first or second group of LLEs), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the second or second element 71 (the first or second group of LLEs).
  • the linguistic features of the first and second elements 71 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic Proposals 11 of which the elements 71 (LLE groups) are composed.
  • Step 204 is characterized by: performing step 2041 of identifying the types of elements 71 of the sixth SMD data structure indicating the presence in element 71 of the complications of the linguistic sentence, on which
  • the value 811 of the unconverted element 81 of the seventh SMD data structure and the serial number of the linguistic sentence 11 constituting (constituting) the unconverted element 81 (the meaning and serial numbers of the TE of the unformed element 81);
  • the identification data of the transformed elements 81 which for each transformed element 81 is, by way of example, but not limitation, the value 811 of the transformed element 81 of the seventh SMD data structure and the serial number of the linguistic sentence 11, constituting (components) the transformed element 81 (the value and serial numbers of the TE of the transformed element 81);
  • step 2043 of generating the seventh SMD data structure wherein the seventh SMD data structure is formed from the transformed elements 81 and non-transformed elements 81 of the seventh SMD data structure.
  • the seventh SMD data structure is a SMD containing untransformed elements 81 and transformed elements 81, which are basic linguo-logical objects (LLL) of the linguistic sentence 11.
  • LLL basic linguo-logical objects
  • the LLLL of the linguistic sentence 11 has characterizing them unique names (UNOLLO), which have practical use, as an example, but not limitation: “subject of judgment”, “predicate of judgment” and the like.
  • elements 81 are referred to by unique names, and, as an example, but not limitation, can be referred to as “UNOLLO p,” where n> 1 is the index number of a unique name element in a linguistic sentence, starting with “1” for each new UN OLLO, not previously seen in a linguistic sentence. Further, at
  • OLLO as an element of the seventh data structure means UN OLLO.
  • the main linguistic and logical objects of a sentence are a borderline entity with signs of both linguistic and logical objects.
  • An entity is an object in a computer system that contains a set of critical rules.
  • the main linguistic-logical object is a syntactic unit of the form “syntactic construction”, which can be formed from a structured LLE group by heterogenizing the LLE group.
  • the heterogenization of the LLE group is the elimination of homogeneities in the syntactic structure by identifying the syntactic compositional connection in it and transforming the syntactic structure with
  • a compound link is a link between syntactically equal units of a sentence (in this case, between LLEs) that have the same syntactically main word (main LLE) and the same syntactic role (syntactic role of LLE). LLE between which identified
  • OLLOs are logical entities (objects) that are elements of simple judgment, with the help of which they form and convey the idea that something (a predicate of a judgment) is affirmed or refuted about the subject of a judgment (the subject of a judgment). Moreover, something (that is affirmed or refuted about the subject of judgment) may be
  • the predicate of judgment can be divided into three logically separable logical entities (objects) - the action of the predicate of judgment, the object of the predicate of judgment and the circumstances of the predicate of judgment.
  • objects logically separable logical entities
  • the elements of simple proposition mentioned above for example can be identified with individual UN OLLO as separate syntactic constructions of linguistic sentence 11. From the semantic point of view, OLLO are a generalized conceivable (semantic) image of an element of simple judgment.
  • the identification of elements 71 of the first or second type of the sixth SMD data structure in step 2041 is performed by analyzing the linguistic characteristics of the text elements of the sixth SMD data structure constituting element 71 (LLE group), in order to identify syntactic compositional links in the LLE 71 group. Syntactic
  • the composing link between text elements (words, LLE) in the LLE 71 group is identified if the same LLE (words) have the same syntactic parent (the syntactically main word that has a direct syntactic subordinate link to such LLE (words)).
  • Additional conditions may be the presence of the same syntactic role for such LLEs (words), as well as the presence of a sign of a connection between such LLEs (words), namely a comma or a compound union.
  • Comparative unions are divided by value into connectives (“and”, “yes” in the meaning of “and”, “neither ... nor”, “also”, “too”, “both ... and”), separation (“ or “,” or ... or “,” either “,” either ... or “,” then ... then “,” either ... or “,” not that ... not that “ ) and opposing (“a”, “but”, “however”, “yes” in the meaning of “but”), including comparative ones (“not only ... but also”, “not only ...
  • the identified first type of element 71 of the sixth data structure of the SMD is identified with the unconverted element 81 of the seventh
  • the formation of the converted elements of the seventh data structure of the SMD (converted elements 81 obtained from the elements 71 of the second type) at step 2042 is performed based on the identified on step 2041 of syntactic co-communication and homogeneous members by converting the identified elements 71 of the second type of the sixth data structure of the SMD.
  • the meaning of the transformation of the second type element 71 at step 2042 is to heterogenize the LLE group, that is, eliminate syntactic homogeneities in the LLE group by forming from the second type element 71 many new LLE groups identical in uniformity to the first type element 71.
  • each new LLE group of the said set can contain only one of the mentioned homogeneous members (if the element 71 of the second type contains one row of homogeneous members) or only one unique combination of the said homogeneous members of different rows of homogeneous members (if the element 71 of the second type contains several rows of homogeneous members).
  • Many LLE groups formed from an element 71 of the second type are heterogeneous OLLO (transformed elements 81), that is, formed from one group of LLE 71 of the second type by its heterogeneous transformation
  • heterogenization The process of heterogenization of elements of the second type 71 can be carried out, as an example, but not limited, as follows: at the first stage, rows of homogeneous members in the analyzed element 71 of the second type are revealed; in the course of identifying rows of homogeneous members, the rows of homogeneous members and serial numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member (LLE-OCH) are revealed; at the second stage, chains of homogeneous members are revealed for each identified LLE-OCH element 71 of the second type; in this case, chains of homogeneous members (chain 04) are LLE-OCH and dependent chain 04 (chain of syntactically related LLEs, starting from the first syntactic descendant of LLE-OCH (syntactically dependent word) and continuing along the chain of syntactic dependence (by syntactic subordination) to another LLE-OCH or until the last LLE in element 71 of the second kind
  • identified chains 04 are classified based on availability
  • LLE syntax descendant in dependent chain 04 which is not included in dependent chain 04; those chains 04 that have dependent chains 04 without a syntactic descendant outside the framework of dependent chain 04 are considered extreme chains of homogeneous members (extreme chains 04), and those chains 04 that have dependent chains 04 with syntactic descendant outside the framework of dependent chain 04 are considered internal chains of homogeneous members (internal chains 04); in the third stage, the LLE of element 71 the second type, not included in the chains of homogeneous members (LLE outside chains 04); at the fourth stage, replaceable dependent chains (replaceable LC) of the element 71 of the second type are formed; at the same time, a replaceable LC is the basis of the transformed elements 81, consisting of one extreme chain 04 and internal chains 04, if such internal chains 04 along a chain of continuous syntactic subordinate communication exist between the extreme chain 04 and LLE outside chains 04; at the fifth stage, heterogeneous basic linguistic-logical objects (ALLO) are formed; at the same time, heterogen
  • the SMD within step 2041 does not change the value 711 of element 71 and does not change the serial numbers of the text elements 21 of the linguistic sentence 11 constituting element 71 (LLE group).
  • the value and serial number (s) of the TE of the non-transformed element 81 (OLLL) of the seventh SMD data structure are identified as part of step 2041 as follows: the value (values) 211 of the TE 21 of the linguistic sentence 11 constituting the element 71 of the first kind of the sixth
  • the SMD data structures are identified as the value 811 of the unconverted element 81 (OLLO), and the serial number (s) 712 of the TE 21 of the linguistic sentence 11 constituting the constituent element 71 of which the non-transform This element 81 is identified as the ordinal number (s) 812 of the fuel cell constituting the non-transformed element 81 (OLLO).
  • subordinate deleted LLE-04 composing unions or punctuation marks identify as the value 811 of the transformed element 81 (OLLO), and the serial number (s) 212 TE 21 linguistic
  • LLE-OCH separate (s) part (s) of the element 71 of the second type (LLE-OCH), which (which) was (were) deleted (deleted) during heterogenization, and signs of communication of the deleted LLE-OCH (syntactically subordinate to the remote LLE-OCH joint unions or punctuation marks) are identified as the serial number (s) of 812 TEs that make up the transformed element 81 (heterogeneous OLLO).
  • step 2043 The formation of the seventh SMD data structure in step 2043 is performed by combining in one data structure
  • the first of the combined elements of the seventh SMD data structure is the element identified in step 2041 as an element of the first kind 71, which is an unreformed element 81, that is, OLLL 81, which coincides with the group LLE 71 without a syntactic juxtaposition.
  • the second of the combined elements of the seventh SMD data structure are transformed elements 81, formed in step 2042 as a set of transformed elements 81, which are heterogeneous OLLO,
  • LLE groups with a syntactic coherent link formed from an element 71 of the second kind (LLE groups with a syntactic coherent link) by heterogenizing LLE groups of the second kind.
  • the linguistic features of elements 81 (ALLO) are as minimum morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 81 (OLLO) are composed.
  • FIG. 25 depicts a General diagram of the steps of the claimed method 300 for converting SMD containing at least the main linguistic-logical objects (LLL) of a linguistic sentence and LLL identification data,
  • the LLLO of the linguistic sentence and the identification data of the LLLF is characterized by: performing the identification step 301 of a suitable data structure containing the LLLF, on which
  • the step 302 of forming the eighth data structure of the SMD which forms the eighth data structure of the SMD, which is the first data structure of the SMD for the method 300 under consideration, containing elements of the said eighth data structure of the SMD, and the said elements of the eighth data structure of the SMD represent the initial simple linguistic logical constructions (IP LLK) linguistic sentences,
  • the identification data of the IP LLK representing for each IP the LLK, as an example, but not limitation: the value of the IP LLK and the serial numbers of TE linguistic sentences that make up the IP LLK; performing step 303 of generating the ninth SMD data structure, which forms the ninth SMD data structure, which is the second SMD data structure for the method 300 under consideration, containing elements of the ninth SMD data structure, said elements of the ninth SMD data structure being simple linguistic-logical constructions (PLCK ) linguistic sentences formed from IP LLK by eliminating homogeneities in IP LLK, and also represent PLCK identification data,
  • PLCK simple linguistic-logical constructions
  • the eleventh DMD data structure which forms the eleventh SMD data structure, which is the final SMD data structure for the considered method 300, containing elements of the eleventh SMD data structure, wherein the elements of the eleventh SMD data structure are complex linguistic-logical constructions ( SLLK) linguistic sentences formed from the IP LLK by eliminating the homogeneities in the IP LLK, and also represent identification data sllc, which are for each sllc, as an example, but not limitation: the value of sllc and the sequence numbers of the linguistic TE
  • FIG. 26 by way of example, but not limitation, a general flowchart of an identification step 301 suitable for
  • Step 301 is characterized by identifying a transformable data structure containing OLLL suitable for transforming, on which
  • 911 element 91 is suitable for converting a data structure containing OLLO and serial number (s) 912 TE
  • FIG. 27 depicts the General data structure that is the source for the present method
  • transform 300 which is a transformable data structure containing basic linguistic logic objects (LLLO).
  • the original data structure is a DMD containing elements 91 of a transformable data structure containing OLO,
  • OLLO identification data representing, for each OLLO, as an example, but not limitation, the value of 911 element 91 is suitable for converting the data structure containing OLLO and serial number (s) 912 TE linguistic sentences constituting
  • (constituent) OLLO which, by way of example, but not limitation, have been described previously with reference to FIG. 24 ways 200.
  • Element 91 of the linguistic sentence 11 has unique names that characterize them (UNOLLO), which have practical use as an example, but not
  • OLLOs are a syntactic unit of the form “syntactic construction”, which can be formed from structured LLE groups; logically, OLLOs are elements of simple judgment, by which something is affirmed or refuted on the subject of judgment; from a semantic point of view, OLLOs are a generalized conceivable (semantic) image of an element of simple judgment.
  • Elements 91 of a transformable data structure containing ALLO constitute a plurality of LLLOs of unique names (UNOLLO) of linguistic sentence 11.
  • ALLO 91 in a transformable data structure containing ALLO are separate elements prepared in advance and placed into a transformable data structure containing OLLO in the form of a structured array (list, list, etc.) of individual OLLOs.
  • a structured array list, list, etc.
  • the specified entity can be linguistically expressed through one, two or three TE.
  • the identification of the value 911 of the element 91 (ALLO) suitable for converting the data structure containing the ALLO during step 301 is performed by registering the character set of the text elements 21 Proposals 11, of which the OLLL 91 is composed.
  • the identification of the serial number (s) of 912 TEs of which (of which) the element 91 (OLLL) is suitable for transforming the data structure containing the OLLL, during step 301, is performed by registering the ordinal ( serial) numbers (numbers) of the mentioned TE in accordance with their location in the linguistic sentence, provided that the first TE in the linguistic sentence has the number "1", and all subsequent TEs have a sequence number greater than one by a sequence number, previous present TE.
  • a convertible data structure comprising
  • OLLO which is the source for the present method of conversion 300 is a result of a multitude of elements 91, their values 911 and
  • sequence numbers 912 TE constituting the elements 22 identified at step 301.
  • Identification of the linguistic characteristics of TEs constituting elements 91 (ALLO) suitable for transforming the data structure containing ALLO, and their values, if necessary, is carried out by organizing a request into the BDLP generated in step 2031, which consists of the identification data of TEs constituting element 91 (ALLO), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the element 91 (ALLO) consists. Moreover, as described previously,
  • the linguistic features of elements 91 are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11 of which the elements 91 (ALLO) are composed.
  • Step 302 is characterized by: performing step 3021 of generating values 2161 of the fifth part of the linguistic characteristics of 216 elements 21, constituent elements 91 suitable for transforming a data structure containing OLLL which form values 2161 of the fifth
  • step 3022 of generating the elements of the eighth SMD data structure on which the elements 12 of the eighth SMD data structure are formed, as well as the identification data of the elements 12, which for each element 12, as an example, but not limitation, the value 121 of the element 12 of the eighth SMD data structure and serial numbers 122 TE of the linguistic sentence 11 constituting the elements 12, and form the eighth data structure of the DMD.
  • BDLP database of linguistic features
  • OLLO is a syntactic construct, it is natural that in one sentence some syntactic constructs relative to other syntactic constructs, if there is a syntactic subordinate relationship between them, are syntactically main or syntactically dependent. According to this principle, some OLLOs can be syntactically main (main OLLOs), while others can be syntactically dependent (dependent OLLOs).
  • main OLLOs main OLLOs
  • dependent OLLOs dependent OLLOs
  • the syntactic role of OLLO is identified with the syntactic role of the main LLE in OLLO 91. Using the value 2161 of the fifth part of the linguistic characteristics of the 216 elements 21 that make up OLLO 91, all OLLO 91 are divided into main OLLO 91 and dependent OLLO 91.
  • 216 and their values 2161 during step 3021 are produced by analyzing the existing linguistic features of element 91.
  • the following actions can be performed: at the first stage, in all ALLO 91 identify syntactically the main LLE; at the second stage, among the linguistic features of the main LLEs of the mentioned OLLL 91, the linguistic characteristic responsible for the syntactic role is identified
  • linguistic sentences 11 formed within the framework of step 3021. Moreover, all parts (211, 214, 232, 215 and 216) of the linguistic characteristics of the text elements 21 of the linguistic sentences 11 and their meanings (2111, 2141, 2321, 2151 and 2161) form unique linguistic signs of the elements 91.
  • FIG. 30, by way of example, but not limitation, the general structure of the generated eighth SMD data structure is shown, which is the first SMD data structure for the present conversion method 300.
  • the eighth SMD data structure is a SMD containing elements 12 of the eighth SMD data structure, which are the original simple linguistic-logical constructions (IP LLK 12) of linguistic sentence 11 and identification data of IP LLK, representing for each IP LLK, as an example, but not limitation, the value121 element 12 of the eighth data structure and the sequence numbers of the text elements 122 constituting the LC LLK (the value and sequence numbers of the TE element 12).
  • IP LLK 12 the original simple linguistic-logical constructions
  • IP LLK-1 IP LLK-2
  • IP LLK-3 IP LLK-n
  • n> 1 - serial number of the element in the linguistic sentence IP LLK offers are
  • IP LLK is a syntactic unit of the form “syntactic construction”, formed from ALLO by combining ALLO on the basis of the presence of direct syntactic subordinate or composing connection between ALLO.
  • IP LLK is a separate initial simple sentence or an initial simple sentence as part of the initial complex sentence.
  • the initial simple sentence in the IP LLK may contain homogeneous members, that is, words between which there is a syntactic compositional connection.
  • IP LLK is a logical entity that expresses a simple proposition (non-quantifier proposition), which is the primary
  • the predicate of judgment can be divided into three logically separable entities - the action of the predicate of judgment, the object of the predicate of judgment and the circumstances of the predicate of judgment.
  • the elements of simple judgment mentioned for example can be identified with individual UNOLLO (unique name OLLLO), from which the IP LLK is formed.
  • the quantity of a simple judgment is determined by its "quantitative characteristic", that is, the presence or absence of unambiguity in a simple proposition.
  • Unambiguous simple judgments are quantified simple propositions in which the quantifier index is always defined and equal to unity, that is, each element of a simple proposition has no variability, is always unambiguous.
  • the unambiguity of the simple judgments are manifested through the presence in the composition of a simple judgment of the elements of a simple judgment of one unique denomination (UN) in
  • a single quantity for example, not limited to, one subject of a judgment, an object of a judgment predicate, an action of a judgment predicate, or one
  • An example of an unambiguous simple judgment is the following proposition: “The goods must be transferred to the buyer by the seller”. This simple judgment does not allow any ambiguity - only “goods”, only “must be transferred”, only
  • ambiguous The ambiguity of a simple proposition is manifested by the fact that a simple proposition contains several elements of a simple proposition of one unique denomination (UN) (for example, but not limited to, several subjects of the proposition and (or) objects of the predicate of the proposition and (or) the actions of the predicate of the proposition and (or) several similar circumstances judgment predicate).
  • An example of an ambiguous simple judgment can be the following proposition: “The goods must be transferred to the buyer by the seller or manager of the company.” This simple proposition is ambiguous due to the presence of two elements of a simple proposition with the same CN - the subjects of the judgment are “seller” and “company manager”, for each of which the predicate of judgment “must transfer goods to the buyer” can be applied.
  • IP LLK formed from the OLLL of the original sentence, between which there is a syntactic coherent connection, can only be classified as a “non-quantitative” simple proposition, since it does not guarantee the existence of the same quantitative characteristic of all simple propositions directly (without any additional processing) formed from an arbitrary initial linguistic sentence.
  • the formation of the elements 12 of the eighth data structure of the SMD which are the initial simple linguistic constructions (IP LLK) during step 3022, is based on the results of identification of the values of 2161 of the fifth part of the linguistic characteristics of the 216 elements 21 that make up the OLL 91.
  • the element 12 of the eighth SMD data structure it is necessary to carry out the following actions: at the first stage, the main OLLO 91 is selected; at the second stage, all dependent dependent ALLO 91 subordinate to him are identified using the values 2161 of the fifth part of the linguistic characteristics 216 of the elements 21 making up the ALLO 91; at the third stage, among the identified dependent OLLO 91, such OLLO 91 are identified that have a direct subordinate relationship with the previously selected main OLLO 91; at the fourth stage, a preliminary element 12 of the eighth SMD data structure is formed, which is the initial simple linguological structure (IP LLK) by combining the selected “main OLLO” 91 and all identified “dependent OLLOs” 91 having direct subordinate connections with the selected main OLLO 91 ; at the fifth stage, the composed ALLO among the already identified dependent ALLO 91 is identified using the values 2131 of the first part of the linguistic characteristics 213 of the elements 21 constituting the ALLO 91.
  • IP LLK initial simple
  • a request is made to the BDLP generated in step 3021 to check for signs of communication between the combined OLLO, and, if there are such signs, they get a text element (text elements) identified (identified) as one of (or several of, or a combination of): punctuation mark, union or a union word located between the combined OLLL.
  • a text element text elements identified (identified) as one of (or several of, or a combination of): punctuation mark, union or a union word located between the combined OLLL.
  • the formation of the eighth SMD data structure during step 3022 is performed by combining in one data structure the elements 12 of the eighth SMD data structure and their identification data according to principles and methods known from the prior art, which, accordingly, are not described in further detail below.
  • Identification of the linguistic characteristics of TEs that comprise elements 12 (IP LLK) of the eighth data structure of the SMD, and their values, if necessary, is carried out by organizing a request to the BDLP, which is generated as part of step 3021, consisting of identification data of TEs that comprise element 12 (IE LLK ), and obtaining the values (2131, 2141, 2231, 2151, 2161) of all parts of the linguistic characteristics (213, 214, 223, 215, 216) of the text elements 21 of the linguistic sentence 11, which make up element 12 (IP LLK).
  • the linguistic features of the elements 12 (IP LLK) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 12 (IP LLK) consist.
  • FIG. 31 by way of example, but not limitation, a general flowchart is shown of the steps of step 303 of generating the ninth SMD data structure, which is the second data structure for the method 300 in question.
  • Step 303 is characterized by: performing step 3031 of identifying the types of elements 12 of the 8th SMD data structure indicating the presence in the LLK IP of compiled OLLOs, on which the first and second types of elements 12 of the eighth SMD data structure are identified, and also the non-transformed elements 13 of the ninth SMD data structure and their identifiers are identified display data representing, for each non-transformed element 13, as an example, but not limitation, the value 131 of the non-transformed element 13 the ninth SMD data structure and the ordinal numbers 132 of the TE of the linguistic sentence 11 constituting element 13 (the meaning and sequence numbers of the TE of the unreformed element 13); performing the step 3032 of generating the converted elements 13 of the ninth SMD data structure, on which the converted elements 13 of the ninth SMD data structure are formed
  • FIG. 32 by way of example, but not limitation, the general structure of the generated ninth SMD data structure is shown, which is the second SMD data structure for the present conversion method 300.
  • the ninth SMD data structure is a SMD containing elements 13, which are simple linguistic logical constructions (PLCC) of the linguistic sentence 11, and PLCC identification data, representing for each PLCC, as an example, but not limitation, the value of 131 element 13 of the ninth data structure and order stems rooms 132 text elements constituting PLLK.
  • Elements 13 of the ninth SMD data structure are subdivided according to the principle of their formation into
  • PLCC 13 of the linguistic sentence 11 lacks unique names characterizing them that have practical use.
  • elements 13, as an example, but not limitation, can be referred to as “PLCK1”, “PLCK2”, “PLCKZ”, “PLLKp”, where n> 1 is the serial number of the element in the linguistic sentence.
  • PLCC of Linguistic Proposal 11 is a boundary entity between linguistics and logic. From a linguistic point of view, PLLC is a syntactic unit of the form “syntactic construction”, formed from IP LLK by heterogenization of IP LLK. In terms of syntax, PLCC is a single simple sentence or simple sentence.
  • PLLC is a logical entity that expresses a simple proposition (quantifier proposition), which is the primary logical construction of thinking, with the help of which the idea is formed and transmitted that something (a predicate of proposition) is affirmed or disproved about the subject of judgment (the subject of the proposition ) In this case, something (that is approved or
  • the predicate of judgment can be divided into three logically separable entities - the action of the predicate of judgment, the object of the predicate of judgment and the circumstances of the predicate of judgment.
  • the elements of simple judgment mentioned for example can be identified with
  • PLCC cannot contain several elements of a simple judgment of one unique name (UN).
  • a PLCC cannot contain several subjects of judgment, and (or) objects of a judgment predicate, and (or) actions of a judgment predicate, and (or) homogeneous circumstances of a judgment predicate.
  • the Identification of the types of elements 12 of the eighth data structure of the SMD in the framework of step 3031 is carried out by analyzing the linguistic characteristics of the text elements 12 (IP LLK) in order to identify syntactic compositional links in the IP LLK 12.
  • the composer link between OLLL (element 91) in the LLK IP 12 is identified if the syntaxically important LLLEs have such OLLLs with the same syntactic parent (the syntactically main word that has such a LLL with a direct syntactic subordinate link). Additional conditions may be the presence of the same syntactic role in the main LLEs of such OLLLs, as well as the presence of a sign of a connection between such LLEs, namely, a comma or a compound union.
  • LL LL second type of element 12
  • the identified first type of element 12 of the eighth data structure of the SMD is identified with the non-transformed element 13 of the ninth data structure of the SMD.
  • the formation of the transformed elements of the ninth SMD data structure (transformed elements 13 obtained from the second type of elements 12) at step 3032 is performed based on the syntactic writing connection between the elements 91 ( ⁇ ) of the element 12 ( ⁇ ⁇ ) identified by the step 3031 by converting the second type element 12 .
  • the meaning of the conversion of the element 12 of the second type at step 3032 is to heterogenize the IP LLK 12, that is, to eliminate syntactic homogeneities in the IP LLK 12 by
  • each new PLLC of the said set can contain only one of the mentioned OLLL 91 with homogeneous members (if the element 12 of the second type contains one row of homogeneous members) or only one unique combination of the mentioned OLLL 91 with homogeneous members of different rows of homogeneous members (if element 12 of the second species contains several rows of OLLO 91 with homogeneous members).
  • PLCs formed from the element 12 of the second kind are heterogeneous PLCs, that is, formed from one PI of the LLK 12 of the second kind by its heterogeneous transformation (heterogenization).
  • the heterogenization process of PI LLK 12 of the second type can be carried out, as an example, but not limited, as follows: at the first stage, rows of homogeneous members in the element 12 of the second type are revealed; in the course of identifying rows of homogeneous members, the rows themselves of homogeneous members and the serial numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member are revealed; at the second stage, chains of homogeneous members are detected for each identified OLLO containing LLE-OCH (OLLO-OCH) element 12 of the second type; the chain of homogeneous members (chain 04) is the OLLO-OCH and the dependent chain of homogeneous members (the chain of syntactically related OLLLs, starting from the first
  • the value and sequence numbers of the TE of the unreformed element 13 (PLC) of the ninth SMD data structure are identified as part of step 3031 as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting the element 12 of the first type of the eighth SMD data structure are identified as the value 131 of the unreformed element 13 ( PLCK), and the serial numbers 212 of the mentioned text elements 21 of the linguistic sentence 11 constituting the element 12 of which the unreformed element 13 consists are identified as oryadkovye number 132 text elements, components
  • Proposals 11, constituting separate parts of element 12 of the second type ( ⁇ -04), which were removed during heterogenization, and signs of communication of remote ⁇ - ⁇ (syntactic subordinate compound unions or punctuation marks synthesized by the main LLL to remote ⁇ ) are identified as the value 131 of the transformed element 13 (PLCK), and serial numbers 212 of the text elements 21 of the linguistic sentence 11 constituting the element 12 of the second type of the eighth data structure of the SMD, with the exception of serial numbers 212 of the text elements 21 of the linguistic sentences 11, which are separate parts of element 12 of the second type ( ⁇ - ⁇ ), which were removed during heterogenization, and signs of communication of remote ⁇ - ⁇ (syntactic subordinate compound unions or punctuation marks synthesized by the main LLL to remote ⁇ ) are identified as 132 serial numbers elements making up the transformed element 13 (heterogeneous PLCK).
  • the formation of the ninth SMD data structure in step 3033 is performed by combining elements 13 of the ninth SMD data structure and their identification data previously identified in steps 3031 and 3032 using the principles and methods known from the prior art that are not described in further detail below.
  • the first of the combined elements of the ninth SMD data structure is the element of the first type identified at step 3031, which is the non-transformed element 13, that is, PLCK 13, which coincides with the IP of the LLK 12 without syntactic coupling.
  • the second of the combined elements of the ninth DMD data structure are
  • the transformed elements 13 formed in step 3032 as a plurality of transformed elements 13, which are heterogeneous PLCC 13,
  • IP LLK with syntactic co-linking IP LLK with syntactic co-linking
  • Identification of the linguistic characteristics of TEs constituting the unreformed or transformed elements 13 (PLCC) of the ninth structure SMD data, and their values, if necessary, are produced by organizing a request in BDLP, formed in the framework of step 3021, consisting of
  • untransformed or transformed element 13 PLCK or heterogeneous PLCK.
  • linguistic features of unreformed and transformed elements 13 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 13 (PLCC and heterogeneous PLCC) are composed.
  • FIG. 33 by way of example, but not limitation, a general flowchart is shown of the steps of step 304 of generating the tenth SMD data structure, which is the third data structure for the method 300 under consideration.
  • Step 304 is characterized by: step 3041 of generating values 2171 of the sixth of the linguistic characteristics of 217 elements 21 constituting elements 13 of the ninth SMD data structure, on which values 2171 of the sixth of the linguistic characteristics of 217 elements 21 are generated,
  • step 3021 constituting the elements 13, and inputting the received information into the BDLP of the text elements 21 of the linguistic sentence 11, formed in step 3021, forming as a result the BDLP of the text elements 21 of the linguistic sentence 11, formed in the framework of step 3041; the implementation of step 3042 identification of the types of elements 13 of the ninth data structure of the DMD,
  • step 3043 identifying elements 14 as constituent parts of element 15 of the tenth SMD data structure, which identifies elements 14 of the tenth data structure of the SMD, as well as the identification data of the elements 14, which for each element 14, as an example, but not limitation, the value 141 element 14 of the tenth SMD data structure and serial numbers 142 TE of the linguistic sentence 11 constituting element 14; and form the tenth data structure of the SMD by combining the elements 14 as components of a single element 15 of the tenth structure SMD data.
  • FIG. 34 by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated as part of step 3041 is shown, which is BDLP of text elements 21 of sentence 11 contained in elements 13 of the ninth data structure of the DMD.
  • the BDLP generated in step 3041 differs from the BDLP generated in step 3021 in the presence of a sixth of the linguistic characteristics 217 and their values of 2171 text elements 21 contained in elements 13, which establishes the syntactic role of PLCs (elements 13 of the ninth data structure of the DMD).
  • the syntactic role of PLCA may have meanings: the main PLC or dependent PLC. Since, from a linguistic point of view, PLCC is a syntactic construction, it is natural that in one sentence some syntactic constructs relative to other syntactic constructs, if there is a syntactic subordinate relationship between them, are syntactically main or syntactically dependent. According to this principle, some PLCs can be syntactically main (main PLCs), while others can be syntactically dependent (dependent PLCs).
  • the formation of the sixth part of linguistic characteristics 217 and their values 2171 is performed by analyzing the existing linguistic features of elements 21 constituting PLCC 13. During this analysis, as an example, but not limitation, the following actions can be performed: at the first stage, all PLCs 13 are identified
  • FIG. 35 by way of example, but not limitation, the general structure of the tenth SMD data structure generated is shown, which is the third SMD data structure for the present conversion method 300.
  • the tenth SMD data structure is a SMD containing element 15, which is the original complex linguistic-logical the construction (IP LLK) of the linguistic sentence 11, and the identification data of element 15, which, by way of example, but not limitation, is the value 151 of element 15 of the tenth data structure and order marketing number 152 text elements constituting the element 15.
  • IP LLK complex linguistic-logical the construction
  • the IP LLK of Proposition 11 is a borderline entity between linguistics and logic.
  • the LLK IC is a syntactic unit of the “syntactic construction” form, formed from PLCK by combining PLCK based on the presence of direct syntactic subordinate and composing connections between PLCCs.
  • IS LLK consists of the number of PLCs that are identified in original sentence.
  • the mentioned direct syntactic subordinate connection means the presence between the elements of different PLCCs (between LLE of different PLCCs) of syntactic subordinate communication.
  • IP LLK is a transformed source sentence without distorting its meaning. The essence of the transformation of the original linguistic sentence is that all applied linguistic techniques
  • the original sentence thus transformed represents (provided that the above techniques are used in the original linguistic sentence), in fact, a complex sentence consisting of converted simple sentences in an amount exceeding the number of initial simple sentences in the original linguistic sentence.
  • all converted simple sentences in the LC LLK are unambiguous simple judgments (conceivable statements or denials).
  • the registration of element 15 (IS LLK) in the form of a data structure allows you to identify the multi-level syntactic structure of element 15 (IS LLK) and the relationship between the elements of this structure.
  • LLK IP levels reflect the structure of the syntactic subordinate relationship between structured PLCK (SPLC) as the constituent parts of the IS LLK and are caused by the revealed syntactic relations between the constituent parts of element 15 (elements 14 of the linguistic sentence 11.)
  • Element 15 (IS LLK) is formed from the mentioned structured PLC (SPLC) - elements 14.
  • mandatory IS LLK contains only element 14 (SPLC) of the first level (elements 13 of the first kind). The presence of other elements 14 (SPLC) of the second and subsequent levels (elements 13 of the second and subsequent types) is due to
  • the first level SPLCK (elements 13 of the first kind) include PLCK, which are not subordinate simple sentences.
  • the second level SPLCK (elements 13 of the second type) include PLCK, which are subordinate simple sentences, provided that the main one is the first level SPLC.
  • the third level SPLCK (elements 13 of the third type) include PLCKs, which are subordinate simple sentences, provided that the main ones are second level SPLCs.
  • the syntactic structure of the IP LLK 15, in addition to syntactically subordinate SPLCK, may contain syntactically composed SPLCK.
  • all first-level DPRKs (elements 13 of the first kind) are necessarily composed of PLCK with each other.
  • second-level SPLK (elements 13 of the second and subsequent types)
  • single-level SPLCs may or may not have syntactic connective connections with each other.
  • the composing link between the LLLF in the LLL IC is identified if the syntactically main words (LLEs) have the syntactically main LLLFs of such LLLFs of the same syntactic parent (the syntactically main word that has a direct syntactic subordinate link to such a word (LLE)). Additional conditions may be the presence of the same syntactic role in the main words (LLE) of such SPLCs, as well as the presence of a sign of connection between such words (LLE), namely, a comma or a compound union.
  • IS LLK 15, in contrast to the previously mentioned FE LLK 12 and PLLC 13, can only be singular - from one initial linguistic sentence, only one LS LLK 15 can be formed. From a logical point of view, LS LLK 15 is a logical entity expressing a complex proposition (non-quantifier proposition), which is a logical construction, the elements of which are simple judgments. The quantity of a complex judgment is determined by
  • Unambiguous complex judgments are quantified complex judgments in which the quantifier index is always defined and equal to unity, that is, each element of a complex proposition has no variability, is always unambiguous.
  • the uniqueness of a complex judgment is manifested by finding elements in a complex judgment that do not have the ability to be interpreted as variants of statements or negations, or as variants of conditionality of the same statement or denial.
  • An example of an unambiguous complex judgment is the following proposition: “If the buyer paid for the goods, then the goods should be transferred to the buyer by the seller”. This complex judgment does not allow any variation - the simple proposition “the goods must be transferred to the buyer by the seller” is due to the only simple proposition “if the buyer paid for the goods”.
  • Ambiguous complex judgments are quantified complex judgments in which the quantifier index is always determined and always greater than unity, that is, at least one element of a complex proposition has variability.
  • the ambiguity of a complex judgment is manifested through the presence in the composition of a complex judgment of elements that can be interpreted as variants of statements or negations, or as variants of the conditionality of the same statement or negation.
  • An example of an ambiguous complex judgment is the following proposition: “If the buyer paid for the goods, the goods must be transferred to the buyer by the seller or the goods must be transferred to the buyer by another official
  • IS LLK is a complex proposition with an indefinite quantitative characteristic (the quantifier index can be either equal to one or be greater than unity), and such a complex proposition is "non-quantifier".
  • the IP LLK is an information-filled scheme that clarifies the logical construction of a sentence (logical connections between individual simple judgments inherent in the original linguistic sentence).
  • the IP LLK is preferably not shown in a linguistic textual form (in the form of a complex sentence consisting of many simple sentences without an inventive connection and participial (participial) turns, in which there can be both a subordinate and an inventive connection between the mentioned simple sentences) , but in tabular or schematic form.
  • the mentioned tabular or schematic form of the demonstration allows you to quickly and accurately understand and analyze all the used basic logical entities (SPLC) and all logical connections between
  • the identification of the types of elements 13 of the ninth SMD data structure during step 3042 is based on the results of identifying the values of 2171 of the sixth of the linguistic characteristics of 217 text elements 21 constituting PLCC 13.
  • PLCK 13 connective connections between elements 13 (PLCK).
  • PLCK 13 in which there is no syntactic subordinate connection, but a syntactic compositional link is identified, is assigned to the same form as PLCK 13 with which it is composed.
  • the identification of elements 14 (component parts of element 15) of the tenth data structure of the DMD during step 3043 is performed by
  • elements 13 identified at block 3042 as certain types of element 13. Moreover, elements 13 of the first kind
  • elements 13 of the second type are identified as element 14 of the second level
  • elements 13 of the third and subsequent types are identified as element 14 of the third and, accordingly, subsequent levels.
  • the Identification of the types of elements 13 of the ninth data structure of the DMD in the framework of step 3042 does not change the value 131 of the element 13 and does not change
  • serial numbers of text elements 21 of the linguistic sentence 11 constituting element 13 (PLCK).
  • the identification of the value and serial numbers of the TE element 14 (LFLC) of the tenth SMD data structure within the framework of step 3043 is carried out as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting element 13 are identified as the value 141 of element 14 (LFLC), and serial numbers) 212 of said text elements 21 of the linguistic sentence 11 constituting element 13 are identified as serial numbers 142 of text elements, constituting element 14 (SPLC).
  • the identification of the value and serial numbers of the TE element 15 (LC LLK) of the tenth SMD data structure within the framework of step 3043 is carried out as follows: the values of 211 text elements 21 of the linguistic sentence 11 that make up all the elements 14,
  • the formation of the tenth SMD data structure during step 3043 is performed by combining the elements of the tenth SMD data structure 14 as well as their identification data in one data structure. Moreover, the elements 14 combined in one data structure, being the constituent parts of the element 15, thus form the element 15, which is the main element of the tenth data structure of the SMD.
  • the combination of the mentioned elements and their identification data in one data structure is carried out according to the principles and methods known from the prior art, which, accordingly, are not further described in detail.
  • the tenth SMD data structure is an array (list) of structured PLCCs (SPLCC) - elements 14 of the first and subsequent levels located in the CPLC list taking into account the increasing level of element 14 (and indicating this level), as well as taking into account the increasing serial number of the text element of the sign of communication element 14 (and indicating this serial number), as well as the serial number of the text element of the syntactic parent of element 14 (and indicating this serial number).
  • the first part of the IP LLK and the first serial number in the above list of structured PLCs will be SPLK 14 without a syntactic parent and without a sign of communication.
  • Elements 14 of the tenth SMD data structure are used to construct a diagram or table of logical connections that visually displays the logical construction of the original linguistic sentence (logical connections between individual simple judgments embedded in the original linguistic sentence).
  • a detailed and at the same time structured representation of the original linguistic sentence allows to increase the processing efficiency linguistic sentences 11 by machine, because instead of one processed sentence with a complex structure, it becomes possible to process many simple sentences with
  • Necessities are made by organizing a request to the BDLP, which is formed as part of step 3041, consisting of the identification data of the fuel cells that make up element 15 (IS LLK), and obtaining the values (2131, 2141, 2231, 2151, 2161, 2171) of all parts of the linguistic characteristics (213 , 214, 223, 215, 216, 217) of the textual elements 21 of the linguistic sentence 11, of which the element 15 (EC LLK) consists.
  • the linguistic features of element 15 (IS LLK) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which element 15 (IS LLK) consist.
  • FIG. 36 by way of example, but not limitation, a general flowchart is shown of the steps of step 305 of generating the eleventh SMD data structure, which is the third SMD data structure for the method 300 under consideration.
  • Step 305 is characterized by: performing step 3051 of identifying views of the element 15 of the tenth SMD data structure indicating for the presence in the LLC IC of composed PLCs, on which the first and second types of element 15 of the tenth structure of the SMD data are identified, as well as identification
  • untransformed element 16 by way of example, but not limitation, the value 161 of the non-transformed element 16 of the eleventh SMD data structure and serial numbers 162 of the TE of the linguistic sentence 11 constituting the non-transformed element 16; performing step 3052 of generating the transformed elements 16 of the eleventh SMD data structure, on which the converted elements 16 of the eleventh SMD data structure are formed from the second type elements 15, as well as identification data
  • the transformed element 16 as an example, but not limitation, the value 161 of the transformed element 16 of the eleventh data structure SMD and serial numbers 162 TE of the linguistic sentence 11 constituting the transformed elements 16; the execution of step 3053 formation
  • FIG. 37 by way of example, but not limitation, the general structure of the generated eleventh SMD data structure is shown, which is the fourth SMD data structure for the present conversion method 300.
  • the eleventh SMD data structure is a SMD containing elements 16 of the eleventh SMD data structure, which are complex linguistic-logical constructions (LLLC) of the linguistic sentence 11 and the logo identification data, representing for each element 16, as an example, but not limitation, Beginning 161 of element 16 of the eleventh SMD data structure and serial numbers 162 of the text elements constituting element 16.
  • the LLLC of the linguistic sentence 11 does not have any unique names characterizing it that have practical use.
  • elements 16, as an example, but not limitation, can be referred to as “SLLK1”, “SLLK2”, “SLLKZ”, “SLLKp”, where n> 1 is the serial number of the element in the linguistic sentence.
  • the SLLC of Linguistic Proposal 11 is a boundary entity between linguistics and logic. From a linguistic point of view, SLCC is a syntactic unit of the “syntactic construction” form, formed from the LLK IC by heterogenizing the LLK IS.
  • SLLC is a separate simple sentence (if the original linguistic sentence is a simple sentence without syntactic complications (homogeneous members, revolutions, etc.)) or a complex sentence that does not contain homogeneous members (words between which there is a syntactic juxtaposition).
  • SLLK is a logical entity that expresses a complex proposition (quantifier proposition), which is a complete logical construction of thinking, with the help of which
  • Identification of the type of the LLK IC 15 in step 3051 is carried out by analyzing the linguistic characteristics of the text elements that make up the LLK IS 15 in order to identify syntactic co-links between the SPLK 14 in the LLK 15 IC.
  • the syntactic co-link between the SPLK 14 is identified if any the syntaxically important LLEs of the syntactically principal LLLOs of such LLLFs of the same syntactic parent (the syntactically major LLLEs of different LLLFs, which have the direct syntax with the word (LLEs) in the compiled LLLFs eskaya subordinate connection).
  • Additional conditions may include the presence of the same syntactic role in the main LLLOs of the main OLLLs composed of SPLCs, as well as the presence of a sign of connection between the aforementioned composed LLLEs, namely, a comma or a writing union.
  • a link between the main LLEs of the main OLLO of two or more SPLKs such an LLK IS is identified as the second type of element 15.
  • IS LLK 15, which does not identify the syntactic linkage of the main LLEs of the main OLLO in the SPLK is identified as the first type of element 15.
  • the identified first type of element 15 of the tenth SMD data structure is identified with the non-transformed element 16 of the eleventh SMD data structure.
  • the generation of the transformed elements of the eleventh SMD data structure (the transformed elements 16 obtained from the second type elements 15) at step 3052 is performed based on the syntactic writing connection between the SPLK identified at step 3051 by converting the LLK IC of the second kind.
  • the meaning of the conversion of the LLK IC of the second kind at step 3052 is to heterogenize the LLK IC, that is, to eliminate syntactic homogeneities in the LLK IC by forming from the element 15 of the second kind a multitude of new LL LLP identical in uniformity to the element 15 of the first kind.
  • each new IS LLK of the said set may contain only one of the said LLDC with homogeneous members (if the LL LL of the second type contains one row of homogeneous members) or only one unique combination of the said LDLC with homogeneous members of different rows of homogeneous members (if the LL LL of the second type contains several rows of LDLC with homogeneous members).
  • a plurality of LLK ICs formed from LLK IC (element 15) of the second kind are
  • heterogeneous SLCK transformed elements 16
  • heterogenization of LC LLK (element 15) of the second type can be carried out, as an example, but not limitation, as follows: at the first stage, rows of homogeneous members in the element 15 of the second type are revealed; in the course of identifying rows of homogeneous members, the rows themselves of homogeneous members and the serial numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member are revealed; at the second stage, chains of homogeneous members are revealed for each identified SPLCK containing LLE-OCH (SPLLK-OCH) element 15 of the second type; the chain of homogeneous members (chain 04) is SPLC-OCH and the dependent chain of homogeneous members (chain
  • syntactically related SPLCKs starting from the first syntactic descendant of homogeneous members (syntactically dependent SPLCK) and continuing along the chain of syntactic dependence (according to syntactic subordination) to another SPLCK-OCh or to the last PLCK in element 15 of the second kind;
  • identified chains 04 are classified based on availability
  • LLE syntax descendant in dependent chain 04 which is not included in dependent chain 04; those chains 04 that have dependent chains 04 without a syntactic descendant outside the dependent chain of homogeneous members are considered extreme chains of homogeneous members (extreme chains 04), and those chains 04 that have dependent chains 04 with a syntactic descendant outside dependent chain 04 are considered internal chains homogeneous members (inner chains 04); at the third stage, the PLLC of element 15 of the second type is detected that are not included in the chains of homogeneous members (PLCC outside chains 04); at the fourth stage, replaceable dependent chains (replaceable LC) of the element 15 of the second type are formed; interchangeable ZC is the basis of transformed elements 16, consisting of one extreme chain 04 and internal chains 04, if such internal chains 04 are in a chain of continuous syntactic subordinate there are connections between the end chain 04 and the PLCC outside the chains 04; at the fifth stage, heterogeneous SLLK is formed (elements 16); heterogeneous SLLK is formed from one
  • the Identification of the types of elements 15 of the tenth data structure of the SMD in the framework of step 3051 does not change the value 151 of the element 15 and does not change
  • serial numbers of text elements 21 of the linguistic sentence 11 constituting element 15 IP LLK.
  • the value and sequence numbers of the TE of the unreformed element 16 (SLCC) of the eleventh SMD data structure are identified as part of step 3051 as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting the element 15 of the first type of the tenth SMD data structure are identified as the value 161 of the unreformed element 16 (SLLK), and serial numbers 152 of the mentioned text elements 21 of the linguistic sentence 11 constituting the element 15 of the first kind, of which the unreformed element 16 consists, identify as serial numbers 162 of the text elements constituting the non-transformed element 16 (SLLK).
  • the value and serial numbers of the TE of the transformed element 16 (heterogeneous SLCK) of the eleventh SMD data structure are identified as part of step 3052 as follows: the values of 211 text elements 21 of the linguistic sentence 11 constituting element 15 of the second type of the tenth SMD data structure, except for the values of 211 text elements 21 linguistic
  • SPLCK-04 which were removed during heterogenization, and signs of communication of remote SPLCK-04 (syntactic subordinate compound unions or punctuation marks syntactically subordinate to the remote SPLC-04), are identified as the value 161 of the transformed element 16 (SLLK), and the serial numbers are 212 text elements 21 linguistic sentences 11 constituting element 15 of the second type of the sixth SMD data structure, with the exception of serial numbers 212 text elements 21 linguistic sentences 11 constituting separate parts of element 15 of the second type (SPLK-04), cat rye removed during heterogenisation and signs connect remote SPLLK-04 (syntactically subordinate remote SPLLK 04 coordinating conjunctions or punctuation) identify as serial numbers 162 of the text elements making up the transformed element 16 (heterogeneous SLCK).
  • step 3053 The formation of the eleventh SMD data structure in step 3053 is performed by combining in one data structure
  • the first of the combined elements of the eleventh SMD data structure is the first type of element 15 identified in step 3051, which is an untransformed element 16, that is, SLCK 16,
  • the second of the combined elements of the eleventh SMD data structure are transformed elements 16, formed at block 3052 as a plurality of transformed elements 16, which are heterogeneous SLL,
  • the linguistic characteristics of TEs constituting element 16 (SLLK) of the eleventh SMD data structure and their values are identified, if necessary, by organizing a request to the BDLP generated in step 3041, consisting of TE identification data constituting element 16 (SLLK), and obtaining the values (2131, 2141, 2231, 2151, 2161, 2171) of all parts of the linguistic characteristics (213, 214, 223, 215, 216, 217) of the text elements 21 of the linguistic sentence 11, which make up element 16 (SLCK).
  • the linguistic features of element 16 (SLLK) are at least the morphological, syntactic, and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the element 16 (SLLK) consists.
  • FIG. 38 depicts a General diagram of the steps of the claimed method 400 for converting SMD containing at least the main linguistic-logical objects (LLL) of a linguistic sentence and LLL identification data,
  • the LLLO of the linguistic sentence and their identification data is characterized by: performing the identification step 301 of a data structure suitable for transforming containing the LLLF, on which
  • ALLE main linguistic logical elements
  • ALLE formed by dividing ALLE into semantic parts of ALLE and forming the initial elements from them, and also represent
  • ILLE identification data representing for each ILLE, as an example, but not limitation: the meaning of ILLE and the serial number (s) of the TE of the linguistic sentence constituting
  • SMD data structure identification step 301 which identifies the SMD data structure, which is the original data structure for the method 400 in question, whose elements 91 are the OLLO of the linguistic sentence 11, as well as identification the data of elements 91, representing, for each element 91, as an example, but not limitation, the value of 911 element91 and the serial number (s) of 912 TE linguistic sentences 1 1 constituting the element (s) 91. Described in this way with reference to FIG. 26, the process is not further described in detail. Based on the results of step 301, a data structure is identified,
  • FIG. 27 the composition of which is described with reference to FIG. 27, respectively, is not further described in detail.
  • Step 402 is characterized by: performing the step 4021 of generating the values 2181 of the seventh of the linguistic characteristics of 218 elements 21, constituent elements 91 suitable for transforming a data structure containing an OLL on which forms the values of 2181 seventh of the linguistic
  • FIG. 40 by way of example, but not limitation, the general structure of the database of linguistic features (BDLP) generated as part of step 4021 is shown, which is BDLP of text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing OLL formed within step 4021.
  • the BDLP generated in step 4021 differs from the BDLP generated in step 3021 in the presence of values 2181 of the seventh of the linguistic characteristics 218 indicating the main word of the semantic part of element 91 (ALLO).
  • ALLO main word of the semantic part of element 91
  • OLLL syntactic links between words (LLE) in OLLL
  • the semantic parts of OLLO clarify the semantic structure of OLLO, in which individual parts fulfill their limited semantic roles in OLLO.
  • the semantic parts in OLLO make it possible to distinguish in OLLO integrated in it the dominant and clarifying entities of the world (objects and actions) for the correct identification of their semantic roles and, as a consequence, the meaning of OLLO.
  • the allocation of individual semantic parts in OLLO allows you to establish their unique logical roles in OLLO, which allows you to store these parts separately without losing their semantic logical role in the sentence.
  • Such separate storage allows you to quickly and accurately search for the semantic parts of OLLO, as well as separately from other parts of the linguistic proposal to analyze and process them differently.
  • step 4021 The formation of the seventh of the linguistic characteristics 218 and their values 2181 during step 4021 is carried out on the basis of a comprehensive analysis of the linguistic characteristics of the text elements 21 included in the elements 91. During this analysis, all text elements 21 constituting the element 91 check for the presence of the main word attribute
  • a sign of the main word of the semantic part of element 91 can be, as an example, but not limitation, the presence of the following values of linguistic characteristics of a text element (TE):
  • TE is the main word of OLLO or TE has a dependent TE in the form of an excuse.
  • Other own criteria for identifying the syntactic part of the OLLO can be preliminarily set. For example, but not limited to, a list of parts of speech that indicate the main word of the syntactic part of the OLLO can be refined. If TE has the indicated values of linguistic characteristics, the corresponding values of 2181 of the seventh part of linguistic characteristics 218 are formed - “the main word of the semantic part of OLLO”.
  • step 4021 all parts (211, 214, 232, 215, 216 and 218) of the linguistic characteristics of the text elements 21 of the linguistic sentence 11 and their meanings (2111, 2141, 2321, 2151, 2161 and 2181) form unique linguistic feature elements 91 for an alternative way to improve search accuracy in a structured data array.
  • FIG. 41 by way of example, but not limitation, the general structure of the generated twelfth SMD data structure is shown, which is the first for the present conversion method 400.
  • the twelfth SMD data structure is a SMD containing elements 17 of the twelfth SMD data structure, which are the main linguistic-logical elements (ALLE) of the linguistic sentence 11 and the ALLE identification data, which are, by way of example, but not limitation, the values of 171 elements 17 of the twelfth data structure and serial numbers 172 text elements that make up ALL.
  • OLLE 12 of the linguistic sentence 11 lacks unique names describing them (UN) having practical use.
  • ALLE n In the data structure, elements 12, by way of example, but not limitation, can be referred to as “ALLE n.”, Where n> 1 indicates the serial number of the ALLO in the linguistic sentence, am> 1) indicates the syntactic level of ALLE in the ALLO, starting from the first.
  • the OLLE of Proposition 11 is a boundary entity between linguistics and logic. From a linguistic point of view, ALLE is a syntactic unit of the form
  • the main words mentioned in the syntactic part of ALLO 91 are such parts of speech as a noun, pronoun or verb (in any grammatical form), which are either syntactically the main word of OLLO 91, or contain a direct syntactic descendant (a word with which there is a direct syntactic subordinate relationship) with a syntactic role "Pretext".
  • Other criteria for identifying the syntactic part of OLLO 91 can be preliminarily set. For example, not
  • ALL 17 are words and special phrases inside ALLO 91.
  • ALLO 91 can be distinguished in it one or more ALLE 17.
  • ALLE 17 is a logical entity that is a logically separable part of an element of simple judgment.
  • the semantic parts of the image of ALLO 91 is that not every image of ALLO 91 can be linguistically implemented using only one composite element (a group of words without a preposition between words).
  • the imaginary image of OLLO 91 about the right to something cannot be realized with one constituent element (one group of words without an excuse between words)).
  • only two constituent elements - the first is “consumer right” and the second is “return of goods” form an imaginable image of an element of simple judgment.
  • the integral element of ALLO 91 (the semantic part of ALLO) is referred to as the term ALLO 91.
  • C the semantic point of view the terms OLLO 91, forming OLLO 91
  • the main terms ALLO 91 have a maximum semantic role, that is, they are the terms ALLO 91 of the first semantic part.
  • the term OLLO 91 of the first semantic part defines the semantic vector OLLO 91.
  • the semantic essence of the OLLO 91 image is formed by the constituent element “consumer right” rather than the constituent element “return of goods”.
  • the terms OLLO of the second and subsequent semantic parts are syntactically dependent terms OLLO 91, and their presence in OLLO 91 is necessary only to clarify the imaginary image of OLLO 91. The more complex the imaginary image of OLLO 91 is, the more terms OLLO 91 may require to clarify its imaginary image.
  • OLLO 91 Structuring the terms OLLO 91 as the semantic parts of OLLO allows you to correctly perceive the semantic roles of individual terms in OLLO 91. Separating in this way OLLO 91 allows you to intelligently search for information with increased accuracy, since if there is a more structured (by the logical role of words) data array, a more accurate description of the desired objects. As a result of machine processing of such an array of data, the accuracy of the search is increased and the search time is reduced,
  • the serial number of the semantic part in OLLO indicates its semantic role in OLLO and is formed in accordance with the serial number of the text element (TE) of the main word of the semantic part of ALLO 91.
  • the semantic part of ALLO 91 with the lowest sequence number TE of the main word is the first
  • the semantic part of OLLO 91 having the TE number of the main word of the semantic part closest to it, is the second the semantic part of OLLO 91, and so on.
  • the serial number of ALLE is indicated in the name of ALLE, for example, but not limited to - "ALLE 1.2".
  • Such a name for element 17 suggests that it is the second semantic part in the first OLLO (according to the syntactic level “.2”).
  • the identification of elements 17 of the twelfth SMD data structure during step 4023 is carried out on the basis of step 4022 of forming the semantic parts of elements 91 of a transformable data structure containing OLLO suitable for transformation. All formed semantic parts of elements 91 are identified with elements 17 of the twelfth data structure of the DMD.
  • Identification of the value and serial numbers of the TE of element 17 of the twelfth data structure of the DMD is carried out as part of step 4023 by identifying the value 171 of element 17 with the values of 911
  • Identification of the linguistic characteristics of TEs constituting the elements 17 (OLE) of the twelfth structure of the SMD data and their values, if necessary, is carried out by organizing a request to the BDLP generated in step 4021, consisting of the identification data of the TEs constituting the element 17 (OLE), and obtaining the values (2131, 2141, 2231; 2151, 2161, 2181) of all parts of the linguistic characteristics (213, 214, 223, 215, 216,218) of the text elements 21 of the linguistic sentence 11, which make up element 17 (ALL).
  • the linguistic features of the elements 17 (ALLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 17 (ALLE) consist.
  • FIG. 42 depicts a General diagram of the steps of step 403 of the formation of the thirteenth structure SMD data, which is the second data structure for the method 400 under consideration.
  • Step 403 is characterized by: performing step 4031 of generating values of 2191 of the eighth of the linguistic characteristics of 219 elements 21 constituting the elements 17 of the twelfth data structure of the SMD, on which values of 2191 of the eighth of the linguistic characteristics of 219 elements of 21 are formed constituting the elements 91, and enter the received information into the BDLP of the text elements 21 of the linguistic sentence 11, formed in the framework of step 4021, forming as a result the BDLP of the text lementov 21
  • the identification data of the elements 18, which, by way of example, but not limitation, represent the values of 181 elements 18 of the thirteenth SMD data structure, serial numbers 182 of the TE of the linguistic sentence 11 constituting the elements 18, and also identify the first and second types of elements 18 of the thirteenth SMD data structure and form the thirteenth SMD data structure.
  • BDLP database of linguistic features
  • ALLE main word of the semantic part of element 17
  • the reason for revealing the main word of the semantic part of ALLE is that, using the identified main word of the semantic part of ALLE and the previously syntactic links between words (LLE) in ALLE, it is possible to divide ALLE into separate semantic parts.
  • the semantic parts of ALLE clarify the semantic structure of ALLE, in which the individual parts fulfill their limited semantic roles in ALLE. Semantic parts in ALLE allow to distinguish in ALLE integrated into it the dominant and clarifying entities of the world (objects and actions) for the correct identification of their semantic roles and, as a result, the meaning of ALLE.
  • the allocation of individual semantic parts in ALLE allows you to establish their unique logical roles in ALLE, which allows you to store these parts separately without losing their semantic logical role in the sentence. This separate storage allows
  • step 4031 The formation of the eighth of the linguistic characteristics 219 and their values 2191 during step 4031 is performed on the basis of a comprehensive analysis of the values of the linguistic characteristics of the text elements 21 included in elements 17. During this analysis, all text elements 21 constituting element 17 check for the presence of a characteristic the main word
  • a sign of the main word of the semantic part of the element 17 may be, as an example, but not limitation, the presence of a text element (TE) the following values of linguistic characteristics:
  • TE is the main word of ALLE or TE has the form of a noun, pronoun or verb (in any grammatical form).
  • Other own criteria for identifying the syntactic part of ALLE can be preliminarily set. For example, without limitation, the list of parts of speech that indicate the main word of the syntactic part of ALLE can be clarified. If the TE indicated values of linguistic characteristics are formed
  • the corresponding values of 2191 of the eighth of the linguistic characteristics 219 are “the main word of the semantic part of ALLE”.
  • the values 2191 (the main word of the semantic part of element 17) of the eighth part of the linguistic characteristics 219 of the elements 21 constituting the OLLE 17 of the twelfth data structure of the SMD are generated in the text-based textbook 21 of the linguistic sentence 11 formed in the framework of step 4021, forming as a result, the BDLP of the text elements 21 of the linguistic sentence 11, formed in the framework of step 4031.
  • all parts (211, 214, 232, 215, 216, 218, 219) of the linguistic characteristics of the text elements 21 of the linguistic sentence 11 and and values (2111, 2141, 2321, 2151, 2161, 2181, 2191) form unique linguistic feature elements 17 for an alternative way to improve search accuracy in a structured data array.
  • FIG. 44 by way of example, but not limitation, the general structure of the generated thirteenth SMD data structure is shown, which is the second SMD data structure for the present conversion method 400.
  • the thirteenth SMD data structure is a SMD containing elements 18 of the first and second types of the thirteenth SMD data structure, which are the original linguistic logic elements (ILE)
  • ILLE 18 of the linguistic sentence 11 does not have their unique names characterizing them in practical use.
  • elements 18, by way of example, but not limitation, can be referred to as " ⁇ nmk", where n> 1 indicates the sequence number of the ALLO in the linguistic sentence, am> 1 indicates the syntactic level of ALLE in the ALLO, starting from the first, ak> 1 indicates the syntactic level of ILLE in ALLE, starting with the first.
  • ILLE 18 of Proposition 11 is a boundary entity between linguistics and logic. From a linguistic point of view, ILLE 18 is the primary syntactic unit that is a word.
  • ILLE 18 is a logical entity that is a logically separable part of the term of an element of simple judgment (the term ALLO). Moreover, such logically separable parts in their structure and logical role are no different from OLLE 17 for the reason that, like OLLE 17, they represent a conceivable (semantic) image of a certain object or action of the surrounding world). The reason for the existence of the syntactic parts of ALLE 17 is that not every conceivable image of ALLE 17 can be represented using only one “source element” (a word,
  • OLLE 17 expressing an object or action
  • the term OLLO only two initial elements - the first - “rights”, and the second - “consumer” - form an imaginable image of the term of an element of simple judgment (the term OLLO).
  • Source the element ALLE 17 is referred to as the concept of the term ALLO (PT ALLO) or elements 18 (ILLE).
  • PT OLLO (ILLE 18), forming the term OLLO (ALLE 17) are not equivalent, that is, they have different semantic roles.
  • the main PT OLLOs have the maximum semantic role, that is, the PT OLLOs of the first semantic part.
  • semantic parts determine the semantic vector of the term ALLO (ALLE 17).
  • ALLO the essence of the image of the term ALLO (ALLE 17) is precisely “rights” and not “consumer”.
  • PT OLLO of the second and subsequent semantic parts (syntactically dependent PT OLLO) in the term OLLO (ALLE 17) are necessary to clarify the meaning of the term ALLO (ALLE 17).
  • ALLE 17 the more complex the conceivable image of the term ALLO (ALLE 17), the more PT OLLO (ILLE 18) it may require.
  • syntactic parts based on the presence of the main words of the syntactic parts of OLLE 17 and the subsequent structuring of text elements of the syntactic part.
  • one or more syntactic parts can be distinguished in it (ILLE 18).
  • the syntactic part (ILLE 18) OLLE 17 can be only one main word or several syntactically related words
  • the main word of the syntactic part ( ⁇ 18) ⁇ 17 is identified with the element 18 of the first kind, and all words syntactically dependent on it (significant parts of speech), if any, are identified with the element 18 of the second kind.
  • the initial linguistic elements (elements 18) of the first kind are “concepts” - that is, objects or actions of the world around them, and elements 18 of the second kind are “signs of a concept”, that is, some semantic characteristics of the mentioned objects and actions.
  • the formation of the parts (semantic parts) of the elements 17 of the twelfth SMD data structure is performed at 4032 by performing the following steps: at the first stage, all syntactically subordinate words are identified from the identified main word of the element 17 (ALL); up to the word, which itself is the main word of the semantic part of element 17 (ALLE), but not including this word; at the second stage, the main word of the semantic part of element 17 (ALL) and all the mentioned syntactically subordinate words, including successively subordinate ones, form the semantic part of element 17 (ALL).
  • the serial number of the semantic part in ALLE indicates its semantic role in ALLE, and it is formed in
  • the semantic part of ALL 17 with the lowest TE number of the main word is the first semantic part of element 17 (ALL).
  • the semantic part is the second semantic part of ALLE 17, and so on.
  • the serial number of ILLE is indicated in the name of ALLE, for example, but not limited to - "ILLE 1.2.1.” This name of the element 18 suggests that it is the first semantic part in the second ALLE of the first ALLO.
  • the formation of elements 18 of the thirteenth SMD data structure during step 4033 is based on the results of step 4032 of forming the semantic parts of elements 17 of the twelfth SMD data structure as follows: at the first stage, all significant parts of speech in the semantic parts of elements 17 are identified with elements 18 of the thirteenth SMD data structure; at the second stage, the identified identified main words of the semantic parts of elements 17 are identified with elements 18 of the first kind; in the third stage, all other elements 18 of this semantic part, except for element 18 of the first kind, are identified with elements 18 of the second kind.
  • Identification of the value and serial number (s) of the TE of element 18 of the twelfth SMD data structure is performed as part of step 4033 by identifying the value 181 of element 18 with the value (s) of 211 textual (text) element (s) 21
  • the identification of the types of elements 18 of the twelfth SMD data structure in step 4031 does not change the value 181 of element 18 and does not change the ordinal (serial) number (s) of the TE 21 of the linguistic sentence 11 constituting the (element) element 18 (ILLE).
  • step 4033 The formation of the thirteenth SMD data structure during step 4033 is performed by combining in one data structure the elements 18 of the first and second types of the thirteenth SMD data structure, as well as their identification data according to the principles and methods known from the prior art, which, accordingly, are not described in further detail below are described.
  • Identification of the linguistic characteristics of TEs constituting the elements 18 (LLE) of the thirteenth SMD data structure and their values, if necessary, is carried out by organizing a request in the BDLP generated in step 4031, which consists of the identification data of the TEs constituting the element 18 (LLE), and obtaining the values (2131, 2141, 2231; 2151, 2161, 2181, 2191) of all parts of the linguistic characteristics (213, 214, 223, 215, 216, 218, 219) of the text elements 21 of the linguistic sentence 11 of which element 18 consists (ILLE ) Moreover, as described previously
  • the linguistic features of elements 18 are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 18 (ILLE) are composed.
  • FIG. 45 by way of example, but not limitation,
  • a structured data array which in a preferred embodiment comprises at least one or more computer devices 501 for converting a structured data array containing at least one or more processors 5011 and memory 5012.
  • Said devices 501 for converting a structured data array may represent by yourself, but not limited to: a personal computer,
  • the memory (computer-readable storage medium) 5012 of the structured data array conversion device 501 contains a program code that, when executed, causes said one or more processors 5011 of the said device 501 to perform the actions of the previously described methods for converting a structured data array.
  • the computer device 501 may be server computer device associated with user
  • a computer device configured to transmit to the server computer device 501 commands or instructions causing the processor or processors 5011 of the server computer device to execute code
  • the user computer device 502 may include, but is not limited to: a personal computer, a laptop computer, a tablet computer, a PDA, a smartphone, a phablet, a thin client, and the like.
  • the user computer device 502 may be connected to the server computer device 501 via a wired or wireless connection. Mentioned memory 5012 of the computer device 501 (server computer device 501) contains subject
  • one or more structured data arrays containing at least a linguistic sentence may also contain any of the previously described source data structures for any of the previously described methods for converting a structured data array.
  • one or more to be converted may also contain any of the previously described source data structures for any of the previously described methods for converting a structured data array.
  • structured data arrays can be downloadable and stored, in particular, in the database 503 of the structured data array conversion system.
  • a computer-readable storage medium may include random access memory (RAM); read-only memory device (ROM); Electrically Erasable Programmable Read-Only Memory (EEPROM); flash memory or other memory technologies; CDROM, digital versatile disc (DVD) or other optical or holographic storage media; magnetic cassettes, magnetic tape, magnetic disk storage device or other magnetic storage devices, wave carriers or other storage medium that can be used to encode the desired
  • the memory includes a storage medium based on
  • a computer storage device in the form of volatile or non-volatile memory, or combinations thereof.
  • Exemplary hardware devices include solid state memory, hard disk drives, optical disk drives, and so on. Stored in memory
  • the device contains one or more processors 5011, which are designed to perform
  • System 500 may also include a database (DB) 503.
  • Database 503 may
  • the database 503 stores data in memory, which may be, but not limited to: read-only memory (ROM), electrically erasable programmable read-only memory (EEPROM), flash memory, CDROM, digital versatile disk (DVD) or other optical or holographic data carriers; magnetic cassettes, magnetic tape, magnetic disk storage device or other magnetic storage devices, wave carriers or other storage medium that can be used to store the required information, and which can be accessed by the structured data array conversion device 501.
  • ROM read-only memory
  • EEPROM electrically erasable programmable read-only memory
  • flash memory CDROM, digital versatile disk (DVD) or other optical or holographic data carriers
  • the database 503 is used to store data representing at least commands for performing the steps of the previously described methods for converting a structured data array; one or more structured data arrays to be converted containing at least a linguistic sentence, or one of the data structures that can be loaded into the memory 5012 of the device 501 of the conversion of a structured data array described previously for any conversion method; and other data
  • transforming a structured data array can additionally contain a server computer device 501, which, in addition to the functions described previously, saves and facilitates the manipulation of computer commands or codes previously described in this document, which, accordingly, are not further described.
  • the server computer device 501 in addition to the functions described above, can provide data exchange control in the structured data array conversion system 500, and also provides data processing provided that one or more than one user computer devices 502 are connected to it. In this case, all computing power, necessary to ensure the implementation of the procedure for converting a structured data array are located on the server computer device 501.
  • the system 500 can also This may include one or more data networks 504.
  • 5 data networks 204 may include, but are not limited to, one or more local area networks (LANs) and / or wide area networks (WANs), or may be an information telecommunication network Internet, or an Intranet, or a virtual private network (VPN) , or a combination thereof, and the like.
  • Server computer device 501 also has the ability to provide virtual
  • the network 504 is used to provide interaction between the computer device 501, the database 503 and the user computer device 502 of the structured data array conversion system 500.
  • the user computer device 502 can be directly connected to the server computer device 501 using wire and wireless communication methods and methods known from the prior art, which, accordingly, are not described in further detail below.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

Группа изобретений относится к решениям в области обработки массивов данных, в частности, к решениям в области обработки структурированных массивов данных, содержащих текст на естественном языке, в частности, лингвистические предложения, и может быть использована для предварительного преобразования структурированного массива данных для обеспечения его последующеи обработки. Техническим результатом, достигаемым при реализации настоящего изобретения, является повышение эффективности и точности предварительнои обработки текста на естественном языке для его последующеи индексации и обработки.

Description

СПОСОБ ЛИНГВО-ЛОГИЧЕСКОГО ПРЕОБРАЗОВАНИЯ
СТРУКТУРИРОВАННОГО МАССИВА ДАННЫХ
[0001]ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0002] Группа изобретений относится к решениям в области обработки массивов данных, в частности, к решениям в области обработки
структурированных массивов данных, содержащих текст на естественном языке, в частности, лингвистические предложения, и может быть использована для предварительного преобразования структурированного массива данных для обеспечения его последующей обработки.
[0003] ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
[0004] Из патента РФ 2399959 (ЗАО «АВИКОМП СЕРВИСЕЗ»),
опубликованного 10.05.2010 (Д1) известен способ автоматической индексации текстов на естественных языках. Известный из Д1 способ заключается в том, что текст сегментируют в электронной форме на элементарные единицы, выявляют устойчивые словосочетания, формируют предложения, выявляют семантически значимые объекты и семантически значимые отношения между ними, формируют для каждого семантически значимого отношения множество триад, в которых единственная триада первого типа соответствует связи, устанавливаемой семантически значимым отношением между двумя
семантически значимыми объектами, при этом каждая из триад второго типа соответствует значению конкретного атрибута одного из этих семантически значимых объектов, каждая из триад третьего типа соответствует значению конкретного атрибута самого семантически значимого отношения, затем индексируют на множестве сформированных триад все связанные
семантически значимыми отношениями семантически значимые объекты по отдельности, запоминают в базе данных сформированные триады и
полученные индексы вместе со ссылкой на исходный текст, из которого сформированы эти триады.
[0005] Однако известный из Д1 способ не обладает достаточной точностью индексации элементов текста на естественном языке, что, в свою очередь, сказывается на точности последующей обработки текста на естественном языке и точности поиска в тексте на естественном языке. Главным образом, это происходит из-за недостаточно эффективной предварительной обработки текста на естественном языке, что, соответственно, не позволяет осуществить индексацию с достаточной точностью.
[0006] РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
[0007] Исходя из этого, технической проблемой, решаемой настоящим изобретением, является создание способа и реализующих способ устройств и/или систем, обладающих повышенной эффективностью предварительной обработки текста на естественном языке для его последующей индексации и обработки.
[0008] Соответственно, техническим результатом, достигаемым при реализации настоящего изобретения, является повышение эффективности и точности предварительной обработки текста на естественном языке для его последующей индексации и обработки.
[0009]Технический результат достигается за счет того, что заявленный выполняемый процессором компьютерного устройства способ 100 преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, синтаксические единицы [СЕ] лингвистического предложения и
идентификационные данные СЕ лингвистического предложения, характеризуется выполнением этапов: этапа 201 идентификации исходной структуры данных, содержащей СЕ, на котором идентифицируют структуру данных СМД, содержащую СЕ и идентификационные данные СЕ; этапа 104 формирования следующей структуры данных, на котором формируют следующую структуру данных СМД, содержащую элементы упомянутой следующей структуры данных, причем упомянутые элементы третьей структуры данных представляют собой
лингвистические объекты (ЛО) лингвистического предложения, сформированные путем их отождествления с упомянутыми синтаксическими единицами, либо полученные в результате преобразования упомянутых синтаксических единиц, а также представляют собой идентификационные данные лингвистических объектов (идентификационные данные ЛО], представляющие собой для каждого ЛО, по меньшей мере: значение лингвистического объекта (значение ЛО] и порядковый (порядковые] номер (номера] ТЭ лингвистического предложения, составляющего (составляющих] ЛО; этапа 105 формирования заключительной структуры данных, на котором формируют заключительную структуру данных СМД, содержащую элементы упомянутой заключительной структуры данных, причем упомянутые элементы заключительной структуры данных представляют собой логические объекты (ЛогО] лингвистического предложения, сформированные посредством корреляции лингвистических и логических объектов и отождествленные с упомянутыми лингвистическими объектами, а также представляют собой идентификационные данные логических объектов (идентификационные данные ЛогО), представляющие собой для каждого ЛогО, по меньшей мере: значение логического объекта (значение ЛогО) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ЛогО.
[0010] Варианты осуществления настоящего изобретения относятся к способам, устройствам, системам и машиночитаемым носителям данных для обеспечения эффективности и точности предварительной обработки текста на естественном языке для его последующей индексации и обработки.
[0011]КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0012]Иллюстративные варианты осуществления настоящего изобретения описываются далее подробно со ссылкой на прилагаемые чертежи, которые включены в данный документ посредством ссылки, и на которых:
[0013]На фиг. 1 изображена примерная общая схема выполнения этапов способа 100 преобразования структурированного массива данных, содержащего, по меньшей мере, лингвистическое предложение, являющегося исходной структурой данных для способа 100.
[0014]На фиг. 2 изображена примерная общая схема выполнения этапов этапа 101 формирования первой структуры данных.
[0015] На фиг. 3 изображена примерная общая структура исходной структуры данных, из которой формируется первая структура данных структурированного массива данных.
[0016]На фиг. 4 изображена примерная общая структура сформированной первой структуры данных.
[0017]На фиг. 5 изображена примерная общая схема выполнения этапов этапа 102 формирования базы данных лингвистических признаков,
представляющей собой базу данных лингвистических признаков текстовых элементов 21 предложения 11.
[0018]На фиг. 6 изображена примерная общая структура сформированной базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11.
[0019]На фиг. 7 изображена примерная общая схема выполнения этапов этапа 103 формирования второй структуры данных СМД.
[0020] На фиг. 8 изображена примерная общая структура сформированной второй структуры данных структурированного массива данных.
[0021]На фиг. 9 изображена примерная общая схема выполнения этапов этапа 104 формирования третьей (следующей для заявленного способа) структуры данных структурированного массива данных.
[0022] На фиг. 10 изображена примерная общая структура сформированной третьей структуры данных структурированного массива данных.
[0023]На фиг. 11 изображена примерная общая схема выполнения этапа 105 формирования четвертой (заключительной для заявленного способа) структуры данных структурированного массива данных.
[0024] На фиг. 12 изображена примерная общая структура сформированной четвертой структуры данных структурированного массива данных.
[0025] На фиг. 13 изображена примерная общая схема выполнения этапов заявленного способа 200 преобразования структурированного массива данных, содержащего, по меньшей мере, синтаксические единицы лингвистического предложения и идентификационные данные синтаксических единиц, являющегося исходной структурой данных для рассматриваемого способа 200.
[0026]На фиг. 14 изображена примерная общая схема выполнения этапа 201 идентификации пригодной для преобразования структуры данных, содержащей синтаксические единицы, являющейся исходной структурой данных для
рассматриваемого способа 200.
[0027] На фиг. 15 изображена примерная общая структура данных, являющаяся исходной структурой данных для способа преобразования 200, представляющая собой пригодную для преобразования структуру данных, содержащую синтаксические единицы.
[0028] На фиг. 16 изображена примерная общая схема выполнения этапов этапа 202 формирования пятой структуры данных структурированного массива данных, являющейся первой структурой данных для рассматриваемого способа 200.
[0029] На фиг. 17 изображена примерная общая структура сформированной в рамках этапа 2021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей синтаксические единицы.
[0030] На фиг. 18 изображена примерная общая структура сформированной в рамках этапа 2022 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей СЕ.
[0031]На фиг. 19 изображена примерная общая структура сформированной пятой структуры данных структурированного массива данных, являющейся первой для настоящего способа преобразования 200.
[0032] На фиг. 20 изображена примерная общая схема выполнения этапа 203 формирования шестой структуры данных структурированного массива данных, являющейся второй структурой данных для рассматриваемого способа 200.
[0033] На фиг. 21 изображена примерная общая структура сформированной в рамках этапа 2031 базы данных лингвистических признаков [БДЛП], являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 61 пятой структуры данных структурированного массива данных.
[0034] На фиг. 22 изображена примерная общая структура сформированной шестой структуры данных структурированного массива данных, являющаяся второй структурой данных для настоящего способа преобразования 200.
[0035]На фиг. 23 изображена примерная общая схема выполнения этапов этапа 204 формирования седьмой структуры данных структурированного массива данных, являющейся третьей структурой данных для рассматриваемого способа 200.
[0036] На фиг. 24 изображена примерная общая структура сформированной седьмой структуры данных структурированного массива данных, являющейся третьей структурой данных для настоящего способа преобразования 200.
[0037]На фиг. 25 изображена примерная общая схема выполнения этапов заявленного способа 300 преобразования структурированного массива данных, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО,
являющегося исходной структурой данных для рассматриваемого способа 300.
[0038]На фиг. 26 изображена примерная общая схема выполнения этапа 301 идентификации пригодной для преобразования структуры данных, содержащей основные лингво-логические объекты [ОЛЛО], являющейся исходной структурой данных для рассматриваемого способа 300. [0039]Ha фиг. 27 изображена примерная общая структура данных, являющаяся исходной для способа преобразования 300, представляющая собой пригодную для преобразования структуру данных, содержащую основные лингво- логические объекты (ОЛЛО).
[0040] На фиг. 28 изображена примерная общая схема выполнения этапов этапа 302 формирования восьмой структуры данных структурированного массива данных, являющейся первой структурой данных для рассматриваемого способа 300.
[0041] На фиг. 29 изображена примерная общая структура формируемой в рамках этапа 3021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО.
[0042] На фиг. 30 изображена примерная общая структура сформированной восьмой структуры данных СМД, являющейся первой структурой данных СМД для настоящего способа преобразования 300.
[0043] На фиг. 31 изображена примерная общая схема выполнения этапов этапа 303 формирования девятой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 300.
[0044] На фиг. 32 изображена примерная общая структура сформированной девятой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 300.
[0045]На фиг. 33 изображена примерная общая схема выполнения этапов этапа 304 формирования десятой структуры данных СМД являющейся третьей структурой данных для рассматриваемого способа 300.
[0046] На фиг. 34 изображена примерная общая структура формируемой в рамках этапа 3041 базы данных лингвистических признаков [БДЛП], являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 13 девятой структуры данных СМД.
[0047]На фиг. 35 изображена примерная общая структура сформированной десятой структуры данных СМД, являющейся третьей структурой данных СМД для настоящего способа преобразования 300.
[0048] На фиг. 36 изображена примерная общая схема выполнения этапов этапа 305 формирования одиннадцатой структуры данных СМД, являющейся третьей структурой данных СМД для рассматриваемого способа 300. [0049]Ha фиг. 37 изображена примерная общая структура сформированной одиннадцатой структуры данных СМД, являющейся четвертой структурой данных СМД для настоящего способа преобразования 300.
[0050] На фиг. 38 изображена примерная общая схема выполнения этапов заявленного способа 400 преобразования СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО, являющегося исходной структурой данных для рассматриваемого способа 400.
[0051] На фиг. 39 изображена примерная общая схема выполнения этапов этапа 402 формирования двенадцатой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 400.
[0052] На фиг. 40 изображена примерная общая структура формируемой в рамках этапа 4021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО,
формируемой в рамках этапа 4021.
[0053] На фиг. 41 изображена примерная общая структура сформированной двенадцатой структуры данных СМД являющаяся первой для настоящего способа преобразования 400.
[0054] На фиг. 42 изображена примерная общая схема выполнения этапов этапа 403 формирования тринадцатой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 400.
[0055] На фиг. 43 изображена примерная общая структура формируемой в рамках этапа 4031 базы данных лингвистических признаков [БДЛП], являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 17 двенадцатой структуры данных СМД.
[0056] На фиг. 44 изображена примерная общая структура сформированной тринадцатой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 400.
[0057] На фиг. 45 изображена примерная общая схема системы для
преобразования структурированного массива данных.
[0058] ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
[0059] Описанные в данном разделе возможные осуществления вариантов настоящего изобретения представлены на неограничивающих объем правовой охраны примерах, применительно к конкретным вариантам осуществления настоящего изобретения, которые во всех их аспектах предполагаются
иллюстративными и не накладывающими ограничения. Альтернативные варианты реализации настоящего изобретения, не выходящие за пределы объема его правовой охраны, являются очевидными специалистам в данной области, имеющим обычную квалификацию, на которых это изобретение рассчитано.
[0060] На фиг. 1, в качестве примера, но не ограничения, изображена общая схема выполнения этапов способа 100 преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, лингвистическое
предложение (ЛП), являющегося исходной структурой данных для способа 100. Заявленный способ 100 преобразования СМД, содержащего, по меньшей мере, лингвистическое предложение, характеризуется: выполнением этапа 101 формирования первой структуры данных, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных представляют собой текстовые элементы (ТЭ) лингвистического предложения, а также
идентификационные данные текстовых элементов (идентификационные данные ТЭ), представляющие собой для каждого ТЭ, в качестве примера, но не
ограничения: значение текстового элемента (значение ТЭ) и порядковый номер текстового элемента (порядковый номер ТЭ) в лингвистическом предложении; выполнением этапа 102 формирования базы данных лингвистических признаков (БДЛП), на котором выявляют лингвистические признаки текстовых элементов (лингвистические признаки ТЭ) лингвистического предложения, из которых формируют базу данных представляющую собой базу данных лингвистических признаков текстовых элементов лингвистического предложения (БДЛП ТЭ лингвистического предложения); выполнением этапа 103 формирования второй структуры данных, на котором формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой синтаксические единицы (СЕ) лингвистического предложения, сформированные на основании сведений из БДЛП ТЭ лингвистического предложения, а также представляют собой
идентификационные данные синтаксических единиц (идентификационные данные СЕ), представляющие собой для каждой СЕ, в качестве примера, но не ограничения: значение синтаксической единицы (значение СЕ) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих СЕ; выполнением этапа 104 формирования третьей (следующей для заявленного способа) структуры данных, на котором формируют третью структуру данных СМД, содержащую элементы упомянутой третьей структуры данных, причем
упомянутые элементы третьей структуры данных представляют собой
лингвистические объекты (ЛО) лингвистического предложения, сформированные путем их отождествления с упомянутыми синтаксическими единицами, либо полученные в результате преобразования упомянутых синтаксических единиц, а также представляют собой идентификационные данные лингвистических объектов (идентификационные данные ЛО), представляющие собой для каждого ЛО, в качестве примера, но не ограничения: значение лингвистического объекта (значение ЛО) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ЛО; выполнением этапа 105 формирования четвертой (заключительной для заявленного способа) структуры данных, на котором формируют четвертую структуру данных СМД, содержащую элементы упомянутой четвертой структуры данных, причем упомянутые
элементы четвертой структуры данных представляют собой логические объекты (ЛогО) лингвистического предложения, сформированные посредством корреляции лингвистических и логических объектов и отождествленные с упомянутыми лингвистическими объектами, а также представляют собой идентификационные данные логических объектов (идентификационные данные ЛогО),
представляющие собой для каждого ЛогО, в качестве примера, но не ограничения: значение логического объекта (значение ЛогО) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ЛогО.
[0061] На фиг. 2, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 101 формирования первой структуры данных. Этап 101 характеризуется: выполнением этапа 1011 идентификации исходной
структуры данных СМД на котором идентифицируют элементы 11 исходной структуры данных СМД, являющиеся лингвистическими предложениями 11 (ЛП 11); выполнением этапа 1012 идентификации элементов 21 первой структуры данных СМД, на котором идентифицируют элементы 21 первой структуры данных СМД, являющиеся текстовыми элементами (ТЭ) лингвистического предложения 11, а также идентификационные данные элементов 21, представляющие собой для каждого ТЭ, в качестве примера, но не ограничения: значение 211 элемента 21 первой структуры данных СМД и порядковый номер 212 элемента 21 первой структуры данных СМД, и формируют первую структуру данных СМД.
[0062] На фиг. 3, в качестве примера, но не ограничения, изображена общая структура исходной структуры данных, из которой формируется первая структура данных СМД. Исходные данные представляют собой СМД, содержащий элементы 11 исходной структуры данных, представляющие собой лингвистические
предложения (ЛП). Такой массив данных представляет собой множество
лингвистических предложений 11, относящихся к любой области деятельности и любого назначения. У элементов 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В исходной структуре данных элементы 11, в качестве примера, но не ограничения, могут именоваться как «ЛП1», «ЛП2», «ЛПЗ», «ЛПп», где n > 1 - порядковый номер элемента в
лингвистическом предложении. Лингвистическое предложение - это
грамматически организованное соединение слов (множество синтаксически связанных слов), обладающее смысловой и логической завершенностью. Кроме слов ЛП может содержать следующие объекты: цифры (числа), знаки препинания и индексы (конструкции из букв, цифр и знаков). Все перечисленные выше объекты являются компонентами ЛП 11 (компонентами ЛП) и в исходной структуре данных представляют собой отдельные элементы, заранее подготовленные и помещенные в исходную структуру данных не в виде лингвистического текста, а в виде структурированного массива (списка, перечня и тому подобного) отдельных ЛП. Такие подготовительные действия могут осуществляться любым известным из уровня техники способом и, соответственно, далее не описываются.
[0063] Идентификация элементов 11 исходной структуры данных в рамках этапа 1011 сводится к обеспечению классификации элементов, из которых состоит исходная структура данных, как лингвистических предложений (ЛП 11). При этом компонентами ЛП являются все цифры (числа), знаки препинания и индексы (конструкции из букв, цифр и знаков), содержащиеся в ЛП и отделенные друг от друга пробелом.
[0064] Исходная структура данных представляет собой в итоге множество элементов 11, идентифицированных на этапе 1011.
[0065] На фиг. 4, в качестве примера, но не ограничения, изображена общая структура сформированной первой структуры данных. Первая структура данных представляет собой СМД, содержащий элементы 21 первой структуры данных, которые представляют собой текстовые элементы (ТЭ 21) лингвистического предложения 11 и идентификационные данные ТЭ. У текстовых элементов 21 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 21, в качестве примера, но не ограничения, могут именоваться как «ТЭ», «ТЭ2», «ТЭЗ», «ТЭп», где n > 1 - порядковый номер элемента в лингвистическом предложении 11. ТЭ 21 лингвистического предложения (ЛП 11) являются компонентами ЛП, то есть словами, цифрами (числами), знаками препинания или индексами (конструкциями из букв, цифр и знаков), содержащимися в ЛП 11 и отделенными друг от друга пробелом. Текстовые элементы 21 лингвистического предложения 11 имеют идентификационные данные ТЭ, такие как, в качестве примера, но не ограничения: значение 211 ТЭ и порядковый номер 212 ТЭ.
Значением 211 ТЭ являются, в качестве примера, но не ограничения, набор букв, цифр и(или) знаков препинания, из которых состоит ТЭ. Порядковым номером 212 ТЭ является порядковый номер ТЭ 21 в лингвистическом предложении 11.
[0066] Формирование текстовых элементов 21 первой структуры данных в ходе этапа 1012 производят путем выявления отдельных слов или групп слов, цифр (чисел) или индексов, причем цифры (числа) или индексы не разделены пробелом, а также знаков препинания. При этом предпочтительно, чтобы последний знак препинания в лингвистическом предложении 11 не учитывался и не
рассматривался в качестве текстового элемента 21 лингвистического предложения 11.
[0067] Идентификацию значения 211 текстового элемента 21 первой структуры данных в ходе этапа 1012 производят путем регистрации символов (букв, цифр и(или) знаков препинания), из которых состоит текстовый элемент 21. Идентификацию порядкового номера 212 текстового элемента 21 первой
структуры данных в ходе этапа 1012 производят путем расчета местоположения ТЭ 21 в лингвистическом предложении 11. При этом первый текстовый элемент 21 в лингвистическом предложении 11 получает порядковый номер «1», а все
последующие ТЭ получают порядковый номер, больший на единицу чем
порядковый номер предыдущего ТЭ 21.
[0068] Формирование первой структуры данных СМД в ходе этапа
1012 производят путем объединения в одной структуре данных элементов 21 первой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.
[0069] На фиг. 5, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 102 формирования базы данных лингвистических признаков, представляющей собой базу данных лингвистических признаков текстовых элементов 21 предложения 11. Этап 102 характеризуется: выполнением этапа 1021 формирования лингвистических признаков текстовых элементов 21 предложения 11, на котором для лингвистического анализа текстового элемента предоставляют идентификационные данные элемента 21 (значение 211 и порядковый номер 212 ТЭ) и получают лингвистические характеристики 213 текстовых элементов 21 лингвистического предложения 11, а также значения упомянутых лингвистических характеристик 2131; выполнением этапа 1022 формирования базы данных лингвистических признаков (БДЛП), на котором формируют БДЛП текстовых элементов 21 лингвистического предложения 11. При этом лингвистическим признаком текстового элемента 21 будут являться все полученные для текстового элемента 21 в ходе этапа 1021 лингвистические характеристики 213, обладающие значениями лингвистических характеристик 2131.
[0070] На фиг. 6, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных лингвистических признаков (БДЛП], являющейся БДЛП текстовых элементов 21 лингвистического предложения 11. Первая часть (основная] лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 может содержать морфологические, синтаксические и семантические характеристики. При этом совокупность значений всех лингвистических характеристик текстового элемента является для каждого ТЭ 21 лингвистического предложения 11 его отличительным (уникальным] лингвистическим признаком в лингвистическом предложении. Морфологические характеристики предпочтительно указывают на морфологические признаки ТЭ 21 лингвистического предложения 11, которые могут быть классифицированы, в качестве примера, но не ограничения, по уровню вложенности (род-вид-подвид]. При этом морфологическими родами ТЭ 21 лингвистического предложения 11 предпочтительно являются слово, цифра, знаки препинания, иные знаки;
морфологическими видами - часть речи (для слов], вид цифры (арабская, римская], вид знака препинания (точка, запятая и тому подобное], вид иного знака; морфологическими подвидами - род, число, падеж частей речи и тому подобное (для слов), число, двоичный код, индекс и тому подобное (для цифр).
Синтаксические характеристики предпочтительно указывают на множество синтаксических признаков ТЭ 21 лингвистического предложения 11, среди которых можно выделить, в качестве примера, но не ограничения, следующие синтаксические характеристики ТЭ 21 лингвистического предложения 11:
синтаксическая роль (сказуемое, подлежащее и тому подобное.); синтаксический родитель (синтаксически главное слово); синтаксические потомки (синтаксически подчиненные слова); синтаксическая сочинительная связь (наличие иного ТЭ, имеющего ту же синтаксическую роль и того же синтаксического родителя).
Семантические характеристики предпочтительно указывают на семантические признаки ТЭ 21 лингвистического предложения 11, среди которых можно выделить, в качестве примера, но не ограничения, следующие семантические характеристики ТЭ 21 лингвистического предложения 11: семантическая группа (группа слов, которые можно отнести к одному классу, роду, виду или подвиду предметов или действий окружающего мира при совпадении признаков
упомянутых классов, родов, видов или подвидов), семантический статус
(смысловое значение слова или группы слов в рамках словосочетания, которым называется некий мыслимый образ (предмет или действие). Например, но не ограничиваясь, мыслимый образ «отсутствие продавца в месте нахождения потребителя» состоит из двух элементов верхнего уровня вложенности
(терминов): первого - «отсутствие продавца», и второго - «месте нахождения потребителя», у которых имеются следующие семантические статусы: у первого - главный (определяет смысл термина), у второго - дополнительный (уточняет определенный ранее смысл главного термина)).
[0071]Формирование первой части (основной) лингвистических
характеристик 213 и их значений 2131 для текстовых элементов 21
лингвистического предложения 11 предпочтительно производят на этапе 1021 путем комплексного лингвистического анализа каждого текстового элемента 21 лингвистического предложения 11, представляющего, в качестве примера, но не ограничения, анализ ТЭ на основе местонахождения ТЭ в структуре предложения, его значения, вида, классификации его мыслимого образа и анализа его связей с другими текстовыми элементами в предложении. По результатам комплексного анализа предпочтительно производится формирование основных лингвистические характеристик 213 и их внесение на этапе 1022 в БДЛП в виде перечня первой части лингвистических характеристик 213 со значениями этих характеристик 2131. Например, но не ограничиваясь, одной из лингвистических характеристик 213 может быть «синтаксическая роль», со значением 2131 данной лингвистической характеристики «подлежащее». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети) посредством применения технологии обучения нейросети.
[0072] На основании выявленной первой части (основной) лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 и их значений 2131 в итоге формируют базу данных лингвистических признаков, являющуюся БДЛП текстовых элементов 21 лингвистического предложения 11.
При этом первая часть лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 и их значения 2131 формирует уникальные лингвистические признаки текстовых элементов 21 лингвистического
предложения 11.
[0073] На фиг. 7, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 103 формирования второй структуры данных СМД. Этап 103 характеризуется: выполнением этапа 1031 идентификации и
формирования первых элементов второй структуры данных СМД, на котором идентифицируют и формируют элементы 31 второй структуры данных СМД, а также идентификационные данные элементов 31, представляющие собой для каждого элемента 31, в качестве примера, но не ограничения, значение 311 элемента 31 второй структуры данных СМД и порядковый (порядковые) номер (номера) 312 ТЭ лингвистического предложения 11, составляющих элемент 31 (значение и порядковые номера ТЭ элементов 31); выполнением этапа 1032 формирования вторых элементов второй структуры данных СМД, на котором формируют элементы 32 второй структуры данных СМД, а также
идентификационные данные элементов 32, представляющие собой для каждого элемента 32, в качестве примера, но не ограничения, значение 321 элементов 32 второй структуры данных СМД и порядковые номера 322 ТЭ лингвистического предложения 11, составляющих элементы 32 (значение и порядковые номера ТЭ элементов 32); выполнением этапа 1033 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД путем объединения идентифицированных элементов 31 и 32 и их идентификационных данных
(значений 311, 321 и порядковых номеров 312, 322 ТЭ).
[0074] На фиг. 8, в качестве примера, но не ограничения, изображена общая структура сформированной второй структуры данных СМД. Вторая структура данных СМД представляет собой СМД, содержащий элементы 31 и (или) элементы 32, которые представляют собой синтаксические единицы (СЕ) лингвистического предложения 11 и идентификационные данные СЕ, представляющие собой для каждого СЕ, в качестве примера, но не ограничения, значение 311 элемента 31 и (или) значение 321 элемента 32, а также порядковый (порядковые) номер (номера) 312 и (или) 322 ТЭ 21 лингвистического предложения, составляющего
(составляющих) элементы 31 и (или) элементы 32. Синтаксическими единицами (СЕ) предложения 11 предпочтительно являются отдельные слова и группы слов, связанные синтаксической связью. У СЕ лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН СЕ), имеющие практическое использование, в качестве примера, но не ограничения:
«подлежащее», «сказуемое», «прямое дополнение» и тому подобное. В структуре данных элементы 31 и 32 именуются уникальными наименованиями и, в качестве примера, но не ограничения, могут именоваться как «УН СЕ п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН СЕ, ранее не встречавшегося в лингвистическом предложении. В качестве примера, но не ограничения для пояснения определения порядковых индексов элементов структуры данных, имеющих уникальное наименование (СЕ и иных, указанных далее) определение порядкового индекса УН СЕ может быть продемонстрировано следующим образом. В предложении: «Покупатель обязан оплатить и забрать оплаченные товар, тару и упаковку» имеются семь СЕ четырех уникальных наименований: «подлежащее» - одна СЕ, «сказуемое» - две СЕ, «определение» - одна СЕ и «дополнение» - три СЕ. В структуре данных будет содержаться один элемент «подлежащее», который будет иметь индекс «1», а также два элемента «сказуемое», которые будут иметь соответствующие индексы «1» и «2», причем индекс «1» будет иметь то «сказуемое», которое имеет меньший порядковый номер ТЭ, а также один элемент «определение», который будет иметь индекс «1», а также три элемента
«дополнение», которые будут иметь соответствующие индексы «1», «2» и «3», причем индекс «1» будет иметь то «дополнение», которое имеет меньший порядковый номер ТЭ. В дальнейшем, при упоминании СЕ как элемента второй структуры данных имеется ввиду УН СЕ. По своей структуре СЕ могут состоять из одного слова или из нескольких слов. СЕ из одного слова (одного текстового элемента 21 предложения 11) - это всегда элемент 31, являющийся исходным синтаксическим объектом (ИСО), то есть членом предложения, установленным в результате синтаксического анализа. В дальнейшем, при упоминании элемента 31 второй структуры данных, являющегося ИСО, имеется ввиду УН ИСО. При этом у членов предложения можно выделить множество характеристик, которые на практике могут породить перечень уточненных членов предложения. Таким образом список ИСО - это не заранее установленный список, а варьируемый, зависящий от предварительно заданных параметров список. Одно и тоже слово (текстовый элемент 21 предложения 11) в предложении 11 может быть
поименовано разной синтаксической единицей 31, в зависимости от наличия у данного текстового элемента 21 предложения 11 различных лингвистических характеристик 213 и их значений 2131, а также актуальности отдельных
лингвистических характеристик. Например, но не ограничиваясь, при
идентификации ИСО «дополнение», в котором не актуальны некоторые
лингвистические характеристики 213 данного ИСО, к одному уникальному названию синтаксических единиц ИСО 31 будут отнесены и ИСО «прямое
дополнение», и ИСО «косвенное дополнение». При актуализации всех
лингвистических характеристик 213 ИСО как отдельных синтаксических единиц 31 будут идентифицированы ИСО «прямое дополнение» и ИСО «косвенное
дополнение». Синтаксические единицы из нескольких слов (нескольких текстовых элементов 21 предложения 11) - это иногда ИСО (элемент 31), а иногда
синтаксические конструкции (элемент 32). ИСО (элемент 31) из нескольких слов (текстовых элементов 21 предложения 11) встречаются, в частности, в ИСО
«сказуемое». Например, но не ограничиваясь, ИСО «сказуемое» - «мог быть выполнен», - состоит из трех текстовых элементов 21 предложения 11 ввиду лингвистической особенности формирования сказуемого, которое, помимо глагола «выполнен» может иметь вспомогательный глагол «быть» и модальность (модальный глагол) «мог». Синтаксическая конструкция 32 всегда состоит из нескольких слов (текстовых элементов 21 предложения 11) и представляет собой конструкцию из синтаксически связанных ИСО (элементов 31), в качестве примера, но не ограничения, синтаксической конструкцией (УН СК) является
«словосочетание», «синтаксический оборот» (причастный, деепричастный), «простое предложение», «сложное предложение» и т.д. В дальнейшем, при упоминании элемента 32 второй структуры данных, являющегося синтаксической конструкцией (СК), имеется ввиду УН СК. На практике, в целях решения
прикладных задач, возможно формирование самых различных синтаксических конструкций, при этом перечень и описание синтаксических конструкций могут быть заданы предварительно. Перечень СЕ 31 (ИСО) и СЕ 32 (СК), которые подлежат идентификации в предложении 11, предпочтительно задается
предварительно.
[0075]Идентификацию или формирование первого элемента 31 второй структуры данных СМД в рамках этапа 1031 производят путем комплексного анализа значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11. Элементы 31 второй структуры данных СМД, являющиеся ИСО, идентифицируемые (если состоят из одного ТЭ) или формируемые (если состоят из нескольких ТЭ) в рамках этапа 1031, фактически отождествляют с актуальными ИСО. Актуальные ИСО - это актуальный перечень ИСО с актуальными лингвистическими характеристиками, установленный предварительно и записанный в первую пользовательскую базу данных (первую ПБД), являющуюся таким образом базой данных актуальных синтаксических единиц (СЕ), содержащей актуальные ИСО и актуальные СК. Идентификацию и формирование (если требуется) элементов 31 ИСО производят путем сравнения зарегистрированных в базе данных лингвистических признаков (БДЛП) значений 2131 лингвистических характеристик 213 текстовых элементов 21
лингвистического предложения 11 с предварительно заданными значениями лингвистических характеристик актуальных ИСО. При совпадении значений 2131 лингвистических характеристик 213 текстового элемента 21 лингвистического предложения 11 и предварительно заданных значений лингвистических
характеристик актуальных ИСО выявленный текстовый элемент идентифицируют и при необходимости осуществляют его формирование как соответствующего ИСО (элемент 31). Такой комплексный анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети) посредством применения технологии обучения нейросети. Формирование второго элемента 32 второй структуры данных СМД в рамках этапа 1032 производят путем комплексного анализа значений 2131 лингвистических характеристик 213 текстовых элементов, являющихся ИСО (элементов 31). При выявлении лингвистических характеристик текстовых элементов, составляющих ИСО, которые соответствуют описанию синтаксической конструкции (СК), содержащемуся в базе данных актуальных СЕ, формируют СК (элементы 32) из упомянутых двух или более ИСО (элементов 31). Такой комплексный анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма
лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети) посредством применения технологии обучения нейросети.
[0076] Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 31 (ИСО) второй структуры данных СМД в рамках этапа 1032 производят следующим образом: значение (значения) 211 текстового
(текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) элемент 31, идентифицируют как значение 311 элемента 31 (ИСО), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) элемент 31, идентифицируют как порядковый (порядковые) номер (номера) 312 текстового (текстовых) элемента (элементов), составляющего (составляющих) элемент 31 (ИСО). Идентификацию значения и порядковых номеров ТЭ элемента 32 (СК) второй структуры данных СМД в рамках этапа 1032 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 32, идентифицируют как значение 321 элемента 32 (СК), а порядковые номера 212 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 32 идентифицируют как порядковые номера текстовых элементов 322, составляющих элемент 32 (СК).
[0077] Формирование второй структуры данных СМД в ходе этапа 1033 производят путем объединения в одной структуре данных элементов 31 второй структуры данных СМД и элементов 32 второй структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.
[0078] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 31 (ИСО) второй структуры данных СМД и их значений при
необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих ИСО 31, и получения значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 31 (ИСО). Идентификация лингвистических характеристик ТЭ, составляющих элементы 32 (СК) второй структуры данных СМД и их значений при необходимости производится путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих СК 32, и получения значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 32 (СК). При этом, как было описано ранее, лингвистическими признаками элементов 31 (ИСО) и 32 (СК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 31 (ИСО) и 32 (СК).
[0079]Таким образом специалисту в данной области техники должно быть очевидно, что формируется СМД, содержащий, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и идентификационные данные СЕ лингвистического предложения. Такой СМД может быть впоследствии
идентифицирован, как это будет показано далее со ссылкой на фиг. 14 при описании способа 201. Кроме того, как это будет показано далее, такой массив данных может содержать как СЕ как таковые, так и частные варианты СЕ, такие как, но не ограничиваясь: основные лингво-логические объекты (ОЛЛО)
лингвистического предложения, исходные простые лингво-логические конструкции (ИП ЛЛК) лингвистического предложения, простые лингво- логические конструкции (ПЛЛК) лингвистического предложения, исходные сложные лингво-логические конструкции (ИС ЛЛК) лингвистического
предложения, сложные лингво-логические конструкции (СЛЛК) лингвистического предложения, основные лингво-логические элементы (ОЛЛЭ) лингвистического предложения, исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения, либо какую-либо их комбинацию.
[0080] На фиг. 9, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 104 формирования третьей (следующей для заявленного способа) структуры данных СМД. Этап 104 характеризуется:
выполнением этапа 1041 идентификации первого элемента третьей структуры данных СМД, на котором идентифицируют или формируют элементы 41 третьей структуры данных СМД, а также идентификационные данные элементов 41, представляющие собой для каждого элемента 41, в качестве примера, но не ограничения, значение 411 элемента 41 третьей структуры данных СМД и порядковый (порядковые) номер (номера) 412 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 41; выполнением этапа 1042
формирования второго элемента третьей структуры данных СМД, на котором формируют элементы 42 третьей структуры данных СМД а также
идентификационные данные элементов 42, представляющие собой для каждого элемента 42, в качестве примера, но не ограничения, значение 421 элемента 42 третьей структуры данных СМД и порядковый (порядковые) номер (номера) 422 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 42; выполнением этапа 1043 формирования третьей структуры данных СМД, на котором формируют третью структуру данных СМД путем объединения
идентифицированных элементов 41 и 42 и их идентификационных данных.
[0081] На фиг. 10, в качестве примера, но не ограничения, изображена общая структура сформированной третьей структуры данных СМД. Третья структура данных СМД представляет собой СМД, содержащий элементы 41 и (или) элементы 42, которые представляют собой лингвистические объекты (ЛО) лингвистического предложения 11 и идентификационные данные ЛО, представляющие собой для каждого ЛО, в качестве примера, но не ограничения, значение 411 элемента 41 и (или) значение 421 элемента 42 (значение элементов 41 и (или) 42), а также порядковый (порядковые) номер (номера) 412 и (или) 422 текстовых элементов 21 лингвистического предложения, составляющего (составляющих) элемент 41 и (или) элемент 42 (порядковые номера ТЭ элементов 41 и (или) 42).
Лингвистическим объектом (ЛО) является особая синтаксическая единица (ОСЕ). У ЛО лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ЛО), имеющие практическое использование в качестве примера, но не ограничения, представляет собой: «простое предложение без однородных членов и оборотов», «первое словосочетание» и тому подобное. В структуре данных элементы 41 и 42 именуются уникальными наименованиями, в качестве примера, но не ограничения, могут именоваться как «УН ЛО п», где n > 1 - порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ЛО, ранее не встречавшегося в
лингвистическом предложении. В дальнейшем, при упоминании ЛО как элемента третьей структуры данных или элементов 41 и 42 третьей структуры данных имеется ввиду УН ЛО. ОСЕ предварительно формируют в рамках лингво- логического преобразования, результатом которого является выполнение корреляции лингвистических и логических объектов и преобразование
синтаксических единиц предложения в массив логических объектов. Механизм лингво-логического преобразования позволяет на основании заранее известного представления о логической модели предложения (логической структуре простого неосложненного предложения, идентичного простому суждению) установить корреляцию (взаимосвязь) между логическими объектами предложения и синтаксическими единицами предложения. В ходе формирования таблицы взаимосвязанных (лингвистических и логических) объектов в каждом отдельном случае формируются такие ОСЕ, являющиеся искомыми лингвистическими объектами (искомые ЛО), которые могут быть отождествлены с искомыми логическими объектами (искомыми ЛогО). Сформированный таким образом искомый ЛО может быть полностью тождественен одному или нескольким СЕ (такой искомый ЛО будет порождать первый лингвистический объект (первый ЛО), являющийся элементом 41 лингвистического предложения 11), либо представлять собой производный синтаксический объект, полученный путем преобразования одного или нескольких СЕ в объект, который будет являться объектом, тождественным искомому ЛО (такой искомый ЛО будет порождать второй лингвистический объект (второй ЛО), являющийся элементом 42
лингвистического предложения 11). Искомыми ЛогО могут быть отдельные логические объекты или группы логических объектов, которые являются
логическими сущностями и сформированы по законам логики (науке о мышлении). При этом существуют базовые академические логические сущности, в качестве примера, но не ограничения, такие как «понятие», «суждение», «субъект суждения» (то, о чем что-либо утверждается или отрицается в суждении), «предикат
суждения» (то, что утверждается или отрицается о субъекте суждения). Вместе с тем, в практических целях могут быть сформированы и иные логические сущности, отражающие потребности текущей прикладной задачи и используемые в рамках лингво-логического преобразования. Например, не ограничиваясь, в предикате суждения могут быть выделены отдельные более функционально однородные логические сущности, нежели сам предикат суждения, а именно - «действие предиката суждения», «объект предиката суждения» и «обстоятельства предиката суждения».
[0082] Идентификацию элемента 41 (первый ЛО) третьей структуры данных СМД в рамках этапа 1041 производят путем анализа состава искомых ЛО. При этом состав искомых ЛО предварительно задают в виде СЕ уникального наименования (УН СЕ) или списка СЕ уникальных наименований с указанием способа
формирования ЛО, которым, не ограничиваясь, может быть один из следующих способов: отождествление с установленным (несколькими установленными) СЕ или преобразование установленного (установленных) СЕ по описанному ранее способу. Упомянутые состав искомых ЛО и способы формирования ЛО формируют собой вторую пользовательскую базу данных (вторую ПБД), являющуюся таким образом базой данных искомых ЛО, содержащую, в том числе, и лингвистические характеристики текстовых элементов, из которых формируются искомые ЛО. Если в результате анализа состава конкретного ЛО будет установлено, что
анализируемый Л О состоит из отождествляемых СЕ (элементов 31 или элементов 32), то такой ЛО идентифицируют (если тождественен одному СЕ) или формируют (если тождественен нескольким СЕ) как элемент 41 третьей структуры данных СМД. Идентифицированные в рамках анализа состава лингвистических объектов синтаксические единицы (элементы 31 или элементы 32) второй структуры данных СМД в соответствии с предварительно заданными параметрами
идентификации или формирования элементов 41 третьей структуры данных СМД содержащиеся в описании искомых лингвистических объектов, отождествляют с первым ЛО (первым лингвистическим объектом (элементом 41 третьей структуры данных СМД)), благодаря чему формируют элемент 41 третьей структуры данных СМД. Дополнительной частью элемента 41 третьей структуры данных СМД могут быть служебные части речи (предлоги, союзы, частицы) и знаки препинания, находящиеся между объединяемыми в рамках элемента 41 третьей структуры данных СМД синтаксическими единицами в соответствии со способом
формирования первого ЛО, установленным пользователем. Если в результате анализа состава конкретного ЛО будет установлено, что анализируемый ЛО состоит из преобразуемых СЕ, то такой лингвистический объект будет относиться к элементам 42 третьей структуры данных СМД (вторым ЛО) и формироваться в рамках этапа 1042. Формирование элемента 42 третьей структуры данных СМД (второго ЛО) в рамках этапа 1042 производят путем преобразования СЕ,
предварительно заданных в описании искомых ЛО вида «второй ЛО» по
предварительно заданному способу преобразования во второй ПБД.
Преобразование СЕ в элементы 42 третьей структуры данных СМД является необязательным действием для настоящего способа преобразования
структурированного массива данных. Настоящий способ преобразования структурированного массива данных может быть с достаточной эффективностью и точностью реализован даже при осуществлении лишь идентификации элемента 41 третьей структуры данных СМД при условии, что все искомые Л О порождают только первый ЛО, являющийся элементом 41 лингвистического предложения 11.
[0083] Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ, элемента 41 (первый ЛО) третьей структуры данных СМД в рамках этапа 1041 производят следующим образом: значение (значения) 311 или 321 элемента (элементов) 31 или 32 лингвистического предложения 11,
отождествленного (отождествленных) с элементом 41 (первый ЛО),
идентифицируют как значение 411 элемента 41 (первый ЛО), а порядковый (порядковые) номер (номера) 312 или 322 ТЭ элемента (элементов) 31 или 32 лингвистического предложения 11, отождествленного (отождествленных) с элементом 41 (первый ЛО) идентифицируют как порядковый (порядковые) номер (номера) 412 текстового (текстовых) элемента (элементов), составляющего (составляющих) элемент 41 (первый ЛО). Если формирование элемента 41 производят согласно требованиям второй ПБД путем объединения нескольких СЕ, то к значениям и номерам ТЭ элемента 41 (первый ЛО) третьей структуры данных СМД добавляют значения и порядковые номера ТЭ служебных частей речи (предлоги, союзы, частицы) и знаки препинания, находящиеся между объединяемыми СЕ. Идентификацию значения и порядкового (порядковых) номеров ТЭ элемента 42 (второй ЛО) третьей структуры данных СМД в рамках этапа 1042 производят следующим образом: значение (значения) преобразованных СЕ (из элемента (элементов) 31 и (или) 32 лингвистического предложения 11), отождествленного (отождествленных) с элементом 42 (второй ЛО),
идентифицируют как значение 421 элемента 42 (второй Л О), а порядковый
(порядковые) номер (номера) преобразованных СЕ (из элемента (элементов) 31 и (или) 32 лингвистического предложения 11), отождествленного
(отождествленных) с элементом 42 (второй ЛО) идентифицируют как порядковый (порядковые) номер (номера) 422 текстового (текстовых) элемента (элементов), составляющего (составляющих) элемент 42 (второй ЛО).
[0084] Формирование третьей структуры данных СМД в ходе этапа 1043 производят путем объединения в одной структуре данных элементов 41 третьей структуры данных СМД и элементов 42 третьей структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.
[0085] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 41 (первый ЛО) третьей структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих первый ЛО 41, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 41 (первый ЛО). Идентификацию лингвистических характеристик ТЭ, составляющих элементы 42 (второй ЛО) третьей структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих второй ЛО 42, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 42 (второй ЛО). При этом, как было описано ранее лингвистическими признаками элементов 41 (первый ЛО) и 42 (второй ЛО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 41 (первый ЛО) и 42 (второй ЛО). [0086]Ha фиг. 11, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 105 формирования четвертой (заключительной для заявленного способа) структуры данных СМД. Этап 105 характеризуется
формированием элемента четвертой (заключительной для заявленного способа) структуры данных, при котором формируют элементы 51 четвертой структуры данных СМД, а также идентификационные данные элементов 51, представляющие собой для каждого элемента 51, в качестве примера, но не ограничения, значение 511 элемента 51 четвертой структуры данных СМД и порядковый (порядковые) номер (номера) 512 ТЭ лингвистического предложения 11, составляющего
(составляющих) элемент 51.
[0087] На фиг. 12, в качестве примера, но не ограничения, изображена общая структура сформированной четвертой структуры данных СМД. Четвертая структура данных СМД представляет собой СМД, содержащий элементы 51 четвертой структуры данных СМД, которые представляют собой логические объекты (ЛогО) лингвистического предложения 11 и идентификационные данные ЛогО, представляющие собой для каждого ЛогО, в качестве примера, но не ограничения, значение 511 элемента 51 четвертой структуры данных СМД
(значение элемента 51) и порядковый (порядковые) номер (номера) 512 ТЭ, составляющего (составляющих) элемент 51 (порядковые номера 512 ТЭ элемента 51). Логические объекты (ЛогО) являются логическими сущностями и
сформированы по законам логики (науки о мышлении). У ЛогО лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ЛогО), имеющие практическое использование, в качестве примера, но не
ограничения, - «понятие», «суждение», «субъект суждения» (то, о чем что-либо утверждается или отрицается в суждении), «предикат суждения» (то, что утверждается или отрицается о субъекте суждения и тому подобное. В структуре данных элементы 51 именуются уникальными наименованиями, в качестве примера, но не ограничения, могут именоваться как «УН ЛогО п», где n > 1 - порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ЛогО, ранее не встречавшегося в лингвистическом предложении элемента в лингвистическом предложении. В дальнейшем, при упоминании ЛогО как элемента четвертой структуры данных или элемента 51 четвертой структуры данных имеется ввиду УН ЛогО. Массив логических объектов предложения представляет собой иной, нелингвистический способ регистрации смысла того, о чем идет речь в лингвистическом предложении. В отличии от лингвистического предложения, смысл которого может быть сохранен только при условии регистрации всех текстовых элементов предложения в одном месте (в виде одной единицы информации), массив логических объектов позволяет хранить туже информацию без потери смысла в разделенном виде, во множестве независимых мест хранения информации (в виде массива логических объектов). При этом формирование массива логических объектов позволяет не просто разделить единую информацию на части, но и системно структурировать эти части для любых преобразуемых в рамках настоящего способа
лингвистических предложений. Возможность регистрации и хранения логически и системно структурированной информации по частям открывает новые
возможности для высокоточной обработки такой информации, поскольку в этом случае поиск и анализ информации технически может проводиться не в едином объеме исходной информации (лингвистическом предложении), а только в определенных логических частях этой информации, характеристики и требования к которым соответствуют логической сути и логическому предмету поиска или анализа. В результате такой способ хранения информации существенно уменьшает объем (зону) поиска и анализа, что приводит к уменьшению времени и повышению качества (релевантности, точности) поиска и анализа.
[0088]Формирование элемента 51 (ЛогО) четвертой структуры данных СМД в рамках этапа 105 производят с помощью третьей структуры данных СМД, содержащей лингвистические объекты (ЛО) и базы данных корреляции
лингвистических и логических объектов, представляющей собой таким образом третью пользовательскую базу данных (третью ПБД). Третью ПБД формируют для лингво-логического преобразования предварительно. Третья ПБД представляет собой перечень необходимых логических объектов, которые могут быть выделены в лингвистическом предложении и на которые оно может быть в итоге разделено. Кроме этого, третья ПБД содержит перечень лингвистических объектов
уникальных наименований (УН ЛО) и описаний лингвистических объектов, которые предполагают тождественными искомым логическим объектам
уникальных наименований (УН ЛогО) при указанных условиях (указанном составе УН ЛО (перечень СЕ) и (или) указанном способе преобразования СЕ, а также указанных лингвистических характеристиках упомянутых СЕ). Для формирования логического объекта 51, коррелированного с выбранным лингвистическим объектом 41 или 42 в третьей структуре данных выбирают отдельный ЛО (из перечня ЛО) и с помощью третьей ПБД выявляют коррелированный с УН ЛО логический объект (УН ЛогО), в качестве примера, но не ограничения, выбирают из третьей структуры данных ЛО с уникальным наименованием (УН ЛО) «первое словосочетание» (словосочетание состоящее из простого предложения без однородных членов и оборотов (например, подлежащее) и все зависимые от него слова)) и направляют этот УН ЛО в качестве запроса в третью ПБД для поиска выбранного УН ЛО в перечне уникальных наименований имеющихся там ЛО. При обнаружении такого УН ЛО (например, «первое словосочетание») в соответствии с третьей ПБД получают отождествленное с ним УН логического объекта (в приведенном примере УН ЛогО - «субъект суждения»). Таким образом формируют логический объект (элемент 51 четвертой структуры данных СМД) для
выбранного лингвистического объекта 41 или 42. Результатом формирования элемента 51 является выявленное УН ЛогО.
[0089] Идентификацию значения и порядковых номеров ТЭ элемента 51 (ЛогО) четвертой структуры данных СМД в рамках этапа 105 производят
следующим образом: значение (значения) 211 текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) коррелированный с элементом 51 элемент 41 или 42, идентифицируют как значение 511 элемента 51 (ЛогО), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих)
коррелированный с элементом 51 элемент 41 или 42 идентифицируют как порядковый (порядковые) номер (номера) текстового (текстовых) элемента (элементов) 512, составляющего (составляющих) элемент 51 (ЛогО).
[0090] Формирование четвертой структуры данных СМД в ходе этапа 105 производят путем объединения в одной структуре данных элементов 51 четвертой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.
[0091] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 51 (ЛогО) четвертой структуры данных СМД и их значений при
необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих ЛогО 51, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 51 (ЛогО). При этом, как было описано ранее лингвистическими
признаками элементов 51 (ЛогО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 51 (ЛогО).
[0092]Далее, после завершения описанного ранее этапа 103, в целях повышения точности последующего поиска в структурированном массиве данных становится возможным осуществить дальнейшее преобразование СМД,
содержащего, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и их идентификационные данные.
[0093] На фиг. 13, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 200 преобразования СМД, содержащего, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и идентификационные данные СЕ, являющегося исходной
структурой данных для рассматриваемого способа 200. Заявленный способ 200 преобразования СМД, содержащего, по меньшей мере, СЕ лингвистического предложения и идентификационные данные СЕ, характеризуется: выполнением этапа 201 идентификации пригодной для преобразования структуры данных, содержащей СЕ, на котором идентифицируют структуру данных СМД, содержащую элементы упомянутой пригодной для преобразования структуры данных, содержащей СЕ, являющейся исходной структурой данных СМД в рамках
рассматриваемого способа 200, причем упомянутые элементы пригодной для преобразования структуры данных представляют собой синтаксические единицы (СЕ) лингвистического предложения и идентификационные данные СЕ;
выполнением этапа 202 формирования пятой структуры данных СМД, на котором формируют пятую структуру данных СМД, являющуюся первой структурой данных СМД в рамках рассматриваемого способа 200, содержащую элементы упомянутой пятой структуры данных СМД, причем упомянутые элементы пятой структуры данных СМД представляют собой лингво-логические единицы (ЛЛЕ)
лингвистического предложения, идентифицированные и сформированные по итогам лингво-логического анализа синтаксических единиц, а также представляют собой идентификационные данные ЛЛЕ, представляющие собой для каждого ЛЛЕ, в качестве примера, но не ограничения: значение ЛЛЕ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего
(составляющих) ЛЛЕ; выполнением этапа 203 формирования шестой структуры данных СМД, на котором формируют шестую структуру данных СМД, являющуюся второй структурой данных СМД в рамках рассматриваемого способа 200,
содержащую элементы упомянутой шестой структуры СМД, причем упомянутые элементы шестой структуры данных СМД представляют собой группы лингво - логических единиц (группы ЛЛЕ) лингвистического предложения
сформированные на основании схемы синтаксических связей ЛЛЕ в простом предложении исходного лингвистического предложения, а также представляют собой идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, в качестве примера, но не ограничения: значение группы ЛЛЕ и порядковые номера ТЭ лингвистического предложения, составляющих группу ЛЛЕ; выполнением этапа 204 формирования седьмой структуры данных СМД, на котором формируют седьмую структуру данных СМД, являющуюся итоговой структурой данных СМД для рассматриваемого способа 200, содержащую элементы упомянутой седьмой структуры данных СМД, причем упомянутые элементы седьмой структуры данных СМД представляют собой основные лингво -логические объекты (ОЛЛО) лингвистического предложения сформированные из групп ЛЛЕ путем устранения однородностей в группах ЛЛЕ, а также представляют собой идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, в качестве примера, но не ограничения: значение ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего
(составляющих) ОЛЛО.
[0094] На фиг. 14, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 201 идентификации пригодной для преобразования структуры данных, содержащей синтаксические единицы (СЕ), являющейся исходной структурой данных для рассматриваемого способа 200. Этап 201 характеризуется выполнением идентификации пригодной для преобразования структуры данных содержащей СЕ, на котором идентифицируют элементы 22 пригодной для преобразования структуры данных содержащей СЕ, а также идентификационные данные элементов 22, представляющие собой для каждого элемента 22, в качестве примера, но не ограничения, значение 221 элемента 22 пригодной для преобразования структуры данных, содержащей СЕ и порядковый (порядковые) номер (номера) 222 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 22.
[0095] На фиг. 15, в качестве примера, но не ограничения, изображена общая структура данных, являющаяся исходной структурой данных для настоящего способа преобразования 200, представляющая собой пригодную для
преобразования структуру данных, содержащую синтаксические единицы.
Исходная структура данных представляет собой СМД, содержащий элементы 22 пригодной для преобразования структуры данных, содержащей СЕ,
представляющие собой синтаксические единицы (СЕ) и идентификационные данные СЕ, представляющие собой для каждой СЕ, в качестве примера, но не ограничения, значение 221 элемента 22 пригодной для преобразования структуры данных, содержащей СЕ и порядковый (порядковые) номер (номера) 222 ТЭ лингвистического предложения, составляющего (составляющих) СЕ, которые, в качестве примера, но не ограничения, были описаны ранее со ссылкой на фиг. 8 способа 100. У элементов 22 лингвистического предложения 11 имеются
характеризующие их уникальные наименования (УН), имеющие практическое использование, в качестве примера, но не ограничения: «подлежащее»,
«сказуемое», «прямое дополнение» и тому подобное. В структуре данных элементы 22 именуются уникальными наименованиями и, в качестве примера, но не ограничения, могут именоваться как «УН СЕ п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН СЕ, ранее не встречавшегося в лингвистическом предложении. Как было сказано ранее, СЕ могут быть двух видов: исходные синтаксические объекты (ИСО), то есть синтаксические единицы - члены
предложения, выявленные в результате синтаксического анализа, и
синтаксические конструкции представляющие собой конструкцию из
синтаксически связанных ИСО. Элементы 22 пригодной для преобразования структуры данных, содержащей СЕ представляют собой множество ИСО
уникальных наименований (УН ИСО) лингвистического предложения 11. ИСО 22 в пригодной для преобразования структуре данных, содержащей СЕ представляют собой отдельные элементы, заранее подготовленные и помещенные в пригодную для преобразования структуру данных, содержащую СЕ в виде структурированного массива (списка, перечня и тому подобного) отдельных ИСО. Такие
подготовительные действия могут осуществляться указанным любым известным из уровня техники способом или неизвестным из уровня техники способом, таким, как способ, указанный при описании способа 100, и, соответственно, далее не описываются.
[0096] Идентификация элементов 22 пригодной для преобразования структуры данных, содержащей СЕ в ходе этапа 201, сводится к классификации элементов, из которых состоит пригодная для преобразования структура данных, содержащая СЕ, как исходных синтаксических объектов (ИСО 22). При этом отдельные ИСО 22 имеют значение 221 и порядковый (порядковые) номер
(номера) 222 ТЭ лингвистического предложения, составляющего (составляющих) синтаксические единицы. Значение 221 ИСО 22 представляет собой один или несколько текстовых элементов (ТЭ 21) предложения 11, из которых состоят ИСО. Как правило ИСО состоят из одного ТЭ 21, за исключением некоторых ИСО.
Например, но не ограничиваясь, ИСО «сказуемое» может состоять из трех ТЭ 21 - «мог быть выполнен». ИСО «сказуемое» состоит из трех текстовых элементов ввиду лингвистической особенности формирования сказуемого, которое, помимо глагола «выполнен», может иметь вспомогательный глагол «быть» и модальность
(модальный глагол) «мог».
[0097] Идентификацию значения 221 элемента 22 (ИСО) пригодной для преобразования структуры данных, содержащей СЕ в ходе этапа 201 производят путем регистрации набора знаков ТЭ 21 предложения 11, составляющего
(составляющих) элемент ИСО 22. Идентификацию порядкового (порядковых) номера (номеров) 222ТЭ, составляющего (составляющих) элемент 22 (ИСО) пригодной для преобразования структуры данных, содержащей СЕ в ходе этапа 201 производят путем регистрации порядкового (порядковых) номера (номеров) упомянутых ТЭ в соответствии с его (их) расположением в лингвистическом предложении, при условии, что первый ТЭ в лингвистическом предложении имеет порядковый номер «1», а все последующие ТЭ имеют порядковый номер, больший на единицу чем порядковый номер предыдущего ТЭ.
[0098] Пригодная для преобразования структура данных, содержащая СЕ, являющаяся исходной для настоящего способа преобразования 200 представляет собой в итоге множество элементов 22, их значений 221 и порядковых номеров 222 ТЭ, составляющих элементы 22, идентифицированных на этапе 201.
[0099] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 22 (ИСО) пригодной для преобразования структуры данных, содержащей СЕ и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих ИСО 22, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 22 (ИСО). При этом, как было описано ранее,
лингвистическими признаками элементов 22 (ИСО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 22 (ИСО).
[0100]На фиг. 16, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 202 формирования пятой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 200. Этап 202 характеризуется: выполнением этапа 2021 формирования значений 2141 второй части лингвистических характеристик 214 текстовых элементов 21, составляющих элементы 22 пригодной для преобразования структуры данных, содержащей СЕ, на котором формируют значения 2141 второй части
лингвистических характеристик 214 текстовых элементов 21, составляющих элементы 22 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 102, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021; выполнением этапа 2022 формирования значений 2231 третьей части лингвистических характеристик 223 текстовых элементов 21, составляющих элементы 22 пригодной для преобразования структуры данных, содержащей СЕ на котором идентифицируют виды элемента 22 пригодной для преобразования структуры данных, содержащей СЕ для которых необходимо изменить некоторые значения лингвистических характеристик, формируют упомянутые значения 2231 третьей части лингвистических
характеристик 223 текстовых элементов 21, составляющих элементы 22 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2022; выполнением этапа 2023 идентификации элементов 61 пятой структуры данных СМД, на котором идентифицируют и формируют элементы 61, пятой структуры данных СМД, а также идентификационные данные элементов 61, представляющие собой для каждого элемента 61, в качестве примера, но не ограничения, значение 611 элемента 61 пятой структуры данных СМД и порядковый (порядковые) номер (номера) 612 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 61, и формируют пятую структуру данных СМД.
[0101]На фиг. 17, в качестве примера, но не ограничения, изображена общая структура сформированной в рамках этапа 2021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей СЕ. БДЛП, сформированная в рамках этапа 2021, отличается от БДЛП, сформированной в рамках этапа 102, наличием значений 2141 второй части лингвистических характеристик 214, указывающих на
синтаксическо-логическую идентичность элемента 22 (ИСО). Для идентификации лингво-логических единиц (ЛЛЕ) лингвистического предложения необходимо по всем синтаксическим единицам вида ИСО (элемент 22) провести проверку на идентичность их синтаксической и логической ролей в лингвистическом
предложении 11. В результате упомянутой проверки синтаксических единиц ИСО 22 на их синтаксическо-логическую идентичность должны быть установлены наличие или отсутствие идентичности ИСО 22. ИСО 22 будет считаться
синтаксическо-логическо идентичным, если его синтаксическая и логическая роли совпадут, и будет считаться синтаксическо-логическо неидентичным, если упомянутые роли не совпадут. Синтаксическая роль ИСО 22 - это функция слова в предложении, которая определяется в рамках взаимосвязей слов в предложении. Синтаксическая роль ИСО 22 определяет, каким членом предложения является слово, и в каких оно синтаксических отношениях состоит с другими словами. Одна и та же форма слова может выполнять различные функции, то есть быть разными членами предложения. Логическая роль ИСО 22 - это синтаксическая роль, отождествленная с логической функцией слова в простом суждении. Вид
логической функции в простом суждении связан с уникальным наименованием логического объекта (УН ЛО), являющегося элементом простого суждения, к которому относится ИСО 22. Простое суждение - это логическая сущность, представляющая собой первичную логическую конструкцию мышления, обязательно содержащую элементы простого суждения - субъект суждения
(предмет окружающего мира, о котором идет речь) и предикат суждения (то, что утверждается или опровергается о предмете суждения). При этом субъект суждения представляет собой один предмет окружающего мира, а предикат суждения состоит как правило из действия и множества предметов, которые находятся в определенной взаимосвязи друг с другом, что в конечном итоге и выполняет функцию предиката суждения, то есть поясняет то, что утверждается или опровергается о предмете суждения. Поэтому предикат суждения может быть разделен на логические функционально-однородные части (логические объекты), в качестве примера, но не ограничения, такие как действие, объект и
обстоятельства предиката суждения. Упомянутые ранее субъект суждения, а также действие, объект и обстоятельства предиката суждения могут являться
уникальными наименованиями логического объекта (УН ЛО), являющегося элементом простого суждения. В соответствии с использованным словом (ИСО 22) посредством которого выражены элементы простого суждения, эти слова (ИСО 22) будут иметь определенную логическую функцию, которая в соответствии с предварительно заданными условиями может отождествляться или не
отождествляться с определенной синтаксической ролью. Таким образом
становится возможным провести проверку на идентичность синтаксической и логической ролей отдельных ИСО 22 лингвистического предложения 11 и преобразовать ИСО 22 в лингво-логические единицы (ЛЛЕ).
[0102]Формирование второй части лингвистических характеристик 214 и их значений 2141 для текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 с целью идентификации синтаксическо -логической идентичности ИСО 22 на этапе 2021 производят путем проверки ИСО 22 на идентичность синтаксической и логической ролей в лингвистическом
предложении 11. Проверка представляет собой сравнение значений 2131 первой части лингвистических характеристик 213 текстовых элементов 21, составляющих элементы 22, с заранее заданными значениями заранее заданных лингвистических признаков текстовых элементов 21, составляющих ИСО 22. Для проведения проверки заранее задаются условия, такие как, в качестве примера, но не ограничения: перечни пар ИСО 22, у которых синтаксическая и логическая роли могут не совпадать, а также признаки несовпадения синтаксической и логической ролей (некоторые значения лингвистических характеристик указанных ИСО 22, при наличии которых ИСО 22 идентифицируется как ИСО 22 с несовпадением синтаксических и логических ролей). ИСО 22, которые успешно проходят
упомянутую проверку идентифицируют как ИСО 22 с совпадением синтаксических и логических ролей (СЛ-идентичные ИСО 22, то есть синтаксическо-логическо идентичные ИСО). ИСО 22, которые не проходят упомянутую проверку по причине того, что их упомянутые роли не совпадают, идентифицируют как ИСО 22 с несовпадением синтаксических и логических ролей (СЛ-неидентичные ИСО 22, то есть синтаксическо-логическо неидентичные ИСО). Например, но не
ограничиваясь, ИСО в форме глагола имеет синтаксическую роль - «сказуемое», а ИСО в форме причастия - синтаксическую роль «согласованное определение».
Несмотря на то, что синтаксические роли глагола и причастия не совпадают, с логической точки зрения и тот и другой ИСО являются синтаксически главными словами в одном и том же элементе простого суждения «действие предиката суждения», то есть имеют одну и ту же логическую роль. В итоге ИСО в форме глагола проходит проверку идентичности синтаксической и логической ролей, так как «глагол» и есть то, что выражает действие. При этом ИСО в форме
согласованного определения не проходит проверку, так как «определение» - это признак, а не действие. По этой причине, а также при дополнительном условии, что причастие является распространенным (имеет зависимые слова - значимые части речи) считается, что ИСО «согласованное определение» в форме причастия не проходят упомянутую проверку и являются СЛ-неидентичным ИСО 22. Упомянутые условия, используемые для проведения проверки идентичности синтаксической и логической ролей ИСО 22 предварительно записывают в четвертую
пользовательскую базу данных (четвертую ПБД).
[0103]Сформированные в результате выполнения этапа 2021 значения 2141 (синтаксическо-логическая идентичность ИСО 22) второй части лингвистических характеристик 214 элементов 21, составляющих ИСО 22 пригодной для
преобразования структуры данных, содержащей СЕ вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 102, формируя таким образом БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021. При этом обе части (213 и 214) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2131 и 2141) формируют уникальные
лингвистические признаки элементов 22.
[0104]На фиг. 18, в качестве примера, но не ограничения, изображена общая структура сформированной в рамках этапа 2022 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей СЕ. БДЛП, формируемая в рамках этапа 2022, отличается от БДЛП, формируемой в рамках этапа 2021, наличием значений 2231 третьей части лингвистических характеристик 223, указывающих вид элемента 22 (ИСО) и актуальные значения некоторых лингвистических характеристик 213 текстовых элементов, составляющих элемент 22 (ИСО). Для идентификации лингво-логических единиц (ЛЛЕ) лингвистического 11 необходимо по всем синтаксическим единицам ИСО 22, по которым была проведена проверка на идентичность их синтаксической и логической ролей дополнительно провести идентификацию видов ИСО 22 по признаку внесения изменений в значения их лингвистических характеристик 213 в соответствии с их значением 2141 синтаксическо-логической идентичности 214. В результате проведенной на этапе 2021 проверки на синтаксическо-логическую идентичность ИСО 22 было установлено, что все ИСО 22 разделяются по этому признаку на СЛ-идентичные и СЛ-неидентичные ИСО 22. При этом СЛ-неидентичные ИСО 22 могут быть изменяемыми и неизменяемыми, то есть такие СЛ-неидентичные ИСО 22, у которых в соответствии с заранее заданным условием должны быть изменены значения 2131 некоторых лингвистических характеристик 213 или не изменены. Кроме этого, в некоторых случаях, в заранее установленных условиях возможно наличие требования о создании дубликата СЛ-неидентичного ИСО 22, у которого не изменяются лингвистические характеристики. Упомянутые условия и требования устанавливаются в четвертой ПБД.
[0105]Формирование третьей части лингвистических характеристик 223 и их значений 2231 для текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 производят на этапе 2022 с целью идентификации различных видов ИСО 22 по признаку синтаксическо-логической идентичности (СЛ-идентичности) и формирования дубликата СЛ-неидентичного ИСО 22 путем комплексного анализа условий, установленных в четвертой ПБД, и на основании итогов проверки ИСО 22 на СЛ-идентичность. В результате упомянутого анализа для каждого ИСО 22 устанавливают определенный вид - первый, второй или третий вид. Если в условиях, установленных в четвертой ПБД, имеется требование о создании дубликата СЛ-неидентичных ИСО 22, то такие ИСО 22 относят к четвертому виду ИСО 22. В соответствии с установленным видом ИСО 22
формируют значения 2231 третьей части лингвистических характеристик 223 текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22. У первого вида ИСО 22 (СЛ-идентичные) остаются все их исходные значения 221 и номера текстовых элементов 222, а также их лингвистические характеристики 213 и 214 со значениями 2131 и 2141. В связи с этим значения 2231 лингвистических характеристик 213 для такого ИСО 22 отсутствуют. У второго вида ИСО 22 (СЛ-неидентичные изменяемые) остается неизменным исходное их значение 221 и номера текстовых элементов 222, а также вторая часть их лингвистических характеристик 214 со значениями 2141, но при этом значения 2131 некоторых лингвистических характеристик 213 первой части изменяют. В связи с этим значения 2231 лингвистической характеристики 223 вместо изменяемых значений 2131 некоторых лингвистических характеристик 213 такого ИСО 22 указывается таким, как это установлено в четвертой ПБД. У третьего вида ИСО 22 (СЛ-неидентичные неизменяемые) остаются все их исходные значения 221 и номера текстовых элементов 222, а также их лингвистические характеристики
213 и 214 со значениями 2111 и 2141. В связи с этим значения 2231
лингвистических характеристик 213 для такого ИСО 22 отсутствуют. У четвертого вида ИСО 22 (дубликат СЛ-неидентичных неизменяемых ИСО) остается
неизменным исходное их значение 221 и номера текстовых элементов 222, а также вторая часть их лингвистических характеристик 214 со значениями 2141, но при этом значения 2131 некоторых лингвистических характеристик 213 первой части изменяют. В связи с этим значения 2231 лингвистической характеристики 223 вместо изменяемых значений 2131 некоторых лингвистических характеристик 213 такого ИСО 22 указывают таким, как это установлено в четвертой ПБД.
[0106]Сформированные по итогам этапа 2022 значения 2231 (измененные значения лингвистических характеристик ИСО 22) третьей части лингвистических характеристик 223 элементов 21, составляющих ИСО 22 пригодной для
преобразования структуры данных, содержащей СЕ, вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021, формируя таким образом БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2022. При этом все три части (213,
214 и 223) лингвистических характеристик текстовых элементов 21
лингвистического предложения 11 и их значения (2131, 2141 и 2231) формируют уникальные лингвистические признаки элемента 22.
[0107]На фиг. 19, в качестве примера, но не ограничения, изображена общая структура сформированной пятой структуры данных СМД, являющейся первой для настоящего способа преобразования 200. Пятая структура данных СМД
представляет собой СМД, содержащий элементы 61 пятой структуры данных СМД, которые представляют собой лингво-логические единицы (ЛЛЕ 61)
лингвистического предложения 11 и идентификационные данные ЛЛЕ 61, представляющие собой для каждой ЛЛЕ, в качестве примера, но не ограничения, значение 611 элемента 61 пятой структуры данных и порядковый (порядковые) номер (номера) 612 ТЭ, составляющего (составляющих) ЛЛЕ 61. У ЛЛЕ 61 лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ЛЛЕ), имеющие практическое использование в качестве примера, но не ограничения: «подлежащее», «сказуемое», «прямое дополнение» и тому подобное. В структуре данных элементы 61 именуются уникальными наименованиями, и, в качестве примера, но не ограничения, могут именоваться как «УН ЛЛЕ п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ЛЛЕ, ранее не встречавшегося в лингвистическом предложении. Лингво-логическая единица (ЛЛЕ 61) - это синтаксическая единица вида ИСО, по которой проведена проверка на идентичность ее синтаксической и логической ролей в лингвистическом предложении. При этом может быть два вида ЛЛЕ 61: первый вид - это
оригинальный ИСО 22, прошедший упомянутую проверку, который содержался в пригодной для преобразования структуре данных, содержащей СЕ, а второй вид - это дубликат ИСО 22, которого не было в упомянутой структуре данных. Первому виду ЛЛЕ 61 соответствуют все ИСО 22 пригодной для преобразования структуры данных, содержащей СЕ. Второму виду ЛЛЕ 61 соответствуют те ИСО 22 пригодной для преобразования структуры данных, содержащей СЕ, которые отнесены к четвертому виду (дубликат СЛ-неидентичных неизменяемых ИСО), указанному в значении 2231 третьей части лингвистических характеристик 223.
[0108]Идентификацию и формирование элементов 61 пятой структуры данных СМД в ходе этапа 2023 производят на основе результатов этапа 2022 по идентификации видов элементов 22 пригодной для преобразования структуры данных, содержащей СЕ. Идентификацию элементов 61 (ЛЛЕ) первого вида на этапе 2023 производят путем их отождествления с элементами 22 (ИСО) первого, второго и третьего видов. ИСО 22, идентифицированные на этапе 2022 как четвертый вид, формируют новые элементы - элементы 61 второго вида пятой структуры данных СМД. Формирование элементов 61 (ЛЛЕ) второго вида на этапе 2023 производится путем их отождествления с элементами 22 (ИСО) четвертого вида.
[0109]Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 первого вида пятой структуры данных СМД,
отождествленного с первым видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 первого вида, а порядкового (порядковых) номера (номеров) 612 ТЭ, составляющего (составляющих) элемент 61, путем отождествления с порядковым (порядковыми) номером (номерами) 222 ТЭ, составляющего (составляющих) элемент 22 первого вида. Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 первого вида пятой структуры данных СМД, отождествленного со вторым видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 второго вида, а
порядкового (порядковых) номера (номеров) 612ТЭ, составляющих элемент 61, с порядковым (порядковыми) номерами 222 ТЭ, составляющего (составляющих) элемент 22 второго вида. Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 первого вида пятой структуры данных СМД, отождествленного с третьим видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 третьего вида, а порядкового (порядковых) номера (номеров) 612 текстовых элементов 21, составляющих элемент 61, с порядковым (порядковыми) номером (номерами) 222 ТЭ, составляющего (составляющих) элемент 22 третьего вида. Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 второго вида пятой структуры данных СМД, отождествленного с четвертым видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 третьего вида, а порядкового (порядковых) номера (номеров) 612ТЭ, составляющего (составляющих) элемент 61, с порядковым (порядковыми) номером (номерами) 222 ТЭ, составляющего (составляющих) элемент 22 третьего вида.
[0110]Формирование пятой структуры данных СМД в ходе этапа 2023 производят путем объединения в одной структуре данных элементов 61 первого и второго видов пятой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.
[0111]Идентификацию лингвистических характеристик ТЭ, составляющих первые или вторые элементы 61 (ЛЛЕ) пятой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2022, состоящего из идентификационных данных ТЭ, составляющих первый или второй элемент 61 (ЛЛЕ), и получении значений (2131, 2141, 2231) всех частей лингвистических характеристик (213, 214, 223) текстовых элементов 21 лингвистического предложения 11, из которых состоит первый или второй элемент 61 (ЛЛЕ). При этом, как было описано ранее лингвистическими признаками первых и вторых элементов 61 (ЛЛЕ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 61 (ЛЛЕ).
[0112]На фиг. 20 в качестве примера, но не ограничения, изображена общая схема выполнения этапа 203 формирования шестой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 200. Этап 203 характеризуется: выполнением этапа 2031 формирования значений 2151 четвертой части лингвистических характеристик 215 текстовых элементов 21, составляющих элементы 61 пятой структуры данных СМД, на котором формируют значения 2151 четвертой части лингвистических характеристик 215 текстовых элементов 21, составляющих элементы 61, и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2022, формируя в итоге БДЛП текстовых элементов 21
лингвистического предложения 11, формируемую в рамках этапа 2031;
выполнением этапа 2032 формирования элементов шестой структуры данных СМД, на котором формируют элементы 71 шестой структуры данных СМД, а также идентификационные данные элементов 71, представляющие собой для каждого элемента 71, в качестве примера, но не ограничения, значение 711 элемента 71 шестой структуры данных СМД и порядковый (порядковые) номер (номера) 712 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 71; и формируют шестую структуру данных СМД.
[0113]На фиг. 21, в качестве примера, но не ограничения, изображена общая структура сформированной в рамках этапа 2031 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 61 пятой структуры данных СМД. БДЛП, формируемая в рамках этапа 2031 отличается от БДЛП, формируемой в рамках этапа 2022, наличием значений 2151 четвертой части лингвистических характеристик 215, указывающих на уровень синтаксической значимости элемента 61 (ЛЛЕ). Уровень синтаксической значимости элемента 61 (ЛЛЕ) характеризует местоположение ЛЛЕ в синтаксическом дереве лингвистического предложения 11. Синтаксическим деревом является схема синтаксических связей предложения 11, в которой между отдельными словами (ЛЛЕ) установлена подчинительная
синтаксическая связь. В зависимости от состава и строения предложения
синтаксическое дерево может содержать неопределенное количество
синтаксических уровней и частей предложения, в которых содержатся основные логические элементы (субъект и предикат суждения). Синтаксическое дерево, используемое в настоящем способе, содержит элементы (ЛЛЕ) как минимум трех уровней синтаксической значимости (УСЗ). К первому УСЗ относят ЛЛЕ,
находящиеся на синтаксической вершине синтаксического дерева. Ко второму УСЗ относят ЛЛЕ, являющиеся прямыми синтаксическими потомками синтаксических вершин. К третьему УСЗ относят все остальные ЛЛЕ лингвистического
предложения. Синтаксическая вершина - это синтаксическая единица (ЛЛЕ), имеющая синтаксическую роль «сказуемое». Особенностью ЛЛЕ «сказуемое» является то, что оно может состоять из трех слов. Прямой синтаксический потомок синтаксической вершины - это синтаксическая единица (ЛЛЕ), имеющая прямую подчинительную связь со словом группы ЛЛЕ первого уровня. Установление синтаксического уровня ЛЛЕ является синтаксическим структурированием ЛЛЕ.
[0114]Формирование четвертой части лингвистических характеристик 215 и их значений 2151 для текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 61, с целью установления уровня синтаксической значимости элементов 61 пятой структуры данных СМД в ходе этапа 2031 производят на основании комплексного анализа значений лингвистических характеристик всех ЛЛЕ 61 лингвистического предложения, на основе которого формируют синтаксическое дерево лингвистического предложения. В результате выяснения положения каждого ЛЛЕ в синтаксическом дереве предложения определяют уровень синтаксической значимости каждого ЛЛЕ 61.
[0115]Сформированные по итогам этапа 2031 значения 2151 (уровень синтаксической значимости ЛЛЕ 61) четвертой части лингвистических характеристик 215 элементов 21, составляющих элементы 61 пятой структуры данных СМД, вносят в БДЛП текстовых элементов 21 лингвистического
предложенияН, формируемую в рамках этапа 2022, формируя таким образом БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031. При этом все части (211, 214, 223, 215) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2231, 2151) формируют уникальные лингвистические признаки элементов 61.
[0116]На фиг. 22, в качестве примера, но не ограничения, изображена общая структура сформированной шестой структуры данных СМД, являющаяся второй структурой данных для настоящего способа преобразования 200. Шестая структура данных СМД представляет собой СМД, содержащий элементы 71, которые представляют собой структурированные группы лингво-логических единиц (группы ЛЛЕ) лингвистического предложения 11 и идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, в качестве примера, но не ограничения, значение 711 элемента 71 шестой структуры данных и
порядковый (порядковые) номер (номера) 712 ТЭ, составляющего (составляющих) группу ЛЛЕ. У групп ЛЛЕ 71 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН групп ЛЛЕ), имеющие практическое использование. В структуре данных элементы 71, в качестве примера, но не ограничения, могут именоваться как «группа ЛЛЕ 1», «группа ЛЛЕ 2», «группа ЛЛЕ 3», «группа ЛЛЕ п», где n > 1 - порядковый номер элемента в лингвистическом предложении. Группа ЛЛЕ лингвистического предложения 11 - это синтаксические единицы вида «синтаксическая конструкция», которые формируются из лингво-логических единиц (элементов 61 пятой структуры данных СМД) разных уровней синтаксической значимости ЛЛЕ. К первой группе ЛЛЕ (первые элементы 71 шестой структуры данных СМД) относят как главные ЛЛЕ первой группы ЛЛЕ, являющиеся упомянутыми синтаксическими вершинами (ЛЛЕ первого УСЗ), так и прочие ЛЛЕ первой группы ЛЛЕ (группы 1 ЛЛЕ), являющиеся последовательно подчиненными ЛЛЕ, первая из которых имеет прямую подчинительную связь с ЛЛЕ первого УСЗ, вплоть до ЛЛЕ, которая является главной ЛЛЕ второй группы ЛЛЕ. Ко второй группе ЛЛЕ (вторые элементы 71 шестой структуры данных СМД) относят как главные ЛЛЕ второй группы ЛЛЕ, являющиеся упомянутыми ЛЛЕ второго УСЗ при условии, что, такой ЛЛЕ имеет синтаксическую роль подлежащего или любого второстепенного члена предложения, кроме определения (исключая определения в форме
распространенного причастия или деепричастия), так и прочие ЛЛЕ второй группы ЛЛЕ, являющиеся последовательно подчиненными ЛЛЕ, первая из которых является ЛЛЕ третьего УСЗ, которые имеют прямую подчинительную связь с упомянутым главным ЛЛЕ второй группы ЛЛЕ, вплоть до последних ЛЛЕ в цепочке ЛЛЕ с непрерывной подчинительной связью.
[0117] Идентификацию элементов 71 (первых и вторых элементов 71) шестой структуры данных СМ в ходе этапа 2032 производят посредством
идентификации главных ЛЛЕ первых и вторых групп ЛЛЕ, а также идентификации прочих ЛЛЕ первых и вторых групп ЛЛЕ. Для идентификации главных ЛЛЕ первых групп ЛЛЕ необходимо выявить все ЛЛЕ «сказуемое» (в том числе, все части каждого ЛЛЕ «сказуемое») анализируемого предложения. Для идентификации главных ЛЛЕ вторых групп ЛЛЕ необходимо выявить все ЛЛЕ, которые имеют прямую синтаксическую связь с любой частью ЛЛЕ «сказуемое» и которые при этом имеют синтаксическую роль подлежащего или любого второстепенного члена предложения, кроме определения (исключая определения в форме
распространенного причастия или деепричастия). Для идентификации прочих ЛЛЕ первой или второй группы ЛЛЕ необходимо идентифицировать все ЛЛЕ, которые имеют непрерывную синтаксическую подчинительную связь, начиная от главного ЛЛЕ первой или второй группы ЛЛЕ и вплоть до другого идентифицированного главного ЛЛЕ первой или второй группы ЛЛЕ, или до последнего ЛЛЕ в цепочке непрерывной синтаксической подчинительной связи от главного ЛЛЕ первой или второй группы ЛЛЕ. Формирование первых элементов 71 шестой структуры данных СМД производят путем объединения идентифицированных главной ЛЛЕ первой группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ. Формирование вторых элементов 71 шестой структуры данных СМ производят путем объединения идентифицированных главной ЛЛЕ второй группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ.
[0118]Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ первого элемента 71 (первой группы ЛЛЕ) шестой структуры данных СМД в рамках этапа 2032 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент (элементы) 61, из которого (которых) состоит первый элемент 71, идентифицируют как значение 711 первого элемента 71 (первая группа ЛЛЕ), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент (элементы) 61, из которого (которых) состоит первый элемент 71,
идентифицируют как порядковый (порядковые) номер (номера) 712 ТЭ, составляющего(составляющих) первый элемент 71 (первая группа ЛЛЕ).
Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ второго элемента 71 (второй группы ЛЛЕ) шестой структуры данных СМД в рамках этапа 2032 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент (элементы) 61, из которого (которых) состоит второй элемент 71,
идентифицируют как значение 711 второго элемента 71 (вторая группа ЛЛЕ), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 61, из которого (которых) состоит второй элемент 71, идентифицируют как порядковый (порядковые) номер (номера) 712 ТЭ, составляющего(составляющих) второй элемент 71 (вторая группа ЛЛЕ).
[0119] Формирование шестой структуры данных СМД в ходе этапа
2032 производят путем объединения в одной структуре данных первых и вторых элементов 71 шестой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.
[0120] Идентификацию лингвистических характеристик ТЭ, составляющих первые или вторые элементы 71 (первую или вторую группу ЛЛЕ) шестой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2031, состоящего из идентификационных данных ТЭ, составляющих первый или второй элемент 71 (первая или вторая группа ЛЛЕ), и получении значений (2131, 2141, 2231, 2151) всех частей лингвистических характеристик (213, 214, 223, 215) текстовых элементов 21 лингвистического предложения 11, из которых состоит первый или второй элемент 71 (первая или вторая группа ЛЛЕ). При этом, как было описано ранее лингвистическими признаками первых и вторых элементов 71 (первой и второй группы ЛЛЕ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 71 (группы ЛЛЕ).
[0121] На фиг. 23, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 204 формирования седьмой структуры данных СМД, являющейся третьей структурой данных для рассматриваемого способа 200. Этап 204 характеризуется: выполнением этапа 2041 идентификации видов элементов 71 шестой структуры данных СМД, указывающих на наличие в элементе 71 осложнений лингвистического предложения, на котором
идентифицируют первые и вторые виды элементов 71 шестой структуры данных СМД, а также идентификации непреобразованных элементов 81 седьмой
структуры данных СМД и их идентификационных данных, представляющих собой для каждого непреобразованного элемента 81, в качестве примера, но не
ограничения, значение 811 непреобразованного элемента 81 седьмой структуры данных СМД и порядковый (порядковые) номер (номера) 812 ТЭ лингвистического предложения 11, составляющего (составляющих) непреобразованный элемент 81 (значение и порядковые номера ТЭ непреобразованного элемента 81);
выполнением этапа 2042 формирования преобразованных элементов 81 седьмой структуры данных СМД, на котором формируют преобразованные элементы седьмой структуры данных СМД из элементов 71 второго вида, а также
идентификационные данные преобразованных элементов 81, представляющие собой для каждого преобразованного элемента 81, в качестве примера, но не ограничения, значение 811 преобразованного элемента 81 седьмой структуры данных СМД и порядковый (порядковые) номер (номера) 812 ТЭ лингвистического предложения 11, составляющего (составляющих) преобразованный элемент 81(значение и порядковые номера ТЭ преобразованного элемента 81);
выполнением этапа 2043 формирования седьмой структуры данных СМД, на котором формируют седьмую структуру данных СМД из преобразованных элементов 81 и непреобразованных элементов 81 седьмой структуры данных СМД.
[0122] На фиг. 24, в качестве примера, но не ограничения, изображена общая структура сформированной седьмой структуры данных СМД, являющейся третьей структурой данных для настоящего способа преобразования 200. Седьмая структура данных СМД представляет собой СМД, содержащий непреобразованные элементы 81 и преобразованные элементы 81, которые представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения 11. У ОЛЛО лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ОЛЛО), имеющие практическое использование, в качестве примера, но не ограничения: «субъект суждения», «предикат суждения» и тому подобное. В структуре данных элементы 81 именуются уникальными наименованиями, и, в качестве примера, но не ограничения, могут именоваться как «УН ОЛЛО п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ОЛЛО, ранее не встречавшегося в лингвистическом предложении. В дальнейшем, при
упоминании ОЛЛО как элемента седьмой структуры данных имеется ввиду УН ОЛЛО. Основные лингво-логические объекты предложения - это пограничная сущность с признаками как лингвистического, так и логического объектов.
Сущность - это объект в компьютерной системе, содержащий набор критических правил. С лингвистической точки зрения, основной лингво-логический объект - это синтаксическая единица вида «синтаксическая конструкция», которая может быть сформирована из структурированной группы ЛЛЕ путем гетерогенизации группы ЛЛЕ. Гетерогенизация группы ЛЛЕ - это устранение однородностей в синтаксической конструкции путем идентификации в ней синтаксической сочинительной связи и преобразования синтаксической конструкции с
однородностями в несколько синтаксических конструкций без однородностей. Сочинительная связь - это связь между синтаксически равноправными единицами предложения (в данном случае между ЛЛЕ), у которых имеется одно и то же синтаксически главное слово (главная ЛЛЕ) и одна и та же синтаксическая роль (синтаксическая роль ЛЛЕ). ЛЛЕ, между которыми идентифицирована
синтаксическая сочинительная связь, считаются «однородными членами» (ЛЛЕ- ОЧ). С логической точки зрения ОЛЛО - это логические сущности (объекты), являющиеся элементами простого суждения, с помощью которых формируют и передают мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъекте суждения). При этом нечто (то, что утверждается или опровергается о предмете суждения) может быть
дополнительно логически структурирован. Например, но не ограничиваясь, предикат суждения может быть разделен на три логически отделимые логические сущности (объекта) - действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения. Упомянутые выше для примера элементы простого суждения (субъект суждения, действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения) могут быть отождествлены с отдельными УН ОЛЛО, как с отдельными синтаксическими конструкциями лингвистического предложения 11. С семантической точки зрения ОЛЛО представляют собой обобщенный мыслимый (семантический) образ элемента простого суждения.
[0123] Идентификацию элементов 71 первого или второго вида шестой структуры данных СМД в рамках этапа 2041 производят путем анализа значений лингвистических характеристик текстовых элементов шестой структуры данных СМД, составляющих элемент 71 (группу ЛЛЕ), с целью идентификации синтаксических сочинительных связей в группе ЛЛЕ 71. Синтаксическая
сочинительная связь между текстовыми элементами (словами, ЛЛЕ) в группе ЛЛЕ 71 идентифицируют в случае наличия у таких ЛЛЕ (слов) одного и того же синтаксического родителя (синтаксически главного слова, у которого с такими ЛЛЕ (словами) имеется прямая синтаксическая подчинительная связь).
Дополнительными условиями может быть наличие у таких ЛЛЕ (слов) одной и той же синтаксической роли, а также наличие признака связи между такими ЛЛЕ (словами), а именно запятой или сочинительного союза. Сочинительные союзы делятся по значению на соединительные («и», «да» в значении «и», «ни... ни», «также», «тоже», «как... так и»), разделительные («или», «или... или», «либо», «либо... либо», «то... то», «то ли... то ли», «не то... не то») и противительные («а», «но», «однако», «да» в значении «но»), в том числе сопоставительные («не только... но и», «не только... а и», «не только не... но», «не столько... сколько»). Предварительно могут быть заданы иные собственные критерии идентификации сочинительной связи или, например, не ограничиваясь, может быть задано игнорирование какого- либо дополнительного условия, например, не ограничиваясь, условия о наличии признака связи. При идентификации синтаксической сочинительной связи в группе ЛЛЕ такие группы ЛЛЕ с однородными членами идентифицируются как второй вид элемента 71 шестой структуры данных СМД. Все иные группы ЛЛЕ, в которых не идентифицируется синтаксическая сочинительная связь
идентифицируются как первый вид элемента 71 шестой структуры данных СМД. При этом идентифицированный первый вид элемента 71 шестой структуры данных СМД отождествляют с непреобразованным элементом 81 седьмой
структуры данных СМД. Формирование преобразованных элементов седьмой структуры данных СМД (преобразованных элементов 81, полученных из элементов 71 второго вида) на этапе 2042 производят на основании идентифицированной на этапе 2041 синтаксической сочинительной связи и однородных членов путем преобразования идентифицированных элементов 71 второго вида шестой структуры данных СМД. Смысл преобразования элемента 71 второго вида на этапе 2042 состоит в гетерогенизации группы ЛЛЕ, то есть в устранении синтаксических однородностей в группе ЛЛЕ путем формирования из элемента 71 второго вида множества новых групп ЛЛЕ, идентичных по однородностям элементу 71 первого вида. При этом каждая новая группа ЛЛЕ упомянутого множества может содержать только один из упомянутых однородных членов (если элемент 71 второго вида содержит один ряд однородных членов) или только одно уникальное сочетание упомянутых однородных членов разных рядов однородных членов (если элемент 71 второго вида содержит несколько рядов однородных членов). Множество групп ЛЛЕ, сформированных из элемента 71 второго вида, являются гетерогенными ОЛЛО (преобразованными элементами 81), то есть сформированными из одной группы ЛЛЕ 71 второго вида путем ее гетерогенного преобразования
(гетерогенизации). Процесс гетерогенизации элементов 71 второго вида может быть проведен, в качестве примера, но не ограничения, следующим образом: на первом этапе выявляют ряды однородных членов в анализируемом элементе 71 второго вида; в ходе выявления рядов однородных членов выявляются сами ряды однородных членов и порядковые номера однородных членов в ряду, а также признаки связи каждого однородного члена (ЛЛЕ-ОЧ); на втором этапе выявляют цепочки однородных членов для каждого выявленного ЛЛЕ-ОЧ элемента 71 второго вида; при этом цепочки однородных членов (цепочки 04) - это ЛЛЕ-ОЧ и зависимая цепочка 04 (цепочка синтаксически связанных ЛЛЕ, начиная от первого синтаксического потомка ЛЛЕ-ОЧ (синтаксически зависимого слова) и продолжая по цепочке синтаксической зависимости (по синтаксической подчинительной связи) до другого ЛЛЕ-ОЧ или до последней ЛЛЕ в элементе 71 второго вида;
идентифицированные цепочки 04 классифицируются по факту наличия
синтаксического потомка ЛЛЕ в зависимой цепочке 04, который не входит в зависимую цепочку 04; те цепочки 04, которые имеют зависимые цепочки 04 без синтаксического потомка за рамками зависимой цепочки 04 считаются крайними цепочками однородных членов (крайними цепочками 04), а те цепочки 04, которые имеют зависимые цепочки 04 с синтаксическим потомком за рамками зависимой цепочки 04 считаются внутренними цепочками однородных членов (внутренними цепочками 04); на третьем этапе выявляют ЛЛЕ элемента 71 второго вида, не входящие в цепочки однородных членов (ЛЛЕ вне цепочек 04); на четвертом этапе формируют сменные зависимые цепочки (сменные ЗЦ) элемента 71 второго вида; при этом сменная ЗЦ - это основа преобразованных элементов 81, состоящая из одной крайней цепочки 04 и внутренних цепочек 04, если такие внутренние цепочки 04 по цепочке непрерывной синтаксической подчинительной связи имеются между крайней цепочкой 04 и ЛЛЕ вне цепочек 04; на пятом этапе формируют гетерогенные основные лингво-логические объекты (ОЛЛО); при этом гетерогенный ОЛЛО формируется из одной сменной ЗЦ и ЛЛЕ вне цепочки 04 (если такие ЛЛЕ есть); количество сменных ЗЦ элемента 71 второго вида определяет количество гетерогенных ОЛЛО, сформированных от одного элемента 71 второго вида.
[0124] Идентификация видов элементов 71 шестой структуры данных
СМД в рамках этапа 2041 не изменяет значение 711 элемента 71 и не изменяет порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 71 (группу ЛЛЕ). Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ непреобразованного элемента 81 (ОЛЛО) седьмой структуры данных СМД в рамках этапа 2041 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 первого вида шестой структуры данных СМД идентифицируют как значение 811 непреобразованного элемента 81 (ОЛЛО), а порядковый (порядковые) номер (номера) 712 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 из которого состоит непреобразованный элемент 81 идентифицируют как порядковый (порядковые) номер (номера) 812 ТЭ, составляющего (составляющих) непреобразованный элемент 81 (ОЛЛО). Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ преобразованного элемента 81 (гетерогенного ОЛЛО) седьмой структуры данных СМД в рамках этапа 2042 производят следующим образом:
значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 второго вида шестой структуры данных СМД, за исключением значения (значений) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) отдельную (отдельные) часть (части) элемента 71 второго вида (ЛЛЕ-04), которая (которые) была (были) удалена (удалены) при гетерогенизации, и признаков связи удаленных ЛЛЕ-04 (синтаксически
подчиненные удаленным ЛЛЕ-04 сочинительные союзы или знаки препинания) идентифицируют как значение 811 преобразованного элемента 81 (ОЛЛО), а порядковый (порядковые) номер (номера) 212 ТЭ 21 лингвистического
предложения 11, составляющего (составляющих) элемент 71 второго вида шестой структуры данных СМД, за исключением порядкового (порядковых) номера
(номеров) 212 ТЭ 21 лингвистического предложения 11, составляющего
(составляющих) отдельную (отдельные) часть (части) элемента 71 второго вида (ЛЛЕ-ОЧ), которая (которые) была (были) удалена (удалены) при гетерогенизации, и признаков связи удаленных ЛЛЕ-ОЧ (синтаксически подчиненные удаленным ЛЛЕ-ОЧ сочинительные союзы или знаки препинания) идентифицируют как порядковый (порядковые) номер (номера) 812 ТЭ, составляющего (составляющих) преобразованный элемент 81 (гетерогенный ОЛЛО).
[0125] Формирование седьмой структуры данных СМД в рамках этапа 2043 производят путем объединения в одной структуре данных
идентифицированных на этапе 2041 и сформированных на этапе 2042 элементов 81 седьмой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. Первым из объединяемых элементов седьмой структуры данных СМД является элемент, идентифицированный на этапе 2041 как элемент 71 первого вида, являющийся непреобразованным элементом 81, то есть ОЛЛО 81, совпадающий с группой ЛЛЕ 71 без синтаксической сочинительной связи. Вторым из объединяемых элементов седьмой структуры данных СМД являются преобразованные элементы 81, сформированные на этапе 2042 как множество преобразованных элементов 81, являющихся гетерогенными ОЛЛО,
сформированными из элемента 71 второго вида (групп ЛЛЕ с синтаксической сочинительной связью) путем гетерогенизации групп ЛЛЕ второго вида.
[0126] Идентификацию лингвистических характеристик ТЭ,
составляющих первые или вторые элементы 81 (ОЛЛО) седьмой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2031, состоящего из идентификационных данных ТЭ, составляющих первый или второй элемент 81 (ОЛЛО), и получении значений (2131, 2141, 2231, 2151) всех частей лингвистических характеристик (213, 214, 223, 215) текстовых элементов 21 лингвистического предложения 11, из которых состоит первый или второй элемент 81 (ОЛЛО). При этом, как было описано ранее лингвистическими признаками элементов 81 (ОЛЛО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 81 (ОЛЛО).
[0127] Далее, после завершения описанного ранее этапа 204, в целях еще большего повышения точности последующего поиска в структурированном массиве данных (СМД), становится возможным осуществить дальнейшее
преобразование СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и их идентификационные данные.
[0128] На фиг. 25, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 300 преобразования СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО,
являющегося исходной структурой данных для рассматриваемого способа 300. Заявленный способ 300 преобразования СМД, содержащего, по меньшей мере,
ОЛЛО лингвистического предложения и идентификационные данные ОЛЛО, характеризуется: выполнением этапа 301 идентификации пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором
идентифицируют структуру данных СМД, содержащую элементы упомянутой пригодной для преобразования структуры данных, содержащей ОЛЛО, являющейся исходной структурой данных СМД в рамках рассматриваемого способа 300, причем упомянутые элементы пригодной для преобразования структуры данных представляют собой основные лингво-логические объекты (ОЛЛО)
лингвистического предложения и идентификационные данные ОЛЛО;
выполнением этапа 302 формирования восьмой структуры данных СМД, на котором формируют восьмую структуру данных СМД, являющуюся первой структурой данных СМД для рассматриваемого способа 300, содержащую элементы упомянутой восьмой структуры данных СМД, причем упомянутые элементы восьмой структуры данных СМД представляют собой исходные простые лингво - логические конструкции (ИП ЛЛК) лингвистического предложения,
сформированные из синтаксически связанных ОЛЛО простого предложения исходного лингвистического предложения, а также представляют собой
идентификационные данные ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, в качестве примера, но не ограничения: значение ИП ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИП ЛЛК; выполнением этапа 303 формирования девятой структуры данных СМД, на котором формируют девятую структуру данных СМД, являющуюся второй структурой данных СМД для рассматриваемого способа 300, содержащую элементы девятой структуры данных СМД, причем упомянутые элементы девятой структуры данных СМД представляют собой простые лингво-логические конструкции (ПЛЛК) лингвистического предложения, сформированные из ИП ЛЛК путем устранения однородностей в ИП ЛЛК, а также представляют собой идентификационные данные ПЛЛК,
представляющие собой для каждой ПЛЛК, в качестве примера, но не ограничения: значение ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ПЛЛК; выполнением этапа 304 формирования десятой структуры данных СМД, на котором формируют десятую структуру данных СМД, являющуюся третьей структурой данных СМД для рассматриваемого способа 300, содержащую элемент упомянутой десятой структуры данных СМД, причем упомянутый элемент десятой структуры данных СМД представляет собой исходную сложную лингво - логическую конструкцию (ИС ЛЛК) лингвистического предложения,
сформированную путем объединения всех ПЛЛК с учетом синтаксических связей ПЛЛК в исходном лингвистическом предложении, а также представляет собой идентификационные данные ИС ЛЛК, представляющие собой, в качестве примера, но не ограничения: значение ИС ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИС ЛЛК; выполнением этапа 305 формирования одиннадцатой структуры данных СМД, на котором формируют одиннадцатую структуру данных СМД, являющуюся итоговой структурой данных СМД для рассматриваемого способа 300, содержащую элементы упомянутой одиннадцатой структуры данных СМД, причем упомянутые элементы одиннадцатой структуры данных СМД представляют собой сложные лингво-логические конструкции (СЛЛК) лингвистического предложения, сформированные из ИС ЛЛК путем устранения однородностей в ИС ЛЛК, а также представляют собой идентификационные данные СЛЛК, представляющие собой для каждой СЛЛК, в качестве примера, но не ограничения: значение СЛЛК и порядковые номера ТЭ лингвистического
предложения, составляющих СЛЛК.
[0129] На фиг. 26, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 301 идентификации пригодной для
преобразования структуры данных, содержащей основные лингво-логические объекты (ОЛЛО), являющейся исходной структурой данных для рассматриваемого способа 300. Этап 301 характеризуется выполнением идентификации пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором
идентифицируют элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, а также идентификационные данные элементов 91,
представляющие собой для каждого ОЛЛО, в качестве примера, но не ограничения, значение 911 элемента 91 пригодной для преобразования структуры данных, содержащей ОЛЛО и порядковый (порядковые) номер (номера) 912 ТЭ
лингвистического предложения 11, составляющего (составляющих) элемент 91.
[0130] На фиг. 27, в качестве примера, но не ограничения, изображена общая структура данных, являющаяся исходной для настоящего способа
преобразования 300, представляющая собой пригодную для преобразования структуру данных, содержащую основные лингво-логические объекты (ОЛЛО). Исходная структура данных представляет собой СМД, содержащий элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО,
представляющие собой основные лингво-логические объекты (ОЛЛО) и
идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, в качестве примера, но не ограничения, значение 911 элемента 91 пригодной для преобразования структуры данных содержащей ОЛЛО и порядковый (порядковые) номер (номера) 912 ТЭ лингвистического предложения, составляющего
(составляющих) ОЛЛО, которые, в качестве примера, но не ограничения, были описаны ранее со ссылкой на фиг. 24 способа 200. У элемента 91 лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ОЛЛО), имеющие практическое использование в качестве примера, но не
ограничения: «субъект суждения», «действие предиката суждения» и тому подобное. В структуре данных элементы 91 именуются уникальными
наименованиями, в качестве примера, но не ограничения, могут именоваться как «УН ОЛЛО п», где n > 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ОЛЛО, ранее не встречавшегося в лингвистическом предложении. Как было сказано ранее, с лингвистической точки зрения ОЛЛО представляют собой синтаксическую единицу вида «синтаксическая конструкция», которая может быть сформирована из структурированных групп ЛЛЕ; с логической точки зрения ОЛЛО представляют собой элементы простого суждения, с помощью которых нечто утверждается или опровергается о предмете суждения; с семантической точки зрения ОЛЛО представляют собой обобщенный мыслимый (семантический) образ элемента простого суждения. Элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО представляют собой множество ОЛЛО уникальных наименований (УН ОЛЛО) лингвистического предложения 11. ОЛЛО 91 в пригодной для преобразования структуре данных, содержащей ОЛЛО представляют собой отдельные элементы, заранее подготовленные и помещенные в пригодную для преобразования структуру данных, содержащую ОЛЛО в виде структурированного массива (списка, перечня и тому подобного) отдельных ОЛЛО. Такие
подготовительные действия могут осуществляться любым известным из уровня техники способом или неизвестным из уровня техники способом, таким, как способ, указанный при описании способа 200, и, соответственно, далее не описываются.
[0131] Идентификация элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО в ходе этапа 301 сводится к классификации элементов, из которых состоит пригодная для преобразования структура данных, содержащая ОЛЛО, как основных лингво-логических объектов (ОЛЛО 91). При этом все ОЛЛО 91 имеют значения 911 и порядковые номера текстовых элементов 912 лингвистического предложения, составляющие ОЛЛО. Значения 911 ОЛЛО 91 представляют собой один или несколько текстовых элементов (ТЭ 21)
предложения 11, из которых состоят ОЛЛО. Количество ТЭ, из которых состоит ОЛЛО связано с технической возможностью языка при описании объекта, действия или их признаков, либо с потребностью автора описания сущностей окружающего мира (объектов, действий или их признаков) использовать определенный способ лингвистического описания, в качестве примера, но не ограничения, можно привести различные следующие способы лингвистического описания одной и той же сущности: «старый человек» = «старик» = «человек преклонных лет» и тому подобное. Указанная сущность может быть лингвистически выражена через один, два или три ТЭ. При этом, например, не ограничиваясь, сущность «права
потребителей» не может быть лингвистически выражена в русском языке одним ТЭ.
[0132] Идентификацию значения 911 элемента 91 (ОЛЛО) пригодной для преобразования структуры данных, содержащей ОЛЛО в ходе этапа 301 производят путем регистрации набора знаков текстовых элементов 21 предложения 11, из которых состоит ОЛЛО 91. Идентификацию порядкового (порядковых) номера (номеров) 912 ТЭ, из которого (которых) состоит элемент 91 (ОЛЛО) пригодной для преобразования структуры данных, содержащей ОЛЛО, в ходе этапа 301 производят путем регистрации порядкового (порядковых) номера (номеров) упомянутых ТЭ в соответствии с их расположением в лингвистическом предложении, при условии, что первый ТЭ в лингвистическом предложении имеет номер «1», а все последующие ТЭ имеют порядковый номер, больший на единицу, чем порядковый номер, предыдущего ТЭ.
[0133] Пригодная для преобразования структура данных, содержащая
ОЛЛО, являющаяся исходной для настоящего способа преобразования 300 представляет собой в итоге множество элементов 91, их значений 911 и
порядковых номеров 912 ТЭ, составляющих элементы 22, идентифицированных на этапе 301.
[0134] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 91 (ОЛЛО) пригодной для преобразования структуры данных, содержащей ОЛЛО, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2031, состоящего из идентификационных данных ТЭ, составляющих элемент 91 (ОЛЛО), и получении значений (2131, 2141, 2231, 2151) всех частей лингвистических характеристик (213, 214, 223, 215) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 91 (ОЛЛО). При этом, как было описано ранее
лингвистическими признаками элементов 91 (ОЛЛО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 91 (ОЛЛО).
[0135] На фиг. 28, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 302 формирования восьмой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 300. Этап 302 характеризуется: выполнением этапа 3021 формирования значений 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО на котором формируют значения 2161 пятой части
лингвистических характеристик 216 элементов 21, составляющих элементы 91 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3021; выполнением этапа 3022 формирования элементов восьмой структуры данных СМД на котором формируют элементы 12 восьмой структуры данных СМД, а также идентификационные данные элементов 12, представляющие собой для каждого элемента 12, в качестве примера, но не ограничения, значение 121 элемента 12 восьмой структуры данных СМД и порядковые номера 122 ТЭ лингвистического предложения 11, составляющих элементы 12, и формируют восьмую структуру данных СМД.
[0136] На фиг. 29, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 3021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО. БДЛП, формируемая в рамках этапа 3021, отличается от БДЛП, формируемой в рамках этапа 2031, наличием значений 2161 пятой части
лингвистических характеристик 216, указывающих на синтаксическую роль элемента 91 (ОЛЛО). Поскольку с лингвистической точки зрения ОЛЛО - синтаксическая конструкция, то естественно, что в одном предложении одни синтаксические конструкции относительно других синтаксических конструкций при наличии между ними синтаксической подчинительной связи являются синтаксически главными или синтаксически зависимыми. По этому принципу одни ОЛЛО могут быть синтаксически главными (главными ОЛЛО), а другие - синтаксически зависимыми (зависимыми ОЛЛО). Выявление пятой части лингвистических характеристик 216 текстовых элементов 21 лингвистического предложения 11, составляющих ОЛЛО 91 и их значений 2161 сводится к
классификации ОЛЛО 91 по их синтаксической роли. Синтаксическую роль ОЛЛО отождествляют с синтаксической ролью главной ЛЛЕ в ОЛЛО 91. С помощью значения 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91, все ОЛЛО 91 разделяют на главные ОЛЛО 91 и зависимые ОЛЛО 91.
[0137] Формирование пятой части лингвистических характеристик
216 и их значений 2161 в ходе этапа 3021 производят путем анализа существующих лингвистических признаков элемента 91. В ходе такого анализа для примера, но не ограничения, могут производиться следующие действия: на первом этапе во всех ОЛЛО 91 идентифицируют синтаксически главную ЛЛЕ; на втором этапе среди лингвистических признаков главных ЛЛЕ упомянутых ОЛЛО 91 идентифицируют лингвистическую характеристику, отвечающую за синтаксическую роль
синтаксически главной ЛЛЕ элемента 91; на третьем этапе проверяют значение идентифицированной лингвистической характеристики, отвечающей за
синтаксическую роль синтаксически главной ЛЛЕ; если значение (синтаксическая роль синтаксически главной ЛЛЕ элемента 91) является «сказуемым», то такой ОЛЛО 91 (синтаксически главной ЛЛЕ элемента 91) получает значение 2161 пятой части лингвистических характеристик 216 - «главный ОЛЛО»; если значение не является «сказуемым», то такой ОЛЛО 91 (синтаксически главной ЛЛЕ элемента 91) получает значение 2161 пятой части лингвистических характеристик 216 - «зависимый ОЛЛО». В итоге формируют значения 2161 пятой части
лингвистических характеристик 216 для всех элементов 91 (ОЛЛО).
[0138]Сформированные по итогам этапа 3021 значения 2161
(синтаксическая роль синтаксически главной ЛЛЕ элемента 91) пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91, пригодной для преобразования структуры данных, содержащей ОЛЛО, вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031, формируя в итоге БДЛП текстовых элементов 21
лингвистического предложения 11, формируемую в рамках этапа 3021. При этом все части (211, 214, 232, 215 и 216) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2321, 2151 и 2161) формируют уникальные лингвистические признаки элементов 91.
[0139]На фиг. 30, в качестве примера, но не ограничения, изображена общая структура сформированной восьмой структуры данных СМД, являющейся первой структурой данных СМД для настоящего способа преобразования 300. Восьмая структура данных СМД представляет собой СМД, содержащий элементы 12 восьмой структуры данных СМД, которые представляют собой исходные простые лингво - логические конструкции (ИП ЛЛК 12) лингвистического предложения 11 и идентификационные данные ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, в качестве примера, но не ограничения, значение121 элемента 12 восьмой структуры данных и порядковые номера текстовых элементов 122, составляющих ИП ЛЛК (значение и порядковые номера ТЭ элемента 12). У ИП ЛЛК 12
лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 12, в качестве примера, но не ограничения, могут именоваться как «ИП ЛЛК-1», «ИП ЛЛК-2», «ИП ЛЛК-3», «ИП ЛЛК-n», где n > 1 - порядковый номер элемента в лингвистическом предложении. ИП ЛЛК предложения - это
пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения ИП ЛЛК - это синтаксическая единица вида «синтаксическая конструкция», сформированная из ОЛЛО путем объединения ОЛЛО по признаку наличия между ОЛЛО прямой синтаксической подчинительной или сочинительной связи.
Упомянутая прямая синтаксическая подчинительная или сочинительная связь означает наличие между элементами различных ОЛЛО (между ЛЛЕ различных ОЛЛО) синтаксической подчинительной или сочинительной связи. С точки зрения синтаксиса ИП ЛЛК - это отдельное исходное простое предложение или исходное простое предложение в составе исходного сложного предложения. При этом исходное простое предложение в ИП ЛЛК может содержать однородные члены, то есть слова, между которыми имеется синтаксическая сочинительная связь. С логической точки зрения ИП ЛЛК - это логическая сущность, выражающая простое суждение (некванторное суждение), представляющее собой первичную
логическую конструкцию мышления, с помощью которой формируется и
передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). При этом нечто (то, что утверждается или опровергается о предмете суждения) может быть
дополнительно логически структурировано. Например, не ограничиваясь, предикат суждения может быть разделен на три логически отделимые сущности - действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения. Упомянутые для примера элементы простого суждения могут быть отождествлены с отдельными УН ОЛЛО (ОЛЛО уникального наименования), из которых и формируется ИП ЛЛК. Кванторность простого суждения определяется его «количественной характеристикой», то есть наличием или отсутствием однозначности в простом суждении. По количественной характеристике
(кванторности) все простые суждения можно разделить на две категории:
однозначные простые суждения и неоднозначные простые суждения. Однозначные простые суждения - это кванторные простые суждения, в которых показатель кванторности всегда определен и равен единице, то есть каждый элемент простого суждения не имеет вариативности, всегда однозначен. Однозначность простого суждения проявляется посредством нахождения в составе простого суждения элементов простого суждения одного уникального наименования (УН) в
единичном количестве (например, не ограничиваясь, одного субъекта суждения, объекта предиката суждения, действия предиката суждения или одного
однородного обстоятельства предиката суждения). Примером однозначного простого суждения может быть следующее суждение: «Товар должен быть передан покупателю продавцом». Данное простое суждение не допускает никакой неоднозначности - только «товар», только «должен быть передан», только
«покупателю» и только «продавцом». Неоднозначные простые суждения - это кванторные простые суждения, в которых показатель кванторности как минимум у одного элемента простого суждения уникального наименования (УН) всегда определен и всегда больше единицы, то есть элемент простого суждения в неоднозначном простом суждении всегда имеет вариативности, всегда
неоднозначен. Неоднозначность простого суждения проявляется посредством нахождения в составе простого суждения нескольких элементов простого суждения одного уникального наименования (УН) (например, не ограничиваясь, нескольких субъектов суждения и(или) объектов предиката суждения и(или) действий предиката суждения и(или) нескольких однородных обстоятельств предиката суждения). Примером неоднозначного простого суждения может быть следующее суждение: «Товар должен быть передан покупателю продавцом или менеджером компании». Данное простое суждение допускает неоднозначность ввиду наличия в нем двух элементов простого суждения с одинаковыми УН - субъектов суждения «продавец» и «менеджер компании», к каждому из которых можно применить предикат суждения «должны передать товар покупателю». Если простые суждения, находящиеся в некоем массиве простых суждений (отдельной, обособленной группе простых суждений), имеют гарантировано одну и ту же количественную характеристику (показатель кванторности равен единице или больше единицы), то вне зависимости от вида кванторности простого суждения (однозначное или неоднозначное) простые суждения такого массива являются «кванторными». Если простые суждения, находящиеся в некоем массиве простых суждений (отдельной, обособленной группе простых суждений), не имеют гарантировано одну и туже количественную характеристику (показатель кванторности простых суждений может быть как равен единице, так и быть большим единицы), то простые суждения такого массива именуются «некванторными» (без определенной кванторности). В связи с вышеизложенным ИП ЛЛК, формируемая из ОЛЛО исходного предложения, между которыми имеется синтаксическая сочинительная связь, может быть классифицирована только как «некванторное» простое суждение, поскольку ничем не гарантируется наличие одной и той же количественной характеристики у всех простых суждений, напрямую (без какой-либо дополнительной обработки) формируемых из произвольного исходного лингвистического предложения.
[0140] Формирование элементов 12 восьмой структуры данных СМД, представляющих собой исходные простые лингво-логические конструкции (ИП ЛЛК) в ходе этапа 3022 производят на основе результатов идентификации значений 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91. Для формирования элемента 12 восьмой структуры данных СМД необходимо осуществить следующие действия: на первом этапе выбирают главный ОЛЛО 91; на втором этапе идентифицируют все подчиненные ему зависимые ОЛЛО 91 с помощью значений 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91; на третьем этапе среди идентифицированных зависимых ОЛЛО 91 идентифицируют такие ОЛЛО 91, которые имеют с выбранным ранее главным ОЛЛО 91 прямую подчинительную связь; на четвертом этапе формируют предварительный элемент 12 восьмой структуры данных СМД, являющийся исходной простой лингво-логической конструкцией (ИП ЛЛК), путем объединения выбранного «главного ОЛЛО» 91 и всех идентифицированных «зависимых ОЛЛО» 91, имеющих с выбранным главным ОЛЛО 91 прямые подчинительные связи; на пятом этапе идентифицируют сочиненные ОЛЛО среди уже идентифицированных зависимых ОЛЛО 91 с помощью значений 2131 первой части лингвистических характеристик 213 элементов 21, составляющих ОЛЛО 91. Для завершения формирования элемента 12 формируют запрос в БДЛП, формируемую в рамках этапа 3021 для проверки наличия признаков связи между объединяемыми ОЛЛО, и, при наличии таких признаков, получают текстовый элемент (текстовые элементы), идентифицированный (идентифицированные) как одно из (или несколько из, или комбинация из): знак препинания, союз или союзное слово, расположенные между объединяемыми ОЛЛО.
[0141]Идентификацию значения и порядковых номеров ТЭ элемента 12 восьмой структуры данных СМД, производят в рамках этапа 3022 путем отождествления значения 121 элемента 12 со значениями 911 объединяемых элементов 91 и значениями 211 текстовых элементов, являющихся признаками связи согласно своим уникальным лингвистическим признакам,
идентифицированных между объединяемыми элементами 91, а порядковых номеров 122 текстовых элементов 21, составляющих элемент 12 с порядковыми номерами 912 текстовых элементов, составляющих объединяемые элементы 91 и порядковыми номерами 21 текстовых элементов, являющихся признаками связи, идентифицированных между объединяемыми элементами 91.
[0142]Формирование восьмой структуры данных СМД в ходе этапа 3022 производят путем объединения в одной структуре данных элементов 12 восьмой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.
[0143] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 12 (ИП ЛЛК) восьмой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3021, состоящего из идентификационных данных ТЭ, составляющих элемент 12 (ИП ЛЛК), и получении значений (2131, 2141, 2231, 2151, 2161) всех частей лингвистических характеристик (213, 214, 223, 215, 216) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 12 (ИП ЛЛК). При этом, как было описано ранее, лингвистическими признаками элементов 12 (ИП ЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 12 (ИП ЛЛК).
[0144]На фиг. 31, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 303 формирования девятой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 300. Этап 303 характеризуется: выполнением этапа 3031 идентификации видов элементов 12 восьмой структуры данных СМД, указывающих на наличие в ИП ЛЛК сочиненных ОЛЛО, на котором идентифицируют первые и вторые виды элементов 12 восьмой структуры данных СМД, а также идентифицируют непреобразованные элементы 13 девятой структуры данных СМД и их идентификационные данные, представляющие собой для каждого непреобразованного элемента 13, в качестве примера, но не ограничения, значение 131 непреобразованного элемента 13 девятой структуры данных СМД и порядковые 132 номера ТЭ лингвистического предложения 11, составляющих элемент 13 (значение и порядковые номера ТЭ непреобразованного элемента 13); выполнением этапа 3032 формирования преобразованных элементов 13 девятой структуры данных СМД, на котором формируют преобразованные элементы 13 девятой структуры данных СМД из элементов 12 второго вида, а также идентификационные данные преобразованных элементов 13, представляющие собой для каждого преобразованного элемента 13, в качестве примера, но не ограничения, значение 131 преобразованного элемента 13 девятой структуры данных СМД и порядковые 132 номера ТЭ лингвистического предложения 11, составляющих элемент 13 (значение и порядковые номера ТЭ преобразованного элемента 13); выполнением этапа 3033 формирования девятой структуры данных СМД, на котором формируют девятую структуру данных СМД из преобразованных элементов 13 и непреобразованных элементов 13 девятой структуры данных СМД.
[0145]На фиг. 32, в качестве примера, но не ограничения, изображена общая структура сформированной девятой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 300. Девятая структура данных СМД представляет собой СМД, содержащий элементы 13, которые представляют собой простые лингво-логические конструкции (ПЛЛК) лингвистического предложения 11, и идентификационные данные ПЛЛК, представляющие собой для каждой ПЛЛК, в качестве примера, но не ограничения, значение 131 элемента 13 девятой структуры данных и порядковые номера 132 текстовых элементов, составляющих ПЛЛК. Элементы 13 девятой структуры данных СМД подразделяются по принципу их формирования на
непреобразованные элементы 13 и преобразованные элементы 13. У ПЛЛК 13 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 13, в качестве примера, но не ограничения, могут именоваться как «ПЛЛК1», «ПЛЛК2», «ПЛЛКЗ», «ПЛЛКп», где n > 1 - порядковый номер элемента в лингвистическом предложении. ПЛЛК лингвистического предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, ПЛЛК - это синтаксическая единица вида «синтаксическая конструкция», сформированная из ИП ЛЛК путем гетерогенизации ИП ЛЛК. С точки зрения синтаксиса ПЛЛК - это отдельное простое предложение или простое предложение в составе исходного сложного предложения, которое не содержит однородных членов (слов между которыми имеется синтаксическая сочинительная связь). С логической точки зрения ПЛЛК - это логическая сущность, выражающая простое суждение (кванторное суждение), представляющее собой первичную логическую конструкцию мышления, с помощью которой формируется и передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). При этом нечто (то, что утверждается или
опровергается о предмете суждения) может быть дополнительно логически структурировано. Например, не ограничиваясь, предикат суждения может быть разделен на три логически отделимые сущности - действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения. Упомянутые для примера элементы простого суждения могут быть отождествлены с
отдельными видами ОЛЛО, из которых и формируется ПЛЛК. Отличие ПЛЛК от ИП ЛЛК в кванторности простого суждения. Если ИП ЛЛК допускает возможность наличия неоднозначности в простом суждении, то ПЛЛК имеет показатель кванторности равный единице, что полностью отождествляет ПЛЛК с абсолютно однозначным простым суждением. В составе ПЛЛК не может быть нескольких элементов простого суждения одного уникального наименования (УН). Например, не ограничиваясь, в составе ПЛЛК не может быть нескольких субъектов суждения, и (или) объектов предиката суждения, и (или) действий предиката суждения, и (или) однородных обстоятельств предиката суждения. В ПЛЛК не может быть никакой неоднозначности ни в субъекте суждения, ни в предикате суждения, вне зависимости от состава и конструкции исходного лингвистического предложения.
[0146] Идентификацию видов элементов 12 восьмой структуры данных СМД в рамках этапа 3031 производят путем анализа значений лингвистических характеристик текстовых элементов 12 (ИП ЛЛК) с целью идентификации синтаксических сочинительных связей в ИП ЛЛК 12. Синтаксическую
сочинительную связь между ОЛЛО (элемент 91) в ИП ЛЛК 12 идентифицируют в случае наличия у синтаксически главных ЛЛЕ таких ОЛЛО одного и того же синтаксического родителя (синтаксически главного слова, у которого с такой ЛЛЕ имеется прямая синтаксическая подчинительная связь). Дополнительными условиями может быть наличие у главных ЛЛЕ таких ОЛЛО одной и той же синтаксической роли, а также наличие признака связи между такими ЛЛЕ, а именно - запятой или сочинительного союза. При идентификации синтаксической сочинительной связи между главными ЛЛЕ двух или более ОЛЛО такие ИП ЛЛК идентифицируют как второй вид элемента 12 (ИП ЛЛК) восьмой структуры данных СМД. Все иные элементы 12 (ИП ЛЛК) в которых не идентифицирована синтаксическая сочинительная связь у главной ЛЛЕ идентифицируют как первый вид элемента 12 (ИП ЛЛК) восьмой структуры данных СМД. При этом
идентифицированный первый вид элемента 12 восьмой структуры данных СМД отождествляют с непреобразованным элементом 13 девятой структуры данных СМД. Формирование преобразованных элементов девятой структуры данных СМД (преобразованных элементов 13, полученных из элементов 12 второго вида) на этапе 3032 производят на основании идентифицированной на этапе 3031 синтаксической сочинительной связи между элементами 91 (ОЛЛО) элемента 12 (ИП ЛЛК) путем преобразования элемента 12 второго вида. Смысл преобразования элемента 12 второго вида на этапе 3032 состоит в гетерогенизации ИП ЛЛК 12, то есть в устранении синтаксических однородностей в ИП ЛЛК 12 путем
формирования из элемента 12 второго вида множества новых ПЛЛК, идентичных по однородностям элементу 12 первого вида. При этом каждая новая ПЛЛК упомянутого множества может содержать только один из упомянутых ОЛЛО 91 с однородными членами (если элемент 12 второго вида содержит один ряд однородных членов) или только одно уникальное сочетание упомянутых ОЛЛО 91 с однородными членами разных рядов однородных членов (если элемент 12 второго вида содержит несколько рядов ОЛЛО 91 с однородными членами).
Множество ПЛЛК (элементов 13), сформированных из элемента 12 второго вида являются гетерогенными ПЛЛК, то есть сформированными из одной ИП ЛЛК 12 второго вида путем ее гетерогенного преобразования (гетерогенизации). Процесс гетерогенизации ИП ЛЛК 12 второго вида может быть проведен, в качестве примера, но не ограничения, следующим образом: на первом этапе выявляют ряды однородных членов в элементе 12 второго вида; в ходе выявления рядов однородных членов выявляют сами ряды однородных членов и порядковые номера однородных членов в ряду, а также признаки связи каждого однородного члена; на втором этапе выявляют цепочки однородных членов для каждого выявленного ОЛЛО, содержащего ЛЛЕ-ОЧ (ОЛЛО-ОЧ) элемента 12 второго вида; цепочка однородных членов (цепочка 04) - это ОЛЛО-ОЧ и зависимая цепочка однородных членов (цепочка синтаксически связанных ОЛЛО, начиная от первого синтаксического потомка однородных членов (синтаксически зависимого ОЛЛО) и продолжая по цепочке синтаксической зависимости (по синтаксической подчинительной связи) до другого ОЛЛО-ОЧ или до последнего ОЛЛО в элементе 12 второго вида; идентифицированные цепочки 04 классифицируют по факту наличия синтаксического потомка ЛЛЕ в зависимой цепочке 04, который не входит в зависимую цепочку 04; те цепочки 04, которые имеют зависимые цепочки 04 без синтаксического потомка за рамками зависимой цепочки однородных членов считаются крайними цепочками однородных членов (крайними ЦОЧ), а те цепочки 04, которые имеют зависимые цепочки 04 с синтаксическим потомком за рамками зависимой цепочки 04 считаются внутренними цепочками однородных членов (внутренними цепочками 04); на третьем этапе выявляют ОЛЛО элемента 12 второго вида, не входящие в цепочки 04 (ОЛЛО вне цепочек 04); на четвертом этапе формируют сменные зависимые цепочки (сменные ЗЦ) элемента 12 второго вида; сменная ЗЦ - это основа преобразованных элементов 13, состоящая из одной крайней цепочки 04 и внутренних цепочек 04, если такие внутренние цепочки 04 по цепочке непрерывной синтаксической подчинительной связи имеются между крайней цепочкой 04 и ОЛЛО вне цепочек 04; на пятом этапе формируют гетерогенные ПЛЛК (преобразованные элементы 13); гетерогенная ПЛЛК формируется из одной сменной ЗЦ и ОЛЛО вне цепочки 04 (если такие ОЛЛО есть); количество сменных ЗЦ элемента 12 второго вида определяет количество гетерогенных ПЛЛК (преобразованных элементов 13), сформированных от одного элемента 12 второго вида.
[0147] Идентификация видов элементов 12 восьмой структуры данных СМД в рамках этапа 3031 не изменяет значение 121 элемента 12 и не изменяет порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 (ИП ЛЛК). Идентификацию значения и порядковых номеров ТЭ непреобразованного элемента 13 (ПЛЛК) девятой структуры данных СМД в рамках этапа 3031 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 первого вида восьмой структуры данных СМД идентифицируют как значение 131 непреобразованного элемента 13 (ПЛЛК), а порядковые номера 212 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 из которого состоит непреобразованный элемент 13 идентифицируют как порядковые номера 132 текстовых элементов, составляющих
непреобразованный элемент 13 (ПЛЛК). Идентификацию значения и порядковых номеров ТЭ преобразованного элемента 13 (гетерогенный ПЛЛК) девятой структуры данных СМД в рамках этапа 3032 производят следующим образом:
значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 второго вида восьмой структуры данных СМД, за исключением значений 211 текстовых элементов 21 лингвистического
предложения 11, составляющих отдельные части элемента 12 второго вида (ОЛЛО- 04), которые были удалены при гетерогенизации, и признаков связи удаленных ОЛЛО-ОЧ (синтаксически подчиненные главным ЛЛЕ удаленным ОЛЛО-ОЧ сочинительные союзы или знаки препинания) идентифицируют как значение 131 преобразованного элемента 13 (ПЛЛК), а порядковые номера 212 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 второго вида восьмой структуры данных СМД, за исключением порядковых номеров 212 текстовых элементов 21 лингвистического предложения 11, составляющих отдельные части элемента 12 второго вида (ОЛЛО-ОЧ), которые были удалены при гетерогенизации, и признаков связи удаленных ОЛЛО-ОЧ (синтаксически подчиненные главным ЛЛЕ удаленным ОЛЛО-ОЧ сочинительные союзы или знаки препинания) идентифицируют как порядковые номера 132 текстовых элементов, составляющих преобразованный элемент 13 (гетерогенный ПЛЛК).
[0148]Формирование девятой структуры данных СМД в рамках этапа 3033 производят путем объединения ранее идентифицированных на этапах 3031 и 3032 элементов 13 девятой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. Первым из объединяемых элементов девятой структуры данных СМД является идентифицированный на этапе 3031 элемент 12 первого вида, являющийся непреобразованным элементом 13, то есть ПЛЛК 13, совпадающий с ИП ЛЛК 12 без синтаксической сочинительной связи. Вторыми из объединяемых элементов девятой структуры данных СМД являются
преобразованные элементы 13, сформированные на этапе 3032 как множество преобразованных элементов 13, являющихся гетерогенными ПЛЛК 13,
сформированными из элемента 12 второго вида (ИП ЛЛК с синтаксической сочинительной связью) путем гетерогенизации ИП ЛЛК второго вида.
[0149] Идентификацию лингвистических характеристик ТЭ, составляющих непреобразованные или преобразованные элементы 13 (ПЛЛК) девятой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3021, состоящего из
идентификационных данных ТЭ, составляющих непреобразованный или
преобразованный элемент 13, и получении значений (2131, 2141, 2231, 2151, 2161) всех частей лингвистических характеристик (213, 214, 223, 215, 216) текстовых элементов 21 лингвистического предложения 11, из которых состоит
непреобразованный или преобразованный элемент 13 (ПЛЛК или гетерогенная ПЛЛК). При этом, как было описано ранее лингвистическими признаками непреобразованных и преобразованных элементов 13 (ПЛЛК или гетерогенная ПЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 13 (ПЛЛК и гетерогенные ПЛЛК).
[0150]На фиг. 33, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 304 формирования десятой структуры данных СМД являющейся третьей структурой данных для рассматриваемого способа 300. Этап 304 характеризуется: выполнением этапа 3041 формирования значений 2171 шестой части лингвистических характеристик 217 элементов 21, составляющих элементы 13 девятой структуры данных СМД, на котором формируют значения 2171 шестой части лингвистических характеристик 217 элементов 21,
составляющих элементы 13, и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3041; выполнением этапа 3042 идентификации видов элементов 13 девятой структуры данных СМД,
указывающих на наличие сочиненных ПЛЛК, на котором идентифицируют первые и последующие виды элементов 13 девятой структуры данных СМД; выполнением этапа 3043 идентификации элементов 14 как составных частей элемента 15 десятой структуры данных СМД, на котором идентифицируют элементы 14 десятой структуры данных СМД, а также идентификационные данные элементов 14, представляющие собой для каждого элемента 14, в качестве примера, но не ограничения, значение 141 элемента 14 десятой структуры данных СМД и порядковые номера 142 ТЭ лингвистического предложения 11, составляющих элемент 14; и формируют десятую структуру данных СМД путем объединения элементов 14 как составных частей единственного элемента 15 десятой структуры данных СМД.
[0151]На фиг. 34, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 3041 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 13 девятой структуры данных СМД. БДЛП, формируемая в рамках этапа 3041, отличается от БДЛП, формируемой в рамках этапа 3021, наличием шестой части лингвистических характеристик 217 и их значений 2171 текстовых элементов 21, содержащихся в элементах 13, устанавливающей синтаксическую роль ПЛЛК (элементов 13 девятой структуры данных СМД).
Синтаксическая роль ПЛЛК может иметь значения: главная ПЛЛК или зависимая ПЛЛК. Поскольку с лингвистической точки зрения ПЛЛК - синтаксическая конструкция, то естественно, что в одном предложении одни синтаксические конструкции относительно других синтаксических конструкций при наличии между ними синтаксической подчинительной связи являются синтаксически главными или синтаксически зависимыми. По этому принципу одни ПЛЛК могут быть синтаксически главными (главными ПЛЛК), а другие - синтаксически зависимыми (зависимыми ПЛЛК).
[0152]Формирование шестой части лингвистических характеристик 217 и их значений 2171 для текстовых элементов 21 лингвистического предложения 11, составляющих ПЛЛК 13 производят путем классификации ПЛЛК 13 по их синтаксической роли в ходе этапа 3041. Синтаксическую роль ПЛЛК
отождествляют с синтаксической ролью главного ЛЛЕ в главном ОЛЛО 91 в ПЛЛК 13. В соответствии со значением 2171 шестой части лингвистических
характеристик 217 элементов 21, составляющих ПЛЛК 13, подразделяют все ПЛЛК 13 на главные ПЛЛК 13 и зависимые ПЛЛК 13. Формирование шестой части лингвистических характеристик 217 и их значений 2171 производят путем анализа существующих лингвистических признаков элементов 21, составляющих ПЛЛК 13. В ходе такого анализа, в качестве примера, но не ограничения, могут производят следующие действия: на первом этапе во всех ПЛЛК 13 идентифицируют
синтаксически главную ЛЛЕ синтаксически главной ОЛЛО 91; на втором этапе среди лингвистических признаков упомянутых главных ЛЛЕ упомянутого ПЛЛК 13 идентифицируют лингвистическую характеристику, отвечающую за
синтаксическую роль упомянутой синтаксически главной ЛЛЕ элемента 13; на третьем этапе проверяют значение идентифицированной лингвистической характеристики, отвечающей за синтаксическую роль упомянутой синтаксически главной ЛЛЕ; если значение (синтаксическая роль упомянутой синтаксически главной ЛЛЕ элемента 13) является «сказуемым», то такой ПЛЛК 13
(синтаксически главная ЛЛЕ синтаксически главного элемента 91) предоставляют значение 2171 шестой части лингвистических характеристик 217- «главная ПЛЛК»; если значение не является «сказуемым», то такой ПЛЛК 13 предоставляют значение 2171 шестой части лингвистических характеристик 217 - «зависимая ПЛЛК». В итоге формируют значения 2171 шестой части лингвистических характеристик 217 для всех элементов ПЛЛК 13.
[0153]Сформированные по итогам этапа 3041 значения 2171
(синтаксическая роль синтаксически главной ЛЛЕ синтаксически главного ОЛЛО элемента 13) шестой части лингвистических характеристик 217 элементов 21, составляющих ПЛЛК 13 девятой структуры данных СМД вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3041. При этом все части (211, 214, 232, 215, 216 и 217) лингвистических
характеристик текстовых элементов 21 лингвистического предложения 11, входящих в ПЛЛК 13 и их значения (2111, 2141, 2321, 2151, 2161 и 2171)
формируют уникальные лингвистические признаки элементов 13.
[0154]На фиг. 35, в качестве примера, но не ограничения, изображена общая структура сформированной десятой структуры данных СМД, являющейся третьей структурой данных СМД для настоящего способа преобразования 300. Десятая структура данных СМД представляет собой СМД, содержащий элемент 15, который представляет собой исходную сложную лингво-логическую конструкцию (ИС ЛЛК) лингвистического предложения 11, и идентификационные данные элемента 15, представляющие собой, в качестве примера, но не ограничения, значение 151 элемента 15 десятой структуры данных и порядковые номера 152 текстовых элементов, составляющих элемент 15. У исходной сложной ЛЛК 15
лингвистического предложения 11 отсутствует характеризующее ее уникальное наименование (УН), имеющее практическое использование. ИС ЛЛК предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, ИС ЛЛК - это синтаксическая единица вида «синтаксическая конструкция», сформированная из ПЛЛК путем объединения ПЛЛК по признаку наличия между ПЛЛК прямой синтаксической подчинительной и сочинительной связей. ИС ЛЛК состоит из того количества ПЛЛК, которое идентифицировано в исходном предложении. Упомянутая прямая синтаксическая подчинительная связь означает наличие между элементами различных ПЛЛК (между ЛЛЕ различных ПЛЛК) синтаксической подчинительной связи. Прямая синтаксическая
сочинительная связь означает наличие между элементами различных ПЛЛК (между ЛЛЕ различных ПЛЛК) синтаксической сочинительной связи. С точки зрения синтаксиса ИС ЛЛК - это преобразованное исходное предложение без искажения его смысла. Суть преобразования исходного лингвистического предложения состоит в том, что все примененные лингвистические приемы
(осложнения), направленные на упрощение лингвистических форм и структур мыслимых автором утверждений (отрицаний) в тексте лингвистического предложения (например, не ограничиваясь, использование однородных членов, причастных (деепричастных) оборотов) отменяют. Вместо исходного
лингвистического предложения формируют массив простых предложений, которые синтаксически и логически связаны друг с другом. Упомянутые связи проясняют, а затем тем или иным образом регистрируют. Потребность такого преобразования актуальна потому, что одновременно с упрощением
лингвистических форм и структуры лингвистического предложения применение упомянутых лингвистических приемов приводит к сложности и неоднозначности логической структуры исходного лингвистического предложения, к сложности и неоднозначности восприятия смысла исходного предложения пользователем, а также к большой технической сложности корректного интеллектуального машинного анализа содержания исходного лингвистического предложения.
Преобразованное таким образом исходное предложение представляет собой (при условии применения в исходном лингвистическом предложении упомянутых приемов), по сути, сложное предложение, состоящее из преобразованных простых предложений в количестве, превышающем количество исходных простых предложений в исходном лингвистическом предложении. Однако в отличие от исходного лингвистического предложения все преобразованные простые предложения в ИС ЛЛК представляют собой однозначные простые суждения (мыслимые утверждения или отрицания). Регистрация элемента 15 (ИС ЛЛК) в форме структуры данных (массива преобразованных ПЛЛК (элементов 14)) позволяет выявить многоуровневую синтаксическую структуру элемента 15 (ИС ЛЛК) и связи между элементами этой структуры. Уровни ИС ЛЛК отражают структуру синтаксической подчинительной связи между структурированными ПЛЛК (СПЛЛК) как составными частями ИС ЛЛК и обусловлены выявленными синтаксическими связями между составными частями элемента 15 (элементами 14 лингвистического предложения 11.) Элемент 15 (ИС ЛЛК) формируется из упомянутых структурированных ПЛЛК (СПЛЛК) - элементов 14. В обязательном порядке ИС ЛЛК содержит только элемент 14 (СПЛЛК) первого уровня (элементы 13 первого вида). Наличие иных элементов 14 (СПЛЛК) второго и последующих уровней (элементов 13 второго и последующих видов) обусловлено
лингвистическими осложнениями исходного лингвистического предложения. К СПЛЛК первого уровня (элементам 13 первого вида) относят ПЛЛК, которые не являются подчиненными простыми предложениями. К СПЛЛК второго уровня (элементам 13 второго вида) относят ПЛЛК, которые являются подчиненными простыми предложениями, при условии, что главными для них являются СПЛЛК первого уровня. К СПЛЛК третьего уровня (элементам 13 третьего вида) относят ПЛЛК, которые являются подчиненными простыми предложениями при условии, что главными для них являются СПЛЛК второго уровня. Эти утверждения таким образом справедливы и для СПЛЛК последующих уровней (четвертого, пятого, шестого и так далее), и для специалиста в данной области техники должна быть очевидна возможность существования таких последующих уровней.
Синтаксическая структура ИС ЛЛК 15, кроме синтаксически подчиненных СПЛЛК, может содержать и синтаксические сочиненные СПЛЛК. При этом все СПЛЛК первого уровня (элементы 13 первого вида) обязательно являются сочиненными друг с другом ПЛЛК. Начиная со СПЛЛК второго уровня (элементов 13 второго и последующих видов), СПЛЛК одного уровня могут как иметь, так и не иметь синтаксических сочинительных связей друг с другом. Синтаксическую
сочинительную связь между СПЛЛК в ИС ЛЛК идентифицируют в случае наличия у синтаксически главных слов (ЛЛЕ) синтаксически главных ОЛЛО таких СПЛЛК одного и того же синтаксического родителя (синтаксически главного слова, у которого с таким словом (ЛЛЕ) имеется прямая синтаксическая подчинительная связь). Дополнительными условиями может быть наличие у главных слов (ЛЛЕ) таких СПЛЛК одной и той же синтаксической роли, а также наличие признака связи между такими словами (ЛЛЕ), а именно - запятой или сочинительного союза. ИС ЛЛК 15 в отличие от упомянутых ранее ИП ЛЛК 12 и ПЛЛК 13 может быть только в единственном числе - из одного исходного лингвистического предложения можно сформировать только одну ИС ЛЛК 15. С логической точки зрения, ИС ЛЛК 15 - это логическая сущность, выражающая сложное суждение (некванторное суждение), представляющая собой логическую конструкцию, элементами которой являются простые суждения. Кванторность сложного суждения определяется его
количественной характеристикой, то есть наличием или отсутствием
однозначности в сложном суждении. По количественной характеристике
(кванторности) все сложные суждения можно разделить на две категории:
однозначные сложные суждения и неоднозначные сложные суждения.
Однозначные сложные суждения - это кванторные сложные суждения, в которых показатель кванторности всегда определен и равен единице, то есть каждый элемент сложного суждения не имеет вариативности, всегда однозначен.
Однозначность сложного суждения проявляется посредством нахождения в составе сложного суждения элементов, не имеющих возможность быть истолкованными как варианты утверждений или отрицаний, либо как варианты обусловленности одного и того же утверждения или отрицания. Примером однозначного сложного суждения может быть следующее суждение: «Если покупатель оплатил товар, то товар должен быть передан покупателю продавцом». Данное сложное суждение не допускает никакой вариативности - простое суждение «товар должен быть передан покупателю продавцом» обусловлено единственным простым суждением «если покупатель оплатил товар». Неоднозначные сложные суждения - это кванторные сложные суждения, в которых показатель кванторности всегда определен и всегда больше единицы, то есть, как минимум, один элемент сложного суждения имеет вариативность. Неоднозначность сложного суждения проявляется посредством нахождения в составе сложного суждения элементов, имеющих возможность быть истолкованными как варианты утверждений или отрицаний, либо как варианты обусловленности одного и того же утверждения или отрицания. Примером неоднозначного сложного суждения может быть следующее суждение: «Если покупатель оплатил товар, то товар должен быть передан покупателю продавцом или товар должен быть передан покупателю иным должностным лицом
компании». Данное сложное суждение допускает вариативность утверждения - или «товар должен быть передан покупателю продавцом», или «товар должен быть передан покупателю иным должностным лицом компании». Сложное суждение состоит из простых суждений, имеющих исходные (установленные в исходном лингвистическом предложении) синтаксические связи между собой. В связи с тем, что такими связями могут быть как синтаксические подчинительные связи, так и синтаксические сочинительные связи, нельзя гарантировать отсутствие в сложном суждении вариативности утверждений или отрицаний, либо вариативности обусловленностей утверждений (отрицаний). В связи с вышеизложенным ИС ЛЛК является сложным суждением с неопределенной количественной характеристикой (показатель кванторности может быть как равен единице, так и быть больше единицы), и такое сложное суждение является «некванторным». С аналитической точки зрения ИС ЛЛК - это информационно наполненная схема, проясняющая логическую конструкцию предложения (логические связи между отдельными простыми суждениями, заложенными в исходном лингвистическом предложении). В связи с этим ИС ЛЛК предпочтительно демонстрируется не в лингвистической текстовой формы (в виде сложного предложения, состоящего из множества простых предложений без сочинительной связи и причастных (деепричастных) оборотов, в котором может имеется как подчинительная, так и сочинительная связь между упомянутыми простыми предложениями), а в табличной или схематичной форме. Упомянутая табличная или схематичная форма демонстрации позволяет быстро и точно уяснить и проанализировать все используемые основные логические сущности (СПЛЛК) и все логические связи между
упомянутыми логическими сущностями исходного лингвистического
предложения. В частности, не ограничиваясь, такое развернутое и одновременно структурированное представление исходного лингвистического предложения (логически связанное множество простых предложений без однородностей) позволяет повысить эффективность обработки лингвистического предложения 11 машинными средствами поскольку вместо одного обрабатываемого предложения со сложной структурой появляется возможность обрабатывать множество простых предложений с идентифицированной логической связью между элементами этого множества.
[0155]Идентификацию видов элементов 13 девятой структуры данных СМД в ходе этапа 3042 производят на основе результатов идентификации значений 2171 шестой части лингвистических характеристик 217 текстовых элементов 21, составляющих ПЛЛК 13. Для идентификации видов ПЛЛК 13 необходимо, в качестве примера, но не ограничения, осуществить следующие действия: на первом этапе из всех ПЛЛК 13 выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО элемента 13 (ПЛЛК) не имеет синтаксического родителя; такая ПЛЛК будет являться элементом 13 первого вида - обязательным элементом десятой структуры данных СМД; на втором этапе из оставшихся ПЛЛК 13, вид которых еще не идентифицирован, выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО элемента 13 (ПЛЛК) имеет синтаксического родителя в ПЛЛК идентифицированной как элемент 13 первого вида; такая ПЛЛК будет являться элементом 13 второго вида - не обязательным элементом десятой структуры данных СМД; на третьем и последующих этапах из оставшихся ПЛЛК 13, вид которых еще не идентифицирован, выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО элемента 13 (ПЛЛК) имеет синтаксического родителя в ПЛЛК, идентифицированной как элемент 13 второго или последующих видов; такая ПЛЛК будет являться элементом 13 третьего или последующих видов - не обязательным элементом десятой структуры данных СМД. Наличие таких ПЛЛК обусловлено только синтаксической сложностью исходного лингвистического предложения. При этом дополнительно проводят этап идентификации
сочинительных связей между элементами 13 (ПЛЛК). ПЛЛК 13, у которых отсутствует синтаксическая подчинительная связь, но идентифицирована синтаксическая сочинительная связь, относят к тому же виду, что и ПЛЛК 13, с которым она сочинена. Идентификацию элементов 14 (составных частей элемента 15) десятой структуры данных СМД в ходе этапа 3043 производят путем
отождествления с элементами 13, идентифицированными на этапе 3042 как определенные виды элемента 13. При этом элементы 13 первого вида
идентифицируют как элемент 14 первого уровня, элементы 13 второго вида идентифицируют как элемент 14 второго уровня и так далее, элементы 13 третьего и последующих видов идентифицируют как элемент 14 третьего и, соответственно, последующих уровней.
[0156]Идентификация видов элементов 13 девятой структуры данных СМД в рамках этапа 3042 не изменяет значение 131 элемента 13 и не изменяет
порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 13 (ПЛЛК). Идентификацию значения и порядковых номеров ТЭ элемента 14 (СПЛЛК) десятой структуры данных СМД в рамках этапа 3043 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 13, идентифицируют как значение 141 элемента 14 (СПЛЛК), а порядковые номера) 212 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 13, идентифицируют как порядковые номера 142 текстовых элементов, составляющих элемент 14 (СПЛЛК). Идентификацию значения и порядковых номеров ТЭ элемента 15 (ИС ЛЛК) десятой структуры данных СМД в рамках этапа 3043 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих все элементы 14,
идентифицируют как значение 151 элемента 15 (ИС ЛЛК), а порядковые номера 212 (упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих все элементы 14, идентифицируют как порядковые номера 152 текстовых элементов, составляющих элемент 15 (ИС ЛЛК).
[0157]Формирование десятой структуры данных СМД в ходе этапа 3043 производят путем объединения в одной структуре данных элементов 14 десятой структуры данных СМД, а также их идентификационных данных. При этом объединяемые в одной структуре данных элементы 14, являясь составными частями элемента 15, формируют таким образом элемент 15, который является основным элементом десятой структуры данных СМД. Объединение в одной структуре данных упомянутых элементов и их идентификационных данных производится по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. В итоге десятая структура данных СМД представляет собой массив (перечень) структурированных ПЛЛК (СПЛЛК) - элементов 14 первого и последующих уровней, расположенных в перечне СПЛЛК с учетом возрастания уровня элемента 14 (и указанием этого уровня), а также с учетом возрастания порядкового номера текстового элемента признака связи элемента 14 (и указанием этого порядкового номера), а также порядкового номера текстового элемента синтаксического родителя элемента 14 (и указанием этого порядкового номера). При этом первой частью ИС ЛЛК и первым порядковым номером в упомянутом перечне структурированных ПЛЛК будет СПЛЛК 14 без синтаксического родителя и без признака связи. Элементы 14 десятой структуры данных СМД используют для построения схемы или таблицы логических связей, визуально отображающей логическую конструкцию исходного лингвистического предложения (логические связи между отдельными простыми суждениями, заложенными в исходном лингвистическом предложении). В частности, не ограничиваясь, как это было указано ранее со ссылкой на элементы 15, такое развернутое и одновременно структурированное представление исходного лингвистического предложения (логически связанное множество простых предложений без однородностей) позволяет повысить эффективность обработки лингвистического предложения 11 машинными средствами поскольку вместо одного обрабатываемого предложения со сложной структурой появляется возможность обрабатывать множество простых предложений с
идентифицированной логической связью между элементами этого множества.
[0158]Идентификацию лингвистических характеристик ТЭ, составляющих элемент 15 (ИС ЛЛК) десятой структуры данных СМД, и их значений при
необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3041, состоящего из идентификационных данных ТЭ, составляющих элемент 15 (ИС ЛЛК), и получении значений (2131, 2141, 2231, 2151, 2161, 2171) всех частей лингвистических характеристик (213, 214, 223, 215, 216, 217) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 15 (ИС ЛЛК). При этом, как было описано ранее лингвистическими признаками элемента 15 (ИС ЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элемент 15 (ИС ЛЛК).
[0159]На фиг. 36, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 305 формирования одиннадцатой структуры данных СМД, являющейся третьей структурой данных СМД для рассматриваемого способа 300. Этап 305 характеризуется: выполнением этапа 3051 идентификации видов элемента 15 десятой структуры данных СМД, указывающих на наличие в ИС ЛЛК сочиненных ПЛЛК, на котором идентифицируют первый и второй виды элемента 15 десятой структуры данных СМД, а также идентификации
непреобразованных элементов 16 одиннадцатой структуры данных СМД и их идентификационных данных, представляющих собой для каждого
непреобразованного элемента 16, в качестве примера, но не ограничения, значение 161 непреобразованного элемента 16 одиннадцатой структуры данных СМД и порядковые номера 162 ТЭ лингвистического предложения 11, составляющих непреобразованный элемент 16; выполнением этапа 3052 формирования преобразованных элементов 16 одиннадцатой структуры данных СМД, на котором формируют преобразованные элементы 16 одиннадцатой структуры данных СМД из элементов 15 второго вида, а также идентификационные данные
преобразованных элементов 16, представляющие собой для каждого
преобразованного элемента 16, в качестве примера, но не ограничения, значение 161 преобразованного элемента 16 одиннадцатой структуры данных СМД и порядковые номера 162 ТЭ лингвистического предложения 11, составляющих преобразованные элементы 16; выполнением этапа 3053 формирования
одиннадцатой структуры данных СМД, на котором формируют одиннадцатую структуру данных СМД из преобразованных элементов 16 одиннадцатой
структуры данных СМД или из непреобразованного элемента 16 одиннадцатой структуры данных СМД.
[0160]На фиг. 37, в качестве примера, но не ограничения, изображена общая структура сформированной одиннадцатой структуры данных СМД, являющейся четвертой структурой данных СМД для настоящего способа преобразования 300. Одиннадцатая структура данных СМД представляет собой СМД, содержащий элементы 16 одиннадцатой структуры данных СМД, которые представляют собой сложные лингво-логические конструкции (СЛЛК) лингвистического предложения 11 и идентификационные данные ЛогО, представляющие собой для каждого элемента 16, в качестве примера, но не ограничения, значение 161 элемента 16 одиннадцатой структуры данных СМД и порядковые номера 162 текстовых элементов, составляющих элемент 16. У СЛЛК лингвистического предложения 11 отсутствуют какие-либо характеризующие ее уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 16, в качестве примера, но не ограничения, могут именоваться как «СЛЛК1», «СЛЛК2», «СЛЛКЗ», «СЛЛКп», где n > 1 - порядковый номер элемента в лингвистическом предложении. СЛЛК лингвистического предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, СЛЛК - это синтаксическая единица вида «синтаксическая конструкция», сформированная из ИС ЛЛК путем гетерогенизации ИС ЛЛК. С точки зрения синтаксиса СЛЛК - это отдельное простое предложение (если исходное лингвистическое предложение является простым предложением без синтаксических осложнений (однородных членов, оборотов и так далее)) или сложноподчиненное предложение, которое не содержит однородных членов (слов между которыми имеется синтаксическая сочинительная связь). С логической точки зрения, СЛЛК - это логическая сущность, выражающая сложное суждение (кванторное суждение), представляющее собой завершенную логическую конструкцию мышления, с помощью которой
формируется и передается мысль о том, что нечто (предикат суждения)
утверждается или опровергается о предмете суждения (субъект суждения).
Отличие СЛЛК от ИС ЛЛК в кванторности сложного суждения. Если ИС ЛЛК допускает возможность наличия неоднозначности в сложном суждении, то СЛЛК (имеющая показатель кванторности, равный единице) является абсолютно однозначным сложным суждением. В составе СЛЛК не может быть нескольких однородных (сочиненных) простых суждений. В СЛЛК не может быть никакой неоднозначности ни при утверждении (опровержении) чего-либо, ни при обусловленности утверждения (опровержения), ни при обусловленности
элементов утверждения (опровержения), вне зависимости от состава и
конструкции исходного лингвистического предложения.
[0161]Идентификацию вида ИС ЛЛК 15 в рамках этапа 3051 производят путем анализа значений лингвистических характеристик текстовых элементов, составляющих ИС ЛЛК 15, с целью идентификации синтаксических сочинительных связей между СПЛЛК 14 в ИС ЛЛК 15. Синтаксическую сочинительную связь между СПЛЛК 14 идентифицируют в случае наличия у синтаксически главных ЛЛЕ синтаксически главных ОЛЛО таких СПЛЛК одного и того же синтаксического родителя (синтаксически главной ЛЛЕ другой СПЛЛК, у которой со словом (ЛЛЕ) в сочиненных СПЛЛК имеется прямая синтаксическая подчинительная связь).
Дополнительными условиями может быть наличие у главных ЛЛЕ главных ОЛЛО упомянутых сочиненных СПЛЛК одной и той же синтаксической роли, а также наличие признака связи между упомянутыми сочиненными ЛЛЕ, а именно - запятой или сочинительного союза. При идентификации синтаксической
сочинительной связи между главными ЛЛЕ главных ОЛЛО двух или более СПЛЛК такую ИС ЛЛК идентифицируют как второй вид элемента 15. ИС ЛЛК 15, в которой не идентифицируют синтаксической сочинительной связи у главного ЛЛЕ главного ОЛЛО в СПЛЛК идентифицируют как первый вид элемента 15. При этом
идентифицированный первый вид элемента 15 десятой структуры данных СМД отождествляют с непреобразованным элементом 16 одиннадцатой структуры данных СМД. Формирование преобразованных элементов одиннадцатой структуры данных СМД (преобразованных элементов 16, полученных из элементов 15 второго вида) на этапе 3052 производят на основании идентифицированной на этапе 3051 синтаксической сочинительной связи между СПЛЛК путем преобразования ИС ЛЛК второго вида. Смысл преобразования ИС ЛЛК второго вида на этапе 3052 состоит в гетерогенизации ИС ЛЛК, то есть в устранении синтаксических однородностей в ИС ЛЛК путем формирования из элемента 15 второго вида множества новых ИС ЛЛК, идентичных по однородностям элементу 15 первого вида. При этом каждая новая ИС ЛЛК упомянутого множества может содержать только одну из упомянутых СПЛЛК с однородными членами (если ИС ЛЛК второго вида содержит один ряд однородных членов) или только одно уникальное сочетание упомянутых СПЛЛК с однородными членами разных рядов однородных членов (если ИС ЛЛК второго вида содержит несколько рядов СПЛЛК с однородными членами). Множество ИС ЛЛК, сформированных из ИС ЛЛК (элемент 15) второго вида являются
гетерогенными СЛЛК (преобразованными элементами 16), то есть
сформированными из одной ИС ЛЛК второго вида путем ее гетерогенного преобразования (гетерогенизации). Процесс гетерогенизации ИС ЛЛК (элемента 15) второго вида может быть проведен, в качестве примера, но не ограничения, следующим образом: на первом этапе выявляют ряды однородных членов в элементе 15 второго вида; в ходе выявления рядов однородных членов выявляют сами ряды однородных членов и порядковые номера однородных членов в ряду, а также признаки связи каждого однородного члена; на втором этапе выявляют цепочки однородных членов для каждого выявленного СПЛЛК, содержащего ЛЛЕ- ОЧ (СПЛЛК-ОЧ) элемента 15 второго вида; цепочка однородных членов (цепочка 04) - это СПЛЛК-ОЧ и зависимая цепочка однородных членов (цепочка
синтаксически связанных СПЛЛК, начиная от первого синтаксического потомка однородных членов (синтаксически зависимой СПЛЛК) и продолжая по цепочке синтаксической зависимости (по синтаксической подчинительной связи) до другой СПЛЛК-ОЧ или до последней ПЛЛК в элементе 15 второго вида;
идентифицированные цепочки 04 классифицируются по факту наличия
синтаксического потомка ЛЛЕ в зависимой цепочке 04, который не входит в зависимую цепочку 04; те цепочки 04, которые имеют зависимые цепочки 04 без синтаксического потомка за рамками зависимой цепочки однородных членов считаются крайними цепочками однородных членов (крайними цепочками 04), а те цепочки 04, которые имеют зависимые цепочки 04 с синтаксическим потомком за рамками зависимой цепочки 04 считаются внутренними цепочками однородных членов (внутренними цепочками 04); на третьем этапе выявляют ПЛЛК элемента 15 второго вида, не входящие в цепочки однородных членов (ПЛЛК вне цепочек 04); на четвертом этапе формируют сменные зависимые цепочки (сменные ЗЦ) элемента 15 второго вида; сменная ЗЦ - это основа преобразованных элементов 16, состоящая из одной крайней цепочки 04 и внутренних цепочек 04, если такие внутренние цепочки 04 по цепочке непрерывной синтаксической подчинительной связи имеются между крайней цепочкой 04 и ПЛЛК вне цепочек 04; на пятом этапе формируют гетерогенные СЛЛК (элементы 16); гетерогенная СЛЛК формируется из одной сменной ЗЦ и ПЛЛК вне цепочки 04 (если такие ПЛЛК есть); количество сменных ЗЦ элемента 15 второго вида определяет количество гетерогенных СЛЛК, сформированных от одного элемента 15 второго вида.
[0162] Идентификация видов элементов 15 десятой структуры данных СМД в рамках этапа 3051 не изменяет значение 151 элемента 15 и не изменяет
порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 (ИС ЛЛК). Идентификацию значения и порядковых номеров ТЭ непреобразованного элемента 16 (СЛЛК) одиннадцатой структуры данных СМД в рамках этапа 3051 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 первого вида десятой структуры данных СМД, идентифицируют как значение 161 непреобразованного элемента 16 (СЛЛК), а порядковые номера 152 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 первого вида, из которого состоит непреобразованный элемент 16, идентифицируют как порядковые номера 162 текстовых элементов, составляющих непреобразованный элемент 16 (СЛЛК). Идентификацию значения и порядковых номеров ТЭ преобразованного элемента 16 (гетерогенной СЛЛК) одиннадцатой структуры данных СМД в рамках этапа 3052 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 второго вида десятой структуры данных СМД, за исключением значений 211 текстовых элементов 21 лингвистического
предложения 11, составляющих отдельные части элемента 15 второго вида
(СПЛЛК-04), которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК-04 (синтаксически подчиненные удаленным СПЛЛК-04 сочинительные союзы или знаки препинания), идентифицируют как значение 161 преобразованного элемента 16 (СЛЛК), а порядковые номера 212 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 второго вида шестой структуры данных СМД, за исключением порядковых номеров 212 текстовых элементов 21 лингвистического предложения 11, составляющих отдельные части элемента 15 второго вида (СПЛЛК-04), которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК-04 (синтаксически подчиненные удаленным СПЛЛК-04 сочинительные союзы или знаки препинания) идентифицируют как порядковые номера 162 текстовых элементов, составляющих преобразованный элемент 16 (гетерогенная СЛЛК).
[0163] Формирование одиннадцатой структуры данных СМД в рамках этапа 3053 производят путем объединения в одной структуре данных,
идентифицированных на этапах 3051 и 3052 элементов 16 одиннадцатой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются. Первым из объединяемых элементов одиннадцатой структуры данных СМД является идентифицированный на этапе 3051 элемент 15 первого вида, являющийся непреобразованным элементом 16, то есть СЛЛК 16,
совпадающей с ИС ЛЛК 15 без синтаксической сочинительной связи. Вторым из объединяемых элементов одиннадцатой структуры данных СМД являются преобразованные элементы 16, сформированные на этапе 3052 как множество преобразованных элементов 16, являющихся гетерогенными СЛЛК,
сформированными из элемента 15 второго вида (ИС ЛЛК с синтаксической сочинительной связью) путем гетерогенизации ИС ЛЛК второго вида.
[0164] Идентификацию лингвистических характеристик ТЭ, составляющих элемент 16 (СЛЛК) одиннадцатой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3041, состоящего из идентификационных данных ТЭ, составляющих элемент 16 (СЛЛК), и получении значений (2131, 2141, 2231, 2151, 2161, 2171) всех частей лингвистических характеристик (213, 214, 223, 215, 216, 217) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 16 (СЛЛК). При этом, как было описано ранее лингвистическими признаками элемента 16 (СЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элемент 16 (СЛЛК).
[0165]Вместе с тем, после завершения описанного ранее этапа 301, в целях обеспечения альтернативного повышения точности последующего поиска в структурированном массиве данных (СМД), альтернативно становится возможным осуществить дальнейшее преобразование СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и их идентификационные данные. При этом специалисту в данной области техники должно быть очевидно, что описанные далее принципы и способы по завершении описанного ранее этапа 301 способа 300 могут осуществляться как одновременно (параллельно) с описанными ранее этапами 301-305 способа 300, так и не одновременно (альтернативно или последовательно, в том числе вне зависимости от порядка следования), а также, что отдельные принципы и способы отдельных описываемых далее этапов могут реализовываться аналогичным образом.
[0166]На фиг. 38, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 400 преобразования СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО,
являющегося исходной структурой данных для рассматриваемого способа 400. Заявленный способ 400 преобразования СМД, содержащего, по меньшей мере,
ОЛЛО лингвистического предложения и их идентификационные данные, характеризуется: выполнением этапа 301 идентификации пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором
идентифицируют структуру данных СМД, содержащую элементы упомянутой пригодной для преобразования структуры данных, содержащей ОЛЛО, являющейся исходной структурой данных СМД в рамках рассматриваемого способа 400, причем упомянутые элементы пригодной для преобразования структуры данных представляют собой основные лингво-логические объекты (ОЛЛО)
лингвистического предложения и идентификационные данные ОЛЛО;
выполнением этапа 402 формирования двенадцатой структуры данных СМД, на котором формируют двенадцатую структуру данных СМД, являющуюся первой структурой данных СМД для рассматриваемого способа 400, содержащую элементы упомянутой двенадцатой структуры данных СМД, причем упомянутые элементы двенадцатой структуры данных СМД представляют собой основные лингво - логические элементы (ОЛЛЭ) лингвистического предложения сформированные путем разделения ОЛЛО на семантические части ОЛЛО, а также представляют собой идентификационные данные ОЛЛЭ, представляющие собой для каждого ОЛЛЭ, в качестве примера, но не ограничения: значение ОЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих ОЛЛЭ; выполнением этапа 403 формирования тринадцатой структуры данных СМД, на котором формируют тринадцатую структуру данных СМД, являющуюся итоговой структурой данных СМД для рассматриваемого способа 400, содержащую элементы упомянутой тринадцатой структуры данных СМД, причем упомянутые элементы тринадцатой структуры данных СМД представляют собой исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения,
сформированные путем разделения ОЛЛЭ на семантические части ОЛЛЭ и формирования из них исходных элементов, а также представляют собой
идентификационные данные ИЛЛЭ, представляющие собой для каждого ИЛЛЭ, в качестве примера, но не ограничения: значение ИЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего
(составляющих) ИЛЛЭ.
[0167] Как было указано ранее со ссылкой на фиг. 26, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 301 идентификации структуры данных СМД, на котором идентифицируют структуру данных СМД, являющуюся исходной структурой данных для рассматриваемого способа 400, элементы 91 которого представляют собой ОЛЛО лингвистического предложения 11, а также идентификационные данные элементов 91, представляющие собой для каждого элемента 91, в качестве примера, но не ограничения, значение 911 элемента91 и порядковый (порядковые) номер (номера) 912 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 91. Описанный таким образом со ссылкой на фиг. 26 процесс далее подробно не описывается. По результатам выполнения этапа 301 идентифицируют структуру данных,
показанную на фиг. 27, состав которой, описанный со ссылкой на фиг. 27, соответственно далее подробно не описывается.
[0168]На фиг. 39, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 402 формирования двенадцатой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 400. Этап 402 характеризуется: выполнением этапа 4021 формирования значений 2181 седьмой части лингвистических характеристик 218 элементов 21, составляющих элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО на котором формирует значения 2181 седьмой части лингвистических
характеристик 218 элементов 21, составляющих элементы 91 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3041, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021;
выполнением этапа 4022 формирования семантических частей элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором формируют первую и последующие (вторую, третью и так далее по порядку) семантические части ОЛЛО, проясняющие смысловую структуру ОЛЛО;
выполнением этапа 4023 формирования двенадцатой структуры данных СМД на котором идентифицируют элементы 17 двенадцатой структуры данных СМД, а также идентификационные данные элементов 17, представляющие собой для каждого элемента 17, в качестве примера, но не ограничения, значение 171 элемента 17 двенадцатой структуры данных СМД и порядковый (порядковые) номер (номера) 172 ТЭ лингвистического предложения 11, составляющего
(составляющих) элемент 17, и формируют двенадцатую структуру данных СМД.
[0169]На фиг. 40, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 4021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, формируемой в рамках этапа 4021. БДЛП, формируемая в рамках этапа 4021, отличается от БДЛП, формируемой в рамках этапа 3021, наличием значений 2181 седьмой части лингвистических характеристик 218, указывающих главное слово семантической части элемента 91 (ОЛЛО). Причина выявления главного слова семантической части ОЛЛО состоит в том, что, используя выявленное главное слово семантической части ОЛЛО и
идентифицированные ранее синтаксические связи между словами (ЛЛЕ) в ОЛЛО, можно разделить ОЛЛО на отдельные семантические части. Семантические части ОЛЛО проясняют смысловую структуру ОЛЛО, в которой отдельные части выполняют свои ограниченные смысловые роли в ОЛЛО. Семантические части в ОЛЛО позволяют выделить в ОЛЛО интегрированные в нем доминирующую и уточняющие сущности окружающего мира (объекты и действия) для корректной идентификации их смысловых ролей и, как следствие, смысла ОЛЛО. Выделение отдельных семантических частей в ОЛЛО позволяет установить их уникальные логические роли в ОЛЛО, что позволяет хранить эти части раздельно без потери их смысловой логической роли в предложении. Такое раздельное хранение позволяет осуществлять быстрый и точный поиск семантических частей ОЛЛО, а также отдельно от других частей лингвистического предложения производить разного рода их анализ и обработку.
[0170]Формирование седьмой части лингвистических характеристик 218 и их значений 2181 в ходе этапа 4021 производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов 21, входящих в элементы 91. В ходе такого анализа у всех текстовых элементов 21, составляющих элемент 91 проверяют наличие признака главного слова
семантической части элемента 91. Признаком главного слова семантической части элемента 91 может быть, в качестве примера, но не ограничения, наличие у текстового элемента (ТЭ) следующих значений лингвистических характеристик:
ТЭ является главным словом ОЛЛО или ТЭ имеет зависимый ТЭ в форме предлога. Предварительно могут быть заданы иные собственные критерии идентификации синтаксической части ОЛЛО. Например, не ограничиваясь, может быть уточнен перечень частей речи, которые указывают на главное слово синтаксической части ОЛЛО. При наличии у ТЭ указанных значений лингвистических характеристик формируют соответствующие значения 2181 седьмой части лингвистических характеристик 218 - «главное слово семантической части ОЛЛО».
[0171]Сформированные по итогам этапа 4021 значения 2181 (главное слово семантической части элемента 91) седьмой части лингвистических характеристик 218 элементов 21, составляющих ОЛЛО 91 пригодной для преобразования структуры данных, содержащей ОЛЛО вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11,
формируемую в рамках этапа 4021. При этом все части (211, 214, 232, 215, 216 и 218) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2321, 2151, 2161 и 2181) формируют уникальные лингвистические признаки элементов 91 для альтернативного способа повышения точности поиска в структурированном массиве данных.
[0172]На фиг. 41, в качестве примера, но не ограничения, изображена общая структура сформированной двенадцатой структуры данных СМД являющаяся первой для настоящего способа преобразования 400. Двенадцатая структура данных СМД представляет собой СМД, содержащий элементы 17 двенадцатой структуры данных СМД, которые представляют собой основные лингво -логические элементы (ОЛЛЭ) лингвистического предложения 11 и идентификационные данные ОЛЛЭ, представляющие собой, в качестве примера, но не ограничения, значения 171 элементов 17 двенадцатой структуры данных и порядковые номера 172 текстовых элементов, составляющих ОЛЛЭ. У ОЛЛЭ 12 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 12, в качестве примера, но не ограничения, могут именоваться как «ОЛЛЭ п.ш», где n > 1 указывает на порядковый номер ОЛЛО в лингвистическом предложении, a m > 1) указывает на синтаксический уровень ОЛЛЭ в ОЛЛО, начиная с первого. ОЛЛЭ предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, ОЛЛЭ - это синтаксическая единица вида
«синтаксическая конструкция», сформированная из ОЛЛО 91 путем выделения в ОЛЛО 91 отдельных синтаксических частей по признаку наличия главных слов синтаксических частей в ОЛЛО 91. Упомянутые главные слова синтаксической части ОЛЛО 91 представляют собой такие части речи как существительное, местоимение или глагол (в любой грамматической форме), которые либо являются синтаксически главным словом ОЛЛО 91, либо содержат прямого синтаксического потомка (слово, с которым имеется прямая синтаксическая подчинительная связь) с синтаксической ролью «предлог». Предварительно могут быть заданы иные критерии идентификации синтаксической части ОЛЛО 91. Например, не
ограничиваясь, возможно задать критерии в виде конкретного перечня предлогов, наличие которых указывают на главное слово синтаксической части ОЛЛО 91. С точки зрения синтаксиса ОЛЛЭ 17 - это слова и особые словосочетания внутри ОЛЛО 91. В зависимости от сложности лингвистической структуры ОЛЛО 91 в нем можно выделить один или несколько ОЛЛЭ 17. С логической точки зрения, ОЛЛЭ 17 - это логическая сущность, являющаяся логически отделимой частью элемента простого суждения. При этом такие логически отделимые части по своей структуре и логической роли ничем не отличаются от ОЛЛО 91 по той причине, что, так же, как и ОЛЛО 91, они представляют мыслимый (семантический) образ некого предмета или действия окружающего мира). Причина существования
семантических частей образа ОЛЛО 91 в том, что не всякий образ ОЛЛО 91 можно лингвистически реализовать, используя лишь один составной элемент (группу слов без предлога между словами). Например, не ограничиваясь, мыслимый образ ОЛЛО 91 о праве на что-либо (например, не ограничиваясь, «право потребителя на возврат товара») невозможно реализовать одним составным элементом (одной группой слов без предлога между словами)). В упомянутом примере лишь два составных элемента - первый - «право потребителя», и второй - «возврат товара», - формируют мыслимый образ элемента простого суждения. Составной элемент ОЛЛО 91 (семантическая часть ОЛЛО) именуется термином ОЛЛО 91. С семантической точки зрения термины ОЛЛО 91, формирующие ОЛЛО 91
неодинаковы, то есть имеют различные семантические роли. Синтаксически главные термины ОЛЛО 91 имеют максимальную семантическую роль, то есть являются терминами ОЛЛО 91 первой семантической части. Термин ОЛЛО 91 первой семантической части определяет смысловой вектор ОЛЛО 91. Например, не ограничиваясь, в примере «право потребителя на возврат товара» смысловую суть образа ОЛЛО 91 формирует именно составной элемент «право потребителя», а не составной элемент «возврат товара». Термины ОЛЛО второй и последующих семантических частей, являются синтаксически зависимыми терминами ОЛЛО 91, и их присутствие в ОЛЛО 91 необходимо только для уточнения мыслимого образа ОЛЛО 91. Чем сложнее мыслимый образ ОЛЛО 91, тем большего количества терминов ОЛЛО 91 может потребовать уточнение его мыслимого образа.
Структурирование терминов ОЛЛО 91 как семантических частей ОЛЛО позволяет правильно воспринимать семантические роли отдельных терминов в ОЛЛО 91. Разделение таким образом ОЛЛО 91 позволяет производить интеллектуальный поиск информации с повышенной точностью, так как при наличии более структурированного (по логической роли слов) массива данных возможно более точное описание искомых объектов. В результате машинной обработки такого массива данных повышается точность поиска и сокращается время поиска,
[0173] Формирование частей (семантических частей) элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, на этапе 4022 производят путем выполнения следующих действий: на первом этапе от идентифицированного главного слова семантической части ОЛЛО 91
идентифицируют все синтаксически подчиненные слова, вплоть до слова, которое само является главным словом семантической части ОЛЛО 91, но не включая данное слово; на втором этапе главное слово семантической части ОЛЛО 91 и все упомянутые синтаксически подчиненные слова, в том числе последовательно подчиненные, формируют семантическую часть ОЛЛО 91. Порядковый номер семантической части в ОЛЛО, указывает на ее семантическую роль в ОЛЛО и формируется в соответствии с порядковым номером текстового элемента (ТЭ) главного слова семантической части ОЛЛО 91. Семантическая часть ОЛЛО 91 с наименьшим порядковым номером ТЭ главного слова является первой
семантической частью ОЛЛО 91. Семантическая часть ОЛЛО 91, имеющая ближайший к нему номер ТЭ главного слова семантической части является второй семантической частью ОЛЛО 91, и так далее. Порядковый номер ОЛЛЭ указывается в наименовании ОЛЛЭ, например, но не ограничиваясь - «ОЛЛЭ 1.2». Такое наименование элемента 17 говорит о том, что он является второй семантической частью в первом ОЛЛО (по синтаксическому уровню «.2»). Идентификацию элементов 17 двенадцатой структуры данных СМД в ходе этапа 4023 производят на основе этапа 4022 формирования семантических частей элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО. Все сформированные семантические части элементов 91 отождествляют с элементами 17 двенадцатой структуры данных СМД.
[0174]Идентификацию значения и порядковых номеров ТЭ элемента 17 двенадцатой структуры данных СМД, производят в рамках этапа 4023 путем отождествления значения 171 элемента 17 со значениями 911
идентифицированной семантической части элемента 91, а порядковых номеров 172 текстовых элементов 21, составляющих элемент 17 путем отождествления с порядковыми номерами 912 текстовых элементов, составляющих
идентифицированную семантическую часть элемента 91.
[0175]Формирование двенадцатой структуры данных СМД в ходе этапа 4023 производят путем объединения в одной структуре данных элементов 17
двенадцатой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.
[0176]Идентификацию лингвистических характеристик ТЭ, составляющих элементы 17 (ОЛЛЭ) двенадцатой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 4021, состоящего из идентификационных данных ТЭ, составляющих элемент 17 (ОЛЛЭ), и получении значений (2131, 2141, 2231; 2151, 2161, 2181) всех частей лингвистических характеристик (213, 214, 223, 215, 216,218) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 17 (ОЛЛЭ). При этом, как было описано ранее лингвистическими признаками элементов 17 (ОЛЛЭ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 17 (ОЛЛЭ).
[0177]На фиг. 42, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 403 формирования тринадцатой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 400. Этап 403 характеризуется: выполнением этапа 4031 формирования значений 2191 восьмой части лингвистических характеристик 219 элементов 21, составляющих элементы 17 двенадцатой структуры данных СМД, на котором формируют значения 2191 восьмой части лингвистических характеристик 219 элементов 21, составляющих элементы 91, и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021, формируя в итоге БДЛП текстовых элементов 21
лингвистического предложения 11, формируемую в рамках этапа 4031;
выполнением этапа 4032 формирования семантических частей элементов 17 двенадцатой структуры данных СМД, на котором формируют первую и
последующие (вторую, третью и так далее по порядку) семантические части ОЛЛЭ, проясняющие смысловую структуру ОЛЛЭ; выполнением этапа 4033
формирования элементов 18 тринадцатой структуры данных СМД, на котором формируют элементы 18 тринадцатой структуры данных СМД и
идентификационные данные элементов 18, представляющие собой, в качестве примера, но не ограничения, значения 181 элементов 18 тринадцатой структуры данных СМД, порядковые номера 182 ТЭ лингвистического предложения 11, составляющих элементы 18, а также идентифицируют первые и вторые виды элементов 18 тринадцатой структуры данных СМД и формируют тринадцатую структуру данных СМД.
[0178]На фиг. 43, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 4031 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 17 двенадцатой структуры данных СМД. БДЛП, формируемая в рамках этапа 4031, отличается от БДЛП, формируемой в рамках этапа 4021, наличием значений 2191 восьмой части лингвистических
характеристик 219, указывающих главное слово семантической части элемента 17 (ОЛЛЭ). Причина выявления главного слова семантической части ОЛЛЭ состоит в том, что, используя выявленное главное слово семантической части ОЛЛЭ и идентифицированные ранее синтаксические связи между словами (ЛЛЕ) в ОЛЛЭ можно разделить ОЛЛЭ на отдельные семантические части. Семантические части ОЛЛЭ проясняют смысловую структуру ОЛЛЭ, в которой отдельные части выполняют свои ограниченные смысловые роли в ОЛЛЭ. Семантические части в ОЛЛЭ позволяют выделить в ОЛЛЭ интегрированные в нем доминирующую и уточняющие сущности окружающего мира (объекты и действия) для корректной идентификации их смысловых ролей и в итоге смысла ОЛЛЭ. Выделение отдельных семантических частей в ОЛЛЭ позволяет установить их уникальные логические роли в ОЛЛЭ, что позволяет хранить эти части раздельно без потери их смысловой логической роли в предложении. Такое раздельное хранение позволяет
осуществлять быстрый и точный поиск семантических частей ОЛЛЭ, а также отдельно от других частей лингвистического предложения производить разного рода их анализ и обработку.
[0179]Формирование восьмой части лингвистических характеристик 219 и их значений 2191 в ходе этапа 4031 производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов 21, входящих в элементы 17. В ходе такого анализа у всех текстовых элементов 21, составляющих элемент 17 проверяют наличие признака главного слова
семантической части элемента 17. Признаком главного слова семантической части элемента 17 может быть, в качестве примера, но не ограничения, наличие у текстового элемента (ТЭ) следующих значений лингвистических характеристик:
ТЭ является главным словом ОЛЛЭ или ТЭ имеет форму существительного, местоимения или глагола (в любой грамматической форме). Предварительно могут быть заданы иные собственные критерии идентификации синтаксической части ОЛЛЭ. Например, не ограничиваясь, может быть уточнен перечень частей речи, которые указывают на главное слово синтаксической части ОЛЛЭ. При наличии у ТЭ указанных значений лингвистических характеристик формируют
соответствующие значения 2191 восьмой части лингвистических характеристик 219 - «главное слово семантической части ОЛЛЭ».
[0180]Сформированные по итогам этапа 4031 значения 2191 (главное слово семантической части элемента 17) восьмой части лингвистических характеристик 219 элементов 21, составляющих ОЛЛЭ 17 двенадцатой структуры данных СМД вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4031. При этом все части (211, 214, 232, 215, 216, 218, 219) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2321, 2151, 2161, 2181, 2191) формируют уникальные лингвистические признаки элементов 17 для альтернативного способа повышения точности поиска в структурированном массиве данных.
[0181]На фиг. 44, в качестве примера, но не ограничения, изображена общая структура сформированной тринадцатой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 400. Тринадцатая структура данных СМД представляет собой СМД, содержащий элементы 18 первого и второго вида тринадцатой структуры данных СМД, которые представляют собой исходные лингво-логические элементы (ИЛЛЭ)
лингвистического предложения 11 и идентификационные данные ИЛЛЭ, представляющие собой для каждого ИЛЛЭ, в качестве примера, но не ограничения: значение 181 элемента 18 шестой структуры данных СМД, порядковый
(порядковые) номер (номера) 182 ТЭ лингвистического предложения 11, составляющих элементы 18. У ИЛЛЭ 18 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 18, в качестве примера, но не ограничения, могут именоваться как «ИЛЛЭ n.m.k», где n > 1 указывает на порядковый номер ОЛЛО в лингвистическом предложении, a m > 1 указывает на синтаксический уровень ОЛЛЭ в ОЛЛО, начиная с первого, a k > 1 указывает на синтаксический уровень ИЛЛЭ в ОЛЛЭ, начиная с первого. ИЛЛЭ 18 предложения 11 - это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения ИЛЛЭ 18 - это первичная синтаксическая единица, являющаяся словом. С логической точки зрения ИЛЛЭ 18 - это логическая сущность, являющаяся логически отделимой частью термина элемента простого суждения (термина ОЛЛО). При этом такие логически отделимые части по своей структуре и логической роли ничем не отличаются от ОЛЛЭ 17 по той причине, что так же, как и ОЛЛЭ 17 они представляют собой мыслимый (семантический) образ о некоем предмете или действии окружающего мира). Причина существования синтаксических частей ОЛЛЭ 17 в том, что не всякий мыслимый образ ОЛЛЭ 17 можно представить, используя лишь один «исходный элемент» (слово,
выражающее объект или действие). Например, не ограничиваясь, мыслимый образ ОЛЛЭ 17 о правах кого-либо, например, не ограничиваясь, «права потребителя», невозможно реализовать одним исходным элементом. В упомянутом примере лишь два исходных элемента - первый - «права», и второй - «потребителя», - формируют мыслимый образ термина элемента простого суждения (термина ОЛЛО). Исходный элемент ОЛЛЭ 17 именуется понятием термина ОЛЛО (ПТ ОЛЛО) или элементов 18 (ИЛЛЭ). С семантической точки зрения ПТ ОЛЛО (ИЛЛЭ 18), формирующие термин ОЛЛО (ОЛЛЭ 17) неравнозначны, то есть имеют различные семантические роли. Синтаксически главные ПТ ОЛЛО имеют максимальную семантическую роль, то есть являются ПТ ОЛЛО первой семантической части. ПТ ОЛЛО первой
семантической части определяют смысловой вектор термина ОЛЛО (ОЛЛЭ 17). Например, в упомянутом примере «права потребителя» суть образа термина ОЛЛО (ОЛЛЭ 17) - именно «права», а не «потребитель». ПТ ОЛЛО второй и последующих семантических частей (синтаксически зависимые ПТ ОЛЛО) в термине ОЛЛО (ОЛЛЭ 17) необходимы для уточнения смысла термина ОЛЛО (ОЛЛЭ 17). Чем сложнее мыслимый образ термина ОЛЛО (ОЛЛЭ 17), тем большего количества ПТ ОЛЛО (ИЛЛЭ 18) он может потребовать. Структурирование ПТ ОЛЛО (ИЛЛЭ 18) как семантических частей ОЛЛЭ 17 позволяет правильно воспринимать семантические роли отдельных ПТ ОЛЛО (ИЛЛЭ 18) в терминах ОЛЛО (ОЛЛЭ 17). Элемент 18 (ИЛЛЭ) формируют из ОЛЛЭ 17 путем выделения в ОЛЛЭ 17 отдельных
синтаксических частей по признаку наличия главных слов синтаксических частей ОЛЛЭ 17 и последующего структурирования текстовых элементов синтаксической части. В зависимости от сложности лингвистической структуры ОЛЛЭ 17 в нем можно выделить одну или несколько синтаксических частей (ИЛЛЭ 18).
Синтаксическая часть (ИЛЛЭ 18) ОЛЛЭ 17 может представлять собой только одно упомянутое главное слово или несколько синтаксически связанных слов
(значимых частей речи), синтаксически главным из которых является упомянутое главное слово. Таким образом главное слово синтаксической части (ИЛЛЭ 18) ОЛЛЭ 17 отождествляется с элементом 18 первого вида, а все синтаксически зависимые от него слова (значимые части речи), если такие имеются, отождествляются с элементом 18 второго вида. С логической точки зрения исходные лингво- логические элементы (элементы 18) первого вида являются «понятиями» - то есть объектами или действиями окружающего мира, а элементы 18 второго вида - «признаками понятия», то есть некими семантическими характеристиками упомянутых объектов и действий.
[0182]Формирование частей (семантических частей) элементов 17 двенадцатой структуры данных СМД, на этапе 4032 производят путем выполнения следующих действий: на первом этапе от идентифицированного главного слова элемента 17 (ОЛЛЭ) идентифицируют все синтаксически подчиненные слова, вплоть до слова, которое само является главным словом семантической части элемента 17 (ОЛЛЭ), но не включая данное слово; на втором этапе главное слово семантической части элемента 17 (ОЛЛЭ) и все упомянутые синтаксически подчиненные слова, в том числе последовательно подчиненные, формируют семантическую часть элемента 17 (ОЛЛЭ). Порядковый номер семантической части в ОЛЛЭ, указывает на ее семантическую роль в ОЛЛЭ, и его формируют в
соответствии с номером текстового элемента (ТЭ) главного слова семантической части ОЛЛЭ 17. Семантическая часть ОЛЛЭ 17 с наименьшим номером ТЭ главного слова является первой семантической частью элемента 17 (ОЛЛЭ). Семантическая часть ОЛЛЭ 17, имеющая ближайший к нему номер ТЭ главного слова
семантической части является второй семантической частью ОЛЛЭ 17, и так далее. Порядковый номер ИЛЛЭ указывает в наименовании ОЛЛЭ, например, но не ограничиваясь - «ИЛЛЭ 1.2.1». Такое наименование элемента 18 говорит о том, что он является первой семантической частью во втором ОЛЛЭ первого ОЛЛО.
Формирование элементов 18 тринадцатой структуры данных СМД в ходе этапа 4033 производят на основе результатов этапа 4032 формирования семантических частей элементов 17 двенадцатой структуры данных СМД следующим образом: на первом этапе все значимые части речи в семантических частях элементов 17 отождествляют с элементами 18 тринадцатой структуры данных СМД; на втором этапе упомянутые идентифицированные главные слова семантических частей элементов 17 отождествляют с элементами 18 первого вида; на третьем этапе все остальные элементы 18 данной семантической части, кроме элемента 18 первого вида отождествляют с элементами 18 второго вида.
[0183]Идентификация значения и порядкового (порядковых) номера (номеров) ТЭ элемента 18 двенадцатой структуры данных СМД, производится в рамках этапа 4033 путем отождествления значения 181 элемента 18 со значением (значениями) 211 текстового (текстовых) элемента (элементов) 21
лингвистического предложения 11, составляющего (составляющих) элемент 18, а порядковый (порядковые) номер (номера) 182 текстового (текстовых) элемента (элементов) 21, составляющего (составляющих) элемент 18 путем отождествления с порядковым (порядковыми) номером (номерами) 212 текстового (текстовых) элемента (элементов) 21, составляющего (составляющих) элемент 18.
Идентификация видов элементов 18 двенадцатой структуры данных СМД в рамках этапа 4031 не изменяет значение 181 элемента 18 и не изменяет порядковый (порядковые) номер (номера) ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 18 (ИЛЛЭ).
[0184] Формирование тринадцатой структуры данных СМД в ходе этапа 4033 производят путем объединения в одной структуре данных элементов 18 первого и второго вида тринадцатой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно далее подробно не описываются.
[0185] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 18 (ИЛЛЭ) тринадцатой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 4031, состоящего из идентификационных данных ТЭ, составляющих элемент 18 (ИЛЛЭ), и получении значений (2131, 2141, 2231; 2151, 2161, 2181, 2191) всех частей лингвистических характеристик (213, 214, 223, 215, 216, 218, 219) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 18 (ИЛЛЭ). При этом, как было описано ранее
лингвистическими признаками элементов 18 (ИЛЛЭ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 18 (ИЛЛЭ).
[0186]На фиг. 45, в качестве примера, но не ограничения,
проиллюстрирована примерная схема системы 500 преобразования
структурированного массива данных, которая в предпочтительном варианте реализации содержит, по меньшей мере, одно или более компьютерных устройств 501 преобразования структурированного массива данных, содержащих, по меньшей мере, один или более процессоров 5011 и память 5012. Упомянутые устройства 501 преобразования структурированного массива данных могут представлять собой, но не ограничиваться: персональный компьютер,
портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет и тому подобное. Память (машиночитаемый носитель данных) 5012 устройства 501 преобразования структурированного массива данных, содержит код программы, который при выполнении побуждает упомянутые один или более процессоры 5011 упомянутого устройства 501 выполнять действия описанных ранее способов преобразования структурированного массива данных. В некоторых случаях компьютерное устройство 501 может представлять собой серверное компьютерное устройство, связанное с пользовательским
компьютерным устройством, выполненным с возможностью передачи серверному компьютерному устройству 501 команды или команд, побуждающих процессор или процессоры 5011 серверного компьютерного устройства выполнять код
программы, который при выполнении процессором или процессорами серверного компьютерного устройства 5011 побуждает процессор или процессоры 5011 серверного компьютерного устройства выполнять действия какого-либо из описанных ранее способов преобразования структурированного массива данных. Пользовательское компьютерное устройство 502 может представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет, тонкий клиент и тому подобное. Пользовательское компьютерное устройство 502 может быть связано с серверным компьютерным устройством 501 посредством проводного или беспроводного соединения. Упомянутая память 5012 компьютерного устройства 501 (серверного компьютерного устройства 501) содержит подлежащие
преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, а также может содержать любую из описанных ранее исходных структур данных для какого-либо из описанных ранее способов преобразования структурированного массива данных. Более того, подлежащие преобразованию один или несколько
структурированных массивов данных могут являться загружаемыми и храниться, в частности, в базе данных 503 системы преобразования структурированного массива данных. В качестве примера, но не ограничения, машиночитаемый носитель данных (память 5012) может включать в себя оперативную память (RAM); постоянное запоминающее устройство (ROM); электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM); флэш-память или другие технологии памяти; CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для кодирования требуемой
информации, и к которому может быть осуществлен доступ посредством
устройства 501. Память включает в себя носитель данных на основе
запоминающего устройства компьютера в форме энергозависимой или энергонезависимой памяти, или их комбинации. Примерные аппаратные устройства включают в себя твердотельную память, накопители на жестких дисках, накопители на оптических дисках и так далее. В памяти хранится
примерная среда, в которой при помощи компьютерных команд или кодов, хранящихся в памяти устройства, может быть осуществлена процедура
преобразования структурированного массива данных. Устройство содержит один или более процессоров 5011, которые предназначены для выполнения
компьютерных команд или кодов, хранящихся в памяти устройства с целью обеспечения выполнения процедуры преобразования структурированного массива данных. Компьютерные команды или коды, хранящиеся в памяти, предназначены для выполнения преобразования структурированного массива данных. Система 500 также может включать в себя базу данных (БД) 503. БД 503 может
представлять собой, но не ограничиваясь: иерархическую БД, сетевую БД, реляционную БД, объектную БД, объектно-ориентированную БД, объектно- реляционную БД, пространственную БД, комбинацию перечисленных двух и более БД, и тому подобное. БД 503 хранит данные в памяти, которая может представлять собой, но не ограничиваясь: постоянное запоминающее устройство (ROM), электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для хранения требуемой информации, и к которому может быть осуществлен доступ посредством устройства 501 преобразования структурированного массива данных. БД 503 служит для хранения данных, представляющих собой, по меньшей мере, команды для выполнения этапов описанных ранее способов преобразования структурированного массива данных; подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, или одну из описанных ранее исходных для какого-либо способа преобразования структур данных, которые могут быть загружены в память 5012 устройства 501 преобразования структурированного массива данных; и других данных,
необходимых для функционирования системы. Примерная система 500
преобразования структурированного массива данных дополнительно может содержать серверное компьютерное устройство 501, которое помимо описанных ранее функций, сохраняет и содействует манипуляции компьютерными командами или кодами, ранее описанными в данном документе, которые, соответственно, дополнительно не описываются. Серверное компьютерное устройство 501, помимо описанных ранее функций, может обеспечивает регулирование обменом данных в системе 500 преобразования структурированного массива данных, а также обеспечивает обработку данных при условии подключения к нему одного или более чем одного пользовательских компьютерных устройств 502. В этом случае все вычислительные мощности, необходимые для обеспечения выполнения процедуры преобразования структурированного массива данных, расположены на серверном компьютерном устройстве 501. Система 500 так же может содержать одну или более сетей 504 передачи данных. 5ети 204 передачи данных могут включать в себя, но не ограничиваться, одну или более локальных сетей (LAN) и/или глобальных сетей (WAN), или могут представлять собой информационно- телекоммуникационную сеть Интернет, или Интранет, или виртуальную частную сеть (VPN), или их комбинацию, и тому подобное. Серверное компьютерное устройство 501 также имеет возможность обеспечивать виртуальную
вычислительную среду (Virtual Machine) для обеспечения взаимодействия между пользовательским компьютерным устройством 502 и БД 503. Сеть 504 служит для обеспечения взаимодействия между компьютерным устройством 501, базой данных 503 и пользовательским компьютерным устройством 502 системы 500 преобразования структурированного массива данных. При этом пользовательское компьютерное устройство 502 может быть связано с серверным компьютерным устройством 501 напрямую, используя известные из уровня техники проводные и беспроводные способы и методы связи, которые, соответственно, далее не подробно не описываются.

Claims

Формула изобретения
1. Выполняемый процессором компьютерного устройства способ
преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и идентификационные данные СЕ лингвистического предложения,
характеризующийся выполнением этапов:
этапа 201 идентификации исходной структуры данных, содержащей СЕ, на котором идентифицируют структуру данных СМД, содержащую СЕ и
идентификационные данные СЕ;
этапа 104 формирования следующей структуры данных, на котором формируют следующую структуру данных СМД, содержащую элементы
упомянутой следующей структуры данных, причем упомянутые элементы следующей структуры данных представляют собой лингвистические объекты (ЛО) лингвистического предложения, сформированные путем их отождествления с упомянутыми синтаксическими единицами, либо полученные в результате преобразования упомянутых синтаксических единиц, а также представляют собой идентификационные данные лингвистических объектов (идентификационные данные ЛО), представляющие собой для каждого ЛО, по меньшей мере: значение лингвистического объекта (значение ЛО) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ЛО; этапа 105 формирования заключительной структуры данных, на котором формируют заключительной структуру данных СМД, содержащую элементы упомянутой заключительной структуры данных, причем упомянутые элементы заключительной структуры данных представляют собой логические объекты (ЛогО) лингвистического предложения, сформированные посредством корреляции лингвистических и логических объектов и отождествленные с упомянутыми лингвистическими объектами, а также представляют собой идентификационные данные логических объектов (идентификационные данные ЛогО),
представляющие собой для каждого ЛогО, по меньшей мере: значение логического объекта (значение ЛогО) и порядковый (порядковые) номер (номера) ТЭ
лингвистического предложения, составляющего (составляющих) ЛогО.
2. Способ по п. 1, характеризующийся тем, что в рамках этапа 201
идентифицируют элементы пригодной для преобразования структуры данных,
98
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) содержащей СЕ, а также идентификационные данные СЕ, представляющие собой для каждой СЕ, по меньшей мере: значение СЕ и порядковый (порядковые) номер (номера) текстовых элементов лингвистического предложения, составляющего (составляющих) СЕ.
3. Способ по п. 2, характеризующийся тем, что этап 104 характеризуется выполнением этапов:
этапа 1041 идентификации первого элемента третьей структуры данных СМД, на котором идентифицируют или формируют первые ЛО, а также
идентификационные данные первых ЛО, представляющие собой для каждого первого ЛО, по меньшей мере: значение первого ЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего
(составляющих) первый ЛО;
этапа 1042 формирования второго элемента третьей структуры данных СМД, на котором формируют вторые ЛО, а также идентификационные данные вторых ЛО, представляющие собой для каждого второго ЛО, по меньшей мере: значение второго ЛО и порядковый (порядковые) номер (номера) ТЭ
лингвистического предложения, составляющего (составляющих) второй ЛО;
этапа 1043 формирования третьей структуры данных СМД, на котором формируют третью структуру данных СМД путем объединения
идентифицированных и (или) сформированных первых ЛО и вторых ЛО, и их идентификационных данных.
4. Способ по п. 3, характеризующийся тем, что в рамках этапа 1041 идентификацию или формирование первого ЛО производят путем анализа состава искомых ЛО, при этом состав искомых ЛО предварительно задают в виде СЕ уникального наименования или списка СЕ уникальных наименований с указанием способа формирования ЛО, которым, не ограничиваясь, может быть один из следующих способов: отождествление с установленным (несколькими
установленными) СЕ или преобразование установленного (установленных) СЕ, причем СЕ уникального наименования или список СЕ уникальных наименований, равно как и способ формирования ЛО, предварительно устанавливаются или записываются во вторую пользовательскую базу данных.
5. Способ по п. 3, характеризующийся тем, что в рамках этапа 1042
формирование второго ЛО производят путем преобразования СЕ, предварительно заданных в описании искомых ЛО вида «второй ЛО» по предварительно заданному
99
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) способу преобразования во второй пользовательской базе данных.
6. Способ по п.З, характеризующийся тем, что в рамках этапа 1041
идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ первого производят следующим образом: значение (значения) первых СЕ или вторых СЕ лингвистического предложения, отождествленных с первым ЛО идентифицируют как значение первого ЛО; а порядковый (порядковые) номер (номера) ТЭ первых СЕ или вторых СЕ, отождествленных с первым ЛО
идентифицируют как порядковый (порядковые) номер (номера) текстового (текстовых) элемента (элементов), составляющего (составляющих) первый ЛО, при этом если формирование первого ЛО производят согласно требованиям второй пользовательской базы данных путем объединения нескольких СЕ, то к значениям и номерам ТЭ первого ЛО добавляют значения и порядковые номера ТЭ служебных частей речи (предлоги, союзы, частицы) и знаки препинания, находящиеся между объединяемыми СЕ.
7. Способ по п. 3, характеризующийся тем, что в рамках этапа 1042
идентификацию значения и порядкового (порядковых) номеров ТЭ второго ЛО производят следующим образом: значение (значения) преобразованных СЕ, формируемых из первых СЕ и (или) вторых СЕ, отождествленного
(отождествленных) со вторым ЛО, идентифицируют как значение второго ЛО, а порядковый (порядковые) номер (номера) преобразованных СЕ, формируемых из первых СЕ и (или) вторых СЕ, отождествленного (отождествленных) со вторым ЛО идентифицируют как порядковый (порядковые) номер (номера) текстового (текстовых) элемента (элементов), составляющего (составляющих) второй ЛО.
8. Способ по п. 3, характеризующийся тем, что в рамках этапа 1043
формирование третьей структуры данных СМД в ходе этапа 1043 производят путем объединения в одной структуре данных первых ЛО и вторых ЛО, а также их идентификационных данных.
9. Способ по п. 2, характеризующийся тем, что в рамках этапа 105
формирование ЛогО производят с помощью третьей структуры данных СМД, содержащей ЛО и базы данных корреляции лингвистических и логических объектов, представляющей собой предварительно формируемую третью
пользовательскую базу данных.
10. Способ по п. 9, характеризующийся тем, что третья пользовательская база данных представляет собой перечень необходимых ЛогО, которые могут быть
100
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) выделены в лингвистическом предложении, и на которые оно может быть разделено, и содержит перечень ЛО уникальных наименований и описаний ЛО, которые предполагают тождественными искомым ЛогО уникальных
наименований при заранее заданных условиях.
11. Способ по п. 10, характеризующийся тем, что заранее заданным условием может быть одно из или комбинация из: указанный состав ЛО уникальных наименований и (или) указанный способ преобразования СЕ, а также указанные лингвистические характеристики СЕ.
12. Способ по любому из п.п. 9-11, характеризующийся тем, что для
формирования ЛогО, коррелированного с выбранным первым ЛО или вторым ЛО, выбирают отдельный ЛО из перечня ЛО и с помощью третьей ПБД выявляют коррелированный с ЛО уникального наименования ЛогО уникального
наименования.
13. Способ по п. 2, характеризующийся тем, что в рамках этапа 105
идентификацию значения и порядковых номеров ТЭ ЛогО производят следующим образом: значение (значения) текстового (текстовых) элемента (элементов) лингвистического предложения, составляющего (составляющих)
коррелированный с ЛогО первый ЛО или второй ЛО, идентифицируют как значение ЛогО, а порядковый (порядковые) номер (номера) упомянутого
(упомянутых) текстового (текстовых) элемента (элементов) лингвистического предложения, составляющего (составляющих) коррелированный с ЛогО первый ЛО или второй ЛО, идентифицируют как порядковый (порядковые) номер (номера) текстового (текстовых) элемента (элементов), составляющего (составляющих) ЛогО.
14. Способ по и. 2, характеризующийся тем, что формирование четвертой структуры данных СМД производят путем объединения в одной структуре данных ЛогО и их идентификационных данных.
15. Способ по любому из п.п. 1-11, 13-14, характеризующийся тем, что СЕ представляют собой одно из или комбинацию из: основные лингво-логические объекты (ОЛЛО) лингвистического предложения, исходные простые лингво- логические конструкции (ИП ЛЛК) лингвистического предложения, простые лингво-логические конструкции (ПЛЛК) лингвистического предложения, исходные сложные лингво-логические конструкции (ИС ЛЛК) лингвистического
предложения, сложные лингво-логические конструкции (СЛЛК) лингвистического
101
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) предложения, основные лингво-логические элементы (ОЛЛЭ) лингвистического предложения, исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения.
16. Способ по п. 12, характеризующийся тем, что СЕ представляют собой одно из или комбинацию из: основные лингво-логические объекты (ОЛЛО)
лингвистического предложения, исходные простые лингво-логические
конструкции (ИП ЛЛК) лингвистического предложения, простые лингво- логические конструкции (ПЛЛК) лингвистического предложения, исходные сложные лингво-логические конструкции (ИС ЛЛК) лингвистического
предложения, сложные лингво-логические конструкции (СЛЛК) лингвистического предложения, основные лингво-логические элементы (ОЛЛЭ) лингвистического предложения, исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения.
17. Способ по п. 15, характеризующийся тем, что упомянутые ОЛЛО представляют собой элементы структуры данных СМД, полученной посредством выполняемого процессором компьютерного устройства способа 200
преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и идентификационные данные СЕ лингвистического предложения,
характеризующегося выполнением этапов:
этапа 201 идентификации исходной структуры данных, содержащей СЕ, на котором идентифицируют структуру данных СМД, содержащую СЕ и
идентификационные данные СЕ;
этапа 202 формирования первой структуры данных СМД, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных СМД, причем упомянутые элементы первой структуры данных СМД представляют собой лингво-логические единицы (ЛЛЕ)
лингвистического предложения, идентифицированные и сформированные по итогам лингво-логического анализа СЕ, а также представляют собой
идентификационные данные ЛЛЕ, представляющие собой для каждого ЛЛЕ, по меньшей мере: значение ЛЛЕ и порядковый (порядковые) номер (номера) текстовых элементов (ТЭ) лингвистического предложения, составляющего
(составляющих) ЛЛЕ;
этапа 203 формирования второй структуры данных СМД, на котором
102
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры СМД, причем упомянутые элементы второй структуры данных СМД представляют собой группы лингво-логических единиц (группы ЛЛЕ) лингвистического предложения, сформированные на основании схемы
синтаксических связей ЛЛЕ в простом предложении исходного лингвистического предложения, а также представляют собой идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, по меньшей мере: значение группы ЛЛЕ и порядковые номера ТЭ лингвистического предложения,
составляющих группу ЛЛЕ;
этапа 204 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД, содержащую элементы упомянутой итоговой структуры данных СМД, причем упомянутые элементы итоговой структуры данных СМД представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения сформированные из групп ЛЛЕ путем устранения однородностей в группах ЛЛЕ, а также представляют собой
идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, по меньшей мере: значение ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ОЛЛО.
18. Способ по п. 16, характеризующийся тем, что упомянутые ОЛЛО представляют собой элементы СМД, полученной посредством выполняемого процессором компьютерного устройства способа 200 преобразования
структурированного массива данных (СМД), содержащего, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и
идентификационные данные СЕ лингвистического предложения,
характеризующегося выполнением этапов:
этапа 201 идентификации исходной структуры данных, содержащей СЕ, на котором идентифицируют структуру данных СМД, содержащую СЕ и
идентификационные данные СЕ;
этапа 202 формирования первой структуры данных СМД, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных СМД, причем упомянутые элементы первой структуры данных СМД представляют собой лингво-логические единицы (ЛЛЕ)
лингвистического предложения, идентифицированные и сформированные по итогам лингво-логического анализа СЕ, а также представляют собой
103
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) идентификационные данные ЛЛЕ, представляющие собой для каждого ЛЛЕ, по меньшей мере: значение ЛЛЕ и порядковый (порядковые) номер (номера) текстовых элементов (ТЭ) лингвистического предложения, составляющего
(составляющих) ЛЛЕ;
этапа 203 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры СМД, причем упомянутые элементы второй структуры данных СМД представляют собой группы лингво-логических единиц (группы ЛЛЕ) лингвистического предложения, сформированные на основании схемы
синтаксических связей ЛЛЕ в простом предложении исходного лингвистического предложения, а также представляют собой идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, по меньшей мере: значение группы ЛЛЕ и порядковые номера ТЭ лингвистического предложения,
составляющих группу ЛЛЕ;
этапа 204 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД, содержащую элементы упомянутой итоговой структуры данных СМД, причем упомянутые элементы итоговой структуры данных СМД представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения сформированные из групп ЛЛЕ путем устранения однородностей в группах ЛЛЕ, а также представляют собой
идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, по меньшей мере: значение ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ОЛЛО.
19. Способ по любому из п.п. 17 или 18, характеризующийся тем, что в рамках этапа 201 идентифицируют элементы пригодной для преобразования структуры данных, содержащей СЕ, а также идентификационные данные СЕ, представляющие собой для каждой СЕ, по меньшей мере: значение СЕ и порядковый (порядковые) номер (номера) текстовых элементов лингвистического предложения,
составляющего (составляющих) СЕ.
20. Способ по любому из п.п. 17 или 18, характеризующийся тем, что этап 202 характеризуется выполнением этапов:
этапа 2021 формирования значений второй части лингвистических характеристик текстовых элементов, составляющих СЕ, на котором формируют значения второй части лингвистических характеристик текстовых элементов,
104
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) составляющих СЕ и вносят полученные сведения в предварительно
сформированную базу данных лингвистических признаков (БДЛП) текстовых элементов лингвистического предложения;
этапа 2022 формирования значений третьей части лингвистических характеристик текстовых элементов, составляющих СЕ, на котором
идентифицируют виды СЕ, для которых необходимо изменить некоторые значения лингвистических характеристик, формируют упомянутые значения третьей части лингвистических характеристик текстовых элементов, составляющих СЕ, и вносят полученные сведения в БДЛП текстовых элементов лингвистического
предложения, формируемую в рамках этапа 2021;
этапа 2023 идентификации элементов второй структуры данных СМД, на котором идентифицируют и формируют ЛЛЕ, а также идентификационные данные ЛЛЕ, представляющие собой для каждой ЛЛЕ, по меньшей мере: значение ЛЛЕ и порядковый (порядковые) номер (номера) ТЭ, составляющего (составляющих)
ЛЛЕ, и формируют первую структуру данных СМД.
21. Способ по п. 20, характеризующийся тем, что в рамках этапа 2021 формирование второй части лингвистических характеристик и их значений для текстовых элементов лингвистического предложения, содержащихся в СЕ, с целью идентификации синтаксическо-логической идентичности производят путем проверки исходного синтаксического объекта на идентичность синтаксической и логической ролей в лингвистическом предложении, причем проверка представляет собой сравнение значений первой части лингвистических характеристик
текстовых элементов, составляющих СЕ, с заранее заданными значениями заранее заданных лингвистических признаков текстовых элементов, составляющих исходный синтаксический объект; при этом для проведения проверки заранее задаются условия, такие как, не ограничиваясь: перечни пар исходных
синтаксических объектов, у которых синтаксическая и логическая роли могут не совпадать, а также признаки несовпадения синтаксической и логической ролей.
22. Способ по п. 20, характеризующийся тем, что в рамках этапа 2022 формирование третьей части лингвистических характеристик и их значений для текстовых элементов лингвистического предложения, содержащихся в СЕ, с целью идентификации различных видов исходных синтаксических объектов производят по признаку синтаксическо-логической идентичности и формирования дубликата синтаксического-логически неидентичного исходного синтаксического объекта
105
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) путем комплексного анализа условий, установленных в пользовательской базе данных, и на основании итогов проверки исходного синтаксического объекта на идентичность, при этом для каждого исходного синтаксического объекта устанавливают соответствующий первый, второй, третий или четвертый вид.
23. Способ по п. 20, характеризующийся тем, что в рамках этапа 2023 идентификацию и формирование ЛЛЕ производят на основе результатов этапа 2022 по идентификации видов исходных синтаксических объектов, причем идентификацию ЛЛЕ первого вида производят путем их отождествления с исходными синтаксическими объектами первого, второго и третьего видов, а формирование ЛЛЕ второго вида производят из идентифицированных на этапе 2022 исходных синтаксических объектов четвертого вида путем их
отождествления с исходными синтаксическими объектами четвертого вида.
24. Способ по п. 20, характеризующийся тем, что в рамках этапа 2023 формирование первой структуры данных СМД производят путем объединения в одной структуре данных ЛЛЕ первого и второго видов.
25. Способ по любому из п.п. 17 или 18, характеризующийся тем, что этап 203 характеризуется выполнением этапов:
этапа 2031 формирования значений четвертой части лингвистических характеристик текстовых элементов, составляющих ЛЛЕ, на котором формируют значения четвертой части лингвистических характеристик текстовых элементов, составляющих ЛЛЕ, и вносят полученные сведения в БДЛП текстовых элементов лингвистического предложения, формируемую в рамках этапа 2022;
этапа 2032 формирования элементов второй структуры данных СМД, на котором формируют группы ЛЛЕ, а также идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, по меньшей мере: значение группы ЛЛЕ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) группу ЛЛЕ; и формируют вторую структуру данных СМД.
26. Способ по п. 25, характеризующийся тем, что в рамках этапа 2031 формирование четвертой части лингвистических характеристик и их значений для текстовых элементов лингвистического предложения, содержащихся в ЛЛЕ, с целью установления уровня синтаксической значимости ЛЛЕ производят на основании комплексного анализа значений лингвистических характеристик всех ЛЛЕ лингвистического предложения, на основе которого формируют
106
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) синтаксическое дерево лингвистического предложения, после чего в результате выяснения положения каждого ЛЛЕ в синтаксическом дереве предложения определяют уровень синтаксической значимости каждого ЛЛЕ.
27. Способ по п. 25, характеризующийся тем, что в рамках этапа 2032 идентификацию групп ЛЛЕ производят посредством идентификации главных ЛЛЕ первых и вторых групп ЛЛЕ, а также посредством идентификации прочих ЛЛЕ первых и вторых групп ЛЛЕ, при этом для идентификации главных ЛЛЕ первых групп ЛЛЕ выявляют все ЛЛЕ «сказуемое» лингвистического предложения, а для идентификации главных ЛЛЕ вторых групп ЛЛЕ выявляют все ЛЛЕ, которые имеют прямую синтаксическую связь с любой частью ЛЛЕ «сказуемое» и которые при этом имеют синтаксическую роль подлежащего или любого второстепенного члена предложения, кроме определения, за исключением определения в форме
распространенного причастия или деепричастия, а для идентификации прочих ЛЛЕ первой или второй группы ЛЛЕ выявляют все ЛЛЕ, которые имеют
непрерывную синтаксическую подчинительную связь, начиная от главного ЛЛЕ первой или второй группы ЛЛЕ и вплоть до другого идентифицированного главного ЛЛЕ первой или второй группы ЛЛЕ, или до последнего ЛЛЕ в цепочке непрерывной синтаксической подчинительной связи от главного ЛЛЕ первой или второй группы ЛЛЕ.
28. Способ по п. 25, характеризующийся тем, что в рамках этапа 2032 формирование первых групп ЛЛЕ производят путем объединения
идентифицированных главной ЛЛЕ первой группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ, а формирование вторых групп ЛЛЕ производят путем объединения идентифицированных главной ЛЛЕ второй группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ.
29. Способ по п. 25, характеризующийся тем, что в рамках этапа 2032 идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ первой группы ЛЛЕ производят следующим образом: значение (значения) ТЭ лингвистического предложения, составляющего (составляющих) ЛЛЕ, из которого (которых) состоит первая группа ЛЛЕ, идентифицируют как значение первого первой группы ЛЛЕ, а порядковый (порядковые) номер (номера) упомянутого (упомянутых) ТЭ лингвистического предложения, составляющего(составляющих) ЛЛЕ, из которого (которых) состоит первая группа ЛЛЕ, идентифицируют как порядковый (порядковые) номер (номера) ТЭ, составляющего(составляющих)
107
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) первую группу ЛЛЕ; и
идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ второй группы ЛЛЕ производят следующим образом: значение (значения) ТЭ лингвистического предложения, составляющего (составляющих) ЛЛЕ, из которого (которых) состоит вторая группа ЛЛЕ, идентифицируют как значение второй группы ЛЛЕ, а порядковый (порядковые) номер (номера) упомянутого
(упомянутых) ТЭ лингвистического предложения, составляющего (составляющих) ЛЛЕ, из которого (которых) состоит вторая группа ЛЛЕ, идентифицируют как порядковый (порядковые) номер (номера) ТЭ, составляющего (составляющих) вторую группу ЛЛЕ.
30. Способ по п. 25, характеризующийся тем, что формирование второй структуры данных СМД производят путем объединения в одной структуре данных первых и вторых групп ЛЛЕ.
31. Способ по любому из п.п. 17 или 18, характеризующийся тем, что этап 204 характеризуется выполнением этапов:
этапа 2041 идентификации видов групп ЛЛЕ, указывающих на наличие в группе ЛЛЕ осложнений лингвистического предложения, на котором
идентифицируют первые и вторые виды групп ЛЛЕ, а также идентификации непреобразованных ОЛЛО итоговой структуры данных СМД и их
идентификационных данных, представляющих собой для каждого
непреобразованного ОЛЛО, по меньшей мере: значение непреобразованного ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) непреобразованный ОЛЛО (значение и
порядковые номера ТЭ непреобразованного ОЛЛО);
этапа 2042 формирования преобразованных ОЛЛО, на котором формируют преобразованные ОЛЛО из групп ЛЛЕ второго вида, а также идентификационные данные преобразованных ОЛЛО, представляющие собой для каждого
преобразованного ОЛЛО, по меньшей мере, значение преобразованного ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) преобразованный ОЛЛО (значение и порядковые номера ТЭ преобразованного ОЛЛО);
выполнением этапа 2043 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД из преобразованных ОЛЛО и непреобразованных ОЛЛО.
108
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26)
32. Способ по п. 31, характеризующийся тем, что в рамках этапа 2041 идентификацию групп ЛЛЕ первого или второго вида производят путем анализа значений лингвистических характеристик текстовых элементов, составляющих группу ЛЛЕ, с целью идентификации синтаксических сочинительных связей в группе ЛЛЕ, при этом синтаксическую сочинительную связь между текстовыми элементами в группе ЛЛЕ идентифицируют в случае наличия у ЛЛЕ, входящих в группу ЛЛЕ, одного и того же синтаксического родителя, являющегося
синтаксически главным словом, у которого с такими ЛЛЕ имеется прямая
синтаксическая подчинительная связь, при этом при идентификации
синтаксической сочинительной связи в группе ЛЛЕ такие группы ЛЛЕ с
однородными членами идентифицируются как второй вид группы ЛЛЕ, а все иные группы ЛЛЕ, в которых не идентифицируется синтаксическая сочинительная связь, идентифицируются как первый вид группы ЛЛЕ, при этом идентифицированный первый вид группы ЛЛЕ отождествляют с непреобразованным ОЛЛО.
33. Способ по п. 31, характеризующийся тем, что в рамках этапа 2042 формирование преобразованных ОЛЛО производят на основании
идентифицированной на этапе 2041 синтаксической сочинительной связи и однородных членов путем преобразования идентифицированных групп ЛЛЕ второго вида путем гетерогенизации группы ЛЛЕ второго вида, заключающейся в устранении синтаксических однородностей в группе ЛЛЕ второго вида путем формирования из группы ЛЛЕ второго вида множества новых групп ЛЛЕ первого вида.
34. Способ по п. 33, характеризующийся тем, что в рамках этапа 2042 идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ преобразованного ОЛЛО производят следующим образом: значение (значения) ТЭ лингвистического предложения, составляющего (составляющих) группу ЛЛЕ второго вида, за исключением значения (значений) ТЭ лингвистического
предложения, составляющего (составляющих) отдельную (отдельные) часть (части) группы ЛЛЕ второго вида, которая (которые) была (были) удалена
(удалены) при гетерогенизации, и признаков связи удаленных ЛЛЕ, являющихся однородными членами, идентифицируют как значение преобразованного ОЛЛО, а порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) группу ЛЛЕ второго вида, за исключением порядкового (порядковых) номера (номеров) ТЭ лингвистического предложения,
109
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) составляющего (составляющих) отдельную (отдельные) часть (части) группы ЛЛЕ второго вида, которая (которые) была (были) удалена (удалены) при
гетерогенизации, и признаков связи удаленных ЛЛЕ, являющихся однородными членами, идентифицируют как порядковый (порядковые) номер (номера) ТЭ, составляющего (составляющих) преобразованный ОЛЛО.
35. Способ по п. 31, характеризующийся тем, что в рамках этапа 2043 формирование итоговой структуры данных СМД производят путем объединения в одной структуре данных идентифицированных на этапе 2041 и сформированных на этапе 2042 ОЛЛО, а также их идентификационных данных.
36. Способ по п. 15, характеризующийся тем, что упомянутые СЛЛК представляют собой элементы структуры данных СМД, полученной посредством выполняемого процессором компьютерного устройства способа 300
преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО лингвистического
предложения, характеризующегося выполнением этапов:
этапа 301 идентификации пригодной для преобразования структуры данных, на котором идентифицируют исходную структуру данных СМД,
содержащую ОЛЛО и их идентификационные данные;
этапа 302 формирования первой структуры данных СМД, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных СМД, причем упомянутые элементы первой структуры данных СМД представляют собой исходные простые лингво-логические
конструкции (ИП ЛЛК) лингвистического предложения, сформированные из синтаксически связанных ОЛЛО простого предложения исходного
лингвистического предложения, а также представляют собой идентификационные данные ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, по меньшей мере: значение ИП ЛЛК и порядковые номера текстовых элементов (ТЭ)
лингвистического предложения, составляющих ИП ЛЛК;
этапа 303 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД, содержащую элементы второй структуры данных СМД, причем упомянутые элементы второй структуры данных СМД представляют собой простые лингво-логические конструкции (ПЛЛК) лингвистического предложения, сформированные из ИП ЛЛК путем устранения
110
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) однородностей в ИП ЛЛК, а также представляют собой идентификационные данные ПЛЛК, представляющие собой для каждой ПЛЛК, по меньшей мере:
значение ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ПЛЛК;
этапа 304 формирования третьей структуры данных СМД, на котором формируют третью структуру данных СМД, содержащую элемент упомянутой третьей структуры данных СМД, причем упомянутый элемент третьей структуры данных СМД представляет собой исходную сложную лингво-логическую конструкцию (ИС ЛЛК) лингвистического предложения, сформированную путем объединения всех ПЛЛК с учетом синтаксических связей ПЛЛК в исходном лингвистическом предложении, а также представляет собой идентификационные данные ИС ЛЛК, представляющие собой, по меньшей мере: значение ИС ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИС ЛЛК; этапа 305 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД, содержащую элементы упомянутой итоговой структуры данных СМД, причем упомянутые элементы итоговой структуры данных СМД представляют собой сложные лингво-логические конструкции (СЛЛК) лингвистического предложения, сформированные из ИС ЛЛК путем устранения однородностей в ИС ЛЛК, а также представляют собой идентификационные данные СЛЛК, представляющие собой для каждой СЛЛК, по меньшей мере: значение СЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих СЛЛК.
37. Способ по п. 16, характеризующийся тем, что упомянутые СЛЛК представляют собой элементы структуры данных СМД, полученной посредством выполняемого процессором компьютерного устройства способа 300
преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО лингвистического
предложения, характеризующегося выполнением этапов:
этапа 301 идентификации пригодной для преобразования структуры данных, на котором идентифицируют исходную структуру данных СМД, содержащую ОЛЛО и их идентификационные данные;
этапа 302 формирования первой структуры данных СМД, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой
111
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) первой структуры данных СМД, причем упомянутые элементы первой структуры данных СМД представляют собой исходные простые лингво-логические
конструкции (ИП ЛЛК) лингвистического предложения, сформированные из синтаксически связанных ОЛЛО простого предложения исходного
лингвистического предложения, а также представляют собой идентификационные данные ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, по меньшей мере: значение ИП ЛЛК и порядковые номера текстовых элементов (ТЭ)
лингвистического предложения, составляющих ИП ЛЛК;
этапа 303 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД, содержащую элементы второй структуры данных СМД, причем упомянутые элементы второй структуры данных СМД представляют собой простые лингво-логические конструкции (ПЛЛК) лингвистического предложения, сформированные из ИП ЛЛК путем устранения однородностей в ИП ЛЛК, а также представляют собой идентификационные данные ПЛЛК, представляющие собой для каждой ПЛЛК, по меньшей мере:
значение ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ПЛЛК;
этапа 304 формирования третьей структуры данных СМД, на котором формируют третью структуру данных СМД, содержащую элемент упомянутой третьей структуры данных СМД, причем упомянутый элемент третьей структуры данных СМД представляет собой исходную сложную лингво-логическую
конструкцию (ИС ЛЛК) лингвистического предложения, сформированную путем объединения всех ПЛЛК с учетом синтаксических связей ПЛЛК в исходном лингвистическом предложении, а также представляет собой идентификационные данные ИС ЛЛК, представляющие собой, по меньшей мере: значение ИС ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИС ЛЛК; этапа 305 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД, содержащую элементы упомянутой итоговой структуры данных СМД, причем упомянутые элементы итоговой структуры данных СМД представляют собой сложные лингво-логические конструкции (СЛЛК) лингвистического предложения, сформированные из ИС ЛЛК путем устранения однородностей в ИС ЛЛК, а также представляют собой
идентификационные данные СЛЛК, представляющие собой для каждой СЛЛК, по меньшей мере: значение СЛЛК и порядковые номера ТЭ лингвистического
112
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) предложения, составляющих СЛЛК.
38. Способ по любому из п.п. 36 или 37, характеризующийся тем, что в рамках этапа 301 идентифицируют исходную структуру данных СМД, содержащую ОЛЛО, а также идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, по меньшей мере, значение ОЛЛО и порядковый (порядковые) номер
(номера) ТЭ лингвистического предложения, составляющего (составляющих)
ОЛЛО.
39. Способ по любому из п.п. 36 или 37, характеризующийся тем, что этап 302 характеризуется выполнением этапов:
этапа 3021 формирования значений пятой части лингвистических
характеристик ТЭ, составляющих ОЛЛО, на котором формируют значения пятой части лингвистических характеристик ТЭ, составляющих ОЛЛО, и вносят
полученные сведения в предварительно сформированную базу данных
лингвистических признаков (БДЛП) текстовых элементов лингвистического предложения;
этапа 3022 формирования элементов первой структуры данных СМД на котором формируют ИП ЛЛК, а также идентификационные данные элементов ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, по меньшей мере: значение ИП ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИП ЛЛК, и формируют восьмую структуру данных СМД.
40. Способ по п. 39, характеризующийся тем, что в рамках этапа 3021 формирование пятой части лингвистических характеристик ТЭ и их значений производят путем анализа существующих лингвистических признаков ОЛЛО, причем в ходе такого анализа, по меньшей мере, проводятся следующие действия: на первом этапе во всех ОЛЛО идентифицируют синтаксически главную лингво-логическую единицу (ЛЛЕ);
на втором этапе среди лингвистических признаков главных ЛЛЕ упомянутых ОЛЛО идентифицируют лингвистическую характеристику, отвечающую за синтаксическую роль синтаксически главной ЛЛЕ;
на третьем этапе проверяют значение идентифицированной
лингвистической характеристики, отвечающей за синтаксическую роль
синтаксически главной ЛЛЕ; и
если значение, являющееся синтаксической ролью синтаксически главной ЛЛЕ, является «сказуемое», то такой ОЛЛО получает значение пятой части
113
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) лингвистических характеристик «главный ОЛЛО» и является главным ОЛЛО;
если значение не является «сказуемое», то такой ОЛЛО получает значение пятой части лингвистических характеристик «зависимый ОЛЛО» и является зависимым ОЛЛО.
41. Способ по п. 39, характеризующийся тем, что в рамках этапа 3022 формирование ИП ЛЛК производят на основе результатов идентификации значений пятой части лингвистических характеристик ТЭ, составляющих ОЛЛО следующим образом:
на первом этапе выбирают главный ОЛЛО;
на втором этапе идентифицируют все подчиненные ему зависимые ОЛЛО с помощью значений пятой части лингвистических характеристик элементов ТЭ, составляющих ОЛЛО;
на третьем этапе среди идентифицированных зависимых ОЛЛО
идентифицируют такие ОЛЛО, которые имеют с выбранным ранее главным ОЛЛО прямую подчинительную связь;
на четвертом этапе формируют предварительную ИП ЛЛК, являющейся исходной ИП ЛЛК, путем объединения выбранного главного ОЛЛО и всех
идентифицированных зависимых ОЛЛО, имеющих с выбранным главным ОЛЛО прямые подчинительные связи;
на пятом этапе идентифицируют сочиненные ОЛЛО среди уже
идентифицированных зависимых ОЛЛО с помощью значений первой части лингвистических характеристик ТЭ, составляющих ОЛЛО, содержащихся БДЛП для завершения формирования ИП ЛЛК формируют запрос в БДЛП, формируемую в рамках этапа 3021 для проверки наличия признаков связи между объединяемыми ОЛЛО, и, при наличии таких признаков, получают текстовый элемент (текстовые элементы), идентифицированный (идентифицированные) как одно из (или несколько из, или комбинация из): знак препинания, союз или союзное слово, расположенные между объединяемыми ОЛЛО.
42. Способ по п. 39, характеризующийся тем, что в рамках этапа 3022 идентификацию значения и порядковых номеров ТЭ ИП ЛЛК, производят путем отождествления значения ИП ЛЛК со значениями объединяемых ОЛЛО и
значениями ТЭ, являющихся признаками связи согласно своим уникальным лингвистическим признакам, идентифицированных между объединяемыми ОЛЛО, а порядковых номеров ТЭ, составляющих ОЛЛО - с порядковыми номерами ТЭ,
114
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) составляющих объединяемые ОЛЛО и порядковыми номерами ТЭ, являющихся признаками связи, идентифицированных между объединяемыми ОЛЛО.
43. Способ по п. 39, характеризующийся тем, что в рамках этапа 3022 формирование первой структуры данных СМД производят путем объединения в одной структуре данных ИП ЛЛК и их идентификационных данных.
44. Способ по любому из п.п. 36 или 37, характеризующийся тем, что этап 303 характеризуется выполнением этапов:
этапа 3031 идентификации видов ИП ЛЛК, указывающих на наличие в ИП ЛЛК сочиненных ОЛЛО, на котором идентифицируют первые и вторые виды ИП ЛЛК, а также идентифицируют непреобразованные ПЛЛК второй структуры данных СМД и их идентификационные данные, представляющие собой для каждой непреобразованной ПЛЛК, по меньшей мере: значение непреобразованной ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих
непреобразованную ПЛЛК (значение и порядковые номера ТЭ непреобразованной ПЛЛК);
этапа 3032 формирования преобразованных ПЛЛК, на котором формируют преобразованные ПЛЛК, полученные из ИП ЛЛК второго вида, а также
идентификационные данные преобразованных ПЛЛК, представляющие собой для каждой преобразованной ПЛЛК, по меньшей мере: значение преобразованной ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих преобразованную ПЛЛК (значение и порядковые номера ТЭ преобразованной ПЛЛК);
этапа 3033 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД из преобразованных ПЛЛК и
непреобразованных ПЛЛК.
45. Способ по п. 44, характеризующийся тем, что в рамках этапа 3031 идентификацию видов ИП ЛЛК производят путем анализа значений
лингвистических характеристик текстовых элементов ИП ЛЛК с целью
идентификации синтаксических сочинительных связей в ИП ЛЛК 12, причем синтаксическую сочинительную связь между ОЛЛО в ИП ЛЛК идентифицируют в случае наличия у синтаксически главных ЛЛЕ таких ОЛЛО одного и того же синтаксического родителя, являющегося синтаксически главным словом, у которого с такой ЛЛЕ имеется прямая синтаксическая подчинительная связь, причем при идентификации синтаксической сочинительной связи между
115
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) главными ЛЛЕ двух или более ОЛЛО такие ИП ЛЛК идентифицируют как второй вид ИП ЛЛК, при этом все иные ИП ЛЛК, в которых не идентифицирована синтаксическая сочинительная связь у главной ЛЛЕ, идентифицируют как первый вид ИП ЛЛК, при этом идентифицированный первый вид ИП ЛЛК отождествляют с непреобразованной ПЛЛК второй структуры данных СМД.
46. Способ по и. 44, характеризующийся тем, что в рамках этапа 3032 формирование преобразованных ПЛЛК производят на основании
идентифицированной на этапе 3031 синтаксической сочинительной связи между ОЛЛО, входящими в ИП ЛЛК, путем преобразования ИП ЛЛК второго вида, заключающегося в гетерогенизации ИП ЛЛК, приводящей к устранению
синтаксических однородностей в ИП ЛЛК, посредством чего из ИП ЛЛК второго вида формируется множество новых ПЛЛК, идентичных по однородностям ИП ЛЛК первого вида, при этом каждая новая ПЛЛК упомянутого множества может содержать только один из упомянутых ОЛЛО с однородными членами или только одно уникальное сочетание упомянутых ОЛЛО с однородными членами разных рядов однородных членов.
47. Способ по и. 44, характеризующийся тем, что в рамках этапа 3031 идентификацию значения и порядковых номеров ТЭ непреобразованной ПЛЛК производят следующим образом: значения текстовых элементов лингвистического предложения, составляющих ИП ЛЛК первого вида, идентифицируют как значение непреобразованной ПЛЛК, а порядковые номера упомянутых текстовых элементов лингвистического предложения, составляющих ИП ЛЛК, из которого состоит непреобразованная ПЛЛК, идентифицируют как порядковые номера текстовых элементов, составляющих непреобразованную ПЛЛК.
48. Способ по и. 44, характеризующийся тем, что в рамках этапа 3032 идентификацию значения и порядковых номеров ТЭ преобразованной ПЛЛК производят следующим образом: значения текстовых элементов лингвистического предложения, составляющих ИП ЛЛК второго вида, за исключением значений текстовых элементов лингвистического предложения, составляющих отдельные части ИП ЛЛК второго вида, которые были удалены при гетерогенизации, и признаков связи удаленных ОЛЛО, являющихся однородными членами,
идентифицируют как значение преобразованной ПЛЛК, а порядковые номера текстовых элементов лингвистического предложения, составляющих ИП ЛЛК второго вида, за исключением порядковых номеров текстовых элементов
116
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) лингвистического предложения, составляющих отдельные части ИП ЛЛК второго вида, которые были удалены при гетерогенизации, и признаков связи удаленных ОЛЛО, являющихся однородными членами, идентифицируют как порядковые номера текстовых элементов, составляющих преобразованную ПЛЛК.
49. Способ по п. 44, характеризующийся тем, что в рамках этапа 3033 формирование второй структуры данных СМД производят путем объединения в одной структуре данных преобразованных и непреобразованных ПЛЛК и их идентификационных данных.
50. Способ по любому из п.п. 36 или 37, характеризующийся тем, что этап 304 характеризуется выполнением этапов:
этапа 3041 формирования значений шестой части лингвистических характеристик ТЭ, составляющих ПЛЛК, на котором формируют значения шестой части лингвистических характеристик ТЭ, составляющих ПЛЛК, и вносят полученные сведения в БДЛП текстовых элементов лингвистического
предложения, формируемую в рамках этапа 3021;
этапа 3042 идентификации видов ПЛЛК, указывающих на наличие сочиненных ПЛЛК, на котором идентифицируют первые и последующие виды ПЛЛК;
этапа 3043 идентификации структурированных ПЛЛК (СПЛЛК) как составных частей ИС ЛЛК, на котором идентифицируют СПЛЛК, а также
идентификационные данные СПЛЛК, представляющие собой для каждой СПЛЛК, по меньшей мере, значение СПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих СПЛЛК; и формируют третью структуру данных СМД путем объединения СПЛЛК как составных частей единственного элемента третьей структуры данных СМД, являющегося ИС ЛЛК.
51. Способ по п. 50, характеризующийся тем, что в рамках этапа 3041 формирование шестой части лингвистических характеристик и их значений для текстовых элементов лингвистического предложения, составляющих ПЛЛК, производят путем классификации ПЛЛК по их синтаксической роли, причем синтаксическую роль ПЛЛК отождествляют с синтаксической ролью главного ЛЛЕ в главном ОЛЛО в ПЛЛК, при этом в соответствии со значением шестой части лингвистических характеристик ТЭ, составляющих ПЛЛК, подразделяют все ПЛЛК на главные ПЛЛК и зависимые ПЛЛК, при этом в ходе анализа производят следующие действия:
117
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) на первом этапе во всех ПЛЛК идентифицируют синтаксически главную ЛЛЕ синтаксически главного ОЛЛО;
на втором этапе среди лингвистических признаков упомянутых главных ЛЛЕ упомянутой ПЛЛК идентифицируют лингвистическую характеристику,
отвечающую за синтаксическую роль упомянутой синтаксически главной ЛЛЕ, входящей в ПЛЛК;
на третьем этапе проверяют значение идентифицированной
лингвистической характеристики, отвечающей за синтаксическую роль
упомянутой синтаксически главной ЛЛЕ; и
если значение, являющееся синтаксической ролью упомянутой
синтаксически главной ЛЛЕ, входящей в ПЛЛК, является «сказуемое», то такой ПЛЛК присваивают значение шестой части лингвистических характеристик «главная ПЛЛК»;
если значение не является «сказуемое», то такой ПЛЛК присваивают значение шестой части лингвистических характеристик «зависимая ПЛЛК».
52. Способ по и. 50, характеризующийся тем, что в рамках этапа 3042 идентификацию видов ПЛЛК производят на основе результатов идентификации значений шестой части лингвистических характеристик текстовых элементов, составляющих ПЛЛК, при этом для идентификации видов ПЛЛК осуществляют следующие действия:
на первом этапе из всех ПЛЛК выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО не имеет синтаксического родителя и идентифицируют такую ПЛЛК как ПЛЛК первого вида, являющуюся обязательным элементом третьей структуры данных СМД;
на втором этапе из оставшихся ПЛЛК выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО имеет синтаксического родителя в ПЛЛК,
идентифицированной как ПЛЛК первого вида и идентифицируют такую ПЛЛК как ПЛЛК второго вида, являющуюся необязательным элементом третьей структуры данных СМД;
на третьем и последующих этапах из оставшихся ПЛЛК выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО имеет синтаксического родителя в ПЛЛК, идентифицированной как ПЛЛК второго или последующих видов и идентифицируют такую ПЛЛК как ПЛЛК третьего или последующих видов, являющуюся необязательным элементом третьей структуры данных СМД.
118
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26)
53. Способ по п. 50, характеризующийся тем, что в рамках этапа 3043 идентификация СПЛЛК как составных частей ИС ЛЛК осуществляется путем отождествления соответствующих ПЛЛК первого, второго, третьего и
последующих видов с, соответственно, СПЛЛК первого, второго, третьего и последующих уровней.
54. Способ по п. 50, характеризующийся тем, что в рамках этапа 3043 идентификацию значения и порядковых номеров ТЭ СПЛЛК производят
следующим образом: значения текстовых элементов лингвистического
предложения, составляющих соответствующую ПЛЛК соответствующего вида, идентифицируют как значение соответствующей СПЛЛК соответствующего уровня, а порядковые номера упомянутых текстовых элементов лингвистического предложения, составляющих соответствующую ПЛЛК соответствующего вида, идентифицируют как порядковые номера текстовых элементов, составляющих соответствующую СПЛЛК соответствующего уровня.
55. Способ по п. 50, характеризующийся тем, что ИС ЛЛК обязательно содержит СПЛЛК первого уровня и необязательно содержит СПЛЛК второго, третьего и последующих уровней.
56. Способ по любому из п.п. 36 или 37, характеризующийся тем, что этап 305 характеризуется выполнением этапов:
этапа 3051 идентификации видов ИС ЛЛК, указывающих на наличие в ИС ЛЛК сочиненных ПЛЛК, на котором идентифицируют первый или второй виды ИС ЛЛК, а также идентификации непреобразованных СЛЛК и их идентификационных данных, представляющих собой для каждой непреобразованной СЛЛК, по меньшей мере: значение непреобразованной СЛЛК и порядковые номера ТЭ
лингвистического предложения, составляющих непреобразованный СЛЛК;
этапа 3052 формирования преобразованных СЛЛК, на котором формируют преобразованные СЛЛК из ИС ЛЛК второго вида, а также идентификационные данные преобразованных СЛЛК, представляющие собой для каждой
преобразованной СЛЛК, по меньшей мере: значение преобразованной СЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих
преобразованные СЛЛК;
этапа 3053 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД из преобразованных СЛЛК или из непреобразованной СЛЛК.
119
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26)
57. Способ по п. 56, характеризующийся тем, что в рамках этапа 3051 идентификацию вида ИС ЛЛК производят путем анализа значений
лингвистических характеристик текстовых элементов, составляющих ИС ЛЛК, с целью идентификации синтаксических сочинительных связей между СПЛЛК, входящих в ИС ЛЛК, причем синтаксическую сочинительную связь между СПЛЛК идентифицируют в случае наличия у синтаксически главных ЛЛЕ синтаксически главных ОЛЛО таких СПЛЛК одного и того же синтаксического родителя, являющегося синтаксически главной ЛЛЕ другой СПЛЛК, у которой с ЛЛЕ в сочиненных СПЛЛК имеется прямая синтаксическая подчинительная связь, при этом при идентификации синтаксической сочинительной связи между главными ЛЛЕ главных ОЛЛО двух или более СПЛЛК такую ИС ЛЛК идентифицируют как ИС ЛЛК второго вида, а ИС ЛЛК, в которой не идентифицируют синтаксической сочинительной связи у главного ЛЛЕ главного ОЛЛО в СПЛЛК, идентифицируют как ИС ЛЛК первого вида, при этом идентифицированную ИС ЛЛК первого вида отождествляют с непреобразованной СЛЛК.
58. Способ по п. 56, характеризующийся тем, что в рамках этапа 3052, формирование преобразованных СЛЛК производят на основании
идентифицированной на этапе 3051 синтаксической сочинительной связи между СПЛЛК путем преобразования ИС ЛЛК второго вида, заключающегося в
гетерогенизации ИС ЛЛК, приводящей к устранению синтаксических
однородностей в ИС ЛЛК, посредством чего из ИС ЛЛК второго вида формируется множество новых ИС ЛЛК, идентичных по однородностям ИС ЛЛК первого вида, при этом каждая новая ИС ЛЛК упомянутого множества может содержать только одну из упомянутых СПЛЛК с однородными членами или только одно уникальное сочетание упомянутых СПЛЛК с однородными членами разных рядов однородных членов, при этом множество ИС ЛЛК, сформированных из ИС ЛЛК второго вида таким образом являются преобразованными СЛЛК.
59. Способ по п. 56, характеризующийся тем, что в рамках этапа 3051 идентификацию значения и порядковых номеров ТЭ непреобразованной СЛЛК производят следующим образом: значения текстовых элементов лингвистического предложения, составляющих ИС ЛЛК первого вида, идентифицируют как значение непреобразованной СЛЛК, а порядковые номера упомянутых текстовых элементов лингвистического предложения, составляющих ИС ЛЛК первого вида, из которого состоит непреобразованная СЛЛК, идентифицируют как порядковые номера
120
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) текстовых элементов, составляющих непреобразованную СЛЛК.
60. Способ по п. 56, характеризующийся тем, что в рамках этапа 3052 идентификацию значения и порядковых номеров ТЭ преобразованной СЛЛК производят следующим образом: значения текстовых элементов лингвистического предложения, составляющих ИС ЛЛК второго вида, за исключением значений текстовых элементов лингвистического предложения, составляющих отдельные части ИС ЛЛК второго вида, которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК, являющихся однородными членами, идентифицируют как значение 161 преобразованной СЛЛК, а порядковые номера текстовых элементов лингвистического предложения, составляющих ИС ЛЛК второго, за исключением порядковых номеров текстовых элементов
лингвистического предложения, составляющих отдельные части ИС ЛЛК второго вида, которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК, являющихся однородными членами идентифицируют как порядковые номера текстовых элементов, составляющих преобразованную СЛЛК.
61. Способ по и. 56, характеризующийся тем, что в рамках этапа 3053 формирование итоговой структуры данных СМД производят путем объединения в одной структуре данных, преобразованных СЛЛК и непреобразованной СЛЛК, а также их идентификационных данных.
62. Способ по и. 15, характеризующийся тем, что упомянутые ИЛЛЭ представляют собой элементы структуры данных СМД, полученной посредством выполняемого процессором компьютерного устройства способа 400
преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО лингвистического
предложения, характеризующегося выполнением этапов:
этапа 301 идентификации пригодной для преобразования структуры данных, на котором идентифицируют исходную структуру данных СМД,
содержащую ОЛЛО и их идентификационные данные;
этапа 402 формирования первой структуры данных СМД, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных СМД, причем упомянутые элементы первой структуры данных СМД представляют собой основные лингво-логические элементы (ОЛЛЭ) лингвистического предложения, сформированные путем разделения ОЛЛО на
121
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) семантические части ОЛЛО, а также представляют собой идентификационные данные ОЛЛЭ, представляющие собой для каждого ОЛЛЭ, по меньшей мере:
значение ОЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих ОЛЛЭ;
этапа 403 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД, содержащую элементы упомянутой итоговой структуры данных СМД, причем упомянутые элементы итоговой структуры данных СМД представляют собой исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения, сформированные путем разделения ОЛЛЭ на семантические части ОЛЛЭ и формирования из них исходных элементов, а также представляют собой идентификационные данные ИЛЛЭ, представляющие собой для каждого ИЛЛЭ, по меньшей мере: значение ИЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ИЛЛЭ.
63. Способ по п. 16, характеризующийся тем, что упомянутые ИЛЛЭ представляют собой элементы структуры данных СМД, полученной посредством выполняемого процессором компьютерного устройства способа 400
преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО лингвистического
предложения, характеризующегося выполнением этапов:
этапа 301 идентификации пригодной для преобразования структуры данных, на котором идентифицируют исходную структуру данных СМД, содержащую ОЛЛО и их идентификационные данные;
этапа 402 формирования первой структуры данных СМД, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных СМД, причем упомянутые элементы первой структуры данных СМД представляют собой основные лингво-логические элементы (ОЛЛЭ) лингвистического предложения, сформированные путем разделения ОЛЛО на семантические части ОЛЛО, а также представляют собой идентификационные данные ОЛЛЭ, представляющие собой для каждого ОЛЛЭ, по меньшей мере:
значение ОЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих ОЛЛЭ;
этапа 403 формирования итоговой структуры данных СМД, на котором
122
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) формируют итоговую структуру данных СМД, содержащую элементы упомянутой итоговой структуры данных СМД, причем упомянутые элементы итоговой структуры данных СМД представляют собой исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения, сформированные путем разделения ОЛЛЭ на семантические части ОЛЛЭ и формирования из них исходных элементов, а также представляют собой идентификационные данные ИЛЛЭ, представляющие собой для каждого ИЛЛЭ, по меньшей мере: значение ИЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ИЛЛЭ.
64. Способ по любому из п.п. 62 или 63, характеризующийся тем, что в рамках этапа 301 идентифицируют исходную структуру данных СМД, содержащую ОЛЛО, а также идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, по меньшей мере, значение ОЛЛО и порядковый (порядковые) номер
(номера) ТЭ лингвистического предложения, составляющего (составляющих)
ОЛЛО.
65. Способ по любому из п.п. 62 или 63, характеризующийся тем, что этап 402 характеризуется выполнением этапов:
этапа 4021 формирования значений седьмой части лингвистических характеристик текстовых элементов (ТЭ), составляющих ОЛЛО, на котором формируют значения седьмой части лингвистических характеристик ТЭ, составляющих ОЛЛО и вносят полученные сведения в предварительно
сформированную базу данных лингвистических признаков текстовых элементов лингвистического предложения;
этапа 4022 формирования семантических частей ОЛЛО, на котором формируют первую и последующие семантические части ОЛЛО, проясняющие смысловую структуру ОЛЛО;
этапа 4023 формирования первой структуры данных СМД, на котором идентифицируют ОЛЛЭ, а также идентификационные данные ОЛЛЭ,
представляющие собой для каждого ОЛЛЭ, по меньшей мере: значение ОЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ОЛЛЭ, и формируют первую структуру данных СМД.
66. Способ по п. 65, характеризующийся тем, что в рамках этапа 4021 формирование седьмой части лингвистических характеристик и их значений
123
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов, входящих в ОЛЛО, при этом в ходе такого анализа у всех текстовых элементов, составляющих ОЛЛО проверяют наличие признака главного слова семантической части ОЛЛО, при этом таким признаком может являться, по меньшей мере, наличие у ТЭ следующих значений
лингвистических характеристик: ТЭ является главным словом ОЛЛО или ТЭ имеет зависимый ТЭ в форме предлога, при этом при наличии у ТЭ указанных значений лингвистических характеристик формируют соответствующие значения седьмой части лингвистических характеристик для такого ТЭ, и такой ТЭ является главным словом семантической части ОЛЛО.
67. Способ по п. 65, характеризующийся тем, что в рамках этапа 4022 формирование семантических частей ОЛЛО производят путем выполнения следующих действий:
на первом этапе, в зависимости от идентифицированного главного слова семантической части ОЛЛО, идентифицируют все синтаксически подчиненные слова вплоть до слова, которое само является главным словом семантической части ОЛЛО, но не включая данное слово;
на втором этапе из главного слова семантической части ОЛЛО и всех упомянутых синтаксически подчиненных слов, в том числе последовательно подчиненных, формируют семантическую часть ОЛЛО; причем
порядковый номер семантической части в ОЛЛО указывает на ее
семантическую роль в ОЛЛО и формируется в соответствии с порядковым номером текстового элемента главного слова семантической части ОЛЛО; причем
семантическая часть ОЛЛО с наименьшим порядковым номером ТЭ главного слова является первой семантической частью ОЛЛО; причем
семантическая часть ОЛЛО, имеющая ближайший к первому номер ТЭ главного слова семантической части, является второй семантической частью ОЛЛО и так далее.
68. Способ по п. 65, характеризующийся тем, что в рамках этапа 4023 идентификацию ОЛЛЭ производят на основе результатов выполнения этапа 4022, при этом все сформированные семантические части ОЛЛО отождествляют с ОЛЛЭ.
69. Способ по п. 65, характеризующийся тем, что в рамках этапа 4023 идентификацию значения и порядковых номеров ТЭ, составляющих ОЛЛЭ, производят путем отождествления значения ОЛЛЭ со значениями
124
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) идентифицированной семантической части ОЛЛО, а порядковых номеров текстовых элементов, составляющих ОЛЛЭ - путем отождествления с порядковыми номерами текстовых элементов, составляющих идентифицированную
семантическую часть ОЛЛЭ.
70. Способ по п. 65, характеризующийся тем, что в рамках этапа 4023 формирование первой структуры данных СМД производят путем объединения в одной структуре данных ОЛЛЭ и их идентификационных данных.
71. Способ по любому из п.п. 62 или 63, характеризующийся тем, что этап 403 характеризуется выполнением этапов:
этапа 4031 формирования значений восьмой части лингвистических характеристик ТЭ, составляющих ОЛЛЭ, на котором формируют значения восьмой части лингвистических характеристик ТЭ, составляющих ОЛЛЭ, и вносят
полученные сведения в БДЛП текстовых элементов лингвистического
предложения 11, формируемую в рамках этапа 4021;
этапа 4032 формирования семантических частей ОЛЛЭ, на котором
формируют первую и последующие семантические части ОЛЛЭ, проясняющие смысловую структуру ОЛЛЭ;
выполнением этапа 4033 формирования ИЛЛЭ, на котором формируют ИЛЛЭ и идентификационные данные ИЛЛЭ, представляющие собой, по меньшей мере: значения ИЛЛЭ, порядковые номера ТЭ лингвистического предложения,
составляющих ИЛЛЭ, а также идентифицируют первые и вторые виды ИЛЛЭ и формируют итоговую структуру данных СМД.
72. Способ по п. 71, характеризующийся тем, что в рамках этапа 4031 формирование восьмой части лингвистических характеристик и их значений производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов, входящих в ОЛЛЭ, причем в ходе такого анализа у всех текстовых элементов, составляющих ОЛЛЭ проверяют наличие признака главного слова семантической части ОЛЛЭ, причем признаком главного слова семантической части ОЛЛЭ является, по меньшей мере, наличие у текстового элемента следующих значений лингвистических характеристик: ТЭ является главным словом ОЛЛЭ или ТЭ имеет форму существительного, местоимения или глагола (в любой грамматической форме); при этом при наличии у ТЭ указанных значений лингвистических характеристик формируют соответствующие значения восьмой части лингвистических характеристик и такой ТЭ является главным
125
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) словом семантической части ОЛЛЭ.
73. Способ по и. 71, характеризующийся тем, что в рамках этапа 4032 формирование семантических частей ОЛЛЭ производят путем выполнения следующих действий:
на первом этапе, в зависимости от идентифицированного главного слова ОЛЛЭ, идентифицируют все синтаксически подчиненные слова, вплоть до слова, которое само является главным словом семантической части ОЛЛЭ, но не включая данное слово;
на втором этапе из главного слова семантической части ОЛЛЭ и всех упомянутых синтаксически подчиненных слов, в том числе последовательно подчиненных, формируют семантическую часть ОЛЛЭ; причем
порядковый номер семантической части в ОЛЛЭ, указывает на ее
семантическую роль в ОЛЛЭ и формируется в соответствии с порядковым номером текстового элемента главного слова семантической части ОЛЛЭ; причем
семантическая часть ОЛЛЭ с наименьшим номером ТЭ главного слова является первой семантической частью ОЛЛЭ; причем
семантическая часть ОЛЛЭ, имеющая ближайший к первому номер ТЭ главного слова семантической части, является второй семантической частью ОЛЛЭ и так далее.
74. Способ по и. 71, характеризующийся тем, что в рамках этапа 4033 формирование ИЛЛЭ и идентификацию первых и вторых видов ИЛЛЭ производят на основе результатов выполнения этапа 4032 следующим образом:
на первом этапе все значимые части речи в семантических частях ОЛЛЭ отождествляют с ИЛЛЭ;
на втором этапе упомянутые идентифицированные главные слова семантических частей ОЛЛЭ отождествляют с ИЛЛЭ первого вида;
на третьем этапе все остальные ИЛЛЭ данной семантической части, кроме ИЛЛЭ первого вида отождествляют с ИЛЛЭ второго вида.
75. Способ по и. 71, характеризующийся тем, что в рамках этапа 4033 идентификация значения и порядкового (порядковых) номера (номеров) ТЭ, составляющих ИЛЛЭ, производят путем отождествления значения ИЛЛЭ со значением (значениями) текстового (текстовых) элемента (элементов)
лингвистического предложения, составляющего (составляющих) ИЛЛЭ, а порядковый (порядковые) номер (номера) текстового (текстовых) элемента
126
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) (элементов), составляющего (составляющих) ИЛЛЭ - путем отождествления с порядковым (порядковыми) номером (номерами) текстового (текстовых) элемента (элементов), составляющего (составляющих) ИЛЛЭ.
76. Способ по п. 71, характеризующийся тем, что в рамках этапа 4033 формирование итоговой структуры данных СМД производят путем объединения в одной структуре данных ИЛЛЭ первого и второго видов, а также их
77. Выполняемый процессором компьютерного устройства способ формирования структуры данных СМД, содержащей ОЛЛО лингвистического предложения и идентификационные данные ОЛЛО, характеризующийся выполнением этапов:
этапа 201 идентификации исходной структуры данных, содержащей СЕ, на котором идентифицируют структуру данных СМД, содержащую СЕ и
идентификационные данные СЕ;
этапа 202 формирования первой структуры данных СМД, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных СМД, причем упомянутые элементы первой структуры данных СМД представляют собой лингво-логические единицы (ЛЛЕ)
лингвистического предложения, идентифицированные и сформированные по итогам лингво-логического анализа СЕ, а также представляют собой
идентификационные данные ЛЛЕ, представляющие собой для каждого ЛЛЕ, по меньшей мере: значение ЛЛЕ и порядковый (порядковые) номер (номера) текстовых элементов (ТЭ) лингвистического предложения, составляющего (составляющих) ЛЛЕ;
этапа 203 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры СМД, причем упомянутые элементы второй структуры данных СМД представляют собой группы лингво-логических единиц (группы ЛЛЕ) лингвистического предложения, сформированные на основании схемы
синтаксических связей ЛЛЕ в простом предложении исходного лингвистического предложения, а также представляют собой идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, по меньшей мере: значение группы ЛЛЕ и порядковые номера ТЭ лингвистического предложения,
составляющих группу ЛЛЕ;
этапа 204 формирования итоговой структуры данных СМД, на котором
127
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) формируют итоговую структуру данных СМД, содержащую элементы упомянутой итоговой структуры данных СМД, причем упомянутые элементы итоговой структуры данных СМД представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения сформированные из групп ЛЛЕ путем устранения однородностей в группах ЛЛЕ, а также представляют собой
идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, по меньшей мере: значение ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ОЛЛО.
78. Способ по п. 77, характеризующийся тем, что в рамках этапа 201 идентифицируют элементы пригодной для преобразования структуры данных, содержащей СЕ, а также идентификационные данные СЕ, представляющие собой для каждой СЕ, по меньшей мере: значение СЕ и порядковый (порядковые) номер (номера) текстовых элементов лингвистического предложения, составляющего (составляющих) СЕ.
79. Способ по п. 77, характеризующийся тем, что этап 202 характеризуется выполнением этапов:
этапа 2021 формирования значений второй части лингвистических характеристик текстовых элементов, составляющих СЕ, на котором формируют значения второй части лингвистических характеристик текстовых элементов, составляющих СЕ и вносят полученные сведения в предварительно
сформированную базу данных лингвистических признаков (БДЛП) текстовых элементов лингвистического предложения;
этапа 2022 формирования значений третьей части лингвистических характеристик текстовых элементов, составляющих СЕ, на котором
идентифицируют виды СЕ, для которых необходимо изменить некоторые значения лингвистических характеристик, формируют упомянутые значения третьей части лингвистических характеристик текстовых элементов, составляющих СЕ, и вносят полученные сведения в БДЛП текстовых элементов лингвистического
предложения, формируемую в рамках этапа 2021;
этапа 2023 идентификации элементов второй структуры данных СМД, на котором идентифицируют и формируют ЛЛЕ, а также идентификационные данные ЛЛЕ, представляющие собой для каждой ЛЛЕ, по меньшей мере: значение ЛЛЕ и порядковый (порядковые) номер (номера) ТЭ, составляющего (составляющих)
ЛЛЕ, и формируют первую структуру данных СМД.
128
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26)
80. Способ по п. 79, характеризующийся тем, что в рамках этапа 2021 формирование второй части лингвистических характеристик и их значений для текстовых элементов лингвистического предложения, содержащихся в СЕ, с целью идентификации синтаксическо-логической идентичности производят путем проверки исходного синтаксического объекта на идентичность синтаксической и логической ролей в лингвистическом предложении, причем проверка представляет собой сравнение значений первой части лингвистических характеристик
текстовых элементов, составляющих СЕ, с заранее заданными значениями заранее заданных лингвистических признаков текстовых элементов, составляющих исходный синтаксический объект; при этом для проведения проверки заранее задаются условия, такие как, не ограничиваясь: перечни пар исходных
синтаксических объектов, у которых синтаксическая и логическая роли могут не совпадать, а также признаки несовпадения синтаксической и логической ролей.
81. Способ по п. 79, характеризующийся тем, что в рамках этапа 2022 формирование третьей части лингвистических характеристик и их значений для текстовых элементов лингвистического предложения, содержащихся в СЕ, с целью идентификации различных видов исходных синтаксических объектов производят по признаку синтаксическо-логической идентичности и формирования дубликата синтаксического-логически неидентичного исходного синтаксического объекта путем комплексного анализа условий, установленных в пользовательской базе данных, и на основании итогов проверки исходного синтаксического объекта на идентичность, при этом для каждого исходного синтаксического объекта устанавливают соответствующий первый, второй, третий или четвертый вид.
82. Способ по п. 79, характеризующийся тем, что в рамках этапа 2023 идентификацию и формирование ЛЛЕ производят на основе результатов этапа 2022 по идентификации видов исходных синтаксических объектов, причем идентификацию ЛЛЕ первого вида производят путем их отождествления с исходными синтаксическими объектами первого, второго и третьего видов, а формирование ЛЛЕ второго вида производят из идентифицированных на этапе 2022 исходных синтаксических объектов четвертого вида путем их
отождествления с исходными синтаксическими объектами четвертого вида.
83. Способ по п. 79, характеризующийся тем, что в рамках этапа 2023 формирование первой структуры данных СМД производят путем объединения в одной структуре данных ЛЛЕ первого и второго видов.
129
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26)
84. Способ по п. 79, характеризующийся тем, что этап 203 характеризуется выполнением этапов:
этапа 2031 формирования значений четвертой части лингвистических характеристик текстовых элементов, составляющих ЛЛЕ, на котором формируют значения четвертой части лингвистических характеристик текстовых элементов, составляющих ЛЛЕ, и вносят полученные сведения в БДЛП текстовых элементов лингвистического предложения, формируемую в рамках этапа 2022;
этапа 2032 формирования элементов второй структуры данных СМД, на котором формируют группы ЛЛЕ, а также идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, по меньшей мере: значение группы ЛЛЕ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) группу ЛЛЕ; и формируют вторую структуру данных СМД.
85. Способ по п. 84, характеризующийся тем, что в рамках этапа 2031 формирование четвертой части лингвистических характеристик и их значений для текстовых элементов лингвистического предложения, содержащихся в ЛЛЕ, с целью установления уровня синтаксической значимости ЛЛЕ производят на основании комплексного анализа значений лингвистических характеристик всех ЛЛЕ лингвистического предложения, на основе которого формируют
синтаксическое дерево лингвистического предложения, после чего в результате выяснения положения каждого ЛЛЕ в синтаксическом дереве предложения определяют уровень синтаксической значимости каждого ЛЛЕ.
86. Способ по п. 84, характеризующийся тем, что в рамках этапа 2032 идентификацию групп ЛЛЕ производят посредством идентификации главных ЛЛЕ первых и вторых групп ЛЛЕ, а также посредством идентификации прочих ЛЛЕ первых и вторых групп ЛЛЕ, при этом для идентификации главных ЛЛЕ первых групп ЛЛЕ выявляют все ЛЛЕ «сказуемое» лингвистического предложения, а для идентификации главных ЛЛЕ вторых групп ЛЛЕ выявляют все ЛЛЕ, которые имеют прямую синтаксическую связь с любой частью ЛЛЕ «сказуемое» и которые при этом имеют синтаксическую роль подлежащего или любого второстепенного члена предложения, кроме определения, за исключением определения в форме
распространенного причастия или деепричастия, а для идентификации прочих ЛЛЕ первой или второй группы ЛЛЕ выявляют все ЛЛЕ, которые имеют
непрерывную синтаксическую подчинительную связь, начиная от главного ЛЛЕ
130
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) первой или второй группы ЛЛЕ и вплоть до другого идентифицированного главного ЛЛЕ первой или второй группы ЛЛЕ, или до последнего ЛЛЕ в цепочке непрерывной синтаксической подчинительной связи от главного ЛЛЕ первой или второй группы ЛЛЕ.
87. Способ по п. 84, характеризующийся тем, что в рамках этапа 2032 формирование первых групп ЛЛЕ производят путем объединения
идентифицированных главной ЛЛЕ первой группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ, а формирование вторых групп ЛЛЕ производят путем объединения идентифицированных главной ЛЛЕ второй группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ.
88. Способ по п. 84, характеризующийся тем, что в рамках этапа 2032 идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ первой группы ЛЛЕ производят следующим образом: значение (значения) ТЭ лингвистического предложения, составляющего (составляющих) ЛЛЕ, из которого (которых) состоит первая группа ЛЛЕ, идентифицируют как значение первого первой группы ЛЛЕ, а порядковый (порядковые) номер (номера) упомянутого (упомянутых) ТЭ лингвистического предложения, составляющего(составляющих) ЛЛЕ, из которого (которых) состоит первая группа ЛЛЕ, идентифицируют как порядковый (порядковые) номер (номера) ТЭ, составляющего(составляющих) первую группу ЛЛЕ; и
идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ второй группы ЛЛЕ производят следующим образом: значение (значения) ТЭ лингвистического предложения, составляющего (составляющих) ЛЛЕ, из которого (которых) состоит вторая группа ЛЛЕ, идентифицируют как значение второй группы ЛЛЕ, а порядковый (порядковые) номер (номера) упомянутого
(упомянутых) ТЭ лингвистического предложения, составляющего (составляющих) ЛЛЕ, из которого (которых) состоит вторая группа ЛЛЕ, идентифицируют как порядковый (порядковые) номер (номера) ТЭ, составляющего (составляющих) вторую группу ЛЛЕ.
89. Способ по п. 84, характеризующийся тем, что формирование второй структуры данных СМД производят путем объединения в одной структуре данных первых и вторых групп ЛЛЕ.
90. Способ по п. 77, характеризующийся тем, что этап 204 характеризуется выполнением этапов:
131
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) этапа 2041 идентификации видов групп ЛЛЕ, указывающих на наличие в группе ЛЛЕ осложнений лингвистического предложения, на котором
идентифицируют первые и вторые виды групп ЛЛЕ, а также идентификации непреобразованных ОЛЛО итоговой структуры данных СМД и их
идентификационных данных, представляющих собой для каждого
непреобразованного ОЛЛО, по меньшей мере: значение непреобразованного ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) непреобразованный ОЛЛО (значение и
порядковые номера ТЭ непреобразованного ОЛЛО);
этапа 2042 формирования преобразованных ОЛЛО, на котором формируют преобразованные ОЛЛО из групп ЛЛЕ второго вида, а также идентификационные данные преобразованных ОЛЛО, представляющие собой для каждого
преобразованного ОЛЛО, по меньшей мере, значение преобразованного ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) преобразованный ОЛЛО (значение и порядковые номера ТЭ преобразованного ОЛЛО);
выполнением этапа 2043 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД из преобразованных ОЛЛО и непреобразованных ОЛЛО.
91. Способ по п. 90, характеризующийся тем, что в рамках этапа 2041 идентификацию групп ЛЛЕ первого или второго вида производят путем анализа значений лингвистических характеристик текстовых элементов, составляющих группу ЛЛЕ, с целью идентификации синтаксических сочинительных связей в группе ЛЛЕ, при этом синтаксическую сочинительную связь между текстовыми элементами в группе ЛЛЕ идентифицируют в случае наличия у ЛЛЕ, входящих в группу ЛЛЕ, одного и того же синтаксического родителя, являющегося
синтаксически главным словом, у которого с такими ЛЛЕ имеется прямая
синтаксическая подчинительная связь, при этом при идентификации
синтаксической сочинительной связи в группе ЛЛЕ такие группы ЛЛЕ с
однородными членами идентифицируются как второй вид группы ЛЛЕ, а все иные группы ЛЛЕ, в которых не идентифицируется синтаксическая сочинительная связь, идентифицируются как первый вид группы ЛЛЕ, при этом идентифицированный первый вид группы ЛЛЕ отождествляют с непреобразованным ОЛЛО.
92. Способ по п. 90, характеризующийся тем, что в рамках этапа 2042
132
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) формирование преобразованных ОЛЛО производят на основании
идентифицированной на этапе 2041 синтаксической сочинительной связи и однородных членов путем преобразования идентифицированных групп ЛЛЕ второго вида путем гетерогенизации группы ЛЛЕ второго вида, заключающейся в устранении синтаксических однородностей в группе ЛЛЕ второго вида путем формирования из группы ЛЛЕ второго вида множества новых групп ЛЛЕ первого вида.
93. Способ по п. 90, характеризующийся тем, что в рамках этапа 2042 идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ преобразованного ОЛЛО производят следующим образом: значение (значения) ТЭ лингвистического предложения, составляющего (составляющих) группу ЛЛЕ второго вида, за исключением значения (значений) ТЭ лингвистического предложения, составляющего (составляющих) отдельную (отдельные) часть (части) группы ЛЛЕ второго вида, которая (которые) была (были) удалена
(удалены) при гетерогенизации, и признаков связи удаленных ЛЛЕ, являющихся однородными членами, идентифицируют как значение преобразованного ОЛЛО, а порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) группу ЛЛЕ второго вида, за исключением порядкового (порядковых) номера (номеров) ТЭ лингвистического предложения, составляющего (составляющих) отдельную (отдельные) часть (части) группы ЛЛЕ второго вида, которая (которые) была (были) удалена (удалены) при
гетерогенизации, и признаков связи удаленных ЛЛЕ, являющихся однородными членами, идентифицируют как порядковый (порядковые) номер (номера) ТЭ, составляющего (составляющих) преобразованный ОЛЛО.
94. Способ по п. 90, характеризующийся тем, что в рамках этапа 2043 формирование итоговой структуры данных СМД производят путем объединения в одной структуре данных идентифицированных на этапе 2041 и сформированных на этапе 2042 ОЛЛО, а также их идентификационных данных.
95. Выполняемый процессором компьютерного устройства способ формирования структуры данных СМД, содержащей СЛЛК лингвистического предложения и идентификационные данные СЛЛК, характеризующийся выполнением этапов:
этапа 301 идентификации пригодной для преобразования структуры данных, на котором идентифицируют исходную структуру данных СМД,
133
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) содержащую ОЛЛО и их идентификационные данные, причем такой структурой данных является структура данных, полученная посредством способа по любому из п.п. 77-94;
этапа 302 формирования первой структуры данных СМД, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных СМД, причем упомянутые элементы первой структуры данных СМД представляют собой исходные простые лингво-логические
конструкции (ИП ЛЛК) лингвистического предложения, сформированные из синтаксически связанных ОЛЛО простого предложения исходного
лингвистического предложения, а также представляют собой идентификационные данные ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, по меньшей мере: значение ИП ЛЛК и порядковые номера текстовых элементов (ТЭ)
лингвистического предложения, составляющих ИП ЛЛК;
этапа 303 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД, содержащую элементы второй структуры данных СМД, причем упомянутые элементы второй структуры данных СМД представляют собой простые лингво-логические конструкции (ПЛЛК) лингвистического предложения, сформированные из ИП ЛЛК путем устранения однородностей в ИП ЛЛК, а также представляют собой идентификационные данные ПЛЛК, представляющие собой для каждой ПЛЛК, по меньшей мере:
значение ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ПЛЛК;
этапа 304 формирования третьей структуры данных СМД, на котором формируют третью структуру данных СМД, содержащую элемент упомянутой третьей структуры данных СМД, причем упомянутый элемент третьей структуры данных СМД представляет собой исходную сложную лингво-логическую
конструкцию (ИС ЛЛК) лингвистического предложения, сформированную путем объединения всех ПЛЛК с учетом синтаксических связей ПЛЛК в исходном лингвистическом предложении, а также представляет собой идентификационные данные ИС ЛЛК, представляющие собой, по меньшей мере: значение ИС ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИС ЛЛК; этапа 305 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД, содержащую элементы упомянутой итоговой структуры данных СМД, причем упомянутые элементы итоговой
134
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) структуры данных СМД представляют собой сложные лингво-логические конструкции (СЛЛК) лингвистического предложения, сформированные из ИС ЛЛК путем устранения однородностей в ИС ЛЛК, а также представляют собой
идентификационные данные СЛЛК, представляющие собой для каждой СЛЛК, по меньшей мере: значение СЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих СЛЛК.
96. Способ по п. 95, характеризующийся тем, что в рамках этапа 301 идентифицируют исходную структуру данных СМД, содержащую ОЛЛО, а также идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, по меньшей мере, значение ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ОЛЛО.
97. Способ по п. 95, характеризующийся тем, что этап 302 характеризуется выполнением этапов:
этапа 3021 формирования значений пятой части лингвистических
характеристик ТЭ, составляющих ОЛЛО, на котором формируют значения пятой части лингвистических характеристик ТЭ, составляющих ОЛЛО, и вносят
полученные сведения в предварительно сформированную базу данных
лингвистических признаков (БДЛП) текстовых элементов лингвистического предложения;
этапа 3022 формирования элементов первой структуры данных СМД на котором формируют ИП ЛЛК, а также идентификационные данные элементов ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, по меньшей мере: значение ИП ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИП ЛЛК, и формируют восьмую структуру данных СМД.
98. Способ по п. 97, характеризующийся тем, что в рамках этапа 3021 формирование пятой части лингвистических характеристик ТЭ и их значений производят путем анализа существующих лингвистических признаков ОЛЛО, причем в ходе такого анализа, по меньшей мере, проводятся следующие действия: на первом этапе во всех ОЛЛО идентифицируют синтаксически главную лингво-логическую единицу (ЛЛЕ);
на втором этапе среди лингвистических признаков главных ЛЛЕ упомянутых ОЛЛО идентифицируют лингвистическую характеристику, отвечающую за синтаксическую роль синтаксически главной ЛЛЕ;
на третьем этапе проверяют значение идентифицированной
135
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) лингвистической характеристики, отвечающей за синтаксическую роль синтаксически главной ЛЛЕ; и
если значение, являющееся синтаксической ролью синтаксически главной ЛЛЕ, является «сказуемое», то такой ОЛЛО получает значение пятой части лингвистических характеристик «главный ОЛЛО» и является главным ОЛЛО;
если значение не является «сказуемое», то такой ОЛЛО получает значение пятой части лингвистических характеристик «зависимый ОЛЛО» и является зависимым ОЛЛО.
99. Способ по п. 97, характеризующийся тем, что в рамках этапа 3022 формирование ИП ЛЛК производят на основе результатов идентификации значений пятой части лингвистических характеристик ТЭ, составляющих ОЛЛО следующим образом:
на первом этапе выбирают главный ОЛЛО;
на втором этапе идентифицируют все подчиненные ему зависимые ОЛЛО с помощью значений пятой части лингвистических характеристик элементов ТЭ, составляющих ОЛЛО;
на третьем этапе среди идентифицированных зависимых ОЛЛО
идентифицируют такие ОЛЛО, которые имеют с выбранным ранее главным ОЛЛО прямую подчинительную связь;
на четвертом этапе формируют предварительную ИП ЛЛК, являющейся исходной ИП ЛЛК, путем объединения выбранного главного ОЛЛО и всех идентифицированных зависимых ОЛЛО, имеющих с выбранным главным ОЛЛО прямые подчинительные связи;
на пятом этапе идентифицируют сочиненные ОЛЛО среди уже
идентифицированных зависимых ОЛЛО с помощью значений первой части лингвистических характеристик ТЭ, составляющих ОЛЛО, содержащихся БДЛП для завершения формирования ИП ЛЛК формируют запрос в БДЛП, формируемую в рамках этапа 3021 для проверки наличия признаков связи между объединяемыми ОЛЛО, и, при наличии таких признаков, получают текстовый элемент (текстовые элементы), идентифицированный (идентифицированные) как одно из (или несколько из, или комбинация из): знак препинания, союз или союзное слово, расположенные между объединяемыми ОЛЛО.
100. Способ по п. 97, характеризующийся тем, что в рамках этапа 3022 идентификацию значения и порядковых номеров ТЭ ИП ЛЛК, производят путем
136
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) отождествления значения ИП ЛЛК со значениями объединяемых ОЛЛО и
значениями ТЭ, являющихся признаками связи согласно своим уникальным лингвистическим признакам, идентифицированных между объединяемыми ОЛЛО, а порядковых номеров ТЭ, составляющих ОЛЛО - с порядковыми номерами ТЭ, составляющих объединяемые ОЛЛО и порядковыми номерами ТЭ, являющихся признаками связи, идентифицированных между объединяемыми ОЛЛО.
101. Способ по и. 97, характеризующийся тем, что в рамках этапа 3022 формирование первой структуры данных СМД производят путем объединения в одной структуре данных ИП ЛЛК и их идентификационных данных.
102. Способ по и. 95, характеризующийся тем, что этап 303 характеризуется выполнением этапов:
этапа 3031 идентификации видов ИП ЛЛК, указывающих на наличие в ИП ЛЛК сочиненных ОЛЛО, на котором идентифицируют первые и вторые виды ИП ЛЛК, а также идентифицируют непреобразованные ПЛЛК второй структуры данных СМД и их идентификационные данные, представляющие собой для каждой непреобразованной ПЛЛК, по меньшей мере: значение непреобразованной ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих
непреобразованную ПЛЛК (значение и порядковые номера ТЭ непреобразованной ПЛЛК);
этапа 3032 формирования преобразованных ПЛЛК, на котором формируют преобразованные ПЛЛК, полученные из ИП ЛЛК второго вида, а также
идентификационные данные преобразованных ПЛЛК, представляющие собой для каждой преобразованной ПЛЛК, по меньшей мере: значение преобразованной ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих преобразованную ПЛЛК (значение и порядковые номера ТЭ преобразованной ПЛЛК);
этапа 3033 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД из преобразованных ПЛЛК и
непреобразованных ПЛЛК.
103. Способ по и. 102, характеризующийся тем, что в рамках этапа 3031 идентификацию видов ИП ЛЛК производят путем анализа значений
лингвистических характеристик текстовых элементов ИП ЛЛК с целью
идентификации синтаксических сочинительных связей в ИП ЛЛК 12, причем синтаксическую сочинительную связь между ОЛЛО в ИП ЛЛК идентифицируют в
137
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) случае наличия у синтаксически главных ЛЛЕ таких ОЛЛО одного и того же синтаксического родителя, являющегося синтаксически главным словом, у которого с такой ЛЛЕ имеется прямая синтаксическая подчинительная связь, причем при идентификации синтаксической сочинительной связи между главными ЛЛЕ двух или более ОЛЛО такие ИП ЛЛК идентифицируют как второй вид ИП ЛЛК, при этом все иные ИП ЛЛК, в которых не идентифицирована синтаксическая сочинительная связь у главной ЛЛЕ, идентифицируют как первый вид ИП ЛЛК, при этом идентифицированный первый вид ИП ЛЛК отождествляют с непреобразованной ПЛЛК второй структуры данных СМД.
104. Способ по и. 102, характеризующийся тем, что в рамках этапа 3032 формирование преобразованных ПЛЛК производят на основании
идентифицированной на этапе 3031 синтаксической сочинительной связи между ОЛЛО, входящими в ИП ЛЛК, путем преобразования ИП ЛЛК второго вида, заключающегося в гетерогенизации ИП ЛЛК, приводящей к устранению
синтаксических однородностей в ИП ЛЛК, посредством чего из ИП ЛЛК второго вида формируется множество новых ПЛЛК, идентичных по однородностям ИП ЛЛК первого вида, при этом каждая новая ПЛЛК упомянутого множества может содержать только один из упомянутых ОЛЛО с однородными членами или только одно уникальное сочетание упомянутых ОЛЛО с однородными членами разных рядов однородных членов.
105. Способ по и. 102, характеризующийся тем, что в рамках этапа 3031 идентификацию значения и порядковых номеров ТЭ непреобразованной ПЛЛК производят следующим образом: значения текстовых элементов лингвистического предложения, составляющих ИП ЛЛК первого вида, идентифицируют как значение непреобразованной ПЛЛК, а порядковые номера упомянутых текстовых элементов лингвистического предложения, составляющих ИП ЛЛК, из которого состоит непреобразованная ПЛЛК, идентифицируют как порядковые номера текстовых элементов, составляющих непреобразованную ПЛЛК.
106. Способ по и. 102, характеризующийся тем, что в рамках этапа 3032 идентификацию значения и порядковых номеров ТЭ преобразованной ПЛЛК производят следующим образом: значения текстовых элементов лингвистического предложения, составляющих ИП ЛЛК второго вида, за исключением значений текстовых элементов лингвистического предложения, составляющих отдельные части ИП ЛЛК второго вида, которые были удалены при гетерогенизации, и
138
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) признаков связи удаленных ОЛЛО, являющихся однородными членами, идентифицируют как значение преобразованной ПЛЛК, а порядковые номера текстовых элементов лингвистического предложения, составляющих ИП ЛЛК второго вида, за исключением порядковых номеров текстовых элементов лингвистического предложения, составляющих отдельные части ИП ЛЛК второго вида, которые были удалены при гетерогенизации, и признаков связи удаленных ОЛЛО, являющихся однородными членами, идентифицируют как порядковые номера текстовых элементов, составляющих преобразованную ПЛЛК.
107. Способ по п. 102, характеризующийся тем, что в рамках этапа 3033 формирование второй структуры данных СМД производят путем объединения в одной структуре данных преобразованных и непреобразованных ПЛЛК и их идентификационных данных.
108. Способ по п. 95, характеризующийся тем, что этап 304 характеризуется выполнением этапов:
этапа 3041 формирования значений шестой части лингвистических характеристик ТЭ, составляющих ПЛЛК, на котором формируют значения шестой части лингвистических характеристик ТЭ, составляющих ПЛЛК, и вносят полученные сведения в БДЛП текстовых элементов лингвистического
предложения, формируемую в рамках этапа 3021;
этапа 3042 идентификации видов ПЛЛК, указывающих на наличие сочиненных ПЛЛК, на котором идентифицируют первые и последующие виды ПЛЛК;
этапа 3043 идентификации структурированных ПЛЛК (СПЛЛК) как составных частей ИС ЛЛК, на котором идентифицируют СПЛЛК, а также
идентификационные данные СПЛЛК, представляющие собой для каждой СПЛЛК, по меньшей мере, значение СПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих СПЛЛК; и формируют третью структуру данных СМД путем объединения СПЛЛК как составных частей единственного элемента третьей структуры данных СМД, являющегося ИС ЛЛК.
109. Способ по п. 108, характеризующийся тем, что в рамках этапа 3041 формирование шестой части лингвистических характеристик и их значений для текстовых элементов лингвистического предложения, составляющих ПЛЛК, производят путем классификации ПЛЛК по их синтаксической роли, причем синтаксическую роль ПЛЛК отождествляют с синтаксической ролью главного ЛЛЕ
139
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) в главном ОЛЛО в ПЛЛК, при этом в соответствии со значением шестой части лингвистических характеристик ТЭ, составляющих ПЛЛК, подразделяют все ПЛЛК на главные ПЛЛК и зависимые ПЛЛК, при этом в ходе анализа производят следующие действия:
на первом этапе во всех ПЛЛК идентифицируют синтаксически главную ЛЛЕ синтаксически главного ОЛЛО;
на втором этапе среди лингвистических признаков упомянутых главных ЛЛЕ упомянутой ПЛЛК идентифицируют лингвистическую характеристику,
отвечающую за синтаксическую роль упомянутой синтаксически главной ЛЛЕ, входящей в ПЛЛК;
на третьем этапе проверяют значение идентифицированной
лингвистической характеристики, отвечающей за синтаксическую роль
упомянутой синтаксически главной ЛЛЕ; и
если значение, являющееся синтаксической ролью упомянутой
синтаксически главной ЛЛЕ, входящей в ПЛЛК, является «сказуемое», то такой ПЛЛК присваивают значение шестой части лингвистических характеристик «главная ПЛЛК»;
если значение не является «сказуемое», то такой ПЛЛК присваивают значение шестой части лингвистических характеристик «зависимая ПЛЛК».
110. Способ по и. 108, характеризующийся тем, что в рамках этапа 3042 идентификацию видов ПЛЛК производят на основе результатов идентификации значений шестой части лингвистических характеристик текстовых элементов, составляющих ПЛЛК, при этом для идентификации видов ПЛЛК осуществляют следующие действия:
на первом этапе из всех ПЛЛК выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО не имеет синтаксического родителя и идентифицируют такую ПЛЛК как ПЛЛК первого вида, являющуюся обязательным элементом третьей структуры данных СМД;
на втором этапе из оставшихся ПЛЛК выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО имеет синтаксического родителя в ПЛЛК,
идентифицированной как ПЛЛК первого вида и идентифицируют такую ПЛЛК как ПЛЛК второго вида, являющуюся необязательным элементом третьей структуры данных СМД;
на третьем и последующих этапах из оставшихся ПЛЛК выбирают такие
140
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО имеет синтаксического родителя в ПЛЛК, идентифицированной как ПЛЛК второго или последующих видов и идентифицируют такую ПЛЛК как ПЛЛК третьего или последующих видов, являющуюся необязательным элементом третьей структуры данных СМД.
111. Способ по п. 108, характеризующийся тем, что в рамках этапа 3043 идентификация СПЛЛК как составных частей ИС ЛЛК осуществляется путем отождествления соответствующих ПЛЛК первого, второго, третьего и
последующих видов с, соответственно, СПЛЛК первого, второго, третьего и последующих уровней.
112. Способ по п. 108, характеризующийся тем, что в рамках этапа 3043 идентификацию значения и порядковых номеров ТЭ СПЛЛК производят
следующим образом: значения текстовых элементов лингвистического
предложения, составляющих соответствующую ПЛЛК соответствующего вида, идентифицируют как значение соответствующей СПЛЛК соответствующего уровня, а порядковые номера упомянутых текстовых элементов лингвистического предложения, составляющих соответствующую ПЛЛК соответствующего вида, идентифицируют как порядковые номера текстовых элементов, составляющих соответствующую СПЛЛК соответствующего уровня.
113. Способ по п. 108, характеризующийся тем, что ИС ЛЛК обязательно содержит СПЛЛК первого уровня и необязательно содержит СПЛЛК второго, третьего и последующих уровней.
114. Способ по п. 95 характеризующийся тем, что этап 305 характеризуется выполнением этапов:
этапа 3051 идентификации видов ИС ЛЛК, указывающих на наличие в ИС ЛЛК сочиненных ПЛЛК, на котором идентифицируют первый или второй виды ИС ЛЛК, а также идентификации непреобразованных СЛЛК и их идентификационных данных, представляющих собой для каждой непреобразованной СЛЛК, по меньшей мере: значение непреобразованной СЛЛК и порядковые номера ТЭ
лингвистического предложения, составляющих непреобразованный СЛЛК;
этапа 3052 формирования преобразованных СЛЛК, на котором формируют преобразованные СЛЛК из ИС ЛЛК второго вида, а также идентификационные данные преобразованных СЛЛК, представляющие собой для каждой
преобразованной СЛЛК, по меньшей мере: значение преобразованной СЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих
141
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) преобразованные СЛЛК;
этапа 3053 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД из преобразованных СЛЛК или из непреобразованной СЛЛК.
115. Способ по п. 114, характеризующийся тем, что в рамках этапа 3051 идентификацию вида ИС ЛЛК производят путем анализа значений
лингвистических характеристик текстовых элементов, составляющих ИС ЛЛК, с целью идентификации синтаксических сочинительных связей между СПЛЛК, входящих в ИС ЛЛК, причем синтаксическую сочинительную связь между СПЛЛК идентифицируют в случае наличия у синтаксически главных ЛЛЕ синтаксически главных ОЛЛО таких СПЛЛК одного и того же синтаксического родителя, являющегося синтаксически главной ЛЛЕ другой СПЛЛК, у которой с ЛЛЕ в сочиненных СПЛЛК имеется прямая синтаксическая подчинительная связь, при этом при идентификации синтаксической сочинительной связи между главными ЛЛЕ главных ОЛЛО двух или более СПЛЛК такую ИС ЛЛК идентифицируют как ИС ЛЛК второго вида, а ИС ЛЛК, в которой не идентифицируют синтаксической сочинительной связи у главного ЛЛЕ главного ОЛЛО в СПЛЛК, идентифицируют как ИС ЛЛК первого вида, при этом идентифицированную ИС ЛЛК первого вида отождествляют с непреобразованной СЛЛК.
116. Способ по п. 114, характеризующийся тем, что в рамках этапа 3052, формирование преобразованных СЛЛК производят на основании
идентифицированной на этапе 3051 синтаксической сочинительной связи между СПЛЛК путем преобразования ИС ЛЛК второго вида, заключающегося в
гетерогенизации ИС ЛЛК, приводящей к устранению синтаксических
однородностей в ИС ЛЛК, посредством чего из ИС ЛЛК второго вида формируется множество новых ИС ЛЛК, идентичных по однородностям ИС ЛЛК первого вида, при этом каждая новая ИС ЛЛК упомянутого множества может содержать только одну из упомянутых СПЛЛК с однородными членами или только одно уникальное сочетание упомянутых СПЛЛК с однородными членами разных рядов однородных членов, при этом множество ИС ЛЛК, сформированных из ИС ЛЛК второго вида таким образом являются преобразованными СЛЛК.
117. Способ по п. 114, характеризующийся тем, что в рамках этапа 3051 идентификацию значения и порядковых номеров ТЭ непреобразованной СЛЛК производят следующим образом: значения текстовых элементов лингвистического
142
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) предложения, составляющих ИС ЛЛК первого вида, идентифицируют как значение непреобразованной СЛЛК, а порядковые номера упомянутых текстовых элементов лингвистического предложения, составляющих ИС ЛЛК первого вида, из которого состоит непреобразованная СЛЛК, идентифицируют как порядковые номера текстовых элементов, составляющих непреобразованную СЛЛК.
118. Способ по п. 114, характеризующийся тем, что в рамках этапа 3052 идентификацию значения и порядковых номеров ТЭ преобразованной СЛЛК производят следующим образом: значения текстовых элементов лингвистического предложения, составляющих ИС ЛЛК второго вида, за исключением значений текстовых элементов лингвистического предложения, составляющих отдельные части ИС ЛЛК второго вида, которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК, являющихся однородными членами, идентифицируют как значение 161 преобразованной СЛЛК, а порядковые номера текстовых элементов лингвистического предложения, составляющих ИС ЛЛК второго, за исключением порядковых номеров текстовых элементов
лингвистического предложения, составляющих отдельные части ИС ЛЛК второго вида, которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК, являющихся однородными членами идентифицируют как порядковые номера текстовых элементов, составляющих преобразованную СЛЛК.
119. Способ по п. 114, характеризующийся тем, что в рамках этапа 3053 формирование итоговой структуры данных СМД производят путем объединения в одной структуре данных, преобразованных СЛЛК и непреобразованной СЛЛК, а также их идентификационных данных.
120. Выполняемый процессором компьютерного устройства способ формирования структуры данных СМД, содержащей ИЛЛЭ лингвистического предложения и идентификационные данные ИЛЛЭ, характеризующийся
выполнением этапов:
этапа 301 идентификации пригодной для преобразования структуры данных, на котором идентифицируют исходную структуру данных СМД,
содержащую ОЛЛО и их идентификационные данные, причем такой структурой данных является структура данных, полученная посредством способа по любому из п.п. 77-94;
этапа 402 формирования первой структуры данных СМД, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой
143
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) первой структуры данных СМД, причем упомянутые элементы первой структуры данных СМД представляют собой основные лингво-логические элементы (ОЛЛЭ) лингвистического предложения, сформированные путем разделения ОЛЛО на семантические части ОЛЛО, а также представляют собой идентификационные данные ОЛЛЭ, представляющие собой для каждого ОЛЛЭ, по меньшей мере:
значение ОЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих ОЛЛЭ;
этапа 403 формирования итоговой структуры данных СМД, на котором формируют итоговую структуру данных СМД, содержащую элементы упомянутой итоговой структуры данных СМД, причем упомянутые элементы итоговой структуры данных СМД представляют собой исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения, сформированные путем разделения ОЛЛЭ на семантические части ОЛЛЭ и формирования из них исходных элементов, а также представляют собой идентификационные данные ИЛЛЭ, представляющие собой для каждого ИЛЛЭ, по меньшей мере: значение ИЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ИЛЛЭ.
121. Способ по п. 120, характеризующийся тем, что в рамках этапа 301 идентифицируют исходную структуру данных СМД, содержащую ОЛЛО, а также идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, по меньшей мере, значение ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ОЛЛО.
122. Способ по п. 120, характеризующийся тем, что этап 402 характеризуется выполнением этапов:
этапа 4021 формирования значений седьмой части лингвистических характеристик текстовых элементов (ТЭ), составляющих ОЛЛО, на котором формируют значения седьмой части лингвистических характеристик ТЭ, составляющих ОЛЛО и вносят полученные сведения в предварительно
сформированную базу данных лингвистических признаков текстовых элементов лингвистического предложения;
этапа 4022 формирования семантических частей ОЛЛО, на котором формируют первую и последующие семантические части ОЛЛО, проясняющие смысловую структуру ОЛЛО;
этапа 4023 формирования первой структуры данных СМД, на котором
144
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) идентифицируют ОЛЛЭ, а также идентификационные данные ОЛЛЭ, представляющие собой для каждого ОЛЛЭ, по меньшей мере: значение ОЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ОЛЛЭ, и формируют первую структуру данных СМД.
123. Способ по п. 122, характеризующийся тем, что в рамках этапа 4021 формирование седьмой части лингвистических характеристик и их значений производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов, входящих в ОЛЛО, при этом в ходе такого анализа у всех текстовых элементов, составляющих ОЛЛО проверяют наличие признака главного слова семантической части ОЛЛО, при этом таким признаком может являться, по меньшей мере, наличие у ТЭ следующих значений
лингвистических характеристик: ТЭ является главным словом ОЛЛО или ТЭ имеет зависимый ТЭ в форме предлога, при этом при наличии у ТЭ указанных значений лингвистических характеристик формируют соответствующие значения седьмой части лингвистических характеристик для такого ТЭ, и такой ТЭ является главным словом семантической части ОЛЛО.
124. Способ по п. 122, характеризующийся тем, что в рамках этапа 4022 формирование семантических частей ОЛЛО производят путем выполнения следующих действий:
на первом этапе, в зависимости от идентифицированного главного слова семантической части ОЛЛО, идентифицируют все синтаксически подчиненные слова вплоть до слова, которое само является главным словом семантической части ОЛЛО, но не включая данное слово;
на втором этапе из главного слова семантической части ОЛЛО и всех упомянутых синтаксически подчиненных слов, в том числе последовательно подчиненных, формируют семантическую часть ОЛЛО; причем
порядковый номер семантической части в ОЛЛО указывает на ее
семантическую роль в ОЛЛО и формируется в соответствии с порядковым номером текстового элемента главного слова семантической части ОЛЛО; причем
семантическая часть ОЛЛО с наименьшим порядковым номером ТЭ главного слова является первой семантической частью ОЛЛО; причем
семантическая часть ОЛЛО, имеющая ближайший к первому номер ТЭ главного слова семантической части, является второй семантической частью ОЛЛО
145
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) и так далее.
125. Способ по п. 122, характеризующийся тем, что в рамках этапа 4023 идентификацию ОЛЛЭ производят на основе результатов выполнения этапа 4022, при этом все сформированные семантические части ОЛЛО отождествляют с ОЛЛЭ.
126. Способ по п. 122, характеризующийся тем, что в рамках этапа 4023 идентификацию значения и порядковых номеров ТЭ, составляющих ОЛЛЭ, производят путем отождествления значения ОЛЛЭ со значениями
идентифицированной семантической части ОЛЛО, а порядковых номеров текстовых элементов, составляющих ОЛЛЭ - путем отождествления с порядковыми номерами текстовых элементов, составляющих идентифицированную
семантическую часть ОЛЛЭ.
127. Способ по п. 122, характеризующийся тем, что в рамках этапа 4023 формирование первой структуры данных СМД производят путем объединения в одной структуре данных ОЛЛЭ и их идентификационных данных.
128. Способ по п. 120, характеризующийся тем, что этап 403 характеризуется выполнением этапов:
этапа 4031 формирования значений восьмой части лингвистических характеристик ТЭ, составляющих ОЛЛЭ, на котором формируют значения восьмой части лингвистических характеристик ТЭ, составляющих ОЛЛЭ, и вносят
полученные сведения в БДЛП текстовых элементов лингвистического
предложения 11, формируемую в рамках этапа 4021;
этапа 4032 формирования семантических частей ОЛЛЭ, на котором
формируют первую и последующие семантические части ОЛЛЭ, проясняющие смысловую структуру ОЛЛЭ;
выполнением этапа 4033 формирования ИЛЛЭ, на котором формируют ИЛЛЭ и идентификационные данные ИЛЛЭ, представляющие собой, по меньшей мере: значения ИЛЛЭ, порядковые номера ТЭ лингвистического предложения,
составляющих ИЛЛЭ, а также идентифицируют первые и вторые виды ИЛЛЭ и формируют итоговую структуру данных СМД.
129. Способ по п. 128, характеризующийся тем, что в рамках этапа 4031 формирование восьмой части лингвистических характеристик и их значений производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов, входящих в ОЛЛЭ, причем в ходе такого анализа у всех текстовых элементов, составляющих ОЛЛЭ проверяют наличие
146
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) признака главного слова семантической части ОЛЛЭ, причем признаком главного слова семантической части ОЛЛЭ является, по меньшей мере, наличие у текстового элемента следующих значений лингвистических характеристик: ТЭ является главным словом ОЛЛЭ или ТЭ имеет форму существительного, местоимения или глагола (в любой грамматической форме); при этом при наличии у ТЭ указанных значений лингвистических характеристик формируют соответствующие значения восьмой части лингвистических характеристик и такой ТЭ является главным словом семантической части ОЛЛЭ.
130. Способ по п. 128, характеризующийся тем, что в рамках этапа 4032 формирование семантических частей ОЛЛЭ производят путем выполнения следующих действий:
на первом этапе, в зависимости от идентифицированного главного слова ОЛЛЭ, идентифицируют все синтаксически подчиненные слова, вплоть до слова, которое само является главным словом семантической части ОЛЛЭ, но не включая данное слово;
на втором этапе из главного слова семантической части ОЛЛЭ и всех упомянутых синтаксически подчиненных слов, в том числе последовательно подчиненных, формируют семантическую часть ОЛЛЭ; причем
порядковый номер семантической части в ОЛЛЭ, указывает на ее
семантическую роль в ОЛЛЭ и формируется в соответствии с порядковым номером текстового элемента главного слова семантической части ОЛЛЭ; причем
семантическая часть ОЛЛЭ с наименьшим номером ТЭ главного слова является первой семантической частью ОЛЛЭ; причем
семантическая часть ОЛЛЭ, имеющая ближайший к первому номер ТЭ главного слова семантической части, является второй семантической частью ОЛЛЭ и так далее.
131. Способ по п. 128, характеризующийся тем, что в рамках этапа 4033 формирование ИЛЛЭ и идентификацию первых и вторых видов ИЛЛЭ производят на основе результатов выполнения этапа 4032 следующим образом:
на первом этапе все значимые части речи в семантических частях ОЛЛЭ отождествляют с ИЛЛЭ;
на втором этапе упомянутые идентифицированные главные слова семантических частей ОЛЛЭ отождествляют с ИЛЛЭ первого вида;
на третьем этапе все остальные ИЛЛЭ данной семантической части, кроме
147
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) ИЛЛЭ первого вида отождествляют с ИЛЛЭ второго вида.
132. Способ по п. 128, характеризующийся тем, что в рамках этапа 4033 идентификация значения и порядкового (порядковых) номера (номеров) ТЭ, составляющих ИЛЛЭ, производят путем отождествления значения ИЛЛЭ со значением (значениями) текстового (текстовых) элемента (элементов)
лингвистического предложения, составляющего (составляющих) ИЛЛЭ, а порядковый (порядковые) номер (номера) текстового (текстовых) элемента (элементов), составляющего (составляющих) ИЛЛЭ - путем отождествления с порядковым (порядковыми) номером (номерами) текстового (текстовых) элемента (элементов), составляющего (составляющих) ИЛЛЭ.
133. Способ по п. 128, характеризующийся тем, что в рамках этапа 4033 формирование итоговой структуры данных СМД производят путем объединения в одной структуре данных ИЛЛЭ первого и второго видов, а также их
идентификационных данных.
134. Компьютерное устройство для преобразования структурированного массива данных, содержащего, по меньшей мере, лингвистическое предложение, содержащее, по меньшей мере:
процессор компьютерного устройства, и
память, содержащую код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из п.п. 1-133.
135. Система для преобразования структурированного массива данных, содержащего, по меньшей мере, лингвистическое предложение, содержащая, по меньшей мере:
серверное компьютерное устройство, являющееся компьютерным
устройством по п. 134, и
пользовательское компьютерное устройство, выполненное с возможностью передачи серверному компьютерному устройству команды или команд,
побуждающих процессор серверного компьютерного устройства выполнять код программы, который при выполнении процессором серверного компьютерного устройства побуждает процессор серверного компьютерного устройства выполнять действия способа по любому из п.п. 1-133.
136. Машиночитаемый носитель данных, содержащий код программы, который при выполнении процессором компьютерного устройства побуждает
148
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26) процессор компьютерного устройства выполнять действия способа по любому из п.п. 1-133.
149
ЗАМЕНЯЮЩИЙ ЛИСТ (ПРАВИЛО 26)
PCT/RU2019/050079 2018-06-07 2019-06-07 Способ лингво-логического преобразования структурированного массива данных WO2019235976A1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EA202092989A EA202092989A1 (ru) 2018-06-07 2019-06-07 Способ лингвологического преобразования структурированного массива данных

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
RU2018121134 2018-06-07
RU2018121139 2018-06-07
RU2018121116A RU2685966C1 (ru) 2018-06-07 2018-06-07 Способ лингво-логического преобразования структурированного массива данных, содержащего лингвистическое предложение
RU2018121134A RU2685960C1 (ru) 2018-06-07 2018-06-07 Способ преобразования структурированного массива данных, содержащего синтаксические единицы
RU2018121142 2018-06-07
RU2018121142A RU2685968C1 (ru) 2018-06-07 2018-06-07 Способ преобразования структурированного массива данных, содержащего основные лингво-логические объекты
RU2018121139A RU2691836C1 (ru) 2018-06-07 2018-06-07 Способ преобразования структурированного массива данных, содержащего основные лингво-логические объекты
RU2018121116 2018-06-07

Publications (1)

Publication Number Publication Date
WO2019235976A1 true WO2019235976A1 (ru) 2019-12-12

Family

ID=68769438

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2019/050079 WO2019235976A1 (ru) 2018-06-07 2019-06-07 Способ лингво-логического преобразования структурированного массива данных

Country Status (1)

Country Link
WO (1) WO2019235976A1 (ru)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120109640A1 (en) * 2006-10-10 2012-05-03 Konstantin Anisimovich Method and system for analyzing and translating various languages with use of semantic hierarchy
US20130024186A1 (en) * 2006-10-10 2013-01-24 Abbyy Software Ltd. Deep Model Statistics Method for Machine Translation
RU2544739C1 (ru) * 2014-03-25 2015-03-20 Игорь Петрович Рогачев Способ преобразования структурированного массива данных
RU2571405C1 (ru) * 2014-06-27 2015-12-20 Игорь Петрович Рогачев Способ предварительного преобразования структурированного массива данных
US20170083508A1 (en) * 2015-09-18 2017-03-23 Mcafee, Inc. Systems and Methods for Multilingual Document Filtering

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120109640A1 (en) * 2006-10-10 2012-05-03 Konstantin Anisimovich Method and system for analyzing and translating various languages with use of semantic hierarchy
US20130024186A1 (en) * 2006-10-10 2013-01-24 Abbyy Software Ltd. Deep Model Statistics Method for Machine Translation
RU2544739C1 (ru) * 2014-03-25 2015-03-20 Игорь Петрович Рогачев Способ преобразования структурированного массива данных
RU2571405C1 (ru) * 2014-06-27 2015-12-20 Игорь Петрович Рогачев Способ предварительного преобразования структурированного массива данных
US20170083508A1 (en) * 2015-09-18 2017-03-23 Mcafee, Inc. Systems and Methods for Multilingual Document Filtering

Similar Documents

Publication Publication Date Title
RU2596599C2 (ru) Система и способ создания и использования пользовательских онтологических моделей для обработки пользовательского текста на естественном языке
US9727553B2 (en) System and method for generating and using user semantic dictionaries for natural language processing of user-provided text
US9588960B2 (en) Automatic extraction of named entities from texts
CN111291161A (zh) 法律案件知识图谱查询方法、装置、设备及存储介质
Sawyer et al. Shallow knowledge as an aid to deep understanding in early phase requirements engineering
CN104252533A (zh) 搜索方法和搜索装置
Bjarnadóttir The database of modern Icelandic inflection (Beygingarlýsing íslensks nútímamáls)
RU2392660C2 (ru) Способ поиска информации в массиве текстов
Krishna et al. A dataset for sanskrit word segmentation
Martens et al. An efficient, generic approach to extracting multi-word expressions from dependency trees
RU2685966C1 (ru) Способ лингво-логического преобразования структурированного массива данных, содержащего лингвистическое предложение
RU2685960C1 (ru) Способ преобразования структурированного массива данных, содержащего синтаксические единицы
RU2691836C1 (ru) Способ преобразования структурированного массива данных, содержащего основные лингво-логические объекты
Szwed Concepts extraction from unstructured Polish texts: A rule based approach
CN110413796A (zh) 一种煤矿典型动力灾害领域本体构建方法
WO2019235976A1 (ru) Способ лингво-логического преобразования структурированного массива данных
RU2685967C1 (ru) Способ предварительного преобразования структурированного массива данных, содержащего лингвистическое предложение
RU2685968C1 (ru) Способ преобразования структурированного массива данных, содержащего основные лингво-логические объекты
Lim et al. Low cost construction of a multilingual lexicon from bilingual lists
Lash Computational representation of linguistic semantics for requirement analysis in engineering design
Haj et al. Automated generation of terminological dictionary from textual business rules
Moran et al. Lemon-aid: using lemon to aid quantitative historical linguistic analysis
Bellström et al. Towards the automation of modeling language independent schema integration
Boese et al. Semantic document networks to support concept retrieval
Castro-Sánchez et al. Automatic acquisition of synonyms of verbs from an explanatory dictionary using hyponym and hyperonym relations

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19814483

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19814483

Country of ref document: EP

Kind code of ref document: A1