RU2685967C1 - Method of preliminary transformation of a structured data array containing a linguistic sentence - Google Patents

Method of preliminary transformation of a structured data array containing a linguistic sentence Download PDF

Info

Publication number
RU2685967C1
RU2685967C1 RU2018121132A RU2018121132A RU2685967C1 RU 2685967 C1 RU2685967 C1 RU 2685967C1 RU 2018121132 A RU2018121132 A RU 2018121132A RU 2018121132 A RU2018121132 A RU 2018121132A RU 2685967 C1 RU2685967 C1 RU 2685967C1
Authority
RU
Russia
Prior art keywords
linguistic
elements
data structure
syntactic
sentence
Prior art date
Application number
RU2018121132A
Other languages
Russian (ru)
Inventor
Игорь Петрович Рогачев
Original Assignee
Игорь Петрович Рогачев
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Игорь Петрович Рогачев filed Critical Игорь Петрович Рогачев
Priority to RU2018121132A priority Critical patent/RU2685967C1/en
Application granted granted Critical
Publication of RU2685967C1 publication Critical patent/RU2685967C1/en
Priority to PCT/RU2019/050078 priority patent/WO2019235975A1/en
Priority to EA202092988A priority patent/EA202092988A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

FIELD: computer equipment.SUBSTANCE: invention relates to computer engineering for processing data arrays. Technical result is achieved due to the fact that the method of transforming a structured data array (SDA) comprises a step of forming a first data structure, on which the first SDA data structure is formed, comprising elements of said first data structure, wherein said elements of the first data structure are text elements (TE) of the linguistic sentence, as well as identification data of TE, which are for each TE, at least: value of TE and TE serial number in linguistic proposal; and a step of forming a second data structure, on which a second SDA data structure is formed, comprising elements of said second data structure, wherein said elements of the second data structure are syntax units (SU) of the linguistic sentence, formed based on information from the database of linguistic features (DLF) of text elements of the linguistic sentence, and also represent SU identification data.EFFECT: technical result consists in improvement of accuracy of preliminary processing of text in natural language.21 cl, 45 dwg

Description

[1] ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ[1] TECHNICAL FIELD TO WHICH INVENTION RELATES.

[2] Группа изобретений относится к решениям в области обработки массивов данных, в частности, к решениям в области обработки структурированных массивов данных, содержащих текст на естественном языке, в частности, лингвистические предложения, и может быть использована для предварительного преобразования структурированного массива данных для обеспечения его последующей обработки.[2] The group of inventions relates to solutions in the field of processing data arrays, in particular, to solutions in the field of processing structured data arrays containing text in natural language, in particular, linguistic sentences, and can be used to pre-convert a structured data array to provide its subsequent processing.

[3] УРОВЕНЬ ТЕХНИКИ[3] LEVEL OF TECHNOLOGY

[4] Из патента РФ 2399959 (ЗАО «АВИКОМП СЕРВИСЕЗ»), опубликованного 10.05.2010 (Д1), известен способ автоматической индексации текстов на естественных языках. Известный из Д1 способ заключается в том, что текст сегментируют в электронной форме на элементарные единицы, выявляют устойчивые словосочетания, формируют предложения, выявляют семантически значимые объекты и семантически значимые отношения между ними, формируют для каждого семантически значимого отношения множество триад, в которых единственная триада первого типа соответствует связи, устанавливаемой семантически значимым отношением между двумя семантически значимыми объектами, при этом каждая из триад второго типа соответствует значению конкретного атрибута одного из этих семантически значимых объектов, каждая из триад третьего типа соответствует значению конкретного атрибута самого семантически значимого отношения, затем индексируют на множестве сформированных триад все связанные семантически значимыми отношениями семантически значимые объекты по отдельности, запоминают в базе данных сформированные триады и полученные индексы вместе со ссылкой на исходный текст, из которого сформированы эти триады. [4] From the patent of the Russian Federation 2399959 (CJSC Avikomp Services), published 10.05.2010 (D1), a method of automatic indexing of texts in natural languages is known. The method known from D1 is that the text is segmented electronically into elementary units, identifies stable phrases, forms sentences, identifies semantically significant objects and semantically significant relationships between them, forms for each semantically significant relationship many triads, in which a single triad of the first type corresponds to a relationship established by a semantically significant relationship between two semantically significant objects, each of the triads of the second type corresponds to the value of a specific attribute of one of these semantically significant objects, each of the triads of the third type corresponds to the value of a specific attribute of the semantically meaningful relationship itself, then they index all the semantically meaningful objects connected by semantically significant relations into a set of formed triads, store the formed triads and the resulting indices together with a reference to the source text from which these triads are formed.

[5] Однако известный из Д1 способ не обладает достаточной точностью индексации элементов текста на естественном языке, что, в свою очередь, сказывается на точности последующей обработки текста на естественном языке и точности поиска в тексте на естественном языке. Главным образом, это происходит из-за недостаточно эффективной предварительной обработки текста на естественном языке, что, соответственно, не позволяет осуществить индексацию с достаточной точностью.[5] However, the method known from D1 does not have sufficient accuracy of indexing elements of text in a natural language, which, in turn, affects the accuracy of subsequent processing of a text in a natural language and the accuracy of searching in a text in a natural language. This is mainly due to the lack of effective preprocessing of text in natural language, which, accordingly, does not allow indexation with sufficient accuracy.

[6] РАСКРЫТИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ[6] DISCLOSURE OF THE INVENTION

[7] Исходя из этого, технической проблемой, решаемой настоящим изобретением, является создание способа и реализующих способ устройств и/или систем, обладающих повышенной эффективностью предварительной обработки текста на естественном языке для его последующей индексации и обработки.[7] On the basis of this, a technical problem solved by the present invention is the creation of a method and devices and / or systems implementing a method that have an increased efficiency of preprocessing a natural language text for its subsequent indexing and processing.

[8] Соответственно, техническим результатом, достигаемым при реализации настоящего изобретения, является повышение эффективности и точности предварительной обработки текста на естественном языке для его последующей индексации и обработки.[8] Accordingly, the technical result achieved when implementing the present invention is to increase the efficiency and accuracy of preprocessing a natural-language text for subsequent indexing and processing.

[9] Технический результат достигается за счет того, что заявленный выполняемый процессором компьютерного устройства способ преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, лингвистическое предложение, характеризуется выполнением этапов: А) формирования первой структуры данных, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных представляют собой текстовые элементы (ТЭ) лингвистического предложения, а также идентификационные данные текстовых элементов (идентификационные данные ТЭ), представляющие собой для каждого ТЭ, по меньшей мере: значение текстового элемента (значение ТЭ) и порядковый номер текстового элемента (порядковый номер ТЭ) в лингвистическом предложении; Б) формирования базы данных лингвистических признаков (БДЛП), на котором выявляют лингвистические признаки текстовых элементов (лингвистические признаки ТЭ) лингвистического предложения, из которых формируют базу данных, представляющую собой БДЛП текстовых элементов лингвистического предложения; В) формирования второй структуры данных, на котором формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой синтаксические единицы (СЕ) лингвистического предложения, сформированные на основании сведений из БДЛП текстовых элементов лингвистического предложения, а также представляют собой идентификационные данные синтаксических единиц (идентификационные данные СЕ), представляющие собой для каждой СЕ, по меньшей мере: значение синтаксической единицы (значение СЕ) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих СЕ. [9] The technical result is achieved due to the fact that the method for transforming a structured data set (MDC), containing at least a linguistic sentence, performed by a processor of a computer device, is characterized by the following steps: A) forming the first data structure, which forms the first structure data of the DMD containing the elements of the first data structure, and the elements of the first data structure are the textual elements (TE) of the linguistic proposition zheniya and identification data of text elements (TE identification data) representing for each fuel cell, at least: a value of a text element (TEQ value) and the ordinal number of the text element (TE ordinal number) in the linguistic sentence; B) the formation of a database of linguistic features (BDLP), which reveal the linguistic features of the text elements (linguistic signs of TE) of the linguistic sentence, from which form a database that represents the BDLP of text elements of the linguistic sentence; C) forming the second data structure, on which the second data structure of the MDD is formed, containing elements of the said second data structure, said elements of the second data structure being syntactic units (CE) of the linguistic sentence, formed on the basis of information from the BDLP of textual elements of the linguistic sentence, also represent the identification data of syntactic units (the identification data of the CE), representing for each CE at least: the value syntactic unit (CE value) and ordinal (s) number (s) of TE linguistic sentences that make up CE.

[10] Варианты осуществления настоящего изобретения относятся к способам, устройствам, системам и машиночитаемым носителям данных для обеспечения эффективности и точности предварительной обработки текста на естественном языке для его последующей индексации и обработки.[10] Embodiments of the present invention relate to methods, devices, systems, and computer-readable media to ensure the efficiency and accuracy of preprocessing a natural-language text for subsequent indexing and processing.

[11] КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ[11] BRIEF DESCRIPTION OF THE DRAWINGS

[12] Иллюстративные варианты осуществления настоящего изобретения описываются далее подробно со ссылкой на прилагаемые чертежи, которые включены в данный документ посредством ссылки, и на которых:[12] Illustrative embodiments of the present invention are described below in detail with reference to the accompanying drawings, which are incorporated herein by reference, and in which:

[13] На фиг. 1 изображена примерная общая схема выполнения этапов заявленного способа 100 преобразования структурированного массива данных, содержащего, по меньшей мере, лингвистическое предложение, являющегося исходной структурой данных для рассматриваемого способа 100.[13] FIG. 1 depicts an exemplary general scheme for performing the steps of the claimed method 100 for transforming a structured data array containing at least a linguistic sentence that is the initial data structure for the method 100 in question.

[14] На фиг. 2 изображена примерная общая схема выполнения этапов этапа 101 формирования первой структуры данных.[14] FIG. 2 depicts an exemplary general scheme for performing the steps of step 101 of forming the first data structure.

[15] На фиг. 3 изображена примерная общая структура исходной структуры данных, из которой формируется первая структура данных структурированного массива данных.[15] FIG. 3 depicts an exemplary general structure of the original data structure from which the first data structure of a structured data array is formed.

[16] На фиг. 4 изображена примерная общая структура сформированной первой структуры данных.[16] FIG. 4 depicts an exemplary overall structure of the generated first data structure.

[17] На фиг. 5 изображена примерная общая схема выполнения этапов этапа 102 формирования базы данных лингвистических признаков, представляющей собой базу данных лингвистических признаков текстовых элементов 21 предложения 11.[17] FIG. 5 depicts an exemplary general scheme for performing the steps of the step 102 of forming a database of linguistic features, which is a database of linguistic features of the text elements 21 of sentence 11.

[18] На фиг. 6 изображена примерная общая структура сформированной базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11.[18] FIG. 6 depicts an exemplary general structure of the generated linguistic characteristics database (BDLP), which is the BDLP of textual elements 21 of the linguistic sentence 11.

[19] На фиг. 7 изображена примерная общая схема выполнения этапов этапа 103 формирования второй структуры данных СМД.[19] FIG. 7 depicts an exemplary general scheme for performing the steps of step 103 of forming a second SMD data structure.

[20] На фиг. 8 изображена примерная общая структура сформированной второй структуры данных структурированного массива данных.[20] FIG. 8 depicts an exemplary general structure of a second structured data structure of a structured data array.

[21] На фиг. 9 изображена примерная общая схема выполнения этапов этапа 104 формирования третьей структуры данных структурированного массива данных.[21] FIG. 9 depicts an exemplary general scheme for performing the steps of step 104 of forming a third data structure of a structured data array.

[22] На фиг. 10 изображена примерная общая структура сформированной третьей структуры данных структурированного массива данных.[22] FIG. 10 depicts an exemplary general structure of the formed third data structure of a structured data array.

[23] На фиг. 11 изображена примерная общая схема выполнения этапа 105 формирования четвертой структуры данных структурированного массива данных.[23] FIG. 11 shows an exemplary general scheme for performing step 105 of forming a fourth data structure of a structured data array.

[24] На фиг. 12 изображена примерная общая структура сформированной четвертой структуры данных структурированного массива данных.[24] FIG. 12 depicts an exemplary general structure of the fourth structured data structure of a structured data array.

[25] На фиг. 13 изображена примерная общая схема выполнения этапов заявленного способа 200 преобразования структурированного массива данных, содержащего, по меньшей мере, синтаксические единицы лингвистического предложения и идентификационные данные синтаксических единиц, являющегося исходной структурой данных для рассматриваемого способа 200.[25] FIG. 13 depicts an exemplary general scheme for performing the steps of the claimed method 200 for converting a structured data array containing at least the syntactic units of the linguistic sentence and the identification data of the syntactic units being the original data structure for the method 200 in question.

[26] На фиг. 14 изображена примерная общая схема выполнения этапа 201 идентификации пригодной для преобразования структуры данных, содержащей синтаксические единицы, являющейся исходной структурой данных для рассматриваемого способа 200.[26] FIG. 14 depicts an exemplary general scheme for the execution of the identification step 201 for converting a data structure containing syntactic units, which is the initial data structure for the method 200 under consideration.

[27] На фиг. 15 изображена примерная общая структура данных, являющаяся исходной структурой данных для способа преобразования 200, представляющая собой пригодную для преобразования структуру данных, содержащую синтаксические единицы.[27] FIG. 15 illustrates an exemplary overall data structure that is the original data structure for the transform method 200, which is a translatable data structure containing syntactic units.

[28] На фиг. 16 изображена примерная общая схема выполнения этапов этапа 202 формирования пятой структуры данных структурированного массива данных, являющейся первой структурой данных для рассматриваемого способа 200.[28] FIG. 16 depicts an exemplary general scheme for performing the steps of step 202 of forming a fifth data structure of a structured data array, which is the first data structure for the method 200 in question.

[29] На фиг. 17 изображена примерная общая структура сформированной в рамках этапа 2021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей синтаксические единицы.[29] FIG. 17 depicts an exemplary general structure of the linguistic characteristics database (BDLP) formed as part of step 2021, which is the BDLP textual elements 21 of the linguistic sentence 11 contained in the elements 22 of the data structure containing syntax units that can be converted.

[30] На фиг. 18 изображена примерная общая структура сформированной в рамках этапа 2022 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей СЕ.[30] FIG. 18 depicts an exemplary general structure of the linguistic characteristics database (BDLP) formed under step 2022, which is the BDLP of textual elements 21 of the linguistic sentence 11 contained in the elements 22 suitable for transforming the data structure containing the CE.

[31] На фиг. 19 изображена примерная общая структура сформированной пятой структуры данных структурированного массива данных, являющейся первой для настоящего способа преобразования 200.[31] FIG. 19 depicts an exemplary overall structure of the fifth structured data structure of a structured data array, which is the first for the present transformation method 200.

[32] На фиг. 20 изображена примерная общая схема выполнения этапа 203 формирования шестой структуры данных структурированного массива данных, являющейся второй структурой данных для рассматриваемого способа 200.[32] FIG. 20 depicts an exemplary general scheme for performing step 203 of forming a sixth data structure of a structured data array, which is the second data structure for the method 200 in question.

[33] На фиг. 21 изображена примерная общая структура сформированной в рамках этапа 2031 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 61 пятой структуры данных структурированного массива данных.[33] FIG. 21 depicts an exemplary general structure of the linguistic characteristics database (BDLP) formed as part of step 2031, which is the BDLP textual elements 21 of the linguistic sentence 11 contained in the elements 61 of the fifth data structure of a structured data array.

[34] На фиг. 22 изображена примерная общая структура сформированной шестой структуры данных структурированного массива данных, являющаяся второй структурой данных для настоящего способа преобразования 200.[34] FIG. 22 depicts an exemplary overall structure of the sixth structured data structure of a structured data array that is the second data structure for the present transformation method 200.

[35] На фиг. 23 изображена примерная общая схема выполнения этапов этапа 204 формирования седьмой структуры данных структурированного массива данных, являющейся третьей структурой данных для рассматриваемого способа 200.[35] FIG. 23 illustrates an exemplary general scheme for performing the steps of step 204 of forming the seventh data structure of a structured data array, which is the third data structure for the method 200 in question.

[36] На фиг. 24 изображена примерная общая структура сформированной седьмой структуры данных структурированного массива данных, являющейся третьей структурой данных для настоящего способа преобразования 200.[36] FIG. 24 depicts an exemplary overall structure of the formed seventh data structure of a structured data array, which is the third data structure for the present transform method 200.

[37] На фиг. 25 изображена примерная общая схема выполнения этапов заявленного способа 300 преобразования структурированного массива данных, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО, являющегося исходной структурой данных для рассматриваемого способа 300.[37] FIG. 25 depicts an exemplary general scheme for performing the steps of the claimed method 300 for converting a structured data array containing at least the basic linguistic entities (OLLO) of the linguistic sentence and the identification data of the OLLO, which is the original data structure for the method 300 in question.

[38] На фиг. 26 изображена примерная общая схема выполнения этапа 301 идентификации пригодной для преобразования структуры данных, содержащей основные лингво-логические объекты (ОЛЛО), являющейся исходной структурой данных для рассматриваемого способа 300.[38] FIG. 26 illustrates an exemplary general scheme for performing step 301 of an identification of a data structure suitable for converting, which contains basic linguistic-logical objects (OLLO), which is the initial data structure for the method 300 in question.

[39] На фиг. 27 изображена примерная общая структура данных, являющаяся исходной для способа преобразования 300, представляющая собой пригодную для преобразования структуру данных, содержащую основные лингво-логические объекты (ОЛЛО).[39] FIG. 27 depicts an exemplary general data structure that is the source for the transformation method 300, which is a convertible data structure containing the main linguistic entities (OLLO).

[40] На фиг. 28 изображена примерная общая схема выполнения этапов этапа 302 формирования восьмой структуры данных структурированного массива данных, являющейся первой структурой данных для рассматриваемого способа 300.[40] FIG. 28 depicts an exemplary general scheme for performing the steps of step 302 of forming the eighth data structure of a structured data array, which is the first data structure for the method 300 in question.

[41] На фиг. 29 изображена примерная общая структура формируемой в рамках этапа 3021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО.[41] FIG. 29 depicts an exemplary general structure of the linguistic attributes database (BDLP) formed within step 3021, which is the BDLP text elements 21 of sentence 11 contained in elements 91 of a data structure containing OLLO that is suitable for converting.

[42] На фиг. 30 изображена примерная общая структура сформированной восьмой структуры данных СМД, являющейся первой структурой данных СМД для настоящего способа преобразования 300.[42] FIG. 30 depicts an exemplary overall structure of the eighth formed data structure of the DMD, which is the first data structure of the DMD for this conversion method 300.

[43] На фиг. 31 изображена примерная общая схема выполнения этапов этапа 303 формирования девятой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 300.[43] FIG. 31 depicts an exemplary general scheme for performing the steps of step 303 of forming the ninth SMD data structure, which is the second data structure for the considered method 300.

[44] На фиг. 32 изображена примерная общая структура сформированной девятой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 300.[44] FIG. 32 depicts an exemplary overall structure of the ninth formed MDD data structure, which is the second SMD data structure for the present conversion method 300.

[45] На фиг. 33 изображена примерная общая схема выполнения этапов этапа 304 формирования десятой структуры данных СМД являющейся третьей структурой данных для рассматриваемого способа 300. [45] FIG. 33 illustrates an exemplary general scheme for performing the steps of step 304 of forming a tenth SMD data structure, which is the third data structure for the method 300 in question.

[46] На фиг. 34 изображена примерная общая структура формируемой в рамках этапа 3041 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 13 девятой структуры данных СМД.[46] FIG. 34 depicts an exemplary general structure of the linguistic attributes database (BDLP) formed within step 3041, which is the BDLP text elements 21 of sentence 11 contained in elements 13 of the ninth SMD data structure.

[47] На фиг. 35 изображена примерная общая структура сформированной десятой структуры данных СМД, являющейся третьей структурой данных СМД для настоящего способа преобразования 300.[47] FIG. 35 depicts an exemplary overall structure of the formed tenth data structure of the DMD, which is the third data structure of the DMD for this conversion method 300.

[48] На фиг. 36 изображена примерная общая схема выполнения этапов этапа 305 формирования одиннадцатой структуры данных СМД, являющейся третьей структурой данных СМД для рассматриваемого способа 300. [48] FIG. 36 depicts an exemplary general scheme for performing the steps of step 305 of forming the eleventh SMD data structure, which is the third MDD data structure for the method 300 in question.

[49] На фиг. 37 изображена примерная общая структура сформированной одиннадцатой структуры данных СМД, являющейся четвертой структурой данных СМД для настоящего способа преобразования 300.[49] FIG. 37 depicts an exemplary overall structure of the generated eleventh data structure of the DMD, which is the fourth data structure of the DMD for this conversion method 300.

[50] На фиг. 38 изображена примерная общая схема выполнения этапов заявленного способа 400 преобразования СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО, являющегося исходной структурой данных для рассматриваемого способа 400.[50] FIG. 38 depicts an exemplary general scheme for performing the steps of the claimed method 400 for converting a SMD containing at least the basic linguistic entities (OLLO) of the linguistic sentence and the identification data of the OLLO, which is the original data structure for the method 400 in question.

[51] На фиг. 39 изображена примерная общая схема выполнения этапов этапа 402 формирования двенадцатой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 400.[51] FIG. 39 depicts an exemplary general scheme for performing the steps of step 402 of forming the twelfth SMD data structure, which is the first data structure for the method 400 in question.

[52] На фиг. 40 изображена примерная общая структура формируемой в рамках этапа 4021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, формируемой в рамках этапа 4021.[52] FIG. 40 depicts an exemplary general structure of the linguistic characteristics database (BDLP) formed under step 4021, which is the BDLP text elements 21 of sentence 11 contained in the elements 91 of the data structure containing the OLLO generated under step 4021.

[53] На фиг. 41 изображена примерная общая структура сформированной двенадцатой структуры данных СМД являющаяся первой для настоящего способа преобразования 400.[53] FIG. 41 depicts an exemplary overall structure of the formed twelfth data structure of the SMD which is the first for the present conversion method 400.

[54] На фиг. 42 изображена примерная общая схема выполнения этапов этапа 403 формирования тринадцатой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 400.[54] FIG. 42 illustrates an exemplary general scheme for performing the steps of step 403 of forming the thirteenth data structure of the SMD, which is the second data structure for the method 400 in question.

[55] На фиг. 43 изображена примерная общая структура формируемой в рамках этапа 4031 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 17 двенадцатой структуры данных СМД.[55] FIG. 43 depicts an exemplary general structure of the linguistic attributes database (BDLP) formed under step 4031, which is the BDLP text elements 21 of sentence 11 contained in elements 17 of the twelfth data structure of the MDD.

[56] На фиг. 44 изображена примерная общая структура сформированной тринадцатой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 400.[56] FIG. 44 depicts an exemplary overall structure of the formed thirteenth data structure of the SMD, which is the second data structure of the SMD for this transformation method 400.

[57] На фиг. 45 изображена примерная общая схема системы для преобразования структурированного массива данных.[57] FIG. 45 depicts an exemplary general system diagram for transforming a structured data array.

[58] ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ[58] the IMPLEMENTATION of the INVENTION

[59] Описанные в данном разделе возможные осуществления вариантов настоящего изобретения представлены на неограничивающих объем правовой охраны примерах, применительно к конкретным вариантам осуществления настоящего изобретения, которые во всех их аспектах предполагаются иллюстративными и не накладывающими ограничения. Альтернативные варианты реализации настоящего изобретения, не выходящие за пределы объема его правовой охраны, являются очевидными специалистам в данной области, имеющим обычную квалификацию, на которых это изобретение рассчитано.[59] The possible embodiments of the present invention described in this section are presented in non-limiting examples of legal protection applicable to particular embodiments of the present invention, which in all their aspects are intended to be illustrative and not restrictive. Alternative implementations of the present invention, not exceeding the scope of its legal protection, are obvious to those skilled in the art having the usual qualifications for which this invention is intended.

[60] На фиг. 1, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 100 преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, лингвистическое предложение (ЛП), являющегося исходной структурой данных для рассматриваемого способа 100. Заявленный способ 100 преобразования СМД, содержащего, по меньшей мере, лингвистическое предложение, характеризуется: выполнением этапа 101 формирования первой структуры данных, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных представляют собой текстовые элементы (ТЭ) лингвистического предложения, а также идентификационные данные текстовых элементов (идентификационные данные ТЭ), представляющие собой для каждого ТЭ, в качестве примера, но не ограничения: значение текстового элемента (значение ТЭ) и порядковый номер текстового элемента (порядковый номер ТЭ) в лингвистическом предложении; выполнением этапа 102 формирования базы данных лингвистических признаков (БДЛП), на котором выявляют лингвистические признаки текстовых элементов (лингвистические признаки ТЭ) лингвистического предложения, из которых формируют базу данных представляющую собой базу данных лингвистических признаков текстовых элементов лингвистического предложения (БДЛП ТЭ лингвистического предложения); выполнением этапа 103 формирования второй структуры данных, на котором формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой синтаксические единицы (СЕ) лингвистического предложения, сформированные на основании сведений из БДЛП ТЭ лингвистического предложения, а также представляют собой идентификационные данные синтаксических единиц (идентификационные данные СЕ), представляющие собой для каждой СЕ, в качестве примера, но не ограничения: значение синтаксической единицы (значение СЕ) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих СЕ; выполнением этапа 104 формирования третьей структуры данных, на котором формируют третью структуру данных СМД, содержащую элементы упомянутой третьей структуры данных, причем упомянутые элементы третьей структуры данных представляют собой лингвистические объекты (ЛО) лингвистического предложения, сформированные путем их отождествления с упомянутыми синтаксическими единицами, либо полученные в результате преобразования упомянутых синтаксических единиц, а также представляют собой идентификационные данные лингвистических объектов (идентификационные данные ЛО), представляющие собой для каждого ЛО, в качестве примера, но не ограничения: значение лингвистического объекта (значение ЛО) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ЛО; выполнением этапа 105 формирования четвертой структуры данных, на котором формируют четвертую структуру данных СМД, содержащую элементы упомянутой четвертой структуры данных, причем упомянутые элементы четвертой структуры данных представляют собой логические объекты (ЛогО) лингвистического предложения, сформированные посредством корреляции лингвистических и логических объектов и отождествленные с упомянутыми лингвистическими объектами, а также представляют собой идентификационные данные логических объектов (идентификационные данные ЛогО), представляющие собой для каждого ЛогО, в качестве примера, но не ограничения: значение логического объекта (значение ЛогО) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ЛогО.[60] FIG. 1, as an example, but not limited to, a general scheme for performing the steps of the inventive method 100 for transforming a structured data set (MDD) containing at least a linguistic sentence (LP), which is the original data structure for the method in question 100, is depicted. The claimed method 100 MDD transformations containing at least the linguistic sentence are characterized by: performing step 101 of forming the first data structure, which forms the first MDD data structure containing the elements the first data structure, and the first data structure elements are the textual elements (TE) of the linguistic sentence, as well as the identification data of the text elements (the identification data of the TE), for each TE, as an example, but not limited to: the value of the text element (TE value) and the sequence number of the text element (TE sequence number) in the linguistic sentence; the step 102 of forming a database of linguistic features (BDLP), which reveal the linguistic features of textual elements (linguistic features of TE) of the linguistic sentence, which form the database representing the database of linguistic features of textual elements of the linguistic sentence (BDLP of TE linguistic sentence); by performing step 103 of forming a second data structure, in which a second MDD data structure is formed, containing elements of said second data structure, said elements of the second data structure being syntactic units (CE) of a linguistic sentence, formed on the basis of information from BDLP TE linguistic sentence, also represent the identification data of syntactic units (CE identification data), representing for each CE, as an example, but not restrictions: the value of the syntactic unit (CE value) and the ordinal (ordinal) number (s) of the TE linguistic sentence that make up the CE; by performing a step 104 of forming a third data structure, in which a third MDD data structure is formed, containing elements of said third data structure, said elements of a third data structure being linguistic objects (LO) of a linguistic sentence, formed by identifying them with said syntactic units or obtained as a result of the transformation of the mentioned syntactic units, and also represent the identification data of linguistic objects ( dentifikatsionnye data LO), which are each LO, as an example, but not limited to: the value of linguistic object (LO value) and serial (serial) number (s) TE linguistic supply components (components) LO; by performing a step 105 of forming a fourth data structure, in which a fourth data structure of the DMD is formed, containing elements of said fourth data structure, said elements of the fourth data structure being logical entities (LogO) of a linguistic sentence, formed by correlating linguistic and logical objects and identified with said linguistic objects, and also represent the identification data of logical objects (identification LogOn data), representing for each LogO, as an example, but not limitation: the value of the logical object (LogO value) and the ordinal (ordinal) number (s) of the TE of the linguistic sentence constituting (components) of the LogO.

[61] На фиг. 2, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 101 формирования первой структуры данных. Этап 101 характеризуется: выполнением этапа 1011 идентификации исходной структуры данных СМД на котором идентифицируют элементы 11 исходной структуры данных СМД, являющиеся лингвистическими предложениями 11 (ЛП 11); выполнением этапа 1012 идентификации элементов 21 первой структуры данных СМД, на котором идентифицируют элементы 21 первой структуры данных СМД, являющиеся текстовыми элементами (ТЭ) лингвистического предложения 11, а также идентификационные данные элементов 21, представляющие собой для каждого ТЭ, в качестве примера, но не ограничения: значение 211 элемента 21 первой структуры данных СМД и порядковый номер 212 элемента 21 первой структуры данных СМД, и формируют первую структуру данных СМД.[61] FIG. 2, by way of example, but not limitation, shows the general scheme for performing the steps of step 101 of forming the first data structure. Step 101 is characterized by: performing step 1011 of identifying the original SMD data structure in which elements 11 of the original SMD data structure are identified, which are linguistic sentences 11 (LP 11); performing step 1012 of identifying the elements 21 of the first data structure of the DMD, which identifies the elements 21 of the first data structure of the DMD, which are the textual elements (TE) of the linguistic sentence 11, as well as the identification data of the elements 21, representing for each TE, as an example but not restrictions: the value 211 of the element 21 of the first data structure of the DMD and the sequence number 212 of the element 21 of the first data structure of the SMD, and form the first data structure of the SMD.

[62] На фиг. 3, в качестве примера, но не ограничения, изображена общая структура исходной структуры данных, из которой формируется первая структура данных СМД. Исходные данные представляют собой СМД, содержащий элементы 11 исходной структуры данных, представляющие собой лингвистические предложения (ЛП). Такой массив данных представляет собой множество лингвистических предложений 11, относящихся к любой области деятельности и любого назначения. У элементов 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В исходной структуре данных элементы 11, в качестве примера, но не ограничения, могут именоваться как «ЛП1», «ЛП2», «ЛП3», «ЛПn», где n ≥ 1 - порядковый номер элемента в лингвистическом предложении. Лингвистическое предложение – это грамматически организованное соединение слов (множество синтаксически связанных слов), обладающее смысловой и логической завершенностью. Кроме слов ЛП может содержать следующие объекты: цифры (числа), знаки препинания и индексы (конструкции из букв, цифр и знаков). Все перечисленные выше объекты являются компонентами ЛП 11 (компонентами ЛП) и в исходной структуре данных представляют собой отдельные элементы, заранее подготовленные и помещенные в исходную структуру данных не в виде лингвистического текста, а в виде структурированного массива (списка, перечня и тому подобного) отдельных ЛП. Такие подготовительные действия могут осуществляться любым известным из уровня техники способом и, соответственно, далее не описываются. [62] FIG. 3, by way of example, but not limitation, shows the general structure of the original data structure from which the first SMD data structure is formed. The source data is a MDD containing elements 11 of the original data structure, which are linguistic sentences (LP). Such an array of data is a set of linguistic sentences 11 relating to any field of activity and for any purpose. Elements 11 have no unique names characterizing them (UN) that have practical use. In the original data structure, elements 11, as an example, but not limitation, may be referred to as “LP1”, “LP2”, “LP3”, “LPn”, where n ≥ 1 is the ordinal number of the element in the linguistic sentence. A linguistic sentence is a grammatically organized combination of words (a set of syntactically related words) with semantic and logical completeness. In addition to words, the LP may contain the following objects: numbers (numbers), punctuation marks and indexes (constructions of letters, numbers, and signs). All the objects listed above are components of LP 11 (components of LP) and in the initial data structure are separate elements prepared in advance and placed in the initial data structure not in the form of a linguistic text, but in the form of a structured array (list, list, and the like) of individual Lp Such preparatory actions can be carried out by any method known in the art and, accordingly, are not further described below.

[63] Идентификация элементов 11 исходной структуры данных в рамках этапа 1011 сводится к обеспечению классификации элементов, из которых состоит исходная структура данных, как лингвистических предложений (ЛП 11). При этом компонентами ЛП являются все цифры (числа), знаки препинания и индексы (конструкции из букв, цифр и знаков), содержащиеся в ЛП и отделенные друг от друга пробелом.[63] The identification of the elements 11 of the original data structure in step 1011 is reduced to ensuring the classification of the elements that make up the initial data structure as linguistic sentences (LP 11). In this case, the components of the LP are all numbers (numbers), punctuation marks and indexes (constructions of letters, numbers and signs) contained in the PL and separated from each other by a space.

[64] Исходная структура данных представляет собой в итоге множество элементов 11, идентифицированных на этапе 1011.[64] The original data structure is the result of the many elements 11 identified in step 1011.

[65] На фиг. 4, в качестве примера, но не ограничения, изображена общая структура сформированной первой структуры данных. Первая структура данных представляет собой СМД, содержащий элементы 21 первой структуры данных, которые представляют собой текстовые элементы (ТЭ 21) лингвистического предложения 11 и идентификационные данные ТЭ. У текстовых элементов 21 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 21, в качестве примера, но не ограничения, могут именоваться как «ТЭ», «ТЭ2», «ТЭ3», «ТЭn», где n ≥ 1 - порядковый номер элемента в лингвистическом предложении 11. ТЭ 21 лингвистического предложения (ЛП 11) являются компонентами ЛП, то есть словами, цифрами (числами), знаками препинания или индексами (конструкциями из букв, цифр и знаков), содержащимися в ЛП 11 и отделенными друг от друга пробелом. Текстовые элементы 21 лингвистического предложения 11 имеют идентификационные данные ТЭ, такие как, в качестве примера, но не ограничения: значение 211 ТЭ и порядковый номер 212 ТЭ. Значением 211 ТЭ являются, в качестве примера, но не ограничения, набор букв, цифр и(или) знаков препинания, из которых состоит ТЭ. Порядковым номером 212 ТЭ является порядковый номер ТЭ 21 в лингвистическом предложении 11.[65] FIG. 4, by way of example, but not limitation, the general structure of the first data structure formed is depicted. The first data structure is a MDD containing the elements 21 of the first data structure, which are the text elements (TE 21) of the linguistic sentence 11 and the identification data of the TE. The text elements 21 of the linguistic sentence 11 are absent characterizing their unique names (UN), which have practical use. In the data structure, elements 21, as an example, but not limitation, may be referred to as “TE”, “TE2”, “TE3”, “TEn”, where n ≥ 1 is the sequence number of the element in the linguistic sentence 11. (LP 11) are components of the LP, that is, words, numbers (numbers), punctuation marks or indexes (constructions of letters, numbers and symbols) contained in LP 11 and separated from each other by a space. The textual elements 21 of the linguistic sentence 11 have the identification data of TE, such as, by way of example, but not limitation: the value 211 TE and the sequence number 212 TE. The value of 211 TEs is, by way of example, but not limitation, a set of letters, numbers, and (or) punctuation marks that make up TE. The sequence number 212 TE is the sequence number TE 21 in the linguistic sentence 11.

[66] Формирование текстовых элементов 21 первой структуры данных в ходе этапа 1012 производят путем выявления отдельных слов или групп слов, цифр (чисел) или индексов, причем цифры (числа) или индексы не разделены пробелом, а также знаков препинания. При этом предпочтительно, чтобы последний знак препинания в лингвистическом предложении 11 не учитывался и не рассматривался в качестве текстового элемента 21 лингвистического предложения 11.[66] The formation of the text elements 21 of the first data structure during step 1012 is performed by identifying individual words or groups of words, numbers (numbers) or indices, with the numbers (numbers) or indices not separated by a space, as well as punctuation marks. It is preferable that the last punctuation in the linguistic sentence 11 is not taken into account and is not considered as the text element 21 of the linguistic sentence 11.

[67] Идентификацию значения 211 текстового элемента 21 первой структуры данных в ходе этапа 1012 производят путем регистрации символов (букв, цифр и(или) знаков препинания), из которых состоит текстовый элемент 21. Идентификацию порядкового номера 212 текстового элемента 21 первой структуры данных в ходе этапа 1012 производят путем расчета местоположения ТЭ 21 в лингвистическом предложении 11. При этом первый текстовый элемент 21 в лингвистическом предложении 11 получает порядковый номер «1», а все последующие ТЭ получают порядковый номер, больший на единицу чем порядковый номер предыдущего ТЭ 21.[67] The identification of the value 211 of the text element 21 of the first data structure during step 1012 is performed by registering the characters (letters, numbers and / or punctuation marks) of which the text element 21 consists. The identification number 212 of the text element 21 of the first data structure in during step 1012, it is produced by calculating the location of the TE 21 in the linguistic sentence 11. In this case, the first text element 21 in the linguistic sentence 11 is assigned the sequence number “1”, and all subsequent TEs receive a sequence number larger by nitsu than the sequence number of the previous TE 21.

[68] Формирование первой структуры данных СМД в ходе этапа 1012 производят путем объединения в одной структуре данных элементов 21 первой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются.[68] The formation of the first MDD data structure during step 1012 is performed by combining in one data structure the elements 21 of the first MDD data structure, as well as their identification data according to principles and methods known from the prior art, which, respectively, are not described in further detail below.

[69] На фиг. 5, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 102 формирования базы данных лингвистических признаков, представляющей собой базу данных лингвистических признаков текстовых элементов 21 предложения 11. Этап 102 характеризуется: выполнением этапа 1021 формирования лингвистических признаков текстовых элементов 21 предложения 11, на котором для лингвистического анализа текстового элемента предоставляют идентификационные данные элемента 21 (значение 211 и порядковый номер 212 ТЭ) и получают лингвистические характеристики 213 текстовых элементов 21 лингвистического предложения 11, а также значения упомянутых лингвистических характеристик 2131; выполнением этапа 1022 формирования базы данных лингвистических признаков (БДЛП), на котором формируют БДЛП текстовых элементов 21 лингвистического предложения 11. При этом лингвистическим признаком текстового элемента 21 будут являться все полученные для текстового элемента 21 в ходе этапа 1021 лингвистические характеристики 213, обладающие значениями лингвистических характеристик 2131. [69] FIG. 5, by way of example, but not limitation, a general scheme is presented for performing the steps of stage 102 of forming a database of linguistic attributes, which is a database of linguistic signs of text elements 21 of sentence 11. Step 102 is characterized by: performing step 1021 of forming linguistic signs of text elements 21 of sentence 11 , on which for the linguistic analysis of the text element provide the identification data of the element 21 (value 211 and the sequence number 212 TE) and get linguistic ha characteristics of 213 text elements 21 of the linguistic sentence 11, as well as the meanings of the said linguistic characteristics of 2131; performing step 1022 of forming a linguistic attributes database (BDLP), on which BDLP of textual elements 21 of the linguistic sentence 11 is formed. In this case, the linguistic feature of the text element 21 will be all linguistic characteristics 213 obtained with the values of linguistic characteristics for the text element 21 2131.

[70] На фиг. 6, в качестве примера, но не ограничения, изображена общая структура сформированной базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11. Первая часть (основная) лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 может содержать морфологические, синтаксические и семантические характеристики. При этом совокупность значений всех лингвистических характеристик текстового элемента является для каждого ТЭ 21 лингвистического предложения 11 его отличительным (уникальным) лингвистическим признаком в лингвистическом предложении. Морфологические характеристики предпочтительно указывают на морфологические признаки ТЭ 21 лингвистического предложения 11, которые могут быть классифицированы, в качестве примера, но не ограничения, по уровню вложенности (род-вид-подвид). При этом морфологическими родами ТЭ 21 лингвистического предложения 11 предпочтительно являются слово, цифра, знаки препинания, иные знаки; морфологическими видами – часть речи (для слов), вид цифры (арабская, римская), вид знака препинания (точка, запятая и тому подобное), вид иного знака; морфологическими подвидами – род, число, падеж частей речи и тому подобное (для слов), число, двоичный код, индекс и тому подобное (для цифр). Синтаксические характеристики предпочтительно указывают на множество синтаксических признаков ТЭ 21 лингвистического предложения 11, среди которых можно выделить, в качестве примера, но не ограничения, следующие синтаксические характеристики ТЭ 21 лингвистического предложения 11: синтаксическая роль (сказуемое, подлежащее и тому подобное.); синтаксический родитель (синтаксически главное слово); синтаксические потомки (синтаксически подчиненные слова); синтаксическая сочинительная связь (наличие иного ТЭ, имеющего ту же синтаксическую роль и того же синтаксического родителя). Семантические характеристики предпочтительно указывают на семантические признаки ТЭ 21 лингвистического предложения 11, среди которых можно выделить, в качестве примера, но не ограничения, следующие семантические характеристики ТЭ 21 лингвистического предложения 11: семантическая группа (группа слов, которые можно отнести к одному классу, роду, виду или подвиду предметов или действий окружающего мира при совпадении признаков упомянутых классов, родов, видов или подвидов), семантический статус (смысловое значение слова или группы слов в рамках словосочетания, которым называется некий мыслимый образ (предмет или действие). Например, но не ограничиваясь, мыслимый образ «отсутствие продавца в месте нахождения потребителя» состоит из двух элементов верхнего уровня вложенности (терминов): первого - «отсутствие продавца», и второго - «месте нахождения потребителя», у которых имеются следующие семантические статусы: у первого – главный (определяет смысл термина), у второго - дополнительный (уточняет определенный ранее смысл главного термина)).[70] FIG. 6, by way of example, but not limitation, the general structure of the formed linguistic characteristics database (BDLP) is shown. and semantic characteristics. At the same time, the totality of the values of all the linguistic characteristics of a text element is for each TE 21 of the linguistic sentence 11 its distinctive (unique) linguistic attribute in the linguistic sentence. The morphological characteristics preferably indicate the morphological features of TE 21 of the linguistic sentence 11, which can be classified as an example, but not limited to, by the level of nesting (the genus-species-subspecies). At the same time, the morphological genera of the TE 21 linguistic sentence 11 are preferably a word, a number, punctuation marks, other signs; morphological views - part of speech (for words), type of number (Arabic, Roman), type of punctuation mark (full stop, comma, etc.), type of another sign; morphological subspecies - gender, number, case of parts of speech, and the like (for words), number, binary code, index, and the like (for numbers). Syntactic characteristics preferably indicate a variety of syntactic features of TE 21 linguistic sentence 11, among which the following syntactic characteristics of TE 21 linguistic sentence 11 can be distinguished: syntactic role (predicate, subject, and the like); syntactic parent (syntactic main word); syntactic descendants (syntactically subordinate words); syntactic writing relationship (the presence of another TE, having the same syntactic role and the same syntactic parent). Semantic characteristics preferably indicate the semantic features of TE 21 linguistic sentence 11, among which the following semantic characteristics of TE 21 linguistic sentence 11 can be distinguished: semantic group (a group of words that can be attributed to one class, gender, the type or subspecies of objects or actions of the surrounding world when the signs of the mentioned classes, genus, species or subspecies coincide), semantic status (the semantic meaning of a word or group of words in For example, but not limited to, the “seller’s absence at the consumer’s location”, for example, consists of two elements of the top level of nesting (terms): the first is the “seller’s absence” and the second - “location of the consumer”, which have the following semantic statuses: the first one has the main one (determines the meaning of the term), the second one has the additional one (clarifies the previously defined meaning of the main term)).

[71] Формирование первой части (основной) лингвистических характеристик 213 и их значений 2131 для текстовых элементов 21 лингвистического предложения 11 предпочтительно производят на этапе 1021 путем комплексного лингвистического анализа каждого текстового элемента 21 лингвистического предложения 11, представляющего, в качестве примера, но не ограничения, анализ ТЭ на основе местонахождения ТЭ в структуре предложения, его значения, вида, классификации его мыслимого образа и анализа его связей с другими текстовыми элементами в предложении. По результатам комплексного анализа предпочтительно производится формирование основных лингвистические характеристик 213 и их внесение на этапе 1022 в БДЛП в виде перечня первой части лингвистических характеристик 213 со значениями этих характеристик 2131. Например, но не ограничиваясь, одной из лингвистических характеристик 213 может быть «синтаксическая роль», со значением 2131 данной лингвистической характеристики «подлежащее». Такой анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети) посредством применения технологии обучения нейросети.[71] The formation of the first part (main) of linguistic characteristics 213 and their meanings 2131 for textual elements 21 of linguistic sentence 11 is preferably carried out at step 1021 by complex linguistic analysis of each textual element 21 of linguistic sentence 11, representing, by way of example but not limitation analysis of TE based on the location of TE in the structure of the sentence, its meaning, type, classification of its mental image and analysis of its links with other textual elements in the sentence. According to the results of a comprehensive analysis, the basic linguistic characteristics 213 are preferably formed and entered at stage 1022 into the BDLP as a list of the first part of linguistic characteristics 213 with the values of these characteristics 2131. For example, but not limited to, one of the linguistic characteristics 213 may be , with a value of 2131 of this linguistic characteristic "subject". Such an analysis can be performed by any method known in the art and, accordingly, is not described in further detail below. For example, without limitation, such an analysis can be performed traditionally by a linguistic specialist, or by using a software algorithm of a linguistic (syntactic) processor. Moreover, in the presence of a sufficient number of examples, it is possible to perform such an analysis with the help of a statistical processor (neural network) using the neural network training technology.

[72] На основании выявленной первой части (основной) лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 и их значений 2131 в итоге формируют базу данных лингвистических признаков, являющуюся БДЛП текстовых элементов 21 лингвистического предложения 11. При этом первая часть лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 и их значения 2131 формирует уникальные лингвистические признаки текстовых элементов 21 лингвистического предложения 11.[72] Based on the identified first part (main) linguistic characteristics 213 of textual elements 21 of linguistic sentence 11 and their meanings 2131 ultimately form a database of linguistic features that is BDLP of textual elements 21 of linguistic sentence 11. At the same time, the first part of linguistic characteristics of 213 text elements 21 linguistic sentences 11 and their meanings 2131 forms the unique linguistic features of textual elements 21 of linguistic sentences 11.

[73] На фиг. 7, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 103 формирования второй структуры данных СМД. Этап 103 характеризуется: выполнением этапа 1031 идентификации и формирования первых элементов второй структуры данных СМД, на котором идентифицируют и формируют элементы 31 второй структуры данных СМД, а также идентификационные данные элементов 31, представляющие собой для каждого элемента 31, в качестве примера, но не ограничения, значение 311 элемента 31 второй структуры данных СМД и порядковый (порядковые) номер (номера) 312 ТЭ лингвистического предложения 11, составляющих элемент 31 (значение и порядковые номера ТЭ элементов 31); выполнением этапа 1032 формирования вторых элементов второй структуры данных СМД, на котором формируют элементы 32 второй структуры данных СМД, а также идентификационные данные элементов 32, представляющие собой для каждого элемента 32, в качестве примера, но не ограничения, значение 321 элементов 32 второй структуры данных СМД и порядковые номера 322 ТЭ лингвистического предложения 11, составляющих элементы 32 (значение и порядковые номера ТЭ элементов 32); выполнением этапа 1033 формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД путем объединения идентифицированных элементов 31 и 32 и их идентификационных данных (значений 311, 321 и порядковых номеров 312, 322 ТЭ).[73] FIG. 7, by way of example, but not limitation, shows the general scheme for performing the steps of step 103 of forming a second SMD data structure. Step 103 is characterized by: performing step 1031 of identifying and forming the first elements of the second SMD data structure, which identify and form the elements 31 of the second SMD data structure, as well as the identification data of the elements 31, representing for each element 31, as an example, but not limiting , the value 311 of the element 31 of the second SMD data structure and the ordinal (s) number (s) 312 TE of the linguistic sentence 11 constituting the element 31 (value and ordinal numbers of the TE elements 31); performing step 1032 of forming the second elements of the second SMD data structure, on which the elements 32 of the second SMD data structure are formed, as well as the identification data of the elements 32, representing for each element 32, as an example, but not limitation, the value 321 of the elements 32 of the second data structure SMD and sequence numbers 322 TE of linguistic sentence 11, constituting elements 32 (meaning and sequence numbers of TE elements 32); performing step 1033 of forming the second data structure of the DMD, which forms the second data structure of the DMD by combining the identified elements 31 and 32 and their identification data (values 311, 321 and sequence numbers 312, 322 TE).

[74] На фиг. 8, в качестве примера, но не ограничения, изображена общая структура сформированной второй структуры данных СМД. Вторая структура данных СМД представляет собой СМД, содержащий элементы 31 и (или) элементы 32, которые представляют собой синтаксические единицы (СЕ) лингвистического предложения 11 и идентификационные данные СЕ, представляющие собой для каждого СЕ, в качестве примера, но не ограничения, значение 311 элемента 31 и (или) значение 321 элемента 32, а также порядковый (порядковые) номер (номера) 312 и (или) 322 ТЭ 21 лингвистического предложения, составляющего (составляющих) элементы 31 и (или) элементы 32. Синтаксическими единицами (СЕ) предложения 11 предпочтительно являются отдельные слова и группы слов, связанные синтаксической связью. У СЕ лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН СЕ), имеющие практическое использование, в качестве примера, но не ограничения: «подлежащее», «сказуемое», «прямое дополнение» и тому подобное. В структуре данных элементы 31 и 32 именуются уникальными наименованиями и, в качестве примера, но не ограничения, могут именоваться как «УН СЕ n», где n ≥ 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН СЕ, ранее не встречавшегося в лингвистическом предложении. В качестве примера, но не ограничения для пояснения определения порядковых индексов элементов структуры данных, имеющих уникальное наименование (СЕ и иных, указанных далее) определение порядкового индекса УН СЕ может быть продемонстрировано следующим образом. В предложении: «Покупатель обязан оплатить и забрать оплаченные товар, тару и упаковку» имеются семь СЕ четырех уникальных наименований: «подлежащее» - одна СЕ, «сказуемое» - две СЕ, «определение» - одна СЕ и «дополнение» - три СЕ. В структуре данных будет содержаться один элемент «подлежащее», который будет иметь индекс «1», а также два элемента «сказуемое», которые будут иметь соответствующие индексы «1» и «2», причем индекс «1» будет иметь то «сказуемое», которое имеет меньший порядковый номер ТЭ, а также один элемент «определение», который будет иметь индекс «1», а также три элемента «дополнение», которые будут иметь соответствующие индексы «1», «2» и «3», причем индекс «1» будет иметь то «дополнение», которое имеет меньший порядковый номер ТЭ. В дальнейшем, при упоминании СЕ как элемента второй структуры данных имеется ввиду УН СЕ. По своей структуре СЕ могут состоять из одного слова или из нескольких слов. СЕ из одного слова (одного текстового элемента 21 предложения 11) – это всегда элемент 31, являющийся исходным синтаксическим объектом (ИСО), то есть членом предложения, установленным в результате синтаксического анализа. В дальнейшем, при упоминании элемента 31 второй структуры данных, являющегося ИСО, имеется в виду УН ИСО. При этом у членов предложения можно выделить множество характеристик, которые на практике могут породить перечень уточненных членов предложения. Таким образом список ИСО – это не заранее установленный список, а варьируемый, зависящий от предварительно заданных параметров список. Одно и то же слово (текстовый элемент 21 предложения 11) в предложении 11 может быть поименовано разной синтаксической единицей 31, в зависимости от наличия у данного текстового элемента 21 предложения 11 различных лингвистических характеристик 213 и их значений 2131, а также актуальности отдельных лингвистических характеристик. Например, но не ограничиваясь, при идентификации ИСО «дополнение», в котором не актуальны некоторые лингвистические характеристики 213 данного ИСО, к одному уникальному названию синтаксических единиц ИСО 31 будут отнесены и ИСО «прямое дополнение», и ИСО «косвенное дополнение». При актуализации всех лингвистических характеристик 213 ИСО как отдельных синтаксических единиц 31 будут идентифицированы ИСО «прямое дополнение» и ИСО «косвенное дополнение». Синтаксические единицы из нескольких слов (нескольких текстовых элементов 21 предложения 11) – это иногда ИСО (элемент 31), а иногда синтаксические конструкции (элемент 32). ИСО (элемент 31) из нескольких слов (текстовых элементов 21 предложения 11) встречаются, в частности, в ИСО «сказуемое». Например, но не ограничиваясь, ИСО «сказуемое» - «мог быть выполнен», - состоит из трех текстовых элементов 21 предложения 11 ввиду лингвистической особенности формирования сказуемого, которое, помимо глагола «выполнен» может иметь вспомогательный глагол «быть» и модальность (модальный глагол) «мог». Синтаксическая конструкция 32 всегда состоит из нескольких слов (текстовых элементов 21 предложения 11) и представляет собой конструкцию из синтаксически связанных ИСО (элементов 31), в качестве примера, но не ограничения, синтаксической конструкцией (УН СК) является «словосочетание», «синтаксический оборот» (причастный, деепричастный), «простое предложение», «сложное предложение» и т.д. В дальнейшем, при упоминании элемента 32 второй структуры данных, являющегося синтаксической конструкцией (СК), имеется ввиду УН СК. На практике, в целях решения прикладных задач, возможно формирование самых различных синтаксических конструкций, при этом перечень и описание синтаксических конструкций могут быть заданы предварительно. Перечень СЕ 31 (ИСО) и СЕ 32 (СК), которые подлежат идентификации в предложении 11, предпочтительно задается предварительно. [74] FIG. 8, as an example, but not limiting, the general structure of the formed second SMD data structure is depicted. The second SMD data structure is a MDD containing elements 31 and / or elements 32, which are the syntactic units (CE) of the linguistic sentence 11 and the identification data CE, representing for each CE, as an example, but not limited to, the value 311 element 31 and (or) value 321 elements 32, as well as ordinal (s) number (s) 312 and (or) 322 TE 21 linguistic sentences, constituting (making) elements 31 and (or) elements 32. Syntactic units (CE) sentences 11 would prefer There are separate words and groups of words connected by a syntactic link. The CE linguistic sentence 11 has characterizing their unique names (UN CE), which have practical use, as an example, but not limitation: "subject", "predicate", "direct addition" and the like. In the data structure, elements 31 and 32 are referred to as unique names and, by way of example, but not limitation, can be referred to as “UNC n”, where n ≥ 1 is the ordinal index of a unique name element in the linguistic sentence, starting with “1” for each New UN CE, not previously encountered in the linguistic sentence. As an example, but not limitation, to clarify the definition of the ordinal indexes of the elements of a data structure that have a unique name (CE and others, mentioned below), the definition of the ordinal index of a CE CE can be demonstrated as follows. In the proposal: “The buyer is obliged to pay and pick up the paid goods, containers and packaging” there are seven CE four unique names: “subject” - one CE, “predicate” - two CE, “definition” - one CE and “addition” - three CE . The data structure will contain one element “subject”, which will have index “1”, as well as two elements “predicate”, which will have corresponding indices “1” and “2”, with index “1” having that “predicate ", Which has a lower TE sequence number, as well as one element" definition ", which will have an index of" 1 ", as well as three elements of" addition ", which will have the corresponding indices" 1 "," 2 "and" 3 ", moreover, the index "1" will have that "addition", which has a lower sequence number of TE. Further, when the CE is mentioned as an element of the second data structure, it means the CE CE. In their structure, CE can consist of one word or several words. The CE of one word (one text element 21 of sentence 11) is always the element 31, which is the original syntactic object (ISO), that is, the member of the sentence established as a result of the syntax analysis. In the future, at the mention of the element 31 of the second data structure, which is ISO, I mean the UN ISO. At the same time, the members of the proposal can be identified many characteristics that in practice can generate a list of updated members of the proposal. Thus, the ISO list is not a predetermined list, but a variable list, depending on the previously set parameters. The same word (text element 21 of sentence 11) in sentence 11 may be named with a different syntactic unit 31, depending on whether the given text element 21 has sentence 11 of different linguistic characteristics 213 and their meanings 2131, as well as the relevance of individual linguistic characteristics. For example, but not limited to, in identifying an ISO “supplement”, in which some linguistic characteristics 213 of this ISO are not relevant, the ISO “direct addition” and ISO “indirect complement” will be assigned to one unique name of the ISO 31 syntax units. When updating all the linguistic characteristics of ISO 213 as separate syntactic units 31, the ISO “direct complement” and the ISO “indirect complement” will be identified. Syntactic units of several words (several text elements 21 of sentence 11) are sometimes ISO (element 31), and sometimes syntactic structures (element 32). The ISO (element 31) of several words (text elements 21 of sentence 11) are found, in particular, in ISO “predicate”. For example, but not limited to, the ISO “predicate” - “could be fulfilled” - consists of three text elements 21 of sentence 11 because of the linguistic peculiarity of the formation of the predicate, which, in addition to the “completed” verb, can have the auxiliary verb “be” and modality (modal verb) "could." The syntactic construction 32 always consists of several words (text elements 21 of sentence 11) and is a construction of syntactically related ISO (elements 31), as an example, but not limited to, a syntactic construction (UN SC) is a “phrase”, “syntax "(Participial, mixed)," simple sentence "," complex sentence ", etc. In the future, at the mention of the element 32 of the second data structure, which is the syntactic construction (IC), we mean the UNC SC. In practice, in order to solve applied problems, the formation of a wide variety of syntactic structures is possible, while the list and description of syntactic structures can be preset. The list of CE 31 (ISO) and CE 32 (UK), which are to be identified in Proposal 11, is preferably predefined.

[75] Идентификацию или формирование первого элемента 31 второй структуры данных СМД в рамках этапа 1031 производят путем комплексного анализа значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11. Элементы 31 второй структуры данных СМД, являющиеся ИСО, идентифицируемые (если состоят из одного ТЭ) или формируемые (если состоят из нескольких ТЭ) в рамках этапа 1031, фактически отождествляют с актуальными ИСО. Актуальные ИСО – это актуальный перечень ИСО с актуальными лингвистическими характеристиками, установленный предварительно и записанный в первую пользовательскую базу данных (первую ПБД), являющуюся таким образом базой данных актуальных синтаксических единиц (СЕ), содержащей актуальные ИСО и актуальные СК. Идентификацию и формирование (если требуется) элементов 31 ИСО производят путем сравнения зарегистрированных в базе данных лингвистических признаков (БДЛП) значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11 с предварительно заданными значениями лингвистических характеристик актуальных ИСО. При совпадении значений 2131 лингвистических характеристик 213 текстового элемента 21 лингвистического предложения 11 и предварительно заданных значений лингвистических характеристик актуальных ИСО выявленный текстовый элемент идентифицируют и при необходимости осуществляют его формирование как соответствующего ИСО (элемент 31). Такой комплексный анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети) посредством применения технологии обучения нейросети. Формирование второго элемента 32 второй структуры данных СМД в рамках этапа 1032 производят путем комплексного анализа значений 2131 лингвистических характеристик 213 текстовых элементов, являющихся ИСО (элементов 31). При выявлении лингвистических характеристик текстовых элементов, составляющих ИСО, которые соответствуют описанию синтаксической конструкции (СК), содержащемуся в базе данных актуальных СЕ, формируют СК (элементы 32) из упомянутых двух или более ИСО (элементов 31). Такой комплексный анализ может быть выполнен любым известным из уровня техники способом и, соответственно, подробно далее не описывается. Например, не ограничиваясь, такой комплексный анализ может быть выполнен традиционно специалистом-лингвистом, или же с помощью программного алгоритма лингвистического (синтаксического) процессора. Более того, при наличии достаточного количества примеров возможно выполнение такого анализа с помощью статистического процессора (нейросети) посредством применения технологии обучения нейросети. [75] The identification or formation of the first element 31 of the second SMD data structure in step 1031 is carried out by comprehensive analysis of the values 2131 of the linguistic characteristics 213 of the text elements 21 of the linguistic sentence 11. The elements 31 of the second MDD data structure that are ISO identifiable (if they consist of one ) or formed (if they consist of several TE) at stage 1031, in fact, they are identified with actual ISO. Relevant ISO is an up-to-date list of ISO with current linguistic characteristics, pre-installed and recorded in the first user database (first PDU), which is thus a database of current syntactic units (CE) containing the current ISO and current IC. Identification and formation (if required) of ISO elements 31 is carried out by comparing the values of 2131 linguistic characteristics 213 of textual elements 21 of linguistic sentence 11 with predefined values of linguistic characteristics of the current ISOs recorded in the linguistic characteristics database (BDLP). If the values of 2131 linguistic characteristics 213 of the text element 21 of the linguistic sentence 11 and the predefined values of the linguistic characteristics of the current ISO match, the identified text element is identified and, if necessary, is formed as the corresponding ISO (element 31). Such a comprehensive analysis can be performed by any method known in the art and, accordingly, is not described in detail below. For example, without limitation, such a complex analysis can be performed traditionally by a specialist-linguist, or using a software algorithm of a linguistic (syntactic) processor. Moreover, in the presence of a sufficient number of examples, it is possible to perform such an analysis with the help of a statistical processor (neural network) using the neural network training technology. The formation of the second element 32 of the second MDD data structure in the framework of step 1032 is carried out by a comprehensive analysis of the values of 2131 linguistic characteristics of 213 text elements that are ISO (elements 31). When identifying the linguistic characteristics of the text elements constituting ISO, which correspond to the description of the syntactic structure (IC) contained in the database of current CE, form IC (elements 32) of the two or more ISO (elements 31) mentioned. Such a comprehensive analysis can be performed by any method known in the art and, accordingly, is not described in detail below. For example, without limitation, such a complex analysis can be performed traditionally by a specialist-linguist, or using a software algorithm of a linguistic (syntactic) processor. Moreover, in the presence of a sufficient number of examples, it is possible to perform such an analysis with the help of a statistical processor (neural network) using the neural network training technology.

[76] Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 31 (ИСО) второй структуры данных СМД в рамках этапа 1032 производят следующим образом: значение (значения) 211 текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) элемент 31, идентифицируют как значение 311 элемента 31 (ИСО), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) элемент 31, идентифицируют как порядковый (порядковые) номер (номера) 312 текстового (текстовых) элемента (элементов), составляющего (составляющих) элемент 31 (ИСО). Идентификацию значения и порядковых номеров ТЭ элемента 32 (СК) второй структуры данных СМД в рамках этапа 1032 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 32, идентифицируют как значение 321 элемента 32 (СК), а порядковые номера 212 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 32 идентифицируют как порядковые номера текстовых элементов 322, составляющих элемент 32 (СК).[76] The identification of the value and ordinal (ordinal) number (s) of the TE element 31 (ISO) of the second SMD data structure in step 1032 is as follows: the value (s) 211 of the text (text) element (s) 21 of the linguistic sentence 11, the constituent element (s) 31 is identified as the value 311 of the element 31 (ISO), and the ordinal number (s) 212 of the said (mentioned) text (s) element (s) 21 of the linguistic sentence 11 constituting the (constituent) element 31 ID It is referred to as the ordinal (s) number (s) 312 of the text (s) element (s) constituting (s) element 31 (ISO). The value and sequence numbers of the TE element 32 (SC) of the second SMD data structure in step 1032 are identified as follows: the values 211 of the text elements 21 of the linguistic sentence 11 constituting the element 32 are identified as the value 321 elements 32 (SC) and the sequence numbers 212 the above-mentioned text elements 21 of the linguistic sentence 11 constituting the element 32 are identified as the sequence numbers of the text elements 322 constituting the element 32 (UK).

[77] Формирование второй структуры данных СМД в ходе этапа 1033 производят путем объединения в одной структуре данных элементов 31 второй структуры данных СМД и элементов 32 второй структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются.[77] The formation of the second MDD data structure during step 1033 is performed by combining in one data structure the elements 31 of the second MDD data structure and the elements 32 of the second MDD data structure, as well as their identification data according to the principles and methods known from the prior art. further not described in detail.

[78] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 31 (ИСО) второй структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих ИСО 31, и получения значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 31 (ИСО). Идентификация лингвистических характеристик ТЭ, составляющих элементы 32 (СК) второй структуры данных СМД и их значений при необходимости производится путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих СК 32, и получения значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 32 (СК). При этом, как было описано ранее, лингвистическими признаками элементов 31 (ИСО) и 32 (СК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 31 (ИСО) и 32 (СК).[78] Identification of linguistic characteristics of TE, constituting elements 31 (ISO) of the second SMD data structure and their values, if necessary, is made by organizing a query in the BDLP, formed during step 102, consisting of identification data of TE, constituting ISO 31, and obtaining values 2131 linguistic characteristics of 213 text elements 21 of the linguistic sentence 11, of which element 31 (ISO) consists. Identification of linguistic characteristics of TE, constituting elements 32 (SC) of the second SMD data structure and their values, if necessary, is done by organizing a query in the BDLP, formed in step 102, consisting of identification data of TE, comprising SC 32, and obtaining values of 2131 linguistic characteristics 213 text elements 21 of the linguistic sentence 11, of which element 32 (UK) is composed. At the same time, as described earlier, the linguistic features of elements 31 (ISO) and 32 (UK) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which elements 31 (ISO) and 32 (UK) consist.

[79] На фиг. 9, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 104 формирования третьей структуры данных СМД. Этап 104 характеризуется: выполнением этапа 1041 идентификации первого элемента третьей структуры данных СМД, на котором идентифицируют или формируют элементы 41 третьей структуры данных СМД, а также идентификационные данные элементов 41, представляющие собой для каждого элемента 41, в качестве примера, но не ограничения, значение 411 элемента 41 третьей структуры данных СМД и порядковый (порядковые) номер (номера) 412 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 41; выполнением этапа 1042 формирования второго элемента третьей структуры данных СМД, на котором формируют элементы 42 третьей структуры данных СМД а также идентификационные данные элементов 42, представляющие собой для каждого элемента 42, в качестве примера, но не ограничения, значение 421 элемента 42 третьей структуры данных СМД и порядковый (порядковые) номер (номера) 422 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 42; выполнением этапа 1043 формирования третьей структуры данных СМД, на котором формируют третью структуру данных СМД путем объединения идентифицированных элементов 41 и 42 и их идентификационных данных.[79] FIG. 9, by way of example, but not limitation, shows the general scheme for performing the steps of step 104 of forming the third SMD data structure. Step 104 is characterized by: performing step 1041 of identifying the first element of the third SMD data structure, which identifies or forms the elements 41 of the third SMD data structure, as well as the identification data of the elements 41, representing for each element 41, as an example, but not limitation, the value 411 of the element 41 of the third SMD data structure and the ordinal number of the linguistic sentence 11 of the TE, constituting the constituent element 41; performing step 1042 of forming the second element of the third SMD data structure on which the elements 42 of the third SMD data structure are formed as well as the identification data of the elements 42, representing for each element 42, as an example, but not limitation, the value 421 of the element 42 of the third SMD data structure and ordinal (s) number (s) 422 TE linguistic sentences 11, constituent (s) element 42; performing step 1043 of forming a third MDD data structure, wherein the third MDD data structure is formed by combining the identified elements 41 and 42 and their identification data.

[80] На фиг. 10, в качестве примера, но не ограничения, изображена общая структура сформированной третьей структуры данных СМД. Третья структура данных СМД представляет собой СМД, содержащий элементы 41 и (или) элементы 42, которые представляют собой лингвистические объекты (ЛО) лингвистического предложения 11 и идентификационные данные ЛО, представляющие собой для каждого ЛО, в качестве примера, но не ограничения, значение 411 элемента 41 и (или) значение 421 элемента 42 (значение элементов 41 и (или) 42), а также порядковый (порядковые) номер (номера) 412 и (или) 422 текстовых элементов 21 лингвистического предложения, составляющего (составляющих) элемент 41 и (или) элемент 42 (порядковые номера ТЭ элементов 41 и (или) 42). Лингвистическим объектом (ЛО) является особая синтаксическая единица (ОСЕ). У ЛО лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ЛО), имеющие практическое использование в качестве примера, но не ограничения, представляет собой: «простое предложение без однородных членов и оборотов», «первое словосочетание» и тому подобное. В структуре данных элементы 41 и 42 именуются уникальными наименованиями, в качестве примера, но не ограничения, могут именоваться как «УН ЛО n», где n ≥ 1 - порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ЛО, ранее не встречавшегося в лингвистическом предложении. В дальнейшем, при упоминании ЛО как элемента третьей структуры данных или элементов 41 и 42 третьей структуры данных имеется ввиду УН ЛО. ОСЕ предварительно формируют в рамках лингво-логического преобразования, результатом которого является выполнение корреляции лингвистических и логических объектов и преобразование синтаксических единиц предложения в массив логических объектов. Механизм лингво-логического преобразования позволяет на основании заранее известного представления о логической модели предложения (логической структуре простого неосложненного предложения, идентичного простому суждению) установить корреляцию (взаимосвязь) между логическими объектами предложения и синтаксическими единицами предложения. В ходе формирования таблицы взаимосвязанных (лингвистических и логических) объектов в каждом отдельном случае формируются такие ОСЕ, являющиеся искомыми лингвистическими объектами (искомые ЛО), которые могут быть отождествлены с искомыми логическими объектами (искомыми ЛогО). Сформированный таким образом искомый ЛО может быть полностью тождественен одному или нескольким СЕ (такой искомый ЛО будет порождать первый лингвистический объект (первый ЛО), являющийся элементом 41 лингвистического предложения 11), либо представлять собой производный синтаксический объект, полученный путем преобразования одного или нескольких СЕ в объект, который будет являться объектом, тождественным искомому ЛО (такой искомый ЛО будет порождать второй лингвистический объект (второй ЛО), являющийся элементом 42 лингвистического предложения 11). Искомыми ЛогО могут быть отдельные логические объекты или группы логических объектов, которые являются логическими сущностями и сформированы по законам логики (науке о мышлении). При этом существуют базовые академические логические сущности, в качестве примера, но не ограничения, такие как «понятие», «суждение», «субъект суждения» (то, о чем что-либо утверждается или отрицается в суждении), «предикат суждения» (то, что утверждается или отрицается о субъекте суждения). Вместе с тем, в практических целях могут быть сформированы и иные логические сущности, отражающие потребности текущей прикладной задачи и используемые в рамках лингво-логического преобразования. Например, не ограничиваясь, в предикате суждения могут быть выделены отдельные более функционально однородные логические сущности, нежели сам предикат суждения, а именно – «действие предиката суждения», «объект предиката суждения» и «обстоятельства предиката суждения». [80] FIG. 10, as an example, but not limiting, the general structure of the formed third SMD data structure is depicted. The third data structure of the SMD is a SMD containing elements 41 and / or elements 42, which are the linguistic objects (LO) of the linguistic sentence 11 and the identification data of the LO, which for each LO, as an example, but not limitation, is 411 the element 41 and (or) the value 421 of the element 42 (the value of the elements 41 and (or) 42), as well as the ordinal (s) number (s) 412 and (or) 422 text elements 21 of the linguistic sentence constituting (constituting) the element 41 and (or) element 42 (orders of magnitude Number of TE elements of 41 and (or) 42). A linguistic object (LO) is a special syntactic unit (EfE). LO linguistic sentence 11 has characterizing their unique names (UN LO), which have practical use as an example, but not limitation, is: “a simple sentence without homogeneous members and turns”, “first phrase” and the like. In the data structure, elements 41 and 42 are referred to as unique names, by way of example, but not limitation, can be referred to as “UN LU n”, where n ≥ 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN LO, not previously encountered in the linguistic sentence. In the future, when reference is made to LO as an element of the third data structure or elements 41 and 42 of the third data structure, it is meant UNL. EfE is pre-formed within the framework of the linguo-logical transformation, the result of which is the performance of the correlation of linguistic and logical objects and the conversion of syntactic units of a sentence into an array of logical objects. The linguistic-logical transformation mechanism makes it possible to establish a correlation (relationship) between the logical objects of the sentence and the syntactic units of the sentence based on a previously known idea of the logical model of the sentence (the logical structure of a simple uncomplicated sentence identical to a simple judgment). In the course of forming a table of interrelated (linguistic and logical) objects in each individual case, such EfEs are formed, which are the required linguistic objects (sought LO), which can be identified with the desired logical entities (sought LogO). The desired LO generated in this way can be completely identical to one or several CE (such a sought LO will generate the first linguistic object (the first LO), which is the element 41 of the linguistic sentence 11), or it can be a derived syntactic object obtained by converting one or several CE into an object that will be an object that is identical to the desired LO (such a sought LO will generate a second linguistic object (the second LO), which is the element 42 of the linguistic clause 11). The desired logical objects can be separate logical objects or groups of logical objects that are logical entities and are formed according to the laws of logic (the science of thinking). At the same time, there are basic academic logical entities, as an example, but not limitations, such as "concept", "judgment", "subject of judgment" (what something is affirmed or denied in judgment), "predicate judgment" ( that which is affirmed or denied about the subject of judgment). At the same time, for practical purposes, other logical entities can also be formed that reflect the needs of the current application and are used in the framework of the linguo-logical transformation. For example, without limiting, in a predicate of judgment, separate more functionally homogeneous logical entities can be distinguished than the predicate of judgment itself, namely, “the action of the predicate of judgment”, “the object of the predicate of judgment” and “the circumstances of the predicate of judgment”.

[81] Идентификацию элемента 41 (первый ЛО) третьей структуры данных СМД в рамках этапа 1041 производят путем анализа состава искомых ЛО. При этом состав искомых ЛО предварительно задают в виде СЕ уникального наименования (УН СЕ) или списка СЕ уникальных наименований с указанием способа формирования ЛО, которым, не ограничиваясь, может быть один из следующих способов: отождествление с установленным (несколькими установленными) СЕ или преобразование установленного (установленных) СЕ по описанному ранее способу. Упомянутые состав искомых ЛО и способы формирования ЛО формируют собой вторую пользовательскую базу данных (вторую ПБД), являющуюся таким образом базой данных искомых ЛО, содержащую, в том числе, и лингвистические характеристики текстовых элементов, из которых формируются искомые ЛО. Если в результате анализа состава конкретного ЛО будет установлено, что анализируемый ЛО состоит из отождествляемых СЕ (элементов 31 или элементов 32), то такой ЛО идентифицируют (если тождественен одному СЕ) или формируют (если тождественен нескольким СЕ) как элемент 41 третьей структуры данных СМД. Идентифицированные в рамках анализа состава лингвистических объектов синтаксические единицы (элементы 31 или элементы 32) второй структуры данных СМД в соответствии с предварительно заданными параметрами идентификации или формирования элементов 41 третьей структуры данных СМД содержащиеся в описании искомых лингвистических объектов, отождествляют с первым ЛО (первым лингвистическим объектом (элементом 41 третьей структуры данных СМД)), благодаря чему формируют элемент 41 третьей структуры данных СМД. Дополнительной частью элемента 41 третьей структуры данных СМД могут быть служебные части речи (предлоги, союзы, частицы) и знаки препинания, находящиеся между объединяемыми в рамках элемента 41 третьей структуры данных СМД синтаксическими единицами в соответствии со способом формирования первого ЛО, установленным пользователем. Если в результате анализа состава конкретного ЛО будет установлено, что анализируемый ЛО состоит из преобразуемых СЕ, то такой лингвистический объект будет относиться к элементам 42 третьей структуры данных СМД (вторым ЛО) и формироваться в рамках этапа 1042. Формирование элемента 42 третьей структуры данных СМД (второго ЛО) в рамках этапа 1042 производят путем преобразования СЕ, предварительно заданных в описании искомых ЛО вида «второй ЛО» по предварительно заданному способу преобразования во второй ПБД. Преобразование СЕ в элементы 42 третьей структуры данных СМД является необязательным действием для настоящего способа преобразования структурированного массива данных. Настоящий способ преобразования структурированного массива данных может быть с достаточной эффективностью и точностью реализован даже при осуществлении лишь идентификации элемента 41 третьей структуры данных СМД при условии, что все искомые ЛО порождают только первый ЛО, являющийся элементом 41 лингвистического предложения 11.[81] The identification of the element 41 (first LO) of the third SMD data structure under step 1041 is made by analyzing the composition of the sought LO. In this case, the composition of the sought LOs is preset in the form of the CE unique name (CE CE) or the list of CE unique names indicating the method of forming the LO, which, without limitation, can be one of the following ways: identification with the established (several established) CE or conversion of the established (established) CE by the method described earlier. The aforementioned list of sought LOs and methods of generating LO form a second user database (second PBB), which is thus the database of sought LOs, including, among other things, the linguistic characteristics of the textual elements from which the sought LOs are formed. If, as a result of analyzing the composition of a specific LO, it is established that the analyzed LO consists of identified CE (elements 31 or elements 32), then such LO is identified (if identical to one CE) or formed (if identical to several CE) as element 41 of the third SMD data structure . Identified within the framework of the analysis of the composition of linguistic objects, syntactic units (elements 31 or elements 32) of the second data structure of the MDD in accordance with the preset identification parameters or the formation of elements 41 of the third data structure of the DMD are identified with the first LO (first linguistic object (element 41 of the third data structure of the MDD)), due to which the element 41 of the third data structure of the MDD is formed. An additional part of the element 41 of the third SMD data structure may be service parts of speech (prepositions, conjunctions, particles) and punctuation marks between syntax units between the third SMD data structure that are combined within the third data structure of the SMD, set by the user. If, as a result of analyzing the composition of a particular LO, it is determined that the LO analyzed consists of convertible CEs, then such a linguistic object will belong to the elements 42 of the third SMD data structure (second LO) and be formed within step 1042. The formation of an element 42 of the third SMD data structure ( second LO) in the framework of step 1042 is produced by converting CE, previously specified in the description of the desired LO type "second LO" according to a predefined method of conversion to the second PBB. The conversion of CE to the elements 42 of the third SMD data structure is an optional step for the present method of converting a structured data array. This method of transforming a structured data array can be implemented with sufficient efficiency and accuracy even if only the element 41 of the third SMD data structure is identified, provided that all the desired LOs generate only the first LO, which is the element 41 of the linguistic sentence 11.

[82] Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ, элемента 41 (первый ЛО) третьей структуры данных СМД в рамках этапа 1041 производят следующим образом: значение (значения) 311 или 321 элемента (элементов) 31 или 32 лингвистического предложения 11, отождествленного (отождествленных) с элементом 41 (первый ЛО), идентифицируют как значение 411 элемента 41 (первый ЛО), а порядковый (порядковые) номер (номера) 312 или 322 ТЭ элемента (элементов) 31 или 32 лингвистического предложения 11, отождествленного (отождествленных) с элементом 41 (первый ЛО) идентифицируют как порядковый (порядковые) номер (номера) 412 текстового (текстовых) элемента (элементов), составляющего (составляющих) элемент 41 (первый ЛО). Если формирование элемента 41 производят согласно требованиям второй ПБД путем объединения нескольких СЕ, то к значениям и номерам ТЭ элемента 41 (первый ЛО) третьей структуры данных СМД добавляют значения и порядковые номера ТЭ служебных частей речи (предлоги, союзы, частицы) и знаки препинания, находящиеся между объединяемыми СЕ. Идентификацию значения и порядкового (порядковых) номеров ТЭ элемента 42 (второй ЛО) третьей структуры данных СМД в рамках этапа 1042 производят следующим образом: значение (значения) преобразованных СЕ (из элемента (элементов) 31 и (или) 32 лингвистического предложения 11), отождествленного (отождествленных) с элементом 42 (второй ЛО), идентифицируют как значение 421 элемента 42 (второй ЛО), а порядковый (порядковые) номер (номера) преобразованных СЕ (из элемента (элементов) 31 и (или) 32 лингвистического предложения 11), отождествленного (отождествленных) с элементом 42 (второй ЛО) идентифицируют как порядковый (порядковые) номер (номера) 422 текстового (текстовых) элемента (элементов), составляющего (составляющих) элемент 42 (второй ЛО).[82] The identification of the value and ordinal (ordinal) number (s) of TE, element 41 (first LO) of the third SMD data structure as part of step 1041 is as follows: value (values) 311 or 321 elements (elements) 31 or 32 of the linguistic sentence 11, identified (identified) with the element 41 (first LO), is identified as the value 411 of the element 41 (first LO), and the ordinal (ordinal) number (s) 312 or 322 TE elements (s) 31 or 32 of the linguistic sentence 11, identified (identified) with element 41 (first L ) Is identified as a sequential (sequence) number (s) 412 of the text (text) element (s) constituting the (constituent) element 41 (first LO). If element 41 is formed according to the requirements of the second PBB by combining several CE, then values and TE numbers of service parts of speech (prepositions, conjunctions, particles) and punctuation marks are added to the values and TE numbers of element 41 (first LO) of the third data structure of the MDD, between the merged CEs. The identification of the value and ordinal (ordinal) numbers of the TE element 42 (second LO) of the third SMD data structure in step 1042 is performed as follows: the value (values) of the transformed CE (from the element (elements) 31 and (or) 32 linguistic sentences 11), identified (identified) with the element 42 (second LO), identify as the value 421 elements 42 (second LO), and the ordinal (ordinal) number (s) of the transformed CE (from the element (s) 31 and (or) 32 linguistic sentences 11) identified with the the element 42 (second LO) is identified as the ordinal (s) number (s) 422 of the text (s) element (s) constituting (constituting) the element 42 (second LO).

[83] Формирование третьей структуры данных СМД в ходе этапа 1043 производят путем объединения в одной структуре данных элементов 41 третьей структуры данных СМД и элементов 42 третьей структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются.[83] The formation of the third MDD data structure during step 1043 is performed by combining in one data structure the elements 41 of the third MDD data structure and the elements 42 of the third MDD data structure, as well as their identification data according to principles and methods known from the prior art further not described in detail.

[84] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 41 (первый ЛО) третьей структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих первый ЛО 41, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 41 (первый ЛО). Идентификацию лингвистических характеристик ТЭ, составляющих элементы 42 (второй ЛО) третьей структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих второй ЛО 42, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 42 (второй ЛО). При этом, как было описано ранее, лингвистическими признаками элементов 41 (первый ЛО) и 42 (второй ЛО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 41 (первый ЛО) и 42 (второй ЛО).[84] Identification of the linguistic characteristics of the TEs that make up the elements 41 (first LO) of the third data structure of the SMD data and their values, if necessary, is made by organizing a request to the BDLP, formed during step 102, consisting of the identification data of the TEs that make up the first LO 41, and getting values of 2131 linguistic characteristics of 213 text elements 21 of the linguistic sentence 11, of which element 41 consists (first LO). The linguistic characteristics of the TEs that make up the elements 42 (second LO) of the third SMD data structure and their values, if necessary, are identified by organizing a query in the BDLP formed during step 102, consisting of the identification data of the TEs that make up the second LO 42, and obtaining 2131 linguistic values characteristics of 213 text elements 21 of the linguistic sentence 11, of which element 42 consists (second LL). At the same time, as described earlier, the linguistic features of elements 41 (first LO) and 42 (second LO) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 41 (first LO) and 42 ( second LO).

[85] На фиг. 11, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 105 формирования четвертой структуры данных СМД. Этап 105 характеризуется формированием элемента четвертой структуры данных, при котором формируют элементы 51 четвертой структуры данных СМД, а также идентификационные данные элементов 51, представляющие собой для каждого элемента 51, в качестве примера, но не ограничения, значение 511 элемента 51 четвертой структуры данных СМД и порядковый (порядковые) номер (номера) 512 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 51.[85] FIG. 11, by way of example, but not limitation, shows the general scheme for executing step 105 of forming the fourth SMD data structure. Step 105 is characterized by the formation of an element of the fourth data structure, in which the elements 51 of the fourth SMD data structure are formed, as well as the identification data of the elements 51, which for each element 51, as an example, but not limitation, the value 511 of the element 51 of the fourth SMD data structure and ordinal (s) number (s) 512 TE linguistic sentences 11, constituting (making) element 51.

[86] На фиг. 12, в качестве примера, но не ограничения, изображена общая структура сформированной четвертой структуры данных СМД. Четвертая структура данных СМД представляет собой СМД, содержащий элементы 51 четвертой структуры данных СМД, которые представляют собой логические объекты (ЛогО) лингвистического предложения 11 и идентификационные данные ЛогО, представляющие собой для каждого ЛогО, в качестве примера, но не ограничения, значение 511 элемента 51 четвертой структуры данных СМД (значение элемента 51) и порядковый (порядковые) номер (номера) 512 ТЭ, составляющего (составляющих) элемент 51 (порядковые номера 512 ТЭ элемента 51). Логические объекты (ЛогО) являются логическими сущностями и сформированы по законам логики (науки о мышлении). У ЛогО лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ЛогО), имеющие практическое использование, в качестве примера, но не ограничения, - «понятие», «суждение», «субъект суждения» (то, о чем что-либо утверждается или отрицается в суждении), «предикат суждения» (то, что утверждается или отрицается о субъекте суждения и тому подобное. В структуре данных элементы 51 именуются уникальными наименованиями, в качестве примера, но не ограничения, могут именоваться как «УН ЛогО n», где n ≥ 1 - порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ЛогО, ранее не встречавшегося в лингвистическом предложении элемента в лингвистическом предложении. В дальнейшем, при упоминании ЛогО как элемента четвертой структуры данных или элемента 51 четвертой структуры данных имеется ввиду УН ЛогО. Массив логических объектов предложения представляет собой иной, нелингвистический способ регистрации смысла того, о чем идет речь в лингвистическом предложении. В отличии от лингвистического предложения, смысл которого может быть сохранен только при условии регистрации всех текстовых элементов предложения в одном месте (в виде одной единицы информации), массив логических объектов позволяет хранить ту же информацию без потери смысла в разделенном виде, во множестве независимых мест хранения информации (в виде массива логических объектов). При этом формирование массива логических объектов позволяет не просто разделить единую информацию на части, но и системно структурировать эти части для любых преобразуемых в рамках настоящего способа лингвистических предложений. Возможность регистрации и хранения логически и системно структурированной информации по частям открывает новые возможности для высокоточной обработки такой информации, поскольку в этом случае поиск и анализ информации технически может проводиться не в едином объеме исходной информации (лингвистическом предложении), а только в определенных логических частях этой информации, характеристики и требования к которым соответствуют логической сути и логическому предмету поиска или анализа. В результате такой способ хранения информации существенно уменьшает объем (зону) поиска и анализа, что приводит к уменьшению времени и повышению качества (релевантности, точности) поиска и анализа.[86] FIG. 12, by way of example, but not limitation, the overall structure of the formed fourth SMD data structure is depicted. The fourth data structure of the MDD is a DMD containing elements 51 of the fourth data structure of the MDD, which are logical entities (LogO) of the linguistic sentence 11 and the identification data of LogO, which for each LogO, as an example, but not limitation, the value 511 of the element 51 the fourth data structure of the SMD (the value of the element 51) and the ordinal (s) number (s) of 512 TEs constituting (constituting) the element 51 (serial numbers 512 of the TE element 51). Logical objects (Logo) are logical entities and are formed according to the laws of logic (science of thinking). LogO linguistic sentence 11 has characterizing their unique names (UNLOGO), having practical use, as an example, but not limitation, - “concept”, “judgment”, “subject of judgment” (something about which something is approved or is denied in the judgment), "predicate judgments" (what is approved or denied about the subject of judgment, etc.) In the data structure, the elements 51 are called unique names, as an example, but not limitation, can be referred to as "UN LogO n", where n ≥ 1 - the order index The unique name in the linguistic sentence, starting with "1" for each new UNO LogO, previously not encountered in the linguistic sentence, is an element in the linguistic sentence. Later, when LogO is mentioned as an element of the fourth data structure or the element 51, the fourth data structure means UNL An array of logical objects of a sentence is a different, non-linguistic method of registering the meaning of what is involved in a linguistic sentence. Unlike a linguistic sentence, the meaning of which can be saved only if all the text elements of the sentence are registered in one place (as a single unit of information), an array of logical objects allows storing the same information without loss of meaning in a divided form, in many independent storage locations information (in the form of an array of logical objects). At the same time, the formation of an array of logical objects allows not only to divide a single information into parts, but also to systematically structure these parts for any linguistic sentences transformed within the framework of this method. The possibility of registering and storing logically and systemically structured information in parts opens up new possibilities for highly accurate processing of such information, since in this case the search and analysis of information can technically be conducted not in a single volume of initial information (linguistic sentence), but only in certain logical parts of this information , characteristics and requirements for which correspond to the logical essence and logical subject of search or analysis. As a result, this method of storing information significantly reduces the volume (zone) of search and analysis, which leads to a decrease in time and an increase in the quality (relevance, accuracy) of search and analysis.

[87] Формирование элемента 51 (ЛогО) четвертой структуры данных СМД в рамках этапа 105 производят с помощью третьей структуры данных СМД, содержащей лингвистические объекты (ЛО) и базы данных корреляции лингвистических и логических объектов, представляющей собой, таким образом, третью пользовательскую базу данных (третью ПБД). Третью ПБД формируют для лингво-логического преобразования предварительно. Третья ПБД представляет собой перечень необходимых логических объектов, которые могут быть выделены в лингвистическом предложении и на которые оно может быть в итоге разделено. Кроме этого, третья ПБД содержит перечень лингвистических объектов уникальных наименований (УН ЛО) и описаний лингвистических объектов, которые предполагают тождественными искомым логическим объектам уникальных наименований (УН ЛогО) при указанных условиях (указанном составе УН ЛО (перечень СЕ) и (или) указанном способе преобразования СЕ, а также указанных лингвистических характеристиках упомянутых СЕ). Для формирования логического объекта 51, коррелированного с выбранным лингвистическим объектом 41 или 42 в третьей структуре данных выбирают отдельный ЛО (из перечня ЛО) и с помощью третьей ПБД выявляют коррелированный с УН ЛО логический объект (УН ЛогО), в качестве примера, но не ограничения, выбирают из третьей структуры данных ЛО с уникальным наименованием (УН ЛО) «первое словосочетание» (словосочетание состоящее из простого предложения без однородных членов и оборотов (например, подлежащее) и все зависимые от него слова)) и направляют этот УН ЛО в качестве запроса в третью ПБД для поиска выбранного УН ЛО в перечне уникальных наименований имеющихся там ЛО. При обнаружении такого УН ЛО (например, «первое словосочетание») в соответствии с третьей ПБД получают отождествленное с ним УН логического объекта (в приведенном примере УН ЛогО - «субъект суждения»). Таким образом формируют логический объект (элемент 51 четвертой структуры данных СМД) для выбранного лингвистического объекта 41 или 42. Результатом формирования элемента 51 является выявленное УН ЛогО.[87] the Formation of the element 51 (Logo) of the fourth data structure of the MDD in the framework of step 105 is produced using the third data structure of the MDD containing linguistic objects (LO) and the correlation database of linguistic and logical objects, thus representing the third user database (third PBB). The third PBB is preliminarily formed for the linguo-logical transformation. The third PBB is a list of the necessary logical objects that can be distinguished in the linguistic sentence and into which it can eventually be divided. In addition, the third PBB contains a list of linguistic objects of unique names (UN LO) and descriptions of linguistic objects that assume the unique logical objects of unique names that are identical (UN LogO) under the specified conditions (indicated composition of UN LO (list of CE) and / or specified method transformations of the CE, as well as the specified linguistic characteristics of the mentioned CE). For the formation of the logical object 51, correlated with the selected linguistic object 41 or 42 in the third data structure, a separate LO is selected (from the list of LOs) and using the third PBB, a logical object correlated with the UN LO is detected, as an example, but not limitation , choose from the third data structure of LO with a unique name (UN LO) “the first word combination” (a word combination consisting of a simple sentence without homogeneous members and turnovers (for example, a subject) and all words dependent on it)) and send this UN LO as a request to the third PBD to search for the selected LV LO in the list of unique names of the LOs there. Upon detection of such a LV LO (for example, “the first phrase”), in accordance with the third PBB, the LV of the logical object that is identified with it (in the given example, the LV LogO is the “subject of judgment”). Thus, a logical object (element 51 of the fourth SMD data structure) is formed for the selected linguistic object 41 or 42. The result of the formation of element 51 is the identified UN LogO.

[88] Идентификацию значения и порядковых номеров ТЭ элемента 51 (ЛогО) четвертой структуры данных СМД в рамках этапа 105 производят следующим образом: значение (значения) 211 текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) коррелированный с элементом 51 элемент 41 или 42, идентифицируют как значение 511 элемента 51 (ЛогО), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) коррелированный с элементом 51 элемент 41 или 42 идентифицируют как порядковый (порядковые) номер (номера) текстового (текстовых) элемента (элементов) 512, составляющего (составляющих) элемент 51 (ЛогО).[88] The identification of the value and sequence numbers of the TE element 51 (LogO) of the fourth SMD data structure in step 105 is as follows: the value (values) 211 of the text (text) element (elements) 21 of the linguistic sentence 11 constituting (components) correlated with element 51, element 41 or 42, is identified as the value 511 of element 51 (LogO), and the ordinal number (s) 212 of the said (mentioned) text (text) element (s) 21 of the linguistic sentence 11 constituting (components) correlated with element 51, element 41 or 42 is identified as the ordinal (s) number (s) of the text (s) element (s) 512 constituting (constituting) element 51 (LogO).

[89] Формирование четвертой структуры данных СМД в ходе этапа 105 производят путем объединения в одной структуре данных элементов 51 четвертой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются.[89] The formation of the fourth MDD data structure during step 105 is performed by combining in one data structure the elements 51 of the fourth MDD data structure, as well as their identification data according to principles and methods known from the prior art, which, respectively, are not described in further detail below.

[90] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 51 (ЛогО) четвертой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих ЛогО 51, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 51 (ЛогО). При этом, как было описано ранее, лингвистическими признаками элементов 51 (ЛогО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 51 (ЛогО).[90] Identification of linguistic characteristics of TEs that make up the elements 51 (LogO) of the fourth data structure of the SMD and their values, if necessary, is produced by organizing a query in the BDLP, formed during step 102, consisting of the identification data of TEs comprising LogO 51, and obtaining 2131 linguistic characteristics of 213 text elements 21 of the linguistic sentence 11, of which element 51 (Logo) consists. At the same time, as described earlier, the linguistic features of elements 51 (LogO) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 51 (LogO) consist.

[91] Далее, после завершения описанного ранее этапа 103, в целях повышения точности последующего поиска в структурированном массиве данных становится возможным осуществить дальнейшее преобразование СМД, содержащего, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и их идентификационные данные.[91] Further, after completing step 103 described earlier, in order to improve the accuracy of a subsequent search in a structured dataset, it becomes possible to further convert the MDD containing at least the syntactic units (CE) of the linguistic sentence and their identification data.

[92] На фиг. 13, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 200 преобразования СМД, содержащего, по меньшей мере, синтаксические единицы (СЕ) лингвистического предложения и идентификационные данные СЕ, являющегося исходной структурой данных для рассматриваемого способа 200. Заявленный способ 200 преобразования СМД, содержащего, по меньшей мере, СЕ лингвистического предложения и идентификационные данные СЕ, характеризуется: выполнением этапа 201 идентификации пригодной для преобразования структуры данных, содержащей СЕ, на котором идентифицируют структуру данных СМД, содержащую элементы упомянутой пригодной для преобразования структуры данных, содержащей СЕ, являющейся исходной структурой данных СМД в рамках рассматриваемого способа 200, причем упомянутые элементы пригодной для преобразования структуры данных представляют собой синтаксические единицы (СЕ) лингвистического предложения и идентификационные данные СЕ; выполнением этапа 202 формирования пятой структуры данных СМД, на котором формируют пятую структуру данных СМД, являющуюся первой структурой данных СМД в рамках рассматриваемого способа 200, содержащую элементы упомянутой пятой структуры данных СМД, причем упомянутые элементы пятой структуры данных СМД представляют собой лингво-логические единицы (ЛЛЕ) лингвистического предложения, идентифицированные и сформированные по итогам лингво-логического анализа синтаксических единиц, а также представляют собой идентификационные данные ЛЛЕ, представляющие собой для каждого ЛЛЕ, в качестве примера, но не ограничения: значение ЛЛЕ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ЛЛЕ; выполнением этапа 203 формирования шестой структуры данных СМД, на котором формируют шестую структуру данных СМД, являющуюся второй структурой данных СМД в рамках рассматриваемого способа 200, содержащую элементы упомянутой шестой структуры СМД, причем упомянутые элементы шестой структуры данных СМД представляют собой группы лингво-логических единиц (группы ЛЛЕ) лингвистического предложения сформированные на основании схемы синтаксических связей ЛЛЕ в простом предложении исходного лингвистического предложения, а также представляют собой идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, в качестве примера, но не ограничения: значение группы ЛЛЕ и порядковые номера ТЭ лингвистического предложения, составляющих группу ЛЛЕ; выполнением этапа 204 формирования седьмой структуры данных СМД, на котором формируют седьмую структуру данных СМД, являющуюся итоговой структурой данных СМД для рассматриваемого способа 200, содержащую элементы упомянутой седьмой структуры данных СМД, причем упомянутые элементы седьмой структуры данных СМД представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения сформированные из групп ЛЛЕ путем устранения однородностей в группах ЛЛЕ, а также представляют собой идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, в качестве примера, но не ограничения: значение ОЛЛО и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ОЛЛО.[92] FIG. 13, by way of example, but not limitation, shows the general scheme for performing the steps of the claimed method 200 for converting an SMD containing at least the syntactic units (CE) of the linguistic sentence and the identification data of the CE, which is the original data structure for the method 200 in question. The claimed method 200 SMD conversions containing at least CE of the linguistic sentence and the identification data of the CE are characterized by: performing step 201 of identifying a convertible structure data containing the CE, which identifies the data structure of the MD, containing the elements mentioned convertible data structure containing the CE, which is the original data structure of the MD in the framework of this method 200, and referred to the elements suitable for converting the data structure are syntactic units (CE) linguistic sentences and CE identification data; performing step 202 of forming the fifth MDD data structure, which forms the fifth MDD data structure, which is the first MDD data structure in the framework of this method 200, containing elements of the fifth fifth data structure of the MDD, and these elements of the fifth MDD data structure are linguistic-logical units ( LLE) linguistic sentences, identified and formed on the basis of the linguo-logical analysis of syntactic units, and also represent the identification data LLE, p edstavlyayuschie a LLE for each, as an example, but not limited to: the value of LLE and serial (serial) number (s) TE linguistic supply components (components) LLE; performing step 203 of forming the sixth MDD data structure, which forms the sixth MDD data structure, which is the second MDD data structure within the framework of the method 200, containing elements of the sixth SMD structure, and said elements of the sixth MDD data structure are groups of linguistic units ( LLE groups of the linguistic sentence formed on the basis of the LLE syntactic linking scheme in the simple sentence of the original linguistic sentence, and also represent bout identification data groups LLE representing LLE for each group as an example, but not limited to: the value of a group serial numbers and LLE TE linguistic proposal constituting the group LLE; performing step 204 of forming the seventh data structure of the DMD, which forms the seventh data structure of the DMD, which is the final data structure of the MDD data for the considered method 200, containing elements of the said seventh data structure of the MDD, OLLO linguistic sentences are formed from LLE groups by eliminating homogeneity in LLE groups, and also represent the identification data OLLO, representing for each OLLO, as an example, but not limitation: the OLLO value and the ordinal (s) number (s) of the TE language of the linguistic sentence constituting (s) the OLLO.

[93] На фиг. 14, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 201 идентификации пригодной для преобразования структуры данных, содержащей синтаксические единицы (СЕ), являющейся исходной структурой данных для рассматриваемого способа 200. Этап 201 характеризуется выполнением идентификации пригодной для преобразования структуры данных содержащей СЕ, на котором идентифицируют элементы 22 пригодной для преобразования структуры данных содержащей СЕ, а также идентификационные данные элементов 22, представляющие собой для каждого элемента 22, в качестве примера, но не ограничения, значение 221 элемента 22 пригодной для преобразования структуры данных, содержащей СЕ и порядковый (порядковые) номер (номера) 222 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 22.[93] FIG. 14, by way of example, but not limitation, depicts a general flowchart of identification step 201 for converting a data structure comprising syntactic units (CE), which is the original data structure for method 200 under consideration. CE, which identifies the elements 22 suitable for converting the data structure containing the CE, as well as the identification data of the elements 22, representing for Each element 22, by way of example, but not limitation, is the value 221 of element 22 of a translatable data structure containing the CE and the ordinal number (s) of the 222 TE linguistic sentence 11 constituting the constituent element 22.

[94] На фиг. 15, в качестве примера, но не ограничения, изображена общая структура данных, являющаяся исходной структурой данных для настоящего способа преобразования 200, представляющая собой пригодную для преобразования структуру данных, содержащую синтаксические единицы. Исходная структура данных представляет собой СМД, содержащий элементы 22 пригодной для преобразования структуры данных, содержащей СЕ, представляющие собой синтаксические единицы (СЕ) и идентификационные данные СЕ, представляющие собой для каждой СЕ, в качестве примера, но не ограничения, значение 221 элемента 22 пригодной для преобразования структуры данных, содержащей СЕ и порядковый (порядковые) номер (номера) 222 ТЭ лингвистического предложения, составляющего (составляющих) СЕ, которые, в качестве примера, но не ограничения, были описаны ранее со ссылкой на фиг. 8 способа 100. У элементов 22 лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН), имеющие практическое использование, в качестве примера, но не ограничения: «подлежащее», «сказуемое», «прямое дополнение» и тому подобное. В структуре данных элементы 22 именуются уникальными наименованиями и, в качестве примера, но не ограничения, могут именоваться как «УН СЕ n», где n ≥ 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН СЕ, ранее не встречавшегося в лингвистическом предложении. Как было сказано ранее, СЕ могут быть двух видов: исходные синтаксические объекты (ИСО), то есть синтаксические единицы - члены предложения, выявленные в результате синтаксического анализа, и синтаксические конструкции, представляющие собой конструкцию из синтаксически связанных ИСО. Элементы 22 пригодной для преобразования структуры данных, содержащей СЕ, представляют собой множество ИСО уникальных наименований (УН ИСО) лингвистического предложения 11. ИСО 22 в пригодной для преобразования структуре данных, содержащей СЕ, представляют собой отдельные элементы, заранее подготовленные и помещенные в пригодную для преобразования структуру данных, содержащую СЕ в виде структурированного массива (списка, перечня и тому подобного) отдельных ИСО. Такие подготовительные действия могут осуществляться указанным любым известным из уровня техники способом или неизвестным из уровня техники способом, таким, как способ, указанный при описании способа 100, и, соответственно, далее не описываются. [94] FIG. 15, by way of example, but not limitation, depicts a general data structure that is the original data structure for the present mapping method 200, which is a mappable data structure containing syntax units. The original data structure is a MDD containing elements 22 of a data structure suitable for converting, containing CE, representing syntactic units (CE) and CE identification data representing, for each CE, as an example, but not limitation, the value 221 of element 22 suitable to convert a data structure containing CE and ordinal (s) number (s) of 222 TE linguistic sentences that make up (s) CE, which, as an example, but not limitation, were described p it with reference to FIG. 8 of the method 100. Elements 22 of the linguistic sentence 11 have characterizing their unique names (UN), which have practical use, as an example, but not limitation: "subject", "predicate", "direct addition" and the like. In the data structure, elements 22 are referred to as unique names and, by way of example, but not limitation, can be referred to as “UNC n”, where n ≥ 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN CE, not previously encountered in the linguistic sentence. As mentioned earlier, CE can be of two types: the original syntactic objects (ISO), that is, syntactic units - the members of the sentence identified as a result of the syntactic analysis, and syntactic constructions representing the construction of syntactically related ISO. The elements 22 of the convertible data structure containing the CE are a set of ISO of unique names (UN ISO) of the linguistic sentence 11. The ISO 22 in the convertible data structure containing the CE are individual elements prepared in advance and placed in the convertible a data structure containing CE as a structured array (list, list, and the like) of individual ISOs. Such preparatory actions can be carried out by a specified method known from the prior art or by a method unknown from the prior art, such as the method specified in the description of the method 100, and, accordingly, are not further described.

[95] Идентификация элементов 22 пригодной для преобразования структуры данных, содержащей СЕ в ходе этапа 201, сводится к классификации элементов, из которых состоит пригодная для преобразования структура данных, содержащая СЕ, как исходных синтаксических объектов (ИСО 22). При этом отдельные ИСО 22 имеют значение 221 и порядковый (порядковые) номер (номера) 222 ТЭ лингвистического предложения, составляющего (составляющих) синтаксические единицы. Значение 221 ИСО 22 представляет собой один или несколько текстовых элементов (ТЭ 21) предложения 11, из которых состоят ИСО. Как правило, ИСО состоят из одного ТЭ 21, за исключением некоторых ИСО. Например, но не ограничиваясь, ИСО «сказуемое» может состоять из трех ТЭ 21 - «мог быть выполнен». ИСО «сказуемое» состоит из трех текстовых элементов ввиду лингвистической особенности формирования сказуемого, которое, помимо глагола «выполнен», может иметь вспомогательный глагол «быть» и модальность (модальный глагол) «мог».[95] The identification of the elements 22 of the data structure suitable for conversion, which contains CE during step 201, is reduced to the classification of the elements that comprise the data structure that is suitable for transformation, which contains CE as initial syntactic objects (ISO 22). At the same time, separate ISO 22 have the value 221 and the ordinal number (s) of the 222 TE linguistic sentence, constituting (constituting) syntactic units. The value 221 of ISO 22 is one or more text elements (TE 21) of proposal 11, of which ISO is composed. As a rule, ISO consist of one TE 21, with the exception of some ISO. For example, but not limited to, the ISO “predicate” may consist of three TE 21 - “could be performed.” The ISO “predicate” consists of three textual elements due to the linguistic peculiarity of the formation of the predicate, which, in addition to the verb “completed”, can have the auxiliary verb “to be” and the modality (modal verb) “could”.

[96] Идентификацию значения 221 элемента 22 (ИСО) пригодной для преобразования структуры данных, содержащей СЕ в ходе этапа 201 производят путем регистрации набора знаков ТЭ 21 предложения 11, составляющего (составляющих) элемент ИСО 22. Идентификацию порядкового (порядковых) номера (номеров) 222ТЭ, составляющего (составляющих) элемент 22 (ИСО) пригодной для преобразования структуры данных, содержащей СЕ в ходе этапа 201 производят путем регистрации порядкового (порядковых) номера (номеров) упомянутых ТЭ в соответствии с его (их) расположением в лингвистическом предложении, при условии, что первый ТЭ в лингвистическом предложении имеет порядковый номер «1», а все последующие ТЭ имеют порядковый номер, больший на единицу, чем порядковый номер предыдущего ТЭ.[96] The identification of the value 221 of the element 22 (ISO) of a data structure suitable for conversion, containing the CE during step 201, is produced by registering a set of signs ТЭ 21 of sentence 11, constituting (constituting) an element of ISO 22. Identification of ordinal (s) numbers (s) The 222TE that constitutes (constitutes) the element 22 (ISO) of a data structure that is suitable for the conversion that contains the CE during step 201 is produced by registering the ordinal (s) number (s) of said FC according to its (their) location in the linguis nical proposal, provided that the first fuel cell in the linguistic sentence has a serial number "1" and all the subsequent FCs have a serial number greater by one than the sequence number of the previous TE.

[97] Пригодная для преобразования структура данных, содержащая СЕ, являющаяся исходной для настоящего способа преобразования 200 представляет собой в итоге множество элементов 22, их значений 221 и порядковых номеров 222 ТЭ, составляющих элементы 22, идентифицированных на этапе 201.[97] A convertible data structure containing CE, which is the source for the present transformation method 200, is ultimately a plurality of elements 22, their values 221 and sequence numbers 222 TEs constituting elements 22 identified in step 201.

[98] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 22 (ИСО) пригодной для преобразования структуры данных, содержащей СЕ и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 102, состоящего из идентификационных данных ТЭ, составляющих ИСО 22, и получении значений 2131 лингвистических характеристик 213 текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 22 (ИСО). При этом, как было описано ранее, лингвистическими признаками элементов 22 (ИСО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 22 (ИСО).[98] The identification of the linguistic characteristics of the TEs that make up the elements 22 (ISO) of the data structure containing the CE that can be converted and, if necessary, is produced by organizing a query into the BDLP, formed during step 102 consisting of the identification data of the TEs comprising ISO 22, and obtaining the values of 2131 linguistic characteristics of 213 text elements 21 of the linguistic sentence 11, of which element 22 consists (ISO). At the same time, as described earlier, the linguistic features of elements 22 (ISO) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 22 (ISO) consist.

[99] На фиг. 16, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 202 формирования пятой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 200. Этап 202 характеризуется: выполнением этапа 2021 формирования значений 2141 второй части лингвистических характеристик 214 текстовых элементов 21, составляющих элементы 22 пригодной для преобразования структуры данных, содержащей СЕ, на котором формируют значения 2141 второй части лингвистических характеристик 214 текстовых элементов 21, составляющих элементы 22 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 102, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021; выполнением этапа 2022 формирования значений 2231 третьей части лингвистических характеристик 223 текстовых элементов 21, составляющих элементы 22 пригодной для преобразования структуры данных, содержащей СЕ на котором идентифицируют виды элемента 22 пригодной для преобразования структуры данных, содержащей СЕ для которых необходимо изменить некоторые значения лингвистических характеристик, формируют упомянутые значения 2231 третьей части лингвистических характеристик 223 текстовых элементов 21, составляющих элементы 22 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2022; выполнением этапа 2023 идентификации элементов 61 пятой структуры данных СМД, на котором идентифицируют и формируют элементы 61, пятой структуры данных СМД, а также идентификационные данные элементов 61, представляющие собой для каждого элемента 61, в качестве примера, но не ограничения, значение 611 элемента 61 пятой структуры данных СМД и порядковый (порядковые) номер (номера) 612 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 61, и формируют пятую структуру данных СМД.[99] FIG. 16, by way of example, but not limitation, shows a general scheme for performing the steps of step 202 of forming the fifth SMD data structure, which is the first data structure for the method 200 in question. Step 202 is characterized by: performing step 2021 of generating values 2141 of the second part of the linguistic characteristics 214 of text elements constituting the elements 22 of a data structure suitable for converting, containing the CE, on which the values 2141 of the second part of the linguistic characteristics 214 of the text elements 21 are formed, constituting x elements 22 and contribute the findings to the BDLP of textual elements 21 of the linguistic sentence 11, formed during step 102, forming as a result the BDLP of text elements 21 of the linguistic sentence 11, forming during step 2021; by performing step 2022 of forming the values 2231 of the third part of the linguistic characteristics 223 of text elements 21 constituting the elements 22 of a data structure suitable for converting, which contains the CE identifying the types of the element 22 of the convertible data structure containing the CE for which certain values of linguistic characteristics need to be changed the said values are 2231 of the third part of the linguistic characteristics of the 223 text elements 21 that make up the elements 22 and contribute the resulting BDLP text elements 21 of the linguistic sentence 11, formed in step 2021, forming as a result of the BDLP text elements 21 of the linguistic sentence 11, formed in step 2022; performing step 2023 of identifying the elements 61 of the fifth SMD data structure, which identifies and forms the elements 61, the fifth data structure of the SMD, as well as the identification data of the elements 61, representing for each element 61, as an example, but not limitation, the value 611 of element 61 the fifth data structure of the SMD and the ordinal (s) number (s) 612 TE of the linguistic sentence 11 constituting (constituting) the element 61, and form the fifth data structure of the SMD.

[100] На фиг. 17, в качестве примера, но не ограничения, изображена общая структура сформированной в рамках этапа 2021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей СЕ. БДЛП, сформированная в рамках этапа 2021, отличается от БДЛП, сформированной в рамках этапа 102, наличием значений 2141 второй части лингвистических характеристик 214, указывающих на синтаксическо-логическую идентичность элемента 22 (ИСО). Для идентификации лингво-логических единиц (ЛЛЕ) лингвистического предложения необходимо по всем синтаксическим единицам вида ИСО (элемент 22) провести проверку на идентичность их синтаксической и логической ролей в лингвистическом предложении 11. В результате упомянутой проверки синтаксических единиц ИСО 22 на их синтаксическо-логическую идентичность должны быть установлены наличие или отсутствие идентичности ИСО 22. ИСО 22 будет считаться синтаксическо-логическо идентичным, если его синтаксическая и логическая роли совпадут, и будет считаться синтаксическо-логическо неидентичным, если упомянутые роли не совпадут. Синтаксическая роль ИСО 22 – это функция слова в предложении, которая определяется в рамках взаимосвязей слов в предложении. Синтаксическая роль ИСО 22 определяет, каким членом предложения является слово, и в каких оно синтаксических отношениях состоит с другими словами. Одна и та же форма слова может выполнять различные функции, то есть быть разными членами предложения. Логическая роль ИСО 22 – это синтаксическая роль, отождествленная с логической функцией слова в простом суждении. Вид логической функции в простом суждении связан с уникальным наименованием логического объекта (УН ЛО), являющегося элементом простого суждения, к которому относится ИСО 22. Простое суждение - это логическая сущность, представляющая собой первичную логическую конструкцию мышления, обязательно содержащую элементы простого суждения - субъект суждения (предмет окружающего мира, о котором идет речь) и предикат суждения (то, что утверждается или опровергается о предмете суждения). При этом субъект суждения представляет собой один предмет окружающего мира, а предикат суждения состоит, как правило, из действия и множества предметов, которые находятся в определенной взаимосвязи друг с другом, что в конечном итоге и выполняет функцию предиката суждения, то есть поясняет то, что утверждается или опровергается о предмете суждения. Поэтому предикат суждения может быть разделен на логические функционально-однородные части (логические объекты), в качестве примера, но не ограничения, такие как действие, объект и обстоятельства предиката суждения. Упомянутые ранее субъект суждения, а также действие, объект и обстоятельства предиката суждения могут являться уникальными наименованиями логического объекта (УН ЛО), являющегося элементом простого суждения. В соответствии с использованным словом (ИСО 22) посредством которого выражены элементы простого суждения, эти слова (ИСО 22) будут иметь определенную логическую функцию, которая в соответствии с предварительно заданными условиями может отождествляться или не отождествляться с определенной синтаксической ролью. Таким образом становится возможным провести проверку на идентичность синтаксической и логической ролей отдельных ИСО 22 лингвистического предложения 11 и преобразовать ИСО 22 в лингво-логические единицы (ЛЛЕ).[100] FIG. 17, by way of example, but not limitation, shows the general structure of the linguistic characteristics database (BDLP) formed within step 2021, which is the BDLP textual elements 21 of the linguistic sentence 11 contained in the elements 22 suitable for transforming the data structure containing the CE. The BDLP, formed under step 2021, differs from the BDLP, formed under step 102, by the presence of 2141 values of the second part of the linguistic characteristics 214, indicating the syntactic-logical identity of element 22 (ISO). To identify linguistic-logical units (LLE) of a linguistic sentence, it is necessary for all syntactic units of the ISO type (element 22) to verify that their syntactic and logical roles in the linguistic sentence 11 are identical. the presence or absence of ISO 22 identity must be established. ISO 22 will be considered syntactically logical identical if its syntactic and logical roles match, and the score will be It becomes syntactically logical non-identical if the roles mentioned do not match. The syntactic role of ISO 22 is a function of a word in a sentence, which is defined within the framework of the interrelationship of words in a sentence. The syntactical role of ISO 22 defines which sentence a word is and in which it has syntactic relations with other words. The same form of a word can perform different functions, that is, be different members of a sentence. The logical role of ISO 22 is a syntactic role, identified with the logical function of a word in a simple judgment. The type of logical function in a simple judgment is associated with the unique name of a logical object (UN LO), which is an element of a simple judgment to which ISO 22 belongs. Simple judgment is a logical entity that is the primary logical construction of thinking that necessarily contains elements of simple judgment - the subject of judgment (the subject of the world in question) and the predicate of judgment (that which is affirmed or refuted about the subject of judgment). At the same time, the subject of the judgment is one subject of the surrounding world, and the predicate of judgment consists, as a rule, of the action and set of objects that are in a certain relationship with each other, which ultimately performs the function of the predicate of judgment, that is, it explains that affirms or refuted the subject matter of judgment. Therefore, the predicate of judgment can be divided into logical functionally homogeneous parts (logical objects), as an example, but not restrictions, such as the action, object and circumstances of the predicate of judgment. The subject of a judgment mentioned earlier, as well as the action, object and circumstances of the predicate of a judgment can be the unique names of a logical object (UNL), which is an element of a simple judgment. In accordance with the word used (ISO 22) by which the elements of simple judgment are expressed, these words (ISO 22) will have a certain logical function, which, according to the predetermined conditions, may or may not be identified with a certain syntactic role. Thus, it becomes possible to verify the identity of the syntactic and logical roles of individual ISO 22 linguistic sentences 11 and convert ISO 22 into linguistic-logical units (LLE).

[101] Формирование второй части лингвистических характеристик 214 и их значений 2141 для текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 с целью идентификации синтаксическо-логической идентичности ИСО 22 на этапе 2021 производят путем проверки ИСО 22 на идентичность синтаксической и логической ролей в лингвистическом предложении 11. Проверка представляет собой сравнение значений 2131 первой части лингвистических характеристик 213 текстовых элементов 21, составляющих элементы 22, с заранее заданными значениями заранее заданных лингвистических признаков текстовых элементов 21, составляющих ИСО 22. Для проведения проверки заранее задаются условия, такие как, в качестве примера, но не ограничения: перечни пар ИСО 22, у которых синтаксическая и логическая роли могут не совпадать, а также признаки несовпадения синтаксической и логической ролей (некоторые значения лингвистических характеристик указанных ИСО 22, при наличии которых ИСО 22 идентифицируется как ИСО 22 с несовпадением синтаксических и логических ролей). ИСО 22, которые успешно проходят упомянутую проверку идентифицируют как ИСО 22 с совпадением синтаксических и логических ролей (СЛ-идентичные ИСО 22, то есть синтаксическо-логическо идентичные ИСО). ИСО 22, которые не проходят упомянутую проверку по причине того, что их упомянутые роли не совпадают, идентифицируют как ИСО 22 с несовпадением синтаксических и логических ролей (СЛ-неидентичные ИСО 22, то есть синтаксическо-логическо неидентичные ИСО). Например, но не ограничиваясь, ИСО в форме глагола имеет синтаксическую роль - «сказуемое», а ИСО в форме причастия – синтаксическую роль «согласованное определение». Несмотря на то, что синтаксические роли глагола и причастия не совпадают, с логической точки зрения и тот и другой ИСО являются синтаксически главными словами в одном и том же элементе простого суждения «действие предиката суждения», то есть имеют одну и ту же логическую роль. В итоге ИСО в форме глагола проходит проверку идентичности синтаксической и логической ролей, так как «глагол» и есть то, что выражает действие. При этом ИСО в форме согласованного определения не проходит проверку, так как «определение» – это признак, а не действие. По этой причине, а также при дополнительном условии, что причастие является распространенным (имеет зависимые слова – значимые части речи) считается, что ИСО «согласованное определение» в форме причастия не проходят упомянутую проверку и являются СЛ-неидентичным ИСО 22. Упомянутые условия, используемые для проведения проверки идентичности синтаксической и логической ролей ИСО 22 предварительно записывают в четвертую пользовательскую базу данных (четвертую ПБД). [101] The formation of the second part of the linguistic characteristics 214 and their meanings 2141 for the textual elements 21 of the linguistic sentence 11 contained in the elements 22 in order to identify the syntactic-logical identity of ISO 22 at step 2021 is performed by checking the ISO 22 for syntactic and logical roles in the linguistic identity sentence 11. The check is a comparison of the values 2131 of the first part of the linguistic characteristics 213 of the text elements 21 constituting the elements 22 with the predetermined values its specified linguistic features of the text elements 21 constituting ISO 22. Conditions for pre-testing are set, such as, by way of example, but not limitation: lists of pairs of ISO 22 whose syntactic and logical roles may not match, as well as signs of syntactic mismatch and logical roles (some values of the linguistic characteristics of these ISO 22, in the presence of which ISO 22 is identified as ISO 22 with the syntactic and logical roles that do not match). ISO 22, which successfully passes the above mentioned test, is identified as ISO 22 with syntactic and logical role overlap (SL-identical to ISO 22, that is, syntactically-logical to identical ISO). ISO 22, which does not pass the above-mentioned verification due to the fact that their mentioned roles do not match, is identified as ISO 22 with a mismatch of syntactic and logical roles (SL-non-identical ISO 22, that is, syntactic-logical non-identical ISO). For example, but not limited to, ISO in the form of a verb has a syntactic role - “predicate”, and ISO in the form of participle - the syntactic role “agreed definition”. Despite the fact that the syntactic roles of the verb and participle do not coincide, from a logical point of view both the ISO and the other are syntactically head words in the same element of the simple judgment “the action of the predicate judgment”, that is, they have the same logical role. As a result, the ISO in the form of a verb passes the verification of the identity of syntactic and logical roles, since the “verb” is what expresses action. At the same time, ISO in the form of an agreed definition does not pass the test, since “definition” is a sign, not an action. For this reason, as well as with the additional condition that the participle is common (has dependent words - meaningful parts of speech), it is considered that ISO “agreed definition” in the form of participle does not pass the above test and is not identical to ISO 22. The mentioned conditions used To verify the identity of syntactic and logical roles, ISO 22 is pre-recorded in the fourth user database (fourth PDU).

[102] Сформированные в результате выполнения этапа 2021 значения 2141 (синтаксическо-логическая идентичность ИСО 22) второй части лингвистических характеристик 214 элементов 21, составляющих ИСО 22 пригодной для преобразования структуры данных, содержащей СЕ вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 102, формируя таким образом БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021. При этом обе части (213 и 214) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2131 и 2141) формируют уникальные лингвистические признаки элементов 22.[102] Formed as a result of step 2021, the values 2141 (syntactic-logical identity of ISO 22) of the second part of the linguistic characteristics 214 of the elements 21 constituting ISO 22 of the data structure that contains the CE that can be converted into the BDLP of the text elements 21 of the linguistic sentence 11 within stage 102, thus forming the BDLP of textual elements 21 of the linguistic sentence 11, which is formed within the framework of stage 2021. At the same time, both parts (213 and 214) of the linguistic characteristics of the text elements 21 l ngvisticheskogo proposals 11 and their values (2131 and 2141) form features unique linguistic elements 22.

[103] На фиг. 18, в качестве примера, но не ограничения, изображена общая структура сформированной в рамках этапа 2022 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 пригодной для преобразования структуры данных, содержащей СЕ. БДЛП, формируемая в рамках этапа 2022, отличается от БДЛП, формируемой в рамках этапа 2021, наличием значений 2231 третьей части лингвистических характеристик 223, указывающих вид элемента 22 (ИСО) и актуальные значения некоторых лингвистических характеристик 213 текстовых элементов, составляющих элемент 22 (ИСО). Для идентификации лингво-логических единиц (ЛЛЕ) лингвистического 11 необходимо по всем синтаксическим единицам ИСО 22, по которым была проведена проверка на идентичность их синтаксической и логической ролей дополнительно провести идентификацию видов ИСО 22 по признаку внесения изменений в значения их лингвистических характеристик 213 в соответствии с их значением 2141 синтаксическо-логической идентичности 214. В результате проведенной на этапе 2021 проверки на синтаксическо-логическую идентичность ИСО 22 было установлено, что все ИСО 22 разделяются по этому признаку на СЛ-идентичные и СЛ-неидентичные ИСО 22. При этом СЛ-неидентичные ИСО 22 могут быть изменяемыми и неизменяемыми, то есть такие СЛ-неидентичные ИСО 22, у которых в соответствии с заранее заданным условием должны быть изменены значения 2131 некоторых лингвистических характеристик 213 или не изменены. Кроме этого, в некоторых случаях, в заранее установленных условиях возможно наличие требования о создании дубликата СЛ-неидентичного ИСО 22, у которого не изменяются лингвистические характеристики. Упомянутые условия и требования устанавливаются в четвертой ПБД.[103] FIG. 18, by way of example, but not limitation, shows the general structure of the linguistic characteristics database (BDLP) formed within step 2022, which is the BDLP textual elements 21 of the linguistic sentence 11 contained in the elements 22 suitable for transforming the data structure containing the CE. The BDLP formed in step 2022 differs from the BDLP formed in step 2021 by the presence of values 2231 of the third part of linguistic characteristics 223, indicating the type of element 22 (ISO) and the actual values of some linguistic characteristics of 213 text elements constituting element 22 (ISO) . To identify linguistic-logical units (LLE) of a linguistic 11, it is necessary for all ISO 22 syntax units, which were checked for the identity of their syntactic and logical roles, to additionally identify the ISO 22 types based on changes in their linguistic characteristics 213 in accordance with their 2141 syntactic-logical identity value 214. As a result of the check for the syntactic-logical identity of ISO 22 carried out at step 2021, it was established that all ISO 22 section According to this feature, SL-identical and SL-non-identical ISO 22. Herewith, SL-non-identical ISO 22 can be changeable and unchangeable, that is, such SL-non-identical ISO 22, in which the values of 2131 should be changed according to a predetermined condition. Some linguistic characteristics are 213 or unchanged. In addition, in some cases, in predetermined conditions, there may be a requirement to create a duplicate of the SL-non-identical ISO 22, which does not change the linguistic characteristics. The above conditions and requirements are set forth in the fourth PBB.

[104] Формирование третьей части лингвистических характеристик 223 и их значений 2231 для текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22 производят на этапе 2022 с целью идентификации различных видов ИСО 22 по признаку синтаксическо-логической идентичности (СЛ-идентичности) и формирования дубликата СЛ-неидентичного ИСО 22 путем комплексного анализа условий, установленных в четвертой ПБД, и на основании итогов проверки ИСО 22 на СЛ-идентичность. В результате упомянутого анализа для каждого ИСО 22 устанавливают определенный вид – первый, второй или третий вид. Если в условиях, установленных в четвертой ПБД, имеется требование о создании дубликата СЛ-неидентичных ИСО 22, то такие ИСО 22 относят к четвертому виду ИСО 22. В соответствии с установленным видом ИСО 22 формируют значения 2231 третьей части лингвистических характеристик 223 текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 22. У первого вида ИСО 22 (СЛ-идентичные) остаются все их исходные значения 221 и номера текстовых элементов 222, а также их лингвистические характеристики 213 и 214 со значениями 2131 и 2141. В связи с этим значения 2231 лингвистических характеристик 213 для такого ИСО 22 отсутствуют. У второго вида ИСО 22 (СЛ-неидентичные изменяемые) остается неизменным исходное их значение 221 и номера текстовых элементов 222, а также вторая часть их лингвистических характеристик 214 со значениями 2141, но при этом значения 2131 некоторых лингвистических характеристик 213 первой части изменяют. В связи с этим значения 2231 лингвистической характеристики 223 вместо изменяемых значений 2131 некоторых лингвистических характеристик 213 такого ИСО 22 указывается таким, как это установлено в четвертой ПБД. У третьего вида ИСО 22 (СЛ-неидентичные неизменяемые) остаются все их исходные значения 221 и номера текстовых элементов 222, а также их лингвистические характеристики 213 и 214 со значениями 2111 и 2141. В связи с этим значения 2231 лингвистических характеристик 213 для такого ИСО 22 отсутствуют. У четвертого вида ИСО 22 (дубликат СЛ-неидентичных неизменяемых ИСО) остается неизменным исходное их значение 221 и номера текстовых элементов 222, а также вторая часть их лингвистических характеристик 214 со значениями 2141, но при этом значения 2131 некоторых лингвистических характеристик 213 первой части изменяют. В связи с этим значения 2231 лингвистической характеристики 223 вместо изменяемых значений 2131 некоторых лингвистических характеристик 213 такого ИСО 22 указывают таким, как это установлено в четвертой ПБД.[104] The formation of the third part of the linguistic characteristics 223 and their meanings 2231 for the textual elements 21 of the linguistic sentence 11 contained in the elements 22 is carried out at step 2022 in order to identify various types of ISO 22 based on the syntactic-logical identity (SL-identity) and the formation of a duplicate SL-non-identical ISO 22 through a comprehensive analysis of the conditions established in the fourth PBB, and based on the results of testing ISO 22 on the SL-identity. As a result of the above analysis, for each ISO 22 a specific type is established - the first, second or third type. If, under the conditions established in the fourth PBB, there is a requirement to create a duplicate SL-non-identical ISO 22, then such ISO 22 refers to the fourth ISO 22 type. In accordance with the established ISO 22 form, the values 2231 of the third part of the linguistic characteristics of the 223 textual elements 21 of the linguistic Proposals 11 contained in elements 22. The first type of ISO 22 (SL-identical) contains all their original values 221 and the numbers of text elements 222, as well as their linguistic characteristics 213 and 214 with values 2131 and 2141. In this regard, cheniya 2231 linguistic characteristics of the ISO 213 22 no. In the second type of ISO 22 (SL-non-identical variable), their original value 221 and the number of text elements 222, as well as the second part of their linguistic characteristics 214 with values of 2141, remain unchanged, but the values 2131 of some linguistic characteristics of 213 of the first part change. In this regard, the values of 2231 linguistic characteristics 223 instead of the changing values 2131 of some linguistic characteristics 213 of such ISO 22 are indicated as specified in the fourth PBB. The third type of ISO 22 (SL-non-identical immutable) retains all their original values 221 and the numbers of text elements 222, as well as their linguistic characteristics 213 and 214 with values 2111 and 2141. In this regard, the values 2231 of linguistic characteristics 213 for such ISO 22 are missing. The fourth type of ISO 22 (duplicate SL-non-identical unchangeable ISO) remains their original value 221 and the number of text elements 222, as well as the second part of their linguistic characteristics 214 with values of 2141, but the values of 2131 change some of the linguistic characteristics of the first part. In this regard, the values of 2231 linguistic characteristics 223 instead of variable values 2131 of some linguistic characteristics 213 of such ISO 22 are indicated as specified in the fourth PBB.

[105] Сформированные по итогам этапа 2022 значения 2231 (измененные значения лингвистических характеристик ИСО 22) третьей части лингвистических характеристик 223 элементов 21, составляющих ИСО 22 пригодной для преобразования структуры данных, содержащей СЕ, вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2021, формируя таким образом БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2022. При этом все три части (213, 214 и 223) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2131, 2141 и 2231) формируют уникальные лингвистические признаки элемента 22.[105] Formed at the end of step 2022, the values of 2231 (modified values of linguistic characteristics of ISO 22) of the third part of the linguistic characteristics of 223 elements 21, constituting ISO 22 of a suitable data structure containing CE, are inserted into BDLP of text elements 21 of linguistic sentence 11, formed in as part of step 2021, thus forming the BDLP of textual elements 21 of the linguistic sentence 11, which is formed in the framework of step 2022. All three parts (213, 214 and 223) of the linguistic characteristics of the textual elements s 21 and 11 offers linguistic values (2131, 2141 and 2231) form features unique linguistic element 22.

[106] На фиг. 19, в качестве примера, но не ограничения, изображена общая структура сформированной пятой структуры данных СМД, являющейся первой для настоящего способа преобразования 200. Пятая структура данных СМД представляет собой СМД, содержащий элементы 61 пятой структуры данных СМД, которые представляют собой лингво-логические единицы (ЛЛЕ 61) лингвистического предложения 11 и идентификационные данные ЛЛЕ 61, представляющие собой для каждой ЛЛЕ, в качестве примера, но не ограничения, значение 611 элемента 61 пятой структуры данных и порядковый (порядковые) номер (номера) 612 ТЭ, составляющего (составляющих) ЛЛЕ 61. У ЛЛЕ 61 лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ЛЛЕ), имеющие практическое использование в качестве примера, но не ограничения: «подлежащее», «сказуемое», «прямое дополнение» и тому подобное. В структуре данных элементы 61 именуются уникальными наименованиями, и, в качестве примера, но не ограничения, могут именоваться как «УН ЛЛЕ n», где n ≥ 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ЛЛЕ, ранее не встречавшегося в лингвистическом предложении. Лингво-логическая единица (ЛЛЕ 61) – это синтаксическая единица вида ИСО, по которой проведена проверка на идентичность ее синтаксической и логической ролей в лингвистическом предложении. При этом может быть два вида ЛЛЕ 61: первый вид – это оригинальный ИСО 22, прошедший упомянутую проверку, который содержался в пригодной для преобразования структуре данных, содержащей СЕ, а второй вид – это дубликат ИСО 22, которого не было в упомянутой структуре данных. Первому виду ЛЛЕ 61 соответствуют все ИСО 22 пригодной для преобразования структуры данных, содержащей СЕ. Второму виду ЛЛЕ 61 соответствуют те ИСО 22 пригодной для преобразования структуры данных, содержащей СЕ, которые отнесены к четвертому виду (дубликат СЛ-неидентичных неизменяемых ИСО), указанному в значении 2231 третьей части лингвистических характеристик 223.[106] FIG. 19 shows, by way of example, but not limitation, the general structure of the formed fifth MDD data structure, which is the first for this conversion method 200. The fifth MDD data structure is a MDD containing elements 61 of the fifth MDD data structure, which are linguistic units. (LLE 61) of the linguistic sentence 11 and the identification data of the LLE 61, which for each LLE, as an example, but not limited to, the value 611 of the element 61 of the fifth data structure and ordinal (ordinal f) the number (s) of 612 TEs constituting (components) of LLE 61. LLE 61 of the linguistic sentence 11 has characterizing their unique names (UN LLE), which have practical use as an example, but not limitation: "subject", "predicate" , "Direct addition" and the like. In the data structure, the elements 61 are referred to as unique names, and, by way of example, but not limitation, can be referred to as “UNLLE n”, where n ≥ 1 is the ordinal index of the element of the unique name in the linguistic sentence, starting with “1” for each new UN LLE, not previously encountered in the linguistic sentence. A linguistic-logical unit (LLE 61) is a syntactic unit of the ISO type, according to which a check is made for the identity of its syntactic and logical roles in the linguistic sentence. There can be two types of LLE 61: the first type is the original ISO 22, which passed the mentioned test, which was contained in the data structure containing the CE that is suitable for conversion, and the second type is a duplicate of the ISO 22, which was not in the mentioned data structure. The first LLE 61 type corresponds to all ISO 22 suitable for converting a data structure containing CE. The second type of LLE 61 corresponds to those of ISO 22 suitable for transformation of a data structure containing CE, which are assigned to the fourth type (duplicate SL-non-identical unchanged ISO) specified in the value of 2231 of the third part of linguistic characteristics 223.

[107] Идентификацию и формирование элементов 61 пятой структуры данных СМД в ходе этапа 2023 производят на основе результатов этапа 2022 по идентификации видов элементов 22 пригодной для преобразования структуры данных, содержащей СЕ. Идентификацию элементов 61 (ЛЛЕ) первого вида на этапе 2023 производят путем их отождествления с элементами 22 (ИСО) первого, второго и третьего видов. ИСО 22, идентифицированные на этапе 2022 как четвертый вид, формируют новые элементы - элементы 61 второго вида пятой структуры данных СМД. Формирование элементов 61 (ЛЛЕ) второго вида на этапе 2023 производится путем их отождествления с элементами 22 (ИСО) четвертого вида.[107] The identification and formation of the elements 61 of the fifth SMD data structure during step 2023 is made based on the results of step 2022 for identifying the types of elements 22 suitable for transforming the data structure containing the CE. The identification of elements 61 (LLE) of the first type at step 2023 is made by identifying them with elements 22 (ISO) of the first, second and third types. ISO 22, identified at stage 2022 as the fourth type, forms new elements — elements 61 of the second type of the fifth SMD data structure. The formation of the elements 61 (LLE) of the second type at step 2023 is carried out by identifying them with the elements 22 (ISO) of the fourth type.

[108] Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 первого вида пятой структуры данных СМД, отождествленного с первым видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 первого вида, а порядкового (порядковых) номера (номеров) 612 ТЭ, составляющего (составляющих) элемент 61, путем отождествления с порядковым (порядковыми) номером (номерами) 222 ТЭ, составляющего (составляющих) элемент 22 первого вида. Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 первого вида пятой структуры данных СМД, отождествленного со вторым видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 второго вида, а порядкового (порядковых) номера (номеров) 612ТЭ, составляющих элемент 61, с порядковым (порядковыми) номерами 222 ТЭ, составляющего (составляющих) элемент 22 второго вида. Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 первого вида пятой структуры данных СМД, отождествленного с третьим видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 третьего вида, а порядкового (порядковых) номера (номеров) 612 текстовых элементов 21, составляющих элемент 61, с порядковым (порядковыми) номером (номерами) 222 ТЭ, составляющего (составляющих) элемент 22 третьего вида. Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ элемента 61 второго вида пятой структуры данных СМД, отождествленного с четвертым видом ИСО 22, производят в рамках этапа 2023 путем отождествления значения 611 элемента 61 со значением 221 элемента 22 третьего вида, а порядкового (порядковых) номера (номеров) 612ТЭ, составляющего (составляющих) элемент 61, с порядковым (порядковыми) номером (номерами) 222 ТЭ, составляющего (составляющих) элемент 22 третьего вида. [108] The identification of the value and ordinal (ordinal) number (s) of the TE element 61 of the first type of the fifth SMD data structure identified with the first type of ISO 22 is produced in step 2023 by identifying the value 611 of the element 61 with the value 221 of the first type 22 and the ordinal (s) number (s) of 612 TEs constituting (constituting) element 61, by identifying with the ordinal (ordinal) number (s) of 222 TEs constituting (constituting) element 22 of the first type. Identification of the value and ordinal (s) numbers (numbers) of the TE element 61 of the first type of the fifth SMD data structure identified with the second type of ISO 22 is produced in step 2023 by identifying the value 611 of the element 61 with the value 221 of the second type 22, and ordinal ( serial) numbers (numbers) 612ТЭ, making an element 61, with serial (serial) numbers 222 ТЭ, making (making) an element 22 of the second kind. Identification of the value and ordinal (s) numbers (numbers) of the TE element 61 of the first type of the fifth SMD data structure identified with the third type of ISO 22 is produced in step 2023 by identifying the value 611 of the element 61 with the value 221 of the third type 22, and ordinal ( ordinal numbers (numbers) 612 of text elements 21 constituting element 61, with ordinal (ordinal) number (numbers) of 222 TE constituting (constituting) element 22 of the third type. The identification of the value and ordinal (s) numbers (numbers) of the TE element 61 of the second type of the fifth SMD data structure identified with the fourth type of ISO 22 is performed in step 2023 by identifying the value 611 of the element 61 with the value 221 of the third type 22, and ordinal ( ordinal numbers (numbers) of 612TE constituting (constituting) element 61, with ordinal (ordinal) number (numbers) of 222 TE constituting (constituting) element 22 of the third type.

[109] Формирование пятой структуры данных СМД в ходе этапа 2023 производят путем объединения в одной структуре данных элементов 61 первого и второго видов пятой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются.[109] The formation of the fifth MDD data structure during step 2023 is performed by combining in one data structure elements 61 of the first and second types of the fifth MDD data structure and their identification data according to principles and methods known from the prior art, which, respectively, are not further described in detail .

[110] Идентификацию лингвистических характеристик ТЭ, составляющих первые или вторые элементы 61 (ЛЛЕ) пятой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2022, состоящего из идентификационных данных ТЭ, составляющих первый или второй элемент 61 (ЛЛЕ), и получении значений (2131, 2141, 2231) всех частей лингвистических характеристик (213, 214, 223) текстовых элементов 21 лингвистического предложения 11, из которых состоит первый или второй элемент 61 (ЛЛЕ). При этом, как было описано ранее, лингвистическими признаками первых и вторых элементов 61 (ЛЛЕ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 61 (ЛЛЕ).[110] Identification of linguistic characteristics of TEs that make up the first or second elements 61 (LLE) of the fifth SMD data structure, and their values, if necessary, is made by organizing a request to the BDLP, formed as part of step 2022, consisting of the identification data of TEs that are first or second element 61 (LLE), and obtaining the values (2131, 2141, 2231) of all parts of the linguistic characteristics (213, 214, 223) of the text elements 21 of the linguistic sentence 11, of which the first or second element 61 (LLE) consists. At the same time, as described earlier, the linguistic features of the first and second elements 61 (LLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 61 (LLE) consist.

[111] На фиг. 20 в качестве примера, но не ограничения, изображена общая схема выполнения этапа 203 формирования шестой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 200. Этап 203 характеризуется: выполнением этапа 2031 формирования значений 2151 четвертой части лингвистических характеристик 215 текстовых элементов 21, составляющих элементы 61 пятой структуры данных СМД, на котором формируют значения 2151 четвертой части лингвистических характеристик 215 текстовых элементов 21, составляющих элементы 61, и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2022, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031; выполнением этапа 2032 формирования элементов шестой структуры данных СМД, на котором формируют элементы 71 шестой структуры данных СМД, а также идентификационные данные элементов 71, представляющие собой для каждого элемента 71, в качестве примера, но не ограничения, значение 711 элемента 71 шестой структуры данных СМД и порядковый (порядковые) номер (номера) 712 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 71; и формируют шестую структуру данных СМД.[111] FIG. 20, by way of example, but not limitation, shows the general scheme for performing step 203 of forming the sixth SMD data structure, which is the second data structure for the method 200 under consideration. the elements 61 of the fifth MDD data structure, on which the values 2151 of the fourth part of the linguistic characteristics 215 of the text elements 21 constituting the elements 61 are formed, and which are derived from SIC BDLP in the text linguistic elements 21 Proposition 11 that is generated in phase in 2022, forming eventually BDLP text elements 21 linguistic Proposition 11, formed in 2031 under the stage; performing step 2032 of forming elements of the sixth SMD data structure on which elements 71 of the sixth SMD data structure are formed, as well as identification data of the elements 71, representing for each element 71, as an example, but not limitation, the value 711 of element 71 of the sixth SMD data structure and ordinal (s) number (s) 712 TE of the linguistic sentence 11, constituting (making) element 71; and form the sixth data structure MDD.

[112] На фиг. 21, в качестве примера, но не ограничения, изображена общая структура сформированной в рамках этапа 2031 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 61 пятой структуры данных СМД. БДЛП, формируемая в рамках этапа 2031 отличается от БДЛП, формируемой в рамках этапа 2022, наличием значений 2151 четвертой части лингвистических характеристик 215, указывающих на уровень синтаксической значимости элемента 61 (ЛЛЕ). Уровень синтаксической значимости элемента 61 (ЛЛЕ) характеризует местоположение ЛЛЕ в синтаксическом дереве лингвистического предложения 11. Синтаксическим деревом является схема синтаксических связей предложения 11, в которой между отдельными словами (ЛЛЕ) установлена подчинительная синтаксическая связь. В зависимости от состава и строения предложения синтаксическое дерево может содержать неопределенное количество синтаксических уровней и частей предложения, в которых содержатся основные логические элементы (субъект и предикат суждения). Синтаксическое дерево, используемое в настоящем способе, содержит элементы (ЛЛЕ) как минимум трех уровней синтаксической значимости (УСЗ). К первому УСЗ относят ЛЛЕ, находящиеся на синтаксической вершине синтаксического дерева. Ко второму УСЗ относят ЛЛЕ, являющиеся прямыми синтаксическими потомками синтаксических вершин. К третьему УСЗ относят все остальные ЛЛЕ лингвистического предложения. Синтаксическая вершина – это синтаксическая единица (ЛЛЕ), имеющая синтаксическую роль «сказуемое». Особенностью ЛЛЕ «сказуемое» является то, что оно может состоять из трех слов. Прямой синтаксический потомок синтаксической вершины – это синтаксическая единица (ЛЛЕ), имеющая прямую подчинительную связь со словом группы ЛЛЕ первого уровня. Установление синтаксического уровня ЛЛЕ является синтаксическим структурированием ЛЛЕ.[112] FIG. 21, by way of example, but not limitation, shows the general structure of the linguistic characteristics database (BDLP) formed within step 2031, which is the BDLP text elements 21 of the linguistic sentence 11 contained in the elements 61 of the fifth UDF data structure. The BDLP formed in step 2031 differs from the BDLP formed in step 2022 by the presence of 2151 fourth-part linguistic characteristics 215 indicating the level of syntactic significance of element 61 (LLE). The level of syntactic significance of the element 61 (LLE) characterizes the location of LLE in the syntactic tree of the linguistic sentence 11. The syntactic tree is the syntax of the sentence of sentence 11, in which a separate syntactic connection is established between the individual words (LLE). Depending on the composition and structure of the sentence, the syntactic tree may contain an indefinite number of syntactic levels and parts of the sentence that contain the main logical elements (the subject and the predicate of the judgment). The syntax tree used in this method contains elements (LLE) of at least three levels of syntactic significance (HSS). The first HSS include LLE, located on the syntax vertex of the syntactic tree. The second HSS include LLE, which are direct syntactic descendants of syntactic vertices. The third HSS include all other LLE linguistic sentences. A syntactic vertex is a syntactic unit (LLE), having a predicate role. A feature of LLE "predicate" is that it can consist of three words. A direct syntactic descendant of a syntactic vertex is a syntactic unit (LLE), which has a direct subordinate connection with the word of the LLE group of the first level. The establishment of the syntactic level of LLE is the syntactic structuring of LLE.

[113] Формирование четвертой части лингвистических характеристик 215 и их значений 2151 для текстовых элементов 21 лингвистического предложения 11, содержащихся в элементах 61, с целью установления уровня синтаксической значимости элементов 61 пятой структуры данных СМД в ходе этапа 2031 производят на основании комплексного анализа значений лингвистических характеристик всех ЛЛЕ 61 лингвистического предложения, на основе которого формируют синтаксическое дерево лингвистического предложения. В результате выяснения положения каждого ЛЛЕ в синтаксическом дереве предложения определяют уровень синтаксической значимости каждого ЛЛЕ 61.[113] The formation of the fourth part of the linguistic characteristics 215 and their meanings 2151 for the textual elements 21 of the linguistic sentence 11 contained in the elements 61, in order to establish the level of syntactic significance of the elements 61 of the fifth SMD data structure during step 2031 is produced based on a comprehensive analysis of the values of linguistic characteristics all LLE 61 linguistic sentences, on the basis of which form the syntactic tree of the linguistic sentence. As a result of finding out the position of each LLE in the syntactic tree of a sentence, they determine the level of syntactic significance of each LLE 61.

[114] Сформированные по итогам этапа 2031 значения 2151 (уровень синтаксической значимости ЛЛЕ 61) четвертой части лингвистических характеристик 215 элементов 21, составляющих элементы 61 пятой структуры данных СМД, вносят в БДЛП текстовых элементов 21 лингвистического предложения11, формируемую в рамках этапа 2022, формируя таким образом БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031. При этом все части (211, 214, 223, 215) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2231, 2151) формируют уникальные лингвистические признаки элементов 61.[114] Formed at the end of step 2031, the values of 2151 (the syntactic significance level of LLE 61) of the fourth part of the linguistic characteristics 215 elements 21 constituting the elements 61 of the fifth SMD data structure contribute to the BDLP of textual elements 21 of the linguistic sentence 11 formed in BDLP text elements 21 of the linguistic sentence 11, formed in the framework of step 2031. In this case, all parts (211, 214, 223, 215) of the linguistic characteristics of the text elements 21 of the linguistic sentence 11 and their meaning (2111, 2141, 2231, 2151) form the unique linguistic features of the elements 61.

[115] На фиг. 22, в качестве примера, но не ограничения, изображена общая структура сформированной шестой структуры данных СМД, являющаяся второй структурой данных для настоящего способа преобразования 200. Шестая структура данных СМД представляет собой СМД, содержащий элементы 71, которые представляют собой структурированные группы лингво-логических единиц (группы ЛЛЕ) лингвистического предложения 11 и идентификационные данные групп ЛЛЕ, представляющие собой для каждой группы ЛЛЕ, в качестве примера, но не ограничения, значение 711 элемента 71 шестой структуры данных и порядковый (порядковые) номер (номера) 712 ТЭ, составляющего (составляющих) группу ЛЛЕ. У групп ЛЛЕ 71 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН групп ЛЛЕ), имеющие практическое использование. В структуре данных элементы 71, в качестве примера, но не ограничения, могут именоваться как «группа ЛЛЕ 1», «группа ЛЛЕ 2», «группа ЛЛЕ 3», «группа ЛЛЕ n», где n ≥ 1 - порядковый номер элемента в лингвистическом предложении. Группа ЛЛЕ лингвистического предложения 11 – это синтаксические единицы вида «синтаксическая конструкция», которые формируются из лингво-логических единиц (элементов 61 пятой структуры данных СМД) разных уровней синтаксической значимости ЛЛЕ. К первой группе ЛЛЕ (первые элементы 71 шестой структуры данных СМД) относят как главные ЛЛЕ первой группы ЛЛЕ, являющиеся упомянутыми синтаксическими вершинами (ЛЛЕ первого УСЗ), так и прочие ЛЛЕ первой группы ЛЛЕ (группы 1 ЛЛЕ), являющиеся последовательно подчиненными ЛЛЕ, первая из которых имеет прямую подчинительную связь с ЛЛЕ первого УСЗ, вплоть до ЛЛЕ, которая является главной ЛЛЕ второй группы ЛЛЕ. Ко второй группе ЛЛЕ (вторые элементы 71 шестой структуры данных СМД) относят как главные ЛЛЕ второй группы ЛЛЕ, являющиеся упомянутыми ЛЛЕ второго УСЗ при условии, что, такой ЛЛЕ имеет синтаксическую роль подлежащего или любого второстепенного члена предложения, кроме определения (исключая определения в форме распространенного причастия или деепричастия), так и прочие ЛЛЕ второй группы ЛЛЕ, являющиеся последовательно подчиненными ЛЛЕ, первая из которых является ЛЛЕ третьего УСЗ, которые имеют прямую подчинительную связь с упомянутым главным ЛЛЕ второй группы ЛЛЕ, вплоть до последних ЛЛЕ в цепочке ЛЛЕ с непрерывной подчинительной связью. [115] FIG. 22 shows, by way of example, but not limitation, the general structure of the sixth formed data structure of the SMD, which is the second data structure for this transformation method 200. The sixth data structure of the MDD is the SMD containing elements 71, which are structured groups of linguistic units. (LLE groups) of the linguistic sentence 11 and the identification data of the LLE groups, representing for each LLE group, as an example, but not limitation, the value 711 of the element 71 of the sixth pattern data courses and ordinal (s) number (s) of 712 TEs constituting (constituting) the LLE group. The LLE 71 groups of the linguistic sentence 11 lack the unique names that characterize them (UN LLE groups) that have practical use. In the data structure, elements 71, as an example, but not limitation, may be referred to as “LLE 1 group”, “LLE 2 group”, “LLE 3 group”, “LLE n group”, where n ≥ 1 is the element number in linguistic sentence. The LLE group of a linguistic sentence 11 is syntactic units of the “syntactic structure” type, which are formed from linguistic-logical units (elements 61 of the fifth SMD data structure) of different levels of syntactic significance of the LLE. The first LLE group (first elements 71 of the sixth SMD data structure) includes both the main LLE of the first LLE group, which are the mentioned syntax vertices (LLE of the first HSS), and the other LLE of the first LLE group (group 1 LLE), which are consistently subordinate to LLE, the first of which has a direct subordinate connection with the LLE of the first HSS, up to the LLE, which is the main LLE of the second group of LLE. The second LLE group (the second elements 71 of the sixth SMD data structure) is referred to as the main LLE of the second LLE group, referred to as the LLE of the second HSS, provided that such LLE has the syntactic role of the subject or any secondary member of the sentence, except for the definition (excluding definitions in the form common and participles) and other LLE of the second group of LLE, which are consistently subordinate to the LLE, the first of which is the LLE of the third HSS, which have a direct subordinate connection with the said chapter LLE of the second LLE group, up to the last LLE in the LLE chain with a continuous subordinate connection.

[116] Идентификацию элементов 71 (первых и вторых элементов 71) шестой структуры данных СМ в ходе этапа 2032 производят посредством идентификации главных ЛЛЕ первых и вторых групп ЛЛЕ, а также идентификации прочих ЛЛЕ первых и вторых групп ЛЛЕ. Для идентификации главных ЛЛЕ первых групп ЛЛЕ необходимо выявить все ЛЛЕ «сказуемое» (в том числе, все части каждого ЛЛЕ «сказуемое») анализируемого предложения. Для идентификации главных ЛЛЕ вторых групп ЛЛЕ необходимо выявить все ЛЛЕ, которые имеют прямую синтаксическую связь с любой частью ЛЛЕ «сказуемое» и которые при этом имеют синтаксическую роль подлежащего или любого второстепенного члена предложения, кроме определения (исключая определения в форме распространенного причастия или деепричастия). Для идентификации прочих ЛЛЕ первой или второй группы ЛЛЕ необходимо идентифицировать все ЛЛЕ, которые имеют непрерывную синтаксическую подчинительную связь, начиная от главного ЛЛЕ первой или второй группы ЛЛЕ и вплоть до другого идентифицированного главного ЛЛЕ первой или второй группы ЛЛЕ, или до последнего ЛЛЕ в цепочке непрерывной синтаксической подчинительной связи от главного ЛЛЕ первой или второй группы ЛЛЕ. Формирование первых элементов 71 шестой структуры данных СМД производят путем объединения идентифицированных главной ЛЛЕ первой группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ. Формирование вторых элементов 71 шестой структуры данных СМ производят путем объединения идентифицированных главной ЛЛЕ второй группы ЛЛЕ и прочих ЛЛЕ для этой главной ЛЛЕ.[116] The identification of elements 71 (first and second elements 71) of the sixth SM data structure during step 2032 is performed by identifying the main LLE of the first and second LLE groups, as well as identifying the other LLE of the first and second LLE groups. To identify the main LLE of the first LLE groups, it is necessary to reveal all the LLE “predicate” (including all parts of each LLE “predicate) of the analyzed sentence. To identify the main LLE of the second LLE groups, it is necessary to identify all LLEs that have a direct syntactic connection with any part of the LLE “predicate” and which at the same time have the syntactic role of the subject or any secondary member of the sentence, except for the definition (excluding the definition in the form of common participle or microparticle . To identify other LLE of the first or second LLE group, it is necessary to identify all LLE's that have a continuous syntactic subordinate relationship, starting from the main LLE of the first or second LLE group and up to another identified main LLE of the first or second LLE group, or the last LLE in a chain of continuous syntactic subordinate connection from the main LLE of the first or second group LLE. The formation of the first elements 71 of the sixth SMD data structure is carried out by combining the identified LLE of the first group of LLE and other LLE for this main LLE. The formation of the second elements 71 of the sixth SM data structure is carried out by combining the identified LLE main group of the second LLE group and other LLE for this main LLE.

[117] Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ первого элемента 71 (первой группы ЛЛЕ) шестой структуры данных СМД в рамках этапа 2032 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент (элементы) 61, из которого (которых) состоит первый элемент 71, идентифицируют как значение 711 первого элемента 71 (первая группа ЛЛЕ), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент (элементы) 61, из которого (которых) состоит первый элемент 71, идентифицируют как порядковый (порядковые) номер (номера) 712 ТЭ, составляющего(составляющих) первый элемент 71 (первая группа ЛЛЕ). Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ второго элемента 71 (второй группы ЛЛЕ) шестой структуры данных СМД в рамках этапа 2032 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент (элементы) 61, из которого (которых) состоит второй элемент 71, идентифицируют как значение 711 второго элемента 71 (вторая группа ЛЛЕ), а порядковый (порядковые) номер (номера) 212 упомянутого (упомянутых) ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 61, из которого (которых) состоит второй элемент 71, идентифицируют как порядковый (порядковые) номер (номера) 712 ТЭ, составляющего(составляющих) второй элемент 71 (вторая группа ЛЛЕ).[117] The identification of the value and ordinal (ordinal) number (s) of the TE of the first element 71 (first LLE group) of the sixth data structure of the MDD within step 2032 is as follows: the value (s) 211 of the TE 21 of the linguistic sentence 11 constituting the element (s) 61 of which (which) the first element 71 consists are identified as the value 711 of the first element 71 (the first LLE group), and the ordinal number (s) 212 of the said (mentioned) TE 21 linguistic sentence 11, constituting (constituting ) Element (s) 61, from which (whom) includes a first member 71, identified as sequence (sequence) number (s) 712 TE constituting (constituting) the first member 71 (the first group LLE). The identification of the value and ordinal (ordinal) numbers (numbers) of TEs of the second element 71 (second LLE group) of the sixth data structure of the SMD data as part of step 2032 is as follows: the value (values) 211 TEs 21 of the linguistic sentence 11 constituting ) 61, of which (which) the second element 71 consists, is identified as the value 711 of the second element 71 (second LLE group), and the ordinal number (s) 212 of the above (mentioned) TE 21 linguistic sentence 11 constituting (components) uh ement 61, from which (whom) includes a second member 71, identified as sequence (sequence) number (s) 712 TE constituting (components) of the second member 71 (the second group LLE).

[118] Формирование шестой структуры данных СМД в ходе этапа 2032 производят путем объединения в одной структуре данных первых и вторых элементов 71 шестой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются.[118] The formation of the sixth data structure of the MDD during step 2032 is performed by combining the first and second elements 71 of the sixth data structure of the DMD data and their identification data according to principles and methods known from the prior art in a single data structure, are described.

[119] Идентификацию лингвистических характеристик ТЭ, составляющих первые или вторые элементы 71 (первую или вторую группу ЛЛЕ) шестой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2031, состоящего из идентификационных данных ТЭ, составляющих первый или второй элемент 71 (первая или вторая группа ЛЛЕ), и получении значений (2131, 2141, 2231, 2151) всех частей лингвистических характеристик (213, 214, 223, 215) текстовых элементов 21 лингвистического предложения 11, из которых состоит первый или второй элемент 71 (первая или вторая группа ЛЛЕ). При этом, как было описано ранее, лингвистическими признаками первых и вторых элементов 71 (первой и второй группы ЛЛЕ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 71 (группы ЛЛЕ).[119] Identification of linguistic characteristics of TEs that make up the first or second elements 71 (the first or second LLE group) of the sixth data structure of the MDD and their values, if necessary, is produced by organizing a query in the BDLP, formed as part of step 2031, consisting of the identification data of TEs the first or second element 71 (first or second LLE group), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the first left or second element 71 (the first or second group of LLE). At the same time, as described earlier, the linguistic features of the first and second elements 71 (first and second LLE groups) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, which the elements 71 (LLE groups) consist of.

[120] На фиг. 23, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 204 формирования седьмой структуры данных СМД, являющейся третьей структурой данных для рассматриваемого способа 200. Этап 204 характеризуется: выполнением этапа 2041 идентификации видов элементов 71 шестой структуры данных СМД, указывающих на наличие в элементе 71 осложнений лингвистического предложения, на котором идентифицируют первые и вторые виды элементов 71 шестой структуры данных СМД, а также идентификации непреобразованных элементов 81 седьмой структуры данных СМД и их идентификационных данных, представляющих собой для каждого непреобразованного элемента 81, в качестве примера, но не ограничения, значение 811 непреобразованного элемента 81 седьмой структуры данных СМД и порядковый (порядковые) номер (номера) 812 ТЭ лингвистического предложения 11, составляющего (составляющих) непреобразованный элемент 81 (значение и порядковые номера ТЭ непреобразованного элемента 81); выполнением этапа 2042 формирования преобразованных элементов 81 седьмой структуры данных СМД, на котором формируют преобразованные элементы седьмой структуры данных СМД из элементов 71 второго вида, а также идентификационные данные преобразованных элементов 81, представляющие собой для каждого преобразованного элемента 81, в качестве примера, но не ограничения, значение 811 преобразованного элемента 81 седьмой структуры данных СМД и порядковый (порядковые) номер (номера) 812 ТЭ лингвистического предложения 11, составляющего (составляющих) преобразованный элемент 81(значение и порядковые номера ТЭ преобразованного элемента 81); выполнением этапа 2043 формирования седьмой структуры данных СМД, на котором формируют седьмую структуру данных СМД из преобразованных элементов 81 и непреобразованных элементов 81 седьмой структуры данных СМД.[120] FIG. 23, by way of example, but not limitation, shows the general scheme for performing the steps of step 204 of forming the seventh data structure of the DMD, which is the third data structure for the method 200 in question. Step 204 is characterized by: performing step 2041 of identifying the types of elements 71 of the sixth data structure of the MDD the presence in element 71 of the complications of the linguistic sentence, which identify the first and second types of elements 71 of the sixth SMD data structure, as well as the identification of non-transformed elements 81 of the seventh structure the data paths of the SMD data and their identification data representing, for each non-transformed element 81, as an example, but not limitation, the value 811 of the non-transformed element 81 of the seventh SMD data structure and the ordinal number of the linguistic sentence 11 constituting ( components) non-transformed element 81 (value and sequence numbers of TE non-transformed element 81); performing step 2042 of generating the transformed elements 81 of the seventh SMD data structure, on which the transformed elements of the seventh MDD data structure are formed from the second type elements 71, as well as the identification data of the transformed elements 81, representing for each transformed element 81, as an example but not limitation , the value 811 of the transformed element 81 of the seventh data structure of the MDD and the ordinal (s) number (s) 812 TE of the linguistic sentence 11, constituting (components) razovanny element 81 (value and the converted ordinal numbers TE element 81); performing step 2043 of forming the seventh SMD data structure, wherein the seventh SMD data structure is formed from the transformed elements 81 and the non-transformed elements 81 of the seventh SMD data structure.

[121] На фиг. 24, в качестве примера, но не ограничения, изображена общая структура сформированной седьмой структуры данных СМД, являющейся третьей структурой данных для настоящего способа преобразования 200. Седьмая структура данных СМД представляет собой СМД, содержащий непреобразованные элементы 81 и преобразованные элементы 81, которые представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения 11. У ОЛЛО лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ОЛЛО), имеющие практическое использование, в качестве примера, но не ограничения: «субъект суждения», «предикат суждения» и тому подобное. В структуре данных элементы 81 именуются уникальными наименованиями, и, в качестве примера, но не ограничения, могут именоваться как «УН ОЛЛО n», где n ≥ 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ОЛЛО, ранее не встречавшегося в лингвистическом предложении. В дальнейшем, при упоминании ОЛЛО как элемента седьмой структуры данных имеется в виду УН ОЛЛО. Основные лингво-логические объекты предложения – это пограничная сущность с признаками как лингвистического, так и логического объектов. Сущность – это объект в компьютерной системе, содержащий набор критических правил. С лингвистической точки зрения, основной лингво-логический объект – это синтаксическая единица вида «синтаксическая конструкция», которая может быть сформирована из структурированной группы ЛЛЕ путем гетерогенизации группы ЛЛЕ. Гетерогенизация группы ЛЛЕ – это устранение однородностей в синтаксической конструкции путем идентификации в ней синтаксической сочинительной связи и преобразования синтаксической конструкции с однородностями в несколько синтаксических конструкций без однородностей. Сочинительная связь – это связь между синтаксически равноправными единицами предложения (в данном случае между ЛЛЕ), у которых имеется одно и то же синтаксически главное слово (главная ЛЛЕ) и одна и та же синтаксическая роль (синтаксическая роль ЛЛЕ). ЛЛЕ, между которыми идентифицирована синтаксическая сочинительная связь, считаются «однородными членами» (ЛЛЕ-ОЧ). С логической точки зрения ОЛЛО – это логические сущности (объекты), являющиеся элементами простого суждения, с помощью которых формируют и передают мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъекте суждения). При этом нечто (то, что утверждается или опровергается о предмете суждения) может быть дополнительно логически структурирован. Например, но не ограничиваясь, предикат суждения может быть разделен на три логически отделимые логические сущности (объекта) - действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения. Упомянутые выше для примера элементы простого суждения (субъект суждения, действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения) могут быть отождествлены с отдельными УН ОЛЛО, как с отдельными синтаксическими конструкциями лингвистического предложения 11. С семантической точки зрения ОЛЛО представляют собой обобщенный мыслимый (семантический) образ элемента простого суждения. [121] FIG. 24 shows, by way of example, but not limitation, the general structure of the seventh SMD data structure that is the third data structure for this transformation method 200. The seventh SMD data structure is an SMD containing non-transformed elements 81 and transformed elements 81, which are basic linguistic-logical objects (OLLO) of the linguistic sentence 11. OLLO linguistic sentence 11 has characterizing their unique names (UN OLLO), which have practical and Use, as an example, but not limitation: "subject of judgment", "predicate judgments" and the like. In the data structure, elements 81 are referred to as unique names, and, by way of example, but not limitation, can be referred to as “UN OLLO n”, where n ≥ 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN OLLO, not previously encountered in the linguistic sentence. In the future, when OLLO is mentioned as an element of the seventh data structure, I mean the OLLO UN. The main linguistic-logical objects of a sentence are a border entity with signs of both linguistic and logical objects. An entity is an object in a computer system containing a set of critical rules. From the linguistic point of view, the main linguo-logical object is a syntactic unit of the form “syntactic structure”, which can be formed from the structured LLE group by heterogenizing the LLE group. Heterogenization of the LLE group is the elimination of homogeneity in the syntactic structure by identifying in it the syntactic, somatic link and converting the syntactic structure with homogeneities into several syntactic structures without homogeneities. A writing connection is a connection between syntactically equivalent sentence units (in this case between LLE), which have the same syntactically main word (main LLE) and the same syntactic role (syntactic role of LLE). LLE, between which syntactic and somatic connection is identified, are considered “homogeneous members” (LLE-POC). From a logical point of view, OLLOs are logical entities (objects) that are elements of a simple judgment, with the help of which they form and convey the idea that something (predicate of judgment) is affirmed or refuted about the subject of judgment (the subject of judgment). In this case, something (that which is affirmed or refuted about the subject of judgment) can be additionally logically structured. For example, but not limited to, a predicate of judgment can be divided into three logically separable logical entities (objects) —the action of the predicate of judgment, the object of the predicate of judgment, and the circumstances of the predicate of judgment. The elements of simple judgment mentioned above (subject of judgment, action of the predicate of judgment, object of the predicate of judgment, and circumstances of the predicate of judgment) mentioned above can be identified with separate UN OLLOs as separate syntactic constructions of the linguistic sentence 11. From the semantic point of view, OLLOs are generalized thinkable ( semantic image of the element of simple judgment.

[122] Идентификацию элементов 71 первого или второго вида шестой структуры данных СМД в рамках этапа 2041 производят путем анализа значений лингвистических характеристик текстовых элементов шестой структуры данных СМД, составляющих элемент 71 (группу ЛЛЕ), с целью идентификации синтаксических сочинительных связей в группе ЛЛЕ 71. Синтаксическая сочинительная связь между текстовыми элементами (словами, ЛЛЕ) в группе ЛЛЕ 71 идентифицируют в случае наличия у таких ЛЛЕ (слов) одного и того же синтаксического родителя (синтаксически главного слова, у которого с такими ЛЛЕ (словами) имеется прямая синтаксическая подчинительная связь). Дополнительными условиями может быть наличие у таких ЛЛЕ (слов) одной и той же синтаксической роли, а также наличие признака связи между такими ЛЛЕ (словами), а именно запятой или сочинительного союза. Сочинительные союзы делятся по значению на соединительные («и», «да» в значении «и», «ни... ни», «также», «тоже», «как... так и»), разделительные («или», «или... или», «либо», «либо... либо», «то... то», «то ли... то ли», «не то... не то») и противительные («а», «но», «однако», «да» в значении «но»), в том числе сопоставительные («не только... но и», «не только... а и», «не только не... но», «не столько... сколько»). Предварительно могут быть заданы иные собственные критерии идентификации сочинительной связи или, например, не ограничиваясь, может быть задано игнорирование какого-либо дополнительного условия, например, не ограничиваясь, условия о наличии признака связи. При идентификации синтаксической сочинительной связи в группе ЛЛЕ такие группы ЛЛЕ с однородными членами идентифицируются как второй вид элемента 71 шестой структуры данных СМД. Все иные группы ЛЛЕ, в которых не идентифицируется синтаксическая сочинительная связь, идентифицируются как первый вид элемента 71 шестой структуры данных СМД. При этом идентифицированный первый вид элемента 71 шестой структуры данных СМД отождествляют с непреобразованным элементом 81 седьмой структуры данных СМД. Формирование преобразованных элементов седьмой структуры данных СМД (преобразованных элементов 81, полученных из элементов 71 второго вида) на этапе 2042 производят на основании идентифицированной на этапе 2041 синтаксической сочинительной связи и однородных членов путем преобразования идентифицированных элементов 71 второго вида шестой структуры данных СМД. Смысл преобразования элемента 71 второго вида на этапе 2042 состоит в гетерогенизации группы ЛЛЕ, то есть в устранении синтаксических однородностей в группе ЛЛЕ путем формирования из элемента 71 второго вида множества новых групп ЛЛЕ, идентичных по однородностям элементу 71 первого вида. При этом каждая новая группа ЛЛЕ упомянутого множества может содержать только один из упомянутых однородных членов (если элемент 71 второго вида содержит один ряд однородных членов) или только одно уникальное сочетание упомянутых однородных членов разных рядов однородных членов (если элемент 71 второго вида содержит несколько рядов однородных членов). Множество групп ЛЛЕ, сформированных из элемента 71 второго вида, являются гетерогенными ОЛЛО (преобразованными элементами 81), то есть сформированными из одной группы ЛЛЕ 71 второго вида путем ее гетерогенного преобразования (гетерогенизации). Процесс гетерогенизации элементов 71 второго вида может быть проведен, в качестве примера, но не ограничения, следующим образом: на первом этапе выявляют ряды однородных членов в анализируемом элементе 71 второго вида; в ходе выявления рядов однородных членов выявляются сами ряды однородных членов и порядковые номера однородных членов в ряду, а также признаки связи каждого однородного члена (ЛЛЕ-ОЧ); на втором этапе выявляют цепочки однородных членов для каждого выявленного ЛЛЕ-ОЧ элемента 71 второго вида; при этом цепочки однородных членов (цепочки ОЧ) - это ЛЛЕ-ОЧ и зависимая цепочка ОЧ (цепочка синтаксически связанных ЛЛЕ, начиная от первого синтаксического потомка ЛЛЕ-ОЧ (синтаксически зависимого слова) и продолжая по цепочке синтаксической зависимости (по синтаксической подчинительной связи) до другого ЛЛЕ-ОЧ или до последней ЛЛЕ в элементе 71 второго вида; идентифицированные цепочки ОЧ классифицируются по факту наличия синтаксического потомка ЛЛЕ в зависимой цепочке ОЧ, который не входит в зависимую цепочку ОЧ; те цепочки ОЧ, которые имеют зависимые цепочки ОЧ без синтаксического потомка за рамками зависимой цепочки ОЧ считаются крайними цепочками однородных членов (крайними цепочками ОЧ), а те цепочки ОЧ, которые имеют зависимые цепочки ОЧ с синтаксическим потомком за рамками зависимой цепочки ОЧ считаются внутренними цепочками однородных членов (внутренними цепочками ОЧ); на третьем этапе выявляют ЛЛЕ элемента 71 второго вида, не входящие в цепочки однородных членов (ЛЛЕ вне цепочек ОЧ); на четвертом этапе формируют сменные зависимые цепочки (сменные ЗЦ) элемента 71 второго вида; при этом сменная ЗЦ - это основа преобразованных элементов 81, состоящая из одной крайней цепочки ОЧ и внутренних цепочек ОЧ, если такие внутренние цепочки ОЧ по цепочке непрерывной синтаксической подчинительной связи имеются между крайней цепочкой ОЧ и ЛЛЕ вне цепочек ОЧ; на пятом этапе формируют гетерогенные основные лингво-логические объекты (ОЛЛО); при этом гетерогенный ОЛЛО формируется из одной сменной ЗЦ и ЛЛЕ вне цепочки ОЧ (если такие ЛЛЕ есть); количество сменных ЗЦ элемента 71 второго вида определяет количество гетерогенных ОЛЛО, сформированных от одного элемента 71 второго вида.[122] Identification of elements 71 of the first or second type of the sixth SMD data structure under step 2041 is performed by analyzing the values of the linguistic characteristics of the text elements of the sixth SMD data structure constituting element 71 (LLE group) in order to identify syntactic composing connections in the LLE group 71. The syntactic writing relationship between text elements (words, LLE) in the LLE 71 group is identified if such LLE (words) have the same syntactic parent (syntactic main word, which with such LLE (words) has a direct syntactic subordinate connection). Additional conditions may be that such LLE (words) have the same syntactic role, as well as the presence of an indication of a connection between such LLE (words), namely, a comma or a writing union. Writing unions are divided by value into connecting ("and", "yes" in the meaning of "and", "neither ... nor", "also", "also", "both ... and"), dividing (" either "," or ... or "," or "," either ... or "," then ... then "," whether ... whether "," not that ... not that " ) and adversary ("a", "but", "however", "yes" in the meaning of "but"), including comparative ("not only ... but", "" not only ... but and " , "Not only not ... but", "not so much ... how much"). Other own criteria for identifying a sociable link can be pre-set, or, for example, not limited to, ignoring any additional condition, for example, not limiting to the condition about the presence of a link sign, can be set. When identifying a syntactic intimate relationship in the LLE group, such LLE groups with homogeneous members are identified as the second type of element 71 of the sixth SMD data structure. All other LLE groups in which the syntactic composing link is not identified are identified as the first type of element 71 of the sixth data structure of the SMD. In this case, the identified first type element 71 of the sixth SMD data structure is identified with the non-transformed element 81 of the seventh SMD data structure. The formation of the transformed elements of the seventh SMD data structure (transformed elements 81, obtained from the second type elements 71) at step 2042 is performed based on the syntactic composing link identified at step 2041 and homogeneous members by transforming the identified second element elements 71 of the sixth data structure of the MDD. The meaning of the transformation of the element 71 of the second type at step 2042 consists in heterogenizing the LLE group, that is, eliminating syntactic homogeneities in the LLE group by forming from the element 71 of the second type a set of new LLE groups identical in homogeneity to the element 71 of the first type. Moreover, each new LLE group of the mentioned set can contain only one of the mentioned homogeneous members (if the element 71 of the second type contains one row of homogeneous members) or only one unique combination of the mentioned homogeneous members of different rows of homogeneous members (if the element 71 of the second type contains several rows of homogeneous members). The set of LLE groups formed from the element 71 of the second type are heterogeneous OLLO (transformed elements 81), that is, formed from one group of the LLE 71 of the second type by its heterogeneous transformation (heterogenization). The process of heterogenization of the elements 71 of the second type can be carried out, by way of example, but not limitation, as follows: in the first stage, rows of homogeneous members are detected in the analyzed element 71 of the second type; in the course of identifying the series of homogeneous members, the series of homogeneous members themselves and the sequence numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member (LLE-TOR), are identified; at the second stage, chains of homogeneous members are detected for each LLE-PCH element 71 of the second type; the chains of homogeneous members (chains of PTS) are LLE-POC and the dependent chain of PTS (a chain of syntactically related LLEs, starting from the first syntactic descendant of LLE-POC (a syntactically dependent word) and continuing along the chain of syntactic dependence (on a syntactic subordinate connection) another LLE-POC or to the last LLE in element 71 of the second type; the identified POC chains are classified according to the fact that there is a syntactic descendant of LLE in the dependent POC chain that is not included in the dependent POC chain; those POC chains that dependent PTS chains without a syntactic descendant outside the dependent POC chains are considered as extreme chains of homogeneous members (extreme chains of PTS), and those PEC chains that have dependent POC chains with a syntactic descendant beyond the framework of the dependent POC chains are considered as internal chains of homogeneous members (internal chains of PTS ); at the third stage, LLE of the element 71 of the second type, not included in the chains of homogeneous members (LLE outside the PTS chains), is detected; in the fourth stage, replaceable dependent chains (interchangeable SCs) of the element 71 of the second type are formed; at the same time, a replaceable SC is the basis of the transformed elements 81, consisting of one extreme PTS chain and internal PTS chains, if such internal PTS chains along a chain of continuous syntactic subordinate relationship exist between the PTS extreme chain and LLE outside the PTS chains; at the fifth stage, heterogeneous basic linguo-logical objects (OLLO) are formed; at the same time, a heterogeneous OLLO is formed from one interchangeable ZZ and LLE outside the PTS chain (if there are such LLE); the number of interchangeable replacement elements of the element 71 of the second type determines the number of heterogeneous OLLOs formed from one element 71 of the second type.

[123] Идентификация видов элементов 71 шестой структуры данных СМД в рамках этапа 2041 не изменяет значение 711 элемента 71 и не изменяет порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 71 (группу ЛЛЕ). Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ непреобразованного элемента 81 (ОЛЛО) седьмой структуры данных СМД в рамках этапа 2041 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 первого вида шестой структуры данных СМД идентифицируют как значение 811 непреобразованного элемента 81 (ОЛЛО), а порядковый (порядковые) номер (номера) 712 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 из которого состоит непреобразованный элемент 81 идентифицируют как порядковый (порядковые) номер (номера) 812 ТЭ, составляющего (составляющих) непреобразованный элемент 81 (ОЛЛО). Идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ преобразованного элемента 81 (гетерогенного ОЛЛО) седьмой структуры данных СМД в рамках этапа 2042 производят следующим образом: значение (значения) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 второго вида шестой структуры данных СМД, за исключением значения (значений) 211 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) отдельную (отдельные) часть (части) элемента 71 второго вида (ЛЛЕ-ОЧ), которая (которые) была (были) удалена (удалены) при гетерогенизации, и признаков связи удаленных ЛЛЕ-ОЧ (синтаксически подчиненные удаленным ЛЛЕ-ОЧ сочинительные союзы или знаки препинания) идентифицируют как значение 811 преобразованного элемента 81 (ОЛЛО), а порядковый (порядковые) номер (номера) 212 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 71 второго вида шестой структуры данных СМД, за исключением порядкового (порядковых) номера (номеров) 212 ТЭ 21 лингвистического предложения 11, составляющего (составляющих) отдельную (отдельные) часть (части) элемента 71 второго вида (ЛЛЕ-ОЧ), которая (которые) была (были) удалена (удалены) при гетерогенизации, и признаков связи удаленных ЛЛЕ-ОЧ (синтаксически подчиненные удаленным ЛЛЕ-ОЧ сочинительные союзы или знаки препинания) идентифицируют как порядковый (порядковые) номер (номера) 812 ТЭ, составляющего (составляющих) преобразованный элемент 81 (гетерогенный ОЛЛО).[123] The identification of the types of elements 71 of the sixth SMD data structure in step 2041 does not change the value 711 of element 71 and does not change the sequence numbers of the text elements 21 of the linguistic sentence 11 that make up element 71 (LLE group). Identification of the value and ordinal (ordinal) number (s) of TE non-transformed element 81 (OLLO) of the seventh SMD data structure in step 2041 is as follows: value (values) 211 TE 21 of linguistic sentence 11 constituting (making) element 71 of the first type sixth the data structures of the SMD are identified as the value 811 of the non-transformed element 81 (OLLO), and the serial number (s) 712 of the TE 21 of the linguistic sentence 11 constituting the constituent element 71 of which consists of This element 81 is identified as the ordinal (s) number (s) of 812 TEs constituting (components) the non-transformed element 81 (OLLO). The identification of the value and ordinal (ordinal) number (s) of the TE of the transformed element 81 (heterogeneous OLLO) of the seventh SMD data structure in the framework of step 2042 is performed as follows: the value (values) 211 of the TE 21 of the linguistic sentence 11 constituting the (component) element 71 of the second type the sixth data structure of the SMD, except for the value (values) 211 TE 21 of the linguistic sentence 11, constituting (constituting) a separate (separate) part (parts) of the element 71 of the second type (LLE-OCH), which (which) were (were) deleted ( distant) during heterogenization, and communication attributes of remote LLE-OCH (syntactically subordinate to remote LLE-OCH composes or punctuation marks) are identified as the value 811 of the transformed element 81 (OLLO), and the ordinal number (s) of 212 TE 21 of the linguistic sentence 11, constituting (constituting) element 71 of the second type of the sixth data structure of the SMD, except for the ordinal (s) number (s) 212 TE 21 of the linguistic sentence 11, constituting (constituting) separate (separate) part (s) of the elements those 71 of the second type (LLE-OCH), which (which) were (were) removed (removed) during heterogenization, and the communication signs of the deleted LLE-OCH (syntactically subordinate to the remote LLE-OCH, composing associations or punctuation marks) are identified as ordinal (ordinal ) number (s) 812 TE, constituting (making) the transformed element 81 (heterogeneous OLLO).

[124] Формирование седьмой структуры данных СМД в рамках этапа 2043 производят путем объединения в одной структуре данных идентифицированных на этапе 2041 и сформированных на этапе 2042 элементов 81 седьмой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются. Первым из объединяемых элементов седьмой структуры данных СМД является элемент, идентифицированный на этапе 2041 как элемент 71 первого вида, являющийся непреобразованным элементом 81, то есть ОЛЛО 81, совпадающий с группой ЛЛЕ 71 без синтаксической сочинительной связи. Вторым из объединяемых элементов седьмой структуры данных СМД являются преобразованные элементы 81, сформированные на этапе 2042 как множество преобразованных элементов 81, являющихся гетерогенными ОЛЛО, сформированными из элемента 71 второго вида (групп ЛЛЕ с синтаксической сочинительной связью) путем гетерогенизации групп ЛЛЕ второго вида.[124] The formation of the seventh MDD data structure in step 2043 is performed by combining the elements of the seventh seventh SMD data structure, as well as their identification data according to principles and methods known from the prior art, in one data structure identified at step 2041 and formed at step 2042. , accordingly, further are not described in detail. The first of the merged elements of the seventh SMD data structure is the element identified at step 2041 as the element 71 of the first type, which is the untransformed element 81, that is, OLLO 81, which coincides with the LLE group 71 without syntactic composing. The second of the combined elements of the seventh SMD data structure is the transformed elements 81, formed at step 2042 as a set of transformed elements 81 that are heterogeneous OLLOs, formed from the element 71 of the second type (LLE groups with syntactic composer link) by heterogenizing the LLE groups of the second type.

[125] Идентификацию лингвистических характеристик ТЭ, составляющих первые или вторые элементы 81 (ОЛЛО) седьмой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2031, состоящего из идентификационных данных ТЭ, составляющих первый или второй элемент 81 (ОЛЛО), и получении значений (2131, 2141, 2231, 2151) всех частей лингвистических характеристик (213, 214, 223, 215) текстовых элементов 21 лингвистического предложения 11, из которых состоит первый или второй элемент 81 (ОЛЛО). При этом, как было описано ранее, лингвистическими признаками элементов 81 (ОЛЛО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 81 (ОЛЛО).[125] Identification of linguistic characteristics of TEs that make up the first or second elements 81 (OLLO) of the seventh MDD data structure and their values, if necessary, is produced by organizing a query in the BDLP, formed as part of step 2031, consisting of the identification data of TEs that make up the first or second element 81 (OLLO), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the first or second element 81 (OLLO) consists. At the same time, as described earlier, the linguistic features of the elements 81 (OLLO) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 81 (OLLO) consist.

[126] Далее, после завершения описанного ранее этапа 204, в целях еще большего повышения точности последующего поиска в структурированном массиве данных (СМД), становится возможным осуществить дальнейшее преобразование СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и их идентификационные данные.[126] Further, after completing the previously described step 204, in order to further improve the accuracy of subsequent search in a structured dataset (SMD), it becomes possible to further convert the SMD containing at least the basic linguistic objects offers and their identification data.

[127] На фиг. 25, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 300 преобразования СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО, являющегося исходной структурой данных для рассматриваемого способа 300. Заявленный способ 300 преобразования СМД, содержащего, по меньшей мере, ОЛЛО лингвистического предложения и идентификационные данные ОЛЛО, характеризуется: выполнением этапа 301 идентификации пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором идентифицируют структуру данных СМД, содержащую элементы упомянутой пригодной для преобразования структуры данных, содержащей ОЛЛО, являющейся исходной структурой данных СМД в рамках рассматриваемого способа 300, причем упомянутые элементы пригодной для преобразования структуры данных представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО; выполнением этапа 302 формирования восьмой структуры данных СМД, на котором формируют восьмую структуру данных СМД, являющуюся первой структурой данных СМД для рассматриваемого способа 300, содержащую элементы упомянутой восьмой структуры данных СМД, причем упомянутые элементы восьмой структуры данных СМД представляют собой исходные простые лингво-логические конструкции (ИП ЛЛК) лингвистического предложения, сформированные из синтаксически связанных ОЛЛО простого предложения исходного лингвистического предложения, а также представляют собой идентификационные данные ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, в качестве примера, но не ограничения: значение ИП ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИП ЛЛК; выполнением этапа 303 формирования девятой структуры данных СМД, на котором формируют девятую структуру данных СМД, являющуюся второй структурой данных СМД для рассматриваемого способа 300, содержащую элементы девятой структуры данных СМД, причем упомянутые элементы девятой структуры данных СМД представляют собой простые лингво-логические конструкции (ПЛЛК) лингвистического предложения, сформированные из ИП ЛЛК путем устранения однородностей в ИП ЛЛК, а также представляют собой идентификационные данные ПЛЛК, представляющие собой для каждой ПЛЛК, в качестве примера, но не ограничения: значение ПЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ПЛЛК; выполнением этапа 304 формирования десятой структуры данных СМД, на котором формируют десятую структуру данных СМД, являющуюся третьей структурой данных СМД для рассматриваемого способа 300, содержащую элемент упомянутой десятой структуры данных СМД, причем упомянутый элемент десятой структуры данных СМД представляет собой исходную сложную лингво-логическую конструкцию (ИС ЛЛК) лингвистического предложения, сформированную путем объединения всех ПЛЛК с учетом синтаксических связей ПЛЛК в исходном лингвистическом предложении, а также представляет собой идентификационные данные ИС ЛЛК, представляющие собой, в качестве примера, но не ограничения: значение ИС ЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих ИС ЛЛК; выполнением этапа 305 формирования одиннадцатой структуры данных СМД, на котором формируют одиннадцатую структуру данных СМД, являющуюся итоговой структурой данных СМД для рассматриваемого способа 300, содержащую элементы упомянутой одиннадцатой структуры данных СМД, причем упомянутые элементы одиннадцатой структуры данных СМД представляют собой сложные лингво-логические конструкции (СЛЛК) лингвистического предложения, сформированные из ИС ЛЛК путем устранения однородностей в ИС ЛЛК, а также представляют собой идентификационные данные СЛЛК, представляющие собой для каждой СЛЛК, в качестве примера, но не ограничения: значение СЛЛК и порядковые номера ТЭ лингвистического предложения, составляющих СЛЛК.[127] FIG. 25, by way of example, but not limitation, depicts a general scheme for performing the steps of the claimed method 300 for converting an SMD containing at least the main linguistic-logical objects (OLLO) of the linguistic sentence and the identification data of the OLLO, which is the initial data structure for the method 300 in question The claimed method 300 for converting an SMD containing at least the OLLO linguistic sentence and the OLLO identification data is characterized by: performing an identification step 301 suitable for Formation of a data structure containing an OLLO, which identifies an MCD data structure containing the elements of a convertible data structure containing an OLLO, which is the initial structure of the MCD data in the framework of the considered method 300, and logical objects (OLLO) linguistic sentences and identification data OLLO; performing step 302 of forming the eighth MDD data structure, which forms the eighth MDD data structure, which is the first MDD data structure for the considered method 300, containing the elements of the eighth SMD data structure, and the said elements of the eighth MDD data structure are the original simple linguistic-logical structures (IP LLK) linguistic sentences, formed from syntactically related OLLO simple sentences of the original linguistic sentence, as well as are a SP data identification LLK representing for each SP LLK, as an example, but not limitation: SP value LLK and sequence numbers TE linguistic proposals constituting SP LLK; the execution of step 303 of forming the ninth MDD data structure, which forms the ninth MDD data structure, which is the second MDD data structure for the considered method 300, containing elements of the ninth SMD data structure, and these elements of the ninth MDD data structure are simple linguistic-logical structures (PLC a) linguistic sentences, formed from the PI LLK by eliminating the homogeneities in the PI LLK, and also represent the identification data of the PLC, which represent zhdoy PLLK, as an example, but not limited to: the value and serial numbers PLLK TE linguistic supply components PLLK; the step 304 of forming the tenth data structure of the DMD, which forms the tenth data structure of the DMD, which is the third data structure of the MDD data for the method 300, containing the element of the tenth data structure of the MDD, and the element of the tenth data structure of the MDD is the initial complex linguistic-logical structure (IS LLK) linguistic sentence, formed by combining all PLC with the syntax of PLC in the original linguistic sentence, as well as edstavlyaet an identification data IC LLC, representing, as an example, but not limited to: the value of IP and serial numbers LLC TE linguistic proposals constitute LLC IC; the execution of step 305 of forming the eleventh data structure of the MDD, which forms the eleventh data structure of the DMD, which is the final data structure of the MDD data for the method 300, containing elements of said eleventh data structure of the DMD, and these elements of the eleventh data structure of the MDD are complex linguistic-logical structures ( SLC) of the linguistic sentence, formed from the IS LLK by eliminating the homogeneities in the IS LLK, and also represent the identification data SLLCs, representing for each SLLC, as an example, but not a limitation: the SLLC value and the sequence numbers of the TE language of the linguistic sentence that make up the SLCK.

[128] На фиг. 26, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 301 идентификации пригодной для преобразования структуры данных, содержащей основные лингво-логические объекты (ОЛЛО), являющейся исходной структурой данных для рассматриваемого способа 300. Этап 301 характеризуется выполнением идентификации пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором идентифицируют элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, а также идентификационные данные элементов 91, представляющие собой для каждого ОЛЛО, в качестве примера, но не ограничения, значение 911 элемента 91 пригодной для преобразования структуры данных, содержащей ОЛЛО и порядковый (порядковые) номер (номера) 912 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 91.[128] FIG. 26, by way of example, but not limitation, depicts a general scheme for the implementation of identification stage 301 for converting a data structure containing basic linguistic entities (OLLO), which is the initial data structure for method 300 under consideration. Step 301 is characterized by performing identification suitable for conversion a data structure containing an OLLO, on which elements 91 of a data structure suitable for conversion, containing an OLLO, are identified, as well as the identification data of the elements 91, amounts to the OLLO for each, as an example, but not limitation, a value element 911 91 is suitable for converting the data structure comprising OLLO and sequence (sequence) number (s) 912 Offer linguistic TE 11 constituting the (constituent) element 91.

[129] На фиг. 27, в качестве примера, но не ограничения, изображена общая структура данных, являющаяся исходной для настоящего способа преобразования 300, представляющая собой пригодную для преобразования структуру данных, содержащую основные лингво-логические объекты (ОЛЛО). Исходная структура данных представляет собой СМД, содержащий элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, представляющие собой основные лингво-логические объекты (ОЛЛО) и идентификационные данные ОЛЛО, представляющие собой для каждого ОЛЛО, в качестве примера, но не ограничения, значение 911 элемента 91 пригодной для преобразования структуры данных содержащей ОЛЛО и порядковый (порядковые) номер (номера) 912 ТЭ лингвистического предложения, составляющего (составляющих) ОЛЛО, которые, в качестве примера, но не ограничения, были описаны ранее со ссылкой на фиг. 24 способа 200. У элемента 91 лингвистического предложения 11 имеются характеризующие их уникальные наименования (УН ОЛЛО), имеющие практическое использование в качестве примера, но не ограничения: «субъект суждения», «действие предиката суждения» и тому подобное. В структуре данных элементы 91 именуются уникальными наименованиями, в качестве примера, но не ограничения, могут именоваться как «УН ОЛЛО n», где n ≥ 1- порядковый индекс элемента уникального наименования в лингвистическом предложении, начиная с «1» для каждого нового УН ОЛЛО, ранее не встречавшегося в лингвистическом предложении. Как было сказано ранее, с лингвистической точки зрения ОЛЛО представляют собой синтаксическую единицу вида «синтаксическая конструкция», которая может быть сформирована из структурированных групп ЛЛЕ; с логической точки зрения ОЛЛО представляют собой элементы простого суждения, с помощью которых нечто утверждается или опровергается о предмете суждения; с семантической точки зрения ОЛЛО представляют собой обобщенный мыслимый (семантический) образ элемента простого суждения. Элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, представляют собой множество ОЛЛО уникальных наименований (УН ОЛЛО) лингвистического предложения 11. ОЛЛО 91 в пригодной для преобразования структуре данных, содержащей ОЛЛО, представляют собой отдельные элементы, заранее подготовленные и помещенные в пригодную для преобразования структуру данных, содержащую ОЛЛО в виде структурированного массива (списка, перечня и тому подобного) отдельных ОЛЛО. Такие подготовительные действия могут осуществляться любым известным из уровня техники способом или неизвестным из уровня техники способом, таким, как способ, указанный при описании способа 200, и, соответственно, далее не описываются.[129] FIG. 27, as an example, but not limiting, a general data structure is shown that is the source for the present transformation method 300, which is a convertible data structure containing the main linguistic-logical objects (OLLO). The original data structure is an SMD containing elements 91 of a data structure suitable for conversion, containing OLLOs, which are the main linguistic-logical objects (OLLOs) and the OLLO identification data representing, for each OLLO, as an example, but not limitation, the value 911 an element 91 of a data structure that is suitable for conversion and contains the ordinal (s) number (s) 912 of the TE of the linguistic sentence that make up the sLL, which, as an example, but not og The limitations have been described previously with reference to FIG. 24 ways 200. The element 91 of the linguistic sentence 11 has characterizing their unique names (UN OLLO), which have practical use as an example, but not limitation: “subject of judgment”, “action of the predicate of judgment” and the like. In the data structure, elements 91 are referred to as unique names, by way of example, but not limitation, may be referred to as “UN OLLO n”, where n ≥ 1 is the ordinal index of the unique name element in the linguistic sentence, starting with “1” for each new UN OLLO not previously encountered in the linguistic sentence. As mentioned earlier, from the linguistic point of view, OLLOs represent a syntactic unit of the form “syntactic construction”, which can be formed from LLE structured groups; from a logical point of view, OLLOs are elements of a simple judgment, with the help of which something is affirmed or refuted about the subject of judgment; From the semantic point of view, OLLOs represent a generalized conceivable (semantic) image of the element of simple judgment. The elements 91 of a convertible data structure containing OLLO are a set of unique names (UNOLLO) of the linguistic sentence 11. a data structure containing an OLLO in the form of a structured array (list, list, and the like) of individual OLLOs. Such preparatory actions may be carried out by any method known from the prior art or by a method unknown from the prior art, such as the method specified in the description of method 200, and, accordingly, are not described further below.

[130] Идентификация элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, в ходе этапа 301 сводится к классификации элементов, из которых состоит пригодная для преобразования структура данных, содержащая ОЛЛО, как основных лингво-логических объектов (ОЛЛО 91). При этом все ОЛЛО 91 имеют значения 911 и порядковые номера текстовых элементов 912 лингвистического предложения, составляющие ОЛЛО. Значения 911 ОЛЛО 91 представляют собой один или несколько текстовых элементов (ТЭ 21) предложения 11, из которых состоят ОЛЛО. Количество ТЭ, из которых состоит ОЛЛО связано с технической возможностью языка при описании объекта, действия или их признаков, либо с потребностью автора описания сущностей окружающего мира (объектов, действий или их признаков) использовать определенный способ лингвистического описания, в качестве примера, но не ограничения, можно привести различные следующие способы лингвистического описания одной и той же сущности: «старый человек» = «старик» = «человек преклонных лет» и тому подобное. Указанная сущность может быть лингвистически выражена через один, два или три ТЭ. При этом, например, не ограничиваясь, сущность «права потребителей» не может быть лингвистически выражена в русском языке одним ТЭ.[130] The identification of the elements 91 of the data structure that is suitable for conversion that contains OLLO, during step 301, is reduced to the classification of the elements that make up the transformation of the data structure that contains the OLLOs as the main linguistic objects (OLLO 91). Moreover, all OLLO 91 have the values 911 and the ordinal numbers of the textual elements 912 of the linguistic sentence that constitute OLLO. The 911 OLLO 91 values represent one or more text elements (TE 21) of Proposition 11, of which OLLO is composed. The number of FCs that make up OLLO is related to the technical ability of a language when describing an object, an action or its signs, or the need of the author to describe the entities of the surrounding world (objects, actions or their signs) to use a certain linguistic description method, as an example, but not limitation , we can give the following various ways of linguistic description of the same entity: “old man” = “old man” = “old man” and the like. This entity can be linguistically expressed through one, two or three TE. At the same time, for example, without being limited to, the essence of “consumer rights” cannot be linguistically expressed in Russian as one TE.

[131] Идентификацию значения 911 элемента 91 (ОЛЛО) пригодной для преобразования структуры данных, содержащей ОЛЛО, в ходе этапа 301 производят путем регистрации набора знаков текстовых элементов 21 предложения 11, из которых состоит ОЛЛО 91. Идентификацию порядкового (порядковых) номера (номеров) 912 ТЭ, из которого (которых) состоит элемент 91 (ОЛЛО) пригодной для преобразования структуры данных, содержащей ОЛЛО, в ходе этапа 301 производят путем регистрации порядкового (порядковых) номера (номеров) упомянутых ТЭ в соответствии с их расположением в лингвистическом предложении, при условии, что первый ТЭ в лингвистическом предложении имеет номер «1», а все последующие ТЭ имеют порядковый номер, больший на единицу, чем порядковый номер, предыдущего ТЭ.[131] The identification of the 911 value of the element 91 (OLLO) of the data structure containing the OLLO that is suitable for conversion during step 301 is performed by registering a set of characters of the text elements 21 of the sentence 11, of which the OLLO 91 consists. Identification of the ordinal number (s) 912 TE, of which (which) element 91 (OLLO) of the data structure containing OLLO, which is suitable for conversion, is composed, during step 301, is produced by registering ordinal (s) numbers (s) of said TE in accordance with their location in lin in a linguistic sentence, provided that the first TE in the linguistic sentence has the number “1”, and all subsequent TEs have a sequence number greater by one than the sequence number of the previous TE.

[132] Пригодная для преобразования структура данных, содержащая ОЛЛО, являющаяся исходной для настоящего способа преобразования 300 представляет собой в итоге множество элементов 91, их значений 911 и порядковых номеров 912 ТЭ, составляющих элементы 22, идентифицированных на этапе 301.[132] The conversion-suitable data structure containing the OLLO, which is the source for the present transformation method 300, is ultimately a plurality of elements 91, their values 911 and sequence numbers 912 TEs constituting the elements 22 identified in step 301.

[133] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 91 (ОЛЛО) пригодной для преобразования структуры данных, содержащей ОЛЛО, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 2031, состоящего из идентификационных данных ТЭ, составляющих элемент 91 (ОЛЛО), и получении значений (2131, 2141, 2231, 2151) всех частей лингвистических характеристик (213, 214, 223, 215) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 91 (ОЛЛО). При этом, как было описано ранее, лингвистическими признаками элементов 91 (ОЛЛО) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 91 (ОЛЛО).[133] Identification of linguistic characteristics of TE, constituting elements 91 (OLLO) of a data structure containing OLLO, which is suitable for conversion, and their values, if necessary, is produced by organizing a query into BDLP, formed under step 2031, consisting of identification data of TE, constituting element 91 (OLLO), and obtaining the values (2131, 2141, 2231, 2151) of all parts of the linguistic characteristics (213, 214, 223, 215) of the text elements 21 of the linguistic sentence 11, of which the element 91 (OLLO) consists. At the same time, as described earlier, the linguistic features of elements 91 (OLLO) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 91 (OLLO) consist.

[134] На фиг. 28, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 302 формирования восьмой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 300. Этап 302 характеризуется: выполнением этапа 3021 формирования значений 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО на котором формируют значения 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих элементы 91 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3021; выполнением этапа 3022 формирования элементов восьмой структуры данных СМД, на котором формируют элементы 12 восьмой структуры данных СМД, а также идентификационные данные элементов 12, представляющие собой для каждого элемента 12, в качестве примера, но не ограничения, значение 121 элемента 12 восьмой структуры данных СМД и порядковые номера 122 ТЭ лингвистического предложения 11, составляющих элементы 12, и формируют восьмую структуру данных СМД.[134] FIG. 28, by way of example, but not limitation, a general scheme of performing the steps of step 302 of forming the eighth SMD data structure, which is the first data structure for the method 300 under consideration, is shown. constituting elements 91 of a data structure suitable for transformation, containing the OLLO on which the values 2161 of the fifth part of the linguistic characteristics 216 of the elements 21 constituting the elements 91 are formed and ie the information obtained in BDLP text elements 21 linguistic Proposition 11 that is generated in phase in 2031, eventually forming BDLP text elements 21 linguistic Proposition 11, formed in 3021 under the stage; performing step 3022 of forming the elements of the eighth SMD data structure on which the elements 12 of the eighth SMD data structure are formed, as well as the identification data of the elements 12 representing for each element 12, as an example, but not limitation, the value 121 of the element 12 of the eighth SMD data structure and sequence numbers 122 TE linguistic sentences 11, constituting the elements 12, and form the eighth structure of the data SMD.

[135] На фиг. 29, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 3021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО. БДЛП, формируемая в рамках этапа 3021, отличается от БДЛП, формируемой в рамках этапа 2031, наличием значений 2161 пятой части лингвистических характеристик 216, указывающих на синтаксическую роль элемента 91 (ОЛЛО). Поскольку с лингвистической точки зрения ОЛЛО – синтаксическая конструкция, то естественно, что в одном предложении одни синтаксические конструкции относительно других синтаксических конструкций при наличии между ними синтаксической подчинительной связи являются синтаксически главными или синтаксически зависимыми. По этому принципу одни ОЛЛО могут быть синтаксически главными (главными ОЛЛО), а другие – синтаксически зависимыми (зависимыми ОЛЛО). Выявление пятой части лингвистических характеристик 216 текстовых элементов 21 лингвистического предложения 11, составляющих ОЛЛО 91 и их значений 2161 сводится к классификации ОЛЛО 91 по их синтаксической роли. Синтаксическую роль ОЛЛО отождествляют с синтаксической ролью главной ЛЛЕ в ОЛЛО 91. С помощью значения 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91, все ОЛЛО 91 разделяют на главные ОЛЛО 91 и зависимые ОЛЛО 91.[135] FIG. 29, by way of example, but not limitation, shows the general structure of the linguistic characteristics database (BDLP) formed during step 3021, which is the BDLP text elements 21 of sentence 11 contained in elements 91 suitable for transforming a data structure containing an OLLO. The BDLP, formed in step 3021, differs from the BDLP, formed in step 2031, by the presence of 2161 fifths of the linguistic characteristics 216, indicating the syntactic role of element 91 (OLLO). Since from the linguistic point of view OLLO is a syntactic construction, it is natural that in one sentence some syntactic constructions relative to other syntactic constructions, if there is a syntactic subordinate connection between them, are syntactically main or syntactically dependent. According to this principle, some OLLOs can be syntactically main (main OLLOs), and others - syntactically dependent (dependent OLLOs). The identification of the fifth part of the linguistic characteristics of 216 textual elements 21 of the linguistic sentence 11, which constitute OLLO 91 and their meanings 2161, is reduced to the classification of OLLO 91 by their syntactic role. The syntactic role of OLLO is identified with the syntactic role of the main LLE in OLLO 91. Using the value 2161 of the fifth part of the linguistic characteristics 216 elements 21 constituting OLLO 91, all OLLO 91 is divided into main OLLO 91 and dependent OLLO 91.

[136] Формирование пятой части лингвистических характеристик 216 и их значений 2161 в ходе этапа 3021 производят путем анализа существующих лингвистических признаков элемента 91. В ходе такого анализа для примера, но не ограничения, могут производиться следующие действия: на первом этапе во всех ОЛЛО 91 идентифицируют синтаксически главную ЛЛЕ; на втором этапе среди лингвистических признаков главных ЛЛЕ упомянутых ОЛЛО 91 идентифицируют лингвистическую характеристику, отвечающую за синтаксическую роль синтаксически главной ЛЛЕ элемента 91; на третьем этапе проверяют значение идентифицированной лингвистической характеристики, отвечающей за синтаксическую роль синтаксически главной ЛЛЕ; если значение (синтаксическая роль синтаксически главной ЛЛЕ элемента 91) является «сказуемым», то такой ОЛЛО 91 (синтаксически главной ЛЛЕ элемента 91) получает значение 2161 пятой части лингвистических характеристик 216 – «главный ОЛЛО»; если значение не является «сказуемым», то такой ОЛЛО 91 (синтаксически главной ЛЛЕ элемента 91) получает значение 2161 пятой части лингвистических характеристик 216 – «зависимый ОЛЛО». В итоге формируют значения 2161 пятой части лингвистических характеристик 216 для всех элементов 91 (ОЛЛО).[136] The formation of the fifth part of the linguistic characteristics 216 and their meanings 2161 during step 3021 is performed by analyzing the existing linguistic characteristics of element 91. During such analysis, for example, but not limitation, the following actions can be performed: syntactically main LLE; at the second stage, among the linguistic features of the main LLE mentioned OLLO 91 identify the linguistic characteristic responsible for the syntactic role of the syntactically main LLE of element 91; at the third stage, the value of the identified linguistic characteristic responsible for the syntactic role of the syntactically main LLE is checked; if the value (the syntactic role of the syntactically main LLE of element 91) is “predicate”, then such OLLO 91 (syntactically the main LLE of element 91) gets the value 2161 of the fifth part of linguistic characteristics 216 - “main OLLO”; if the value is not “predicate”, then such OLLO 91 (syntactically main LLE of element 91) gets the value 2161 of the fifth part of linguistic characteristics 216 - “dependent OLLO”. As a result, 2161 fifths of the linguistic characteristics 216 are formed for all elements 91 (OLLO).

[137] Сформированные по итогам этапа 3021 значения 2161 (синтаксическая роль синтаксически главной ЛЛЕ элемента 91) пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91, пригодной для преобразования структуры данных, содержащей ОЛЛО, вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3021. При этом все части (211, 214, 232, 215 и 216) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2321, 2151 и 2161) формируют уникальные лингвистические признаки элементов 91.[137] Formed at the end of step 3021, the values 2161 (the syntactic role of the syntactically main LLE element 91) of the fifth part of the linguistic characteristics 216 of elements 21 constituting OLLO 91, suitable for transforming the data structure containing OLLO, are inserted into the BDLP of text elements 21 of the linguistic sentence 11, formed as part of stage 2031, forming as a result the BDLP of textual elements 21 of the linguistic sentence 11, formed within the framework of stage 3021. All parts (211, 214, 232, 215 and 216) of the linguistic characteristics of textual elements 21 linguistic sentences 11 and their meanings (2111, 2141, 2321, 2151 and 2161) form the unique linguistic attributes of the elements 91.

[138] На фиг. 30, в качестве примера, но не ограничения, изображена общая структура сформированной восьмой структуры данных СМД, являющейся первой структурой данных СМД для настоящего способа преобразования 300. Восьмая структура данных СМД представляет собой СМД, содержащий элементы 12 восьмой структуры данных СМД, которые представляют собой исходные простые лингво-логические конструкции (ИП ЛЛК 12) лингвистического предложения 11 и идентификационные данные ИП ЛЛК, представляющие собой для каждой ИП ЛЛК, в качестве примера, но не ограничения, значение121 элемента 12 восьмой структуры данных и порядковые номера текстовых элементов 122, составляющих ИП ЛЛК (значение и порядковые номера ТЭ элемента 12). У ИП ЛЛК 12 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 12, в качестве примера, но не ограничения, могут именоваться как «ИП ЛЛК-1», «ИП ЛЛК-2», «ИП ЛЛК-3», «ИП ЛЛК-n», где n ≥ 1 - порядковый номер элемента в лингвистическом предложении. ИП ЛЛК предложения – это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения ИП ЛЛК – это синтаксическая единица вида «синтаксическая конструкция», сформированная из ОЛЛО путем объединения ОЛЛО по признаку наличия между ОЛЛО прямой синтаксической подчинительной или сочинительной связи. Упомянутая прямая синтаксическая подчинительная или сочинительная связь означает наличие между элементами различных ОЛЛО (между ЛЛЕ различных ОЛЛО) синтаксической подчинительной или сочинительной связи. С точки зрения синтаксиса ИП ЛЛК – это отдельное исходное простое предложение или исходное простое предложение в составе исходного сложного предложения. При этом исходное простое предложение в ИП ЛЛК может содержать однородные члены, то есть слова, между которыми имеется синтаксическая сочинительная связь. С логической точки зрения ИП ЛЛК – это логическая сущность, выражающая простое суждение (некванторное суждение), представляющее собой первичную логическую конструкцию мышления, с помощью которой формируется и передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). При этом нечто (то, что утверждается или опровергается о предмете суждения) может быть дополнительно логически структурировано. Например, не ограничиваясь, предикат суждения может быть разделен на три логически отделимые сущности – действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения. Упомянутые для примера элементы простого суждения могут быть отождествлены с отдельными УН ОЛЛО (ОЛЛО уникального наименования), из которых и формируется ИП ЛЛК. Кванторность простого суждения определяется его «количественной характеристикой», то есть наличием или отсутствием однозначности в простом суждении. По количественной характеристике (кванторности) все простые суждения можно разделить на две категории: однозначные простые суждения и неоднозначные простые суждения. Однозначные простые суждения – это кванторные простые суждения, в которых показатель кванторности всегда определен и равен единице, то есть каждый элемент простого суждения не имеет вариативности, всегда однозначен. Однозначность простого суждения проявляется посредством нахождения в составе простого суждения элементов простого суждения одного уникального наименования (УН) в единичном количестве (например, не ограничиваясь, одного субъекта суждения, объекта предиката суждения, действия предиката суждения или одного однородного обстоятельства предиката суждения). Примером однозначного простого суждения может быть следующее суждение: «Товар должен быть передан покупателю продавцом». Данное простое суждение не допускает никакой неоднозначности - только «товар», только «должен быть передан», только «покупателю» и только «продавцом». Неоднозначные простые суждения – это кванторные простые суждения, в которых показатель кванторности как минимум у одного элемента простого суждения уникального наименования (УН) всегда определен и всегда больше единицы, то есть элемент простого суждения в неоднозначном простом суждении всегда имеет вариативности, всегда неоднозначен. Неоднозначность простого суждения проявляется посредством нахождения в составе простого суждения нескольких элементов простого суждения одного уникального наименования (УН) (например, не ограничиваясь, нескольких субъектов суждения и(или) объектов предиката суждения и(или) действий предиката суждения и(или) нескольких однородных обстоятельств предиката суждения). Примером неоднозначного простого суждения может быть следующее суждение: «Товар должен быть передан покупателю продавцом или менеджером компании». Данное простое суждение допускает неоднозначность ввиду наличия в нем двух элементов простого суждения с одинаковыми УН - субъектов суждения «продавец» и «менеджер компании», к каждому из которых можно применить предикат суждения «должны передать товар покупателю». Если простые суждения, находящиеся в некоем массиве простых суждений (отдельной, обособленной группе простых суждений), имеют гарантировано одну и ту же количественную характеристику (показатель кванторности равен единице или больше единицы), то вне зависимости от вида кванторности простого суждения (однозначное или неоднозначное) простые суждения такого массива являются «кванторными». Если простые суждения, находящиеся в некоем массиве простых суждений (отдельной, обособленной группе простых суждений), не имеют гарантировано одну и ту же количественную характеристику (показатель кванторности простых суждений может быть как равен единице, так и быть большим единицы), то простые суждения такого массива именуются «некванторными» (без определенной кванторности). В связи с вышеизложенным ИП ЛЛК, формируемая из ОЛЛО исходного предложения, между которыми имеется синтаксическая сочинительная связь, может быть классифицирована только как «некванторное» простое суждение, поскольку ничем не гарантируется наличие одной и той же количественной характеристики у всех простых суждений, напрямую (без какой-либо дополнительной обработки) формируемых из произвольного исходного лингвистического предложения.[138] FIG. 30, by way of example, but not limitation, depicts the general structure of the eighth formed data structure of the DMD, which is the first data structure of the MDD data for this conversion method 300. The eighth data structure of the MDD is the MDD containing elements 12 of the eighth data structure of the DMD, which are the original simple linguistic-logical constructions (PI LLK 12) of the linguistic sentence 11 and identification data of the IP LLK, representing for each IP LLK, as an example, but not limitation, the value of 121 e Item 12 of the eighth data structure and sequence numbers of text elements 122 that make up the IP LLK (value and sequence numbers of TE element 12). The IP LLK 12 of the linguistic sentence 11 lacks the unique names that characterize them, which have practical use. In the data structure, elements 12, as an example, but not limitation, may be referred to as “IP LLK-1”, “IP LLK-2”, “IP LLK-3”, “IP LLK-n”, where n ≥ 1 - The ordinal number of the element in the linguistic sentence. IP LLK sentences - is the border entity between linguistics and logic. From a linguistic point of view, the IP LLK is a syntactic unit of the “syntactic structure” type, formed from OLLO by combining OLLO on the basis of the presence of a direct syntactic subordinate or composing link between OLLO. The mentioned direct syntactic subordinate or writing link means the presence between the elements of different OLLO (between LLE different OLLO) syntactic subordinate or writing link. From the point of view of the syntax, the IP LLK is a separate source simple sentence or a source simple sentence as part of the original compound sentence. In this case, the initial simple sentence in the IP LLK may contain homogeneous members, that is, words, between which there is a syntactic somatic connection. From a logical point of view, PI LLK is a logical entity that expresses a simple judgment (non-quantifier judgment), which is a primary logical construction of thinking, through which the thought is formed and transmitted that something (the predicate of judgment) is affirmed or refuted about the subject of judgment (subject judgments). In this case, something (that which is affirmed or refuted about the subject of judgment) can be additionally logically structured. For example, without limitation, the predicate of judgment can be divided into three logically separable entities — the action of the predicate of judgment, the object of the predicate of judgment, and the circumstances of the predicate of judgment. The elements of simple judgment mentioned for example can be identified with separate UN OLLO (OLLO of the unique name), from which IP LLK is formed. Quantifying simple judgment is determined by its “quantitative characteristic”, that is, by the presence or absence of uniqueness in a simple judgment. According to the quantitative characteristic (quantification), all simple judgments can be divided into two categories: single-valued simple judgments and ambiguous simple judgments. Unambiguous simple judgments are simple quantifier judgments, in which the quantifier index is always defined and equal to one, that is, each element of a simple judgment has no variability, is always single-valued. The uniqueness of a simple judgment is manifested by finding in a simple judgment elements of a simple judgment of a single unique name (NR) in a single quantity (for example, without limitation, one subject of the judgment, the object of the predicate judgment, the action of the predicate judgment or one homogeneous circumstance of the predicate judgment). An example of a straightforward simple judgment is the following judgment: “The goods must be transferred to the buyer by the seller.” This simple judgment does not allow any ambiguity - only the “goods”, only “must be transferred”, only the “buyer” and only the “seller”. Ambiguous simple judgments are simple quantifier judgments in which at least one element of a simple proposition of a unique name (UI) quantifierity is always defined and always greater than one, that is, an element of simple judgment is always ambiguous in an ambiguous simple proposition. The ambiguity of a simple judgment is manifested by finding in the composition of a simple judgment several elements of a simple judgment of one unique name (NP) (for example, without limitation, several subjects of judgment and (or) objects of a predicate of judgment and (or) actions of a predicate of judgment and (or) several homogeneous circumstances predicate judgments). An example of an ambiguous simple judgment is the following judgment: “The goods must be transferred to the buyer by the seller or manager of the company”. This simple judgment allows ambiguity due to the presence in it of two elements of a simple judgment with the same DCs - the subjects of the seller and the manager of the company, each of which can be applied to the predicate judgment “must transfer the goods to the buyer”. If simple judgments that are in a certain array of simple judgments (a separate, separate group of simple judgments) have the same quantitative characteristic (quantifier index is one or more than one), then regardless of the quantifier type of simple judgment (single-valued or ambiguous) simple judgments of such an array are “quantifier”. If simple judgments that are in a certain array of simple judgments (a separate, separate group of simple judgments) do not have the same quantitative characteristic (the quantifier index of simple judgments can be either equal to one or greater than one), then simple judgments Arrays are referred to as “non-quantifiers” (without a certain quantifier). In connection with the foregoing, IP LLK, formed from the OLLO of the original sentence, between which there is a syntactic and somatic connection, can be classified only as a “non-quantifier” simple judgment, since nothing guarantees the presence of the same quantitative characteristic of all simple judgments directly (without any additional processing) generated from an arbitrary source linguistic sentence.

[139] Формирование элементов 12 восьмой структуры данных СМД, представляющих собой исходные простые лингво-логические конструкции (ИП ЛЛК) в ходе этапа 3022 производят на основе результатов идентификации значений 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91. Для формирования элемента 12 восьмой структуры данных СМД необходимо осуществить следующие действия: на первом этапе выбирают главный ОЛЛО 91; на втором этапе идентифицируют все подчиненные ему зависимые ОЛЛО 91 с помощью значений 2161 пятой части лингвистических характеристик 216 элементов 21, составляющих ОЛЛО 91; на третьем этапе среди идентифицированных зависимых ОЛЛО 91 идентифицируют такие ОЛЛО 91, которые имеют с выбранным ранее главным ОЛЛО 91 прямую подчинительную связь; на четвертом этапе формируют предварительный элемент 12 восьмой структуры данных СМД, являющийся исходной простой лингво-логической конструкцией (ИП ЛЛК), путем объединения выбранного «главного ОЛЛО» 91 и всех идентифицированных «зависимых ОЛЛО» 91, имеющих с выбранным главным ОЛЛО 91 прямые подчинительные связи; на пятом этапе идентифицируют сочиненные ОЛЛО среди уже идентифицированных зависимых ОЛЛО 91 с помощью значений 2131 первой части лингвистических характеристик 213 элементов 21, составляющих ОЛЛО 91. Для завершения формирования элемента 12 формируют запрос в БДЛП, формируемую в рамках этапа 3021 для проверки наличия признаков связи между объединяемыми ОЛЛО, и, при наличии таких признаков, получают текстовый элемент (текстовые элементы), идентифицированный (идентифицированные) как одно из (или несколько из, или комбинация из): знак препинания, союз или союзное слово, расположенные между объединяемыми ОЛЛО.[139] The formation of elements 12 of the eighth data structure of the DMD, which are the original simple linguistic-logical constructions (PI LLK) during step 3022, is based on the results of identifying the 2161 values of the fifth part of the linguistic characteristics 216 of the elements 21 constituting OLLO 91. To form the element 12 the eighth data structure of the MDD is necessary to perform the following steps: in the first stage, choose the main OLLO 91; at the second stage, all dependent OLLO 91s subordinate to him are identified using the values 2161 of the fifth part of the linguistic characteristics 216 of the elements 21 constituting OLLO 91; at the third stage, among the identified dependent OLLO 91, such OLLO 91 is identified, which have a direct subordinate relationship with the previously selected OLLO 91; at the fourth stage, a preliminary element 12 of the eighth SMD data structure is formed, which is the initial simple linguistic-logical structure (IP LLK), by combining the selected “main OLLO 91” and all identified “dependent OLLO 91” having direct subordinate links with the selected main OLLO 91 ; at the fifth stage, the identified OLLOs are identified among the already identified dependent OLLOs 91 using the values 2131 of the first part of the linguistic characteristics 213 of the elements 21 constituting the OLLO 91. To complete the formation of the element 12 form a query in the BDLP formed within the framework of step 3021 to check for signs of a connection between the combined OLLO, and, in the presence of such signs, receive a text element (text elements), identified (identified) as one of (or several of, or a combination of): punctuation, union or union word, located between the merged ollo.

[140] Идентификацию значения и порядковых номеров ТЭ элемента 12 восьмой структуры данных СМД, производят в рамках этапа 3022 путем отождествления значения 121 элемента 12 со значениями 911 объединяемых элементов 91 и значениями 211 текстовых элементов, являющихся признаками связи согласно своим уникальным лингвистическим признакам, идентифицированных между объединяемыми элементами 91, а порядковых номеров 122 текстовых элементов 21, составляющих элемент 12 с порядковыми номерами 912 текстовых элементов, составляющих объединяемые элементы 91 и порядковыми номерами 21 текстовых элементов, являющихся признаками связи, идентифицированных между объединяемыми элементами 91.[140] The identification of the meaning and sequence numbers of the TE element 12 of the eighth SMD data structure is performed in step 3022 by identifying the value 121 of element 12 with the values 911 of the elements 91 to be merged and the values 211 of text elements, which are attributes of the connection according combinable elements 91, and the ordinal numbers 122 of text elements 21 constituting element 12 with the ordinal numbers 912 of text elements constituting the elements 91 to be merged and order Vym numbered textual elements 21, which are signs of connection between the identified elements 91 combinable.

[141] Формирование восьмой структуры данных СМД в ходе этапа 3022 производят путем объединения в одной структуре данных элементов 12 восьмой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются.[141] The formation of the eighth MDD data structure during step 3022 is carried out by combining the eighth eighth SMD data structure and their identification data according to principles and methods known from the prior art, which, respectively, are not described in further detail in one data structure.

[142] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 12 (ИП ЛЛК) восьмой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3021, состоящего из идентификационных данных ТЭ, составляющих элемент 12 (ИП ЛЛК), и получении значений (2131, 2141, 2231, 2151, 2161) всех частей лингвистических характеристик (213, 214, 223, 215, 216) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 12 (ИП ЛЛК). При этом, как было описано ранее, лингвистическими признаками элементов 12 (ИП ЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 12 (ИП ЛЛК).[142] Identification of linguistic characteristics of TE, constituting elements 12 (IP LLK) of the eighth SMD data structure, and their values, if necessary, is produced by organizing a query in BDLP, formed under step 3021, consisting of identification data of TE, constituting element 12 ), and obtaining the values (2131, 2141, 2231, 2151, 2161) of all parts of the linguistic characteristics (213, 214, 223, 215, 216) of the text elements 21 of the linguistic sentence 11, of which element 12 consists (PI LLK). At the same time, as described earlier, the linguistic features of elements 12 (PI LLK) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, which constitute elements 12 (IP LLK).

[143] На фиг. 31, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 303 формирования девятой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 300. Этап 303 характеризуется: выполнением этапа 3031 идентификации видов элементов 12 восьмой структуры данных СМД, указывающих на наличие в ИП ЛЛК сочиненных ОЛЛО, на котором идентифицируют первые и вторые виды элементов 12 восьмой структуры данных СМД, а также идентифицируют непреобразованные элементы 13 девятой структуры данных СМД и их идентификационные данные, представляющие собой для каждого непреобразованного элемента 13, в качестве примера, но не ограничения, значение 131 непреобразованного элемента 13 девятой структуры данных СМД и порядковые 132 номера ТЭ лингвистического предложения 11, составляющих элемент 13 (значение и порядковые номера ТЭ непреобразованного элемента 13); выполнением этапа 3032 формирования преобразованных элементов 13 девятой структуры данных СМД, на котором формируют преобразованные элементы 13 девятой структуры данных СМД из элементов 12 второго вида, а также идентификационные данные преобразованных элементов 13, представляющие собой для каждого преобразованного элемента 13, в качестве примера, но не ограничения, значение 131 преобразованного элемента 13 девятой структуры данных СМД и порядковые 132 номера ТЭ лингвистического предложения 11, составляющих элемент 13 (значение и порядковые номера ТЭ преобразованного элемента 13); выполнением этапа 3033 формирования девятой структуры данных СМД, на котором формируют девятую структуру данных СМД из преобразованных элементов 13 и непреобразованных элементов 13 девятой структуры данных СМД. [143] FIG. 31, by way of example, but not limitation, a general scheme for performing the steps of step 303 of forming the ninth SMD data structure, which is the second data structure for the considered method 300, is shown. Step 303 is characterized by: performing step 3031 of identifying the types of elements 12 of the eighth MDD data structure indicating the presence in IP LLK of composed OLLOs, which identify the first and second types of elements 12 of the eighth SMD data structure, and also identify the non-transformed elements 13 of the ninth SMD data structure and their identifiers The icing data representing, for each non-transformed element 13, as an example, but not limitation, the value 131 non-transformed element 13 of the ninth SMD data structure and the serial numbers 132 of the TE language of the linguistic sentence 11 constituting element 13 (the value and numbers of the TEs of the non-transformed element 13) ; performing step 3032 of generating the transformed elements 13 of the ninth SMD data structure, on which the transformed elements 13 of the ninth SMD data structure of the second type of elements 12 are formed, and also the identification data of the transformed elements 13, representing for each transformed element 13, as an example, but not restrictions, the value 131 of the transformed element 13 of the ninth data structure of the MDD and the serial 132 numbers of the TE of the linguistic sentence 11 constituting the element 13 (the value and the sequence number TE transformed member 13); performing step 3033 of forming the ninth SMD data structure, wherein the ninth SMD data structure is formed from the transformed elements 13 and the non-transformed elements 13 of the ninth SMD data structure.

[144] На фиг. 32, в качестве примера, но не ограничения, изображена общая структура сформированной девятой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 300. Девятая структура данных СМД представляет собой СМД, содержащий элементы 13, которые представляют собой простые лингво-логические конструкции (ПЛЛК) лингвистического предложения 11, и идентификационные данные ПЛЛК, представляющие собой для каждой ПЛЛК, в качестве примера, но не ограничения, значение 131 элемента 13 девятой структуры данных и порядковые номера 132 текстовых элементов, составляющих ПЛЛК. Элементы 13 девятой структуры данных СМД подразделяются по принципу их формирования на непреобразованные элементы 13 и преобразованные элементы 13. У ПЛЛК 13 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 13, в качестве примера, но не ограничения, могут именоваться как «ПЛЛК1», «ПЛЛК2», «ПЛЛК3», «ПЛЛКn», где n ≥ 1 - порядковый номер элемента в лингвистическом предложении. ПЛЛК лингвистического предложения 11 – это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, ПЛЛК – это синтаксическая единица вида «синтаксическая конструкция», сформированная из ИП ЛЛК путем гетерогенизации ИП ЛЛК. С точки зрения синтаксиса ПЛЛК – это отдельное простое предложение или простое предложение в составе исходного сложного предложения, которое не содержит однородных членов (слов между которыми имеется синтаксическая сочинительная связь). С логической точки зрения ПЛЛК – это логическая сущность, выражающая простое суждение (кванторное суждение), представляющее собой первичную логическую конструкцию мышления, с помощью которой формируется и передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). При этом нечто (то, что утверждается или опровергается о предмете суждения) может быть дополнительно логически структурировано. Например, не ограничиваясь, предикат суждения может быть разделен на три логически отделимые сущности - действие предиката суждения, объект предиката суждения и обстоятельства предиката суждения. Упомянутые для примера элементы простого суждения могут быть отождествлены с отдельными видами ОЛЛО, из которых и формируется ПЛЛК. Отличие ПЛЛК от ИП ЛЛК в кванторности простого суждения. Если ИП ЛЛК допускает возможность наличия неоднозначности в простом суждении, то ПЛЛК имеет показатель кванторности равный единице, что полностью отождествляет ПЛЛК с абсолютно однозначным простым суждением. В составе ПЛЛК не может быть нескольких элементов простого суждения одного уникального наименования (УН). Например, не ограничиваясь, в составе ПЛЛК не может быть нескольких субъектов суждения, и (или) объектов предиката суждения, и (или) действий предиката суждения, и (или) однородных обстоятельств предиката суждения. В ПЛЛК не может быть никакой неоднозначности ни в субъекте суждения, ни в предикате суждения, вне зависимости от состава и конструкции исходного лингвистического предложения. [144] FIG. 32, by way of example, but not limitation, depicts the general structure of the ninth SMD data structure formed, which is the second SMD data structure for this conversion method 300. The ninth SMD data structure is a SMD containing elements 13, which are simple linguistic-logical structures (PLC) of the linguistic sentence 11, and the PLC identification data representing for each PLC, as an example, but not limited to, the value 131 of the 13th of the ninth data structure and order stems rooms 132 text elements constituting PLLK. Elements 13 of the ninth data structure of the SMD are subdivided according to the principle of their formation into non-transformed elements 13 and transformed elements 13. PLC 13 linguistic sentence 11 does not have any unique names that characterize them, which have practical use. In the data structure, elements 13, by way of example, but not limitation, may be referred to as “PLC1”, “PLC2”, “PLCC3”, “PLCCn”, where n ≥ 1 is the sequence number of the element in the linguistic sentence. The linguistic sentence 11 PLC is the borderline between linguistics and logic. From a linguistic point of view, a PLC is a syntactic unit of the “syntactic construction” type, formed from an IP LLK by heterogenization of an IP LLK. From the point of view of syntax, PLC is a separate simple sentence or a simple sentence as part of the original complex sentence, which does not contain homogeneous members (words between which there is a syntactic compositional link). From a logical point of view, PLC is a logical entity expressing a simple judgment (quantifier judgment), which is a primary logical construction of thinking, through which the thought is formed and transmitted that something (judgment predicate) is affirmed or refuted about the subject matter of judgment (subject of judgment ). In this case, something (that which is affirmed or refuted about the subject of judgment) can be additionally logically structured. For example, without limitation, the predicate of judgment can be divided into three logically separable entities — the action of the predicate of judgment, the object of the predicate of judgment, and the circumstances of the predicate of judgment. The elements of simple judgment mentioned for example may be identified with particular types of OLLOs from which the PLC is formed. The difference between PLC and IP LLK in the quantifier of simple judgment. If the PI LLC admits the possibility of the presence of ambiguity in a simple judgment, then the PLC has a quantifier index of one, which completely identifies the PLC with an absolutely single-valued simple judgment. In the composition of the PLC, there cannot be several elements of a simple judgment of one unique name (NR). For example, without being limited to, a PLC cannot include several subjects of judgment, and (or) objects of the predicate of judgment, and (or) actions of the predicate of judgment, and (or) homogeneous circumstances of the predicate of judgment. In PLC, there can be no ambiguity either in the subject of the judgment, or in the predicate of the judgment, regardless of the composition and design of the original linguistic sentence.

[145] Идентификацию видов элементов 12 восьмой структуры данных СМД в рамках этапа 3031 производят путем анализа значений лингвистических характеристик текстовых элементов 12 (ИП ЛЛК) с целью идентификации синтаксических сочинительных связей в ИП ЛЛК 12. Синтаксическую сочинительную связь между ОЛЛО (элемент 91) в ИП ЛЛК 12 идентифицируют в случае наличия у синтаксически главных ЛЛЕ таких ОЛЛО одного и того же синтаксического родителя (синтаксически главного слова, у которого с такой ЛЛЕ имеется прямая синтаксическая подчинительная связь). Дополнительными условиями может быть наличие у главных ЛЛЕ таких ОЛЛО одной и той же синтаксической роли, а также наличие признака связи между такими ЛЛЕ, а именно - запятой или сочинительного союза. При идентификации синтаксической сочинительной связи между главными ЛЛЕ двух или более ОЛЛО такие ИП ЛЛК идентифицируют как второй вид элемента 12 (ИП ЛЛК) восьмой структуры данных СМД. Все иные элементы 12 (ИП ЛЛК) в которых не идентифицирована синтаксическая сочинительная связь у главной ЛЛЕ идентифицируют как первый вид элемента 12 (ИП ЛЛК) восьмой структуры данных СМД. При этом идентифицированный первый вид элемента 12 восьмой структуры данных СМД отождествляют с непреобразованным элементом 13 девятой структуры данных СМД. Формирование преобразованных элементов девятой структуры данных СМД (преобразованных элементов 13, полученных из элементов 12 второго вида) на этапе 3032 производят на основании идентифицированной на этапе 3031 синтаксической сочинительной связи между элементами 91 (ОЛЛО) элемента 12 (ИП ЛЛК) путем преобразования элемента 12 второго вида. Смысл преобразования элемента 12 второго вида на этапе 3032 состоит в гетерогенизации ИП ЛЛК 12, то есть в устранении синтаксических однородностей в ИП ЛЛК 12 путем формирования из элемента 12 второго вида множества новых ПЛЛК, идентичных по однородностям элементу 12 первого вида. При этом каждая новая ПЛЛК упомянутого множества может содержать только один из упомянутых ОЛЛО 91 с однородными членами (если элемент 12 второго вида содержит один ряд однородных членов) или только одно уникальное сочетание упомянутых ОЛЛО 91 с однородными членами разных рядов однородных членов (если элемент 12 второго вида содержит несколько рядов ОЛЛО 91 с однородными членами). Множество ПЛЛК (элементов 13), сформированных из элемента 12 второго вида являются гетерогенными ПЛЛК, то есть сформированными из одной ИП ЛЛК 12 второго вида путем ее гетерогенного преобразования (гетерогенизации). Процесс гетерогенизации ИП ЛЛК 12 второго вида может быть проведен, в качестве примера, но не ограничения, следующим образом: на первом этапе выявляют ряды однородных членов в элементе 12 второго вида; в ходе выявления рядов однородных членов выявляют сами ряды однородных членов и порядковые номера однородных членов в ряду, а также признаки связи каждого однородного члена; на втором этапе выявляют цепочки однородных членов для каждого выявленного ОЛЛО, содержащего ЛЛЕ-ОЧ (ОЛЛО-ОЧ) элемента 12 второго вида; цепочка однородных членов (цепочка ОЧ) - это ОЛЛО-ОЧ и зависимая цепочка однородных членов (цепочка синтаксически связанных ОЛЛО, начиная от первого синтаксического потомка однородных членов (синтаксически зависимого ОЛЛО) и продолжая по цепочке синтаксической зависимости (по синтаксической подчинительной связи) до другого ОЛЛО-ОЧ или до последнего ОЛЛО в элементе 12 второго вида; идентифицированные цепочки ОЧ классифицируют по факту наличия синтаксического потомка ЛЛЕ в зависимой цепочке ОЧ, который не входит в зависимую цепочку ОЧ; те цепочки ОЧ, которые имеют зависимые цепочки ОЧ без синтаксического потомка за рамками зависимой цепочки однородных членов считаются крайними цепочками однородных членов (крайними ЦОЧ), а те цепочки ОЧ, которые имеют зависимые цепочки ОЧ с синтаксическим потомком за рамками зависимой цепочки ОЧ считаются внутренними цепочками однородных членов (внутренними цепочками ОЧ); на третьем этапе выявляют ОЛЛО элемента 12 второго вида, не входящие в цепочки ОЧ (ОЛЛО вне цепочек ОЧ); на четвертом этапе формируют сменные зависимые цепочки (сменные ЗЦ) элемента 12 второго вида; сменная ЗЦ - это основа преобразованных элементов 13, состоящая из одной крайней цепочки ОЧ и внутренних цепочек ОЧ, если такие внутренние цепочки ОЧ по цепочке непрерывной синтаксической подчинительной связи имеются между крайней цепочкой ОЧ и ОЛЛО вне цепочек ОЧ; на пятом этапе формируют гетерогенные ПЛЛК (преобразованные элементы 13); гетерогенная ПЛЛК формируется из одной сменной ЗЦ и ОЛЛО вне цепочки ОЧ (если такие ОЛЛО есть); количество сменных ЗЦ элемента 12 второго вида определяет количество гетерогенных ПЛЛК (преобразованных элементов 13), сформированных от одного элемента 12 второго вида. [145] Identification of the types of elements 12 of the eighth SMD data structure in step 3031 is performed by analyzing the values of the linguistic characteristics of text elements 12 (IP LLK) in order to identify syntactic composing links in the IP LLK 12. Syntactic composing connection between the OLLO (element 91) in the PI LLK 12 identify if the syntactically main LLE of such OLLOs have the same syntactic parent (the syntactically main word that has a direct syntactic subordinate connection with such LLE). Additional conditions may be that the main LLE of such OLLOs have the same syntactic role, as well as the presence of a sign of a connection between such LLE, namely, a comma or a writing union. When identifying a syntactic, somatic connection between the main LLE of two or more OLLOs, such IP LLKs are identified as the second type of element 12 (IP LLK) of the eighth SMD data structure. All other elements 12 (IP LLK) in which the syntactic composing relationship of the main LLE is not identified is identified as the first type of element 12 (IP LLK) of the eighth SMD data structure. In this case, the identified first type of element 12 of the eighth SMD data structure is identified with the non-transformed element 13 of the ninth SMD data structure. The formation of the transformed elements of the ninth data structure of the DMD (transformed elements 13 obtained from elements 12 of the second type) at step 3032 is made on the basis of the syntactic composing relationship identified between elements 91 (OLLO) element 12 (IP LLK) identified at step 3031 by converting element 12 of the second type . The meaning of the transformation of the element 12 of the second type at step 3032 is to heterogenize the PI LLK 12, that is, to eliminate syntactic homogeneities in the PI LLK 12 by forming from the second element 12 a set of new PLCs that are identical in homogeneity to the element 12 of the first type. Moreover, each new PLC of the mentioned set can contain only one of the mentioned OLLO 91 with homogeneous members (if element 12 of the second type contains one row of homogeneous members) or only one unique combination of the mentioned OLLO 91 with homogeneous members of different rows of homogeneous members (if element 12 of the second species contains several rows OLLO 91 with homogeneous members). Many PLLK (elements 13), formed from the element 12 of the second type are heterogeneous PLC, that is, formed from a single PI LLK 12 of the second type through its heterogeneous transformation (heterogenization). The process of heterogenization of IP LLK 12 of the second type can be carried out, as an example, but not limitation, as follows: at the first stage, rows of homogeneous members in the element 12 of the second type are detected; in the course of identifying the series of homogeneous members, they themselves identify the series of homogeneous members and the sequence numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member; at the second stage, chains of homogeneous members are detected for each identified OLLO containing the LLE-OCH (OLLO-OCH) element 12 of the second type; chain of homogeneous members (chain of PTS) is the OLLO-POC and dependent chain of homogeneous members (a chain of syntactically related OLLOs, starting from the first syntactic descendant of homogeneous members (syntactically dependent OLLO) and continuing along the chain of syntactic dependence (on the syntactic subordinate connection) to another OLLO -OCH or until the last OLLO in the element 12 of the second type; the identified POC chains are classified by the fact that there is a syntax descendant of LLE in the dependent PTS chain that is not included in the dependent POC chain; PTS chains that have dependent PTS chains without a syntactic descendant beyond the dependent chain of homogeneous members are considered extreme chains of homogeneous members (extreme CSCs), and those PZh chains that have dependent POC chains with a syntactic descendant beyond the dependent chains of PTS are considered internal chains of homogeneous members (internal chains of OFC); in the third stage, OLLO of element 12 of the second type is detected that are not included into chains of OFC (OLLO outside of chains of OFC); in the fourth stage, replaceable dependent chains (interchangeable replacement centers) of the element 12 of the second type are formed; removable SC is the basis of the transformed elements 13, consisting of one extreme chain of PSh and internal chains of PS, if such internal chains of PS are along the chain of a continuous syntactic subordinate connection between the extreme chain of PS and the OLLO outside the chains of PS. at the fifth stage, heterogeneous PLCs are formed (transformed elements 13); Heterogeneous PLLK is formed from one interchangeable LC and OLLO outside the PTS chain (if there are such OLLOs); the number of interchangeable replacement elements of the second type element 12 determines the number of heterogeneous PLCs (transformed elements 13) formed from one element 12 of the second type.

[146] Идентификация видов элементов 12 восьмой структуры данных СМД в рамках этапа 3031 не изменяет значение 121 элемента 12 и не изменяет порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 (ИП ЛЛК). Идентификацию значения и порядковых номеров ТЭ непреобразованного элемента 13 (ПЛЛК) девятой структуры данных СМД в рамках этапа 3031 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 первого вида восьмой структуры данных СМД идентифицируют как значение 131 непреобразованного элемента 13 (ПЛЛК), а порядковые номера 212 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 из которого состоит непреобразованный элемент 13 идентифицируют как порядковые номера 132 текстовых элементов, составляющих непреобразованный элемент 13 (ПЛЛК). Идентификацию значения и порядковых номеров ТЭ преобразованного элемента 13 (гетерогенный ПЛЛК) девятой структуры данных СМД в рамках этапа 3032 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 второго вида восьмой структуры данных СМД, за исключением значений 211 текстовых элементов 21 лингвистического предложения 11, составляющих отдельные части элемента 12 второго вида (ОЛЛО-ОЧ), которые были удалены при гетерогенизации, и признаков связи удаленных ОЛЛО-ОЧ (синтаксически подчиненные главным ЛЛЕ удаленным ОЛЛО-ОЧ сочинительные союзы или знаки препинания) идентифицируют как значение 131 преобразованного элемента 13 (ПЛЛК), а порядковые номера 212 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 12 второго вида восьмой структуры данных СМД, за исключением порядковых номеров 212 текстовых элементов 21 лингвистического предложения 11, составляющих отдельные части элемента 12 второго вида (ОЛЛО-ОЧ), которые были удалены при гетерогенизации, и признаков связи удаленных ОЛЛО-ОЧ (синтаксически подчиненные главным ЛЛЕ удаленным ОЛЛО-ОЧ сочинительные союзы или знаки препинания) идентифицируют как порядковые номера 132 текстовых элементов, составляющих преобразованный элемент 13 (гетерогенный ПЛЛК).[146] The identification of the types of elements 12 of the eighth MDD data structure under step 3031 does not change the value 121 of element 12 and does not change the sequence numbers of the text elements 21 of the linguistic sentence 11 constituting element 12 (IP LLK). The identification of the value and sequence numbers of the TE of the non-transformed element 13 (PLC) of the ninth SMD data structure in step 3031 is as follows: the values 211 of the text elements 21 of the linguistic sentence 11 constituting the element 12 of the first type of the eighth data structure of the MDD are identified as 131 131 PLC), and the sequence numbers 212 of the above-mentioned text elements 21 of the linguistic sentence 11, constituting the element 12 of which the non-transformed element 13 consists, are identified as oryadkovye number 132 text elements constituting the unconverted element 13 (PLLK). The value and sequence numbers of the TE converted element 13 (heterogeneous PLC) of the ninth SMD data structure in step 3032 are identified as follows: 211 text elements 21 of the linguistic sentence 11 constituting element 12 of the second type of the eighth SMD data structure, except for 211 text elements 21 of the linguistic sentence 11, which make up separate parts of the element 12 of the second type (OLLO-OCH), which were removed during heterogenization, and signs of the connection between the remote OLLO-OCH (syntactically the subordinate main LLE remote allorders or punctuation marks) are identified as the value 131 of the transformed element 13 (PLC), and the ordinal numbers 212 of the text elements 21 of the linguistic sentence 11 constituting the element 12 of the second type of the eighth SMD data structure, except for the ordinal numbers 212 text elements 21 of the linguistic sentence 11, which constitute separate parts of the second type element 12 (OLLO-OCH), which were removed during heterogenization, and the connection signs of the deleted OLLO-OCH (syntactically subordinates to the main LLE by remote OLLO-OCH composing unions or punctuation marks) are identified as the ordinal numbers 132 of the text elements constituting the transformed element 13 (heterogeneous PLC).

[147] Формирование девятой структуры данных СМД в рамках этапа 3033 производят путем объединения ранее идентифицированных на этапах 3031 и 3032 элементов 13 девятой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются. Первым из объединяемых элементов девятой структуры данных СМД является идентифицированный на этапе 3031 элемент 12 первого вида, являющийся непреобразованным элементом 13, то есть ПЛЛК 13, совпадающий с ИП ЛЛК 12 без синтаксической сочинительной связи. Вторыми из объединяемых элементов девятой структуры данных СМД являются преобразованные элементы 13, сформированные на этапе 3032 как множество преобразованных элементов 13, являющихся гетерогенными ПЛЛК 13, сформированными из элемента 12 второго вида (ИП ЛЛК с синтаксической сочинительной связью) путем гетерогенизации ИП ЛЛК второго вида.[147] The formation of the ninth MDD data structure in step 3033 is performed by combining the elements of the ninth ninth SMD data structure previously identified in steps 3031 and 3032 and their identification data according to principles and methods known from the prior art, which are not described in further detail below. The first of the merged elements of the ninth data structure of the MDD is the element 12 of the first type identified at step 3031, which is the untransformed element 13, that is, PLC 13, which coincides with the PI LLK 12 without a syntactic composing relationship. The second of the merged elements of the ninth data structure of the DMD are the transformed elements 13, formed at step 3032 as a set of transformed elements 13, which are heterogeneous PLLK 13, formed from the element 12 of the second type (PI LLK with syntactic composing link) by heterogenizing IP LLK of the second type.

[148] Идентификацию лингвистических характеристик ТЭ, составляющих непреобразованные или преобразованные элементы 13 (ПЛЛК) девятой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3021, состоящего из идентификационных данных ТЭ, составляющих непреобразованный или преобразованный элемент 13, и получении значений (2131, 2141, 2231, 2151, 2161) всех частей лингвистических характеристик (213, 214, 223, 215, 216) текстовых элементов 21 лингвистического предложения 11, из которых состоит непреобразованный или преобразованный элемент 13 (ПЛЛК или гетерогенная ПЛЛК). При этом, как было описано ранее, лингвистическими признаками непреобразованных и преобразованных элементов 13 (ПЛЛК или гетерогенная ПЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 13 (ПЛЛК и гетерогенные ПЛЛК).[148] Identification of linguistic characteristics of FCs that make up the non-transformed or transformed elements 13 (PLC) of the ninth data structure of the MD, and if necessary, their values are produced by organizing a query into the BDLP, formed during step 3021, consisting of the identification data of the TEs that compose the non-transformed or transformed element 13, and obtaining the values (2131, 2141, 2231, 2151, 2161) of all parts of the linguistic characteristics (213, 214, 223, 215, 216) of the textual elements 21 of the linguistic sentence 11, which consist of transformed or transformed element 13 (PLC or heterogeneous PLC). At the same time, as described earlier, the linguistic features of non-transformed and transformed elements 13 (PLC or heterogeneous PLC) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which elements 13 consist (PLC and heterogeneous PLC).

[149] На фиг. 33, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 304 формирования десятой структуры данных СМД являющейся третьей структурой данных для рассматриваемого способа 300. Этап 304 характеризуется: выполнением этапа 3041 формирования значений 2171 шестой части лингвистических характеристик 217 элементов 21, составляющих элементы 13 девятой структуры данных СМД, на котором формируют значения 2171 шестой части лингвистических характеристик 217 элементов 21, составляющих элементы 13, и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3041; выполнением этапа 3042 идентификации видов элементов 13 девятой структуры данных СМД, указывающих на наличие сочиненных ПЛЛК, на котором идентифицируют первые и последующие виды элементов 13 девятой структуры данных СМД; выполнением этапа 3043 идентификации элементов 14 как составных частей элемента 15 десятой структуры данных СМД, на котором идентифицируют элементы 14 десятой структуры данных СМД, а также идентификационные данные элементов 14, представляющие собой для каждого элемента 14, в качестве примера, но не ограничения, значение 141 элемента 14 десятой структуры данных СМД и порядковые номера 142 ТЭ лингвистического предложения 11, составляющих элемент 14; и формируют десятую структуру данных СМД путем объединения элементов 14 как составных частей единственного элемента 15 десятой структуры данных СМД.[149] FIG. 33, by way of example, but not limitation, shows a general scheme for performing the steps of step 304 of forming the tenth data structure of the DMD which is the third data structure for the method 300 in question. Step 304 is characterized by: performing step 3041 of generating values 2171 of the sixth part of the linguistic characteristics 217 of the elements 21 elements 13 of the ninth MDD data structure, on which the 2171 values of the sixth part of the linguistic characteristics of 217 elements 21 constituting elements 13 are formed, and the obtained information is entered into the BDLP t Kstovo linguistic elements 21 Proposition 11, formed in 3021 under the stage, forming eventually BDLP text elements 21 linguistic Proposition 11, formed in 3041 under the stage; performing step 3042 of identifying the types of elements 13 of the ninth SMD data structure indicating the presence of written PLCs, which identify the first and subsequent types of elements 13 of the ninth data structure of the MDS; performing step 3043 of identifying elements 14 as constituent parts of element 15 of the tenth SMD data structure, which identifies elements 14 of the tenth data structure of the DMD, as well as the identification data of elements 14 representing 141 for each element 14, as an example, but not limited to the element 14 of the tenth data structure of the MD and the sequence numbers 142 TE linguistic sentences 11, constituting the element 14; and form the tenth structure of the data of the MDD by combining elements 14 as components of a single element 15 of the tenth data structure of the DMD.

[150] На фиг. 34, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 3041 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 13 девятой структуры данных СМД. БДЛП, формируемая в рамках этапа 3041, отличается от БДЛП, формируемой в рамках этапа 3021, наличием шестой части лингвистических характеристик 217 и их значений 2171 текстовых элементов 21, содержащихся в элементах 13, устанавливающей синтаксическую роль ПЛЛК (элементов 13 девятой структуры данных СМД). Синтаксическая роль ПЛЛК может иметь значения: главная ПЛЛК или зависимая ПЛЛК. Поскольку с лингвистической точки зрения ПЛЛК – синтаксическая конструкция, то естественно, что в одном предложении одни синтаксические конструкции относительно других синтаксических конструкций при наличии между ними синтаксической подчинительной связи являются синтаксически главными или синтаксически зависимыми. По этому принципу одни ПЛЛК могут быть синтаксически главными (главными ПЛЛК), а другие – синтаксически зависимыми (зависимыми ПЛЛК).[150] FIG. 34, by way of example, but not limitation, shows the general structure of the linguistic characteristics database (BDLP) formed during step 3041, which is the BDLP text elements 21 of sentence 11 contained in elements 13 of the ninth MDD data structure. The BDLP formed in step 3041 differs from the BDLP formed in step 3021 by the presence of the sixth part of linguistic characteristics 217 and their meanings 2171 text elements 21 contained in elements 13, which establishes the syntactic role of PLC (elements 13 of the ninth MDD data structure). The syntactic role of a PLC can have values: the main PLC or the dependent PLC. Since from the linguistic point of view PLC is a syntactic construction, it is natural that in one sentence some syntactic constructions relative to other syntactic constructions, if there is a syntactic subordinate connection between them, are syntactically main or syntactically dependent. According to this principle, some PLCs can be syntactically main (main PLCs), while others - syntactically dependent (dependent PLCs).

[151] Формирование шестой части лингвистических характеристик 217 и их значений 2171 для текстовых элементов 21 лингвистического предложения 11, составляющих ПЛЛК 13 производят путем классификации ПЛЛК 13 по их синтаксической роли в ходе этапа 3041. Синтаксическую роль ПЛЛК отождествляют с синтаксической ролью главного ЛЛЕ в главном ОЛЛО 91 в ПЛЛК 13. В соответствии со значением 2171 шестой части лингвистических характеристик 217 элементов 21, составляющих ПЛЛК 13, подразделяют все ПЛЛК 13 на главные ПЛЛК 13 и зависимые ПЛЛК 13. Формирование шестой части лингвистических характеристик 217 и их значений 2171 производят путем анализа существующих лингвистических признаков элементов 21, составляющих ПЛЛК 13. В ходе такого анализа, в качестве примера, но не ограничения, могут производиться следующие действия: на первом этапе во всех ПЛЛК 13 идентифицируют синтаксически главную ЛЛЕ синтаксически главной ОЛЛО 91; на втором этапе среди лингвистических признаков упомянутых главных ЛЛЕ упомянутого ПЛЛК 13 идентифицируют лингвистическую характеристику, отвечающую за синтаксическую роль упомянутой синтаксически главной ЛЛЕ элемента 13; на третьем этапе проверяют значение идентифицированной лингвистической характеристики, отвечающей за синтаксическую роль упомянутой синтаксически главной ЛЛЕ; если значение (синтаксическая роль упомянутой синтаксически главной ЛЛЕ элемента 13) является «сказуемым», то такой ПЛЛК 13 (синтаксически главная ЛЛЕ синтаксически главного элемента 91) предоставляют значение 2171 шестой части лингвистических характеристик 217– «главная ПЛЛК»; если значение не является «сказуемым», то такой ПЛЛК 13 предоставляют значение 2171 шестой части лингвистических характеристик 217 – «зависимая ПЛЛК». В итоге формируют значения 2171 шестой части лингвистических характеристик 217 для всех элементов ПЛЛК 13. [151] The formation of the sixth part of the linguistic characteristics 217 and their meanings 2171 for the textual elements 21 of the linguistic sentence 11 constituting the PLC 13 is made by classifying the PLC 13 by their syntactic role during step 3041. The syntactic role of the PLC is identified with the syntactic role of the main LLE in the main OLLO 91 in PLC 13. In accordance with the value 2171 of the sixth part of the linguistic characteristics 217 elements 21 constituting PLC 13, divide all PLC 13 into main PLC 13 and dependent PLC 13. Forming the sixth part of the ling 217 and their values 2171 are produced by analyzing the existing linguistic features of the elements 21 that constitute PLC 13. During such analysis, as an example, but not limitation, the following actions can be taken: at the first stage, syntactically main LLE is identified in all PLC 13 the main OLLO 91; in the second stage, among the linguistic features of the mentioned main LLEs of the mentioned PLC 13, a linguistic characteristic is identified that is responsible for the syntactic role of the mentioned syntactically main LLE of element 13; at the third stage, the value of the identified linguistic characteristic responsible for the syntactic role of the syntactically main LLE is checked; if the meaning (the syntactic role of the mentioned syntactically main LLE of element 13) is “predicate”, then such a PLC 13 (syntactically main LLE of the syntactic main element 91) provide the value 2171 of the sixth part of the linguistic characteristics 217– “main PLC”; if the meaning is not “predicate”, then such PLC 13 provides the value 2171 of the sixth part of the linguistic characteristics 217 - “dependent PLC”. In the end, form the values of 2171 of the sixth part of the linguistic characteristics 217 for all elements of PLC 13.

[152] Сформированные по итогам этапа 3041 значения 2171 (синтаксическая роль синтаксически главной ЛЛЕ синтаксически главного ОЛЛО элемента 13) шестой части лингвистических характеристик 217 элементов 21, составляющих ПЛЛК 13 девятой структуры данных СМД вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3041. При этом все части (211, 214, 232, 215, 216 и 217) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11, входящих в ПЛЛК 13 и их значения (2111, 2141, 2321, 2151, 2161 и 2171) формируют уникальные лингвистические признаки элементов 13.[152] Formed according to the results of step 3041, the values of 2171 (the syntactic role of the syntactically main LLE of the syntactically main OLLO element 13) of the sixth part of the linguistic characteristics 217 of elements 21 constituting the PLC 13 of the ninth data structure of the MDD are added to the BDLP of text elements 21 of the linguistic sentence 11 formed within of step 3041. All the parts (211, 214, 232, 215, 216 and 217) of the linguistic characteristics of the textual elements 21 of the linguistic sentence 11 included in the PLLC 13 and their meanings (2111, 2141, 2321, 2151, 2161 and 2171) form unique l ngvisticheskie features 13 elements.

[153] На фиг. 35, в качестве примера, но не ограничения, изображена общая структура сформированной десятой структуры данных СМД, являющейся третьей структурой данных СМД для настоящего способа преобразования 300. Десятая структура данных СМД представляет собой СМД, содержащий элемент 15, который представляет собой исходную сложную лингво-логическую конструкцию (ИС ЛЛК) лингвистического предложения 11, и идентификационные данные элемента 15, представляющие собой, в качестве примера, но не ограничения, значение 151 элемента 15 десятой структуры данных и порядковые номера 152 текстовых элементов, составляющих элемент 15. У исходной сложной ЛЛК 15 лингвистического предложения 11 отсутствует характеризующее ее уникальное наименование (УН), имеющее практическое использование. ИС ЛЛК предложения 11 – это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, ИС ЛЛК – это синтаксическая единица вида «синтаксическая конструкция», сформированная из ПЛЛК путем объединения ПЛЛК по признаку наличия между ПЛЛК прямой синтаксической подчинительной и сочинительной связей. ИС ЛЛК состоит из того количества ПЛЛК, которое идентифицировано в исходном предложении. Упомянутая прямая синтаксическая подчинительная связь означает наличие между элементами различных ПЛЛК (между ЛЛЕ различных ПЛЛК) синтаксической подчинительной связи. Прямая синтаксическая сочинительная связь означает наличие между элементами различных ПЛЛК (между ЛЛЕ различных ПЛЛК) синтаксической сочинительной связи. С точки зрения синтаксиса ИС ЛЛК – это преобразованное исходное предложение без искажения его смысла. Суть преобразования исходного лингвистического предложения состоит в том, что все примененные лингвистические приемы (осложнения), направленные на упрощение лингвистических форм и структур мыслимых автором утверждений (отрицаний) в тексте лингвистического предложения (например, не ограничиваясь, использование однородных членов, причастных (деепричастных) оборотов) отменяют. Вместо исходного лингвистического предложения формируют массив простых предложений, которые синтаксически и логически связаны друг с другом. Упомянутые связи проясняют, а затем тем или иным образом регистрируют. Потребность такого преобразования актуальна потому, что одновременно с упрощением лингвистических форм и структуры лингвистического предложения применение упомянутых лингвистических приемов приводит к сложности и неоднозначности логической структуры исходного лингвистического предложения, к сложности и неоднозначности восприятия смысла исходного предложения пользователем, а также к большой технической сложности корректного интеллектуального машинного анализа содержания исходного лингвистического предложения. Преобразованное таким образом исходное предложение представляет собой (при условии применения в исходном лингвистическом предложении упомянутых приемов), по сути, сложное предложение, состоящее из преобразованных простых предложений в количестве, превышающем количество исходных простых предложений в исходном лингвистическом предложении. Однако в отличие от исходного лингвистического предложения все преобразованные простые предложения в ИС ЛЛК представляют собой однозначные простые суждения (мыслимые утверждения или отрицания). Регистрация элемента 15 (ИС ЛЛК) в форме структуры данных (массива преобразованных ПЛЛК (элементов 14)) позволяет выявить многоуровневую синтаксическую структуру элемента 15 (ИС ЛЛК) и связи между элементами этой структуры. Уровни ИС ЛЛК отражают структуру синтаксической подчинительной связи между структурированными ПЛЛК (СПЛЛК) как составными частями ИС ЛЛК и обусловлены выявленными синтаксическими связями между составными частями элемента 15 (элементами 14 лингвистического предложения 11.) Элемент 15 (ИС ЛЛК) формируется из упомянутых структурированных ПЛЛК (СПЛЛК) – элементов 14. В обязательном порядке ИС ЛЛК содержит только элемент 14 (СПЛЛК) первого уровня (элементы 13 первого вида). Наличие иных элементов 14 (СПЛЛК) второго и последующих уровней (элементов 13 второго и последующих видов) обусловлено лингвистическими осложнениями исходного лингвистического предложения. К СПЛЛК первого уровня (элементам 13 первого вида) относят ПЛЛК, которые не являются подчиненными простыми предложениями. К СПЛЛК второго уровня (элементам 13 второго вида) относят ПЛЛК, которые являются подчиненными простыми предложениями, при условии, что главными для них являются СПЛЛК первого уровня. К СПЛЛК третьего уровня (элементам 13 третьего вида) относят ПЛЛК, которые являются подчиненными простыми предложениями при условии, что главными для них являются СПЛЛК второго уровня. Эти утверждения таким образом справедливы и для СПЛЛК последующих уровней (четвертого, пятого, шестого и так далее), и для специалиста в данной области техники должна быть очевидна возможность существования таких последующих уровней. Синтаксическая структура ИС ЛЛК 15, кроме синтаксически подчиненных СПЛЛК, может содержать и синтаксические сочиненные СПЛЛК. При этом все СПЛЛК первого уровня (элементы 13 первого вида) обязательно являются сочиненными друг с другом ПЛЛК. Начиная со СПЛЛК второго уровня (элементов 13 второго и последующих видов), СПЛЛК одного уровня могут как иметь, так и не иметь синтаксических сочинительных связей друг с другом. Синтаксическую сочинительную связь между СПЛЛК в ИС ЛЛК идентифицируют в случае наличия у синтаксически главных слов (ЛЛЕ) синтаксически главных ОЛЛО таких СПЛЛК одного и того же синтаксического родителя (синтаксически главного слова, у которого с таким словом (ЛЛЕ) имеется прямая синтаксическая подчинительная связь). Дополнительными условиями может быть наличие у главных слов (ЛЛЕ) таких СПЛЛК одной и той же синтаксической роли, а также наличие признака связи между такими словами (ЛЛЕ), а именно - запятой или сочинительного союза. ИС ЛЛК 15 в отличие от упомянутых ранее ИП ЛЛК 12 и ПЛЛК 13 может быть только в единственном числе - из одного исходного лингвистического предложения можно сформировать только одну ИС ЛЛК 15. С логической точки зрения, ИС ЛЛК 15 – это логическая сущность, выражающая сложное суждение (некванторное суждение), представляющая собой логическую конструкцию, элементами которой являются простые суждения. Кванторность сложного суждения определяется его количественной характеристикой, то есть наличием или отсутствием однозначности в сложном суждении. По количественной характеристике (кванторности) все сложные суждения можно разделить на две категории: однозначные сложные суждения и неоднозначные сложные суждения. Однозначные сложные суждения – это кванторные сложные суждения, в которых показатель кванторности всегда определен и равен единице, то есть каждый элемент сложного суждения не имеет вариативности, всегда однозначен. Однозначность сложного суждения проявляется посредством нахождения в составе сложного суждения элементов, не имеющих возможность быть истолкованными как варианты утверждений или отрицаний, либо как варианты обусловленности одного и того же утверждения или отрицания. Примером однозначного сложного суждения может быть следующее суждение: «Если покупатель оплатил товар, то товар должен быть передан покупателю продавцом». Данное сложное суждение не допускает никакой вариативности - простое суждение «товар должен быть передан покупателю продавцом» обусловлено единственным простым суждением «если покупатель оплатил товар». Неоднозначные сложные суждения – это кванторные сложные суждения, в которых показатель кванторности всегда определен и всегда больше единицы, то есть, как минимум, один элемент сложного суждения имеет вариативность. Неоднозначность сложного суждения проявляется посредством нахождения в составе сложного суждения элементов, имеющих возможность быть истолкованными как варианты утверждений или отрицаний, либо как варианты обусловленности одного и того же утверждения или отрицания. Примером неоднозначного сложного суждения может быть следующее суждение: «Если покупатель оплатил товар, то товар должен быть передан покупателю продавцом или товар должен быть передан покупателю иным должностным лицом компании». Данное сложное суждение допускает вариативность утверждения - или «товар должен быть передан покупателю продавцом», или «товар должен быть передан покупателю иным должностным лицом компании». Сложное суждение состоит из простых суждений, имеющих исходные (установленные в исходном лингвистическом предложении) синтаксические связи между собой. В связи с тем, что такими связями могут быть как синтаксические подчинительные связи, так и синтаксические сочинительные связи, нельзя гарантировать отсутствие в сложном суждении вариативности утверждений или отрицаний, либо вариативности обусловленностей утверждений (отрицаний). В связи с вышеизложенным ИС ЛЛК является сложным суждением с неопределенной количественной характеристикой (показатель кванторности может быть как равен единице, так и быть больше единицы), и такое сложное суждение является «некванторным». С аналитической точки зрения ИС ЛЛК – это информационно наполненная схема, проясняющая логическую конструкцию предложения (логические связи между отдельными простыми суждениями, заложенными в исходном лингвистическом предложении). В связи с этим ИС ЛЛК предпочтительно демонстрируется не в лингвистической текстовой формы (в виде сложного предложения, состоящего из множества простых предложений без сочинительной связи и причастных (деепричастных) оборотов, в котором может иметься как подчинительная, так и сочинительная связь между упомянутыми простыми предложениями), а в табличной или схематичной форме. Упомянутая табличная или схематичная форма демонстрации позволяет быстро и точно уяснить и проанализировать все используемые основные логические сущности (СПЛЛК) и все логические связи между упомянутыми логическими сущностями исходного лингвистического предложения. В частности, не ограничиваясь, такое развернутое и одновременно структурированное представление исходного лингвистического предложения (логически связанное множество простых предложений без однородностей) позволяет повысить эффективность обработки лингвистического предложения 11 машинными средствами, поскольку вместо одного обрабатываемого предложения со сложной структурой появляется возможность обрабатывать множество простых предложений с идентифицированной логической связью между элементами этого множества.[153] FIG. 35, by way of example, but not limitation, depicts the general structure of the formed tenth SMD data structure, which is the third SMD data structure for the present conversion method 300. The tenth MDD data structure is the SMD containing element 15, which is the original complex linguistic-logical the construction (IPLQ) of the linguistic sentence 11, and the identification data of element 15, representing, by way of example, but not limitation, the value 151 of element 15 of the tenth data structure and order marketing number 152 text elements constituting the element 15. In the initial complex linguistic LLK 15 11 offers no characterizing its unique name (VH) having the practical use. IPLLK sentences 11 is the borderline between linguistics and logic. From a linguistic point of view, IS LLK is a syntactic unit of the “syntactic construction” type, formed from a PLC by combining PLCs on the basis of the presence of direct syntactic subordination and composing links between the PLC. IS LLC consists of the number of PLC identified in the original sentence. The mentioned direct syntactic subordinate link means the presence between the elements of different PLC (between LLE different PLC) a syntactic subordinate link. A direct syntactic association means the presence between elements of different PLCs (between LLE different PLCs) a syntactic composing relationship. From the point of view of the syntax, IP LLK is a transformed original sentence without distorting its meaning. The essence of the transformation of the original linguistic sentence is that all the applied linguistic techniques (complications) aimed at simplifying the linguistic forms and structures of the author's assertions (denials) in the text of the linguistic sentence (for example, without limitation, the use of homogeneous members involved). ) cancel. Instead of the original linguistic sentence, they form an array of simple sentences that are syntactically and logically related to each other. The links mentioned are clarified and then recorded in one way or another. The need for such a transformation is relevant because simultaneously with the simplification of the linguistic forms and structure of the linguistic sentence, the use of the mentioned linguistic techniques leads to the complexity and ambiguity of the logical structure of the original linguistic sentence, to the complexity and ambiguity of the user’s sense of the original sentence, as well as to the great technical complexity of the correct intelligent machine analysis of the content of the original linguistic sentence. The original sentence thus transformed is (subject to the use of the mentioned techniques in the original linguistic sentence), in fact, a complex sentence consisting of transformed simple sentences in an amount greater than the number of initial simple sentences in the original linguistic sentence. However, unlike the original linguistic sentence, all transformed simple sentences in the LLK IS are unambiguous simple judgments (imaginable statements or denials). Registration of element 15 (IP LLK) in the form of a data structure (array of transformed PLC (elements 14)) allows revealing the multi-level syntactic structure of element 15 (IP LLK) and the connections between the elements of this structure. The levels of IP LLK reflect the structure of the syntactic subordinate connection between the structured PLC (SPLC) as constituent parts of the IC LLC and are due to the identified syntactic links between the component parts of element 15 (elements 14 of the linguistic sentence 11.) Element 15 (IP LLC) is formed from the mentioned structured PLC (SPLL) ) - elements 14. It is mandatory IP LLK contains only element 14 (SPLCK) of the first level (elements 13 of the first type). The presence of other elements 14 (SPLK) of the second and subsequent levels (elements 13 of the second and subsequent types) is due to the linguistic complications of the original linguistic sentence. The first level SPLC (elements of the first type 13) include PLC, which are not subject to simple sentences. The second-level SPLLK (elements of the second type 13) include PLCA, which are subject to simple sentences, provided that the first level SPLC are the main ones. The third level SPLK (elements of the third type 13) include PLCA, which are subject to simple sentences, provided that the second level SPLC is the main thing for them. These statements are thus also valid for the next levels of SPLC (fourth, fifth, sixth, and so on), and the possibility of the existence of such subsequent levels should be obvious to a person skilled in the art. The syntactic structure of the IC LLK 15, in addition to the syntactically subordinate SPLKK, may contain syntactic written SPLLK. At the same time, all SPLCMs of the first level (elements 13 of the first type) are necessarily composed of PLCMs with each other. Starting with the second level SPLKK (elements 13 of the second and subsequent types), the SPLK of the same level may or may not have syntactic composing links with each other. The syntactic composing relationship between SPLK in IS LLK is identified if the syntactically main words (LLE) have syntactically main OLLOs of such SPLLK of the same syntactic parent (syntactic main word that has a direct syntactic subordinate connection with such a word (LLE)). Additional conditions may be the presence of the main words (LLE) of such SPLLK of the same syntactic role, as well as the presence of an indication of a connection between such words (LLE), namely, a comma or a writing union. IP LLK 15, in contrast to the previously mentioned IP LLK 12 and PLC 13, can be only in the singular - only one LLK 15 can be formed from one initial linguistic sentence. From a logical point of view, IP LLK 15 is a logical entity expressing a complex judgment (non-quantifier judgment), which is a logical construction whose elements are simple judgments. The quantifier of a complex judgment is determined by its quantitative characteristic, that is, by the presence or absence of uniqueness in a complex judgment. According to the quantitative characteristic (quantification), all complex judgments can be divided into two categories: single-valued complex judgments and ambiguous complex judgments. Unambiguous complex judgments are quantifier complex judgments, in which the quantifier index is always defined and equal to one, that is, each element of a complex judgment has no variation, is always unequivocal. The unambiguity of a complex judgment is manifested by the presence of elements in a complex judgment that cannot be interpreted as variants of statements or denials, or as variants of the conditionality of the same statement or negation. An example of unambiguous complex judgment may be the following judgment: “If the buyer paid for the goods, then the goods must be transferred to the buyer by the seller.” This complex judgment does not allow for any variation - a simple judgment “the goods must be transferred to the buyer by the seller” is due to a single simple judgment “if the buyer paid for the goods”. Ambiguous complex judgments are quantifier complex judgments in which the quantifier index is always defined and is always greater than one, that is, at least one element of the complex judgment has variability. The ambiguity of a complex judgment is manifested by the presence in the composition of a complex judgment of elements that can be interpreted as variants of statements or denials, or as variants of the conditionality of the same statement or denial. An example of an ambiguous complex judgment may be the following judgment: “If the buyer paid for the goods, then the goods must be transferred to the buyer by the seller or the goods must be transferred to the buyer by another company official”. This complex judgment allows variability of the statement - either “the goods must be transferred to the buyer by the seller”, or “the goods must be transferred to the buyer by another official of the company”. A complex judgment consists of simple judgments having initial (established in the initial linguistic sentence) syntactic connections among themselves. Due to the fact that such links can be both syntactic subordinate links and syntactic composing links, it is impossible to guarantee the absence in a complex judgment of the variability of statements or negations, or the variability of conditionality of statements (negations). In connection with the foregoing, the ICLA is a complex judgment with an indefinite quantitative characteristic (the quantifier index can be either equal to one or be greater than one), and such a complex judgment is “non-quantifier”. From an analytical point of view, IS LLK is an information-filled scheme that clarifies the logical construction of a sentence (logical connections between individual simple judgments embedded in the original linguistic sentence). In this regard, the IC LLK is preferably shown in a non-linguistic textual form (in the form of a complex sentence consisting of a set of simple sentences without a coherent connection and implicated (adverbial) turns, in which there can be both a subordinate and a companion connection between the said simple sentences) , and in tabular or schematic form. The mentioned tabular or schematic form of the demonstration allows you to quickly and accurately understand and analyze all used basic logical entities (SPLLK) and all the logical connections between the mentioned logical entities of the original linguistic sentence. In particular, without limitation, such a developed and at the same time structured representation of the original linguistic sentence (a logically connected set of simple sentences without homogeneities) allows one to increase the processing efficiency of the linguistic sentence 11 by machine tools, because instead of one processed sentence with a complex structure, it is possible to process many simple sentences with identified logical connection between the elements of this set.

[154] Идентификацию видов элементов 13 девятой структуры данных СМД в ходе этапа 3042 производят на основе результатов идентификации значений 2171 шестой части лингвистических характеристик 217 текстовых элементов 21, составляющих ПЛЛК 13. Для идентификации видов ПЛЛК 13 необходимо, в качестве примера, но не ограничения, осуществить следующие действия: на первом этапе из всех ПЛЛК 13 выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО элемента 13 (ПЛЛК) не имеет синтаксического родителя; такая ПЛЛК будет являться элементом 13 первого вида - обязательным элементом десятой структуры данных СМД; на втором этапе из оставшихся ПЛЛК 13, вид которых еще не идентифицирован, выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО элемента 13 (ПЛЛК) имеет синтаксического родителя в ПЛЛК идентифицированной как элемент 13 первого вида; такая ПЛЛК будет являться элементом 13 второго вида – не обязательным элементом десятой структуры данных СМД; на третьем и последующих этапах из оставшихся ПЛЛК 13, вид которых еще не идентифицирован, выбирают такие ПЛЛК, в которых главная ЛЛЕ главного ОЛЛО элемента 13 (ПЛЛК) имеет синтаксического родителя в ПЛЛК, идентифицированной как элемент 13 второго или последующих видов; такая ПЛЛК будет являться элементом 13 третьего или последующих видов – не обязательным элементом десятой структуры данных СМД. Наличие таких ПЛЛК обусловлено только синтаксической сложностью исходного лингвистического предложения. При этом дополнительно проводят этап идентификации сочинительных связей между элементами 13 (ПЛЛК). ПЛЛК 13, у которых отсутствует синтаксическая подчинительная связь, но идентифицирована синтаксическая сочинительная связь, относят к тому же виду, что и ПЛЛК 13, с которым она сочинена. Идентификацию элементов 14 (составных частей элемента 15) десятой структуры данных СМД в ходе этапа 3043 производят путем отождествления с элементами 13, идентифицированными на этапе 3042 как определенные виды элемента 13. При этом элементы 13 первого вида идентифицируют как элемент 14 первого уровня, элементы 13 второго вида идентифицируют как элемент 14 второго уровня и так далее, элементы 13 третьего и последующих видов идентифицируют как элемент 14 третьего и, соответственно, последующих уровней.[154] The identification of the types of elements 13 of the ninth SMD data structure during step 3042 is made based on the results of identifying the values 2171 of the sixth part of the linguistic characteristics 217 of the text elements 21 constituting the PLLC 13. to carry out the following actions: in the first stage, from all PLCs 13, PLCs are chosen in which the main LLE of the main OLLO element 13 (PLCA) does not have a syntactic parent; such a PLC will be the element 13 of the first type - an obligatory element of the tenth data structure of the MD; in the second stage, from the remaining PLCs 13, the type of which has not yet been identified, select such PLCs in which the main LLE of the main OLLO element 13 (PLCA) has a syntactic parent in the PLCA identified as element 13 of the first type; such a PLC will be the element of the second type 13 - not a mandatory element of the tenth data structure of the MD; in the third and subsequent stages from the remaining PLC 13, the type of which has not yet been identified, select such PLC in which the main LLE of the main OLLO element 13 (PLC) has a syntactic parent in the PLC identified by element 13 of the second or subsequent species; such a PLC will be an element of the third or subsequent species 13 - not a mandatory element of the tenth data structure of the SMD. The presence of such PLCs is due only to the syntactic complexity of the original linguistic sentence. At the same time, an additional stage is the identification of the composing connections between elements 13 (PLC). PLC 13, in which there is no syntactic subordinate connection, but syntactic composing connection is identified, refer to the same type as PLC 13 with which it was composed. Elements 14 (constituent parts of element 15) of the tenth SMD data structure during step 3043 are identified by identification with elements 13 identified at stage 3042 as certain types of element 13. In this case, elements 13 of the first type are identified as element 14 of the first level, elements 13 of the second the species is identified as element 14 of the second level, and so on, elements 13 of the third and subsequent types are identified as element 14 of the third and, respectively, subsequent levels.

[155] Идентификация видов элементов 13 девятой структуры данных СМД в рамках этапа 3042 не изменяет значение 131 элемента 13 и не изменяет порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 13 (ПЛЛК). Идентификацию значения и порядковых номеров ТЭ элемента 14 (СПЛЛК) десятой структуры данных СМД в рамках этапа 3043 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 13, идентифицируют как значение 141 элемента 14 (СПЛЛК), а порядковые номера) 212 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 13, идентифицируют как порядковые номера 142 текстовых элементов, составляющих элемент 14 (СПЛЛК). Идентификацию значения и порядковых номеров ТЭ элемента 15 (ИС ЛЛК) десятой структуры данных СМД в рамках этапа 3043 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих все элементы 14, идентифицируют как значение 151 элемента 15 (ИС ЛЛК), а порядковые номера 212 (упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих все элементы 14, идентифицируют как порядковые номера 152 текстовых элементов, составляющих элемент 15 (ИС ЛЛК).[155] The identification of the types of elements 13 of the ninth MDD data structure under step 3042 does not change the value 131 of element 13 and does not change the sequence numbers of the text elements 21 of the linguistic sentence 11 constituting element 13 (PLC). The value and sequence numbers of the TE element 14 (SPLLK) of the tenth SMD data structure in step 3043 are identified as follows: the values 211 of the text elements 21 of the linguistic sentence 11 constituting element 13 are identified as the value 141 elements 14 (SPLLC) and the sequence numbers 212 of the above-mentioned text elements 21 of the linguistic sentence 11, constituting element 13, are identified as sequence numbers 142 of text elements constituting element 14 (SPLLK). The identification of the value and sequence numbers of the TE element 15 (IP LLK) of the tenth data structure of the DMD in step 3043 is as follows: the values 211 of the text elements 21 of the linguistic sentence 11 constituting all elements 14 are identified as the value 151 elements 15 The sequence numbers 212 (of the mentioned textual elements 21 of the linguistic sentence 11, constituting all the elements 14, are identified as the sequence numbers 152 of the text elements making up the element 15 (IS LLK).

[156] Формирование десятой структуры данных СМД в ходе этапа 3043 производят путем объединения в одной структуре данных элементов 14 десятой структуры данных СМД, а также их идентификационных данных. При этом объединяемые в одной структуре данных элементы 14, являясь составными частями элемента 15, формируют таким образом элемент 15, который является основным элементом десятой структуры данных СМД. Объединение в одной структуре данных упомянутых элементов и их идентификационных данных производится по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются. В итоге десятая структура данных СМД представляет собой массив (перечень) структурированных ПЛЛК (СПЛЛК) - элементов 14 первого и последующих уровней, расположенных в перечне СПЛЛК с учетом возрастания уровня элемента 14 (и указанием этого уровня), а также с учетом возрастания порядкового номера текстового элемента признака связи элемента 14 (и указанием этого порядкового номера), а также порядкового номера текстового элемента синтаксического родителя элемента 14 (и указанием этого порядкового номера). При этом первой частью ИС ЛЛК и первым порядковым номером в упомянутом перечне структурированных ПЛЛК будет СПЛЛК 14 без синтаксического родителя и без признака связи. Элементы 14 десятой структуры данных СМД используют для построения схемы или таблицы логических связей, визуально отображающей логическую конструкцию исходного лингвистического предложения (логические связи между отдельными простыми суждениями, заложенными в исходном лингвистическом предложении). В частности, не ограничиваясь, как это было указано ранее со ссылкой на элементы 15, такое развернутое и одновременно структурированное представление исходного лингвистического предложения (логически связанное множество простых предложений без однородностей) позволяет повысить эффективность обработки лингвистического предложения 11 машинными средствами, поскольку вместо одного обрабатываемого предложения со сложной структурой появляется возможность обрабатывать множество простых предложений с идентифицированной логической связью между элементами этого множества. [156] The formation of the tenth data structure of the MDD during step 3043 is performed by combining in one data structure the elements of the 14th tenth data structure of the MDD and their identification data. In this case, the elements 14 that are combined in one data structure, being constituent parts of element 15, thus form element 15, which is the main element of the tenth data structure of the MDD. The combination of these elements and their identification data in one data structure is carried out according to principles and methods known from the prior art, which, respectively, are not described in further detail below. As a result, the tenth data structure of the SMD is an array (list) of structured PLCM (SPLLK) - elements 14 of the first and subsequent levels, located in the list of SPLCM, taking into account the increasing level of element 14 (and indicating this level), and also taking into account the increase of the text number the link element element of element 14 (and an indication of this sequence number), as well as the sequence number of the text element of the syntactic parent of element 14 (and an indication of this sequence number). At the same time, the first part of the ISLK and the first sequence number in the mentioned list of structured PLLCs will be SPLLK 14 without a syntactic parent and without a link sign. Elements 14 of the tenth SMD data structure are used to build a schema or table of logical links that visually display the logical construction of the original linguistic sentence (logical links between individual simple judgments embedded in the original linguistic sentence). In particular, without being limited, as it was mentioned earlier with reference to elements 15, such a developed and at the same time structured representation of the original linguistic sentence (a logically connected set of simple sentences without homogeneity) allows increasing the processing efficiency of the linguistic sentence 11 by machine tools, because instead of a single sentence being processed with a complex structure, it is possible to process many simple sentences with an identified logical connection between elements of this set.

[157] Идентификацию лингвистических характеристик ТЭ, составляющих элемент 15 (ИС ЛЛК) десятой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3041, состоящего из идентификационных данных ТЭ, составляющих элемент 15 (ИС ЛЛК), и получении значений (2131, 2141, 2231, 2151, 2161, 2171) всех частей лингвистических характеристик (213, 214, 223, 215, 216, 217) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 15 (ИС ЛЛК). При этом, как было описано ранее, лингвистическими признаками элемента 15 (ИС ЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 15 (ИС ЛЛК).[157] The identification of the linguistic characteristics of the TEs that make up element 15 (IS LLK) of the tenth data structure of the DMD, and their values, if necessary, is produced by organizing a query in the BDLP, formed as part of step 3041, consisting of the identity data of the TEs that make up element 15 (IS LLK ), and obtaining the values (2131, 2141, 2231, 2151, 2161, 2171) of all parts of the linguistic characteristics (213, 214, 223, 215, 216, 217) of textual elements 21 of the linguistic sentence 11, of which element 15 consists (IC LLK ). At the same time, as described earlier, the linguistic features of element 15 (IP LLK) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which elements 15 consist (IC LLK).

[158] На фиг. 36, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 305 формирования одиннадцатой структуры данных СМД, являющейся третьей структурой данных СМД для рассматриваемого способа 300. Этап 305 характеризуется: выполнением этапа 3051 идентификации видов элемента 15 десятой структуры данных СМД, указывающих на наличие в ИС ЛЛК сочиненных ПЛЛК, на котором идентифицируют первый и второй виды элемента 15 десятой структуры данных СМД, а также идентификации непреобразованных элементов 16 одиннадцатой структуры данных СМД и их идентификационных данных, представляющих собой для каждого непреобразованного элемента 16, в качестве примера, но не ограничения, значение 161 непреобразованного элемента 16 одиннадцатой структуры данных СМД и порядковые номера 162 ТЭ лингвистического предложения 11, составляющих непреобразованный элемент 16; выполнением этапа 3052 формирования преобразованных элементов 16 одиннадцатой структуры данных СМД, на котором формируют преобразованные элементы 16 одиннадцатой структуры данных СМД из элементов 15 второго вида, а также идентификационные данные преобразованных элементов 16, представляющие собой для каждого преобразованного элемента 16, в качестве примера, но не ограничения, значение 161 преобразованного элемента 16 одиннадцатой структуры данных СМД и порядковые номера 162 ТЭ лингвистического предложения 11, составляющих преобразованные элементы 16; выполнением этапа 3053 формирования одиннадцатой структуры данных СМД, на котором формируют одиннадцатую структуру данных СМД из преобразованных элементов 16 одиннадцатой структуры данных СМД или из непреобразованного элемента 16 одиннадцатой структуры данных СМД.[158] FIG. 36, by way of example, but not limitation, depicts a general scheme for performing the steps of step 305 of forming the eleventh UDL data structure, which is the third UDT data structure for the method 300 under consideration. for the presence in ISLK of composed PLCs, on which the first and second types of element 15 identify the tenth SMD data structure, as well as the identification of non-transformed elements 16 of the eleventh SM data structure D and their identification data, representing for each non-transformed element 16, as an example, but not limitation, the value 161 of non-transformed element 16 of the eleventh data structure of the SMD and the sequence numbers 162 TE of the linguistic sentence 11 constituting the non-transformed element 16; performing step 3052 of generating transformed elements 16 of the eleventh SMD data structure, wherein transformed elements 16 of the eleventh SMD data structure of the second type of elements 15 are formed, as well as identification data of the transformed elements 16, representing for each transformed element 16, as an example, but not restrictions, the value 161 of the transformed element 16 of the eleventh data structure of the MDD and the sequence numbers 162 TE of the linguistic sentence 11 constituting the transformed elements nty 16; the execution of step 3053 of forming the eleventh data structure of the DMD, which forms the eleventh data structure of the SMD of the converted elements 16 of the eleventh data structure of the SMD or of the untransformed element 16 of the eleventh data structure of the SMD.

[159] На фиг. 37, в качестве примера, но не ограничения, изображена общая структура сформированной одиннадцатой структуры данных СМД, являющейся четвертой структурой данных СМД для настоящего способа преобразования 300. Одиннадцатая структура данных СМД представляет собой СМД, содержащий элементы 16 одиннадцатой структуры данных СМД, которые представляют собой сложные лингво-логические конструкции (СЛЛК) лингвистического предложения 11 и идентификационные данные ЛогО, представляющие собой для каждого элемента 16, в качестве примера, но не ограничения, значение 161 элемента 16 одиннадцатой структуры данных СМД и порядковые номера 162 текстовых элементов, составляющих элемент 16. У СЛЛК лингвистического предложения 11 отсутствуют какие-либо характеризующие ее уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 16, в качестве примера, но не ограничения, могут именоваться как «СЛЛК1», «СЛЛК2», «СЛЛК3», «СЛЛКn», где n ≥ 1 - порядковый номер элемента в лингвистическом предложении. СЛЛК лингвистического предложения 11 – это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, СЛЛК – это синтаксическая единица вида «синтаксическая конструкция», сформированная из ИС ЛЛК путем гетерогенизации ИС ЛЛК. С точки зрения синтаксиса СЛЛК – это отдельное простое предложение (если исходное лингвистическое предложение является простым предложением без синтаксических осложнений (однородных членов, оборотов и так далее)) или сложноподчиненное предложение, которое не содержит однородных членов (слов между которыми имеется синтаксическая сочинительная связь). С логической точки зрения, СЛЛК – это логическая сущность, выражающая сложное суждение (кванторное суждение), представляющее собой завершенную логическую конструкцию мышления, с помощью которой формируется и передается мысль о том, что нечто (предикат суждения) утверждается или опровергается о предмете суждения (субъект суждения). Отличие СЛЛК от ИС ЛЛК в кванторности сложного суждения. Если ИС ЛЛК допускает возможность наличия неоднозначности в сложном суждении, то СЛЛК (имеющая показатель кванторности, равный единице) является абсолютно однозначным сложным суждением. В составе СЛЛК не может быть нескольких однородных (сочиненных) простых суждений. В СЛЛК не может быть никакой неоднозначности ни при утверждении (опровержении) чего-либо, ни при обусловленности утверждения (опровержения), ни при обусловленности элементов утверждения (опровержения), вне зависимости от состава и конструкции исходного лингвистического предложения.[159] FIG. 37, by way of example, but not limitation, depicts the general structure of the eleventh UDB data structure that is the fourth UDT data structure for the present conversion method 300. The eleventh UDD data structure is a UDT containing 16 elements of the 11th UDB data structure, which are complex linguistic-logical constructions (SLLC) of linguistic sentence 11 and the identification data of LogO, representing for each element 16, as an example, but not limitation, 161 elements 16 of the eleventh data structure of the SMD and sequence numbers 162 of text elements constituting element 16. The SLCA of the linguistic sentence 11 does not have any unique characterizations (UN) that have practical use. In the data structure, elements 16, by way of example, but not limitation, may be referred to as “SLLK1”, “SLLK2”, “SLLK3”, “SLLKn”, where n ≥ 1 is the ordinal number of the element in the linguistic sentence. The SLCA of the linguistic sentence 11 is the borderline between linguistics and logic. From a linguistic point of view, SLLC is a syntactic unit of the form “syntactic construction”, formed from an ISLK by heterogenization of an ICLL. From the point of view of syntax, SLK is a separate simple sentence (if the original linguistic sentence is a simple sentence without syntactic complications (homogeneous members, revolutions, etc.)) or a complex subordinate sentence that does not contain homogeneous members (the words between which have a syntactic composing relationship). From a logical point of view, SLLK is a logical entity expressing a complex judgment (quantifier judgment), which is a complete logical construction of thinking, through which the thought that something (predicate judgment) is affirmed or refuted about the subject matter of judgment (subject judgments). The difference between SLCK and ISLK in the quantifier of complex judgment. If IS LLK admits the possibility of having ambiguity in a complex judgment, then SLLC (having a quantifier of one) is an absolutely single-valued complex judgment. SLCK cannot contain several homogeneous (composed) simple judgments. In SLC, there can be no ambiguity either in approving (denying) something, or when the approval (refutation) is conditional, or when the approval (refutation) elements are conditional, regardless of the composition and design of the original linguistic sentence.

[160] Идентификацию вида ИС ЛЛК 15 в рамках этапа 3051 производят путем анализа значений лингвистических характеристик текстовых элементов, составляющих ИС ЛЛК 15, с целью идентификации синтаксических сочинительных связей между СПЛЛК 14 в ИС ЛЛК 15. Синтаксическую сочинительную связь между СПЛЛК 14 идентифицируют в случае наличия у синтаксически главных ЛЛЕ синтаксически главных ОЛЛО таких СПЛЛК одного и того же синтаксического родителя (синтаксически главной ЛЛЕ другой СПЛЛК, у которой со словом (ЛЛЕ) в сочиненных СПЛЛК имеется прямая синтаксическая подчинительная связь). Дополнительными условиями может быть наличие у главных ЛЛЕ главных ОЛЛО упомянутых сочиненных СПЛЛК одной и той же синтаксической роли, а также наличие признака связи между упомянутыми сочиненными ЛЛЕ, а именно - запятой или сочинительного союза. При идентификации синтаксической сочинительной связи между главными ЛЛЕ главных ОЛЛО двух или более СПЛЛК такую ИС ЛЛК идентифицируют как второй вид элемента 15. ИС ЛЛК 15, в которой не идентифицируют синтаксической сочинительной связи у главного ЛЛЕ главного ОЛЛО в СПЛЛК идентифицируют как первый вид элемента 15. При этом идентифицированный первый вид элемента 15 десятой структуры данных СМД отождествляют с непреобразованным элементом 16 одиннадцатой структуры данных СМД. Формирование преобразованных элементов одиннадцатой структуры данных СМД (преобразованных элементов 16, полученных из элементов 15 второго вида) на этапе 3052 производят на основании идентифицированной на этапе 3051 синтаксической сочинительной связи между СПЛЛК путем преобразования ИС ЛЛК второго вида. Смысл преобразования ИС ЛЛК второго вида на этапе 3052 состоит в гетерогенизации ИС ЛЛК, то есть в устранении синтаксических однородностей в ИС ЛЛК путем формирования из элемента 15 второго вида множества новых ИС ЛЛК, идентичных по однородностям элементу 15 первого вида. При этом каждая новая ИС ЛЛК упомянутого множества может содержать только одну из упомянутых СПЛЛК с однородными членами (если ИС ЛЛК второго вида содержит один ряд однородных членов) или только одно уникальное сочетание упомянутых СПЛЛК с однородными членами разных рядов однородных членов (если ИС ЛЛК второго вида содержит несколько рядов СПЛЛК с однородными членами). Множество ИС ЛЛК, сформированных из ИС ЛЛК (элемент 15) второго вида являются гетерогенными СЛЛК (преобразованными элементами 16), то есть сформированными из одной ИС ЛЛК второго вида путем ее гетерогенного преобразования (гетерогенизации). Процесс гетерогенизации ИС ЛЛК (элемента 15) второго вида может быть проведен, в качестве примера, но не ограничения, следующим образом: на первом этапе выявляют ряды однородных членов в элементе 15 второго вида; в ходе выявления рядов однородных членов выявляют сами ряды однородных членов и порядковые номера однородных членов в ряду, а также признаки связи каждого однородного члена; на втором этапе выявляют цепочки однородных членов для каждого выявленного СПЛЛК, содержащего ЛЛЕ-ОЧ (СПЛЛК-ОЧ) элемента 15 второго вида; цепочка однородных членов (цепочка ОЧ) - это СПЛЛК-ОЧ и зависимая цепочка однородных членов (цепочка синтаксически связанных СПЛЛК, начиная от первого синтаксического потомка однородных членов (синтаксически зависимой СПЛЛК) и продолжая по цепочке синтаксической зависимости (по синтаксической подчинительной связи) до другой СПЛЛК-ОЧ или до последней ПЛЛК в элементе 15 второго вида; идентифицированные цепочки ОЧ классифицируются по факту наличия синтаксического потомка ЛЛЕ в зависимой цепочке ОЧ, который не входит в зависимую цепочку ОЧ; те цепочки ОЧ, которые имеют зависимые цепочки ОЧ без синтаксического потомка за рамками зависимой цепочки однородных членов, считаются крайними цепочками однородных членов (крайними цепочками ОЧ), а те цепочки ОЧ, которые имеют зависимые цепочки ОЧ с синтаксическим потомком за рамками зависимой цепочки ОЧ, считаются внутренними цепочками однородных членов (внутренними цепочками ОЧ); на третьем этапе выявляют ПЛЛК элемента 15 второго вида, не входящие в цепочки однородных членов (ПЛЛК вне цепочек ОЧ); на четвертом этапе формируют сменные зависимые цепочки (сменные ЗЦ) элемента 15 второго вида; сменная ЗЦ - это основа преобразованных элементов 16, состоящая из одной крайней цепочки ОЧ и внутренних цепочек ОЧ, если такие внутренние цепочки ОЧ по цепочке непрерывной синтаксической подчинительной связи имеются между крайней цепочкой ОЧ и ПЛЛК вне цепочек ОЧ; на пятом этапе формируют гетерогенные СЛЛК (элементы 16); гетерогенная СЛЛК формируется из одной сменной ЗЦ и ПЛЛК вне цепочки ОЧ (если такие ПЛЛК есть); количество сменных ЗЦ элемента 15 второго вида определяет количество гетерогенных СЛЛК, сформированных от одного элемента 15 второго вида. [160] The identification of the type of IP LLK 15 in step 3051 is made by analyzing the values of the linguistic characteristics of the text elements constituting the IP LLK 15, in order to identify the syntactic composing connections between SPLLK 14 in the IP LLK 15. The syntactic composing link between SPLLK 14 is identified if the syntactically main LLE of the syntactically main OLLO of such SPLLKs of the same syntactic parent (the syntactically main LLE of another SPLLK, which with the word (LLE) in the composed SPLLK has direct syntax eskaya subordinate connection). Additional conditions may be the presence of the main LLE main OLLO mentioned penned SPLLK of the same syntactic role, as well as the presence of a sign of connection between the mentioned penned LLE, namely, a comma or a writing union. When identifying a syntactic somatic connection between the main LLE main OLLOs of two or more SPLLKs, such an LLK is identified as the second type of element 15. LLK 15, which does not identify the syntactic somatic connection of the main LLE of the main OLLO to the SPLLK, is identified as the first type of the 15. element. In this, the identified first type of element 15 of the tenth SMD data structure is identified with the non-transformed element 16 of the eleventh SMD data structure. The formation of the transformed elements of the eleventh data structure of the DMD (transformed elements 16 obtained from the second type of elements 15) at step 3052 is made on the basis of the syntactic composing relationship identified between SPLLK identified at step 3051 by converting the second type of LLK. The meaning of the transformation of an IP LLK of the second type at step 3052 is to heterogenize the IP LLK, that is, to eliminate syntactic homogeneities in the IP LLK by forming from the second type element 15 a set of new IP LLKs identical in homogeneity to the element 15 of the first type. Moreover, each new LLK of the mentioned set may contain only one of the mentioned SPLCM with homogeneous members (if the LLM IP of the second type contains one row of homogeneous members) or only one unique combination of the mentioned SPLCM with homogeneous members of different rows of homogeneous members (if the LLK of the second kind contains several rows of SPLK with homogeneous members). Many IP LLK, formed from IP LLK (element 15) of the second type are heterogeneous SLLK (transformed elements 16), that is, formed from one LLK IP of the second type by its heterogeneous transformation (heterogenization). The process of heterogenization of IP LLK (element 15) of the second type can be carried out, by way of example, but not limitation, as follows: at the first stage, rows of homogeneous members in element 15 of the second type are identified; in the course of identifying the series of homogeneous members, they themselves identify the series of homogeneous members and the sequence numbers of homogeneous members in the series, as well as signs of the connection of each homogeneous member; at the second stage, chains of homogeneous members are detected for each SPLLL identified, containing the LLE-POC (SPLCP-POC) element 15 of the second type; A chain of homogeneous members (an ECH chain) is a SPLLK-POC and a dependent chain of homogeneous members (a chain of syntactically related SPLLK, starting from the first syntactic descendant of homogeneous members (syntactically dependent SPLLK) and continuing along the chain of syntactic dependence (on syntactic subordinate link) to another SPLLK -OCH or up to the last PLC in the element 15 of the second type; the identified PTS chains are classified by the fact that there is a syntax descendant of LLE in the dependent PTS chain that is not included in the dependent PTS chain; those PTS chains that have dependent PTS chains without a syntactic descendant beyond the dependent chain of homogeneous members are considered extreme chains of homogeneous members (extreme chains of PTS), and those PCH chains that have dependent chains of POC with a syntactic descendant beyond the dependent chain of PTS, are considered internal chains of homogeneous members (internal chains of OFC); in the third stage, PLLCs of element 15 of the second type are identified that are not included in the chains of homogeneous members (PLCs outside the chains of RCh); in the fourth stage, replaceable dependent chains (interchangeable replacement centers) of the element 15 of the second type are formed; replaceable SC is the basis of the transformed elements 16, consisting of one extreme chain of PSh and internal chains of PS, if such internal chains of PS are along the chain of a continuous syntactic subordinate connection between the extreme chain of PS and PLC outside the chains of PS; at the fifth stage, heterogeneous SLCAs are formed (elements 16); heterogeneous SLLC is formed from one interchangeable SCC and PLC outside the PTS chain (if there are such PLCs); the number of interchangeable replacement elements of the element 15 of the second type determines the number of heterogeneous SLCAs formed from one element 15 of the second type.

[161] Идентификация видов элементов 15 десятой структуры данных СМД в рамках этапа 3051 не изменяет значение 151 элемента 15 и не изменяет порядковые номера текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 (ИС ЛЛК). Идентификацию значения и порядковых номеров ТЭ непреобразованного элемента 16 (СЛЛК) одиннадцатой структуры данных СМД в рамках этапа 3051 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 первого вида десятой структуры данных СМД, идентифицируют как значение 161 непреобразованного элемента 16 (СЛЛК), а порядковые номера 152 упомянутых текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 первого вида, из которого состоит непреобразованный элемент 16, идентифицируют как порядковые номера 162 текстовых элементов, составляющих непреобразованный элемент 16 (СЛЛК). Идентификацию значения и порядковых номеров ТЭ преобразованного элемента 16 (гетерогенной СЛЛК) одиннадцатой структуры данных СМД в рамках этапа 3052 производят следующим образом: значения 211 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 второго вида десятой структуры данных СМД, за исключением значений 211 текстовых элементов 21 лингвистического предложения 11, составляющих отдельные части элемента 15 второго вида (СПЛЛК-ОЧ), которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК-ОЧ (синтаксически подчиненные удаленным СПЛЛК-ОЧ сочинительные союзы или знаки препинания), идентифицируют как значение 161 преобразованного элемента 16 (СЛЛК), а порядковые номера 212 текстовых элементов 21 лингвистического предложения 11, составляющих элемент 15 второго вида шестой структуры данных СМД, за исключением порядковых номеров 212 текстовых элементов 21 лингвистического предложения 11, составляющих отдельные части элемента 15 второго вида (СПЛЛК-ОЧ), которые были удалены при гетерогенизации, и признаков связи удаленных СПЛЛК-ОЧ (синтаксически подчиненные удаленным СПЛЛК-ОЧ сочинительные союзы или знаки препинания) идентифицируют как порядковые номера 162 текстовых элементов, составляющих преобразованный элемент 16 (гетерогенная СЛЛК).[161] The identification of the types of elements 15 of the tenth data structure of the MDD within step 3051 does not change the value 151 of elements 15 and does not change the sequence numbers of the text elements 21 of the linguistic sentence 11 constituting element 15 (IS LLK). The identification of the value and sequence numbers of the TE of the non-transformed element 16 (SLLC) of the eleventh SMD data structure as part of step 3051 is as follows: the values 211 of the text elements 21 of the linguistic sentence 11 constituting the element 15 of the first type of the tenth data structure of the SMD are identified as the value 161 of the non-transformed element 16 (SLCK), and the ordinal numbers 152 of the above-mentioned text elements 21 of the linguistic sentence 11, constituting element 15 of the first type, of which the non-transformed element 16 consists, identify as sequence numbers 162 text elements constituting non-transformed element 16 (SLCK). The meaning and sequence numbers of the transformed element TE 16 (heterogeneous SLLC) of the eleventh SMD data structure in step 3052 are identified as follows: 211 text elements 21 of the linguistic sentence 11 constituting element 15 of the second type of the tenth SMD data structure, except for 211 text elements 21 linguistic sentences 11 that make up separate parts of the element 15 of the second type (SPLLK-RN), which were removed during heterogenization, and signs of the connection of the remote RLLC-RN (syntak sically subordinate remote allorders or punctuation marks) are identified as the value 161 of the transformed element 16 (SLLC), and the ordinal numbers 212 of the text elements 21 of the linguistic sentence 11 constituting the element 15 of the second type of the sixth data structure of the MD, except for the ordinal numbers 212 text elements 21 of the linguistic sentence 11, constituting separate parts of the second type element 15 (SPLLK-RCh), which were removed during heterogenization, and the connection signs of the deleted SPLLK-RCh (syntactically dchinennye remote SPLLK-OCH coordinative associations or punctuation) is identified as sequence numbers 162 text elements constituting the converted element 16 (heterogeneous SLLK).

[162] Формирование одиннадцатой структуры данных СМД в рамках этапа 3053 производят путем объединения в одной структуре данных, идентифицированных на этапах 3051 и 3052 элементов 16 одиннадцатой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются. Первым из объединяемых элементов одиннадцатой структуры данных СМД является идентифицированный на этапе 3051 элемент 15 первого вида, являющийся непреобразованным элементом 16, то есть СЛЛК 16, совпадающей с ИС ЛЛК 15 без синтаксической сочинительной связи. Вторым из объединяемых элементов одиннадцатой структуры данных СМД являются преобразованные элементы 16, сформированные на этапе 3052 как множество преобразованных элементов 16, являющихся гетерогенными СЛЛК, сформированными из элемента 15 второго вида (ИС ЛЛК с синтаксической сочинительной связью) путем гетерогенизации ИС ЛЛК второго вида.[162] The formation of the eleventh data structure of the MDD in step 3053 is performed by combining in one data structure identified in steps 3051 and 3052 elements 16 of the eleventh data structure of the DMD, as well as their identification data according to principles known from the prior art and further not described in detail. The first of the merged elements of the eleventh data structure of the MDD is the first type element identified at step 3051 of the first type, which is the untransformed element 16, i.e. SLLK 16, coinciding with the IS LLK 15 without syntactic composing. The second of the combined elements of the eleventh data structure of the SMD is the transformed elements 16, formed at step 3052 as a set of transformed elements 16, which are heterogeneous SLLC, formed from the element 15 of the second type (IP LLK with syntactic linking) by the second type.

[163] Идентификацию лингвистических характеристик ТЭ, составляющих элемент 16 (СЛЛК) одиннадцатой структуры данных СМД, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 3041, состоящего из идентификационных данных ТЭ, составляющих элемент 16 (СЛЛК), и получении значений (2131, 2141, 2231, 2151, 2161, 2171) всех частей лингвистических характеристик (213, 214, 223, 215, 216, 217) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 16 (СЛЛК). При этом, как было описано ранее, лингвистическими признаками элемента 16 (СЛЛК) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 16 (СЛЛК).[163] The linguistic characteristics of the TEs that make up element 16 (SLLC) of the eleventh SMD data structure and their values, if necessary, are identified by organizing a query in the BDLP, formed as part of step 3041, consisting of the identification data of TEs that make up element 16 (SLLC), and obtaining the values (2131, 2141, 2231, 2151, 2161, 2171) of all parts of the linguistic characteristics (213, 214, 223, 215, 216, 217) of the textual elements 21 of the linguistic sentence 11, of which element 16 consists (SLLC). At the same time, as described earlier, the linguistic features of element 16 (SLCA) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 16 consist (SLLC).

[164] Вместе с тем, после завершения описанного ранее этапа 301, в целях обеспечения альтернативного повышения точности последующего поиска в структурированном массиве данных (СМД), альтернативно становится возможным осуществить дальнейшее преобразование СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и их идентификационные данные. При этом специалисту в данной области техники должно быть очевидно, что описанные далее принципы и способы по завершении описанного ранее этапа 301 способа 300 могут осуществляться как одновременно (параллельно) с описанными ранее этапами 301-305 способа 300, так и не одновременно (альтернативно или последовательно, в том числе вне зависимости от порядка следования), а также, что отдельные принципы и способы отдельных описываемых далее этапов могут реализовываться аналогичным образом.[164] However, after completing the previously described step 301, in order to provide an alternative to improve the accuracy of subsequent search in a structured dataset (SMD), it becomes alternatively possible to further convert the SMD containing at least the main linguistic objects ( OLLO) linguistic sentences and their identification data. In this case, it will be obvious to a person skilled in the art that the principles and methods described below upon completing the previously described step 301 of the method 300 can be carried out simultaneously (in parallel) with the previously described steps 301-305 of the method 300, and not simultaneously (alternatively or sequentially). , including regardless of the order), and also that the individual principles and methods of the individual steps described below can be implemented in a similar way.

[165] На фиг. 38, в качестве примера, но не ограничения, изображена общая схема выполнения этапов заявленного способа 400 преобразования СМД, содержащего, по меньшей мере, основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО, являющегося исходной структурой данных для рассматриваемого способа 400. Заявленный способ 400 преобразования СМД, содержащего, по меньшей мере, ОЛЛО лингвистического предложения и их идентификационные данные, характеризуется: выполнением этапа 301 идентификации пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором идентифицируют структуру данных СМД, содержащую элементы упомянутой пригодной для преобразования структуры данных, содержащей ОЛЛО, являющейся исходной структурой данных СМД в рамках рассматриваемого способа 400, причем упомянутые элементы пригодной для преобразования структуры данных представляют собой основные лингво-логические объекты (ОЛЛО) лингвистического предложения и идентификационные данные ОЛЛО; выполнением этапа 402 формирования двенадцатой структуры данных СМД, на котором формируют двенадцатую структуру данных СМД, являющуюся первой структурой данных СМД для рассматриваемого способа 400, содержащую элементы упомянутой двенадцатой структуры данных СМД, причем упомянутые элементы двенадцатой структуры данных СМД представляют собой основные лингво-логические элементы (ОЛЛЭ) лингвистического предложения сформированные путем разделения ОЛЛО на семантические части ОЛЛО, а также представляют собой идентификационные данные ОЛЛЭ, представляющие собой для каждого ОЛЛЭ, в качестве примера, но не ограничения: значение ОЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих ОЛЛЭ; выполнением этапа 403 формирования тринадцатой структуры данных СМД, на котором формируют тринадцатую структуру данных СМД, являющуюся итоговой структурой данных СМД для рассматриваемого способа 400, содержащую элементы упомянутой тринадцатой структуры данных СМД, причем упомянутые элементы тринадцатой структуры данных СМД представляют собой исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения, сформированные путем разделения ОЛЛЭ на семантические части ОЛЛЭ и формирования из них исходных элементов, а также представляют собой идентификационные данные ИЛЛЭ, представляющие собой для каждого ИЛЛЭ, в качестве примера, но не ограничения: значение ИЛЛЭ и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющего (составляющих) ИЛЛЭ.[165] FIG. 38, by way of example, but not limitation, depicts a general scheme for performing the steps of the claimed method 400 for converting an SMD containing at least the main linguistic-logical objects (OLLO) of the linguistic sentence and the identification data of the OLLO, which is the initial data structure for the method 400 in question The claimed method 400 for converting an SMD containing at least an OLLO linguistic sentence and its identification data is characterized by: performing an identification step 301 suitable for converting data structure that contains an OLLO, which identifies an MDD data structure that contains elements of the aforementioned convertible data structure that contains an ALLO, which is the original data structure of the MDD within the framework of this method 400, and these elements are suitable for transforming the data structure logical objects (OLLO) linguistic sentences and identification data OLLO; the step 402 of forming the twelfth data structure of the MDD, which forms the twelfth data structure of the MDD, which is the first data structure of the MDD data for the method 400, containing the elements of the said twelfth data structure of the MDD, OLE) linguistic sentences formed by dividing OLLO into semantic parts of OLLO, and also represent the identification data of OLLE, representing for each OLLE, as an example, but not limiting: the OLLE value and the ordinal (ordinal) number (s) of the TE language of the linguistic sentence constituting the OLLE; the step 403 of forming the thirteenth data structure of the MDD, which forms the thirteenth data structure of the MDD, which is the final data structure of the MDD data for the method 400, containing the elements of the thirteenth data structure of the MDD, and these elements of the thirteenth data structure of the MDD are the original linguistic elements ( ILE) of the linguistic sentence, formed by dividing the OLE into the semantic parts of the OLE and forming the original elements from them, as well as vlyayut a ILLE identification data representing each ILLE, as an example, but not limited to: ILLE value and serial (serial) number (s) TE linguistic supply components (components) ILLE.

[166] Как было указано ранее со ссылкой на фиг. 26, в качестве примера, но не ограничения, изображена общая схема выполнения этапа 301 идентификации структуры данных СМД, на котором идентифицируют структуру данных СМД, являющуюся исходной структурой данных для рассматриваемого способа 400, элементы 91 которого представляют собой ОЛЛО лингвистического предложения 11, а также идентификационные данные элементов 91, представляющие собой для каждого элемента 91, в качестве примера, но не ограничения, значение 911 элемента 91 и порядковый (порядковые) номер (номера) 912 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 91. Описанный таким образом со ссылкой на фиг. 26 процесс далее подробно не описывается. По результатам выполнения этапа 301 идентифицируют структуру данных, показанную на фиг. 27, состав которой, описанный со ссылкой на фиг. 27, соответственно далее подробно не описывается.[166] As previously indicated with reference to FIG. 26, by way of example, but not limitation, shows the general scheme for performing step 301 of identifying an SMD data structure, which identifies the data structure of an SMD, which is the initial data structure for the method 400 in question, whose elements 91 represent the OLLO linguistic sentence 11, as well as the identification data of elements 91, representing for each element 91, as an example, but not limitation, the value of 911 element 91 and the ordinal number of the linguistic sentence 11 constituting (constituting) the element 91. Described in this way with reference to FIG. 26 The process is not described further in detail. Based on the results of step 301, the data structure shown in FIG. 27, the composition of which is described with reference to FIG. 27, respectively, is not described further below.

[167] На фиг. 39, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 402 формирования двенадцатой структуры данных СМД, являющейся первой структурой данных для рассматриваемого способа 400. Этап 402 характеризуется: выполнением этапа 4021 формирования значений 2181 седьмой части лингвистических характеристик 218 элементов 21, составляющих элементы 91 пригодной для преобразования структуры данных, содержащей ОЛЛО на котором формирует значения 2181 седьмой части лингвистических характеристик 218 элементов 21, составляющих элементы 91 и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 3041, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021; выполнением этапа 4022 формирования семантических частей элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, на котором формируют первую и последующие (вторую, третью и так далее по порядку) семантические части ОЛЛО, проясняющие смысловую структуру ОЛЛО; выполнением этапа 4023 формирования двенадцатой структуры данных СМД, на котором идентифицируют элементы 17 двенадцатой структуры данных СМД, а также идентификационные данные элементов 17, представляющие собой для каждого элемента 17, в качестве примера, но не ограничения, значение 171 элемента 17 двенадцатой структуры данных СМД и порядковый (порядковые) номер (номера) 172 ТЭ лингвистического предложения 11, составляющего (составляющих) элемент 17, и формируют двенадцатую структуру данных СМД.[167] FIG. 39, by way of example, but not limitation, shows the general scheme for performing the steps of step 402 of forming the twelfth SMD data structure, which is the first data structure for the method 400 in question. Step 402 is characterized by: performing step 4021 of generating values 2181 of the seventh part of linguistic characteristics 218 of elements 21, constituent elements 91 of a data structure suitable for transformation, containing an OLLO on which forms the values 2181 of the seventh part of the linguistic characteristics 218 elements 21 constituting the elements 91 and contribute the information to the BDLP of textual elements 21 of the linguistic sentence 11, which is formed in the framework of step 3041, forming as a result the BDLP of the text elements 21 of the linguistic sentence 11, which is being formed in the framework of step 4021; performing step 4022 of forming the semantic parts of the elements 91 of a data structure suitable for converting the OLLO, on which the first and subsequent (second, third, and so forth in order) semantic parts of the OLLO are formulated, clarifying the OLLO semantic structure; performing step 4023 of forming the twelfth data structure of the DMD, which identifies the elements 17 of the twelfth data structure of the DMD, as well as the identification data of the elements 17, representing for each element 17, as an example, but not limitation, the value 171 of the element 17 of the twelfth data structure of the MDD and ordinal (s) number (s) 172 TE linguistic sentences 11, constituting (making) element 17, and form the twelfth data structure of the SMD.

[168] На фиг. 40, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 4021 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, формируемой в рамках этапа 4021. БДЛП, формируемая в рамках этапа 4021, отличается от БДЛП, формируемой в рамках этапа 3021, наличием значений 2181 седьмой части лингвистических характеристик 218, указывающих главное слово семантической части элемента 91 (ОЛЛО). Причина выявления главного слова семантической части ОЛЛО состоит в том, что, используя выявленное главное слово семантической части ОЛЛО и идентифицированные ранее синтаксические связи между словами (ЛЛЕ) в ОЛЛО, можно разделить ОЛЛО на отдельные семантические части. Семантические части ОЛЛО проясняют смысловую структуру ОЛЛО, в которой отдельные части выполняют свои ограниченные смысловые роли в ОЛЛО. Семантические части в ОЛЛО позволяют выделить в ОЛЛО интегрированные в нем доминирующую и уточняющие сущности окружающего мира (объекты и действия) для корректной идентификации их смысловых ролей и, как следствие, смысла ОЛЛО. Выделение отдельных семантических частей в ОЛЛО позволяет установить их уникальные логические роли в ОЛЛО, что позволяет хранить эти части раздельно без потери их смысловой логической роли в предложении. Такое раздельное хранение позволяет осуществлять быстрый и точный поиск семантических частей ОЛЛО, а также отдельно от других частей лингвистического предложения производить разного рода их анализ и обработку.[168] FIG. 40, by way of example, but not limitation, depicts the general structure of the linguistic characteristics database (BDLP) formed within step 4021, which is the BDLP text elements 21 of sentence 11 contained in the elements 91 suitable for transforming a data structure containing an OLLO formed within stage 4021. BDLP, formed under stage 4021, differs from BDLP, formed under stage 3021, the presence of values 2181 of the seventh part of the linguistic characteristics 218, indicating the main word of the semantic part of the element 91 (OLLO). The reason for identifying the main word of the semantic part of OLLO is that, using the identified main word of the semantic part of OLLO and the previously identified syntactic links between words (LLE) in OLLO, OLLO can be divided into separate semantic parts. The semantic parts of OLLO clarify the semantic structure of OLLO, in which the individual parts perform their limited semantic roles in OLLO. The semantic parts in OLLO allow identifying in OLLO the dominant and clarifying entities of the surrounding world (objects and actions) integrated in it for the correct identification of their semantic roles and, as a result, the meaning of OLLO. Selection of separate semantic parts in OLLO allows you to establish their unique logical role in OLLO, which allows you to store these parts separately without losing their semantic logical role in the sentence. Such separate storage allows for a quick and accurate search for the semantic parts of OLLO, as well as, separately from other parts of the linguistic sentence, to produce various kinds of analysis and processing.

[169] Формирование седьмой части лингвистических характеристик 218 и их значений 2181 в ходе этапа 4021 производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов 21, входящих в элементы 91. В ходе такого анализа у всех текстовых элементов 21, составляющих элемент 91 проверяют наличие признака главного слова семантической части элемента 91. Признаком главного слова семантической части элемента 91 может быть, в качестве примера, но не ограничения, наличие у текстового элемента (ТЭ) следующих значений лингвистических характеристик: ТЭ является главным словом ОЛЛО или ТЭ имеет зависимый ТЭ в форме предлога. Предварительно могут быть заданы иные собственные критерии идентификации синтаксической части ОЛЛО. Например, не ограничиваясь, может быть уточнен перечень частей речи, которые указывают на главное слово синтаксической части ОЛЛО. При наличии у ТЭ указанных значений лингвистических характеристик формируют соответствующие значения 2181 седьмой части лингвистических характеристик 218 - «главное слово семантической части ОЛЛО».[169] The formation of the seventh part of the linguistic characteristics 218 and their values 2181 during step 4021 is carried out on the basis of a comprehensive analysis of the values of the linguistic characteristics of the text elements 21 included in the elements 91. During this analysis, all the text elements 21 that make up the element 91 are checked for the main word of the semantic part of the element 91. A sign of the main word of the semantic part of the element 91 may be, as an example, but not limitation, the presence of the following lingual values in the text element (TE) historical characteristics: TE is the main word OLLO or TE has dependent TE in the form of a preposition. Other own criteria for identifying the syntactic part of OLLO can be pre-set. For example, without being limited to, the list of parts of speech that indicate the main word of the syntactic part of OLLO can be specified. If TE has the indicated values of linguistic characteristics, the corresponding values 2181 of the seventh part of the linguistic characteristics 218 form - “the main word of the semantic part of OLLO”.

[170] Сформированные по итогам этапа 4021 значения 2181 (главное слово семантической части элемента 91) седьмой части лингвистических характеристик 218 элементов 21, составляющих ОЛЛО 91 пригодной для преобразования структуры данных, содержащей ОЛЛО вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 2031, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021. При этом все части (211, 214, 232, 215, 216 и 218) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2321, 2151, 2161 и 2181) формируют уникальные лингвистические признаки элементов 91 для альтернативного способа повышения точности поиска в структурированном массиве данных.[170] Formed at the end of step 4021, the values 2181 (the main word of the semantic part of element 91) of the seventh part of the linguistic characteristics of 218 elements 21 constituting OLLO 91 suitable for transforming the data structure containing OLLO are inserted into BDLP of textual elements 21 of linguistic sentence 11, formed within step 2031, forming as a result BDLP text elements 21 of the linguistic sentence 11, formed in the framework of step 4021. All parts (211, 214, 232, 215, 216 and 218) of the linguistic characteristics of the text elements 21 of the lingua The classical sentences 11 and their meanings (2111, 2141, 2321, 2151, 2161, and 2181) form the unique linguistic attributes of the elements 91 for an alternative way to improve the accuracy of searching in a structured dataset.

[171] На фиг. 41, в качестве примера, но не ограничения, изображена общая структура сформированной двенадцатой структуры данных СМД являющаяся первой для настоящего способа преобразования 400. Двенадцатая структура данных СМД представляет собой СМД, содержащий элементы 17 двенадцатой структуры данных СМД, которые представляют собой основные лингво-логические элементы (ОЛЛЭ) лингвистического предложения 11 и идентификационные данные ОЛЛЭ, представляющие собой, в качестве примера, но не ограничения, значения 171 элементов 17 двенадцатой структуры данных и порядковые номера 172 текстовых элементов, составляющих ОЛЛЭ. У ОЛЛЭ 12 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 12, в качестве примера, но не ограничения, могут именоваться как «ОЛЛЭ n.m», где n ≥ 1 указывает на порядковый номер ОЛЛО в лингвистическом предложении, а m ≥ 1) указывает на синтаксический уровень ОЛЛЭ в ОЛЛО, начиная с первого. ОЛЛЭ предложения 11 – это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения, ОЛЛЭ - это синтаксическая единица вида «синтаксическая конструкция», сформированная из ОЛЛО 91 путем выделения в ОЛЛО 91 отдельных синтаксических частей по признаку наличия главных слов синтаксических частей в ОЛЛО 91. Упомянутые главные слова синтаксической части ОЛЛО 91 представляют собой такие части речи как существительное, местоимение или глагол (в любой грамматической форме), которые либо являются синтаксически главным словом ОЛЛО 91, либо содержат прямого синтаксического потомка (слово, с которым имеется прямая синтаксическая подчинительная связь) с синтаксической ролью «предлог». Предварительно могут быть заданы иные критерии идентификации синтаксической части ОЛЛО 91. Например, не ограничиваясь, возможно задать критерии в виде конкретного перечня предлогов, наличие которых указывают на главное слово синтаксической части ОЛЛО 91. С точки зрения синтаксиса ОЛЛЭ 17 – это слова и особые словосочетания внутри ОЛЛО 91. В зависимости от сложности лингвистической структуры ОЛЛО 91 в нем можно выделить один или несколько ОЛЛЭ 17. С логической точки зрения, ОЛЛЭ 17 – это логическая сущность, являющаяся логически отделимой частью элемента простого суждения. При этом такие логически отделимые части по своей структуре и логической роли ничем не отличаются от ОЛЛО 91 по той причине, что, так же, как и ОЛЛО 91, они представляют мыслимый (семантический) образ некого предмета или действия окружающего мира). Причина существования семантических частей образа ОЛЛО 91 в том, что не всякий образ ОЛЛО 91 можно лингвистически реализовать, используя лишь один составной элемент (группу слов без предлога между словами). Например, не ограничиваясь, мыслимый образ ОЛЛО 91 о праве на что-либо (например, не ограничиваясь, «право потребителя на возврат товара») невозможно реализовать одним составным элементом (одной группой слов без предлога между словами)). В упомянутом примере лишь два составных элемента - первый - «право потребителя», и второй - «возврат товара», - формируют мыслимый образ элемента простого суждения. Составной элемент ОЛЛО 91 (семантическая часть ОЛЛО) именуется термином ОЛЛО 91. С семантической точки зрения термины ОЛЛО 91, формирующие ОЛЛО 91 неодинаковы, то есть имеют различные семантические роли. Синтаксически главные термины ОЛЛО 91 имеют максимальную семантическую роль, то есть являются терминами ОЛЛО 91 первой семантической части. Термин ОЛЛО 91 первой семантической части определяет смысловой вектор ОЛЛО 91. Например, не ограничиваясь, в примере «право потребителя на возврат товара» смысловую суть образа ОЛЛО 91 формирует именно составной элемент «право потребителя», а не составной элемент «возврат товара». Термины ОЛЛО второй и последующих семантических частей, являются синтаксически зависимыми терминами ОЛЛО 91, и их присутствие в ОЛЛО 91 необходимо только для уточнения мыслимого образа ОЛЛО 91. Чем сложнее мыслимый образ ОЛЛО 91, тем большего количества терминов ОЛЛО 91 может потребовать уточнение его мыслимого образа. Структурирование терминов ОЛЛО 91 как семантических частей ОЛЛО позволяет правильно воспринимать семантические роли отдельных терминов в ОЛЛО 91. Разделение таким образом ОЛЛО 91 позволяет производить интеллектуальный поиск информации с повышенной точностью, так как при наличии более структурированного (по логической роли слов) массива данных возможно более точное описание искомых объектов. В результате машинной обработки такого массива данных повышается точность поиска и сокращается время поиска, [171] FIG. 41, by way of example, but not limitation, shows the general structure of the formed twelfth SMD data structure, which is the first for the present conversion method 400. The twelfth SMD data structure is the SMD containing elements 17 of the twelfth SMD data structure, which are the main linguistic-logical elements (OLE) of the linguistic sentence 11 and the OLE identification data, representing, by way of example, but not limitation, the values of 171 elements 17 of the twelfth data structure and oryadkovye number 172 text elements constituting OLLE. OLE 12 linguistic sentences 11 are absent characterizing their unique names (UN), which have practical use. In the data structure, elements 12, by way of example, but not limitation, may be referred to as “OLL nm”, where n ≥ 1 indicates the OLLO sequence number in the linguistic sentence, and m ≥ 1) indicates the OLLO syntactic level, starting with first. OLL sentences 11 - is the borderline between linguistics and logic. From a linguistic point of view, OLLE is a syntactic unit of the “syntactic construction” type, formed from OLLO 91 by separating 91 syntactic parts into OLLO based on the presence of the main words of the syntactic parts in OLLO 91. The above main words of the syntactic part of OLLO 91 are such parts speeches as a noun, pronoun or verb (in any grammatical form), which are either syntactically the main word OLLO 91, or contain a direct syntactic descendant (a word with which direct syntactic subordinate connection) with the syntax role “preposition”. Other criteria for identifying the syntactic part of OLLO 91 can be pre-set. For example, without limitation, it is possible to set criteria in the form of a specific list of prepositions whose presence indicate the main word of the syntactic part of OLLO 91. From the point of view of the syntax, OLLE 17 is words and special phrases inside OLLO 91. Depending on the complexity of the linguistic structure of OLLO 91, it is possible to single out one or several OLLE 17. In its logical point of view, OLLE 17 is a logical entity that is a logically separable part element of simple judgment. Moreover, such logically separable parts do not differ in any way from OLLO 91 due to the fact that, like OLLO 91, they represent a conceivable (semantic) image of a certain object or action of the surrounding world). The reason for the existence of semantic parts of the image of OLLO 91 is that not every image of OLLO 91 can be linguistically realized using only one component element (a group of words without a preposition between words). For example, without being limited to, the conceivable image of OLLO 91 on the right to something (for example, not limited to, “the consumer’s right to return goods”) cannot be realized by one component element (one group of words without a preposition between words)). In the example mentioned, only two constituent elements — the first — the “consumer right” and the second — the “return of goods” —constitute a conceivable image of the element of simple judgment. The constituent element of OLLO 91 (the semantic part of OLLO) is called the term OLLO 91. From a semantic point of view, the terms OLLO 91 that form OLLO 91 are not the same, that is, they have different semantic roles. Syntactically, the main terms OLLO 91 have the maximum semantic role, that is, they are the terms OLLO 91 of the first semantic part. The term OLLO 91 of the first semantic part defines the semantic vector OLLO 91. For example, not limited to, in the example “consumer's right to return goods”, the semantic essence of the image of OLLO 91 is formed by the constituent element “consumer right”, and not the constituent element “return of goods”. The terms OLLO of the second and subsequent semantic parts are syntactically dependent terms of OLLO 91, and their presence in OLLO 91 is necessary only to refine the conceivable image of OLLO 91. The more complex the conceivable image of OLLO 91, the more terms of the OLLO 91 may require clarification of its conceivable image. Structuring the terms of OLLO 91 as semantic parts of OLLO allows you to correctly perceive the semantic roles of individual terms in OLLO 91. Separating in this way OLLO 91 allows you to perform an intelligent search for information with increased accuracy, since if you have a more structured (by the logical role of words) data array, it is possible to more accurately description of the desired objects. As a result of the machining of such a data array, the accuracy of the search is increased and the search time is reduced

[172] Формирование частей (семантических частей) элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО, на этапе 4022 производят путем выполнения следующих действий: на первом этапе от идентифицированного главного слова семантической части ОЛЛО 91 идентифицируют все синтаксически подчиненные слова, вплоть до слова, которое само является главным словом семантической части ОЛЛО 91, но не включая данное слово; на втором этапе главное слово семантической части ОЛЛО 91 и все упомянутые синтаксически подчиненные слова, в том числе последовательно подчиненные, формируют семантическую часть ОЛЛО 91. Порядковый номер семантической части в ОЛЛО, указывает на ее семантическую роль в ОЛЛО и формируется в соответствии с порядковым номером текстового элемента (ТЭ) главного слова семантической части ОЛЛО 91. Семантическая часть ОЛЛО 91 с наименьшим порядковым номером ТЭ главного слова является первой семантической частью ОЛЛО 91. Семантическая часть ОЛЛО 91, имеющая ближайший к нему номер ТЭ главного слова семантической части является второй семантической частью ОЛЛО 91, и так далее. Порядковый номер ОЛЛЭ указывается в наименовании ОЛЛЭ, например, но не ограничиваясь - «ОЛЛЭ 1.2». Такое наименование элемента 17 говорит о том, что он является второй семантической частью в первом ОЛЛО (по синтаксическому уровню «.2»). Идентификацию элементов 17 двенадцатой структуры данных СМД в ходе этапа 4023 производят на основе этапа 4022 формирования семантических частей элементов 91 пригодной для преобразования структуры данных, содержащей ОЛЛО. Все сформированные семантические части элементов 91 отождествляют с элементами 17 двенадцатой структуры данных СМД.[172] The formation of parts (semantic parts) of elements 91 of a data structure that can be converted to an OLLO is processed at step 4022 by performing the following actions: at the first stage, from the identified main word of the semantic part of OLLO 91, all syntactically subordinate words are identified, up to the word, which is itself the main word of the semantic part of OLLO 91, but not including this word; at the second stage, the main word of the semantic part of OLLO 91 and all the mentioned syntactically subordinate words, including consecutively subordinate, form the semantic part of OLLO 91. The sequence number of the semantic part in OLLO indicates its semantic role in OLLO and is formed in accordance with the sequence number of the text element (TE) of the main word of the semantic part of OLLO 91. The semantic part of OLLO 91 with the lowest sequence number TE of the main word is the first semantic part of OLLO 91. The semantic part of OLLO 91, and The nearest TE TE number of the main word of the semantic part is the second semantic part of OLLO 91, and so on. The serial number of the OLE is indicated in the name of the OLE, for example, but not limited to - “OLE 1.2”. Such a name of element 17 indicates that it is the second semantic part in the first OLLO (according to the syntactic level “.2”). The identification of the elements 17 of the twelfth data structure of the MDD during step 4023 is made on the basis of the step 4022 of forming the semantic parts of the elements 91 suitable for transforming the data structure containing the OLLO. All formed semantic parts of elements 91 identify with elements 17 of the twelfth data structure of the MDD.

[173] Идентификацию значения и порядковых номеров ТЭ элемента 17 двенадцатой структуры данных СМД, производят в рамках этапа 4023 путем отождествления значения 171 элемента 17 со значениями 911 идентифицированной семантической части элемента 91, а порядковых номеров 172 текстовых элементов 21, составляющих элемент 17 путем отождествления с порядковыми номерами 912 текстовых элементов, составляющих идентифицированную семантическую часть элемента 91.[173] The meaning and sequence numbers of the TE element 17 of the twelfth SMD data structure are identified in step 4023 by identifying the value 171 elements 17 with the 911 values of the identified semantic part of element 91, and the sequence numbers 172 of text elements 21 that make up element 17 by identifying with sequence numbers 912 text elements constituting the identified semantic part of the element 91.

[174] Формирование двенадцатой структуры данных СМД в ходе этапа 4023 производят путем объединения в одной структуре данных элементов 17 двенадцатой структуры данных СМД и их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются.[174] The formation of the twelfth SMD data structure during step 4023 is performed by combining in one data structure elements 17 of the twelfth SMD data structure and their identification data according to principles and methods known from the prior art, which, respectively, are not described in further detail below.

[175] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 17 (ОЛЛЭ) двенадцатой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 4021, состоящего из идентификационных данных ТЭ, составляющих элемент 17 (ОЛЛЭ), и получении значений (2131, 2141, 2231; 2151, 2161, 2181) всех частей лингвистических характеристик (213, 214, 223, 215, 216,218) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 17 (ОЛЛЭ). При этом, как было описано ранее, лингвистическими признаками элементов 17 (ОЛЛЭ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 17 (ОЛЛЭ).[175] Identification of linguistic characteristics of TE, constituting elements 17 (ALEE) of the twelfth data structure of the DMD and their values, if necessary, is produced by organizing a query in the BDLP, formed under step 4021, consisting of the identification data of TE, constituting element 17 (OLE), and obtaining the values (2131, 2141, 2231; 2151, 2161, 2181) of all parts of the linguistic characteristics (213, 214, 223, 215, 216.218) of the text elements 21 of the linguistic sentence 11, of which the element 17 consists (OLLE). At the same time, as described earlier, the linguistic features of the elements 17 (OLE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 17 consist (OLLE).

[176] На фиг. 42, в качестве примера, но не ограничения, изображена общая схема выполнения этапов этапа 403 формирования тринадцатой структуры данных СМД, являющейся второй структурой данных для рассматриваемого способа 400. Этап 403 характеризуется: выполнением этапа 4031 формирования значений 2191 восьмой части лингвистических характеристик 219 элементов 21, составляющих элементы 17 двенадцатой структуры данных СМД, на котором формируют значения 2191 восьмой части лингвистических характеристик 219 элементов 21, составляющих элементы 91, и вносят полученные сведения в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4031; выполнением этапа 4032 формирования семантических частей элементов 17 двенадцатой структуры данных СМД, на котором формируют первую и последующие (вторую, третью и так далее по порядку) семантические части ОЛЛЭ, проясняющие смысловую структуру ОЛЛЭ; выполнением этапа 4033 формирования элементов 18 тринадцатой структуры данных СМД, на котором формируют элементы 18 тринадцатой структуры данных СМД и идентификационные данные элементов 18, представляющие собой, в качестве примера, но не ограничения, значения 181 элементов 18 тринадцатой структуры данных СМД, порядковые номера 182 ТЭ лингвистического предложения 11, составляющих элементы 18, а также идентифицируют первые и вторые виды элементов 18 тринадцатой структуры данных СМД и формируют тринадцатую структуру данных СМД.[176] FIG. 42, by way of example, but not limitation, shows a general scheme for performing the steps of step 403 of forming the thirteenth data structure of the SMD data, which is the second data structure for the method 400 in question. Step 403 is characterized by: performing step 4031 of forming 2191 values of the eighth part of linguistic characteristics 219 of elements 21, constituting elements 17 of the twelfth data structure of the MDD, on which the values 2191 of the eighth part of the linguistic characteristics 219 of the elements 21 constituting the elements 91 are formed and contribute the resulting information I BDLP text elements 21 linguistic Proposition 11, formed in 4021 under the stage, forming eventually BDLP text elements 21 linguistic Proposition 11, formed in 4031 under the stage; step 4032 of forming the semantic parts of the elements 17 of the twelfth data structure of the MD, which forms the first and next (second, third, and so on in order) semantic parts of OLE, clarifying the semantic structure of OLLE; performing step 4033 of forming the elements 18 of the thirteenth data structure of the DMD, which forms the elements 18 of the thirteenth data structure of the MDD and the identification data of the elements 18, representing, by way of example but not limitation, the values 181 of the elements 18 of the thirteenth data structure of the DMD, serial numbers 182 TE linguistic sentences 11, constituting elements 18, and also identify the first and second types of elements 18 of the thirteenth data structure of the SMD and form the thirteenth data structure of the SMD.

[177] На фиг. 43, в качестве примера, но не ограничения, изображена общая структура формируемой в рамках этапа 4031 базы данных лингвистических признаков (БДЛП), являющейся БДЛП текстовых элементов 21 предложения 11, содержащихся в элементах 17 двенадцатой структуры данных СМД. БДЛП, формируемая в рамках этапа 4031, отличается от БДЛП, формируемой в рамках этапа 4021, наличием значений 2191 восьмой части лингвистических характеристик 219, указывающих главное слово семантической части элемента 17 (ОЛЛЭ). Причина выявления главного слова семантической части ОЛЛЭ состоит в том, что, используя выявленное главное слово семантической части ОЛЛЭ и идентифицированные ранее синтаксические связи между словами (ЛЛЕ) в ОЛЛЭ можно разделить ОЛЛЭ на отдельные семантические части. Семантические части ОЛЛЭ проясняют смысловую структуру ОЛЛЭ, в которой отдельные части выполняют свои ограниченные смысловые роли в ОЛЛЭ. Семантические части в ОЛЛЭ позволяют выделить в ОЛЛЭ интегрированные в нем доминирующую и уточняющие сущности окружающего мира (объекты и действия) для корректной идентификации их смысловых ролей и в итоге смысла ОЛЛЭ. Выделение отдельных семантических частей в ОЛЛЭ позволяет установить их уникальные логические роли в ОЛЛЭ, что позволяет хранить эти части раздельно без потери их смысловой логической роли в предложении. Такое раздельное хранение позволяет осуществлять быстрый и точный поиск семантических частей ОЛЛЭ, а также отдельно от других частей лингвистического предложения производить разного рода их анализ и обработку.[177] FIG. 43, by way of example, but not limitation, shows the general structure of the linguistic characteristics database (BDLP) formed during step 4031, which is the BDLP text elements 21 of sentence 11 contained in elements 17 of the twelfth data structure of the MDD. BDLP, formed under stage 4031, differs from BDLP, formed under stage 4021, by the presence of 2191 eighth parts of linguistic characteristics 219, indicating the main word of the semantic part of the element 17 (ALLE). The reason for identifying the main word of the semantic part of OLE is that, using the identified main word of the semantic part of OLE, and the previously identified syntactic links between words (LLE) in OLLE, OLLE can be divided into separate semantic parts. The semantic parts of the OLEE clarify the semantic structure of the OLEE, in which the individual parts fulfill their limited semantic roles in the OLEE. The semantic parts in the OLEE make it possible to isolate in the OLEE the dominant and specifying entities of the surrounding world (objects and actions) integrated into it for the correct identification of their semantic roles and, as a result, the OLEE meaning. Selection of separate semantic parts in OLEE allows you to establish their unique logical role in OLEE, which allows you to store these parts separately without losing their meaningful logical role in the sentence. Such separate storage allows for a quick and accurate search for semantic parts of the ALE, as well as separate analysis and processing of them from other parts of the linguistic sentence.

[178] Формирование восьмой части лингвистических характеристик 219 и их значений 2191 в ходе этапа 4031 производят на основании комплексного анализа значений лингвистических характеристик текстовых элементов 21, входящих в элементы 17. В ходе такого анализа у всех текстовых элементов 21, составляющих элемент 17 проверяют наличие признака главного слова семантической части элемента 17. Признаком главного слова семантической части элемента 17 может быть, в качестве примера, но не ограничения, наличие у текстового элемента (ТЭ) следующих значений лингвистических характеристик: ТЭ является главным словом ОЛЛЭ или ТЭ имеет форму существительного, местоимения или глагола (в любой грамматической форме). Предварительно могут быть заданы иные собственные критерии идентификации синтаксической части ОЛЛЭ. Например, не ограничиваясь, может быть уточнен перечень частей речи, которые указывают на главное слово синтаксической части ОЛЛЭ. При наличии у ТЭ указанных значений лингвистических характеристик формируют соответствующие значения 2191 восьмой части лингвистических характеристик 219 - «главное слово семантической части ОЛЛЭ».[178] The formation of the eighth part of the linguistic characteristics 219 and their values 2191 during step 4031 is carried out on the basis of a comprehensive analysis of the values of the linguistic characteristics of the text elements 21 included in the elements 17. During this analysis, all the text elements 21 that make up the element 17 check for the presence the main word of the semantic part of the element 17. The sign of the main word of the semantic part of the element 17 may be, as an example, but not limitation, the presence of the following text values (TE) of the lingual historical characteristics: TE is the main word OLEE or TE has the form of a noun, pronoun or verb (in any grammatical form). Other own criteria for identifying the syntactic part of the ALE can be pre-set. For example, without limitation, the list of parts of speech that indicate the main word of the syntactic part of the ALE may be specified. If the TE has the indicated values of linguistic characteristics, the corresponding values 2191 of the eighth part of the linguistic characteristics 219 form - “the main word of the semantic part of ALLE”.

[179] Сформированные по итогам этапа 4031 значения 2191 (главное слово семантической части элемента 17) восьмой части лингвистических характеристик 219 элементов 21, составляющих ОЛЛЭ 17 двенадцатой структуры данных СМД вносят в БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4021, формируя в итоге БДЛП текстовых элементов 21 лингвистического предложения 11, формируемую в рамках этапа 4031. При этом все части (211, 214, 232, 215, 216, 218, 219) лингвистических характеристик текстовых элементов 21 лингвистического предложения 11 и их значения (2111, 2141, 2321, 2151, 2161, 2181, 2191) формируют уникальные лингвистические признаки элементов 17 для альтернативного способа повышения точности поиска в структурированном массиве данных.[179] Formed according to the results of step 4031, the values 2191 (the main word of the semantic part of element 17), the eighth part of the linguistic characteristics 219 elements 21 constituting the OLE 17 of the twelfth data structure of the MDD are inserted into BDLP of the text elements 21 of the linguistic sentence 11, formed in the framework of step 4021, forming as a result, the BDLP of textual elements 21 of the linguistic sentence 11, formed in the framework of step 4031. All parts (211, 214, 232, 215, 216, 218, 219) of the linguistic characteristics of the textual elements 21 of the linguistic sentence 11 and values (2111, 2141, 2321, 2151, 2161, 2181, 2191) form features unique linguistic elements 17 for an alternative method of increasing search accuracy in a structured dataset.

[180] На фиг. 44, в качестве примера, но не ограничения, изображена общая структура сформированной тринадцатой структуры данных СМД, являющейся второй структурой данных СМД для настоящего способа преобразования 400. Тринадцатая структура данных СМД представляет собой СМД, содержащий элементы 18 первого и второго вида тринадцатой структуры данных СМД, которые представляют собой исходные лингво-логические элементы (ИЛЛЭ) лингвистического предложения 11 и идентификационные данные ИЛЛЭ, представляющие собой для каждого ИЛЛЭ, в качестве примера, но не ограничения: значение 181 элемента 18 шестой структуры данных СМД, порядковый (порядковые) номер (номера) 182 ТЭ лингвистического предложения 11, составляющих элементы 18. У ИЛЛЭ 18 лингвистического предложения 11 отсутствуют характеризующие их уникальные наименования (УН), имеющие практическое использование. В структуре данных элементы 18, в качестве примера, но не ограничения, могут именоваться как «ИЛЛЭ n.m.k», где n ≥ 1 указывает на порядковый номер ОЛЛО в лингвистическом предложении, а m ≥ 1 указывает на синтаксический уровень ОЛЛЭ в ОЛЛО, начиная с первого, а k ≥ 1 указывает на синтаксический уровень ИЛЛЭ в ОЛЛЭ, начиная с первого. ИЛЛЭ 18 предложения 11 – это пограничная сущность между лингвистикой и логикой. С лингвистической точки зрения ИЛЛЭ 18 – это первичная синтаксическая единица, являющаяся словом. С логической точки зрения ИЛЛЭ 18 – это логическая сущность, являющаяся логически отделимой частью термина элемента простого суждения (термина ОЛЛО). При этом такие логически отделимые части по своей структуре и логической роли ничем не отличаются от ОЛЛЭ 17 по той причине, что так же, как и ОЛЛЭ 17, они представляют собой мыслимый (семантический) образ о некоем предмете или действии окружающего мира). Причина существования синтаксических частей ОЛЛЭ 17 в том, что не всякий мыслимый образ ОЛЛЭ 17 можно представить, используя лишь один «исходный элемент» (слово, выражающее объект или действие). Например, не ограничиваясь, мыслимый образ ОЛЛЭ 17 о правах кого-либо, например, не ограничиваясь, «права потребителя», невозможно реализовать одним исходным элементом. В упомянутом примере лишь два исходных элемента – первый - «права», и второй - «потребителя», - формируют мыслимый образ термина элемента простого суждения (термина ОЛЛО). Исходный элемент ОЛЛЭ 17 именуется понятием термина ОЛЛО (ПТ ОЛЛО) или элементов 18 (ИЛЛЭ). С семантической точки зрения ПТ ОЛЛО (ИЛЛЭ 18), формирующие термин ОЛЛО (ОЛЛЭ 17) неравнозначны, то есть имеют различные семантические роли. Синтаксически главные ПТ ОЛЛО имеют максимальную семантическую роль, то есть являются ПТ ОЛЛО первой семантической части. ПТ ОЛЛО первой семантической части определяют смысловой вектор термина ОЛЛО (ОЛЛЭ 17). Например, в упомянутом примере «права потребителя» суть образа термина ОЛЛО (ОЛЛЭ 17) - именно «права», а не «потребитель». ПТ ОЛЛО второй и последующих семантических частей (синтаксически зависимые ПТ ОЛЛО) в термине ОЛЛО (ОЛЛЭ 17) необходимы для уточнения смысла термина ОЛЛО (ОЛЛЭ 17). Чем сложнее мыслимый образ термина ОЛЛО (ОЛЛЭ 17), тем большего количества ПТ ОЛЛО (ИЛЛЭ 18) он может потребовать. Структурирование ПТ ОЛЛО (ИЛЛЭ 18) как семантических частей ОЛЛЭ 17 позволяет правильно воспринимать семантические роли отдельных ПТ ОЛЛО (ИЛЛЭ 18) в терминах ОЛЛО (ОЛЛЭ 17). Элемент 18 (ИЛЛЭ) формируют из ОЛЛЭ 17 путем выделения в ОЛЛЭ 17 отдельных синтаксических частей по признаку наличия главных слов синтаксических частей ОЛЛЭ 17 и последующего структурирования текстовых элементов синтаксической части. В зависимости от сложности лингвистической структуры ОЛЛЭ 17 в нем можно выделить одну или несколько синтаксических частей (ИЛЛЭ 18). Синтаксическая часть (ИЛЛЭ 18) ОЛЛЭ 17 может представлять собой только одно упомянутое главное слово или несколько синтаксически связанных слов (значимых частей речи), синтаксически главным из которых является упомянутое главное слово. Таким образом главное слово синтаксической части (ИЛЛЭ 18) ОЛЛЭ 17 отождествляется с элементом 18 первого вида, а все синтаксически зависимые от него слова (значимые части речи), если такие имеются, отождествляются с элементом 18 второго вида. С логической точки зрения исходные лингво-логические элементы (элементы 18) первого вида являются «понятиями» - то есть объектами или действиями окружающего мира, а элементы 18 второго вида – «признаками понятия», то есть некими семантическими характеристиками упомянутых объектов и действий. [180] FIG. 44, by way of example, but not limitation, depicts the general structure of the formed thirteenth data structure of the DMD, which is the second data structure of the MDD for this conversion method 400. The thirteenth data structure of the MDD is a DMD containing elements 18 of the first and second types of the thirteenth data structure of the MDD, which are the initial linguistic-logical elements (ILE) of the linguistic sentence 11 and the ILE identification data, which for each ILLE, as an example, but not limited cheniya: the value of 181 element 18 SMD sixth data structure, sequence (serial) number (s) 182 TE linguistic Proposition 11, the constituent elements 18. ILLE 18 Linguistic offers 11 no characterizing their unique names (UN), with practical use. In the data structure, elements 18, by way of example, but not limitation, may be referred to as “ELEE nmk”, where n ≥ 1 indicates the sequence number of OLLO in the linguistic sentence, and m ≥ 1 indicates the syntactic level of OLLO in OLLO, starting with the first , and k ≥ 1 indicates the syntactic level of the ELEE in the ALE, starting with the first one. ILLE 18 sentences 11 is the borderline between linguistics and logic. From a linguistic point of view, ILLE 18 is the primary syntactic unit, which is a word. From a logical point of view, ILLE 18 is a logical entity that is a logically separable part of the term of the element of simple judgment (the term OLLO). Moreover, such logically separable parts do not differ in any way from OLE 17 due to the fact that, like OLE 17, they represent a conceivable (semantic) image about some object or action of the surrounding world). The reason for the existence of syntactic parts of ALE 17 is that not every conceivable image of ALE 17 can be represented using only one “source element” (a word expressing an object or an action). For example, without being limited to, the conceivable image of OLE 17 on the rights of someone, for example, without being limited to “consumer rights”, cannot be realized by a single initial element. In the mentioned example, only two initial elements - the first - “rights”, and the second - “consumer” - form the conceivable image of the term of the element of simple judgment (the term OLLO). The original element OLLE 17 is referred to as the concept of the term OLLO (PT OLLO) or elements 18 (ILLE). From a semantic point of view, PT OLLO (ILE 18), forming the term OLLO (ALLE 17) are unequal, that is, they have different semantic roles. Syntactically, the main PT OLLOs have the maximum semantic role, that is, they are the PT OLLO of the first semantic part. PT OLLO of the first semantic part defines the semantic vector of the term OLLO (OLLE 17). For example, in the example mentioned, “consumer rights” are the essence of the image of the term OLLO (OLLE 17) - namely “rights”, and not “consumer”. PT OLLO of the second and subsequent semantic parts (syntactically dependent PT OLLO) in the term OLLO (OLLE 17) is needed to clarify the meaning of the term OLLO (OLLE 17). The more complex the conceivable image of the term OLLO (OLE 17), the more PT OLLO (ILLE 18) it may require. Structuring of PT OLLO (ILLE 18) as semantic parts of OLE 17 allows one to correctly perceive the semantic roles of individual PT OLLO (ILLE 18) in terms of OLLO (OLLE 17). Element 18 (ILE) is formed from OLE 17 by selecting in the OLE 17 separate syntactic parts based on the presence of the main words of the syntactic parts of OLE 17 and the subsequent structuring of the text elements of the syntactic part. Depending on the complexity of the linguistic structure of OLE 17, it is possible to single out one or several syntactic parts (ILLE 18). The syntactic part (ILLE 18) of the ALE 17 may consist of only one mentioned main word or several syntactically related words (meaningful parts of speech), syntactically the main one of which is the said main word. Thus, the main word of the syntactic part (ILE 18) of OLE 17 is identified with the element 18 of the first type, and all the words that are syntactically dependent on it (meaningful parts of speech), if any, are identified with the element 18 of the second type. From a logical point of view, the original lingvo-logical elements (elements 18) of the first kind are “concepts” - that is, objects or actions of the surrounding world, and elements 18 of the second type are “signs of the concept”, that is, certain semantic characteristics of the mentioned objects and actions.

[181] Формирование частей (семантических частей) элементов 17 двенадцатой структуры данных СМД, на этапе 4032 производят путем выполнения следующих действий: на первом этапе от идентифицированного главного слова элемента 17 (ОЛЛЭ) идентифицируют все синтаксически подчиненные слова, вплоть до слова, которое само является главным словом семантической части элемента 17 (ОЛЛЭ), но не включая данное слово; на втором этапе главное слово семантической части элемента 17 (ОЛЛЭ) и все упомянутые синтаксически подчиненные слова, в том числе последовательно подчиненные, формируют семантическую часть элемента 17 (ОЛЛЭ). Порядковый номер семантической части в ОЛЛЭ, указывает на ее семантическую роль в ОЛЛЭ, и его формируют в соответствии с номером текстового элемента (ТЭ) главного слова семантической части ОЛЛЭ 17. Семантическая часть ОЛЛЭ 17 с наименьшим номером ТЭ главного слова является первой семантической частью элемента 17 (ОЛЛЭ). Семантическая часть ОЛЛЭ 17, имеющая ближайший к нему номер ТЭ главного слова семантической части является второй семантической частью ОЛЛЭ 17, и так далее. Порядковый номер ИЛЛЭ указывает в наименовании ОЛЛЭ, например, но не ограничиваясь - «ИЛЛЭ 1.2.1». Такое наименование элемента 18 говорит о том, что он является первой семантической частью во втором ОЛЛЭ первого ОЛЛО. Формирование элементов 18 тринадцатой структуры данных СМД в ходе этапа 4033 производят на основе результатов этапа 4032 формирования семантических частей элементов 17 двенадцатой структуры данных СМД следующим образом: на первом этапе все значимые части речи в семантических частях элементов 17 отождествляют с элементами 18 тринадцатой структуры данных СМД; на втором этапе упомянутые идентифицированные главные слова семантических частей элементов 17 отождествляют с элементами 18 первого вида; на третьем этапе все остальные элементы 18 данной семантической части, кроме элемента 18 первого вида отождествляют с элементами 18 второго вида.[181] The formation of parts (semantic parts) of elements 17 of the twelfth SMD data structure, at step 4032, is performed by performing the following actions: at the first stage, from the identified main word of element 17 (OLLE), all syntactically subordinate words are identified, up to a word that is itself the main word of the semantic part of the element 17 (AULE), but not including this word; at the second stage, the main word of the semantic part of the element 17 (ALEE) and all the syntactically subordinate words mentioned, including successively subordinate words, form the semantic part of the element 17 (ALEE). The sequence number of the semantic part in the OLE, indicates its semantic role in the OLE, and it is formed in accordance with the text element number (TE) of the main word of the semantic part of the OLE 17. The semantic part of the OLL 17 with the smallest TE number of the main word is the first semantic part of the element 17 (OLE). The semantic part of OLE 17, which has the TE number of the main word of the semantic part closest to it, is the second semantic part of OLL 17, and so on. The serial number of ILLE is indicated in the name of OLEE, for example, but not limited to - “ILLE 1.2.1”. This name of element 18 suggests that it is the first semantic part in the second OLLE of the first OLLO. The formation of elements 18 of the thirteenth data structure of the MDD during step 4033 is based on the results of step 4032 of forming the semantic parts of elements 17 of the twelfth data structure of the MDD as follows: at the first stage, all significant parts of speech in the semantic parts of the elements 17 are identified with elements 18 of the thirteenth data structure of the MDD; at the second stage, the mentioned identified main words of the semantic parts of the elements 17 are identified with the elements 18 of the first type; in the third stage, all other elements 18 of this semantic part, except for the element 18 of the first type, are identified with elements 18 of the second type.

[182] Идентификация значения и порядкового (порядковых) номера (номеров) ТЭ элемента 18 двенадцатой структуры данных СМД, производится в рамках этапа 4033 путем отождествления значения 181 элемента 18 со значением (значениями) 211 текстового (текстовых) элемента (элементов) 21 лингвистического предложения 11, составляющего (составляющих) элемент 18, а порядковый (порядковые) номер (номера) 182 текстового (текстовых) элемента (элементов) 21, составляющего (составляющих) элемент 18 путем отождествления с порядковым (порядковыми) номером (номерами) 212 текстового (текстовых) элемента (элементов) 21, составляющего (составляющих) элемент 18. Идентификация видов элементов 18 двенадцатой структуры данных СМД в рамках этапа 4031 не изменяет значение 181 элемента 18 и не изменяет порядковый (порядковые) номер (номера) ТЭ 21 лингвистического предложения 11, составляющего (составляющих) элемент 18 (ИЛЛЭ).[182] The identification of the value and ordinal (ordinal) number (s) of the TE element 18 of the twelfth data structure of the DMD is performed within step 4033 by identifying the value 181 of element 18 with the value (values) 211 of the text (text) element (s) 21 of the linguistic sentence 11, constituting (constituting) element 18, and ordinal (ordinal) number (s) of 182 text (s) element (s) 21 constituting (constituting) element 18 by identifying with ordinal (ordinal) numbered (s) 212 textual about (text) element (s) 21, constituting (making) element 18. Identifying the types of elements 18 of the twelfth SMD data structure in step 4031 does not change the value 181 of element 18 and does not change the ordinal number (s) of TE 21 linguistic sentence 11 constituting (constituting) the element 18 (ILE).

[183] Формирование тринадцатой структуры данных СМД в ходе этапа 4033 производят путем объединения в одной структуре данных элементов 18 первого и второго вида тринадцатой структуры данных СМД, а также их идентификационных данных по известным из уровня техники принципам и способам, которые, соответственно, далее подробно не описываются.[183] The formation of the thirteenth data structure of the MDD during step 4033 is performed by combining in one data structure the elements of the first and second types of the thirteenth data structure of the MDD data, as well as their identification data according to the principles and methods known from the prior art, which, respectively, are described later in detail not described.

[184] Идентификацию лингвистических характеристик ТЭ, составляющих элементы 18 (ИЛЛЭ) тринадцатой структуры данных СМД и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа 4031, состоящего из идентификационных данных ТЭ, составляющих элемент 18 (ИЛЛЭ), и получении значений (2131, 2141, 2231; 2151, 2161, 2181, 2191) всех частей лингвистических характеристик (213, 214, 223, 215, 216, 218, 219) текстовых элементов 21 лингвистического предложения 11, из которых состоит элемент 18 (ИЛЛЭ). При этом, как было описано ранее, лингвистическими признаками элементов 18 (ИЛЛЭ) являются как минимум морфологические, синтаксические и семантические характеристики текстовых элементов 21 лингвистического предложения 11, из которых состоят элементы 18 (ИЛЛЭ).[184] The identification of the linguistic characteristics of the TEs that make up the elements 18 (ILE) of the thirteenth data structure of the MD and their values, if necessary, is produced by organizing a request to the BDLP, formed under step 4031, consisting of the identification data of the TEs, constituting element 18 (ILE), and obtaining the values (2131, 2141, 2231; 2151, 2161, 2181, 2191) of all parts of the linguistic characteristics (213, 214, 223, 215, 216, 218, 219) of the text elements 21 of the linguistic sentence 11, of which element 18 consists (ILE ). At the same time, as described earlier, the linguistic features of elements 18 (ILEE) are at least the morphological, syntactic and semantic characteristics of the text elements 21 of the linguistic sentence 11, of which the elements 18 (ILE) consist.

На фиг. 45, в качестве примера, но не ограничения, проиллюстрирована примерная схема системы 500 преобразования структурированного массива данных, которая в предпочтительном варианте реализации содержит, по меньшей мере, одно или более компьютерных устройств 501 преобразования структурированного массива данных, содержащих, по меньшей мере, один или более процессоров 5011 и память 5012. Упомянутые устройства 501 преобразования структурированного массива данных могут представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет и тому подобное. Память (машиночитаемый носитель данных) 5012 устройства 501 преобразования структурированного массива данных, содержит код программы, который при выполнении побуждает упомянутые один или более процессоры 5011 упомянутого устройства 501 выполнять действия описанных ранее способов преобразования структурированного массива данных. В некоторых случаях компьютерное устройство 501 может представлять собой серверное компьютерное устройство, связанное с пользовательским компьютерным устройством, выполненным с возможностью передачи серверному компьютерному устройству 501 команды или команд, побуждающих процессор или процессоры 5011 серверного компьютерного устройства выполнять код программы, который при выполнении процессором или процессорами серверного компьютерного устройства 5011 побуждает процессор или процессоры 5011 серверного компьютерного устройства выполнять действия какого-либо из описанных ранее способов преобразования структурированного массива данных. Пользовательское компьютерное устройство 502 может представлять собой, но не ограничиваться: персональный компьютер, портативный компьютер, планшетный компьютер, карманный компьютер, смартфон, фаблет, тонкий клиент и тому подобное. Пользовательское компьютерное устройство 502 может быть связано с серверным компьютерным устройством 501 посредством проводного или беспроводного соединения. Упомянутая память 5012 компьютерного устройства 501 (серверного компьютерного устройства 501) содержит подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, а также может содержать любую из описанных ранее исходных структур данных для какого-либо из описанных ранее способов преобразования структурированного массива данных. Более того, подлежащие преобразованию один или несколько структурированных массивов данных могут являться загружаемыми и храниться, в частности, в базе данных 503 системы преобразования структурированного массива данных. В качестве примера, но не ограничения, машиночитаемый носитель данных (память 5012) может включать в себя оперативную память (RAM); постоянное запоминающее устройство (ROM); электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM); флэш-память или другие технологии памяти; CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для кодирования требуемой информации, и к которому может быть осуществлен доступ посредством устройства 501. Память включает в себя носитель данных на основе запоминающего устройства компьютера в форме энергозависимой или энергонезависимой памяти, или их комбинации. Примерные аппаратные устройства включают в себя твердотельную память, накопители на жестких дисках, накопители на оптических дисках и так далее. В памяти хранится примерная среда, в которой при помощи компьютерных команд или кодов, хранящихся в памяти устройства, может быть осуществлена процедура преобразования структурированного массива данных. Устройство содержит один или более процессоров 5011, которые предназначены для выполнения компьютерных команд или кодов, хранящихся в памяти устройства с целью обеспечения выполнения процедуры преобразования структурированного массива данных. Компьютерные команды или коды, хранящиеся в памяти, предназначены для выполнения преобразования структурированного массива данных. Система 500 также может включать в себя базу данных (БД) 503. БД 503 может представлять собой, но не ограничиваясь: иерархическую БД, сетевую БД, реляционную БД, объектную БД, объектно-ориентированную БД, объектно-реляционную БД, пространственную БД, комбинацию перечисленных двух и более БД, и тому подобное. БД 503 хранит данные в памяти, которая может представлять собой, но не ограничиваясь: постоянное запоминающее устройство (ROM), электрически-стираемое программируемое постоянное запоминающее устройство (EEPROM), флэш-память, CDROM, цифровой универсальный диск (DVD) или другие оптические или голографические носители данных; магнитные кассеты, магнитную пленку, запоминающее устройство на магнитных дисках или другие магнитные запоминающие устройства, несущие волны или другой носитель данных, который может быть использован для хранения требуемой информации, и к которому может быть осуществлен доступ посредством устройства 501 преобразования структурированного массива данных. БД 503 служит для хранения данных, представляющих собой, по меньшей мере, команды для выполнения этапов описанных ранее способов преобразования структурированного массива данных; подлежащие преобразованию один или несколько структурированных массивов данных, содержащих, по меньшей мере, лингвистическое предложение, или одну из описанных ранее исходных для какого-либо способа преобразования структур данных, которые могут быть загружены в память 5012 устройства 501 преобразования структурированного массива данных; и других данных, необходимых для функционирования системы. Примерная система 500 преобразования структурированного массива данных дополнительно может содержать серверное компьютерное устройство 501, которое помимо описанных ранее функций, сохраняет и содействует манипуляции компьютерными командами или кодами, ранее описанными в данном документе, которые, соответственно, дополнительно не описываются. Серверное компьютерное устройство 501, помимо описанных ранее функций, может обеспечивать регулирование обменом данных в системе 500 преобразования структурированного массива данных, а также обеспечивает обработку данных при условии подключения к нему одного или более чем одного пользовательских компьютерных устройств 502. В этом случае все вычислительные мощности, необходимые для обеспечения выполнения процедуры преобразования структурированного массива данных, расположены на серверном компьютерном устройстве 501. Система 500 так же может содержать одну или более сетей 504 передачи данных. 5ети 204 передачи данных могут включать в себя, но не ограничиваться, одну или более локальных сетей (LAN) и/или глобальных сетей (WAN), или могут представлять собой информационно-телекоммуникационную сеть Интернет, или Интранет, или виртуальную частную сеть (VPN), или их комбинацию, и тому подобное. Серверное компьютерное устройство 501 также имеет возможность обеспечивать виртуальную вычислительную среду (Virtual Machine) для обеспечения взаимодействия между пользовательским компьютерным устройством 502 и БД 503. Сеть 504 служит для обеспечения взаимодействия между компьютерным устройством 501, базой данных 503 и пользовательским компьютерным устройством 502 системы 500 преобразования структурированного массива данных. При этом пользовательское компьютерное устройство 502 может быть связано с серверным компьютерным устройством 501 напрямую, используя известные из уровня техники проводные и беспроводные способы и методы связи, которые, соответственно, далее не подробно не описываются.FIG. 45 illustrates, by way of example, but not limitation, an exemplary diagram of a system 500 for converting a structured data array, which in a preferred embodiment contains at least one or more computer devices 501 for converting a structured data array containing at least one or more than 5011 processors and 5012 memory. The structured dataset conversion devices 501 may include, but are not limited to: a personal computer, a portable computer p, tablet PC, PDA, smartphone, PHABLET and the like. The memory (machine-readable storage medium) 5012 of a structured data transformation device 501 comprises program code, which, when executed, causes said one or more processors 5011 of said device 501 to perform the actions of previously described methods for converting a structured data array. In some cases, the computing device 501 may be a server computing device associated with a user computing device configured to transmit commands or instructions to the server computing device 501 that cause the processor or processors 5011 of the server computing device to execute program code, which when executed by the server processor or processors computer device 5011 induces the processor or processors 5011 of the server computer device to perform action of any of the ways described earlier conversion structured dataset. The user computer device 502 may be, but is not limited to: a personal computer, a laptop computer, a tablet computer, a pocket computer, a smartphone, a phablet, a thin client, and the like. The user computing device 502 may be connected to the server computing device 501 via a wired or wireless connection. The memory 5012 of the computer device 501 (server computer device 501) contains one or more structured data arrays containing at least a linguistic sentence to be converted, and may also contain any of the previously described source data structures for any of the previously described methods structured data array conversion. Moreover, the one or more structured data arrays to be converted may be loadable and stored, in particular, in the database of the structured data array conversion system 503. By way of example, and not limitation, computer readable storage media (memory 5012) may include random access memory (RAM); read only memory (ROM); electrically erasable programmable read-only memory (EEPROM); flash memory or other memory technology; CDROM, digital versatile disk (DVD) or other optical or holographic data carriers; magnetic cassettes, magnetic tape, magnetic disk storage or other magnetic storage devices, carrier waves or other data carrier that can be used to encode the required information and which can be accessed through the device 501. The memory includes a data carrier based on computer storage device in the form of volatile or non-volatile memory, or a combination thereof. Exemplary hardware devices include solid-state memory, hard disk drives, optical drives, and so on. An approximate environment is stored in the memory, in which the procedure of converting a structured data array can be performed using computer commands or codes stored in the device's memory. The device contains one or more processors 5011, which are designed to execute computer commands or codes stored in the device’s memory in order to ensure the implementation of the procedure for converting a structured data array. Computer commands or codes stored in memory are designed to perform the transformation of a structured array of data. System 500 may also include a database (DB) 503. DB 503 may be, but is not limited to: a hierarchical database, a network database, a relational database, an object database, an object-oriented database, an object-relational database, a spatial database, a combination listed two or more databases, and the like. DB 503 stores data in memory, which can be, but is not limited to, read-only memory (ROM), electrically erasable programmable read-only memory (EEPROM), flash memory, CDROM, digital versatile disk (DVD) or other optical or holographic data carriers; magnetic cassettes, magnetic tape, magnetic disk storage or other magnetic storage devices, carrier waves or other data carrier that can be used to store the required information, and which can be accessed through a structured data array device 501. DB 503 is used to store data representing at least the commands for performing the steps of the previously described methods for transforming a structured data array; one or more structured datasets to be converted, containing at least a linguistic sentence, or one of the previously described initial data for any method of converting data structures that can be loaded into the memory 5012 of the structured dataset 5012; and other data necessary for the functioning of the system. The exemplary structured data transformation system 500 may further comprise a server computer device 501, which, in addition to the functions described previously, stores and facilitates manipulation of computer commands or codes previously described in this document, which, respectively, are not further described. The server computer device 501, in addition to the functions described earlier, can regulate the exchange of data in the system 500 by converting a structured array of data, and also provides data processing provided one or more than one user computer device 502 is connected to it. In this case, all the computing powers necessary to ensure the implementation of the procedure for converting a structured data array, are located on the server computer device 501. The system 500 can also The network contains one or more data networks 504. The data transfer networks 204 may include, but are not limited to, one or more local area networks (LANs) and / or wide area networks (WANs), or may be an information and telecommunications network, the Internet, or an Intranet, or virtual private network (VPN) , or a combination of them, and the like. The server computing device 501 also has the ability to provide a virtual computing environment (Virtual Machine) to provide interaction between user computing device 502 and DB 503. Network 504 serves to provide interaction between computing device 501, database 503 and user computing device 502 of the structure 500 array of data. In this case, the user computing device 502 may be connected to the server computing device 501 directly using wire and wireless communication methods and methods known from the prior art, which, respectively, are not further described in detail.

Claims (36)

1. Выполняемый процессором компьютерного устройства способ преобразования структурированного массива данных (СМД), содержащего, по меньшей мере, лингвистическое предложение, характеризующийся выполнением этапов: 1. A method for converting a structured data file (CIC) executed by a processor of a computer device, containing at least a linguistic sentence characterized by the following steps: А) формирования первой структуры данных, на котором формируют первую структуру данных СМД, содержащую элементы упомянутой первой структуры данных, причем упомянутые элементы первой структуры данных представляют собой текстовые элементы (ТЭ) лингвистического предложения, а также идентификационные данные текстовых элементов (идентификационные данные ТЭ), представляющие собой для каждого ТЭ, по меньшей мере: значение текстового элемента (значение ТЭ) и порядковый номер текстового элемента (порядковый номер ТЭ) в лингвистическом предложении; A) the formation of the first data structure, which form the first data structure of the MD, containing the elements of the first data structure, said elements of the first data structure being the textual elements (TE) of the linguistic sentence, as well as the identification data of the text elements (identification data of the TE), representing for each TE, at least: the value of the text element (the value of the TE) and the sequence number of the text element (the sequence number of the TE) in the linguistic sentence AI; Б) формирования базы данных лингвистических признаков (БДЛП), на котором выявляют лингвистические признаки текстовых элементов (лингвистические признаки ТЭ) лингвистического предложения, из которых формируют базу данных, представляющую собой БДЛП текстовых элементов лингвистического предложения; B) the formation of a database of linguistic features (BDLP), which reveal the linguistic features of the text elements (linguistic signs of TE) of the linguistic sentence, from which form a database that represents the BDLP of text elements of the linguistic sentence; В) формирования второй структуры данных, на котором формируют вторую структуру данных СМД, содержащую элементы упомянутой второй структуры данных, причем упомянутые элементы второй структуры данных представляют собой синтаксические единицы (СЕ) лингвистического предложения, сформированные на основании сведений из БДЛП текстовых элементов лингвистического предложения, а также представляют собой идентификационные данные синтаксических единиц (идентификационные данные СЕ), представляющие собой для каждой СЕ, по меньшей мере: значение синтаксической единицы (значение СЕ) и порядковый (порядковые) номер (номера) ТЭ лингвистического предложения, составляющих СЕ.C) forming the second data structure, on which the second data structure of the MDD is formed, containing elements of the said second data structure, said elements of the second data structure being syntactic units (CE) of the linguistic sentence, formed on the basis of information from the BDLP of textual elements of the linguistic sentence, also represent the identification data of syntactic units (the identification data of the CE), representing for each CE at least: the value syntactic unit (CE value) and ordinal (s) number (s) of TE linguistic sentences that make up CE. 2. Способ по п. 1, характеризующийся тем, что в рамках этапа А) выполняют способ, характеризующийся выполнением этапов:2. The method according to p. 1, characterized in that in stage A) perform the method, characterized by the implementation stages: А1) идентификации исходной структуры данных СМД, на котором идентифицируют элементы исходной структуры данных СМД, являющиеся лингвистическими предложениями; A1) identify the original data structure of the MDD, which identifies the elements of the original data structure of the MDD, which are linguistic sentences; А2) идентификации элементов первой структуры данных СМД, на котором идентифицируют элементы первой структуры данных СМД, являющиеся текстовыми элементами (ТЭ) лингвистического предложения, а также идентификационные данные ТЭ, представляющие собой для каждого ТЭ, по меньшей мере: значение ТЭ и порядковый номер ТЭ, и формируют первую структуру данных СМД.A2) identifying the elements of the first SMD data structure, which identifies the elements of the first SMD data structure, which are the textual elements (TE) of the linguistic sentence, as well as the identification data of the TE, which for each TE, at least: the TE value and the sequence number of the TE, and form the first data structure of the MD. 3. Способ по п. 2, характеризующийся тем, что в рамках этапа А1) обеспечивают классификацию элементов, из которых состоит исходная структура данных, как лингвистических предложений.3. The method according to claim 2, characterized in that within stage A1) provide a classification of the elements that make up the original data structure, as linguistic sentences. 4. Способ по п. 2, характеризующийся тем, что в рамках этапа А2) идентифицируют элементы первой структуры данных СМД, являющиеся текстовыми элементами (ТЭ) лингвистического предложения, путем выявления отдельных слов или групп слов, цифр (чисел) или индексов, причем цифры (числа) или индексы не разделены пробелом, а также знаков препинания.4. The method of claim 2, characterized in that in step A2) identify the elements of the first SMD data structure, which are the textual elements (TE) of the linguistic sentence, by identifying individual words or groups of words, numbers (numbers) or indices, and the numbers (numbers) or indices are not separated by a space, as well as punctuation marks. 5. Способ по п. 4, характеризующийся тем, что последний знак препинания в лингвистическом предложении не учитывается при идентификации и не рассматривается в качестве текстового элемента лингвистического предложения.5. The method according to claim 4, characterized in that the last punctuation mark in the linguistic sentence is not taken into account during identification and is not considered as a text element of the linguistic sentence. 6. Способ по п. 2, характеризующийся тем, что в рамках этапа А2) идентификацию значения текстового элемента производят путем регистрации символов (букв, цифр и(или) знаков препинания), из которых состоит текстовый элемент, а идентификацию порядкового номера текстового элемента производят путем расчета местоположения текстового элемента в лингвистическом предложении.6. The method according to claim 2, characterized in that in step A2) the identification of the value of the text element is produced by registering the characters (letters, numbers and / or punctuation marks) that make up the text element, and the identification of the sequence number of the text element is produced by calculating the location of the text element in the linguistic sentence. 7. Способ по п. 6, характеризующийся тем, что первый текстовый элемент в лингвистическом предложении получает порядковый номер «1», а все последующие текстовые элементы получают порядковый номер, больший на единицу, чем порядковый номер предыдущего текстового элемента.7. The method according to claim 6, characterized in that the first text element in the linguistic sentence receives a sequence number "1", and all subsequent text elements receive a sequence number greater by one than the sequence number of the previous text element. 8. Способ по п. 1, характеризующийся тем, что этап Б) характеризуется выполнением этапов:8. The method according to p. 1, characterized in that stage B) is characterized by the implementation stages: Б1) формирования лингвистических признаков текстовых элементов лингвистического предложения, на котором для лингвистического анализа текстового элемента предоставляют идентификационные данные элемента (значение и порядковый номер текстового элемента) и получают лингвистические характеристики текстовых элементов лингвистического предложения, а также значения упомянутых лингвистических характеристик 2131; B1) the formation of linguistic features of textual elements of the linguistic sentence, which for linguistic analysis of the text element provide the identification data of the element (value and ordinal number of the text element) and receive the linguistic characteristics of the text elements of the linguistic sentence, as well as the values of the said linguistic characteristics 2131; Б2) формирования базы данных лингвистических признаков (БДЛП), на котором формируют БДЛП текстовых элементов лингвистического предложения;B2) forming a database of linguistic features (BDLP), on which BDLP of textual elements of the linguistic sentence are formed; причем лингвистическим признаком текстового элемента являются все полученные для текстового элемента в ходе выполнения этапа Б1) лингвистические характеристики, обладающие значениями лингвистических характеристик.moreover, the linguistic feature of the text element is all the linguistic characteristics obtained for the text element during the execution of step B1) that have values of linguistic characteristics. 9. Способ по п. 8, характеризующийся тем, что в рамках этапа Б1) лингвистические характеристики и их значения формируют путем комплексного лингвистического анализа каждого текстового элемента лингвистического предложения, представляющего, в качестве примера, но не ограничения, комплексный анализ текстового элемента на основе местонахождения текстового элемента в структуре лингвистического предложения, его значения, вида, классификации его мыслимого образа и анализа его связей с другими текстовыми элементами в лингвистическом предложении, после чего производят формирование основных лингвистических характеристик.9. The method of claim 8, characterized in that within step B1) the linguistic characteristics and their meanings are formed by a comprehensive linguistic analysis of each textual element of the linguistic sentence, representing, by way of example, but not limitation, a comprehensive analysis of the text element based on location text element in the structure of a linguistic sentence, its meaning, type, classification of its mental image and analysis of its connections with other text elements in the linguistic sentence ii, whereupon the formation of basic linguistic characteristics. 10. Способ по п. 8, характеризующийся тем, что формирование БДЛП осуществляют путем внесения сформированных в рамках этапа Б1) лингвистических характеристик и их значений в БДЛП в виде перечня первой части лингвистических характеристик со значениями этих характеристик.10. The method according to claim 8, characterized in that the formation of BDLP is carried out by entering formed in the framework of stage B1) linguistic characteristics and their values in BDLP as a list of the first part of the linguistic characteristics with the values of these characteristics. 11. Способ по п. 1, характеризующийся тем, что этап В) характеризуется выполнением этапов:11. The method according to claim 1, characterized in that step B) is characterized by the implementation of the steps: В1) идентификации и формирования первых элементов второй структуры данных СМД, на котором идентифицируют и формируют первые элементы второй структуры данных СМД, являющиеся первыми синтаксическими единицами, а также идентификационные данные первых синтаксических единиц, представляющие собой для каждой первой синтаксической единицы, по меньшей мере, значение первой синтаксической единицы и порядковый (порядковые) номер (номера) текстового элемента или текстовых элементов лингвистического предложения, составляющих первую синтаксическую единицу; B1) identify and form the first elements of the second SMD data structure, which identify and form the first elements of the second SMD data structure, which are the first syntactic units, as well as the identification data of the first syntactic units, which for each first syntactic unit is at least the first syntactic unit and the ordinal (s) number (s) of a text element or textual elements of the linguistic sentence that make up the first syntax th unit; В2) формирования вторых элементов второй структуры данных СМД, на котором формируют вторые элементы второй структуры данных СМД, являющиеся вторыми синтаксическими единицами, а также идентификационные данные вторых синтаксических единиц, представляющие собой для каждой такой синтаксической единицы, по меньшей мере, значение второй синтаксической единицы и порядковые номера текстовых элементов лингвистического предложения, составляющих вторую синтаксическую единицу;B2) forming the second elements of the second SMD data structure, on which the second elements of the second SMD data structure are formed, which are the second syntactic units, as well as the identification data of the second syntactic units, which for each such syntactic unit are at least the value of the second syntactic unit and the sequence numbers of the textual elements of the linguistic sentence constituting the second syntactic unit; В3) формирования второй структуры данных СМД, на котором формируют вторую структуру данных СМД путем объединения первых синтаксических единиц, вторых синтаксических единиц и их идентификационных данных.B3) forming the second data structure of the MDD, on which the second data structure of the MDD is formed by combining the first syntactic units, second syntactic units and their identification data. 12. Способ по п. 11, характеризующийся тем, что в рамках этапа В1) идентификацию или формирование первых синтаксических единиц производят путем комплексного анализа значений лингвистических характеристик текстовых элементов лингвистического предложения, причем идентификации подвергаются первые синтаксические единицы, состоящие из одного текстового элемента, а формированию подвергаются первые синтаксические единицы, состоящие из нескольких текстовых элементов, при этом идентификация или формирование осуществляется путем отождествления первых синтаксических единиц с актуальными исходными синтаксическими объектами, представляющими собой перечень исходных синтаксических объектов, предварительно устанавливаемый и записываемый в первую пользовательскую базу данных.12. The method according to claim 11, characterized in that in step B1) the identification or formation of the first syntactic units is carried out by a comprehensive analysis of the values of the linguistic characteristics of the text elements of the linguistic sentence, the first syntax units consisting of one text element being identified, and subject to the first syntactic units, consisting of several text elements, while identification or formation is carried out by identifying Ia first syntactical elements with current source syntactic objects representing a list of initial syntactic objects previously established and stored in the first user database. 13. Способ по п. 11, характеризующийся тем, что в рамках этапа В2) формирование вторых синтаксических единиц из двух и более первых синтаксических единиц производят путем комплексного анализа значений лингвистических характеристик текстовых элементов, являющихся первыми синтаксическими единицами, при выявлении лингвистических характеристик текстовых элементов, составляющих первые синтаксические единицы, которые соответствуют описанию синтаксической конструкции, содержащемуся в первой пользовательской базе данных.13. The method according to claim 11, characterized in that, as part of stage B2), the formation of second syntactic units from two or more first syntactic units is carried out by a comprehensive analysis of the values of the linguistic characteristics of the text elements, which are the first syntactic units, while identifying the linguistic characteristics of the text elements, make up the first syntactic units that correspond to the description of the syntactic structure contained in the first user database. 14. Способ по п. 11, характеризующийся тем, что в рамках этапа В1) идентификацию значения и порядкового (порядковых) номера (номеров) ТЭ первых синтаксических единиц производят следующим образом: значение (значения) текстового (текстовых) элемента (элементов) лингвистического предложения, составляющего (составляющих) первую синтаксическую единицу, идентифицируют как значение элемента первой синтаксической единицы, а порядковый (порядковые) номер (номера) упомянутого (упомянутых) текстового (текстовых) элемента (элементов) лингвистического предложения, составляющего (составляющих) первую синтаксическую единицу, идентифицируют как порядковый (порядковые) номер (номера) текстового (текстовых) элемента (элементов) 312, составляющего (составляющих) первую синтаксическую единицу.14. The method according to claim 11, characterized in that, within the framework of step B1), the meaning and serial (serial) number (s) of the first syntactic units are identified as follows: the value (s) of the text (text) element (s) of the linguistic sentence constituting (constituting) the first syntactic unit is identified as the value of the element of the first syntactic unit, and the ordinal (ordinal) number (s) of the said (mentioned) text (text) element (s) of the linguistic rule The units constituting (constituting) the first syntactic unit are identified as the ordinal (s) number (s) of the text (text) element (s) 312 constituting (constituting) the first syntactic unit. 15. Способ по п. 11, характеризующийся тем, что в рамках этапа В2) идентификацию значения и порядковых номеров ТЭ вторых синтаксических единиц производят следующим образом: значения текстовых элементов лингвистического предложения, составляющих вторую синтаксическую единицу, идентифицируют как значение второй синтаксической единицы, а порядковые номера упомянутых текстовых элементов лингвистического предложения, составляющих вторую синтаксическую единицу, идентифицируют как порядковые номера текстовых элементов, составляющих вторую синтаксическую единицу.15. The method according to claim 11, characterized in that within step B2) the identification of the meaning and sequence numbers of TEs of the second syntactic units is made as follows: the values of the textual elements of the linguistic sentence that constitute the second syntactic unit are identified as the value of the second syntactic unit, and ordinal the numbers of the mentioned textual elements of the linguistic sentence constituting the second syntactic unit are identified as the ordinal numbers of the textual elements constituting the second syntactic unit. 16. Способ по п. 11, характеризующийся тем, что в рамках этапа В3) формирование второй структуры данных СМД производят путем объединения в одной структуре данных первых синтаксических единиц и вторых синтаксических единиц.16. The method according to claim 11, characterized in that, as part of step B3), the formation of the second SMD data structure is carried out by combining the first syntactic units and second syntactic units in one data structure. 17. Способ по п. 12, характеризующийся тем, что в рамках этапа В1) идентификацию лингвистических характеристик ТЭ, составляющих первые синтаксические единицы, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа Б), состоящего из идентификационных данных ТЭ, составляющих первую синтаксическую единицу, и получения значений лингвистических характеристик текстовых элементов лингвистического предложения, из которых состоит первая синтаксическая единица.17. The method according to claim 12, characterized in that within stage B1) the identification of the linguistic characteristics of the TEs that make up the first syntactic units and their meanings, if necessary, is done by organizing a query into the BDLP, formed within the framework of stage B), consisting of the identification data TE, constituting the first syntactic unit, and obtaining the values of the linguistic characteristics of the textual elements of the linguistic sentence of which the first syntactic unit consists. 18. Способ по п. 13, характеризующийся тем, что в рамках этапа В2) идентификацию лингвистических характеристик ТЭ, составляющих вторые синтаксические единицы, и их значений при необходимости производят путем организации запроса в БДЛП, формируемую в рамках этапа Б), состоящего из идентификационных данных ТЭ, составляющих вторую синтаксическую единицу, и получения значений лингвистических характеристик текстовых элементов лингвистического предложения, из которых состоит вторая синтаксическая единица.18. The method according to claim 13, characterized in that in step B2) the identification of the linguistic characteristics of the TEs constituting the second syntactic units and their meanings, if necessary, is carried out by organizing a query into the BDLP, formed within the framework of step B), consisting of the identification data TE, constituting the second syntactic unit, and obtaining the values of the linguistic characteristics of the textual elements of the linguistic sentence, of which the second syntactic unit consists. 19. Компьютерное устройство для преобразования структурированного массива данных, содержащего, по меньшей мере, лингвистическое предложение, содержащее, по меньшей мере:19. A computer device for converting a structured data file containing at least a linguistic sentence containing at least: процессор компьютерного устройства, иcomputer device processor and память, содержащую код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из пп. 1-18.a memory containing program code which, when executed by the processor of the computing device, causes the processor of the computing device to perform the steps of the method according to any one of claims. 1-18. 20. Система для преобразования структурированного массива данных, содержащего, по меньшей мере, лингвистическое предложение, содержащая, по меньшей мере:20. A system for converting a structured data file containing at least a linguistic sentence containing at least: серверное компьютерное устройство, являющееся компьютерным устройством по п. 19, иthe server computing device, which is the computing device of claim 19, and пользовательское компьютерное устройство, выполненное с возможностью передачи серверному компьютерному устройству команды или команд, побуждающих процессор серверного компьютерного устройства выполнять код программы, который при выполнении процессором серверного компьютерного устройства побуждает процессор серверного компьютерного устройства выполнять действия способа по любому из пп. 1-18.A user computing device capable of transmitting commands or instructions to the server computer device to cause the processor of the server computer device to execute program code, which, when the processor computer executes the server computer device, causes the processor of the server computer device to perform the method of any one of claims. 1-18. 21. Машиночитаемый носитель данных, содержащий код программы, который при выполнении процессором компьютерного устройства побуждает процессор компьютерного устройства выполнять действия способа по любому из пп. 1-18.21. A computer-readable storage medium containing a program code that, when executed by a processor of a computing device, causes the processor of the computing device to perform the steps of the method according to any one of claims. 1-18.
RU2018121132A 2018-06-07 2018-06-07 Method of preliminary transformation of a structured data array containing a linguistic sentence RU2685967C1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2018121132A RU2685967C1 (en) 2018-06-07 2018-06-07 Method of preliminary transformation of a structured data array containing a linguistic sentence
PCT/RU2019/050078 WO2019235975A1 (en) 2018-06-07 2019-06-07 Conversion of a structured data array containing a linguistic sentence
EA202092988A EA202092988A1 (en) 2018-06-07 2019-06-07 METHOD FOR PRELIMINARY CONVERSION OF A STRUCTURED DATA ARRAY CONTAINING A LINGUISTIC PROPOSAL

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2018121132A RU2685967C1 (en) 2018-06-07 2018-06-07 Method of preliminary transformation of a structured data array containing a linguistic sentence

Publications (1)

Publication Number Publication Date
RU2685967C1 true RU2685967C1 (en) 2019-04-23

Family

ID=66314607

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018121132A RU2685967C1 (en) 2018-06-07 2018-06-07 Method of preliminary transformation of a structured data array containing a linguistic sentence

Country Status (3)

Country Link
EA (1) EA202092988A1 (en)
RU (1) RU2685967C1 (en)
WO (1) WO2019235975A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011082056A1 (en) * 2009-12-29 2011-07-07 Dynavox Systems Llc System and method of using pos tagging for symbol assignment
US20120109640A1 (en) * 2006-10-10 2012-05-03 Konstantin Anisimovich Method and system for analyzing and translating various languages with use of semantic hierarchy
US20130024186A1 (en) * 2006-10-10 2013-01-24 Abbyy Software Ltd. Deep Model Statistics Method for Machine Translation
US20170083508A1 (en) * 2015-09-18 2017-03-23 Mcafee, Inc. Systems and Methods for Multilingual Document Filtering
RU2630427C2 (en) * 2016-08-12 2017-09-07 Дмитрий Владимирович Мительков Method and system of semantic processing text documents

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2544739C1 (en) * 2014-03-25 2015-03-20 Игорь Петрович Рогачев Method to transform structured data array
RU2571405C1 (en) * 2014-06-27 2015-12-20 Игорь Петрович Рогачев Method for preliminary conversion of structured data array

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120109640A1 (en) * 2006-10-10 2012-05-03 Konstantin Anisimovich Method and system for analyzing and translating various languages with use of semantic hierarchy
US20130024186A1 (en) * 2006-10-10 2013-01-24 Abbyy Software Ltd. Deep Model Statistics Method for Machine Translation
WO2011082056A1 (en) * 2009-12-29 2011-07-07 Dynavox Systems Llc System and method of using pos tagging for symbol assignment
US20170083508A1 (en) * 2015-09-18 2017-03-23 Mcafee, Inc. Systems and Methods for Multilingual Document Filtering
RU2630427C2 (en) * 2016-08-12 2017-09-07 Дмитрий Владимирович Мительков Method and system of semantic processing text documents

Also Published As

Publication number Publication date
WO2019235975A1 (en) 2019-12-12
EA202092988A1 (en) 2021-03-18

Similar Documents

Publication Publication Date Title
US9588960B2 (en) Automatic extraction of named entities from texts
RU2596599C2 (en) System and method of creating and using user ontology-based patterns for processing user text in natural language
RU2605077C2 (en) Method and system for storing and searching information extracted from text documents
CN111291161A (en) Legal case knowledge graph query method, device, equipment and storage medium
US9727553B2 (en) System and method for generating and using user semantic dictionaries for natural language processing of user-provided text
Sawant et al. Neural architecture for question answering using a knowledge graph and web corpus
CN104252533A (en) Search method and search device
Krishna et al. A dataset for sanskrit word segmentation
RU2685966C1 (en) Method for lingual-logical transformation of a structured data array containing a linguistic sentence
Li et al. Neural factoid geospatial question answering
RU2685960C1 (en) Method of converting structured data array, containing syntactic units
RU2571405C1 (en) Method for preliminary conversion of structured data array
RU2691836C1 (en) Method of transforming a structured data array comprising main linguistic-logic entities
Chen et al. An automatic method for extracting innovative ideas based on the scopus® database
Cm et al. Question answering over knowledge graphs using BERT based relation mapping
RU2685967C1 (en) Method of preliminary transformation of a structured data array containing a linguistic sentence
RU2685968C1 (en) Method of transforming a structured data array comprising main lingvo-logical objects (ollo)
Szwed Concepts extraction from unstructured Polish texts: A rule based approach
CN114580556A (en) Method and device for pre-evaluating patent literature
Chein et al. Sudocad: a knowledge-based system for the author linkage problem
Haj et al. Automated generation of terminological dictionary from textual business rules
WO2019235976A1 (en) Method for the linguistic-logical conversion of a structured data array
Forcher et al. Semantic logging: Towards explanation-aware das
RU2572367C1 (en) Method of searching for information in pre-transformed structured data array
RU2571407C1 (en) Method to generate map of connections of converted structured data array components

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20200225